AI 叙事转向:从模型训练到推理经济
图源:Financial Times
过去两年,AI 产业的核心竞争集中在“训练”层面——谁能构建更强的大模型,谁就占据优势。从 GPT-4 到多模态模型的持续迭代,本质上是围绕“模型能力上限”的竞争。
然而,在 NVIDIA GTC 2026 上,Jensen Huang 明确提出:AI 的核心战场正在从训练(Training)转向推理(Inference)。
这一转变背后反映的是商业逻辑的变化:训练是一次性投入,而推理是持续发生的需求。
具体而言:
-
训练决定模型“能做什么”
-
推理决定模型“能赚多少钱”
这意味着 AI 正从“技术驱动产业”演进为“需求驱动产业”,从一次性资本开支(CapEx)转向持续性运营收入(Recurring Revenue)。
Token 工厂模型:数据中心的生产属性重构
“数据中心是 Token 工厂”并不是一个营销口号,而是一种新的产业范式。在传统互联网时代:
-
数据中心承担计算与存储任务
-
收入来源于广告、订阅或交易
-
计算与收入之间没有直接映射关系
但在 AI 时代,这一逻辑被彻底重构:
-
每一次模型调用都会消耗算力
-
每一次计算都会生成 Token
-
每一个 Token 都可以被计费
这使得数据中心首次具备了“生产单位”的属性。
一个完整的闭环由此形成:算力投入 → 推理计算 → Token 生成 → 收入实现
在这一体系下,NVIDIA 提出的 AI Factory(AI 工厂)概念,实际上是在用工业体系重新定义 AI 基础设施:
-
输入层:电力 + 数据
-
中间层:GPU 算力与调度系统
-
输出层:Token + AI 服务
换句话说,数据中心不再只是服务器集群,而是类似“发电厂”或“制造工厂”的存在。
AI 生产函数变化:算力如何直接变现
AI 时代的生产函数可以被重新表达为:
Revenue = Token × Price,Cost = Compute Cost
因此利润可以简化为 Profit = Token × (Price - Cost per Token)
这带来三个关键变化:
-
收入与算力直接绑定:算力越强 → Token 产出越高 → 收入越高
-
成本结构高度集中:算力成本成为最大支出
-
效率成为核心竞争力:企业竞争的关键变为每单位算力能产出多少 Token
推理需求爆发的三大驱动因素
推理需求之所以被认为将爆发,主要来自三个结构性变化。
-
模型能力升级
从简单生成到复杂推理:
-
多步推理
-
长上下文
-
多模态融合
每一次调用的计算成本显著上升。
-
上下文长度扩展
AI 正从短文本处理转向:
-
10 万 token
-
甚至百万级上下文
这直接放大了计算需求。
-
Agent 的出现
AI Agent 可以:
-
自动执行任务
-
持续调用模型
-
形成“无限推理循环”
这使得 AI 的计算需求从“线性增长”变为“指数增长”。
AI 服务分层与 Token 定价体系
在 NVIDIA GTC 2026 上,NVIDIA 还隐含提出了 AI 服务分层的逻辑,本质是算力的“分级定价”。
这一体系类似云计算的分层模型:
-
高端层:高性能 GPU + 实时推理(高价格)
-
中端层:标准推理服务(中等价格)
-
低端层:批处理或延迟容忍任务(低价格)
不同场景对应不同 Token 单价:
-
实时对话 → 高价值 Token
-
数据分析 → 中等价值 Token
-
离线处理 → 低价值 Token
最终竞争的关键在于:谁能以更低成本生产 Token,并以更高价格出售。
万亿美元市场:预测背后的产业结构变化
Jensen Huang 预测,到 2027 年,AI 芯片与基础设施市场规模可能达到 1 万亿美元。
这一预测的核心意义在于:AI 正在成为“基础设施级产业”,类似于:
-
电力系统
-
云计算平台
-
互联网网络
这一趋势将带来三方面变化:
-
投资逻辑转变
资本将从应用层,重新流向底层基础设施:
-
数据中心
-
AI 芯片
-
能源系统
-
产业链重构
新的核心玩家将包括:
-
芯片厂商(如 NVIDIA)
-
云服务商
-
AI 平台公司
-
Agent 生态开发者
-
地缘与能源因素强化
AI 不再只是软件问题,而是:
-
电力资源竞争
-
数据中心选址
-
国家级算力战略
Agent 经济:无限推理需求的核心变量
如果说 Token 是商品,那么 Agent 就是“需求生成器”。传统互联网的需求来自用户,而在 AI 时代:
Agent 本身就可以创造需求。例如:
-
自动交易 Agent 持续分析市场
-
企业 Agent 自动处理流程
-
开发 Agent 自动生成与优化代码
这意味着:AI 经济中首次出现“非人类需求主体”。因此可以进一步推导:Agent 的规模 = 推理需求的上限
这也是为什么当前 AI 竞争正在向:
-
Agent 框架
-
自动化系统
-
AI Workflow 平台
快速转移。
风险与争议:Token 经济是否被高估
尽管“Token 工厂”叙事极具吸引力,但市场仍存在明显分歧。
-
成本压力
-
GPU 成本高企
-
电力成本上升
-
数据中心建设投入巨大
如果 Token 价格下降,利润空间将被压缩。
-
需求不确定性
-
企业是否愿意持续支付推理费用?
-
Agent 是否真的能创造稳定需求?
当前很多 AI 应用仍处于试验阶段。
-
技术替代风险
-
更高效模型可能减少算力需求
-
边缘计算可能分流数据中心
-
开源模型可能压低 Token 定价
这些因素都可能影响 Token 经济的长期稳定性。
AI 是否正在走向“工业化体系”
如果将当前趋势抽象,可以发现一个重要对应关系:
-
电力 → AI 的能源基础
-
数据 → 原材料
-
算力 → 生产设备
-
Token → 产品
-
Agent → 自动化系统
这一结构高度类似工业革命时期的生产体系。这意味 AI 正在从“软件行业”转变为“算力驱动的工业体系”。
结论
在 NVIDIA GTC 2026 上,Jensen Huang 提出的“Token 工厂”概念,并非简单比喻,而是对 AI 产业底层逻辑的重新定义:
-
Token 成为生产单位
-
推理成为生产过程
-
算力成为核心生产资料
随着 Agent 经济的兴起和推理需求的爆发,AI 基础设施市场正迈向万亿美元规模。
如果这一趋势持续,未来的企业竞争,将不再只是比拼产品或用户规模,而是:谁拥有更高效的 Token 生产能力。
