黄仁勋GTC 2026演讲:推理时代来临,AI工厂与智能体革命重塑未来
作者:鲍奕龙、董静,华尔街见闻
2026年3月16日,英伟达GTC 2026大会正式拉开帷幕,英伟达创始人兼CEO黄仁勋发表了备受瞩目的主题演讲。

在这场被誉为“AI行业年度朝圣”的大会上,黄仁勋详细阐述了英伟达从一家“芯片公司”向“AI基础设施和工厂公司”的蜕变。面对市场对业绩持续性与增长空间的高度关注,他首次拆解了驱动未来增长的底层商业逻辑——“Token工厂经济学”,并给出了令人振奋的预期。
万亿需求引爆AI基础设施新时代
过去两年,全球AI计算需求呈指数级爆炸式增长。随着大模型从“感知”、“生成”进化到“推理”与“行动(执行任务)”,算力消耗量急剧攀升。针对市场高度关注的订单与营收天花板问题,黄仁勋给出了极为强劲的预期。
黄仁勋在演讲中直言:
去年这个时候,我说过,我们看到了5000亿美元的高确信度需求,覆盖Blackwell和Rubin直到2026年。现在,就在此时此地,我看到到2027年至少有1万亿美元的需求(at least $1 trillion)。

黄仁勋的万亿预期一度推动英伟达股价涨超4.3%。

不仅如此,他还补充道:
这合理吗?这就是我接下来要讲的。事实上,我们甚至会供不应求。我确定,实际的计算需求会比这高得多。
黄仁勋指出,如今的英伟达系统已经证明了自己是全球“成本最低的基础设施”。由于英伟达能运行几乎所有领域的AI模型,这种通用性使得客户投入的这1万亿美元能够被充分利用并保持长久的生命周期。
目前,英伟达60%的业务来自排名前五的超大型云服务商,而另外40%的业务则广泛分布于主权云、企业、工业、机器人和边缘计算等各个领域。
Token工厂经济学:每瓦性能决定商业命脉
为了解释这1万亿需求的合理性,黄仁勋向全球企业CEO展示了一套全新的商业思维。他指出,未来的数据中心不再是存储文件的仓库,而是生产Token(AI生成的基本单位)的“工厂”。

黄仁勋强调:
每一座数据中心、每一座工厂,从定义上来说都是受电力限制的。一座1GW(吉瓦)的工厂永远不会变成2GW,这是物理和原子的定律。在固定的功率下,谁的每瓦Token吞吐量最高,谁的生产成本就最低。
黄仁勋将未来的AI服务分为四个商业层级:
免费层(高吞吐、低速度)
中级层(~每百万token 3美元)
高级层(~每百万token 6美元)
高速层(~每百万token 45美元)
超高速层(~每百万token 150美元)
他指出,随着模型越来越大、上下文越来越长,AI会变得更聪明,但Token的生成速率会降低。黄仁勋表示:
在这个Token工厂里,你的吞吐量和Token生成速度,将直接转化为你明年的精确收入。
黄仁勋强调英伟达的架构能够让客户在免费层实现极高的吞吐量,同时在最高价值的推理层级上,将性能提升惊人的35倍。

Vera Rubin两年实现350倍加速,Groq填补极速推理
在这个物理极限的约束下,英伟达介绍其有史以来最复杂的AI计算系统,Vera Rubin。黄仁勋表示:
过去提到Hopper,我会举起一块芯片,那很可爱。但提到Vera Rubin,大家想到的是整个系统。在这个100%液冷、完全消灭了传统线缆的系统中,过去需要两天安装的机架,现在只需两小时。
黄仁勋指出,通过极致的端到端软硬件协同设计,Vera Rubin在同一座1GW数据中心里创造了惊人的数据跨越:
在短短两年时间内,我们将Token的生成速率从2200万提升到了7亿,实现了350倍的增长。摩尔定律在同时期仅能带来约1.5倍的提升。
为了解决极速推理(如1000 Tokens/秒)条件下的带宽瓶颈,英伟达给出了整合被收购公司Groq的最终方案:非对称式的分离推理。黄仁勋解释:
这两款处理器的特点截然不同。Groq芯片拥有500MB的SRAM,而一颗Rubin芯片拥有288GB的内存。

黄仁勋指出,英伟达通过Dynamo软件系统,将需要海量计算和显存的“预填充(Pre-fill)”阶段交给Vera Rubin,将对延迟极度敏感的“解码”阶段交给Groq。黄仁勋还对企业算力配置给出了建议:
如果你的工作主要是高吞吐,100%使用Vera Rubin;如果你有大量高价值的编程级别的Token生成需求,拿出25%的数据中心规模给Groq。
据透露,由三星代工的Groq LP30芯片已在量产,预计第三季度出货,而首个Vera Rubin机架已在微软Azure云上运行。
此外,针对光互联技术,黄仁勋展示了全球首款量产的共封装光学(CPO)交换机Spectrum X,并平息了市场对于“铜退光进”的路线之争:
我们需要更多的铜缆产能,更多的光芯片产能,更多的CPO产能。
Agent终结传统SaaS,“年薪+Token”成硅谷标配
除了硬件壁垒,黄仁勋把大量篇幅留给了AI软件和生态的革命,特别是Agent(智能体)的爆发。
他将开源项目OpenClaw形容为“人类历史上最受欢迎的开源项目”,称其仅用几周时间就超越了Linux在过去30年取得的成就。黄仁勋直言,OpenClaw本质上就是Agent计算机的“操作系统”。
黄仁勋断言:
每一个SaaS(软件即服务)公司都将变成AaaS(Agent-as-a-Service,智能体即服务)公司。毫无疑问,为了让这种具备访问敏感数据和执行代码能力的智能体安全落地,英伟达推出了企业级的NeMo Claw参考设计,增加了策略引擎和隐私路由器。
对于普通职场人,这场变革同样近在咫尺。黄仁勋描绘了未来的职场新形态:
在未来,我们公司的每一位工程师都需要一个年度Token预算。他们的基础年薪可能是几十万美元,我会在此基础上再拿出大约一半的金额作为Token额度给他们,让他们实现10x的效率提升。这已经是硅谷的新招聘筹码了:你的offer里带多少Token?
演讲最后,黄仁勋还“剧透”了下一代计算架构Feynman,它将首次实现铜线与CPO的共同水平扩展。更引人遐想的是,英伟达正在研发部署在太空的数据中心计算机“Vera Rubin Space-1”,彻底打开了AI算力向地球之外延伸的想象空间。
免责声明:
1.资讯内容不构成投资建议,投资者应独立决策并自行承担风险
2.本文版权归属原作所有,仅代表作者本人观点,不代币币情的观点或立场
首页
快讯