纳德拉懂张一鸣

36氪的朋友们·2026年01月24日 10:31
张一鸣在中国走了几步,纳德拉现在大声告诉全世界:这条路是对的。

撰文|画画

2026 年初的达沃斯,有点热闹。 

这个滑雪胜地挤满了全球AI界最有权势的人。 

英伟达的黄仁勋、OpenAI 的萨姆·奥特曼、DeepMind 的哈萨比斯、微软的纳德拉、Anthropic 的阿莫迪,说这届达沃斯是一场AI盛会,也丝毫不为过。 

在会场里,大家聊得最多的自然还是 AI。不过,大多数人讨论的还是比较虚的话题,比如,AI 到底有没有像人一样的意识?它会不会取代人类?这种讨论听起来很高级,但总让人觉得有点飘在空中。 

直到微软 CEO 纳德拉站出来讲话,他谈论的是:工厂、能效比、总体拥有成本(TCO)以及每瓦特电力能产出多少 Token。

纳德拉在现场甚至抛出了一个极其肯定的判断:未来的 AI 竞争,本质上就是一场关于Token 工厂的效率战争。

说白了,AI的竞争就是盖工厂、算成本、比效率。 

这个观点在此时显得格外引人注目。因为它不仅呼应了马斯克此前的一个预言:未来货币本质上将是瓦特。 

纳德拉的思考,更是在遥远的东方找到了回响。 

在关于 Token 价格战和大规模调用的战役中,张一鸣领导下的火山引擎,已经默默在Token 工厂这条路上跑了很久。(延伸阅读:字节打响“Token战争”,阿里腾讯掀桌子) 

这一次,纳德拉坐在了张一鸣的凳子上。 

1、AI 正在变成一种工业品

纳德拉在达沃斯的这次发言,非常有意思,他先是给 AI 行业泼了一盆冷水,也指明了一条路,意思是说,别再把 AI 当成什么神奇的魔法了,它正在变成一种标准化的工业产品。 

纳德拉说,现在的 Azure 已经是微软最大的业务,未来的核心竞争力在于建设高度异构的基础设施集群,通过软件最大化利用率,降低总体拥有成本。 

这句话翻译成大白话就是,别管模型有多玄乎,咱们来算笔账。如果你的工厂生产一万个 Token 要花一块钱,而我的工厂只要一毛钱,那你就没法跟我竞争。 

他在演讲中提到的Token 工厂,本质上就是把 AI 算力变成像自来水和电力一样的公共设施和标准化资源。

这时候,马斯克的那个判断就显得很有前瞻性了。马斯克前段时间说,未来的货币本质上将是瓦特。 

这话听着有点极端,但道理是对的。 

在 2026 年的今天,所有的智能,不管是写代码还是画图,到最后消耗的都是电费。谁能用同样的电,生产出更多、更好的 Token,谁就掌握了定价权。 

当很多硅谷精英还在争论大模型是不是真的懂人类时,没想到纳德拉这么干脆利索,已经开始像经营电厂一样,计算每一度电的投入产出比了。 

这种从讲故事到算成本的转变,将会是今年科技界最大的变化之一。 

2、张一鸣走的路,在达沃斯听到了回响

纳德拉关于“Token 工厂”的论述,在中国互联网界听起来一点也不陌生。 

如果你回头看 2024、2025 年的中国大模型市场,你会发现字节跳动旗下的火山引擎一直在干一件尤其遭人恨的事:降价、持续降价。

一句话,没有最低,只有更低。 

当时,很多大模型创业者都在谈技术路线、谈榜单跑分,但字节跳动的打法非常直接,把 Token 价格打到地板上,甚至直接免费。 

字节的逻辑很简单,大模型如果不被大规模使用,那就是废纸。为了让它跑起来,必须把门槛降到最低,这其实就是纳德拉所说的用量优先策略。 

张一鸣和纳德拉在这一点上达成了惊人的共识。 

AI 的胜负手不在于谁的模型参数大,在于谁的 Token 产出效率高、谁的生态里消耗的 Token 多,还在于谁能大规模地和廉价地供应给全世界。

字节跳动为什么敢这么干? 

因为它自己就是那个最大的Token消耗大户。

字节旗下拥有抖音、西瓜视频、今日头条、飞书等海量应用,这些应用每天产生多少交互? 

它在对外卖 Token 之前,自己内部就已经在疯狂消耗 Token 了。这种从内部需求倒逼出的成本领先,让字节在构建Token 工厂时,天然比单纯卖云算力的公司更有动力去压榨每一瓦特的价值。 

纳德拉在达沃斯提到的第二点是应用服务层,也正是火山引擎一直在布局的方向。如果你发现所有人都在构建 AI Agent(智能体),那么你必然需要一个极其稳定的应用服务器层。 

字节跳动的豆包大模型,本质上就是这个服务器层上的一个超级应用。纳德拉的言论,在某种程度上,是对张一鸣过去几年工业化思维的一次跨洋背书。 

3、同样的 Token,不一样的生意经

虽然纳德拉和张一鸣都在谈 Token 效率,但由于微软和字节的基因和生意模式不同,他们谈论 Token 的本质逻辑其实是有区别的。 

我们可以把他们看作是电网老板和超级厂家的区别: 

微软(电网老板):

纳德拉的思路是,我要把工厂开到全球,把算力网络铺好。他谈论能效比,是因为微软的数据中心太多了,如果每一度电能多产出 10% 的内容,那省下来的钱就是天文数字。 

纳德拉希望全世界的企业都来用微软的电,所以他必须证明自己的电是最便宜、最稳的。 

字节跳动(超级厂家):

字节更像是一个本身就要消耗大量电力的工厂。它谈论低成本,是为了给自己旗下的短视频、社交软件寻找更便宜的燃料。 

字节的领先,是应用场景倒逼出的成本领先。它把 Token 价格打低,是为了分摊自己的研发成本,顺便让竞争对手在成本上感到绝望,顺便扩大自己的生态圈。 

简单来说,纳德拉是在给全世界造插座,而张一鸣是先给自己造了一堆家电,然后发现由于家电太多,自己造电反而最划算,顺便还把电卖给了隔壁邻居。 

微软和字节,一个是向外扩张的基建狂魔,一个是向下扎根的应用霸主。

4、Token 是未来吗?寻找 AI 的“后 Token 指标”

在纳德拉和张一鸣的共识背后,我们也必须保持一定的冷思考。 

去年的这个时候,刚好是DeepSeek R1发布,现在满一年。 

回过头看, DeepSeek R1的 发布不仅是中国 AI 的高光时刻,更是整个行业逻辑的转折点,它证明了算法的巧劲可以战胜算力的蛮力,通过算法优化可以极大地节省成本。 

这意味着,光有工厂不行,还得有顶级的生产工艺。 

那么,当 Token 变得像空气一样廉价时,它还是衡量 AI 发展的核心指标吗? 

答案是:Token 可能很快就会成为历史。

这对纳德拉和张一鸣来说,既是挑战也是机会。 

现在的趋势是,大模型的竞争指标正在发生变化,行业共识已经发生了剧变。以前大家聊模型,第一句话问“你参数多大?”,现在大家问的是“你一个 Token 的推理成本降到几分钱了?”。 

随着 DeepSeek 验证了强化学习和模型蒸馏的高效,行业开始意识到,Token 的数量虽然重要,但 Token 的含金量和质量更重要。

如果一个大模型生成了 100 万个 Token,却无法帮用户定到一张正确的机票,那么这 100 万个 Token 就是垃圾。在工业化生产之后,我们需要的是有效产出。 

未来,除了 Token 效率,以下三个指标将变得更加关键: 

任务成功率:这是未来最核心的指标。与其关心 AI 说了多少话,不如关心它办成了多少事。一个高效的 AI 应该用最少的 Token 消耗,完成最复杂的任务。

推理延迟:纳德拉提到的电厂模式,对稳定性和实时性要求极高。如果 AI 的反馈需要让用户多等哪怕几秒钟,它就无法大规模融入实体经济。未来的竞争,是毫秒级的竞争。

多模态融合效率:纯文本的 Token 已经不值钱了。未来真正值钱的是能驱动机器人动作、能生成 3D 模型、能进行实时视频交互的指令序列。这些多模态 Token的生产效率,才是下一阶段的必争之地。

5、Token 只是开始,真正的硬仗在后面

纳德拉站在张一鸣这一边,说明全球AI的竞争已经进入下半场。 

当AI变成一种可以大规模、标准化生产的产品,那些还在纠结技术玄学的公司,可能会被迅速淘汰。而那些专注于提升每一瓦特价值的公司,才会笑到最后。 

正如纳德拉在达沃斯所说,AI 将成为全球经济的动力源。这意味着,未来我们评价一家科技公司,不会再看它发了多少篇论文,而是看它在实体经济中,到底帮企业省了多少钱、提了多少效。 

张一鸣在中国走了几步,纳德拉现在大声告诉全世界:这条路是对的。 

至少,目前是。 

【版面之外】的话:

纳德拉和张一鸣都在追求标准化的智能,但商业世界有一个扎心的规律,越是标准化的东西,就越不值钱。 

当 AI 生产的 Token 变得无比精准、廉价且随处可见时,那些不标准的东西,比如人类的直觉、带偏见的创意、甚至是一个虽然低效但符合人类惯性的错误,反而会成为新的稀缺品。 

AI发展越迅猛越普及,人类就越要守住那种不标准,不怎么高效,不怎么聪明的胡思乱想。 

本文来自微信公众号“版面之外”,作者:画画,36氪经授权发布。

+1
13

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

AI今年超人类,2035超越全人类

2小时前

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业