一位芯片老兵,再战英伟达
2016年,当英特尔斥资约3.5亿美元收购Nervana Systems时,这家芯片巨头对人工智能市场的野心昭然若揭。
八年后,Nervana联合创始人Naveen Rao正带着一家名为Unconventional的新公司,目标估值50亿美元,手握10亿美元融资计划,准备再次向英伟达发起冲击。
这一次,他不再是大公司的附庸,而是以独立创业者的身份,试图用一种全新的计算架构改写AI硬件市场的规则。
三位神经科学家的创业梦
故事要从2014年说起。那一年,“人工智能”还是一个让投资者皱眉的词汇。
“当时,人工智能是一个肮脏的词,”在肯塔基州长大的Naveen Rao回忆道,他的父母是印度移民。那时的AI被视为“某种失败,一种拙劣的玩意儿”——一个深奥难懂、令人着迷的研究领域,在大学实验室和科幻迷中引发热烈讨论,但不被认为具有任何实用价值或商业价值。
Rao与Amir Khosrowshahi、Arjun Bansal三人在高通公司相遇。他们都拥有神经科学博士学位——Rao和Bansal是布朗大学的同班同学,Khosrowshahi毕业于加州大学伯克利分校。三人都是科技迷和科幻迷,对《终结者》《黑客帝国》《神经漫游者》等作品中关于智能机器的想象着迷。
“我们所有人都热衷于当书呆子,”Rao说,“那些关于电脑因为智能而失控的电影总是让我着迷。”对能够像人类一样思考的机器的痴迷,促使三人进入了神经科学领域——研究大脑的运作方式,而这也正是人工智能研究的核心。
在高通工作期间,他们开始谈论创办自己的公司。“我们聊了聊,”来自伊朗的移民Khosrowshahi说,这引出了更严肃的话题,关于“我们将如何打造机器学习处理器”。值得注意的是,Khosrowshahi出身于一个著名的技术专家和投资者家族:他的表弟Dara Khosrowshahi曾任Expedia首席执行官,现任Uber首席执行官,并在Nervana早期担任过导师。
那时,三人清楚地意识到,以深度学习形式出现的人工智能正在蓬勃发展。他们瞄准了这项技术的一大障碍:硬件,特别是微处理器。深度学习涉及更繁重的计算任务,传统的中央处理器难以轻松处理,而用于游戏和高端图形的图形处理器,尤其是英伟达的GPU,性能要好得多。
“我们有所有这些想法,其中有一个非常实用的想法:我们可以设计制造芯片,”Khosrowshahi说。
他们得到了Khosrowshahi在加州大学伯克利分校的导师之一、红木理论神经科学中心主任Bruno Olshausen的支持。当他们向Olshausen解释计划时,这位受人尊敬的神经科学家说:"你必须行动。你必须现在就行动。"
"他看到我们处于领先地位,甚至领先于其他所有人,"Khosrowshahi回忆道。Bansal指出,Olshausen"不是一个容易激动的人",所以他的热情反应对他们来说意义重大。
艰难的融资之路
但让投资者兴奋又是另一回事。2014年,当他们创立Nervana时,人们谈论的是“机器学习”,而不是“人工智能”。Nervana的创始人经常谈论另一个当时并不广为人知的概念:深度学习。
深度学习是人工智能的一个分支,它使计算系统能够通过人工神经网络来模仿人类大脑的工作方式,这些神经网络能够拾取、记录和处理数据和信号,然后以类似于人类记忆的方式组织信息。
Khosrowshahi的一些亲戚告诉他:“我们宁愿你别这么做。”他们担心人工智能是一项过于未来化的登月技术。此外,Nervana专注于一个通常会让投资者感到不安的领域:硬件。“他们知道打造硬件的难度,”Khosrowshahi说。
但随后,转机出现了。谷歌于2014年初收购了总部位于伦敦的人工智能公司DeepMind,当时Nervana正处于创立阶段。2016年,DeepMind凭借其人工智能系统AlphaGo击败了围棋世界冠军,一举引起国际轰动。围棋是一种类似于国际象棋的复杂棋盘游戏,计算机一直难以掌握。
“DeepMind的成立意义非凡,”Rao说道。它也帮助Nervana筹集了资金。Rao、Khosrowshahi和Bansal在首轮融资中筹集了60万美元,这笔资金足以让他们"辞去工作,租一间办公室,雇人"。之后,他们又筹集了约2400万美元。
突然间,人工智能成为了人们关注的焦点。随着人们越来越关注人工智能在声控设备、自动驾驶汽车中所扮演的角色,这些技术总体上“从有趣的玩具变成了可以使用的东西”。
芯片是人工智能潮流的核心。英伟达抓住机遇,率先领先。芯片初创公司迅速加入竞争,打造专为人工智能设计的处理器。在这场竞争中,Nervana已然是先驱。
“这是一次幸运的意外,”出生于新德里、后来凭借南加州大学全额奖学金来到美国的Bansal说道,“我们看到了可以超越图形芯片进行优化的机会。”
到2015年末,越来越多的投资者对人工智能产生了兴趣。“现在,每个人都在投资这个领域,”Rao打趣道。更重要的是Nervana团队对初创企业领域的影响,现在人们更加关注硬件和芯片。
“打造硬件真的很难,”Khosrowshahi说,“但现在正值它的黄金时代。”
英特尔的橄榄枝
而此时的英特尔,正面临着一个严峻的现实:在深度学习芯片市场,这家半导体巨头正被劲敌英伟达击败,其在半导体领域的主导地位正在被削弱。
深度学习的崛起让英伟达的GPU找到了新的用武之地。这些原本为游戏和高端图形设计的处理器,在处理深度学习所需的大规模并行计算时表现出色。英伟达迅速占领了这个新领域,甚至开始将自己定位为一家人工智能科技公司。
“深度学习落到了他们的头上,”Rao说道。现在,英特尔需要夺回失去的阵地。
英特尔首席执行官兼创始人Andy Grove有一句著名的口头禅:“只有偏执狂才能生存。”这番话成为了硅谷的战斗口号,强调了不断寻找甚至痴迷于新的市场趋势和威胁的重要性。2016年,Grove去世仅几个月后,英特尔决定收购Nervana,试图在这个芯片巨头曾经缺乏足够警惕的市场中实现反弹。
2016年,当Rao、Khosrowshahi和Bansal正寻求为Nervana筹集更多资金时,另一条道路出现了。Rao说,与英特尔的谈判"很快就从融资转向了收购谈判"。
“将公司出售给英特尔对我们来说是件有点伤感的事,它是我们的宝贝,”Rao说。但被英特尔这样的科技巨头收购意味着获得巨大的资源,这将给他们带来巨大的优势。
“英特尔拥有强大的技术资产,”Rao说道,“如果你把它应用到人工智能领域,我们就能获得相当大的优势。”
Khosrowshahi表示:“我们当时只是一支很小的团队,来到了英特尔,而英特尔却下了很大的赌注。”
英特尔最终以约3.5亿美元收购了Nervana Systems,旨在打入深度学习训练芯片市场。此前,这个市场一直由拥有更强大图形处理单元的英伟达公司主导。英特尔的想法是,通过开发专门用于深度学习的专用集成电路,可以获得超越英伟达的竞争优势。
Nervana的短暂辉煌
收购完成后,英特尔的人工智能平台事业部由Rao领导,成员包括Nervana的许多前员工。这是英特尔对AI芯片市场的一次重大押注。
英特尔的人工智能部门已经推出了能够运行人工智能系统的芯片。但真正的考验将在稍后到来——一款名为英特尔Nervana的新处理器,这是这家科技巨头首款从零开始打造的人工智能芯片,旨在处理人工智能所需的海量数据吞吐量。
Rao承认他们面临的挑战:“我们面对的是一个努力的竞争对手,而且他们很优秀。”英伟达一直在努力捍卫其领先地位,其首席执行官黄仁勋当时表示:“我们看到人工智能正在几乎所有行业得到应用,从交通运输到医疗保健,从零售到物流、工业、农业。”
2018年,英特尔在人工智能峰会上正式推出了Nervana神经网络处理器——用于深度学习训练的NNP-T1000和用于推理的NNP-I1000芯片,并宣布下一代Movidius VPU将于2020年发布。这些产品的开发源于英特尔2016年对Nervana和Movidius的收购。
Rao在声明中表示:“随着人工智能的下一阶段发展,我们在计算硬件和内存方面正达到一个临界点。像英特尔Nervana神经网络处理器和Movidius Myriad视觉处理单元这样的专用硬件对于人工智能继续取得惊人的进步至关重要。”
英特尔当时宣称,目前正在发售的这些芯片旨在为客户提供“系统级人工智能方法”,其中包括具有开放组件和深度学习框架集成的完整软件堆栈。
NNP-T1000提供了“计算、通信和内存之间的适当平衡”,使其适用于从小型计算集群到大型超级计算机的任何设备。Rao表示,NNP-T1000在ResNet-50和BERT等重要训练模型上提供了95%的扩展能力,并且在32块芯片上运行这些模型时性能几乎不会下降。
为了推动新芯片的推广,英特尔开发了一种新的pod参考设计,该设计由10个机架和480块NNP-T1000卡组成,这些卡使用英特尔的无胶结构互连。Rao表示:“这款ASIC专门设计用于分布式训练,无需切换。”
另一方面,NNP-I1000为客户提供了高效节能且预算充足的产品,可“使用灵活的外形尺寸在现实世界规模上进行密集的多模式推理”。Rao表示,与搭载英伟达T4推理GPU的服务器机架相比,运行NNP-I1000的服务器机架的计算密度几乎提高了四倍。“我们拥有的是在单个机架单元中每秒可以进行最多推理的能力,”他说。
英特尔表示,Nervana芯片是为了满足社交媒体巨头Facebook的人工智能处理需求而开发的。Facebook人工智能系统联合设计总监Misha Smelyanskiy在声明中表示:“我们很高兴能与英特尔合作,利用英特尔Nervana神经网络处理器部署更快、更高效的推理计算,并将我们最先进的深度学习编译器Glow的支持扩展到NNP-I。”
据报道,英特尔曾预计其人工智能产品将在2019财年创造35亿美元的销售额,其希望新的Nervana和Movidius产品能够延续这一势头,使其产品组合成为业内最广泛的广度和深度。
突如其来的转折
然而,好景不长。就在Nervana芯片发布一年多后,2019年12月,英特尔宣布以20亿美元收购另一家AI芯片公司Habana Labs。这次收购为Nervana芯片的命运埋下了伏笔。
Habana Labs是一家总部位于以色列的初创公司,自主研发了两款AI芯片:用于神经网络训练的Habana Gaudi和用于推理的Habana Goya。问题在于,这两组芯片的用途与Nervana芯片大致相同——一个用于训练,一个用于推理,过于雷同的定位,让英特尔陷入了两难的纠结。
事实上,在英特尔收购Habana时,分析师们就曾对Nervana芯片的未来进行过猜测。Moor Insights & Strategy分析师Karl Freund本人也表示,很难想象Nervana处理器会继续在英特尔的产品组合中扮演重要角色。
原因之一是Habana芯片的性能远超Nervana。在ResNet-50基准测试中,两块Nervana NNP-I芯片每秒可处理10,567个输入。但在同一测试中,仅一块Habana Goya芯片就能达到每秒14,451个输入——性能差距接近1.4倍。Goya不仅性能更强大,而且自2018年以来已开始向客户发货,而NNP-I尚未正式发布。
2020年,Karl Freund在《福布斯》杂志的一篇文章中披露,英特尔已决定停止Nervana神经网络处理器的开发工作,转而将精力集中在收购Habana Labs时获得的人工智能芯片架构上。英特尔告知他,已决定终止Nervana NNP-T训练芯片和Nervana NNP-I推理芯片的研发工作,但表示仍将履行对后者的客户承诺。
这意味着英特尔在AI芯片市场上为期四年的Nervana计划宣告终结。从2016年3.5亿美元的收购,到2018年的产品发布,再到2020年的项目终止,Nervana在英特尔内部的生命周期不到四年。
放弃Nervana芯片的决定对英特尔的人工智能平台事业部产生了重大影响。该事业部当时由Nervana Systems联合创始人Naveen Rao领导,成员包括该公司的许多前员工。英特尔在2019年12月表示,计划保留Habana作为一个独立的业务部门,但很可能会将其与人工智能平台事业部合并。
英特尔在这方面有先例,因为它曾在2017年以153亿美元收购Mobileye后将其自动驾驶集团与该公司合并,尽管它仍将其保留为一个独立的业务部门。
这是英特尔在AI芯片市场上的一次重大战略调整。事实上上,Nervana的技术路线最终在与Habana的竞争中落败了。对于Rao和他的团队来说,这无疑是一次沉重的打击——他们倾注心血打造的芯片,最终在母公司内部的竞争中败下阵来。
再次出发
Nervana项目终止后,Rao并没有立即离开英特尔。但最终,他选择了新的职业道路,加入了数据分析和人工智能平台公司Databricks,担任人工智能主管。
Databricks是一家成立于2013年的公司,由Apache Spark的原始开发者创立,专注于为企业提供统一的数据分析和人工智能平台。在Databricks,Rao负责领导公司的AI战略和产品开发,这让他能够从软件和平台的角度继续深入AI领域。
在Databricks工作期间,Rao积累了更多关于AI应用层面的经验和洞察。他看到了企业在部署AI应用时面临的各种挑战,也看到了现有硬件架构的局限性。这些经历无疑为他后来创立Unconventional埋下了伏笔。
但对于一个曾经试图用专用芯片挑战英伟达的人来说,在软件平台公司工作或许只是一个过渡期。Rao心中仍然怀揣着硬件梦想,仍然相信通过重新设计计算架构,可以为AI带来根本性的突破。
今年10月,根据知情人士透露,Rao正在为一家名为Unconventional, Inc.的新创业公司洽谈筹集10亿美元,这家公司正在开发一种新型计算机,其目标估值为50亿美元。
消息人士称,Andreessen Horowitz已同意领投,Lightspeed和Lux Capital也参与了此次交易。彭博社报道称,Databricks也正在投资Rao的新公司。据透露,Rao已经筹集了数亿美元,并计划在10亿美元融资轮全部结束后立即着手打造这家初创公司。他计划分期筹集剩余资金,这种融资方式通常被称为"分期"融资。
50亿美元的估值目标,远超当年Nervana被收购时的3.5亿美元。10亿美元的融资规模,也远超Nervana在被收购前筹集的约2500万美元。这些数字表明,投资者对Rao的新项目寄予厚望,也反映了AI硬件市场在过去几年间的巨大变化。
Rao拒绝置评,但他上周在X平台上公开承认了这家新创业公司的存在,确认了公司的名称,并将其预期产品描述为“重新思考计算机的基础,构建一个与生物学一样高效的智能新基础。摆脱生物学包袱,实现大脑规模的效率”。
这段描述透露出几个关键信息。首先,Unconventional不是在做渐进式的改进,而是试图重新思考计算机的基础——这是一个极其大胆的目标。其次,与生物学一样高效暗示了神经形态计算或受大脑启发的架构,这与Rao的神经科学背景高度契合。第三,摆脱生物学包袱意味着他们不是简单地模仿大脑,而是要提取其效率原理并超越生物限制。
从Rao的背景来看,这个方向并不令人意外。他拥有神经科学博士学位,创立Nervana时就是从神经科学的角度思考如何构建更好的AI芯片。现在,他似乎想要更彻底地实现这一愿景。
市场环境的巨变
与2014年创立Nervana时相比,如今的AI硬件市场已经发生了翻天覆地的变化。
最显著的变化是市场规模的爆炸式增长。2014年,投资者对AI硬件还持谨慎态度。如今,生成式AI的爆发让AI芯片成为了最炙手可热的赛道之一。英伟达的市值突破4万亿美元,成为全球市值最高的公司之一,其数据中心业务(主要由AI芯片驱动)的季度营收已经超过数百亿美元。
其次是竞争格局的变化。2014年,英伟达在AI芯片市场几乎没有竞争对手。如今,除了英特尔、AMD等传统芯片厂商,还涌现出了大量AI芯片初创公司,包括Graphcore、Cerebras、SambaNova等。更重要的是,科技巨头们纷纷自研AI芯片:谷歌有TPU,亚马逊有Trainium和Inferentia,微软正在开发Maia,Meta也在投资自研芯片。
第三是技术路线的多元化。早期的AI芯片主要聚焦于加速深度学习训练和推理,现在则出现了更多创新方向:模拟计算、神经形态芯片、光子计算、量子计算等。这为新进入者提供了差异化竞争的机会。
第四是资本环境的变化。在生成式AI热潮的推动下,投资者对AI硬件初创公司的兴趣空前高涨。像Groq这样的AI芯片初创公司能够在短时间内筹集数亿美元,估值达到数十亿美元。Unconventional的50亿美元估值目标,虽然雄心勃勃,但在当前的市场环境下并非不可想象。
然而,Rao和Unconventional面临的挑战也是前所未有的。
首先是英伟达的护城河已经变得更深。除了技术优势,英伟达还建立了强大的软件生态系统——CUDA平台经过近二十年的发展,已经成为AI开发者的标准工具。任何新的AI芯片,如果不能提供与CUDA兼容或同等便利的软件工具链,都很难获得开发者的青睐。
其次是客户惯性。经过多年的发展,主要的AI应用都是基于英伟达GPU开发和优化的。要说服客户切换到新的硬件平台,不仅需要显著的性能或成本优势,还需要完整的迁移方案和长期的技术支持承诺。
第三是制造和供应链的挑战。先进的AI芯片需要最先进的制程工艺,这意味着要与台积电等晶圆厂商建立合作关系,并在产能分配上与英伟达、苹果、AMD等巨头竞争。这对初创公司来说是一个巨大的挑战。
第四是人才竞争。顶尖的芯片设计人才供不应求,科技巨头和成功的初创公司都在高薪挖人。Unconventional需要组建一支世界级的团队,这需要时间和资源。
但Rao也有自己的优势。他有过完整的AI芯片创业经历,知道哪些坑需要避免。他在英特尔的经历让他深入理解了大公司的运作方式和局限性,而在Databricks的工作也让他更了解AI应用的实际需求。
结语
从某种意义上说,Rao的职业生涯形成了一个完整的叙事弧线。
2014年,他和两位神经科学家伙伴创立Nervana,试图用专用芯片挑战英伟达的GPU霸主地位。那时AI还是一个"肮脏的词",他们筹集了2500万美元,被认为是疯狂的赌博。
2016年,英特尔以3.5亿美元收购Nervana,Rao成为这家芯片巨头AI部门的领导者。他们开发出了Nervana NNP系列芯片,在某些指标上展现出了与英伟达竞争的潜力。
2020年,英特尔放弃Nervana芯片,转向Habana的技术路线。这次失败的经历无疑是痛苦的,但也让Rao更深刻地理解了在大公司体系内推动创新的困难,以及技术路线选择的重要性。
现在,他带着Unconventional重新出发,目标估值50亿美元,手握10亿美元融资计划。这一次,他不再是被收购的创业者,不再需要在大公司的体系内妥协和权衡。他可以按照自己的愿景,从零开始构建一种全新的计算架构。
而他的对手,依然是英伟达。只不过,这个对手已经比十年前强大了无数倍。英伟达的市值从2014年的百亿美元级别,增长到了2024年的数万亿美元。其在AI芯片市场的份额超过80%,几乎垄断了数据中心AI训练市场。黄仁勋已经成为科技界最有影响力的CEO之一,英伟达也从一家图形芯片公司转型为AI计算的代名词。
但市场也比十年前大了无数倍。2014年,全球AI芯片市场规模只有数十亿美元。到2024年,这个数字已经是数千亿美元,并且还在快速增长。即使只能占据这个市场的一小部分,也足以支撑起一家价值数十亿甚至上百亿美元的公司。
更重要的是,技术风向正在发生变化。过去十年,AI芯片的发展主要是在现有的冯·诺依曼架构基础上进行优化——增加算力、扩展带宽、提升并行度。但随着AI模型规模的指数级增长,这种方式正在遇到物理极限和能效瓶颈。
这正是Rao所说的“重新思考计算机的基础”的意义所在。如果Unconventional真的能够开发出一种在能效比上实现数量级突破的新型计算架构,那么它就有机会在这个看似被英伟达垄断的市场中撕开一道口子。
本文来自微信公众号“半导体行业观察”(ID:icbank),作者:邵逸琦,36氪经授权发布。