基模“驱虎”,阿里“吞狼”

锌产业·2025年09月04日 09:48
3600亿,大模型给了阿里一个“彩头”。

今年7月,彭博社对阿里云创始人王坚进行了一次访谈,当时王坚还有另一重身份,之江实验室主任。

之江实验室是浙江省为基础技术研究和攻关建设的前沿阵地,2021年被纳入了国家实验室体系,作为继云计算之后的又一项进入社会议题的重要基础技术,人工智能自然也在之江实验室研究之列。

曾经,王坚是国内最大一朵云——阿里云的缔造者,如今,王坚再次站到了人工智能技术漩涡中央,本质上是当代“工业革命”,或者说是技术革命的一次延续。

在彭博社的那场访谈中,王坚有这样一段话描述了云与AI的关系:

因为互联网的存在,我确信云计算是一项好业务,而互联网将数据聚集到一起,也让我坚信,数据会从根本上改变商业模式。

但我当时没有意识到的是,计算、数据、模型结合在一起会创造出人工智能,会再次改变我们做生意的方式,也没有想到,人工智能会成为云计算最大的‘客户’。”

当然,王坚更不会想到的是,它年之后,人工智能会在短短几天内为阿里云带来3600亿市值。

01 基模“驱虎”

2019年3月27日,2018年图灵奖名单公布,在这一届图灵奖得主中,最引人注目的是“深度学习三巨头”——杰弗里·辛顿、约书亚·本吉奥和杨立昆。

这老三位有着错综复杂的关系,又各有各的故事。

辛顿的人工智能技术成果曾在2013年以4400万美元的高价竞拍给了谷歌,辛顿也随之一起投效了谷歌,当时参与这场竞拍的还有微软、百度。

后知后觉的Meta后来是三顾茅庐请了杨立昆出山,来为Meta的人工智能战略坐镇。

学术大佬的坐镇对于科技巨头有诸多好处,诸如这些学术大佬手中技术成果商业转化的优先权,以及这些学术大佬的名气和人脉带来的人才资源。

当然,由于在美国这些科技巨头中拥有至高话语权,这些学术大佬往往也会将自己的学术习惯带到公司中,杨立昆为Meta带来的一个“学术习惯”是,开源。

2022年11月30日,ChatGPT的问世将人工智能拉入了大模型范式,也让人工智能进入到了OpenAI时刻。

我们如果看那一年美国人工智能领域格局的话会发现:

OpenAI一骑绝尘,投资了OpenAI的微软成了最大的赢家,谷歌依旧是美国顶级科学家的大本营,而且还是Transformer架构的提出者。

那么,当时同为美国顶级科技公司的Meta要如何应对?

在杨立昆的影响下,Meta在人工智能领域走了另一条技术路线,开源路线

2023年2月,Meta发布了自己的Llama 1,这是Meta发布的第一个大模型,一个开源大模型。

在大模型成为人工智能主流技术范式后,通用基础大模型,也就是大家常说的基模,形成了以OpenAI为代表的闭源路线以Meta为代表的开源路线两条技术路径。

在国内,承袭了开源技术路线的是阿里

2023年8月,阿里首次对外发布两款开源大模型QWen-7B和QWen-7B-Chat,通过小参数模型,阿里开始试水大模型开源路线。

实际上,当2023年大模型这把火烧到国内时,最先感知到它的存在的是两个群体:

一个是李志飞、王小川、李开复等科技领域创业大佬,另一个就是国内互联网巨头。

前者支撑起了2023年国内的百模大战,后者则成了这场百模大战的最终受益者。

国内在2023年最早发声、也是势头最猛的互联网巨头公司有两家:

一家是在2013年收购辛顿DNNresearch未果的百度,百度后来在国内广泛招揽AI人才,在2014年重组深度学习研究院为百度研究院,确立了AI战略。

2023年3月16日,百度召开新闻发布会,发布了文心一言,百度CEO李彦宏自豪地称,“百度是全球大厂中第一个发布大模型的厂商。”

只不过,卡点发布的文心一言并没能如众人所愿那般对标上ChatGPT,乃至在之后的一年里,国内人工智能领域的一个普遍观点是,国内大模型的技术进程较ChatGPT至少落后1-2年

另一家是后来走了开源路线的阿里。

同样是在2023年就发布了大模型的阿里,虽然其产品通义千问对外发布时间比百度晚了一个月,但却成了后来国内发展最猛,也是最有可能追上OpenAI的团队。

实际上,互联网巨头在技术领域往往秉持的是广撒网模式,国内几家大厂的实验室中其实早早就有在跟进大模型这条技术路径,也早早就有了技术雏形,只是大家不确定该All in哪条路线,以及人工智能何时到来。

话分两头,一头是国内掀起了百模大战,尤其是在基模领域追赶ChatGPT,成了2023年中国科技领域的重头戏

这一年,无论是大模型明星创业团队,还是互联网巨头,在产品发布会上大都会提到或被问到——团队与ChatGPT的技术差距有多久?

这场持续了近两年的百模大战第一阶段最终以“大厂做基模、创业做应用”的暂定格局收尾,其中标志性事件是零一万物部分团队并入阿里,李开复公开表示,“只有大公司能继续做超大模型(教师模型)。”

“AI六小虎”黯然失色,基模进入到了互联网巨头掰手腕阶段

另一头是互联网巨头的基模不断刷榜后,开始挺进商业世界。

阿里的开源大模型是在Qwen2.5、尤其是2025年1月的Qwen2.5 Max发布后,开始在产业中体现出商业价值。

02 押注AI,像押注云计算一样

2024年是中国大模型发展最快的一年,也是烧钱最快的一年。

阿里现任掌舵人吴泳铭在近日的财报电话会上透露,阿里过去四个季度在AI基础设施和AI产品研发上的累计投入已经超过1000亿元。

由此带来的是,阿里在国内人工智能领域的一骑绝尘。

就业务从属关系来看,阿里将大模型产品放到了与之高度相关的云业务体系中,这其中一个关键考量自然是大模型产品的应用与云计算资源消耗高度挂钩,“卖大模型就是卖token”已经成为一个主流观念。

尤其是在吴泳铭接棒阿里CEO的2023年,为阿里云定调“AI驱动、公共云优先”战略后,阿里云开始向AI云转变。

以最为关键的基模模型能力来看,在2024年云栖大会上发布的Qwen2.5 72B开源大模型,部分性能已经超越了Meta同期发布的Llama 3.1 405B大模型,这款大模型也被周靖人称为“最强开源模型”。

如果说阿里云2023年发布7B参数开源大模型是试水技术路线,那么,自Qwen2开始发布72B参数规模的大模型,阿里云就已经坚定要走开源路线,并通过大量人才、资金的研发投入,很快走在了全球前列。

据阿里官方给出的统计数据显示,截至2025年4月,阿里通义系列开源模型超300个全球下载量超3亿次,基于Qwen系列衍生模型超10万个

与此同时,阿里云还上线了用于模型训练和部署的人工智能平台PAI、用于企业级大模型开发的百炼平台,搭建了用于训练模型的十万卡级灵骏智算集群,研发了用于模型推理的平头哥系列芯片……

后来阿里云一再强调打造了全栈AI体系,芯片、算力集群、平台工具、通用基础大模型,正是其中关键的几个环节。

至于资金投入上,2024年国内大模型领域还上演了一场别具特色的价格战,字节、阿里、百度、腾讯、科大讯飞等基模公司都有参与到这场大战中。

阿里云的大模型在2024年至少经历了三轮集中降价,在2024年12月31日公布的第三轮降价中,通义千问视觉模型全线降价超80%。

关于降价,阿里云CTO周靖人在2024年9月的一次采访中曾专门做出过回应:

“今天大模型的创新、迭代和运用依然处于早期阶段,如果推理成本昂贵,大量开发者就无法有效、规模化使用大模型,大模型的能力需要让大家用得起……

……我不认为这是价格战,我们的大模型降价主要通过技术优化来实现,通过规模效应、技术进步和资源调度将成本进一步降低……”

后来行业中有过这样统计数据:

在经过2024年几轮降价后,大模型的调用成本下降了99%,百万Token调用成本直接降到了不到1元

大模型基模的技术冲刺、成本猛降的成效最终在阿里云业务上有了很好的体现,吴妈在2025财年年报中指出,阿里云公共云收入增长加速、AI相关产品收入连续七个季度实现了三位数增长,全财年收入实现了双位数增长。

而转年进入2025年、大模型应用落地元年后,阿里云再次加快了推进AI战略的脚步,我们能够看到的是:

曾经帮助阿里推广了云计算的阿里云城市峰会,在这一年转变为AI势能大会,开始在各个城市推广阿里云的全栈AI、大模型能力,以及已经打造出的阿里云大模型应用标杆企业的标杆案例;

更为直观的是,曾经朗朗上口的“上云就上阿里云”的广告词,在这一年也化身为“AI就用阿里云”,出现在了各大机场最显现的位置。

阿里云押注AI的决心,就像十年前押注云计算一样

只不过,这次,所有人都相信AI的未来,AI的竞争从第一天就是炽热战场。

03 3600亿的“彩头”

9月3日,Anthropic官宣完成130亿美元F轮融资,投后估值1830亿美元(约1.3万亿元),全球人工智能领域由此迎来了第三家万亿估值独角兽公司。

Anthropic是由OpenAI前员工在2021年创立,和OpenAI并称为全球基模领域两大AI独角兽公司。

或许有人会觉得遗憾,国内经过百模大战后,也未能跑出一家像上述两家一般的基模创业公司,基模最终仍是被互联网巨头秋风扫落叶后收入囊中。

实际上,这本质上是两个创业环境培养出的不同创业体系——美国往往是在基础技术上一骑绝尘,中国的创业团队更擅长的是应用创新

如果将人工智能视为堪比互联网的跨时代技术周期,在人工智能被写入政府工作报告、成为国家战略级新兴产业后,国内人工智能产业基本由深层到浅层可以按数据、算法、应用被划归为三大环节,这其中:

最根本的数据构成的数据网,更像是互联网时代由三大运营商运营的互联网,由新成立的数据集团统一管理,北京数据集团就在2025年7月正式成立;

最基础的通用基础大模型,更像是互联网时代的门户网站,最终会由几家人工智能巨头提供,显然,阿里云正在从互联网巨头过渡到人工智能巨头;

最广泛的人工智能应用,更像是互联网时代各种门类的App,这正是中国创业团队擅长的地方,各种智能体正在中国市场孵化中。

作为人工智能这个大时代中商业帝国的根本,如今的一个行业共识是:

通用基础模型已经足够支撑第一波商业化应用落地,我们正在进入一个由通用基础模型“教”出的小参数模型支撑各类智能硬件、催生智能体和智能应用的阶段。

也是在这时,作为国内通用基础模型的代表,阿里在全球的估值也迎来了一次急剧拉升。

在阿里2025年财报发布后,阿里股价一度飙升19%,港股市值由此飙升超4000亿港元(约3600亿元)。

就连外媒都为此咂舌不已。

不过,3600亿也只不过是中国人工智能产业发展的一个彩头。

一则是,人工智能应用、智能体创业大潮刚刚开启,超级AI应用还在酝酿之中,大模型第一阶段商业大幕才仅仅掀开一角,由基础模型带来的商业价值更多停留在提振云计算、消费token上;

二则是,从数据集团的成立、《人工智能生成合成内容标识办法》落地来看,我们仍处于人工智能基础设施构建和完善阶段,甚至包括通用基础模型,依然处于不断完善阶段。

在今年接受彭博社采访时,王坚就指出,“AI竞赛是一场马拉松,我们肯定还处于早期阶段。”

甚至,王坚“并不认为在AI领域,如今拥有的任何优势,会成为别人无法追上的障碍。”

本文来自微信公众号“锌产业”,作者:山竹,36氪经授权发布。

+1
5

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000
特邀作者

用技术范式,给未来一个解释。

下一篇

诺和诺德的发展故事不仅是一部用技术温暖生命的编年史,也是一场在变与不变中持续生长的远征。

7小时前

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业