黄仁勋要靠梁文锋逼单

源媒汇·2025年07月16日 17:43
只有梁文锋配得上H20。

穿着皮衣顶着北京的大太阳,英伟达CEO黄仁勋可不想自己今年第三次的中国之行,就仅仅收获一张跟小米创始人雷军的合影。

次日,也就是7月15日,黄仁勋宣布H20芯片恢复对华销售,声称将缓解中国市场的算力瓶颈,算是帮DeepSeek创始人梁文锋解了围。

据知情人士爆料,DeepSeek的R2模型因H20芯片禁售而延迟发布,官网流量暴跌70%,用户流失至第三方平台,梁文锋急需R2模型来稳住局面。

作为垄断全球算力的硬核狠人,黄仁勋出手“搭救”梁文锋可能更多是从商业层面考虑,毕竟放眼全球,只有眼前这位广东靓仔依靠“阉割版”的基建,就能对OpenAI、谷歌等一系列国际巨头持续施压。

相爱相杀

黄仁勋与梁文锋的关系,可以用“亦敌亦友”来概括。

黄仁勋掌舵的英伟达,是全球AI算力基础设施的“军火商”,是支撑顶级大模型发展的核心引擎。而梁文锋创立的DeepSeek,则以“低成本、高性价比”为标签,通过算法创新将大模型训练成本压缩至行业平均水平的1/20。

在DeepSeek年初爆火出圈的那段时间,它不止颠覆了技术路径,更动摇了“算力霸权=商业成功”的旧秩序,一度让英伟达的市值蒸发千亿美元。

但如果追根溯源的话,两人的关系起点应该是合作,2021年,梁文锋着手提前卡位,意图购买1万张A100显卡,为DeepSeek后续研发奠定基础。彼时的美国还尚未将该型号列入禁售清单。

在后来的台北国际电脑展大会上,黄仁勋还公开称赞DeepSeek,他认为,DeepSeek-R1对人们理解AI和推理有巨大的影响,对行业和世界作出了巨大贡献。

对于老辣的黄仁勋来说,DeepSeek的崛起让他看到了新的市场机遇。2025年春节后的第一周,搭载8块H20的服务器价格从年前的100万元飙升至110万元,甚至有客户愿意加价5万元锁定现货,随后,这款显卡一路飙升,截止黄仁勋本年度第三次来华之前,市场价格已经来到了180万元。

英伟达芯片概念图 | 源Byte制

这款专为中国市场设计的芯片,虽在浮点运算能力上仅有旗舰产品H100的1/10,但其96GB显存和900GB/s的NVLink带宽,恰好击中了推理场景的命门。

当DeepSeek以560万美元的训练成本叫板行业巨头时,其开源策略点燃了企业部署AI的热情,但也带来了副作用:推理服务的稳定性成为致命短板,而H20的“错位竞争”策略恰好填补了这一需求空白,其4.0TB/s的显存带宽足以支撑数十个推理任务并行,而价格仅为H100的1/3。

也就是说,DeepSeek的崛起反而让H20完美地适配了中国大模型市场,黄仁勋这一次的中国行虽没有带来顶级“尖儿”货,但带来了最具性价比的选择。

还是黄仁勋的算盘打得精,在DeepSeek彻底将中国大模型市场定位在弯道超车的性价比路线后,英伟达极有可能将类似H100这类顶级显卡卖给海外顶级大模型公司,待其升级迭代数月后,再将“阉割版”、“特供版”大批量地出售给中国大模型公司,让其继续对海外公司保持竞争力。

毕竟,有竞争才有压力,有压力才会让这些大模型公司不断提升对算力的需求。

梁文锋又要杀回来了

在R2接连跳票的这段日子里,梁文锋的日子并不好过。

一度在大模型内卷中“掉队”的百度率先发难,百度创始人李彦宏早在4月就公开吐槽DeepSeek“慢且贵”,称其API调用价格远高于市场平均水平。

在外界都以为,梁文锋掏出R2模型将文心一言按在地上摩擦之时,仅仅在5月底推出了DeepSeekR1的改款,但是后续市场反响平平,并未帮助DeepSeek止住颓势。

截图来源于DeepSeek官网

根据国际半导体研究机构Semianalysis最新报告,DeepSeek的全球用户使用率已从2025年1月的50%骤降至7月的3%,官网访问量在2月至5月期间下滑63%。另一家AI模型集成平台Poe的统计显示,其核心模型R1的使用率在2月至4月间腰斩,从7%跌至3%,而同期ChatGPT和谷歌Gemini的使用率分别增长40.6%和85.8%。

眼见R2模型一拖再拖,一度让DeepSeek彻底挤下牌桌的“X小龙”们又活跃起来,6月中旬更新的MiniMax-M1模型,号称世界上第一个开源的大规模混合架构推理模型,其号称整个强化学习阶段只用到512块H800三周的时间,租赁成本只有53.47万美金。

来到7月,月之暗面上线的KimiK2模型,同样选择了开源,并成为国内开源领域首个总参数量达到1万亿的MoE架构基础模型。

截图来源于KimiK2官网

一个有趣的现象似乎可以印证“X小龙”们在R2缺位这段时间内的心情起伏,在BOSS直聘等招聘渠道上,5月份的主流岗位还是各类应用的产品经理,进入到6月就纷纷将其撤下,换成各类工程师与研究员。

毕竟,在为效率买单的AI付费体系尚未成熟的阶段,各类应用前途不明,倒不如在R2缺位的阶段,在大模型领域再搏一把。即便是Mauns这种一度火出半边天的爆款,并未在国内市场淘出几个金块,在近期甚至传出“跑路”去新加坡的消息。

甚至,部分国内大厂似乎看到了对DeepSeek取而代之的希望,赶工加点地推出产品,一度让行业从从“卷技术”转向“卷参数”,技术标准逐渐模糊化,甚至闹出了一连串的套壳抄袭事件。

就在7月初,华为盘古大模型被曝与阿里通义千问的代码相似度高达92.7%,华为的回应堪称教科书级别的公关话术——“严格遵循开源许可”,但开源社区的开发者们并不买账。这场风波并非孤例。月之暗面与阿里通义的纠纷也被旧事重提,尽管细节模糊,却足以让行业陷入信任危机。

“即便R2无法完全超越这些顶级大模型,但至少会给整个行业的发展路径定调,就是给大家一个如何接近和赶超顶级大模型的路径,省得只能在这里无效卷参数。”有开发者对源Byte坦言。

“虽然是一边唱衰DeepSeek,但行业还是离不开(DeepSeek),毕竟只有幻方知道如何赶超顶级大模型。”上述开发者表示,相比其他国产大模型,DeepSeek至少不会盲目卷参数,且清楚地知道这条追赶之路是什么状况。

就当友商们似乎见到光明之时,黄仁勋直接掐灭了火种,他为梁文锋带来了期盼已久的H20。据知情人士透露,DeepSeek团队近几个月一直在密集推进R2模型开发,但梁文锋目前对模型的能力仍不满意,内部仍在继续提升性能,相应模型尚未准备好正式投用。

黄仁勋带来的H20,虽然在性能仅为H100的15%-20%,谈不上雪中送炭,倒也间接地帮助国产大模型结束抄袭、套壳、参数注水的乱象。

芯片解禁,谁的救命稻草?

虽然梁文锋的R2模型在某种程度上,未来极有可能成为黄仁勋向OpenAI等公司逼单的筹码,但天下终究苦英伟达久矣,这位钟爱皮衣的男人同样需要盟友。

翻开“反英伟达联盟”的名单,既有OpenAI、Meta、微软、谷歌、亚马逊等深度依赖英伟达芯片的科技巨头,也包括英特尔、AMD、高通等英伟达的直接竞争对手。

来到今年6月,在AdvancingAI 2025大会现场,OpenAI的CEO萨姆·奥特曼明确表示,OpenAI未来将使用AMD的AI芯片。正在构建“芯片-模型-生态”三位一体的全新生态。

这种顶级AI模型厂商与芯片厂商深度合作的模式,可能会引发其他AI领军企业效仿,加速它们在芯片领域的布局。

AMD作为英伟达的老对手,在苏姿丰的带领下,凭借在CPU和GPU方面的建树,提供在性能上能与市场领导者匹敌甚至在某些单点上有所超越、但在成本上更具优势的产品,以此吸引那些对价格敏感或者寻求替代供应商的客户。

因此,H20这种性能被打了折扣的产品,恰好与AMD的芯片来到了同一赛道。据财报数据,2025年第一季度,英伟达营收达440亿美元,在独立显卡市场占据超90%的份额;AMD同期营收74.4亿美元,同比增长35.9%(年增36%),超出市场预期的71亿美元,增长势头强劲。

英伟达已被OpenAI、谷歌、Meta等头部机构的大模型训练(如GPT-4、PaLM)验证,形成“成功案例→行业信任→更多采用”的正向循环;而AMD在超大规模大模型(千亿参数以上)的公开成功案例较少,企业在选择时需承担“试错成本”。

就在黄仁勋宣布H20的第二天,AMD当即表示,在美国宣布将批准销售后,公司计划重启向中国出口其MI308芯片。AMD的MI308芯片是专为中国市场设计的AI加速器,基于其MI300系列架构,性能足以满足垂类模型训练和推理需求。

因此,OpenAI与AMD的合作,在某种程度上为AMD的产品和服务打样,倘若继续“禁售”下去,势必助长AMD在争取DeepSeek等一众国产大模型的优势。

对于黄仁勋来说,这块最适配H20的市场,又是增速最为迅猛的市场,错过这一波行情,不知下一次是何年。

根据IDC发布的《中国模型即服务(MaaS)及AI大模型解决方案市场追踪,2024H2》报告显示,2024年中国MaaS市场呈现爆发式增长,全年规模达7.1亿元人民币,较2023年实现215.7%的同比激增,其中2024下半年市场规模达4.6亿元人民币。展望2024-2029年,该市场将以66.1%的年均复合增长率高速扩容,预计2029年市场规模将达到90亿元人民币。

黄仁勋必须要在友商即将要起势的关键阶段,果断出手来打乱节奏,积极游说美国政府调整政策。

肉眼可见,英伟达将在中国市场狂赚一笔了。

部分图片来源于网络,如有侵权请告知删除

本文来自微信公众号“源媒汇”,作者:柯基的柯,36氪经授权发布。

+1
15

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000
36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业