OpenAI曝出第一颗芯片叫「辣椒」,AI自己设计,9个月流片

新智元·2026年06月25日 08:07
OpenAI首颗自研芯片Jalapeño问世,9个月白纸到流片,创下行业最快纪录。设计它的,正是跑在上面的AI模型。

就在刚刚,OpenAI掏出了史上第一颗自研芯片。

名字叫Jalapeño,墨西哥辣椒,专为大模型推理设计。

9个月前,白纸一张。

9个月后,工程样片不仅跑通了GPT-5.3-Codex-Spark,而且频率和功耗均已达到量产目标。

更离谱的是,这颗芯片是OpenAI用自己的AI帮着画的。

9个月,行业纪录碎了

Jalapeño,墨西哥辣椒里辣度最温和的品种之一。

OpenAI拿它给第一颗芯片命名,潜台词很可能是:这只是入门级,后面可能还有更辣的。

官方定位叫「Intelligence Processor」,一颗专为大模型推理设计的定制ASIC。

由OpenAI主导架构设计,Broadcom负责芯片实现和网络互联,Celestica做板卡和机架集成。

通常来说,先进半导体行业,设计一颗高性能ASIC要18到24个月。Google TPU两年一代,Amazon Trainium差不多也是这个的节奏。

而OpenAI只用了9个月,一举刷新了先进半导体领最快的ASIC开发周期。

这颗芯片从第一根线开始就只为一件事优化:LLM推理。

而且,Jalapeño不只跑OpenAI自家模型,架构上兼容全行业的LLM。

AI帮自己画了电路图

比性能更值得关注的,是这颗芯片怎么被造出来的。

OpenAI自家AI模型参与了这颗芯片的设计和优化。

也就是说——AI设计了一颗芯片,芯片反过来跑AI,跑在上面的更强AI会设计下一代更强的芯片。

AI,帮自己造了一副新身体。

AI设计芯片不新鲜。Google 2021年在Nature发论文,用强化学习做芯片布局,速度比人类快几个数量级。

此后AlphaChip连续优化了三代TPU布局方案。

OpenAI硬件团队的掌门人Richard Ho,正是从这个圈子里走出来的。

Google近九年,TPU高级工程总监,参与发明了ML设计芯片架构的方法,多个TPU项目首次流片即成功。

之后去了光子计算公司Lightmatter当高级副总裁,更早联合创办过EDA公司0-In Design Automation。学术界、芯片设计、AI硬件,整条路走了一遍。

OpenAI挖他来,大概率就是为了一件事:把「AI辅助芯片设计」嫁接到自家模型上。

芯片设计最磨人的不是「想方案」,是无数次的设计—验证—改—再验证循环。一颗先进芯片的验证要跑成千上万次,占掉整个周期的大半时间。

AI恰恰擅长干这种事——读历史设计数据、生成RTL代码、辅助验证和debug、优化布局布线。

能实现9个月流片,靠的是AI替人扛掉了那「18到24个月」里最磨人的一大块。

用最会用锤子的人,来设计新锤子。用最懂LLM运行规律的模型,来设计专门跑LLM的硬件。

你的ChatGPT账单正在被重写

OpenAI每年算力支出百亿美元级别,这些钱最终要从你身上赚回来——20美元月费、API调用、Plus和Pro订阅。

推理成本砍半,普通用户最先感受到的:响应变快。

现在ChatGPT高峰期排队、转圈、长对话变慢,本质都是算力不够分。

推理效率提升后,同等服务器能服务更多用户,体验有望改善。

其次:免费版能力放开。

现在很多功能锁在Plus里——深度研究、高级数据分析、完整版语音对话。

成本降了,这些功能下放给免费用户的可能性就大了。

而OpenAI需要的,正是让更多人用上ChatGPT,并且能用更久。

再往远看:20美元的月费可能还是20美元,但你拿到的东西完全不一样。

去年这个价格买到的是GPT-4o,明年同样的钱可能买到的是一个能跑完整工作流的agent。

月费没变,能力可能翻几番——推理成本下降带来的隐性降价。

但Jalapeño瞄准的不只是今天的ChatGPT。

Richard Ho的思路是:为模型要去的方向设计硬件,而不是为它现在的样子。

OpenAI内部能看到未来6到9个月模型的演进方向,芯片按这条管线往前造。

等agent真正跑起来,算力需求和今天的一问一答完全不是一个量级。

说白了,推理成本降下来,受益的不只是Pro用户。

学生、小企业、独立开发者,都可能用上今天只有大客户才跑得起的AI能力。

OpenAI要吃掉整条链

模型自己训,芯片自己设计,推理自己优化,部署自己控制。

换句话说,OpenAI要做全栈AI公司。

之前和Cerebras合作推理部署,OpenAI从中摸清了专用推理硬件的价值。现在自己下场做,把经验变成自己可控的平台。

Apple和Google都走过这条路。

但OpenAI的全栈多了一层:

用AI加速AI基础设施建设,再用更好的基础设施跑更强的AI。如果这个循环成立,飞轮会自己给自己加速。

首批GW级数据中心将和Microsoft等合作方从2026年底开始部署。

Jalapeño只是第一代,下一代叫什么还不知道。

但造它的,大概率不只是人了。

参考资料:

https://x.com/OpenAI/status/2069770172802773292

https://openai.com/index/openai-broadcom-jalapeno-inference-chip/

本文来自微信公众号“新智元”,作者:ASI启示录,编辑:摩西,36氪经授权发布。

+1
5

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000
36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业