特斯拉要把「世界最强AI」 搬上车,华为理想压力最大
马斯克最引以为豪的特斯拉智能座舱,在中国市场却如路边一条、无人问津,想必他心里一定不太好受。
就像《英雄本色》里小马哥发狠地说出“我失去的一定要亲手拿回来”一般,大洋彼岸的另一位“小马哥”,似乎也在憋了半年之后,要让自己的特斯拉重新拿回汽车智能化的王者地位。
上周四,在 Grok 大模型正式发布的隔天,马斯克兴奋地在 X 上宣布,Grok AI“最迟”将于下周(也就是这周)在特斯拉汽车上推出。
一旦实现,意味着特斯拉在智能化上迈出极其重要的一步。因为这不仅是马斯克首次为“Grok 上车”这个饼给出了准确的时间表,而且要上车的 Grok,还是马斯克口中的“地表最强 AI”:
比如,马斯克早就声称 Grok 4 要 “重写人类知识库”;在发布会上,马斯克再次强调 Grok 4 是目前世界上最聪明的 AI。
这么厉害的 AI 要上车,国内智能座舱的领头羊——华为理想们,能招架吗?
吹牛还是真实力?
一提到 Grok,更多人最先想起的可能是它的“口无遮拦”,无论是说“日本历史上最大的烟花是原子弹爆炸”,还是支持希特勒的“反犹言论”都令人印象深刻。
而在 Grok 4 发布之后,大家的关注点又放到了它最高可达每年 3000 美元的“天价”订阅费用上。所以当马斯克说 Grok 4 是「世界最聪明 AI」 的时候,更多人持有的是怀疑态度。
果然,在 Grok 4 在实际测试中马就“翻车”了。
博主@ karminski-牙医 发微博称,经过他的测试,在「20小球在七边形里面弹跳」的经典试题中,Grok 4 不仅在 3 次代码生成中就有 2 次有语法错误,唯一一成功的,表现也和初版的 DeepSeek R1 有明显差距。
在另一个难度更高的「烟囱爆破模拟」中,Grok 4 的表现也比较一般,不仅散落的粒子粗糙模糊,最离谱的是模拟出来的烟囱底部甚至不是圆柱体的…和旁边的 DeepSeek R1 一比,简直高下立判。
反正, Grok 4写代码根本没有第一梯队水平,更别说牛吹上天的「世界上最聪明 AI」 了。
不过,尽管马斯克没有确认即将上车的 Grok会在特斯拉的智能座舱中扮演什么角色,但国外媒体分析大概率会先在车机中担任「语音助手」。
如果只是要做「语音助手」,那这项功能对 Grok 来说就是牛刀小试了。
特别是作为语音助手最需要的大模型能力:多学科推理、语义理解、上下文理解和 Agent 能力方面,Grok 4 在目前的大模型里的确算是数一数二的。
多学科推理这块,在 HLE(Humanity’s Last Exam),一般中文翻译为“人类终极考试”或“人类最后考试”的测试中,无工具辅助的情况下,Grok 4 的得分为 25.4%,大幅超越Gemini 2.5 Pro 的 21.6% 和 OpenAI o3的 21%;如果有工具辅助,则 Grok 4 的得分可以进一步上升到 38.6%,Grok 4 Heavy 的得分更是达到了 44%。
另外在ARC-AGI 测试中,Grok 4 甚至“创下新纪录”。这项测试旨在评估 AI 模型的通用智能水平,题目主要是视觉推理类测试,Grok 4 的得分为 16.2%,在得分坐标系中可以说是“遥遥领先”。
另外在上下文理解方面,Grok 4 支持256k token的上下文窗口,虽然比不上Gemini 2.5 Pro 变态级别的100万个token,但也超越了Claude 4 Sonnet、Claude 4 Opus 、ChatGPT o3的200k token和 DeepSeek R1 0528 的 128k token,用来做语音助手是绰绰有余了。
而且马斯克还说Grok 4 基础模型的第七版将在本月完成,会拥有更出色的视频理解能力和工具调用能力;接下来几个月 xAI 还会推出代码模型、多模型智能体以及视频生成模型。
总而言之,哪怕是单智能体版本的 Grok 4,在车上调节个空调、雨刮、后视镜什么的肯定够用了。
有 Grok 加持,特斯拉的智能座舱堪称是小米加步枪换巴特雷,试想在特斯拉原先就非常炸裂的销量之上,还有了能用自然语言流畅对话、操控大面积的车用功能的语音助手,直接解决了一个消费者诟病许久的槽点。
只要特斯拉上的 Grok能达到国内新能源车语音助手的平均水准,小米、理想、华为、小鹏等在发布会上“嘲笑”特斯拉的点又少了一个,宣发部门压力又大了一点。
但「语音助手」就是 Grok 上车的全部意义吗?显然不是。
为 FSD 赋予灵魂
除了能补齐人机交互的短板之外,我们不妨脑洞更大些:如此强大的 Grok 4,有没有可能甚至可以影响、控制 FSD?
这个脑洞并非毫无根据。在咱们国内,新能源车企们的智能辅助驾驶功能规划里,早就把「自然语言指挥辅助驾驶」作为下一代辅助驾驶系统的必备功能了。
在 NVIDIA GTC2025 上,理想高管提到了在自家下一代自动驾驶技术 MindVLA 中,要让汽车的智驾系统变成听得懂、看得见、找得到的专职司机。
在理想的描述中,用户可以和汽车系统深度互动,比如在智驾的过程中一旦车子开快了,就可以用“开得太快了”的模糊语音指令来限制车速;车子已经规划好智驾路线后,车主也可以临时改变主意,对着车机说“在下一个路口右转”,智驾就会根据指令修改路线。
这个像“科幻片”一样功能,目前还有华为、小鹏、极氪和小米等车企在规划。
耐人寻味的是,Grok 4 所展现出来的能力,就像为「自然语言指挥辅助驾驶」量身定制一般。
「自然语言指挥辅助驾驶」里,AI 对自然语言的理解和对驾驶意图的精准映射是核心。这时Grok 4 支持256K 上下文窗口与多代理协作架构(Grok 4 Heavy 专属),有同时处理用户语音指令、车辆状态与环境数据的复杂关联的潜力
当用户说“前面要堵车了,换条车少的路”时,Grok 就能解析出三重语义:环境感知(识别地图上的拥堵状态)、用户偏好(“车少”= 低流量路径)和动作生成(触发路径重规划),进而快速选择一条新的行车路线。
另外,Grok 4 Heavy 的 4-Agent 并行架构从技术上为 FSD 提供“类人决策脑区”,这就和国内车企在智驾系统中强调的“大小脑”架构有点相似。
例如,Grok 4 Heavy 的4 个 Agent 可以分别是感知代理(融合数据构建占据网络)、规划代理(基于空间模拟能力的路线规划)、交互代理(主要处理车内语音交互和指令)和安全代理(实时监控 Action Token 与交通规则的冲突)。
在打开 FSD 功能时,四个代理之间就能互相协作,在一个简单的“向左超车”语音命令场景,交互代理感知用户命令、感知代理识别左侧的车道情况、安全代理判断是否存在安全超车的窗口,最后规划代理规划具体的超车路线,由 FSD 实现超车。
如果功能可以上车,这种语音指令还能拓展到非常多的用车场景中,包括理想提出的“找车位”、“灵活的路线规划”等等。
此外,结合马斯克在自动驾驶无人车上的动作, Grok 的上车还可能是特斯拉打造全新的车载 AI 生态闭环、部署自动驾驶的关键一环。
说到底,智能驾驶的竞争,最终都是自动驾驶的竞争。6 月 22 日起,特斯拉在德州奥斯丁启动首批 Robotaxi 服务;相比 FSD,Robotaxi 或许更加需要聪明的“大脑”,或者说“灵魂”。
有了「语义层级指挥 FSD」,乘客可以在合规、安全的情况下控制Robotaxi 的驾驶节奏、风格、路线,同时还能像正常询问出租车司机一样问车子“你刚刚为什么急刹?”
这时, Grok 就可以查询车子的决策日志,把急刹的原因转述为人能听懂的语言,比如“刚才前面的车急减速”等。
不过相比理想预告 MindVLA 将在 2025 年下半年上车、华为类似效果的盘古大模型5.0 赋能ADS 将于2025 年 8 月开始陆续铺开,特斯拉能不能真正实现「语义层级指挥 FSD」还是未知数。
同时,「自然语言指挥辅助驾驶」还面临着监管、权责、伦理道德和算力部署等一系列难题,对中国消费者来说最灵魂的问题是,Grok 能否进入国内?
这一点影响的不止遥远的「自然语言指挥辅助驾驶」,还有“这周上车”的「Grok 语音助手」,大概率又是北美用户先尝鲜,中国用户望眼欲穿。
尽管“世界最强 AI 上车”充满了未知,但不代表国产新能源厂商们能松一口气。只要这事存在可能,国产汽车厂商们就得面临巨大压力。
国产车,压力山大
只看当前的技术和销量,特斯拉都有从容的资本,更别说未来Grok 的加入,还有可能让特斯拉的智能化程度进入一个新的台阶。
在刚过去的这个六月,虽然有号称“终极 Model Y 杀手”的小米 YU7 发布,它也的确拿下了 1 小时近 30 万订单的空前战绩,但特斯拉 Model Y 依然卖出了恐怖的44848 辆(懂车帝数据),在一些机构的统计中甚至达到了51253 辆(盖世汽车),可谓他强任他强,清风拂山岗。
甚至 Model 3 长续航版还敢涨价 1 万元。
同样坚挺的,还有特斯拉的技术。自 3 月在中国区上线的 FSD 一直被群嘲订阅价格过高、不能识别中国的红绿灯和公交车道,自然成了各家智驾的吊打对象。
但当国内车企才将「识别交警手势」作为一个主要卖点时,就有不少网友早在几个月前发现 FSD 已经悄悄“学会”了看交警的手势,并且根据手势开车。
网友@黄斯忑敢开FSD 早在 3 月 26 日就发布了一条视频,说他的FSD 的确可以根据手势来开车。
更别说,国外一辆特斯拉自行从工厂下线后直接开到用户的家里。你可以说 FSD 在中国水土不服,但不能否认在智能驾驶这块特斯拉一直都在玩一些很新的东西,是有两把刷子的。
到了未来,有 Grok 加持的特斯拉智能座舱,没有比“如虎添翼”更加合适的形容词了。就算中国市场没能第一时间迎来Grok上车,特斯拉还是有可能建立起“科技先锋”的光环,再吸引一批新的消费者。
哪怕同样是「自然语言控制智驾」的画饼阶段,特斯拉也有大模型更强、训练量更大、自主性更强,甚至是算力也更加充沛的优势,没准真能“弯道超车”“力大砖飞”,先理想一步装车。
今天你对我爱答不理,明天我让你高攀不起——理想华为们别一不小心,被特斯拉在智驾这块偷了家,丢了泉水了。
可能也就在智驾领域“遥遥落后”的蔚来、小米和合资企业们,能坐得住吧。
本文来自微信公众号“蓝字计划”,作者:Hayward,36氪经授权发布。