何小鹏:未来1-3年完全自动驾驶将真正到来|最前线
小鹏汽车董事长 何小鹏
文|肖漫
编辑|李勤
“通过我们内部比较测评,我认为比行业一流选手领先接近5倍。”在第二代VLA发布会后的交流中,小鹏汽车董事长兼CEO何小鹏说道。
智驾的演进,正从“软件定义汽车”变为“AI 定义超级智能体”。新浪潮下,小鹏汽车给出了他们面向未来的激进解法:跳过在硬件、软件与法规层面皆面临妥协的 L3 阶段,直接以 L2 和 L4 作为智驾演进的核心锚点。
在何小鹏看来,第二代VLA已经让小鹏具备从L2直接进入L4的可能性。
小鹏和特斯拉一样,不再是在原有的智驾框架里修修补补,而是彻底把自动驾驶当成通用人工智能(AGI)在物理世界的落地来解题。战略变化前,小鹏已将智能座舱中心和自动驾驶中心合并,集中 AI 资源形成统一中台,以此提升开发效率。
小鹏现在的思路是引入世界模型的构建思路,实现智能座舱与智能驾驶的深度融合。让智舱与智驾不再孤立,融合为一个“强力超级智能体(Agent)”,未来 1-3 年实现从被动工具到主动服务的跨越。
实现这个设想的基础是最好基座模型,并解决数据问题。⼩鹏汽⻋通用智能中心负责⼈刘先明认为,“做好基座模型,是一家做L4公司的必修课。不做这件事,就可能在这次技术转型中落在后面,或者没办法完成完整的技术转型。”
小鹏的技术变革足够果断,智能化的软件升级已经成为小鹏汽车产品的核心抓手。但正如36氪汽车此前报道指出,现下的小鹏仍是一家以卖车作为核心收入的汽车公司,身处在竞争烈度仍在强化的中国汽车市场,小鹏在内的所有公司都要在市场环境和技术的双重变革下寻求转型。
以下是36氪汽车与小鹏汽车董事长 CEO 何小鹏、⼩鹏汽⻋通用智能中心负责⼈刘先明的交流内容,略经编辑:
问:小鹏为何建议跳过L3、并向两会提出该建议,是为了我们可以有一个更领先的技术吗?
何小鹏:我认为L4开始就会有新的责任主体,在今天全球科技发展的情况下,基本上从L2的下一个台阶就是L4,中间专门加一个L3实际对于硬件、软件、法律法规都是挑战,所以从我的角度来看,我认为中国应该一个是L2,一个是L4。
问:第二代VLA将落地到多少台车辆,能否给出大致预估数据?
何小鹏:我们所有的Ultra和UltraSE都会都会搭载第二代 VLA,你可理解为未来小鹏在全球市场的车型,将会提供基础智能辅助驾驶和顶级智能辅助驾驶两种选择。
问:第二代VLA到底能够做到什么程度?是已经完全可以达到L4,还是在什么样的阶段?
刘先明:现在到底做到什么水平。目前还没有完全说自己能达到百分之百的L4,但是现在整个VLA2.0搭建了一套非常通用并且高效的架构,所以基本上每天都会有新的版本出来,不停地去迭代新的问题,而且进步速度也是超乎我们想象的,所以我们有信心,在未来的一段时间内能做到L4水平的一套比较完整的体系。
具体的时间可能还没有办法给出完全的判断,1—3年是大师兄给出的判断,我们的判断是如果按每一天迭代的速度比前一天快,看到整个训练速度和数据规模曲线是加速上升的状态,如果我们一直维持这个状态的话,我相信会很快。
问:为什么会把智能座舱和智能驾驶合并,形成这样的组织架构调整?目前这种变化似乎也是车企中正在发生的趋势,想请问小鹏汽车这次调整与其他车企有什么不同?
何小鹏:汽车行业正在进入新的跨域融合阶段:自动驾驶是整车运动,智能座舱是整车大脑,再加上动力、底盘,我们认为这四个域都在进行跨域融合中。
未来L4或Robotaxi车型,很多厂商会从原来单一域的集成(比如一个域由多家供应商集成,或单独一个域研发),转向跨域融合,这样能让整车更快、更安全、更灵敏,能力提升数倍,从被动使用转向主动服务。所以,先明负责的通用智能中心,正是跨域融合进程中的一部分。
这也是我非常坚信1—3年全自动驾驶会落地、3—5年所有汽车都会成为强力超级智能体。
问:第二代VLA实现端到端智能革命,将于本月下旬全量推送。这套底层技术统一、动力形态双选的产品策略,将如何定义小鹏未来3年高端市场打法?
何小鹏:关于未来1-3年,汽车将从软件时代进入AI时代,从软硬件独立发展走向跨域融合,从原来的、简单的智能新能源车升级为可主动服务的高阶智能Agent。因为小鹏在多领域同步研发,所以未来1-3年大家会看到有很多跨域融合的效果。
这也是我为什么非常激动地认为,包括以前的燃油汽车,以前靠汽车商想做好的方案越来越困难,汽车一定会从原来的被动生产工具变成一个主动产生生产力的产物,我认为是划时代的产物,大概3—5年会实现。
问:刚才您提到基座模型是做好L4的基础。从行业来看,目前很多Robotaxi玩家对基座模型提及不多,或选择其他技术路线。未来基座模型是否会成为Robotaxi企业做好业务的标准吗?
刘先明:现在 L4 或者自动驾驶已经发生很大的技术范式变化。我们过去看到Waymo还有很多 L4 公司,其实上限很低,大家只能不停往前卷。这带来另外一个问题,就是L4的ODD概念,车辆到底能运行在什么地方,只能取决于铺了多少车、采了多少数据、建了多少地图。所以如果真想泛化性解决整个问题,技术范式就一定要变,这是不可避免的。
今天我们也在发布会上提到,做好基座模型,是一家做L4公司的必修课。不做这件事,就可能在这次技术转型中落后,没办法完成完整的技术转型。
问:第二代VLA出海方面,您提到目前在瑞典的case使用云端模型进行仿真训练。特斯拉在做中国FSD时,也是通过网络视频、仿真训练等方式推进,我们如何避免出现类似特斯拉 “水土不服” 的问题?
刘先明:第二代 VLA 模型在没有经过任何海外数据适配训练的情况下,从今天大师兄(何小鹏)发布的视频里可以看到,已经具备很强的能力。第二,小鹏是一家全球化企业,我们会在合规前提下,在全球任何有小鹏车辆的地方正常拥有并使用当地数据。第三,对于更多泛化性场景,通过世界模型的生成方式,也可以让我们快速达到一个能力起始点。
所以整个小鹏全球化自动驾驶的策略,一定是这几点结合在一起:模型本身要有极强的泛化能力,不能只依赖中国数据、只能在中国跑,这个事情是行不通的;再加上小鹏的全球化布局,以及我们在技术上的突破。
问:世界基座模型如果同时赋能多样化智能体,它在多模态交互、空间感知这些方面会不会存在技术复用的瓶颈?不同形态的智能体能否对基座模型反哺,加深模型的优化?
刘先明:底层的复用能力应该还是很强的,整个VLA或基座模型的设计是原生多模态,不太会只针对自动驾驶,是可以复用的。具体的复用情况我们还在持续探索,目前暂时无法给出特别明确的结论。现阶段首要任务还是先在车上先把整个事情跑完,下一步再推进舱驾联动。
问:自动驾驶从端到端进入到模型这个范式之后,大家都在用人类的数据去做模仿学习,今天先明也分享了世界模型在仿真世界里做大量的强化学习的案例,但从去年开始,很多人就在谈人类数据其实价值不大了,您怎么看?
何小鹏:我觉得物理世界、人类世界的数据量现在来看是无限的。
以前我觉得有10万台、100万台车跑了多少公里就够了,现在我觉得远远不够。很多人说我有车队、我有公司,车卖得多就有很多数据,这些都是错误的。如何收集有质量、有价值、超大规模的数据,我觉得是非常困难的一点。不论是汽车还是机器人,这件事上都远远没有看到头,这是我的看法。
问:RL强化学习是不是真的万金油,所有的问题都可以解吗?有没有它不擅长的东西?
刘先明:强化学习不是万金油。现在学术界、工业界都在说强化学习很厉害,但它一定需要一个非常强的基座模型——至少能采样到解决这个问题的可行解。如果连这个能力都没有,强化学习就没办法继续提升。
但强化学习是效率特别高、能定向解决问题,并且能持续探索长尾问题的一种学习方式。所以我觉得大家不用把强化学习当成可解万物的万能解,而是一个非常高效的学习方法。
问:目前市场上算力军备竞赛宣传愈演愈烈,友商之间在疯狂堆算力,但很多用户实际体验后发现,算力大幅提升,体感提升却没有数值增长那么明显,问题大概出在哪?
刘先明:算力不只是名义上的数字好看,更重要的是把算力用好,这是核心问题。这也是我们从通用处理器向专用处理器ASIC过渡的原因。其实你看NVIDIA(英伟达),就是在GPU和CUDA时代做这件事 —— 把算力用好,比单纯说算力提升多少倍更有价值。所以算力不仅要大,用好才是核心关键。
另外,大算力一定需要更高信息密度的输入、更大的模型来匹配,否则算力就是空转。这些因素合在一起就意味着:如果只是搞算力军备竞赛、单纯堆高数值,消费者是感受不到明显的体感提升的。
问:最近2—3年我们从行业实践来看,关于模型做决策怎么出轨迹这件事主要有两种方法,第一种方法是大模型直接给出最终的轨迹,第二个给出几种不同的轨迹之后,让系统从中选择一条,小鹏第二代VLA是前者还是后者,在您看来这两种不同的方案之间有没有优劣之分,哪种方案更符合未来的发展趋势?
刘先明:第一个问题核心就是你是做自动驾驶还是AI?如果这个问题回答了,那答案其实很清楚了。我们做的是一个AI,不是专门只是用来做自动驾驶,所以一个AI模型是怎么做的,我们就是什么样子的。
既然都已经做了这么大的变化,就不会带着之前很多的逻辑,这些heuristic(基于经验规则的启发式方法),就是这些很多的规则或者办法来解决现在的问题,这个也是让数据和模型不停scaling(通过增加数据量、模型参数规模、算力投入,来持续提升模型能力)最重要的核心,尽量少加其他的东西进来。
这个可能听起来有点过于简单直接,但是在过去这几年里面,整个AI的发展就是告诉我们这一件事,就是怎么能去做scaling,怎么能够快速地迭代,就能够快速的解决问题。核心就是你到底做的是智驾还是做的是AI。
问:在模型训练过程中,“安心、场景、效率”这三个关键词是否存在取舍,是否有明确的优先级排序?在您目前的观察中,全球范围内是否只有两家已经切换到原生多模态物理世界大模型?
刘先明:如果做过机器学习或AI,就知道PR曲线。当曲线较平时,只能在安心、效率、场景间权衡,本质没得选。
自动驾驶中,我们常问:到底想要什么样的自动驾驶?
自动驾驶最核心的目标是安全。但并不意味着安全就可以为所有其他东西让路,没人想要为了安全而要一个慢吞吞、没效率、跑不动的东西。解决这个矛盾,核心是提升基础能力——只有基础能力上去,才能在不牺牲其他维度的前提下,把安全做到更高水平。
我们说的 “代际差”,不只是单一指标的差距,更关键是有没有切换整套做事思路,迭代速度有没有质变。我们现在追求的是不仅跑得快,加速度还在持续变大,因为我们在构建底层通用能力体系,这才是真正的代际差,而非单点指标领先。















