藏不住的 AI 副驾:1200 行代码泄露 Waymo 野心
2025 年圣诞前夜,华裔研究员Jane Manchun Wong在社交平台抛出的一则推文,让自动驾驶行业掀起波澜。她逆向解析 Waymo 移动端应用代码时,意外发现了一份名为 “Waymo Ride Assistant Meta-Prompt” 的内部文档 —— 超过 1200 行的系统提示词,完整勾勒出谷歌 Gemini AI 助手入驻无人驾驶出租车的全景蓝图。
这并非 Gemini 与 Waymo 的首次牵手。此前 Waymo 已借助 Gemini 的 “世界知识” 训练自动驾驶系统应对复杂路况,但此次车载助手的集成,标志着 Alphabet 生态的 AI 能力正式从 “驾驶决策层” 下沉至 “乘客体验层”。Waymo 发言人茱莉娅・伊莉娜虽未正面确认,但坦言 “团队一直在优化骑行体验相关功能”,间接印证了这一创新的真实性。
被 1200 行代码框定的 AI 行为边界
这份泄露的系统提示词,本质是一份 AI 行为宪法,从身份定义、功能权限到交互规范,构建了一套近乎严苛的约束体系。
1. 身份建构:明确的 “助手” 而非 “司机”
提示词开篇即确立 Gemini 的核心定位:“集成在 Waymo 自动驾驶车辆中的友好 AI 伴侣”,并强制划定与 Waymo Driver(自动驾驶系统)的权责边界。当乘客询问 “你如何看路” 时,AI 必须回答 “Waymo Driver 使用激光雷达、摄像头和雷达等传感器观察环境”,而绝对不能用 “我使用传感器” 的表述。这种语言隔离设计,源于自动驾驶行业对 “责任归属” 的谨慎 —— 避免乘客产生 “AI 掌控驾驶” 的认知误解。
2. 功能矩阵:有所为,有所不为
根据提示词规范,Gemini 车载助手的能力圈被精确划分为三大模块:
环境控制:可调节温度、风扇速度、车内灯光及音乐播放,但明确排除音量控制、座椅调节、车窗操控等核心舒适功能;
信息查询:支持天气、地标数据、商户营业时间等常识性问答,甚至能告知上一届世界大赛冠军,但禁止执行订餐、预订等实体操作;
情感支持:在突发状况下启动安抚式语音,但不得对驾驶行为本身进行任何评价或解释。
值得注意的是,当乘客提出超出权限的请求时,AI 需使用 “这还不是我能做到的” 等 “抱负短语” 回应,既不引发期待也不造成挫败感。这种精细化的功能取舍,体现了 Waymo“安全优先、体验为辅” 的产品逻辑。
3. 交互设计:极致简洁的沟通哲学
为适配车载场景的注意力稀缺特性,提示词制定了严格的交互规则:
语言风格:禁用 “激光雷达”“BEV 感知” 等技术术语,采用生活化表达;
回复长度:音频输入场景下限制为 1-2 句话,文本输入最多不超过 3 句;
模态适配:语音交互优先极简句式,文本交互可提供简短步骤说明;
终止机制:当乘客说出 “stop talking”“be quiet” 等关键词,AI 需立即停止回应。
更具人性化的是,系统会调用乘客上下文数据 —— 包括出行次数、偏好设置等,生成个性化问候语。这种 “有限度的个性化”,既提升体验又避免隐私过度采集。
双重隔离机制杜绝 AI 干扰驾驶
Waymo 在 Gemini 集成中最值得称道的,是其构建的 “硬件 + 软件” 双重安全隔离体系。
从技术架构来看,Gemini 助手与 Waymo Driver 采用物理隔离设计,通过硬件级通信阻断确保 AI 无法访问或干预驾驶系统的传感器数据与决策模块。这种设计从根源上避免了类似 “AI 误操作导致车辆失控” 的风险。
软件层面,1200 行提示词中近 30% 的内容用于定义安全边界:禁止 AI 对驾驶行为做任何猜测、解释或辩护;当乘客询问 Waymo 事故视频等敏感问题时,需礼貌转移话题,且不得采取防御或道歉语气;若乘客要求 “开快点”“改变路线” 等涉及驾驶控制的指令,AI 必须明确声明 “无法控制 Waymo Driver”,并可主动提供预计到达时间等替代信息。
Waymo 内部测试数据显示,这套隔离机制成效显著:搭载 Gemini 助手的车辆乘客满意度提升 27%,而因 “对驾驶系统产生误解” 导致的投诉率下降 41%。正如智能驾驶专家朱西产所言,L3 及以上级别自动驾驶的核心,是让用户 “明确知晓系统的能力边界”。
Waymo Gemini vs 特斯拉 Grok
Gemini 上车的背后,是智能汽车行业 “AI 副驾” 赛道的暗战。特斯拉早在 2025 年 7 月便宣布将 xAI 的 Grok 大模型植入车辆,形成直接竞争态势,但两者的产品逻辑呈现鲜明差异:
特斯拉 CEO 马斯克曾宣称 “不是汽车装了 AI,而是 AI 长出了轮子”,Grok 的设计印证了这一理念 —— 支持 12 种个性角色切换,能根据路况主动讲段子解压,甚至可连接智能家居生态。而 Waymo 的 Gemini 则始终坚守 “出行服务” 本质,拒绝过度拟人化,这种差异源于两者的商业场景不同:特斯拉面向私家车用户,追求情感连接与用户粘性;Waymo 聚焦共享出行,更强调标准化、安全性与普适性。
自动驾驶从 “能开” 到 “开好” 的进化
Gemini 的集成,标志着自动驾驶行业正从“功能实现” 向 “体验优化”转型。Waymo 的实践揭示了三个关键趋势:
首先,AI 助手成为信任构建的关键载体。对于缺乏人类司机的无人驾驶车辆,拟人化的 AI 交互能有效缓解乘客的焦虑感。Waymo 通过 “温和音色 + 明确边界声明” 的组合,在“拟人化”与“安全性”之间找到了平衡。
其次,大模型落地车载场景需 “场景化阉割”。谷歌 Gemini 作为顶尖多模态大模型,其能力远超车载场景需求,但 Waymo 通过 1200 行提示词进行精准约束,只保留与出行相关的核心功能。这种 “有所不为” 的克制,恰恰是大模型商业化落地的关键 —— 避免功能冗余导致的安全风险与用户困惑。
最后,生态协同成为核心竞争力。Gemini 与 Waymo 的整合,是 Alphabet 生态资源协同的缩影。正如谷歌 DeepMind 与 Google Brain 合并后形成的技术合力,这种 “大模型 + 自动驾驶” 的生态协同,将成为传统车企难以逾越的壁垒。
目前,Waymo 的自动驾驶车队已覆盖全美 6 个城市,超过 2000 辆车辆,圣何塞机场的商业运营许可更使其场景拓展迈出关键一步。随着 Gemini 助手的逐步落地,Waymo 不仅在重构无人驾驶的出行体验,更在定义智能交通时代的人机交互范式。而这场 AI 副驾的争夺战,终将重塑整个汽车行业的价值链条 —— 当驾驶本身不再是核心竞争力,“如何让出行更智能、更舒适” 将成为新的战场。
本文来自微信公众号“山自”,作者:Rayking629,36氪经授权发布。















