皮查伊专访:解密Gemini 3背后的十年布局,2027年将在太空部署TPU
- 谷歌采取全栈式AI战略,从算法、模型到芯片(TPU)、基础设施全面布局,TPU作为10年前为解决AI计算效率瓶颈的项目,如今已成长为公司“经济支柱”,且计划2027年通过 Project Suncatcher(捕日者计划)在太空部署。
- Gemini 3成为谷歌“AI为先”战略最具象化的体现,深度融入搜索、YouTube、云服务、Gmail 等所有产品,成为贯穿谷歌全产品矩阵的技术主线,实现自有产品与第三方平台的同步上线创新。
- Nano Banana Pro 意外实现信息图表高效生成,跨越 “有趣” 与 “有用” 的边界,将复杂信息压缩为更易理解的形式,完美契合谷歌组织全球信息并使其普遍可及的使命,激发人类潜在创造力。
- 随着2026年临近,谷歌将回归全栈战略,在技术栈的每一层级都迎来更多令人振奋的进展。
当地时间11月25日,Alphabet兼谷歌首席执行官桑达尔・皮查伊(Sundar Pichai)接受了Google DeepMind开发者关系负责人洛根・基尔帕特里克(Logan Kilpatrick)的专访。
近期,Gemini 3、Nano Banana Pro、Veo3等多项前沿模型密集发布,叠加伯克希尔・哈撒韦公司首次建仓Alphabet股票,推动谷歌母公司Alphabet股价加速上涨,市值已逼近4万亿美元大关,距离苹果与英伟达市值仅一步之遥。
与此同时,市场传出英伟达大客户Meta考虑2027年在其数据中心部署谷歌TPU,并于2026年通过谷歌云租用TPU算力的消息,引发行业关注,英伟达紧急声明强调GPU优势以稳固市场地位。
专访中,皮查伊围绕Gemini 3发布背后的十年布局、全栈优势、算力扩张展开分享,谈及Nano Banana Pro带来的创造力爆发、氛围编程(Vibe Coding)浪潮,以及量子计算、太空数据中心等面向2030年以后的登月计划,同时也涉及谷歌TPU的发展历程与行业影响。这款10年前为解决AI计算效率瓶颈而生的“救命项目”,如今已成长为公司“经济支柱”,以超大规模系统哲学重新定义AI基础设施的未来。
以下为访谈内容精简版:
01.谷歌AI十年深耕:从战略布局到技术突破
问:Gemini 3已经推出,Nano Banana Pro也已上线。谷歌在越来越多领域达到最先进水平。你能否描述一下这一刻的意义?
答:这一刻的意义在于,它建立在过去十余年的深厚积累之上——从算法、模型到芯片和基础设施的全面投入。过去几周,我们几乎每天都在发布重要更新,看到所有成果在这一节点汇聚,确实令人感慨。进展速度其实早已显现,但当一切真正“合拢”时,仍给人强烈的震撼。
问:外界常感觉这是一场追逐排行榜1%提升的短跑,但长期视角显然才是制胜关键。
现在我们终于拥有最先进的模型和足以在全公司范围扩展Gemini的基础设施,尤其在当前竞争白热化的阶段,你是如何始终保持这种长期视角的?
答:我深知,只有长期押注并在数年甚至十数年内持续聚焦,才能真正占据优势。
2016年,我提出让整个公司转向“AI为先”(AI First),正是基于一系列关键信号:2012年DeepMind“猫论文”(The Cat Detector Paper,注:2012年6月,谷歌X实验室用1.6万张CPU、约10亿个神经连接训练了一个超大规模的深度神经网络,训练数据是YouTube视频的随机1000万帧截图。该模型完全无监督学习,却自发地在最高层神经元中形成了一个专门检测猫脸的单元。这张“猫脸可视化图”被媒体大幅报道,从此这篇论文就被称为“猫论文”。)
在图像识别领域的突破;2014年引入DeepMind;2016年1月AlphaGo的里程碑式胜利;同年5月第一代TPU的发布。
这些事件让我确信,又一次平台级变革即将来临。那一刻,我们做出了全栈押注:不仅在算法和模型层面领先,更要在芯片(TPU)、基础设施和产品落地能力上全面布局,将谷歌彻底转型为AI优先的公司。
此后多年,我们持续将Transformer等核心突破应用于搜索、Google Photos等产品。当生成式AI浪潮真正爆发,我意识到用户和开发者已准备好大规模拥抱这项技术,机会窗口远超以往。于是我们迅速启动Gemini项目,整合谷歌大脑(Google Brain)与DeepMind团队,成立统一的Google DeepMind,同时大幅扩充数据中心、TPU和GPU集群,推动公司整体提速。
如今,技术成熟后,核心挑战已转为如何将Gemini的能力快速渗透到搜索、YouTube、Gmail、云服务等触达数十亿用户的产品中。只有全栈打通,每一层的创新才能顺畅流向用户端。这正是我们过去十年坚持的逻辑,也是当前密集发布背后的真正底气。
02.全栈优势与Gemini成为谷歌产品新主线
问:DeepMind在Gemini模型中的预训练效果极佳,后训练与强化学习如同底层能力的强力加速器。我认为我们的基础设施建设也遵循同样的逻辑。
答:基础设施的每一次优化,都会直接提升模型在预训练、后训练以及推理阶段的计算效率。这些能力最终必须以产品化的形式呈现:Nano Banana Pro如何自然融入终端体验?搜索中的生成式界面与AI模式如何设计?这些都是同一套底层能力在不同层面的表达。更关键的是,我们将这些能力开放给全球开发者,让他们在之上继续创新,从而形成显著的倍增效应。
这一切都源于长期的全栈愿景。正因为采取全栈策略,当生成式AI浪潮来袭时,我们一度面临算力严重不足的局面,只能紧急投入巨资扩建数据中心、TPU和GPU集群,这带来了较高的固定成本。从外部看,那段时间谷歌显得较为低调甚至落后,但实际上我们专注于补齐最底层的基建。如今这些投入已转化为显著优势,也正是团队当前能够高速推进的根本原因。
问:历史上,除了Gaia(盖亚系统)账号体系,谷歌旗下从云、Waymo、搜索到Gmail等众多产品之间,其实从未有过真正贯穿的技术主线。而现在,Gemini正在成为这条主线,覆盖我们每一款产品,这种变化令人觉得近乎神奇。你怎么看?
答:Gemini正是“AI为先”战略最清晰、最具象化的体现。它不再是抽象的口号,而是一个真实可触的技术内核,直接驱动搜索、YouTube、云服务、Veo等所有产品的体验升级。
这次Gemini 3发布,我们实现了在多款自有产品上的同步上线。当天,Copilot、Replit、Figma等第三方开发者也同步推出了基于Gemini的新功能。这才是真正意义上的规模化创新——不只谷歌一家在加速,整个生态都在同一天集体向前迈进。
03.Nano Banana Pro:从“玩具”到“生产力革命”与人类创造力爆发
问:另一个现象级产品是Nano Banana Pro,我相信你已经花了很多时间体验,用户热情极高。
答:我一直在问自己一个问题:我们到底是在提升全球生产力,还是只制造了新的“香蕉玩具”?这算不算真正的净进步?
问:Nano Banana Pro正在跨越“有趣”和“有用”的边界。回想PowerPoint当年让全球幻灯片数量指数级增长、让信息总量爆炸式扩张,Nano Banana Pro似乎正在反向而行:把复杂信息重新压缩成更易消化、更直观的形式。
答:我过去对很多生成式媒体模型的实用价值一直抱有怀疑——娱乐属性很强,但离“改变世界”似乎还差一口气。而Nano Banana Pro第一次让我真正看见了它如何完美契合谷歌的使命:组织全球信息,并使其真正普遍可及。
尤其当它与谷歌搜索深度结合后,这种价值变得触手可及。更令人意外的是,Nano Banana团队自己都说,他们并没有刻意去优化信息图表,而是模型整体能力提升、文本渲染能力大幅进步后,这一功能自然就“长出来”了。
04.发布日运营、成功指标与谷歌文化现场
问:在对谷歌具有里程碑意义的发布日,你的成功标准到底是什么?是线上反响、首日数据,还是其他更综合的指标?
答:发布日我会全程高强度在线,既看数据也看人。我在X上直接关注普通用户的使用感受,见到有价值的反馈会立刻转给团队。
内部我们用Gemini实时汇总舆情,再配合完整的仪表盘,QPS、使用量、容量告警、错误率一目了然。但我最在意的还是“亲身感受”:除了看报告,我会走到有大屏的同事身边,和大家一起盯着曲线,看真实用户在做什么、卡在哪儿。首个24小时的反馈尤其宝贵,能最快告诉我哪些功能真正击中了用户,哪些还需紧急调整。
问:现在整个办公室的兴奋氛围都看得见。
答:走到哪儿都能撞见香蕉,数量级至少十万根——不知道是哪支神奇的团队干的,设施和活动团队值得全场MVP。这只是Gemini 3篇章的第一页,Flash还没来,3.0系列其他模型也都在路上。实际上,即使是已经发布的2.5 Pro,在不少基准上仍是同类最佳,3.0是在此基础上再上一层楼。
05.技术迭代路线:Gemini系列与未来模型规划
答:Gemini 2.5 Pro在今年Google I/O大会上发布,其带来的进步有目共睹。令我感到欣慰的是,德米斯·哈斯比斯(Demis Hassabis)领导的Google DeepMind团队保持着稳定的研发节奏。我们大约每6个月就在技术前沿实现一次显著突破,这一过程的难度正逐年递增。Gemini 2.5 Pro已具备极高性能,要从中实现真正有意义的飞跃绝非易事,但这也正是技术迭代最令人兴奋之处。
我知道你一直对Flash版本寄予厚望,团队正在全力开发,它即将推出。
问:你对Flash版本如此期待,是因为它能服务更多用户群体。
答:没错。
问:在技术前沿的竞争中,它将产生重大影响。
答:因此,我对3.0 Flash版本满怀期待,它有望成为我们迄今最强大的模型。更重要的是,预训练团队已开始规划下一代版本。这种不懈创新、持续发布的文化,正是当前阶段的独特魅力所在。随着2026年临近,我们将回归全栈战略,在技术栈的每一层级都迎来更多令人振奋的进展。
06.未来前沿探索:登月计划与氛围编程浪潮
问:你之前分享的许多AI故事,都源于十年前的长期布局,为公司成功奠基。现在云服务成效显著,Waymo稳步推进,量子计算充满潜力,最近还公布多项新进展。我对量子领域的技术细节超出认知,但通过vibe coding体验来尝试理解。
答:这也是我验证新技术的一种方式。
问:展望未来十年,你如何定位核心押注?是继续梭哈AI,还是基础设施将成为新焦点?抑或已明确AI是主线,所有鸡蛋都在这个篮子里?你对下一个十年的判断是什么?现在我们在哪些领域布局,为下一轮成功蓄力?
答:长期规划从来都是重中之重。回溯十年前,我们以全栈方式深度押注AI,同时推动业务多元化——大力投资YouTube和云服务。谷歌天生就是云原生公司,但之前并未完全对外开放,因此云业务的巨额投入成为战略转折点。Waymo这类项目需要漫长积累,如今终于迎来拐点,商业化前景清晰。
面向未来,押注从未停歇。量子计算便是典型潜力股,我预计五年后,它将引发如同今日AI般的热潮。
我始终以十年视角审视机会。最近的Project Suncatcher(捕日者计划)就是绝佳例证:两周前宣布在太空建造数据中心。这是一项典型的登月计划(Moonshot),当下听来有些疯狂,但当你认真评估未来计算需求的爆炸式增长,它就变得顺理成章——只是时间问题。为此,我们倒推制定了27个里程碑,稳步推进。目标是2027年在太空部署TPU,或许还能偶遇那辆在轨道上行驶的特斯拉Roadster,这过程本身就充满乐趣。
类似长期项目还有Isomorphic Labs与AlphaFold的合作、Wing的无人机送货,以及我们正在酝酿的机器人创新。我们始终以十年视角驱动进展。
问:氛围编程具有革命性:编程与软件创建作为历史上最具经济杠杆的能力,如今正向更广泛群体普及。你如何看待AI构建者超越传统软件工程师的这一转变?
答:这是一个令人振奋的时代。回想互联网如何通过博客让普通人变成作家,YouTube如何催生海量创作者,编码领域正上演相同剧本。即使在谷歌内部,提交首个代码变更(CL)的员工数量最近激增。这得益于工具的易用性大幅降低门槛:一位产品营销同事,过去只能口头描述构想,现在能用氛围编程快速原型并展示。
我团队里就有一位完全不懂编程的传播专员,用Gemini 3一键生成带动画的HTML页面,教儿子西班牙语动词变位。这种故事层出不穷,证明工具正重塑工作方式,前景无限。
我在有限时间里试玩氛围编程后,发现不只过程本身,现代IDE也让编程重获乐趣。当然,大型代码库仍需专业把控准确性和安全,但整体上,编码正变得更亲民、更激动人心,而且这只是起点。以往谈Waymo时,我常说:今天是它开车的最差状态,只会越来越好。
07.下一步规划:产品生态与持续创新
问:你最值得期待的是什么?
答:先让大家睡个好觉——包括我自己。但节奏不会停。我个人最期待的仍然是Gemini路线图的持续高速推进,以及它如何更深、更自然地融入搜索、YouTube、Gmail、云、Waymo等每一款产品。
同时,我们还在推出全新产品:Flow,我已经玩了很久,越用越上瘾;NotebookLM,社区增长惊人,从记者到博士生都在用它做深度研究,活力超乎想象。
本文来自“腾讯科技”,作者:无忌,36氪经授权发布。















