从Perplexity对Chrome发起收购要约,深聊新一轮AI浏览器大战

硅谷101·2025年09月02日 15:37
AI将如何主导下一代浏览器?

在硅谷,很多人认为谷歌将掉队了。

8月中旬,AI搜索独角兽公司Perplexity称要以345亿美元的价格收购谷歌的Chrome浏览器,这几乎是Perplexity自身估值的两倍。此前Perplexity还曾放话要买Tiktok…本轮浏览器收购大战到底是纯炒作,还是真的有蛇吞象的可能性呢?

到了8月底,Anthropic新发布了浏览器产品Claude for Chrome,加入了这场战局。随着AI agent赛道的火热和能力增强,“AI browser”让“浏览器”这个过去数年都没人讨论的词,又在霎那间变成了硅谷的科技香饽饽。

AI浏览器之战真的要来了吗,它意味着什么样的新机会?搜索这个万亿级的生意会如何被颠覆呢?

本期文章我们将与Lightspeed Venture Partners合伙人Guru Chahal(Anthropic的领投投资人)以及Gen Digital的首席AI及创新官Howie Xu一起探讨新一轮的浏览器大战。

01

什么是AI浏览器?

在上一代浏览器大战中,Firefox、Google Chrome、Microsoft Edge、Safari与Opera是市场中主要的竞争者。这几大玩家的市场份额在近年来变得非常稳定,直到AI出现。

陈茜:

请帮我们定义一下什么是“AI浏览器”?

Guru Chahal:

我认为这要回到一个非常简单的前提。在过去20年甚至25年里,人类或用户与计算机交互的方式已经系统性地从操作系统转移到了浏览器。所以,过去在操作系统层面相关的一切,现在也都在浏览器层面发生。我们过去主要依赖操作系统来实现安全、可观测性、数据收集和运行应用,而这些现在都在浏览器里完成了。

因此,我的初步假设是:AI与那些最初为人类设计的工具交互的主要机制也将会是浏览器。浏览器由此就成了一个有趣的“要塞”,在这里你可以收集数据,可以做自动化,可以保障AI与系统交互的安全等等。这就是我们相信的一个投资框架。

其实我们早就已经在这个领域投资了。就像我之前和Howie聊过的,几年前我们看到一些非常出色的团队在做企业浏览器。而比如Lightspeed等公司之所以愿意使用这些浏览器,是因为我们的IT和安全团队就可以控制用户在浏览器里能做和不能做的事情。

所以我们投资了Talon这家公司,它后来被Palo Alto Networks收购,我们是当时的领投方。我们见证了这个市场非常快地成长,今天已成为非常庞大的企业浏览器市场。

而我认为,我们今天要讨论的核心问题是:AI能否成为另一个推动全新浏览器类别诞生、并发展壮大的理由。所以我很期待这次讨论。

Howie Xu:

是啊,你知道Talon当时被收购并不是因为AI,对吧?

Guru Chahal:

没错,当时是出于网络安全的原因。

Howie Xu:

当时也有其他原因,但是我们能看到很有意思的一点是,我们已经很久没有见到浏览器技术的收购了。突然之间,浏览器又成了一种有趣的技术。

你我相识这么多年,聊过无数话题,但过去20年里从没聊过浏览器,当我看到Guru发表的那篇文章时,我心想:“什么?他对浏览器感兴趣了?”

现在你解释道你原本关注的是企业浏览器,这可以理解。但现在你又对AI浏览器感兴趣,那是为什么呢?

Guru Chahal:

这其实源于两个关键认识和一个基础信念。

在Lightspeed我们的基础信念是,大模型和AI整体代表了一类全新的能力,它们能把“认知劳动”带进来,让认知劳动变得可被技术利用。这是科技史上第一次,机器能够处理半结构化的语言,能够理解语言,并像人类一样去操作。

那么问题来了:这项能力的边界在哪里?一方面,是模型能变得多聪明?我们认为目前只是刚刚触及表面,模型还会不断变得更强。我们也是Anthropic等公司的最大投资者之一。

另一方面是,是什么限制了这些模型的发展?如果我们仔细来看,其实有两点:第一,是模型吸收数据、学习,并在企业环境中表现更好的能力,也就是观察和学习;第二,是模型真正去执行动作、去做事的能力,也就是“行动/执行”。

而有一项技术,恰好是观察与行动的通用窗口,那就是浏览器。

因为想一想,在过去这些年,甚至就在你来参加这次采访之前,你在电脑上所做的事情大约有95%都是通过浏览器完成的。这意味着,如果我是浏览器,我完全知道你在做什么,以及你在与哪些软件交互,那么我也就能够以同样的方式去与这些软件交互。

当然,因为还有桌面应用这个数字不会是100%,但如果要找一个切入口,那一定是浏览器。我认为这就是浏览器一直以来都是非常战略性的“数字地产”的原因,也是Google当初要做整个Chrome项目的原因。

想想看,Google做Chrome的唯一原因就是他们想要掌控搜索,但浏览器本身就是如此战略性的入口。所以,在AI时代,它的重要性要比过去高出几个数量级。浏览器重新受到关注是因为它同时解决了两个关键问题——它让你能够以被动持续的方式收集数据,它还能既作为协作的副驾驶,帮助你持续采取行动,也可以作为自主智能体,替你执行工作。

02

Perplexity的野心

与谷歌的创新困境

开头提到Perplexity想收购谷歌Chrome的新闻,尽管比Perplexity之前说想收购Tiktok听起来可信一点,但Chrome的估值和体量肯定是Perplexity吃不下的。作为公关策略之余,它也传递出一个信号:Perplexity认为AI浏览器将会是他们接下来重点布局的一个赛道。

今年7月,Perplexity发布了基于Chromium构建的AI浏览器产品Comet,目前支持Windows和MacOS,后续计划拓展到Linux、Android和iOS系统。

目前这款AI浏览器只向每个月支付200美元的高端Perplexity Max用户开放,其它用户只能加入waitlist申请。

根据公开资料,Comet是一款内嵌了AI助手的浏览器产品,可以在边栏中持续提供帮助,不需频繁切换标签。

它支持网页搜索、内容总结、预定会议、编写邮件等多种任务,同时还能让AI Agent帮用户在网页上自动点击、输入、提交表单,比如完整完成购物流程。

它还支持利用功能让AI参考你当前打开的标签页内容,保持提问的上下文相关性,可在任意网页上高亮词句以获取即时解释、延展思考,支持多角度提问。

最后,它支持从摘要内容、研究、翻译,到日程管理和多平台联动,比如邮箱、Slack、社交媒体等等。

虽然这样的AI浏览器还是比较初期的尝试,受限于AI Agent的能力和技术,但确实展示了未来流量入口的潜力。

陈茜:

前几天,我在和Howie聊天。有新闻说,Perplexity出人意料地以345亿美元开价收购Chrome。你第一次看到这条新闻时的反应是什么?

Guru Chahal:

我们没有投资Perplexity,所以我们掌握的信息并不比你们二位多。但我要说的是,说出这样的话、做这样的事是零风险的。即便没成,也能获得巨大的关注。归根结底,Perplexity是一家面向消费者的公司,所以任何能获得更多关注的事都值得做。

Howie Xu:

Attention is all you need(流量就是一切)。

Guru Chahal:

我喜欢这个说法,Attention is all you need(流量就是一切)。所以有什么坏处呢?没有坏处。而在极小概率的好处上,也许会出现被迫或主动剥离的情况。在那种情况下,为什么不去争取呢?所以我认为这是一个非常聪明精明的举动。

Howie Xu:

虽然我现在是上市公司的首席AI官,但即使没有这个身份,我也会去争取大家的关注。所以我完全同意Guru的看法:这里面完全没有坏处,即使什么也得不到,最糟糕的情况也是获得大量关注。

我认为Google正处在一个非常有意思的时期。一方面,他们的搜索业务正受到冲击。就我个人而言,我使用搜索的频率已经远不如以前了,我认为在未来五到十年里,这会越来越成为一个事实。但与此同时,Google也是AI的提供者,他们也拥有大量优秀的工程师。

在浏览器之战中,Chrome的市场份额超过70%,显然是这个市场的巨无霸。浏览器之战是真实存在的,十年后,70%的人使用的默认浏览器将不会是Chrome,甚至远远达不到这个比例。

这是因为Google的收入每年大约4000亿美元,其中很大一部分搜索收入实际上来自Chrome。所以Google对Chrome做的任何调整,都会立刻对收入产生巨大影响。

市场普遍共识是,在这4000亿美元中,大约800亿美元直接来自Chrome,所以如果我改变Chrome的用户界面,我其实是在改变这800亿美元的收入,全世界有多少家公司有800亿美元的收入?所以这可是一件大事。

我认为他们正在经历所谓的“创新者的窘境”。他们并不是不知道一个原生浏览器应该是什么样子,他们也并不是不懂我们所说的逻辑,即浏览器应该帮助用户更轻松地浏览或进入数字世界,但他们不可能做太大的改变。从第一性原理的角度来看,这一点其实非常明显。

当我和Google内部的人交流时,他们直白地告诉我:“我的手被绑住了,我没办法做太多事。我知道该怎么做,但我无能为力。”所以某种意义上,现在我们正经历一个非常有意思的阶段:行业老大要被淘汰了,这是我对未来十年的假设。

那么下一个是谁呢?显然有Comet、Dia,还有Norton Neo,但我觉得我们大家现在都还在非常初期的阶段。

我大约一年前加入了Gen Digital公司担任首席创新官。一年前我开始研究浏览器项目,我们在内部也都观察到了,浏览器迫切需要AI的加入,而不仅仅是新增了一个总结页面的按钮。那根本不算浏览器,那只是助手。

我认为世界需要的是原生浏览器,必须从零开始重新思考浏览器,就像重新思考“人机交互”。比如说,以前我想去CNN或Fox News,我点一个链接,如果浏览器让我更快打开这个页面,我就会选择这个浏览器。当时Google的引擎比IE快得多,所以它颠覆了微软IE。

但今天,我和数字世界交互的方式不应该再仅仅是那样了。我有要点击的链接,但浏览器应该了解我,浏览器应该在我点击链接之前,就把信息带给我。浏览器应该能够总结信息,甚至帮我谈判,或者直接完成我需要的任务。它不仅是一个日程工具,浏览器应该主动在你前面,而不是被动响应你。而且它应该高度个性化,这里面有无限可能。

所以一年前我们就决定要重新思考浏览器,于是我们启动了这个项目。在这个过程中,显然这些公司也在做类似的事情,他们大概和我们在同一条思路上。而我今天看待浏览器,就像回到1997年的搜索一样。我甚至不认为未来的“下一个Google”一定已经诞生,可能它还在某个车库里,但这个理念已经存在了。

拉里·佩奇在1997、1998年创建Google时,他就已经在思考类似问题,这就是我们现在所处的位置。我认为我们需要一些时间去学习和探索最终的商业模式是什么、产品究竟长什么样,但我们会拥有一个完全不同的浏览器。

浏览器不应该只是“我点一个链接,它给我内容”,它应该是我的个人助手,让我的效率提升十倍、帮我十倍速完成很多事情。至于怎么实现,这就是我们现在在思考的。ChatGPT在今年五月推出了浏览器功能,凭借应用到浏览器上的执行力,尤其是安全与隐私方面的优势,用户会喜欢它,并且会有完全不同的体验。

03

新一轮大战开启

巨头游戏还是初创机会?

上一轮的浏览器大战中,今日赢家、稳拿70%市场份额的Google,并不是一开始的领跑者。

虽然Google从2001年起开始酝酿打造自家浏览器,但团队花了六年时间才说服当时的CEO Eric Schmidt批准这个项目,所以Chrome在2008年才问世,基于开源项目Chromium与Safari所用的WebKit引擎打造。

在最开始,Chrome并不被市场看好,但很快,它凭借Google对广告投放与品牌塑造的优势迅速崛起。2011年底,Chrome首次超越Firefox,市场份额达到 27%;六个月后,又超过IE,与谷歌的搜索功能正式成为市场霸主。

而在新一轮的AI浏览器大战开启之际,这会是初创企业的机会呢,还是像大模型之战,最后只会是巨头们的游戏呢?

陈茜:

Guru,你同意“浏览器行业老大将会消失,Google可能不会是浏览器的领导者”这个观点吗?

Guru Chahal:

我认为,这个生态格局是完全开放的。在过去15年里,这是谷歌第一次两块核心“战略地产”都面临挑战。一块是搜索,另一块是浏览器。这是他们最重要的两块战略资产,我认为这两块都面临威胁,而机会正在出现。关键在于,像我们这样的人去思考,如何不只是做渐进式的小改进,而是做革命性的创新。

你必须重新思考交互体系。如果你的浏览器只是快一点,那在与IE的战争中很有效,但现在已经不够了。现在真正“足够”的东西还没有被发明出来,这需要彻底重构人类用户与网络的交互方式,以及重新思考这个“与网络交互的门户”会有什么机会。

所以我非常期待看到这方面的创新。语音会是其中的一部分...更好的安全性、更自主以及更易发现,我觉得这些领域全都是开放机会。

陈茜:

你们已经提到了一些AI浏览器,比如Perplexity的Comet、Dia和Norton Neo,有传言说OpenAI也要推出自己的AI浏览器?

Guru Chahal:

我敢打赌,在未来两三年里,我们会看到巨大的创新,更多浏览器进入这个领域。我们会看到初创公司,也会看到大型实验室。我们甚至可能会看到像Meta这样的公司,要么重塑,要么干脆推出全新的浏览器。

我们正经历一场“达尔文式”的爆炸性变革,将彻底改变我们与世界交互的方式。而且在某种程度上,就连桌面上的Claude或ChatGPT,其实都在和浏览器竞争。

Howie说的我完全同意,现在我找信息第一步绝对不是去Google。比如开会时有人提到“量子计算”,我可能完全不懂量子计算,我不会去Google搜“请告诉我量子计算”,我会直接去问Claude:“给我一个关于量子计算的快速入门介绍。”五秒钟后,我就能得到一份很完美的总结。

所以我认为,正在发生一些根本性的变化,浏览器将会是其中的关键一环。我一点也不会惊讶看到OpenAI要么开发自己的浏览器,要么直接出手收购Chrome。我们将在这个领域看到巨大的创新。

Howie Xu:

为什么我们没有听说过Anthropic在开发浏览器的传闻?

Guru Chahal:

这个我不能评论。但你们也都知道,我们是Anthropic的超级粉丝。原因很简单:这是最优秀的一支团队。他们正在推动智能的前沿发展,但同时又是在一种安全、可信、可解释的方式下推进。这些特质,对像我和Howie这样有企业背景的人来说,非常重要。

所以我们认为,应用智能和认知智能前景巨大,尤其是在企业场景中。可以肯定的是,Anthropic会持续尝试新的方式,把他们的模型和智能,与企业所需的数据,以及这些模型要实现智能所需的动作连接起来。这会不会是一个浏览器?当然有可能,但那取决于首席产品官(CPO)Mike Krieger和他的团队。

陈茜:

你觉得浏览器之战会只是巨头的游戏舞台,还是初创公司也有机会?因为我们看到大语言模型(LLM)这场游戏已经完全是大玩家的天下了。

Guru Chahal:

初创公司百分之百有机会。这是一个公平竞争的赛道。而原因其实很有趣——Chromium(Chrome的底层引擎)是开源的。

如果在15年前,我不会那么大胆地说一家初创公司能从零写一个浏览器。互联网如此多样,要支持构建浏览器所需的各种功能,是一件极具挑战的任务。但让我对新玩家充满信心的例子是这样的:Howie和我一样有网络安全背景,大概五六年前,有几个创始人意识到可以为企业打造一个全新的安全浏览器。一开始你可能会下意识反应:“这不就是Safari或者Chrome的地盘吗?不可能有市场。”

但事实是,它很快就被Palo Alto Networks收购,如今已经成为这家大型网络安全公司内部非常庞大的业务。此外,还有一家叫Island的公司也发展得很好。所以,初创公司确实有机会。这两家公司都是初创公司,他们的产品都是基于Chromium构建的。

你完全可以把Chromium当作初创引擎和基础模块,然后在用户界面、交互系统、安全优化、自动化优化等方面全部重新思考,构建出新的东西。所以我认为这个领域是完全开放的。

Howie Xu:

我会说,这主要还是小玩家的机会。不过我同意你的看法,可能巨头也会在现有产品之外搞一些新项目,在我看来,那算是巨头内部的小玩家。

但我实在无法想象现有的巨头、现有的No.1应用会发生太大的变化,原因就是我之前提到的。但大巨头中有可能会出现一些有趣的新项目,比如说微软的Surface。只是通常你也知道,在大公司里这种(内部创新)推进很艰难。所以我可能有点偏见,但我会说,对于那些没有市场份额的人来说,现在其实正是他们的机会,或者说我们的机会。

04

搜索商业模式的完全颠覆

谷歌的搜索引擎和Chrome浏览器是两个独立的霸权体系。搜索引擎控制了全球近90%的搜索入口,而Chrome浏览器则是握住了互联网的流量窗口。

为了守住这一双重垄断结构,谷歌不惜重金投入,比如说谷歌母公司Alphabet每年都会向苹果支付数百亿美元,只为让Google保持在Safari中的默认搜索地位。

别看谷歌家大业大,但这几百亿美元相当于谷歌从Safari流量中获取搜索广告收入的36%。所以,对于依靠广告和搜索为主要收入模式的谷歌,也不单是谷歌,还包括依靠展示投放广告为主要收入的Meta及其它社交媒体,AI浏览器会如何颠覆广告的商业模式呢?

陈茜:

浏览器会如何颠覆当前广告商的模式?因为搜索引擎和浏览器一直是流量入口,对于SEO、排名、广告展示等等都是如此。那么,新的AI浏览器会如何冲击谷歌和Meta的盈利机器呢?

Guru Chahal:

我觉得你问的是个正确的问题,但视角有点窄。我更建议把问题放大一点:在我们即将进入的新世界里,“搜索”到底是什么?

过去,我们所有人都把搜索当成一个对人类好用的发现机制。你想去旅行,比如夏威夷,想要好酒店,你会去搜索。但你要问自己:五年后、十年后,你还会这样做吗?你还会打开一个搜索框,输入“夏威夷好酒店”,看十个蓝色链接,然后一个一个点开,逐个比较评论吗?这就是那时的交互系统吗?

在我看来是零可能。五到十年后,我认为整个世界将被彻底颠覆。因为你会去找一个值得信赖的智能体,或者你信任的浏览器,并对它说:“我在考虑去夏威夷,你觉得怎么样?”搜索仍然会发生,但它被下推了一层,由智能体来完成。

Howie Xu:

所以,我称之为你和你的旅行agent对话,告诉它“这是我的计划,你来把它弄好。”可能智能体需要去做些研究,可能需要与航空公司或酒店对话,不管什么,那是智能体的工作。我的工作,是与我的旅行智能体对话。

Guru Chahal:

没错,这会带来什么样的影响呢:今天整个搜索行业是基于一个非常简单的假设,即有一个有点不耐烦的人类坐在那里、查询能力并不完美,而且想立刻得到答案。

这就是为什么搜索引擎会显示10个搜索链接。因为如果你显示40个,我会很不知所措;如果你只显示3个,我就不太会信任你。所以经过足够多的试验,我们决定10似乎是合适的数字。因此,整个行业都围绕着:我去到那个单一的输入栏,输入一个并不完美的搜索查询,然后逐个浏览结果。

而这样的逻辑对智能体并不成立,因为智能体搜索的方式、它们搜索的对象,以及它们能够接收处理的查询类型,与当今人类有着极大的不同。举个例子,我们投资过的公司Exa AI专门为智能体构建搜索引擎。

人类今天是这么做的:在夏威夷找酒店的时候,搜索结果会跳出10个链接。我点开每一个,然后逐一打开标签页。结果我在浏览器里一下子开了11个标签,再一个一个看过去,发现都不喜欢。于是再翻到下一页,继续点、继续看。AI则只会发出一个查询:“给我100家酒店,并把所有可以用来筛选的元数据、所有评论一次性返回给我。”

然后,它会把这些数据塞进上下文窗口,再问四个人:“根据你们对Guru的了解,你们觉得在这些日期里可能会喜欢哪些酒店?顺便说一句,把那些日期不可订的酒店直接排除掉。”最后,它给我三条推荐,我立刻觉得其中一家不错,想马上去。

于是,整个搜索的方式都被改变了。而这才是对搜索更大的威胁。威胁不只是从Chrome转向Neo,更大的威胁在于:搜索已不再由人来完成。我不相信由人类主动发起的搜索查询十年后仍会是主流。届时,执行搜索与信息发现的将是AI。

所以,我们正在投资那些让这一未来成为现实的团队。浏览器会更多地成为一种交互机制,你通过它来驱动自动化、进行对话、完成你关心的事务,不管是工作还是娱乐。至于搜索,它将被委托给AI去完成,由它在那一刻为你抓取所需的正确信息。

Howie Xu:

我非常同意。在谈论商业化和盈利模式之前,我们首先需要讨论未来会是什么样子。你刚刚描绘了从搜索到浏览器的未来,那只是未来的一部分,还包括搜索是如何完成的、在哪一层完成的、以什么形式呈现。我完全同意你的观点,但我想再补充一点关于商业模式的看法。

我想说的是,我们其实并不知道这个商业模式最终会是什么样子。举个例子,为什么今天会有Google?我是在一个播客上听到的这个非常有趣的故事。1997年,也就是Google成立之前,拉里·佩奇去拜访了一家叫Excite的公司。当时市面上有十几家搜索公司,而Excite的发展还算不错。

后来他们做了个测试,把Excite的搜索和Google的搜索放在一起比较,团队一致认为Google的搜索效果好得多。于是最后一次会议时,Excite的CEO进到房间里说:“好吧,让我看看我们要不要收购这项技术,或者做点别的。”但当他看到Google的搜索效果好得多时(第一个搜索结果就如此相关)他当场就说:“你们可以离开了。”

为什么会这样?原因就在于商业模式。因为Excite的商业模式是依赖横幅广告的,所以人们在页面上停留得越久越好。但如果第一个蓝色链接就已经足够相关,那么我的横幅广告收入反而会减少,而不是增加。

所以在我看来,当我们还在思考广告收入模式的时候,其实正在经历另一场重大的转变。因此我会说,尽管今天的广告收入规模巨大,任何仍然以当下这种方式来思考广告收入的人其实都是错误的。现在唯一不能说这些话的公司就是Google:他们没办法这么说,因为他们必须每个季度向华尔街交账——1000亿美元的大部分收入都来自广告。

所以,我会说Google正是因为这个原因而陷入困境。当然Google也有Gemini模型,还有很多其他项目,他们可能会启动新的尝试。所以,从这个角度看,未来其实是不确定的。

但回答你的问题:第一,要先去思考未来会是什么样子,我认为那将是一个完全不同的未来。第二,我们要思考的是那个未来的商业模式是什么,而不是继续用当下“广告驱动”的思路去想商业模式。

Guru Chahal:

有一个思考方式是这样的,当你观察一个市场时,产品到底是在服务商业模式,还是商业模式在服务产品?在市场发展的早期阶段,你会先创造一个伟大的产品,然后再匹配一个商业模式来支撑它,因为你想要打造更多的产品,希望更多人来使用。这就是Google的早期。但当你取得巨大成功之后,某个时间点,你会被锁定在这个商业模式里,反而变成了产品去服务商业模式。

这就是搜索引擎的转折点。它曾经非常成功,但现在却被困在这种商业模式中。于是你不再只是在搜索结果右边显示三四个横幅广告,而是把它们放到了搜索结果的最上方。然后渐渐地,你让这些广告看起来越来越像真实的搜索结果。

如今,你在Google上做搜索时,有多少次会思考“这是赞助结果还是自然结果?”我不得不去注意底部那个小小的斜体字“赞助”。如果我看到它是“赞助”就会直接划过,但不是每个人都能注意到这一点,毕竟它们被做得看起来就像是真正的搜索结果。

现在,我们处在一个“产品反而在服务商业模式”的局面里。而这正是机会所在,也是风险投资存在的意义。那些我们资助的创业者,他们并不在意商业模式是什么,他们只想打造最好的产品。

我们两个人都做过创始人。我们当初创业时,并不是想着“该找个什么商业模式”,而是看到了市场的空白,能创造出一个出色的产品,然后再去匹配一个合适的商业模式来支撑这个产品。我认为这就是机会。

市场有它自身的规律,我不会责怪Google或其他公司。这是它们的成功,把自己带到了今天这种局面。只是,事实就是它们被商业模式所束缚,而产品仅仅是在服务这种商业模式,而不是努力做到最好的产品。这正是留给创业者的机会,而对此我们感到非常兴奋。

陈茜:

是啊,这是个好时机。就像你说的,我经常点开页面上的第一条或第二条结果,发现完全不是我想要的东西。有时候,连竞争对手的公司都可能因为排名被展示出来。

Guru Chahal:

这简直成了个笑话。有些时候,我甚至在手机上都没法再用。如果我要用,就得先翻过第一页,再翻到第二页,才能越过那些赞助结果,看到真正的搜索内容。

那我为什么要用它呢?我完全可以直接打开AI,然后把问题丢给它,让它立刻给我答案。

Howie Xu:

这正是因为他们的产品在服务商业模式,很简单的原因。

05

AI浏览器

技术难题与多模态

要让AI浏览器真正成为主流产品,我们可能需要AI Agent技术的快速进步,包括之前我们也出了节目聊AI Agent路线的各种挑战和难题,包括信息抓取,速度,MCP协议等等。我们的嘉宾Howie分享到说,他认为AI浏览器会有三个阶段的发展。

陈茜:

为了克服当前的障碍,我们还需要哪些技术上的突破或进展?

Howie Xu:

过去一年,我几乎全身心都投入在浏览器的这场革命中。可以说每天24小时都在想着这个问题。我认为我们正在走向AI原生浏览器,而现在我们正经历三个不同的阶段。

第一个阶段,基本上就是聊天,然后是搜索,以及它们之间的整合。我什么时候需要聊天,什么时候需要搜索?让人们一边说“去Google搜索”,一边又去别的地方提问,这是没有意义的。你需要给我一个统一的体验:当我有一个问题或需求时,我只要去一个地方,它会在需要时提供聊天、需要时提供搜索。比如说,我想直接进入美国银行的账户页面,我不想点开10个蓝色链接,我只想直接到美国银行。所以,导航、聊天、搜索,这三者必须整合在一起,提供一个统一的体验。我认为,对于AI原生浏览器来说,不光是Neo,这个阶段我们其实已经渡过了。我觉得很多其他浏览器要么已经意识到了,要么很快就会走到这一点。搜索和聊天的融合,我会称之为第一阶段。

第二阶段和第三阶段,时间点可能存在争议,我先分享我的观点,但业内也有不同的看法。在我看来,第二阶段并不仅仅是把搜索和聊天融合在一起,而是浏览器需要变得更加主动、更加个性化。它不能只是在我想去CNN或Fox News的时候简单给我一个链接。在我打开网站之前,浏览器就应该已经做了一些事情,比如推送通知。假设我在读新闻的时候,可能没有注意所有细节,那么两天之后,它会对我说:“Howie你对F1感兴趣吧?”顺便提醒,有一个相关的赛事就在你刚才或者两天前浏览的那篇文章里提到过。

这就好像有一个“超级助手”坐在你身边,几乎与你一起浏览。它会帮你记忆内容,帮你提取信息。如果需要的话,它甚至能帮你访问50个不同的网站,并进行总结。所以我把它称为一个“个性化的、主动的智能体”,就像一个超级助手陪在你身边,这就是Neo浏览器正在努力实现的价值。

第三阶段是智能体化。所谓智能体化,是指浏览器能够执行更复杂的任务,而不仅仅是填写一些简单的表单。它会更像是我的私人助理。比如说,我想去夏威夷,它不只是告诉我几个热门景点,而是能给我一个完整的行程安排,甚至包含潜在的预订方案。

在业内确实有人相信我们需要立刻跳到“智能体化浏览器”这一阶段,我并不反对。事实上第二阶段和第三阶段,我们是同时在推进的。但我认为,技术还没有完全准备好支撑一个成熟的全功能智能体化浏览器。

比如说,如果我想在亚马逊上买一个手机壳,我还不会完全信任智能体化浏览器来帮我完成,因为它可能十次里有八九次做对了,但万一那一次,它不是帮我买到手机壳,而是买了一部手机就不好了。所以,现在我对AI的信任程度还远没有到那一步。

但如果我们真的能进入第三阶段,那就不仅仅是搜索、导航和聊天的融合,而是搜索、聊天与行动的融合。不过,我觉得在“行动”层面,技术还没有完全成熟。简单的动作当然可以做到,这也是我们现在正在尝试的。

对于浏览器来说,我们已经完成了第一阶段,我们觉得自己已经走在了其他产品的前面,特别是在推动浏览器个性化和主动化方面。这里面其实还有很多工作要做,并不是说简单把Anthropic或OpenAI集成进来就算完事了,你必须更深入地思考用户体验到底是什么。

因为说到底,即便浏览器能做到很主动,但如果处理不好,也可能会让人觉得非常烦人。如何在其中找到用户体验的平衡,这是个很难的问题。所以我们现在正处在第二阶段,同时也在交付一些智能体化的功能。但我认为,这可能还需要一年甚至十八个月,或者更久的时间,我们会逐步取得进展。

Guru Chahal:

我很喜欢这种分阶段的表述:先从消费者能够轻松适应的新模式开始,然后逐步进入个性化,再到行动与执行导向的方式。但几乎就像你刚才描述的那样,我突然意识到,或许现在正是浏览器真正成为AI操作系统的时机。长期来看,这可能才是更大的机会。

浏览器不再只是一个小窗口,让我们去获取信息、在互联网上或应用中执行操作,而是真正成为我们生活的操作系统。它是智能体化的,它是主动的,而且它能作为一个真正的伙伴,把聊天与搜索结合起来,甚至可以和它一起头脑风暴。我对这样的世界感到非常兴奋。

在另一方面,我对“智能体化”也有一些不同的看法。我认为,其他一些公司正在研发的东西实在是太了不起了,而且我觉得我们都会惊讶于自动化将以多么快的速度进入我们的生活。

Howie Xu:

我个人非常喜欢智能体。我并不是说要等到一年或十八个月之后才有,而是指那个时候我们可能会看到高准确率、真正成熟的智能体化成果。但除此之外,智能体其实已经在这里了。

Guru Chahal:

你怎么看语音呢?它会不会在这里重新找到自己的位置?现在语音已经非常出色了,有时候我甚至根本不用打字,而是直接说话。

Howie Xu:

是的,这很有意思。当我们开始做并发布第一个版本时,其实已经内置了语音功能。我觉得有趣的是,最初语音的采用并不多。目前还不确定原因到底是语音本身是个“错误”的功能,还是人类需要时间去适应。在移动端,我觉得人们更习惯使用语音,但在桌面端,我不认为大家会觉得“对着笔记本电脑说话”是自然的行为,这显得没那么自然。

但谁知道呢,也许只是时间问题。我觉得这里有两个不同的方面:

第一,技术成熟度。语音技术本身是否足够成熟,是否足够自然、便宜,延迟够低。我认为在过去12个月里,整个行业已经取得了巨大的进步,所以我会说,现在不能再用“技术还不成熟”作为借口。

第二,这项技术是否真正适合那个使用场景?在我看来,目前我们还没有看到。我本人非常支持在浏览器中采用语音功能,我带着团队把这个功能加进去了,但我也被告知几乎没人用。

Guru Chahal:

我觉得你的直觉是对的:语音确实非常挑剔。95%的准确率其实还不够。它必须能够真正理解我说的话,包括我的口音、我使用的词汇。如果我是金融领域的专家或者是一名医生,它需要理解那些专业术语。它还需要做到实时——我需要能很快看到它正在输入的内容。我的直觉是,我们已经非常接近了。

另一方面,用户体验的门槛也很高。如果我在讲话,它等到我完全说完之后才把文字显示出来是不可行的。我需要看到它边听边打出来,这样我才会有信心它在正确地工作。所以,我认为技术门槛非常高,但我们几乎快达到了。

同时,你说的另一个方面也完全正确:它是否适合某些使用场景?我认为会有一些场景能让语音快速形成使用习惯。我很好奇,如果你重新启用这个功能,并在语音上投入更多会有什么结果?也许这就是我们之后要继续探讨的话题。

陈茜:

那视觉呢?我认为视觉很可能是浏览器的下一个阶段,因为视觉包含了大量其他信息,是语音或文字难以描述的。但目前可能还稍微有些早,因为我们还在等待硬件的发展。

Guru Chahal:

我对AI所带来的新的视觉交互模式非常兴奋。我确实觉得现在还稍显早期,但技术正在逐步接近。

举个例子:如今整个浏览器的交互模式是,我打开一个网站,看到预先排版好的页面,上面有图片和文字。但未来也许AI会基于对我意图的理解,即时生成完整的结果,可能是视频、可能是图片,也可能是文字,完全为我量身定制。

视觉将在其中扮演重要角色,包括呈现的方式。比如,它可能会生成一张思维导图,因为知道我喜欢这种形式;又或者以图片为主,因为明白我是一个视觉型思维的人,喜欢通过图像理解;也可能以文字为主,因为明白我不喜欢图片,更愿意快速浏览文字内容。

所以,我认为即时生成图像和视频的能力极具吸引力。但就目前而言,它依然昂贵、难以预测。同样的提示词,可能每次生成完全不同的图像,而且延迟还很高。我知道有一些团队正在努力解决这三个问题:提高结果的可预测性、降低延迟,甚至实现实时视频生成。

我们已经开始看到一些演示,比如“无限游戏”的概念:游戏世界会在玩家游玩时实时生成,这个世界永不会结束,它会以比真实时间更快的速度生成游戏世界,所以你永远不会看到视频的终点。我们已经开始看到这样的趋势,虽然分辨率还有点低,但技术正在逐步成熟。接下来,还需要成本的下降。我觉得,一旦做到这一点,我会非常兴奋。这不会是一个六个月就能完成的事情,但它确实正在逼近。

Howie Xu:

这次Guru谈的是工程层面的内容 :成本、延迟、技术成熟度。而我要谈的是愿景层面。在我看来,也许十年后,甚至不到十年,但肯定不是两年内,而是在未来若干年,当我们回过头看浏览器的使用方式时,会发现我们今天的使用方式是多么的错误。

今天你去你喜欢的新闻网站,不管是Fox News还是CNN,你看到的都是他们给你的内容。但问题是,为什么我必须因为CNN或Fox News提供的是文字,就去看文字呢?应该是我自己来决定:我想看视频的时候就看视频,我想读文字的时候就读文字。数据的来源其实无关紧要,它不应该是固定的。

所以,我们确实需要一个多模态的浏览器。所谓多模态就是它作为中间的一层:我有需求,比如我要看新闻、看视频,那么CNN、Fox News的内容无论以什么形式存在都不重要。如果它是文字,就可以即时转换为视频给我。但有时候,我在车里,只想随便刷一刷YouTube。这时即使我打开浏览器,我也更希望能直接看到文字摘要,而不是视频,因为那时的环境不适合我看视频。

所以,我认为多模态是一种全新的方式,它能让我们真正释放作为用户的价值,以更合适、更高效的方式来消费信息,而不是被固定在“给我的是文字,我就只能看文字”、“给我的是音频,我就只能听音频”的限制之中。

Guru Chahal:

我见过最令人兴奋的一个演示就是Google的Notebook LM。我们平时都会读一些论文、博客或者新闻稿,如果把同一篇文章导入,它在你开车的时候就会自动生成一段播客供你收听。这是一个做得非常好的产品。

现在,想象一下它的下一代版本:不再是播客,而是生成一段视频,比如一个“对话式视频”。画面中会出现两个虚拟角色,他们在讨论你提供的那篇技术论文,并且展开辩论。我们正在进入一个全新的、令人兴奋的世界。在这个世界里,你消费信息的方式和形态将会实时、个性化地决定:

如果此刻我想以文字的形式获取信息,它就会以文字呈现;

如果我想以播客或音频的形式,它就会以音频呈现;

如果我想以视频的形式,它就会以视频呈现。

这就是我们正走向的未来,非常令人兴奋。在消费端,尤其是面向大众的应用场景,这里面会有非常多的机会。所以,浏览器之战是真实存在的。

06

AI浏览器时代

数据隐私与安全

陈茜:

我知道,正如我们之前讨论的,浏览器提供了便利和全新的未来,但它们也可能以某种方式集中化用户数据收集,这确实会引发隐私方面的担忧。那么,从治理角度以及透明性角度来看,这有多大的风险?

Howie Xu:

这个话题,我算是两方面都能看到:

一方面,很多时候人们追求的是便利,无论是把所有东西都传给模型提供方还是其他,只要我能得到最好的答案就行;但另一方面,也有人会在意,我是不是提供了敏感信息、你会不会保留我的提示词?因为对一些人来说,他们不希望别人看到自己的提示内容。

对我来说,让消费者拥有选择是非常重要的。我会用的一个类比是:提供端到端加密。而最极致的版本,可能就是Signal——无论我在Signal上做什么,只有我和你能看到,中间不会有其他人。而其他一些聊天工具,总是会存在“中间有人能看到”的情况,或者说它们的隐私保护程度是有很大的范围差异。

我们的设计理念是:我并不是说所有人都必须追求最极端的隐私保护,但至少从我们Neo浏览器的角度出发,我们希望提供一个几乎相当于“浏览器界的极致隐私产品”。这样你就能有信心:只要这是你选择的配置、你设定的方式,那么提示词就只会保存在你本地的设备上,它不会保存到我的服务器,也不会保存到任何别人的服务器。

或许有人会说,在云时代,这不应该是什么大问题了,但确实有一些人非常在意这一点。所以Norton Neo提供的安全感和安心感就是那些关心隐私、关心安全的人选择Norton Neo的原因。但我也要说,我很确定会有人告诉我:“我不在乎这些,我只在乎能不能跑出一个很炫的智能工作流,只要能完成任务那就够了。”所以这类情况同样存在。

Guru Chahal:

这里有几个彼此相关的词语或概念:安全、隐私、信任。因为隐私和信任是相互联系的:如果我信任你,我就不需要过分强调隐私;如果我不信任你,我就必须非常注重隐私。最后,还有一个概念是“对齐”:我们在世界观上是否一致?当我对你说些什么、分享些什么时,你是否会像我对待它们那样去对待它们。

所以对齐、信任、安全,然后才是隐私,单独的“隐私”其实并没有太大意义——你会把一切都与伴侣分享,但你不会跟陌生人分享太多。这归根结底,都与信任相关。

所以当我们思考这四个要素时,我们的核心信念是:在技术栈的每一层,都需要考虑这些基本原则,尽可能地赋予用户更多的控制权,同时也让上层有更多的控制权,最终落实到终端用户。这样,当我们使用它时,我们就能决定我们想要多大程度上的信任,需要多高程度的隐私保护。

我认为,大多数面向消费者的应用都必须提供这样的选择。因为这种技术不同于以往的技术,它非常强大,但同时又需要接入你的生活和信息才能变得更强大。因此,在不提供任何信息和提供信息之间,它的有效性差距其实非常大。也正因如此,我认为人们会有很强的冲动去提供更多的信息。

对于应用提供商、浏览器开发者来说,要自己去决定、去假设,应该把这个“刻度”调到哪里,其实是非常困难的。更重要的做法是:推荐一些默认的设置,并且把调节权交给用户。

我再举一个更底层的例子:在那一层里,Neo浏览器可能与Anthropic有某种集成。我们非常认同Anthropic的愿景,因为它强调信任、安全、保障以及对齐,而这些都是极其重要的。因为作为一个应用构建者,你可以在界面上提供所有这些控制选项,但如果底层的智能系统本身并不真正遵守这些指令,那你最终面对的将是一个更大的问题。

Howie Xu:

所以沿着这个思路,你觉得在未来,消费者会不会拥有某种“数字世界”(的分配形式)?比如我会说:“这一部分我交给浏览器,那一部分我交给那个AI智能体。”

因为无论如何,我都要和6个,甚至60个智能体打交道。我会把记忆和数据集中保存在一个地方,由我统一管理,然后再根据不同的智能体去调用。你认为这是可能的吗?你见过那么多不同的应用,你怎么看?

Guru Chahal:

我觉得会有一些网络安全的极客,比如像我和Howie,会非常谨慎地管理信息,以及决定哪些应用能访问哪些内容。但根据我的观察,普通消费者在这方面的认知负担很大。要把信息分门别类地放进不同的“沙盒”,然后再把每个沙盒交给不同的应用,这个过程对大多数人来说太复杂了。

我可以告诉你,很多硅谷之外的人,或者说网络安全圈子之外的人,当他们用 Google 登录某个应用时,Google会提示:“这个应用将能访问Google的七个服务。”几乎没有人会真的去读、去处理这些提示。人们的反应就是:“是的,我只想用这个应用。”

所以,我的结论是:对一小部分人来说,这种“分区管理信息”的能力确实很重要,而且在许多场景下它会很有经济价值。比如你在美国国家安全局工作,这就显然非常有价值,你也许可以基于这种需求来建立业务。但我并不认为会有一个世界——普通消费者、大多数不了解的用户、全球几十亿用户——能够以正确的方式去分区管理这些信息。

我们甚至在个人生活里都很难做到。就像我很难记得,我到底跟我的伴侣说过什么?我跟我的孩子说过什么?又跟我的表亲说过什么?这真的很难,认知负担实在太大了。不过如果AI能在这方面帮到我们,那就很有意思了。

Howie Xu:

我觉得消费者在隐私和安全问题上,其实并不喜欢额外的认知负担。他们也不喜欢为此付费。消费者只有在不用付费,而且使用体验顺畅的情况下,才会强调隐私。但只要这两个条件中有一个不满足,甚至两个都不满足时,他们通常就会说:“嗯,我不确定。”

Guru Chahal:

如果真的这么在乎隐私,今天全球占主导地位的搜索引擎应该是那些专注隐私保护的搜索引擎,而不是Google。人们喜欢谈论隐私,但归根结底,他们只是想做自己想做的事情——体验感需要是顺畅的。如果有免费的选择,他们不愿意为隐私额外付费。如果你能把隐私融入其中,那当然很好;但如果不能,以我的经验来看,大多数消费者其实并不在乎。

Howie Xu:

我还有一个问题:过去消费者是不愿意为任何东西付费的,对吧?比如Gmail之类的服务。但现在,他们却愿意每个月花20美元去订阅Anthropic或OpenAI。你怎么看待这种行为?你觉得这是消费者行为上的一种转变吗?

Guru Chahal:

我觉得,回到之前的讨论,我认为长期的商业模式其实还没有完全被发现。一开始,每个月花20美元、5美元,甚至100美元,取决于你得到的价值,这是完全合理的。我认为,这能为这些公司提供非常强的信号,同时在某些情况下,也能覆盖极高的推理成本。

我喜欢的一点是,从历史上来看,即使是我们这些在技术上相对走在前沿的人,以前也不会每个月花20美元去订阅五六七个不同的应用。但现在,我们会这么做了。我喜欢的一点是,我们从AI中获得的价值如此之高,以至于我们终于打破了过去“不愿付费”的习惯,开始付费了。想想看,仅仅在短短二十年间,我从来没为这些东西付过钱,但从一两年前开始,我们突然觉得:“天哪,我离不开这些东西了。”于是刷张信用卡就付了,真是不可思议。

长期来看,这会是最终的商业模式吗?还不确定。我认为最终可能会是多种模式的混合。至于真正成功的商业模式,还需要继续探索:也许是“我们给你提供最安全、最注重隐私的浏览器,所以你应该付费”;也许是广告模式,或者其他什么形式。

陈茜:

我最后还有一个问题:你觉得未来五到十年里,最令人兴奋的创业机会会是什么?

Guru Chahal:

在我们见证这场AI浏览器之战拉开序幕之际,这个问题其实不言自明:AI是如此基础、如此惊人的构建模块,以至于几乎技术市场中的每一个领域,甚至超出科技本身的范围,都将会出现巨大的机会。所以,我不会排除任何可能性。

话虽如此,我觉得对创业者来说,一个最有趣也是最重要的检验标准是:这件事三年前能做出来吗?这是一个非常简单的问题:你是在做一件三年前就能做、只是今天把它做得稍微好一点的事?还是在做一件三年前在经济上或者在技术上根本不可能实现的事?

三四年前,你能不能做出一项技术,可以把一家公司在财务披露中发布的所有PDF全部读完,然后给你一个总结?所以,我对那些在三四年前根本不可行,而今天却可以实现的业务感到非常兴奋。这是一个典型的“为什么现在创业”的问题:不管是因为当时经济条件不允许,还是技术条件不成熟。我很享受这种变化,但我也很好奇,你怎么看?

Howie Xu:

回到你之前提到的一个观点,浏览器不仅仅是浏览器,它将成为未来的AI操作系统。所以,在我看来,当然,我承认我有偏见,但我认为Neo将会彻底取代 Chrome。到那时,这就是操作系统的未来。我会在浏览器里与六千万个应用程序协同工作,因此基于构建服务,会有大量的创业机会。这就是我对未来十年的看法。

Guru Chahal:

确实,我觉得这是一个很棒的观点。你正在拓展浏览器所能达到的边界,而这些新的边界会催生出一类全新的应用。就像当初浏览器引入JavaScript才有了AJAX、Gmail以及各种有趣的应用一样。我之前没往这方面想,但这是一个很好的观点。仅仅是在浏览器层面的创新本身,就可能促使一类新的应用出现。

Howie Xu:

是的,所有与(我创办的)Neo浏览器协作的智能体,其实都在为Lightspeed带来潜在客户。所以无论如何,50%的潜在客户都会在我的浏览器(Neo)上产生。那我肯定会订阅,并为这个浏览器付费。

我还是那个问题:关于为什么Anthropic还没有发布浏览器产品。

Guru Chahal:

我真希望(作为印度人)我能不那么谨慎,但我只能说,那是一家非常了不起的公司。我真希望能透露更多。我从未和一群如此聪明、如此深思熟虑的人一起工作过,这真的是一个了不起的团队。而且,你我都有了漫长的职业历程。在我们职业生涯的这个阶段,最重要的是能与那些杰出的人共事。他们能推动我们拓展自己对世界的看法、推动我们不断思考。能和那个团队共事,我觉得无比荣幸。

所以,我只能说:请大家拭目以待。

这场对话我们觉得非常精彩,我们聊了AI浏览器的潜在形态,商业变现方式,颠覆谷歌的机会,初创公司的机会,技术壁垒和挑战,以及新时代的安全问题等等。

希望对大家理解即将到来的这场AI浏览器有所帮助,而我也很期待,接下来几年,我们和互联网交互范式的完全改变。

本文来自微信公众号“硅谷101”,作者:硅谷101,36氪经授权发布。

+1
7

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

671B DeepSeek-R1在数学推理上竟被14B模型超越?

4小时前

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业