谷歌黑科技:用人工智能,把搜索变成对话

神译局2021-06-16
一款“可以就任何话题展开对话”的人工智能。

神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。

编者按:未来的搜索会是什么样的?从谷歌这里可以窥见未来。今年的I/O大会上,谷歌展示了LaMDA,一款“可以就任何话题展开对话”的人工智能。谷歌CEO Sundar Pichai表示,LaMDA 的自然对话功能有可能彻底改变信息和计算,让它们变得更易于访问和使用。未来的搜索也许就会像跟专家对话一样,通过一段段的对话,慢慢把你想要的答案呈现出来。《连线》聚焦了谷歌对搜索的未来设想。原文作者KHARI JOHNSON,标题是:Google Hopes AI Can Turn Search Into a Conversation

划重点:

谷歌最近推出了LaMDA,一款 “可以就任何话题展开对话”的人工智能

谷歌对搜索未来的将以人工智能为中心

这种AI可以推断人类语言的含义,参与对话,并像专家一样回答由多环节构成的问题

谷歌还推出了另一款人工智能工具,也就是所谓的多任务统一模型(MUM),让用户结合文字和图像进行查询

使用大型语言模型的搜索引擎可提出建议、检索文档、回答问题并完成广泛的任务,但依然存在偏见的风险

谷歌经常会利用自己一年一度举办的开发者大会 I/O 来展示其令人惊叹的人工智能。2016 年,它推出了带内置Google Assistant 的 Google Home 智能音箱。2018 年,为企业接听电话和安排约会的Duplex 首次亮相。按照这一传统,上个月,首席执行官Sundar Pichai宣布推出了LaMDA ,一款 “可以就任何话题展开对话”的人工智能。

在台上的演示中,Pichai展示了跟纸飞机以及天体冥王星交流是什么感觉。对于每一个查询,LaMDA 都会用三到四个句子来予以回应,就好像两个人之间进行的自然对话一样。Pichai说,慢慢地,LAMDA将会融入到谷歌的其他产品之中,比如Assistant和Workspace,以及最关键的搜索。

Pichai说:“我们相信LaMDA 的自然对话功能有可能彻底改变信息和计算,让它们变得更易于访问和使用。”

这次LAMDA的演示为我们提供一个窗口,让我们得以一窥谷歌对搜索的愿景,这个愿景已经超越了链接列表,并可能改变数十亿人对web的搜索方式。这个愿景将以人工智能为中心,它可以推断人类语言的含义,参与对话,并像专家一样回答由多环节构成的问题。

同样也是在这次 I/O 大会上,谷歌还推出了另一款人工智能工具,也就是所谓的多任务统一模型 (Multitask Unified Model ,MUM),它可以在搜索的时候把文本和图像考虑在内。谷歌副总裁Prabhakar Raghavan说,有朝一日用户可以拍下一双鞋的照片,然后到搜索引擎询问这双鞋是否适合攀登富士山的时候穿。

MUM 可以生成 75 种语言的结果,谷歌声称这可以让它对世界的了解更加全面。台上的演示展示了 MUM 是怎么响应搜索查询的,当用户输入“我已经爬过亚当斯山了,现在我想明年秋天爬富士山,我该怎么做?” 这个搜索查询跟我们今天在谷歌上进行的搜索在表述上有所不同,因为 MUM的目标是减少查找到答案所需的搜索次数。MUM 既可以对文本进行概括也可以生成文本;它会知道拿亚当斯山与富士山进行比较,并且知道为远足做准备可能需要有关健身训练、远足装备推荐以及天气预报方面的搜索结果。

在上个月发表的一篇题为“重新思考搜索:从业余爱好者变成专家”的论文中,谷歌研究院的四位工程师把搜索设想成跟人类专家的对话。论文提到了一个例子,搜索“红葡萄酒的健康益处和风险是什么?”目前,谷歌会回复一个要点列表。而这篇论文表明,未来搜索引擎的回应可能看起来更像是一段话,里面会说红酒可促进心血管健康,但可能会弄脏你的牙齿,并且会补充相关的信息来源与链接。论文显示,回复是文本形式,但你很容易会想到口头回复的可能性,就像今天我们使用 Google Assistant 的体验一样。

不过更多地依赖人工智能来破译文本也存在风险,因为计算机依然难以理解语言的各种微妙复杂之处。用来完成生成文本或回答问题等任务的最先进的人工智能,也就是所谓的大型语言模型,已经显示出存在放大偏见,以及生成不可预测或有害文本的倾向。其中有一个模型,也就是OpenAI 的GPT-3,已被用于为动画角色创建互动故事,但在一个在线游戏里面它也生成过牵涉到儿童性爱场景的文字。

作为去年发表并进行展示的一篇论文的一部分,来自麻省理工学院、英特尔和以及Facebook 的研究人员发现,大型语言模型表现出基于对种族、性别、宗教和职业所存在的刻板印象的偏见。

拥有自然语言处理伦理学博士学位的语言学家Rachael Tatman表示,随着这些模型生成的文本变得越来越有说服力,它可以让大家相信自己正在跟能够理解自己所表达单词含义的人工智能交谈。但生成——其实对世界并没有常识性的理解。当它生成对残疾人或穆斯林有害的文本或者告诉大家去自杀时,这可能就会造成问题。Tatman回忆起一位图书管理员曾经教过自己怎么去判断 Google 的搜索结果是否有效。她说,如果谷歌把大型语言模型跟搜索结合起来的话,用户就得被迫学会怎么评估跟专家 AI 的对话。

Google 是一家建立在 PageRank 之上的公司。PageRank 是公司联合创始人 Larry Page 和 Sergey Brin在 1990 年代后期研究式创建出来的一种算法。这种算法要依赖于索引——这是一个利用算法对网站进行排序和评估的过程。后来慢慢地,谷歌又把知识图谱,一个庞大的事实库,纳入到搜索结果里面。

最近,谷歌开始把语言模型纳入到搜索响应里面。2019 年,该公司把一种叫做 BERT 的模型植入到搜索里面,以便回答对话式搜索查询、建议搜索,并对出现在搜索结果下方的文本进行摘要。当时,谷歌副总裁Pandu Nayak称这是五年来搜索领域取得的最大进步,也是“搜索史上最大的飞跃之一”。微软的 Bing在提供搜索结果时也用到了BERT。

BERT 在 2018 年的引入在科技巨头之间开启了一场竞赛,大家都在竞相创建出规模更大的语言模型,力争在语言理解或回答问题等任务上在 GLUE 等流行的性能排行榜上能取得更高的排名。不久之后,百度推出了Ernie,Nvidia推出了Megatron,微软推出了 T-NLG,OpenAI 推出了 GPT-3。工程师通常会通过参数的数量,也就是深度学习系统中人工神经元之间连接的度量来评估这些模型。BERT 包含了数亿个参数,GPT-3 的参数则高达1750 亿个。今年1 月,谷歌发布了一个带有 1 万亿参数的语言模型。在 Google 今年的 I/O 活动上,Raghavan称在参数的数量上 MUM 比 BERT 强大 1000 倍。

在《重新思考搜索》那篇论文中,谷歌研究人员称索引是现代搜索的驮马。但是他们设想今后通过利用能理解更多查询的,更庞大的语言模型来消除索引。

比方说,知识图谱可以针对对事实问题提供答案,但那只针对web的一小部分进行了训练。使用基于更广泛的web构建的语言模型,将可以让搜索引擎提出建议、检索文档、回答问题并完成广泛的任务。《重新思考搜索》那篇论文的作者表示,这种方法有可能带来“思维的变革性转变”。

这样的模型并不存在。事实上,作者说这可能需要创建出通用人工智能,或在信息检索和机器学习等领域取得进步。此外,他们希望这种新方法能够从多个角度提供权威答案,清晰地披露来源,并且不带偏见。

谷歌发言人把LaMDA和 MUM说成是谷歌下一代语言模型研究的一部分,并且表示, MUM 目前正在内部开展试点,来帮助大家查询数十亿个主题。在被问及《重新思考搜索》那篇论文跟LaMDA和 MUM 的关系时,这位发言人表示,Google Research并没有给谷歌产品设定方向,进入谷歌产品(如搜索)的机器学习通常是作为补充而不是取代现有产品。

他们的野心比展示广告领域要大多了。

Michael Blumenthal,搜索顾问

不可避免地,谷歌搜索算法的任何变化都会影响到核心的广告业务。这一该业务去年为谷歌创造了 1470 亿美元的收入。搜索顾问Michael Blumenthal表示,关于登山靴的 MUM 演示表明,谷歌希望在连接企业与消费者之间发挥更大的作用。上个月的另一个变化是,谷歌引入了跟Shopify的集成,将 170 万商家的商品带到搜索结果里面。2019年,外卖公司DoorDash和Postmates已经进入到搜索结果里面。

20 年来一直为企业提供搜索策略咨询服务的 Blumenthal 指出,谷歌搜索结果已经从由 PageRank 提供的链接列表,演变为把广告、知识面板、地图、视频和增强现实纳入在内。

这种转变导致了部分人所谓的零点击搜索(zero-click)的兴起。零点击搜索,是指大家将不再靠点击进入网站来完成一次web搜索。这让 Google 能够在不需要用户离开谷歌渠道别的地方的情况下获得广告收入。数字数据公司Similarweb估计,去年在近三分之二的谷歌搜索当中用户都没有点击进入到另一个页面;在移动设备上,点击率(click-through rates)尤其低。

Blumenthal在谈到谷歌正在考虑进行的搜索变革时说:“在我看来,他们的野心要比展示广告领域大多了。他们喜欢将各方连接起来进行交易,所以我把这看作是极大地增强了这一点。”

强调用自然语言或图像进行搜索的变化可能会让用户不再把注意力放在关键字上,而且还会破坏价值数十亿美元的搜索引擎优化业务——目前企业仍争相靠这一业务让自己靠近搜索结果的顶部。

部分搜索引擎优化公司一直在为自然语言的未来做着准备。Copysmith.ai 是一家总部位于美国阿拉巴马州伯明翰的初创企业,它利用了 GPT-3来为网站生成 SEO元标签等。公司的首席执行官Shegun Otulana表示,该公司不认为谷歌最近的举动“是一种威胁,而是整个人工智能领域往前又迈进了一步。这证实了我们正在朝着正确的方向前进。”

Blumenthal则表示,I/O上面发布的引人注目的公告可能需要数年的时间才能兑现承诺,但他同时表示,有一点越来越清楚,谷歌想要的不仅仅是事实和链接的集合,而是希望自己更像一位能够回答复杂问题的专家。“唯一的问题是他们什么时候能到达那里,”他说。

谷歌把大型语言模型作为商业战略和研究重点的做法在公司内部造成了冲突。最值得注意的一点是,谷歌 Ethical AI 团队的两位前领导,Timnit Gebru和 Margaret Mitchell,他们在共同撰写了一篇强调对此类模型的担忧的论文之后就被迫离职了。除此之外,这篇论文引用的研究表明,大型语言模型会延续人类的偏见和刻板印象,并可能导致气候变化。该论文称,随着语言模型变得越来越庞大,糟糕的数据标记和管理实践会变成更大的问题。至关重要的是,论文还指出,大型语言模型对社会造成的危险最有可能落在被边缘化的社区身上。

今年 1 月,近期另一篇批评大型语言模型的人工智能研究论文的作者,说谷歌法律和政策团队的干预“非常阴险”。今年 3 月,来自谷歌DeepMind 的研究人员发现,大型语言模型可以通过传播刻板印象、失业和虚假信息,在创作者没有任何恶意的情况下给社会造成危害。

译者:boxi

+1
3

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

文章提及的项目

下一篇

没有库存压力的小米线下商家们,要赚更多的钱,就要在更短的时间内卖出更多的货,同时帮小米开更多的店。

2021-06-16

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业