从雅虎到谷歌再到雅虎:搜索的未来是精品店
神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。
编者按:在创立之初,谷歌便瞄准了一个宏伟的社会目标:“组织全球信息,使人人皆可访问和使用。”2014 年的时候,彼时的 CEO 拉里·佩奇宣布这一使命已经完成。但果真是这样吗?你用搜索引擎查询,第一时间能找到自己想找的东西的机率有多大?从雅虎到谷歌,再从谷歌到雅虎,组织全球信息永远在路上。文章来自编译。
对于大多数查询来说,这段时间谷歌搜索出来的东西已经变得相当平淡无奇。谷歌擅长用客观的答案来回答诸如“全球亿万富翁的数量”或“冰岛的人口有多少?”这样的问题。而在回答一些需要判断以及了解背景的问题的时候,比如回答“NFT 藏家对 NFT 有什么看法?”这样的问题,谷歌的表现通常就非常糟糕。
证据到处都是。这些天来,我上 Google 搜索“ Substack + future of learning”时,要排除一堆的垃圾信息才能找到关于教育最好的信息。我们一遍又一遍地在 Twitter 上面发“什么是最好的”推文来试图找到答案。当我要研究新产品时,我会上 Google 输入“X(产品名) reddit ”。我发现,像 Spaghetti Directory 这样经常被遗忘的小众网站往往具有巨大价值。
然后市面上又出现了 Notion、 Airtable 和 Readwise 这样的工具,大家用这些工具来聚合内容和资源,复兴精心策划的 web。但目前这些大多是单打独斗——隐藏在互联网的私下或半私下的角落,十分的碎片化,没有得到很好的索引,无法供公众使用。我们还没有弄清楚怎么让这些东西变成多人游戏。如果将它们开放出来,让大家协作的话(这里有一个很好的例子),这些项目往往会显得维护不善,而且很短命。
一家市值近 2 万亿美元的公司的既定使命是“组织全球信息”,但互联网的信息仍然组织得很差。或者,换一种说法,在一个信息无限的世界里,光是组织全球的信息已经不够了。组织全球可信赖的信息变得非常重要。
我们是怎么走到现在的?
听起来很难相信,但谷歌的主要问题之一,是在它创始之初,互联网上其实没什么新鲜的事好看的。如果有人输入“药草园怎么种植”,但是线上不存在答案的话,那么就算搜索引擎再怎么出色也毫无用处了。随着 Google AdWords 的出现,发布低质量的内容变得有利可图,然后这些内容又被当作有用信息填充到 Google 的搜索引擎结果。最终的结果是,谷歌搜索排名靠前的网站不一定是质量最高的网站,而是对 SEO 投入最多的网站。刚开始作为组织全球信息的一种善意手段,现已变成将大部分资源用于靠点击广告获利的业务,而不是专注于为大家提供可信赖的搜索结果了。
十年前大家的问题是读/买/吃/看什么等,但现在的问题已经大不相同,是想找出最好读/买/吃/看什么。而且是在时间和注意力有限的情况下找出答案。
现在出现了像 DuckDuckGo 与 Neeva 这样大胆的团队,他们正试图通过开发大规模的横向搜索引擎来与 Google 正面竞争。他们不是用自己的方式去爬取东西并建立索引,而是基于现有的数据源,并将自己定位为以隐私为中心的谷歌替代品。但保护隐私并不足以让人离开谷歌。对于绝大多数人来说,让他们可以“控制自己的数据”并不是卖点,尤其是当他们需要为习惯于免费获得的东西付费时。
我相信,搜索的机会不在于用一个大规模的、一体万用的横向聚合器向谷歌发起证明攻击,而是建立精品搜索引擎,用新的方式对信息进行索引、管理和组织。
垂直搜索聚合器
互联网是如何兼顾了规模与速度的呢?谷歌就是一个很好的例子:web 上的每个页面都能立即返回。但是,我们日益看到这种规模与人类的基本需求——相关性的不一致。想要找到最好的自由设计师、最好的寿司店,或者可以买的最好的 NFT,你没法在谷歌上找到答案。
没有一种搜索架构可以适用所有的搜索类别。很难想象你会想用与搜索自由职业者相同的用户体验去搜索食谱。谷歌的产品始于搜索栏也终于搜索栏,为了简单而牺牲掉功能;而 Yelp、Expedia、Zillow 和 Behance 等垂直搜索公司的出现,则是为了用行业相关的结构化数据来填补前者的功能与相关性的空白。凭借对信息如何组织的强烈看法(这一点可以体现在对过滤器的选择上),垂直搜索聚合器具有横向软件永远也无法实现的明显优势。
但在这里,相关性也取决于当前的社会学。比方说,在 Behance(编者注:一个设计社区)上,在线创意社区、学校以及地点是作为过滤器而突出显示的——这意味着你的居住地和上学地点是衡量你的设计组合质量的重要指标。在人才与文凭主义已经与地理脱钩的世界里,这些过滤器正在失去相关性。
随着信号的演进,创新出现了新的索引方法。如果 Behance 是今天设计的话,我认为“位置”和“学校”都不会是过滤条件。
在 Yelp 上,搜索“迈阿密的电工”的话,排在第一位的是标题为“佛罗里达州迈阿密最好的 10 位电工”的页面,但下方的文字表明其中大部分都是广告。
当你的货币化手段是广告时,内容策划就会被放在次要位置,因为可供你策划推荐内容的数字房地产空间会比较少。所以,这些平台最终做出了在道德上存疑的设计选择,从而导致了巨大的信任鸿沟。
此外,在 Yelp、Zillow、LinkedIn 与 Behance 等垂直搜索聚合器里,任何人都可以拥有个人资料。不相关的过滤器、基于广告的商业模式,再加上供应的不受限制,令消费者不堪重负,难以在这些平台中找到信号。
当你明确知道自己想要什么时,垂直搜索聚合器是有用的。但是知道你想要什么通常并不是起点,而这创造了一个机会,可以沿着漏斗提供更好的发现和策划,从而帮助不堪重负的消费者。
策展人,策展人
我们生活在信息时代已经变成流行说法,我们需要“策展”(curation)来帮助我们厘清头绪。但到目前为止,围绕策展的对话过于关注内容,对结构的关注不足。我们似乎已经接受了策展人的工作,即提供产品点评、链接列表或歌曲推荐——所有这些都放在线性结构以及按时间顺序排列的动态消息里,其目的是呈现过去 24 小时的想法,而不是根据需要来积累和展示知识。
如果是作为业务项目的话,一个提供阿里巴巴前五名产品的每日电子邮件也许感觉很有趣很花哨,但是如果你是打算给自己的宝宝寻找最好的婴儿床的话,这样的邮件并没有帮助。你不可避免地需要有一种方法来搜索某位策展人的档案。
在类动态消息架构的背景下,对分享小规模的孤立信息进行策展,其目的主要是为了娱乐,而不是实用性。说这类策展有市场并没有错。不过,大家没意识到的是这个市场已经被 Twitter、Facebook 和 TikTok 占领了。
这些娱乐巨头提供的是需要我们注意力的策展,但它们并非是根据我们的需要来提供策展的。机会在于将策展内容的动态消息从没完没了的以当下为导向的界面中剥离出来,转到更多以目标为导向的界面上。人们应该可以根据自己的条件找到自己想要的任何内容,而不是受制于策展人发布策展内容的时间。
精品搜索引擎是更高级的策展
所有的策展都会膨胀到需要搜索,所有的搜索都会膨胀到需要策展。
——Ben Evans
按照 Ben Evans 的框架,很显然,虽然垂直搜索玩家由于变得太大且需要策展,但策展的动态消息因为变得太长而没法浏览,然后就需要搜索与结构化数据。解决方案是更好的搜索与更好的策展,所有这些都打包进更好的商业模式里面——我称之为精品搜索引擎的组合。
可搜索、经过策展的界面可帮助我们从短暂的、有时间限制的动态消息转移到上下文有联系、高信号、可信赖的知识空间。由于可搜索的界面紧密相连,因此浏览器可以通过内容跟踪多条踪迹,而不是被扔到“最新”消息里面。
在策展与搜索之间的关系如此紧密的情况下,真正的问题不是你需要的是策展还是搜索,而是它应该在什么时候出现,以及怎么出现:
Spotify 不会只将某些特定歌曲放进他们的平台来做策展。相反,它要的是整个音乐世界,而且它找到了无穷无尽的方式来发现和搜索自己的库,包括人工策展(通过其内部策展人团队及其用户策划的播放列表)与算法(如 Discover Weekly)的结合。
Wirecutter 不会点评完所有的产品。它会人工挑选顶级的产品,然后用搜索等发现工具帮助你找到所需的产品。
Thingtesting 不会自动抓取互联网上所有的消费品品牌。它的团队或社区里面的某个人会尽最大努力把品牌添加到数据库里面。
如果你搜索过 On Deck 的会员数据库,你就会知道,为了参与该计划,每个人都要申请、接受审查并支付费用。
如果你通过 Tegus 看转录文本的话,就会知道内容来自他们团队精心挑选出来的专家。
上述所有例子有一个共同点,那就是价值在于它们排除掉的内容与包含进来的内容一样多。供应侧的摩擦是产生信号的原因。
基于这些信号,这些企业建立起了强大的搜索引擎。比方说, On Deck 建立了一个图谱,可以让用户以独特的方式去发现人才。比方说,你可以按具备“软件工程”技能且当前状态为“对新想法持开放态度”的人员进行筛选。作为一个寻找工程人才的创始人,我总是会在 LinkedIn 上面用这个精选的数据集来搜索。
与垂直搜索聚合器一样的是,精品搜索引擎看起来不太像黄页,而更像是给你的朋友发短信征求建议。精品搜索对供应进行限制,这是他们最大的护城河的基础:信任。重要的是,精品搜索引擎还引进了新的不依赖广告的商业模式。
垂直搜索聚合器与精品搜索引擎的比较
问题仍然存在,因为搜索很难
开发精品搜索引擎需要无数微妙的产品选择。要把策展、搜索、算法以及商业模式搭配得当可能会非常困难,但也非常有价值。以下是我们在做 Startupy 时所思考的问题的非详尽列表,算是我们为了获得对精品搜索引擎的定性洞察而进行的尝试。
如果价值主张是噪声之上的信号的话,怎么才能放大这一信号呢?
策展网站一再陷入到存在主义的陷阱。这类网站一般从高质量的、精心策划的推荐开始。随着网站的壮大,他们靠众包扩大规模,而且往往会通过抓取来填补空白。慢慢地,内容质量会从出色变成良好。在这一点上,像 Yelp 这样的垂直搜索聚合器的实用性会更强一些。比方说,雅虎就因为变得太过庞大而没法看,失去了信号能力,以至于相比之下谷歌竟然显得更好了。策展人、汇编者与编目员之间的界线很模糊,而且存在一条天然无形的渐近线——随着时间的推移,数据更多,回报反而递减。
新一波搜索引擎的商业模式是什么?
表面看来,垂直搜索引擎似乎很简单——内容就是供给,眼球就是需求。但是上一波垂直搜索引擎是建立在基于广告的商业模式之上的,这让事情变得更加棘手。在广告驱动的市场里,眼球集中在供应侧。他们的注意力是需求方——广告商——想要什么。这种广告驱动模式的缺点是广告商和内容创作者都要争夺相同受众的关注度,这就是为什么这些网站最终给人感觉像是营销博客的原因。
所以订阅就是一个机会。订阅将网络效应简化为两个方面:内容即供给,付费受众即需求。但订阅本身并不是灵丹妙药,尤其是在使用不够频繁的情况下。你多久需要寻找一次自由职业者?投资人呢?如果使用不够频繁的话,搜索引擎的效用将无法转化为可持续的商业模式,你就得被迫想办法让用户“为搜索而来,因为其他东西而留下”。
此外,正如我的朋友 Joey 所指出的那样,任何你在隐身模式下花费了大量时间使用的产品,都会存在相当大的用户体验问题。在最终屈服于付费专区之前,你创建过多少个《纽约时报》的帐号?在如今的订阅模式下,客户缺乏真正的动力来帮助平台发展壮大。新生的基于代币的商业模式已经初步显露了一点希望的迹象。通过将所有权授予利益相关者,并让订阅者能从将来的上涨中受益,初创公司可以克服冷启动的问题。
尽管很有吸引力,但目前还没有出现代币化商业模式的玩法。不过我怀疑未来几年这一点会发生变化。
策展人又由谁来策展?
像 Twitter 这样的平台把这个责任委托给他们的用户,他们必须经历一个漫长而艰巨的过程,去关注大量的人,最终达到一条模仿他们兴趣的自我策划的时间线。有些人则是把策展这件事集中化——在 On Deck 上面,你信任用户,认为他们会选择好谁可以加入他们的网络。而有的用户则远离策展,而是偏爱更传统的众包。做法的差别很大。
你怎么才能先找到这个搜索引擎?
这篇文章一开始就提出谷歌需要解绑。标题很吸引人,但事实上,我相信在用户能对你的产品形成习惯性回忆之前,谷歌会成为别人发现你的引擎的重要手段。 像 Zillow 和 Airbnb 这样的公司能吸引大量的直接流量,但 SEO 依然是他们早期战略的重要组成部分。通过成为第一批为房屋建立权威页面的网站,他们从掠夺 SEO 的土地中得到了好处,并坐稳了位置,从此难以被取代。
我们还远未实现互联网的宏伟愿景。就目前而言,人类知识这个项目仍然是由稍纵即逝和支离破碎的信息与想法构成的浩瀚海洋,几乎不可能找到最好的资源。我们需要更多的接口,才能知道缺少了哪些信息,信息需要如何组织,以及必须在价值链的什么位置对信息进行管理。
译者:boxi。