AI市场格局日渐明朗:投资人详解6大“终局”领域与下一波机会
神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。
编者按:AI的“战国时代”即将结束。这篇文章为你绘制了一张清晰的权力地图:谁已胜出,以及下一个战场在哪。文章来自编译。
人工智能市场已然成形
过去四年,人工智能市场发生了显著演变。当GPT-3问世,且“尺度定律(scaling laws)”在人工智能文献中被公开讨论时,情况似乎就很明朗了:你可以根据从GPT-2到GPT-3的进展速度,推断出GPT-4、GPT-5等后续模型的发展轨迹,并意识到一场革命即将发生。
四年前,基于这一发展曲线,我开始寻找值得投资或帮助创立的生成式人工智能公司。最终,我领投或参与了像Harvey、Perplexity、Character.AI、BrainTrust等公司的早期融资。当时,我的策略很明确,就是“支持所有致力于解决重大问题的顶尖人才”,因为那时候真正创办生成式人工智能公司的人寥寥无几。OpenAI似乎是唯一明确的基础模型公司(当时Anthropic尚未发布但前景可期,Llama还不存在,而谷歌显然有能力(并最终会)积极创新,但当时受制于其内部流程)。
随着人工智能核心圈之外越来越多的人意识到这个机会,或者主流实验室的研究员和工程师离职创办人工智能新公司,人工智能的世界变得愈发模糊。我过去常说,我对人工智能了解得越多,就感觉自己知道得越少——因为在许多早期市场中,谁会成为最终赢家并不明朗,而且底层模型和技术变化太快了。比方说在2022年,代码/人工智能驱动的软件工程显然会很重要,但谁会是赢家却不清楚(比如Cursor直到2023年才推出,Codium大约在9个月前正式发布了Windsurf,而Cognition在一年多前才发布了有局限的Devin)。
我们现在已进入了一个新时代,第一波出现的人工智能市场已经稳固,一批可能的赢家已经浮现。这并不意味着未来不会有其他公司出现并参与竞争,也不意味着目前的领导者不会被收购或最终消亡(就像Stripe在PayPal问世十多年后、在Braintree问世四年后才推出,Facebook也在Friendster和Myspace几年后才出现一样)。我们也会看到,在未来几年,新一批的市场将逐渐成形,而这些市场在今天看来还术语相当不确定的那种。
市场格局日渐清晰
1. 基础模型 - 大语言模型(LLMs)
基础模型有很多种,包括大语言模型(LLMs),以及用于语音、图像、视频、音乐、化学、生物、材料、物理等领域的模型。基础模型的发展往往由规模驱动(如数据、算力、特定类型的后训练与反馈等)。规模意味着资本,因此要在LLM市场取胜,你需要拥有动辄数十亿美元的雄厚资本。
在LLM市场,一批核心公司已经明确成为未来的主要参与者。它们通常与超大规模云服务商合作(亚马逊与Anthropic、谷歌云平台与Gemini、微软Azure与OpenAI及其自身项目),因为这些云服务商有经济动机(通过AI的采用来增加云支出)去资助这些公司,这与这些公司本身是否是好的投资标的无关(虽然它们通常是)。据传,基础模型公司的收入在短短三年左右的时间里,就从0增长到了数十亿美元的规模,而一些主流云服务商在“人工智能”上的支出据报道已达到每季度数十亿美元。
LLM领域的核心玩家现在是Anthropic、谷歌、Meta(通过Llama)、微软、Mistral、OpenAI以及X.AI。其中三到四家公司在各项基准测试中明显胜出,被开发者和企业最广泛采用,并且也驱动了行业内大部分的支出。还有一些由杰出AI研究人员驱动的新晋者,如SSI和Thinking Machine Labs,它们或许能提出创新方法,或者会持续融资来参与竞争,也可能在几年后被希望进入市场或加码人才储备的公司收购。
与此同时,中国公司也推出了一些新的开源项目,如深度求索(Deepseek)、阿里巴巴的Qwen,以及最近的Kimi,它们在基准测试上表现良好。关于中国的开源LLM有很多可说的,或许最好在另一篇文章中单独探讨。
未来,由于资本壁垒的存在,不太可能再有很多新的核心LLM公司诞生,除非出现某种未能迅速普及的新突破。
其他基础模型市场虽然在多个细分领域存在有前景的公司,但仍缺乏明确的赢家。
2. 编码
编码是生成式AI和LLM最早、最明确的大规模应用之一。比方说,Github Copilot于2021年10月推出,尽管当时功能和精确度有限,但已被广泛采用并证明非常有用。代码的各种特性使其特别适合生成式AI方法。据传,在编码领域,一些公司产品的上线头两年内,收入就从0增长到5000万甚至5亿美元——这个速度着实惊人。
与基础模型公司类似,编码领域的核心潜在赢家也已显而易见,少数几家公司长期来看颇具吸引力。大型老牌企业可能仍会进入编码市场,迄今为止的产品似乎用户粘性不是特别强,但护城河往往会随着时间的推移而建立。然而,不出意外的话,少数几家公司将在未来几年的代码领域扮演重要角色,其中包括Anthropic的Claude Code、Cognition/Windsurf、Cursor、谷歌/Windsurf、微软/Github、OpenAI,可能还有像Magic或Poolside这样的初创公司,以及像Lovable、Replit等“氛围”编程公司。有趣的是,Figma和Canva都推出了“氛围”编程工具,可以想象未来还会有更多类似产品出现。
编码(及其他市场)仍然存在一些问题,包括“智能体”式工作流与基于IDE的工作流之争及其最终的融合(它们无疑会趋于一致),以及基础模型公司会在多大程度上直接整合或吞并更多编程公司的功能——这既是出于巨大的经济价值考量,也是因为编码是通往通用人工智能(AGI)/超级智能(SI)的起步。这些核心问题将决定谁会成为编码领域的最终赢家。
3. 法律
在核心法律市场,主要参与者格局已经稳固,Harvey(服务于律师事务所和企业)和CaseText是目前的领导者。其他初创公司也开始崭露头角,它们或是在重叠领域(如Legora),或是在新领域(如Crosby)开展业务。EvenUp在后AI时代进入到人身伤害及相关领域,而Eve和Supio则专注于原告方的工作流。我们仍处于全工作流自动化的非常早期阶段,但像Harvey和EvenUp这样的初创公司已经开始着手处理核心法律工作流,并构建端到端完成工作的系统。鉴于法律业务的核心地位,像Harvey这样的公司未来或许能够自然地融入其他专业服务的工作流当中。
考虑到法律服务在垂直领域(专利、合同等)和客户类型(律师事务所、企业、中小企业、消费者)上的广泛性,可能还有新的法律领域有待探索。
4. 医疗文书记录
医生工具及医疗文书记录领域的市场格局也已趋于明朗,主要玩家包括Abridge、Ambience、Commure/Athelas与Nuance(微软)。一些国际公司也已进入该领域,它们最终可能会独立发展,或被主要玩家整合。
这些玩家的关键下一步是将产品扩展到医疗保健体系的其他领域。
5. 客户服务/体验
美国的客户体验市场短期内似乎已整合进少数几家核心初创公司——Decagon和Sierra,而像Intercom、Zendesk等老牌公司则致力于增加和交叉销售生成式AI功能。其他值得关注的初创公司包括Forethought、Maven、Parahelp、Wonderful等。与上述许多市场一样,客户体验市场的特点是,生成式AI通过自主智能工作强力地取代或增强人类,而非仅仅作为另一个按座席付费的工作流工具。
我们开始看到从“卖座席”到“卖认知单元”的转变。这是人工智能公司普遍存在但讨论较少的一个方面。
推理模型的进步与智能体基础设施产品只会加速这一转变。
6. 搜索与信息检索的重塑
专注于这一领域的玩家包括谷歌、OpenAI(ChatGPT)、Perplexity和Meta。值得注意的是,Perplexity是这个市场上的主要初创公司,而其他大多数玩家都是老牌企业。这种情况可能也适用于其他消费者和专业消费者市场,尽管新的消费级应用场景仍有很大空间。
Perplexity和其他玩家正迅速迈向“智能体”的未来(见下文),一方面通过像Deep Research这样的工具,另一方面则通过(最近)进入浏览器市场。比方说,Perplexity的Comet浏览器已经集成了用于网络购物和其他操作的智能体功能。
未来将变重要的市场
3年前,基础模型/LLM、代码、医疗保健、客户服务等领域显然将成为重要的人工智能市场,但谁会胜出或变得重要还远不明朗。如今,可能在短期内扮演重要角色的市场领导者已经很明确了(尽管如前所述,新的初创公司或老牌企业推出的产品仍有可能在后期加入竞争)。
下一批看起来对生成式AI极具吸引力且易于切入的市场包括但不限于以下几个。我和我的团队对投资这些领域的公司抱有浓厚兴趣:
会计。人们既在开发相关软件,在某些情况下还在进行行业整合。
合规。合规有多种形式。制药合规就是一个例子,早期玩家有Blue Note Health等。
金融工具。帮助金融分析师等专业人士的工具。已有许多优秀的团队和早期公司在这一领域开展工作。
销售工具和代理。这里大有可为——从负责销售开发代表(SDR)工作的AI智能体,到增强企业销售能力的工具。
安全。这里有大量的潜在应用,特别是在服务利用率高或团队复杂性大的领域。此外,还会单独出现专注于AI端点、智能体或基础模型使用安全的安防公司,以防范数据泄露或其他漏洞。
其他待定市场也大有可为!
在这些领域中,都有一批令人兴奋的公司,哪家能脱颖而出或最终胜出,可能会在未来几个月或几个季度内明朗化。在某些情况下,模型可能还不足以很好地应对这些市场;在另一些情况下,则需要开发更全面的工作流工具或更好的市场进入(GTM)策略。有时候,这可能只是时间问题——充分了解客户、根据他们的需求进行开发、并看到产品与市场的契合与拉动,都需要时间。
模型 vs. 市场进入策略 vs. 团队?
对于上述这些“新”的市场细分领域,一个核心问题是:是什么阻碍了市场的成形?
对于某些市场来说,部分原因在于模型需要在推理能力或精确度上有所提升。比方说,法律工作流在GPT-3.5上效果不佳,但随着GPT-4的推出才真正起飞,Harvey就受益于此,外加其定制化的模型工作。同样,像Cursor这样的编程工具也受益于Claude 3.5(2024年6月发布),在所用模型的精确度跨过某个临界点之前,它们的作用并不大。在模型精确度提升之前就针对客户进行早期开发,可以让你在模型变得更好时抢占市场份额。
这就引出了“GPT阶梯”这个概念——当GPT(或Claude、Gemini、Grok、Llama)发展到某个特定水平时,特定的新市场就会开启。比方说,GPT-5(或Claude X、Gemini Y)应该能催生出一个全新的市场,而这个市场在没有该模型的情况下,技术上是无法实现的。
除了模型之外,其他可能阻碍生成式AI在市场中被采用的因素可能包括:
市场进入策略、购买行为和竞争。
初创公司的市场进入策略可能有误(用错误的方式向错误的客户销售)。
市场上可能被太多的既有企业锁定(或者既有企业有能力用较差的产品迅速反击初创公司,或利用其已有的用户界面或工作流进行交叉销售)。
市场上的买家可能行动和采用速度较慢,但随着时间的推移会逐渐跟上。
团队。也许合适的团队还没有出现,或者创始人对市场不熟悉,需要一些时间来学习和迭代以满足客户需求。
开发时间。开发和交付有用的产品需要时间。有时候,一个市场的活动还处于萌芽阶段,在6到12个月后,市场的格局才会大到让赢家浮现。
智能体无处不在
一个正在发生的重大转变是从纯粹的“AI聊天”工具转向智能体工作流。智能体是能代你执行操作的AI软件。这就像,你不是在谷歌上查找去西班牙旅行的信息,而是让谷歌生成一个AI智能体,由它去为你预订行程并代你执行操作。像Devin这样的编程工具与Decagon/Sierra这样的客户服务工具似乎是B2B领域最早采用智能体工作流的,而像ChatGPT、Gemini和Perplexity这样的信息工具也正在增加智能体功能,替用户进行深度研究。
随着推理模型和智能体的普及,支持智能体部署和工作流的新基础设施正在加速发展。许多初创公司正在开发智能体框架或基础设施,而咨询公司或大型部署公司也正在将智能体加入其工具库,以便在企业中部署。
我们开始看到从“卖座席”到“卖认知单元”或“等效人力”的转变。
AI整合并购
大约三年来,我一直在讨论并投资于由生成式AI驱动的行业整合并购(Roll-ups)。从生成式AI的早期开始,就很清楚这种基于Transformer架构的新型AI非常擅长处理人类的知识性工作——这正是白领服务经济的主要部分。在AI驱动的整合并购中,收购一家公司,而不仅仅是向其销售软件,可以带来远超单纯销售软件的更快采纳速度和经济效益。
AI的采用通常不是什么技术问题,而是组织、流程与人的问题。你能围绕AI工具重塑整个组织或其运作方式吗?这往往比AI工具本身要难得多,需要实际拥有该公司,才能在足够短的时间内重塑组织流程以产生影响(至少对初创公司而言是这样——既有企业通常需要很长时间)。
市场的收官之举
在另一篇文章中,我谈到了“市场的收官之举”——可以采取什么样的重大战略举措(并购?巨大的资本规模和投资?其他?)来一举赢得市场第一的位置。
随着市场整合,旨在赢得市场的战略举措变得清晰。这可能会导致各种形式的并购、合作、渠道锁定或其他策略,因为每个市场的少数玩家将进一步整合为一家或极少数几家。
我们应该很快就会看到大量的整合和并购,因为通过合并两家主要的初创领导者(通常谈判困难但值得一试)或既有企业/初创公司组合(渠道+技术=胜利),就有可能赢得一个市场。
激动人心的时刻即将来临。
总结——人工智能市场已然成形
人工智能市场如今的格局是几年来最清晰的。在许多早期的生成式AI市场(如代码和法律领域),特定细分市场的领导者已经明确,而新市场也已成熟,亟待颠覆。激动人心的时刻即将来临。
译者:boxi。