大模型开始偏爱引用YouTube了？

刀客Doc·2026年03月02日 20:41

品牌GEO主战场转向YouTube，引用率超Reddit。

一

品牌做GEO的主战场已经从新闻网站、问答图文社区，逐渐偏向YouTube。

从目前来看，GEO的引用来源做一个简单的划分有几类：

第一类是权威资料，比如百科、政府与科研站点，外加各类标准文档、白皮书、产品说明书。

第二类是经验社区，Reddit、Quora、StackOverflow 这类以问答、讨论串为单位的内容池。

第三类是视频类内容：YouTube 、TikTok这一类，一些拆箱、横测视频、教程等等。

第四类是新闻媒体：主流媒体、行业媒体、公司公告、财报解读、监管与政策报道。

第五类是电商内容：电商详情页、评测站、论坛测评、App Store/Google Play 评论、地图与点评。

近段时间，一些公司的数据指出，YouTube的引用得到明显提升。

根据 SEO 公司 BrightEdge 的数据，YouTube 现在已经是大语言模型（LLM）的核心内容源之一：在 29.5% 的 Google AI 概览中，都会引用到 YouTube 的内容；像 Gemini、ChatGPT 这样的工具使用 YouTube 的频率，已经高于 Reddit。

另一个做 GEO 的供应商提到，今年 1 月，在被各大 LLM 调用作为信息来源的频次上，YouTube 已经超过了 Reddit。

还有一家为某头部品牌提供 GEO 服务的机构发现，就这家客户所在的细分品类而言，Google 的 AI 概览中，将 YouTube 作为主要信息源的比例已经接近 60%。

各个机构的统计口径不一，比如对高度监管的行业（比如医疗、金融）以及很多 B2B 领域，权威站点和专业机构仍然占据主导，YouTube 的影响更多体现在怎么做、怎么买这一类决策环节，而不是所有问题的起点。

不过，有个事儿是基本确定的，YouTube在GEO理的重要性，目前来看是逐步上升的。

二

2025 年的一项基于 Semrush 关键词样本的研究统计了大模型回答里的来源引用，Reddit 在被分析样本里大约占到 40% 左右的引用份额，排在最前面。Wikipedia 大约 26% 左右，后面才是其他来源。

当然，这可能是由于2024 年 Reddit 与 Google 签了每年 6000 万美元的内容授权协议，用于 AI 训练与相关用途；随后 Reddit 也与 OpenAI 达成类似的数据合作。

在 GEO 这件事儿上，Reddit 确实很重要。它的特点是活人感。模型需要人话、需要真实使用情境、需要多视角争论时，Reddit 往往比任何媒体评测、品牌官网都更重要。

Reddit上的标题往往就是自然语言提问，下面是一串具体情境：预算、地区、替代方案、失败经历、情绪反应。对大模型来说，这比传统网页更像可直接拿来回答的样本，因为它天然贴着用户提问的语义走。

再叠加 Reddit 的投票排序机制（高赞靠前）和楼中楼对质，它等于把同一问题的多种答案做了一个粗糙但有效的群体筛选。

模型喜欢这种既有多视角，又有用户人群评审的数据，可以用来判断哪段话更像共识、哪段话可能是极端个案。

更关键的是这个社区有不少长尾内容。

在Reddit ，一些细碎、生活化、非主流的问题，也容易在某个小圈子里被认真讨论。很多品类的决策关键句，可能在某个帖子的三楼：用了一周哪里不爽、哪个型号在北方冬天会出问题、某个品牌售后怎么扯皮、同价位有没有更稳的替代。

对 GEO 来说，这些句子价值极高，总之Reddit有经验密度很高的语料。

不过，在GEO上，Reddit的不足也同样源于他的活人感，也就是噪音和偏见。

因为活人感太重，用户的情绪、立场、身份认同、品牌站队经常盖过事实讨论。

用户在上面看到的是经验、观点、情绪、梗、互喷。大模型要把它变成可引用的答案，就必须投入更多过滤成本，平台方一旦在质量和安全上收紧，Reddit 会首当其冲。

还有个问题是，Reddit在做GEO的时候，可控性差。对品牌而言，Reddit 的内容生产权在社区用户。品牌可以参与讨论，但你无法像运营自有内容那样系统铺设问题空间，更无法保证讨论方向不跑偏，甚至在很多内容里，商业身份天然不受欢迎，稍有营销味就会被群嘲、被删除、被封禁。

对 GEO 来说，这意味着 Reddit 能放大口碑，也能放大负面，而且往往不可预测。

三

还有个问题，为什么短视频、音频播客

大模型为什么更“爱吃”YouTube、而不是短视频和播客，本质不是“视频更流行”，而是YouTube把内容加工成了机器最省事的那种形态：能检索、能切片、能对齐问题、还能较低风险地引用。

你看一组很扎眼的数据就明白了：BrightEdge 监测了 2024 年 5 月到 2025 年 9 月之间，Google 的 AI Overviews / AI Mode、ChatGPT、Perplexity 这些产品在答案里引用视频内容的情况。

YouTube平均拿走约 20% 的引用份额，在 Google AI Overviews 里更是29.5% 的结果会引用 YouTube，并且“被引用次数”大约是其它视频平台的 200 倍；对照组里，Vimeo、TikTok 这种平台的引用占比只有 0.1% 左右，Twitch、Dailymotion 甚至基本不出现。

短视频平台内容的核心能力是情绪和节奏，镜头碎切、强依赖BGM与画面反转。对人类来说这是爽点；对模型来说，这是噪音。

因为模型真正能稳定吃到的，一般还是是文本层。大部分短视频的问题就在于，画面大于文本：文本的作用是配合画面。

很多短视频的内容是片段化的，缺少可索引的长文本。大模型从一个 20～60 秒的字幕里拼一个完整回答，它得跨很多条视频去拼接，比起直接拿一条 10～20 分钟的YouTube文字稿，成本高太多。

另外，播客的问题更微妙：播客里有大量高质量信息，甚至比 YouTube密度更高，不过它在机器侧的最大障碍是——文本化和结构化不统一。

YouTube的视频天然带一个可抓取的全文：自动转写。哪怕里头有口头语、听写错误，但对机器来说已经足够形成一份带时间戳的粗加工文稿，方便按主题切片、对齐问题，再从中挑出可以引用的句子。

播客则长期缺这套工业化包装：Apple Podcasts虽然从 iOS 17.4 开始提供自动转写，并且在 2025 年说已转写超过 1 亿期节目，但它也明确了语言与系统版本等条件，并且这份转写主要服务于 Apple 自己的App体验，生态外部并不一定可用、可索引。

Spotify 也有转写，但同样强调，转写并不是对所有创作者都开放，并且与不同托管平台的同步能力有限，还可能被自动转写覆盖。

这会导致一个现实：播客文本的稳定性有时候也不高。

大模型想引用一段播客观点时，常常拿不到稳定的可引用文本片段。当然，即便拿到了，定位、对齐、验证也更难。于是它更愿意引用那种——天然就是文本、天然有章节、天然可切片的来源。YouTube恰好满足了。

四

应该这么说，对大模型来说，YouTube赢在了对机器友好的工业化标准上。

所谓的GEO ，其实是让大模型在回答问题时更容易捞到品牌的内容，这个和之前基于搜索引擎的优化SEO在目标上是一致的。

如果把大模型拟人化，GEO就是一个只看好读文本的挑剔读者。

这个读者不喜欢噪音多、没有重点的内容，更喜欢别人提前帮它分好段、打好标签、写好小标题的材料，还偏爱那种一篇内容解决一个问题的结构。

机器先看的是结构。YouTube的内容长得都差不多：有标题、有简介、有标签，有时还有清晰的时间轴和章节。标题往往就是一个问题或主题，简介相当于摘要和补充说明，标签和分类是现成的语义标记，章节和时间点把一条长视频切成若干段。

加上自动生成的文字稿，一条 10～20 分钟的视频对大模型来说，就是一篇格式统一、已经分好段的长文。模型通过读标题判断大类，扫一遍文字稿理解在讲什么，再用章节时间点去对齐不同话题片段。

YouTube 的主流内容类型，比如评测、横评、教程、拆解、开箱，这些天然是一个问题和一段完整回答的形态，而且一条视频的文字稿往往能抽出一整串可以直接引用的句子。

对大模型和 GEO 来说，YouTube 在模型友好度上，已经站定了一个很好的生态位。

当然，这套偏好本身也有明显的副作用。

一方面，YouTube 的推荐和创作环境，会把内容一步步推向更AI友好的方向上，比如结构要清楚、逻辑要顺、关键词要齐、章节要分好。

这对品牌的现实影响是：为了让大模型更容易引用品牌，内容可能要变得更规矩、更像说明书；但越规矩，也越容易牺牲一部分锋芒和个性。

GEO 友好的内容，并不总是最有记忆点、最打动人的那种表达，这两件事本身就有些矛盾。

所以，今天的数据看起来是 YouTube 在走高，可能也只是一个阶段性的事实。

大模型的引用逻辑、平台之间的数据合作、监管和舆论风向，随时可能改变权重。毕竟AI行业的发展太快了。

谁都没有永久头牌的资格。品牌做GEO 真正需要的，是在多源信息栈里建立冗余和弹性。同一套关键信息，在权威资料、社区讨论、长视频、电商与评测页面里，都有可以被机器捞到的版本。

即便某一层权重被调低，整体的可被引用性也不会塌方。

这样做，比单纯过度偏向一个平台，要安全得多。

本文来自微信公众号“刀客Doc”，作者：刀客doc，36氪经授权发布。

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

大模型开始偏爱引用YouTube了？

一

二

三

四

最近内容

36氪AI测评

36氪寻求报道

下一篇