大模型开始偏爱引用YouTube了?
一
品牌做GEO的主战场已经从新闻网站、问答图文社区,逐渐偏向YouTube。
从目前来看,GEO的引用来源做一个简单的划分有几类:
第一类是权威资料,比如百科、政府与科研站点,外加各类标准文档、白皮书、产品说明书。
第二类是经验社区,Reddit、Quora、StackOverflow 这类以问答、讨论串为单位的内容池。
第三类是视频类内容:YouTube 、TikTok这一类,一些拆箱、横测视频、教程等等。
第四类是新闻媒体:主流媒体、行业媒体、公司公告、财报解读、监管与政策报道。
第五类是电商内容:电商详情页、评测站、论坛测评、App Store/Google Play 评论、地图与点评。
近段时间,一些公司的数据指出,YouTube的引用得到明显提升。
根据 SEO 公司 BrightEdge 的数据,YouTube 现在已经是大语言模型(LLM)的核心内容源之一:在 29.5% 的 Google AI 概览中,都会引用到 YouTube 的内容;像 Gemini、ChatGPT 这样的工具使用 YouTube 的频率,已经高于 Reddit。
另一个做 GEO 的供应商提到,今年 1 月,在被各大 LLM 调用作为信息来源的频次上,YouTube 已经超过了 Reddit。
还有一家为某头部品牌提供 GEO 服务的机构发现,就这家客户所在的细分品类而言,Google 的 AI 概览中,将 YouTube 作为主要信息源的比例已经接近 60%。
各个机构的统计口径不一,比如对高度监管的行业(比如医疗、金融)以及很多 B2B 领域,权威站点和专业机构仍然占据主导,YouTube 的影响更多体现在怎么做、怎么买这一类决策环节,而不是所有问题的起点。
不过,有个事儿是基本确定的,YouTube在GEO理的重要性,目前来看是逐步上升的。
二
2025 年的一项基于 Semrush 关键词样本的研究统计了大模型回答里的来源引用,Reddit 在被分析样本里大约占到 40% 左右的引用份额,排在最前面。Wikipedia 大约 26% 左右,后面才是其他来源。
当然,这可能是由于2024 年 Reddit 与 Google 签了每年 6000 万美元的内容授权协议,用于 AI 训练与相关用途;随后 Reddit 也与 OpenAI 达成类似的数据合作。
在 GEO 这件事儿上,Reddit 确实很重要。它的特点是活人感。模型需要人话、需要真实使用情境、需要多视角争论时,Reddit 往往比任何媒体评测、品牌官网都更重要。
Reddit上的标题往往就是自然语言提问,下面是一串具体情境:预算、地区、替代方案、失败经历、情绪反应。对大模型来说,这比传统网页更像可直接拿来回答的样本,因为它天然贴着用户提问的语义走。
再叠加 Reddit 的投票排序机制(高赞靠前)和楼中楼对质,它等于把同一问题的多种答案做了一个粗糙但有效的群体筛选。
模型喜欢这种既有多视角,又有用户人群评审的数据,可以用来判断哪段话更像共识、哪段话可能是极端个案。
更关键的是这个社区有不少长尾内容。
在Reddit ,一些细碎、生活化、非主流的问题,也容易在某个小圈子里被认真讨论。很多品类的决策关键句,可能在某个帖子的三楼:用了一周哪里不爽、哪个型号在北方冬天会出问题、某个品牌售后怎么扯皮、同价位有没有更稳的替代。
对 GEO 来说,这些句子价值极高,总之Reddit有经验密度很高的语料。
不过,在GEO上,Reddit的不足也同样源于他的活人感,也就是噪音和偏见。
因为活人感太重,用户的情绪、立场、身份认同、品牌站队经常盖过事实讨论。
用户在上面看到的是经验、观点、情绪、梗、互喷。大模型要把它变成可引用的答案,就必须投入更多过滤成本,平台方一旦在质量和安全上收紧,Reddit 会首当其冲。
还有个问题是,Reddit在做GEO的时候,可控性差。对品牌而言,Reddit 的内容生产权在社区用户。品牌可以参与讨论,但你无法像运营自有内容那样系统铺设问题空间,更无法保证讨论方向不跑偏,甚至在很多内容里,商业身份天然不受欢迎,稍有营销味就会被群嘲、被删除、被封禁。
对 GEO 来说,这意味着 Reddit 能放大口碑,也能放大负面,而且往往不可预测。
三
还有个问题,为什么短视频、音频播客
大模型为什么更“爱吃”YouTube、而不是短视频和播客,本质不是“视频更流行”,而是YouTube把内容加工成了机器最省事的那种形态:能检索、能切片、能对齐问题、还能较低风险地引用。
你看一组很扎眼的数据就明白了:BrightEdge 监测了 2024 年 5 月到 2025 年 9 月之间,Google 的 AI Overviews / AI Mode、ChatGPT、Perplexity 这些产品在答案里引用视频内容的情况。
YouTube平均拿走约 20% 的引用份额,在 Google AI Overviews 里更是29.5% 的结果会引用 YouTube,并且“被引用次数”大约是其它视频平台的 200 倍;对照组里,Vimeo、TikTok 这种平台的引用占比只有 0.1% 左右,Twitch、Dailymotion 甚至基本不出现。
短视频平台内容的核心能力是情绪和节奏,镜头碎切、强依赖BGM与画面反转。对人类来说这是爽点;对模型来说,这是噪音。
因为模型真正能稳定吃到的,一般还是是文本层。大部分短视频的问题就在于,画面大于文本:文本的作用是配合画面。
很多短视频的内容是片段化的,缺少可索引的长文本。大模型从一个 20~60 秒的字幕里拼一个完整回答,它得跨很多条视频去拼接,比起直接拿一条 10~20 分钟的YouTube文字稿,成本高太多。
另外,播客的问题更微妙:播客里有大量高质量信息,甚至比 YouTube密度更高,不过它在机器侧的最大障碍是——文本化和结构化不统一。
YouTube的视频天然带一个可抓取的全文:自动转写。哪怕里头有口头语、听写错误,但对机器来说已经足够形成一份带时间戳的粗加工文稿,方便按主题切片、对齐问题,再从中挑出可以引用的句子。
播客则长期缺这套工业化包装:Apple Podcasts虽然从 iOS 17.4 开始提供自动转写,并且在 2025 年说已转写超过 1 亿期节目,但它也明确了语言与系统版本等条件,并且这份转写主要服务于 Apple 自己的App体验,生态外部并不一定可用、可索引。
Spotify 也有转写,但同样强调,转写并不是对所有创作者都开放,并且与不同托管平台的同步能力有限,还可能被自动转写覆盖。
这会导致一个现实:播客文本的稳定性有时候也不高。
大模型想引用一段播客观点时,常常拿不到稳定的可引用文本片段。当然,即便拿到了,定位、对齐、验证也更难。于是它更愿意引用那种——天然就是文本、天然有章节、天然可切片的来源。YouTube恰好满足了。
四
应该这么说,对大模型来说,YouTube赢在了对机器友好的工业化标准上。
所谓的GEO ,其实是让大模型在回答问题时更容易捞到品牌的内容,这个和之前基于搜索引擎的优化SEO在目标上是一致的。
如果把大模型拟人化,GEO就是一个只看好读文本的挑剔读者。
这个读者不喜欢噪音多、没有重点的内容,更喜欢别人提前帮它分好段、打好标签、写好小标题的材料,还偏爱那种一篇内容解决一个问题的结构。
机器先看的是结构。YouTube的内容长得都差不多:有标题、有简介、有标签,有时还有清晰的时间轴和章节。标题往往就是一个问题或主题,简介相当于摘要和补充说明,标签和分类是现成的语义标记,章节和时间点把一条长视频切成若干段。
加上自动生成的文字稿,一条 10~20 分钟的视频对大模型来说,就是一篇格式统一、已经分好段的长文。模型通过读标题判断大类,扫一遍文字稿理解在讲什么,再用章节时间点去对齐不同话题片段。
YouTube 的主流内容类型,比如评测、横评、教程、拆解、开箱,这些天然是一个问题和一段完整回答的形态,而且一条视频的文字稿往往能抽出一整串可以直接引用的句子。
对大模型和 GEO 来说,YouTube 在模型友好度上,已经站定了一个很好的生态位。
当然,这套偏好本身也有明显的副作用。
一方面,YouTube 的推荐和创作环境,会把内容一步步推向更AI友好的方向上,比如结构要清楚、逻辑要顺、关键词要齐、章节要分好。
这对品牌的现实影响是:为了让大模型更容易引用品牌,内容可能要变得更规矩、更像说明书;但越规矩,也越容易牺牲一部分锋芒和个性。
GEO 友好的内容,并不总是最有记忆点、最打动人的那种表达,这两件事本身就有些矛盾。
所以,今天的数据看起来是 YouTube 在走高,可能也只是一个阶段性的事实。
大模型的引用逻辑、平台之间的数据合作、监管和舆论风向,随时可能改变权重。毕竟AI行业的发展太快了。
谁都没有永久头牌的资格。品牌做GEO 真正需要的,是在多源信息栈里建立冗余和弹性。同一套关键信息,在权威资料、社区讨论、长视频、电商与评测页面里,都有可以被机器捞到的版本。
即便某一层权重被调低,整体的可被引用性也不会塌方。
这样做,比单纯过度偏向一个平台,要安全得多。
本文来自微信公众号“刀客Doc”,作者:刀客doc,36氪经授权发布。















