前百川联创下场、字节腾讯入局,“AI小宇宙”正在被集体押注?
4 月底我们曾经在《融了 3 个亿的张月光,就做出了个“AI 播客播放器”?》选题中观察过由前妙鸭相机产品负责人张月光开发的 AI 播客产品 ChatPods,当时我们认为,想用 AI 做成一个泛播客工具/平台比较困难。而最近,又有 AI 领域的知名从业者离职创业,选择的方向恰恰也是 AI 播客。
2025 年 3 月,前百川智能联合创始人焦可宣布离职创业,7 月份,他创立的“北京耳朵时间科技有限公司”低调上线一款 AI 播客产品“来福”。
与 ChatPods 用 AI 去加持人类制作的播客内容,发力内容推荐与总结不同,“来福”上的播客全部都是 AI 生成的,用户可以随时生成、点播自己想听的内容。注册时,用户可以选择用语音与 AI 交流 3 个问题,或者以文字形式提供基础信息(年龄、性别、通过标签的方式选择自己感兴趣的主题),注册完成后,系统在主页上为用户推荐符合兴趣的播客,并配有一个 ChatBot,在收听时,用户可以随时使用语音或文字与 AI 进行交互,完成提问、点播等操作,或与 AI 闲聊。
根据测试,目前来福上有不少预先制作好的播客,用户也可以基于自己喜好进行点播,比如我和 Chatbot 说“我想听背部运动的相关内容”,来福在库里没有找到,大概花了 3-5 分钟的时间生成了一个总长 15 分钟的播客。讲述了背部的肌肉、和做背部锻炼之前应注意的问题等等,然后由两个 AI 主播“小来和大福”通过对话演绎。但其他同事在测试时,遇到了生成播客失败的问题,来福转而推荐了其他内容。
截止 8 月 2 日,点点数据显示,总下载量 2000 左右,可能是因为产品处于早期阶段,三方平台没有收录到活跃用户和收入数据。如果将张月光的 Chatpods、和焦可的来福对比来看,两者之间完成了“从 AI 加持播客,到 AI 生成播客”的转变,AI 与播客的结合,更加“原生“了。
而无独有偶,在海外 NoteBookLM 火过后,近两个月,有多款 AI 生成播客产品/功能在国内市场上线,除了来福这种,用户点播主题,AI 直接生成之外,其余更多是遵循 NotebookLM 的使用路径,用户输入要求、提供参考文件和链接,然后由 AI 直接生成一段音频播客。
人类给内容,AI 管“制作”,能达到及格水平?
ListenHub 首页,豆包和 Coze 页面也大同小异
首先从用法上,三款产品大同小异,输入文字、上传资料,等待 5 分钟左右,直接得到可以发布的完整音频(目前豆包无法输入文字,仅能上传资料)。虽然用户也可以不上传其他资料,将内容搜集工作完全交给 AI,但是经过测试,这种方式输出内容的质量远不如上传材料来的好。此外,目前豆包和 Coze 均只能使用官方制作好的语音,而 ListenHub 则刚刚在 7 月 29 日面向订阅用户推出了语音克隆功能。
AI 生成播客工作流程
总体看,AI 播客的工作流程比较像“人机共创”。人类仍是创作主体,把握主题、核心内容与观点;AI 则充当“制作人”,将人类给出的文字内容进行口语化、叙事化的包装、润色,再通过自主搜索,补充资料、完善观点,输出一个 5-15 分钟对话形式的短播客。
注:红框中是AI可以着重提效的部分,嘉宾访谈类型的播客由于无法提前拿到观点,目前AI并不能有所加持。| 来源:Reddit
而对应到播客原有的创作流程,AI 播客产品能够明显提效的是非访谈节目的“录制”和“后期剪辑、制作”的环节(红框中)。根据 JustPod 的数据,中文播客创作者每期节目的净工作时长为 12.9 小时,录制、剪辑的工作量,大概要占到一半以上,不仅工作量大,还很繁琐、无趣。从逻辑上看,AI 播客能去掉“录制、剪辑”环节的门槛,让擅长内容输出,但不擅长播音和剪辑的创作者也能做播客,对已有的播客创作者也是一种加持和提效的方案。
理论上看起来成立,但 AI 播客能做到人类的几成功力呢?带着这个问题,笔者将之前写的 ChatPods 选题“喂”给了 ListenHub、豆包和 Coze,分别生成一段播客,并从内容和听感两个层面,总结出了 5 个测试维度,结果如下:
从结果来看,三款产品生成的播客效果令人惊喜,都能比较好地模仿播客风格、对话相当自然,也都能忠实于原文的内容与观点,基本已经能达到人类播客的及格水平了。而三者对比下来,ListenHub 最好;Coze 听感上与 ListenHub 差不多,但“扣分点”是一些事实错误;而豆包有抢话的情况,内容上也没有增量信息,综合来看略差一些。
(关心测试过程和细节的读者可以向下阅读,我们也将三段播客贴了出来,各位读者也可以听一听,自行评判,如果不关心测试细节,可以跳过。)
豆包生成的内容基本是复述文章的内容,没有自行搜索的增量信息,也没有改动文字结构,只不过把文章改成了对话风格,并进行了内容精简。听感上,豆包在播客的前 30 秒出现了抢话情况,开场白还没说完,另一个人就“抢话”了。
文章中并没有提到Chatpods有实时向主播提问的功能,仅能向AI提问,这里Coze出现了事实错误|图片来源:Coze
Coze 在生成播客时会在网上搜索大量的信息,在生成的播客中,也能听到网上其他文章中的信息和观点,但是由 AI 自行搜索的信息中,出现了明显的事实错误,听感上则无明显问题。
ListenHub深度探索模式输出播客的脚本,图中高亮的内容是AI自行添加的分析|图片来源:ListenHub
ListenHub 的速听精华模式与豆包相似,基本是以“对话方式呈现事实”。深度探索模式更像 Coze,时长达到 8-15 分钟,AI 会更深度的理解文章,并参考增量信息,给出分析,如上图,测试文章中有说到“投资人愿意拿钱,主要是看中张月光的个人能力”,而在播客中 AI 就将归为“CEO 信仰”,并分析了深层次原因。
从测试结果看,三款产品的输出都能够及格,但作为生产力工具,这些产品几乎是 NotebookLM 的复制,不仅小于 15 分钟的时长不太符合主流用户需求,也没有二次剪辑,以及供分发环节用的短切片、生成适用于不同平台的播客封面生成等适应播客场景的提效工具。
而更关键的是,AI 播客质量合格,与能被听众消费之间,仍存在距离。
不一样的路径,一样的结果?
上述 AI 播客产品直接生成内容的思路虽然与 ChatPods 不同,但分析下来,AI 播客产品生成的内容会比较适用于以事实传达为核心的“新闻类播客”场景,但在更大众化的“娱乐类”、“知识类”播客中,却很难替代现有的播客内容,被用户所接受。
娱乐、学习、打发时间是用户听播客的主要目标,学习排在第二
之前的选题有分析过,秉持放松、陪伴、娱乐等非功利目的收听播客的用户占比与“获取信息”几乎等同、甚至更高。而娱乐类播客内容本身,非常依赖主播的真实情绪、即兴发挥和主播之间的化学反应,这些是当前 AI 难以做到的。
小宇宙平台科技类播客订阅数 Top11,发布时间 6 月 10 日|图片来源:小红书博主赵智沉(侵删)
而知识型的播客看上去和 AI“专业对口”,但目前大多数知识型播客以“访谈类”为主,AI 也很难进行加持。从小宇宙平台上订阅量 Top11 的科技类播客来看,除了排名第 5 的《大小马聊科技》是以 3 位固定主播对谈的形式,其他 10 档播客都是以“主持人+不同嘉宾”的访谈形式为主。
对于知识性的播客来说,用户需求的核心价值是一手信息与独特的观点,尤其是相对专业化的科技、财经等领域,由业内人士输出观点与见解,能够显著增强说服力,而相比业内人士,AI 生成的内容显然不够有竞争力。实际操作层面,主播和嘉宾在对话前,一般只会商量大概框架,真正进行对话时会有大量框架外的“追问”与“闲聊”,由于其不可预知的特性,目前 AI 生成播客的模式,很难加持访谈类播客。
2020 年新闻类和每日新闻播客占整体的比例(左),欧美部分市场中新闻类和每日新闻播客,在苹果播客 Top 250 榜单中的占比(右)
虽然,AI 播客可能无法适应多数热门播客形式,但是,在“重信息传达,轻解读评论”的新闻类播客中,AI 还能有用武之地。新闻类播客虽不是主流,但也有一定受众群体,根据 2020 年的一项统计,新闻类播客的数量仅占所有播客的 7%,但是在部分市场是有不少受众的,比如,在法国和美国 Top250 播客节目(苹果播客)中,分别有 45% 和 30% 的新闻类播客上榜。
总体来看,除了新闻类,无论是主打“博人一笑”的娱乐类,还是以“对话权威”为主的知识类播客,AI 都很难进行加持,并达到能被听众所喜爱、所消费的标准。与 NoteBookLM 相同,这些 AI 播客产品可能还更偏向于“帮用户解读晦涩难懂的文章,做自我学习提效”的工具化场景。
写在最后
综合以上分析,AI 生成播客本身的质量已经能到及格以上的水平,但仍没达到能被用户所接受的水平。而从整个市场来看,相比长/短视频,音频播客仍是一个偏小众的媒体形式,且由于其发布频率低、内容长、粘性高的特性,形成了强大的马太效应,头部主播吸走了大部分流量与收入。
而从喜马拉雅和 Ipsos 的调查看,要成为头部主播,内容的知识性、趣味性、权威性、主播个人特点缺一不可,AI 生成的播客内容虽然能够达到及格水平,但想要与现今市面上的头部内容竞争,仍然非常困难。
本文来自微信公众号 “白鲸出海”(ID:baijingapp),作者:白鲸小编,36氪经授权发布。