马斯克带货Labubu？两个同济校友搞出的这款AI神器，要「卷死」广告圈

机器之心·2025年07月02日 15:51

AI带货时代来了。

让马斯克秒变带货主播。

还记得那个让霉霉说地道中文、郭德纲讲英语相声的 HeyGen 吗？

最近它又上新了「产品植入」功能，只需一张人物头像和一张产品图片，就能让任何人给任何产品「带货」。

比如，让盖尔・加朵、霉霉和伊万卡分别手持 Labubu、百事可乐、Gucci 经典包包说着一段广告词，无论是表情、口型还是手势，都相当自然逼真流畅。

或者让蒙娜丽莎、带珍珠项链的女孩在线推销商品：

还有网友完全用 AI 生成人物和产品图片搞了段带货视频，这要是去掉 HeyGen 水印，再放到社交媒体上，又能忽悠了不少人。

不少网友看了这些 case，纷纷表示这将重新定义广告行业。

HeyGen 是一款 AI 视频生成平台，但与可灵、即梦、Runway 等不同，它专注于数字人视频的制作。用户只需输入文本脚本，就能一键生成高质量的虚拟人像视频，并支持多种语言和方言。

此外，HeyGen 还探索出不少五花八门的功能。比如 Video Podcast，只需上传网站链接或 pdf 文档即可生成双人 AI 视频播客。

再比如 Interactive Avatar，通过该功能，我们可以和各种虚拟形象进行实时互动，有点类似于给虚拟人打电话。

还有两项 Beta 测试版功能 ——Instant Highlights 和 URL to Video。前者是把长视频一键剪成多个精彩片段，后者则是粘贴产品列表链接即可立即生成促销视频内容。

一手体验

今天，我们就详细介绍下 HeyGen 的「产品植入」功能的玩法。

打开 HeyGen 官网，选择「Product Placemengt」功能，分别上传一张 Labubu 的产品图像和一张马斯克的人物头像，让 AI 将其自动组合起来。

链接直达：https://app.heygen.com/home

它可以一次性输出 4 张图片，说实话生成效果有点搞笑，AI 笔下的马斯克虽然磨皮拉满，但好像更显老了。如果细看，图二中的马斯克还缺了根手指。

接着就是写脚本或者上传音频，需要注意的是，上传音频时长不超过 15 秒。我们可以让 AI 帮忙生成脚本，或者直接输入文字，选择系统提供的声音，生成一段带货音频。当然我们也可以通过克隆音色生成带货音频，再进行上传、视频生成。

来看看最终效果， AI 马斯克煞有介事地推荐着 Labubu：

「Hello, I’m Elon — yes, it’s really me.I’ve sent people to Mars, but today, I’m sending this to your home.It’s called Labubu. Don’t be fooled by its quirky-cute looks — it’s the hottest little monster on the planet.」

如今，市面上不少 AI 视频生成应用都实现了完美的对口型功能，比如谷歌 Veo3、快手可灵、字节即梦等，只要上传一张人物手持产品的图片，再输入口播文本或音频，也能达到同样的效果。

不过它们都还无法自定义带货主播和产品，相较于这一点，HeyGen 还是走出了一条差异化之路。当然，这一领域也不乏竞争对手，比如 Topview。其玩法和 HeyGen 相差无几，都是上传一张人物头像和一张产品图，然后合成一张人物带货图片，继而生成相应视频。

链接：https://www.topview.ai/gen/product-avatar

Topview 分为两种模式：Manual Mode（手动模式）和 Auto Mode（自动模式）。手动模式需要我们调整产品图片尺寸，使其和人物头像匹配，每次可生成两张，但效果不稳定，比如图 2 就出现了人与物品的分离。

自动模式则是 AI 自动调整拼合，官方还给出了提示词：The model in Image 1 is holding the item from Image 2. Maintain the consistency of the model's appearance, composition, and positioning from Image 1, and adjust the gesture to fit the size and appearance of the item. The item must remain consistent with the one in Image 2.（图 1 中的模特正拿着图 2 中的物品，要保持图 1 中模特的外观、构图以及位置不变，同时调整其手势，使其与图 2 中物品的大小和外观相匹配，并且图 2 中的物品需保持原样。）

生成效果更拉胯，不仅奥特曼美颜过度，手里拿的苹果手机还一大一小，尺寸对不上。

从中挑选一张顺眼的图片，点击「Create Avatar」，AI 自动设计数字人动作提示，再选择配音或者克隆音色即可。

从生成效果来看，相比于 HeyGen，Topview 还欠点火候。无论是模特表情的自然度、对口型的准确度，HeyGen 的表现更加亮眼。

从价格上来看，它俩都是付费产品。HeyGen 针对个人创作者推出月付和年付计划，月付是每月 29 美元（约合人民币 207.76 元），年付则是每月 24 美元（约合人民币 171.94 元），可以生成无限量短视频，无水印，1080p 输出，每月 5 分钟 Avatar IV 视频等。

Topview 价格稍微便宜一些，月付 138 元人民币，年付是 74.8 元人民币，每月 50 个积分，可免费生成 5 个声音克隆项目，每个图片说话的视频最长 3 分钟等。

扒一扒背后的公司

创业这事儿，有时候还真是东方不亮西方亮，就比如 HeyGen 背后的这家公司，别看其官网从头到尾一派英文，但往前追溯几年它还是一家深圳公司。

HeyGen 两位创始人徐卓和梁望也都来自中国，且同为校友。他们本科均毕业于同济大学，研究生则毕业于卡内基梅隆大学，只不过前者专攻计算机专业，后者则是人机交互专业。

HeyGen 联合创始人兼 CEO 徐卓（Joshua Xu）硕士毕业后在 Snapchat 工作了 6 年，在商业化、推荐算法、机器学习平台和人工智能相机等多个公司产品中担任核心角色。

另一位联创兼 CPO 为梁望（Wayne Liang），曾任字节跳动产品设计负责人。

后来，徐卓回国创业成立了诗云科技，并推出产品诗云马良，这是一款 AI 作画、AI 换脸应用，但在国内不温不火，已于前年 1 月 31 日停止服务。

国内创业没泛起什么水花，徐卓再次把眼光投向海外。2022 年，徐卓和梁望在洛杉矶创立了 HeyGen。HeyGen 最初名为「Movio」，是一个利用生成式人工智能创建视频的平台，推出 7 个月就实现了 100 万美元的 ARR（年度经常性收入），并保持连续 9 个月 50% 的月环比增长率。

业绩不错，使得 HeyGen 的融资也很顺利，2024 年 6 月，HeyGen 在一轮融资中筹集了 6000 万美元，公司估值达到 5 亿美元。据有关媒体报道，HeyGen 的最新 ARR 已经达到 8000 万美金，今年有望突破 1 亿美金，团队 100 人左右。由于该公司一直盈利，上一轮融的钱基本上都在银行里吃利息。

参考链接：

https://x.com/minchoi/status/1935842891085025690

https://x.com/EHuanglu/status/1935699485537231218

https://x.com/techhalla/status/1935727516708131123

本文来自微信公众号 “机器之心”（ID：almosthuman2014），编辑：杨文，36氪经授权发布。

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。