3个清华兄弟，又融资6亿

铅笔道·2026年03月04日 09:24

AI视频生成赛道又杀出一匹黑马。

最近，成立不到3年的生数科技，完成超6亿元A+轮融资，成为国内视频生成领域最大单笔融资。

我们常吐槽视频创作太费劲：学习门槛高、耗时久、成本高，其实是缺了高效的智能创作工具。生数科技给视频创作者配上AI大脑和手，让想法通过AI自动地生成视频。

生数科技目前已服务字节跳动、索尼、安踏等一众客户。

自去年下半年以来，AI视频生成赛道正迎来一波融资潮，它会成为第一个跑通商业模式的AI细分赛道吗？

01 视频大模型痛点

生数科技于2023年3月创立于北京，三位联合创始人朱军、唐家渝、鲍凡均有清华大学背景。

朱军，1983年出生，安徽阜南人。他毕业于清华大学计算机系。后来，他担任清华大学人工智能研究院副院长。他长期从事图片生成方向的研究，重点研究的是新一代核心技术——扩散模型。

唐家渝本科与硕士均就读于清华大学计算机系，师从自然语言处理实验室。硕士毕业后，他加入腾讯优图实验室任高级产品经理，后担任AI基础设施服务商——瑞莱智慧的副总裁。

鲍凡是“95后”，2014 年考入清华大学生命科学学院读本科，两年后转入计算机科学与技术系，2019 年获得计算机系的学士学位，之后在本校获得博士学位。他是朱军的学生。

2022年，行业的焦点还在图文大模型。朱军判断，下一个突破口会是视频生成。他决定做一款面向实际应用的视频大模型。

从上面履历可以看出，这个清华师生为核心的团队，在视频生成算法和底层研发上有长期积累。

早在2022年9月，这个团队就提出了U-ViT技术架构。它可以用于生成高质量图像、视频。还能生成3D内容，甚至用于构建世界模型。

2023年，生数科技成立，由瑞莱智慧参与孵化，并很快获得来自蚂蚁集团和百度风投的近亿元天使轮融资。

2024年，生数科技基于U-ViT技术，推出了视频生成大模型 Vidu。这是一款专门做视频生成的模型，它能模拟真实的物理世界，生成的画面细节丰富。

更重要的是，场景运动符合物理规律，看起来更真实。

早期的生数科技，在产品化和销售体系上进展缓慢，实验室能力很强，但没有转化为稳定收入；模型能跑出来，却没有形成持续回款。

问题不在模型本身，关键在于：如何把模型做成产品。如何让客户愿意长期付费。

转折出现在2025年。

骆怡航后来加入公司，出任CEO。他此前在字节跳动火山引擎工作，负责AI解决方案。他长期做To B业务，熟悉企业采购流程，也清楚客户的实际应用场景。

上任后，他先理顺产品结构，围绕Vidu搭建起四层体系：MaaS、SaaS、Agent 和 APP。不同层级对应不同客户。从个人创作者，到企业平台，都有明确方案。

技术和商业，两条线同时推进。

技术侧，朱军继续带队优化模型性能和效率。公开数据显示，Vidu在全球视频大模型评测中排名第二，国内排名第一。生成速度也明显提升，相比 Sora2 快约10倍。

商业侧，骆怡航加快客户合作。影视和内容领域，覆盖字节、索尼、央视动漫。品牌营销领域，合作欧莱雅、安踏。同时与联想、AMD合作，探索在 AI PC 端的部署方式。

2025年，生数科技用户数和收入同比增长超过10倍，服务企业超过3000家，业务覆盖200多个国家和地区。生数科技的年度经常性收入，也已经突破2000万美元。

与早期相比，生数科技的重心已经发生变化。公司围绕视频生成能力搭建产品体系，不再只是做模型研究。

02 行业转折点

不到三年，生数科技已经获得6次融资和1次股权转让，华为、蚂蚁、百度、智谱等企业均站在生数科技背后。

除了生数科技，整个AI视频生成赛道受到产业资本重注。去年以来，国内融资速度最快、估值上升最快的 AI 创业公司，多数集中在视频赛道。

从技术层面看，行业转折点出现在2024年下半年：多模态模型的架构，开始转向以 DiT / Transformer 为主。

架构一变，效果也随之改变，视频生成中的“长序列一致性”明显提升。

简单说，画面不再前后打架，人物不会突然变脸，动作也更连贯。这意味着一个关键问题被解决了——稳定性。

AI 视频生成，第一次真正接近“可商用”。

也就是说，它不再只是演示效果，而是可以进入真实生产流程，可以被当作工具使用，可以计入成本，计算效率。

也开始有创业公司，凭它真正赚到钱。

AI视频生成产品，可以让视频制作周期可缩短约 80%，成本可降低约 90%。同时，它能覆盖自媒体、广告、影视、电商等多种场景，应对大量内容生产需求。

《经济观察报》数据显示，2025年12月，多家头部AI视频公司披露业绩。它们的收入规模，和一年前完全不同。

去年，收入还少到几乎可以忽略。今年，已经跨入“亿元俱乐部”，少的约1.4亿元，多的接近10亿元。

增长幅度非常明显。

在生数科技本轮融资前，AI视频生成赛道单轮融金额纪录属于爱诗科技。去年9月，爱诗科技宣布完成超6000万美元B轮融资。仅一个月后，又宣布完成1亿元人民币B+轮融资。

爱诗科技被押注，很重要的原因也是商业化跑出了雏形，据说其全球C端用户规模已突破 1 亿，80%收入来自C端；

在B端则为广告、短剧和游戏等领域提供API 和定制化视频生成服务，2025年度经常性收入（ARR）超过4000万美元。

去年12月，AI视频生成产品 Pollo AI 完成1400万美元首轮融资，由高成资本领投，真格基金跟投。

Pollo AI 接入了市面上大多数主流视频生成模型，包括OpenAI的Sora、Midjourney、Vidu、Hailuo、Kling 等。

它把不同模型整合到一个平台上，同时，清楚标注每个模型的优势。

比如，有的擅长写实风格，有的更适合动漫效果，有的在人物稳定性上更强。

用户可以根据需求，直接选择合适的模型，不用自己反复测试，效率更高，也更有针对性。

值得注意的是，Pollo AI商业化进展很快：注册用户数超过2000 万，月活跃用户超过600 万，日活跃用户超过20万，年化收入超过 2000 万美元。

行业还有几家公司值得关注。

一家是由商汤研究总监刘宇创办的AI视频生成企业——Vivix AI。据Z Fianace报道，它2 月完成种子轮，由红杉中国和 IDG 资本联合领投；去年11月，A 轮估值突破13.2亿美元。

另一家公司是LiblibAI，去年10月完成1.3亿美元B轮融资。虽然不是纯视频生成，是图像为主。其商业化也进展较为顺利，半年ARR超150万美元。

03 趋势：头部效应加剧

以视频生成为代表的多模态产品融资潮背后，到底在发生什么？

MovieFlow创始人梁巍告诉铅笔道，这轮融资潮的头部效应明显。能否获得融资的关键，在于应用场景是否成熟，能否支持商业落地。

相比前两年，行业最大变化在于，音画一体模型让工具从“片段生成”向“完整内容创作”转变。

此时，企业核心价值从单纯的技术，转向如何将模型封装成易用产品，让用户真正能稳定使用。提供标准化、场景化交付服务是核心商机。

目前，MovieFlow一方面提供C端轻量产品，另一方面是MovieFlow Studio 专业版服务影视制作，既构建YouTube那样的内容社区，又有像Netflix那样高质量的内容。

梁巍预测，2026年上半年行业格局基本确定，新进入者空间明显收缩，资源将集中在技术+赚钱能力都强的头部企业。

巨人网络战略投资部负责人邓昆——爱诗科技和LiblibAI投资人——曾向《经济观察报》表示：2026年，AI视频在电商、教育、短剧、漫剧等领域能看到更好的商业收益。下一步的决胜点，在于能否开发出电影级画质的AI视频产品。

本文不构成任何投资建议。

本文来自微信公众号“铅笔道”（ID：pencilnews），作者：松格，编辑：黄小贵，36氪经授权发布。

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

3个清华兄弟，又融资6亿

01

视频大模型痛点

02

行业转折点

03

趋势：头部效应加剧

最近内容

提及的机构

下一篇