3个清华兄弟,又融资6亿
AI视频生成赛道又杀出一匹黑马。
最近,成立不到3年的生数科技,完成超6亿元A+轮融资,成为国内视频生成领域最大单笔融资。
我们常吐槽视频创作太费劲:学习门槛高、耗时久、成本高,其实是缺了高效的智能创作工具。生数科技给视频创作者配上AI大脑和手,让想法通过AI自动地生成视频。
生数科技目前已服务字节跳动、索尼、安踏等一众客户。
自去年下半年以来,AI视频生成赛道正迎来一波融资潮,它会成为第一个跑通商业模式的AI细分赛道吗?
01
视频大模型痛点
生数科技于2023年3月创立于北京,三位联合创始人朱军、唐家渝、鲍凡均有清华大学背景。
朱军,1983年出生,安徽阜南人。他毕业于清华大学计算机系。后来,他担任清华大学人工智能研究院副院长。他长期从事图片生成方向的研究,重点研究的是新一代核心技术——扩散模型。
唐家渝本科与硕士均就读于清华大学计算机系,师从自然语言处理实验室。硕士毕业后,他加入腾讯优图实验室任高级产品经理,后担任AI基础设施服务商——瑞莱智慧的副总裁。
鲍凡是“95后”,2014 年考入清华大学生命科学学院读本科,两年后转入计算机科学与技术系,2019 年获得计算机系的学士学位,之后在本校获得博士学位。他是朱军的学生。
2022年,行业的焦点还在图文大模型。朱军判断,下一个突破口会是视频生成。他决定做一款面向实际应用的视频大模型。
从上面履历可以看出,这个清华师生为核心的团队,在视频生成算法和底层研发上有长期积累。
早在2022年9月,这个团队就提出了U-ViT技术架构。它可以用于生成高质量图像、视频。还能生成3D内容,甚至用于构建世界模型。
2023年,生数科技成立,由瑞莱智慧参与孵化,并很快获得来自蚂蚁集团和百度风投的近亿元天使轮融资。
2024年,生数科技基于U-ViT技术,推出了视频生成大模型 Vidu。这是一款专门做视频生成的模型,它能模拟真实的物理世界,生成的画面细节丰富。
更重要的是,场景运动符合物理规律,看起来更真实。
早期的生数科技,在产品化和销售体系上进展缓慢,实验室能力很强,但没有转化为稳定收入;模型能跑出来,却没有形成持续回款。
问题不在模型本身,关键在于:如何把模型做成产品。如何让客户愿意长期付费。
转折出现在2025年。
骆怡航后来加入公司,出任CEO。他此前在字节跳动火山引擎工作,负责AI解决方案。他长期做To B业务,熟悉企业采购流程,也清楚客户的实际应用场景。
上任后,他先理顺产品结构,围绕Vidu搭建起四层体系:MaaS、SaaS、Agent 和 APP。不同层级对应不同客户。从个人创作者,到企业平台,都有明确方案。
技术和商业,两条线同时推进。
技术侧,朱军继续带队优化模型性能和效率。公开数据显示,Vidu在全球视频大模型评测中排名第二,国内排名第一。生成速度也明显提升,相比 Sora2 快约10倍。
商业侧,骆怡航加快客户合作。影视和内容领域,覆盖字节、索尼、央视动漫。品牌营销领域,合作欧莱雅、安踏。同时与联想、AMD合作,探索在 AI PC 端的部署方式。
2025年,生数科技用户数和收入同比增长超过10倍,服务企业超过3000家,业务覆盖200多个国家和地区。生数科技的年度经常性收入,也已经突破2000万美元。
与早期相比,生数科技的重心已经发生变化。公司围绕视频生成能力搭建产品体系,不再只是做模型研究。
02
行业转折点
不到三年,生数科技已经获得6次融资和1次股权转让,华为、蚂蚁、百度、智谱等企业均站在生数科技背后。
除了生数科技,整个AI视频生成赛道受到产业资本重注。去年以来,国内融资速度最快、估值上升最快的 AI 创业公司,多数集中在视频赛道。
从技术层面看,行业转折点出现在2024年下半年:多模态模型的架构,开始转向以 DiT / Transformer 为主。
架构一变,效果也随之改变,视频生成中的“长序列一致性”明显提升。
简单说,画面不再前后打架,人物不会突然变脸,动作也更连贯。这意味着一个关键问题被解决了——稳定性。
AI 视频生成,第一次真正接近“可商用”。
也就是说,它不再只是演示效果,而是可以进入真实生产流程,可以被当作工具使用,可以计入成本,计算效率。
也开始有创业公司,凭它真正赚到钱。
AI视频生成产品,可以让视频制作周期可缩短约 80%,成本可降低约 90%。同时,它能覆盖自媒体、广告、影视、电商等多种场景,应对大量内容生产需求。
《经济观察报》数据显示,2025年12月,多家头部AI视频公司披露业绩。它们的收入规模,和一年前完全不同。
去年,收入还少到几乎可以忽略。今年,已经跨入“亿元俱乐部”,少的约1.4亿元,多的接近10亿元。
增长幅度非常明显。
在生数科技本轮融资前,AI视频生成赛道单轮融金额纪录属于爱诗科技。去年9月,爱诗科技宣布完成超6000万美元B轮融资。仅一个月后,又宣布完成1亿元人民币B+轮融资。
爱诗科技被押注,很重要的原因也是商业化跑出了雏形,据说其全球C端用户规模已突破 1 亿,80%收入来自C端;
在B端则为广告、短剧和游戏等领域提供API 和定制化视频生成服务,2025年度经常性收入(ARR)超过4000万美元。
去年12月,AI视频生成产品 Pollo AI 完成1400万美元首轮融资,由高成资本领投,真格基金跟投。
Pollo AI 接入了市面上大多数主流视频生成模型,包括OpenAI的Sora、Midjourney、Vidu、Hailuo、Kling 等。
它把不同模型整合到一个平台上,同时,清楚标注每个模型的优势。
比如,有的擅长写实风格,有的更适合动漫效果,有的在人物稳定性上更强。
用户可以根据需求,直接选择合适的模型,不用自己反复测试,效率更高,也更有针对性。
值得注意的是,Pollo AI商业化进展很快:注册用户数超过2000 万,月活跃用户超过600 万,日活跃用户超过20万,年化收入超过 2000 万美元。
行业还有几家公司值得关注。
一家是由商汤研究总监刘宇创办的AI视频生成企业——Vivix AI。据Z Fianace报道,它2 月完成种子轮,由红杉中国和 IDG 资本联合领投;去年11月,A 轮估值突破13.2亿美元。
另一家公司是LiblibAI,去年10月完成1.3亿美元B轮融资。虽然不是纯视频生成,是图像为主。其商业化也进展较为顺利,半年ARR超150万美元。
03
趋势:头部效应加剧
以视频生成为代表的多模态产品融资潮背后,到底在发生什么?
MovieFlow创始人梁巍告诉铅笔道,这轮融资潮的头部效应明显。能否获得融资的关键,在于应用场景是否成熟,能否支持商业落地。
相比前两年,行业最大变化在于,音画一体模型让工具从“片段生成”向“完整内容创作”转变。
此时,企业核心价值从单纯的技术,转向如何将模型封装成易用产品,让用户真正能稳定使用。提供标准化、场景化交付服务是核心商机。
目前,MovieFlow一方面提供C端轻量产品,另一方面是MovieFlow Studio 专业版服务影视制作,既构建YouTube那样的内容社区,又有像Netflix那样高质量的内容。
梁巍预测,2026年上半年行业格局基本确定,新进入者空间明显收缩,资源将集中在技术+赚钱能力都强的头部企业。
巨人网络战略投资部负责人邓昆——爱诗科技和LiblibAI投资人——曾向《经济观察报》表示:2026年,AI视频在电商、教育、短剧、漫剧等领域能看到更好的商业收益。下一步的决胜点,在于能否开发出电影级画质的AI视频产品。
本文不构成任何投资建议。
本文来自微信公众号“铅笔道”(ID:pencilnews),作者:松格,编辑:黄小贵,36氪经授权发布。















