那个下午,我变成了一个“缝合怪”导演
虽然成本并非3000元,那只是AI算力成本,但AI短片《霍去病》还是让影视从业者们,感到了阵阵寒意。
看报价便知,《霍去病》制作团队向媒体提供的报价单显示,其商业视频每秒100-500元,影视视频每秒100-300元,CG建模类视频每秒300-1000元,1分钟影视短片最低成本仅6000元。而常规短剧单集制作成本5万元左右,特效镜头普遍3000元/秒的CG报价。也就是说用AI制作短剧,成本不足传统影视的十分之一。
这是连短剧领域的“郑州帮”都难以企及的成本优势。至于效果,对于短剧平台来说,短剧不过是消耗用户时间,以方便植入广告的消耗品。消耗品比起质量,更在乎数量,海量的AI短剧灌入,用户的偏好也很可能因此改变。
既然推荐算法“驯服”了用户的习惯,AI制作也能改变用户的审美。这让整个影视圈宛如手持着冷兵器,面对铺天盖地而来的“机械章鱼”,《黑客帝国》般的场景。
一开始所有人都没意识到改变会来得那么快,春节前,就在短剧剧组、公司经历了一整年红利,兴致勃勃准备开年再接再厉时,快手在2月4日连夜发布可灵3.0系列,字节跳动的Seedance 2.0在2月7日开启小范围内测,宣传片里,那些画面流畅、光影考究的片段,看得人心潮澎湃。
只要敲几行字,AI就能把脑中的画面变成短剧,整个影视生产底层逻辑被重构了,剧本生成、角色建模、画面渲染、配音配乐等全流程均可通过AI工具完成。行业数据显示,AI特效成本已压缩至传统模式的5%-20%。曾经以技术、资金构筑的影视工业化门槛,被轻易击垮。
一位广告公司朋友告诉我们,过去拍宣传片,需要找编剧、导演、演员,租场地、设备,请剪辑、包装、配音,来来回 回沟通。但现在输入创作需求,几小时就能出片,成本还不到原来的三分之一。
我的几位影视圈朋友心态更是复杂的,因募资不足赋闲已久的出品人兴高采烈跃跃一试,剪辑师已经好久没能接单,编剧朋友更是早就用AI写剧本。“传统”从业者们被迫应对时,有AI加持的普通创业者与个人创作者反而涌入行业,进一步杀低报价。
似乎有了AI,人人皆可当导演,人人皆可拍剧了。影视创造的城门已经洞开。
老实说,我一开始也是信了的。
01
前几天下午,我满怀期待地打开了这两个工具,然而,实际的体验,却让我打破了很多对当下视频AI的“幻想”。
在以下测试中,上方的视频均为可灵3.0,下方均为Seedance 2.0。
最开始测试的,是复杂场景的理解力。
以下面这段视频为例,我输入的提示词是:
“一对男女在咖啡馆里交谈,女子问男子:你相信吗?其实我们都是AI,这个世界也都是模拟出来的,男子表示难以置信,之后,女子示意男子一起随她走出咖啡馆,两人走出后,发现外面是一片黄沙肆虐的废土,原先的高楼全都变成了废墟。”
讲真,可灵似乎没能准确get到我的意图,视频中,咖啡厅外的景象出现了诡异的漂移,最后高楼转成废墟的场景,也显得有些突兀。
相较之下,Seedance 2.0的表现就自然了些许,不仅人物的神色拿捏得较为到位,并且在走出咖啡厅时,也展现了“出门”这一动作,而不是生硬地转场;
之后,我分别测试了二者在理解物理规律上的表现。
这方面,Seedance 2.0和可灵3.0,可谓半斤八两。
首先看可灵的表现:
提示词:一个烧红的铁球掉落在一大块透明冰块上。撞击时,冰块逼真地裂开,蒸汽瞬间升起,球体在冰上熔化出一个小坑,同时产生蜘蛛网状的裂纹。水在撞击点周围积聚。
从视频中的效果来看,铁球撞上的似乎是某种很脆的,易碎的固体,而非遇热即熔的冰块,冰块也并未因与灼热铁球的接触,而发生凹陷。
Seedance 2.0在音色方面的表现略出色了些,出现了冒烟的滋滋声,冰块的融化声,但冰块仍然没有凹陷。
这说明二者在物理规律方面,仍然在靠数据和样本在模仿,而并非真正理解现实的物理规律。
之后,则是一段比较“人间”的物理性测试:
提示词:一辆载着10个高高叠起的不稳定披萨盒的送餐摩托车在街上飞驰。摩托车突然急刹车。车停了,但披萨盒堆因惯性逐个倒塌,最后掉落在路面上
这段案例,因为不像前面的铁球撞冰块那样,对物理规律有着严苛的要求,这方面的视频,因为有较多素材训练,因此二者表现尚可,都展现了披萨因惯性掉落的画面,
区别是可灵的表现似乎更有“镜头感”一些,还展示了披萨掉落后的些许细节。
最后,我脑洞大开,拍了个穿越剧的片段,让古代士兵用机枪战斗,并被手雷反杀的剧情:
讲真,这段视频中,Seedance 2.0在多图控制上的优势体现了出来,虽说还有小BUG,但已经比较完整地体现了整个剧情。
相较之下,可灵的效果则很不尽人意,尽管上传了相同的配图,但人物还是出现了严重的变形,并且士兵扫射的方向也完全搞反了。
以上展示的片段,只是我在试用过程中,做出的真正“能看”的成果。
而相当一部分的时间、积分和算力,都消耗在了“抽卡”上。
可灵的会员是60块钱一个月,送1800积分。生成一段15秒视频,消耗180积分,也就是一个月大约10个视频。
但问题是,“抽卡”是不保证质量的。你可能生成十段,只有两段勉强能用。
那天下午,我把半个月的积分都挥霍完了,最后只得到两三个勉强满意的视频——离可直接交付的影视级标准,还差得远。
为了提高成功率,我开始尝试多图控制——就是先让AI画几张关键帧的图,再让视频模型参考这些图生成视频。
但很快我又撞上了另一堵墙:AI绘图本身也需要抽卡。
我让AI画一张“窗外正在下雨的咖啡馆”,它要么把雨画在咖啡馆里,要么把窗户画成透明的墙壁。
更痛苦的是,由于最近Seedance 2.0 爆火,字节服务器似乎压力颇大,在我测试时,一段15秒的视频,居然提示要排6个小时的队,这直接劝退了我后续的制作。
那一刻,我突然意识到一件事。
我原本以为,AI工具能帮我省掉那些最昂贵的、消耗时间的环节——找场地、搭景、调灯光、等演员。但现在呢?场地不用找了,但我得花七个小时排队;灯光不用调了,但我得花一下午抽卡赌运气。
就这样,整整一个下午,我大部分时间都耗在了排队和抽卡里。
02
那天下午折腾完之后,我并没有觉得愤怒。更多的是一种奇怪的疲倦——不是因为做了太多事,而是因为什么事都没做成,却已经很累了。
这种感觉从哪里来的?我试着把它拆开来看。
做视频这件事,不管用什么工具,本质上都有无形的、琐屑的步骤在消耗你——传统拍摄有传统拍摄的消耗:找场地、约演员、搭景、调光、返工等等。
这样的消耗,正是视频制作环节中的“摩擦力”。
AI工具出现之前,这些摩擦力是“可见”的:你知道找场地要花多少钱,知道约演员要等多久。它们明码标价,你可以算账、预判、接受。
AI工具出现之后呢?乍一看,那些摩擦力消失了。不用找场地了,不用约演员了。但那天下午的经历告诉我:它们并没有消失,只是换了一副面孔。
显性摩擦力,变成了排队时间和生成费用。Seedance 2.0服务器爆掉的那七个小时,时间是真实消耗的。可灵的积分消耗是另一种形式的钱:生成一段15秒视频要耗掉180积分,效果不理想不会退给你。你付的是"可能"的钱,不是"确定"的钱。
隐性摩擦力,变成了抽卡成本和学习成本。本质上,这是“导演换成了AI模型”、“沟通换成了提示词博弈”。
上游摩擦力,从“找演员”变成了“生成参考图”。 为了让视频效果更可控,需要先用AI绘图生成关键帧。但AI绘图本身也有摩擦力——你让它画一张窗外在下雨的咖啡馆,它可能把雨画进咖啡馆里——目前某些最“先进”的绘图模型,现在仍然在犯这种低级错误。
这就是我那天撞上的“控制悖论”:为了降低视频生成的摩擦力,你需要先承受图像生成的摩擦力。摩擦力没有消失,它只是被推到了上游。
更麻烦的是,这种变形让摩擦力从“可见”变成“隐形”,从“指导-改进”变成“混沌-靠运气”。传统拍摄的摩擦力是一锤子买卖:场地租了、演员付了,后面就是拍。AI工具的摩擦力是持续性的:每一次生成都有失败的可能,你永远不知道这次要花多少钱、多长时间。
当摩擦力是可见的,人会本能地去对抗它。但当摩擦力变成隐形的,人就会陷入一种莫名的消耗——不知道在哪里出了问题,只知道结果不尽如人意。
这不是AI工具不好,这是摩擦力在换了一副面孔之后,更难被察觉,也更难被抵消。
03
但我必须说公道话。那天的失败经历是真实的,但它不是全部的真相。
2025年末,一部叫《斩仙台AI真人版》的短剧,6天内播放量破亿。制作方12人团队,周期30天,算力成本10万元。同等体量的传统短剧需要40到60人,成本60万以上,另一个案例就是《霍去病》,23分钟,算力成本据说是3000元,播放量据称有5亿。
同样的工具,为什么结果差距这么大?
答案其实不复杂。这就是杠杆原理:杠杆能省力,前提是支点位置正确。
这个行业找到的"最佳支点",叫做"缝合模式"。
逻辑很简单:AI做特效,真人演文戏,最后剪辑合成。传统短剧做不起特效,是因为S级别特效单分钟成本要1.5万到4万元。但AI生成的特效,单分钟成本已经压缩到1300元,最低能到400元,这不是一个数量级的差距。
AI让短剧“用得起特效了”——这才是这个工具的核心价值。不是替代人,而是把过去“负担不起”的部分,变成“负担得起”。
这个逻辑,用杠杆来理解再贴切不过了:AI是杠杆的一端,真人制作是另一端,特效镜头是支点。 把AI放在特效这个支点上,它以最小的成本撬动了过去需要大量金钱才能实现的画面效果。
市场印证了这一点。2025年被称为“AI漫剧元年”,全年播放量突破700亿,上线漫剧46931部。约60%到70%的漫剧使用AI辅助生成,但纯AI生成占比不到10%——这说明,市场不是在用AI替代人,而是在用AI做人做不了的部分。
但这里有一个前提:这个杠杆效应,是有条件的。
《斩仙台》能做到那个效果,是因为12人团队已经跑通了“AI+真人缝合”的完整工作流——前期AI生成角色形象和场景概念图,中期真人演员拍摄文戏,后期AI生成特效镜头,人工剪辑合成。每个环节都有人负责,每个人都知道自己该做什么,容错空间可以被分摊到整个流程里。
所以,AI视频工具并没有“降低门槛”。更准确的表述是:它把门槛从“有没有资源”变成了“有没有工作流”。
你不再需要60个人和60万块钱,但你需要一套成熟的分工体系,学会“缝合”。这个认知本身,就是一道新的门槛。
04
现在回到那两个工具本身,以及它们背后的两家公司。
Seedance和可灵虽然亮眼,但目前仍掩盖不了字节、快手在AI创作应用商业闭环上的焦虑。
2025年可灵AI全年收入约10亿人民币(1.4亿美元),2025年全年Capex(资本性开支)指引上调至140亿元,主要用于可灵AI和广告技术,10亿收入 vs 140亿投入,可灵的收入连投入的零头都不到。
字节这边,更是无从对照:字节2025年整体AI资本开支1500亿元,2026年计划1600亿元,Seedance至今没有公开的商业化营收数字;
所以,对二者来说,短剧和漫剧真的是“救命稻草”吗?
我的判断是:不是。
因为AI漫剧、短剧有几个结构性隐患。
首先,爆款难以复制,且用户审美疲劳极快。2026年数据显示,AI漫剧的爆款率已经下滑到1%——100部里只有1部能真正出圈。这个比例还在下降,因为供给在爆炸式增长,仅2025年抖音端原生漫剧上线数量就突破了6万部。
其次,虽然所有视频内容都消耗用户时间,但短剧的时间消耗直接决定收入上限,而广告/电商的时间消耗只是“效果变量”。短剧市场受限于C端的钱包和时间,广告/电商市场受限于B端的预算——后者可扩展,前者是物理常数。
一个广告视频可能被100万人看,也可能被1万人看,但企业关心的是转化率和ROI。
所以,更大的战场在别处。电商广告领域,AI混剪素材制作成本降低95%,视频产量提升700%。品牌营销、文旅、教育、游戏,这些场景对视频的需求量远大于短剧。
现阶段快手和字节烧的钱,实际上是在为两三年后的广告和电商AI化买票——短剧、漫剧只是验证工具能力的试验田,不是终局。
这个大盘子有多大?2025年中国互联网营销市场规模约8818亿元,移动广告市场约4867亿元。AI视频哪怕只渗透其中5%,就是400亿以上的市场。这会是快手和字节开辟的新市场,而不只是短剧。
更进一步地说,如果Seedance、可灵能成为行业标准工具,未来的变现空间就不止是短剧和广告素材,而是所有需要视频内容的场景——包括游戏、影视、教育、企业服务。
但二者面临同一个核心挑战:如何把摩擦力降到用户感知不到的程度。
可灵的抽卡机制、Seedance的排队问题,本质上都是视频生成中的“摩擦力”问题。
AI视频创作的未来,不是让一个人变成一个团队,而是让工具变成一种能力,稳定、可控、可预期,随手可调用。当摩擦力从“看不见的负担”变成“感知不到的存在”,就意味着AI创作能力、算力成本被摊薄到基础设施使用成本的地步。
我不敢想象那会是何等的情景,是人创造力被极大释放,还是会活在“黑镜”之中。
那真会是非常充满戏剧性张力的一幕。
本文来自微信公众号“最话FunTalk”(ID:iFuntalker),作者:林书 ,编辑:刘宇翔,36氪经授权发布。















