那个下午，我变成了一个“缝合怪”导演

最话FunTalk·2026年03月11日 10:26

AI还需要与现实世界缝合

虽然成本并非3000元，那只是AI算力成本，但AI短片《霍去病》还是让影视从业者们，感到了阵阵寒意。

看报价便知，《霍去病》制作团队向媒体提供的报价单显示，其商业视频每秒100-500元，影视视频每秒100-300元，CG建模类视频每秒300-1000元，1分钟影视短片最低成本仅6000元。而常规短剧单集制作成本5万元左右，特效镜头普遍3000元/秒的CG报价。也就是说用AI制作短剧，成本不足传统影视的十分之一。

这是连短剧领域的“郑州帮”都难以企及的成本优势。至于效果，对于短剧平台来说，短剧不过是消耗用户时间，以方便植入广告的消耗品。消耗品比起质量，更在乎数量，海量的AI短剧灌入，用户的偏好也很可能因此改变。

既然推荐算法“驯服”了用户的习惯，AI制作也能改变用户的审美。这让整个影视圈宛如手持着冷兵器，面对铺天盖地而来的“机械章鱼”，《黑客帝国》般的场景。

一开始所有人都没意识到改变会来得那么快，春节前，就在短剧剧组、公司经历了一整年红利，兴致勃勃准备开年再接再厉时，快手在2月4日连夜发布可灵3.0系列，字节跳动的Seedance 2.0在2月7日开启小范围内测，宣传片里，那些画面流畅、光影考究的片段，看得人心潮澎湃。

只要敲几行字，AI就能把脑中的画面变成短剧，整个影视生产底层逻辑被重构了，剧本生成、角色建模、画面渲染、配音配乐等全流程均可通过AI工具完成。行业数据显示，AI特效成本已压缩至传统模式的5%-20%。曾经以技术、资金构筑的影视工业化门槛，被轻易击垮。

一位广告公司朋友告诉我们，过去拍宣传片，需要找编剧、导演、演员，租场地、设备，请剪辑、包装、配音，来来回回沟通。但现在输入创作需求，几小时就能出片，成本还不到原来的三分之一。

我的几位影视圈朋友心态更是复杂的，因募资不足赋闲已久的出品人兴高采烈跃跃一试，剪辑师已经好久没能接单，编剧朋友更是早就用AI写剧本。“传统”从业者们被迫应对时，有AI加持的普通创业者与个人创作者反而涌入行业，进一步杀低报价。

似乎有了AI，人人皆可当导演，人人皆可拍剧了。影视创造的城门已经洞开。

老实说，我一开始也是信了的。

01

前几天下午，我满怀期待地打开了这两个工具，然而，实际的体验，却让我打破了很多对当下视频AI的“幻想”。

在以下测试中，上方的视频均为可灵3.0，下方均为Seedance 2.0。

最开始测试的，是复杂场景的理解力。

以下面这段视频为例，我输入的提示词是：

“一对男女在咖啡馆里交谈，女子问男子：你相信吗？其实我们都是AI，这个世界也都是模拟出来的，男子表示难以置信，之后，女子示意男子一起随她走出咖啡馆，两人走出后，发现外面是一片黄沙肆虐的废土，原先的高楼全都变成了废墟。”

讲真，可灵似乎没能准确get到我的意图，视频中，咖啡厅外的景象出现了诡异的漂移，最后高楼转成废墟的场景，也显得有些突兀。

相较之下，Seedance 2.0的表现就自然了些许，不仅人物的神色拿捏得较为到位，并且在走出咖啡厅时，也展现了“出门”这一动作，而不是生硬地转场；

之后，我分别测试了二者在理解物理规律上的表现。

这方面，Seedance 2.0和可灵3.0，可谓半斤八两。

首先看可灵的表现：

提示词：一个烧红的铁球掉落在一大块透明冰块上。撞击时，冰块逼真地裂开，蒸汽瞬间升起，球体在冰上熔化出一个小坑，同时产生蜘蛛网状的裂纹。水在撞击点周围积聚。

从视频中的效果来看，铁球撞上的似乎是某种很脆的，易碎的固体，而非遇热即熔的冰块，冰块也并未因与灼热铁球的接触，而发生凹陷。

Seedance 2.0在音色方面的表现略出色了些，出现了冒烟的滋滋声，冰块的融化声，但冰块仍然没有凹陷。

这说明二者在物理规律方面，仍然在靠数据和样本在模仿，而并非真正理解现实的物理规律。

之后，则是一段比较“人间”的物理性测试：

提示词：一辆载着10个高高叠起的不稳定披萨盒的送餐摩托车在街上飞驰。摩托车突然急刹车。车停了，但披萨盒堆因惯性逐个倒塌，最后掉落在路面上

这段案例，因为不像前面的铁球撞冰块那样，对物理规律有着严苛的要求，这方面的视频，因为有较多素材训练，因此二者表现尚可，都展现了披萨因惯性掉落的画面，

区别是可灵的表现似乎更有“镜头感”一些，还展示了披萨掉落后的些许细节。

最后，我脑洞大开，拍了个穿越剧的片段，让古代士兵用机枪战斗，并被手雷反杀的剧情：

讲真，这段视频中，Seedance 2.0在多图控制上的优势体现了出来，虽说还有小BUG，但已经比较完整地体现了整个剧情。

相较之下，可灵的效果则很不尽人意，尽管上传了相同的配图，但人物还是出现了严重的变形，并且士兵扫射的方向也完全搞反了。

以上展示的片段，只是我在试用过程中，做出的真正“能看”的成果。

而相当一部分的时间、积分和算力，都消耗在了“抽卡”上。

可灵的会员是60块钱一个月，送1800积分。生成一段15秒视频，消耗180积分，也就是一个月大约10个视频。

但问题是，“抽卡”是不保证质量的。你可能生成十段，只有两段勉强能用。

那天下午，我把半个月的积分都挥霍完了，最后只得到两三个勉强满意的视频——离可直接交付的影视级标准，还差得远。

为了提高成功率，我开始尝试多图控制——就是先让AI画几张关键帧的图，再让视频模型参考这些图生成视频。

但很快我又撞上了另一堵墙：AI绘图本身也需要抽卡。

我让AI画一张“窗外正在下雨的咖啡馆”，它要么把雨画在咖啡馆里，要么把窗户画成透明的墙壁。

更痛苦的是，由于最近Seedance 2.0 爆火，字节服务器似乎压力颇大，在我测试时，一段15秒的视频，居然提示要排6个小时的队，这直接劝退了我后续的制作。

那一刻，我突然意识到一件事。

我原本以为，AI工具能帮我省掉那些最昂贵的、消耗时间的环节——找场地、搭景、调灯光、等演员。但现在呢？场地不用找了，但我得花七个小时排队；灯光不用调了，但我得花一下午抽卡赌运气。

就这样，整整一个下午，我大部分时间都耗在了排队和抽卡里。

02

那天下午折腾完之后，我并没有觉得愤怒。更多的是一种奇怪的疲倦——不是因为做了太多事，而是因为什么事都没做成，却已经很累了。

这种感觉从哪里来的？我试着把它拆开来看。

做视频这件事，不管用什么工具，本质上都有无形的、琐屑的步骤在消耗你——传统拍摄有传统拍摄的消耗：找场地、约演员、搭景、调光、返工等等。

这样的消耗，正是视频制作环节中的“摩擦力”。

AI工具出现之前，这些摩擦力是“可见”的：你知道找场地要花多少钱，知道约演员要等多久。它们明码标价，你可以算账、预判、接受。

AI工具出现之后呢？乍一看，那些摩擦力消失了。不用找场地了，不用约演员了。但那天下午的经历告诉我：它们并没有消失，只是换了一副面孔。

显性摩擦力，变成了排队时间和生成费用。Seedance 2.0服务器爆掉的那七个小时，时间是真实消耗的。可灵的积分消耗是另一种形式的钱：生成一段15秒视频要耗掉180积分，效果不理想不会退给你。你付的是"可能"的钱，不是"确定"的钱。

隐性摩擦力，变成了抽卡成本和学习成本。本质上，这是“导演换成了AI模型”、“沟通换成了提示词博弈”。

上游摩擦力，从“找演员”变成了“生成参考图”。为了让视频效果更可控，需要先用AI绘图生成关键帧。但AI绘图本身也有摩擦力——你让它画一张窗外在下雨的咖啡馆，它可能把雨画进咖啡馆里——目前某些最“先进”的绘图模型，现在仍然在犯这种低级错误。

这就是我那天撞上的“控制悖论”：为了降低视频生成的摩擦力，你需要先承受图像生成的摩擦力。摩擦力没有消失，它只是被推到了上游。

更麻烦的是，这种变形让摩擦力从“可见”变成“隐形”，从“指导-改进”变成“混沌-靠运气”。传统拍摄的摩擦力是一锤子买卖：场地租了、演员付了，后面就是拍。AI工具的摩擦力是持续性的：每一次生成都有失败的可能，你永远不知道这次要花多少钱、多长时间。

当摩擦力是可见的，人会本能地去对抗它。但当摩擦力变成隐形的，人就会陷入一种莫名的消耗——不知道在哪里出了问题，只知道结果不尽如人意。

这不是AI工具不好，这是摩擦力在换了一副面孔之后，更难被察觉，也更难被抵消。

03

但我必须说公道话。那天的失败经历是真实的，但它不是全部的真相。

2025年末，一部叫《斩仙台AI真人版》的短剧，6天内播放量破亿。制作方12人团队，周期30天，算力成本10万元。同等体量的传统短剧需要40到60人，成本60万以上，另一个案例就是《霍去病》，23分钟，算力成本据说是3000元，播放量据称有5亿。

同样的工具，为什么结果差距这么大？

答案其实不复杂。这就是杠杆原理：杠杆能省力，前提是支点位置正确。

这个行业找到的"最佳支点"，叫做"缝合模式"。

逻辑很简单：AI做特效，真人演文戏，最后剪辑合成。传统短剧做不起特效，是因为S级别特效单分钟成本要1.5万到4万元。但AI生成的特效，单分钟成本已经压缩到1300元，最低能到400元，这不是一个数量级的差距。

AI让短剧“用得起特效了”——这才是这个工具的核心价值。不是替代人，而是把过去“负担不起”的部分，变成“负担得起”。

这个逻辑，用杠杆来理解再贴切不过了：AI是杠杆的一端，真人制作是另一端，特效镜头是支点。把AI放在特效这个支点上，它以最小的成本撬动了过去需要大量金钱才能实现的画面效果。

市场印证了这一点。2025年被称为“AI漫剧元年”，全年播放量突破700亿，上线漫剧46931部。约60%到70%的漫剧使用AI辅助生成，但纯AI生成占比不到10%——这说明，市场不是在用AI替代人，而是在用AI做人做不了的部分。

但这里有一个前提：这个杠杆效应，是有条件的。

《斩仙台》能做到那个效果，是因为12人团队已经跑通了“AI+真人缝合”的完整工作流——前期AI生成角色形象和场景概念图，中期真人演员拍摄文戏，后期AI生成特效镜头，人工剪辑合成。每个环节都有人负责，每个人都知道自己该做什么，容错空间可以被分摊到整个流程里。

所以，AI视频工具并没有“降低门槛”。更准确的表述是：它把门槛从“有没有资源”变成了“有没有工作流”。

你不再需要60个人和60万块钱，但你需要一套成熟的分工体系，学会“缝合”。这个认知本身，就是一道新的门槛。

04

现在回到那两个工具本身，以及它们背后的两家公司。

Seedance和可灵虽然亮眼，但目前仍掩盖不了字节、快手在AI创作应用商业闭环上的焦虑。

2025年可灵AI全年收入约10亿人民币（1.4亿美元），2025年全年Capex（资本性开支）指引上调至140亿元，主要用于可灵AI和广告技术，10亿收入 vs 140亿投入，可灵的收入连投入的零头都不到。

字节这边，更是无从对照：字节2025年整体AI资本开支1500亿元，2026年计划1600亿元，Seedance至今没有公开的商业化营收数字；

所以，对二者来说，短剧和漫剧真的是“救命稻草”吗？

我的判断是：不是。

因为AI漫剧、短剧有几个结构性隐患。

首先，爆款难以复制，且用户审美疲劳极快。2026年数据显示，AI漫剧的爆款率已经下滑到1%——100部里只有1部能真正出圈。这个比例还在下降，因为供给在爆炸式增长，仅2025年抖音端原生漫剧上线数量就突破了6万部。

其次，虽然所有视频内容都消耗用户时间，但短剧的时间消耗直接决定收入上限，而广告/电商的时间消耗只是“效果变量”。短剧市场受限于C端的钱包和时间，广告/电商市场受限于B端的预算——后者可扩展，前者是物理常数。

一个广告视频可能被100万人看，也可能被1万人看，但企业关心的是转化率和ROI。

所以，更大的战场在别处。电商广告领域，AI混剪素材制作成本降低95%，视频产量提升700%。品牌营销、文旅、教育、游戏，这些场景对视频的需求量远大于短剧。

现阶段快手和字节烧的钱，实际上是在为两三年后的广告和电商AI化买票——短剧、漫剧只是验证工具能力的试验田，不是终局。

这个大盘子有多大？2025年中国互联网营销市场规模约8818亿元，移动广告市场约4867亿元。AI视频哪怕只渗透其中5%，就是400亿以上的市场。这会是快手和字节开辟的新市场，而不只是短剧。

更进一步地说，如果Seedance、可灵能成为行业标准工具，未来的变现空间就不止是短剧和广告素材，而是所有需要视频内容的场景——包括游戏、影视、教育、企业服务。

但二者面临同一个核心挑战：如何把摩擦力降到用户感知不到的程度。

可灵的抽卡机制、Seedance的排队问题，本质上都是视频生成中的“摩擦力”问题。

AI视频创作的未来，不是让一个人变成一个团队，而是让工具变成一种能力，稳定、可控、可预期，随手可调用。当摩擦力从“看不见的负担”变成“感知不到的存在”，就意味着AI创作能力、算力成本被摊薄到基础设施使用成本的地步。

我不敢想象那会是何等的情景，是人创造力被极大释放，还是会活在“黑镜”之中。

那真会是非常充满戏剧性张力的一幕。

本文来自微信公众号“最话FunTalk”（ID：iFuntalker），作者：林书，编辑：刘宇翔，36氪经授权发布。

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

那个下午，我变成了一个“缝合怪”导演

01

02

03

04

最近内容

下一篇