美图历险记:靠AI重生,又遇模型吞噬,还有反转吗?

IC实验室·2026年03月30日 19:38
从逃出模型竞争,到深耕影像应用,再到进军Agent,美图的AI历险记还没结束。

从逃出模型竞争,到深耕影像应用,再到进军Agent,美图的AI历险记还没结束。

时间回到2023年之前。

如果你走到大街上,随机问路人:“美图是干嘛的?”,大家都会笑笑说:“修图的呗。”

没错,曾经的美图秀秀和美颜相机,是修图界的绝对王者,巅峰时期坐拥2.5亿忠实的活跃用户。

但在商业世界里,赚不到钱的流量就是毒药。美图公司长期只能靠免费工具换广告的古典互联网模式赚钱,在短视频平台的降维打击下,一度陷入变现和规模的双重困境。

直到2023年,CHATGPT一鸣惊人,生成式AI爆发了。

就像快淹死的人,会抓住一切可以抓住的东西,面对AIGC这个将会改变整个科技行业的新趋势时,美图没有丝毫犹豫,就跳进了“百模大战”的绞肉机。

他们的战略极其宏大但也极其危险:我们要自己做底层大模型!

美图的AI冒险,就从这个决策开始了。

01

2023年6月,美图启动了自研视觉大模型MiracleVision(奇想智能)。

为了这款大模型,美图砸下了6.4亿元人民币。

对那个还在低谷期艰难挣扎的美图来说,这笔钱已经是全年总收入的四分之一,堪称舍身一击。除此之外,还邀请了许多艺术家、设计师,一同训练大模型。

在美图的计划中,MiracleVision会是懂美学的大模型,未来能够以一己之力包揽电商、广告、游戏、动漫、影视五大行业,成为视觉美学生态基石。

那一刻的美图,看着不断迭代的模型,也许真的产生了一种幻觉:只要熬下去,我们就能成为下一个时代的巨头。

然而,幻觉之所以是幻觉,就是因为它终将被现实无情击碎。

2024年2月,大洋彼岸的OpenAI扔出了一颗核弹——文生视频大模型Sora。那段长达60秒、极度逼真、完美符合物理规律的视频,不仅震撼了世界,更像是狠狠扇在了美图的脸上。

美图创始人吴欣鸿在财报会上坦言:“我们原本以为这要两三年后才能实现,没想到今天就摆在眼前了。”

比Sora强大的性能更残酷的,是Sora的成本。

OpenAI到底在Sora上花了多少钱?有媒体估计,每年超过50亿美元,相当于每天约1500万美元,超过一亿人民币。美图节衣缩食省出来,喂养MiracleVision的6个多亿,也就够人家烧不到一个礼拜。

这对于美图的震撼,不亚于我当年发现高中学习委员每天放学,她妈妈开奔驰跑车接她回家。

Sora的出现,撕开了大模型赛道最残酷的真相:这根本不是什么技术创新的游戏,这是一场比谁家显卡多的非对称战争。

美图也算是上市公司,勉强也能算互联网中厂,但真要和微软、谷歌,还有一系列国内大厂比算力,这点钱恐怕还不够上桌的。

这件事,美图自己恐怕是最清楚的。

就在Sora面世的4个月后,在美图影像节上,美图CEO吴欣鸿无奈地坦白,短期追不上Sora的技术能力和生成效果,跟全球巨头们正面硬刚视频大模型的话,无论是资金投入、算力还是算法,都有差距。

在这个世界上,最痛苦的决定,莫过于接受自己的平凡。

美图选择了认怂,选择了后退,选择了全面转向AI应用层。

吴欣鸿算了一笔账:底层模型卖API不仅要打价格战,还要天天打榜比参数;而应用层直接解决用户痛点,市场空间是底层的十倍,还能直接收高毛利的订阅费。

基建狂魔当不起,但在人家造的房子里面开个小店,卖点小玩意儿,也能把日子过得滋润。

星辰大海的事情,就让那些大厂去操心吧。

那么,事情真的有这么简单吗?

02

回到应用层,美图发现,这块的钱也不好赚。

AIGC普及了,满大街都是套壳的AI画图工具,一键生成漂亮图片,凭什么让用户为美图的AI掏钱?

咋办?

摆在美图面前的,有两个选项。一个选项是走网红炫技流,做一个类似早年网红滤镜那样的AI效果,加上铺天盖地的广告,打造爆款产品。

另一个选项,是找出AI时代,属于美图专属的护城河,从而和同行们做出差异化。

按理来说,美图是做C端产品起家的,前者更符合这家公司的基因。

但美图最终选择了后者。

这个选择,和当时行业里两大顶流的影响不无关系。

当时在文生图领域,Midjourney主打生成效果好,一度也是AIGC赛道当红炸子鸡。但天天被艺术家起诉侵权,他们家做出来的图,企业根本不敢拿来商用。

另一边,Adobe Firefly效果虽然中规中矩,但人家承诺全部用自家版权图库训练,主打一个“商业安全”。

有这两家珠玉在前,美图意识到,版权,会是AI应用的护城河(之一)。

于是,2024年,美图又砸出2.85亿人民币(近4000万美元),直接把中国顶尖的视觉创意社区——站酷(Zcool)给收购了。

这笔收购,拿到的不是一个网站,而是它背后1700万专业设计师的用户池。

作为一家强调“美学”的影像公司,视觉创作者群体对美图的意义不言而喻,不仅为美图未来的AI生成提供了军粮,更是直接为商业应用场景准备了练兵场。

美图开始了对产品的重塑。

和那些主推“一键生成视频”、“一句话生成图片”的炫技产品不同,美图在这个行业浸淫许久,他们很清楚,真正的生产力用户,做电商的、做自媒体的,根本不需要这些华而不实的功能,他们需要的是一整套跑得通的业务流水线。

以前做电商,要给商品拍场景图,得找模特、租影棚,花几万块等几个星期。

现在美图设计室诞生了,丢一张干净的商品实拍图进去,AI自动抠纯白背景,瞬间生成北欧风、欧美风场景图。你想做跨境出海,人家连多语种详情页都给你排版好了。

以前设计师和插画师要创作,所有的元素都必须手搓。

现在美图推出了AI视觉创作工具WHEE,想要做个海报,只要把主图传上去,AI就能给你适配各种不同的海报风格。如果你想用一些特别的字体,过去要么让设计师一个字一个字来调整,要么买现成的字体,现在也可以直接按照你的要求,让AI帮忙设计字体。

除此之外,专注口播视频的开拍,专注人像精修的美图云修,都是专注生产力的AI产品。

至此,美图已经建立起同行难以跨越的AI壁垒。

底层是版权和素材。

中层是一套从静态图文到动态视频,无死角覆盖的视觉生产力工具矩阵。

顶层是专业设计师用户,以及商业合规的应用场景。

这三层壁垒,不仅让美图跑赢同行,更是解决了过去C端产品一直难以解决的问题——变现。

毕竟生产力工具核心场景是to B端,尤其是适配电商场景,天然离交易更近,现金流充沛。

当你站在一条大河边上,怎么样都不会渴死。

光是给短视频主播做个提词器,美图公司一年就赚1000多万。

回归应用层,美图终于回到了舒适区,跑出了其他对手望尘莫及的速度。

但这一切,真的会有这么顺利吗?

03

进入AI纪元,一切都像踩上了加速器。

曾经坚若磐石的商业模式,在这个时代,必然要面对一浪一浪的新技术冲击。

刚从“百模大战”的绞肉战中全身而退,美图又迎面撞上了“大模型吞噬应用”的市场叙事。

什么叫“大模型吞噬应用”?简单来说,就是随着基础AI模型功能日益强大,开始跨界抢夺软件的核心业务。

许多工作只要需要一股脑儿丢给AI Agent(智能体)就可以了,不再需要只能解决单一问题的应用和工具。

比如“龙虾(OpenClaw)”的爆火,让过去只有对话能力,只能输出内容的AI,变成了真正能够处理文件、操作工具、使用浏览器的生产力协作对象。

再比如Anthropic在旗下Claude Cowork,强大的功能,引发了SaaS软件市场恐慌,股价跳水。

类似的恐慌,也蔓延到了视觉工具领域。

Salesforce、Adobe、Figma这些著名软件公司,都被“大模型吞噬应用”的叙事所波及,成为了人们口中的“AI牺牲品”。

美图公司自然也在这个行列中。

这一次,美图又要认怂后退吗?

没有。

但有趣的是,它也没有选择正面硬刚,而是走了第三条路:

让一切趋势为我所用。

既然AI Agent大爆发,那就顺势而为。

于是2025年,美图推出了战略级产品——原生AI Agent“RoboNeo”。

美图过去做产品的思路,是给修图软件加入AI功能。

RoboNeo完全相反,它完全不是一个布满按钮的设计软件,而是一套以自然语言指令为逻辑的全新工作流。

哪怕你完全不掌握任何设计师的基础技能,只要有需求,会打字,RoboNeo就能实现图像编辑、视频制作、平面设计、网页建站等一系列工序。

这相当于给每个有想法的普通人配备了一个专属创意总监。

更可怕的是,这个创意总监的大脑,不是某个单一的模型,而是一整个“模型容器”。

它集成了 Nano Banana pro等多家第三方基座模型,当然也包括自研的 Miracle Vision 视觉大模型。针对用户极其复杂的非标准需求,让最适合完成任务,成功率最高,效果最好的模型来执行。

“模型容器”这个概念,也是美图“顺势而为”风格的产物。

既然巨头们的大模型一个比一个猛,功能一个比一个强,新版本迭代你追我赶,那我美图干脆让这些模型在我的场景下赛马,看看谁能更好地完成用户的任务。

DeepSeek不是对话能力强嘛,那到了需要语义理解的时候,就接入DeepSeek。

Nano Banana pro不是擅长理解物理世界嘛,那3D图像生成的时候就交给你。

至于美图,它要做的,就是帮用户翻牌子。

作为“模型容器”,它要把基础模型的能力封装成一个个可用的产品,要帮助用户判断哪个模型更强大,要为用户的场景寻找合适的模型,要对各种三方API进行微调,控制大模型的能力。

它成为了大模型的驯兽师,将强大但难以驯服的模型能力,转化成为用户所操控的生产力。

今年,美图更是全面拥抱了OpenClaw龙虾生态。

美图AI开放平台的全新Meitu CLI工具发布,首批美图AI Skills一口气向全球开放了8种强悍的AI影像能力模块:覆盖视频动作迁移、图片编辑、图片生成/设计、图片超清、AI换装、图生视频、智能改尺寸、智能抠图。

这些曾经只在美图自家APP里独享的“核武器”,现在彻底打包,变成了全球开发者和生态用户的公共弹药库。

前几天,美图公司发布了2025年的财报。

38.6亿元的收入,同比增长28.8%,归母净利润9.65亿元,同比增长64.7%。

算算规模,美图远远比不上那些超级互联网巨头,但字节、阿里们几百亿几百亿地烧钱,智谱、MiniMax们十个亿十个亿地亏损,美图靠AI过上了自给自足的日子,也多了一份在全球AI生态中抢肉吃的底气。

那么,我们要问最后一个问题了:

为什么是美图做到了这一切。

04

要回答这个问题,我们要理解“大模型吞噬应用”的过程里,是什么东西在被吞噬。

在我看来,被吞噬的应用和软件,它们的应用场景有两个极大的特征:

流程化和标准化。

比如查航班、写周报、订会议室、写报销单,这些都是按部就班,没有多少人脑决策的空间。说通俗一点,都是没什么人味儿的Bullshit Jobs。

随着AI模型能力增强,这些东西都是最容易被AI取代的东西。

但也有一些很难甚至不可能被AI取代的软件,它们的应用场景,也有两个极大的特征:

决策型和审美型。

有些决策,AI永远不可能替代人类,大到司法审判,政治决策,小到晚上吃什么,周末去哪玩。因为这些决策背后,需要有人来负责。如果你不能让AI替人类坐牢,替人类郁闷,替人类挨饿,那这些决策的最终权力,就不可能完全交给AI。

至于审美,则是一个没有标准答案的事情,比如人像精修,有的人喜欢尖下巴,也有人喜欢圆脸,有人喜欢肤色洁白无瑕,也有人觉得小麦色和雀斑才是生命力的象征。

为什么颜值赛道的网红,哪怕旗下有上百人团队,修图也要自己来,因为没有人比TA们自己更熟悉自己的脸,没有人比TA们清楚自己哪里好看,如何放大优势。

这件事,也是AI难以取代的。

美图旗下的一系列产品和工具,无论服务于C端用户还是B端生产力,都属于审美决策类的产品。它们可以被AI赋能,但不可能被AI吞噬。

审美,才是美图在AI时代,最核心的护城河。

过去17年,美图这家公司积累的,不止是账面上的资金和活跃的用户池,还有对“美”的理解。

进入到AI时代,这种审美积累就化为了叠加AI功能的滤镜设计、特效打造、模版堆叠——每一个提供给用户的功能按钮。

或许是因为经历过惨痛的失败,美图比很多公司对自己有清醒的认知。他们明白,在这个时代,不是所有人都要去修高速公路,去建收费站收过路费。

也有一些公司应该选择造车,让更多人有冲上高速公路的机会。

也有一些公司应该选择当司机,让人们轻松便捷地享受道路带来的便捷。

作为离消费者更近的公司,美图无疑更适合做后面这两件事。

这么做的结果,可能注定只能是星辰大海里的浪花一朵,但起码不会被时代的浪潮无情淘汰。

美图的历险记仍未结束,不过,看不见结局的故事,才更让人着迷。

本文来自微信公众号“IC实验室”,作者:IC实验室,36氪经授权发布。

+1
2

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000
特邀作者

TA没有写简介,但内敛也是一种表达

下一篇

曹操出行亮点、隐忧并存。

1小时前

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业