谷歌“香蕉”爆火启示:国产垂类AI的危机还是转机?

科技新知·2025年09月26日 18:39
图片AI迎来GPT时刻,大模型吞噬垂类的诅咒还在吗?

最近,一根香蕉打破了AI圈的平静。

最初可能只是朋友圈病毒式传播的手办图,但随后事情似乎向着疯狂的方向发展,上线不到两周,谷歌旗下的Nano Banana已在全球生产超2亿张图片,亚太地区用户热情度居首。而英伟达CEO黄仁勋成了它的忠实用户,在伦敦,他面对一众记者,公开宣称自己是Nano Banana的忠实粉丝。

疯狂的流行带来了另一个好处,就是直接带动了Gemini App的用户增长。在短时间内,Nano Banana为Gemini App带来了超过1000万新用户。而在前不久,Nano Banana更是帮助谷歌Gemini超越了霸榜苹果应用榜很久的ChatGPT。

相关的连锁反应也在进一步加深,在海外,有报道显示,为了应对nano Banana带来的冲击,openAI以约11亿美元的全股票交易方式,收购产品实验平台Statsig。伴随此次收购,Statsig的创始人兼首席执行官Vijaye Raji将加入OpenAI,担任新设立的“应用部门首席技术官”。

在国内,字节快速跟进推出了seedream4.0,试图通过这一方式强化豆包和即梦的用户心智。而另一边,垂类应用美图,则遭遇了危机,通用模型吞噬垂类应用的故事,影响着资本市场对其未来的判断,股价经历了巨量波动。

虽然外资投行,依然为美图站台,但通用模型的势能仍好像“达摩克利斯之剑”影响着公司。

一时间,AI世界的变化,开始围绕着这一超级应用泛起波澜。其实类似的波动,让人总会想起,GPT-4o带来的吉卜力画风的时刻,而与之相对应的则是,通用模型是否会代替掉垂类AI应用的探讨。

前OpenAI研究员姚顺雨曾在播客中表达,创业公司对比大模型公司最大的机会在于能不能设计出不同的interface(交互方式),可能模型的能力会产生beyond chatgpt的交互方式,变成superAPP。

但从另一个维度来看,主流研究员则认为,长期耕耘C端业务的垂类应用,有着对用户精细化的理解,而在B端,特定场景的know-how也能为垂类应用公司垒起一定的护城河。无疑nano Banana像是一场突如起来的变革,搅动着AI圈的神经,而到到底是促增长的功能,还是抢地盘的入侵,似乎值得一番拆解。

谷歌“香蕉”搅动AI圈

如果顺着姚顺雨的思路来看,Nano Banana确实正在颠覆图片创作的逻辑。

在以往,大模型如果要生成图片,prompt提示词非常关键,用户需要学习结构化的提示词才能获取较好的效果。甚至在一些场景中,需要专业的提示词才能达到应有的效果。

后续的修改,无论是通过Midjourney的“Vary”功能还是DALL-E的局部重绘,都感觉像是独立的、离散的操作。

而现在,Nano Banana的快速响应和自然度,让创作更像实时对话,而不是反复抽卡。这也是许多人第一次感到,AI图像生成变得像实时创作。用户不再需要反复调试结构化的咒语,而是通过简单的自然语言对话,就能对图像进行精确修改。

Nano Banana继承了Gemini大模型的“原生世界知识”,这意味着它不仅仅是一个图像生成器,更是一个具备常识和推理能力的系统。它能够理解和生成具有深层语义准确性的图像.在罗永浩与周鸿祎最新的对谈中,也提到了,语言对于AI帮助的核心价值。

根据报道,这一切让Nano Banana在风格一致性、多图融合、精准的逐步编辑以及设计与风格迁移等多个方面上,有了出色的表现。

Nano Banana通过更精确的理解和更细致的任务拆分,实现了高度一致性的图像编辑。某种程度上,这是通过模型定义实现的一种更近似Agent的能力。

从这个角度来看,其颠覆感正如姚顺雨所说,正在改变交互的方式,这也是它为何能够震动AI圈的原因。在此基础上,Nano Banana也做到了成本低、速度快。在Google的介绍中,Nano Banana的定价为30美元/百万token,每张图片生成所需的token在1290个左右,成本约合0.039美元。

而从另一个视角来说,Nano Banana的实现路径,似乎很难复制,在团队的访谈和公开分享里,Nano Banana的几个方向被反复提及:文字渲染、交错生成、速度哲学,以及世界知识的引入。这些关键词组成的其实是,背后强大的模型能力所带来的降维打击。

那么,另一个问题就非常值得关注了,面对如此强大的工具,以及国内已经逐渐明朗的大模型厂商格局,是否意味着,如果按照Nano Banana的思路,就可以成功颠覆垂类的AI应用呢?

美图们的护城河在哪儿?

在美图暴跌之后,相关券商的调研也相继出炉。9月2日,摩根士丹利研报指出,美图的增长轨迹并未受到AI模型Nano Banana的影响,其真正的价值在于提供了基础AI模型无法企及的“最后一公里”解决方案。

报告强调美图凭借其在垂直领域的深厚积累、专有数据以及对核心付费功能的专注,构筑了坚实的护城河。此外,公司对所有AI模型保持开放和中立,并已将Nano Banana等新技术无缝整合进产品中。

而与此同时,也有业内人士表达,美图的C端业务主要优势在于对美颜美体的精细化理解,目前看nano的手办模型只是一种新的玩法,并不威胁C端主业。而美图的B端业务主要是围绕商拍等核心功能服务大C小B的客户,优势在于对于特定场景的know-how、在商拍环节,nano主要聚焦商品多角度复制性以适应不同社交平台模板,而美图产品则聚焦商品高匹配背景及模特,这个赛道国内海外目前确实涌现出了许多创业公司,但是大家在一块全新的市场,目前的玩法、打法都不甚相同,还没有到存量竞争的状态。

尽管如此,从叙事来看,美图做为垂类应用,AI仍是其转型的关键。从2022年开始,美图率先在旗下产品Wink中上线视频画质修复技术,并逐步延伸出画质优化、视频分辨率提升、人像增强等一系列细分功能,形成完整的画质修复能力矩阵。进入2023年,美图进一步丰富了AI功能版图,同时正式切入B端市场,为美业领域量身打造AI测肤解决方案,开启ToB业务的探索。

随后2024年,与阿里巴巴达成2.5亿美元(约合人民币18亿元)战略投资,双方明确将在电商平台、AI技术、云计算三大核心领域展开深度合作。其中在电商合作层面,双方重点推进两大方向:一是计划联合推出“AI试衣”功能——依托美图成熟的AI试衣技术,结合阿里巴巴平台丰富的商家服装资源,从根本上优化线上购物的体验痛点;二是美图设计室将向淘天商家后台开放部分核心能力,例如“AI商品图”生成功能,帮助商家高效提升商品视觉呈现效果。

从以上可以看出,美图的位置非常微妙,在c端,它通过AI技术进行自我迭代与升级,在b端,则通过自身技术赋能电商用户,而无论哪一个业务,似乎都还是技术沉淀过后的串联与精细化。

从某种程度来说,美图更多的优势在于用户心智、用户经验以及精细化,而这些是否能够让其保持现有的业务模型不受干扰,似乎需要时间验证。

而另一方面,按照之前的逻辑,美图围绕着美图秀秀等垂类赛道的superapp进行着业务进行,从某种程度来说,似乎需要更大层面的交互方式的变化,才能占住更强的心智。同时,如国内头部模型厂商开始进入到这一赛道之后,对其是否有更强的颠覆,值得一番思考。

美图是AI变革下的一个典型代表,每一次当巨头模型公司发生技术溢出时,垂类AI应用就将经历考验,而这种不确定性,则会成为公司需要长期面对的命题。

场景赋能是终极胜负手

从硅谷的经验来看,其实大模型公司与垂类AI公司的竞争,从来都是一个经久不衰的话题,比如,anthopic旗下的cloude code与编程垂类应用cursor,其追赶的速度都是超乎寻常。而面对这方面的竞争,似乎垂类AI的办法,并没有想象的多。

投资人朱啸虎曾在采访中坦言:AI Coding我一开始就不敢投,我觉得这肯定是大厂的天下。今年特别有意思,中国在补贴外卖,美国在补贴AI Coding,几乎都是负毛利。你收几十美金一个月的订阅费,消耗的Token可能都是几百美金,这都是拿投资人的钱在补贴程序员。而程序员这个群体是最没有忠诚度的,哪个API好用、哪个便宜,他们就用哪个。

回归到这次事件的主角,美图在此前的计划重心是在出海。在大摩的报告中,公司设定的首个里程碑是,在三年内(2025-2028年)将整体付费率提升至8-10%——这是在2024年4.7%基础上的巨大飞跃;长期来看,其目标更指向休闲类产品付费率10%以上、生产力工具付费率20%以上的更高天花板。

但要实现这一系列聚焦“用户付费转化”的目标,美图首先要应对的,正是Nano Banana所代表的通用大模型冲击:当“对话式创作”重构了用户对图像AI的交互期待,垂类应用若仍困守传统功能,此前的付费率规划便可能沦为空谈。

而美图的应对逻辑——将Nano Banana技术整合进自身产品,同时联合阿里深耕“AI试衣”这类场景化服务,恰恰为国产垂类AI指明了破局方向:这场看似“巨头碾压垂类”的博弈,实则已被撕开转机的裂缝。

危机从不是大模型的技术溢出,而是垂类对自身价值的误判——误将“工具能力”等同于“用户价值”;转机也从不是与大模型比拼参数算力,而是成为大模型落地现实场景的“场景翻译官”与“价值放大器”。毕竟大模型提供的只是“通用能力底座”,而垂类沉淀的用户心智(如美图之于“美”的认知)、场景know-how(如商拍中的背景匹配逻辑)、B端服务闭环(如对接电商的商家需求),才是把技术转化为“用户愿付费的服务”的关键,也是决定AI能否真正解决痛点的“最后一块拼图”。

对国产垂类AI而言,真正的突破点从不是“造一个更好的香蕉”,而是跳出“与大模型对抗”的思维定式,像美图锚定付费率目标那样,聚焦“用大模型赋能场景”:当通用技术与垂类场景深度绑定,所谓的“危机”便会转化为“差异化竞争”的转机——毕竟AI的终极战场从不是技术榜单,而是能否击中用户愿意买单的真实需求。

许,正如朱啸虎所说,AI时代的演化速度可能是移动互联网的三倍速,甚至更快,所以很多机会也会更快被证伪。当年移动互联网的很多工具App还能有不错的退出,但在三倍速的AI时代,退出可能会难很多。所以创业者要用十年、二十年的眼光来看,什么东西是更可持续的,要去离大厂不只是一条马路,而是两条马路、三条马路之外寻找机会。

本文来自微信公众号“科技新知”(ID:kejixinzhi),作者:樱木,编辑:江蓠,36氪经授权发布。

+1
1

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000
特邀作者

读懂硬科技,尝鲜新硬件。把脉产业互联网,关注智能新基建。

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业