连夜测试 Nano Banana Pro,从创意玩具变成了专业工具

果壳·2025年11月21日 07:58
懂逻辑,会推理,AI 生图就快没有幻觉了

Nano Banana Pro(官方也称 Gemini 3 Pro Image)在昨夜上线。

其基于 Gemini 3 Pro 构建,具备更强的多模态能力、推理能力,比如文本渲染准确性更高;

具备最新知识储备,集成 Google 搜索能力,先将用户提示词检索一番,进一步增强生成的相关性和真实性;

高保真图像生成(2K/4K 输出分辨率支持),用 Google 自己的话说,从一个“创意玩具”升级成了“专业”、“工作室级别”工具

我们跑了一些案例,看看是不是像 Google 自己说的那么“离谱”。

又名 PS “终结者”

提示词:生成一张超写实、高清晰度的肖像画。画面内容是《VOGUE》杂志封面,包括杂志的标志和文字。封面有一位年轻女子,背景为摄影室内。她穿着一件华丽的黑色礼服,直视着观者,神情专注。她的右臂抬起,手部分触碰着她的脸侧,同时,右手手腕还有一块 Apple Watch。她的金色头发飘逸,中分造型。

Nano Banana Pro 支持2K/4K 超高分辨率输出,放大看细节也很清楚。图片的皮肤质感、发丝细节、人物的打光,都已经达到了专业摄影室的水平。

然后,我上传一张自己的照片,让 Nano Banana Pro 将杂志封面换成我,其余保持一致。

脸部虽然白了一些,但是也考虑到原图是需要打光的。

提示词:生成一个啤酒的海报宣传图。画面主体是阳光、沙滩,然后一瓶冰冻的玻璃瓶啤酒放在其中,瓶身上有许多小水珠。画面比例为 3:4,分辨率为 2K。

上一代已经很让人惊喜了,但有一点小问题,成图比例固定,想改,得后期裁。

在 Nano Banana Pro 里,确定好你的主视觉之后,就可以让它去延展了。

提示词:接着帮我基于这个海报延展。我需要 16:9、21:9、1:1 还有 9:20.9 比例(大部分全面屏手机的屏幕比例)的图片,分辨率为 2K。

然后,Nano Banana Pro 就会生成这么多,任君挑选。好了我宣布,电商设计师可以尽情摸鱼了。

“一致性”可以说是 Nano Banana 的招牌了。Pro 中升级成最多使用 14 张参考图像,保持多达 5 个人物的一致性与相似度。

比如官方给的例子,

Prompt: A medium shot of the 14 fluffy characters sitting squeezed together side-by-side on a worn beige fabric sofa and on the floor. They are all facing forwards, watching a vintage, wooden-boxed television set placed on a low wooden table in front of the sofa. The room is dimly lit, with warm light from a window on the left and the glow from the TV illuminating the creatures' faces and fluffy textures. The background is a cozy, slightly cluttered living room with a braided rug, a bookshelf with old books, and rustic kitchen elements in the background. The overall atmosphere is warm, cozy, and amused. |Google

那么,或许你就可以尝试,把你和一堆明星塞进一张“魅力新广州”的合照。

提示词:将这四个人放在一张图像中。她们看起来像是一张自拍,看起来像是随兴而为。背景图片是最后一张,她们在这里开心地与地标建筑合影留念。整体的图片颜色和光线看起来都很自然,她们看起来自然地来到这里旅行。

然后你会得到(我被美女包围了),

这里不得不说一句,谷歌自家的模型居然不用 Pixel!

多轮对话、局部调整这些能力,加上画面质量、精度、细节刻画这些在图像质量上的提升,让 Nano Banana Pro 往“专业级别”工具打造,比如可以轻易改变镜头角度,打光效果,画面调色等等这些。

Nano Banana Pro 在工作流整合了自家的 Veo 3 和 Google Slides,前者可以让生成的图片作为关键帧生成视频;后者可以快速搞定 PPT 排版。

懂逻辑、会推理

上面那些功能,还都只是“自家本领”。Nano Banana Pro 和搜索集成后相当于有了“外挂”,基于提示词,先去检索和核查一番,确保生成图片中信息是最新的,是有据可依的。

比如,帮我生成一个宫保鸡丁制作的流程步骤图,插画风格。

再比如,生物老师要求“帮我生成一个介绍植物光合作用的流程步骤图,写明每一步的反应和参与的结构,插画风格。”

我看到 X 网友 @CaomuQ625 生成的“Windows 截图”,这曾经难倒几乎所有 AI ,Nano Banana Pro 做起来毫无压力。

提示词:生成一张 Windows 11 操作系统的桌面截图,截图中已打开 Google Chrome 浏览器,并在浏览器窗口内展示 YouTube 网站上 Mr. Beast 的视频缩略图。|X.com截图

你会发现 Nano Banana Pro 在生成界面时,理解了组件关系,和各自代表什么,不是把每一个部分简单拼合,生成一张像是“UI的图”。

然后我想,生成一个游戏截图呢?

提示词:生成一个正在 macOS 上用游戏模拟器玩《超级马里奥》的截图。

再然后,只要你想,就可以让“野兽先生”进到马里奥世界里。Nano Banana Pro 的逻辑推理能力属实有些惊呆我。

它在思考的过程中,意识到了 Mr. Beast 是一个真人,怎么放进去不违和?于是学习了马里奥游戏的画面信息,把卡通化的野兽先生放了进去,而不是简单当个“缝合怪”。甚至,为了匹配 Mr. Beast 头像的大小,它还把马里奥的身体也放大了——它似乎真的在理解所要生成的内容。

而且,我当时只是说“生成一个正在 macOS 上用游戏模拟器玩《超级马里奥》的截图”,没有具体说是什么模拟器软件。然后,它居然真的找了个能在 Mac 上用的街机游戏模拟器软件 OpenEmu,甚至获取到了它的正确图标(这还是我认识的 AI 吗?)

同时基于 Gemini 3 Pro 的多模态推理能力,Nano Banana Pro 的文字渲染准确性大大提升。Google 毫不避讳地称自己在这块儿是最先进的。

提示词:李商隐的《无题》是一首以男女离别为题材创作的七言爱情诗,请帮我生成一张中国风的插画,主题是一位女子在家中,站在窗边,窗外百花凋零,看着远处的青鸟流泪,并在画面合适的地方附上这首古诗。

中文生成告别“鬼画符”。在测其他例子时,我发现中英文混排时,中文也能保证正确。

不知道你有没有发现,上面的这些案例里有些提示词不长,很模糊。我在测试过程中发现,Nano Banana Pro甚至能理解我的一些抽象表达。

这是 Gemini 具备的“世界知识”发挥了作用。

Nano Banana 核心团队曾经提到,“有时候我们的指令本身就定义得不够清晰,或者我们对现实的某些理解其实是不准确的,而 Gemini 拥有的知识可能和我们视角之外的世界更加一致。”

我突然想到此前,很多没有堂食的外卖商家用 AI 生成店铺图,挂在外卖平台上,结果引起更多反感声。

我尝试让 Nano Banana Pro 做了一张看看效果如何。

提示词:生成一张咖啡店的照片,店名为果壳咖啡。咖啡店整体现代装修风格,坐落在城市转角,干净整洁。门店一侧是透明落地玻璃窗,另一侧是适合顾客落座的临街座位,有人在这里看书,也有人在店里喝咖啡聊天。

先不提“装修好不好”,左边落地窗上的男人倒影是不是也有点惊艳到你了?

(夹带私货)彩蛋

记得一个多月前,我妈给我发来一张照片,是她 1979 年高中毕业时的合照。她是她们乡里仅有的两个女高中生之一,那是她人生的高光时刻。

如今她年过 60,想让我用 AI 给老照片上色,怀念一下。但你知道,这种大集体合照对 AI 来说就“噩梦级别”,不是把脸改得“不成人样”,就是整个画面颜色十分诡异。

刚好今天 Nano Banana Pro 上线,我又拿它试了试:

效果简直让人惊叹,妈妈看到照片,掩饰不住愉快之情,声音里带着笑意:“真棒,真棒......”在那一刻,我好像看到了那个 1979 年意气风发的少女。

目前,Nano Banana Pro 已经正式上线了。

直接打开 Gemini App 或者网页版,选择“工具-制作图片”,然后选择 Gemini 3 Pro 的“思考”模型,就能直接调用。免费版用户也能用,但有限额。

此外,谷歌自家的 Vertex AI Studio(进入网页后,选择“gemini-3-pro-image-preview”就是 Nano Banana Pro 了),或者 ZenMux 这类第三方 AI 聚合网站,也已经提供了 Nano Banana Pro 的预览版。

没有特殊标注,图片均为作者生成

本文来自微信公众号“果壳”(ID:Guokr42),作者:宛潼,编辑:沈知涵,36氪经授权发布。

+1
29

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

休闲市场的未来,是土耳其vs中国?

1小时前

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业