太炸裂了,全网实测Nano Banana Pro,网友:这模型里到底装了什么鬼东西
炸裂!太炸裂了!
谷歌Nano Banana Pro一出世,全网都开始直呼:
这模型里到底装了什么鬼东西!
硅谷VC大佬Deedy首先分享了自己的实测案例,看完只能说真不怪网友大惊小怪(doge)。
扔给它一份英伟达最新财报PDF文件,结果它秒秒钟生成了一张重点突出、内容精致的图表:
又或者直接将未加工的Graphviz图表代码丢给它,结果一次性就生成了带logo的可视化效果图:
更别提各种论文流程图、核心概念解释图了(连Transformer架构图都能AI直出):
总之短短几小时过去,𝕏现在已经掀起了一股Nano Banana Pro疯玩热潮:
呼~Nano Banana Pro真有这么强吗?咱们这就实测见真章。
实测Nano Banana Pro
前情提醒,Nano Banana Pro是谷歌趁着Gemini 3 Pro好评如潮而推出的最新、最强文生图模型。
它又名Gemini 3 Pro Image,整合了Gemini 3 Pro的多模态理解能力以及谷歌搜索的知识库,能理解现实语义与物理逻辑。
其主要升级之处体现在:
- 更高画质和分辨率,支持2K、4K高清分辨率及多种宽高比 (如方形 1:1、超宽画幅2.76:1) ;
- 文字渲染能力大幅提升,支持多语言直接渲染或翻译 (如将图片中的英文翻译成中文、韩文等) ;
- 支持最多14张图像融合生成;
- 基于Gemini 3 Pro的多模态理解能力,支持生成复杂专业图表。
目前,普通用户可以在Gemini应用中免费体验——选择“创建图像”功能时就能使用,不过免费用户有额度限制,超出后会回退到原始的Nano Banana模型。Google AI Plus、Pro和Ultra订阅用户则享有更高的配额。
实测第一弹,先上个开胃小菜——拆解一辆自行车。
提示词:Exploded view diagram of a bicycle frame and components, technical blueprint, aesthetic cyanotype print, annotated with measurements in millimeters, disassembled gears and chain, perspective view, clean lines, on a white background —ar 16:9 —style raw
大概要求是,生成一辆自行车车架及组件的爆炸视图,拥有已拆卸的齿轮和链条,以毫米为单位进行尺寸标注等。
而Nano Banana Pro经过一番深度思考后,很快就生成了下图:
肉眼对比原图好像确实像样儿,不过为了更严谨点,我们这里找来了ChatGPT帮忙“客观点评”一下。
而ChatGPT也对照要求进行了逐项打分,最终认定:完成度确实很高。
再试试图像融合呢~为了节省时间,我们直接把难度拉满——让14只娃娃坐在一起看电视。
提示词:These dolls are seated on the same sofa while watching TV.
而Nano Banana Pro原图直出如下:
先不说别的,整个氛围感确实很符合要求,玩偶们排排坐在沙发上看动画。而且落地灯照出的光影和玩偶在窗户里的背影这些细节都考虑到了,整体生成效果相当不错。
唯一的遗憾是娃娃数量凑不够14只,转念一想可能是有的玩偶不爱看电视吧(bushi~
当然,最大的问题或许还是出在提示词上,这里我们指代的过于宽泛了(“These dolls”),换成更清晰的14个娃娃可能效果会好一点。
因为深扒Nano Banana Pro的思考过程,我们发现它自己其实会重点考虑这些细节之处的指令遵循情况。
同样的情况,谷歌那边就尝试成功了:
以及提醒一下,大约测试了三回左右,咱们普通用户的体验之旅就到此结束了(遗憾退场……
不过,从上述简单实测我们也能感受到,Nano Banana Pro确实能打。其整体实力相当强悍,几乎凭一己之力使得我们离AI生成的图片完全真正可用更进一步了。
更多网友实测也印证了这一点——
Nano Banana Pro正在掀起生图热潮
有一说一,AI生图这事儿确实和每个人的提示词构思水平息息相关。
你瞧,如果把Nano Banana Pro放到一些脑洞大开、拥有各种奇思妙想的网友手中,那才叫一个玩出花了。
把谷歌博客照搬进一本杂志里,什么配图、排版……通通Nano Banana Pro自己搞定。
“灵魂草图”反手就变成了撕漫感插画,尤其是很好地拿捏住了这不屑的眼神:“灵魂草图”反手就变成了撕漫感插画,尤其是很好地拿捏住了这不屑的眼神:
给一张人物参考图,Nano Banana Pro仅需1分钟就生成了带故事情节的条漫,制作水平令网友直呼可怕。
动动嘴还能直出世界杯对决海报:
各种结构分解图更是手拿把掐:
谷歌CEO皮猜和哈萨比斯的同框图也有了:
用来制作一些精美的手册、指南也不是不行(下图为奥地利州狩猎参考指南):
甚至,由于它对物理世界的理解更强了,所以生成的透明物体也经受住了光影考验。
一片热闹中,连谷歌CEO皮猜也亲自贡献了一张图,顺带也替Nano Banana Pro站了一波台:
它拥有最先进的图像生成和编辑功能,具备更高级的世界知识、文本渲染、精度和控制能力。基于Gemini 3构建,它非常擅长制作复杂的图表——就像工程师看待世界的方式一样。
so,你觉得Nano Banana Pro这波表现如何?你还发现了哪些玩法吗?
(欢迎评论区带图分享)
参考链接:
[1]https://x.com/deedydas/status/1991549985088041427
[2]https://x.com/deedydas/status/1991548498328818030
[3]https://x.com/omarsar0/status/1991537283175194752
本文来自微信公众号“量子位”,作者:一水,36氪经授权发布。















