Nano Banana 2 深度实测:谷歌这次到底行不行?
昨天,谷歌正式发布了新一代 AI 生图模型 Nano Banana 2,官方代号是 Gemini 3.1 Flash Image。
昨天,谷歌正式发布了新一代 AI 生图模型 Nano Banana 2,官方代号是 Gemini 3.1 Flash Image。
去年 8 月,第一代 Nano Banana 横空出世,靠着惊艳的图像编辑能力迅速在全球爆火,四天内吸引了 1300 万新用户。11 月,Pro 版本跟进,进一步拉高了质量上限。这次的 Nano Banana 2,谷歌的说法是:把 Pro 的能力,装进了 Flash 的速度里。
听起来很美。但实际怎么样?我们来认真拆一拆。
真正进步的地方
先说让人眼前一亮的部分。
第一个是文字渲染。Nano Banana Pro 已经把中文渲染做得相当不错了,但偶尔还是会出现笔画糊掉、字形不准的情况。Nano Banana 2 在这个基础上又进了一步。有人测试让它生成一幅《枫桥夜泊》水墨画,「月落乌啼霜满天」这几个字被端端正正地用书法写出来了,排版和意境都拿捏得不错。中文信息图、海报、漫画对白,都能处理。当然,仔细看还是会有小瑕疵,比如偶尔多出一个字,但整体稳定性比前代又上了一个台阶。
第二个是世界知识接入。Nano Banana 2 能联网搜索实时信息,用来生成更准确的图像。你让它画上海东方明珠被巨猫占领,它能精准还原地标建筑,光影和透视关系也处理得很自然。这背后是 Gemini 积累的庞大真实世界知识库在支撑。
第三个是主体一致性。这次最多能保持 5 个角色的外貌不变,或者 14 个物品的样子不变。对于做连载漫画、影视分镜、品牌视觉的人来说,这是实实在在的生产力提升。
第四个是分辨率和宽高比。从 512px 的小图到 4K 超高清,支持 14 种宽高比,包括 1:4、4:1 这种极端比例,基本覆盖了所有使用场景。
没那么完美的地方
说完优点,说说让人皱眉头的地方。
速度问题是目前最大的槽点。谷歌宣传的是 Flash 级别的快,但实测下来,API 调用的生成时间大约在 100 秒左右。这不是模型本身的问题,是谷歌的算力供给跟不上。2 月份谷歌的 Gemini 基础设施一直在承压,新模型上线后算力更加紧张。谷歌官方承认需求远超预期,正在扩容。按照历史经验,这个问题通常在新模型发布后 1 到 4 周内解决。但现在这个时间点,速度确实还没达到宣传水平。
实时数据不总是准确。有测试者让它生成一张实时天气信息图,结果拉取的是上周的数据,需要手动纠正。联网能力是加分项,但不能完全依赖它的准确性。
跨维度融合效果退步了。把二次元角色、铅笔素描和黏土人放进同一个真实咖啡馆场景,素描人物的融入非常生硬,边缘过渡不自然。这个场景在前代模型里反而处理得更好。
复杂提示词偶尔会误解。对于层次很多、条件很复杂的提示词,Nano Banana 2 有时候会抓错重点。这方面 Pro 版本依然更稳。
还有一个让老用户不满的地方:谷歌把 Nano Banana 2 设为默认模型,同时把原来的 Nano Banana 和 Nano Banana Pro 从主界面撤掉了。Pro 订阅用户以前每天有 1000 张 Nano Banana 加 100 张 Pro,现在统一换成了 Nano Banana 2,实际可用配额反而大幅缩水。这个操作在社区里引发了不少抱怨。
价格和可用性
这是 Nano Banana 2 最有说服力的地方。