最初的Nano Banana席卷了 AI 艺术界,迅速成为创作者的首选模型之一。自然而然地, Nano Banana 2的到来吸引了大量关注。此次更新侧重于更灵活的工作流程——提供自定义宽高比和原生 2K 输出,而无需漫长的等待时间。
在将新功能推向极限后,我发现它虽然能对画布提供令人难以置信的控制,但在渲染复杂、数据量大的文本时仍然会遇到瓶颈。以下是我对它如何处理自定义比例与排版精度的分析。
Nano Banana 2有哪些新功能?
Nano Banana 2在其先前版本的基础上,引入了多项技术升级,专为需要在预算内获得高质量素材的创作者而设计:
- 速度和效率提升:生成高分辨率图像现在大约需要 20 秒。对于大批量任务,这既更快,也更具成本效益。
- 默认 2K 输出:该模型已不再使用低分辨率预览。现在,它默认采用 2K 分辨率,从而省去了许多项目中的额外升级步骤。
- 解锁宽高比:该模型现在可以生成几乎任何宽高比的图像。虽然默认值为 16:9,但用户可以指定常见格式,如纵向 (3:2)、正方形 (1:1) 或超宽 (21:9)。它甚至支持 8:1 甚至 10:1 等极端自定义比例。
性能测试:组合和文本精度
为了评估该模型的优缺点,我进行了一系列测试,重点关注其新的宽高比功能以及遵循基于文本的指令的能力。
测试 1:超宽滚动
我的第一次测试旨在突破新宽高比设置的界限,看看模型是否能在极宽的画布上保持场景的连贯性。
| 提示 | 一个8:1比例的连续奇幻风景卷轴。从左到右:一片神秘的森林,一条发光的河流,以及日落下的远山。 |
| 输出 | ![]() |
测试 2:文本精度和排版逻辑
接下来,我测试了该模型在复杂场景中渲染特定单词的能力,这是生成式人工智能面临的一项常见挑战。
| 提示 | 输出 |
| 一张大黑板上写着一家时髦咖啡店的详细菜单。顶部写着“NANO ROASTERS”。下面有三个部分。第一部分:“意式浓缩咖啡 3.50”, “拿铁 4.50”。第二部分:“Chemex 6.00”, “Aeropress 5.00”。第三部分:“羊角面包 3.00”, “松饼 2.50”。 | ![]() |
整体图像质量和高分辨率纹理都非常出色,但文本的逻辑执行效果一般。
虽然主要标题基本没问题,但模型完全遗漏了第 2 节中商品的定价。
此外,它还在黑板上幻现出许多提示中从未提及的额外产品和文字。这表明,虽然它能绘制出漂亮的文字元素,但它在严格遵守精确数据方面有所欠缺。
观察:比例灵活性与细节准确性
虽然Nano Banana 2在工作流程速度和自定义构图方面取得了巨大飞跃,但它显然更注重创建令人印象深刻的视觉环境,而不是严格遵循文本指令。
优点
- 画布完全自由:不受限制的宽高比支持允许极端的自定义尺寸(如 8:1 或 10:1),同时保持出色的构图逻辑并避免重复模式。
- 闪电般的 2K 输出:在大约 20 秒内生成原生 2K 分辨率图像,完全无需二次升频步骤,从而大大加快了工作流程的迭代速度。
缺点:
- 文本和数据遵循性弱:在处理密集、结构化的文本提示时存在显著困难,经常忽略精确数据(如具体数字或价格),并用幻觉文本填充画布。
结语
Nano Banana 2并非一款完美的万能型产品;它是一款专为速度和布局而打造的专业产品。如果您需要 8:1 或 10:1 等超宽比例,那么快速的 20 秒 2K 输出可以节省大量时间,无需单独进行升频。
但是,请对它的局限性保持现实。文本精度仍然是它的阿喀琉斯之踵。幸运的是,当您在Pollo AI上使用Nano Banana 2时,您拥有灵活性。如果您的项目需要完美的排版或复杂的数据精度, Pollo AI还有其他模型可供您使用。
我的建议?使用Nano Banana 2来实现高分辨率的环境、光照和构图,然后在后期制作中处理精确的文本。这是一个很有用的专业工具,适合你的工具包——非常适合概念艺术和宽幅背景——只要你知道它最适合在哪里使用,以及在哪里会遇到瓶颈。

