首頁/部落格/評論/我試用了Google Nano Banana 3,這就是為什麼它目前是精準度最高的 AI 圖像模型。

我試用了Google Nano Banana 3,這就是為什麼它目前是精準度最高的 AI 圖像模型。

Google在AI圖像生成領域一直快速發展,而Nano Banana就反映了這個趨勢。它建立在Gemini的基礎上,超越了基本的圖像生成,朝向一個更可控的系統發展。

根據Google的說法, 他們的圖像模型結合了世界知識、推理和視覺生成,以產生更準確、更有用的結果。

有了Nano Banana 3,這個方向變得更明確了。它不只提升了輸出品質,更在先前的版本基礎上,強化了控制力、提升了穩定性,並提供了更完整的創作體驗

從我的角度來看,它之所以有趣,是因為它如何融入 Google 的生態系統。在像Flow這樣的平台上,圖像生成成為更廣泛的創意工作流程的一部分,而不是最後一步。

我很好奇這東西實際用起來到底怎麼樣,所以決定自己來測試一下。

在測試了Google Nano Banana 3 之後,最讓我印象深刻的是它給你的掌控度。你可以輕鬆地調整語氣、套用風格,並生成清晰易讀的文字。它感覺更像是一個創意工具,而不是一個典型的模型。

不過,它的表現不一定總是那麼穩定。當提示詞比較複雜,或是需要多步驟編輯的時候,結果可能會跑偏,讓它在要求比較高的工作流程中,可靠性會降低。

我們來仔細看看Nano Banana 3 在實際使用中的表現如何。

Nano Banana 3有什麼升級的地方?

  • 精準的風格控制:透過簡單的提示,輕鬆調整圖像的外觀和感覺,以符合不同的情緒、風格或品牌方向。
  • 參考式風格轉換:套用參考圖片的風格,同時保持輸出內容的主題一致。
  • 清晰文字生成:生成帶有清晰、易讀文字的圖像,適用於海報、廣告和社群內容。
  • 多格式輸出,靈活運用:製作並調整圖片尺寸與版面,以符合不同平台的需求。
  • 保持主題一致性:在多種變化中,讓角色和物件保持一致。
  • 快速迭代與控制:快速生成並優化輸出,結果穩定且可預期。

Nano Banana 3 有什麼厲害的地方?

精準震動控制

我一開始就發現,這個工具的控制感非常直接。我不用一直修改提示詞,就能更精準地調整圖像的氛圍和風格。

大部分的工具,要達到理想的效果,通常需要隨機嘗試幾次。但這個工具感覺比較可預測,讓整個過程更順暢,尤其是在追求特定外觀的時候。

為了測試這個功能,我試著將同一張圖片從明亮的白天風格轉換成較暗的電影風格。過渡過程很流暢,整體氛圍也改變了,但圖片本身沒有受到影響。

輸入圖片輸出圖片
白天,一個白雪覆蓋的沿海村莊,有著色彩繽紛的房子。
海邊的雪山村莊上空,絢麗的極光閃耀。

基於參考的風格轉換

我覺得這裡最有趣的地方是它處理參考資料的方式。我不用用文字描述所有東西,我只需要提供一個簡單的草圖和一張風格參考圖作為靈感。

在大多數的工具中,這種混合方式會破壞結構或忽略參考。但這裡,它卻能將兩個輸入合併成一個乾淨的結果。

我用一張粗略的汽車草圖和一張水母圖片來測試這個功能。輸出的結果是一輛半透明、果凍狀的車子,形狀和紋理都很一致,感覺出乎意料地有設計感,而不是隨機生成的。

輸入圖片輸出圖片
一張簡單的汽車線稿圖
水母在水裡漂浮的特寫鏡頭
這款概念車的設計靈感來自半透明的水母造型。

生成清晰的文字

文字通常是比較容易出問題的地方,所以我想要看看它到底能做到什麼程度。沒想到,它處理裝飾性文字的能力比我預期的還要好很多。

大部分情況下,我會預期字體會斷裂或間距會很亂。但這裡的字體不僅清晰易讀,而且風格也跟圖片很搭。

我用這個方法測試,產生了一個店面風格的視覺效果,上面有分層的文字,像是「Menially Tornabuoni Strada 64」。結果看起來很精緻,感覺就像是真實的招牌,而不是AI生成的文字。

復古風格餐廳窗戶字體設計

多種格式輸出,靈活運用

我還發現,同一個視覺設計在不同格式中都能很好地呈現,這點讓我很驚訝。我不需要為了適應新的版面配置而重新構圖或重新生成。

通常,調整圖片大小可能會裁切掉關鍵細節或破壞構圖。但這裡,主體在不同尺寸的圖片中都保持置中且完整。

我用一張直幅照片來測試,把它改成寬幅的橫幅。構圖還是很不錯,而且過程中沒有任何重要的東西被裁掉。

輸入圖片輸出圖片
一張柔光人像照,主題周圍環繞著羽毛。
一個人抬頭看著,周圍飄著羽毛。

保持主題一致性

通常,當事情牽涉到多個世代時,一致性是個難以維持的點。但這次,即使經過幾次編輯,主題還是保持得相當穩定。

這樣一來,我們就能輕鬆地製作出不同版本,同時又不會失去原本的特色,這對說故事或品牌視覺設計來說很重要。

我透過生成同一個角色的多種變體來測試這個功能。雖然不完美,但核心特徵在不同輸出中都保持了可辨識性。

輸入圖片輸出圖片
三個朋友在戶外咖啡廳喝汽水、聊天。
三個朋友在咖啡廳笑著喝水。

一群朋友在戶外咖啡廳開心地聊天。
朋友們在咖啡廳的桌子旁舉杯慶祝。

Nano Banana 3 可以改進的地方

快速迭代與控制

這是我覺得跟預期有點落差的地方。雖然Nano Banana 3 速度很快,但在做小幅度的調整時,操控感會有點過於靈敏。

主題保持不變,但微調不一定都是細微的。像是調整光線或表情這種小改變,有時候反而會有出乎意料的效果。

舉例來說,我試著一步一步地調整燈光,但有些輸出的結果在氛圍上變化太大,讓我很難精準地調出我想要的感覺。

當我用Seedream 5.0 Lite試用同樣的設定時,燈光感覺更平衡、更自然。它能更好地處理細微的調整,而不會讓氣氛變得太過。

輸入圖片輸出圖片
一個戴著太陽眼鏡的時尚玩具公仔,旁邊放著幾本藝術書籍。
Nano Banana3: 一個玩具公仔,旁邊放著幾本書,在陽光下,鏡頭還會產生光暈。

Seedream 5.0 Lite:

一個玩具公仔擺在書架前,旁邊還有一本藝術畫冊。

Pollo AI如何解決Nano Banana 3 的限制

在跟Nano Banana 3 互動了一段時間後,我開始感覺到它哪些地方用起來很順手,哪些地方還有待加強,尤其是在精細操作方面。這也是為什麼我會想把它整合到Pollo AI裡面,而不是單獨使用它。

我喜歡在Pollo AI上使用Nano Banana 3 的原因,就是它的靈活性。你不會被單一模型給限制住。我可以根據任務的不同,在Nano Banana 3、 Kling 3.0GPT-4o之間切換,這讓整個工作流程更具適應性。

更重要的是, Pollo AI除了提示功能之外,還提供額外的控制選項。像是Pollo AnglesPollo Relight這類的工具,讓我可以直接調整視角和光線。

在我測試的時候,我發現與其重新生成圖片,我可以用 Pollo relight 更精確地調整光線,這讓整個過程更快、也更有掌控度。

總結

Nano Banana 3 並不是要做到面面俱到,但它在整體輸出品質和易用性方面做得相當不錯。從塑造圖像氛圍到套用風格,再到生成清晰的視覺效果,它感覺就像一個實用的工具,你可以真正依賴它來完成實際的創意工作。

話說回來,它也不是沒有缺點。精細的控制有時候會感覺有點過度靈敏,尤其是在做小幅度的調整時,這讓在更複雜的工作流程中進行精確的微調變得比較難以預測。

我的看法是?先用Nano Banana 3 快速鎖定整體外觀、構圖和風格,然後再視需要微調細節。

而且,如果你是在Pollo AI上使用它,你也可以靈活地在不同模型之間切換,這樣在需要更高精確度的時候,就能更容易地補足不足。

您可能也喜歡

查看更多

最佳CometAPI替代方案:誠實評論和我的最佳 7 款選擇

了解 7 個最佳CometAPI替代方案。探索哪些平台提供更優質的支援、更清晰的文件和更靈活的定價,以滿足您的獨特需求。

Replicate 的最佳替代方案:我的 7 大首選

厭倦了使用 Replicate 進行 AI API 整合嗎?請繼續閱讀,我將探索其他 7 種替代方案,例如 Pollo AI API,我確信它們能提供更好的成本效益、可擴展性等等。

最佳 AI 影片生成開源替代Runway

正在尋找Runway開源替代品?在本文中發現最好的免費 AI 影片產生器。立即開始創建高品質的 AI 生成影片!

我嘗試過的 10 個最佳Sora替代品,確實有效

正在尋找像Sora這樣優秀的 AI 影片工具?我測試了 10 個很棒的替代方案,它們簡單易用,還能快速製作出精彩的影片。非常適合初學者以及所有喜歡用 AI 製作影片的人!