Google กำลังพัฒนาเทคโนโลยีการสร้างภาพด้วย AI อย่างรวดเร็ว และ Nano Banana ก็สะท้อนให้เห็นถึงการเปลี่ยนแปลงนั้น โดยสร้างขึ้นบน Gemini จึงก้าวข้ามการสร้างภาพแบบพื้นฐานไปสู่ระบบที่ควบคุมได้มากขึ้น
จากข้อมูลของ Googleโมเดลภาพของ Google ผสานความรู้เกี่ยวกับโลก การให้เหตุผล และการสร้างภาพเข้าด้วยกัน เพื่อให้ได้ผลลัพธ์ที่แม่นยำและใช้งานได้ดียิ่งขึ้น
ด้วย Nano Banana 3 ทิศทางนี้จึงชัดเจนยิ่งขึ้น แทนที่จะแค่ปรับปรุงคุณภาพของผลลัพธ์ มันยังต่อยอดจากเวอร์ชันก่อนหน้าด้วยการควบคุมที่แข็งแกร่งขึ้น ความสม่ำเสมอที่ดีขึ้น และประสบการณ์การสร้างสรรค์ที่สมบูรณ์ยิ่งขึ้น
ในมุมมองของผม สิ่งที่ทำให้มันน่าสนใจคือวิธีที่มันเข้ากับระบบนิเวศของ Google ภายในแพลตฟอร์มอย่าง Flow การสร้างภาพกลายเป็นส่วนหนึ่งของกระบวนการทำงานสร้างสรรค์ที่กว้างขึ้น ไม่ใช่ขั้นตอนสุดท้าย
ด้วยความอยากรู้ว่ามันจะใช้งานได้ดีแค่ไหนในสถานการณ์จริง ผมจึงตัดสินใจทดสอบด้วยตัวเอง
หลังจากทดสอบ Google Nano Banana 3 แล้ว สิ่งที่โดดเด่นคือการควบคุมที่มันมอบให้ คุณสามารถ ปรับแต่งบรรยากาศ ใส่สไตล์ และสร้างข้อความที่สะอาดตาและอ่าน ง่ายได้อย่างง่ายดาย รู้สึกเหมือนเป็นเครื่องมือสร้างสรรค์มากกว่าเป็นโมเดลทั่วไป
อย่างไรก็ตาม ผลลัพธ์ที่ได้อาจไม่คงที่เสมอไป เมื่อมีคำสั่งที่ซับซ้อนมากขึ้นหรือการแก้ไขหลายขั้นตอน ผลลัพธ์อาจคลาดเคลื่อน ทำให้ไม่น่าเชื่อถือสำหรับขั้นตอนการทำงานที่ต้องการความแม่นยำสูง
มาดูกันให้ละเอียดขึ้นว่า Nano Banana 3 ทำงานได้จริงอย่างไรบ้าง
มีอะไรได้รับการอัปเกรดใน Nano Banana 3 บ้าง ?
- การควบคุมบรรยากาศอย่างแม่นยำ : ปรับแต่งรูปลักษณ์และบรรยากาศของภาพให้เข้ากับอารมณ์ สไตล์ หรือทิศทางของแบรนด์ได้อย่างง่ายดายด้วยคำแนะนำง่ายๆ
- การถ่ายโอนสไตล์โดยอ้างอิงจาก ภาพต้นแบบ: นำสไตล์จากภาพต้นแบบมาใช้โดยคงความสอดคล้องของตัวแบบในทุกผลลัพธ์
- การสร้างข้อความที่คมชัด : สร้างภาพที่มีข้อความคมชัดอ่านง่าย เหมาะสำหรับโปสเตอร์ โฆษณา และเนื้อหาโซเชียลมีเดีย
- การส่งออกหลายรูปแบบที่ยืดหยุ่น : สร้างและปรับแต่งภาพให้มีขนาดและรูปแบบต่างๆ สำหรับแพลตฟอร์มต่างๆ
- การรักษาความสม่ำเสมอของตัวละครและวัตถุ : รักษาความสม่ำเสมอของตัวละครและวัตถุในรูปแบบต่างๆ
- การทำงานซ้ำและการควบคุมที่รวดเร็ว : สร้างและปรับปรุงผลลัพธ์ได้อย่างรวดเร็วด้วยผลลัพธ์ที่เสถียรและคาดการณ์ได้
อะไรทำให้ Nano Banana 3 น่าประทับใจ
การควบคุมการสั่นสะเทือนที่แม่นยำ
หนึ่งในสิ่งแรกที่ผมสังเกตเห็นคือการควบคุมที่ตรงไปตรงมา แทนที่จะต้องปรับแต่งข้อความแจ้งเตือนซ้ำแล้วซ้ำเล่า ผมสามารถปรับอารมณ์และโทนของภาพได้อย่างตั้งใจมากขึ้น
ในเครื่องมือส่วนใหญ่ การจะได้บรรยากาศที่ต้องการนั้นต้องลองผิดลองถูกอยู่หลายครั้ง แต่ในเครื่องมือนี้กลับคาดเดาได้ง่ายกว่า ทำให้กระบวนการทั้งหมดราบรื่นขึ้น โดยเฉพาะอย่างยิ่งเมื่อต้องการได้ลุคที่เฉพาะเจาะจง
เพื่อทดสอบเรื่องนี้ ฉันลองเปลี่ยนภาพเดียวกันจากภาพที่ให้ความรู้สึกสดใสในเวลากลางวันไปเป็นภาพที่มืดกว่าและให้ความรู้สึกแบบภาพยนตร์ การเปลี่ยนภาพนั้นราบรื่น และอารมณ์โดยรวมเปลี่ยนไปโดยไม่ทำให้ภาพเสียไป
| รูปภาพอินพุต | ภาพผลลัพธ์ |
![]() | ![]() |
การถ่ายโอนสไตล์โดยอ้างอิงจากแบบอ้างอิง
สิ่งที่ฉันพบว่าน่าสนใจคือวิธีการจัดการกับข้อมูลอ้างอิงอย่างเป็นธรรมชาติ แทนที่จะอธิบายทุกอย่างด้วยคำพูด ฉันสามารถใส่ภาพร่างง่ายๆ และภาพอ้างอิงสไตล์เพื่อเป็นแรงบันดาลใจได้เลย
ในเครื่องมือส่วนใหญ่ การผสมผสานแบบนี้จะทำให้โครงสร้างเสียหายหรือละเลยการอ้างอิง แต่ในกรณีนี้ มันกลับผสานอินพุตทั้งสองเข้าด้วยกันได้อย่างลงตัว
ฉันทดสอบโดยการนำภาพร่างรถแบบคร่าวๆ มาผสมผสานกับภาพแมงกะพรุน ผลลัพธ์ที่ได้คือยานพาหนะโปร่งแสงคล้ายเจลลี่ที่มีรูปทรงและพื้นผิวสม่ำเสมอ ซึ่งให้ความรู้สึกว่าตั้งใจทำมากกว่าที่จะเป็นเรื่องบังเอิญอย่างน่าประหลาดใจ
| รูปภาพอินพุต | ภาพผลลัพธ์ |
![]() ![]() | ![]() |
การสร้างข้อความที่ชัดเจน
โดยปกติแล้ว ข้อความมักเป็นจุดที่ทำให้ทุกอย่างดูไม่ลงตัว ดังนั้นฉันจึงอยากลองดูว่ามันจะทำได้ดีแค่ไหน ปรากฏว่ามันจัดการกับข้อความตกแต่งได้ดีกว่าที่ฉันคาดไว้มาก
โดยปกติแล้ว ฉันมักจะคาดหวังว่าจะเห็นตัวอักษรที่ขาดๆ หายๆ หรือช่องว่างที่ไม่เป็นระเบียบ แต่ในกรณีนี้ การจัดวางตัวอักษรไม่เพียงแต่สามารถอ่านได้เท่านั้น แต่ยังสอดคล้องกับรูปแบบภาพอีกด้วย
ฉันได้ทดสอบโดยการสร้างภาพสไตล์หน้าร้านค้าที่มีข้อความซ้อนกัน เช่น “Menially Tornabuoni Strada 64” ผลลัพธ์ที่ได้ดูสวยงามและเหมือนป้ายจริงมากกว่าข้อความที่สร้างโดย AI

การส่งออกหลายรูปแบบที่ยืดหยุ่น
อีกสิ่งหนึ่งที่ฉันสังเกตเห็นคือ ภาพเดียวกันนั้นดูดีมากในรูปแบบต่างๆ ฉันไม่จำเป็นต้องปรับเฟรมหรือสร้างภาพใหม่เพื่อให้เข้ากับเลย์เอาต์ใหม่
โดยปกติแล้ว การปรับขนาดภาพอาจทำให้รายละเอียดสำคัญบางส่วนหายไป หรือทำให้องค์ประกอบภาพเสียไป แต่ในภาพนี้ ตัวแบบยังคงอยู่ตรงกลางและไม่เปลี่ยนแปลงไม่ว่าจะปรับขนาดภาพอย่างไรก็ตาม
ฉันได้ทดสอบโดยการนำภาพถ่ายแนวตั้งภาพเดียวมาปรับให้เป็นแบนเนอร์ขนาดกว้าง การจัดองค์ประกอบยังคงใช้ได้ดี และไม่มีส่วนสำคัญใดสูญหายไปในกระบวนการนี้
| รูปภาพอินพุต | ภาพผลลัพธ์ |
![]() | ![]() |
การรักษาเนื้อหาอย่างสม่ำเสมอ
ความสม่ำเสมอเป็นจุดเริ่มต้นที่มักทำให้ทุกอย่างพังทลาย โดยเฉพาะอย่างยิ่งเมื่อข้ามรุ่นคน แต่ในกรณีนี้ เนื้อหาค่อนข้างคงที่แม้จะมีการแก้ไขหลายครั้งแล้วก็ตาม
นั่นทำให้การสร้างรูปแบบต่างๆ โดยไม่สูญเสียเอกลักษณ์ดั้งเดิมทำได้ง่ายขึ้นมาก ซึ่งเป็นสิ่งสำคัญสำหรับการเล่าเรื่องหรือภาพลักษณ์ของแบรนด์
ฉันได้ทดสอบโดยการสร้างตัวละครเดียวกันในหลายรูปแบบ แม้จะไม่สมบูรณ์แบบ แต่ลักษณะสำคัญยังคงจดจำได้ในทุกผลลัพธ์
| รูปภาพอินพุต | ภาพผลลัพธ์ |
![]() | ![]() ![]() ![]() |
Nano Banana 3 สามารถปรับปรุงในด้านใดบ้าง
การทำซ้ำอย่างรวดเร็วและการควบคุม
นี่เป็นจุดหนึ่งที่ผมรู้สึกว่าค่อนข้างไม่ตรงกับความคาดหวังของผม แม้ว่า Nano Banana 3 จะเร็ว แต่การควบคุมอาจรู้สึกไวเกินไปเล็กน้อยเมื่อทำการปรับเปลี่ยนเล็กๆ น้อยๆ
เนื้อหาหลักยังคงเหมือนเดิม แต่การปรับแต่งรายละเอียดนั้นไม่ใช่เรื่องง่ายเสมอไป การเปลี่ยนแปลงเล็กน้อย เช่น การปรับแสงหรือการแสดงออกทางสีหน้า บางครั้งอาจส่งผลมากกว่าที่คาดไว้
ตัวอย่างเช่น ฉันลองปรับแสงทีละขั้นตอน แต่ผลลัพธ์บางอย่างทำให้บรรยากาศเปลี่ยนไปมากเกินไป ทำให้ยากที่จะปรับแต่งให้ได้ลุคที่ต้องการอย่างแท้จริง
เมื่อผมลองใช้การตั้งค่าเดียวกันกับ Seedream 5.0 Lite แสงสว่างดูสมดุลและเป็นธรรมชาติมากขึ้น ปรับแต่งได้อย่างละเอียดอ่อนได้ดีกว่า โดยไม่ทำให้บรรยากาศดูจัดจ้านเกินไป
| รูปภาพอินพุต | ภาพผลลัพธ์ |
![]() | Nano Banana 3: ![]() Seedream 5.0 Lite: ![]() |
Pollo AI แก้ไขข้อจำกัดของ Nano Banana 3 ได้อย่างไร
หลังจากใช้เวลาอยู่กับ Nano Banana 3 สักระยะ ผมเริ่มรู้สึกว่ามันทำงานได้ดีในด้านใดบ้าง และยังมีข้อจำกัดในด้านใดบ้าง โดยเฉพาะอย่างยิ่งในเรื่องการควบคุมที่ละเอียดอ่อน นั่นเป็นเหตุผลที่ทำให้ผมลองใช้มันร่วมกับ Pollo AI แทนที่จะใช้มันแบบเดี่ยวๆ
สิ่งที่ฉันชอบเกี่ยวกับการใช้ Nano Banana 3 กับ Pollo AI คือความยืดหยุ่น คุณไม่ถูกจำกัดอยู่แค่รุ่นเดียว ฉันสามารถสลับไปมาระหว่าง Nano Banana 3, Kling 3.0 และ GPT-4o ได้ตามงาน ซึ่งทำให้ขั้นตอนการทำงานมีความยืดหยุ่นมากขึ้น
ที่สำคัญกว่านั้น Pollo AI ยังให้การควบคุมที่มากกว่าแค่การแสดงคำแนะนำ เครื่องมืออย่าง Pollo Angles และ Pollo Relight ช่วยให้ฉันปรับมุมมองและแสงได้โดยตรง
จากการทดสอบของผม แทนที่จะสร้างภาพใหม่ ผมสามารถใช้ Pollo relight เพื่อแก้ไขแสงได้อย่างแม่นยำกว่ามาก ซึ่งทำให้กระบวนการทั้งหมดเร็วขึ้นและควบคุมได้ดียิ่งขึ้น
ข้อคิดส่งท้าย
Nano Banana 3 อาจไม่ได้พยายามเป็นทุกอย่าง แต่ทำได้ดีมากในเรื่องคุณภาพของผลลัพธ์โดยรวมและการใช้งาน ตั้งแต่การปรับแต่งบรรยากาศของภาพ การใช้สไตล์ และการสร้างภาพที่คมชัด รู้สึกเหมือนเป็นเครื่องมือที่ใช้งานได้จริงและเชื่อถือได้สำหรับงานสร้างสรรค์จริงๆ
ถึงกระนั้น มันก็มีข้อจำกัดอยู่บ้าง การควบคุมอย่างละเอียดอาจรู้สึกว่าตอบสนองไวเกินไป โดยเฉพาะอย่างยิ่งเมื่อทำการปรับเปลี่ยนเล็กน้อย ซึ่งทำให้การปรับแต่งอย่างแม่นยำคาดเดาได้ยากขึ้นในขั้นตอนการทำงานที่ซับซ้อนกว่า
ความคิดเห็นของผม? ใช้ Nano Banana 3 เพื่อล็อคภาพรวม องค์ประกอบ และสไตล์อย่างรวดเร็ว จากนั้นค่อยปรับแต่งรายละเอียดหากจำเป็น
และหากคุณใช้งานบน Pollo AI คุณยังมีความยืดหยุ่นในการสลับระหว่างโมเดลต่างๆ ซึ่งจะช่วยให้เติมเต็มช่องว่างได้ง่ายขึ้นเมื่อต้องการความแม่นยำสูงขึ้น













