ฉันได้ทดสอบ Google Nano Banana 3 แล้ว และนี่คือเหตุผลว่าทำไมมันถึงเป็นโมเดลประมวลผลภาพ AI ที่แม่นยำที่สุดเท่าที่เคยมีมา

Google กำลังพัฒนาเทคโนโลยีการสร้างภาพด้วย AI อย่างรวดเร็ว และ Nano Banana ก็สะท้อนให้เห็นถึงการเปลี่ยนแปลงนั้น โดยสร้างขึ้นบน Gemini จึงก้าวข้ามการสร้างภาพแบบพื้นฐานไปสู่ระบบที่ควบคุมได้มากขึ้น

จากข้อมูลของ Googleโมเดลภาพของ Google ผสานความรู้เกี่ยวกับโลก การให้เหตุผล และการสร้างภาพเข้าด้วยกัน เพื่อให้ได้ผลลัพธ์ที่แม่นยำและใช้งานได้ดียิ่งขึ้น

ด้วย Nano Banana 3 ทิศทางนี้จึงชัดเจนยิ่งขึ้น แทนที่จะแค่ปรับปรุงคุณภาพของผลลัพธ์ มันยังต่อยอดจากเวอร์ชันก่อนหน้าด้วยการควบคุมที่แข็งแกร่งขึ้น ความสม่ำเสมอที่ดีขึ้น และประสบการณ์การสร้างสรรค์ที่สมบูรณ์ยิ่งขึ้น

ในมุมมองของผม สิ่งที่ทำให้มันน่าสนใจคือวิธีที่มันเข้ากับระบบนิเวศของ Google ภายในแพลตฟอร์มอย่าง Flow การสร้างภาพกลายเป็นส่วนหนึ่งของกระบวนการทำงานสร้างสรรค์ที่กว้างขึ้น ไม่ใช่ขั้นตอนสุดท้าย

ด้วยความอยากรู้ว่ามันจะใช้งานได้ดีแค่ไหนในสถานการณ์จริง ผมจึงตัดสินใจทดสอบด้วยตัวเอง

หลังจากทดสอบ Google Nano Banana 3 แล้ว สิ่งที่โดดเด่นคือการควบคุมที่มันมอบให้ คุณสามารถ ปรับแต่งบรรยากาศ ใส่สไตล์ และสร้างข้อความที่สะอาดตาและอ่าน ง่ายได้อย่างง่ายดาย รู้สึกเหมือนเป็นเครื่องมือสร้างสรรค์มากกว่าเป็นโมเดลทั่วไป

อย่างไรก็ตาม ผลลัพธ์ที่ได้อาจไม่คงที่เสมอไป เมื่อมีคำสั่งที่ซับซ้อนมากขึ้นหรือการแก้ไขหลายขั้นตอน ผลลัพธ์อาจคลาดเคลื่อน ทำให้ไม่น่าเชื่อถือสำหรับขั้นตอนการทำงานที่ต้องการความแม่นยำสูง

มาดูกันให้ละเอียดขึ้นว่า Nano Banana 3 ทำงานได้จริงอย่างไรบ้าง

มีอะไรได้รับการอัปเกรดใน Nano Banana 3 บ้าง ?
อะไรทำให้ Nano Banana 3 น่าประทับใจ
Nano Banana 3 สามารถปรับปรุงในด้านใดบ้าง
Pollo AI แก้ไขข้อจำกัดของ Nano Banana 3 ได้อย่างไร
ข้อคิดส่งท้าย

มีอะไรได้รับการอัปเกรดใน Nano Banana 3 บ้าง ?

การควบคุมบรรยากาศอย่างแม่นยำ : ปรับแต่งรูปลักษณ์และบรรยากาศของภาพให้เข้ากับอารมณ์ สไตล์ หรือทิศทางของแบรนด์ได้อย่างง่ายดายด้วยคำแนะนำง่ายๆ

การถ่ายโอนสไตล์โดยอ้างอิงจาก ภาพต้นแบบ: นำสไตล์จากภาพต้นแบบมาใช้โดยคงความสอดคล้องของตัวแบบในทุกผลลัพธ์

การสร้างข้อความที่คมชัด : สร้างภาพที่มีข้อความคมชัดอ่านง่าย เหมาะสำหรับโปสเตอร์ โฆษณา และเนื้อหาโซเชียลมีเดีย

การส่งออกหลายรูปแบบที่ยืดหยุ่น : สร้างและปรับแต่งภาพให้มีขนาดและรูปแบบต่างๆ สำหรับแพลตฟอร์มต่างๆ

การรักษาความสม่ำเสมอของตัวละครและวัตถุ : รักษาความสม่ำเสมอของตัวละครและวัตถุในรูปแบบต่างๆ

การทำงานซ้ำและการควบคุมที่รวดเร็ว : สร้างและปรับปรุงผลลัพธ์ได้อย่างรวดเร็วด้วยผลลัพธ์ที่เสถียรและคาดการณ์ได้

อะไรทำให้ Nano Banana 3 น่าประทับใจ

การควบคุมการสั่นสะเทือนที่แม่นยำ

หนึ่งในสิ่งแรกที่ผมสังเกตเห็นคือการควบคุมที่ตรงไปตรงมา แทนที่จะต้องปรับแต่งข้อความแจ้งเตือนซ้ำแล้วซ้ำเล่า ผมสามารถปรับอารมณ์และโทนของภาพได้อย่างตั้งใจมากขึ้น

ในเครื่องมือส่วนใหญ่ การจะได้บรรยากาศที่ต้องการนั้นต้องลองผิดลองถูกอยู่หลายครั้ง แต่ในเครื่องมือนี้กลับคาดเดาได้ง่ายกว่า ทำให้กระบวนการทั้งหมดราบรื่นขึ้น โดยเฉพาะอย่างยิ่งเมื่อต้องการได้ลุคที่เฉพาะเจาะจง

เพื่อทดสอบเรื่องนี้ ฉันลองเปลี่ยนภาพเดียวกันจากภาพที่ให้ความรู้สึกสดใสในเวลากลางวันไปเป็นภาพที่มืดกว่าและให้ความรู้สึกแบบภาพยนตร์ การเปลี่ยนภาพนั้นราบรื่น และอารมณ์โดยรวมเปลี่ยนไปโดยไม่ทำให้ภาพเสียไป

รูปภาพอินพุต	ภาพผลลัพธ์

การถ่ายโอนสไตล์โดยอ้างอิงจากแบบอ้างอิง

สิ่งที่ฉันพบว่าน่าสนใจคือวิธีการจัดการกับข้อมูลอ้างอิงอย่างเป็นธรรมชาติ แทนที่จะอธิบายทุกอย่างด้วยคำพูด ฉันสามารถใส่ภาพร่างง่ายๆ และภาพอ้างอิงสไตล์เพื่อเป็นแรงบันดาลใจได้เลย

ในเครื่องมือส่วนใหญ่ การผสมผสานแบบนี้จะทำให้โครงสร้างเสียหายหรือละเลยการอ้างอิง แต่ในกรณีนี้ มันกลับผสานอินพุตทั้งสองเข้าด้วยกันได้อย่างลงตัว

ฉันทดสอบโดยการนำภาพร่างรถแบบคร่าวๆ มาผสมผสานกับภาพแมงกะพรุน ผลลัพธ์ที่ได้คือยานพาหนะโปร่งแสงคล้ายเจลลี่ที่มีรูปทรงและพื้นผิวสม่ำเสมอ ซึ่งให้ความรู้สึกว่าตั้งใจทำมากกว่าที่จะเป็นเรื่องบังเอิญอย่างน่าประหลาดใจ

รูปภาพอินพุต	ภาพผลลัพธ์

การสร้างข้อความที่ชัดเจน

โดยปกติแล้ว ข้อความมักเป็นจุดที่ทำให้ทุกอย่างดูไม่ลงตัว ดังนั้นฉันจึงอยากลองดูว่ามันจะทำได้ดีแค่ไหน ปรากฏว่ามันจัดการกับข้อความตกแต่งได้ดีกว่าที่ฉันคาดไว้มาก

โดยปกติแล้ว ฉันมักจะคาดหวังว่าจะเห็นตัวอักษรที่ขาดๆ หายๆ หรือช่องว่างที่ไม่เป็นระเบียบ แต่ในกรณีนี้ การจัดวางตัวอักษรไม่เพียงแต่สามารถอ่านได้เท่านั้น แต่ยังสอดคล้องกับรูปแบบภาพอีกด้วย

ฉันได้ทดสอบโดยการสร้างภาพสไตล์หน้าร้านค้าที่มีข้อความซ้อนกัน เช่น “Menially Tornabuoni Strada 64” ผลลัพธ์ที่ได้ดูสวยงามและเหมือนป้ายจริงมากกว่าข้อความที่สร้างโดย AI

การออกแบบตัวอักษรตกแต่งหน้าต่างร้านอาหารสไตล์วินเทจ

การส่งออกหลายรูปแบบที่ยืดหยุ่น

อีกสิ่งหนึ่งที่ฉันสังเกตเห็นคือ ภาพเดียวกันนั้นดูดีมากในรูปแบบต่างๆ ฉันไม่จำเป็นต้องปรับเฟรมหรือสร้างภาพใหม่เพื่อให้เข้ากับเลย์เอาต์ใหม่

โดยปกติแล้ว การปรับขนาดภาพอาจทำให้รายละเอียดสำคัญบางส่วนหายไป หรือทำให้องค์ประกอบภาพเสียไป แต่ในภาพนี้ ตัวแบบยังคงอยู่ตรงกลางและไม่เปลี่ยนแปลงไม่ว่าจะปรับขนาดภาพอย่างไรก็ตาม

ฉันได้ทดสอบโดยการนำภาพถ่ายแนวตั้งภาพเดียวมาปรับให้เป็นแบนเนอร์ขนาดกว้าง การจัดองค์ประกอบยังคงใช้ได้ดี และไม่มีส่วนสำคัญใดสูญหายไปในกระบวนการนี้

รูปภาพอินพุต	ภาพผลลัพธ์

การรักษาเนื้อหาอย่างสม่ำเสมอ

ความสม่ำเสมอเป็นจุดเริ่มต้นที่มักทำให้ทุกอย่างพังทลาย โดยเฉพาะอย่างยิ่งเมื่อข้ามรุ่นคน แต่ในกรณีนี้ เนื้อหาค่อนข้างคงที่แม้จะมีการแก้ไขหลายครั้งแล้วก็ตาม

นั่นทำให้การสร้างรูปแบบต่างๆ โดยไม่สูญเสียเอกลักษณ์ดั้งเดิมทำได้ง่ายขึ้นมาก ซึ่งเป็นสิ่งสำคัญสำหรับการเล่าเรื่องหรือภาพลักษณ์ของแบรนด์

ฉันได้ทดสอบโดยการสร้างตัวละครเดียวกันในหลายรูปแบบ แม้จะไม่สมบูรณ์แบบ แต่ลักษณะสำคัญยังคงจดจำได้ในทุกผลลัพธ์

รูปภาพอินพุต	ภาพผลลัพธ์

Nano Banana 3 สามารถปรับปรุงในด้านใดบ้าง

การทำซ้ำอย่างรวดเร็วและการควบคุม

นี่เป็นจุดหนึ่งที่ผมรู้สึกว่าค่อนข้างไม่ตรงกับความคาดหวังของผม แม้ว่า Nano Banana 3 จะเร็ว แต่การควบคุมอาจรู้สึกไวเกินไปเล็กน้อยเมื่อทำการปรับเปลี่ยนเล็กๆ น้อยๆ

เนื้อหาหลักยังคงเหมือนเดิม แต่การปรับแต่งรายละเอียดนั้นไม่ใช่เรื่องง่ายเสมอไป การเปลี่ยนแปลงเล็กน้อย เช่น การปรับแสงหรือการแสดงออกทางสีหน้า บางครั้งอาจส่งผลมากกว่าที่คาดไว้

ตัวอย่างเช่น ฉันลองปรับแสงทีละขั้นตอน แต่ผลลัพธ์บางอย่างทำให้บรรยากาศเปลี่ยนไปมากเกินไป ทำให้ยากที่จะปรับแต่งให้ได้ลุคที่ต้องการอย่างแท้จริง

เมื่อผมลองใช้การตั้งค่าเดียวกันกับ Seedream 5.0 Lite แสงสว่างดูสมดุลและเป็นธรรมชาติมากขึ้น ปรับแต่งได้อย่างละเอียดอ่อนได้ดีกว่า โดยไม่ทำให้บรรยากาศดูจัดจ้านเกินไป

รูปภาพอินพุต

ภาพผลลัพธ์

หุ่นของเล่นสุดเก๋สวมแว่นกันแดดวางอยู่ข้างหนังสือศิลปะ

Nano Banana 3: หุ่นของเล่นถือหนังสืออยู่ใต้แสงแดดและแสงสะท้อนจากเลนส์กล้อง

Seedream 5.0 Lite:

หุ่นของเล่นวางโชว์คู่กับหนังสือศิลปะอยู่หน้าชั้นวางของ

Pollo AI แก้ไขข้อจำกัดของ Nano Banana 3 ได้อย่างไร

หลังจากใช้เวลาอยู่กับ Nano Banana 3 สักระยะ ผมเริ่มรู้สึกว่ามันทำงานได้ดีในด้านใดบ้าง และยังมีข้อจำกัดในด้านใดบ้าง โดยเฉพาะอย่างยิ่งในเรื่องการควบคุมที่ละเอียดอ่อน นั่นเป็นเหตุผลที่ทำให้ผมลองใช้มันร่วมกับ Pollo AI แทนที่จะใช้มันแบบเดี่ยวๆ

สิ่งที่ฉันชอบเกี่ยวกับการใช้ Nano Banana 3 กับ Pollo AI คือความยืดหยุ่น คุณไม่ถูกจำกัดอยู่แค่รุ่นเดียว ฉันสามารถสลับไปมาระหว่าง Nano Banana 3, Kling 3.0 และ GPT-4o ได้ตามงาน ซึ่งทำให้ขั้นตอนการทำงานมีความยืดหยุ่นมากขึ้น

ที่สำคัญกว่านั้น Pollo AI ยังให้การควบคุมที่มากกว่าแค่การแสดงคำแนะนำ เครื่องมืออย่าง Pollo Angles และ Pollo Relight ช่วยให้ฉันปรับมุมมองและแสงได้โดยตรง

จากการทดสอบของผม แทนที่จะสร้างภาพใหม่ ผมสามารถใช้ Pollo relight เพื่อแก้ไขแสงได้อย่างแม่นยำกว่ามาก ซึ่งทำให้กระบวนการทั้งหมดเร็วขึ้นและควบคุมได้ดียิ่งขึ้น

ข้อคิดส่งท้าย

Nano Banana 3 อาจไม่ได้พยายามเป็นทุกอย่าง แต่ทำได้ดีมากในเรื่องคุณภาพของผลลัพธ์โดยรวมและการใช้งาน ตั้งแต่การปรับแต่งบรรยากาศของภาพ การใช้สไตล์ และการสร้างภาพที่คมชัด รู้สึกเหมือนเป็นเครื่องมือที่ใช้งานได้จริงและเชื่อถือได้สำหรับงานสร้างสรรค์จริงๆ

ถึงกระนั้น มันก็มีข้อจำกัดอยู่บ้าง การควบคุมอย่างละเอียดอาจรู้สึกว่าตอบสนองไวเกินไป โดยเฉพาะอย่างยิ่งเมื่อทำการปรับเปลี่ยนเล็กน้อย ซึ่งทำให้การปรับแต่งอย่างแม่นยำคาดเดาได้ยากขึ้นในขั้นตอนการทำงานที่ซับซ้อนกว่า

ความคิดเห็นของผม? ใช้ Nano Banana 3 เพื่อล็อคภาพรวม องค์ประกอบ และสไตล์อย่างรวดเร็ว จากนั้นค่อยปรับแต่งรายละเอียดหากจำเป็น

และหากคุณใช้งานบน Pollo AI คุณยังมีความยืดหยุ่นในการสลับระหว่างโมเดลต่างๆ ซึ่งจะช่วยให้เติมเต็มช่องว่างได้ง่ายขึ้นเมื่อต้องการความแม่นยำสูงขึ้น

มีอะไรได้รับการอัปเกรดใน Nano Banana 3 บ้าง ?

อะไรทำให้ Nano Banana 3 น่าประทับใจ

การควบคุมการสั่นสะเทือนที่แม่นยำ

การถ่ายโอนสไตล์โดยอ้างอิงจากแบบอ้างอิง

การสร้างข้อความที่ชัดเจน

การส่งออกหลายรูปแบบที่ยืดหยุ่น

การรักษาเนื้อหาอย่างสม่ำเสมอ

Nano Banana 3 สามารถปรับปรุงในด้านใดบ้าง

การทำซ้ำอย่างรวดเร็วและการควบคุม

Pollo AI แก้ไขข้อจำกัดของ Nano Banana 3 ได้อย่างไร

ข้อคิดส่งท้าย

คุณอาจสนใจสิ่งเหล่านี้ด้วย

ทางเลือก CometAPI ที่ดีที่สุด: บทวิจารณ์ที่ตรงไปตรงมาและ 7 อันดับแรกที่ฉันเลือก

ทางเลือกที่ดีที่สุดสำหรับ Replicate: 7 ตัวเลือกยอดนิยมของฉัน

ทางเลือกโอเพ่นซอร์ส Runway ที่ดีที่สุดสำหรับการสร้างวิดีโอด้วย AI

10 ทางเลือกของ Sora ที่ดีที่สุดที่ฉันลองใช้แล้วได้ผลจริง

ในหน้านี้