Nano Banana รุ่นแรกสร้างความฮือฮาในวงการศิลปะ AI อย่างรวดเร็ว และกลายเป็นหนึ่งในรุ่นยอดนิยมสำหรับผู้สร้างสรรค์ผลงาน แน่นอนว่าการมาถึงของ Nano Banana 2 ดึงดูดความสนใจอย่างมาก การอัปเดตครั้งนี้เน้นไปที่เวิร์กโฟลว์ที่ยืดหยุ่นมากขึ้น โดยนำเสนออัตราส่วนภาพที่กำหนดเองและการส่งออกภาพ 2K แบบดั้งเดิมโดยไม่ต้องรอเวลานาน
หลังจากทดลองใช้ฟีเจอร์ใหม่ ๆ อย่างเต็มที่แล้ว ผมพบว่าถึงแม้จะให้การควบคุมพื้นที่แสดงผลได้อย่างยอดเยี่ยม แต่ก็ยังมีข้อจำกัดในการแสดงผลข้อความที่ซับซ้อนและมีข้อมูลจำนวนมาก นี่คือการวิเคราะห์ของผมเกี่ยวกับประสิทธิภาพในการปรับขนาดแบบกำหนดเองเทียบกับความแม่นยำทางด้านการพิมพ์
มีอะไรใหม่ใน Nano Banana 2?
Nano Banana 2 พัฒนาต่อยอดจากเวอร์ชันก่อนหน้า โดยมีการอัปเกรดทางเทคนิคหลายอย่างที่ออกแบบมาสำหรับครีเอเตอร์ที่ต้องการสินทรัพย์คุณภาพสูงในราคาประหยัด:
- ความเร็วและประสิทธิภาพที่เพิ่มขึ้น : การสร้างภาพความละเอียดสูงใช้เวลาประมาณ 20 วินาที ซึ่งเร็วกว่าและประหยัดค่าใช้จ่ายมากกว่าสำหรับงานที่มีปริมาณมาก
- เอาต์พุต 2K เริ่มต้น : โมเดลนี้ได้เปลี่ยนจากการแสดงตัวอย่างความละเอียดต่ำไปเป็นความละเอียด 2K เป็นค่าเริ่มต้นแล้ว ซึ่งช่วยลดขั้นตอนการเพิ่มความละเอียดสำหรับหลายๆ โปรเจ็กต์
- ปลดล็อกอัตราส่วนภาพ : ตอนนี้รุ่นนี้สามารถสร้างภาพได้ในอัตราส่วนภาพแทบทุกแบบ แม้ว่าค่าเริ่มต้นจะเป็น 16:9 แต่ผู้ใช้สามารถกำหนดรูปแบบทั่วไปได้ เช่น แนวตั้ง (3:2), สี่เหลี่ยมจัตุรัส (1:1) หรือมุมกว้างพิเศษ (21:9) นอกจากนี้ยังรองรับอัตราส่วนภาพแบบกำหนดเองที่แปลกใหม่ เช่น 8:1 หรือแม้แต่ 10:1
การทดสอบประสิทธิภาพ: การเรียบเรียงและความแม่นยำของข้อความ
เพื่อประเมินจุดแข็งและจุดอ่อนของโมเดล ฉันได้ทำการทดสอบหลายชุด โดยเน้นที่ความสามารถด้านอัตราส่วนภาพแบบใหม่และความสามารถในการปฏิบัติตามคำสั่งที่เป็นข้อความ
การทดสอบที่ 1: การเลื่อนแบบกว้างพิเศษ
การทดสอบครั้งแรกของฉันมีเป้าหมายเพื่อทดสอบขีดจำกัดของการตั้งค่าอัตราส่วนภาพแบบใหม่ เพื่อดูว่าโมเดลสามารถรักษาความต่อเนื่องของฉากได้หรือไม่ แม้จะมีความกว้างที่มากเป็นพิเศษ
| ทันที | ภาพทิวทัศน์แฟนตาซีต่อเนื่องในอัตราส่วน 8:1 จากซ้ายไปขวา: ป่าลึกลับ แม่น้ำเรืองแสง และเทือกเขาที่อยู่ไกลออกไปภายใต้แสงอาทิตย์ตกดิน |
| เอาต์พุต | ![]() |
การทดสอบที่ 2: ความแม่นยำของข้อความและตรรกะทางด้านการพิมพ์
ถัดมา ผมได้ทดสอบความสามารถของโมเดลในการแสดงผลคำเฉพาะเจาะจงภายในฉากที่ซับซ้อน ซึ่งเป็นความท้าทายทั่วไปสำหรับ AI แบบสร้างภาพ
| ทันที | เอาต์พุต |
| เมนูร้านกาแฟสุดฮิปสเตอร์ที่เขียนอย่างละเอียดบนกระดานดำขนาดใหญ่ ด้านบนสุดเขียนว่า "NANO ROASTERS" ด้านล่างแบ่งออกเป็นสามส่วน ส่วนที่ 1: "เอสเพรสโซ 3.50", "ลาเต้ 4.50" ส่วนที่ 2: "เคเม็กซ์ 6.00", "แอโรเพรส 5.00" ส่วนที่ 3: "ครัวซองต์ 3.00", "มัฟฟิน 2.50" | ![]() |
คุณภาพของภาพโดยรวมและพื้นผิวที่มีความละเอียดสูงนั้นยอดเยี่ยม แต่การจัดเรียงข้อความอย่างมีเหตุผลนั้นอยู่ในระดับปานกลาง
แม้ว่าส่วนหัวหลักส่วนใหญ่จะถูกต้อง แต่แบบจำลองกลับแสดงราคาของสินค้าในส่วนที่ 2 ผิดพลาดอย่างสิ้นเชิง
นอกจากนี้ มันยังสร้างภาพหลอนโดยปรากฏผลิตภัณฑ์และข้อความเพิ่มเติมจำนวนมากบนกระดานดำ ซึ่งไม่เคยถูกกล่าวถึงในคำสั่งเลย แสดงให้เห็นว่าถึงแม้มันจะสามารถวาดองค์ประกอบข้อความได้อย่างสวยงาม แต่การยึดมั่นในข้อมูลที่แม่นยำนั้นยังขาดอยู่
ข้อสังเกต: ความยืดหยุ่นของอัตราส่วนเทียบกับความแม่นยำของรายละเอียด
แม้ว่า Nano Banana 2 จะเป็นก้าวสำคัญที่ช่วยเพิ่มความเร็วในการทำงานและปรับแต่งเฟรมภาพได้อย่างมาก แต่เห็นได้ชัดว่ามันให้ความสำคัญกับการสร้างสภาพแวดล้อมทางภาพที่น่าประทับใจมากกว่าการปฏิบัติตามคำแนะนำที่เป็นข้อความอย่างเคร่งครัด
ข้อดี
- อิสระเต็มที่ในการสร้างสรรค์ภาพ : การรองรับอัตราส่วนภาพแบบไม่จำกัด ช่วยให้สามารถกำหนดขนาดภาพเองได้อย่างหลากหลาย (เช่น 8:1 หรือ 10:1) ในขณะที่ยังคงรักษาหลักการจัดองค์ประกอบภาพที่ดีเยี่ยมและหลีกเลี่ยงรูปแบบที่ซ้ำซากจำเจ
- การสร้างภาพ 2K ที่รวดเร็วทันใจ : สร้างภาพความละเอียด 2K ดั้งเดิมได้ในเวลาประมาณ 20 วินาที โดยไม่จำเป็นต้องมีขั้นตอนการขยายภาพเพิ่มเติม และช่วยเพิ่มความเร็วในการทำงานอย่างมาก
ข้อเสีย:
- การยึดติดกับข้อความและข้อมูลไม่แข็งแรง : มีปัญหาอย่างมากกับข้อความที่มีโครงสร้างซับซ้อน มักละเลยข้อมูลที่ถูกต้อง (เช่น ตัวเลขหรือราคาที่เฉพาะเจาะจง) และเติมพื้นที่ทำงานด้วยข้อความที่ไม่ชัดเจน
ข้อคิดส่งท้าย
Nano Banana 2 ไม่ใช่จอภาพที่ใช้งานได้หลากหลายสมบูรณ์แบบ แต่เป็นจอภาพเฉพาะทางที่ออกแบบมาเพื่อความเร็วและรูปแบบการแสดงผล หากคุณต้องการอัตราส่วนภาพกว้างพิเศษ เช่น 8:1 หรือ 10:1 การส่งออกภาพ 2K ในเวลาเพียง 20 วินาทีจะช่วยประหยัดเวลาได้อย่างมหาศาล และไม่จำเป็นต้องทำการเพิ่มความละเอียดภาพแยกต่างหาก
อย่างไรก็ตาม ต้องยอมรับข้อจำกัดของมันด้วย ความแม่นยำของข้อความยังคงเป็นจุดอ่อนอยู่ โชคดีที่เมื่อใช้ Nano Banana 2 บน Pollo AI คุณจะมีความยืดหยุ่น หากโครงการของคุณต้องการการจัดวางตัวอักษรที่สมบูรณ์แบบหรือความแม่นยำของข้อมูลที่ซับซ้อน Pollo AI ก็มีโมเดลอื่นๆ ให้คุณเลือกใช้
คำแนะนำของผมคือ ใช้ Nano Banana 2 เพื่อสร้างสภาพแวดล้อม แสง และองค์ประกอบภาพที่มีความละเอียดสูง จากนั้นค่อยจัดการข้อความในขั้นตอนหลังการถ่ายทำ มันเป็นเครื่องมือเฉพาะทางที่มีประโยชน์สำหรับชุดเครื่องมือของคุณ เหมาะอย่างยิ่งสำหรับภาพร่างแนวคิดและฉากหลังขนาดใหญ่ ตราบใดที่คุณรู้ว่ามันทำงานได้ดีที่สุดในสถานการณ์ใดและมีข้อจำกัดในสถานการณ์ใด

