เมื่อไม่นานมานี้ ฉันได้ทดสอบ Wan 2.5 ซึ่งเป็นโมเดล AI สำหรับวิดีโอรุ่นล่าสุดของ Alibaba หลังจากที่มีกระแสความตื่นเต้นเกี่ยวกับการเปิดตัว ฉันก็อยากรู้ว่ามันจะทำงานได้ดีแค่ไหน และเห็นได้ชัดว่ารุ่นนี้มีการอัพเกรดที่น่าสนใจหลายอย่าง
Wan 2.5 พัฒนาต่อยอดจาก Wan 2.2 ด้วยการสร้างเสียงแบบเนทีฟ ทำให้สามารถสร้างเสียงควบคู่ไปกับวิดีโอได้โดยตรง ไม่ว่าจะเป็นเสียงบรรยากาศ เสียงเพลงประกอบ หรือแม้แต่เสียงบรรยายที่ออกแบบมาให้เข้ากับฉาก
สิ่งนี้ทำให้มันอยู่ในระดับเดียวกับ Google Veo 3 ซึ่งมีระบบเสียงที่ยอดเยี่ยมอยู่แล้ว นอกจากนี้ ในทางทฤษฎี Wan 2.5 ยังให้คำมั่นสัญญาว่าจะมีการเคลื่อนไหวที่ราบรื่นยิ่งขึ้น ภาพคมชัดขึ้น เข้าใจข้อความแจ้งเตือนได้ดีขึ้น และเฟรมภาพที่สม่ำเสมอมากขึ้นตั้งแต่ต้นจนจบ
ฉันทำการทดสอบในสถานการณ์จริงสี่ครั้งเพื่อดูว่าเสียงและภาพผสานกันได้ดีแค่ไหน เพราะการทำงานร่วมกันนี้เองที่เป็นสิ่งที่ทำให้วิดีโอ AI ที่ดีแตกต่างจากวิดีโอที่ยอดเยี่ยม
สรุปโดยย่อ: Wan 2.5 แสดงให้เห็นถึงความก้าวหน้า
Wan 2.5 แสดงให้เห็นถึงการสร้างเสียงที่น่าประทับใจในหลายสถานการณ์ ด้วยบรรยากาศที่สมจริงและเอฟเฟกต์เสียงที่เหมาะสม คุณภาพวิดีโอ โดยเฉพาะอย่างยิ่งสำหรับตัวแบบที่เป็นมนุษย์นั้น ไม่สม่ำเสมอเท่าที่ควร แสดงให้เห็นถึงช่วงเวลาที่น่าประทับใจ แต่ก็ยังมีจุดที่ต้องปรับปรุงในด้านความสมจริงและการซิงค์ริมฝีปาก ในกรณีหนึ่ง เสียงไม่ถูกสร้างขึ้นเลย ซึ่งบ่งชี้ว่าโมเดลยังอยู่ในระหว่างการพัฒนาเพื่อให้มีความน่าเชื่อถืออย่างเต็มที่
ตัวอย่างการใช้งานจริงของ Wan 2.5
เพื่อทดสอบความอเนกประสงค์ ฉันได้เตรียมโจทย์ที่แตกต่างกันสี่แบบ โดยผสมผสานฉากที่สมจริงและฉากที่จัดรูปแบบ และให้คะแนนแต่ละแบบตามเกณฑ์ดังต่อไปนี้:
- ความแม่นยำของเสียงและการจับคู่ฉาก
- ความสมจริงทางภาพและการเคลื่อนไหวที่ราบรื่น
- ความแม่นยำในการเคลื่อนไหวและการแสดงออกทางสีหน้า
1. ภาพบรรยากาศการเดินป่ากับเพื่อนๆ — สวยงามและเป็นธรรมชาติ
คำสั่ง : ชายหนุ่มสองคนและหญิงสาวหนึ่งคนเดินป่าขึ้นไปตามเส้นทางภูเขาที่สวยงาม พวกเขาหัวเราะและพูดคุยกันอย่างสบายๆ สายลมพัดเบาๆ ทำให้ใบไม้พลิ้วไหว แสงแดดส่องลอดผ่านต้นไม้ และแต่ละคนสะพายเป้ การสนทนาที่สนุกสนานและรอยยิ้มของพวกเขาบันทึกช่วงเวลาพักผ่อนกลางแจ้งได้อย่างลงตัว
ผลลัพธ์ : บรรยากาศในป่า สายลม และเสียงหัวเราะ เข้ากันได้อย่างเป็นธรรมชาติกับภาพที่ปรากฏ การเคลื่อนไหวราบรื่นและไม่มีข้อผิดพลาดที่สังเกตได้
คะแนน : 8/10 — ผลลัพธ์ที่แข็งแกร่งและใช้งานได้จริงสำหรับเนื้อหาทั่วไป
2. ผู้หญิงที่สถานีรถไฟใต้ดิน — เสียงดี แต่ขาดความมีชีวิตชีวา
คำสั่ง : หญิงสาวชาวเอเชียคนหนึ่งยืนอยู่บนบันไดสถานีรถไฟใต้ดิน ยิ้มอย่างอบอุ่นพร้อมกับถือสมาร์ทโฟนอยู่ในมือ แสงแดดส่องลงมาทำให้เกิดเงาอ่อนๆ ทอดลงบนชุดลำลองสไตล์คนเมืองของเธอ
ผลลัพธ์ : เสียงพื้นหลังในรถไฟใต้ดินที่สมจริงช่วยสร้างบรรยากาศได้ดี แม้ว่าการแสดงออกทางสีหน้าและการเคลื่อนไหวของเธออาจดูไม่เป็นธรรมชาติและมีชีวิตชีวาเท่าที่ควร
คะแนน : 8/10 — เสียงดี แต่ยังมีโอกาสปรับปรุงเรื่องการเคลื่อนไหวได้
3. จิ้งจอกเจ้าเล่ห์ในชุดสูท — แนวคิดภาพที่ดึงดูดใจ
คำสั่ง : สุนัขจิ้งจอกผู้สง่างามในชุดสูทเนี้ยบถือเอกสารกองหนึ่ง เดินเข้ามาหากล้องด้วยก้าวที่มั่นใจและรอยยิ้มเจ้าเล่ห์
ผลลัพธ์ : ตัวละครแอนิเมชั่นดูมีสไตล์และแสดงอารมณ์ได้ดี อย่างไรก็ตาม การทดสอบนี้ไม่มีเสียงออกมา ซึ่งบ่งชี้ว่ามีช่องว่างเป็นบางครั้งในการสร้างเสียง
คะแนน : ไม่มีข้อมูล — เสียงหายไป ภาพคมชัดดี
4. นักข่าวรายงานสดบนท้องถนน — พูดชัดเจน แต่ต้องปรับปรุงเรื่องการประสานงานให้ดีขึ้น
คำสั่ง : นักข่าวผมสั้นรายงานสดจากถนนที่พลุกพล่าน พูดแข่งกับเสียงรถวิ่งและเสียงพูดคุย
ผลลัพธ์ : การพูดถูกต้องและชัดเจน แต่การขยับริมฝีปากไม่ตรงกับเสียง ทำให้การซิงค์ดูไม่สมจริง
คะแนน : 5/10 — ใช้งานได้ แต่การซิงค์ต้องปรับปรุงเพิ่มเติม
บทสรุปสุดท้าย: การอัปเดตที่น่าสนใจและมีศักยภาพ
Wan 2.5 นำเสนอคุณสมบัติภาพและเสียงที่มีประโยชน์ และสามารถให้ผลลัพธ์ที่ดีเยี่ยมในบางบริบท แม้ว่าประสิทธิภาพจะแตกต่างกันไปตามคำสั่ง แต่ช่วงเวลาที่ดีแสดงให้เห็นถึงศักยภาพในการพัฒนาเพิ่มเติมและการใช้งานที่กว้างขึ้นในอนาคต
ดีกว่า Veo 3? ยังไม่ถึงขั้นนั้น เพราะ Veo 3 ยังคงมีความสม่ำเสมอกว่าโดยรวม แต่การผสานรวมด้านเสียงและภาพที่มีคุณภาพสูงเป็นบางครั้งของ Wan 2.5 บ่งบอกถึงอนาคตที่สดใสเมื่อเทคโนโลยีพัฒนาขึ้น
ใครบ้างที่น่าจะชอบ: นักทดลอง, ผู้สร้างสรรค์โปรเจกต์ที่เกี่ยวข้องกับธรรมชาติหรือฉากที่มีสไตล์ และผู้ที่เปิดรับความไม่สมบูรณ์แบบบ้างเป็นครั้งคราว
ใครควรต้องรอ: ผู้เชี่ยวชาญที่ต้องการความสมจริงที่แม่นยำและการซิงค์ที่สมบูรณ์แบบในวิดีโอที่เน้นมนุษย์เป็นศูนย์กลาง
เหตุใดจึงควรลองใช้ Wan 2.5 บน Pollo AI
Wan 2.5 เป็นหนึ่งในเครื่องมือ AI สำหรับสร้างวิดีโอที่มีประสิทธิภาพหลายอย่างที่มีให้บริการบน Pollo AI แพลตฟอร์มนี้ช่วยให้สร้างภาพคุณภาพสูงในหลากหลายสไตล์ได้อย่างง่ายดาย โดยมี ฟีเจอร์แปลงข้อความเป็นวิดีโอ แปลงภาพเป็นวิดีโอ และเครื่องมือสร้างขั้นสูงอื่นๆ อีกมากมาย
นอกจากนี้ คุณยังสามารถเข้าถึงโมเดลชั้นนำต่างๆ เช่น Runway , Veo 3 , Seedance , Hailuo AI , Kling AI และ PixVerse AI ได้อีกด้วย ดังนั้นคุณจึงไม่จำกัดอยู่แค่ตัวเลือกเดียว

หนึ่งในฟีเจอร์ที่โดดเด่นคือ โปรแกรมสร้างวิดีโออวตารด้วย AI ซึ่งเปลี่ยนภาพถ่ายเพียงภาพเดียวให้กลายเป็นอวตารที่เหมือนจริง ด้วยท่าทางที่เป็นธรรมชาติ การแสดงออกทางสีหน้าที่สมจริง และการขยับปากที่แม่นยำ

เพื่อการสร้างสรรค์ผลงานอย่างรวดเร็ว Pollo AI Shorts สามารถสร้างวิดีโอสั้นได้ทันที ไม่ว่าจะเป็นสไตล์อนิเมะ สัตว์ หรือสไตล์ผ่อนคลาย พร้อมทั้งสร้างฉากหลายฉากได้ในครั้งเดียว

ด้วยเอฟเฟ็กต์ AI ที่หลากหลาย เครื่องมือที่ปรับแต่งได้ และ LoRA ทำให้ Pollo AI สามารถเปลี่ยนแนวคิดให้กลายเป็นวิดีโอคุณภาพสูงได้ในไม่กี่คลิก
หากคุณต้องการลองสร้างวิดีโอด้วย AI โดยไม่ต้องเสียเวลาเรียนรู้นาน ลองใช้ Pollo AI ฟรี แล้วดูว่าไอเดียของคุณจะไปได้ไกลแค่ไหน