ในเดือนกันยายน 2024 Alibaba ได้เปิดตัวโมเดลสร้างวิดีโอด้วย AI ที่เป็นกรรมสิทธิ์ของตนเองอย่างเป็นทางการ ชื่อ Tongyi Waniang AI หรือที่เรียกกันว่า Wan AI ต่อมาในเดือนมกราคม 2025 Alibaba ได้เปิดตัว Wan 2.1 ซึ่งเป็นเวอร์ชันล่าสุดของเครื่องมือสร้างวิดีโอด้วย AI
ขณะนี้ Alibaba ต้องเผชิญกับการแข่งขันที่ดุเดือดจากบริษัทเทคโนโลยีต่างๆ เช่น OpenAI และ Kuaishou แต่ Alibaba มีสิ่งที่จะทำให้โดดเด่นได้หรือไม่?
เพื่อตอบคำถามนี้ ผมได้รวบรวมคู่มือเชิงลึกเพื่อมอบข้อมูลเชิงลึกเกี่ยวกับสิ่งที่ทำให้ Wan AI เป็นเรื่องใหญ่ในการสร้างสรรค์เนื้อหาวิดีโอด้วย AI
Wan 2.1: พื้นฐาน

Wan 2.1 ใช้เทคโนโลยี VAE และ DiT ผสมผสานกันเพื่อทำให้วิดีโอดูสมจริงอย่างยิ่ง โดยการปรับปรุงการเคลื่อนไหวและการเชื่อมต่อทางสายตา โดยพื้นฐานแล้ว มันยอดเยี่ยมในการเลียนแบบการเคลื่อนไหวที่ซับซ้อนในโลกแห่งความเป็นจริง ด้วยการประสานงานของร่างกายที่แม่นยำและการเคลื่อนไหวที่ราบรื่น
ซึ่งหมายความว่าผมสามารถใช้มันเพื่อสร้างฉากตัวละครที่ซับซ้อน เช่น นักบัลเลต์กำลังเต้นรำ ว่ายน้ำ และเล่นสเก็ตลีลา ซึ่งโมเดลวิดีโอ AI ส่วนใหญ่มักทำได้ไม่ดี อันที่จริง ด้วยความสามารถในการรักษาเส้นทางการเคลื่อนไหวที่สมจริง ทำให้ Wan 2.1 อยู่ในอันดับต้นๆ ของ VBench leaderboard สำหรับการสร้างวิดีโอด้วย AI
นอกเหนือจากนั้น เวอร์ชันใหม่นี้ยังมาพร้อมกับความสามารถในการสร้างคำสั่ง (prompting) ที่ดียิ่งขึ้น ซึ่งนำไปสู่การสร้างที่รวดเร็วและเข้าใจง่ายยิ่งขึ้น ด้วยเหตุนี้ ผมจึงสามารถสร้างวิดีโอความยาว 1 นาที ในความละเอียด 1080p ได้ภายในเวลาประมาณ 15 วินาที นอกจากนี้ Wan 2.1 ยังมีสี่เวอร์ชันย่อย ได้แก่ T2V-1.3B, T2V-14B, I2V-14B-480P และ I2V-14B-720P
เนื่องจากรองรับพารามิเตอร์ 14 พันล้าน (14B) โมเดลวิดีโอ AI จึงสามารถตีความอินพุตและบริบทได้มากกว่าเดิม ในเดือนกุมภาพันธ์ 2025 มีการประกาศว่าทั้งสี่เวอร์ชันย่อยขณะนี้เป็น โอเพนซอร์ส ทำให้ Wan 2.1 เป็นหนึ่งในโมเดลวิดีโอ AI ไม่กี่รุ่นที่ผู้ใช้ทั่วไปและนักพัฒนาสามารถเข้าถึงและแก้ไขได้ฟรี
ความเห็นส่วนตัวของฉันเกี่ยวกับ Wan 2.1 คืออะไร?
ฉันได้ลองใช้ Wan 2.1 โดยการทดสอบกับวิดีโอตัวอย่างสองสามตัว และฉันมีความรู้สึกผสมปนเปเกี่ยวกับมัน สำหรับการลองครั้งแรก คำสั่งแรกของฉันคือ: "มังกรยักษ์สองตัวต่อสู้กันกลางอากาศอย่างดุเดือดเหนืออาณาจักรยุคกลาง ปลดปล่อยไฟและความโกลาหล โดยกล้องจะแพนเพื่อแสดงความพินาศที่อยู่เบื้องล่าง"
นี่คือวิดีโอที่สร้างขึ้น:
ฉากดูดี—มีความพินาศและทุกอย่าง—แต่มังกรล่ะ? พวกมันแค่ลอยอยู่ตรงหน้ากันกลางอากาศ ไม่ได้ทำอะไรเลย ซึ่งทำให้การเคลื่อนไหวดูแข็งทื่อและน่าผิดหวัง
ฉันลองอีกครั้งด้วยคำสั่งที่ละเอียดขึ้น: "มังกรยักษ์สองตัวปะทะกันเหนืออาณาจักรยุคกลาง เกล็ดสะท้อนแสงขณะที่ตัวหนึ่งดำลงพร้อมกับกรงเล็บที่ตวัด และอีกตัวสวนกลับด้วยการระเบิดไฟ ปีกโบกสะบัดขณะที่พวกมันหมุนวนและหลบหลีกผ่านท้องฟ้าที่มีควัน หางฟาดด้วยแรงที่สมจริง ขณะที่กล้องสลับไปมาระหว่างภาพมุมกว้างของอาณาจักรและการซูมใกล้การต่อสู้"
คราวนี้ วิดีโอดีขึ้นมาก—การเคลื่อนไหวของมังกรดูทรงพลังและเข้มข้น พร้อมฟิสิกส์ที่เป็นธรรมชาติ และการเปลี่ยนภาพของกล้องดูกลมกลืนและมีชีวิตชีวา
ในความคิดของฉัน Wan 2.1 มีศักยภาพ โดยเฉพาะอย่างยิ่งเนื่องจากใช้เทคโนโลยี VAE และ DiT เพื่อจัดการกับการเคลื่อนไหวที่สมจริงได้ดี แต่ก็ต้องการคำสั่งที่ละเอียดเพื่อให้ได้ผลลัพธ์ที่ดี มิฉะนั้นการเคลื่อนไหวอาจดูราบเรียบ ซึ่งค่อนข้างน่ารำคาญในตอนแรก แต่ด้วยความพยายาม มันสามารถสร้างวิดีโอที่น่าทึ่งและมีไดนามิกได้
คุณสมบัติใดที่ฉันชอบมากที่สุดเกี่ยวกับ Wan 2.1?
ฉันปฏิเสธไม่ได้ว่า Wan 2.1 นำเสนอความก้าวหน้ามากมายที่ยกระดับโซลูชันวิดีโอ AI ของ Alibaba ไปอีกขั้น แม้เมื่อเทียบกับเครื่องมือวิดีโอ AI อื่นๆ ดังนั้น ให้ฉันแจกแจงจุดแข็งหลักของโมเดล AI ที่ทำให้มันโดดเด่นในมุมมองของฉัน:
ประสิทธิภาพที่เหนือกว่า
Wan 2.1 ใช้เทคโนโลยี VAE ที่เป็นกรรมสิทธิ์ซึ่งช่วยให้สามารถสร้างวิดีโอความละเอียดสูง 1080p ใหม่โดยไม่ลดทอนการเคลื่อนไหวที่ราบรื่น ดังที่ฉันกล่าวไปก่อนหน้านี้ มันยังคงรักษาคุณภาพของภาพได้ดี ดังนั้นความสอดคล้องกันของเฟรมต่อเฟรมจึงค่อนข้างดี
กล่าวอีกนัยหนึ่ง มีความเสี่ยงน้อยลงที่จะต้องกังวลเกี่ยวกับการกะพริบหรือการบิดเบือนระหว่างเฟรม นอกจากนี้ สถาปัตยกรรม VAE ของ Wan 2.1 ยังสามารถเข้ารหัสและถอดรหัสวิดีโอได้อย่างรวดเร็วอย่างไม่น่าเชื่อ ซึ่งหมายความว่าฉันสามารถพึ่งพามันเพื่อช่วยในการสร้างวิดีโอแบบเกือบเรียลไทม์ได้
ความเข้าใจหลายภาษา
Wan 2.1 เป็นโมเดลสร้างวิดีโอ AI เครื่องแรกที่สามารถเข้าใจคำสั่งข้อความได้ทั้งภาษาอังกฤษและภาษาจีน นี่เป็นคุณสมบัติสองภาษาที่ยอดเยี่ยมสำหรับการสร้างข้อความเคลื่อนไหวและเลเยอร์ทุกประเภทในวิดีโอ
ฉันยังสามารถใช้ Wan 2.1 เพื่อสร้างคำสั่งสำหรับวิดีโอผลิตภัณฑ์ หรือแม้แต่วิดีโอสอนแบบโต้ตอบสำหรับผู้ชมในท้องถิ่นได้อย่างมีประสิทธิภาพมากขึ้น นอกจากนี้ ความสามารถในการสร้างข้อความที่แข็งแกร่งเหล่านี้ยังทำให้ได้เปรียบเหนือโมเดลวิดีโอ AI อื่นๆ
ไดนามิกการเคลื่อนไหวที่เหนือชั้น
Wan 2.1 มีความเชี่ยวชาญที่น่าประทับใจในด้านไดนามิกการเคลื่อนไหวในการสร้างวิดีโอด้วย AI แม้ว่าฉันจะไม่คิดว่ามันเป็นผู้นำในด้านสุนทรียภาพของภาพ แต่โมเดลวิดีโอ AI นี้ยังคงรักษาสมดุลที่ปฏิเสธไม่ได้ระหว่างความสอดคล้องของฉาก ความสมจริงของการเคลื่อนไหว และความแม่นยำเชิงพื้นที่
โดยส่วนใหญ่แล้ว ทำให้ Wan 2.1 เหมาะอย่างยิ่งสำหรับการสร้างภาพระดับมืออาชีพที่ดูสมจริง ไม่ว่าจะเป็นตัวอย่างภาพยนตร์ มิวสิควิดีโอ ฉากแอนิเมชัน หรือแม้แต่องค์ประกอบเกม ฉันมั่นใจว่ามันสามารถส่งมอบผลลัพธ์ที่ราบรื่นและน่าเชื่อถือได้
การเข้าถึงแบบโอเพนซอร์ส
Alibaba เลือกที่จะเปิดตัว Wan 2.1 เป็นโซลูชันฟรีและโอเพนซอร์ส ซึ่งรวมถึงเวอร์ชันย่อยทั้งสี่ ฉันชื่นชมสิ่งนี้จริงๆ เพราะทำให้ธุรกิจ แบรนด์ นักพัฒนา และผู้สร้างทั่วโลกเข้าถึงได้ง่ายขึ้น
การผสานรวม Wan 2.1 และทำให้กระบวนการสร้างวิดีโอที่ซับซ้อนเป็นไปโดยอัตโนมัติจึงเป็นเรื่องง่าย แม้ว่าคุณจะไม่มีความเชี่ยวชาญด้านการเขียนโค้ดก็ตาม นอกจากนี้ ฉันชอบที่อุปสรรคในการเข้าถึงที่ต่ำลงจะช่วยส่งเสริมนวัตกรรมในชุมชน AI ที่กว้างขึ้น
ฉันชอบเข้าถึง Wan 2.1 ผ่านช่องทางใดมากที่สุด? ขอแนะนำ Pollo AI
คุณสามารถเข้าถึง Wan 2.1 ได้โดยการติดตั้งในเครื่อง หรือผ่านเว็บไซต์อย่างเป็นทางการของผู้พัฒนา Wan.Video อย่างไรก็ตาม ฉันต้องแจ้งให้คุณทราบว่านี่ไม่ใช่วิธีที่ง่ายที่สุดในการใช้โมเดลวิดีโอ AI
แทนที่จะเป็นเช่นนั้น ฉันขอแนะนำให้คุณพิจารณาใช้ Pollo AI นี่คือแพลตฟอร์มสร้างภาพและวิดีโอ AI แบบครบวงจรที่ล้ำสมัย ซึ่งรวมเอาโมเดล AI ชั้นนำของอุตสาหกรรมหลายรุ่นไว้ด้วยกัน บางส่วนรวมถึง Runway, Kling AI, Pixverse, Hailuo, Luma AI และแน่นอน Wan AI
เนื่องจากทั้งหมดอยู่ในที่เดียว ทำให้ง่ายต่อการเปรียบเทียบผลลัพธ์วิดีโอระหว่างโมเดลต่างๆ ได้โดยตรง
นอกจากนี้ ฉันยังสามารถเข้าถึงเครื่องมือและเทมเพลต AI จำนวนมากบน Pollo AI ซึ่งช่วยให้สร้างวิดีโอแบบกำหนดเองทุกประเภทได้อย่างง่ายดายในพริบตา
โดยเฉพาะอย่างยิ่ง Pollo AI ยังมี AI Short Video Generator, AI Video Generator ที่หลากหลาย รวมถึง Image to Video และ Text to Video และ AI Avatar Generator ซึ่งช่วยเสริมศักยภาพผู้สร้างสรรค์ด้วยตัวเลือกที่สร้างสรรค์ที่หลากหลาย
ที่ดีที่สุดคือ แพลตฟอร์มนี้มีแผนราคาที่เข้าถึงได้มาก ดังนั้นฉันจึงไม่ต้องเสียเงินมากมายเพื่อเพลิดเพลินกับคุณสมบัติและเครื่องมือที่เป็นเอกลักษณ์ทั้งหมดของมัน แต่คุณไม่จำเป็นต้องเชื่อคำพูดของฉัน! ลองใช้ Pollo AI ฟรีตอนนี้!
ความคิดสุดท้ายของฉันเกี่ยวกับ Wan 2.1
ฉันพบว่า Wan 2.1 สามารถช่วยผู้สร้างสรรค์ทุกคนสร้างวิดีโอตัวละครที่สมจริงและน่าเชื่อถือในสไตล์ภาพเกือบทุกรูปแบบ มันยังคงเผชิญกับการแข่งขันที่ดุเดือดกับคู่แข่งอื่นๆ เช่น Kling AI แต่ก็ยังคงเป็นผู้นำในด้านไดนามิกการเคลื่อนไหวและความสอดคล้องของรูปแบบในฉากต่างๆ ลองเข้าไปที่ Pollo AI ตอนนี้และเริ่มสร้างวิดีโอด้วย Wan 2.1 เพื่อดูว่ามันสามารถทำอะไรให้คุณได้บ้าง!