في سبتمبر 2024، أطلقت Alibaba رسميًا نموذجها الخاص لتوليد الفيديو بالذكاء الاصطناعي، Tongyi Waniang AI، والمعروف أيضًا باسم Wan AI. وفي يناير 2025، قدمت Alibaba الإصدار Wan 2.1، أحدث تكرار لمولد الفيديو الخاص بها بالذكاء الاصطناعي.
الآن، تواجه منافسة قوية من شركات التكنولوجيا مثل OpenAI و Kuaishou، ولكن هل لدى Alibaba ما يلزم للتميز؟
للإجابة على هذا السؤال، قمت بتجميع دليل شامل لتقديم رؤية حول ما يجعل Wan AI أمرًا مهمًا جدًا في إنشاء المحتوى المرئي بالذكاء الاصطناعي.
Wan 2.1: الأساسيات

يستخدم Wan 2.1 مزيجًا من تقنيات VAE و DiT لجعل مقاطع الفيديو تبدو واقعية للغاية من خلال تحسين كيفية تحرك الأشياء وتواصلها بصريًا. بشكل أساسي، إنه رائع في محاكاة الحركات الواقعية الصعبة مع تنسيق دقيق للجسم وحركة سلسة.
هذا يعني أنه يمكنني استخدامه لتقديم مشاهد شخصيات معقدة مثل راقصة الباليه، والسباحة، والتزلج الفني، والتي غالبًا ما تفشل فيها معظم نماذج الفيديو بالذكاء الاصطناعي. في الواقع، بسبب قدرته على الالتزام بمسارات الحركة الواقعية، يحتل Wan 2.1 صدارة لوحة متصدرين VBench لتوليد الفيديو بالذكاء الاصطناعي.
إلى جانب ذلك، يأتي هذا الإصدار الجديد بقدرات توجيه محسّنة، مما يؤدي إلى عمليات توليد أسرع وأكثر بديهية. لهذا السبب، يمكنني إنشاء مقاطع فيديو مدتها دقيقة واحدة بدقة 1080p في حوالي 15 ثانية. يجدر الإشارة أيضًا إلى أن Wan 2.1 يأتي بأربعة إصدارات: T2V-1.3B، T2V-14B، I2V-14B-480P، و I2V-14B-720P.
نظرًا لأنه يدعم 14 مليار معلمة (14B)، يمكن لنموذج الفيديو بالذكاء الاصطناعي تفسير المزيد من المدخلات والسياق مقارنة بالسابق. في فبراير 2025، تم الإعلان عن أن جميع الإصدارات الأربعة أصبحت الآن مفتوحة المصدر. هذا يجعل Wan 2.1 أحد نماذج الفيديو القليلة بالذكاء الاصطناعي التي يمكن للمستخدمين والمطورين العامين الوصول إليها وتعديلها بحرية.
ما هو رأيي الشخصي في Wan 2.1؟
جربت Wan 2.1 باختباره ببضعة مقاطع فيديو نموذجية، ولدي بعض المشاعر المختلطة تجاهه. في محاولتي الأولى، كان طلبي الأول: "تنينان ضخمان يشاركان في معركة جوية ملحمية فوق مملكة من القرون الوسطى، يطلقان النار والفوضى، مع تحرك الكاميرا لإظهار الدمار أدناه."
إليك الفيديو الذي تم إنشاؤه:
بدا المشهد رائعًا - الدمار وكل شيء - لكن التنانين؟ لم يكن الأمر كذلك. لقد حاموا ببساطة وجهًا لوجه في السماء، ولم يفعلوا شيئًا، مما جعل الحركة تبدو متصلبة ومخيبة للآمال.
حاولت مرة أخرى بطلب أكثر تفصيلاً: "تنانين ضخمان يتصادمان فوق مملكة من القرون الوسطى، تلمع الحراشف بينما يغوص أحدهما بمخالب خاطفة والآخر يرد ب انفجار ناري، والأجنحة ترفرف بينما يلتفان ويتفاديان عبر سماء مليئة بالدخان، والذيل يضرب بقوة واقعية، بينما تنتقل الكاميرا بسلاسة بين اللقطات الواسعة للمملكة ولقطات مقربة للمعركة."
هذه المرة، كان الفيديو أفضل بكثير - كانت حركات التنانين ديناميكية ومكثفة، مع فيزياء طبيعية، وشعرت انتقالات الكاميرا بأنها سلسة وحيوية.
في رأيي، يتمتع Wan 2.1 بإمكانيات، خاصة وأنه يستخدم تقنيات VAE و DiT للتعامل مع الحركة الواقعية بشكل جيد. ولكنه يحتاج حقًا إلى أوامر مفصلة لتقديم النتائج؛ وإلا، يمكن أن تبدو الحركة مسطحة، وهو ما كان مزعجًا بعض الشيء في البداية. ومع ذلك، مع بعض الجهد، يمكنه إنشاء مقاطع فيديو رائعة وديناميكية.
ما هي الميزات التي أحبها أكثر في Wan 2.1؟
لا يمكنني إنكار أن Wan 2.1 يقدم مجموعة واسعة من التحسينات التي تنقل حل فيديو Alibaba بالذكاء الاصطناعي إلى المستوى التالي، حتى عند مقارنته بأدوات الفيديو الأخرى بالذكاء الاصطناعي. لذا، دعني أقسم نقاط القوة الرئيسية لنموذج الذكاء الاصطناعي التي تجعله مميزًا للغاية في نظري:
أداء فائق
يستخدم Wan 2.1 تقنية VAE مملوكة تمكنه من إعادة بناء مقاطع فيديو عالية الدقة بدقة 1080p دون المساس بالحركة السلسة. كما ذكرت سابقًا، فإنه يحافظ على التفاصيل المرئية بشكل جيد، لذا فإن التماسك بين الإطارات جيد نسبيًا.
بمعنى آخر، هناك خطر أقل للقلق بشأن الوميض أو التشويه عبر الإطارات. علاوة على ذلك، يمكن لبنية VAE في Wan 2.1 تشفير وفك تشفير مقاطع الفيديو بسرعة لا تصدق. هذا يعني أنه يمكنني الاعتماد عليه للمساعدة في إنشاء الفيديو شبه الفوري.
فهم متعدد اللغات
Wan 2.1 هو أول نموذج لتوليد الفيديو بالذكاء الاصطناعي قادر على فهم الأوامر النصية باللغتين الإنجليزية والصينية الأصلية. يمكن أن تكون هذه الميزة ثنائية اللغة رائعة لإنتاج نصوص متحركة وجميع أنواع التراكبات في مقاطع الفيديو.
يمكنني أيضًا استخدام Wan 2.1 لصياغة أوامر لمقاطع الفيديو الخاصة بالمنتجات أو حتى البرامج التعليمية التفاعلية للجماهير المحلية بنتائج أكثر فعالية. بالإضافة إلى ذلك، تمنحه قدرات توليد النصوص القوية هذه ميزة عادلة على نماذج الفيديو الأخرى بالذكاء الاصطناعي.
ديناميكيات حركة لا مثيل لها
يتمتع Wan 2.1 بإتقان مثير للإعجاب لديناميكيات الحركة في توليد الفيديو بالذكاء الاصطناعي. بينما لا أعتقد أنه يتفوق بالضرورة في الجماليات البصرية، فإن نموذج الفيديو هذا بالذكاء الاصطناعي يحافظ على توازن لا يمكن إنكاره بين اتساق المشهد، وواقعية الحركة، والدقة المكانية.
في معظم الحالات، هذا يجعل Wan 2.1 مناسبًا جدًا لإنشاء مرئيات احترافية تبدو و تشعر بالواقعية. سواء كانت مقطورات، أو مقاطع فيديو موسيقية، أو مشاهد متحركة، أو حتى أصول ألعاب، أنا واثق من أنه يمكنه تقديم نتائج سلسة ومقنعة.
إمكانية الوصول مفتوحة المصدر
اختارت Alibaba إصدار Wan 2.1 كحل مجاني ومفتوح المصدر، والذي يشمل جميع الإصدارات الأربعة. أنا أقدر هذا حقًا لأنه يجعله في متناول الشركات والعلامات التجارية والمطورين والمبدعين في جميع أنحاء العالم.
يصبح من السهل دمج Wan 2.1 وأتمتة جميع أنواع مهام إنشاء الفيديو المعقدة، حتى لو كنت تفتقر إلى أي خبرة في البرمجة. بالإضافة إلى ذلك، أحب كيف أن الحاجز المنخفض للدخول يعني أنه سيساعد في تعزيز الابتكار في مجتمع الذكاء الاصطناعي الأوسع.
كيف أفضل الوصول إلى Wan 2.1؟ تقديم Pollo AI
يمكنك الوصول إلى Wan 2.1 عن طريق تثبيته محليًا أو عبر الموقع الرسمي للمطور، Wan.Video. ومع ذلك، يجب أن أخبرك أن هذه ليست أسهل الطرق لاستخدام نموذج الفيديو بالذكاء الاصطناعي.
بدلاً من ذلك، أقترح عليك التفكير في استخدام Pollo AI. هذه منصة شاملة لتوليد الصور والفيديو بالذكاء الاصطناعي، مدمجة مع العديد من نماذج الذكاء الاصطناعي الرائدة في الصناعة. بعض هذه تشمل Runway، و Kling AI، و Pixverse، و Hailuo، و Luma AI، وبالطبع، Wan AI.
نظرًا لأنها كلها في مكان واحد، فهذا يسهل مقارنة مخرجات الفيديو مباشرة بين النماذج.
إلى جانب ذلك، يمكنني الوصول إلى العديد من أدوات وقوالب الذكاء الاصطناعي على Pollo AI التي تجعل من السهل إنشاء جميع أنواع مقاطع الفيديو المخصصة في لمح البصر.
تجدر الإشارة إلى أن Pollo AI يتميز أيضًا بـ مولد فيديوهات قصيرة بالذكاء الاصطناعي، و مولد فيديو بالذكاء الاصطناعي متعدد الاستخدامات، بما في ذلك تحويل الصور إلى فيديو و تحويل النص إلى فيديو، و مولد أفاتار بالذكاء الاصطناعي، مما يمكّن المبدعين من مجموعة واسعة من الخيارات الإبداعية.
والأفضل من ذلك كله، تقدم المنصة خطط أسعار معقولة جدًا، لذلك لم أكن بحاجة إلى كسر ميزانيتي للاستمتاع بجميع ميزاتها وأدواتها الفريدة. ولكن لا داعي لأخذ كلمتي! تحقق من Pollo AI مجانًا من خلال تجربته المجانية الآن!
قولي النهائي عن Wan 2.1
أجد أن Wan 2.1 يمكن أن يساعد أي منشئ في إنتاج مقاطع فيديو شخصيات واقعية ومقنعة بأي نمط مرئي تقريبًا. لا يزال يواجه منافسة قوية ضد منافسين آخرين مثل Kling AI، ولكنه يظل لا يهزم من حيث الحركة الديناميكية واتساق الأنماط عبر المشاهد. توجه إلى Pollo AI الآن وابدأ في إنشاء مقاطع الفيديو باستخدام Wan 2.1 لمعرفة ما يمكنه فعله لك!