قمتُ مؤخراً باختبار Wan 2.5 ، أحدث نموذج فيديو بتقنية الذكاء الاصطناعي من شركة علي بابا. بعد كل هذا الحماس الذي أحاط بإطلاقه، كنتُ متشوقاً لمعرفة أدائه، ومن الواضح أن هذا النموذج يحمل بعض التحسينات الملحوظة.
يعتمد Wan 2.5 على Wan 2.2 مع توليد الصوت الأصلي، مما يسمح له بإنتاج الصوت مباشرة جنبًا إلى جنب مع الفيديو - الضوضاء المحيطة، أو موسيقى الخلفية، أو حتى التعليق الصوتي المصمم ليتناسب مع المشهد.
يضع هذا الجهاز في نفس فئة جهاز Veo 3 من جوجل ، الذي يتميز بالفعل بتكامل صوتي قوي. نظريًا، يعد Wan 2.5 أيضًا بحركة أكثر سلاسة، وصور أكثر وضوحًا، وفهم أفضل للتعليمات، وإطارات أكثر اتساقًا من البداية إلى النهاية.
أجريت أربعة اختبارات واقعية لمعرفة مدى جودة مزج الصوت والصورة، لأن هذا التناغم هو ما يميز فيديو الذكاء الاصطناعي الجيد عن الفيديو الرائع.
خلاصة سريعة: شبكة Wan 2.5 تُظهر تقدماً
أظهر نظام Wan 2.5 أداءً صوتيًا مذهلاً في عدة سيناريوهات، مع أجواء واقعية ومؤثرات صوتية مناسبة. أما جودة الفيديو، وخاصةً بالنسبة للأشخاص، فكانت أقل اتساقًا، حيث أظهرت لحظات قوية، ولكنها تركت مجالًا للتحسين في الواقعية ومزامنة حركة الشفاه. في إحدى الحالات، لم يتم توليد الصوت على الإطلاق، مما يشير إلى أن النموذج لا يزال قيد التطوير للوصول إلى موثوقية كاملة.
أمثلة واقعية لشبكات Wan 2.5
لاختبار مدى تنوعها، قمت بإعداد أربعة أسئلة مختلفة، تمزج بين المشاهد الواقعية والمنمقة، وقمت بتقييم كل منها على النحو التالي:
- دقة الصوت ومطابقة المشهد
- الواقعية البصرية والحركة السلسة
- الدقة في الحركة وتعبيرات الوجه
1. مشهد نزهة مع الأصدقاء - سلس وطبيعي
المشهد : شابان وفتاة يتنزهون على درب جبلي خلاب، يضحكون ويتحدثون بودّ. نسمة عليلة تداعب أوراق الشجر، وأشعة الشمس تتخلل الأشجار، وكل منهم يحمل حقيبة ظهر. حديثهم المرح وابتساماتهم تعكس لحظة استرخاء في أحضان الطبيعة.
النتيجة : انسجمت أجواء الغابة ونسيمها وضحكاتها بشكل طبيعي مع المشاهد. حركة سلسة وخالية من أي عيوب ملحوظة.
النتيجة : 8/10 — نتيجة قوية وقابلة للاستخدام للمحتوى غير الرسمي.
2. امرأة في محطة المترو - جودة صوت جيدة، لكنها تحتاج إلى مزيد من الحيوية
المشهد : شابة آسيوية تقف على درج محطة مترو الأنفاق، تبتسم بحرارة وبيدها هاتف ذكي. يتسلل ضوء النهار، فتسقط ظلال ناعمة على إطلالتها العصرية.
النتيجة : ساعدت أصوات الخلفية الواقعية لقطار الأنفاق في تهيئة المشهد، على الرغم من أن تعبير وجهها وحركتها كان من الممكن أن يكونا أكثر طبيعية وديناميكية.
التقييم : 8/10 — صوت جيد، مع إمكانية تحسين الحركة.
3. ثعلب ماكر ببدلة - مفهوم بصري آسر
التلميح : ثعلب أنيق يرتدي بدلة أنيقة يحمل كومة من الأوراق، ويقترب من الكاميرا بخطوات واثقة وابتسامة ماكرة.
النتيجة : بدت الشخصية المتحركة أنيقة ومعبرة. ومع ذلك، لم يُصدر هذا الاختبار أي صوت، مما يشير إلى وجود فجوات عرضية في توليد الصوت.
النتيجة : غير متوفرة — الصوت مفقود، لكن الصور قوية.
4. صحفي مباشر من الشارع - كلام واضح، يحتاج إلى مزامنة أفضل
الملخص : صحفية ذات شعر قصير تقدم تقريراً مباشراً من شارع مزدحم، تتحدث وسط ضجيج حركة المرور والثرثرة.
النتيجة : كان الكلام دقيقًا وواضحًا، لكن حركات الشفاه لم تتطابق تمامًا مع الصوت، مما جعل التزامن أقل إقناعًا.
التقييم : 5/10 — يعمل، لكن المزامنة تحتاج إلى تحسين.
الخلاصة: تحديث واعد ذو إمكانات كبيرة
يُقدّم Wan 2.5 ميزات سمعية بصرية قيّمة، ويُمكنه تحقيق نتائج رائعة في سياقات مُحدّدة. ورغم اختلاف الأداء باختلاف التوجيهات، إلا أن اللحظات الجيدة تُشير إلى إمكانية التحسين المُستقبلي وزيادة سهولة الاستخدام.
هل هو أفضل من Veo 3؟ ليس تمامًا بعد، إذ لا يزال Veo 3 أكثر اتساقًا بشكل عام. لكن تكامل الصوت في Wan 2.5 وجودة الصور العالية التي يوفرها أحيانًا يبشران بمستقبل واعد مع تطور هذه التقنية.
من قد يستمتع به: الأشخاص الذين يجربون، والمشاريع الإبداعية التي تتضمن الطبيعة أو المشاهد ذات الطابع الفني، وأولئك الذين يتقبلون العيوب العرضية.
من ينبغي عليه الانتظار: المحترفون الذين يحتاجون إلى واقعية دقيقة وتزامن مثالي في الفيديو الذي يركز على الإنسان.
لماذا تجرب Wan 2.5 على Pollo AI؟
يُعد Wan 2.5 أحد أدوات الفيديو القوية العديدة التي تعمل بالذكاء الاصطناعي والمتوفرة على Pollo AI. تُسهّل هذه المنصة إنشاء صور عالية الجودة بأنماط لا حصر لها، وتتميز بتحويل النصوص إلى فيديو ، والصور إلى فيديو ، وغيرها من الأدوات المتقدمة.
يمكنك أيضًا الوصول إلى نماذج رائدة مثل Runway و Veo 3 و Seedance و Hailuo AI و Kling AI و PixVerse AI ، لذلك لن تقتصر أبدًا على خيار واحد فقط.

ومن أبرز الميزات مولد الفيديو الخاص بالصور الرمزية بالذكاء الاصطناعي ، والذي يحول صورة واحدة إلى صور رمزية نابضة بالحياة مع إيماءات طبيعية وتعبيرات وجه واقعية ومزامنة دقيقة للشفاه.

لإنتاج إبداعي سريع، يقوم برنامج Pollo AI Shorts بإنتاج مقاطع فيديو قصيرة على الفور - أنماط الأنمي أو الحيوانات أو الهدوء - بالإضافة إلى إنشاء مشاهد متعددة في خطوة واحدة.

بفضل مجموعة تأثيرات الذكاء الاصطناعي والأدوات القابلة للتخصيص وتقنية LoRas، يمكن Pollo AI تحويل الأفكار إلى مقاطع فيديو مصقولة ببضع نقرات فقط.
إذا كنت ترغب في استكشاف إنشاء مقاطع الفيديو باستخدام الذكاء الاصطناعي دون الحاجة إلى تعلم أساسيات معقدة، فجرب Pollo AI مجانًا وشاهد إلى أين يمكن أن تصل أفكارك.