اختبرتُ خاصية الحركة السينمائية والصوت المدمج في جهاز Vidu Q3: قفزة نوعية في مجال الفيديو المدعوم بالذكاء الاصطناعي
يشهد مجال الفيديو المدعوم بالذكاء الاصطناعي تطورًا سريعًا، وقد أطلقت Vidu AI أحدث إصداراتها، واعدةً بحيوية تُحاكي الواقع البشري، وانتقالات أكثر سلاسة، وصوتًا مدمجًا. وبناءً على أساس Vidu Q2، تدّعي هذه النسخة الجديدة دعم مقاطع الفيديو التي تصل مدتها إلى 16 ثانية مع تحسين ملحوظ في الوضوح والواقعية.
في اختباراتي الواقعية، وجدت أنه على الرغم من أن Vidu Q3 يضع معيارًا جديدًا للحركة والأجواء، إلا أنه لا يزال يواجه تحديات تتعلق بتناسق الشخصيات ومنطق التوجيه المعقد.
ما الذي يميز جهاز Vidu Q3؟
انطلاقاً من أساس برنامج Vidu Q2 ، يمثل هذا الإصدار الجديد تحولاً كبيراً نحو سرد القصص السينمائية الاحترافية من خلال العديد من التحسينات الرئيسية:
- لغة الكاميرا السينمائية: فهم أعمق بكثير لحركة العدسة، لا سيما في المشاهد عالية الحركة مثل مشاهد القتال.
- مخرج الصوت والفيديو المباشر: إحدى أبرز ميزاته، توليد المؤثرات الصوتية (SFX) والموسيقى الخلفية (BGM) بشكل متزامن تمامًا مع الصور - قفزة هائلة للأمام من العروض الصامتة في الماضي.
- فيزياء محسّنة ووضوح أعلى: دقة بصرية محسّنة بشكل كبير ومحرك فيزيائي أكثر قوة يدعم مقاطع الفيديو التي تصل مدتها إلى 16 ثانية.
أداء Vidu في الربع الثالث: براعة سينمائية تلتقي بعقبات الاتساق
الاختبار 1: النمذجة الزمنية والحركة الديناميكية
كان هدف اختباري الأول هو اختبار نموذج الفيزياء الخاص بـ Vidu Q3 باستخدام مشهد للحياة البرية عالي الكثافة:
| اِسْتَدْعَى | فيديو مُنشأ |
| مشهدٌ مذهلٌ للحياة البرية. من 0 إلى ثانيتين: يشدّ الظبيان عضلاتهما فجأةً، مستشعرين الخطر. يرفع الظبي الأيمن رأسه على الفور. من ثانيتين إلى أربع ثوانٍ: يقفز الظبيان في الهواء ويركضان بعيدًا نحو الخلفية، مثيرين الغبار. يخرجان من الإطار بسرعة. حركة ديناميكية، سرعة غالق عالية، تشريح واقعي، بدون تشويه. |
هنا يبرز جهاز Vidu Q3 حقًا. كان الانتقال من حالة الثبات إلى الحركة السريعة سلسًا للغاية. كان توتر العضلات واضحًا، وتحركت جزيئات الغبار بديناميكية سوائل واقعية. على عكس Q2، لم يكن هناك أي "تغيير في الشكل" أثناء القفزة. مع ذلك، لاحظتُ انحرافًا طفيفًا غير مقصود للكاميرا، حيث تحركت العدسة جانبيًا دون توجيه واضح.
التقييم: 7.5/10 — منطق فيزيائي فائق وسلاسة حركة ممتازة؛ مشاكل طفيفة تتعلق بانحراف الكاميرا التلقائي.
الاختبار الثاني: اتساق النتائج بين عدة أشخاص والجو العام
بعد ذلك، قمت باختبار "الجو العام" وتعقيد المشهد باستخدام نموذج سوق مزدحم:
| اِسْتَدْعَى | فيديو مُنشأ |
| في سوقٍ نابضٍ بالحياة على الطراز القروسطي عند غروب الشمس، يهرع القرويون المبتهجون بين أكشاكٍ ملونةٍ تعجّ بالفواكه والتوابل والأقمشة. يقف حيوانان كرتونيان لطيفان في ذهولٍ قرب ساعةٍ قديمةٍ ضخمة، يهزان ذيولهما بحماس. يضحك الأطفال ويركضون من أمامهما، بينما يلوّح التجار ويصيحون فرحًا لبيع بضائعهم. المشهد يفيض بالحيوية - تتأرجح الفوانيس برفقٍ فوق الرؤوس، ويعزف الموسيقيون ألحانًا مبهجةً في الخلفية. تتحرك الكاميرا بمرحٍ بين الحشود، تلتقط الابتسامات المشرقة، والتصفيق، والخطوات المتراقصة، وكأن السوق بأكمله يرقص فرحًا. |
كانت الأجواء البصرية مذهلة. نجح Vidu كيو 3 في الحفاظ على حيوية المشهد دون أن يبدو مزدحماً. مع ذلك، تأثرت تناسقية الشخصيات. فمع تحريك الكاميرا، تغيرت ملامح الحيوانات الكرتونية قليلاً، وتعرض بعض سكان القرية في الخلفية لتشوه جمالي، حيث بدت وجوههم مشوهة في الخلفية.
النتيجة: 7/10 — تحكم استثنائي في الأجواء والإضاءة؛ يعاني من صعوبة في الحفاظ على تفاصيل الشخصيات في اتساق مزدحم ومتعدد المواضيع.
الاختبار الثالث: مزامنة الصوت والصورة ومزامنة حركة الشفاه
أما الاختبار الثالث فكان للميزة الأكثر ترقباً: الإخراج المباشر للصوت والفيديو.
| الصورة الأصلية | فيديو مُنشأ |
![]() |
يُعدّ التحسّن الكبير في جودة الصوت نقلة نوعية. فقد تمّ دمج صوت طقطقة النار وأصوات الليل المحيطة بشكل مثالي. ورغم أن حركة الفم كانت متزامنة مع الكلام، إلا أن النطق لم يكن مطابقًا تمامًا للأصوات المحددة في الصوت المُولّد.
التقييم: 7/10 — تحسن كبير في دمج المؤثرات الصوتية والموسيقى الخلفية؛ يحتاج تزامن حركة الشفاه مع الحوار إلى مزيد من الدقة.
الاختبار الرابع: الالتزام الفوري والمنطق التجاري
وأخيراً، قمت باختبار نموذج إعلاني لمعرفة ما إذا كان الربع الثالث قادراً على التعامل مع الصور المرئية للعلامات التجارية الراقية:
| الصورة الأصلية | فيديو مُنشأ |
![]() سيروم فاخر ينساب بسلاسة على بشرة متألقة، مُبرزاً التأثيرات المُجددة للطبيعة. موسيقى هادئة تُعزف في الخلفية. |
يُسلّط هذا الضوء على نقطة ضعف رئيسية: غالبًا ما تُعطي Vidu Q3 الأولوية لـ"الجماليات السينمائية" على حساب الالتزام الصارم بالوقت المحدد. ورغم أن الموسيقى الخلفية كانت هادئة ومناسبة، إلا أن عدم الالتزام بالوقت المطلوب يجعل استخدامها صعبًا في لوحات القصة التجارية المحددة دون الحاجة إلى إعادة تشغيلها عدة مرات.
التقييم: 4/10 — دقة عالية وتفاصيل نسيجية ممتازة؛ الصور الواقعية للبشر عرضة لأخطاء "غريبة" وتتطلب محاولات متعددة.
أفكار ختامية حول Vidu Q3: أداة فعّالة للحركة وخلق الأجواء
يمثل Vidu Q3 خطوة كبيرة للأمام، خاصةً للمبدعين الذين يحتاجون إلى حركة عالية الطاقة وصوت متكامل. إن قدرته على التعامل مع مشاهد القتال والحركة السريعة - وهي مجالات تفشل فيها العديد من نماذج الذكاء الاصطناعي - تجعله بديلاً قابلاً للتطبيق للنماذج المتطورة مثل Hailuo.
على الرغم من تفوقها في "الأجواء" والمشاهد السينمائية والصوت، إلا أنها لا تزال تتطلب بعض "التكرار" (الطلب المتكرر) للحصول على نتائج مثالية.
لماذا يقدم Pollo AI حلاً متفوقاً
يُعدّ Vidu Q3 مثيرًا للإعجاب، ولكنه يبقى أداةً واحدةً ذات قيودها الخاصة. Pollo AI فيتبنى نهجًا مختلفًا، إذ يعمل كمركزٍ متكاملٍ لتوليد فيديوهات الذكاء الاصطناعي .
بدلاً من التقيد بمزايا وعيوب إصدار واحد محدد، يمنحك Pollo AI وصولاً فورياً إلى مجموعة مختارة من أفضل الموديلات في العالم. سواء كنت بحاجة إلى الحركة السينمائية لـ Vidu Q3، أو الواقعية المذهلة لـ Kling 2.6 ، أو اللمسة الفنية لـ Wan 2.6 ، أو دقة Veo 3 ، Pollo AI يوفر لك كل ذلك بسهولة تامة.
باستخدام أدوات تحويل الصور إلى فيديو أو النصوص إلى فيديو من Pollo AI، يمكنك اختبار توجيهاتك على نماذج متعددة في آنٍ واحد. إذا واجه Vidu Q3 صعوبة في الحفاظ على تناسق الشخصيات في مشهدك المحدد، يمكنك التبديل إلى نموذج آخر ضمن نفس الواجهة للعثور على النموذج الأمثل الذي يلبي رؤيتك.
لا تحصر إبداعك في خوارزمية واحدة. اشترك في Pollo AI اليوم واستفد من القوة الجماعية لأفضل نماذج الذكاء الاصطناعي في هذا المجال لإنتاج محتوى فيديو عالمي المستوى.

