كشفت جوجل مؤخرًا عن أحدث نماذج توليد الفيديو لديها، Veo 3.1، والذي تم بناؤه على نموذج Veo 3 الأصلي.
لا يقدم Veo 3.1 فقط التزامًا محسّنًا بالأوامر، مما يضمن تجسيد رؤيتك بدقة أكبر، ولكنه يوفر أيضًا إخراجًا صوتيًا أصليًا أغنى، مما يجمع بين الصوت والحركة بشكل طبيعي أكثر من ذي قبل.
كما قدمت ثلاث ميزات رئيسية جديدة، بما في ذلك:
- مكونات إلى فيديو: قم بإنشاء فيديو كامل من صور مرجعية، مع تثبيت الشخصية وأسلوب المشهد.
- إطارات إلى فيديو: قم بإنشاء انتقالات سلسة وطبيعية عن طريق توفير الإطارات الأولى والأخيرة للمشهد.
- تمديد الفيديو: قم بتحويل المقاطع القصيرة إلى مقاطع فيديو أطول عن طريق تمديد الحركة لمدة دقيقة أو أكثر.
أداة إزالة بنقرة واحدة قادمة أيضًا، والتي ستقوم بإزالة الكائنات غير المرغوب فيها وإعادة بناء الخلفية للحصول على تشطيب نظيف.
أصبح Veo 3.1 من Google متاحًا الآن على مولد الفيديو Pollo AI، مما يوفر للمبدعين إمكانية الوصول إلى قدرات توليد فيديو محسّنة.
لقد أجريت سلسلة من الاختبارات مع التركيز على أربعة ترقيات رئيسية: إخراج صوتي أصلي محسّن، ومكونات إلى فيديو، وإطارات إلى فيديو. إليك ما وجدته — تلميح: Veo 3.1 يغير قواعد اللعبة.
وضع Veo 3.1 قيد الاختبار
- توليد الصوت الأصلي
الأمر: "لقطة مقربة لمقلاة من الحديد الزهر تصدر أزيزًا في مطبخ مطعم مزدحم. يقلب طاهٍ شريحة لحم، ويمكنك سماع ثرثرة طهاة آخرين وأصوات أواني القدور والمقالي في الخلفية."
النتيجة: كانت النتيجة مثيرة للإعجاب. كان الصوت الأساسي - أزيز شريحة اللحم الحاد والمتشقق - واضحًا وفي المقدمة. ومع ذلك، على الرغم من طلبه صراحة في الأمر، إلا أن "ثرثرة الطهاة الآخرين" المميزة كانت غائبة. ترك هذا الخلفية تبدو أقل "ازدحامًا" مما كان متوقعًا، مع فقدان عنصر بشري رئيسي كان من شأنه أن يجعل الصوت غنيًا ومتعدد الطبقات حقًا.
- إطارات إلى فيديو
الأمر: باستخدام الإطارات الأولى والأخيرة كإطارات فاصلة، قم بإنشاء فيديو انتقال سلس لمدة 10 ثوانٍ حيث يدخل زوجان المقهى، ويجلسان، ويطلبان القهوة، ويبدآن في الدردشة بحماس مع حلول الليل.
| صورة الإطار الأول والأخير | الفيديو الناتج |
![]() ![]() |
النتيجة: بينما ظلت الشخصيات والمشهد متسقين بصريًا، وتم استخدام الإطارات الأولى والأخيرة كإطارات فاصلة، فشل الفيديو في إنشاء انتقال سلس. كانت الإجراءات مثل الطلب مفاجئة (على سبيل المثال، ظهرت أكواب القهوة فجأة)، وكان هناك نقص كبير في الاستمرارية مع الإطار النهائي.
- مكونات إلى فيديو
الأمر: ساحر ملتحٍ يرتدي أردية بنفسجية في مكتبة حجرية مضاءة بالشموع يقرأ مخطوطة قديمة، وينظر فجأة بذهول، ثم يلقي تعويذة تجعل الكتب تطفو حوله
| الصور المرجعية | الفيديو الناتج |
![]() ![]() |
النتيجة: بينما تم الحفاظ على الإعداد العام والجو بشكل ممتاز - مع مكتبة حجرية مضاءة بالشموع مفصلة بشكل غني وإضاءة جوية - لم يتطابق مظهر الساحر تمامًا مع الصورة المرجعية.
اختلفت ملامح وجهه ونمط لحيته بشكل ملحوظ، مما يشير إلى محدودية الدقة في نقل الشخصية.
على الرغم من عدم التطابق الأولي، يظهر النموذج ترابطًا زمنيًا ممتازًا والتزامًا بالمشهد، مما يوفر تسلسلًا سينمائيًا وغامرًا يتوافق جيدًا مع الإجراء الموصوف.
الحكم النهائي
يُظهر Veo 3.1 قدرات قوية في عرض الشخصيات والمشاهد المتسقة، مع الحفاظ بنجاح على السلامة البصرية عبر الإطارات والإطارات الفاصلة المحددة.
إنه يؤدي بشكل جيد مع الإجراءات والكائنات الأساسية، ويمكنه إنشاء مؤثرات صوتية أساسية واضحة. ومع ذلك، يظهر النموذج نقاط ضعف كبيرة في إنشاء محتوى فيديو ديناميكي ودقيق. إنه يكافح مع:
- الانتقالات السلسة والاستمرارية: غالبًا ما تبدو الإجراءات المعقدة والمتعددة الخطوات مفاجئة (على سبيل المثال، تظهر الكائنات فجأة)، وتفتقر الانتقالات إلى الاستمرارية، مما يؤدي إلى تسلسلات متقطعة، خاصة في الإطارات النهائية.
- الدقة العاطفية: يمكن أن تكون تعابير الشخصيات والنبرة غير متسقة أو تفتقر إلى العمق العاطفي المحدد (على سبيل المثال، يبدو مظهر "متفاجئ" خفيفًا، أو يفتقر زوجان "يضحكان" إلى الحركة).
- تحريك الكائنات المعقدة: يمكن أن تبدو التفاعلات التي تتضمن كائنات متعددة (مثل الكتب العائمة) جامدة أو ميكانيكية أو تظهر الكائنات "فجأة" بدلاً من التحرك بشكل طبيعي.
- الصوت متعدد الطبقات: بينما الأصوات الأساسية جيدة، فإن إنشاء عناصر صوتية ثانوية أو خلفية مميزة، حتى عند المطالبة بها صراحة، لا يزال يمثل تحديًا، مما يؤثر على ثراء المشهد الصوتي.
لماذا تستخدم Veo 3.1 على Pollo AI؟
يجمع Pollo AI أفضل ما في توليد الفيديو بالذكاء الاصطناعي — كل ذلك تحت سقف واحد. فكر فيه كمركز تحكم إبداعي خاص بك، حيث تلتقي القوة بالمرونة.
لست عالقًا في وضع واحد فقط مثل Veo 3.1. على Pollo AI، يمكنك التبديل بين المحركات الرائدة مثل Sora 2، و Veo 3، و Kling 2.5 Turbo، و Wan 2.5، و Seedance، وغيرها — في أي وقت.
هذا يعني أنه إذا كنت تحب واقعية Veo 3.1 وعمق سرد القصص (والذي، بالمناسبة، مذهل)، يمكنك استخدامه بالضبط عندما يناسبك — ثم التبديل إلى نموذج آخر للسرعة أو الأسلوب أو التفاصيل. لا حدود. لا تنازلات.
بالإضافة إلى ذلك، فإنه يمتلك جميع ميزات توليد الفيديو الأساسية بالذكاء الاصطناعي:
- اجعل الصور تنبض بالحياة باستخدام الذكاء الاصطناعي لتحويل الصور إلى فيديو الخاص بنا.
- حوّل النصوص إلى صور مذهلة باستخدام الذكاء الاصطناعي لتحويل النص إلى فيديو.
- صمم مقاطع مقنعة باستخدام مولد فيديو بالصورة الرمزية بالذكاء الاصطناعي.
- أنشئ مقاطع مهدئة أو حيوانات أو بأسلوب الرسوم المتحركة باستخدام مولد الفيديو القصير بالذكاء الاصطناعي.
- قم بتقليد أي حركة للفيديو المرجعي باستخدام Pollo Mimic.
جرّب Pollo AI اليوم، واطلق العنان للإمكانات الكاملة لإنشاء الفيديو المدفوع بالذكاء الاصطناعي.



