Sora 2 من OpenAI قد وضعت معيارًا جديدًا في توليد الفيديو بالذكاء الاصطناعي، وقد تكون Google مستعدة لمواجهة التحدي.
بينما لم تصدر Google إعلانًا رسميًا بعد، تشير الإشارات المبكرة إلى أن Veo 3.1، وهو تكرار محسّن لنموذج فيديو الذكاء الاصطناعي الرائد Veo 3، قد يتم طرحه في أكتوبر 2025.
فكر في Veo 3.1 ليس كثورة، بل كتحديث مُحسَّن للغاية — استجابات أكثر كفاءة للأوامر، تخصيص إطارات البداية والنهاية، تناسق قائم على المرجع، تكامل صوتي أكثر إحكامًا، حركة أكثر سلاسة، والمزيد.
إذا استمرت الاتجاهات الحالية، فقد يحل Veo 3.1 محل Veo 3 بالكامل قريبًا، ويعمل بنفس الاسم مع تقديم نتائج محسّنة بشكل ملحوظ خلف الكواليس.
دعنا نستكشف ما نعرفه — وما نتوقعه.
مراجعة سريعة: ما الذي جلبه Veo 3 إلى الطاولة
تم تصميم Veo 3 من Google كمولد صور إلى فيديو ونصوص إلى فيديو متقدم يستهدف منشئي المحتوى المحترفين والاجتماعيين.
تضمنت ميزاته البارزة:
- توليد الصوت الأصلي – أصوات مدمجة، مؤثرات صوتية محيطة، وموسيقى متزامنة مع الفيديو المُنشأ.
- إنتاج محتوى جاهز للانتشار الفيروسي – مقاطع ساخرة "أخبار كاذبة" مضحكة، تأثيرات السفر عبر الزمن، مقاطع محاكاة ساخرة — مصممة للمشاركة.
- فهم متقدم للأوامر – تفسير دقيق للأوامر الإبداعية المعقدة متعددة الأجزاء.
- تناسق الشخصيات – القدرة على استخدام صور مرجعية للحفاظ على الاستمرارية البصرية للشخصيات.
- تحكم دقيق في الأسلوب – مطابقة الأساليب الفنية من الصور المرجعية.
- ضوابط الكاميرا – محاكاة حركات اللقطات، التقريب، وغيرها من الحركات السينمائية للكاميرا.
- التحكم في الكائنات – إضافة أو إزالة عناصر داخل مشهد فيديو ديناميكيًا.
- تحكم مرن في الحركة – ضبط سرعة وحركة المسارات للعناصر بدقة.
اقرأ المزيد: مراجعة مولد الفيديو بالذكاء الاصطناعي Veo من Google: رؤى مفصلة وشخصية
تحديث ".1": تقدير الميزات الجديدة لـ Veo 3.1
التحديث التدريجي يتعلق كله بالتحسين. إذا وضع Veo 3 الأساس، فإن Veo 3.1 سيكون حول إتقان التنفيذ. إليك ما يمكننا تقديره بشكل واقعي لتحسيناته:
صوت أصلي مُحسَّن
من المحتمل أن ينتقل توليد الصوت من مجرد "موجود" إلى "معبر". قد يعني هذا نغمات عاطفية أكثر دقة في الأصوات المُنشأة، مزجًا جويًا أفضل، وصوتًا لا يتطابق فقط مع الحركة بل يعزز المزاج.
واقعية وفيزياء مُعززة
في تحدٍ مباشر لميزة Sora 2 الرئيسية، سيركز Veo 3.1 على الأرجح على تحسين محرك الفيزياء الخاص به. توقع محاكاة أكثر دقة للقوام، تفاعلات الإضاءة، وتصادمات معقدة بين الكائنات.
التناسق القائم على المرجع
القدرة على استخدام صور أو مقاطع فيديو مرجعية للحفاظ على تناسق الشخصيات والأساليب الفنية عبر المشاهد. بينما كان Veo 3 قادرًا على الحفاظ على تشابه الشخصية، فإن Veo 3.1 سيستهدف الثبات الخالي من العيوب.
هذا يعني أن التفاصيل الدقيقة — مثل تجعد معين في قميص أو خصلة شعر — ستبقى متسقة تمامًا عبر مشاهد وزوايا كاميرا مختلفة.
الإطارات الأولى والأخيرة
امتدادًا لاستيفاء Veo 3، سيتيح هذا التحديث للمستخدمين تحميل صور البداية والنهاية لإنشاء انتقالات سلسة، وملء الفجوة السردية بسلاسة. فكر في وضع قصة بين قوسين بصريات مخصصة لمقاطع الفيديو الموسيقية أو الإعلانات، مع ضمان أن الذكاء الاصطناعي يسد الفجوة البصرية دون قطع مفاجئة.
سرعة المعالجة
تشير الدلائل المبكرة إلى أن Veo 3.1 يتمتع بأوقات توليد محسّنة قليلاً مقارنة بـ Veo 3، على الرغم من أن Sora 2 يظل تنافسيًا في هذا المجال. يمثل كلا النموذجين تقدمًا كبيرًا في الموازنة بين الجودة وسرعة التوليد.
Sora 2 ترفع مستوى الفيديو بالذكاء الاصطناعي — هل يمكن لـ Veo 3.1 من Google مواكبة ذلك؟
Sora 2 من OpenAI، الذي تم إطلاقه قبل أيام قليلة ويتوفر الآن عبر مولد الفيديو Pollo AI، هو قفزة أكبر مقارنة بسابقه. من نواحٍ عديدة، يُعد Veo 3.1 إصدار صيانة، بينما تبدو Sora 2 وكأنها نقلة جيلية.
| الميزة | Google Veo 3.1 (تقديري) | OpenAI Sora 2 (مؤكد) |
| محاكاة الفيزياء | واقعية محسّنة، ولكن بصرية في الغالب | محرك فيزياء عميق (الجاذبية، الطفو، دقة الاصطدام) |
| اتساق حالة العالم | قوي عبر المشاهد الفردية | استثنائي عبر قصص متعددة اللقطات |
| توليد الصوت | صوت أصلي متزامن | صوت أصلي متزامن بالكامل (صوت + موسيقى + مؤثرات) |
| فهم الأوامر | دقة عالية، ممتازة للإشارات السينمائية | متقدم للغاية، يتعامل مع المنطق المجرد |
| تناسق الشخصيات | موثوق به مع الصور المرجعية | ثبات شبه مثالي عبر تسلسلات طويلة |
| ظهور بشري حقيقي ("Cameos") | غير مؤكد | نعم — يمكن للمستخدمين إدراج وإدارة شبهاتهم الشخصية |
| التحكم في الكاميرا | توجيهات سينمائية متقدمة | مرن، مع سلوكيات ناشئة |
| نقل الأسلوب | ممتاز عبر الصور المرجعية | تحكم عالٍ، يدعم الأوضاع الفنية والتصوير الواقعي |
أين تتفوق Sora 2 حاليًا:
- محاكاة فيزياء متقدمة – جاذبية واقعية، طفو، معالجة اصطدام.
- سرد قصصي مستمر متعدد اللقطات – يحافظ على اتساق حالة العالم عبر المشاهد.
- مزامنة صوت عالية الجودة – أصوات، موسيقى، مؤثرات موقوتة بشكل مثالي مع المرئيات.
- شبه الواقع ( "Cameos") – دمج الأشخاص في المشاهد المُنشأة مع التحكم في حقوق الاستخدام.
اقرأ المزيد: مراجعة Sora 2: اختبرت نموذج الفيديو الجديد بالذكاء الاصطناعي من OpenAI – النتائج غير واقعية
أين قد ينافس Veo 3.1:
إذا تجاوز تفسير الأوامر وتكامل التدفق Sora 2، فقد يتفوق في لوحات القصة التعاونية والمعقدة.
قد تلبي خطوط مطابقة الأساليب من Google بشكل أفضل المشاريع الإبداعية الهجينة التي تمزج بين التصوير الفوتوغرافي والرسم والرسوم المتحركة.
قد تجذب زاوية المحتوى الفيروسي وإعدادات مسبقة لحركة الكاميرا لـ Veo منشئي الوسائط الاجتماعية الذين يبحثون عن تنسيقات مقاطع مسلية بدلاً من الواقعية السينمائية.
التطلع إلى الأمام: متى سيتم إصدار Veo 3.1؟
لم يتم تأكيد أي جدول زمني رسمي، ولكن تشير المصادر إلى طرح محتمل بحلول أواخر أكتوبر 2025، ربما يبدأ بمستخدمي المؤسسات عبر Google Cloud.
إذا ارتقى Veo 3.1 إلى مستوى التوقعات، فقد يعزز مكانة Google في سباق الفيديو بالذكاء الاصطناعي، خاصة مع تكامله مع Android و Wear OS للتوليد على الجهاز.
قد يراقب المبدعون المتشوقون للتجربة مدونة Google DeepMind أو تحديثات VideoFX.
لا تنتظر الإصدار الرسمي — يمكن الوصول إلى Veo 3 عبر Pollo AI الآن، مما يمنحك لمحة عما هو قادم. وعندما يتم إصدار Veo 3.1، ستكون من أوائل من يختبرونه.
مع اشتداد المنافسة في مجال الذكاء الاصطناعي، هناك شيء واحد واضح: عام 2025 هو العام الذي سيصبح فيه توليد الفيديو سينمائيًا حقًا.