مراجعة Gemini Omni : لقد جربت Gemini Omni، وقد نال إعجابي

بعد استكشاف العديد من أدوات الفيديو بالذكاء الاصطناعي، لم يثر إعجابي سوى القليل منها بقدر Gemini Omni، المعروف أيضًا باسم Veo 4. هذا ليس مجرد تحديث بسيط؛ بل هو قفزة نحو فيديو جاهز للإنتاج بدقة 4K وصوت مقصود واتساق ملحوظ في المشاهد.

من المقاطع الأطول إلى التحكم متعدد الزوايا، يقدم Gemini Omni الميزات الاحترافية التي يحتاجها المبدعون. تابع القراءة للاطلاع على مراجعتي العملية الكاملة لهذه الترقيات الرائدة وتعرف على كيفية تجربة Gemini Omni بنفسك من خلال Pollo AI.

انطباعاتي الأولى عن Gemini Omni (Veo 4)

لقد اطلعت على الكثير من أدوات الفيديو بالذكاء الاصطناعي خلال العام الماضي، وبصراحة، يتطلب الأمر الكثير لإثارة دهشتي. Gemini Omni (Veo 4) هو واحد من القلائل الذين فعلوا ذلك.

من كل ما رأيته حتى الآن، يبدو Gemini Omni أقل شبهاً بترقية صغيرة وأكثر شبهاً بخطوة جادة نحو فيديو الذكاء الاصطناعي الأصلي متعدد الوسائط. ما يبرز بالنسبة لي ليس فقط المرئيات الأفضل، ولكن كيف يجمع بين التوليد والتحرير القائم على الدردشة وإعادة المزج والفهم السياقي في سير عمل واحد.

هذا ما يجعله ذا قيمة للمبدعين. يركز Gemini Omni بشكل أقل على الإخراج لمرة واحدة وأكثر على المراجعات التي تجعل الفيديو قابلاً للاستخدام: إعطاء المراجع، وطلب التغييرات، والاحتفاظ بما ينجح، وتحسين النتيجة من خلال المحادثة. بالنسبة للمسوقين وصانعي الأفلام ومنشئي المحتوى، قد يجعل ذلك فيديو الذكاء الاصطناعي أقرب إلى الإنتاج الحقيقي.

يبدو أن Google تحاول نقل فيديو الذكاء الاصطناعي إلى ما هو أبعد من المقاطع التجريبية القصيرة إلى شيء أكثر قابلية للاستخدام للمشاريع الحقيقية.

بالطبع، التوقعات عالية، ولن يكون لكل وعد نفس الأهمية في الممارسة العملية. غالبًا ما تبدو أدوات الفيديو بالذكاء الاصطناعي مثيرة على الورق ولكنها تبدو أقل إثارة للإعجاب بمجرد أن تبدأ في الإنشاء. ومع ذلك، يحتوي Gemini Omni على ترقيات طموحة كافية لتستحق الاهتمام. في هذه المراجعة، سألقي نظرة فاحصة على ما يجعله واعدًا وأين قد لا يزال بحاجة إلى إثبات نفسه.

لتوفير وقتك، أود أن أقدم نظرة عامة لتوضيح الاختلافات بين Veo 3 و Gemini Omni (Veo 4).

الميزة	Veo 3	Gemini Omni (Veo 4)
مدة الفيديو	مقاطع قصيرة، عادة حوالي 8 ثوانٍ	مقاطع أطول، من المتوقع أن تكون مدتها حوالي 15-30 ثانية، مع وتيرة أكثر سلاسة وانتقالات طبيعية
اتساق المشهد	اتساق محدود عبر الإطارات	اتساق زمني أقوى عبر المشاهد الكاملة، وتحسين استمرارية الكائن، وتفاعلات أكثر استقرارًا بين الشخصيات المتعددة
التحكم في الكاميرا	حركة كاميرا أساسية قائمة على الأوامر	تحكم أكثر دقة في العدسات والحركة والتأطير والوتيرة
فهم الأوامر	جيد للأوامر البسيطة	تفسير متقدم للتعليمات السينمائية الدقيقة، مع اتباع أكثر موثوقية للتعليمات
مشاهد متعددة الزوايا	غير مدعوم	دعم زوايا كاميرا متعددة لكل مشهد من أمر واحد
شخصيات رمزية مخصصة	غير متوفر	شخصيات رمزية مخصصة مع مزامنة الصوت وتعبيرات الوجه الدقيقة وحركات الشفاه المتزامنة
سير عمل التحرير	إعادة إنشاء المقطع بأكمله للتغييرات	تحرير تفاعلي أثناء الإنشاء، مما يسمح بإجراء تعديلات في منتصف العملية
حالة الاستخدام الأساسية	ينشئ مقاطع فيديو تجريبية قصيرة	سير عمل إنشاء فيديو جاهز للإنتاج
الدقة	إخراج يصل إلى 1080 بكسل	إخراج يصل إلى 4K
الصوت	مقاطع فيديو صامتة أو صوت أساسي (مرجع توقيت)	صوت عالي الجودة ومقصود مع كلام أكثر تعبيرًا وإيقاع أفضل وأجواء أكثر ثراءً وتصميم صوت متماسك
الدقة متعددة اللغات	أساسي	نص أكثر دقة على الشاشة، وعلامات، وعرض واجهة المستخدم، ومزامنة شفاه أنظف عبر لغات مختلفة

ما الذي يميز Gemini Omni

تحرير الدردشة المدرك للسياق: يبدو Gemini Omni كلحظة Nano Banana لفيديو الذكاء الاصطناعي. يسمح للمستخدمين بمراجعة المقاطع من خلال المحادثة، مع فهم ما يجب تغييره، وما يجب أن يبقى، وكيف يجب أن يستمر المشهد.
سير عمل فيديو أصلي متعدد الوسائط: يجمع Gemini Omni بين إنشاء الفيديو وتحريره وإعادة مزجه وإنشاءه القائم على المراجع في سير عمل واحد أصلي لـ Gemini. بدلاً من التعامل مع النصوص والصور والمقاطع والقوالب والتعديلات كأوضاع منفصلة، فإنه يستخدمها كسياق متصل لتشكيل الفيديو النهائي.
تحكم أكثر دقة في النص والصيغة: يمكن لـ Gemini Omni الحفاظ على التفاصيل المكتوبة والصيغ والحركة والمعنى أكثر تماسكًا داخل الفيديو. وهذا يجعله مفيدًا للبرامج التعليمية والشروحات والمحتوى التعليمي والمشاهد الأخرى كثيفة المعرفة.
يصبح الإنشاء والتحرير واحدًا: يقترح Gemini Omni أن فيديو الذكاء الاصطناعي المستقبلي لن يتم تقسيمه بدقة إلى نص/صورة/مرجع إلى فيديو، وتحرير الفيديو. بمجرد أن يتمكن النموذج من فهم المراجع ومراجعة النتائج من خلال الأوامر، يبدأ الإنشاء والتحرير في أن يصبحا نفس سير العمل.

تجربتي مع Gemini Omni

إنشاء فيديو أصلي متعدد الوسائط

تم تصميم Gemini Omni لبدء الفيديو بطريقة أكثر مرونة. يمكن للمستخدم إدخال أمر أو صورة أو مقطع أو إشارة صوتية أو قالب، ويمكن للنموذج التعامل مع هذه المواد كملخص إبداعي واحد متصل.

لهذا السبب يبدو التقسيم القديم بين تحويل النص إلى فيديو وتحويل الصورة إلى فيديو أقل أهمية هنا. يعمل Gemini Omni بشكل أشبه بنموذج فيديو يعتمد على المراجع، حيث تساعد المدخلات المختلفة في تحديد نفس الاتجاه النهائي.

الأمر	إدخال الفيديو	إخراج الفيديو
إعلان طبيعي للعناية بالبشرة من محتوى من إنشاء المستخدم (UGC) يظهر شابة ذات شعر بني محمر طويل، ونمش واضح، ومكياج بسيط منعش. تحمل وعاء كريم وجه أخضر بالقرب من الكاميرا، وتضع الكريم على وجهها، وتظهر تغييراً واضحاً في البشرة قبل وبعد، من بشرة عارية ذات ملمس إلى مظهر أكثر نعومة وليونة وإشراقاً.

رائع! يحافظ فيديو العناية بالبشرة هذا على واقعية الشخصية واتساق المنتج بصريًا طوال الوقت، مما يجعل النتيجة الإجمالية تبدو أكثر صقلًا وجاذبية.

تحرير الفيديو القائم على الدردشة

التحرير الحواري هو المكان الذي يبدأ فيه Gemini Omni بالشعور بالعملية الحقيقية. لا يحتاج المستخدمون إلى إعادة بناء مقطع أو العمل من خلال جدول زمني؛ يمكنهم ببساطة إخبار النموذج بما يحتاج إلى التغيير.

إنه يحول تحرير الفيديو إلى تبادل قائم على الأوامر. وبهذا المعنى، يجلب Gemini Omni تجربة التحرير بأسلوب Nano Banana إلى الصور المتحركة.

الأمر	إدخال الفيديو	إخراج الفيديو
أزل شعار Sora2 في مقطع الفيديو هذا.

تماسك أقوى للنص والصيغة

يبرز Gemini Omni في المشاهد التي يجب أن تظل فيها المعلومات المكتوبة قابلة للقراءة وذات معنى. هذا اختبار صعب لفيديو الذكاء الاصطناعي، لأن النص يجب أن يظل ثابتًا بينما يستمر المشهد في الحركة.

بالنسبة للبرامج التعليمية والشروحات والدروس ومقاطع الفيديو الأخرى القائمة على المعرفة، هذا يهم كثيرًا. يحتاج النموذج إلى التعامل ليس فقط مع مظهر الكتابة، ولكن أيضًا مع توقيتها وهيكلها ومعناها داخل المشهد.

الأمر	إخراج الفيديو
أستاذ يكتب برهانًا رياضيًا للمتطابقات المثلثية على سبورة تقليدية، موضحًا الخطوة التي هو عليها حاليًا في المعادلة.

لقد أذهلني حقًا فيديو Gemini Omni هذا. فبالإضافة إلى الحفاظ على دقة النص على الشاشة، فإنه يحافظ أيضًا على صحة الصيغ الرياضية المعقدة في جميع أنحاء المشهد، مما يجعل النتيجة بأكملها تبدو أكثر قابلية للتصديق وإثارة للإعجاب من الناحية الفنية.

تحرير على مستوى الكائن والمشهد

يكون Gemini Omni مفيدًا عندما يحتاج الفيديو إلى تغيير مستهدف فقط. بدلاً من إنتاج مقطع جديد من البداية، يمكن للمستخدمين تعديل كائن أو تفصيل أو جزء معين من المشهد.

هذا مهم في الإنتاج الحقيقي لأن الإصلاحات الصغيرة غالبًا ما تحدد ما إذا كان الفيديو قابلاً للاستخدام. إن الحفاظ على اللقطة الأصلية سليمة مع تغيير ما يحتاج إلى التغيير فقط يجعل عملية التحرير أكثر عملية بكثير.

الأمر	إدخال الفيديو	إخراج الفيديو
استبدل السباغيتي في أطباق كلا الشخصين بحساء اليقطين الكريمي. حافظ على كل شيء آخر كما هو.

لقد فاجأني Gemini Omni حقًا هنا. فهو يستبدل الطعام فقط بشكل طبيعي جدًا، مع الحفاظ على واقعية الطبق وترك حركات الشخص والمشهد بأكمله سليمًا.

إعادة مزج الفيديو

إعادة المزج تجعل Gemini Omni مفيدًا بعد المسودة الأولى.

بدلاً من البدء من الصفر، يمكن للمستخدمين أخذ مقطع موجود وتحويله إلى إصدار جديد مع الحفاظ على الهيكل أو الحركة أو الاتجاه الإبداعي. وهذا أقرب إلى طريقة عمل المبدعين الحقيقيين.

إدخال الفيديو	الأمر	إخراج الفيديو
	اجمع مقطع "فتاة تمشي بجانب البحر" مع مقطع المنتج لإنشاء إعلان تلفزيوني تجاري بأسلوب سينمائي، يمزج بين لقطات جمال نمط الحياة مع مرئيات المنتج المصقولة لتقديم إعلان تجاري فاخر وأنيق للعناية بالبشرة.

إنشاء مدرك للمعرفة العالمية

تأتي قيمة Gemini Omni أيضًا من قدرته على فهم السياق الكامن وراء المشهد. فهو لا يحاول فقط جعل الفيديو يبدو مصقولًا؛ بل يحتاج أيضًا إلى معرفة موضوع المشهد.

هذا النوع من الفهم مفيد بشكل خاص للمواضيع التاريخية، والمحتوى التعليمي، وشروحات المنتجات، ومقاطع الفيديو القائمة على القصة، حيث يجب أن تكون التفاصيل منطقية وتبدو جيدة.

الأمر	إخراج الفيديو
أنشئ مقطع فيديو عن قصة حياة ستيف جوبز.

جرب Gemini Omni على Pollo AI

يجمع Pollo AI أفضل أدوات إنشاء الفيديو بالذكاء الاصطناعي في مكان واحد، مما يمنحك مركزًا إبداعيًا حيث تجتمع المرونة والأداء.

مع دمج Gemini Omni، يصبح Pollo AI أكثر قدرة. استكشف إمكانيات Gemini Omni القوية هناك وقارن النتائج بنفسك.

بالإضافة إلى النماذج المختلفة، يقدم لك Pollo AI أيضًا مجموعة واسعة من أدوات الذكاء الاصطناعي. يمكن لهذه الأدوات تقليل العمل المتكرر، وإثارة أفكار جديدة عندما تشعر بالضياع، وجعل الإنشاء المتقدم أكثر سهولة حتى لو لم تكن خبيرًا.

التحكم في الحركة بالذكاء الاصطناعي: حرك أي صورة شخصية ثابتة بحركة واقعية من فيديو حقيقي.
مرشحات الفيديو بالذكاء الاصطناعي: حول لقطاتك بأساليب بصرية إبداعية.
موسع الفيديو بالذكاء الاصطناعي: قم بإطالة مقاطع الفيديو الخاصة بك بسلاسة مع حركة ونمط متسقين.

واجهة لوحة القيادة تعرض أدوات تحرير الفيديو المختلفة بالذكاء الاصطناعي، بما في ذلك رفع دقة الفيديو، وتبديل الوجوه، ومزامنة الشفاه، وإزالة الخلفية

يعتبر Pollo Agent سببًا آخر يجعلني أوصي باستخدام هذه المنصة. كمساعد إنشاء بالذكاء الاصطناعي، يمكنه فهم أهدافك وتوجيه سير عملك. لذا يتم تبسيط عملية الإنشاء الخاصة بك دون الحاجة إلى التلاعب بالأوامر والإعدادات.

يمكنك توفير المزيد من الوقت وتقليل التجربة والخطأ سواء كنت تنشئ مقاطع فيديو UGC أو مقاطع فيديو موسيقية.

الفكرة النهائية

بعد اختبار Gemini Omni (Veo 4)، يمكنني القول إنه يبدو وكأنه خطوة واضحة للأمام عن Veo 3.

أكثر ما برز لي هو فهمه السياقي الأقوى، والتحرير القائم على الدردشة، وإعادة مزج الفيديو، والقدرة على الحفاظ على تماسك التفاصيل المعقدة، خاصة في المشاهد التي تتضمن نصًا أو صيغًا أو تعليمات مستخدم محددة. إنه لا يجعل المقطع يبدو أفضل فحسب؛ بل يجعل الفيديو يبدو أسهل في التوجيه والتحسين.

إذا كنت تريد نموذجًا يمكنه فهم نيتك، والاستجابة للتغييرات، والاستمرار في تشكيل النتيجة من خلال المحادثة، فإن Gemini Omni هو الاتجاه الأكثر إثارة للاهتمام للمشاهدة.

مراجعة Gemini Omni : لقد جربت Gemini Omni، وقد نال إعجابي

انطباعاتي الأولى عن Gemini Omni (Veo 4)

ما الذي يميز Gemini Omni

تجربتي مع Gemini Omni

إنشاء فيديو أصلي متعدد الوسائط

تحرير الفيديو القائم على الدردشة

تماسك أقوى للنص والصيغة

تحرير على مستوى الكائن والمشهد

إعادة مزج الفيديو

إنشاء مدرك للمعرفة العالمية

جرب Gemini Omni على Pollo AI

الفكرة النهائية

قد يعجبك أيضاً

كيفية استخدام Google Gemini Omni (Veo 4): كل ما تحتاج إلى معرفته

دليل استخدام تطبيق Gemini Omni (Veo 4) : كيفية استخدام التطبيق في Gemini Omni (مع أمثلة توضيحية)

أفضل 7 حالات استخدام لجهاز Gemini Omni (Veo 4) التي أثارت إعجابي حقًا

مراجعة Google Veo 3.1 : لقد اختبرت Google Veo 3.1 ووجدته مثيرًا للإعجاب، ولكنه ليس مثاليًا.

في هذه الصفحة