أتيحت لي مؤخراً فرصة تجربة أحدث ابتكارات جوجل في مجال تكنولوجيا الفيديو بالذكاء الاصطناعي، Veo 3. وقد تم إطلاقها في 20 مايو 2025، خلال حدث I/O 2025 .
أثارت ميزاته الرائعة ضجة كبيرة. وبصفتي شخصًا يعمل في مجال توليد الفيديو بالذكاء الاصطناعي، فأنا متشوق لمشاركة أفكاري وتجاربي الصادقة مع هذا النموذج.

باختصار شديد
قمتُ باختبار برنامج Veo 3 من خلال إنشاء بودكاست وعدة فيديوهات لحفلات موسيقية. ورغم أنه ليس مثالياً ويحتوي على بعض الأخطاء الغريبة، إلا أنه من المثير للإعجاب مدى جودة إنتاجه لفيديوهات واقعية وصوت متزامن.
لكنني شعرت بالإحباط أيضاً من هذا النموذج في بعض الأحيان: فعملية توليد الصوت والترجمة ليست قابلة للتحكم بشكل كامل، والنصوص التي يتم إنشاؤها غالباً ما تكون مشوشة.
| الإيجابيات | السلبيات |
| ✔️ يُنشئ الفيديو والصوت دفعة واحدة | ❌ خطة اشتراك باهظة الثمن |
| ✔️ مزامنة واقعية لحركة الشفاه ومؤثرات صوتية | ❌ توليد الصوت والترجمة بشكل غير متحكم به |
| ✔️ رسومات عالية الجودة مع فيزياء جيدة | ❌ عيوب مرئية متكررة ونصوص غير مرتبة |
| ✔️ مُدمج في Google Flow |
فيديو، صوت، تعليق صوتي، مزامنة الشفاه، ... كل ذلك في خطوة واحدة
أول ما لاحظته هو كيف يقوم جهاز Veo 3 بتبسيط خطوات إنشاء الفيديو المتعددة في عملية واحدة بسيطة.
عندما أستخدم Veo 3، أُذهل بقدرته على إضفاء الحيوية على مقاطع الفيديو الخاصة بي من خلال الصوت. أستطيع إضافة أصوات محيطة مثل تغريد الطيور في الأشجار أو أصوات شوارع المدينة الصاخبة، مما يجعل مشاهد الفيديو تبدو واقعية للغاية.
أكثر ما يثير إعجابي هو قدرته على إنشاء حوار يتطابق مع حركات شفاه الشخصيات - إنه طبيعي للغاية لدرجة أنه في بعض الأحيان لا يبدو وكأنه تم إنشاؤه بواسطة الذكاء الاصطناعي.
إعادة تعريف سير عمل الفيديو بالذكاء الاصطناعي
تُعدّ هذه الميزة الجديدة متعددة الوسائط بلا شكّ إحدى أبرز مزايا هذا الطراز. لم يعد عليك بعد الآن التعامل مع الموسيقى أو البحث عن التعليقات الصوتية ومزامنة حركة الشفاه بشكل منفصل.
هذا قد يغير طريقة إنتاج الناس للفيديوهات باستخدام الذكاء الاصطناعي:
- سير العمل القديم: إنشاء مقاطع فيديو > إنشاء تعليق صوتي/مؤثرات صوتية/موسيقى > مزامنة الشفاه > التحرير.
- سير العمل الجديد مع Veo 3: ما عليك سوى إدخال نص، وسيتم الاهتمام بكل شيء.
أمثلة من الجيل
كنت متشوقًا لمعرفة كيف سيتمكن Veo 3 من التعامل مع طلبات الفيديو الرائجة، لذلك طلبت منه إنشاء أربعة مقاطع فيديو فريدة.
في المثال الأول، طلبتُ إعلانًا مزيفًا لمذيع أخبار الطقس يبدو حقيقيًا، يصف غزوًا سريعًا للتاكو يشق طريقه إلى الولايات المتحدة.
لقد فوجئت بمدى واقعية اللقطات. فرغم وجود بعض التشوهات الطفيفة في تعابير الوجه، إلا أن المذيع بدا واقعياً مع مزامنة دقيقة لحركة الشفاه.
أما المثال التالي فكان عبارة عن فيديو مبتكر لغوريلا ناطقة ذات مظهر واقعي تحضر مباراة كرة قدم إنجليزية كبيرة، حيث ترفع عصا السيلفي وتصرخ بغضب على مشاهديها بشأن قرار غير عادل من الحكم بينما كانت في المدرجات مع مشجعين آخرين.
كانت هذه نتيجة طريفة، إذ بدا الغوريلا واقعيًا بشكل لا يُصدق، بتعبيرات وحركات جسدية طبيعية. لكن مع ذلك، كانت هناك بعض التشوهات في الخلفية لا تزال ملحوظة.
أما بالنسبة للمثال الثالث، فقد أردت أن أرى كيف سيبدو شكل الخضراوات من الداخل إذا تم تقطيعها إلى نصفين.
في الغالب، تم تنفيذ تعليماتي بدقة، ولكن لسبب ما، قامت الأداة برسم خضراوات متبلورة، مما أثر على الواقعية البصرية التي كنت أسعى إليها. بالمناسبة، الصوت مريح.
في هذا المثال الأخير، طلبت من Veo 3 إنتاج تسلسل سينمائي للسفر عبر الزمن لامرأة تسافر إلى 14 أبريل 1912، وتحاول تحذير الركاب على متن سفينة تيتانيك من غرق السفينة في شمال المحيط الأطلسي، بالقرب من نيوفاوندلاند.
هذه المرة، وجدتُ أن المشهد كان مبالغًا فيه، وأن تسلسل الاختفاء المفاجئ لم يكن ضروريًا. بصراحة، كان عرض الفيديو بتقنية الذكاء الاصطناعي عشوائيًا وغير دقيق.
بشكل عام، كان أداء Veo 3 جيدًا إلى حد كبير. مع بعض المشاكل الطفيفة في سرعة الاستجابة والاتساق البصري، لذا قد يحتاج إلى بعض التحسينات من حين لآخر، لكنني أعتقد أن نموذج الذكاء الاصطناعي هذا قادر على إنتاج فيديوهات جاهزة للانتشار الواسع.
Flow: لمحة سريعة عن الجيل القادم من إنتاج الفيديو بالذكاء الاصطناعي
أطلقت Google Flow جنبًا إلى جنب مع Veo 3. وهي منصة لوحة قصص فيديو تعمل بالذكاء الاصطناعي، وتدمج Veo 3 ونماذج الفيديو السابقة لها، بالإضافة إلى الكثير من أدوات توليد وتحرير الفيديو بالذكاء الاصطناعي.

لوحة القصة
مفهوم لوحة القصة ليس جديدًا. قدمته Sora ، لكنه لم يحظَ بالاهتمام الكافي بسبب أدائه الضعيف. Google Flow، فقد طور مفهوم لوحة القصة وجعله أكثر فائدة.
يمكنك وضع أي مقاطع فيديو قمت بتحميلها أو إنشاؤها بواسطة عائلة طرازات Veo على خط زمني، وترتيبها، واقتصاصها، وإجراء تعديلات أساسية عليها. لكن الميزة الأروع هي ما يسمونه "الامتداد".
إضافة الفيديو السلس
إليك كيفية عملها: يمكنك أخذ مقطع فيديو مدته 8 ثوانٍ واستخدام أي إطار كنقطة بداية لإنشاء رسوم متحركة جديدة تستمر من تلك اللحظة.

الأمر المذهل هو مدى سلاسة الانتقال بين المحتوى الأصلي والجديد. يبدو أن Flow يحلل اتجاهات الحركة في الفيديو الأصلي بدلاً من مجرد استخدام صورة واحدة كمرجع.
تُعدّ هذه الميزة الإضافية بالغة الأهمية لأنها تتجاوز حدود الطول المعتادة للفيديوهات التي يُنشئها الذكاء الاصطناعي. فبدلاً من الاقتصار على المقاطع القصيرة، يُمكنك الآن إنشاء فيديوهات أطول وأكثر سردية.
يشبه الأمر ما وعدت به Sora ، لكن تطبيق جوجل يعمل بشكل جيد بما يكفي ليكون مفيدًا.
لكن هناك أمر واحد يجب ملاحظته: في الوقت الحالي، تعمل ميزة الإضافة فقط مع Veo 2 ، وليس مع Veo 3 الأحدث.
مثير للإعجاب، ولكنه غير متسق أيضاً
كنتُ متحمسًا جدًا للميزات الرائعة والفيديوهات المذهلة التي يُمكن أن يُنتجها Veo 3. ولكن مع استمراري في استخدامه، لاحظتُ أيضًا أن بعض الفيديوهات التي أنشأتها كانت تعاني من مشاكل في الجودة.
إنشاءات غير خاضعة للتحكم في الصوت والترجمة
أحد الأمور التي أزعجتني حقاً هو عشوائية توليد الصوت والترجمة. لا يمكنك التحكم في ظهورهما من عدمه حتى لو حددت ذلك في موجه الأوامر.
أحد الأمثلة على ذلك هو هذا الفيديو الذي تم إنشاؤه بناءً على هذا السؤال: كانت الفتاة البالغة من العمر 20 عامًا في حالة من الضيق الشديد وقالت: "ما الخطب؟ هل تم تحديد أن مقالًا كتبته بنفسي تم إنشاؤه بواسطة الذكاء الاصطناعي؟" تضع الفتاة يدها على رأسها، ويبدو عليها القلق، ولا توجد تعليقات توضيحية.
طلبتُ تحديداً أن تتحدث الفتاة دون أي تعليق في طلبي. لكن الفيديو ظهر صامتاً تماماً، مع وجود تعليق.
وفي هذا المثال من فيديو TikTok للترويج لفرشاة أسنان، لا يمكنك سماع أي صوت أيضًا.
عيوب ومشاكل
لاحظتُ أيضاً بعض العيوب في مقاطع الفيديو التي تم إنشاؤها بواسطة كاميرا Veo 3. ويشمل ذلك حركات غير طبيعية أو تشوهات بصرية غير منطقية.
على سبيل المثال، حاولتُ إنشاء فيديو لفتح صندوق كمبيوتر محمول. بدلاً من إظهار شخص يفتح الصندوق ويخرج الكمبيوتر، تحوّل صندوق الكرتون نفسه مباشرةً إلى كمبيوتر محمول!
من المؤسف أن نرى أن هذه المشكلات من Veo 2 لا تزال قائمة في الإصدار الجديد.
أعتقد أيضاً أن جودة الصوت الإجمالية لا تزال بحاجة إلى تحسين، وبعض المؤثرات الصوتية تبدو غريبة. كانت هذه العيوب طفيفة، لكنها كانت ملحوظة عند الاستماع إليها عن كثب.
نص مشوش
كانت جودة إنشاء النصوص مشكلة أخرى. يستطيع Veo 3 إنشاء ترجمات للفيديوهات، لكن النص كان يظهر في كثير من الأحيان مشوشاً ومليئاً بالأخطاء الإملائية.
يمكنك ملاحظة هذه المشكلة في الأمثلة السابقة. وإليك المزيد من الأمثلة لتوضيح مدى تكرارها.



أدرك أن هذه مشكلة شائعة في العديد من نماذج الذكاء الاصطناعي. ولكن كما ذكرت، لا يمكنك التحكم بشكل كامل في مظهرها. لذا قد تحتاج إلى محاولة توليدها عدة مرات إضافية لتجنب هذه المشكلة.
الوصول باهظ الثمن
من عيوب Veo 3 الأخرى التي لاحظتها سعره الباهظ. فهو متاح فقط للمستخدمين المشتركين في باقة جوجل ألترا، والتي تبلغ تكلفتها 249.99 دولارًا شهريًا.
هذا سعر باهظ. إذا كنت مستخدمًا عاديًا أو منشئ محتوى صغيرًا ترغب في تجربة هذا النموذج، فلا أعتقد أنه مناسب لك. نأمل أن توسّع Google نطاق الوصول أو تقدّم خيارات بأسعار معقولة أكثر في المستقبل.
غير قادر على استخدام Veo 3؟ جرب Pollo AI!
إذا كنت تبحث عن مولد فيديو عالي الجودة بتقنية الذكاء الاصطناعي ولكنك تجد أن Veo 3 غير متاح، فعليك بالتأكيد إلقاء نظرة على Pollo AI !
Pollo AI منصة قوية ومتكاملة لإنشاء مقاطع الفيديو والصور باستخدام الذكاء الاصطناعي، تتيح لك تجربة أفضل نماذج الفيديو في مكان واحد. وبصفتنا شريكًا رسميًا لـ Google Cloud، يمكنك الآن تجربة Veo 3 على Pollo AI والاطلاع على إمكانياتها المتطورة بنفسك!

بالإضافة إلى Veo 3، تتيح لك المنصة التبديل بسلاسة بين الطرازات الرائدة الأخرى مثل Veo 3.1 و Vidu و Hailuo و Kling و PixVerse، وتجربة إمكانياتها الفريدة. وهذا يوفر لك الوصول إلى جميع الطرازات المتقدمة التي تحتاجها لإنشاء فيديوهات مذهلة وعالية الجودة.
علاوة على ذلك، تقدم Pollo AI مجموعة شاملة من أدوات الفيديو الأصلية لتغطية جميع احتياجاتك الإبداعية.
على سبيل المثال، يمكنك تجربة تقنيات الذكاء الاصطناعي المبتكرة لتحويل الصور إلى فيديوهات، وتحويل النصوص إلى فيديوهات، وإضافة المراجع إلى الفيديوهات ، وتحويل الفيديوهات إلى فيديوهات ، وغيرها الكثير. بالإضافة إلى ذلك، يمكنك تطبيق العديد من تأثيرات الفيديو المدعومة بالذكاء الاصطناعي لإنشاء فيديوهات ممتعة وإبداعية متنوعة.
الخاتمة
بصفتي شخصًا جرب معظم أدوات توليد الفيديو بالذكاء الاصطناعي، فأنا متحمس حقًا للجودة العالية التي قدمها برنامج Veo 3 .
إن التكامل الصوتي الطبيعي، والتفاصيل الواقعية، وعملية إنشاء الفيديو المبسطة، كلها ميزات رائعة تثير إعجابي حقاً.
من ناحية أخرى، يحد السعر من نطاق انتشاره، ولا يزال هناك مجال للتحسين في جودة الإنتاج واتساقه.
ومع ذلك، لا يزال Veo 3 يمنحني لمحة رائعة عن وجهة تقنية الفيديو بالذكاء الاصطناعي، وأنا متشوق لرؤية كيف ستبني Google والشركات الأخرى على هذا الأساس.
وإذا كنت تبحث أيضاً عن منصة متكاملة لإنشاء مقاطع الفيديو باستخدام الذكاء الاصطناعي، فأقترح عليك تجربة مولد الفيديو Pollo AI !