هل سمعت من قبل عن Hunyuan Video؟ إنه نموذج متقدم لتوليد الفيديو بالذكاء الاصطناعي لفت انتباهي مؤخرًا، وهو أمر رائع حقًا!
تم تطويره بواسطة Tencent، وهي شركة مقرها في شنتشن تعمل في مجال التكنولوجيا منذ عام 1998.
تم تصميم Hunyuan Video لإنشاء مقاطع فيديو بجودة سينمائية مع دقة بصرية استثنائية، وهو نموذج غني بالمعلمات وعالي الأداء لتوليد الفيديو بالذكاء الاصطناعي.
بالطبع، كنت حريصًا على استكشاف Hunyuan AI لمعرفة كل شيء عنه، لذا دعنا نبدأ مباشرة!
مقدمة عن Hunyuan Video

تم تطوير Hunyuan Video بواسطة عملاق التكنولوجيا الصيني Tencent وتم إطلاقه في أوائل ديسمبر 2024، وهو نموذج لتوليد الفيديو بالذكاء الاصطناعي. بفضل 13 مليار معلمة، يعد أحد أكبر النماذج مفتوحة المصدر التي يمكنها تحويل النصوص إلى مقاطع فيديو عالية الدقة مع انتقالات سلسة بين الإطارات.
لقد كنت مهتمًا بشكل خاص بحقيقة أن Hunyuan AI Video يستخدم نموذج لغوي كبير متعدد الوسائط أحادي الاتجاه (decoder-only multimodal LLM) لمعالجة النصوص. وفقًا لـ Tencent، هذا هو ما يسمح له باتباع التعليمات البسيطة بشكل أفضل من معظم النماذج التقليدية. ونتيجة لذلك، يمكنه إنشاء تسلسلات واقعية تتناسب مع احتياجات المستخدم المحددة.
إلى جانب ذلك، لاحظت أيضًا أن Hunyuan Video يستخدم بنية VAE ثلاثية الأبعاد متقدمة. وهذا يمكّنه من عرض الحركات الواقعية والطبيعية والحفاظ على تناسق الإطارات عبر جميع مقاطع الفيديو التي تم إنشاؤها. من حيث المخرجات، فإنه يوفر دقة أصلية تبلغ 1280 × 720 بكسل، مما يضمن مشاهدة مصقولة عبر منصات مختلفة.
كما ذكرت سابقًا، Hunyuan AI Video أداة مفتوحة المصدر، مما يعني أيضًا أن أي منشئ ومطور يمكنه الوصول إليه بحرية وتحقيق الدخل منه. يجب أن أشير أيضًا إلى أن Tencent أطلقت مؤخرًا نموذج تحويل الصور إلى فيديو (I2V) الخاص بها. هذا أمر رائع، حيث يأتي مع تحسينات جديدة مثل إخراج بدقة 2K.
ما هو رأيي في Hunyuan Video؟
لقد جربت Hunyuan AI، وأول ما لاحظته هو أنه يمكنه الأداء بشكل جيد في اتباع المطالبات البسيطة. لقد جربت عددًا قليلاً من المطالبات المختلفة، وكانت النتائج التي تم إنشاؤها سينمائية بشكل مثير للإعجاب، حتى بدون لغة طبيعية أو تقنية. كانت الحركات أيضًا سلسة وديناميكية نسبيًا، في معظم الحالات.
أنا أقدر حقيقة أن Hunyuan Video يقدم مخرجات بجودة HD دون فشل، لذا كان هذا أمرًا رائعًا. ومع ذلك، عندما أصبحت المطالبات النصية أكثر تعقيدًا، احتجت إلى بضع تكرارات إضافية للحصول على نتيجة مرضية. على سبيل المثال، عندما طلبت منه إنشاء فيديو حول "شخص يشاهد الحياة تمر من مقهى. شعور مريح مقابل ضبابية المدينة. حميمي، تأملي."
فشلت النتيجة في الالتزام بالمطالبة.
يفتقر Hunyuan Video أيضًا إلى بعض الميزات المتقدمة مثل توليد الصوت ومزامنة الشفاه. ولكن، كنموذج مفتوح المصدر، لا أعتبر هذا مشكلة كبيرة في الوقت الحالي.
ما الذي لا يعجبني في Hunyuan Video؟
لدى Hunyuan Video بعض القيود التي أشعر أنها جديرة بالملاحظة. لقد ذكرت بعضها من قبل، ولكن دعني أتعمق فيها بمزيد من التفصيل للمساعدة في تقليل احتمالية أي إحباطات محتملة قد تواجهها.
يتطلب قوة حوسبة عالية
بينما أحب حقيقة أن Hunyuan AI مفتوح المصدر، فإن الحقيقة هي أنه يحتاج إلى الكثير من قوة الحوسبة ليعمل على النحو الأمثل على الأجهزة المحلية. بشكل عام، ستحتاج إلى حوالي 45 جيجابايت من ذاكرة الفيديو (VRAM)، وإلا فإن تشغيل أي شيء أقل سيؤثر على سرعة التوليد.
ضع في اعتبارك أنه يمكن أن يؤثر سلبًا أيضًا على جودة الفيديو. لذا، لتجنب أي إحباطات في هذه المجالات، أقترح بشدة التأكد من أن جهاز الكمبيوتر الخاص بك لديه المواصفات المناسبة قبل البدء في تثبيت Hunyuan Video.
ضوابط متقدمة محدودة
كما ذكرت من قبل، يفتقر Hunyuan AI إلى بعض ضوابط التوليد المتقدمة التي يمكن أن تدعمها معظم نماذج الفيديو الأخرى بالذكاء الاصطناعي. على سبيل المثال، لا يوجد تحرير إطار بإطار أو توليد صوت. لذلك، سأحتاج إلى برنامج إضافي يلبي هذه الضوابط.
ومع ذلك، لا يزال نموذجًا مفتوح المصدر قيد التطوير. من المحتمل أن نتوقع رؤية المزيد من الميزات التي يتم تقديمها في الأشهر القادمة. لذا، فقط ضع كل ذلك في الاعتبار عند استخدام مولد الفيديو هذا بالذكاء الاصطناعي.
كيف تمكنت من الوصول إلى Hunyuan Video؟
هناك طريقتان رئيسيتان للوصول إلى Hunyuan AI Video. الأولى هي تثبيت نموذج الفيديو بالذكاء الاصطناعي محليًا. لم أستخدم هذه الطريقة لأنها تتطلب موارد كبيرة وخطوات محددة وإجراءات إعداد معقدة للبدء. في معظم الحالات، يواجه المستخدمون الكثير من التحديات التقنية التي قد تكون محبطة للتغلب عليها أثناء التثبيت.
لحسن الحظ، اكتشفت بديلاً ثانيًا لاستخدام Hunyuan Video، وهو طريقة أبسط وأكثر موثوقية تسمى Pollo AI! إنها منصة متكاملة لتوليد الصور والفيديو مدعومة بالعديد من نماذج الفيديو الرائدة بالذكاء الاصطناعي.
يمكنني استخدامها للوصول إلى Hunyuan Video، ونماذج أخرى من الطراز الأول مثل Runway، وLuma AI، وKling AI، على سبيل المثال لا الحصر، كل ذلك من لوحة تحكم واحدة وبديهية.

ولكن هذا ليس الجزء الأفضل! بصرف النظر عن وجود كل هذه النماذج في مكان واحد، تقدم Pollo AI أيضًا مجموعة غنية من أدوات وتأثيرات الذكاء الاصطناعي الأصلية التي تساعدني على تخصيص مقاطع الفيديو الخاصة بي بطرق فريدة وجديدة.
على سبيل المثال، يمكنك استخدام مولد النصوص إلى فيديو بالذكاء الاصطناعي القوي الخاص بها لتحويل النصوص إلى حقيقة، أو مولد الصور إلى فيديو بالذكاء الاصطناعي المتنوع الخاص بها لتحريك الصور الثابتة، أو مولد الأفاتار بالذكاء الاصطناعي الإبداعي لإنتاج مقاطع فيديو واقعية لأفاتار متحدث.
تجعل هذه الأدوات العملية الإبداعية أسرع وأكثر ديناميكية.
بالإضافة إلى ذلك، تتمتع Pollo AI بخطط تسعير فعالة للغاية من حيث التكلفة تسمح لي باستخدام ميزاتها وقدراتها الواسعة دون تكبد نفقات باهظة. إنها تقدم حلاً شاملاً وبأسعار معقولة لجميع احتياجات توليد الفيديو بالذكاء الاصطناعي الخاصة بي.
حكمي النهائي على Hunyuan AI
كان Hunyuan AI يحدث موجات ثابتة عبر الإنترنت، وبعد استخدامه، فهمت السبب. في حين أنه ليس مثاليًا بنسبة 100٪ في عرض المشاهد المعقدة، إلا أنه يبلي بلاءً حسنًا في محاكاة الفيزياء الواقعية وإنتاج مخرجات جذابة بصريًا. إنه أيضًا حل نادر مفتوح المصدر، لذا يحمل نموذج Tencent للذكاء الاصطناعي أهمية كبيرة في السوق الحالي. توجه إلى مولد فيديو Pollo AI وجربه!