بيت/مدونة/المراجعات/مراجعة نموذج صور Kling O1: هل يمكن لأول مولد صور بالذكاء الاصطناعي من Kling أن يضاهي إرثه في الفيديو؟

مراجعة نموذج صور Kling O1: هل يمكن لأول مولد صور بالذكاء الاصطناعي من Kling أن يضاهي إرثه في الفيديو؟

Kling AI لقد رسخت مكانتها كواحدة من أقوى مولدات الفيديو بالذكاء الاصطناعي في السوق، حيث أدهشت المبدعين باستمرار بقدرتها على إنتاج لقطات عالية الجودة من أوامر نصية بسيطة.

الآن، إنهم يجربون شيئًا جديدًا مع إطلاق نموذج الصور Kling O1، وهو أول نموذج مخصص لتوليد الصور لديهم. السؤال الكبير هو: هل يمكن لـ Kling التعامل مع الصور بنفس جودة الفيديو؟

لقد قضيت وقتًا في اختبار نموذج الصور Kling O1 على نطاق واسع، وأنا هنا لمشاركة ما وجدته. دعونا نرى ما يقدمه هذا النموذج الجديد.

ما الذي يميز Kling O1؟

قبل الخوض في اختباراتي التفصيلية، اسمحوا لي أن أقدم لكم لمحة سريعة عما وجدته من أبرز ميزات Kling O1:

دمج مذهل للصور المتعددة مع الحفاظ على التفاصيل الأصلية

تتمثل إحدى نقاط القوة الرئيسية لنموذج الصور Kling O1 في قدرته على دمج صور مرجعية متعددة مع الحفاظ على الميزات الأصلية لكل مصدر بشكل جيد للغاية.

على عكس العديد من النماذج الأخرى التي تطمس التفاصيل عند خلط صور متعددة، يحافظ Kling O1 على الخصائص المميزة لكل عنصر بدقة مذهلة.

فهم ذكي للأوامر وتحرير دقيق

سواء كان تعديل مناطق معينة من صورة أو تغيير عناصر محددة، يفهم النموذج تعليمات التحرير بدقة.

بناءً على المفهوم القوي للغة البصرية متعددة الوسائط ، يجعل تحرير الصور سهلاً مثل التحدث مع مصمم.

عملية الاختبار الخاصة بي: دفع نموذج الصور Kling O1 إلى أقصى حدوده

لتقييم قدرات Kling O1 بشكل صحيح، ركزت على سيناريوهين اختباريين رئيسيين سيكشفان عن نقاط قوته وضعفه المحتملة:

الاختبار 1: دمج الصور المرجعية المتعددة

يهدف الاختبار الأول إلى تقييم مدى جودة تعامل Kling O1 مع صور مرجعية متعددة في وقت واحد وإنشاء تكوين متماسك يحافظ على خصائص كل مصدر.

استخدمت أربع صور:

فتاة صغيرة ترتدي فستانًا ورديًا تبتسم في الملعب
كلب كوكر سبانييل يجلس على عشب أخضر في الخارج
غرفة حفلة عيد ميلاد فارغة مزينة ببالونات وديكورات ملونة
مجموعة من الأصدقاء مع لوح تزلج يحتفلون عند غروب الشمس على الشاطئ

ثم قدمت الأمر التالي:

يرجى إنشاء صورة تضم الفتاة من الصورة 1 وهي تحمل الكلب من الصورة 2، مع خلفية الصورة 3، وتطبيق درجة اللون والأسلوب للصورة 4 على الصورة بأكملها.

وهذه هي النتيجة التي حصلت عليها:

غرفة حفلة عيد ميلاد مزينة بالبالونات ولافتة عيد ميلاد سعيد

من النتائج التي تم إنشاؤها، من الواضح أن Kling O1 اتبع التعليمات تمامًا، حتى أثناء معالجة المحتوى من أربع صور في وقت واحد. لم يكن هناك أي فوضى أو انحراف عن الأمر، وقدرته القوية على معالجة الصور المتعددة فاجأتني حقًا.

ومع ذلك، أعتقد أن واقعية هذه الصورة يمكن تحسينها. على الرغم من أن الموضوع والخلفية يشتركان في نفس درجة اللون، إلا أنه لا يزال هناك شعور غير متناسق وغير طبيعي إلى حد ما.

إلى جانب دمج المشاهد والمواضيع، اختبرت أيضًا تطبيق النمط والمادة.

استخدمت هاتين الصورتين:

رسم توضيحي لفتاة أنمي مع وشاح بالقرب من أشجار أزهار الكرز.
نسيج قماش أسود وأبيض بنقش شبكي عن قرب

وقمت بتعيين الأمر على النحو التالي:

قم بتحويل موضوع الصورة 1 إلى شخص واقعي، باستخدام النسيج والمادة من الصورة 2 للوشاح.

الصورة النهائية التي قدمها Kling O1:

امرأة مبتسمة ترتدي وشاحًا كاروهات في الخارج في أزهار الربيع

توضح النتيجة النهائية أن Kling O1 يؤدي بشكل جيد في تحويل الأسلوب واستبدال المواد.

ومع ذلك، هناك بعض المشكلات الطفيفة: جزء إضافي من الوشاح يظهر على صدر الموضوع واختفاء ربطة العنق. هذه الأنواع من التناقضات المنطقية في الصورة تقوض واقعيتها بشكل عام.

الاختبار 2: التحرير الدقيق التكراري

ركز الاختبار الثاني على تقييم قدرة Kling O1 على إجراء تعديلات دقيقة وتدريجية بناءً على صورة مرجعية واحدة.

سيسمح هذا بالكشف عما إذا كان النموذج يمكنه التعامل مع سير عمل التحرير المعقد دون تدهور الجودة أو فقدان السياق.

في الجدول الذي جمعته أدناه، يمكنك رؤية مقارنة جنبًا إلى جنب لأداء Kling O1 في هذا الاختبار:

الصورة المرجعية الأمر والنتيجة 1 الأمر والنتيجة 2
امرأة تحمل كوب قهوة تجلس بجوار نافذة مقهى في الداخل
امرأة تجلس على طاولة بار مقهى بدرجة حرارة صفراء من الداخل

غيّر الوقت إلى المساء، مع إضاءة داخلية دافئة من المصابيح العلوية. احتفظ بكل شيء آخر دون تغيير.

امرأة تستريح مع قهوة في مقعد بجوار النافذة في مقهى

استبدل كوب القهوة بكتاب. يجب أن تقرأ المرأة الآن بدلاً من النظر من النافذة. حافظ على نفس الميزات الوجه، والملابس، والخلفية.

الأمر والنتيجة 3 الأمر والنتيجة 4 الأمر والنتيجة 5
امرأة تشرب القهوة بجوار نافذة في مقهى حضري مزدحم

أضف مطر خفيف مرئي من خلال النافذة. اضبط انعكاس النافذة لإظهار قطرات المطر. لا تعدل المشهد الداخلي أو الشخصية.

امرأة مع قهوة تجلس في مقهى مزدحم بجوار النافذة

غيّر ملابسها الكاجوال إلى ملابس عمل رسمية - سترة وبلوزة رسمية. احتفظ بوضعيتها، وملامح وجهها، ومشهد الخلفية بأكمله كما هو.

امرأة تحمل قهوة تجلس في نافذة مقهى مع أشخاص

أضف شخصًا آخر في الخلفية - نادل يعمل خلف المنضدة. حافظ على نفس الإضاءة، ووقت اليوم، وجميع العناصر الموجودة الأخرى.

كانت النتائج رائعة حقًا. أظهر Kling O1 فهمًا استثنائيًا لما يجب أن يتغير وما يجب أن يظل ثابتًا.

حافظ كل تكرار على اتساق ملحوظ مع الإصدارات السابقة مع تنفيذ التعديلات المطلوبة بدقة.

أفكار نهائية: هل يستحق Kling O1 التجربة؟

بعد الاختبار المكثف، من الواضح أن نموذج الصور Kling O1 هو إضافة قوية إلى مجال توليد الصور بالذكاء الاصطناعي.

نهج الوسائط المتعددة يعمل بشكل رائع - يجمع بين الأوامر باللغة الطبيعية والصور المرجعية لإنشاء سير عمل سلس يبدو تعاونيًا بدلاً من كونه محبطًا.

إن الاحتفاظ بالميزات هو الأفضل في فئته حقًا، حيث يحافظ على الخصائص المميزة لكل مصدر عند دمج مراجع متعددة. كما أن التحرير خطوة بخطوة فعال بشكل ملحوظ، مما يتيح لك إجراء تعديلات دقيقة دون فقدان السياق.

بالنسبة للمبدعين والمصممين الذين يرغبون في تحكم واتساق ممتازين، فإن نموذج الصور Kling O1 يستحق التجربة بالتأكيد. إنه ينقل خبرة Kling في الفيديو بنجاح إلى الصور الثابتة مع القضاء على تبديل الأدوات المزعج الذي تعاني منه العديد من عمليات الإبداع بالذكاء الاصطناعي.

هل هو مثالي؟ لا. ولكنه ظهور أول قوي يوضح أن Kling AI جاد بشأن توليد الصور.

هل أنت مستعد لاختباره بنفسك؟ توجه إلى Pollo AI لتجربة نموذج الصور Kling O1، أو استكشف النماذج الممتازة الأخرى المتاحة على مولد الصور Pollo AI للعثور على النموذج الذي يناسب احتياجاتك. إنه استثمار في الوقت يستحق العناء لأي مبدع.

قد يعجبك أيضاً

عرض المزيد

مراجعة جهاز Sora 2 : اختبرتُ نموذج الفيديو الجديد بتقنية الذكاء الاصطناعي من OpenAI – النتائج مذهلة

استكشف مُولّد الفيديو Sora 2 AI من OpenAI في هذه المراجعة العملية. اكتشف لماذا يُحدث Sora 2 ثورة في الإبداع. مُجرّب ومُثبت!

مراجعة Nano Banana Pro: هل يحقق مولّد الصور بالذكاء الاصطناعي هذا الضجة؟

هل يرقى Google Nano Banana Pro إلى مستوى الضجيج؟ يتعمق تقييمنا الصادق في نموذج الصور بالذكاء الاصطناعي Nano Banana Pro، حيث نختبر ميزة عرض النصوص الفائقة، والضوابط الإبداعية، وغير ذلك لاكتشاف ما إذا كان يقدم نتائج حقيقية.

مراجعة Hailuo 2.3 : لقد اختبرت أحدث نموذج فيديو بتقنية الذكاء الاصطناعي من Hailuo AI، وقد فاجأني إيجاباً.

اكتشف Hailuo 2.3 على Pollo AI! استكشف هذه المراجعة المتعمقة التي تتناول أحدث نموذج فيديو بتقنية الذكاء الاصطناعي من Hailuo AI والتطورات الجديدة التي يقدمها لإنشاء فيديوهات بتقنية الذكاء الاصطناعي!

مراجعة Kling O1 : قمتُ باختبار نموذج الفيديو المدعوم بالذكاء الاصطناعي Kling O1 ، وقد يكون مستقبل الفيديو المدعوم بالذكاء الاصطناعي

لقد اختبرت نموذج الفيديو O1 من Kling AI - وهو ذكاء اصطناعي موحد متعدد الوسائط يقوم بإنشاء وتحرير مقاطع الفيديو بسلاسة. اكتشف لماذا قد يكون نموذج الفيديو O1 من Kling هو مستقبل الفيديو بالذكاء الاصطناعي.