مراجعة GPT Image 2: اختبرت GPT Image 2 لمدة أسبوعين عبر 5 حالات استخدام، ووجدت النتائج صادمة.

على الرغم من أن العروض التوضيحية التسويقية تبدو مثالية دائمًا، إلا أن نتائج العالم الحقيقي غالبًا ما تكون قصة مختلفة تمامًا.

يعدّ نموذج GPT Image 2، أحدث نماذج معالجة الصور من OpenAI، بتقديم عرض نصوص شبه مثالي وواقعية فائقة. لكن هل يستطيع حقاً التعامل مع النصوص المعقدة والمتشعبة التي نستخدمها يومياً؟ هل يفي بوعوده؟

للوقوف على الحقيقة، أمضيت الأسبوعين الماضيين في اختبار قدرات برنامج GPT Image 2 إلى أقصى حد. إليكم مراجعتي الصادقة والمباشرة لبرنامج GPT Image 2، والتي تم اختبارها في خمسة سيناريوهات مختلفة.

باختصار: هل برنامج GPT Image 2 يستحق التجربة؟

يُعد برنامج GPT Image 2 خيارًا ممتازًا للمبدعين والمسوقين المحترفين الذين يفضلون الدقة على الفوضى الفنية.

أجدها قفزة هائلة للأمام في عرض النصوص والتصميمات الواقعية، لكنها بالتأكيد تضحي ببعض اللمسات الفنية الموجودة في النماذج القديمة.

إذا كان عملك يعتمد على أصول تسويقية نظيفة أو نماذج واجهة مستخدم دقيقة، فسيكون ذلك رائعًا؛ ومع ذلك، إذا كنت تبحث عن فن تجريدي جامح، فقد تجد النتائج واقعية للغاية.

ميزة	أداء صورة GPT 2
الأفضل في	عرض النصوص، نماذج واجهة المستخدم، وجوه بشرية واقعية للغاية
الأسوأ في	فن تجريدي ذو أسلوب مميز للغاية، ومشاهد خيالية فوضوية
سرعة	حوالي 15 ثانية لكل جيل (المستوى القياسي)
التسعير	مشمول في باقة ChatGPT Plus (20 دولارًا شهريًا) أو باقة Pro (200 دولارًا شهريًا)
لمن هذا المنتج	المسوقون والمصممون والمبدعون الذين يحتاجون إلى تحكم دقيق

يمكنك قراءة النظرة العامة الكاملة لصورة GPT 2 للحصول على معلومات أكثر تفصيلاً.

كيف اختبرت صورة GPT 2

قمت بتشغيل GPT Image 2 من خلال 5 سيناريوهات اختبار موحدة، كل منها يحتوي على 3-5 اختلافات في المطالبات تتراوح من البسيطة إلى العدائية المتعمدة.

تم إنشاء كل صورة من الصفر - دون انتقاء صور معينة، أو تكبيرها، أو معالجتها لاحقًا. قيّمتُ كل اختبار من 10 بناءً على الالتزام بالسرعة، والجودة التقنية، والاتساق بين عمليات التشغيل، والفائدة العملية للأعمال الإبداعية الحقيقية. دعوني أريكم النتائج بالتفصيل.

الاختبار الأول: وجوه البشر وتعبيرات الوجه الدقيقة

كنتُ بحاجة إلى صور عالية الجودة لأشخاص يُظهرون مشاعر دقيقة ومحددة، لا مجرد "سعادة" أو "حزن". كنتُ آمل أن تُظهر لي تعابير دقيقة مثل "امرأة في الأربعين من عمرها تحاول إخفاء إرهاقها خلال اجتماع عمل" أو "فتى مراهق يتظاهر بالثقة ولكنه متوتر بشكل واضح".

لمعرفة ما إذا كان بإمكان GPT Image 2 توليد نسيج جلدي واقعي وفروق دقيقة عاطفية، استخدمت هذه المحفزات الثلاثة وهذه هي النتائج التي حصلت عليها.

اِسْتَدْعَى	إخراج الصورة
صورة مقرّبة لرجل في الأربعين من عمره، تظهر عليه تجاعيد خفيفة حول العينين، ويبدو عليه شيء من الحيرة والتسلية. يقف في مقهى ذي إضاءة خافتة. بشرة طبيعية، مسام واضحة، إضاءة سينمائية.
صورة مقرّبة لامرأة مسنّة تضحك، تظهر تجاعيد عميقة حول عينيها، وأشعة الشمس تنعكس على شعيرات وجهها الدقيقة. نسيج بشرة عالي الدقة، بدون تنعيم.
امرأة شابة عاملة في غرفة اجتماعات، تبدو مصممة ولكنها متعبة قليلاً، مع هالات سوداء خفيفة تحت عينيها وميل طفيف في رأسها. إضاءة مكتبية خافتة.

أذهلتني النتائج التي توصلت إليها جميع المطالبات الثلاث. لقد أُعجبتُ بكيفية تمكّن برنامج GPT Image 2 من تجسيد المرح الخفي في العيون مع الحفاظ على عيوب البشرة الواقعية كالمسام والشعر الناعم.

في رأيي، لم يكن يبدو كدمية بلاستيكية على الإطلاق، وحتى مظهر "التعب" الذي طلبته في الطلب الثالث بدا أصيلاً بدلاً من أن يكون مبالغاً فيه.

لاحظت أيضاً كيف أن الإضاءة كانت تحيط بالوجوه بشكل طبيعي، وشعرت أن ضبابية الخلفية جاءت مباشرة من عدسة كاميرا حقيقية.

التقييم: 9.5/10

الاختبار الثاني: عرض النصوص

هذه المرة، أردتُ أن أرى ما إذا كان النموذج قادراً على إنشاء لافتة متجر واقعية دون تحويل الكتابة إلى رموز غريبة. لذا استخدمتُ مُوجِّهات تتضمن رموزاً وأرقاماً وكلمات.

اِسْتَدْعَى	إخراج الصورة
لافتة نيون في زقاق ممطر على طراز السايبربانك مكتوب عليها بوضوح "ميدنايت نودل بار" بأحرف وردية زاهية، مع لافتة أصغر أسفلها مكتوب عليها "مفتوح 24/7".
لوحة قائمة طعام قديمة من خمسينيات القرن الماضي، تعرض "البرغر 5.00 دولار"، و"الميلك شيك 3.00 دولار"، و"البطاطس المقلية 2.00 دولار" بخط كلاسيكي.
واجهة متجر كتب نظيفة وعصرية تحمل اسم "The Paper Architect" مكتوباً بخط serif أنيق على النافذة الزجاجية.

بناءً على النتائج المذكورة أعلاه، أعتقد أن GPT Image 2 قد تعامل مع التهجئة بشكل مثالي تمامًا كما روجت له OpenAI .

لقد هجّأ كل شيء بشكل صحيح في كل اختبار أجريته. شاهدت النموذج وهو يعرض عبارة "Midnight Noodle Bar" والأسعار المحددة في قائمة المطعم، وعبارة "The Paper Architect" الأنيقة بدقة متناهية دون أي خطأ إملائي.

لاحظتُ أيضاً كيف انعكس ضوء النيون بدقة في البرك. وبرأيي، بدت الكتابة ذات الزوائد على واجهة المكتبة مصممة باحترافية.

على الرغم من أنني وجدت أن خيارات الخطوط قد تبدو جامدة بعض الشيء في بعض الأحيان ، إلا أنني ما زلت أعتقد أنها تستحق درجة عالية في عرض النصوص.

التقييم: 9/10

الاختبار الثالث: تحرير سلس على مستوى البكسل

عادةً ما تفشل معظم النماذج في إجراء تعديلات دقيقة. لذا أردتُ أن أرى ما إذا كان بإمكان GPT Image 2 التعامل مع هذا النوع من التصميم التكراري دون إفساد التكوين بأكمله.

لاختبار ذلك، قمت بتشغيل أربع مهام تحرير منفصلة تطلبت من النموذج عزل وتعديل تفاصيل محددة مع الحفاظ على بقية البيئة متطابقة.

المطلوب: تغيير الوسادة الحريرية الزرقاء الموجودة على الجانب الأيسر من الأريكة إلى وسادة مخملية برتقالية محروقة بنمط هندسي، مع الحفاظ على جميع العناصر الأخرى والإضاءة والظلال كما هي.
إدخال الصور	إخراج الصورة

التعليمات: أضف كوبًا صغيرًا من القهوة السوداء الساخنة إلى الطاولة الجانبية الخشبية الفارغة، مع التأكد من أن البخار يبدو طبيعيًا وأن الإضاءة تتناسب مع المصباح المجاور له.
إدخال الصور	إخراج الصورة

المطلوب: تغيير لون عيني النموذج من البني إلى الأخضر الزمردي الثاقب، مع الحفاظ على انعكاس الضوء واللمعان كما هو تمامًا.
إدخال الصور	إخراج الصورة

المطلوب: استبدل طاولة القهوة الزجاجية الحديثة الموجودة في وسط الغرفة بطاولة خشبية ريفية داكنة اللون من خشب البلوط، مع الحفاظ على نفس الانعكاسات على الأرضية والسجادة المحيطة.
إدخال الصور	إخراج الصورة

لقد أذهلتني درجة الاتساق. وأود أن أقول إن قدرتها على عزل وتعديل تفاصيل محددة مع الحفاظ على الإضاءة والبيئة سليمة متقدمة للغاية .

كما ترون، قام برنامج GPT Image 2 بتبديل الوسادة، وإضافة فنجان القهوة، وحتى استبدال الطاولة بأكملها بسلاسة، مما أدى إلى مطابقة الظلال والإضاءة الموجودة بشكل مثالي.

كان تغير لون العين مثيرًا للإعجاب بشكل خاص لأنه لم يكن يبدو كطبقة مسطحة؛ بل احتفظ بالعمق الطبيعي للقزحية.

أراهن أنه لو لم أُريك العملية، لكنت ستعتقد بالتأكيد أنني حصلت على هذه النتائج في برنامج فوتوشوب.

التقييم: 9.5/10

الاختبار الرابع: واقعية المعرفة العالمية الصارمة

كما اختبرت ما إذا كان النموذج يمتلك "حسًا سليمًا" عميقًا من خلال تحديه بأنماط معمارية وبيئية محددة وغير مشهورة.

بدلاً من تركه يعمل بشكل افتراضي على الصور العامة، دفعته لعرض أنسجة محددة ومنطق هيكلي لمعرفة ما إذا كان يفهم كيف تتقادم المواد وتتفاعل مع محيطها.

اِسْتَدْعَى	إخراج الصورة
منظر من الشارع لمجمع سكني تقليدي على الطراز الوحشي في لندن في يوم رمادي غائم. تظهر فيه ملامس الخرسانة، والنوافذ الصغيرة، وبقع الزمن على الجدران.
لقطة من ارتفاع شاهق لمنظر طبيعي بركاني في أيسلندا، يضم أعمدة بازلتية سوداء، وفتحات حرارية أرضية متصاعدة منها الأبخرة، وبقع من الطحالب الخضراء النيونية.
صورة داخلية لصيدلية فرنسية من القرن التاسع عشر، بأرفف خشبية داكنة، وزجاجات تحمل ملصقات يدوية، وسطح من الرخام يظهر عليه تشققات طفيفة وآثار تآكل.
صورة تفصيلية لوعاء كينتسوجي ياباني تقليدي، حيث تكون الشقوق المملوءة بالذهب مرتفعة قليلاً وتلتقط الضوء الخافت لغرفة الشاي.
حجرة محرك سيارة عضلات كلاسيكية من ستينيات القرن الماضي، تُظهر التصميم المحدد لمحرك V8 مع أجزاء من الكروم المتآكل وأسلاك دقيقة من تلك الفترة.

لم أحصل فقط على صور المباني أو السيناريوهات من صورة GPT 2، بل حصلت أيضًا على الأجواء تمامًا كما تخيلتها.

فعلى سبيل المثال، في النتيجة الأولى، بدت أنماط التجوية على الجدران تمامًا مثل أضرار الأمطار الحقيقية التي رأيتها في لندن، مما يثبت لي أن النموذج لديه فهم مذهل للواقعية المعرفية للعالم الحقيقي.

كان وعاء كينتسوجي وحجرة محرك V8 ملفتين للنظر بشكل خاص لأنهما تطلبتا معرفة تقنية محددة. وقد وضع النموذج الشقوق المملوءة بالذهب في السيراميك بدقة، ورتب مكونات المحرك بدقة متناهية.

لقد أذهلني تمامًا حقيقة أنه يفهم "فيزياء" كيفية تقادم المواد في مناخات محددة - كل ذلك دون أن أحتاج إلى توجيهه بشكل صريح من خلال التعليمات.

التقييم: 9/10

الاختبار الخامس: اتباع التعليمات بدقة متناهية

كان وضع GPT Image 2 في سيناريو "كابوس" هو الطريقة الوحيدة لاختبار قدرته على التحمل. لذلك، قمتُ بإخضاعه لخمس قوائم منفصلة من المتطلبات المختلفة والمتضاربة المحتملة.

لأن اتباع التعليمات بشكل مفرط هو ما يؤدي عادةً إلى فقدان معظم نماذج الذكاء الاصطناعي لطريقتها، فقد حددتُ مواقع دقيقة وإضاءة موضعية وقوامًا شديد التحديد لأشياء متعددة لمعرفة التفاصيل التي سيتم إسقاطها.

اِسْتَدْعَى	إخراج الصورة
طاولة خشبية عليها تفاحة حمراء على اليسار، وكوب حليب نصف ممتلئ في المنتصف، وكتاب مفتوح على اليمين. يسقط شعاع ضوء واحد على التفاحة فقط. الخلفية حالكة السواد. صفحات الكتاب مصفرة، وعلى سطح الحليب فقاعة صغيرة.
ساحة مدينة مستقبلية، حيث يهطل المطر على النصف الأيسر من الصورة بينما تشرق الشمس على النصف الأيمن. يقف رجل يرتدي معطفًا أصفرًا واقيًا من المطر تحت المطر، بينما تقف امرأة ترتدي فستانًا أحمر تحت أشعة الشمس. يجب أن يسقط ظل الرجل باتجاه المنتصف.
مكتب عليه حاسوب محمول، وكوب قهوة، ونبتة عصارية. تعرض شاشة الحاسوب محرر أكواد بنص أخضر. كوب القهوة أزرق اللون بمقبض أبيض. النبتة العصارية في أصيص فخاري. يجب وضع الكوب على بُعد بوصتين بالضبط إلى يمين النبتة.
طاولة مطبخ عليها ثلاث مرطبانات: واحدة مملوءة بالكرات الزرقاء، وأخرى بالرمل الأحمر، وثالثة فارغة. يجب أن يكون مرطبان الكرات الزرقاء في المنتصف. قطة تجلس خلف المرطبانات، لكن لا يظهر منها سوى أذنيها فوق الأغطية.
مساحة عمل يرسم فيها شخص صورة قطة على جهاز لوحي، بينما تجلس قطة حقيقية بجانبه تنظر إلى الجهاز. يجب أن تعرض شاشة الجهاز الرسم قيد التنفيذ، ويجب أن يرتدي الشخص خاتمًا أخضر على إبهامه الأيسر.

في رأيي، كانت النتائج واضحة بذاتها فيما يتعلق بقدرة برنامج GPT Image 2 على اتباع التعليمات.

لقد التقطت كل التفاصيل تقريبًا بدقة ملحوظة عبر جميع المطالبات الخمس، بدءًا من الفقاعة الصغيرة على سطح الحليب والإضاءة الموضعية على التفاحة، وصولًا إلى "آذان القطط" المحددة للغاية.

حتى "الحلقة الخضراء على الإبهام الأيسر" في السؤال E تم عرضها بشكل مثالي، وهو تفصيل تتجاهله معظم النماذج ببساطة.

يمكن القول إن هذا المستوى الاستثنائي من الالتزام بالمتطلبات هو أعظم نقاط قوة النموذج، وأعتقد أنه يجعل GPT Image 2 أداة لا غنى عنها للمستخدمين الذين يريدون ترجمة رؤيتهم بدقة إلى وحدات بكسل دون أي تنازلات .

التقييم: 10/10

ما يقوله المستخدمون الحقيقيون

تتباين الآراء بشكل كبير. فبينما يُعجب المحترفون بالدقة، يفتقد المستخدمون العاديون الفوضى الفنية التي كانت تميز الطرازات القديمة.

بالنظر إلى موقعي Reddit و Twitter، يتضح جلياً هذا الشعور. يُشيد مستخدمو منتدى r/ OpenAI بقدرة النموذج على اتباع التعليمات المعقدة. وقد أشار أحد المستخدمين قائلاً: "أخيراً، أصبح يفهم تماماً أين أريد وضع الأشياء في الإطار."

لكن البعض الآخر يشعر بأنه فقد روحه. ومن الشكاوى الشائعة أن برنامج GPT Image 2 يولي أهمية مفرطة للواقعية لدرجة أنه يعجز عن إنتاج فن ملهم أو تجريدي حقًا.

رأيي الشخصي

أعتقد أن ما إذا كان GPT Image 2 هو أفضل مولد صور بالذكاء الاصطناعي في السوق يعتمد بشكل كبير على ما تحاول القيام به.

في رأيي، إنه عبقري في العمل التجاري ، لكنه لا يزال غير قادر على الإبداع الخام والفوضوي.

إذا احتجت إلى نموذج أولي لمنتج، أو صورة شخصية واقعية، أو صورة مع نص، فأنا ألجأ إلى GPT Image 2 في كل مرة. فهو يوفر عليّ ساعات من العمل على برنامج فوتوشوب.

لكن إذا أردت إنشاء مشهد خيالي جامح ومجرد، أجد نفسي أفتقد الطبيعة غير المتوقعة للنماذج القديمة.

يمكنك الاطلاع على مقارنة بين GPT Image 2 و Nano Banana 2 لفهم تطبيقات GPT Image 2 في العالم الحقيقي بشكل أفضل.

باختصار، إنها الأداة المثالية للمحترفين، لكنها قد تُشعر الفنانين بالملل .

كيفية الوصول إلى صورة GPT رقم 2 الآن

يمكنك استخدام GPT Image 2 من خلال الوصول الرسمي أو Pollo AI.

تُجري OpenAI حاليًا اختبارات A/B على النموذج ضمن ChatGPT Plus، ما يعني أنك قد تحصل عليه اليوم وتفقده غدًا. يُتيح لك اشتراك ChatGPT Pro المذكور الوصول الكامل، لكن سعره باهظ بالنسبة لمعظم المستخدمين.

إذا كنت تريد وصولاً سهلاً ومضموناً دون الحاجة إلى خوض لعبة اختبار A/B، Pollo AI ستوفر طريقة سلسة لاستخدام GPT Image 2 ونماذج أخرى من الدرجة الأولى.

إنها منصة توليد شاملة تجمع أقوى نماذج الذكاء الاصطناعي في الصناعة في مساحة عمل واحدة مبسطة.

مع توفر GPT Image 2 بالفعل على Pollo AI، يمكنك دمج قدراته المتقدمة في سير عملك الإبداعي اليوم.

تتيح لك المنصة أيضًا مرونة التبديل بين طرازات أخرى من الطرازات الرائدة مثل Nano Banana 2 و Seedream 5.0 . وهذا يعني أنه يمكنك دائمًا الحصول على أفضل الأدوات في متناول يدك بغض النظر عن متطلبات المشروع.

إلى جانب كونها مركزًا نموذجيًا، تتميز المنصة بـ Pollo Agent ، المصممة لتحويل أفكارك الأولية إلى محتوى جاهز للنشر .

ستتوفر لديك طرق أكثر تطوراً للإنشاء لأن GPT Image 2 سيتم دمجه أيضاً في Pollo Agent.

والأفضل من ذلك كله، يمكنك الحصول على وصول مجاني إلى GPT Image 2 على Pollo AI. لذا يمكنك اختبار كامل إمكانيات GPT Image 2 دون أي تكلفة مسبقة.

بدلاً من البقاء على الهامش، يمكنك إتقان أفضل النماذج الحالية الآن وستكون في وضع مثالي عندما يتم إطلاق GPT Image 2 الثاني.

الحكم النهائي

يمثل GPT Image 2 خطوة هائلة للأمام في مجال تطبيقات الذكاء الاصطناعي. فهو يُصلح أكثر جوانب توليد الصور بالذكاء الاصطناعي إحباطًا، مثل الأخطاء الإملائية وتجاهل تفاصيل التعليمات.

على الرغم من أنه قد لا يكون النموذج "الأكثر متعة" للعب به، إلا أنه بلا شك الأكثر فائدة للتطبيقات الواقعية .

إذا كنت مسوقًا أو مصممًا أو منشئ محتوى، فهذا هو التحديث الذي كنت تنتظره.

الأسئلة الشائعة

ما الفرق بين صورة GPT 2 و DALL-E 3 ؟

يركز برنامج GPT Image 2 بشكل كبير على الواقعية الفوتوغرافية، ودقة عرض النصوص، والالتزام الدقيق بالمواعيد، مما يجعله أفضل للاستخدام التجاري. DALL-E 3 فيُعتبر عمومًا أكثر "إبداعًا" وأفضل في الفن التجريدي أو ذي الطابع الفني المميز.

هل يستطيع برنامج GPT Image 2 تهجئة الكلمات بشكل صحيح؟

نعم، يتمتع بقدرات عرض نصوص شبه مثالية، مما يسمح له بإنشاء لافتات ومستندات وعناصر واجهة مستخدم قابلة للقراءة بأقل قدر من الأخطاء.

هل استخدام صورة GPT 2 مجاني؟

لا، يتم اختباره حاليًا ضمن باقات مدفوعة مثل ChatGPT Plus و ChatGPT Pro المذكور. ولكن يمكنك استخدام GPT Image 2 من خلال Pollo AI للحصول على نسخة تجريبية مجانية.

هل يمكنني استخدام GPT Image 2 لتطوير واجهات برمجة التطبيقات التجارية؟

يتوفر النموذج حاليًا بشكل أساسي للاختبار اليدوي عبر ChatGPT ومنصات مثل Pollo AI. وبينما يُتوقع إصدار واجهة برمجة تطبيقات كاملة، يستخدمه معظم المطورين حاليًا لإنشاء نماذج أولية عالية الدقة قبل أن يصبح التكامل الرسمي على مستوى المؤسسات متاحًا على نطاق واسع.

هل يدعم GPT Image 2 نسب العرض إلى الارتفاع المتعددة؟

نعم، إنه أكثر مرونة بكثير من الطرازات السابقة. خلال تجربتي، وجدت أنه قادر على التعامل مع كل شيء بدءًا من المربعات القياسية بنسبة 1:1 وصولًا إلى التنسيقات السينمائية بنسبة 16:9 والتنسيقات الرأسية بنسبة 9:16 دون تمديد أو تشويه العناصر، وهو ما يُعدّ ميزة كبيرة لمنشئي المحتوى على وسائل التواصل الاجتماعي.

هل تتحسن اتساق المواضيع في المشاريع متعددة اللقطات؟

والجدير بالذكر أن GPT Image 2 يتفوق بشكل ملحوظ في الحفاظ على ملامح الشخصية أو تصميم المنتج عبر مختلف التوجيهات. لاحظتُ أنه إذا وصفتُ شخصيةً ما بالتفصيل مرةً واحدة، فإن النموذج يستطيع محاكاتها في أوضاع مختلفة بدقة تتراوح بين 80 و90%.