Creative Studio

สร้างขึ้นเพื่อให้นักสร้างสรรค์สามารถสร้างวิดีโอ ภาพ อวตาร และไฟล์เสียงได้ในพื้นที่ทำงานสร้างสรรค์เดียว

ลองใช้ Creative Studio ดูสิ

เอเจนต์

สร้างวิดีโอคุณภาพระดับผลิตจริง พร้อมเอฟเฟกต์เสียง ตัวละครที่สอดคล้องกัน และฉากที่สวยงามสมบูรณ์แบบ โดยไม่ต้องตัดต่อ

ลองใช้บริการ Pollo Agent ดูสิ
วิดีโอไวรัล

รีมิกซ์วิดีโอไวรัลได้ภายในไม่กี่นาที

โคลนสไตล์วิดีโอโฆษณา

คัดลอกโฆษณาอีคอมเมิร์ซที่ประสบความสำเร็จ

วิดีโอโฆษณาสไตล์ UGC

สร้างโฆษณาวิดีโอ UGC ที่สมจริง

วิดีโออนิเมะ

แปลงบทภาพยนตร์ให้เป็นวิดีโออนิเมะ

URL ของวิดีโอ (เร็วๆ นี้)

แปลง URL ให้เป็นวิดีโอคุณภาพสูง

วิดีโอเรื่องราว

เปลี่ยนหัวข้อต่างๆ ให้กลายเป็นเรื่องราวในรูปแบบภาพยนตร์

มิวสิกวิดีโอ

แปลงเพลงให้เป็นมิวสิกวิดีโอ

วิดีโอข่าว

สร้างข่าวออกอากาศได้ภายในไม่กี่นาที

วิดีโออธิบาย

เปลี่ยนข้อความธรรมดาให้เป็นคำอธิบายที่น่าสนใจ

หน้าแรก/บล็อก/บทวิจารณ์/รีวิว GPT Image 2: ผมทดสอบ GPT Image 2 เป็นเวลา 2 สัปดาห์ ใน 5 กรณีการใช้งาน และพบว่าผลลัพธ์นั้นน่าตกใจ

รีวิว GPT Image 2: ผมทดสอบ GPT Image 2 เป็นเวลา 2 สัปดาห์ ใน 5 กรณีการใช้งาน และพบว่าผลลัพธ์นั้นน่าตกใจ

แม้ว่าการสาธิตทางการตลาดจะดูสมบูรณ์แบบเสมอ แต่ผลลัพธ์ในโลกแห่งความเป็นจริงมักแตกต่างออกไปอย่างสิ้นเชิง

GPT Image 2 ซึ่งเป็นโมเดลประมวลผลภาพใหม่ล่าสุดของ OpenAI สัญญาว่าจะแสดงผลข้อความได้อย่างสมบูรณ์แบบและสมจริงราวกับภาพถ่าย แต่จะสามารถรับมือกับข้อความแจ้งเตือนที่ยุ่งยากซับซ้อนที่เราใช้กันอยู่ทุกวันได้จริงหรือไม่? มันทำได้ตามที่สัญญาไว้หรือเปล่า?

เพื่อหาคำตอบ ผมจึงใช้เวลาสองสัปดาห์ที่ผ่านมาทดสอบ GPT Image 2 อย่างหนักหน่วงที่สุด นี่คือรีวิวที่ตรงไปตรงมาและไม่ปรุงแต่งของ GPT Image 2 ซึ่งทดสอบในห้าสถานการณ์ที่แตกต่างกัน

สรุปโดยย่อ: GPT Image 2 คุ้มค่าหรือไม่?

GPT Image 2 คุ้มค่าอย่างยิ่งสำหรับ ครีเอเตอร์และนักการตลาดมืออาชีพที่ให้ความสำคัญกับความแม่นยำมากกว่าความวุ่นวายทางศิลปะ

ผมคิดว่ามันเป็นการพัฒนาที่ก้าวกระโดดอย่างมากในด้านการแสดงผลข้อความและการจัดวางที่สมจริง แต่ก็ต้องยอมรับว่ามันทำให้สูญเสียเสน่ห์ทางศิลปะบางส่วนที่พบในรุ่นเก่าๆ ไป

หากงานของคุณขึ้นอยู่กับสื่อการตลาดที่ดูสะอาดตาหรือแบบจำลอง UI ที่แม่นยำ ผลลัพธ์ที่ได้นั้นยอดเยี่ยมมาก แต่ถ้าหากคุณกำลังมองหาภาพศิลปะที่แปลกใหม่และนามธรรม คุณอาจพบว่าผลลัพธ์นั้นดูเรียบง่ายเกินไป

คุณสมบัติ ประสิทธิภาพ GPT Image 2
เก่งที่สุดในด้าน การแสดงผลข้อความ, แบบจำลอง UI, ใบหน้ามนุษย์เสมือนจริง
แย่ที่สุดใน งานศิลปะนามธรรมที่มีรูปแบบเฉพาะตัวสูง ฉากแฟนตาซีที่วุ่นวาย
ความเร็ว ประมาณ 15 วินาทีต่อการสร้างหนึ่งครั้ง (ระดับมาตรฐาน)
ราคา รวมอยู่ในแพ็ก ChatGPT Plus ($20/เดือน) หรือ Pro ($200/เดือน)
เหมาะสำหรับใคร นักการตลาด นักออกแบบ และผู้สร้างสรรค์ที่ต้องการการควบคุมที่แม่นยำ

คุณสามารถอ่าน ภาพรวมฉบับเต็มของ GPT Image 2 เพื่อรับข้อมูลรายละเอียดเพิ่มเติมได้

วิธีที่ฉันทดสอบ GPT Image 2

ฉันได้ทดสอบ GPT Image 2 ผ่านสถานการณ์ทดสอบมาตรฐาน 5 สถานการณ์ โดยแต่ละสถานการณ์มีคำถามที่แตกต่างกัน 3-5 แบบ ตั้งแต่คำถามง่ายไปจนถึงคำถามที่จงใจสร้างความขัดแย้ง

ภาพทุกภาพถูกสร้างขึ้นใหม่ทั้งหมด—ไม่มีการคัดเลือกภาพเฉพาะเจาะจง ไม่มีการขยายขนาดภาพ และไม่มีการปรับแต่งภาพหลังการถ่ายทำ ผมให้คะแนนการทดสอบแต่ละครั้งเต็ม 10 โดยพิจารณาจากความตรงต่อเวลา คุณภาพทางเทคนิค ความสม่ำเสมอในการทดสอบแต่ละครั้ง และประโยชน์ใช้สอยในทางปฏิบัติสำหรับงานสร้างสรรค์จริง ๆ มาดูกันว่าผมพบอะไรบ้าง

แบบทดสอบที่ 1: ใบหน้ามนุษย์และการแสดงออกทางสีหน้าเล็กน้อย

ฉันต้องการภาพถ่ายบุคคลคุณภาพสูงที่แสดงอารมณ์ที่ละเอียดอ่อนและเฉพาะเจาะจง ไม่ใช่แค่ "มีความสุข" หรือ "เศร้า" ฉันหวังว่ามันจะแสดงให้เห็นถึงการแสดงออกทางสีหน้าเล็กๆ น้อยๆ เช่น "หญิงวัย 40 ปีที่พยายามซ่อนความเหนื่อยล้าในระหว่างการประชุมงาน" หรือ "เด็กชายวัยรุ่นที่แสร้งทำเป็นมั่นใจแต่เห็นได้ชัดว่าประหม่า"

เพื่อตรวจสอบว่า GPT Image 2 สามารถสร้างพื้นผิวผิวที่สมจริงและแสดงอารมณ์ได้อย่างละเอียดอ่อนหรือไม่ ฉันใช้คำสั่งสามข้อนี้ และนี่คือผลลัพธ์ที่ได้

ทันที ผลลัพธ์รูปภาพ
ภาพถ่ายระยะใกล้ของชายวัย 40 ปี มีริ้วรอยรอบดวงตาเล็กน้อย ดูสับสนแต่ก็ขบขันเล็กน้อย เขายืนอยู่ในร้านกาแฟที่มีแสงสลัว ผิวดูเป็นธรรมชาติ รูขุมขนมองเห็นได้ชัดเจน แสงไฟแบบภาพยนตร์
ชายคนหนึ่งที่มีริ้วรอยตีนกาเล็กน้อย
ภาพระยะใกล้ของหญิงชรากำลังหัวเราะ มีริ้วรอยลึกรอบดวงตา แสงแดดส่องกระทบเส้นขนอ่อนบนใบหน้า พื้นผิวมีความละเอียดสูง ไม่มีการปรับแต่งให้เรียบเนียน
หญิงชรากำลังหัวเราะ
หญิงสาววัยทำงานคนหนึ่งอยู่ในห้องประชุม ดูมุ่งมั่นแต่เหนื่อยล้าเล็กน้อย มีรอยคล้ำใต้ตาจางๆ และเอียงศีรษะเล็กน้อย แสงไฟในสำนักงานนุ่มนวล
ผู้หญิงมืออาชีพที่กำลังคิด

ผลลัพธ์จากทั้งสามโจทย์ทำให้ฉันประหลาดใจอย่างแท้จริง ฉันประทับใจที่ GPT Image 2 สามารถถ่ายทอดความสนุกสนานเล็กๆ น้อยๆ ในดวงตาได้อย่างสมจริง ในขณะเดียวกันก็รักษารายละเอียดของผิวที่ไม่สมบูรณ์ เช่น รูขุมขนและขนอ่อนๆ ไว้ได้อย่างดีเยี่ยม

ในสายตาของฉัน มันดูไม่เหมือนหุ่นพลาสติกเลยสักนิด และแม้แต่ท่าทาง "เหนื่อยล้า" ที่ฉันขอไว้ในข้อที่สามก็ดูสมจริงมากกว่าที่จะดูเกินจริง

นอกจากนี้ ฉันยังสังเกตเห็นว่าแสงส่องกระทบใบหน้าอย่างเป็นธรรมชาติ และการเบลอฉากหลังนั้นให้ความรู้สึกเหมือนมาจากเลนส์กล้องจริง ๆ

คะแนน: 9.5/10

การทดสอบที่ 2: การแสดงผลข้อความ

คราวนี้ ผมอยากลองดูว่าโมเดลจะสามารถสร้างป้ายหน้าร้านที่สมจริงได้หรือไม่ โดยที่ไม่ทำให้ตัวอักษรกลายเป็นอักษรภาพต่างดาว ดังนั้นผมจึงใช้คำสั่งที่ประกอบด้วยสัญลักษณ์ ตัวเลข และคำต่างๆ

ทันที ผลลัพธ์รูปภาพ
ป้ายไฟนีออนในตรอกไซเบอร์พังก์ที่ฝนตก เขียนว่า 'Midnight Noodle Bar' ด้วยตัวอักษรสีชมพูสดใสอย่างชัดเจน พร้อมป้ายเล็กกว่าด้านล่างเขียนว่า 'Open 24/7'
ป้ายไฟนีออนร้านก๋วยเตี๋ยวเปิด 24 ชั่วโมง
ป้ายเมนูร้านอาหารสไตล์วินเทจยุค 1950 ระบุรายการอาหารว่า 'เบอร์เกอร์ 5.00 ดอลลาร์', 'มิลค์เชค 3.00 ดอลลาร์' และ 'เฟรนช์ฟรายส์ 2.00 ดอลลาร์' ด้วยตัวอักษรเขียนหวัดแบบคลาสสิก
เมนูอาหารฟาสต์ฟู้ดสไตล์วินเทจ
ร้านหนังสือที่มีหน้าร้านสะอาดตาและทันสมัย ​​พร้อมชื่อร้านว่า 'The Paper Architect' เขียนด้วยตัวอักษรแบบมีเชิงที่สวยงามบนกระจกหน้าต่าง
ร้านหนังสือสมัยใหม่บนจัตุรัส

จากผลลัพธ์ข้างต้น ผมคิดว่า GPT Image 2 จัดการกับการสะกดคำได้อย่างสมบูรณ์แบบตามที่ OpenAI โฆษณาไว้

ที่จริงแล้วมันสะกดถูกต้องทุกอย่างในการทดสอบทุกครั้งที่ผมทำ ผมเห็นว่าโมเดลแสดงผลคำว่า 'Midnight Noodle Bar' ราคาที่ระบุในเมนูของร้านอาหาร และชื่อร้าน 'The Paper Architect' ได้อย่างสมบูรณ์แบบโดยไม่มีข้อผิดพลาดแม้แต่คำเดียว

ฉันสังเกตเห็นว่าแสงนีออนสะท้อนในแอ่งน้ำได้อย่างแม่นยำ และในความคิดของฉัน ตัวอักษรแบบมีเชิงบนหน้าต่างร้านหนังสือดูได้รับการออกแบบอย่างมืออาชีพ

แม้ว่าผมจะพบว่า การเลือกแบบอักษรบางครั้งอาจดูแข็งทื่อไปบ้าง แต่ผมก็ยังคิดว่ามันสมควรได้รับคะแนนสูงในด้านการแสดงผลข้อความ

คะแนน: 9/10

การทดสอบที่ 3: การแก้ไขระดับพิกเซลแบบไร้รอยต่อ

การปรับแต่งที่แม่นยำมักเป็นจุดที่โมเดลส่วนใหญ่ล้มเหลว ดังนั้นผมจึงอยากลองดูว่า GPT Image 2 สามารถรับมือกับการออกแบบแบบวนซ้ำเช่นนี้ได้โดยไม่ทำลายองค์ประกอบทั้งหมดหรือไม่

เพื่อทดสอบสิ่งนี้ ฉันได้ทำการประมวลผลงานแก้ไขสี่อย่างแยกกัน ซึ่งแต่ละงานต้องการให้โมเดลแยกและแก้ไขรายละเอียดเฉพาะบางส่วน ในขณะที่รักษาสภาพแวดล้อมส่วนที่เหลือให้เหมือนเดิม

คำสั่ง: เปลี่ยนหมอนผ้าไหมสีน้ำเงินทางด้านซ้ายของโซฟาเป็นหมอนกำมะหยี่สีส้มไหม้ที่มีลวดลายเรขาคณิต โดยคงองค์ประกอบ แสง และเงาอื่นๆ ไว้เหมือนเดิม
การป้อนภาพ ผลลัพธ์รูปภาพ
หมอนสีฟ้าบนโซฟาสีขาว
หมอนสีส้มไหม้ลายเรขาคณิตบนโซฟาสีขาว
คำแนะนำ: วางถ้วยกาแฟดำร้อนๆ ขนาดเล็กไว้บนโต๊ะข้างเตียงไม้ที่ว่างเปล่า โดยจัดให้ไอน้ำดูเป็นธรรมชาติ และแสงไฟเข้ากันกับโคมไฟที่อยู่ข้างๆ
การป้อนภาพ ผลลัพธ์รูปภาพ
โคมไฟแสงสีเหลืองนวลบนโต๊ะทำงาน
กาแฟร้อนหนึ่งถ้วยวางอยู่บนโต๊ะข้างโคมไฟ
คำสั่ง: เปลี่ยนสีตาของนางแบบจากสีน้ำตาลเป็นสีเขียวมรกตสดใส โดยคงแสงสะท้อนและเงาในดวงตาไว้เหมือนเดิมทุกประการ
การป้อนภาพ ผลลัพธ์รูปภาพ
นางแบบตาสีน้ำตาล
นางแบบดวงตาสีเขียวมรกตคมกริบ
คำแนะนำ: เปลี่ยนโต๊ะกาแฟกระจกทรงทันสมัยที่อยู่กลางห้องด้วยโต๊ะไม้โอ๊คสีเข้มสไตล์ชนบท โดยคงไว้ซึ่งเงาสะท้อนบนพื้นและพรมโดยรอบเช่นเดิม
การป้อนภาพ ผลลัพธ์รูปภาพ
ห้องนั่งเล่นขนาดใหญ่ มีโต๊ะกาแฟกระจกอยู่ตรงกลาง
ห้องนั่งเล่นขนาดใหญ่ที่มีโต๊ะกาแฟไม้สีเข้มตั้งอยู่ตรงกลาง

ผมทึ่งกับความสม่ำเสมอของมันมาก และผมต้องบอกว่าความ สามารถในการแยกแยะและปรับแต่งรายละเอียดเฉพาะเจาะจง ในขณะที่ยังคงรักษาสภาพแสงและสภาพแวดล้อมไว้ได้นั้น ล้ำหน้าไปไกลมาก

อย่างที่คุณเห็น GPT Image 2 ได้เปลี่ยนหมอน เพิ่มถ้วยกาแฟ และแม้กระทั่งเปลี่ยนโต๊ะทั้งตัวได้อย่างแนบเนียน เข้ากับเงาและแสงสว่างที่มีอยู่ได้อย่างลงตัว

การเปลี่ยนแปลงสีตาครั้งนี้น่าประทับใจเป็นพิเศษ เพราะมันไม่ได้ดูเหมือนเป็นการเปลี่ยนสีแบบเรียบๆ แต่ยังคงรักษาระดับความลึกตามธรรมชาติของม่านตาไว้

ฉันมั่นใจว่าถ้าฉันไม่แสดงขั้นตอนให้คุณดู คุณคงคิดว่าฉันได้ภาพเหล่านี้มาจากการใช้ Photoshop แน่ๆ

คะแนน: 9.5/10

การทดสอบที่ 4: สัจนิยมเชิงความรู้โลกที่เข้มงวด

นอกจากนี้ ผมยังทดสอบว่าแบบจำลองนี้มี "สามัญสำนึก" ที่ลึกซึ้งหรือไม่ โดยการนำรูปแบบสถาปัตยกรรมและสิ่งแวดล้อมที่ไม่เป็นที่รู้จักมากนักมาท้าทาย

แทนที่จะปล่อยให้มันแสดงผลภาพแบบทั่วไปตามค่าเริ่มต้น ผมได้ลองผลักดันให้มันแสดงผลพื้นผิวและโครงสร้างเฉพาะเจาะจง เพื่อดูว่ามันเข้าใจหรือไม่ว่าวัสดุต่างๆ เสื่อมสภาพและมีปฏิสัมพันธ์กับสภาพแวดล้อมอย่างไร

ทันที ผลลัพธ์รูปภาพ
ภาพจากถนนในอาคารอพาร์ตเมนต์สไตล์บรูทาลิสต์แบบดั้งเดิมในลอนดอนในวันที่ฟ้าครึ้ม พื้นผิวคอนกรีต หน้าต่างบานเล็ก และคราบสกปรกที่หลงเหลืออยู่บนผนัง
อาคารที่อยู่อาศัยแบบดั้งเดิม
ภาพถ่ายมุมสูงของภูมิประเทศภูเขาไฟในไอซ์แลนด์ แสดงให้เห็นเสาหินบะซอลต์สีดำ ปล่องความร้อนใต้พิภพที่พ่นไอน้ำ และมอสสีเขียวนีออนเป็นหย่อมๆ
ภูมิประเทศภูเขาไฟของไอซ์แลนด์
ภาพภายในร้านขายยาฝรั่งเศสในศตวรรษที่ 19 มีชั้นวางของไม้สีเข้ม ขวดแก้วติดฉลากด้วยมือ และเคาน์เตอร์หินอ่อนที่มีรอยแตกและร่องรอยการใช้งานเล็กน้อย
ภาพภายในห้อง
ภาพถ่ายระยะใกล้ของชามคินสึกิแบบดั้งเดิมของญี่ปุ่น ซึ่งรอยแตกที่เติมด้วยทองคำนั้นนูนขึ้นเล็กน้อยและสะท้อนแสงอ่อนๆ ในห้องชงชา
ชามสวยงามสไตล์ญี่ปุ่น
ภาพห้องเครื่องของรถมัสเซิลคาร์คลาสสิกยุค 1960 แสดงให้เห็นถึงการจัดวางเครื่องยนต์ V8 อย่างละเอียด พร้อมชิ้นส่วนโครเมียมที่ดูเก่าแก่ และระบบสายไฟที่ถูกต้องตามยุคสมัย
เครื่องยนต์ของรถยนต์

ฉันไม่ได้แค่ได้ภาพอาคารหรือฉากจาก GPT Image 2 เท่านั้น แต่ยังได้บรรยากาศตรงตามที่ฉันจินตนาการไว้ด้วย

ตัวอย่างเช่น ในผลลัพธ์แรก รูปแบบการผุกร่อนบนผนังดูเหมือนกับความเสียหายจากฝนในโลกแห่งความเป็นจริงที่ฉันเคยเห็นในลอนดอน ซึ่งพิสูจน์ให้ฉันเห็นว่าแบบจำลองนี้มีความเข้าใจในความสมจริงของโลกแห่งความเป็นจริงได้อย่างน่าทึ่ง

ส่วนของชามคินสึกิและห้องเครื่องยนต์ V8 นั้นโดดเด่นเป็นพิเศษ เพราะต้องใช้ความรู้ทางเทคนิคเฉพาะด้าน แบบจำลองนี้ได้วางรอยแตกที่เติมทองคำเปลวลงบนเซรามิกได้อย่างถูกต้อง และจัดวางส่วนประกอบของเครื่องยนต์ได้อย่างแม่นยำ

ผมประทับใจมากที่ มันเข้าใจ "หลักฟิสิกส์" ของการเสื่อมสภาพของวัสดุในสภาพภูมิอากาศเฉพาะต่างๆ โดยที่ผมไม่ต้องคอยชี้นำมันผ่านคำสั่งเลยแม้แต่น้อย

คะแนน: 9/10

การทดสอบที่ 5: การปฏิบัติตามคำแนะนำอย่างเคร่งครัด

การทดสอบ GPT Image 2 ด้วยสถานการณ์ "ข้อความแจ้งเตือนสุดโหด" เป็นวิธีเดียวที่จะทดสอบขีดจำกัดของมันได้อย่างแท้จริง ดังนั้นผมจึงใส่รายการข้อกำหนดที่แตกต่างกันและอาจขัดแย้งกันถึงห้ารายการลงไป

เนื่องจากการปฏิบัติตามคำสั่งที่เข้มงวดเกินไปมักเป็นจุดที่โมเดล AI ส่วนใหญ่หลงทาง ผมจึงกำหนดตำแหน่งที่แน่นอน แสงเฉพาะจุด และพื้นผิวที่เฉพาะเจาะจงมาก ๆ สำหรับวัตถุหลายชิ้น เพื่อดูว่ารายละเอียดใดบ้างที่จะถูกละเลย

ทันที ผลลัพธ์รูปภาพ
โต๊ะไม้หลังหนึ่ง มีแอปเปิลสีแดงวางอยู่ทางซ้าย แก้วนมครึ่งแก้วอยู่ตรงกลาง และหนังสือเปิดอยู่ทางขวา แสงสว่างเพียงลำเดียวส่องกระทบแอปเปิลเท่านั้น ฉากหลังมืดสนิท หน้าหนังสือเหลืองซีด และนมมีฟองเล็กๆ อยู่บนผิวหน้า
แอปเปิ้ลหนึ่งลูก นมหนึ่งถ้วย และหนังสือหนึ่งเล่ม
ภาพจัตุรัสในเมืองแห่งอนาคต ที่ด้านซ้ายของภาพมีฝนตก แต่ด้านขวามีแดดออก ชายคนหนึ่งสวมเสื้อกันฝนสีเหลืองยืนอยู่ท่ามกลางสายฝน และหญิงคนหนึ่งสวมชุดสีแดงยืนอยู่ท่ามกลางแสงแดด เงาของชายคนนั้นควรทอดลงไปยังกึ่งกลางภาพ
การแสดงผลบนหน้าจอที่ขัดแย้งกันของที่พักพิงต่างๆ
โต๊ะทำงานมีแล็ปท็อป แก้วกาแฟ และต้นไม้อวบน้ำ หน้าจอแล็ปท็อปแสดงหน้าต่างแก้ไขโค้ดที่มีตัวอักษรสีเขียว แก้วกาแฟสีน้ำเงินมีหูจับสีขาว ต้นไม้อวบน้ำอยู่ในกระถางดินเผา ต้องวางแก้วกาแฟไว้ทางด้านขวาของต้นไม้อวบน้ำเป็นระยะ 2 นิ้วพอดี
คอมพิวเตอร์ตั้งโต๊ะที่กำลังรันโค้ด ต้นไม้เล็กๆ และชาหนึ่งถ้วย
เคาน์เตอร์ครัวมีโถสามใบ ใบหนึ่งบรรจุลูกแก้วสีฟ้า ใบหนึ่งบรรจุทรายสีแดง และอีกใบว่างเปล่า โถที่บรรจุลูกแก้วสีฟ้าต้องอยู่ตรงกลาง มีแมวนั่งอยู่ด้านหลังโถ แต่เห็นเพียงหูของมันโผล่พ้นฝาขึ้นมา
ลูกแมวตัวหนึ่งซ่อนอยู่หลังโหลสามใบ
ภาพแสดงพื้นที่ทำงานที่บุคคลหนึ่งกำลังวาดรูปแมวบนแท็บเล็ต ในขณะที่แมวตัวจริงนั่งอยู่ข้างๆ และมองดูแท็บเล็ตนั้น หน้าจอแท็บเล็ตต้องแสดงภาพวาดที่กำลังดำเนินการอยู่ และบุคคลนั้นต้องสวมแหวนสีเขียวที่นิ้วโป้งซ้าย
แมวกำลังจ้องมองภาพเหมือนของมัน

ในความคิดเห็นของผม ผลลัพธ์ที่ได้นั้นชัดเจนในตัวเองอยู่แล้วว่า GPT Image 2 สามารถปฏิบัติตามคำแนะนำได้เป็นอย่างดี

มันสามารถเก็บรายละเอียดเกือบทุกอย่างได้อย่างแม่นยำอย่างน่าทึ่งในทุกๆ 5 คำสั่ง ตั้งแต่ฟองเล็กๆ บนผิวนมและแสงที่ส่องเฉพาะจุดบนแอปเปิล ไปจนถึง "หูแมว" ที่เฉพาะเจาะจงมาก

แม้แต่ "วงแหวนสีเขียวบนนิ้วโป้งซ้าย" ในข้อความแจ้งเตือน E ก็ยังถูกเรนเดอร์ได้อย่างสมบูรณ์แบบ ซึ่งเป็นรายละเอียดที่โมเดลส่วนใหญ่จะมองข้ามไป

ความสามารถในการปฏิบัติตามคำสั่งได้อย่างยอดเยี่ยมในระดับนี้ อาจกล่าวได้ว่าเป็นจุดแข็งที่สุดของโมเดลนี้ และผมเชื่อว่ามันทำให้ GPT Image 2 เป็นเครื่องมือที่ขาดไม่ได้สำหรับผู้ใช้ที่ต้องการแปลงวิสัยทัศน์ของตนให้เป็นพิกเซลอย่างแม่นยำโดยไม่ลดทอนคุณภาพ

คะแนน: 10/10

ความคิดเห็นจากผู้ใช้งานจริง

ความคิดเห็นแตกต่างกันอย่างมาก ในขณะที่ผู้เชี่ยวชาญชื่นชอบความแม่นยำ แต่ผู้ใช้ทั่วไปกลับคิดถึงความวุ่นวายทางศิลปะของรุ่นเก่าๆ

จากการสำรวจใน Reddit และ Twitter ทำให้เห็นถึงความรู้สึกที่ชัดเจน ผู้ใช้ใน r/ OpenAI ต่างชื่นชมความสามารถของโมเดลในการทำตามคำสั่งที่ซับซ้อน ผู้ใช้รายหนึ่งกล่าวว่า "ในที่สุดมันก็เข้าใจอย่างถ่องแท้แล้วว่าฉันต้องการวางวัตถุไว้ตรงไหนในเฟรม"

แต่บางคนรู้สึกว่ามันสูญเสียแก่นแท้ไปแล้ว ข้อร้องเรียนที่พบบ่อยคือ GPT Image 2 ให้ความสำคัญกับความสมจริงมากเกินไป จนทำให้ไม่สามารถสร้างสรรค์งานศิลปะที่สร้างแรงบันดาลใจหรือนามธรรมได้อย่างแท้จริง

ความคิดเห็นส่วนตัวของฉัน

ผมคิดว่าการที่ GPT Image 2 เป็นโปรแกรมสร้างภาพด้วย AI ที่ดีที่สุดในตลาดหรือไม่นั้น ขึ้นอยู่กับว่าคุณต้องการใช้งานอะไรเป็นหลัก

ในความคิดของผม มัน เก่งกาจเรื่องงานเชิงพาณิชย์ มาก แต่ยังไม่สามารถสร้างสรรค์งานที่มีความคิดสร้างสรรค์ดิบๆ และไร้ระเบียบได้

ถ้าฉันต้องการภาพจำลองผลิตภัณฑ์ ภาพบุคคลสมจริง หรือภาพที่มีข้อความ ฉันจะเลือกใช้ GPT Image 2 ทุกครั้ง มันช่วยประหยัดเวลาในการทำงานกับ Photoshop ได้หลายชั่วโมง

แต่ถ้าผมต้องการสร้างภาพทิวทัศน์แฟนตาซีที่แปลกใหม่และนามธรรม ผมก็พบว่าตัวเองคิดถึงความไม่แน่นอนของโมเดลแบบเก่าๆ

คุณสามารถดูการเปรียบเทียบ GPT Image 2 กับ Nano Banana 2 เพื่อทำความเข้าใจการใช้งานจริงของ GPT Image 2 ได้ดียิ่งขึ้น

โดยรวมแล้ว มันเป็นเครื่องมือที่ดีที่สุดสำหรับมืออาชีพ แต่สำหรับศิลปินแล้ว มันอาจทำให้รู้สึกเบื่อได้

วิธีเข้าถึง GPT Image 2 ในขณะนี้

คุณสามารถใช้งาน GPT Image 2 ได้ผ่านการเข้าถึงอย่างเป็นทางการหรือผ่าน Pollo AI

ปัจจุบัน OpenAI กำลังทดสอบโมเดลแบบ A/B ภายใน ChatGPT Plus ซึ่งหมายความว่าคุณอาจใช้งานได้ในวันหนึ่งและใช้งานไม่ได้ในวันถัดไป ส่วน ChatGPT Pro ที่กล่าวถึงนั้นให้สิทธิ์การเข้าถึงแบบเต็มรูปแบบ แต่ราคาสูงเกินไปสำหรับผู้ใช้ส่วนใหญ่

หากคุณต้องการการเข้าถึงที่ง่ายและรับประกันได้ โดยไม่ต้องเสียเวลาไปกับการทดสอบ A/B นั้น Pollo AI จะมอบวิธีการที่ราบรื่นในการใช้งาน GPT Image 2 และโมเดลชั้นนำอื่นๆ

เป็นแพลตฟอร์มการสร้างเนื้อหาแบบครบวงจรที่รวบรวมโมเดล AI ที่ทรงพลังที่สุดในอุตสาหกรรมไว้ในพื้นที่ทำงานเดียวที่ใช้งานง่าย

เนื่องจาก GPT Image 2 พร้อมใช้งานแล้วบน Pollo AI คุณจึงสามารถผสานรวมความสามารถขั้นสูงเข้ากับขั้นตอนการทำงานสร้างสรรค์ของคุณได้ตั้งแต่วันนี้

แพลตฟอร์มนี้ยังให้ความยืดหยุ่นในการสลับไปมาระหว่างรุ่นระดับสูงอื่นๆ เช่น Nano Banana 2 และ Seedream 5.0 นั่นหมายความว่าคุณจะมีเครื่องมือที่ดีที่สุดไว้ใช้งานเสมอ ไม่ว่าความต้องการของโปรเจ็กต์จะเป็นอย่างไรก็ตาม

โมเดลภาพ AI ของไก่

นอกเหนือจากการเป็นศูนย์กลางรวบรวมโมเดลแล้ว แพลตฟอร์มนี้ยังมี Pollo Agent ซึ่งออกแบบมาเพื่อ เปลี่ยนไอเดียดิบๆ ของคุณให้เป็นเนื้อหาที่พร้อมสำหรับการเผยแพร่

คุณจะมีวิธีการสร้างสรรค์ที่ซับซ้อนยิ่งขึ้น เนื่องจาก GPT Image 2 จะถูกรวมเข้ากับ Pollo Agent ด้วย

โปโล เอเจนต์

ที่สำคัญที่สุด คุณสามารถ เข้าถึง GPT Image 2 ได้ฟรี บน Pollo AI ดังนั้นคุณจึงสามารถทดสอบศักยภาพเต็มรูปแบบของ GPT Image 2 ได้โดยไม่ต้องเสียค่าใช้จ่ายใดๆ ล่วงหน้า

แทนที่จะอยู่เฉยๆ คุณสามารถเรียนรู้โมเดลที่ดีที่สุดในปัจจุบันได้เลย และเตรียมพร้อมอย่างสมบูรณ์แบบเมื่อ GPT Image 2 รุ่นที่สองเปิดตัวอย่างเป็นทางการ

คำตัดสินสุดท้าย

GPT Image 2 เป็นก้าวสำคัญอย่างยิ่งสำหรับเครื่องมือ AI ที่มีประโยชน์ มันแก้ไขปัญหาที่น่าหงุดหงิดที่สุดในการสร้างภาพด้วย AI นั่นคือ ข้อผิดพลาดด้านการสะกดคำและการละเลยรายละเอียดที่กำหนดไว้

แม้ว่าอาจจะไม่ใช่โมเดลที่ "สนุก" ที่สุดในการเล่น แต่ก็ปฏิเสธไม่ได้เลยว่าเป็น โมเดลที่มีประโยชน์ที่สุดสำหรับการใช้งานในโลกแห่งความเป็นจริง

หากคุณเป็นนักการตลาด นักออกแบบ หรือผู้สร้างคอนเทนต์ นี่คือการอัปเกรดที่คุณรอคอยมานานแล้ว

คำถามที่พบบ่อย

GPT Image 2 กับ DALL-E 3 แตกต่างกันอย่างไร?

GPT Image 2 เน้นหนักไปที่ความสมจริงของภาพถ่าย การแสดงผลข้อความที่ถูกต้อง และการปฏิบัติตามคำสั่งอย่างแม่นยำ ทำให้เหมาะสำหรับการใช้งานเชิงพาณิชย์มากกว่า DALL-E 3 โดยทั่วไปถือว่า "มีความคิดสร้างสรรค์" มากกว่า และเหมาะกับงานศิลปะแบบมีสไตล์หรือนามธรรมมากกว่า

GPT Image 2 สามารถสะกดคำได้อย่างถูกต้องหรือไม่?

ใช่แล้ว โปรแกรมนี้มีความสามารถในการแสดงผลข้อความที่เกือบสมบูรณ์แบบ ทำให้สามารถสร้างป้าย เอกสาร และองค์ประกอบ UI ที่อ่านง่ายโดยมีข้อผิดพลาดน้อยที่สุด

GPT Image 2 สามารถใช้งานได้ฟรีหรือไม่?

ไม่ค่ะ ขณะนี้กำลังทดสอบอยู่ในแพ็กเกจแบบเสียเงิน เช่น ChatGPT Plus และ ChatGPT Pro แต่คุณสามารถใช้ GPT Image 2 ผ่าน Pollo AI เพื่อทดลองใช้งานฟรีได้ค่ะ

ฉันสามารถใช้ GPT Image 2 สำหรับการพัฒนา API ในเชิงพาณิชย์ได้หรือไม่?

ปัจจุบัน โมเดลนี้ส่วนใหญ่พร้อมใช้งานสำหรับการทดสอบด้วยตนเองผ่าน ChatGPT และแพลตฟอร์มต่างๆ เช่น Pollo AI แม้ว่าจะคาดว่าจะมีการเปิดตัว API อย่างเต็มรูปแบบในเร็วๆ นี้ แต่นักพัฒนาส่วนใหญ่กำลังใช้โมเดลนี้เพื่อสร้างต้นแบบชิ้นงานที่มีความละเอียดสูงก่อนที่จะมีการบูรณาการระดับองค์กรอย่างเป็นทางการอย่างแพร่หลาย

โปรแกรม GPT Image 2 รองรับอัตราส่วนภาพหลายแบบหรือไม่?

ใช่แล้ว มันมีความยืดหยุ่นมากกว่ารุ่นก่อนๆ มาก ในระหว่างการทดสอบ ผมพบว่ามันสามารถรองรับได้ทุกอย่าง ตั้งแต่ภาพสี่เหลี่ยมจัตุรัสมาตรฐาน 1:1 ไปจนถึงรูปแบบภาพยนตร์ 16:9 และรูปแบบแนวตั้ง 9:16 โดยไม่ยืดหรือบิดเบี้ยวภาพ ซึ่งถือเป็นข้อดีอย่างมากสำหรับผู้สร้างคอนเทนต์บนโซเชียลมีเดีย

ความสม่ำเสมอของตัวแบบดีขึ้นหรือไม่สำหรับโปรเจ็กต์ที่มีการถ่ายทำหลายช็อต?

ที่สำคัญคือ GPT Image 2 ทำได้ดีกว่ามากในการรักษารายละเอียดของตัวละครหรือการออกแบบผลิตภัณฑ์ให้คงที่ในคำสั่งต่างๆ ผมสังเกตว่าหากผมอธิบายตัวละครอย่างละเอียดเพียงครั้งเดียว โมเดลก็สามารถจำลองท่าทางต่างๆ ได้อย่างแม่นยำประมาณ 80-90%

คุณอาจสนใจสิ่งเหล่านี้ด้วย

ดูเพิ่มเติม

GPT Image 2 เทียบกับ Nano Banana 2: โปรแกรมสร้างภาพ AI ตัวไหนชนะกันแน่?

ลองดูคู่มือเปรียบเทียบ GPT Image 2 กับ Nano Banana 2 ฉบับละเอียดนี้ เพื่อเรียนรู้การเปรียบเทียบเชิงปฏิบัติเกี่ยวกับการแสดงผลข้อความ ความสมจริงของภาพ และการปฏิบัติตามข้อความแจ้งเตือน

รีวิว Getimg: ผมได้ทดสอบ Getimg.ai และค้นพบสิ่งที่น่าตกใจเกี่ยวกับโปรแกรมสร้างภาพด้วย AI ของมัน

อยากใช้ Getimg.ai สร้างภาพใช่ไหม? ก่อนอื่น อ่านรีวิวเชิงลึกของโปรแกรมสร้างภาพ AI ตัวนี้ก่อน เพื่อเรียนรู้เกี่ยวกับคุณสมบัติทั้งหมด ประสบการณ์ส่วนตัวของฉัน และอื่นๆ อีกมากมาย!

ฉันได้ทดสอบ Imagen 4: ไม่ดีเท่า Imagen 3 แต่มีวิธีที่จะทำให้ได้ประสิทธิภาพสูงสุด!

ลองอ่านรีวิว Imagen 4 ของฉันเพื่อเรียนรู้ทุกอย่างเกี่ยวกับสิ่งที่โมเดลการสร้างภาพ AI ของ Google DeepMind ทำได้ รวมถึงประสบการณ์ส่วนตัวของฉันกับมัน

Nano Banana 2: ก้าวกระโดดครั้งต่อไปในการสร้างภาพอัจฉริยะด้วย AI หรือไม่?

Nano Banana 2 คาดว่าจะเปิดตัวช่วงปลายปี 2025/ต้นปี 2026 พร้อมฟีเจอร์พร้อมท์อัจฉริยะ การรองรับหลายภาษา การแสดงผลข้อความที่ล้ำสมัย และความแม่นยำเชิงตรรกะ สำรวจการประมาณการอัปเกรดของ Nano Banana 2