การสร้างภาพ GPT-4o

การสร้างภาพ GPT-4o

การสร้างภาพ GPT-4o เป็นคุณลักษณะขั้นสูงใหม่ที่รวมเข้ากับ โมเดล GPT-4o โดย OpenAI อย่างแท้จริง ด้วย โมเดล DALL·E 3 ขั้นสูงกว่า ทำให้เครื่องสร้างภาพ ChatGPT ช่วยให้ผู้ใช้สามารถสร้างและแก้ไขภาพได้โดยตรงภายใน ChatGPT ผ่านคำแนะนำภาษาธรรมชาติและการปรับแต่งการสนทนา ลองใช้การสร้างภาพ GPT-4o ด้านล่าง

ข้อความเป็นรูปภาพ
ภาพต่อภาพ
ข้อความเป็นรูปภาพ
Flux Dev
0 / 1000
แปลข้อความแจ้งเตือน

ภาพที่มีความเที่ยงตรงสูงและรายละเอียดสูง

GPT-4o สามารถสร้างภาพที่มีวัตถุที่แตกต่างกันจำนวนมากได้สูงสุดถึง 10-20 ชิ้น โดยยังคงความชัดเจนและความสมจริงเอาไว้ ความสามารถนี้รองรับฉากที่ซับซ้อนซึ่งประกอบด้วยตัวละคร วัตถุ และพื้นหลังหลายรายการ โดยแต่ละฉากจะแสดงผลด้วยรายละเอียดและความสัมพันธ์เชิงพื้นที่ที่เหมาะสม

แจ้งเตือน ภาพเอาท์พุต
รูปภาพสี่เหลี่ยมจัตุรัสที่มีตาราง 4 แถว 4 คอลัมน์ มีวัตถุ 16 ชิ้นบนพื้นหลังสีขาว จากซ้ายไปขวา บนลงล่าง นี่คือรายการ:
สี่เหลี่ยม
แสดงแก้วไวน์ให้ฉันดูหน่อย ซึ่งมีไวน์แดงหยดเดียวอยู่ในนั้น
แก้วไวน์
เราต้องการหลักฐานว่ามีช้างที่มองไม่เห็นอยู่จริงในปัจจุบัน ลองพิจารณาว่าช้างคืออะไรและทำอะไรในสิ่งแวดล้อม จากนั้นแสดงให้เราเห็นสิ่งนั้น บางทีอาจเป็นระหว่างกระบวนการ แต่ช้างเองไม่ได้ถูกแสดงออกมาเลย
ช้าง

รองรับรูปแบบภาพหลายรูปแบบ

การสร้างภาพ GPT-4o รองรับรูปแบบภาพที่หลากหลายและหลากหลาย ทำให้สามารถปรับให้เหมาะกับความต้องการด้านความคิดสร้างสรรค์และการใช้งานจริงที่แตกต่างกันได้ โมเดลนี้โดดเด่นในด้านการสร้างภาพที่เหมือนจริง สไตล์ศิลปะ หรือภาพเหมือนการ์ตูน ขึ้นอยู่กับคำสั่ง

สิ่งที่ทำให้คุณสมบัติการสร้างภาพ GPT-4o เป็นที่นิยมอาจเป็นเพราะความสามารถในการสร้างภาพสไตล์อะนิเมะยอดนิยม เช่น Studio Ghibli , South Park, The Simpsons และอื่นๆ อีกมากมาย

ป้อนข้อมูล สตูดิโอจิบลิ เซาท์พาร์ค เดอะ ซิมป์สันส์
สาว
สตูดิโอจิบลิ
เซาท์พาร์ค
ซิมป์สัน

การแสดงข้อความที่แม่นยำ

ความสามารถที่โดดเด่นอย่างหนึ่งของการสร้างภาพ GPT-4o คือความสามารถในการแสดงข้อความภายในภาพได้อย่างชัดเจนและแม่นยำ ซึ่งเป็นความท้าทายที่ทราบกันดีในโมเดลการสร้างภาพก่อนหน้านี้ ซึ่งช่วยให้สามารถสร้างอินโฟกราฟิก ป้ายบอกทาง หรือภาพใดๆ ที่ต้องการข้อความที่อ่านออกได้

แจ้งเตือน ภาพเอาท์พุต
บทกวีแม่เหล็กบนตู้เย็นในบ้านยุคกลางศตวรรษ:

บรรทัดที่ 1: “รูปภาพ”

บรรทัดที่ 2: “คุ้มค่า”

บรรทัดที่ 3: "พันคำ"

บรรทัดที่ 4: “แต่บางครั้ง”ช่องว่างขนาดใหญ่บรรทัดที่ 5: “อยู่ในที่ที่เหมาะสม”

บรรทัดที่ 6: “สามารถยกระดับได้”

บรรทัดที่ 7 : "ความหมายของมัน"

“ชายคนนี้ถือคำว่า “สองสาม” ไว้ในมือขวา และถือคำว่า “คำพูด” ไว้ในมือซ้าย

บทกวี
สร้างภาพของแถบสี่แผงพร้อมการเติมขอบเล็กน้อย:

หอยทากตัวน้อยยืนอยู่ที่เคาน์เตอร์ของโชว์รูมรถยนต์หรูหรา พนักงานขายโน้มตัวไปเหนือโต๊ะเพื่อจะมองเห็นหอยทาก

ภาพระยะใกล้ของหอยทากที่ดูจริงจังมาก เขากล่าวว่า “ผมต้องการรถสปอร์ตที่เร็วที่สุดของคุณ… และผมต้องการให้คุณทาตัวอักษร 'S' ขนาดใหญ่ที่ประตู ฝากระโปรง และหลังคา”

พนักงานขายเกาหัว “เอ่อ… เราทำได้ แต่ทำไมต้องมีตัว S ด้วยล่ะ”

ภาพตัดสลับสีแดงที่พร่ามัวบนถนนหลวง รถสปอร์ตถูกปกคลุมไปด้วยตัวอักษร S ขนาดใหญ่ ผู้คนบนทางเท้าต่างชี้และหัวเราะว่า “ว้าว! ดูสิ รถ S คันนั้นวิ่งสิ!”

แถบ
อินโฟกราฟิกที่อธิบายการทดลองปริซึมของนิวตันอย่างละเอียด
นิวตัน

การแก้ไขและแปลงภาพแบบโต้ตอบ

ผู้ใช้สามารถอัปโหลดรูปภาพที่มีอยู่และสั่งให้ GPT-4o แก้ไขหรือแปลงรูปภาพ เช่น ลบเงาสะท้อน เปลี่ยนพื้นหลัง หรือใช้การเปลี่ยนแปลงสไตล์ ทำให้มีประโยชน์ในการแก้ไขรูปภาพในทางปฏิบัติมากกว่าการสร้างรูปภาพขึ้นมาใหม่ตั้งแต่ต้น

การสร้างภาพ GPT-4o ยังรองรับการโต้ตอบหลายรอบ ซึ่งหมายความว่าผู้ใช้สามารถปรับแต่งภาพผ่านบทสนทนาอย่างต่อเนื่อง ร้องขอการเปลี่ยนแปลงหรือการปรับปรุงเพื่อให้ตรงกับวิสัยทัศน์ของตนมากขึ้น

การป้อนข้อมูลของผู้ใช้ ภาพเอาท์พุต
รอบที่ 1
แมว 1

มอบหมวกนักสืบและแว่นมองข้างให้แมวตัวนี้

แมว 2
รอบที่ 2 เปลี่ยนสิ่งนี้ให้เป็นวิดีโอเกมระดับ Triple A ที่สร้างด้วยเอ็นจิ้นเกม 4k และเพิ่มอินเทอร์เฟซผู้ใช้เป็นโอเวอร์เลย์จาก RPG ลึกลับที่เราสามารถเห็นแถบสุขภาพและแผนที่ย่อที่ด้านบน รวมถึงคาถาที่ด้านล่างด้วยความสอดคล้องและสัญลักษณ์
แมว 3
รอบที่ 3 อัปเดตเป็นภาพทิวทัศน์ในอัตราส่วน 16:9 เพิ่มคาถาเพิ่มเติมใน UI และขยายภาพออกเพื่อให้เราเห็นแมวในมุมมองบุคคลที่สามที่กำลังเดินผ่านแมนฮัตตันสไตล์สตีมพังก์ สร้างความคมชัดและแสงที่สวยงามเหมือนในเกม Triple A ที่ดีที่สุด ด้วยสีสันโทนเย็น
แมว 4
รอบที่ 4 สร้างอินเทอร์เฟซเมื่อผู้เล่นเปิดเมนูและเราเห็นโปรไฟล์ตัวละครแมวพร้อมอุปกรณ์ของเขาและอีกหน้าหนึ่งที่แสดงภารกิจที่ดำเนินการอยู่ (และควรจะสมเหตุสมผลในความสัมพันธ์กับการสร้างโลกจักรวาลที่เรากำลังอธิบายไว้ในรูปภาพ)
แมว 5

การรับรู้บริบทและการใช้ความรู้

GPT-4o ใช้ประโยชน์จากการฝึกอบรมด้านภาษาและความรู้เกี่ยวกับโลกอย่างครอบคลุมเพื่อสร้างภาพที่ไม่เพียงแต่มีความสอดคล้องกันทางภาพเท่านั้น แต่ยังมีความหมายในเชิงบริบทอีกด้วย GPT-4o เข้าใจการอ้างอิงถึงวัตถุในโลกแห่งความเป็นจริง สไตล์ องค์ประกอบทางวัฒนธรรม และสามารถนำสิ่งเหล่านี้มาผสมผสานเข้ากับภาพได้อย่างชาญฉลาด

ทำให้สามารถสร้างภาพที่สอดคล้องกับธีมเฉพาะ ช่วงเวลาทางประวัติศาสตร์ หรือความเคลื่อนไหวทางศิลปะได้ ซึ่งจะเพิ่มความเกี่ยวข้องและความลึก

การป้อนข้อมูลของผู้ใช้ ภาพเอาท์พุต
รอบที่ 1
ออกแบบ

วาดแบบรถยนต์ที่มีล้อสามเหลี่ยม โดยใช้ภาพเหล่านี้เป็นข้อมูลอ้างอิง

ให้ติดป้ายล้อหน้า ล้อหลัง และที่แผนภาพ (เป็นตัวพิมพ์เล็ก)

ยานพาหนะล้อสามเหลี่ยม สิทธิบัตรภาษาอังกฤษ 2025 OPENAI

ผลลัพธ์การออกแบบ
รอบที่ 2 ตอนนี้ใส่รูปนี้ลงในรูปที่ถ่ายที่นิวยอร์คซิตี้
เอาท์พุต 2
วิธีใช้ GPT-4o บน Pollo AI

วิธีใช้ GPT-4o บน Pollo AI

01

เลือกรุ่น GPT-4o

ไปที่ เครื่องสร้างภาพ Pollo AI และเลือก GPT-4o จากรายการรุ่น

02

ป้อนรูปภาพของคุณและแจ้งเตือน

อัปโหลดรูปภาพของคุณ ป้อนข้อความแจ้งเตือน และปรับการตั้งค่าการสร้าง

03

เริ่มต้นเจเนอเรชั่นของคุณ

คลิกสร้างเพื่อเริ่มสร้างภาพด้วย GPT-4o

วิดีโอ YouTube เกี่ยวกับการสร้างภาพ GPT-4o

การสนทนา Reddit เกี่ยวกับการสร้างภาพ GPT-4o

X โพสต์เกี่ยวกับการสร้างภาพ GPT-4o

คำถามที่พบบ่อย

การสร้างภาพ GPT-4o คืออะไร?

การสร้างภาพ GPT-4o เป็นคุณลักษณะมัลติโหมดพื้นฐานของโมเดล GPT-4o ที่ช่วยให้ผู้ใช้สามารถสร้างและแก้ไขภาพได้โดยตรงผ่านคำสั่งภาษาธรรมชาติใน ChatGPT รองรับการสร้างภาพที่มีรายละเอียด สมจริง และหลากหลายสไตล์ โดยมีการแสดงผลข้อความที่แม่นยำฝังอยู่ในภาพ

GPT-4o สามารถสร้างสไตล์ภาพประเภทใดได้บ้าง

GPT-4o รองรับรูปแบบต่างๆ มากมาย เช่น ภาพเหมือนจริง ภาพศิลปะ (สีน้ำ ภาพวาดสีน้ำมัน ภาพร่าง) ประเภทที่เน้นสไตล์ (ไซเบอร์พังก์ อนิเมะ) อินโฟกราฟิกพร้อมข้อความที่ชัดเจน และรูปภาพความละเอียดสูงที่พร้อมสำหรับการผลิต โดยสามารถปรับรูปแบบตามคำแนะนำง่ายๆ เช่น "สดใส" "เป็นธรรมชาติ" หรือ "แบบภาพยนตร์"

ฉันจะเข้าถึงการสร้างภาพ GPT-4o ได้อย่างไร?

การสร้างภาพ GPT-4o พร้อมใช้งานตามค่าเริ่มต้นสำหรับผู้ใช้ ChatGPT Plus, Pro และ Team ขณะนี้ยังไม่พร้อมใช้งานในแผนฟรีเนื่องจากมีความต้องการสูง นักพัฒนาจะสามารถเข้าถึงได้ผ่าน OpenAI API ในเร็วๆ นี้

หากคุณกำลังมองหาวิธีเข้าถึง GPT-4o ที่ง่ายดายและราบรื่น คุณสามารถลองใช้กับ Pollo AI ได้ ซึ่งเป็นเครื่องสร้างภาพและวิดีโอ AI แบบครบวงจรที่ให้คุณใช้โมเดลภาพ AI ที่ดีที่สุดทั้งหมดบนแพลตฟอร์มเดียว รวมถึง GPT-4o, Recraft , FLUX , Imagen , Stable Diffusion และอื่นๆ อีกมากมาย

มีข้อจำกัดหรือปัญหาที่ทราบเกี่ยวกับการสร้างภาพ GPT-4o หรือไม่

ใช่ ข้อจำกัดบางประการในการสร้างภาพ GPT-4o ได้แก่ ภาพหลอนหรือการแต่งข้อมูลขึ้นมา ความยากลำบากในการสร้างกราฟที่แม่นยำ การแสดงข้อความหลายภาษา ความแม่นยำในการแก้ไขที่ไม่สม่ำเสมอ และอื่นๆ

GPT-4o เพิ่มข้อมูลเมตาใดๆ ลงในรูปภาพที่สร้างขึ้นหรือไม่

ใช่ GPT-4o จะฝังแท็กเมตาข้อมูล C2PA ลงในรูปภาพที่สร้างขึ้นโดยอัตโนมัติเพื่อระบุแหล่งที่มาของ AI ส่งเสริมความโปร่งใสและช่วยให้แพลตฟอร์มสามารถระบุเนื้อหาที่สร้างโดย AI ได้

สร้างภาพด้วย GPT-4o บน Pollo AI เลยตอนนี้!

สร้างภาพด้วย GPT-4o บน Pollo AI เลยตอนนี้!