
การสร้างภาพ GPT-4o
การสร้างภาพ GPT-4o เป็นคุณลักษณะขั้นสูงใหม่ที่รวมเข้ากับ โมเดล GPT-4o โดย OpenAI อย่างแท้จริง ด้วย โมเดล DALL·E 3 ขั้นสูงกว่า ทำให้เครื่องสร้างภาพ ChatGPT ช่วยให้ผู้ใช้สามารถสร้างและแก้ไขภาพได้โดยตรงภายใน ChatGPT ผ่านคำแนะนำภาษาธรรมชาติและการปรับแต่งการสนทนา ลองใช้การสร้างภาพ GPT-4o ด้านล่าง
คุณสมบัติหลักของการสร้างภาพ GPT-4o
ภาพที่มีความเที่ยงตรงสูงและรายละเอียดสูง
GPT-4o สามารถสร้างภาพที่มีวัตถุที่แตกต่างกันจำนวนมากได้สูงสุดถึง 10-20 ชิ้น โดยยังคงความชัดเจนและความสมจริงเอาไว้ ความสามารถนี้รองรับฉากที่ซับซ้อนซึ่งประกอบด้วยตัวละคร วัตถุ และพื้นหลังหลายรายการ โดยแต่ละฉากจะแสดงผลด้วยรายละเอียดและความสัมพันธ์เชิงพื้นที่ที่เหมาะสม
แจ้งเตือน | ภาพเอาท์พุต |
รูปภาพสี่เหลี่ยมจัตุรัสที่มีตาราง 4 แถว 4 คอลัมน์ มีวัตถุ 16 ชิ้นบนพื้นหลังสีขาว จากซ้ายไปขวา บนลงล่าง นี่คือรายการ: | ![]() |
แสดงแก้วไวน์ให้ฉันดูหน่อย ซึ่งมีไวน์แดงหยดเดียวอยู่ในนั้น | ![]() |
เราต้องการหลักฐานว่ามีช้างที่มองไม่เห็นอยู่จริงในปัจจุบัน ลองพิจารณาว่าช้างคืออะไรและทำอะไรในสิ่งแวดล้อม จากนั้นแสดงให้เราเห็นสิ่งนั้น บางทีอาจเป็นระหว่างกระบวนการ แต่ช้างเองไม่ได้ถูกแสดงออกมาเลย | ![]() |
รองรับรูปแบบภาพหลายรูปแบบ
การสร้างภาพ GPT-4o รองรับรูปแบบภาพที่หลากหลายและหลากหลาย ทำให้สามารถปรับให้เหมาะกับความต้องการด้านความคิดสร้างสรรค์และการใช้งานจริงที่แตกต่างกันได้ โมเดลนี้โดดเด่นในด้านการสร้างภาพที่เหมือนจริง สไตล์ศิลปะ หรือภาพเหมือนการ์ตูน ขึ้นอยู่กับคำสั่ง
สิ่งที่ทำให้คุณสมบัติการสร้างภาพ GPT-4o เป็นที่นิยมอาจเป็นเพราะความสามารถในการสร้างภาพสไตล์อะนิเมะยอดนิยม เช่น Studio Ghibli , South Park, The Simpsons และอื่นๆ อีกมากมาย
ป้อนข้อมูล | สตูดิโอจิบลิ | เซาท์พาร์ค | เดอะ ซิมป์สันส์ |
![]() | ![]() | ![]() | ![]() |
การแสดงข้อความที่แม่นยำ
ความสามารถที่โดดเด่นอย่างหนึ่งของการสร้างภาพ GPT-4o คือความสามารถในการแสดงข้อความภายในภาพได้อย่างชัดเจนและแม่นยำ ซึ่งเป็นความท้าทายที่ทราบกันดีในโมเดลการสร้างภาพก่อนหน้านี้ ซึ่งช่วยให้สามารถสร้างอินโฟกราฟิก ป้ายบอกทาง หรือภาพใดๆ ที่ต้องการข้อความที่อ่านออกได้
แจ้งเตือน | ภาพเอาท์พุต |
บทกวีแม่เหล็กบนตู้เย็นในบ้านยุคกลางศตวรรษ: บรรทัดที่ 1: “รูปภาพ” บรรทัดที่ 2: “คุ้มค่า” บรรทัดที่ 3: "พันคำ" บรรทัดที่ 4: “แต่บางครั้ง”ช่องว่างขนาดใหญ่บรรทัดที่ 5: “อยู่ในที่ที่เหมาะสม” บรรทัดที่ 6: “สามารถยกระดับได้” บรรทัดที่ 7 : "ความหมายของมัน" “ชายคนนี้ถือคำว่า “สองสาม” ไว้ในมือขวา และถือคำว่า “คำพูด” ไว้ในมือซ้าย | ![]() |
สร้างภาพของแถบสี่แผงพร้อมการเติมขอบเล็กน้อย: หอยทากตัวน้อยยืนอยู่ที่เคาน์เตอร์ของโชว์รูมรถยนต์หรูหรา พนักงานขายโน้มตัวไปเหนือโต๊ะเพื่อจะมองเห็นหอยทาก ภาพระยะใกล้ของหอยทากที่ดูจริงจังมาก เขากล่าวว่า “ผมต้องการรถสปอร์ตที่เร็วที่สุดของคุณ… และผมต้องการให้คุณทาตัวอักษร 'S' ขนาดใหญ่ที่ประตู ฝากระโปรง และหลังคา” พนักงานขายเกาหัว “เอ่อ… เราทำได้ แต่ทำไมต้องมีตัว S ด้วยล่ะ” ภาพตัดสลับสีแดงที่พร่ามัวบนถนนหลวง รถสปอร์ตถูกปกคลุมไปด้วยตัวอักษร S ขนาดใหญ่ ผู้คนบนทางเท้าต่างชี้และหัวเราะว่า “ว้าว! ดูสิ รถ S คันนั้นวิ่งสิ!” | ![]() |
อินโฟกราฟิกที่อธิบายการทดลองปริซึมของนิวตันอย่างละเอียด | ![]() |
การแก้ไขและแปลงภาพแบบโต้ตอบ
ผู้ใช้สามารถอัปโหลดรูปภาพที่มีอยู่และสั่งให้ GPT-4o แก้ไขหรือแปลงรูปภาพ เช่น ลบเงาสะท้อน เปลี่ยนพื้นหลัง หรือใช้การเปลี่ยนแปลงสไตล์ ทำให้มีประโยชน์ในการแก้ไขรูปภาพในทางปฏิบัติมากกว่าการสร้างรูปภาพขึ้นมาใหม่ตั้งแต่ต้น
การสร้างภาพ GPT-4o ยังรองรับการโต้ตอบหลายรอบ ซึ่งหมายความว่าผู้ใช้สามารถปรับแต่งภาพผ่านบทสนทนาอย่างต่อเนื่อง ร้องขอการเปลี่ยนแปลงหรือการปรับปรุงเพื่อให้ตรงกับวิสัยทัศน์ของตนมากขึ้น
การป้อนข้อมูลของผู้ใช้ | ภาพเอาท์พุต | |
รอบที่ 1 | ![]() มอบหมวกนักสืบและแว่นมองข้างให้แมวตัวนี้ | ![]() |
รอบที่ 2 | เปลี่ยนสิ่งนี้ให้เป็นวิดีโอเกมระดับ Triple A ที่สร้างด้วยเอ็นจิ้นเกม 4k และเพิ่มอินเทอร์เฟซผู้ใช้เป็นโอเวอร์เลย์จาก RPG ลึกลับที่เราสามารถเห็นแถบสุขภาพและแผนที่ย่อที่ด้านบน รวมถึงคาถาที่ด้านล่างด้วยความสอดคล้องและสัญลักษณ์ | ![]() |
รอบที่ 3 | อัปเดตเป็นภาพทิวทัศน์ในอัตราส่วน 16:9 เพิ่มคาถาเพิ่มเติมใน UI และขยายภาพออกเพื่อให้เราเห็นแมวในมุมมองบุคคลที่สามที่กำลังเดินผ่านแมนฮัตตันสไตล์สตีมพังก์ สร้างความคมชัดและแสงที่สวยงามเหมือนในเกม Triple A ที่ดีที่สุด ด้วยสีสันโทนเย็น | ![]() |
รอบที่ 4 | สร้างอินเทอร์เฟซเมื่อผู้เล่นเปิดเมนูและเราเห็นโปรไฟล์ตัวละครแมวพร้อมอุปกรณ์ของเขาและอีกหน้าหนึ่งที่แสดงภารกิจที่ดำเนินการอยู่ (และควรจะสมเหตุสมผลในความสัมพันธ์กับการสร้างโลกจักรวาลที่เรากำลังอธิบายไว้ในรูปภาพ) | ![]() |
การรับรู้บริบทและการใช้ความรู้
GPT-4o ใช้ประโยชน์จากการฝึกอบรมด้านภาษาและความรู้เกี่ยวกับโลกอย่างครอบคลุมเพื่อสร้างภาพที่ไม่เพียงแต่มีความสอดคล้องกันทางภาพเท่านั้น แต่ยังมีความหมายในเชิงบริบทอีกด้วย GPT-4o เข้าใจการอ้างอิงถึงวัตถุในโลกแห่งความเป็นจริง สไตล์ องค์ประกอบทางวัฒนธรรม และสามารถนำสิ่งเหล่านี้มาผสมผสานเข้ากับภาพได้อย่างชาญฉลาด
ทำให้สามารถสร้างภาพที่สอดคล้องกับธีมเฉพาะ ช่วงเวลาทางประวัติศาสตร์ หรือความเคลื่อนไหวทางศิลปะได้ ซึ่งจะเพิ่มความเกี่ยวข้องและความลึก
การป้อนข้อมูลของผู้ใช้ | ภาพเอาท์พุต | |
รอบที่ 1 | ![]() วาดแบบรถยนต์ที่มีล้อสามเหลี่ยม โดยใช้ภาพเหล่านี้เป็นข้อมูลอ้างอิง ให้ติดป้ายล้อหน้า ล้อหลัง และที่แผนภาพ (เป็นตัวพิมพ์เล็ก) ยานพาหนะล้อสามเหลี่ยม สิทธิบัตรภาษาอังกฤษ 2025 OPENAI | ![]() |
รอบที่ 2 | ตอนนี้ใส่รูปนี้ลงในรูปที่ถ่ายที่นิวยอร์คซิตี้ | ![]() |

วิธีใช้ GPT-4o บน Pollo AI
เลือกรุ่น GPT-4o
ไปที่ เครื่องสร้างภาพ Pollo AI และเลือก GPT-4o จากรายการรุ่น
ป้อนรูปภาพของคุณและแจ้งเตือน
อัปโหลดรูปภาพของคุณ ป้อนข้อความแจ้งเตือน และปรับการตั้งค่าการสร้าง
เริ่มต้นเจเนอเรชั่นของคุณ
คลิกสร้างเพื่อเริ่มสร้างภาพด้วย GPT-4o
วิดีโอ YouTube เกี่ยวกับการสร้างภาพ GPT-4o
การสนทนา Reddit เกี่ยวกับการสร้างภาพ GPT-4o
ความคิดเห็น
โดย u/abdojapan จากการสนทนา
ใน StableDiffusion
X โพสต์เกี่ยวกับการสร้างภาพ GPT-4o
ผ่านไปแล้ว 24 ชั่วโมงนับตั้งแต่ OpenAI สร้างความสั่นสะเทือนให้กับโลกภาพ AI ด้วยการสร้างภาพ 40 ภาพอย่างไม่คาดคิด
— Barsee 🐶 (@heyBarsee) 26 มีนาคม 2025
ต่อไปนี้เป็น 14 ตัวอย่างที่น่าทึ่งที่สุดเท่าที่มีมา (สร้างโดย AI 100%):
1. มีมสไตล์สตูดิโอจิบลิ pic.twitter.com/E38mBnPnQh
ตอนนี้อัลฟ่าสุดยอดมากในการส่งรูปถ่ายของคุณที่แปลงเป็นอนิเมะของสตูดิโอจิบลิให้ภรรยาของคุณ ดู pic.twitter.com/FROszdFSfN
— Grant Slatton (@GrantSlatton) 25 มีนาคม 2025
โอเค ฉันคิดว่าฉันหลงรักฟีเจอร์การแก้ไขรูปภาพใหม่ของ ChatGPT แล้ว
– ปีเตอร์ หยาง (@petergyang) 26 มีนาคม 2568
สามารถเปลี่ยนรูปถ่ายครอบครัวของฉันทั้งหมดให้กลายเป็นภาพเหมือนของจิบลิได้ pic.twitter.com/tZCbxPUA0D
รูปภาพใดๆ + "สร้างภาพเวอร์ชัน Studio Ghibli" ใน GPT แล้วคุณจะได้ผลลัพธ์ที่สมบูรณ์แบบ pic.twitter.com/Q23AqeznqN
— เจสัน ริงค์ (@TheJasonRink) 26 มีนาคม 2025
นี่มันจริงตรงไหนเนี่ย?
– โทบี ลุตเก (@tobi) 26 มีนาคม 2568
OpenAI ปรุง pic.twitter.com/RfRJhv8uFb
GPT-4o ได้รับการอัปเกรดที่เหลือเชื่อ!
– มินชอย (@minchoi) 26 มีนาคม 2568
OpenAI เพิ่งเปิดตัว Image Generation ดั้งเดิมใน GPT-4o
คุณภาพรูปภาพและข้อความสุดยอดมาก AI 100%
ตัวอย่างที่น่าสนใจ 10 ตัวอย่าง (รวมคำกระตุ้น):
1. ภาพถ่ายสไตล์โพลารอยด์ pic.twitter.com/FRPIsVkMYW
พวกเขาปรุงกันอย่างหนักมาก pic.twitter.com/ZZMDWgJbeF
– adi (@adonis_singh) 25 มีนาคม 2568
การอัปเดตที่น่าสนใจจริงๆ บน ChatGPT pic.twitter.com/P0uMGZPuwV
— Gabbar (@GabbbarSingh) 26 มีนาคม 2025
โมเดลภาพใหม่จาก OpenAI ค่อนข้างดีในด้าน UI pic.twitter.com/BWs4xHV4ic
– ปิเอโตร ชิราโน (@skirano) 25 มีนาคม 2568
เดี๋ยวนะ GPT-4o ทำแบบช็อตเดียวได้งั้นเหรอ น่าทึ่งจริงๆ... pic.twitter.com/SQEirvFUQG
— Tanishq แมทธิว อับราฮัม, Ph.D. (@iScienceLuvr) 25 มีนาคม 2568
เครื่องสร้างภาพ GPT-4O นั้นเหนือจริงมาก เหมือนกับมีโปรแกรมสร้างภาพระดับชั้นนำตามต้องการ pic.twitter.com/BslqOqjwtM
— Ashish Singh (@ashzingh) 26 มีนาคม 2025
การสร้างภาพ OpenAI ใหม่ไม่มีฟิลเตอร์คนดัง!! pic.twitter.com/IWEC1mQjOF
— ดีดี้ (@deedydas) 26 มีนาคม 2025
อะไร
— ไรลีย์ บราวน์ (@rileybrown_ai) 27 มีนาคม 2025
gpt4o... เรนเดอร์โค้ดเป็นรูปภาพ...
หึหึ pic.twitter.com/OAyGqyk9Dq
ฉันคาดการณ์ว่าจะมีการผสมผสานที่ยอดเยี่ยมระหว่างการสร้างภาพ GPT-4o และ @v0
– กิลเลอร์โม เราช์ (@rauchg) 27 มีนาคม 2568
เป็นประโยชน์มากสำหรับการสร้างแรงบันดาลใจเชิงสร้างสรรค์ก่อนการนำไปปฏิบัติ pic.twitter.com/VEGUF16soA
เอาล่ะ เครื่องมือสร้างภาพใหม่ ของ @ OpenAI นั้นน่าทึ่งมาก https://t.co/W3MraV4lLE
– โบยัน ตุงกุซ (@tunguz) 26 มีนาคม 2568
🚨ข่าวด่วน: ตอนนี้แชท GPT สามารถสร้างรูปภาพได้แล้ว
– ฮัมซา คาลิด (@Whizz_ai) 26 มีนาคม 2568
Chat GPT 4.5 เพิ่งเปิดตัว ซึ่งสามารถสร้างและแก้ไขรูปภาพได้จากข้อความธรรมดาๆ
ผู้คนต่างก็คลั่งไคล้กับการสร้างตัวอย่างที่น่าทึ่ง
12 ตัวอย่างสุดแปลก: pic.twitter.com/XpMHgaKqve
โอ้พระเจ้า chatgpt คุณไม่เคยพลาดที่จะทำให้ฉันทึ่งเลย pic.twitter.com/YsCrxkgwFn
— นัยนา (@Naina_2728) 26 มีนาคม 2025
คำถามที่พบบ่อย
การสร้างภาพ GPT-4o คืออะไร?
การสร้างภาพ GPT-4o เป็นคุณลักษณะมัลติโหมดพื้นฐานของโมเดล GPT-4o ที่ช่วยให้ผู้ใช้สามารถสร้างและแก้ไขภาพได้โดยตรงผ่านคำสั่งภาษาธรรมชาติใน ChatGPT รองรับการสร้างภาพที่มีรายละเอียด สมจริง และหลากหลายสไตล์ โดยมีการแสดงผลข้อความที่แม่นยำฝังอยู่ในภาพ
GPT-4o สามารถสร้างสไตล์ภาพประเภทใดได้บ้าง
GPT-4o รองรับรูปแบบต่างๆ มากมาย เช่น ภาพเหมือนจริง ภาพศิลปะ (สีน้ำ ภาพวาดสีน้ำมัน ภาพร่าง) ประเภทที่เน้นสไตล์ (ไซเบอร์พังก์ อนิเมะ) อินโฟกราฟิกพร้อมข้อความที่ชัดเจน และรูปภาพความละเอียดสูงที่พร้อมสำหรับการผลิต โดยสามารถปรับรูปแบบตามคำแนะนำง่ายๆ เช่น "สดใส" "เป็นธรรมชาติ" หรือ "แบบภาพยนตร์"
ฉันจะเข้าถึงการสร้างภาพ GPT-4o ได้อย่างไร?
การสร้างภาพ GPT-4o พร้อมใช้งานตามค่าเริ่มต้นสำหรับผู้ใช้ ChatGPT Plus, Pro และ Team ขณะนี้ยังไม่พร้อมใช้งานในแผนฟรีเนื่องจากมีความต้องการสูง นักพัฒนาจะสามารถเข้าถึงได้ผ่าน OpenAI API ในเร็วๆ นี้
หากคุณกำลังมองหาวิธีเข้าถึง GPT-4o ที่ง่ายดายและราบรื่น คุณสามารถลองใช้กับ Pollo AI ได้ ซึ่งเป็นเครื่องสร้างภาพและวิดีโอ AI แบบครบวงจรที่ให้คุณใช้โมเดลภาพ AI ที่ดีที่สุดทั้งหมดบนแพลตฟอร์มเดียว รวมถึง GPT-4o, Recraft , FLUX , Imagen , Stable Diffusion และอื่นๆ อีกมากมาย
มีข้อจำกัดหรือปัญหาที่ทราบเกี่ยวกับการสร้างภาพ GPT-4o หรือไม่
ใช่ ข้อจำกัดบางประการในการสร้างภาพ GPT-4o ได้แก่ ภาพหลอนหรือการแต่งข้อมูลขึ้นมา ความยากลำบากในการสร้างกราฟที่แม่นยำ การแสดงข้อความหลายภาษา ความแม่นยำในการแก้ไขที่ไม่สม่ำเสมอ และอื่นๆ
GPT-4o เพิ่มข้อมูลเมตาใดๆ ลงในรูปภาพที่สร้างขึ้นหรือไม่
ใช่ GPT-4o จะฝังแท็กเมตาข้อมูล C2PA ลงในรูปภาพที่สร้างขึ้นโดยอัตโนมัติเพื่อระบุแหล่งที่มาของ AI ส่งเสริมความโปร่งใสและช่วยให้แพลตฟอร์มสามารถระบุเนื้อหาที่สร้างโดย AI ได้
