
GPT-4o เครื่องมือสร้างรูปภาพ
การสร้างภาพด้วย GPT-4o เป็นคุณสมบัติใหม่และก้าวหน้าที่รวมเข้าไว้ในตัวโมเดล GPT-4o โดยตรงจาก OpenAI ซึ่งมีความก้าวหน้ากว่า โมเดล DALL·E 3 โมเดลนี้เป็น เครื่องมือสร้างภาพใน ChatGPT ที่ช่วยให้ผู้ใช้สามารถสร้างและแก้ไขภาพได้โดยตรงภายใน ChatGPT ผ่านการใช้คำแนะนำด้วยภาษาธรรมชาติและการปรับแต่งผ่านการสนทนาลองใช้โมเดล GPT-4o ได้แล้ววันนี้ใน เครื่องมือสร้างภาพ AI จาก Pollo!
คุณสมบัติหลักของการสร้างภาพ GPT-4o
ภาพที่มีความเที่ยงตรงสูงและรายละเอียดสูง
GPT-4o สามารถสร้างภาพที่มีวัตถุที่แตกต่างกันจำนวนมากได้สูงสุดถึง 10-20 ชิ้น โดยยังคงความชัดเจนและความสมจริงเอาไว้ ความสามารถนี้รองรับฉากที่ซับซ้อนซึ่งประกอบด้วยตัวละคร วัตถุ และพื้นหลังหลายรายการ โดยแต่ละฉากจะแสดงผลด้วยรายละเอียดและความสัมพันธ์เชิงพื้นที่ที่เหมาะสม
| แจ้งเตือน | ภาพเอาท์พุต |
| รูปภาพสี่เหลี่ยมจัตุรัสที่มีตาราง 4 แถว 4 คอลัมน์ มีวัตถุ 16 ชิ้นบนพื้นหลังสีขาว จากซ้ายไปขวา บนลงล่าง นี่คือรายการ: | ![]() |
| แสดงแก้วไวน์ให้ฉันดูหน่อย ซึ่งมีไวน์แดงหยดเดียวอยู่ในนั้น | ![]() |
| เราต้องการหลักฐานว่ามีช้างที่มองไม่เห็นอยู่จริงในปัจจุบัน ลองพิจารณาว่าช้างคืออะไรและทำอะไรในสิ่งแวดล้อม จากนั้นแสดงให้เราเห็นสิ่งนั้น บางทีอาจเป็นระหว่างกระบวนการ แต่ช้างเองไม่ได้ถูกแสดงออกมาเลย | ![]() |
รองรับรูปแบบภาพหลายรูปแบบ
การสร้างภาพ GPT-4o รองรับรูปแบบภาพที่หลากหลายและหลากหลาย ทำให้สามารถปรับให้เหมาะกับความต้องการด้านความคิดสร้างสรรค์และการใช้งานจริงที่แตกต่างกันได้ โมเดลนี้โดดเด่นในด้านการสร้างภาพที่เหมือนจริง สไตล์ศิลปะ หรือภาพเหมือนการ์ตูน ขึ้นอยู่กับคำสั่ง
สิ่งที่ทำให้คุณสมบัติการสร้างภาพ GPT-4o เป็นที่นิยมอาจเป็นเพราะความสามารถในการสร้างภาพสไตล์อะนิเมะยอดนิยม เช่น Studio Ghibli , South Park, The Simpsons และอื่นๆ อีกมากมาย
| ป้อนข้อมูล | สตูดิโอจิบลิ | เซาท์พาร์ค | เดอะ ซิมป์สันส์ |
![]() | ![]() | ![]() | ![]() |
การแสดงข้อความที่แม่นยำ
ความสามารถที่โดดเด่นอย่างหนึ่งของการสร้างภาพ GPT-4o คือความสามารถในการแสดงข้อความภายในภาพได้อย่างชัดเจนและแม่นยำ ซึ่งเป็นความท้าทายที่ทราบกันดีในโมเดลการสร้างภาพก่อนหน้านี้ ซึ่งช่วยให้สามารถสร้างอินโฟกราฟิก ป้ายบอกทาง หรือภาพใดๆ ที่ต้องการข้อความที่อ่านออกได้
| แจ้งเตือน | ภาพเอาท์พุต |
| บทกวีแม่เหล็กบนตู้เย็นในบ้านยุคกลางศตวรรษ: บรรทัดที่ 1: “รูปภาพ” บรรทัดที่ 2: “คุ้มค่า” บรรทัดที่ 3: "พันคำ" บรรทัดที่ 4: “แต่บางครั้ง”ช่องว่างขนาดใหญ่บรรทัดที่ 5: “อยู่ในที่ที่เหมาะสม” บรรทัดที่ 6: “สามารถยกระดับได้” บรรทัดที่ 7 : "ความหมายของมัน" “ชายคนนี้ถือคำว่า “สองสาม” ไว้ในมือขวา และถือคำว่า “คำพูด” ไว้ในมือซ้าย | ![]() |
| สร้างภาพของแถบสี่แผงพร้อมการเติมขอบเล็กน้อย: หอยทากตัวน้อยยืนอยู่ที่เคาน์เตอร์ของโชว์รูมรถยนต์หรูหรา พนักงานขายโน้มตัวไปเหนือโต๊ะเพื่อจะมองเห็นหอยทาก ภาพระยะใกล้ของหอยทากที่ดูจริงจังมาก เขากล่าวว่า “ผมต้องการรถสปอร์ตที่เร็วที่สุดของคุณ… และผมต้องการให้คุณทาตัวอักษร 'S' ขนาดใหญ่ที่ประตู ฝากระโปรง และหลังคา” พนักงานขายเกาหัว “เอ่อ… เราทำได้ แต่ทำไมต้องมีตัว S ด้วยล่ะ” ภาพตัดสลับสีแดงที่พร่ามัวบนถนนหลวง รถสปอร์ตถูกปกคลุมไปด้วยตัวอักษร S ขนาดใหญ่ ผู้คนบนทางเท้าต่างชี้และหัวเราะว่า “ว้าว! ดูสิ รถ S คันนั้นวิ่งสิ!” | ![]() |
| อินโฟกราฟิกที่อธิบายการทดลองปริซึมของนิวตันอย่างละเอียด | ![]() |
การแก้ไขและแปลงภาพแบบโต้ตอบ
ผู้ใช้สามารถอัปโหลดรูปภาพที่มีอยู่และสั่งให้ GPT-4o แก้ไขหรือแปลงรูปภาพ เช่น ลบเงาสะท้อน เปลี่ยนพื้นหลัง หรือใช้การเปลี่ยนแปลงสไตล์ ทำให้มีประโยชน์ในการแก้ไขรูปภาพในทางปฏิบัติมากกว่าการสร้างรูปภาพขึ้นมาใหม่ตั้งแต่ต้น
การสร้างภาพ GPT-4o ยังรองรับการโต้ตอบหลายรอบ ซึ่งหมายความว่าผู้ใช้สามารถปรับแต่งภาพผ่านบทสนทนาอย่างต่อเนื่อง ร้องขอการเปลี่ยนแปลงหรือการปรับปรุงเพื่อให้ตรงกับวิสัยทัศน์ของตนมากขึ้น
| การป้อนข้อมูลของผู้ใช้ | ภาพเอาท์พุต | |
| รอบที่ 1 | ![]() มอบหมวกนักสืบและแว่นมองข้างให้แมวตัวนี้ | ![]() |
| รอบที่ 2 | เปลี่ยนสิ่งนี้ให้เป็นวิดีโอเกมระดับ Triple A ที่สร้างด้วยเอ็นจิ้นเกม 4k และเพิ่มอินเทอร์เฟซผู้ใช้เป็นโอเวอร์เลย์จาก RPG ลึกลับที่เราสามารถเห็นแถบสุขภาพและแผนที่ย่อที่ด้านบน รวมถึงคาถาที่ด้านล่างด้วยความสอดคล้องและสัญลักษณ์ | ![]() |
| รอบที่ 3 | อัปเดตเป็นภาพทิวทัศน์ในอัตราส่วน 16:9 เพิ่มคาถาเพิ่มเติมใน UI และขยายภาพออกเพื่อให้เราเห็นแมวในมุมมองบุคคลที่สามที่กำลังเดินผ่านแมนฮัตตันสไตล์สตีมพังก์ สร้างความคมชัดและแสงที่สวยงามเหมือนในเกม Triple A ที่ดีที่สุด ด้วยสีสันโทนเย็น | ![]() |
| รอบที่ 4 | สร้างอินเทอร์เฟซเมื่อผู้เล่นเปิดเมนูและเราเห็นโปรไฟล์ตัวละครแมวพร้อมอุปกรณ์ของเขาและอีกหน้าหนึ่งที่แสดงภารกิจที่ดำเนินการอยู่ (และควรจะสมเหตุสมผลในความสัมพันธ์กับการสร้างโลกจักรวาลที่เรากำลังอธิบายไว้ในรูปภาพ) | ![]() |
การรับรู้บริบทและการใช้ความรู้
GPT-4o ใช้ประโยชน์จากการฝึกอบรมด้านภาษาและความรู้เกี่ยวกับโลกอย่างครอบคลุมเพื่อสร้างภาพที่ไม่เพียงแต่มีความสอดคล้องกันทางภาพเท่านั้น แต่ยังมีความหมายในเชิงบริบทอีกด้วย GPT-4o เข้าใจการอ้างอิงถึงวัตถุในโลกแห่งความเป็นจริง สไตล์ องค์ประกอบทางวัฒนธรรม และสามารถนำสิ่งเหล่านี้มาผสมผสานเข้ากับภาพได้อย่างชาญฉลาด
ทำให้สามารถสร้างภาพที่สอดคล้องกับธีมเฉพาะ ช่วงเวลาทางประวัติศาสตร์ หรือความเคลื่อนไหวทางศิลปะได้ ซึ่งจะเพิ่มความเกี่ยวข้องและความลึก
| การป้อนข้อมูลของผู้ใช้ | ภาพเอาท์พุต | |
| รอบที่ 1 | ![]() วาดแบบรถยนต์ที่มีล้อสามเหลี่ยม โดยใช้ภาพเหล่านี้เป็นข้อมูลอ้างอิง ให้ติดป้ายล้อหน้า ล้อหลัง และที่แผนภาพ (เป็นตัวพิมพ์เล็ก) ยานพาหนะล้อสามเหลี่ยม สิทธิบัตรภาษาอังกฤษ 2025 OPENAI | ![]() |
| รอบที่ 2 | ตอนนี้ใส่รูปนี้ลงในรูปที่ถ่ายที่นิวยอร์คซิตี้ | ![]() |

วิธีใช้ GPT-4o บน Pollo AI
เลือกรุ่น GPT-4o
ไปที่ เครื่องสร้างภาพ Pollo AI และเลือก GPT-4o จากรายการรุ่น
ป้อนรูปภาพของคุณและแจ้งเตือน
อัปโหลดรูปภาพของคุณ ป้อนข้อความแจ้งเตือน และปรับการตั้งค่าการสร้าง
เริ่มต้นเจเนอเรชั่นของคุณ
คลิกสร้างเพื่อเริ่มสร้างภาพด้วย GPT-4o
วิดีโอ YouTube เกี่ยวกับการสร้างภาพด้วย GPT-4o
กระทู้ Reddit เกี่ยวกับการสร้างภาพด้วย GPT-4o
ความคิดเห็น
โดยu/abdojapan จากการสนทนา
ในStableDiffusion
โพสต์ X เกี่ยวกับการสร้างภาพด้วย GPT-4o
24 ชั่วโมงแล้วที่ OpenAI ปล่อยการสร้างภาพด้วย 4o ออกมาเขย่าวงการ AI อย่างไม่คาดคิด
— Barsee 🐶 (@heyBarsee) 26 มีนาคม 2025
นี่คือ 14 ตัวอย่างที่น่าทึ่งที่สุดจนถึงตอนนี้ (สร้างโดย AI 100%):
1. มีมสไตล์ Studio Ghiblipic.twitter.com/E38mBnPnQh
ตอนนี้กำลังมีเทรนด์ส่งรูปภรรยาของคุณแปลงเป็นอนิเมะสไตล์ Studio Ghiblipic.twitter.com/FROszdFSfN
— Grant Slatton (@GrantSlatton) 25 มีนาคม 2025
โอเค ฉันว่าฉันหลงรักฟีเจอร์แก้ไขภาพใหม่ของ ChatGPT แล้ว
— Peter Yang (@petergyang) 26 มีนาคม 2025
สามารถเปลี่ยนรูปครอบครัวของฉันทั้งหมดให้เป็นภาพพอร์ตเทรตสไตล์ Ghibli ได้ pic.twitter.com/tZCbxPUA0D
รูปภาพใดก็ได้ + "สร้างเวอร์ชัน Studio Ghibli ของภาพนี้" ใน GPT แล้วคุณจะได้ผลลัพธ์ที่สมบูรณ์แบบ pic.twitter.com/Q23AqeznqN
— Jason Rink (@TheJasonRink) 26 มีนาคม 2025
นี่มันสมจริงได้อย่างไร?
— tobi lutke (@tobi) 26 มีนาคม 2025
OpenAI ทำได้ดีมาก pic.twitter.com/RfRJhv8uFb
GPT-4o เพิ่งได้รับการอัปเกรดที่น่าทึ่ง!
— Min Choi (@minchoi) 26 มีนาคม 2025
OpenAI เพิ่งปล่อยฟีเจอร์สร้างภาพแบบ Native ใน GPT-4o
คุณภาพของภาพและข้อความน่าทึ่งมาก 100% AI
10 ตัวอย่างสุดเจ๋ง (รวมพรอมต์):
1. ภาพถ่ายสไตล์โพลารอยด์ pic.twitter.com/FRPIsVkMYW
พวกเขาทำได้ดีมาก pic.twitter.com/ZZMDWgJbeF
— adi (@adonis_singh) 25 มีนาคม 2025
การอัปเดต ChatGPT ที่น่าทึ่งจริงๆ pic.twitter.com/P0uMGZPuwV
— Gabbar (@GabbbarSingh) 26 มีนาคม 2025
เครื่องมือสร้างภาพใหม่จาก OpenAI ค่อนข้างดีในเรื่อง UI pic.twitter.com/BWs4xHV4ic
— Pietro Schirano (@skirano) 25 มีนาคม 2025
เดี๋ยวนะ GPT-4o สามารถทำแบบนี้ได้เลยเหรอ?! น่าประทับใจมาก... pic.twitter.com/SQEirvFUQG
— Tanishq Mathew Abraham, Ph.D. (@iScienceLuvr) 25 มีนาคม 2025
เครื่องมือสร้างภาพ GPT-4o นั้นเหลือเชื่อจริงๆ มันเหมือนกับการมีนักวาดภาพประกอบชั้นยอดคอยให้บริการตามต้องการ pic.twitter.com/BslqOqjwtM
— Ashish Singh (@ashzingh) 26 มีนาคม 2025
โมเดลภาพใหม่จาก OpenAI ไม่มีตัวกรองคนดัง!! pic.twitter.com/IWEC1mQjOF
— Deedy (@deedydas) 26 มีนาคม 2025
อะไรนะ
— Riley Brown (@rileybrown_ai) 27 มีนาคม 2025
GPT-4o... สร้างโค้ดเป็นภาพ...
เหลือเชื่อ pic.twitter.com/OAyGqyk9Dq
ฉันมองเห็นการทำงานร่วมกันที่ยอดเยี่ยมระหว่าง GPT-4o image gen และ @v0
— Guillermo Rauch (@rauchg) 27 มีนาคม 2025
มันดีมากสำหรับการสร้างแรงบันดาลใจก่อนการนำไปใช้ pic.twitter.com/VEGUF16soA
เอาล่ะ เครื่องมือสร้างภาพใหม่ของ @OpenAI นั้นน่าทึ่งมาก https://t.co/W3MraV4lLE
— Bojan Tunguz (@tunguz) 26 มีนาคม 2025
🚨ด่วน: Chat GPT ตอนนี้สามารถสร้างภาพได้แล้ว
— Hamza Khalid (@Whizz_ai) 26 มีนาคม 2025
Chat GPT 4.5 เพิ่งเปิดตัว และมันสร้างและแก้ไขภาพจากข้อความง่ายๆ ได้จริงๆ
ผู้คนต่างคลั่งไคล้กับการสร้างตัวอย่างที่น่าทึ่ง
12 ตัวอย่างสุดเจ๋ง: pic.twitter.com/XpMHgaKqve
โอ้โห ChatGPT คุณไม่เคยทำให้ฉันผิดหวังเลย pic.twitter.com/YsCrxkgwFn
— Naina (@Naina_2728) 26 มีนาคม 2025
สำรวจโมเดลภาพ AI ของ OpenAI เพิ่มเติม
FAQs
การสร้างภาพ GPT-4o คืออะไร?
การสร้างภาพ GPT-4o เป็นคุณลักษณะมัลติโหมดพื้นฐานของโมเดล GPT-4o ที่ช่วยให้ผู้ใช้สามารถสร้างและแก้ไขภาพได้โดยตรงผ่านคำสั่งภาษาธรรมชาติใน ChatGPT รองรับการสร้างภาพที่มีรายละเอียด สมจริง และหลากหลายสไตล์ โดยมีการแสดงผลข้อความที่แม่นยำฝังอยู่ในภาพ
GPT-4o สามารถสร้างสไตล์ภาพประเภทใดได้บ้าง
GPT-4o รองรับรูปแบบต่างๆ มากมาย เช่น ภาพเหมือนจริง ภาพศิลปะ (สีน้ำ ภาพวาดสีน้ำมัน ภาพร่าง) ประเภทที่เน้นสไตล์ (ไซเบอร์พังก์ อนิเมะ) อินโฟกราฟิกพร้อมข้อความที่ชัดเจน และรูปภาพความละเอียดสูงที่พร้อมสำหรับการผลิต โดยสามารถปรับรูปแบบตามคำแนะนำง่ายๆ เช่น "สดใส" "เป็นธรรมชาติ" หรือ "แบบภาพยนตร์"
ฉันจะเข้าถึงการสร้างภาพ GPT-4o ได้อย่างไร?
การสร้างภาพ GPT-4o พร้อมใช้งานตามค่าเริ่มต้นสำหรับผู้ใช้ ChatGPT Plus, Pro และ Team ขณะนี้ยังไม่พร้อมใช้งานในแผนฟรีเนื่องจากมีความต้องการสูง นักพัฒนาจะสามารถเข้าถึงได้ผ่าน OpenAI API ในเร็วๆ นี้
หากคุณกำลังมองหาวิธีเข้าถึง GPT-4o ที่ง่ายดายและราบรื่น คุณสามารถลองใช้กับ Pollo AI ได้ ซึ่งเป็นเครื่องสร้างภาพและวิดีโอ AI แบบครบวงจรที่ให้คุณใช้โมเดลภาพ AI ที่ดีที่สุดทั้งหมดบนแพลตฟอร์มเดียว รวมถึง GPT-4o, Recraft , FLUX , Imagen , Stable Diffusion และอื่นๆ อีกมากมาย
มีข้อจำกัดหรือปัญหาที่ทราบเกี่ยวกับการสร้างภาพ GPT-4o หรือไม่
ใช่ ข้อจำกัดบางประการในการสร้างภาพ GPT-4o ได้แก่ ภาพหลอนหรือการแต่งข้อมูลขึ้นมา ความยากลำบากในการสร้างกราฟที่แม่นยำ การแสดงข้อความหลายภาษา ความแม่นยำในการแก้ไขที่ไม่สม่ำเสมอ และอื่นๆ
GPT-4o เพิ่มข้อมูลเมตาใดๆ ลงในรูปภาพที่สร้างขึ้นหรือไม่
ใช่ GPT-4o จะฝังแท็กเมตาข้อมูล C2PA ลงในรูปภาพที่สร้างขึ้นโดยอัตโนมัติเพื่อระบุแหล่งที่มาของ AI ส่งเสริมความโปร่งใสและช่วยให้แพลตฟอร์มสามารถระบุเนื้อหาที่สร้างโดย AI ได้

















