Kling AI ได้สร้างชื่อเสียงให้กับตัวเองในฐานะหนึ่งในเครื่องมือสร้างวิดีโอ AI ที่ทรงพลังที่สุดในตลาด สร้างความประทับใจให้กับครีเอเตอร์อย่างต่อเนื่องด้วยความสามารถในการสร้างฟุตเทจคุณภาพสูงจากข้อความแจ้งง่ายๆ
ตอนนี้ พวกเขากำลังลองสิ่งใหม่ด้วยการเปิดตัวโมเดลภาพ Kling O1 ซึ่งเป็นโมเดลสร้างภาพโดยเฉพาะรุ่นแรกของพวกเขา คำถามสำคัญคือ: Kling สามารถสร้างภาพได้ดีเท่ากับวิดีโอหรือไม่?
ฉันได้ใช้เวลาทดสอบโมเดลภาพ Kling O1 อย่างละเอียด และฉันพร้อมที่จะแบ่งปันสิ่งที่ฉันค้นพบ มาดูกันว่าโมเดลใหม่นี้มีอะไรบ้าง
อะไรทำให้ Kling O1 โดดเด่น?
ก่อนที่จะเจาะลึกการทดสอบโดยละเอียดของฉัน ขอฉันแสดงตัวอย่างสั้นๆ ของสิ่งที่ฉันพบว่าเป็นคุณสมบัติที่น่าประทับใจที่สุดของ Kling O1:
การผสานรวมภาพหลายภาพที่น่าทึ่งซึ่งคงรายละเอียดดั้งเดิมไว้
หนึ่งในจุดแข็งที่ยิ่งใหญ่ที่สุดของโมเดลภาพ Kling O1 คือความสามารถในการรวมภาพอ้างอิงหลายภาพเข้าด้วยกัน โดยยังคงรักษาคุณสมบัติดั้งเดิมของแหล่งที่มาแต่ละรายการไว้ได้อย่างดีเยี่ยม
ต่างจากโมเดลอื่นๆ อีกมากมายที่ทำให้รายละเอียดเบลอเมื่อผสมผสานภาพหลายภาพ Kling O1 จะรักษาลักษณะเฉพาะของแต่ละองค์ประกอบด้วยความแม่นยำที่น่าประทับใจ
การทำความเข้าใจ Prompt อัจฉริยะ & การแก้ไขที่แม่นยำ
ไม่ว่าจะเป็นการปรับแต่งพื้นที่เฉพาะของภาพ หรือแก้ไของค์ประกอบเฉพาะ โมเดลสามารถเข้าใจคำสั่งแก้ไขได้อย่างถูกต้อง
สร้างขึ้นบนแนวคิดอันทรงพลังของ ภาษาทางสายตามัลติโมดัล ทำให้การแก้ไขภาพรู้สึกเป็นธรรมชาติเหมือนการสนทนากับนักออกแบบ
กระบวนการทดสอบของฉัน: ผลักดัน Kling O1 Image Model ให้ถึงขีดจำกัด
ในการประเมินความสามารถของ Kling O1 อย่างเหมาะสม ฉันมุ่งเน้นไปที่สถานการณ์การทดสอบหลักสองสถานการณ์ที่จะเปิดเผยทั้งจุดแข็งและจุดอ่อนที่เป็นไปได้:
การทดสอบที่ 1: การผสานภาพอ้างอิงหลายภาพ
การทดสอบครั้งแรกมีวัตถุประสงค์เพื่อประเมินว่า Kling O1 สามารถจัดการภาพอ้างอิงหลายภาพพร้อมกันได้ดีเพียงใด และสร้างองค์ประกอบที่สอดคล้องกันซึ่งรักษาคุณลักษณะของแหล่งที่มาแต่ละรายการ
ฉันใช้สี่ภาพ:
![]() |
![]() |
![]() |
![]() |
จากนั้นฉันก็ให้ prompt ดังนี้:
โปรดสร้างภาพที่มีเด็กผู้หญิงจากภาพที่ 1 ถือสุนัขจากภาพที่ 2 โดยมีฉากหลังเป็นภาพที่ 3 และใช้โทนสีและสไตล์ของภาพที่ 4 กับทั้งภาพ
และนี่คือผลลัพธ์ที่ฉันได้รับ:

จากผลลัพธ์ที่สร้างขึ้น เห็นได้ชัดว่า Kling O1 ทำตามคำแนะนำได้อย่างสมบูรณ์แบบ แม้ในขณะที่ประมวลผลเนื้อหาจากสี่ภาพพร้อมกัน ก็ไม่มีความสับสนหรือการเบี่ยงเบนไปจาก prompt และความสามารถในการประมวลผลภาพหลายภาพที่ทรงพลังทำให้ฉันประหลาดใจอย่างแท้จริง
อย่างไรก็ตาม ฉันเชื่อว่าความสมจริงของภาพนี้สามารถปรับปรุงให้ดีขึ้นได้ แม้ว่าตัวแบบและฉากหลังจะมีโทนสีเดียวกัน แต่ก็ยังคงให้ความรู้สึกไม่ลงรอยกันและไม่เป็นธรรมชาติ
นอกเหนือจากการผสมผสานฉากและตัวแบบแล้ว ฉันยังได้ทดสอบการใช้สไตล์และวัสดุ
ฉันใช้สองภาพนี้:
![]() |
![]() |
และตั้ง prompt เป็น:
แปลงตัวแบบในภาพที่ 1 ให้เป็นบุคคลที่เหมือนจริง โดยใช้พื้นผิวและวัสดุจากภาพที่ 2 สำหรับผ้าพันคอ
ภาพสุดท้ายที่ Kling O1 ให้มา:

ผลลัพธ์สุดท้ายแสดงให้เห็นว่า Kling O1 ทำงานได้ดีพอสมควรในแง่ของการแปลงสไตล์และการแทนที่วัสดุ
อย่างไรก็ตาม ยังมีปัญหาเล็กน้อย: มีส่วนของผ้าพันคอเพิ่มขึ้นที่หน้าอกของตัวแบบ และโบว์ไทหายไป ความไม่สอดคล้องกันทางตรรกะในภาพประเภทนี้บ่อนทำลายความสมจริงโดยรวม
การทดสอบที่ 2: การแก้ไขความแม่นยำแบบวนซ้ำ
การทดสอบครั้งที่สองมุ่งเน้นไปที่การประเมินความสามารถของ Kling O1 ในการปรับเปลี่ยนทีละน้อยอย่างแม่นยำตามภาพอ้างอิงเพียงภาพเดียว
สิ่งนี้จะเปิดเผยว่าโมเดลสามารถจัดการกับเวิร์กโฟลว์การแก้ไขที่ซับซ้อนได้หรือไม่โดยไม่ลดทอนคุณภาพหรือสูญเสียบริบท
ในตารางที่ฉันรวบรวมไว้ด้านล่าง คุณสามารถดูการเปรียบเทียบแบบเคียงข้างกันของประสิทธิภาพของ Kling O1 ในการทดสอบนี้:
| ภาพอ้างอิง | Prompt & ผลลัพธ์ที่ 1 | Prompt & ผลลัพธ์ที่ 2 |
![]() |
![]() เปลี่ยนเวลาของวันเป็นตอนเย็น พร้อมแสงไฟภายในที่อบอุ่นจากหลอดไฟเหนือศีรษะ คงทุกอย่างไว้เหมือนเดิม |
![]() เปลี่ยนถ้วยกาแฟเป็นหนังสือ ผู้หญิงควรจะกำลังอ่านแทนที่จะมองออกไปนอกหน้าต่าง รักษาลักษณะใบหน้า เสื้อผ้า และฉากหลังให้เหมือนเดิม |
| Prompt & ผลลัพธ์ที่ 3 | Prompt & ผลลัพธ์ที่ 4 | Prompt & ผลลัพธ์ที่ 5 |
![]() เพิ่มฝนตกเล็กน้อยที่มองเห็นได้ผ่านหน้าต่าง ปรับเงาสะท้อนบนหน้าต่างให้เห็นหยดฝน อย่าแก้ไขฉากภายในหรือตัวละคร |
![]() เปลี่ยนเสื้อผ้าลำลองเป็นเสื้อผ้าสำหรับมืออาชีพ – เสื้อเบลเซอร์และเสื้อเชิ้ตทางการ รักษาท่าทาง ลักษณะใบหน้า และฉากหลังทั้งหมดให้เหมือนเดิม |
![]() เพิ่มอีกคนในฉากหลัง – บาริสต้าที่ทำงานหลังเคาน์เตอร์ รักษาแสง เวลาของวัน และองค์ประกอบอื่นๆ ที่มีอยู่ทั้งหมดให้เหมือนเดิม |
ผลลัพธ์น่าประทับใจอย่างแท้จริง Kling O1 แสดงให้เห็นถึงความเข้าใจที่ยอดเยี่ยมเกี่ยวกับสิ่งที่ควรเปลี่ยนแปลงและสิ่งที่ควรคงอยู่
แต่ละรอบการทำซ้ำยังคงความสอดคล้องกันอย่างน่าทึ่งกับเวอร์ชันก่อนหน้า ในขณะที่นำการแก้ไขที่ร้องขอมาใช้อย่างถูกต้อง
ความคิดเห็นสุดท้าย: Kling O1 คุ้มค่าที่จะลองหรือไม่?
หลังจากการทดสอบอย่างกว้างขวาง โมเดลภาพ Kling O1 เป็นผลงานที่แข็งแกร่งอย่างเห็นได้ชัดในวงการสร้างภาพ AI
แนวทาง Multi-modal ทำงานได้ดีเยี่ยม – การผสมผสาน prompt ภาษาธรรมชาติเข้ากับภาพอ้างอิงสร้างเวิร์กโฟลว์ที่ราบรื่นซึ่งให้ความรู้สึกร่วมมือกันมากกว่าที่จะน่าหงุดหงิด
การรักษาคุณสมบัติเป็นสิ่งที่ดีที่สุดในระดับเดียวกันอย่างแท้จริง โดยรักษาลักษณะเฉพาะของแต่ละแหล่งที่มาเมื่อรวมการอ้างอิงหลายรายการ การแก้ไขทีละขั้นตอนก็มีประสิทธิภาพอย่างน่าทึ่ง ช่วยให้คุณทำการเปลี่ยนแปลงที่แม่นยำโดยไม่สูญเสียบริบท
สำหรับครีเอเตอร์และนักออกแบบที่ต้องการการควบคุมและความสม่ำเสมอที่ยอดเยี่ยม โมเดลภาพ Kling O1 คุ้มค่าที่จะลองอย่างแน่นอน มันนำความเชี่ยวชาญด้านวิดีโอของ Kling มาสู่ภาพนิ่งได้อย่างสำเร็จ โดยขจัดปัญหาการสลับเครื่องมือที่น่ารำคาญซึ่งแพร่หลายในกระบวนการสร้างสรรค์ AI จำนวนมาก
มันสมบูรณ์แบบหรือไม่? ไม่ใช่ แต่มันเป็นการเปิดตัวที่แข็งแกร่งซึ่งแสดงให้เห็นว่า Kling AI เอาจริงเอาจังกับการสร้างภาพ
พร้อมที่จะทดสอบด้วยตัวเองแล้วหรือยัง? ไปที่ Pollo AI เพื่อลองใช้ โมเดลภาพ Kling O1 หรือสำรวจโมเดลชั้นนำอื่นๆ ที่มีอยู่บน ตัวสร้างภาพ Pollo AI เพื่อค้นหาโมเดลที่ตรงกับความต้องการของคุณมากที่สุด มันเป็นการลงทุนด้านเวลาที่คุ้มค่าสำหรับครีเอเตอร์ทุกคน











