Kling AI เพิ่งเปิด Kling 2.0 สู่สาธารณะ
เวอร์ชันใหม่นี้อัดแน่นไปด้วยอัปเกรดสำคัญๆ จนขึ้นแท่นอันดับหนึ่งในการจัดอันดับวิดีโอด้วย AI แต่จะก้าวล้ำอย่างที่คิดจริงหรือไม่?
เราได้นำ Kling 2.0 มาทดสอบโดยเปรียบเทียบกับรุ่นล้ำสมัยอื่นๆ เช่น Runway Gen 4 และ Veo 2 ของ Google
เราจะมาแบ่งปันผลลัพธ์ในอีกไม่ช้านี้ แต่ก่อนอื่น มาทำความเข้าใจกันก่อนว่าอะไรที่ทำให้ Kling 2.0 พิเศษ
มีอะไรใหม่ใน Kling 2.0 ?
Kling 2.0 ได้แนะนำคุณลักษณะและการเปลี่ยนแปลงใหม่ๆ หลายประการ
การแจ้งเตือนภาพแบบหลายโหมด
คุณสมบัติใหม่ "หลายองค์ประกอบ" คือการเพิ่มสิ่งที่สำคัญที่สุดอย่างหนึ่งให้กับระบบนิเวศ Kling
เป็นระบบแจ้งเตือนแบบภาพหลายโหมดที่ให้ผู้ใช้อ้างอิงรูปภาพและวิดีโอภายในข้อความแจ้งเตือน คุณลักษณะนี้ถือเป็นความก้าวหน้าครั้งสำคัญในด้านการควบคุมและความแม่นยำ แม้ว่าปัจจุบันจะแยกจาก Kling 2.0 (โดยคาดว่าจะรวมเข้าในเร็วๆ นี้)
ระบบนี้มีฟังก์ชั่นหลักสามประการ:
- สลับ: แทนที่หัวเรื่องในวิดีโอที่มีอยู่ (ฟีเจอร์กำลังพบข้อผิดพลาดระหว่างการทดสอบ)
- เพิ่ม: แทรกองค์ประกอบใหม่จากภาพอ้างอิงลงในวิดีโอ
- ลบ: ลบวัตถุที่ไม่ต้องการออกจากฉากแบบไดนามิก
ในการทดสอบของเรา เราสามารถใช้คุณลักษณะ "เพิ่ม" เพื่อแทรกภาพผู้หญิงกำลังวิ่ง (จากรูปภาพอ้างอิง) ลงในฉากลาวาที่ไหลเข้าไปในโรงโอเปร่าเก่าได้สำเร็จ

ในทำนองเดียวกัน ฟังก์ชัน "ลบ" ทำให้เราสามารถลบนกแก้วออกจากไหล่ของหุ่นยนต์ได้ โดยยังคงความสอดคล้องทางภาพตลอดทั้งวิดีโอ

ที่น่าสังเกตคือ Kling AI มอบเทมเพลตคำเตือนที่เป็นประโยชน์เมื่ออัปโหลดเอกสารอ้างอิง ช่วยลดความจำเป็นในการจดจำโครงสร้างคำเตือนที่ซับซ้อน ซึ่งถือเป็นการปรับปรุงประสบการณ์ผู้ใช้ที่ใส่ใจ
การเปลี่ยนแปลงอินเทอร์เฟซและเวิร์กโฟลว์
ในเวอร์ชันนี้ Kling AI ได้แนะนำการเปลี่ยนแปลงอินเทอร์เฟซหลายประการด้วย:
- ความแตกต่างระหว่างโหมด "มาตรฐาน" และ "มืออาชีพ" ได้ถูกลบออกไป
- สไลเดอร์ความคิดสร้างสรรค์และการติดตามคำเตือนไม่สามารถใช้งานได้อีกต่อไป
- โหมดเฟรมไม่ได้รับการรองรับในปัจจุบันด้วย Kling 2.0
- ฟีเจอร์องค์ประกอบดั้งเดิม (สำหรับตำแหน่งตัวละครและการอ้างอิงวัตถุ) ยังไม่เข้ากันได้กับ Kling 2.0

Kling 2.0 เทียบกับ Kling 1.6: มีอะไรปรับปรุงบ้าง?
Kling 2.0 โดดเด่นในเรื่องคุณภาพการเคลื่อนไหวและการจำลองฟิสิกส์ แต่บางครั้งคุณอาจชอบความสอดคล้องของฉากของ Kling 1.6 สำหรับโปรเจ็กต์เฉพาะมากกว่า
ความคล่องตัวของการเคลื่อนไหวและความเป็นธรรมชาติ
Kling 2.0 ช่วยปรับปรุงคุณภาพการเคลื่อนไหวได้อย่างมาก สัตว์เคลื่อนไหวได้ลื่นไหลเป็นธรรมชาติ แทนที่จะเป็นการเคลื่อนไหวกระตุกๆ ที่ไม่สมจริงอย่างที่เห็นใน Kling 1.6
การแสดงออกของมนุษย์นั้นน่าเชื่อถือมากขึ้น โดยขจัดปัญหา "ริมฝีปากขยับโดยไม่พูด" อารมณ์บนใบหน้าดูเป็นธรรมชาติและสม่ำเสมอตลอดทั้งฉาก
การจัดการฉากไดนามิก
สิ่งมีชีวิตที่บินได้แสดงการเคลื่อนไหวของปีกและรูปแบบการร่อนตามธรรมชาติ เส้นทางการบินที่แข็งทื่อของ Kling 1.6 ถูกแทนที่ด้วยพลวัตทางอากาศที่สมจริง
ฟิสิกส์สิ่งแวดล้อมได้รับการปรับปรุงให้ดีขึ้นอย่างมาก เอฟเฟกต์น้ำ ปฏิสัมพันธ์ของวัตถุ และคุณสมบัติของวัสดุมีการทำงานที่สมจริงมากขึ้น
การแลกเปลี่ยนความสอดคล้องกัน
Kling 2.0 สร้างฉากที่มีไดนามิกมากขึ้น แต่บางครั้งก็ต้องแลกมาด้วยความไม่สอดคล้องกัน ตัวละครอาจปรากฏหรือหายไปโดยไม่คาดคิดในลำดับที่ซับซ้อน
Kling 1.6 แม้จะมีภาพที่น่าประทับใจน้อยกว่า แต่ก็ยังคงความสม่ำเสมอของฉากที่ดีกว่าตลอดทั้งวิดีโอ
ความเข้าใจที่รวดเร็ว
คำสั่งกล้อง เช่น การแพน การเอียง และการเปลี่ยนโฟกัส ดำเนินการด้วยความแม่นยำยิ่งขึ้นใน Kling 2.0
การกระทำตามลำดับจะเข้าใจได้ดีขึ้น คำเตือนหลายส่วน เช่น "โคมระย้าตกลงไปในลาวาและระเบิดเป็นไฟ" จะต้องเป็นไปตามลำดับตรรกะที่เหมาะสม
ข้อจำกัดทางเทคนิค
ทั้งสองเวอร์ชันมีปัญหาในการจัดการกับมือ การแสดงข้อความ และการโต้ตอบที่ซับซ้อน แม้ว่าเวอร์ชัน 2.0 จะมีการปรับปรุงเล็กน้อยในพื้นที่เหล่านี้ก็ตาม
พารามิเตอร์การสร้าง
Kling 2.0 ลบแถบเลื่อนที่สร้างสรรค์/ทำตามคำสั่งออก และผสานโหมดมาตรฐาน/มืออาชีพเข้าเป็นอินเทอร์เฟซแบบรวม
แนวทางที่ปรับปรุงใหม่นี้อาจเป็นประโยชน์กับผู้เริ่มต้น แต่จะจำกัดตัวเลือกสำหรับผู้ใช้ขั้นสูงที่คุ้นเคยกับการปรับแต่งเอาต์พุตของตนอย่างละเอียด
ทดสอบ Kling 2.0
เราอยากดูว่า Kling 2.0 จะเทียบกับ Runway Gen 4 และ Google Veo 2 ได้อย่างไร
ดังนั้น เราจึงทำการทดสอบชุดหนึ่งกับเครื่องสร้างวิดีโอ AI ทั้งสามเครื่องโดยใช้คำกระตุ้นเดียวกัน
ความสามารถในการยึดถืออย่างรวดเร็วและการแสดงภาพเคลื่อนไหว
การทดสอบครั้งแรกของเรามุ่งเน้นไปที่ความสามารถของ Kling 2.0 ในการทำความเข้าใจและปฏิบัติตามคำสั่งที่ซับซ้อนซึ่งเกี่ยวข้องกับทั้งวัตถุและการเคลื่อนไหวของกล้อง งานนี้ง่ายแต่ท้าทาย ผู้หญิงคนหนึ่งก้มมองมือของเธอ และนกแก้วก็เกาะบนมือของเธอ
Kling 2.0 ทำหน้าที่ได้อย่างน่าประทับใจในการปฏิบัติตามคำสั่งอย่างเคร่งครัด การดำเนินการดำเนินไปอย่างเป็นธรรมชาติโดยมีลำดับเหตุการณ์ที่ชัดเจน
ในทางกลับกัน ผลงานของรันเวย์กลับไม่เป็นไปตามเป้าหมาย นกแก้วปรากฏตัวอยู่แล้วเมื่อผู้หญิงคนนั้นมองลงมา ซึ่งไม่สอดคล้องกับข้อกำหนดของคำกระตุ้น
Veo 2 ของ Google ปฏิบัติตามคำแจ้งเตือนแต่ขาดการดำเนินการตามลำดับที่ชัดเจนซึ่ง Kling 2.0 มอบให้
การประเมินผลกระทบต่อสิ่งแวดล้อม: การจำลองน้ำท่วม
จากนั้นเราได้ทดสอบความสามารถในการแสดงเอฟเฟ็กต์สภาพแวดล้อมของ Kling 2.0 โดยเฉพาะสถานการณ์น้ำท่วมในเมือง
Kling 2.0 ทำงานได้อย่างน่าชื่นชม ถ่ายทอดภาพน้ำท่วมที่ท่วมถนนและผลักรถออกไปได้อย่างแม่นยำ
Runway ดิ้นรนกับความท้าทายนี้ โดยเลือกที่จะแสดงคลื่นทะเลขนาดใหญ่ที่ไม่ตรงกับข้อความแทน
Veo 2 สามารถแสดงภาพน้ำท่วมได้ แต่ขาดความคล่องตัว และไม่สามารถจับภาพสถานการณ์ที่บรรยายไว้ในข้อความได้อย่างครบถ้วน
การดำเนินการแบบไดนามิกและการทำความเข้าใจอย่างรวดเร็วในสถานการณ์ความเร็วสูง
เราพัฒนา Kling 2.0 ให้ก้าวไปอีกขั้นด้วยการทดสอบความสามารถในการจัดการฉากแอ็คชันความเร็วสูง ภารกิจนี้เกี่ยวข้องกับผู้หญิงคนหนึ่งที่กำลังขี่ม้าควบพร้อมกับกล้องที่หมุนวนรอบตัวเธอ
Kling 2.0 นำเสนอผลลัพธ์ที่เป็นแอนิเมชั่นและดึงดูดสายตา แม้ว่าจะประสบปัญหาเล็กน้อยในการรักษาความสอดคล้องของสีหน้าระหว่างการดำเนินเรื่องความเร็วสูง
ผลงานของรันเวย์ดูเหมือนเป็นฉากสโลว์โมชันมากกว่า ขาดความมีชีวิตชีวาความเร็วสูงที่เรามุ่งหวังไว้
น่าเสียดายที่ Veo 2 ไม่ได้ให้ผลลัพธ์ที่ใช้งานได้ในสถานการณ์นี้
การเรนเดอร์วัตถุลอยตัวและการเคลื่อนไหวของกล้องที่ซับซ้อน
ในการทดสอบนี้ เราท้าทาย Kling 2.0 ให้เรนเดอร์ฉากที่มีวัตถุลอยตัวและเคลื่อนไหวกล้องเอียงลง
Kling 2.0 โดดเด่นอีกครั้งด้วยการถ่ายทอดวัตถุลอยได้อย่างแม่นยำและเคลื่อนไหวกล้องตามที่กำหนด Runway และ Veo 2 ประสบปัญหาในงานนี้ เนื่องจากไม่สามารถแสดงวัตถุลอยและเคลื่อนไหวกล้องได้อย่างสมบูรณ์ตามที่อธิบายไว้ในคำแนะนำ
ความท้าทายขั้นสูงสุด: โมเดลวิดีโอ AI ปะทะฉากต่อสู้ของซามูไร
ความท้าทายสุดท้ายคือการเรนเดอร์ฉากต่อสู้ระหว่างซามูไรสองคน ซึ่งเป็นงานที่พิสูจน์ได้ยากสำหรับโมเดลวิดีโอ AI มาโดยตลอด
แม้ว่า Kling 2.0 จะได้รับการปรับปรุงให้ดีขึ้นกว่าเวอร์ชันก่อนๆ แต่ยังคงประสบปัญหาในการแสดงฉากต่อสู้ให้ดูเป็นธรรมชาติ ความสอดคล้องของดาบลดลง โดยเฉพาะเมื่อดาบโต้ตอบกัน และฉากโดยรวมก็ดูไม่สมจริงเท่าที่เราคาดหวัง
Runway Gen 4 และ Veo 2 เผชิญกับปัญหาที่คล้ายคลึงกันโดยมีปัญหาด้านความสอดคล้องและการเคลื่อนไหวที่ขาดธรรมชาติในฉากต่อสู้
ข้อดีและข้อจำกัดของ Kling 2.0
โดยรวมแล้ว เราคิดว่า Kling 2.0 มีข้อดีและข้อเสียดังต่อไปนี้
จุดแข็งของ Kling 2.0
- การยึดมั่นในคำเตือน: Kling 2.0 แสดงให้เห็นการยึดมั่นอย่างโดดเด่นต่อคำเตือนที่ซับซ้อน โดยเฉพาะอย่างยิ่งคำเตือนที่เกี่ยวข้องกับการกระทำหลายอย่างและผลกระทบต่อสิ่งแวดล้อม
- ความสมจริงในการโต้ตอบ: โมเดลนี้โดดเด่นในด้านการแสดงปฏิสัมพันธ์ที่ละเอียดอ่อนและการเคลื่อนไหวที่สมจริง ซึ่งช่วยยกระดับคุณภาพของภาพโดยรวมให้ดีขึ้น
ความท้าทายของ Kling 2.0
- การรักษาความสอดคล้อง: Kling 2.0 ประสบปัญหาเรื่องความสอดคล้องระหว่างลำดับการกระทำความเร็วสูงและซับซ้อน ส่งผลให้เกิดความไม่สอดคล้องในเอาต์พุต
- การเรนเดอร์ฉากที่ซับซ้อน: แม้ว่าจะมีการปรับปรุง แต่ Kling 2.0 ยังคงเผชิญกับความท้าทายในการเรนเดอร์ฉากการต่อสู้ที่สมจริงและการเคลื่อนไหวกล้องแบบไดนามิก
ราคาและการเข้าถึง
- ผลกระทบด้านต้นทุน: ราคาของ Kling 2.0 โดยเฉพาะอย่างยิ่งสำหรับการสร้างวิดีโอสั้นๆ อาจเป็นปัญหาสำหรับผู้ใช้บางคน ซึ่งบ่งบอกถึงความจำเป็นในการมีตัวเลือกที่ราคาไม่แพง
ความคิดสุดท้าย: Kling 2.0 คุ้มค่าหรือไม่?
Kling 2.0 ถือเป็นก้าวสำคัญในการสร้างวิดีโอด้วย AI ที่มอบการปรับปรุงที่น่าประทับใจในการปฏิบัติตามคำแนะนำที่ซับซ้อน และการแสดงการโต้ตอบที่สมจริง
อย่างไรก็ตาม ยังคงเผชิญกับความท้าทายในการรักษาความสอดคล้องระหว่างฉากไดนามิก แม้จะมีการพัฒนา แต่คุณควรชั่งน้ำหนักข้อดีกับต้นทุนปัจจุบันและความต้องการเฉพาะของโปรเจ็กต์เมื่อพิจารณา Kling 2.0
หมายเหตุ: บทความนี้เขียนขึ้นโดยอ้างอิงจากเนื้อหาในวิดีโอต่อไปนี้: