Kling 2.0 เปิดตัวแล้ว: นี่คือโมเดลวิดีโอ AI ที่ดีที่สุดหรือไม่

Kling AI เพิ่งเปิด Kling 2.0 สู่สาธารณะ

เวอร์ชันใหม่นี้อัดแน่นไปด้วยอัปเกรดสำคัญๆ จนขึ้นแท่นอันดับหนึ่งในการจัดอันดับวิดีโอด้วย AI แต่จะก้าวล้ำอย่างที่คิดจริงหรือไม่?

เราได้นำ Kling 2.0 มาทดสอบโดยเปรียบเทียบกับรุ่นล้ำสมัยอื่นๆ เช่น Runway Gen 4 และ Veo 2 ของ Google

เราจะมาแบ่งปันผลลัพธ์ในอีกไม่ช้านี้ แต่ก่อนอื่น มาทำความเข้าใจกันก่อนว่าอะไรที่ทำให้ Kling 2.0 พิเศษ

มีอะไรใหม่ใน Kling 2.0 ?

Kling 2.0 ได้แนะนำคุณลักษณะและการเปลี่ยนแปลงใหม่ๆ หลายประการ

การแจ้งเตือนภาพแบบหลายโหมด

คุณสมบัติใหม่ "หลายองค์ประกอบ" คือการเพิ่มสิ่งที่สำคัญที่สุดอย่างหนึ่งให้กับระบบนิเวศ Kling

เป็นระบบแจ้งเตือนแบบภาพหลายโหมดที่ให้ผู้ใช้อ้างอิงรูปภาพและวิดีโอภายในข้อความแจ้งเตือน คุณลักษณะนี้ถือเป็นความก้าวหน้าครั้งสำคัญในด้านการควบคุมและความแม่นยำ แม้ว่าปัจจุบันจะแยกจาก Kling 2.0 (โดยคาดว่าจะรวมเข้าในเร็วๆ นี้)

ระบบนี้มีฟังก์ชั่นหลักสามประการ:

สลับ: แทนที่หัวเรื่องในวิดีโอที่มีอยู่ (ฟีเจอร์กำลังพบข้อผิดพลาดระหว่างการทดสอบ)
เพิ่ม: แทรกองค์ประกอบใหม่จากภาพอ้างอิงลงในวิดีโอ
ลบ: ลบวัตถุที่ไม่ต้องการออกจากฉากแบบไดนามิก

ในการทดสอบของเรา เราสามารถใช้คุณลักษณะ "เพิ่ม" เพื่อแทรกภาพผู้หญิงกำลังวิ่ง (จากรูปภาพอ้างอิง) ลงในฉากลาวาที่ไหลเข้าไปในโรงโอเปร่าเก่าได้สำเร็จ

ในทำนองเดียวกัน ฟังก์ชัน "ลบ" ทำให้เราสามารถลบนกแก้วออกจากไหล่ของหุ่นยนต์ได้ โดยยังคงความสอดคล้องทางภาพตลอดทั้งวิดีโอ

ที่น่าสังเกตคือ Kling AI มอบเทมเพลตคำเตือนที่เป็นประโยชน์เมื่ออัปโหลดเอกสารอ้างอิง ช่วยลดความจำเป็นในการจดจำโครงสร้างคำเตือนที่ซับซ้อน ซึ่งถือเป็นการปรับปรุงประสบการณ์ผู้ใช้ที่ใส่ใจ

การเปลี่ยนแปลงอินเทอร์เฟซและเวิร์กโฟลว์

ในเวอร์ชันนี้ Kling AI ได้แนะนำการเปลี่ยนแปลงอินเทอร์เฟซหลายประการด้วย:

ความแตกต่างระหว่างโหมด "มาตรฐาน" และ "มืออาชีพ" ได้ถูกลบออกไป
สไลเดอร์ความคิดสร้างสรรค์และการติดตามคำเตือนไม่สามารถใช้งานได้อีกต่อไป
โหมดเฟรมไม่ได้รับการรองรับในปัจจุบันด้วย Kling 2.0
ฟีเจอร์องค์ประกอบดั้งเดิม (สำหรับตำแหน่งตัวละครและการอ้างอิงวัตถุ) ยังไม่เข้ากันได้กับ Kling 2.0

Kling 2.0 เทียบกับ Kling 1.6: มีอะไรปรับปรุงบ้าง?

Kling 2.0 โดดเด่นในเรื่องคุณภาพการเคลื่อนไหวและการจำลองฟิสิกส์ แต่บางครั้งคุณอาจชอบความสอดคล้องของฉากของ Kling 1.6 สำหรับโปรเจ็กต์เฉพาะมากกว่า

ความคล่องตัวของการเคลื่อนไหวและความเป็นธรรมชาติ

Kling 2.0 ช่วยปรับปรุงคุณภาพการเคลื่อนไหวได้อย่างมาก สัตว์เคลื่อนไหวได้ลื่นไหลเป็นธรรมชาติ แทนที่จะเป็นการเคลื่อนไหวกระตุกๆ ที่ไม่สมจริงอย่างที่เห็นใน Kling 1.6

การแสดงออกของมนุษย์นั้นน่าเชื่อถือมากขึ้น โดยขจัดปัญหา "ริมฝีปากขยับโดยไม่พูด" อารมณ์บนใบหน้าดูเป็นธรรมชาติและสม่ำเสมอตลอดทั้งฉาก

การจัดการฉากไดนามิก

สิ่งมีชีวิตที่บินได้แสดงการเคลื่อนไหวของปีกและรูปแบบการร่อนตามธรรมชาติ เส้นทางการบินที่แข็งทื่อของ Kling 1.6 ถูกแทนที่ด้วยพลวัตทางอากาศที่สมจริง

ฟิสิกส์สิ่งแวดล้อมได้รับการปรับปรุงให้ดีขึ้นอย่างมาก เอฟเฟกต์น้ำ ปฏิสัมพันธ์ของวัตถุ และคุณสมบัติของวัสดุมีการทำงานที่สมจริงมากขึ้น

การแลกเปลี่ยนความสอดคล้องกัน

Kling 2.0 สร้างฉากที่มีไดนามิกมากขึ้น แต่บางครั้งก็ต้องแลกมาด้วยความไม่สอดคล้องกัน ตัวละครอาจปรากฏหรือหายไปโดยไม่คาดคิดในลำดับที่ซับซ้อน

Kling 1.6 แม้จะมีภาพที่น่าประทับใจน้อยกว่า แต่ก็ยังคงความสม่ำเสมอของฉากที่ดีกว่าตลอดทั้งวิดีโอ

ความเข้าใจที่รวดเร็ว

คำสั่งกล้อง เช่น การแพน การเอียง และการเปลี่ยนโฟกัส ดำเนินการด้วยความแม่นยำยิ่งขึ้นใน Kling 2.0

การกระทำตามลำดับจะเข้าใจได้ดีขึ้น คำเตือนหลายส่วน เช่น "โคมระย้าตกลงไปในลาวาและระเบิดเป็นไฟ" จะต้องเป็นไปตามลำดับตรรกะที่เหมาะสม

ข้อจำกัดทางเทคนิค

ทั้งสองเวอร์ชันมีปัญหาในการจัดการกับมือ การแสดงข้อความ และการโต้ตอบที่ซับซ้อน แม้ว่าเวอร์ชัน 2.0 จะมีการปรับปรุงเล็กน้อยในพื้นที่เหล่านี้ก็ตาม

พารามิเตอร์การสร้าง

Kling 2.0 ลบแถบเลื่อนที่สร้างสรรค์/ทำตามคำสั่งออก และผสานโหมดมาตรฐาน/มืออาชีพเข้าเป็นอินเทอร์เฟซแบบรวม

แนวทางที่ปรับปรุงใหม่นี้อาจเป็นประโยชน์กับผู้เริ่มต้น แต่จะจำกัดตัวเลือกสำหรับผู้ใช้ขั้นสูงที่คุ้นเคยกับการปรับแต่งเอาต์พุตของตนอย่างละเอียด

ทดสอบ Kling 2.0

เราอยากดูว่า Kling 2.0 จะเทียบกับ Runway Gen 4 และ Google Veo 2 ได้อย่างไร

ดังนั้น เราจึงทำการทดสอบชุดหนึ่งกับเครื่องสร้างวิดีโอ AI ทั้งสามเครื่องโดยใช้คำกระตุ้นเดียวกัน

ความสามารถในการยึดถืออย่างรวดเร็วและการแสดงภาพเคลื่อนไหว

การทดสอบครั้งแรกของเรามุ่งเน้นไปที่ความสามารถของ Kling 2.0 ในการทำความเข้าใจและปฏิบัติตามคำสั่งที่ซับซ้อนซึ่งเกี่ยวข้องกับทั้งวัตถุและการเคลื่อนไหวของกล้อง งานนี้ง่ายแต่ท้าทาย ผู้หญิงคนหนึ่งก้มมองมือของเธอ และนกแก้วก็เกาะบนมือของเธอ

Kling 2.0 ทำหน้าที่ได้อย่างน่าประทับใจในการปฏิบัติตามคำสั่งอย่างเคร่งครัด การดำเนินการดำเนินไปอย่างเป็นธรรมชาติโดยมีลำดับเหตุการณ์ที่ชัดเจน

ในทางกลับกัน ผลงานของรันเวย์กลับไม่เป็นไปตามเป้าหมาย นกแก้วปรากฏตัวอยู่แล้วเมื่อผู้หญิงคนนั้นมองลงมา ซึ่งไม่สอดคล้องกับข้อกำหนดของคำกระตุ้น

Veo 2 ของ Google ปฏิบัติตามคำแจ้งเตือนแต่ขาดการดำเนินการตามลำดับที่ชัดเจนซึ่ง Kling 2.0 มอบให้

การประเมินผลกระทบต่อสิ่งแวดล้อม: การจำลองน้ำท่วม

จากนั้นเราได้ทดสอบความสามารถในการแสดงเอฟเฟ็กต์สภาพแวดล้อมของ Kling 2.0 โดยเฉพาะสถานการณ์น้ำท่วมในเมือง

Kling 2.0 ทำงานได้อย่างน่าชื่นชม ถ่ายทอดภาพน้ำท่วมที่ท่วมถนนและผลักรถออกไปได้อย่างแม่นยำ

Runway ดิ้นรนกับความท้าทายนี้ โดยเลือกที่จะแสดงคลื่นทะเลขนาดใหญ่ที่ไม่ตรงกับข้อความแทน

Veo 2 สามารถแสดงภาพน้ำท่วมได้ แต่ขาดความคล่องตัว และไม่สามารถจับภาพสถานการณ์ที่บรรยายไว้ในข้อความได้อย่างครบถ้วน

การดำเนินการแบบไดนามิกและการทำความเข้าใจอย่างรวดเร็วในสถานการณ์ความเร็วสูง

เราพัฒนา Kling 2.0 ให้ก้าวไปอีกขั้นด้วยการทดสอบความสามารถในการจัดการฉากแอ็คชันความเร็วสูง ภารกิจนี้เกี่ยวข้องกับผู้หญิงคนหนึ่งที่กำลังขี่ม้าควบพร้อมกับกล้องที่หมุนวนรอบตัวเธอ

Kling 2.0 นำเสนอผลลัพธ์ที่เป็นแอนิเมชั่นและดึงดูดสายตา แม้ว่าจะประสบปัญหาเล็กน้อยในการรักษาความสอดคล้องของสีหน้าระหว่างการดำเนินเรื่องความเร็วสูง

ผลงานของรันเวย์ดูเหมือนเป็นฉากสโลว์โมชันมากกว่า ขาดความมีชีวิตชีวาความเร็วสูงที่เรามุ่งหวังไว้

น่าเสียดายที่ Veo 2 ไม่ได้ให้ผลลัพธ์ที่ใช้งานได้ในสถานการณ์นี้

การเรนเดอร์วัตถุลอยตัวและการเคลื่อนไหวของกล้องที่ซับซ้อน

ในการทดสอบนี้ เราท้าทาย Kling 2.0 ให้เรนเดอร์ฉากที่มีวัตถุลอยตัวและเคลื่อนไหวกล้องเอียงลง

Kling 2.0 โดดเด่นอีกครั้งด้วยการถ่ายทอดวัตถุลอยได้อย่างแม่นยำและเคลื่อนไหวกล้องตามที่กำหนด Runway และ Veo 2 ประสบปัญหาในงานนี้ เนื่องจากไม่สามารถแสดงวัตถุลอยและเคลื่อนไหวกล้องได้อย่างสมบูรณ์ตามที่อธิบายไว้ในคำแนะนำ

ความท้าทายขั้นสูงสุด: โมเดลวิดีโอ AI ปะทะฉากต่อสู้ของซามูไร

ความท้าทายสุดท้ายคือการเรนเดอร์ฉากต่อสู้ระหว่างซามูไรสองคน ซึ่งเป็นงานที่พิสูจน์ได้ยากสำหรับโมเดลวิดีโอ AI มาโดยตลอด

แม้ว่า Kling 2.0 จะได้รับการปรับปรุงให้ดีขึ้นกว่าเวอร์ชันก่อนๆ แต่ยังคงประสบปัญหาในการแสดงฉากต่อสู้ให้ดูเป็นธรรมชาติ ความสอดคล้องของดาบลดลง โดยเฉพาะเมื่อดาบโต้ตอบกัน และฉากโดยรวมก็ดูไม่สมจริงเท่าที่เราคาดหวัง

Runway Gen 4 และ Veo 2 เผชิญกับปัญหาที่คล้ายคลึงกันโดยมีปัญหาด้านความสอดคล้องและการเคลื่อนไหวที่ขาดธรรมชาติในฉากต่อสู้

ข้อดีและข้อจำกัดของ Kling 2.0

โดยรวมแล้ว เราคิดว่า Kling 2.0 มีข้อดีและข้อเสียดังต่อไปนี้

จุดแข็งของ Kling 2.0

การยึดมั่นในคำเตือน: Kling 2.0 แสดงให้เห็นการยึดมั่นอย่างโดดเด่นต่อคำเตือนที่ซับซ้อน โดยเฉพาะอย่างยิ่งคำเตือนที่เกี่ยวข้องกับการกระทำหลายอย่างและผลกระทบต่อสิ่งแวดล้อม
ความสมจริงในการโต้ตอบ: โมเดลนี้โดดเด่นในด้านการแสดงปฏิสัมพันธ์ที่ละเอียดอ่อนและการเคลื่อนไหวที่สมจริง ซึ่งช่วยยกระดับคุณภาพของภาพโดยรวมให้ดีขึ้น

ความท้าทายของ Kling 2.0

การรักษาความสอดคล้อง: Kling 2.0 ประสบปัญหาเรื่องความสอดคล้องระหว่างลำดับการกระทำความเร็วสูงและซับซ้อน ส่งผลให้เกิดความไม่สอดคล้องในเอาต์พุต
การเรนเดอร์ฉากที่ซับซ้อน: แม้ว่าจะมีการปรับปรุง แต่ Kling 2.0 ยังคงเผชิญกับความท้าทายในการเรนเดอร์ฉากการต่อสู้ที่สมจริงและการเคลื่อนไหวกล้องแบบไดนามิก

ราคาและการเข้าถึง

ผลกระทบด้านต้นทุน: ราคาของ Kling 2.0 โดยเฉพาะอย่างยิ่งสำหรับการสร้างวิดีโอสั้นๆ อาจเป็นปัญหาสำหรับผู้ใช้บางคน ซึ่งบ่งบอกถึงความจำเป็นในการมีตัวเลือกที่ราคาไม่แพง

ความคิดสุดท้าย: Kling 2.0 คุ้มค่าหรือไม่?

Kling 2.0 ถือเป็นก้าวสำคัญในการสร้างวิดีโอด้วย AI ที่มอบการปรับปรุงที่น่าประทับใจในการปฏิบัติตามคำแนะนำที่ซับซ้อน และการแสดงการโต้ตอบที่สมจริง

อย่างไรก็ตาม ยังคงเผชิญกับความท้าทายในการรักษาความสอดคล้องระหว่างฉากไดนามิก แม้จะมีการพัฒนา แต่คุณควรชั่งน้ำหนักข้อดีกับต้นทุนปัจจุบันและความต้องการเฉพาะของโปรเจ็กต์เมื่อพิจารณา Kling 2.0

หมายเหตุ: บทความนี้เขียนขึ้นโดยอ้างอิงจากเนื้อหาในวิดีโอต่อไปนี้: