Kling AI baru saja merilis Kling 2.0 ke publik.
Rilisan baru ini dikemas dengan berbagai peningkatan besar, dan menduduki posisi teratas dalam peringkat video AI. Namun, apakah benar-benar secanggih kedengarannya?
Kami telah menguji Kling 2.0 , membandingkannya dengan model canggih lainnya seperti Runway Gen 4 dan Google Veo 2 .
Kami akan membagikan hasilnya sebentar lagi, tetapi pertama-tama, mari kita pahami apa yang membuat Kling 2.0 istimewa.
Apa yang Baru di Kling 2.0 ?
Kling 2.0 telah memperkenalkan beberapa fitur dan perubahan baru.
Dorongan Visual Multi-Modal
Salah satu tambahan paling signifikan pada ekosistem Kling adalah fitur "Multi Elemen" yang baru.
Ini adalah sistem perintah visual multimoda yang memungkinkan pengguna untuk merujuk gambar dan video dalam perintah teks. Fitur ini merupakan kemajuan besar dalam hal kontrol dan ketepatan, meskipun saat ini terpisah dari Kling 2.0 (dengan integrasi yang diharapkan segera).
Sistem ini menawarkan tiga fungsi utama:
- Tukar: Ganti subjek dalam video yang ada (fitur mengalami kesalahan selama pengujian)
- Tambahkan: Masukkan elemen baru dari gambar referensi ke dalam video
- Hapus: Hapus objek yang tidak diinginkan dari pemandangan secara dinamis
Dalam pengujian kami, kami berhasil menggunakan fitur "tambah" untuk menyisipkan seorang wanita berlari (dari gambar referensi) ke dalam adegan lahar memasuki gedung opera tua.

Demikian pula, fungsi "hapus" memungkinkan kami melepaskan burung beo dari bahu robot sambil tetap menjaga koherensi visual di seluruh video.

Khususnya, Kling AI menyediakan templat perintah yang berguna saat mengunggah materi referensi, menghilangkan kebutuhan untuk menghafal struktur perintah yang rumit—peningkatan pengalaman pengguna yang bijaksana.
Perubahan Antarmuka dan Alur Kerja
Dalam versi ini, Kling AI juga memperkenalkan beberapa perubahan antarmuka:
- Perbedaan antara mode “standar” dan “profesional” telah dihapus
- Slider kreativitas versus mengikuti perintah tidak lagi tersedia
- Mode bingkai saat ini tidak didukung dengan Kling 2.0
- Fitur elemen asli (untuk lokasi karakter dan referensi objek) belum kompatibel dengan Kling 2.0

Kling 2.0 vs. Kling 1.6: Apa yang Meningkat?
Kling 2.0 unggul dalam kualitas gerak dan simulasi fisika, tetapi terkadang Anda mungkin lebih menyukai koherensi adegan Kling 1.6 untuk proyek tertentu.
Fluiditas Gerak dan Naturalisme
Kling 2.0 meningkatkan kualitas gerakan secara drastis. Hewan bergerak dengan fluiditas alami, bukan gerakan tersentak-sentak dan tidak realistis seperti yang terlihat pada Kling 1.6.
Ekspresi manusia lebih meyakinkan, menghilangkan masalah "menggerakkan bibir tanpa berbicara". Emosi wajah tampak alami dan konsisten di seluruh rangkaian.
Penanganan Adegan Dinamis
Makhluk terbang menunjukkan gerakan sayap yang tepat dan pola meluncur alami. Lintasan terbang kaku Kling 1.6 digantikan dengan dinamika udara yang realistis.
Fisika lingkungan telah meningkat secara signifikan. Efek air, interaksi objek, dan sifat material berperilaku lebih realistis.
Kompromi Koherensi
Kling 2.0 menghasilkan adegan yang lebih dinamis, tetapi terkadang mengorbankan koherensi. Karakter dapat muncul atau menghilang secara tiba-tiba dalam rangkaian yang rumit.
Kling 1.6, meski kurang mengesankan secara visual, mempertahankan konsistensi pemandangan yang lebih baik di seluruh video.
Pemahaman Cepat
Instruksi kamera seperti menggeser, memiringkan, dan menggeser fokus dijalankan dengan presisi lebih tinggi di Kling 2.0.
Tindakan berurutan lebih mudah dipahami. Perintah yang terdiri dari beberapa bagian seperti "lampu gantung jatuh ke dalam lava dan terbakar" mengikuti urutan logika yang tepat.
Keterbatasan Teknis
Kedua versi tersebut mengalami kendala dalam penggunaan tangan, penyajian teks, dan interaksi yang kompleks, meskipun versi 2.0 menunjukkan perbaikan sederhana dalam beberapa area tersebut.
Parameter Generasi
Kling 2.0 menghapus slider kreativitas/pengikut perintah dan menggabungkan mode standar/profesional ke dalam antarmuka terpadu.
Pendekatan yang efisien ini mungkin bermanfaat bagi pemula tetapi membatasi pilihan bagi pengguna tingkat lanjut yang terbiasa menyempurnakan hasil kerja mereka.
Menguji Kling 2.0
Kami ingin melihat bagaimana Kling 2.0 bersaing dengan Runway Gen 4 dan Google Veo 2.
Jadi kami melakukan serangkaian pengujian pada ketiga generator video AI menggunakan perintah yang sama.
Kemampuan Kepatuhan Cepat dan Perenderan Gerakan
Uji coba pertama kami difokuskan pada kemampuan Kling 2.0 untuk memahami dan menjalankan perintah kompleks yang melibatkan subjek dan gerakan kamera. Tugasnya sederhana namun menantang: seorang wanita melihat ke bawah ke tangannya, dan seekor burung beo hinggap di tangannya.
Kling 2.0 berhasil mengikuti perintah dengan sangat baik. Aksinya berlangsung secara alami, dengan rangkaian kejadian yang jelas.
Di sisi lain, hasil Runway sedikit meleset dari sasaran. Burung beo sudah ada saat wanita itu melihat ke bawah, yang tidak sesuai dengan persyaratan perintah.
Google Veo 2 mengikuti perintah tersebut tetapi tidak memiliki tindakan yang jelas dan berurutan seperti yang diberikan Kling 2.0 .
Mengevaluasi Dampak Lingkungan: Simulasi Banjir
Berikutnya, kami menguji kemampuan Kling 2.0 untuk menampilkan efek lingkungan, khususnya skenario banjir di perkotaan.
Kling 2.0 tampil mengagumkan, secara akurat menggambarkan banjir yang memenuhi jalan dan mendorong mobil menjauh.
Runway kesulitan dengan tantangan ini, dan memilih untuk menunjukkan gelombang laut besar yang tidak sesuai dengan perintah.
Veo 2 berhasil menggambarkan banjir namun kurang dinamis dan tidak sepenuhnya menangkap skenario yang dijelaskan dalam perintah.
Aksi Dinamis dan Pemahaman Cepat dalam Skenario Kecepatan Tinggi
Kami mengembangkan Kling 2.0 lebih jauh dengan menguji kemampuannya untuk menangani rangkaian aksi berkecepatan tinggi. Tugasnya melibatkan seorang wanita yang berlari kencang di atas kuda dengan kamera yang berputar di sekelilingnya.
Kling 2.0 menghasilkan output yang dinamis dan menarik secara visual, meskipun sedikit kesulitan dalam mempertahankan koherensi wajah selama aksi kecepatan tinggi.
Hasil Runway tampak lebih seperti adegan gerak lambat, tanpa dinamisme kecepatan tinggi yang kami tuju.
Veo 2, sayangnya, tidak memberikan hasil yang dapat digunakan dalam skenario ini.
Merender Objek Melayang dan Gerakan Kamera yang Kompleks
Dalam pengujian ini, kami menantang Kling 2.0 untuk membuat adegan dengan objek melayang dan gerakan kamera miring ke bawah.
Kling 2.0 sekali lagi tampil unggul, dengan akurat menggambarkan objek yang melayang dan mengikuti gerakan kamera yang ditentukan. Runway dan Veo 2 kesulitan dengan tugas ini, gagal untuk sepenuhnya menampilkan objek yang melayang dan gerakan kamera seperti yang dijelaskan dalam perintah.
Tantangan Terbesar: Model Video AI vs. Adegan Pertarungan Samurai
Tantangan terakhir adalah membuat adegan pertarungan antara dua samurai, tugas yang secara historis terbukti sulit bagi model video AI.
Kling 2.0, meskipun lebih baik dari versi sebelumnya, masih kesulitan dalam menampilkan pertarungan yang tampak alami. Koherensi pedang berkurang, terutama saat berinteraksi, dan keseluruhan adegan tidak tampak serealistis yang kami harapkan.
Runway Gen 4 dan Veo 2 menghadapi masalah serupa, dengan masalah koherensi dan kurangnya gerakan alami dalam adegan pertarungan.
Manfaat dan Keterbatasan Kling 2.0
Secara keseluruhan, kami pikir Kling 2.0 memiliki kelebihan dan kekurangan sebagai berikut.
Kekuatan Kling 2.0
- Kepatuhan Cepat: Kling 2.0 menunjukkan kepatuhan yang luar biasa terhadap perintah yang rumit, terutama yang melibatkan banyak tindakan dan efek lingkungan.
- Realisme dalam Interaksi: Model ini unggul dalam menampilkan interaksi halus dan gerakan realistis, meningkatkan kualitas visual secara keseluruhan.
Tantangan Kling 2.0
- Mempertahankan Koherensi: Kling 2.0 berjuang dengan koherensi selama rangkaian tindakan berkecepatan tinggi dan kompleks, yang menyebabkan ketidakkonsistenan dalam keluaran.
- Merender Adegan Kompleks: Meskipun ada peningkatan, Kling 2.0 masih menghadapi tantangan dalam merender adegan pertarungan realistis dan gerakan kamera dinamis.
Harga dan Aksesibilitas
- Implikasi Biaya: Harga Kling 2.0, khususnya untuk pembuatan video pendek, mungkin menjadi perhatian bagi beberapa pengguna, yang menunjukkan perlunya opsi yang lebih terjangkau.
Pemikiran Akhir: Apakah Kling 2.0 Layak?
Kling 2.0 merupakan langkah maju yang signifikan dalam pembuatan video AI, yang menawarkan peningkatan yang mengesankan dalam hal kepatuhan terhadap perintah yang rumit dan menghadirkan interaksi yang realistis.
Namun, masih menghadapi tantangan dalam menjaga koherensi selama adegan dinamis. Meskipun ada kemajuan, Anda harus mempertimbangkan manfaatnya terhadap biaya saat ini dan kebutuhan spesifik proyek Anda saat mempertimbangkan Kling 2.0.
Catatan: Artikel ini ditulis berdasarkan konten video berikut: