Kling AI telah menorehkan namanya sebagai salah satu generator video AI terkuat di pasaran, secara konsisten mengesankan para kreator dengan kemampuannya menghasilkan rekaman berkualitas tinggi dari perintah teks sederhana.
Kini, mereka mencoba sesuatu yang baru dengan peluncuran model gambar Kling O1, model generasi gambar khusus pertama mereka. Pertanyaan besarnya adalah: bisakah Kling menghasilkan gambar sebaik video?
Saya telah menghabiskan waktu menguji model gambar Kling O1 secara ekstensif, dan saya di sini untuk membagikan temuan saya. Mari kita lihat apa yang ditawarkan model baru ini.
Apa yang Membuat Kling O1 Menonjol?
Sebelum masuk ke pengujian terperinci saya, izinkan saya memberikan pratinjau singkat tentang fitur-fitur Kling O1 yang menurut saya paling mengesankan:
Fusi Multi-Gambar Luar Biasa yang Mempertahankan Detail Asli
Salah satu kekuatan terbesar model gambar Kling O1 adalah kemampuannya menggabungkan beberapa gambar referensi sambil mempertahankan fitur asli dari setiap sumber yang terjaga dengan luar biasa.
Tidak seperti banyak model lain yang mengaburkan detail saat mencampur beberapa gambar, Kling O1 mempertahankan karakteristik khas dari setiap elemen dengan akurasi yang mengesankan.
Pemahaman Perintah Cerdas & Pengeditan Tepat
Baik saat menyesuaikan area tertentu dari sebuah gambar atau memodifikasi elemen tertentu, model secara akurat memahami instruksi pengeditan.
Dibangun di atas konsep kuat Bahasa Visual Multimodal, ini membuat pengeditan gambar terasa senatural bercakap-cakap dengan seorang desainer.
Proses Pengujian Saya: Mendorong Batas Model Gambar Kling O1
Untuk mengevaluasi kemampuan Kling O1 dengan baik, saya fokus pada dua skenario pengujian utama yang akan mengungkap kekuatan dan potensi kelemahannya:
Tes 1: Fusi Referensi Multi-Gambar
Tes pertama bertujuan untuk menilai seberapa baik Kling O1 dapat menangani beberapa gambar referensi secara bersamaan dan membuat komposisi yang kohesif yang mempertahankan karakteristik dari setiap sumber.
Saya menggunakan empat gambar:
![]() |
![]() |
![]() |
![]() |
Kemudian saya memberikan perintah berikut:
Buatlah gambar yang menampilkan gadis dari Gambar 1 memegang anjing dari Gambar 2, dengan latar belakang Gambar 3, dan menerapkan corak warna serta gaya Gambar 4 ke seluruh foto.
Dan inilah hasil yang saya dapatkan:

Dari hasil yang dihasilkan, terlihat jelas bahwa Kling O1 mengikuti instruksi dengan sempurna, bahkan saat memproses konten dari empat gambar secara bersamaan. Tidak ada kekacauan atau penyimpangan dari perintah, dan kemampuan pemrosesan multi-gambar yang kuat benar-benar mengejutkan saya.
Namun, saya percaya realisme foto ini dapat ditingkatkan lebih lanjut. Meskipun subjek dan latar belakang memiliki corak warna yang sama, masih terasa agak sumbang dan tidak alami.
Selain menggabungkan pemandangan dan subjek, saya juga menguji penerapan gaya dan material.
Saya menggunakan kedua gambar ini:
![]() |
![]() |
Dan mengatur perintahnya sebagai:
Ubah subjek Gambar 1 menjadi orang fotorealistik, gunakan tekstur dan material dari Gambar 2 untuk syal.
Gambar akhir yang diberikan Kling O1:

Hasil akhir menunjukkan bahwa Kling O1 berkinerja cukup baik dalam hal transformasi gaya dan penggantian material.
Namun, ada beberapa masalah kecil: ada tambahan bagian syal yang muncul di dada subjek dan hilangnya dasi kupu-kupu. Inkonsistensi logis semacam ini dalam gambar merusak realisme keseluruhannya.
Tes 2: Pengeditan Presisi Iteratif
Tes kedua berfokus pada evaluasi kapasitas Kling O1 untuk modifikasi presisi, inkremental berdasarkan satu gambar referensi.
Ini akan mengungkapkan apakah model dapat menangani alur kerja pengeditan yang kompleks tanpa menurunkan kualitas atau kehilangan konteks.
Dalam tabel yang saya susun di bawah ini, Anda dapat melihat perbandingan langsung kinerja Kling O1 pada tes ini:
| Gambar Ref | Perintah & Hasil 1 | Perintah & Hasil 2 |
![]() |
![]() Ubah waktu menjadi malam hari, dengan pencahayaan interior hangat dari lampu di atas. Pertahankan semua yang lain. |
![]() Ganti cangkir kopi dengan buku. Wanita itu sekarang harus membaca alih-alih melihat ke luar jendela. Pertahankan fitur wajah, pakaian, dan latar belakang yang sama. |
| Perintah & Hasil 3 | Perintah & Hasil 4 | Perintah & Hasil 5 |
![]() Tambahkan hujan ringan yang terlihat melalui jendela. Sesuaikan pantulan jendela untuk menunjukkan tetesan hujan. Jangan ubah adegan interior atau karakter. |
![]() Ubah pakaian kasualnya menjadi pakaian bisnis profesional—blazer dan blus formal. Pertahankan pose, fitur wajah, dan seluruh latar belakang adegan. |
![]() Tambahkan orang lain di latar belakang—seorang barista yang bekerja di belakang konter. Pertahankan pencahayaan, waktu, dan semua elemen yang ada lainnya. |
Hasilnya sungguh mengesankan. Kling O1 menunjukkan pemahaman yang luar biasa tentang apa yang harus diubah dan apa yang harus tetap konstan.
Setiap iterasi mempertahankan konsistensi yang luar biasa dengan versi sebelumnya sambil secara akurat menerapkan modifikasi yang diminta.
Pikiran Akhir: Apakah Kling O1 Layak Dicoba?
Setelah pengujian ekstensif, model gambar Kling O1 jelas merupakan pendatang kuat di ruang generasi gambar AI.
Pendekatan multi-modal bekerja dengan baik—menggabungkan perintah bahasa alami dengan gambar referensi menciptakan alur kerja yang mulus yang terasa kolaboratif daripada membuat frustrasi.
Retensi fitur benar-benar yang terbaik di kelasnya, mempertahankan karakteristik khas dari setiap sumber saat menggabungkan beberapa referensi. Pengeditan langkah demi langkah juga sangat efisien, memungkinkan Anda melakukan perubahan yang tepat tanpa kehilangan konteks.
Bagi kreator dan desainer yang menginginkan kontrol dan konsistensi yang sangat baik, model gambar Kling O1 pasti layak dicoba. Ini berhasil membawa keahlian video Kling ke gambar diam sambil menghilangkan perpindahan alat yang mengganggu yang menghantui banyak proses kreatif AI.
Apakah sempurna? Tidak. Tapi ini adalah debut yang kuat yang menunjukkan Kling AI serius tentang generasi gambar.
Siap mengujinya sendiri? Kunjungi Pollo AI untuk mencoba model gambar Kling O1, atau jelajahi model-model premier lainnya yang tersedia di generator gambar Pollo AI untuk menemukan yang paling sesuai dengan kebutuhan Anda. Ini adalah investasi waktu yang sangat berharga bagi setiap kreator.











