Kling AI yeni Kling 2.0 modelini yayınladı ve bununla birlikte görüntüden videoya ve metinden videoya iyileştirmeler geliyor. Özellikle Kling 2.0 , daha çarpıcı videolara yol açabilen dinamik, aksiyon dolu istemler ve görüntülerle daha iyi sonuçlar sunuyor. Kling 2.0 yenilikleri ve token'larınızdan en iyi şekilde nasıl yararlanabileceğinizi inceleyelim.
Kling 2.0 Başlarken
Öncelikle yeni Kling 2.0 modeliyle neler yapabileceğinizden bahsedelim.

Şu anda KlingAI, Kling 2.0 ile hem metinden videoya hem de resimden videoya seçeneklerini destekliyor. Elbette, oluşturulan resimler de dahil olmak üzere istediğiniz herhangi bir resmi kullanabilirsiniz; örneklerimde Flux ile yapılmış resimler kullanıyorum. Ayrıca, bir video klipten bölümleri değiştirmenize, eklemenize veya silmenize olanak tanıyan bir "Çoklu Öğeler" seçeneği de göreceksiniz.

Tek yapmanız gereken videonun belirli yerlerinde duraklatmak, düzenlemek istediğiniz bölümleri eklemek (bu durumda yer değiştiriyorum), gerisini Kling AI sizin için halledecektir.

Sonuçları iyileştirmek için seçiminizin farklı bölgelerine noktalar eklemek isteyeceksiniz. Genellikle, ne kadar çok nokta eklerseniz, AI hareketleri izleme ve maskeleme konusunda o kadar iyi olur. Bu seçime oldukça fazla nokta ekledim çünkü insan hareketi birçok hareketli parçaya sahip karmaşık bir yapıdır.
Ama henüz işiniz bitmedi. Özellikle karmaşık hareketler (danslar gibi) içeren videolara başvururken, seçimleri yalnızca bir kareye ekleyerek en iyi sonuçları elde edemezsiniz.

Ancak videonuzda çok fazla aksiyon yoksa şanslısınız. İyi bir sonuç elde etmek için bu kadar çok maske eklemenize gerek kalmayacak. Bu örnekte, video zaman çizelgesinde yalnızca iki maskem var, ancak hareketler nispeten basit olduğu ve kamera çok fazla hareket etmediği için yine de oldukça tutarlı bir sonuç elde etmeyi başardım.

Kling 2.0 ve WAN 2.1 karşılaştırması
Daha önce Kling 2.0 açık kaynaklı bir model olan WAN 2.1 VACE'ye çok benzeyen videolar oluşturmanıza olanak tanıdığını belirtmiştim. Bilgisayarınızda yerel olarak çalışan ücretsiz bir AI modelinin olması güzel olsa da, çoğu kullanıcı donanımla sınırlıdır. Ve H100 gibi AI modelleri için tasarlanmış en üst düzey bir GPU'nuz yoksa, muhtemelen mümkün olan en iyi sonuçları elde edemezsiniz. 4090 ve 5090 gibi amiral gemisi tüketici GPU'ları bile Kling 2.0 gibi birinci sınıf modeller aracılığıyla oluşturulan videoların kalitesine ulaşmakta zorlanacaktır.
WAN 2.1 VACE ve Kling 2.0 ne kadar farklı performans gösterdiğini göstermek için aynı görselleri ve aynı istemleri kullandım ve bunları görüntüden videoya geçirdim. Sonuçlar çok, çok belirgindi.

Her iki modelde de perilerin doğum günü pastası yaptığı bu görseli kullandım. WAN 2.1 ile video oldukça bayattı. Periler çoğunlukla hareketsiz duruyordu ve videodaki tek gerçek hareket pastanın üzerinde yüzen sihirli baloncuklardan geliyordu. Tam olarak dinamik bir sahne değildi.
Öte yandan, Kling 2.0 videosu çok daha aksiyon doluydu. Ortadaki küçük peri pastanın etrafında koşuyordu, sihirli efektler asalarından uçuyordu ve pastanın kendisi çok daha büyük bir boyuta ulaşıyordu. WAN 2.1'in sonucundan çok daha iyi görünüyor. Aslında, Kling 2.0 hızlı sahneleri işleme yeteneği önceki sürümü Kling 1.6'yı geride bırakıyor.
Kling 2.0 ve Kling 1.6 karşılaştırması
Bu sonraki örnekte, Kling 2.0 iki kadın karakter arasında bir dövüş sahnesi oluşturmasını sağladım. Ortaya çıkan videoda karmaşık dövüş sanatları hareketleri ve dövüşürken ikisini çevreleyen hızlı hareket eden bir kamera vardı. Ayrıca sahneye ekstra bir hava katan birçok parçacık efekti de vardı.
Öte yandan, Kling 1.6, Kling 2.0 temposuna ayak uydurmakta zorlandı. Aynı karakterler ve komutlarla bile, Kling 1.6'nın videosu çok daha yavaştı ve neredeyse hiç kamera hareketi yoktu. Aksiyon sahneleri ve komutlar kullanarak Kling 1.6 ile karşılaştırdığınızda Kling 2.0 gelişmeleri gerçekten görebilirsiniz.
Kling 2.0 Tuhaflıkları
Kling 2.0 da kendine has tuhaflıkları var. İstemimle biraz fazla spesifik olmaya çalıştığımda, model bunu pek iyi idare edemiyor. Jet-ski'deki bir kadının bu videosu, kadının başının geriye dönük olması nedeniyle tuhaf görünüyor.
Doğal görünümlü sonuçlar elde etmek istiyorsanız, istemlerinizi basit tutmanız gerekir. Basitleştirilmiş bir istem kullanarak burada çok daha hoş görünümlü bir sonuç elde ettim. Ayrıca Kling 2.0 gerçekçi dalgalar ve sıçramalarla suyu oldukça iyi idare ettiğini belirtmek için iyi bir zaman olurdu.
İstemlerinizi basit tuttuğunuz sürece, videolarınızdaki karakterlerin ilgi çekici şeyler yapmasını, örneğin odaklarını kameradan uzaklaştırmalarını sağlayabilirsiniz.
Bu videonun ilk karesinde kadın kameraya bakıyor, ancak devam ederken başını yola doğru çevirerek uzaklaşıyor. Bu, WAN 2.1'in aynı istemin versiyonundan çok daha gerçekçi görünüyor; açık kaynaklı model yansımaları ve ışıkları iyi idare edebilse de, motosikleti süren kadından çok fazla hareket yok.