Kling AI はKling 2.0 を一般公開しました。
この新リリースには大幅なアップグレードが満載で、AI動画ランキングでトップの座を獲得しました。しかし、本当にその名の通り画期的なのでしょうか?
私たちはKling 2.0 をテストし、 Runway Gen 4やGoogle のVeo 2などの他の最先端モデルと比較しました。
結果はすぐにお知らせしますが、まずはKling 2.0 が特別な理由を理解しましょう。
Kling 2.0の新機能は何ですか?
Kling 2.0では、いくつかの新機能と変更が導入されました。
マルチモーダル視覚プロンプト
Klingエコシステムへの最も重要な追加機能の 1 つは、新しい「マルチ要素」機能です。
これは、テキストプロンプト内で画像や動画を参照できるマルチモーダルな視覚プロンプトシステムです。この機能は、制御性と精度の大幅な向上を表していますが、現在はKling 2.0とは別個の機能です(近日中に統合される予定です)。
このシステムには 3 つの主な機能があります。
- スワップ: 既存の動画の被写体を置き換える (テスト中にエラーが発生していた機能)
- 追加: 参照画像から新しい要素をビデオに挿入します
- 削除: シーンから不要なオブジェクトを動的に削除します
私たちのテストでは、「追加」機能を使用して、古いオペラハウスに溶岩が流れ込むシーンに、走っている女性(参照画像から)を挿入することに成功しました。

同様に、「削除」機能を使用すると、ビデオ全体の視覚的な一貫性を維持しながら、ロボットの肩からオウムを削除することができました。

特に、 Kling AI は参考資料をアップロードするときに便利なプロンプト テンプレートを提供するため、複雑なプロンプト構造を記憶する必要がなくなり、ユーザー エクスペリエンスが配慮されて向上します。
インターフェースとワークフローの変更
このバージョンでは、 Kling AI はインターフェースの変更もいくつか導入しました。
- 「標準」モードと「プロフェッショナル」モードの区別がなくなりました
- 創造性とプロンプトに従うことのスライダーは利用できなくなりました
- フレームモードは現在Kling 2.0ではサポートされていません
- オリジナルの要素機能(文字の位置とオブジェクトの参照用)はまだKling 2.0と互換性がありません

Kling 2.0とKling 1.6: 何が改善されたのでしょうか?
Kling 2.0 はモーション品質と物理シミュレーションに優れていますが、特定のプロジェクトではKling 1.6 のシーンの一貫性が好まれる場合もあります。
動きの滑らかさと自然さ
Kling 2.0はモーションクオリティを劇的に向上させました。Kling 1.6で見られたぎこちなく非現実的な動きではなく、動物が自然で滑らかに動きます。
人間の表情がよりリアルになり、「言葉を発していないのに唇が動く」という問題が解消されました。顔の表情は自然で、シーケンス全体を通して一貫性があります。
ダイナミックシーンハンドリング
飛行生物は、翼の動きと自然な滑空パターンを正確に再現します。Kling 1.6の固定された飛行経路は、リアルな空中ダイナミクスに置き換えられました。
環境物理が大幅に改善されました。水の効果、オブジェクトの相互作用、材質特性がよりリアルに再現されます。
一貫性のトレードオフ
Kling 2.0はよりダイナミックなシーンを生み出しますが、一貫性が損なわれることがあります。複雑なシーンでは、登場人物が予期せず現れたり消えたりすることがあります。
Kling 1.6 は、視覚的にはそれほど印象的ではありませんが、ビデオ全体を通じてシーンの一貫性がより良好に保たれています。
迅速な理解
パン、チルト、フォーカスシフトなどのカメラ指示は、Kling 2.0でより正確に実行されます。
連続したアクションの方が理解しやすいです。「シャンデリアが溶岩に落ちて炎上する」のような複数の部分から成るプロンプトは、適切な論理的順序に従っています。
技術的な制限
どちらのバージョンも、手、テキストのレンダリング、複雑なインタラクションに苦労していますが、2.0 ではこれらの領域で若干の改善が見られます。
生成パラメータ
Kling 2.0、創造性/プロンプト追従スライダーが削除され、標準/プロフェッショナル モードが統合されたインターフェイスに統合されています。
この合理化されたアプローチは初心者には役立つかもしれませんが、出力を微調整することに慣れている上級ユーザーにとっては選択肢が制限されます。
Kling 2.0 のテスト
Kling 2.0 がRunway Gen 4 やGoogle Veo 2 と比べてどうなのかを見てみたかったのです。
そこで、同じプロンプトを使用して、3 つの AI ビデオ ジェネレーターすべてに対して一連のテストを行いました。
迅速な遵守とモーションレンダリング機能
最初のテストでは、被写体とカメラの動きの両方を含む複雑な指示をKling 2.0が理解し、実行する能力に焦点を当てました。タスクはシンプルでありながら難しいものでした。女性が自分の手を見下ろし、オウムがその手に止まるというものです。
Kling 2.0は、指示を忠実に守り、見事な出来栄えを見せました。アクションは自然な流れで展開され、明確な一連の出来事が描かれています。
一方、Runwayの出力は少し的を外していました。女性が下を向いた時に既にオウムがそこにいたため、プロンプトの要件に一致しませんでした。
Google のVeo 2 はプロンプトに従いましたが、 Kling 2.0が実現した明確で連続的なアクションが欠けていました。
環境影響評価:洪水シミュレーション
次に、 Kling 2.0の環境効果、具体的には都市環境での洪水シナリオをレンダリングする能力をテストしました。
Kling 2.0 は見事なパフォーマンスを発揮し、洪水で道路が満たされ車が押し流される様子を正確に描写しました。
Runwayはこの課題に苦戦し、代わりにプロンプトに合わない巨大な海の波を示すことを選択しました。
Veo 2 は洪水をレンダリングできましたが、ダイナミズムが欠けており、プロンプトで説明されたシナリオを完全には再現できませんでした。
高速シナリオにおけるダイナミックな行動と迅速な理解
Kling 2.0の高速アクションシーンへの対応能力をテストすることで、Kling 2.0の性能をさらに向上させました。このテストでは、女性が馬に乗って疾走し、カメラがその周囲を旋回するシーンを撮影しました。
Kling 2.0 は、高速アクション中に顔の一貫性を維持するのに少し苦労しましたが、ダイナミックで視覚的に魅力的な出力を実現しました。
Runway の出力はスローモーション シーンのように見え、私たちが目指していた高速のダイナミズムが欠けていました。
残念ながら、 Veo 2 はこのシナリオでは使える結果をもたらしませんでした。
浮遊する物体と複雑なカメラモーションのレンダリング
このテストでは、 Kling 2.0に、浮遊するオブジェクトとカメラを下向きに傾ける動作を含むシーンのレンダリングを課しました。
Kling 2.0は今回も優れた結果を残し、浮遊する物体を正確に描写し、指定されたカメラの動きに追従しました。RunwayとVeo 2はこの課題に苦戦し、プロンプトで指示されたとおりに浮遊する物体とカメラの動きを完全にレンダリングすることができませんでした。
究極の挑戦:AIビデオモデル vs. サムライの戦闘シーン
最後の課題は、2 人の侍の戦闘シーンをレンダリングすることでした。これは、歴史的に AI ビデオ モデルにとって難しいことが証明されているタスクです。
Kling 2.0は以前のバージョンよりは改善されたものの、自然な戦闘シーンのレンダリングには依然として課題がありました。特に剣同士が絡み合う場面では、剣の一貫性が失われ、シーン全体が期待したほどリアルに見えませんでした。
Runway Gen 4 とVeo 2 は、一貫性の問題や戦闘シーンでの自然な動きの欠如など、同様の問題に直面していました。
Kling 2.0の利点と制限
全体的に、 Kling 2.0 には次のような長所と短所があると考えられます。
Kling 2.0の強み
- プロンプトの遵守: Kling 2.0 は、特に複数のアクションや環境効果を伴う複雑なプロンプトに対して優れた遵守を示します。
- インタラクションのリアリズム: このモデルは微妙なインタラクションとリアルな動きのレンダリングに優れており、全体的な視覚品質を向上させます。
Kling 2.0の課題
- 一貫性の維持: Kling 2.0 は、高速かつ複雑なアクション シーケンス中に一貫性を保つのに苦労し、出力に不一致が生じます。
- 複雑なシーンのレンダリング: 改善は見られましたが、 Kling 2.0では、リアルな戦闘シーンやダイナミックなカメラ モーションのレンダリングにおいて依然として課題が残っています。
価格とアクセシビリティ
- コストの影響: Kling 2.0の価格設定は、特に短いビデオ生成の場合、一部のユーザーにとって懸念事項となる可能性があり、より手頃なオプションが必要であることを示しています。
最終的な考察: Kling 2.0 は価値があるのか?
Kling 2.0 はAI ビデオ生成における大きな前進であり、複雑なプロンプトへの準拠とリアルなインタラクションのレンダリングにおいて目覚ましい改善をもたらします。
しかし、動的なシーンにおける一貫性の維持には依然として課題があります。Kling Kling 2.0 は進化を遂げていますが、導入を検討する際には、現在のコストとプロジェクトの具体的なニーズを比較検討する必要があります。
注: この記事は次のビデオの内容に基づいて書かれました。