首頁Kling AIKling 2.0現已發布:它是最好的 AI 視訊模型嗎?

Kling 2.0現已發布:它是最好的 AI 視訊模型嗎?

Kling AI剛剛向公眾發布了Kling 2.0 。

此次新版本進行了多項重大升級,在AI影片排行榜上佔據榜首。但它真的像聽起來那麼具有開創性嗎?

我們對Kling 2.0進行了測試,並將其與Runway Gen 4Google 的Veo 2等其他最先進的型號進行了比較。

我們稍後會分享結果,但首先,讓我們了解Kling 2.0 的特殊之處。

Kling 2.0有哪些新功能?

Kling 2.0引進了多項新功能和變更。

多模式視覺提示

Kling生態系最重要的新增功能之一是新的「多元素」功能。

它是一個多模式視覺提示系統,允許用戶在文字提示中引用圖像和影片。儘管該功能目前與Kling 2.0是分開的(預計很快就會整合),但它代表了控制和精度方面的重大進步。

該系統提供三個主要功能:

  1. 交換:取代現有影片中的主題(此功能在測試期間出現錯誤)
  2. 新增:將參考影像中的新元素插入影片中
  3. 刪除:動態刪除場景中不需要的對象

在我們的測試中,我們成功地使用“添加”功能將奔跑的女人(來自參考圖像)插入到熔岩進入古老歌劇院的場景中。

圖片1

類似地,「刪除」功能允許我們將鸚鵡從機器人的肩膀上移除,同時保持整個影片的視覺連貫性。

圖片2

值得注意的是, Kling AI在上傳參考資料時提供了有用的提示模板,無需記住複雜的提示結構——這是一項貼心的用戶體驗改進。

介面和工作流程變更

在此版本中, Kling AI還引入了幾項介面變更:

  • 取消了「標準」和「專業」模式之間的區別
  • 創意與提示遵循滑桿不再可用
  • Kling 2.0目前不支援框架模式
  • 原始元素功能(用於角色位置和物件參考)尚不相容Kling 2.0
圖片3

Kling 2.0與Kling 1.6:有哪些改進?

Kling 2.0在運動品質和物理模擬方面表現出色,但有時您可能更喜歡Kling 1.6 針對特定項目的場景連貫性。

運動流暢性和自然主義

Kling 2.0顯著提高了運動品質。動物的動作自然流暢,而不是像Kling 1.6 那樣急促、不切實際。

人類的表情更逼真,消除了「動嘴唇不說話」的問題。在整個過程中,臉部表情顯得自然且一致。

動態場景處理

飛行生物表現出適當的翅膀運動和自然的滑翔模式。 Kling 1.6 的剛性飛行路徑被逼真的空中動力學所取代。

環境物理學有了顯著的進步。水的效果、物體的相互作用和材料的特性表現得更真實。

一致性權衡

Kling 2.0可以產生更動態的場景,但有時會以犧牲連貫性為代價。在複雜的序列中,角色可能會意外出現或消失。

Kling 1.6 雖然視覺效果不那麼令人印象深刻,但在整個影片中保持了更好的場景一致性。

迅速理解

在Kling 2.0中,平移、傾斜和焦點轉移等相機指令的執行更加精確。

順序動作更容易被理解。諸如“枝形吊燈掉入熔岩並突然起火”之類的多部分提示遵循正確的邏輯順序。

技術限制

兩個版本在手部、文字渲染和複雜互動方面都存在困難,不過 2.0 在這些方面有所改進。

產生參數

Kling 2.0刪除了創造力/提示跟隨滑桿,並將標準/專業模式合併到統一的介面中。

這種簡化的方法可能對初學者有益,但限制了習慣於微調輸出的高級用戶的選擇。

測試Kling 2.0

我們想看看Kling 2.0與Runway Gen 4 和Google Veo 2 相比如何。

因此,我們使用相同的提示對所有三個 AI 視訊產生器進行了一系列測試。

快速遵循和運動渲染功能

我們的第一個測試重點關注Kling 2.0理解和執行涉及主體和相機運動的複雜提示的能力。這項任務很簡單,但也很有挑戰性:一個女人低頭看著自己的手,一隻鸚鵡落在了她的手上。

Kling 2.0出色地完成了對提示的遵循。整個動作展開自然,順序清晰。

另一方面,Runway 的產出卻稍微偏離了目標。當女人低頭的時候,鸚鵡已經在那裡了,這不符合提示的要求。

Google 的Veo 2 遵循了提示,但缺乏Kling 2.0所提供的清晰、連續的操作。

評估環境影響:洪水模擬

接下來,我們測試了Kling 2.0渲染環境效果的能力,特別是城市環境中的洪水場景。

Kling 2.0 的表現令人欽佩,準確地描繪了洪水淹沒街道並沖走汽車的場景。

《Runway努力應對這項挑戰,但最終選擇展示與提示不符的巨大海浪。

Veo 2 成功渲染了洪水,但缺乏活力,沒有完全捕捉提示中描述的場景。

高速場景下的動態行動與快速理解

我們透過測試其處理高速動作序列的能力,進一步推動了Kling 2.0 的發展。這項任務要求一名女子騎著馬飛奔,而攝影機則圍繞著她旋轉。

Kling 2.0提供了動態的、視覺上吸引人的輸出,儘管它在高速動作過程中在保持臉部連貫性方面略有困難。

Runway 的輸出看起來更像是慢動作場景,缺乏我們所追求的高速活力。

不幸的是, Veo 2 在這種情況下沒有提供可用的結果。

渲染懸浮物體和複雜的相機運動

在本次測試中,我們挑戰Kling 2.0渲染一個具有懸浮物體和相機向下傾斜運動的場景。

Kling 2.0再次表現出色,準確地描繪了漂浮物體並遵循指定的攝影機運動。 Runway和Veo 2 在完成這項任務時遇到了困難,未能完全呈現提示中描述的懸浮物體和攝影機運動。

終極挑戰:AI視訊模型 vs. 武士打鬥場景

最後的挑戰是渲染兩個武士之間的打鬥場景,這項任務對於 AI 視訊模型來說歷來被證明是困難的。

Kling 2.0雖然比以前的版本有所改進,但在渲染自然的戰鬥方面仍然存在困難。劍的連貫性下降了,尤其是當它們相互作用時,整體場景看起來並不像我們希望的那樣真實。

Runway Gen 4 和Veo 2 面臨類似的問題,連貫性問題以及打鬥場景缺乏自然動作。

Kling 2.0的優點和局限性

整體而言,我們認為Kling 2.0具有以下優點和缺點。

Kling 2.0 的優勢

  • 提示遵守: Kling 2.0對複雜提示表現出了出色的遵守能力,尤其是那些涉及多種動作和環境影響的提示。
  • 互動的真實感:此模型擅長渲染微妙的互動和逼真的動作,增強整體視覺品質。

Kling 2.0挑戰

  • 保持一致性: Kling 2.0在高速複雜的動作序列中難以保持一致性,導致輸出不一致。
  • 渲染複雜場景:儘管有所改進, Kling 2.0在渲染逼真的打鬥場景和動態攝影機運動方面仍然面臨挑戰。

定價和可訪問性

  • 成本影響: Kling 2.0的定價,尤其是對於短影片產生而言,可能會引起一些用戶的擔憂,這表明需要更多實惠的選擇。

最後的想法: Kling 2.0值得嗎?

Kling 2.0代表了 AI 視訊生成領域的重大進步,在遵循複雜提示和呈現逼真互動方面取得了令人矚目的進步。

然而,在動態場景中保持一致性仍然面臨挑戰。儘管它有進步,但在考慮Kling 2.0時,您應該權衡其優勢與當前成本以及專案的具體需求。

註:本文根據以下影片內容撰寫:

相關貼文

Kling 2.0席捲 AI 影片產業

了解Kling 2.0如何憑藉其令人印象深刻的特性和能力徹底改變 AI 影片產業。

Kling 2.0它仍然是最好的 AI 生成器還是已經被取代了?

Kling 2.0仍然是最好的 AI 視訊生成器,還是已經被取代了?探索我們對最新版本的深入評論,以發現其改進、優點和缺點。

Kling 2.0已到來:探索其功能

探索Kling 2.0在影片和影像生成方面的突破性 AI 進步。從流暢的動作到強大的編輯工具,了解為什麼它是改變遊戲規則的視訊模型。

Kling 2.0:與Kling 1.6 的比較

Kling最近推出了他們的Kling 2.0 AI 影片生成模型。這裡我們將向您展示Kling 2.0可以創建的內容以及 1.6 和 2.0 版本之間的差異。