Kling 2.0已經發布,這意味著目前評價最高的 AI 視訊產生器變得更加強大。今天我們將深入研究它到底有多少改進、缺少什麼以及您對這個新的、更高級的版本有何期待。
Kling正以其全新的 2.0 時代保持熱度。我們可以看到1.6 模型在最佳圖像轉視頻模型排行榜上名列前茅,而 1.5 文本轉視頻模型位居第二,僅次於Google 的Veo 2 。那麼,讓我們看看 Kling 2.0 版本的表現如何。
初探Kling 2.0 - 保真度與連貫性提升
就整體保真度和即時連貫性而言,我必須承認新的Kling 2.0型號取得了飛躍,特別是在圖像到視訊方面。無論您輸入的圖像是什麼,事物都保持一致,具有堅實的整體角色表演。
評估Kling 2.0的文字轉影片功能
讓我們從這個文本到視頻的示例開始,首先是受《權力的遊戲》啟發的冰原狼提示,該提示很大程度上受到了現實生活中的新聞故事的啟發,故事中的巨型生物科學公司將三隻瀕臨滅絕的冰原狼帶了回來。
視訊提示看起來非常穩定,特別是對於文字到視訊而言。雖然與黑巫師瓊恩·雪諾相比,冰原狼的視角和體型存在一些問題,但這也符合最初的提示。考慮到這一點,這確實是一個非常令人印象深刻的文本到視頻輸出。
評估Kling 2.0的影像轉視訊功能
範例 1
看我們的第一個例子,我們有 10 秒的穩定步行。令我印象深刻的是,儘管有一點點不連貫,但鏡頭的焦點是腳步的行走,並顯示出非常紮實的行走週期。步履蹣跚,腳步聲很小,雙腳似乎對泥坑之類的東西做出了反應。
偶爾你可能會遇到向後飛行的太空船,但我從未遇到過向後行走的人。但是,如果您遇到這種情況,快速解決方法就是反向執行它。
範例 2
無縫生成的另一個例子是這張受 60 年代 Vogue 風格啟發的照片。雖然模特兒是焦點,但她太酷了,不敢看鏡頭,而是被動地坐著。但場景中的其他角色吸引了我的注意。場景中行走的男人實際上並不是場景的一部分,但從上下文來看,他們看起來就像屬於那裡。
Kling 2.0的升級功能
連貫快速運動
Kling 2.0的一大優勢在於其在連貫、快速運動方面表現出色。
如果我們透過文字到影片來觀看功夫打鬥。它真的很完美嗎?不,但它相當令人印象深刻,特別是考慮到旋轉相機,它抵消了一些退相干。
事實上,兩個人都停留在地面上,沒有一個飛走,背景也沒有變成爆炸,這表明輸出令人印象深刻。
同一提示的另一個輸出在角色的動作方面稍微尷尬,但總體而言,並沒有太多的脫節,角色相互融合或出現了我們經常期待的其他一些方面。如果您使用一些精明的編輯技巧,您可能會獲得 10 秒剪輯的完整部分。
產生規格和相機控制
使用Kling 2.0,我們可以以 5 秒或 10 秒的間隔生成,並使用 16:9、9:16 和 1:1 的寬高比。此外,如果您選擇 Premier Plan,則可以一次產生多個輸出。目前,視訊輸出為 720p,儘管我聽說 1080p 即將推出。
鏡頭和相機運動標註
目前,提示中沒有相機控制選項,但我必須說模型反應非常靈敏,不僅可以對相機移動標註進行響應,甚至可以對鏡頭選擇進行響應。例如,這裡我們要求使用 85 毫米鏡頭,具有淺景深和軌道運動。
值得注意的是,我可以看到桌子有點歪,桿子沒有完全連接到應在的位置,但有趣的是,它始終保持歪斜。總體而言,提示遵循了有關相機移動和鏡頭類型的說明。
然後,將 85 毫米鏡頭換成 20 毫米鏡頭,我們用相同的動作拍攝出更寬的鏡頭,並且非常注重廣角鏡頭的細節。雖然不可避免地會有人指出它不完全是 20 毫米或 85 毫米鏡頭,但這裡的重點是您可以大致了解您想要的效果。
新工具發布—多元素功能
我不想忽視的一個方面是即將推出的新多元素功能。我沒有太多時間去玩它,但我認為讓你了解它的功能很重要,因為它有可能成為一個非常強大的工具。
打開影片後,您可以點擊「新增選擇」選項,它會立即掩蓋您的角色。

當您滿意時,您可以“確認”,然後上傳另一個角色的圖像。

提示會顯示「將(圖片縮圖)中的 X 替換為(影片縮圖)中的 X」。您需要填寫“X”值,在本例中為“女孩”和“女孩”,然後點擊“產生”。

該工具將一個字符替換為另一個字符,雖然此示例中的輸入並不完美,但它很好地表明了多元素功能的作用。

透過一些實驗和可能更多色調一致的選項,您最終可能會得到一些令人驚嘆的結果,特別是在Kling 2.0模型問世之後。
最終判決: Kling AI仍然是王者嗎?
在文字到影片方面,我覺得它或多或少與Veo 2 處於同一水平, Veo 2 略勝一籌,但只是略勝一籌。
但是,您再次必須考慮到Veo 2 更高的運行成本。話雖如此,我聽說其他幾款 2.0 型號也即將推出,所以我們將拭目以待,看看 Kilng 是否能繼續佔據王者地位,或者是否會有其他型號取代它。

註:本文根據以下YouTube影片撰寫。