Kling O1 圖片模型評測：Kling 首款 AI 圖片生成器能否延續其影片的傳奇？

Kling AI 已成為市場上最強大的 AI 影片生成器之一，以其從簡單的文字提示生成高品質影片的能力，持續給創作者留下深刻印象。

現在，他們透過推出 Kling O1 圖像模型，推出了他們首款專用的圖像生成模型，並嘗試了新事物。最大的問題是：Kling 在圖像生成方面是否能像影片生成一樣出色？

我花了大量時間測試 Kling O1 圖像模型，現在要來分享我的發現。讓我們看看這個新模型帶來了什麼。

Kling O1 的獨特之處？

在深入我的詳細測試之前，讓我先快速預覽一下我發現 Kling O1 最令人印象深刻的功能：

Kling O1 圖像模型最大的優勢之一是它能夠結合多張參考圖像，同時極佳地保留每張來源圖像的原有特徵。

與許多混合多張圖像時會模糊細節的其他模型不同，Kling O1 以驚人的準確度保持了每個元素的獨特特徵。

無論是調整圖像的特定區域還是修改特定元素，該模型都能準確理解編輯指令。

該模型建立在強大的多模態視覺語言概念之上，讓圖像編輯感覺就像與設計師對話一樣自然。

為了妥善評估 Kling O1 的能力，我專注於兩個主要測試情境，以展現其優勢和潛在弱點：

第一個測試旨在評估 Kling O1 同時處理多張參考圖像的能力，以及生成能夠保留每個來源特徵的協調構圖。

我使用了四張圖片：

然後我提供了以下提示：

請生成一張圖片，包含圖片 1 中的女孩，拿著圖片 2 中的狗狗，背景是圖片 3，並將圖片 4 的色調和風格應用到整張照片。

這是我得到的結果：

從生成的結果可以明顯看出，Kling O1 完美地遵循了指示，即使在同時處理四張圖片的內容時也是如此。沒有出現混亂或偏離提示的情況，其強大的多圖像處理能力確實讓我感到驚訝。

然而，我認為這張照片的真實感還可以進一步提升。儘管主體和背景具有相同的色調，但仍然感覺有些不協調和不自然。

除了融合場景和人物之外，我還測試了風格和材質的應用。

我使用了這兩張圖片：

並設定提示為：

將圖片 1 的主體轉換為寫實風格人物，並使用圖片 2 的紋理和材質製作圍巾。

Kling O1 給出的最終圖像：

最終結果顯示，Kling O1 在風格轉換和材質替換方面表現相當不錯。

但是，存在一些小問題：人物胸前多出了一部分圍巾，並且蝴蝶領結消失了。這些圖像中的邏輯不一致會損害其整體真實感。

第二個測試重點評估 Kling O1 基於單一張參考圖像進行精確、遞增修改的能力。

這將揭示該模型是否能在不降低品質或丟失上下文的情況下處理複雜的編輯工作流程。

在下方我編制的表格中，您可以並排比較 Kling O1 在此測試中的表現：

參考圖像	提示與結果 1	提示與結果 2
	將時間更改為晚上，並加入從上方吊燈來的溫暖室內光線。其他一切保持不變。	將咖啡杯換成一本書。這位女士現在應該在閱讀，而不是看著窗外。保持相同的面部特徵、服裝和背景。
提示與結果 3	提示與結果 4	提示與結果 5
在窗戶上添加小雨，調整窗戶反射以顯示雨滴。請勿修改室內場景或人物。	將她休閒的服裝改為商務專業服裝 — 一件西裝外套和一件正式襯衫。保持她的姿勢、面部特徵以及整個背景場景的相同。	在背景中添加另一個人 — 一位在櫃檯後面工作的咖啡師。保持相同的光線、一天中的時間以及所有其他現有元素。