首頁/部落格/評論/Kling O1 圖片模型評測:Kling 首款 AI 圖片生成器能否延續其影片的傳奇?

Kling O1 圖片模型評測:Kling 首款 AI 圖片生成器能否延續其影片的傳奇?

Kling AI 已成為市場上最強大的 AI 影片生成器之一,以其從簡單的文字提示生成高品質影片的能力,持續給創作者留下深刻印象。

現在,他們透過推出 Kling O1 圖像模型,推出了他們首款專用的圖像生成模型,並嘗試了新事物。最大的問題是:Kling 在圖像生成方面是否能像影片生成一樣出色?

我花了大量時間測試 Kling O1 圖像模型,現在要來分享我的發現。讓我們看看這個新模型帶來了什麼。

Kling O1 的獨特之處?

在深入我的詳細測試之前,讓我先快速預覽一下我發現 Kling O1 最令人印象深刻的功能:

驚人的多圖像融合,保留原始細節

Kling O1 圖像模型最大的優勢之一是它能夠結合多張參考圖像,同時極佳地保留每張來源圖像的原有特徵。

與許多混合多張圖像時會模糊細節的其他模型不同,Kling O1 以驚人的準確度保持了每個元素的獨特特徵。

智慧的提示理解與精確編輯

無論是調整圖像的特定區域還是修改特定元素,該模型都能準確理解編輯指令。

該模型建立在強大的多模態視覺語言概念之上,讓圖像編輯感覺就像與設計師對話一樣自然。

我的測試流程:挑戰 Kling O1 圖像模型的極限

為了妥善評估 Kling O1 的能力,我專注於兩個主要測試情境,以展現其優勢和潛在弱點:

測試 1:多圖像參考融合

第一個測試旨在評估 Kling O1 同時處理多張參考圖像的能力,以及生成能夠保留每個來源特徵的協調構圖。

我使用了四張圖片:

年輕女孩穿著粉紅色洋裝在遊樂場微笑
可卡犬坐在戶外的綠色草地上
空蕩蕩的生日派對房間,掛滿了彩色氣球和裝飾品
一群朋友帶著衝浪板在海邊日落時慶祝

然後我提供了以下提示:

請生成一張圖片,包含圖片 1 中的女孩,拿著圖片 2 中的狗狗,背景是圖片 3,並將圖片 4 的色調和風格應用到整張照片。

這是我得到的結果:

生日派對房間裝飾著氣球和生日快樂標誌

從生成的結果可以明顯看出,Kling O1 完美地遵循了指示,即使在同時處理四張圖片的內容時也是如此。沒有出現混亂或偏離提示的情況,其強大的多圖像處理能力確實讓我感到驚訝。

然而,我認為這張照片的真實感還可以進一步提升。儘管主體和背景具有相同的色調,但仍然感覺有些不協調和不自然。

除了融合場景和人物之外,我還測試了風格和材質的應用。

我使用了這兩張圖片:

動漫女孩插畫,圍著圍巾,靠近櫻花樹。
黑白千鳥格紋布料紋理特寫

並設定提示為:

將圖片 1 的主體轉換為寫實風格人物,並使用圖片 2 的紋理和材質製作圍巾。

Kling O1 給出的最終圖像:

微笑的女性戴著格紋圍巾,在春天的花叢中戶外

最終結果顯示,Kling O1 在風格轉換和材質替換方面表現相當不錯。

但是,存在一些小問題:人物胸前多出了一部分圍巾,並且蝴蝶領結消失了。這些圖像中的邏輯不一致會損害其整體真實感。

測試 2:迭代精確編輯

第二個測試重點評估 Kling O1 基於單一張參考圖像進行精確、遞增修改的能力。

這將揭示該模型是否能在不降低品質或丟失上下文的情況下處理複雜的編輯工作流程。

在下方我編制的表格中,您可以並排比較 Kling O1 在此測試中的表現:

參考圖像 提示與結果 1 提示與結果 2
女子拿著咖啡杯,坐在室內咖啡館的窗邊
女子坐在室內黃色調咖啡館吧檯

將時間更改為晚上,並加入從上方吊燈來的溫暖室內光線。其他一切保持不變。

女子坐在咖啡館的窗邊看書,手裡拿著咖啡

將咖啡杯換成一本書。這位女士現在應該在閱讀,而不是看著窗外。保持相同的面部特徵、服裝和背景。

提示與結果 3 提示與結果 4 提示與結果 5
女子在擁擠的城市咖啡館窗邊喝咖啡

在窗戶上添加小雨,調整窗戶反射以顯示雨滴。請勿修改室內場景或人物。

女子與咖啡坐在咖啡館窗邊,周圍有人

將她休閒的服裝改為商務專業服裝 — 一件西裝外套和一件正式襯衫。保持她的姿勢、面部特徵以及整個背景場景的相同。

女子拿著咖啡坐在咖啡館窗邊,周圍有人

在背景中添加另一個人 — 一位在櫃檯後面工作的咖啡師。保持相同的光線、一天中的時間以及所有其他現有元素。

結果確實令人印象深刻。Kling O1 展現了對哪些部分應該改變、哪些部分應該保持不變的卓越理解能力。

每次迭代都保持了與先前版本的顯著一致性,同時準確地實現了所要求的修改。

最終想法:Kling O1 值得嘗試嗎?

經過廣泛測試後,Kling O1 圖像模型無疑是 AI 圖像生成領域的有力競爭者。

這種多模態方法效果出色 —— 將自然語言提示與參考圖像相結合,打造出流暢的工作流程,整個過程給人的感覺是協作式的,而非令人困擾的。

特徵保留功能確實是同類產品中的佼佼者,在結合多個參考圖像時能夠保留每個來源的獨特特徵。逐步編輯也特別有效,讓您可以在不丟失上下文的情況下進行精確的更改。

對於希望獲得出色控制力和一致性的創作者和設計師來說,Kling O1 圖像模型絕對值得一試。它成功地將 Kling 的影片專業知識應用於靜態圖像,同時消除了許多 AI 創意流程中惱人的工具切換問題。

它完美嗎?不。但它是一個強有力的首次亮相,表明 Kling AI 在圖像生成方面是認真的。

準備好親自測試了嗎?前往 Pollo AI 試用 Kling O1 圖像模型,或在 Pollo AI 圖像生成器 上探索其他頂級模型,找到最適合自己需求的那一款。對於任何創作者而言,這筆時間投入都十分值得。

您可能也喜歡

查看更多

Sora 2評測:我試用了 OpenAI 的新 AI 影片模型——結果簡直不可思議

在本實戰評測中,探索 OpenAI 的Sora 2 AI 影片生成器。了解Sora 2為何能革新創意。經過測試,久經驗證!

Nano Banana Pro 評測:這款 AI 圖片生成器是否名副其實?

Google Nano Banana Pro 是否名副其實?我們的真實評測深入探討 Nano Banana Pro AI 圖片模型,測試其優越的文字渲染、創意控制等功能,看看它是否真正能達到期望。

Hailuo 2.3評測:我試用了HailuoAI最新的AI影片模型,結果讓我驚喜不已!

在Pollo AI上探索Hailuo 2.3 !這篇深度評論將深入探討Hailuo AI 最新的 AI 影片模型,以及它為 AI 影片創作帶來的全新進展!

Kling O1 評測:我試用了 Kling O1 AI 影片模型,它可能是 AI 影片的未來

我測試了 Kling AI 的 O1 影片模型—一個統一的多模態 AI,可流畅生成和編輯影片。了解為何 Kling O1 影片模型可能是 AI 影片的未來。