首页/博客/评论/Kling O1 图片模型评测:Kling 的首款 AI 图片生成器能否媲美其视频领域的辉煌?

Kling O1 图片模型评测:Kling 的首款 AI 图片生成器能否媲美其视频领域的辉煌?

Kling AI 在市场上已成为最强大的 AI 视频生成器之一,凭借其从简单文本提示生成高质量素材的能力,持续给创作者留下深刻印象。

现在,他们正通过推出 Kling O1 图像模型——他们首个专用的图像生成模型——来尝试新事物。关键问题是:Kling 在图像生成方面是否能像在视频生成方面一样出色?

我花了很多时间对 Kling O1 图像模型进行了广泛测试,现在我将分享我的发现。让我们来看看这个新模型带来了什么。

Kling O1 有何过人之处?

在深入我的详细测试之前,让我先快速预览一下我认为 Kling O1 最令人印象深刻的功能:

惊人的多图像融合,保留原始细节

Kling O1 图像模型最大的优势之一是它能够结合多个参考图像,同时极好地保留每个来源的原始特征。

与其他许多在混合多张图像时会模糊细节的模型不同,Kling O1 以令人印象深刻的准确性保持了每个元素的独特特征。

智能提示理解与精确编辑

无论是调整图像的特定区域还是修改特定的元素,该模型都能准确理解编辑指令。

它构建于强大的多模态视觉语言概念之上,使图像编辑感觉就像与设计师对话一样自然。

我的测试过程:将 Kling O1 图像模型推向极限

为了正确评估 Kling O1 的能力,我专注于两个主要的测试场景,以揭示其优势和潜在的弱点:

测试 1:多图像参考融合

第一个测试旨在评估 Kling O1 能否同时处理多张参考图像,并生成一幅连贯的作品,且保留每张源图像的特征。

我使用了四张图片:

年轻女孩穿着粉色连衣裙在游乐场微笑
可卡犬在户外绿草地上坐着
空荡荡的生日聚会房间,挂满彩色气球和装饰品
一群朋友在海滩日落时冲浪庆祝

然后我提供了以下提示:

请生成一张图片,其中包含图 1 中的女孩,她抱着图 2 中的狗,背景是图 3,并将图 4 的色调和风格应用于整个照片。

这是我得到的结果:

生日聚会房间装饰着气球和生日快乐标语

从生成的结果可以看出,Kling O1 完美地遵循了指令,即使在同时处理来自四张图片的内容时也是如此。没有出现混乱或偏离提示的情况,其强大的多图像处理能力确实令我惊讶。

然而,我认为这张照片的真实感还有待提高。尽管主体和背景具有相同的色调,但仍然给人一种有些不和谐和不自然的感觉。

除了融合场景和主体之外,我还测试了风格和材质的应用。

我使用了这两张图片:

动漫女孩插画,围着围巾,在樱花树附近。
黑白千鸟格图案织物纹理特写

并将提示设置为:

将图 1 中的主体转换为逼真的人,围巾使用图 2 的纹理和材质。

Kling O1 给出的最终图像:

微笑的女人在春天盛开的户外戴着格子围巾

最终结果表明,Kling O1 在风格转换和材质替换方面表现相当不错。

不过,也存在一些小问题:围巾在主体胸部多出了一个部分,领结消失了。这类图像中的逻辑不一致性会影响其整体真实性。

测试 2:迭代精确编辑

第二个测试侧重于评估 Kling O1 基于单个参考图像进行精确、增量修改的能力。

这将揭示该模型是否能够在不降低质量或丢失上下文的情况下处理复杂的编辑工作流程。

在下表中,您可以并排比较 Kling O1 在此测试中的表现:

参考图像 提示与结果 1 提示与结果 2
女子手持咖啡杯在室内咖啡馆窗边坐着
女子坐在黄色调咖啡馆吧台内

将时间改为晚上,带有来自顶灯的温暖室内光线。其他所有内容保持不变。

女子在咖啡馆窗边放松地喝咖啡

将咖啡杯换成一本书。女子现在应该在阅读,而不是看窗外。保持相同的面部特征、服装和背景。

提示与结果 3 提示与结果 4 提示与结果 5
女子在拥挤的城市咖啡馆窗边喝咖啡

通过窗户添加小雨。调整窗户的反射,显示雨滴。不要修改室内场景或人物。

女子在咖啡馆窗边拿着咖啡坐着,周围有人

将她的休闲装改为商务正装——西装外套和正装衬衫。保持她的姿势、面部特征和整个背景场景不变。

女子手持咖啡坐在咖啡馆窗边,有人在旁边

在背景中添加另一个人——一个在柜台后工作的咖啡师。保持相同的光线、时间和其他现有元素。

结果确实令人印象深刻。Kling O1 对哪些内容应该改变,哪些应该保持不变,表现出了卓越的理解能力。

每一次迭代都与之前的版本保持了惊人的连贯性,同时准确地实现了请求的修改。

最终思考:Kling O1 值得尝试吗?

经过广泛测试,Kling O1 图像模型无疑是 AI 图像生成领域的一款强力产品。

这种多模态方法效果出色 —— 将自然语言提示与参考图像相结合,打造出流畅的工作流程,整个过程给人的感觉是协作式的,而非令人困扰的。

功能保留真正是同类产品中的佼佼者,在组合多个参考时能够保留每个来源的独特特征。分步编辑也异常高效,让您可以进行精确的更改而不会丢失上下文。

对于希望获得出色控制和一致性的创作者和设计师来说,Kling O1 图像模型绝对值得一试。它成功地将 Kling 的视频专业知识带入了静态图像,同时消除了许多 AI 创意过程中令人烦恼的工具切换问题。

它完美吗?不。但这是一个强有力的开端,表明 Kling AI 在图像生成领域是认真的。

准备好亲自测试了吗?前往 Pollo AI 尝试 Kling O1 图像模型,或探索 Pollo AI 图像生成器上提供的其他顶级模型,找到最适合自己需求的那一款。对于任何创作者而言,这笔时间投入都十分值得。

您可能也喜欢

查看更多

Sora 2评测:我测试了 OpenAI 的新 AI 视频模型——结果简直不真实

在这篇实践评测中探索 OpenAI 的Sora 2 AI 视频生成器。了解Sora 2如何彻底改变创意领域。经测试验证!

Nano Banana Pro 评测:这款 AI 图片生成器是否名副其实?

Google Nano Banana Pro 是否名副其实?我们的真实评测深入了解 Nano Banana Pro AI 图片模型,测试其卓越的文本渲染、创意控制等功能,看它是否名副其实。

Hailuo 2.3评测:我测试了HailuoAI最新的AI视频模型,结果让我惊喜不已

在Pollo AI上发现Hailuo 2.3 !探索这篇深度评论,深入了解Hailuo AI 最新的 AI 视频模型及其为 AI 视频创作带来的新进展!

Kling O1 评测:我试用了 Kling O1 AI 视频模型,它可能是 AI 视频的未来

我试用了 Kling AI 的 O1 视频模型——一个统一的多模态 AI,可以无缝地创建和编辑视频。了解为什么 Kling O1 视频模型可能是 AI 视频的未来。