首页Kling AIKling 2.0现已发布:它是最好的 AI 视频模型吗?

Kling 2.0现已发布:它是最好的 AI 视频模型吗?

Kling AI刚刚向公众发布了Kling 2.0 。

此次发布的新版本包含多项重大升级,在 AI 视频排行榜上拔得头筹。但它真的像听起来那么具有突破性吗?

我们对Kling 2.0进行了测试,并将其与Runway Gen 4Google 的Veo 2等其他最先进的型号进行了比较。

我们稍后会分享结果,但首先,让我们了解一下Kling 2.0 的特殊之处。

Kling 2.0有哪些新功能?

Kling 2.0引入了多项新功能和变化。

多模式视觉提示

Kling生态系统最重要的新增功能之一是新的“多元素”功能。

它是一个多模态视觉提示系统,允许用户在文本提示中引用图片和视频。此功能代表了控制力和精度的重大提升,尽管它目前与Kling 2.0分开(预计很快会集成)。

该系统提供三个主要功能:

  1. 交换:替换现有视频中的主题(该功能在测试期间出现错误)
  2. 添加:将参考图像中的新元素插入视频中
  3. 删除:动态删除场景中不需要的对象

在我们的测试中,我们成功地使用“添加”功能将奔跑的女人(来自参考图像)插入到熔岩进入古老歌剧院的场景中。

图片1

类似地,“删除”功能允许我们将鹦鹉从机器人的肩膀上移除,同时保持整个视频的视觉连贯性。

图片2

值得注意的是, Kling AI在上传参考资料时提供了有用的提示模板,无需记住复杂的提示结构——这是一项贴心的用户体验改进。

界面和工作流程变更

在此版本中, Kling AI还引入了几项界面变化:

  • 取消了“标准”和“专业”模式之间的区别
  • 创造力与提示遵循滑块不再可用
  • Kling 2.0目前不支持框架模式
  • 原始元素功能(用于角色位置和对象引用)尚不兼容Kling 2.0
图片3

Kling 2.0与Kling 1.6:有哪些改进?

Kling 2.0在运动质量和物理模拟方面表现出色,但有时您可能更喜欢Kling 1.6 针对特定项目的场景连贯性。

运动流畅性和自然主义

Kling 2.0大幅提升了动作质量。动物的动作更加自然流畅,不再像Kling 1.6 中那样僵硬、不真实。

人类表情更加逼真,消除了“嘴唇动而不语”的问题。面部表情在整个场景中显得自然一致。

动态场景处理

飞行生物展现出精准的翅膀动作和自然的滑翔模式。Kling Kling僵硬的飞行路径被逼真的空中动态所取代。

环境物理效果显著提升。水体效果、物体相互作用以及材质属性均更加逼真。

一致性权衡

Kling 2.0可以生成更具动态效果的场景,但有时会牺牲连贯性。在复杂的场景中,角色可能会意外地出现或消失。

Kling 1.6 虽然视觉效果不那么令人印象深刻,但在整个视频中保持了更好的场景一致性。

迅速理解

在Kling 2.0中,平移、倾斜和焦点偏移等相机指令执行得更加精确。

连续动作更容易理解。像“吊灯掉进熔岩,然后燃烧起来”这样的多部分提示符合逻辑顺序。

技术限制

两个版本在手部、文本渲染和复杂交互方面都存在困难,不过 2.0 在这些方面有所改进。

生成参数

Kling 2.0删除了创造力/提示跟随滑块,并将标准/专业模式合并到统一的界面中。

这种简化的方法可能对初学者有益,但限制了习惯于微调输出的高级用户的选择。

测试Kling 2.0

我们想看看Kling 2.0与Runway Gen 4 和Google Veo 2 相比如何。

因此,我们使用相同的提示对所有三个 AI 视频生成器进行了一系列测试。

快速遵循和运动渲染功能

我们的第一个测试重点关注Kling 2.0理解和执行涉及拍摄对象和相机运动的复杂提示的能力。任务简单却充满挑战:一位女士低头看着自己的手,一只鹦鹉落在了她的手上。

Kling 2.0 的表现令人印象深刻,它完全按照提示进行。动作展开自然,事件顺序清晰。

而《Runway》的产出则略有偏差。当女人低头时,鹦鹉已经出现了,这不符合提示的要求。

Google 的Veo 2 遵循了提示,但缺乏Kling 2.0所提供的清晰、连续的操作。

评估环境影响:洪水模拟

接下来,我们测试了Kling 2.0渲染环境效果的能力,特别是城市环境中的洪水场景。

Kling 2.0 的表现令人钦佩,准确地描绘了洪水淹没街道并冲走汽车的场景。

《Runway努力应对这一挑战,但最终选择展示与提示不符的巨大海浪。

Veo 2 成功渲染了洪水,但缺乏活力,没有完全捕捉提示中描述的场景。

高速场景下的动态行动和快速理解

我们进一步测试了Kling 2.0处理高速动作片段的能力。任务内容是一位女子骑着马飞奔,镜头围绕着她旋转。

Kling 2.0提供了动态的、视觉上吸引人的输出,尽管它在高速动作过程中在保持面部连贯性方面略有困难。

Runway 的输出看起来更像是慢动作场景,缺乏我们所追求的高速活力。

不幸的是, Veo 2 在这种情况下没有提供可用的结果。

渲染悬浮物体和复杂的相机运动

在本次测试中,我们挑战Kling 2.0渲染一个具有悬浮物体和相机向下倾斜运动的场景。

Kling 2.0再次表现出色,准确地描绘了漂浮物体并遵循了指定的摄像机运动。Runway 和Veo 2 在这项任务上表现不佳,未能完全按照提示描述的方式渲染悬浮物体和摄像机运动。

终极挑战:AI视频模型 vs. 武士打斗场景

最后的挑战是渲染两个武士之间的打斗场景,这项任务对于 AI 视频模型来说历来被证明是困难的。

Kling 2.0虽然比之前的版本有所改进,但在渲染自然的战斗效果方面仍然存在问题。剑的连贯性下降,尤其是在它们互动的时候,整体场景看起来不如我们所希望的那样逼真。

Runway Gen 4 和Veo 2 面临着类似的问题,即连贯性问题以及打斗场景缺乏自然动作。

Kling 2.0的优点和局限性

总体而言,我们认为Kling 2.0具有以下优点和缺点。

Kling 2.0 的优势

  • 提示遵守: Kling 2.0对复杂提示表现出了出色的遵守能力,尤其是那些涉及多种动作和环境影响的提示。
  • 交互的真实感:该模型擅长渲染微妙的交互和逼真的动作,增强整体视觉质量。

Kling 2.0挑战

  • 保持一致性: Kling 2.0在高速复杂的动作序列中难以保持一致性,导致输出不一致。
  • 渲染复杂场景:尽管有所改进, Kling 2.0在渲染逼真的打斗场景和动态摄像机运动方面仍然面临挑战。

定价和可访问性

  • 成本影响: Kling 2.0的定价,尤其是对于短视频生成而言,可能会引起一些用户的担忧,这表明需要更多实惠的选择。

最后的想法: Kling 2.0值得吗?

Kling 2.0代表了 AI 视频生成领域的重大进步,在遵循复杂提示和呈现逼真交互方面取得了令人瞩目的进步。

然而,在动态场景中保持一致性方面,它仍然面临挑战。尽管Kling 2.0有所进步,但在考虑使用时,您仍应权衡其优势、当前成本以及项目的具体需求。

注:本文根据以下视频内容撰写:

相关文章

Kling 2.0席卷 AI 视频行业

了解Kling 2.0如何凭借其令人印象深刻的特性和能力彻底改变 AI 视频行业。

Kling 2.0它仍然是最好的 AI 生成器还是已经被取代了?

Kling 2.0仍然是最好的 AI 视频生成器,还是已经被淘汰了?探索我们对最新版本的深入评测,了解它的改进、优势和劣势。

Kling 2.0已到来:探索其功能

探索Kling 2.0在视频和图像生成领域突破性的 AI 进步。从流畅的动作到强大的编辑工具,了解它为何能成为颠覆性的视频模型。

Kling 2.0:与Kling 1.6 的比较

Kling最近发布了他们的Kling 2.0 AI 视频生成模型。本文我们将向您展示Kling 2.0 的功能以及 1.6 版本和 2.0 版本之间的区别。