img

Kling 3.0 AI 视频模型

Kling 3.0 是快手迄今为止最强大的 AI 视频模型。此次全新版本引入多镜头叙事能力,并在时间一致性方面进行了优化,同时提升了文本保留效果,支持多语言原生音频,以及高级分镜编辑功能,可生成最长 15 秒的工作室级成片。免费试用!

输入灵感,即刻创造
视频
文本/图像生视频
图生视频
文生视频
图生视频

点击上传图片

Kling 3.0 的主要功能

电影式多镜头序列

Kling 3.0 支持多镜头序列,使用户能够制作高度动态的视频,并实现先进的电影技术。无论是反打镜头、交叉剪辑、越肩镜头等,AI 模型都能适应各种镜头角度和镜头,以适应复杂的故事叙述形式。

镜头 1 镜头 2 镜头 3

一致的主体保留

通过多图像和视频引用,Kling 3.0 用户可以更准确地锁定关键主体和对象的某些元素和特征。这增强了角色和场景的稳定性,提供了更自然、更一致的视觉叙事,最大限度地降低了最终剪辑不符合预期的风险。

参考图像 提示 输出视频
Reference Image 她正在穿过一个霓虹灯闪烁的赛博朋克市场。首先,她冲向镜头,在蓝色霓虹灯下奔跑,表情凶狠。然后,镜头跟随她跳过一个摊位,进入一个昏暗、潮湿、被红灯笼照亮的小巷。在动态运动和从蓝色到红色的光线变化中,她的面部特征、发型和战术服装始终保持完美一致且可识别。

精确的旁白控制

Kling 3.0 允许用户制作具有多角色对话的细致电影场景,能够对表达、说话顺序和节奏进行特定控制。因此,任何人都可以简单地选择哪个角色说什么、怎么说、何时说,从而为更复杂、更引人入胜的剧本创作开辟了新的创意途径。

提示 输出视频
一次紧张的董事会会议,两个不同角色面对面坐着。角色 A(一位年长的灰衣男子):身体前倾,严厉地说:“韦恩斯先生,交易取消了。” 角色 B(一位穿蓝衬衫的年轻男子): smirk,向后靠在椅子上,平静地回答:“我认为您应该重新考虑一下数据。” 镜头首先聚焦于说话的角色 A,然后快速对焦到角色 B 以获得他的回应。需要精确的唇形同步和区分的说话轮次。

升级的原生音频

Kling 3.0 能够生成包括英语、中文、西班牙语、日语和韩语在内的多种语言的原生音频。此外,AI 模型支持地区口音和方言,使用户能够制作出听起来真实自然的唇形同步对话场景,以及符合全球观众口味的角色旁白。

提示 输出视频
一次东京一位年长的寿司师傅的纪录片式近景采访。他温暖地笑着直视镜头。他用流利的日语说:“寿司的秘诀不仅在于鱼,还在于你对米饭付出的心。”(需要音频生成:原生日语男声,平静而睿智的语调)。唇部运动必须与日语音节完美匹配,捕捉细微的停顿和呼吸。

增强的文本保留

Kling 3.0 确保从参考图像中生成的任何文本内容或视觉元素(如标志或徽标)都能以极高的准确度保留在视觉场景中。这对于希望制作嵌入品牌元素的宣传片的企业或电子商务用户尤其有帮助。

提示 输出视频
为一家虚构的能量饮料品牌“BOLT”制作的商业产品镜头。一个带有大号、粗体、黄色字母“BOLT”的时尚铝罐在溅水背景中缓慢旋转。水滴以慢动作击中罐体。当罐体旋转 360 度时,“BOLT”文本保持清晰可辨、锐利,并且不会变形或扭曲,保持与参考图像完全相同的字体样式。

扩展视频生成

Kling 3.0 模型可以生成更长的视频,用户可以设置每次生成 3 秒到 15 秒之间的灵活时长。有了这项扩展,创作者和电影制作人就可以一次性探索更复杂的故事叙述和更精细的序列,而不是满足于零散的视觉效果。

提示 输出视频
一段持续 15 秒的跟踪镜头,跟随一只金毛猎犬在不断变化的环境中奔跑。狗开始在草地上奔跑,无缝过渡到在日落时分的沙滩上奔跑,最后穿过雪林小径。环境之间的过渡是平滑而梦幻的。狗的解剖结构和奔跑姿势在整个 15 秒的时长内都保持真实稳定,不会变成其他动物。

灵活的故事板控制

使用 Kling 3.0,创作者可以在视觉序列中隔离多达 6 个不同的镜头,并以任何他们认为合适的方式自定义故事板。这意味着可以为每个镜头量身定制特定方面,如时长、镜头大小、镜头运动、视角、旁白等,确保采取精准的方法,实现更复杂的叙事。

输出视频

Kling 3.0 vs Sora 2 vs Veo 3.1:功能对比表

在此处了解 Kling 3.0、Sora 2 和 Veo 3.1 AI 视频模型之间的比较:

类别 Kling 3.0 Sora 2 Veo 3.1
输入格式 T2V, I2V, 和 V2V T2V 和 I2V T2V, I2V, 和 V2V
核心焦点 动态、多镜头叙事 视觉真实感和运动物理学 强大的提示遵循和电影感
原生音频 是(支持多语言)
最大视频长度(每次生成) 15 秒 25 秒 8 秒
输出分辨率 最高支持 4K 最高支持 1080p 最高支持 4K
生成速度 每段视频 30 – 60 秒 每段视频 30 秒 – 2 分钟 每段视频 2 – 4 分钟
最适合 复杂的多角色对话场景 现实生活场景,如舞蹈片段、体育、宣传广告等 电影片段、预告片和动画
如何在Pollo AI上使用Kling 3.0

如何在Pollo AI上使用Kling 3.0

01

选择Kling 3.0

转到Pollo AI图像转视频页面,然后选择Kling 3.0模型。

02

输入详情

上传参考图片和/或输入描述图片的文本提示。

03

生成视频

点击“创建”,请耐心等待视频准备好下载。

关于Kling 3.0的YouTube视频

关于Kling 3.0的X帖子

常见问题解答

什么是Kling 3.0?

Kling 3.0由快手开发,是其最新的人工智能视频生成模型,专为高级电影制作量身定制。该模型在角色一致性、视觉真实感、原生音频、时长以及多镜头叙事方面均有所改进,用户可以对场景拥有完全的创意控制权,并实现卓越的精确度。

Kling 3.0比Kling 2.6好在哪里?

相比 Kling 2.6,Kling 3.0 将真正的导演级控制权交到你手中。每次 15 秒的生成中,你都可以生成多镜头叙事,并自定义每个具体镜头,一次性打造精准的视觉故事,同时包含原生音频。通过这种方式,几乎可以完全省去传统后期制作的需求。

我能免费用Kling 3.0生成视频吗?

可以。你可以前往 Pollo AI 注册账号,获取免费试用计划。该计划将提供有限的积分,用于免费生成 Kling 3.0 视频。积分用完后,你可以订阅付费计划以获得更多积分。

我可以在Kling 3.0上使用哪些参考输入?

Kling 3.0 采用统一的多模态框架,支持文本、图像、音频和视频输入。结合其高级分镜控制功能,为你提供更高的精准度和灵活性,生成更贴近创作意图的完整电影级序列。

Kling 3.0支持哪些原生视频分辨率?

Kling 3.0 提供 2K 和 4K 原生分辨率生成,效果远超后期放大处理。这确保你生成的画面呈现更清晰的像素级细节,以及更真实的发丝、皮肤和织物等纹理表现,优于早期的 AI 视频模型。

Kling 3.0在哪些视觉方面表现最出色?

最新的 Kling 3.0 模型在角色真实感方面表现尤为突出,能够以极高的细节呈现自然的面部表情和细微肢体动作。同时,它还实现了接近完美的口型同步,使你能够使用原生语言和方言生成流畅对白,呈现更具真实感的表演效果。

立即在Pollo AI上免费试用Kling 3.0 !

立即在Pollo AI上免费试用Kling 3.0 !