Kling 2.0 ya está disponible: ¿Es el mejor modelo de vídeo con IA?

Kling AI acaba de lanzar Kling 2.0 al público.

Esta nueva versión está repleta de mejoras importantes, lo que la posiciona como la mejor en el ranking de vídeos con IA. Pero ¿es realmente tan innovadora como parece?

Hemos puesto a prueba Kling 2.0 comparándolo con otros modelos de última generación como Runway Gen 4 y Veo 2 de Google .

Compartiremos los resultados en breve, pero primero entendamos qué hace que Kling 2.0 sea especial.

¿Qué novedades hay en Kling 2.0 ?

Kling 2.0 ha introducido varias características y cambios nuevos.

Indicaciones visuales multimodales

Una de las adiciones más importantes al ecosistema Kling es la nueva función "Multi Elements".

Es un sistema de indicaciones visuales multimodal que permite a los usuarios consultar imágenes y vídeos dentro de las indicaciones de texto. Esta función representa un avance importante en control y precisión, aunque actualmente es independiente de Kling 2.0 (se espera su integración próximamente).

El sistema ofrece tres funciones principales:

  1. Intercambiar: Reemplazar sujetos en videos existentes (la función presentaba errores durante la prueba)
  2. Agregar: Insertar nuevos elementos de imágenes de referencia en videos
  3. Eliminar: elimina objetos no deseados de las escenas de forma dinámica

En nuestras pruebas, utilizamos con éxito la función "agregar" para insertar una mujer corriendo (de una imagen de referencia) en una escena de lava ingresando a un antiguo teatro de ópera.

imagen1

De manera similar, la función “eliminar” nos permitió quitar un loro del hombro de un robot manteniendo la coherencia visual en todo el video.

imagen2

En particular, Kling AI proporciona plantillas de indicaciones útiles al cargar materiales de referencia, lo que elimina la necesidad de memorizar estructuras de indicaciones complejas: una mejora importante de la experiencia del usuario.

Cambios en la interfaz y el flujo de trabajo

En esta versión, Kling AI también ha introducido varios cambios en la interfaz:

  • Se ha eliminado la distinción entre los modos "estándar" y "profesional".
  • Los controles deslizantes de creatividad versus seguimiento de indicaciones ya no están disponibles
  • El modo de marco actualmente no es compatible con Kling 2.0
  • La función de elementos originales (para ubicación de personajes y referencias de objetos) aún no es compatible con Kling 2.0
imagen3

Kling 2.0 vs. Kling 1.6: ¿Qué ha mejorado?

Kling 2.0 se destaca en calidad de movimiento y simulación física, pero ocasionalmente puede preferir la coherencia de escena de Kling 1.6 para proyectos específicos.

Fluidez del movimiento y naturalismo

Kling 2.0 mejora drásticamente la calidad del movimiento. Los animales se mueven con naturalidad, en lugar de los movimientos bruscos y poco realistas de Kling 1.6.

Las expresiones humanas son más convincentes, eliminando el problema de mover los labios sin hablar. Las emociones faciales se ven naturales y consistentes a lo largo de las secuencias.

Manejo dinámico de escenas

Las criaturas voladoras muestran movimientos de alas adecuados y patrones de planeo naturales. Las trayectorias de vuelo rígidas de Kling 1.6 se sustituyen por dinámicas aéreas realistas.

La física ambiental ha mejorado significativamente. Los efectos del agua, las interacciones entre objetos y las propiedades de los materiales se comportan de forma más realista.

El equilibrio entre coherencia

Kling 2.0 produce escenas más dinámicas, pero a veces a costa de la coherencia. Los personajes pueden aparecer o desaparecer inesperadamente en secuencias complejas.

Kling 1.6, aunque visualmente es menos impresionante, mantuvo una mejor consistencia de escena en todos los videos.

Comprensión rápida

Las instrucciones de la cámara, como movimiento panorámico, inclinación y cambios de enfoque, se ejecutan con mayor precisión en Kling 2.0.

Las acciones secuenciales se comprenden mejor. Las indicaciones de varias partes, como "una lámpara de araña que cae en lava y estalla en llamas", siguen un orden lógico adecuado.

Limitaciones técnicas

Ambas versiones tienen problemas con las manos, la representación de texto y las interacciones complejas, aunque la versión 2.0 muestra mejoras modestas en estas áreas.

Parámetros de generación

Kling 2.0 elimina los controles deslizantes de creatividad/seguimiento de indicaciones y fusiona los modos estándar/profesional en una interfaz unificada.

Este enfoque simplificado puede beneficiar a los principiantes, pero limita las opciones para los usuarios avanzados acostumbrados a ajustar sus resultados.

Probando Kling 2.0

Queríamos ver cómo se comparaba Kling 2.0 con Runway Gen 4 y Google Veo 2.

Así que hicimos una serie de pruebas en los tres generadores de vídeo de IA usando las mismas indicaciones.

Capacidades de adherencia inmediata y representación del movimiento

Nuestra primera prueba se centró en la capacidad de Kling 2.0 para comprender y ejecutar indicaciones complejas que involucraban tanto el movimiento del sujeto como el de la cámara. La tarea era sencilla pero desafiante: una mujer mira sus manos y un loro aterriza sobre ellas.

Kling 2.0 hizo un trabajo impresionante al seguir la consigna al pie de la letra. La acción se desarrolló con naturalidad, con una secuencia clara de eventos.

El resultado de Runway, por otro lado, no estuvo a la altura. El loro ya estaba presente cuando la mujer bajó la vista, lo cual no se ajusta a los requisitos de la consigna.

Veo 2 de Google siguió la instrucción pero careció de la acción clara y secuencial que ofrecía Kling 2.0 .

Evaluación de los efectos ambientales: simulación de inundaciones

A continuación, probamos la capacidad de Kling 2.0 para representar efectos ambientales, específicamente un escenario de inundación en un entorno urbano.

Kling 2.0 funcionó admirablemente, representando con precisión las aguas de la inundación llenando las calles y empujando los automóviles.

Runway tuvo dificultades para afrontar este desafío y optó por mostrar una ola oceánica gigante que no encajaba con el mensaje.

Veo 2 logró representar la inundación, pero careció de dinamismo y no capturó completamente el escenario descrito en el mensaje.

Acción dinámica y comprensión rápida en escenarios de alta velocidad

Llevamos Kling 2.0 al siguiente nivel probando su capacidad para gestionar secuencias de acción a alta velocidad. La tarea consistía en una mujer galopando a caballo con la cámara girando a su alrededor.

Kling 2.0 ofreció un resultado dinámico y visualmente atractivo, aunque tuvo algunas dificultades para mantener la coherencia facial durante la acción de alta velocidad.

El resultado de Runway parecía más bien una escena en cámara lenta, carente del dinamismo de alta velocidad que buscábamos.

Lamentablemente, Veo 2 no proporcionó resultados utilizables en este escenario.

Representación de objetos levitantes y movimientos complejos de cámara

En esta prueba, desafiamos a Kling 2.0 a renderizar una escena con objetos levitando y un movimiento de inclinación de la cámara hacia abajo.

Kling 2.0 volvió a brillar, representando con precisión los objetos flotantes y siguiendo el movimiento de cámara especificado. Runway y Veo 2 tuvieron dificultades con esta tarea, ya que no lograron representar completamente los objetos levitando ni el movimiento de cámara como se describe en la instrucción.

El desafío definitivo: modelos de video de IA vs. escena de lucha de samuráis

El desafío final fue renderizar una escena de pelea entre dos samuráis, una tarea que históricamente ha resultado difícil para los modelos de video de IA.

Kling 2.0, aunque mejorado con respecto a versiones anteriores, aún tenía dificultades para renderizar combates con un aspecto natural. La coherencia de las espadas disminuyó, especialmente al interactuar, y la escena en general no se veía tan realista como esperábamos.

Runway Gen 4 y Veo 2 enfrentaron problemas similares, con problemas de coherencia y falta de movimiento natural en las escenas de lucha.

Beneficios y limitaciones de Kling 2.0

En general, creemos que Kling 2.0 tiene las siguientes ventajas y desventajas.

Puntos fuertes de Kling 2.0

  • Adherencia inmediata: Kling 2.0 muestra una notable adherencia a indicaciones complejas, especialmente aquellas que involucran múltiples acciones y efectos ambientales.
  • Realismo en las interacciones: el modelo se destaca por representar interacciones sutiles y movimientos realistas, mejorando la calidad visual general.

Desafíos de Kling 2.0

  • Mantener la coherencia: Kling 2.0 tiene dificultades para mantener la coherencia durante secuencias de acción complejas y de alta velocidad, lo que genera inconsistencias en los resultados.
  • Renderizado de escenas complejas: a pesar de las mejoras, Kling 2.0 aún enfrenta desafíos a la hora de renderizar escenas de lucha realistas y movimientos de cámara dinámicos.

Precios y accesibilidad

  • Implicaciones de costos: el precio de Kling 2.0, especialmente para generaciones de video cortas, podría ser una preocupación para algunos usuarios, lo que indica una necesidad de opciones más asequibles.

Reflexiones finales: ¿Vale la pena Kling 2.0 ?

Kling 2.0 representa un avance significativo en la generación de videos con IA, ofreciendo mejoras impresionantes en el cumplimiento de indicaciones complejas y la generación de interacciones realistas.

Sin embargo, aún enfrenta desafíos para mantener la coherencia durante escenas dinámicas. A pesar de sus avances, al considerar Kling 2.0, conviene sopesar los beneficios frente al coste actual y las necesidades específicas de sus proyectos.

Nota: Este artículo fue escrito con base en el contenido del siguiente video:

También te podría gustar

Ver más

Kling 2.0: ¿Cómo se compara con Kling 1.6?

Kling lanzó recientemente su modelo de generación de video con IA Kling 2.0 . Aquí te mostraremos lo que Kling 2.0 puede crear y las diferencias entre las versiones 1.6 y 2.0.

Kling 2.0 ha revolucionado la industria del vídeo con IA

Descubra cómo Kling 2.0 está revolucionando la industria del video con IA con sus impresionantes características y capacidades.

Kling 2.0 : ¿Sigue siendo el mejor generador de IA o ha sido destronado?

¿Sigue siendo Kling 2.0 el mejor generador de vídeo con IA o ha sido destronado? Explora nuestro análisis a fondo de la última versión para descubrir sus mejoras, fortalezas y debilidades.

Kling AI Qué es: Mi guía personal de Kling AI

¿Quieres saber qué es Kling AI? En este completo artículo, profundizaremos en qué consiste este generador de vídeo con IA, ¡incluyendo sus características, beneficios y mucho más!