Kling 2.0 ya está disponible, lo que significa que el generador de video con IA mejor valorado actualmente es aún mejor. Hoy analizaremos en profundidad sus mejoras, sus deficiencias y qué puedes esperar de esta nueva versión superior.
Kling sigue arrasando con su nueva era 2.0. Vemos que el modelo 1.6 se mantiene como el mejor en conversión de imagen a vídeo, mientras que el modelo 1.5 de conversión de texto a vídeo quedó en segundo lugar, solo superado por Veo 2 de Google . Veamos qué tal le va a la versión 2.0 de Kling.
Un primer vistazo a Kling 2.0 : mejora de la fidelidad y la coherencia
En cuanto a fidelidad general y coherencia, debo admitir que el nuevo modelo Kling 2.0 es un avance notable, especialmente en la conversión de imagen a vídeo. Independientemente de la imagen de entrada, la consistencia se mantiene, con una actuación general sólida de los personajes.
Evaluación de la conversión de texto a vídeo de Kling 2.0
Comencemos con este ejemplo de texto a video, comenzando con un mensaje sobre un lobo huargo inspirado en Game of Thrones, inspirado en gran medida por la noticia de la vida real de Colossal Bioscience que rescató a tres lobos huargos de la extinción.
El mensaje de video se ve bastante sólido, especialmente para la conversión de texto a video. Si bien hay algunos problemas con la perspectiva y la escala del lobo huargo en comparación con el mago oscuro Jon Nieve, esto también se ajusta a la propuesta inicial. Con esto en mente, este es un resultado de texto a video realmente impresionante.
Evaluación de la conversión de imagen a vídeo de Kling 2.0
Ejemplo 1
En nuestro primer ejemplo, tenemos 10 segundos de caminata continua. Lo que me impresionó es que, a pesar de cierta decoherencia, la toma se centra en los pies caminando y muestra un ciclo de marcha muy consistente. Hay un paso mínimo y los pies parecen reaccionar a cosas como charcos de barro.
Ocasionalmente, puedes encontrarte con naves espaciales que vuelan hacia atrás, pero no he visto gente caminando hacia atrás. Aunque si te encuentras con esto, una solución rápida es simplemente hacerla en reversa.
Ejemplo 2
Otro ejemplo de generación fluida se presenta en esta foto inspirada en Vogue de los años 60. Si bien la modelo es el centro de atención, a pesar de ser demasiado atractiva para mirar directamente a la cámara, permanece sentada pasivamente. Pero son los demás personajes de la escena los que captaron mi atención. Los hombres que caminan en la escena no forman parte de ella, pero, en el contexto, parecen pertenecer a ella.
Funciones mejoradas de Kling 2.0
Movimiento rápido coherente
Una de las principales fortalezas de Kling 2.0 es que es excepcional en movimiento rápido y coherente.
Si vemos la pelea de kung-fu mediante la conversión de texto a vídeo, ¿es completamente perfecta? No, pero es bastante impresionante, sobre todo teniendo en cuenta la cámara giratoria, que contrarresta parte de la decoherencia.
El hecho de que ambos chicos permanezcan en el suelo y ninguno de ellos salga volando, y que el fondo no se convierta en explosiones, muestra un resultado impresionante.
Otro resultado del mismo mensaje fue un poco más torpe en cuanto a los movimientos de los personajes, pero en general, no hubo mucha decoherencia, con personajes fusionándose entre sí o con algunos de los otros aspectos que solemos esperar. Si se usaran habilidades de edición avanzadas, probablemente se podría lograr una buena parte del clip de 10 segundos.
Especificaciones de generación y control de cámara
Con Kling 2.0, podemos generar en intervalos de cinco o diez segundos y usar relaciones de aspecto de 16:9, 9:16 y 1:1. Además, si elige el Plan Premier, puede generar más de una salida a la vez. Actualmente, las salidas de video son a 720p, aunque me han dicho que pronto estarán disponibles a 1080p.
Llamadas de movimiento de lente y cámara
Actualmente, no hay opciones de control de cámara en las indicaciones, pero debo decir que el modelo responde muy bien, no solo a las indicaciones de movimiento de la cámara, sino también a la elección del objetivo. Por ejemplo, aquí, solicitamos un objetivo de 85 mm, con poca profundidad de campo y movimiento orbital.
Cabe destacar que la mesa está un poco torcida, ya que el poste no encaja del todo donde debería, pero es interesante observar que se ha mantenido así durante todo el proceso. En general, el mensaje siguió las instrucciones sobre el movimiento de la cámara y el tipo de lente.
Luego, al cambiar el objetivo de 85 mm por uno de 20 mm, obtenemos una toma mucho más amplia con el mismo movimiento, prestando gran atención al detalle en la indicación del gran angular. Si bien es inevitable que alguien señale que no se trata exactamente de un objetivo de 20 mm o de 85 mm, el objetivo es obtener una aproximación bastante precisa de lo que se busca.
Lanzamiento de nuevas herramientas: la función Multi-Elements
Un aspecto que no quiero pasar por alto es la nueva función multielementos que también se está lanzando. No he tenido mucho tiempo para probarla, pero creo que es importante darles una idea de lo que hace, ya que tiene el potencial de convertirse en una herramienta muy potente.
Al abrir un video, puedes presionar la opción “Agregar selección” y enmascarará instantáneamente a tu personaje.

Cuando estés satisfecho, puedes hacer clic en “Confirmar” y luego cargar una imagen de otro personaje.

El mensaje indica "Intercambia X de (miniatura de tu imagen) por X de (miniatura de tu video)". Deberás completar los valores de "X" (en este ejemplo, chica y chica) y luego pulsar "Generar".

La herramienta intercambia un carácter por otro y, si bien la entrada en este ejemplo no es perfecta, da una buena indicación de lo que hace la función de elementos múltiples.

Con un poco de experimentación y quizás opciones tonalmente más alineadas, podrías terminar con algunos resultados espectaculares, particularmente una vez que llegue el modelo Kling 2.0 .
Veredicto final: ¿ Kling AI sigue siendo el rey?
En términos de texto a video, siento que está más o menos al mismo nivel que Veo 2, con Veo 2 adelantándose, pero solo levemente.
Pero, de nuevo, hay que tener en cuenta el mayor coste operativo de Veo 2. Dicho esto, me han dicho que hay varios otros modelos 2.0 en camino, así que veremos si Kilng sigue siendo el rey o si otro modelo llega para ocupar su lugar.

Nota: El artículo fue escrito con base en el siguiente video de YouTube .