Kling AI se ha labrado un nombre como uno de los generadores de vídeo con IA más potentes del mercado, impresionando constantemente a los creadores con su capacidad para producir metraje de alta calidad a partir de simples indicaciones de texto.
Ahora, están probando algo nuevo con el lanzamiento del modelo de imagen Kling O1, su primer modelo dedicado a la generación de imágenes. La gran pregunta es: ¿puede Kling generar imágenes tan bien como vídeo?
He pasado tiempo probando exhaustivamente el modelo de imagen Kling O1 y estoy aquí para compartir lo que he descubierto. Veamos qué aporta este nuevo modelo.
¿Qué hace destacar a Kling O1?
Antes de entrar en mis pruebas detalladas, permítanme ofrecerles un breve resumen de las características que me parecieron más impresionantes de Kling O1:
Increíble fusión de múltiples imágenes que conserva los detalles originales
Una de las mayores fortalezas del modelo de imagen Kling O1 es su capacidad para combinar múltiples imágenes de referencia conservando increíblemente bien las características originales de cada fuente.
A diferencia de muchos otros modelos que difuminan los detalles al mezclar varias imágenes, Kling O1 mantiene las características distintivas de cada elemento con una precisión impresionante.
Comprensión inteligente de las indicaciones y edición precisa
Ya sea ajustando áreas específicas de una imagen o modificando elementos concretos, el modelo comprende con precisión las instrucciones de edición.
Construido sobre el potente concepto de Lenguaje Visual Multimodal, hace que la edición de imágenes se sienta tan natural como conversar con un diseñador.
Mi proceso de prueba: Llevando el modelo de imagen Kling O1 al límite
Para evaluar adecuadamente las capacidades de Kling O1, me centré en dos escenarios de prueba principales que expondrían tanto sus fortalezas como sus posibles debilidades:
Prueba 1: Fusión de referencias de múltiples imágenes
La primera prueba tuvo como objetivo evaluar qué tan bien podía Kling O1 manejar múltiples imágenes de referencia simultáneamente y crear una composición cohesiva que conservara las características de cada fuente.
Utilicé cuatro imágenes:
![]() |
![]() |
![]() |
![]() |
Luego proporcioné la siguiente indicación:
Por favor, genera una imagen que presente a la chica de la Imagen 1 sosteniendo al perro de la Imagen 2, con el fondo de la Imagen 3, y aplicando el tono de color y estilo de la Imagen 4 a toda la foto.
Y este es el resultado que obtuve:

De los resultados generados, es evidente que Kling O1 siguió perfectamente las instrucciones, incluso mientras procesaba contenido de cuatro imágenes simultáneamente. No hubo caos ni desviación de la indicación, y su potente capacidad de procesamiento de múltiples imágenes me sorprendió gratamente.
Sin embargo, creo que el realismo de esta foto podría mejorarse. Aunque el sujeto y el fondo comparten el mismo tono de color, todavía hay una sensación algo discordante y poco natural.
Más allá de mezclar escenas y sujetos, también probé la aplicación de estilo y material.
Utilicé estas dos imágenes:
![]() |
![]() |
Y establecí la indicación como:
Convierte el sujeto de la Imagen 1 en una persona fotorrealista, utilizando la textura y el material de la Imagen 2 para la bufanda.
La imagen final que Kling O1 dio:

El resultado final demuestra que Kling O1 funciona bastante bien en términos de transformación de estilo y reemplazo de material.
Sin embargo, hay algunos problemas menores: una porción extra de la bufanda que aparece en el pecho del sujeto y la desaparición de la pajarita. Este tipo de inconsistencias lógicas en la imagen socavan su realismo general.
Prueba 2: Edición iterativa de precisión
La segunda prueba se centró en evaluar la capacidad de Kling O1 para realizar modificaciones precisas e incrementales basadas en una única imagen de referencia.
Esto revelaría si el modelo podía manejar flujos de trabajo de edición complejos sin degradar la calidad o perder el contexto.
En la tabla que he compilado a continuación, pueden ver una comparación lado a lado del rendimiento de Kling O1 en esta prueba:
| Imagen de referencia | Indicación y resultado 1 | Indicación y resultado 2 |
![]() |
![]() Cambia la hora del día a la noche, con iluminación interior cálida de lámparas de techo. No cambies nada más. |
![]() Reemplaza la taza de café por un libro. La mujer ahora debe estar leyendo en lugar de mirar por la ventana. Mantén las mismas características faciales, ropa y fondo. |
| Indicación y resultado 3 | Indicación y resultado 4 | Indicación y resultado 5 |
![]() Añade lluvia ligera visible a través de la ventana. Ajusta el reflejo de la ventana para que muestre las gotas de lluvia. No modifiques la escena interior ni al personaje. |
![]() Cambia su atuendo informal por ropa de negocios profesional: un blazer y una blusa formal. Mantén su pose, rasgos faciales y toda la escena de fondo idénticos. |
![]() Añade otra persona al fondo: un barista trabajando detrás del mostrador. Mantén la misma iluminación, hora del día y todos los demás elementos existentes. |
Los resultados fueron realmente impresionantes. Kling O1 demostró una comprensión excepcional de lo que debía cambiar y lo que debía permanecer constante.
Cada iteración mantuvo una notable consistencia con las versiones anteriores al tiempo que implementaba con precisión las modificaciones solicitadas.
Pensamientos finales: ¿Vale la pena probar Kling O1?
Después de pruebas exhaustivas, el modelo de imagen Kling O1 es claramente una fuerte entrada en el espacio de la generación de imágenes con IA.
El enfoque multimodal funciona muy bien: combinar indicaciones de lenguaje natural con imágenes de referencia crea un flujo de trabajo fluido que se siente colaborativo en lugar de frustrante.
La retención de características es realmente la mejor de su clase, manteniendo las características distintivas de cada fuente al combinar múltiples referencias. La edición paso a paso también es notablemente eficiente, lo que le permite realizar cambios precisos sin perder el contexto.
Para creadores y diseñadores que desean un excelente control y consistencia, el modelo de imagen Kling O1 definitivamente vale la pena probarlo. Trae con éxito la experiencia en vídeo de Kling a imágenes fijas al tiempo que elimina el molesto cambio de herramientas que afecta a muchos procesos creativos de IA.
¿Es perfecto? No. Pero es un debut sólido que demuestra que Kling AI se toma en serio la generación de imágenes.
¿Listo para probarlo tú mismo? Dirígete a Pollo AI para probar el modelo de imagen Kling O1, o explora otros modelos de primer nivel disponibles en el generador de imágenes de Pollo AI para encontrar el que mejor se adapte a tus necesidades. Es una inversión de tiempo que merece la pena para cualquier creador.











