Página principal/Blog/Reseñas/Análisis de Google Veo 3.1 : He probado Google Veo 3.1 y lo he encontrado impresionante, aunque imperfecto.

Análisis de Google Veo 3.1 : He probado Google Veo 3.1 y lo he encontrado impresionante, aunque imperfecto.

Google acaba de presentar su último modelo de generación de vídeo, Veo 3.1, que se construyó sobre el Veo 3 original.

Veo 3.1 no solo ofrece una mejor adherencia a las indicaciones, asegurando que tu visión cobre vida con mayor precisión, sino que también ofrece una salida de audio nativa más rica, uniendo sonido y movimiento de forma más natural que antes.

También ha introducido tres nuevas características clave, que incluyen:

  • Ingredientes a Vídeo: Genera un vídeo completo a partir de imágenes de referencia, fijando el estilo del personaje y la escena.
  • Fotogramas a Vídeo: Crea transiciones fluidas y naturales proporcionando los fotogramas inicial y final de una toma.
  • Extender Vídeo: Convierte clips cortos en vídeos más largos extendiendo la acción durante un minuto o más.

También está en camino una herramienta de eliminación con un solo clic, que borrará objetos no deseados y reconstruirá el fondo para un acabado limpio.

Veo 3.1 de Google ya está disponible en el generador de vídeo Pollo AI, ofreciendo a los creadores acceso a capacidades de generación de vídeo mejoradas.

Realicé una serie de pruebas centrándome en cuatro mejoras clave: salida de audio nativa mejorada, Ingredientes a Vídeo y Fotogramas a Vídeo. Esto es lo que encontré: spoiler: Veo 3.1 cambia las reglas del juego.

Poniendo Veo 3.1 a Prueba

  1. Generación de Audio Nativo

Indicación: "Un primer plano de una sartén de hierro fundido chisporroteante en la bulliciosa cocina de un restaurante. Un chef voltea un filete, y se puede oír el parloteo de otros cocineros y el estrépito de ollas y sartenes al fondo."

Resultado: La salida fue impresionante. El sonido principal —el agudo y crepitante chisporroteo del filete— era nítido y estaba al frente y al centro. Sin embargo, a pesar de haber sido solicitado explícitamente en la indicación, el "parloteo de otros cocineros" distintivo estaba ausente. Esto dejó el fondo sintiéndose menos "bullicioso" de lo esperado, faltando un elemento humano clave que habría hecho el audio realmente rico y con capas.

  1. Fotogramas a Vídeo

Indicación: Utilizando los fotogramas inicial y final como puntos de referencia, crea un vídeo de transición suave de 10 segundos donde una pareja entra en la cafetería, se sienta, pide café y empieza a charlar animadamente mientras cae la noche.

Imagen de inicio y fin de fotograma Vídeo de salida
1
2

Resultado: Si bien los personajes y la escena se mantuvieron visualmente consistentes, y los fotogramas de inicio/fin se utilizaron como puntos de referencia, el vídeo no logró crear una transición suave. Acciones como pedir eran abruptas (por ejemplo, las tazas de café aparecían de repente), y hubo una falta significativa de continuidad hacia el fotograma final.

  1. Ingredientes a Vídeo

Indicación: Un mago barbudo con túnicas púrpuras en una biblioteca de piedra iluminada por velas lee un antiguo tomo, de repente levanta la vista sorprendido, y luego lanza un hechizo que hace que los libros floten a su alrededor.

Imágenes de referencia Vídeo de salida
3
4

Resultado: Si bien el escenario y el ambiente generales se mantuvieron excelentemente —con una biblioteca de piedra iluminada por velas ricamente detallada y una iluminación atmosférica— la apariencia del mago no coincidió completamente con la imagen de referencia.

Sus rasgos faciales y el estilo de su barba diferían notablemente, lo que sugiere una fidelidad limitada en la transferencia del personaje.

A pesar del desajuste inicial, el modelo demuestra una excelente coherencia temporal y adherencia a la escena, entregando una secuencia cinematográfica e inmersiva que se alinea bien con la acción descrita.

Veredicto Final

Veo 3.1 demuestra sólidas capacidades para renderizar personajes y escenas consistentes, manteniendo con éxito la integridad visual a través de los fotogramas y los puntos de referencia especificados.

Funciona bien con las acciones y objetos principales, y puede generar efectos de audio primarios claros. Sin embargo, el modelo muestra debilidades significativas en la generación de contenido de vídeo dinámico y matizado. Lucha con:

  1. Transiciones Suaves y Continuidad: Las acciones complejas y de varios pasos a menudo aparecen abruptas (por ejemplo, objetos que aparecen de repente), y las transiciones carecen de continuidad, lo que lleva a secuencias inconexas, particularmente hacia los fotogramas finales.
  2. Matiz Emocional: Las expresiones de los personajes y el tono pueden ser inconsistentes o carecer de la profundidad emocional especificada (por ejemplo, una mirada "sorprendida" que parece leve, o una pareja "riendo" que carece de animación).
  3. Animación de Objetos Complejos: Las interacciones que involucran múltiples objetos (como libros flotantes) pueden parecer rígidas, mecánicas, o que los objetos "aparecen" en lugar de moverse orgánicamente.
  4. Audio en Capas: Si bien los sonidos principales son buenos, la generación de elementos de audio secundarios o de fondo distintivos, incluso cuando se solicitan explícitamente, sigue siendo un desafío, lo que afecta la riqueza del paisaje sonoro.

¿Por qué usar Veo 3.1 en Pollo AI?

Pollo AI reúne lo mejor de la generación de vídeo con IA, todo bajo un mismo techo. Piénsalo como tu centro de control creativo, donde la potencia se une a la flexibilidad.

No estás limitado a un solo modo como Veo 3.1. En Pollo AI, puedes cambiar entre motores de primer nivel como Sora 2, Veo 3, Kling 2.5 Turbo, Wan 2.5, Seedance y otros, en cualquier momento.

Eso significa que si te encanta el realismo y la profundidad narrativa de Veo 3.1 (que, por cierto, es increíble), puedes usarlo exactamente cuando encaje; luego cambiar a otro modelo por velocidad, estilo o detalle. Sin límites. Sin concesiones.

Además, cuenta con todas las características clave de generación de vídeo con IA:

Prueba Pollo AI hoy mismo y desbloquea todo el potencial de la creación de vídeo impulsada por IA.

También te podría gustar

Ver más

Reseña de Gemini Omni : Probé Gemini Omni y me conquistó.

Gemini Omni es uno de los modelos de vídeo con IA más comentados actualmente. Lo probé personalmente y en esta reseña comparto mis impresiones sobre Gemini funciones, calidad de vídeo y consistencia.

Análisis de Adobe Firefly : He probado Adobe Firefly y tengo noticias interesantes que compartir al respecto.

¿Quieres usar Adobe Firefly? Antes de hacerlo, te sugiero que eches un vistazo a mi análisis detallado de su generador de imágenes y vídeo por IA para ver qué me gustó y qué no durante mi experiencia con él.

Reseña de Pictory AI : Probé Pictory AI y mi impresión honesta sobre sus capacidades podría sorprenderte.

¿Planeas usar Pictory AI? ¡Lee mi reseña de la herramienta de producción de video con IA, donde exploro sus diversas funciones y te cuento mi experiencia personal en detalle!

Reseña de Steve AI: he probado Steve AI, he descubierto que no es la mejor opción para proyectos de vídeo creativos y te cuento por qué.

¿Quieres usar Steve AI? Antes de hacerlo, quiero que me acompañes a explorar las capacidades del generador de video de Steve AI, incluyendo mi experiencia personal usándolo.