Recientemente tuve la oportunidad de probar el último avance de Google en tecnología de vídeo con IA, Veo 3. Se lanzó el 20 de mayo de 2025, durante su evento I/O 2025 .
Sus flipantes funciones han generado mucho revuelo. Y como alguien que trabaja en la generación de vídeo por IA, estoy deseando compartir mis opiniones y experiencias sinceras con este modelo.

Resumen:
Probé el Veo 3 generando un pódcast y varios vídeos de conciertos. Aunque no es perfecto y tiene algunasতেন fallos raros, es impresionante lo bien que crea vídeos realistas y con el audio sincronizado.
Pero este modelo también me frustraba a veces: la generación de audio y subtítulos no es totalmente controlable, y los textos que genera suelen estar hechos un lío.
| Ventajas | Contras |
| ✔️ Genera vídeo y audio de una sola vez | ❌ Plan de suscripción muy caro |
| ✔️ Sincronización labial y efectos de sonido realistas | ❌ Generación incontrolada de audio y subtítulos |
| ✔️ Elementos visuales de alta calidad con buena física | ❌ Errores visuales frecuentes y texto desordenado |
| ✔️ Integrado en Google Flow |
Vídeo, audio, locución, sincronización labial… Todo de una pasada.
Lo primero que me llamó la atención fue cómo Veo 3 optimiza los múltiples pasos de creación de vídeos en un único proceso simplificado.
Cuando uso Veo 3, me sorprende cómo da vida a mis vídeos con el sonido. Puedo añadir ruidos ambientales como el canto de los pájaros en los árboles o el bullicio de las calles de la ciudad, lo que hace que mis escenas parezcan auténticas.
Lo que más me impresiona es cómo puede crear un diálogo que coincida con los movimientos de los labios de los personajes; es tan natural que a veces no parece generado por IA.
Flujo de trabajo de vídeo con IA redefinido.
Esta nueva capacidad multimodal es sin duda uno de los puntos más destacados de este modelo. Ya no tienes que andar trasteando con la música ni buscar locuciones y sincronización labial por separado.
Esto puede cambiar cómo la gente produce vídeos con IA:
- El flujo de trabajo antiguo: generar vídeos > generar locución/efectos de sonido/música > sincronización labial > edición.
- El nuevo flujo de trabajo con Veo 3: Solo tienes que introducir un texto y todo se encarga solo.
Ejemplos de generación
Estaba impaciente por ver cómo Veo 3 sería capaz de gestionar ciertas solicitudes de vídeo de tendencia, así que le pedí que generara cuatro vídeos únicos.
En el primer ejemplo, solicité un anuncio de un presentador de noticias meteorológicas falso con aspecto auténtico que describiera una invasión de tacos que se abría paso rápidamente hacia los Estados Unidos.
Me sorprendió lo semirrealistas que eran las imágenes. Aunque había algunas distorsiones faciales, el presentador parecía real con una sincronización labial bastante precisa.
El siguiente ejemplo fue un vídeo de humor de un gorila de aspecto realista que hablaba y asistía a un gran partido de fútbol inglés, mientras sostenía un palo de selfi y despotricaba con ira a sus espectadores sobre una decisión injusta del árbitro desde las gradas con otros aficionados.
Fue un resultado curioso, ya que el gorila parecía y sonaba increíblemente real, con expresiones y movimientos corporales naturales. Pero todavía se apreciaban varias distorsiones de fondo.
Para el tercer ejemplo, quise ver qué aspecto tendrían las verduras por dentro si se cortaran por la mitad.
En su mayor parte, mi indicación se siguió con precisión, pero por alguna razón, la herramienta generó verduras cristalizadas, lo que comprometió el realismo visual que buscaba. Por cierto, el sonido es relajante.
En este ejemplo final, le pedí a Veo 3 que produjera una secuencia cinematográfica de viaje en el tiempo de una mujer que viaja al 14 de abril de 1912 e intenta advertir a los pasajeros a bordo del Titanic del hundimiento del barco en el océano Atlántico Norte, cerca de Terranova.
Esta vez, me pareció que la escena estaba sobreactuada y la secuencia de desaparición repentina era innecesaria. Francamente, fue una renderización de vídeo de IA bastante aleatoria e imprecisa.
En líneas generales, a Veo 3 le fue bastante bien. Tuvo algunos fallos en la adherencia a las indicaciones y en la consistencia visual. Por lo tanto, puede que se necesite alguna regeneración de vez en cuando, pero creo que este modelo de IA tiene la capacidad de generar vídeos listos para hacerse virales.
Flow: Un adelanto de la producción de vídeo con IA de última generación.
Google lanzó Flow junto a Veo 3. Es una plataforma de guion gráfico de vídeo por IA que integra Veo 3 y sus modelos de vídeo anteriores, además de un montón de herramientas de generación y edición por IA.

Guion gráfico
El concepto del guion gráfico no es nuevo. Sora lo introdujo, pero se pasó por alto debido a su bajo rendimiento. Google Flow retoma el concepto del guion gráfico y lo hace mucho más útil.
Puedes colocar cualquier clip que hayas subido o generado con la familia de modelos Veo en una línea de tiempo, organizarlos, recortarlos y realizar ediciones básicas. Pero la función más guay es lo que llaman "extensión".
Extensión de vídeo fluido
Así es como funciona: grabas un vídeo de 8 segundos y puedes usar cualquier fotograma como punto de partida para generar una nueva animación que continúe a partir de ese momento.

Lo que es increíble es lo fluida que es la transición entre el contenido original y el nuevo. Flow parece analizar las tendencias de movimiento en el vídeo original en lugar de usar solo una imagen como referencia.
Esta función de extensión es realmente importante porque rompe con los límites de longitud típicos de los vídeos generados por IA. En lugar de limitarte a vídeos cortos, ahora puedes crear vídeos más largos y con una narrativa más elaborada.
Es parecido a lo que prometió Sora , pero la implementación de Google funciona realmente bien, lo suficiente para ser útil.
Pero una cosa a tener en cuenta: ahora mismo, la función de extensión solo funciona con el Veo 2 , no con el más reciente Veo 3.
Impresionante, pero también inconsistente.
Estaba bastante emocionado por las geniales funciones y los impresionantes vídeos que Veo 3 puede ofrecer. Pero, a medida que exploraba más, también noté que algunos vídeos que generé tenían problemas de calidad.
Generaciones de audio y subtítulos no controladas
Algo que me molestó bastante fue lo aleatorio que parecía el audio y la generación de subtítulos. No puedes controlar si aparecerán o no, incluso si lo especificas en tu 'prompt'.
Un ejemplo es este vídeo generado con esta indicación: La chica de 20 años estaba muy angustiada y dijo: «¿Qué pasa? ¿Que un ensayo que he escrito yo me lo han catalogado como generado por IA?». La chica tiene una mano en la cabeza, una expresión de angustia, sin subtítulos.
Le pedí específicamente a la chica que dijera algo y que no hubiera subtítulos en mi indicación. El vídeo salió completamente silencioso, pero con subtítulos.
Y en este ejemplo de vídeo de TikTok para promocionar un cepillo de dientes, tampoco se oye ningún sonido.
Rarezas y fallos
También he notado algunos fallos en los vídeos generados por Veo 3. Esto incluye movimientos extraños o fallos visuales que simplemente no tenían sentido.
Por ejemplo, intenté crear un vídeo de unboxing de un portátil. En lugar de mostrar a alguien abriendo la caja y sacando el portátil, ¡la propia caja de cartón se transformó directamente en un portátil!
Es decepcionante ver que estos problemas de Veo 2 persisten en la nueva versión.
Además, creo que la calidad de sonido general todavía necesita pulirse, y algunos de los efectos de sonido generados suenan raros. Eran detalles menores, pero aun así se notaban al escucharlos con atención.
Texto desordenado
Otro problema era la calidad de la generación de texto. Veo 3 puede generar subtítulos para vídeos, pero el texto a menudo salía desordenado y lleno de faltas de ortografía.
Puedes ver este problema en los ejemplos anteriores. Y aquí tienes más ejemplos para mostrarte lo frecuente que puede ser.



Entiendo que este es un problema común en muchos modelos de IA. Pero, como se ha mencionado, no se puede tener un control total sobre su apariencia. Por lo tanto, es posible que deba intentar generar la imagen varias veces para evitar este problema.
Acceso caro
Otro inconveniente que encontré es que el Veo 3 es supercaro. Solo está disponible para los usuarios suscritos al plan Ultra de Google, que cuesta 249,99 $ al mes.
Ese es un precio elevado. Si eres un usuario ocasional o un creador pequeño que quizá quiera experimentar con este modelo, entonces no creo que esto sea para ti. Esperemos que Google amplíe el acceso u ofrezca opciones más asequibles en el futuro.
¿No puedes usar Veo 3? ¡Prueba Pollo AI!
Si buscas un generador de vídeo con IA de alta calidad pero Veo 3 te resulta inaccesible, ¡tienes que echarle un vistazo a Pollo AI !
Pollo AI es una potente plataforma todo en uno de generación de vídeo e imagen por IA que te permite probar los mejores modelos de vídeo en un solo lugar. Como socio oficial de Google Cloud, ¡ahora puedes probar Veo 3 en Pollo AI y experimentar de primera mano sus capacidades de vanguardia!

Además de Veo 3, la plataforma te permite cambiar sin problemas entre las capacidades únicas de otros modelos de primer nivel como Veo 3.1 , Vidu, Hailuo, Kling y PixVerse, y experimentarlas. Esto proporciona acceso a todos los modelos avanzados que necesitas para crear vídeos impresionantes y de alta calidad.
Además, Pollo AI ofrece un completo paquete de herramientas de vídeo nativas para cubrir todas tus necesidades creativas.
Por ejemplo, puedes probar su innovadora IA de imagen a vídeo, IA de texto a vídeo, referencia a vídeo , IA de vídeo a vídeo y mucho más. Además, puedes aplicar múltiples efectos de vídeo de IA para crear todo tipo de vídeos de IA divertidos e imaginativos.
Reflexiones finales
Como alguien que ha probado la mayoría de las herramientas de generación de vídeo por IA, estoy realmente entusiasmado con la alta calidad que ofrece Veo 3 .
La integración de audio natural, los detalles realistas y el proceso de creación de vídeo simplificado, son todas las características geniales que realmente me impresionan.
Por otro lado, el precio limita su alcance, y todavía hay margen de mejora en la calidad y la consistencia de la generación.
Dicho esto, Veo 3 me sigue ofreciendo una fascinante visión de hacia dónde se dirige la tecnología de vídeo con IA, y tengo curiosidad por ver cómo Google y otras compañías se basan en esta tecnología.
Y también, si estás buscando una plataforma todo en uno de generación de vídeo por IA, ¡te sugiero que pruebes el generador de vídeo Pollo AI !