J'ai récemment eu l'occasion de tester Veo 3, la dernière innovation de Google en matière de technologie vidéo IA. Elle a été lancée le 20 mai 2025, lors de leur événement I/O 2025 .
Ses fonctionnalités innovantes ont suscité un vif intérêt. En tant que spécialiste de la génération vidéo par IA, je suis impatient de partager mes impressions et mon expérience avec ce modèle.

TL;DR
J'ai testé Veo 3 en générant un podcast et plusieurs vidéos de concerts. Bien qu'il ne soit pas parfait et qu'il présente quelques bugs étranges, la qualité des vidéos réalistes et du son synchronisé est impressionnante.
Mais ce modèle m'a aussi parfois frustré : la génération audio et de sous-titres n'est pas entièrement contrôlable, et les textes générés sont fréquemment erronés.
| Avantages | Cons |
| ✔️ Génère la vidéo et l'audio en une seule opération | ❌ Formule d'abonnement très chère |
| ✔️ Synchronisation labiale et effets sonores réalistes | ❌ Génération audio et de sous-titres non contrôlée |
| ✔️ Des graphismes de haute qualité et une physique réaliste | ❌ Fréquents défauts d'affichage et texte brouillé |
| ✔️ Intégré à Google Flow |
Vidéo, audio, voix off, synchronisation labiale… Tout en une seule fois
La première chose que j'ai remarquée, c'est comment Veo 3 simplifie les multiples étapes de création vidéo en un seul processus.
Quand j'utilise Veo 3, je suis bluffé par la façon dont il donne vie à mes vidéos grâce au son. Je peux ajouter des bruits d'ambiance, comme le chant des oiseaux dans les arbres ou l'animation des rues, ce qui rend mes scènes vraiment authentiques.
Ce qui m'impressionne le plus, c'est sa capacité à créer des dialogues qui correspondent aux mouvements des lèvres des personnages ; c'est tellement naturel que parfois, on ne dirait pas que c'est généré par une IA.
Flux de travail vidéo IA redéfini
Cette nouvelle fonctionnalité multimodale est sans conteste l'un des atouts majeurs de ce modèle. Plus besoin de gérer la musique, les voix off ni la synchronisation labiale séparément.
Cela peut changer la façon dont les gens produisent des vidéos avec l'IA :
- L'ancien flux de travail : Générer des vidéos > générer la voix off/les effets sonores/la musique > synchronisation labiale > montage.
- Le nouveau flux de travail avec Veo 3: il suffit de saisir une invite de texte, et tout est pris en charge.
Exemples de génération
J'étais impatient de voir comment Veo 3 allait gérer certaines demandes de vidéos populaires, alors je lui ai demandé de générer quatre vidéos uniques.
Dans le premier exemple, j'ai demandé une fausse annonce météo d'apparence authentique décrivant une invasion de tacos qui déferle rapidement sur les États-Unis.
J'ai été surpris par le réalisme relatif des images. Malgré quelques distorsions faciales, le présentateur paraissait très naturel et la synchronisation labiale était plutôt réussie.
L'exemple suivant était celui d'une vidéo humoristique mettant en scène un gorille réaliste et parlant assistant à un grand match de football anglais, brandissant une perche à selfie et s'en prenant avec colère à ses spectateurs au sujet d'une décision injuste de l'arbitre, alors qu'il se trouvait dans les tribunes avec d'autres supporters.
Le résultat était étonnant : le gorille paraissait incroyablement réaliste, tant par son apparence que par sa voix, avec des expressions et des mouvements naturels. Cependant, plusieurs distorsions en arrière-plan restaient perceptibles.
Pour le troisième exemple, je voulais voir à quoi ressemblerait l'intérieur des légumes s'ils étaient coupés en deux.
Dans l'ensemble, mes instructions ont été suivies à la lettre, mais pour une raison inconnue, l'outil a affiché des légumes cristallisés, ce qui a nui au réalisme visuel recherché. Le son est relaxant, au passage.
Dans ce dernier exemple, j'ai demandé à Veo 3 de produire une séquence cinématographique de voyage dans le temps d'une femme qui voyage dans le temps jusqu'au 14 avril 1912 et tente d'avertir les passagers à bord du Titanic du naufrage du navire dans l'océan Atlantique Nord, près de Terre-Neuve.
Cette fois-ci, j'ai trouvé la scène exagérée et la disparition soudaine inutile. Franchement, le rendu vidéo par IA était assez aléatoire et imprécis.
Dans l'ensemble, Veo 3 s'en est plutôt bien sorti. On note quelques petits problèmes de réactivité et de cohérence visuelle. Une régénération ponctuelle pourrait donc s'avérer nécessaire, mais je pense que ce modèle d'IA a le potentiel de générer des vidéos virales.
Flow: Un aperçu de la production vidéo par IA de nouvelle génération
Google a lancé Flow en même temps que Veo 3. Il s'agit d'une plateforme de storyboard vidéo basée sur l'IA qui intègre Veo 3 et ses modèles vidéo précédents, ainsi que de nombreux outils de génération et d'édition basés sur l'IA.

Storyboard
Le concept de storyboard n'est pas nouveau. Sora l'a introduit, mais il est resté confidentiel en raison de ses faibles performances. Google Flow reprend ce concept et le rend bien plus utile.
Vous pouvez placer sur une timeline tous les clips que vous avez importés ou générés par les modèles de la famille Veo , les agencer, les découper et effectuer des montages basiques. Mais la fonctionnalité la plus intéressante est ce qu'ils appellent « extension ».
Extension vidéo fluide
Voici comment ça marche : vous prenez une vidéo de 8 secondes et vous pouvez utiliser n’importe quelle image comme point de départ pour générer une nouvelle animation qui continue à partir de ce moment.

Ce qui est remarquable, c'est la fluidité de la transition entre le contenu original et le nouveau. Flow semble analyser les tendances de mouvement de la vidéo originale plutôt que de se baser sur une simple image de référence.
Cette extension est essentielle car elle permet de s'affranchir des limites de longueur habituelles des vidéos générées par IA. Au lieu d'être limité à de courts clips, vous pouvez désormais créer des vidéos plus longues et plus narratives.
C'est similaire à ce que Sora avait promis, mais l'implémentation de Google fonctionne suffisamment bien pour être utile.
Mais il convient de noter une chose : actuellement, la fonctionnalité d’extension ne fonctionne qu’avec Veo 2 , et non avec le Veo 3 plus récent.
Impressionnant, mais aussi incohérent
J'étais vraiment enthousiaste à l'idée des fonctionnalités intéressantes et des superbes vidéos que Veo 3 peut produire. Mais en explorant davantage le logiciel, j'ai également constaté que certaines vidéos que j'avais générées présentaient des problèmes de qualité.
Générations audio et de sous-titres non contrôlées
Ce qui m'a vraiment agacé, c'est le côté aléatoire de la génération audio et des sous-titres. Impossible de contrôler leur affichage, même en le spécifiant dans l'invite de commande.
Voici un exemple : une vidéo générée à partir de la question suivante montre une jeune fille de 20 ans, très perturbée, demandant : « Qu'est-ce qui se passe ? On a déterminé qu'une dissertation que j'ai écrite moi-même avait été générée par une IA ? » La jeune fille a la main sur la tête, l'air anxieux, sans légende.
J'avais spécifiquement demandé que la fille parle, sans légende. La vidéo est sortie muette, mais avec des sous-titres.
Et dans cet exemple de vidéo TikTok faisant la promotion d'une brosse à dents, on n'entend également aucun son.
Bizarreries et bugs
J'ai également remarqué quelques problèmes dans les vidéos générées par Veo 3. Il s'agit notamment de mouvements étranges ou de bugs visuels qui n'avaient tout simplement aucun sens.
Par exemple, j'ai essayé de créer une vidéo de déballage d'ordinateur portable. Au lieu de montrer quelqu'un ouvrant la boîte et sortant l'ordinateur, la boîte en carton s'est transformée directement en ordinateur portable !
Il est décevant de constater que ces problèmes de Veo 2 persistent dans la nouvelle version.
De plus, je trouve que la qualité sonore globale nécessite encore des améliorations, et certains effets sonores sonnent étrangement. Ces défauts étaient mineurs, mais tout de même perceptibles à l'écoute attentive.
Texte brouillé
Un autre problème résidait dans la qualité de la génération de texte. Veo 3 peut générer des sous-titres pour les vidéos, mais le texte était souvent confus et truffé de fautes d'orthographe.
Vous pouvez constater ce problème dans les exemples précédents. Voici d'autres exemples pour vous montrer à quel point il peut être fréquent.



Je comprends que ce problème est fréquent chez de nombreux modèles d'IA. Cependant, comme indiqué, vous ne pouvez pas contrôler entièrement leur apparence. Il vous faudra peut-être effectuer plusieurs générations pour éviter ce problème.
Accès coûteux
Un autre inconvénient que j'ai constaté est le prix exorbitant de Veo 3. Ce produit n'est disponible que pour les abonnés au forfait Google Ultra, qui coûte 249,99 $ par mois.
C'est un prix élevé. Si vous êtes un utilisateur occasionnel ou un petit créateur qui souhaite simplement tester ce modèle, alors je ne pense pas que ce soit fait pour vous. Espérons que Google élargira l'accès ou proposera des options plus abordables à l'avenir.
Impossible d'utiliser Veo 3? Essayez Pollo AI!
Si vous recherchez un générateur vidéo IA de haute qualité mais que Veo 3 vous est inaccessible, vous devriez absolument jeter un œil à Pollo AI !
Pollo AI est une plateforme puissante et complète de génération vidéo et d'images par IA qui vous permet de tester les meilleurs modèles vidéo en un seul endroit. En tant que partenaire officiel de Google Cloud, vous pouvez désormais essayer Veo 3 sur Pollo AI et découvrir ses fonctionnalités de pointe !

Outre Veo 3, la plateforme vous permet de passer facilement d'un logiciel à l'autre et de profiter des fonctionnalités uniques d'autres modèles haut de gamme comme Veo 3.1 , Vidu, Hailuo, Kling et PixVerse. Vous avez ainsi accès à tous les modèles avancés nécessaires pour créer des vidéos exceptionnelles de haute qualité.
De plus, Pollo AI propose une suite complète d'outils vidéo natifs pour couvrir tous vos besoins créatifs.
Par exemple, vous pouvez tester ses fonctionnalités innovantes d'IA : conversion d'images en vidéos, de textes en vidéos, de références vidéo, de vidéos entre elles , et bien plus encore. De plus, vous pouvez appliquer de nombreux effets vidéo IA pour créer toutes sortes de vidéos amusantes et originales.
Réflexions finales
Ayant testé la plupart des outils de génération vidéo par IA, je suis vraiment impressionné par la haute qualité offerte par Veo 3 .
L'intégration audio naturelle, les détails réalistes et le processus de création vidéo simplifié, ce sont toutes ces fonctionnalités géniales qui m'impressionnent vraiment.
En revanche, son prix limite sa diffusion, et il reste des marges de progression en matière de qualité et de régularité de la production.
Cela dit, Veo 3 me donne tout de même un aperçu fascinant de l'évolution de la technologie vidéo basée sur l'IA, et je suis curieux de voir comment Google et d'autres entreprises vont s'appuyer sur ces bases.
Et si vous recherchez une plateforme de génération vidéo IA tout-en-un, je vous suggère d'essayer le générateur vidéo Pollo AI !