Test du Google Veo 3.1 : J’ai testé le Google Veo 3.1 et je l’ai trouvé impressionnant, bien qu’imparfait.

Google vient de dévoiler son dernier modèle de génération vidéo, Veo 3.1, qui a été construit sur le Veo 3 original.

Veo 3.1 offre non seulement une meilleure adhérence aux instructions, garantissant que votre vision prenne vie avec plus de précision, mais propose également une sortie audio native plus riche, combinant son et mouvement de manière plus naturelle qu'auparavant.

Il a également introduit trois nouvelles fonctionnalités clés, notamment :

Ingrédients vers Vidéo : Générez une vidéo complète à partir d'images de référence, en verrouillant le style du personnage et de la scène.
Images fixes vers Vidéo : Créez des transitions fluides et naturelles en fournissant les images fixes de début et de fin d'un plan.
Étendre la Vidéo : Transformez de courts clips en vidéos plus longues en prolongeant l'action pendant une minute ou plus.

Un outil de suppression en un clic est également en préparation, qui effacera les objets indésirables et reconstruira l'arrière-plan pour une finition propre.

Veo 3.1 de Google est désormais disponible sur le générateur de vidéo Pollo AI, offrant aux créateurs un accès à des capacités de génération vidéo améliorées.

J'ai effectué une série de tests axés sur quatre améliorations clés : la sortie audio native améliorée, les Ingrédients vers Vidéo et les Images fixes vers Vidéo. Voici ce que j'ai trouvé — spoiler : Veo 3.1 change la donne.

Mise à l'épreuve de Veo 3.1

Génération Audio Native

Instruction : « Gros plan d'une poêle en fonte crépitante dans une cuisine de restaurant animée. Un chef retourne un steak, et vous pouvez entendre le brouhaha des autres cuisiniers et le cliquetis des casseroles et des poêles en arrière-plan. »

Résultat : Le résultat était impressionnant. Le son principal — le crépitement aigu et vif du steak — était net et au premier plan. Cependant, malgré sa demande explicite dans l'instruction, le « brouhaha des autres cuisiniers » distinct était absent. Cela a laissé l'arrière-plan moins « animé » qu'anticipé, manquant d'un élément humain clé qui aurait rendu l'audio vraiment riche et superposé.

Images fixes vers Vidéo

Instruction : En utilisant les images fixes de début et de fin comme marqueurs, créez une vidéo de transition fluide de 10 secondes où un couple entre dans le café, s'assoit, commande du café et commence à discuter animément alors que la nuit tombe.

Image de début et de fin	Vidéo de sortie

Résultat : Alors que les personnages et la scène sont restés visuellement cohérents, et que les images fixes de début et de fin ont été utilisées comme marqueurs, la vidéo n'a pas réussi à créer une transition fluide. Les actions comme commander étaient abruptes (par exemple, les tasses de café sont apparues soudainement), et il y a eu un manque important de continuité vers l'image finale.

Ingrédients vers Vidéo

Instruction : Un sorcier barbu en robe violette dans une bibliothèque en pierre éclairée aux chandelles lit un ancien grimoire, lève soudainement la tête surpris, puis lance un sortilège qui fait flotter des livres autour de lui.

Images de référence	Vidéo de sortie

Résultat : Bien que le cadre général et l'ambiance aient été excellemment maintenus — avec une bibliothèque en pierre éclairée aux chandelles richement détaillée et un éclairage d'ambiance — l'apparence du sorcier ne correspondait pas entièrement à l'image de référence.

Ses traits du visage et le style de sa barbe différaient sensiblement, suggérant une fidélité limitée dans le transfert du personnage.

Malgré la déconnexion initiale, le modèle fait preuve d'une excellente cohérence temporelle et d'une bonne adhérence à la scène, offrant une séquence cinématographique et immersive qui correspond bien à l'action décrite.

Verdict final

Veo 3.1 démontre de solides capacités dans le rendu de personnages et de scènes cohérents, en maintenant avec succès l'intégrité visuelle à travers les images fixes et les marqueurs spécifiés.

Il fonctionne bien avec les actions et objets principaux, et peut générer des effets audio primaires clairs. Cependant, le modèle présente des faiblesses significatives dans la génération de contenu vidéo dynamique et nuancé. Il a des difficultés avec :

Transitions fluides et continuité : Les actions complexes en plusieurs étapes apparaissent souvent abruptes (par exemple, des objets apparaissent soudainement), et les transitions manquent de continuité, entraînant des séquences décousues, en particulier vers les images finales.
Nuance émotionnelle : Les expressions des personnages et le ton peuvent être incohérents ou manquer de la profondeur émotionnelle spécifiée (par exemple, un regard « surpris » apparaissant faible, ou un couple « riant » manquant d'animation).
Animation d'objets complexes : Les interactions impliquant plusieurs objets (comme des livres flottants) peuvent paraître rigides, mécaniques, ou les objets peuvent apparaître soudainement plutôt que de bouger organiquement.
Audio superposé : Bien que les sons primaires soient bons, la génération d'éléments audio secondaires ou d'arrière-plan distincts, même lorsqu'ils sont explicitement demandés, reste un défi, impactant la richesse du paysage sonore.

Pourquoi utiliser Veo 3.1 sur Pollo AI ?

Pollo AI réunit le meilleur de la génération vidéo par IA — tout sous un même toit. Considérez-le comme votre centre de contrôle créatif, où la puissance rencontre la flexibilité.

Vous n'êtes pas limité à un seul mode comme Veo 3.1. Sur Pollo AI, vous pouvez basculer entre des moteurs de premier plan comme Sora 2, Veo 3, Kling 2.5 Turbo, Wan 2.5, Seedance, et d'autres — à tout moment.

Cela signifie que si vous aimez le réalisme et la profondeur narrative de Veo 3.1 (qui, d'ailleurs, est incroyable), vous pouvez l'utiliser exactement quand cela convient — puis passer à un autre modèle pour la vitesse, le style ou les détails. Aucune limite. Aucun compromis.

De plus, il dispose de toutes les fonctionnalités clés de génération vidéo par IA :

Donnez vie à des photos avec notre IA d'image à vidéo.
Transformez des scripts en visuels époustouflants avec l'IA de texte à vidéo.
Créez des clips convaincants avec le générateur de vidéo d'avatar IA.
Créez des clips apaisants, animaliers ou de style anime avec le générateur de courtes vidéos IA.
Imitez tout mouvement de la vidéo de référence avec Pollo Mimic.

Découvrez Pollo AI dès aujourd'hui et libérez tout le potentiel de la création vidéo pilotée par l'IA.

Test du Google Veo 3.1 : J’ai testé le Google Veo 3.1 et je l’ai trouvé impressionnant, bien qu’imparfait.

Mise à l'épreuve de Veo 3.1

Verdict final

Pourquoi utiliser Veo 3.1 sur Pollo AI ?

Vous pourriez aussi aimer

Mon avis sur le Générateur PixAI AI Art : comment il facilite la création artistique

Test honnête de Dreamina AI : elle n'est pas aussi puissante qu'elle le prétend

Test du générateur de vidéo PixVerse AI : mon expérience

Test de HeyGen AI : Le générateur vidéo HeyGen AI est-il à la hauteur de sa réputation ? Voici mon avis.

SUR CETTE PAGE