Google har netop lanceret deres seneste video-genereringsmodel, Veo 3.1, som er bygget på den originale Veo 3.
Veo 3.1 leverer ikke kun forbedret prompt-overholdelse, der sikrer, at din vision bliver til virkelighed med større nøjagtighed, men tilbyder også rigere indbygget lyduafgivelse, der bringer lyd og bevægelse sammen mere naturligt end før.
Den har også introduceret tre nye nøglefunktioner, herunder:
- Ingredienser til Video: Generer en fuld video fra referencebilleder, som låser karakteren og scenestilen fast.
- Billederammer til Video: Skab glatte, naturlige overgange ved at angive den første og sidste billedramme af et skud.
- Udvid Video: Gør korte klip til længere videoer ved at udvide handlingen i et minut eller mere.
Et værktøj til fjernelse med et enkelt klik er også på vej, som vil fjerne uønskede objekter og rekonstruere baggrunden for en ren afslutning.
Googles Veo 3.1 er nu live på Pollo AI video-generator, hvilket giver skabere adgang til forbedrede video-genereringsfunktioner.
Jeg kørte en række tests med fokus på fire centrale opgraderinger: forbedret indbygget lyduafgivelse, Ingredienser til Video og Billederammer til Video. Her er hvad jeg fandt – spoiler: Veo 3.1 er en game-changer.
Sætter Veo 3.1 på prøve
- Generering af indbygget lyd
Prompt: "Et nærbillede af en syde-pande af støbejern i et travlt restaurantkøkken. En kok vender en bøf, og du kan høre snakken fra andre kokke og klirren af gryder og pander i baggrunden."
Resultat: Outputtet var imponerende. Lyden primært – den skarpe, knitrende syden af bøffen – var sprød og i forgrunden. Dog, trods at være eksplicit anmodet i prompten, var den tydelige "snakken fra andre kokke" fraværende. Dette efterlod baggrunden mindre "travl" end forventet, og manglede et centralt menneskeligt element, der ville have gjort lyden virkelig rig og lagdelt.
- Billederammer til Video
Prompt: Ved at bruge den første og sidste billedramme som bogmærker, skab en 10-sekunders glat overgangsvideo, hvor et par går ind på caféen, sætter sig, bestiller kaffe og begynder at snakke livligt, mens natten falder på.
| Start- og slut-billedramme billede | Output Video |
![]() ![]() |
Resultat: Mens karakterer og scene forblev visuelt konsistente, og start/slut-billedrammerne blev brugt som bogmærker, lykkedes det ikke videoen at skabe en glat overgang. Handlinger som bestilling var pludselige (f.eks. dukkede kaffekopper pludselig op), og der var en markant mangel på kontinuitet ind i den sidste billedramme.
- Ingredienser til Video
Prompt: En skægget troldmand i lilla kåber i et stearinlysbelyst stenbibliotek læser en gammel bog, ser pludselig overrasket op, og kaster derefter en besværgelse, der får bøger til at svæve omkring ham
| Referencebilleder | Output Video |
![]() ![]() |
Resultat: Mens den overordnede indstilling og stemning blev fremragende bevaret – med et rigt detaljeret stearinlysbelyst stenbibliotek og atmosfærisk belysning – matchede troldmandens udseende ikke helt referencebilledet.
Hans ansigtstræk og skægstil var mærkbart forskellige, hvilket antyder begrænset troværdighed i karakteroverførslen.
På trods af den indledende uoverensstemmelse viser modellen fremragende tidsmæssig sammenhæng og sceneoverholdelse, hvilket leverer en filmisk og medrivende sekvens, der passer godt til den beskrevne handling.
Endelig dom
Veo 3.1 demonstrerer stærke evner til at gengive konsistente karakterer og scener, og bevarer succesfuldt visuel integritet på tværs af billedrammer og specificerede bogmærker.
Den performer godt med primære handlinger og objekter, og kan generere klare primære lydeffekter. Modellen udviser dog betydelige svagheder i genereringen af dynamisk og nuanceret videoindhold. Den kæmper med:
- Glatte overgange & Kontinuitet: Komplekse, fler-trins handlinger virker ofte pludselige (f.eks. objekter der pludselig dukker op), og overgange mangler kontinuitet, hvilket fører til usammenhængende sekvenser, især ind i slutbilledrammerne.
- Følelsesmæssig nuance: Karakterudtryk og tone kan være inkonsistente eller mangle den specificerede følelsesmæssige dybde (f.eks. et "overrasket" udtryk virker mildt, eller et "grinende" par mangler animation).
- Kompleks objektanimation: Interaktioner, der involverer flere objekter (som svævende bøger), kan virke stive, mekaniske, eller objekter kan "poppe" frem i stedet for at bevæge sig organisk.
- Lagdelt lyd: Mens primære lyde er gode, forbliver genereringen af distinkte sekundære eller baggrundslydelementer, selv når de specifikt er bedt om, en udfordring, hvilket påvirker lydbilledets rigdom.
Hvorfor bruge Veo 3.1 på Pollo AI?
Pollo AI samler det bedste inden for AI-video-generering – alt sammen under ét tag. Tænk på det som dit kreative kontrolcenter, hvor kraft møder fleksibilitet.
Du er ikke låst fast til kun én tilstand som Veo 3.1. På Pollo AI kan du skifte mellem top-tier-motorer som Sora 2, Veo 3, Kling 2.5 Turbo, Wan 2.5, Seedance og andre – når som helst.
Det betyder, at hvis du elsker Veo 3.1's realisme og historie-dybde (som, i øvrigt, er fantastisk), kan du bruge det præcis, når det passer – og derefter skifte til en anden model for hastighed, stil eller detaljer. Ingen grænser. Ingen kompromiser.
Derudover har den alle de vigtigste AI-video-genereringsfunktioner:
- Bring billeder til live med vores billede til video AI.
- Omdan manuskripter til fantastiske billeder med tekst til video AI.
- Skab fængslende klip med AI avatar video-generator.
- Skab beroligende klip i dyre-, dyr- eller anime-stil med AI short video-generator.
- Efterlign enhver bevægelse fra referencevideoen med Pollo Mimic.
Oplev Pollo AI i dag, og lås op for det fulde potentiale af AI-drevet videoproduktion.



