Jeg hadde nylig muligheten til å teste ut Googles nyeste sprang innen AI-videoteknologi, Veo 3. Den ble utgitt 20. mai 2025 under I/O 2025-arrangementet deres.
De kule funksjonene har skapt mye oppsikt. Og som en som jobber med AI-videogenerering, er jeg ivrig etter å dele mine ærlige tanker og erfaringer med denne modellen.

TL;DR
Jeg testet Veo 3 ved å generere en podkast og flere konsertvideoer. Selv om den ikke er perfekt og har noen rare feil, er det imponerende hvor godt den lager realistiske videoer og synkronisert lyd.
Men jeg ble også frustrert av denne modellen noen ganger: lyd- og tekstgenereringen er ikke fullt kontrollerbar, og tekstene den genererte er ofte rotete.
| Fordeler | Ulemper |
| ✔️ Genererer video og lyd i én omgang | ❌ Veldig dyrt abonnement |
| ✔️ Realistisk leppesynkronisering og lydeffekter | ❌ Ukontrollert lyd- og tekstgenerering |
| ✔️ Grafikk av høy kvalitet med god fysikk | ❌ Hyppige synlige særegenheter og rotete tekst |
| ✔️ Integrert i Google Flow |
Video, lyd, voiceover, leppesynkronisering, … alt i én omgang
Det første jeg la merke til var hvordan Veo 3 strømlinjeformer flere trinn i videoproduksjon i én enkel prosess.
Når jeg bruker Veo 3, blir jeg overrasket over hvor mye lyd det gir liv til videoene mine. Jeg kan legge til omgivelseslyder som fuglesang i trærne eller den travle lyden fra bygatene, noe som virkelig gjør at scenene mine føles autentiske.
Det som imponerer meg mest er hvordan den kan skape dialog som matcher karakterenes leppebevegelser – det er så naturlig at det noen ganger ikke ser ut som det er AI-generert.
AI-videoarbeidsflyt omdefinert
Denne nye multimodale funksjonen er definitivt et av de viktigste høydepunktene med denne modellen. Du trenger ikke lenger å rote med musikk eller finne voiceovers og lip sync separat.
Dette kan endre hvordan folk produserer videoer med AI:
- Den gamle arbeidsflyten: Generer videoer > generer voiceover/lydeffekter/musikk > leppesynkronisering > redigering.
- Den nye arbeidsflyten med Veo 3: Bare skriv inn en tekstmelding, så er alt ordnet.
Generasjonseksempler
Jeg var ivrig etter å se hvordan Veo 3 ville klare å håndtere visse forespørsler om trendvideoer, så jeg ba den generere fire unike videoer.
I det første eksemplet ba jeg om en falsk værmelding som så autentisk ut og beskrev en invasjon av tacoer som raskt var på vei inn i USA.
Jeg ble overrasket over hvor semi-realistisk opptakene var. Selv om det var noen ansiktsforvrengninger, så kommentatoren naturtro ut med ganske nøyaktig leppesynkronisering.
Det neste eksemplet var en nyhetsvideo av en realistisk utseende, snakkende gorilla som er på en stor engelsk fotballkamp, mens han holder opp en selfiestang og raser sint til seerne sine om en urettferdig avgjørelse fra dommeren mens han er på tribunen med andre fans.
Dette var et morsomt resultat, ettersom gorillaen så ut og hørtes utrolig naturtro ut med naturlige uttrykk og kroppsbevegelser. Men det var flere bakgrunnsforvrengninger som fortsatt var merkbare.
For det tredje eksemplet ville jeg se hvordan det ville se ut inni grønnsaker hvis de ble delt i to.
For det meste ble oppfordringen min fulgt nøyaktig, men av en eller annen grunn gjenga verktøyet krystalliserte grønnsaker, noe som gikk utover den visuelle realismen jeg ønsket. Lyden er forresten avslappende.
I dette siste eksemplet ba jeg Veo 3 om å produsere en tidsreise-filmsekvens av en kvinne som reiser tilbake til 14. april 1912 og forsøker å advare passasjerene om bord på Titanic om skipets forlis i Nord-Atlanteren, nær Newfoundland.
Denne gangen syntes jeg scenen var overdrevet, og den plutselige forsvinnende sekvensen var unødvendig. Helt ærlig, det var en ganske tilfeldig og unøyaktig AI-videogjengivelse.
Alt i alt gjorde Veo 3 det stort sett ganske greit. Det var noen få feil med rask overholdelse og visuell konsistens. Så det kan være behov for litt regenerering fra tid til annen, men jeg tror at denne AI-modellen har kapasitet til å generere virale videoer.
Flow: En sniktitt på neste generasjons AI-videoproduksjon
Google lanserte Flow sammen med Veo 3. Det er en AI-videostoryboardplattform som integrerer Veo 3 og de foregående videomodellene, samt en rekke AI-genererings- og redigeringsverktøy.

Storyboard
Storyboard-konseptet er ikke nytt. Sora introduserte det, men det ble oversett på grunn av dårlig ytelse. Google Flow tar storyboard-konseptet og gjør det mye mer nyttig.
Du kan plassere alle klipp du har lastet opp eller generert av Veo-modellfamilien på en tidslinje, arrangere dem, trimme dem og utføre grunnleggende redigering. Men den kuleste funksjonen er det de kaller «utvidelse».
Smooth Video-utvidelse
Slik fungerer det: du tar en 8-sekunders video og kan bruke et hvilket som helst bilde som utgangspunkt for å generere ny animasjon som fortsetter fra det øyeblikket.

Det som er utrolig er hvor smidig overgangen er mellom det originale og det nye innholdet. Flow ser ut til å analysere bevegelsestrender i den originale videoen i stedet for bare å bruke et enkelt bilde som referanse.
Denne utvidelsesfunksjonen er veldig viktig fordi den bryter forbi de typiske lengdegrensene for AI-genererte videoer. I stedet for å sitte fast med korte klipp, kan du nå lage lengre, mer fortellende videoer.
Det ligner på det Sora lovet, men Googles implementering fungerer faktisk bra nok til å være nyttig.
Men én ting å merke seg: akkurat nå fungerer utvidelsesfunksjonen bare med Veo 2 , ikke den nyere Veo 3.
Imponerende, men også inkonsekvent
Jeg var ganske begeistret for de kule funksjonene og de fantastiske videoene Veo 3 kan levere. Men etter hvert som jeg utforsket det nærmere, la jeg også merke til at noen av videoene jeg genererte hadde kvalitetsproblemer.
Ukontrollerte lyd- og tekstgenerasjoner
En ting som virkelig plaget meg var hvor tilfeldig genereringen av lyd og teksting føltes. Du kan ikke kontrollere om de skal vises eller ikke, selv om du spesifiserer det i ledeteksten.
Et eksempel er denne videoen generert med denne ledeteksten: Den 20 år gamle jenta var veldig opprørt og sa: «Hva er galt? Et essay jeg skrev selv viste seg å være AI-generert?» Jenta har en hånd på hodet, et engstelig uttrykk, ingen teksting.
Jeg ba spesifikt om at jenta skulle si noe, men uten teksting i prompten min. Videoen kom ut helt lydløs, men med teksting.
Og i dette TikTok-videoeksemplet som promoterer en tannbørste, kan du heller ikke høre noen lyd.
Særegenheter og feil
Jeg la også merke til noen feil i videoene som ble generert av Veo 3. Dette inkluderer vanskelige bevegelser eller visuelle feil som rett og slett ikke ga mening.
For eksempel prøvde jeg å lage en video der jeg åpnet esken og tok ut den bærbare datamaskinen. I stedet for å vise noen som faktisk åpnet esken og tok ut den bærbare datamaskinen, ble selve pappesken forvandlet til en bærbar datamaskin!
Det er skuffende å se at disse problemene fra Veo 2 fortsatt henger igjen i den nye versjonen.
Jeg synes også at den generelle lydkvaliteten fortsatt trenger forbedring, og noen av lydeffektene som genereres høres rare ut. Disse var små, men fortsatt merkbare når jeg hørte dem nøye.
Usammenhengende tekst
Et annet problem var kvaliteten på tekstgenereringen. Veo 3 kan generere teksting for videoer, men teksten var ofte rotete og full av stavefeil.
Du kan se dette problemet i de foregående eksemplene. Og her er flere eksempler som viser deg hvor hyppig det kan være.



Jeg forstår at dette er et vanlig problem på tvers av mange AI-modeller. Men som nevnt kan du ikke ha full kontroll over utseendet deres. Så du må kanskje prøve å generere noen ganger til for å unngå dette problemet.
Dyr tilgang
En annen ulempe jeg fant er at Veo 3 er superdyr. Den er bare tilgjengelig for brukere som abonnerer på Googles Ultra-abonnement, som koster 249,99 dollar per måned.
Det er en høy pris. Hvis du bare er en vanlig bruker eller en liten skaper som kanskje vil eksperimentere med denne modellen, tror jeg ikke dette er noe for deg. Forhåpentligvis vil Google utvide tilgangen eller tilby rimeligere alternativer i fremtiden.
Kan du ikke bruke Veo 3? Prøv Pollo AI!
Hvis du leter etter en AI-videogenerator av høy kvalitet, men synes Veo 3 er utilgjengelig, bør du absolutt ta en titt på Pollo AI !
Pollo AI er en kraftig alt-i-ett-plattform for AI-video- og bildegenerering som lar deg prøve alle de beste videomodellene på ett praktisk sted. Som en offisiell partner med Google Cloud kan du nå prøve Veo 3 på Pollo AI og oppleve de banebrytende mulighetene på nært hold!

I tillegg til Veo 3 lar plattformen deg sømløst bytte mellom og oppleve de unike funksjonene til andre toppmodeller som Veo 3.1 , Vidu, Hailuo, Kling og PixVerse. Dette gir tilgang til alle de avanserte modellene du trenger for å lage fantastiske videoer av høy kvalitet.
I tillegg tilbyr Pollo AI en omfattende pakke med innebygde videoverktøy for å dekke alle dine kreative behov.
For eksempel kan du prøve den innovative AI-en for bilde til video, tekst til video, referanse til video , video til video og mer. I tillegg kan du bruke flere AI-videoeffekter for å lage alle slags morsomme og fantasifulle AI-videoer.
Avsluttende tanker
Som en som har prøvd de fleste AI-videogenereringsverktøy, er jeg veldig begeistret for den høye kvaliteten som Veo 3 leverer.
Den naturlige lydintegrasjonen, realistiske detaljer og den strømlinjeformede videoproduksjonsprosessen – dette er alle de kule funksjonene som virkelig imponerer meg.
På den annen side begrenser prisen rekkevidden, og det er fortsatt rom for forbedring i generasjonskvalitet og konsistens.
Når det er sagt, gir Veo 3 meg fortsatt et fascinerende glimt inn i hvor AI-videoteknologi er på vei, og jeg er nysgjerrig på å se hvordan Google og andre selskaper bygger videre på dette fundamentet.
Og hvis du leter etter en alt-i-ett-plattform for AI-videogenerering, foreslår jeg at du prøver Pollo AI-videogenerator !