Jeg testet nylig Wan 2.5 , Alibabas nyeste AI-videomodell. Etter all spenningen rundt lanseringen var jeg nysgjerrig på hvordan den ville prestere – og det er tydelig at denne modellen har noen bemerkelsesverdige oppgraderinger.
Wan 2.5 bygger på Wan 2.2 med innebygd lydgenerering, som gjør at den kan produsere lyd direkte ved siden av videoen – omgivelsesstøy, bakgrunnsmusikk eller til og med stemmefortelling designet for å matche scenen.
Dette setter den i samme liga som Googles Veo 3 , som allerede tilbyr sterk lydintegrasjon. På papiret lover Wan 2.5 også jevnere bevegelse, skarpere grafikk, bedre rask forståelse og mer konsistente bilder fra start til slutt.
Jeg kjørte fire tester i den virkelige verden for å se hvor godt lyd og bilde blandes, siden det er denne synergien som skiller en god AI-video fra en kjempebra en.
Kort oppsummering: Wan 2.5 viser fremgang
Wan 2.5 demonstrerte imponerende lydgenerering i flere scenarier, med realistisk atmosfære og passende lydeffekter. Videokvaliteten, spesielt for mennesker, var mindre konsistent – den viste sterke øyeblikk, men ga også rom for forbedring i realisme og leppesynkronisering. I ett tilfelle ble det ikke generert lyd i det hele tatt, noe som tyder på at modellen fortsatt er i utvikling mot full pålitelighet.
Eksempler på WAN 2.5 fra virkeligheten
For å teste allsidigheten forberedte jeg fire forskjellige oppgaver, blandet realistiske og stiliserte scener, og scoret hver av dem på:
- Lydnøyaktighet og scenetilpasning
- Visuell realisme og jevn bevegelse
- Presisjon i bevegelse og ansiktsuttrykk
1. Fottur med venner – jevnt og naturlig
Oppgave : To unge menn og en ung kvinne går opp en naturskjønn fjellsti og ler mens de prater uformelt. En mild bris rasler i bladene, sollyset filtrerer gjennom trærne, og hver bærer en ryggsekk. Deres lekne samtaler og smil fanger et avslappet øyeblikk utendørs.
Resultat : Skogstemningen, brisen og latteren passet naturlig til det visuelle. Jevn bevegelse og ingen merkbare feil.
Poengsum : 8/10 – Et sterkt, brukbart resultat for uformelt innhold.
2. Kvinnen på T-banestasjonen – God lyd, trenger mer livlighet
Spørsmål : En ung asiatisk kvinne står i trappen til en t-banestasjon og smiler varmt med en smarttelefon i hånden. Dagslyset filtreres ned, og myke skygger faller over hennes urbane streetwear-antrekk.
Resultat : Troverdige bakgrunnslyder fra t-banen bidro til å sette stemningen, selv om ansiktsuttrykket og bevegelsene hennes kunne føles mer naturlige og dynamiske.
Poengsum : 8/10 — Solid lyd, rom for forbedring av bevegelse.
3. Sly Fox in a Suit – Fengslende visuelt konsept
Oppfordring : En distingvert rev i en flott dress bærer en bunke med papirer og nærmer seg kameraet med selvsikre skritt og et lurt smil.
Resultat : Den animerte figuren så stilig og uttrykksfull ut. Denne testen produserte imidlertid ingen lyd, noe som tyder på sporadiske hull i lydgenereringen.
Poengsum : N/A — Mangler lyd, sterke bilder.
4. Journalist live på gaten – klar tale, trenger bedre synkronisering
Prompt : En korthåret journalist rapporterer direkte fra en travel gate, og snakker over lyden av trafikk og prat.
Resultat : Talen var nøyaktig og tydelig, men leppebevegelsene stemte ikke helt overens med lyden, noe som gjorde synkroniseringen mindre overbevisende.
Poengsum : 5/10 – Fungerer, men synkroniseringen trenger forbedring.
Endelig dom: En lovende oppdatering med potensial
Wan 2.5 introduserer verdifulle audiovisuelle funksjoner og kan levere gode resultater i visse sammenhenger. Selv om ytelsen varierer mellom spørsmålene, viser de gode øyeblikkene potensial for fremtidig forbedring og bredere brukervennlighet.
Bedre enn Veo 3? Ikke helt ennå, ettersom Veo 3 generelt sett er mer konsistent. Men Wan 2.5s lydintegrasjon og sporadiske grafikk av høy kvalitet hinter om en lys vei fremover etter hvert som teknologien modnes.
Hvem kan like det: Eksperimenterende personer, kreative prosjekter med natur eller stiliserte scener, og de som er åpne for sporadiske ufullkommenheter.
Hvem bør vente: Fagfolk som krever presis realisme og perfekt synkronisering i menneskesentrert video.
Hvorfor prøve Wan 2.5 på Pollo AI
Wan 2.5 er et av flere kraftige AI-videoverktøy som er tilgjengelige på Pollo AI. Plattformen gjør det enkelt å lage visuelle effekter av høy kvalitet på tvers av utallige stiler, med tekst til video , bilde til video og andre avanserte generatorer.
Du kan også få tilgang til ledende modeller som Runway , Veo 3 , Seedance , Hailuo AI , Kling AI og PixVerse AI , slik at du aldri er begrenset til bare ett valg.

En som skiller seg ut er AI-avatarvideogeneratoren , som forvandler et enkelt bilde til naturtro avatarer med naturlige bevegelser, realistiske ansiktsuttrykk og nøyaktig leppesynkronisering.

For rask kreativ produksjon produserer Pollo AI Shorts umiddelbart korte videoer – anime, dyr eller beroligende stiler – pluss generering av flere scener på én gang.

Med sitt utvalg av AI-effekter, tilpassbare verktøy og LoRA-er kan Pollo AI forvandle konsepter til polerte videoer med bare noen få klikk.
Hvis du vil utforske videoproduksjon med AI uten den bratte læringskurven, kan du prøve Pollo AI gratis og se hvor ideene dine kan føre deg.