Ik heb onlangs Wan 2.5 getest, Alibaba's nieuwste AI-videomodel. Na alle opwinding rond de lancering was ik benieuwd naar de prestaties – en het is duidelijk dat dit model een aantal opmerkelijke verbeteringen biedt.
Wan 2.5 bouwt voort op Wan 2.2 met native audiogeneratie, waardoor het geluid direct naast de video kan produceren – omgevingsgeluiden, achtergrondmuziek of zelfs gesproken commentaar dat is afgestemd op de scène.
Dit plaatst het in dezelfde categorie als Google's Veo 3 , die al een sterke audio-integratie biedt. Op papier belooft Wan 2.5 ook vloeiendere bewegingen, scherpere beelden, een betere verstaanbaarheid van aanwijzingen en consistentere frames van begin tot eind.
Ik heb vier praktijktests uitgevoerd om te zien hoe goed de audio en de beelden op elkaar aansluiten, aangezien deze synergie het verschil maakt tussen een goede en een geweldige AI-video.
Samenvatting: Wan 2.5 laat vooruitgang zien
Wan 2.5 liet in verschillende scenario's indrukwekkende audio-generatie zien, met realistische omgevingsgeluiden en passende geluidseffecten. De videokwaliteit, met name bij mensen, was minder consistent: er waren sterke momenten, maar er was ook ruimte voor verbetering op het gebied van realisme en lipsynchronisatie. In één geval werd er helemaal geen audio gegenereerd, wat erop wijst dat het model nog in ontwikkeling is om volledig betrouwbaar te worden.
Praktische voorbeelden van Wan 2.5
Om de veelzijdigheid te testen, heb ik vier verschillende opdrachten voorbereid, een mix van realistische en gestileerde scènes, en elk beoordeeld op:
- Nauwkeurigheid van het geluid en overeenstemming met de scène.
- Visueel realisme en vloeiende beweging
- Precisie in beweging en gezichtsuitdrukkingen
1. Wandelscène met vrienden — Rustig en natuurlijk
Prompt : Twee jonge mannen en een jonge vrouw wandelen over een schilderachtig bergpad en praten gemoedelijk met elkaar. Een zacht briesje ruist door de bladeren, de zon filtert door de bomen en ze dragen alle drie een rugzak. Hun speelse gesprek en glimlach leggen een ontspannen moment in de buitenlucht vast.
Resultaat : De bossfeer, de bries en het gelach pasten perfect bij de beelden. Vloeiende bewegingen en geen merkbare haperingen.
Score : 8/10 — Een sterk en bruikbaar resultaat voor informele content.
2. Vrouw in het metrostation — Goede geluidskwaliteit, maar mist wat levendigheid
Prompt : Een jonge Aziatische vrouw staat op de trappen van een metrostation, met een warme glimlach en een smartphone in haar hand. Daglicht filtert naar binnen en zachte schaduwen vallen op haar urban streetwear-outfit.
Resultaat : De geloofwaardige achtergrondgeluiden van de metro hielpen de sfeer te bepalen, hoewel haar gezichtsuitdrukkingen en bewegingen natuurlijker en dynamischer hadden kunnen overkomen.
Beoordeling : 8/10 — Degelijk geluid, bewegingsweergave kan verbeterd worden.
3. De sluwe vos in een pak — een boeiend visueel concept
Prompt : Een voorname vos in een strak pak draagt een stapel papieren en nadert de camera met zelfverzekerde passen en een listige glimlach.
Resultaat : Het geanimeerde personage zag er stijlvol en expressief uit. Deze test leverde echter geen geluid op, wat wijst op af en toe onderbrekingen in de geluidsgeneratie.
Beoordeling : N.v.t. — Geluid ontbreekt, beeld is sterk.
4. Journalist live op straat — Duidelijke spraak, betere synchronisatie nodig.
Opdracht : Een journalist met kort haar doet live verslag vanaf een drukke straat en spreekt boven het geluid van verkeer en geroezemoes uit.
Resultaat : De spraak was accuraat en duidelijk, maar de lipbewegingen liepen niet volledig synchroon met de audio, waardoor de synchronisatie minder overtuigend was.
Beoordeling : 5/10 — Werkt, maar de synchronisatie kan nog verbeterd worden.
Eindconclusie: Een veelbelovende update met potentie.
Wan 2.5 introduceert waardevolle audiovisuele functies en kan in bepaalde contexten uitstekende resultaten opleveren. Hoewel de prestaties per prompt verschillen, laten de goede momenten potentie zien voor toekomstige verbeteringen en een bredere toepasbaarheid.
Beter dan Veo 3? Nog niet helemaal, want Veo 3 presteert over het algemeen nog steeds consistenter. Maar de audio-integratie van Wan 2.5 en de af en toe hoogwaardige beelden geven wel een veelbelovende toekomst voor de technologie naarmate deze zich verder ontwikkelt.
Voor wie is dit geschikt: Experimenteerders, creatieve projecten met de natuur of gestileerde scènes, en mensen die openstaan voor af en toe een kleine imperfectie.
Voor wie is wachten essentieel: professionals die nauwkeurige realisme en perfecte synchronisatie vereisen in mensgerichte video.
Waarom Wan 2.5 proberen op Pollo AI?
Wan 2.5 is een van de vele krachtige AI-videotools die beschikbaar zijn op Pollo AI. Het platform maakt het eenvoudig om hoogwaardige beelden te creëren in talloze stijlen, met functies zoals tekst-naar-video , afbeelding-naar-video en andere geavanceerde generatoren.
Je hebt ook toegang tot toonaangevende modellen zoals Runway , Veo 3 , Seedance , Hailuo AI , Kling AI en PixVerse AI , dus je bent nooit beperkt tot slechts één keuze.

Een opvallend kenmerk is de AI-avatarvideogenerator , die een enkele foto omzet in levensechte avatars met natuurlijke gebaren, realistische gezichtsuitdrukkingen en nauwkeurige lipsynchronisatie.

Voor snelle creatieve output produceert Pollo AI Shorts direct korte video's in anime-, dieren- of rustgevende stijl, en genereert bovendien meerdere scènes in één keer.

Met zijn scala aan AI-effecten, aanpasbare tools en LoRA's kan Pollo AI concepten in slechts een paar klikken omzetten in professionele video's.
Wil je experimenteren met het maken van video's met behulp van AI zonder een steile leercurve? Probeer Pollo AI dan gratis uit en ontdek de mogelijkheden van je ideeën.