Kling AI har nettopp gitt ut Kling 2.0 til offentligheten.
Denne nye utgivelsen er fullpakket med store oppgraderinger, og hevder seg øverst i AI-videorangeringen. Men er det virkelig så banebrytende som det høres ut?
Vi har satt Kling 2.0 på prøve, og sammenlignet den med andre toppmoderne modeller som Runway Gen 4 og Googles Veo 2 .
Vi deler resultatene om litt, men først, la oss forstå hva som gjør Kling 2.0 spesiell.
Hva er nytt i Kling 2.0 ?
Kling 2.0 har introdusert flere nye funksjoner og endringer.
Multimodal visuell spørring
Et av de viktigste tilleggene til Kling-økosystemet er den nye "Multi Elements"-funksjonen.
Det er et multimodalt visuelt spørresystem som lar brukere referere til bilder og videoer i tekstmeldinger. Denne funksjonen representerer et stort fremskritt innen kontroll og presisjon, selv om den for øyeblikket er atskilt fra Kling 2.0 (med integrasjon ventet snart).
Systemet tilbyr tre hovedfunksjoner:
- Bytt: Erstatt emner i eksisterende videoer (funksjonen oppsto feil under testing)
- Legg til: Sett inn nye elementer fra referansebilder i videoer
- Slett: Fjern uønskede objekter fra scener dynamisk
I testene våre brukte vi "legg til"-funksjonen for å sette inn en løpende kvinne (fra et referansebilde) i en scene med lava som kommer inn i et gammelt operahus.

På samme måte tillot "slett"-funksjonen oss å fjerne en papegøye fra en robots skulder samtidig som vi opprettholder visuell sammenheng gjennom hele videoen.

Spesielt gir Kling AI nyttige spørsmålsmaler når du laster opp referansemateriale, og eliminerer behovet for å huske komplekse spørsmålsstrukturer – en gjennomtenkt forbedring av brukeropplevelsen.
Endringer i grensesnitt og arbeidsflyt
I denne versjonen har Kling AI også introdusert flere grensesnittendringer:
- Skillet mellom "standard" og "profesjonell" modus er fjernet
- Kreativitet kontra prompt-følgende skyveknapper er ikke lenger tilgjengelige
- Rammemodus støttes foreløpig ikke med Kling 2.0
- Originalelementfunksjonen (for karakterplassering og objektreferanser) er ennå ikke kompatibel med Kling 2.0

Kling 2.0 vs. Kling 1.6: Hva har blitt bedre?
Kling 2.0 utmerker seg i bevegelseskvalitet og fysikksimulering, men noen ganger foretrekker du kanskje Kling 1.6s scenesammenheng for spesifikke prosjekter.
Bevegelsesfluiditet og naturalisme
Kling 2.0 forbedrer bevegelseskvaliteten dramatisk. Dyr beveger seg med naturlig flyt i stedet for de rykkete, urealistiske bevegelsene som er sett i Kling 1.6.
Menneskelige uttrykk er mer overbevisende, og eliminerer problemet med "bevegelige lepper uten å snakke". Ansiktsfølelser virker naturlige og konsistente gjennom sekvenser.
Dynamisk scenehåndtering
Flygende skapninger viser riktige vingebevegelser og naturlige glidemønstre. Kling 1.6s stive flyveier er erstattet med realistisk luftdynamikk.
Miljøfysikken har forbedret seg betydelig. Vanneffekter, objektinteraksjoner og materialegenskaper oppfører seg mer realistisk.
Koherens-avveiningen
Kling 2.0 produserer mer dynamiske scener, men noen ganger på bekostning av sammenheng. Karakterer kan dukke opp eller forsvinne uventet i komplekse sekvenser.
Selv om Kling 1.6 var mindre visuelt imponerende, opprettholdt den bedre scenekonsistens gjennom videoene.
Rask forståelse
Kamerainstruksjoner som panorering, tilting og fokusskift utføres med større presisjon i Kling 2.0.
Sekvensielle handlinger er bedre forstått. Flerdelte meldinger som "lysekrone som faller i lava og sprenger i flammer" følger riktig logisk rekkefølge.
Tekniske begrensninger
Begge versjonene sliter med hender, tekstgjengivelse og komplekse interaksjoner, selv om 2.0 viser beskjedne forbedringer på disse områdene.
Generasjonsparametere
Kling 2.0 fjerner glidebryterne for kreativitet/promptfølgende og slår sammen standard/profesjonelle moduser til et enhetlig grensesnitt.
Denne strømlinjeformede tilnærmingen kan være til nytte for nybegynnere, men begrenser alternativene for avanserte brukere som er vant til å finjustere utgangene sine.
Tester Kling 2.0
Vi ønsket å se hvordan Kling 2.0 stablet opp mot Runway Gen 4 og Google Veo 2.
Så vi gjorde en serie tester på alle tre AI-videogeneratorene ved å bruke de samme ledetekstene.
Umiddelbar overholdelse og bevegelsesgjengivelse
Vår første test fokuserte på Kling 2.0s evne til å forstå og utføre komplekse spørsmål som involverer både motiv og kamerabevegelse. Oppgaven var enkel, men utfordrende: en kvinne ser ned på hendene hennes, og en papegøye lander på hendene hennes.
Kling 2.0 gjorde en imponerende jobb med å følge oppfordringen til punkt og prikke. Handlingen utspilte seg naturlig, med et tydelig hendelsesforløp.
Runways utgang, derimot, bommet litt på målet. Papegøyen var allerede til stede da kvinnen så ned, noe som ikke stemmer overens med forespørselens krav.
Googles Veo 2 fulgte oppfordringen, men manglet den klare, sekvensielle handlingen som Kling 2.0 leverte.
Evaluering av miljøeffekter: flomsimulering
Deretter testet vi Kling 2.0s evne til å gjengi miljøeffekter, spesielt et flomscenario i en by.
Kling 2.0 presterte beundringsverdig, og viste nøyaktig at flomvann fylte gatene og dyttet biler unna.
Rullebanen slet med denne utfordringen, og valgte i stedet å vise en massiv havbølge som ikke passet oppfordringen.
Veo 2 klarte å gjengi oversvømmelsen, men manglet dynamikk og fanget ikke helt scenariet beskrevet i ledeteksten.
Dynamisk handling og rask forståelse i høyhastighetsscenarier
Vi presset Kling 2.0 videre ved å teste dens evne til å håndtere høyhastighets actionsekvenser. Oppgaven gikk ut på at en kvinne galopperte på en hest med kameraet sirkle rundt seg.
Kling 2.0 leverte en dynamisk, visuelt tiltalende utgang, selv om den slet litt med å opprettholde ansiktssammenheng under høyhastighetshandlingen.
Runways utgang så mer ut som en saktefilmscene, og manglet høyhastighetsdynamikken vi siktet etter.
Veo 2 leverte dessverre ikke brukbare resultater i dette scenariet.
Gjengivelse av svevende objekter og komplekse kamerabevegelser
I denne testen utfordret vi Kling 2.0 til å gjengi en scene med svævende gjenstander og en vippebevegelse av kameraet.
Kling 2.0 utmerket seg nok en gang, og viste nøyaktig de flytende objektene og fulgte de spesifiserte kamerabevegelsene. Runway og Veo 2 slet med denne oppgaven, og klarte ikke å gjengi de svevende objektene og kamerabevegelsen fullt ut som beskrevet i ledeteksten.
Den ultimate utfordringen: AI-videomodeller vs. Samurai-kampscene
Den siste utfordringen var å gjengi en kampscene mellom to samuraier, en oppgave som historisk sett har vist seg vanskelig for AI-videomodeller.
Selv om Kling 2.0 var forbedret i forhold til tidligere versjoner, slet fortsatt med å gjengi kamper med et naturlig utseende. Sammenhengen til sverdene avtok, spesielt når de samhandlet, og den generelle scenen så ikke så realistisk ut som vi håpet.
Runway Gen 4 og Veo 2 møtte lignende problemer, med sammenhengsproblemer og mangel på naturlig bevegelse i kampscenene.
Fordeler og begrensninger med Kling 2.0
Totalt sett tror vi Kling 2.0 kommer med følgende fordeler og ulemper.
Kling 2.0 Styrker
- Spørre etterlevelse: Kling 2.0 viser bemerkelsesverdig etterlevelse av komplekse forespørsler, spesielt de som involverer flere handlinger og miljøeffekter.
- Realisme i interaksjoner: Modellen utmerker seg i å gjengi subtile interaksjoner og realistiske bevegelser, og forbedrer den generelle visuelle kvaliteten.
Kling 2.0-utfordringer
- Opprettholde koherens: Kling 2.0 sliter med koherens under høyhastighets og komplekse handlingssekvenser, noe som fører til inkonsekvenser i utgangene.
- Gjengivelse av komplekse scener: Til tross for forbedringer, møter Kling 2.0 fortsatt utfordringer med å gjengi realistiske kampscener og dynamiske kamerabevegelser.
Priser og tilgjengelighet
- Kostnadsimplikasjoner: Kling 2.0s priser, spesielt for korte videogenerasjoner, kan være en bekymring for noen brukere, noe som indikerer et behov for rimeligere alternativer.
Siste tanker: Er Kling 2.0 verdt det?
Kling 2.0 representerer et betydelig skritt fremover i AI-videogenerering, og tilbyr imponerende forbedringer i etterlevelse av komplekse spørsmål og gjengivelse av realistiske interaksjoner.
Imidlertid står det fortsatt overfor utfordringer med å opprettholde sammenheng under dynamiske scener. Til tross for fremskritt, bør du veie fordelene mot dagens kostnad og de spesifikke behovene til prosjektene deres når du vurderer Kling 2.0.
Merk: Denne artikkelen ble skrevet basert på innholdet i følgende video: