Kling AI har netop udgivet Kling 2.0 til offentligheden.
Denne nye udgivelse er spækket med store opgraderinger, der hævder topplaceringen i AI-videorangeringer. Men er det virkelig så banebrydende, som det lyder?
Vi har sat Kling 2.0 på prøve og sammenlignet med andre avancerede modeller som Runway Gen 4 og Googles Veo 2 .
Vi deler resultaterne om lidt, men lad os først forstå, hvad der gør Kling 2.0 til noget særligt.
Hvad er nyt i Kling 2.0 ?
Kling 2.0 har introduceret flere nye funktioner og ændringer.
Multimodal visuel prompt
En af de mest betydningsfulde tilføjelser til Kling økosystemet er den nye "Multi Elements"-funktion.
Det er et multimodalt visuelt promptsystem, der giver brugerne mulighed for at referere til billeder og videoer i tekstprompter. Denne funktion repræsenterer et stort fremskridt inden for kontrol og præcision, selvom den i øjeblikket er adskilt fra Kling 2.0 (med integration forventes snart).
Systemet tilbyder tre primære funktioner:
- Byt: Erstat emner i eksisterende videoer (funktionen oplevede fejl under test)
- Tilføj: Indsæt nye elementer fra referencebilleder i videoer
- Slet: Fjern uønskede objekter fra scener dynamisk
I vores test brugte vi med succes "tilføj"-funktionen til at indsætte en løbende kvinde (fra et referencebillede) i en scene med lava, der trænger ind i et gammelt operahus.

På samme måde tillod "slet"-funktionen os at fjerne en papegøje fra en robots skulder og samtidig bevare visuel sammenhæng gennem hele videoen.

Især Kling AI giver nyttige promptskabeloner, når du uploader referencematerialer, hvilket eliminerer behovet for at huske komplekse promptstrukturer – en gennemtænkt forbedring af brugeroplevelsen.
Ændringer i grænseflade og arbejdsgange
I denne version har Kling AI også introduceret flere grænsefladeændringer:
- Sondringen mellem "standard" og "professionel" tilstand er blevet fjernet
- Kreativitet versus prompt-følgende skydere er ikke længere tilgængelige
- Rammetilstand er i øjeblikket ikke understøttet med Kling 2.0
- Funktionen med originale elementer (til karakterplacering og objektreferencer) er endnu ikke kompatibel med Kling 2.0

Kling 2.0 vs. Kling 1.6: Hvad er blevet forbedret?
Kling 2.0 udmærker sig i bevægelseskvalitet og fysiksimulering, men nogle gange foretrækker du måske Kling 1.6's scenesammenhæng til specifikke projekter.
Bevægelsesfluiditet og naturalisme
Kling 2.0 forbedrer bevægelseskvaliteten dramatisk. Dyr bevæger sig med naturlig fluiditet i stedet for de rykkede, urealistiske bevægelser, der ses i Kling 1.6.
Menneskelige udtryk er mere overbevisende og eliminerer problemet med "bevægelige læber uden at tale". Ansigtsfølelser virker naturlige og konsistente gennem sekvenser.
Dynamisk scenehåndtering
Flyvende væsner viser korrekte vingebevægelser og naturlige glidemønstre. Kling 1.6's stive flyvebaner er erstattet med realistisk luftdynamik.
Miljøfysikken er blevet væsentligt forbedret. Vandeffekter, objektinteraktioner og materialeegenskaber opfører sig mere realistisk.
Afvejningen af sammenhæng
Kling 2.0 producerer mere dynamiske scener, men nogle gange på bekostning af sammenhæng. Tegn kan dukke op eller forsvinde uventet i komplekse sekvenser.
Kling 1.6, selvom det var mindre visuelt imponerende, bibeholdt bedre scenekonsistens gennem videoer.
Hurtig forståelse
Kamerainstruktioner som panorering, vipning og fokusskift udføres med større præcision i Kling 2.0.
Sekventielle handlinger er bedre forstået. Flerdelte prompter som "lysekrone falder i lava og bryder i flammer" følger den rigtige logiske rækkefølge.
Tekniske begrænsninger
Begge versioner kæmper med hænder, tekstgengivelse og komplekse interaktioner, selvom 2.0 viser beskedne forbedringer på disse områder.
Generationsparametre
Kling 2.0 fjerner skyderne for kreativitet/prompt-følgende og fusionerer standard/professionelle tilstande til en samlet grænseflade.
Denne strømlinede tilgang kan være til gavn for begyndere, men begrænser mulighederne for avancerede brugere, der er vant til at finjustere deres output.
Test af Kling 2.0
Vi ville se, hvordan Kling 2.0 klarede sig i forhold til Runway Gen 4 og Google Veo 2.
Så vi lavede en række tests på alle tre AI-videogeneratorer ved at bruge de samme prompter.
Hurtig overholdelse og bevægelsesgengivelsesfunktioner
Vores første test fokuserede på Kling 2.0's evne til at forstå og udføre komplekse prompter, der involverer både motiv og kamerabevægelse. Opgaven var enkel, men udfordrende: en kvinde kigger ned på sine hænder, og en papegøje lander på hendes hænder.
Kling 2.0 gjorde et imponerende stykke arbejde med at følge prompten til punkt og prikke. Handlingen forløb naturligt med et klart hændelsesforløb.
Runway's output missede derimod en anelse. Papegøjen var allerede til stede, da kvinden kiggede ned, hvilket ikke stemmer overens med promptens krav.
Googles Veo 2 fulgte prompten, men manglede den klare, sekventielle handling, som Kling 2.0 leverede.
Evaluering af miljøeffekter: Oversvømmelsessimulering
Dernæst testede vi Kling 2.0's evne til at gengive miljøeffekter, specifikt et oversvømmelsesscenarie i en by.
Kling 2.0 klarede sig beundringsværdigt og skildrede nøjagtigt oversvømmelser, der fyldte gaderne og skubbede biler væk.
Runway kæmpede med denne udfordring og valgte i stedet at vise en massiv havbølge, der ikke passede til prompten.
Veo 2 formåede at gengive oversvømmelsen, men manglede dynamik og fangede ikke fuldt ud scenariet beskrevet i prompten.
Dynamisk handling og hurtig forståelse i højhastighedsscenarier
Vi pressede Kling 2.0 yderligere ved at teste dens evne til at håndtere actionsekvenser i høj hastighed. Opgaven involverede en kvinde, der galopperede på en hest med kameraet cirkulerende omkring sig.
Kling 2.0 leverede et dynamisk, visuelt tiltalende output, selvom det kæmpede lidt med at bevare ansigtets sammenhæng under højhastighedshandlingen.
Runway's output lignede mere en slowmotion-scene, der manglede den højhastighedsdynamik, vi sigtede efter.
Veo 2 leverede desværre ikke brugbare resultater i dette scenarie.
Gengivelse af svævende objekter og komplekse kamerabevægelser
I denne test udfordrede vi Kling 2.0 til at gengive en scene med svævende objekter og en kamera vippe-ned-bevægelse.
Kling 2.0 udmærkede sig endnu en gang, idet den nøjagtigt afbildede de flydende objekter og fulgte den specificerede kamerabevægelse. Runway og Veo 2 kæmpede med denne opgave, da de ikke fuldt ud kunne gengive de svævende objekter og kamerabevægelser som beskrevet i prompten.
Den ultimative udfordring: AI-videomodeller vs. Samurai-kampscene
Den sidste udfordring var at gengive en kampscene mellem to samuraier, en opgave, der historisk har vist sig vanskelig for AI-videomodeller.
Kling 2.0, selvom den var forbedret i forhold til tidligere versioner, kæmpede stadig med at gengive kampe med et naturligt udseende. Sammenhængen af sværdene faldt, især når de interagerede, og den overordnede scene så ikke så realistisk ud, som vi håbede.
Runway Gen 4 og Veo 2 stod over for lignende problemer, med sammenhængsproblemer og mangel på naturlig bevægelse i kampscenerne.
Fordele og begrænsninger ved Kling 2.0
Samlet set tror vi, at Kling 2.0 kommer med følgende fordele og ulemper.
Kling 2.0 Styrker
- Hurtig overholdelse: Kling 2.0 viser bemærkelsesværdig overholdelse af komplekse anvisninger, især dem, der involverer flere handlinger og miljøpåvirkninger.
- Realisme i interaktioner: Modellen udmærker sig ved at gengive subtile interaktioner og realistiske bevægelser, hvilket forbedrer den overordnede visuelle kvalitet.
Kling 2.0 udfordringer
- Opretholdelse af sammenhæng: Kling 2.0 kæmper med sammenhæng under højhastigheds- og komplekse handlingssekvenser, hvilket fører til uoverensstemmelser i udgangene.
- Gengivelse af komplekse scener: På trods af forbedringer står Kling 2.0 stadig over for udfordringer med at gengive realistiske kampscener og dynamiske kamerabevægelser.
Priser og tilgængelighed
- Omkostningsimplikationer: Kling 2.0's prissætning, især for korte videogenerationer, kan være en bekymring for nogle brugere, hvilket indikerer et behov for mere overkommelige muligheder.
Sidste tanker: Er Kling 2.0 det værd?
Kling 2.0 repræsenterer et væsentligt skridt fremad i AI-videogenerering, der tilbyder imponerende forbedringer i overholdelse af komplekse prompter og gengivelse af realistiske interaktioner.
Det står dog stadig over for udfordringer med at bevare sammenhængen under dynamiske scener. På trods af dets fremskridt bør du afveje fordelene mod de nuværende omkostninger og de specifikke behov for deres projekter, når du overvejer Kling 2.0.
Bemærk: Denne artikel er skrevet baseret på indholdet af følgende video: