ForsideKling AIKling 2.0 - Er det fortsatt den beste AI-generatoren eller har den blitt detronisert?

Kling 2.0 - Er det fortsatt den beste AI-generatoren eller har den blitt detronisert?

Kling 2.0 har lansert, noe som betyr at den for tiden best rangerte AI-videogeneratoren har blitt enda bedre. Vi skal dykke inn i dag for å se hvor mye den er forbedret, hva som mangler og hva du kan forvente av denne nye, overlegne versjonen.

Kling holder varmen på med sin nye 2.0-æra. Vi kan se 1.6-modellen holde sin topplassering på ledertavlen for beste bilde-til-video-modell, mens 1.5 tekst-til-video-modellen ble nummer to, bare etter Googles Veo 2 . Så la oss se hvordan det går med Klings 2.0-versjon.

En første titt på Kling 2.0 - Fidelity & Coherence Boost

Når det gjelder generell troskap og umiddelbar sammenheng, må jeg innrømme at den nye Kling 2.0-modellen går foran, spesielt på bilde-til-video-siden. Uansett inndatabilde, forblir ting konsekvente, med solid helhetlig karakterskuespill.

Evaluering av Kling 2.0s tekst-til-video

La oss begynne med dette tekst-til-video-eksemplet, og starter med en Game of Thrones-inspirert direwolf-melding, i stor grad inspirert av den virkelige nyhetshistorien om Colossal Bioscience som bringer tre direwolves tilbake fra utryddelse.

Videoprompten ser ganske solid ut, spesielt for tekst-til-video. Selv om det er noen problemer med perspektivet og omfanget til direwolf sammenlignet med den mørke trollmannen Jon Snow, er dette også i tråd med den første oppfordringen. Med det i tankene er dette virkelig en veldig imponerende tekst-til-video-utgang.

Evaluering av Kling 2.0s bilde-til-video

Eksempel 1

Når vi ser på vårt første eksempel, har vi 10 sekunders solid gange. Det som imponerte meg er at til tross for litt dekoherens, er fokuset på skuddet føttene som går og viser en veldig solid gangsyklus. Det er minimalt med stammetrinn, og føttene ser ut til å reagere på ting som sølepytter i gjørmen.

Noen ganger kan du støte på baklengsflygende romfartøy, men baklengsgående mennesker er ikke noe jeg har møtt. Selv om du støter på dette, er en rask løsning bare å kjøre den i revers.

Eksempel 2

Et annet eksempel på sømløs generasjon kommer i form av denne Vogue-inspirerte filmen fra 60-tallet. Mens modellen er i fokus, til tross for at hun er for kul til å faktisk se inn i kameraet, sitter hun passivt. Men det er de andre karakterene i scenen som fanget oppmerksomheten min. Mennene som går på scenen er egentlig ikke en del av det, men kontekstuelt ser de ut som de hører hjemme der.

Oppgraderte funksjoner i Kling 2.0

Koherent rask bevegelse

En stor styrke med Kling 2.0 er at den er eksepsjonell i sammenhengende, rask bevegelse.

Hvis vi ser på Kung-fu-kampen via tekst-til-video. Er det helt perfekt? Nei, men det er ganske imponerende, spesielt med tanke på det roterende kameraet, som motvirker noe av dekoherensen.

Det faktum at begge gutta holder seg på bakken og ingen av dem flyr bort, og bakgrunnen ikke blir til eksplosjoner, viser et imponerende resultat.

En annen utgang fra den samme oppfordringen var litt mer vanskelig med tanke på bevegelsene til karakterene, men totalt sett var det ikke mye dekoherens, med karakterene som smeltet sammen eller noen av de andre aspektene vi ofte forventer. Hvis du skulle bruke noen kunnskapsrike redigeringsferdigheter, kan du sannsynligvis få en solid del av klippet på 10 sekunder.

Generasjonsspesifikasjoner og kamerakontroll

Ved å bruke Kling 2.0 kan vi generere i fem eller 10 sekunders intervaller, og bruke sideforhold på 16:9, 9:16 og 1:1. I tillegg, hvis du velger Premier-planen, kan du generere mer enn én utgang om gangen. Foreløpig er videoutgangene på 720p, selv om jeg har blitt fortalt at 1080p er på vei.

Bildeforklaringer for objektiv og kamerabevegelse

Foreløpig er det ingen kamerakontrollalternativer i spørringen, men jeg må si at modellen er veldig responsiv, ikke bare for kamerabevegelser, men til og med objektivvalg. For eksempel, her etterlyser vi en 85 mm linse, med en liten dybdeskarphet og en bane-lignende bevegelse.

Spesielt kan jeg se at bordet er litt skjevt med stangen som ikke kobles helt sammen der den skal, men det er interessant å merke seg at det har holdt seg konsekvent skjevt hele veien. Generelt fulgte forespørselen instruksjonene om kamerabevegelse og linsetype.

Deretter, ved å bytte 85 mm-objektivet til et 20 mm-objektiv, får vi et mye bredere bilde med samme bevegelse, med stor oppmerksomhet på detaljer knyttet til bildeteksten til vidvinkelobjektivet. Selv om det er uunngåelig at noen vil påpeke at det ikke akkurat er et 20 mm eller 85 mm objektiv, er fokuset her at du får en ganske god ballpark av det du leter etter.

Nye verktøy lanseres - Multi-Element-funksjonen

Et aspekt jeg ikke vil overse er den nye multi-element-funksjonen som også lanseres. Jeg har ikke hatt mye tid til å leke med det, men jeg tror det er viktig å gi deg en ide om hva det gjør, fordi det har potensial til å bli et ganske kraftig verktøy.

Når du åpner en video, kan du trykke på "Legg til utvalg", og det vil umiddelbart maskere karakteren din.

img1

Når du er fornøyd, kan du "Bekrefte" og deretter laste opp et bilde av en annen karakter.

img2

Spørringen fylles ut med «Bytt X fra (miniatyrbilde av bildet ditt) med X fra (miniatyrbilde av videoen din). Du må fylle ut «X»-verdiene, i dette eksemplet, jente og jente, og deretter trykke «Generer».

img3

Verktøyet bytter ut ett tegn med et annet, og selv om inndataene i dette eksemplet ikke er perfekt, gir det en god indikasjon på hva multi-element-funksjonen gjør.

img4

Med litt eksperimentering og kanskje mer tonejusterte alternativer, kan du ende opp med noen spektakulære resultater, spesielt når Kling 2.0-modellen kommer.

Endelig dom: Er Kling AI fortsatt kongen?

Når det gjelder tekst-til-video, føler jeg at den mer eller mindre sitter på lik linje med Veo 2, med Veo 2 foran, men bare litt.

Men igjen, du må regne med den høyere driftskostnaden til Veo 2. Når det er sagt, har jeg blitt fortalt at flere andre 2.0-modeller er på vei, så vi får se om Kilng forblir konge eller om en annen modell feier inn for å ta dens plass.

img5

Merk: Artikkelen ble skrevet basert på følgende YouTube-video.

Relaterte innlegg

Kling 2.0 har ankommet: Oppdag dens evner

Oppdag Kling 2.0s banebrytende AI-fremskritt innen video- og bildegenerering. Fra flytende bevegelser til kraftige redigeringsverktøy, se hvorfor det er en videomodell som forandrer spillet.

Kling 2.0: Hvordan det sammenlignes med Kling 1.6

Kling lanserte nylig deres Kling 2.0 AI-videogenerasjonsmodell. Her viser vi deg hva Kling 2.0 kan lage og forskjellene mellom 1.6 og 2.0 versjonene.

Kling 2.0 anmeldelse: Bedre dynamisk videogenerering, nye redigeringsfunksjoner og mer

Kling 2.0 har kommet, og forbedrer dynamisk videogenerering med forbedrede bilde-til-video- og tekst-til-video-funksjoner. Sjekk ut anmeldelsen min her!

Hvordan bruke Kling AI i USA

Oppdag hvordan du bruker Kling AI i USA og lag videoer av høy kvalitet! Les dette blogginnlegget for en steg-for-steg guide. (Har også bilder!)