Forside/Blog/Anmeldelser/Kling O1 Billedmodel Anmeldelse: Kan Klings Første AI-billedgenerator matche dens videobaggrund?

Kling O1 Billedmodel Anmeldelse: Kan Klings Første AI-billedgenerator matche dens videobaggrund?

Kling AI har skabt sig et navn som en af de mest kraftfulde AI-videogeneratorer på markedet og imponerer konstant skabere med sin evne til at producere høj kvalitet video ud fra simple tekstprompts.

Nu forsøger de noget nyt med lanceringen af Kling O1 billedmodellen, deres første dedikerede billedgenereringsmodel. Det store spørgsmål er: kan Kling lave billeder lige så godt, som den laver video?

Jeg har brugt tid på at teste Kling O1 billedmodellen grundigt, og jeg er her for at dele, hvad jeg fandt. Lad os se, hvad denne nye model bringer til bordet.

Hvad får Kling O1 til at skille sig ud?

Før jeg dykker ned i mine detaljerede tests, lad mig give dig et hurtigt overblik over, hvad jeg fandt var Kling O1's mest imponerende funktioner:

Fantastisk multifusionssammensmeltning, der bevarer originale detaljer

En af Kling O1 billedmodellens største styrker er dens evne til at kombinere flere referencebilleder, samtidig med at de originale træk fra hver kilde bevares utroligt godt.

I modsætning til mange andre modeller, der slører detaljer, når de blander flere billeder, bevarer Kling O1 de distinkte karakteristika ved hvert element med imponerende nøjagtighed.

Smart promptforståelse & præcis redigering

Uanset om det drejer sig om at justere specifikke områder af et billede eller ændre bestemte elementer, forstår modellen redigeringsinstruktioner præcist.

Bygget på det kraftfulde koncept Multimodal Visuel Sprog gør det billedredigering lige så naturligt som at konversere med en designer.

Min testproces: At presse Kling O1 billedmodellen til dens grænser

For korrekt at evaluere Kling O1's kapaciteter fokuserede jeg på to primære testsituationer, der ville afsløre både dens styrker og potentielle svagheder:

Test 1: Multi-billedreferencefusion

Den første test havde til formål at vurdere, hvor godt Kling O1 kunne håndtere flere referencebilleder samtidigt og skabe en sammenhængende komposition, der bevarer træk fra hver kilde.

Jeg brugte fire billeder:

Lille pige i lyserød kjole smiler på legeplads
Cocker spaniel hund sidder på grønt græs udendørs
Tomt fødselsdagsfestrum med farverige balloner og dekorationer
Gruppe venner med surfbræt fejrer ved solnedgang på stranden

Derefter gav jeg følgende prompt:

Generer venligst et billede med pigen fra Billede 1, der holder hunden fra Billede 2, med baggrunden fra Billede 3, og anvend farvetonen og stilen fra Billede 4 på hele billedet.

Og her er resultatet, jeg fik:

Fødselsdagsfestrum dekoreret med balloner og skilt med 'Happy Birthday'

Ud fra de genererede resultater er det tydeligt, at Kling O1 perfekt fulgte instruktionerne, selv mens den behandlede indhold fra fire billeder samtidigt. Der var ingen kaos eller afvigelse fra prompten, og dens kraftfulde multi-billedbehandlingskapacitet overraskede mig virkelig.

Jeg mener dog, at realismen i dette billede kunne forbedres yderligere. Selvom motivet og baggrunden deler samme farvetone, er der stadig en noget uoverensstemmende og unaturlig følelse.

Ud over at blande scener og motiver testede jeg også anvendelsen af stil og materiale.

Jeg brugte disse to billeder:

Anime-pigeillustration med tørklæde nær kirsebærblomstertræer.
Sort-hvid hundetandsmønster stoftekstur tæt på

Og satte prompten til:

Konverter motivet fra Billede 1 til en fotorealistisk person, ved brug af teksturen og materialet fra Billede 2 til tørklædet.

Det endelige billede, som Kling O1 gav:

Smilende kvinde med ternet tørklæde udendørs i forårsblomster

Det endelige resultat viser, at Kling O1 klarer sig ret godt med hensyn til stiltransformation og materialeudskiftning.

Dog er der nogle mindre problemer: en ekstra del af tørklædet, der dukker op på personens bryst, og forsvinden af butterflyen. Disse former for logiske uoverensstemmelser i billedet underminerer dets samlede realisme.

Test 2: Iterativ præcisionsredigering

Den anden test fokuserede på at evaluere Kling O1's kapacitet til præcise, inkrementelle ændringer baseret på et enkelt referencebillede.

Dette ville afsløre, om modellen kunne håndtere komplekse redigeringsforløb uden at forringe kvaliteten eller miste kontekst.

I tabellen, som jeg har samlet nedenfor, kan du se en side-om-side-sammenligning af Kling O1's præstation i denne test:

Ref. Billede Prompt & Resultat 1 Prompt & Resultat 2
Kvinde holder kaffekop sidder ved cafevindue indendørs
Kvinde sidder ved gul tone cafe bar disk indeni

Skift tidspunktet på dagen til aften, med varm indendørsbelysning fra lamper over hovedet. Lad alt andet være uændret.

Kvinde slapper af med kaffe ved vinduesplads i cafe

Udskift kaffekoppen med en bog. Kvinden skal nu læse i stedet for at kigge ud ad vinduet. Bevar de samme ansigtstræk, tøj og baggrund.

Prompt & Resultat 3 Prompt & Resultat 4 Prompt & Resultat 5
Kvinde drikker kaffe ved vindue i travl urban cafe

Tilføj let regn synlig gennem vinduet. Juster vinduesrefleksionen for at vise regndråberne. Modificer ikke interiøret eller personen.

Kvinde med kaffe sidder i travl cafe ved vinduet

Skift hendes casual påklædning til business professionelt tøj – en blazer og en formel bluse. Bevar hendes positur, ansigtstræk og hele baggrundsscenen identisk.

Kvinde holder kaffe sidder ved cafevindue med folk

Tilføj en anden person i baggrunden – en barista, der arbejder bag disken. Bevar den samme belysning, tidspunkt på dagen og alle andre eksisterende elementer.

Resultaterne var virkelig imponerende. Kling O1 demonstrerede en enestående forståelse af, hvad der skulle ændres, og hvad der skulle forblive konstant.

Hver iteration bevarede en bemærkelsesværdig konsistens med tidligere versioner, samtidig med at de anmodede ændringer blev implementeret præcist.

Afsluttende tanker: Er Kling O1 værd at prøve?

Efter omfattende test er Kling O1 billedmodellen tydeligvis en stærk deltager i AI-billedgenereringsrummet.

Den multimodale tilgang fungerer fantastisk – at kombinere naturlige sprogprompts med referencebilleder skaber et flydende workflow, der føles samarbejdende snarere end frustrerende.

Funktionsbevaringen er virkelig i topklasse og holder de distinkte karakteristika fra hver kilde, når der kombineres flere referencer. Trinvis redigering er også bemærkelsesværdigt effektiv, hvilket giver dig mulighed for at foretage præcise ændringer uden at miste konteksten.

For skabere og designere, der ønsker fremragende kontrol og konsistens, er Kling O1 billedmodellen absolut værd at prøve. Den bringer succesfuldt Kling's videoekspertise ind i stillbilleder, samtidig med at den eliminerer den irriterende værktøjsskiftning, der plager mange AI kreative processer.

Er den perfekt? Nej. Men det er en stærk debut, der viser, at Kling AI er seriøs omkring billedgenerering.

Klar til at teste den selv? Gå til Pollo AI for at prøve Kling O1 billedmodellen, eller udforsk andre førende modeller tilgængelige på Pollo AI billedgenerator for at finde den, der passer bedst til dine behov. Det er en tidsinvestering, der er godt givet ud for enhver skaber.

Du kan måske også lide

Se mere

Sora 2 anmeldelse: Jeg testede OpenAIs nye AI-videomodel – resultaterne er uvirkelige

Udforsk OpenAIs Sora 2 AI-videogenerator i denne praktiske anmeldelse. Se hvorfor Sora 2 revolutionerer kreativiteten. Testet og bevist!

Nano Banana Pro Anmeldelse: Leverer denne AI-billedgenerator op til hypen?

Lever Google Nano Banana Pro op til hypen? Vores ærlige anmeldelse dykker ned i Nano Banana Pro AI-billedmodellen og tester dens overlegne tekstgengivelse, kreative kontroller og mere for at se, om den virkelig leverer.

Hailuo 2.3 anmeldelse: Jeg testede Hailuo AI's nyeste AI-videomodel, og jeg er positivt overrasket over den

Opdag Hailuo 2.3 på Pollo AI! Udforsk denne dybdegående anmeldelse, der dykker ned i Hailuo AIs nyeste AI-videomodel og de nye fremskridt, den bringer til AI-videoproduktion!

Kling O1 anmeldelse: Jeg testede Kling O1 AI-videomodellen, og det kan være fremtiden for AI-video

Jeg testede Kling AI's O1-videomodel—en forenet multimodal AI, der opretter og redigerer videoer problemfrit. Opdag, hvorfor Kling O1-videomodellen kunne være fremtiden for AI-video.