Strona główna/Blog/Recenzje/Recenzja modelu obrazów Kling O1: Czy pierwszy generator obrazów AI od Kling dorówna jego dziedzictwu wideo?

Recenzja modelu obrazów Kling O1: Czy pierwszy generator obrazów AI od Kling dorówna jego dziedzictwu wideo?

Kling AI zyskało uznanie jako jeden z najpotężniejszych generatorów wideo AI na rynku, konsekwentnie zachwycając twórców możliwością produkcji wysokiej jakości materiałów wideo z prostych poleceń tekstowych.

Teraz próbują czegoś nowego, wprowadzając model obrazów Kling O1, swój pierwszy dedykowany model generowania obrazów. Wielkie pytanie brzmi: czy Kling poradzi sobie z obrazami tak dobrze, jak z wideo?

Poświęciłem czas na obszerne testowanie modelu obrazów Kling O1 i jestem tutaj, aby podzielić się moimi odkryciami. Zobaczmy, co nowy model wnosi do gry.

Co wyróżnia Kling O1?

Zanim przejdę do moich szczegółowych testów, pozwólcie, że przedstawię Wam szybki przegląd tego, co uznałem za najbardziej imponujące funkcje Kling O1:

Niesamowita fuzja wielu obrazów, która zachowuje oryginalne detale

Jedną z największych zalet modelu obrazów Kling O1 jest jego zdolność do łączenia wielu obrazów referencyjnych, przy jednoczesnym doskonałym zachowaniu oryginalnych cech każdego źródła.

W przeciwieństwie do wielu innych modeli, które rozmywają detale podczas mieszania wielu obrazów, Kling O1 z imponującą dokładnością zachowuje odrębne cechy każdego elementu.

Inteligentne rozumienie podpowiedzi i precyzyjna edycja

Niezależnie od tego, czy dostosowuje się konkretne obszary obrazu, czy modyfikuje poszczególne elementy, model dokładnie rozumie instrukcje edycji.

Zbudowany na potężnej koncepcji Wielomodalnego Języka Wizualnego, sprawia, że edycja obrazu jest tak naturalna, jak rozmowa z projektantem.

Mój proces testowania: Wprowadzenie modelu obrazów Kling O1 na granice jego możliwości

Aby odpowiednio ocenić możliwości Kling O1, skupiłem się na dwóch głównych scenariuszach testowych, które ujawniłyby zarówno jego mocne strony, jak i potencjalne słabości:

Test 1: Fuzja wielu obrazów referencyjnych

Pierwszy test miał na celu ocenę, jak dobrze Kling O1 radzi sobie z wieloma obrazami referencyjnymi jednocześnie i tworzy spójną kompozycję, która zachowuje cechy każdego źródła.

Użyłem czterech obrazów:

Młoda dziewczyna w różowej sukience uśmiecha się na placu zabaw
Pies rasy cocker spaniel siedzi na zielonej trawie na zewnątrz
Puste pomieszczenie na przyjęcie urodzinowe z kolorowymi balonami i dekoracjami
Grupa przyjaciół z deską surfingową świętuje podczas zachodu słońca na plaży

Następnie podałem następujące polecenie:

Wygeneruj obraz przedstawiający dziewczynę z Obrazu 1 trzymającą psa z Obrazu 2, z tłem z Obrazu 3, i zastosuj odcień koloru oraz styl z Obrazu 4 do całego zdjęcia.

A oto wynik, który uzyskałem:

Pomieszczenie na przyjęcie urodzinowe udekorowane balonami i napisem Happy Birthday

Z wygenerowanych wyników jasno wynika, że Kling O1 doskonale zastosował się do instrukcji, nawet podczas przetwarzania treści z czterech obrazów jednocześnie. Nie było chaosu ani odejścia od polecenia, a jego potężna zdolność przetwarzania wielu obrazów naprawdę mnie zaskoczyła.

Jednak uważam, że realizm tego zdjęcia można by jeszcze poprawić. Chociaż obiekt i tło mają ten sam odcień koloru, wciąż jest to nieco niezgodne i nienaturalne odczucie.

Oprócz łączenia scen i obiektów, przetestowałem również zastosowanie stylu i materiału.

Użyłem tych dwóch obrazów:

Ilustracja anime dziewczyny z szalikiem w pobliżu drzew wiśniowych.
Czarno-biała faktura materiału w jodełkę, zbliżenie

I ustawiłem polecenie jako:

Przekształć obiekt z Obrazu 1 w fotorealistyczną osobę, używając tekstury i materiału z Obrazu 2 do szalika.

Ostateczny obraz, który Kling O1 stworzył:

Uśmiechnięta kobieta w kratkowanym szaliku na zewnątrz wśród wiosennych kwiatów

Ostateczny wynik pokazuje, że Kling O1 działa całkiem dobrze pod względem transformacji stylu i zamiany materiału.

Jednak pojawiają się pewne drobne problemy: dodatkowy fragment szalika pojawiający się na klatce piersiowej obiektu i zniknięcie muszki. Tego rodzaju logiczne nieścisłości w obrazie podważają jego ogólny realizm.

Test 2: Precyzyjna edycja iteracyjna

Drugi test skupił się na ocenie zdolności Kling O1 do precyzyjnych, przyrostowych modyfikacji opartych na pojedynczym obrazie referencyjnym.

Pozwoliłoby to ujawnić, czy model potrafi radzić sobie ze złożonymi przepływami pracy edycyjnej, nie obniżając jakości ani nie tracąc kontekstu.

W poniższej tabeli można zobaczyć porównanie obok siebie działania Kling O1 w tym teście:

Obraz referencyjny Polecenie i Wynik 1 Polecenie i Wynik 2
Kobieta pijąca kawę siedząc przy oknie kawiarni wewnątrz
Kobieta siedzi przy żółtym ladzie kawiarnianym wewnątrz

Zmień porę dnia na wieczór, z ciepłym oświetleniem wnętrza z lamp wiszących. Pozostałe elementy bez zmian.

Kobieta relaksuje się przy kawie przy oknie w kawiarni

Zamień filiżankę kawy na książkę. Kobieta powinna teraz czytać, a nie patrzeć przez okno. Zachowaj tę samą twarz, ubranie i tło.

Polecenie i Wynik 3 Polecenie i Wynik 4 Polecenie i Wynik 5
Kobieta pijąca kawę przy oknie w zatłoczonej miejskiej kawiarni

Dodaj lekki deszcz widoczny przez okno. Dostosuj odbicie w oknie, aby pokazać krople deszczu. Nie modyfikuj sceny wnętrza ani postaci.

Kobieta z kawą siedząca w zatłoczonej kawiarni przy oknie

Zmień jej casualowy strój na profesjonalny strój biznesowy – marynarkę i elegancką bluzkę. Zachowaj jej pozę, cechy twarzy i całą scenę tła.

Kobieta z kawą siedząca przy oknie kawiarni z ludźmi

Dodaj inną osobę w tle – baristę pracującego za ladą. Zachowaj to samo oświetlenie, porę dnia i wszystkie inne istniejące elementy.

Wyniki były naprawdę imponujące. Kling O1 wykazał się wyjątkowym zrozumieniem tego, co powinno się zmienić, a co powinno pozostać niezmienione.

Każda iteracja zachowała niezwykłą spójność z poprzednimi wersjami, jednocześnie dokładnie wdrażając żądane modyfikacje.

Końcowe przemyślenia: Czy Kling O1 warto wypróbować?

Po obszernych testach, model obrazów Kling O1 jest zdecydowanie mocnym wejściem w przestrzeń generowania obrazów AI.

Podejście multimodalne działa świetnie – łączenie poleceń w języku naturalnym z obrazami referencyjnymi tworzy płynny przepływ pracy, który wydaje się bardziej współpracą niż frustracją.

Zachowanie cech jest naprawdę najlepsze w swojej klasie, zachowując odrębne cechy każdego źródła podczas łączenia wielu referencji. Edycja krok po kroku jest również niezwykle wydajna, pozwalając na precyzyjne zmiany bez utraty kontekstu.

Dla twórców i projektantów pragnących doskonałej kontroli i spójności, model obrazów Kling O1 jest zdecydowanie wart wypróbowania. Z powodzeniem przenosi doświadczenie Kling w zakresie wideo do obrazów statycznych, eliminując irytujące przełączanie narzędzi, które nęka wiele procesów twórczych AI.

Czy jest idealny? Nie. Ale jest to mocny debiut, który pokazuje, że Kling AI poważnie myśli o generowaniu obrazów.

Gotowi, aby samemu go przetestować? Udaj się do Pollo AI, aby wypróbować model obrazów Kling O1 lub zapoznaj się z innymi wiodącymi modelami dostępnymi w generatorze obrazów Pollo AI, aby znaleźć ten, który najlepiej odpowiada Twoim potrzebom. To inwestycja czasu, która jest warta każdej ceny dla każdego twórcy.

Może Ci się też spodobać

Zobacz więcej

Recenzja Sora 2 : Testowałem nowy model wideo AI OpenAI – wyniki są niesamowite

Poznaj generator wideo Sora 2 AI firmy OpenAI w tej praktycznej recenzji. Przekonaj się, dlaczego Sora 2 rewolucjonizuje kreatywność. Przetestowane i sprawdzone!

Recenzja Nano Banana Pro: Czy ten generator obrazów AI spełnia oczekiwania?

Czy Google Nano Banana Pro sprosta oczekiwaniom? Nasza szczera recenzja zagłębia się w model sztucznej inteligencji Nano Banana Pro, testując jego doskonałe renderowanie tekstu, kreatywne sterowanie i inne funkcje, aby sprawdzić, czy rzeczywiście działa.

Recenzja Hailuo 2.3 : Przetestowałem najnowszy model wideo AI Hailuo AI i jestem nim pozytywnie zaskoczony

Odkryj Hailuo 2.3 na Pollo AI! Przeczytaj tę dogłębną recenzję, która omawia najnowszy model wideo AI w Hailuo AI i nowe udoskonalenia, jakie wprowadza do tworzenia filmów AI!

Recenzja Kling O1 : Przetestowałem model wideo AI Kling O1 i może to być przyszłość wideo AI

Przetestowałem model wideo Kling AI O1 — zunifikowaną, multimodalną sztuczną inteligencję, która bezproblemowo tworzy i edytuje wideo. Odkryj, dlaczego model wideo Kling O1 może być przyszłością wideo AI.