Kling AI zyskało uznanie jako jeden z najpotężniejszych generatorów wideo AI na rynku, konsekwentnie zachwycając twórców możliwością produkcji wysokiej jakości materiałów wideo z prostych poleceń tekstowych.
Teraz próbują czegoś nowego, wprowadzając model obrazów Kling O1, swój pierwszy dedykowany model generowania obrazów. Wielkie pytanie brzmi: czy Kling poradzi sobie z obrazami tak dobrze, jak z wideo?
Poświęciłem czas na obszerne testowanie modelu obrazów Kling O1 i jestem tutaj, aby podzielić się moimi odkryciami. Zobaczmy, co nowy model wnosi do gry.
Co wyróżnia Kling O1?
Zanim przejdę do moich szczegółowych testów, pozwólcie, że przedstawię Wam szybki przegląd tego, co uznałem za najbardziej imponujące funkcje Kling O1:
Niesamowita fuzja wielu obrazów, która zachowuje oryginalne detale
Jedną z największych zalet modelu obrazów Kling O1 jest jego zdolność do łączenia wielu obrazów referencyjnych, przy jednoczesnym doskonałym zachowaniu oryginalnych cech każdego źródła.
W przeciwieństwie do wielu innych modeli, które rozmywają detale podczas mieszania wielu obrazów, Kling O1 z imponującą dokładnością zachowuje odrębne cechy każdego elementu.
Inteligentne rozumienie podpowiedzi i precyzyjna edycja
Niezależnie od tego, czy dostosowuje się konkretne obszary obrazu, czy modyfikuje poszczególne elementy, model dokładnie rozumie instrukcje edycji.
Zbudowany na potężnej koncepcji Wielomodalnego Języka Wizualnego, sprawia, że edycja obrazu jest tak naturalna, jak rozmowa z projektantem.
Mój proces testowania: Wprowadzenie modelu obrazów Kling O1 na granice jego możliwości
Aby odpowiednio ocenić możliwości Kling O1, skupiłem się na dwóch głównych scenariuszach testowych, które ujawniłyby zarówno jego mocne strony, jak i potencjalne słabości:
Test 1: Fuzja wielu obrazów referencyjnych
Pierwszy test miał na celu ocenę, jak dobrze Kling O1 radzi sobie z wieloma obrazami referencyjnymi jednocześnie i tworzy spójną kompozycję, która zachowuje cechy każdego źródła.
Użyłem czterech obrazów:
![]() |
![]() |
![]() |
![]() |
Następnie podałem następujące polecenie:
Wygeneruj obraz przedstawiający dziewczynę z Obrazu 1 trzymającą psa z Obrazu 2, z tłem z Obrazu 3, i zastosuj odcień koloru oraz styl z Obrazu 4 do całego zdjęcia.
A oto wynik, który uzyskałem:

Z wygenerowanych wyników jasno wynika, że Kling O1 doskonale zastosował się do instrukcji, nawet podczas przetwarzania treści z czterech obrazów jednocześnie. Nie było chaosu ani odejścia od polecenia, a jego potężna zdolność przetwarzania wielu obrazów naprawdę mnie zaskoczyła.
Jednak uważam, że realizm tego zdjęcia można by jeszcze poprawić. Chociaż obiekt i tło mają ten sam odcień koloru, wciąż jest to nieco niezgodne i nienaturalne odczucie.
Oprócz łączenia scen i obiektów, przetestowałem również zastosowanie stylu i materiału.
Użyłem tych dwóch obrazów:
![]() |
![]() |
I ustawiłem polecenie jako:
Przekształć obiekt z Obrazu 1 w fotorealistyczną osobę, używając tekstury i materiału z Obrazu 2 do szalika.
Ostateczny obraz, który Kling O1 stworzył:

Ostateczny wynik pokazuje, że Kling O1 działa całkiem dobrze pod względem transformacji stylu i zamiany materiału.
Jednak pojawiają się pewne drobne problemy: dodatkowy fragment szalika pojawiający się na klatce piersiowej obiektu i zniknięcie muszki. Tego rodzaju logiczne nieścisłości w obrazie podważają jego ogólny realizm.
Test 2: Precyzyjna edycja iteracyjna
Drugi test skupił się na ocenie zdolności Kling O1 do precyzyjnych, przyrostowych modyfikacji opartych na pojedynczym obrazie referencyjnym.
Pozwoliłoby to ujawnić, czy model potrafi radzić sobie ze złożonymi przepływami pracy edycyjnej, nie obniżając jakości ani nie tracąc kontekstu.
W poniższej tabeli można zobaczyć porównanie obok siebie działania Kling O1 w tym teście:
| Obraz referencyjny | Polecenie i Wynik 1 | Polecenie i Wynik 2 |
![]() |
![]() Zmień porę dnia na wieczór, z ciepłym oświetleniem wnętrza z lamp wiszących. Pozostałe elementy bez zmian. |
![]() Zamień filiżankę kawy na książkę. Kobieta powinna teraz czytać, a nie patrzeć przez okno. Zachowaj tę samą twarz, ubranie i tło. |
| Polecenie i Wynik 3 | Polecenie i Wynik 4 | Polecenie i Wynik 5 |
![]() Dodaj lekki deszcz widoczny przez okno. Dostosuj odbicie w oknie, aby pokazać krople deszczu. Nie modyfikuj sceny wnętrza ani postaci. |
![]() Zmień jej casualowy strój na profesjonalny strój biznesowy – marynarkę i elegancką bluzkę. Zachowaj jej pozę, cechy twarzy i całą scenę tła. |
![]() Dodaj inną osobę w tle – baristę pracującego za ladą. Zachowaj to samo oświetlenie, porę dnia i wszystkie inne istniejące elementy. |
Wyniki były naprawdę imponujące. Kling O1 wykazał się wyjątkowym zrozumieniem tego, co powinno się zmienić, a co powinno pozostać niezmienione.
Każda iteracja zachowała niezwykłą spójność z poprzednimi wersjami, jednocześnie dokładnie wdrażając żądane modyfikacje.
Końcowe przemyślenia: Czy Kling O1 warto wypróbować?
Po obszernych testach, model obrazów Kling O1 jest zdecydowanie mocnym wejściem w przestrzeń generowania obrazów AI.
Podejście multimodalne działa świetnie – łączenie poleceń w języku naturalnym z obrazami referencyjnymi tworzy płynny przepływ pracy, który wydaje się bardziej współpracą niż frustracją.
Zachowanie cech jest naprawdę najlepsze w swojej klasie, zachowując odrębne cechy każdego źródła podczas łączenia wielu referencji. Edycja krok po kroku jest również niezwykle wydajna, pozwalając na precyzyjne zmiany bez utraty kontekstu.
Dla twórców i projektantów pragnących doskonałej kontroli i spójności, model obrazów Kling O1 jest zdecydowanie wart wypróbowania. Z powodzeniem przenosi doświadczenie Kling w zakresie wideo do obrazów statycznych, eliminując irytujące przełączanie narzędzi, które nęka wiele procesów twórczych AI.
Czy jest idealny? Nie. Ale jest to mocny debiut, który pokazuje, że Kling AI poważnie myśli o generowaniu obrazów.
Gotowi, aby samemu go przetestować? Udaj się do Pollo AI, aby wypróbować model obrazów Kling O1 lub zapoznaj się z innymi wiodącymi modelami dostępnymi w generatorze obrazów Pollo AI, aby znaleźć ten, który najlepiej odpowiada Twoim potrzebom. To inwestycja czasu, która jest warta każdej ceny dla każdego twórcy.











