Jeśli korzystasz z obrazów generowanych przez sztuczną inteligencję, to zapewne słyszałeś, że Google DeepMind właśnie wprowadził na rynek swój najnowszy model obrazów oparty na sztucznej inteligencji – Imagen 4. Ale czy naprawdę jest wart całego tego szumu? Nie mogłem się doczekać, żeby się przekonać!
Zaprezentowany na konferencji Google I/O 2025 nowy model sztucznej inteligencji ma na celu generowanie bogatszych i bardziej szczegółowych obrazów o jeszcze większej przejrzystości i szybkości niż jego poprzednik,Imagen 3 .
Google twierdzi również, że aplikacja potrafi realistycznie oddawać niuanse kolorów, a także skomplikowane szczegóły i tekstury, takie jak tkaniny, sierść zwierząt, a nawet krople wody.
W tym sensie model obrazu AI może doskonale sprawdzać się w fotorealizmie i stylach abstrakcyjnych. Poza tym, Imagen 4 został zaprojektowany z myślą o lepszej pisowni i typografii.
Oznacza to, że mogę go używać do tworzenia wszelkiego rodzaju obrazów z dużą ilością tekstu, takich jak plakaty, komiksy, slajdy, zaproszenia itp.

Imagen 4 oferuje również szybszą zgodność z przepisami, dostęp do szerszego zakresu proporcji obrazu i możliwość generowania obrazów o rozdzielczości do 2K.
Biorąc pod uwagę liczbę udoskonaleń, jakie oferuje Imagen 4 , wydaje się, że Google DeepMind dąży do osiągnięcia nowego poziomu kontroli i jakości kreatywnej.
Moja podróż z Imagen 4
Ale pytanie pozostaje: jak Imagen 4 sprawdza się w rękach przeciętnego użytkownika? Byłem tego ciekaw, więc postanowiłem przeprowadzić własny test.
Od razu chciałem zacząć od czegoś prostego. Dlatego poprosiłem model Imagen 4 o wygenerowanie sceny bazy wojskowej z żołnierzami przygotowującymi się do wojny.
Niestety, wygenerowany wynik był poniżej oczekiwań. Chociaż Imagen 4 zdołał stworzyć stosunkowo dobry render sceny militarnej, nie udało mu się uchwycić kluczowych szczegółów postaci.

Mówiąc dokładniej, ich twarze wyglądały po prostu na zmiażdżone i zniekształcone. Włożono bardzo mało wysiłku w oddanie właściwych i niepowtarzalnych rysów twarzy każdej z postaci w scenie.
Wygląda na to, że model sztucznej inteligencji został przygotowany do stworzenia otoczenia jako całości, ale zignorował drobne aspekty, które dodatkowo podkreśliłyby realizm obrazu.
W tym teście dałbym Imagen 4 5/10.
Ponieważ ta próba zakończyła się fiaskiem, postanowiłem spróbować czegoś prostszego. Poprosiłem Imagen 4 o stworzenie zdjęcia kobiety nad rzeką za pomocą obiektywu typu rybie oko.
Chciałem sprawdzić, czy film sprawdzi się lepiej w przypadku sceny z jednym tematem niż w scenie z wieloma postaciami. Ale nawet po tej zmianie efekt był nieco rozczarowujący.

Model sztucznej inteligencji wyrenderował nietypowy obraz kobiety z trzema rękami! Nie wiem, dlaczego tak się stało, ale widać wyraźnie, że Imagen 4 ma pewne problemy z konsekwentnym i szybkim wdrażaniem.
Jeśli w ogóle, to wydaje się jeszcze mniej skuteczny niż Imagen 3. Przyznaję, że jakość obrazu i szczegółowość tej sceny jest dobra, więc to już coś.
Ale nawet pracując nad konkretnym tematem, Imagen 4 nie zdołał stworzyć realistycznego obrazu, który mógłby zostać wykorzystany.
A sądząc po wrażeniach innych użytkowników , wygląda na to, że nie jestem jedyną osobą, która ma problem z dostosowaniem stylu podpowiedzi do tego modelu obrazu AI.
W tym teście dałbym Imagen 4 ocenę 3/10.
Aby jeszcze bardziej podkreślić moją tezę, wypróbowałem to samo polecenie w Imagen 3 i oto efekt poniżej. Jak widać, Imagen 4 niewątpliwie ustępuje swojemu poprzednikowi pod względem dokładnego wykonywania instrukcji i renderowania poprawnych obrazów.

W moim teście końcowym zdecydowałem się na użycie jeszcze bardziej szczegółowego polecenia. Oto, co wpisałam: „Futurystyczny, ciemny pojazd, przypominający poduszkowiec lub pojazd opancerzony, jest przedstawiony w powietrzu, nad nocną panoramą miasta. Pojazd jest smukły i kanciasty, z dużymi, terenowymi oponami i wieloma czerwonymi światłami z tyłu. Na jego powierzchni widoczne są smugi deszczu i wydaje się być w ruchu, prawdopodobnie latając lub unosząc się w powietrzu. Miasto jest oświetlone jaskrawymi neonami, głównie w kolorze różowym i czerwonym, co tworzy wyrazisty kontrast z ciemnym pojazdem. Miejskie otoczenie przedstawia oświetlone budynki i most w tle, co sugeruje nocny pejzaż miejski. Perspektywa jest lekko niska, jakby pojazd był oglądany z dołu, co wzmacnia wrażenie prędkości i zwinności. Kompozycja koncentruje się na pojeździe, umieszczając go centralnie w kadrze, a pejzaż miejski stanowi tło. Pojazd jest skierowany do przodu, a kolory są wyraziste, z chłodną paletą ciemnych czerni, szarości i kontrastujących, jasnych neonów. Na zdjęciu dominuje energia i dynamika. Styl jest nowoczesny, stylizowany i nawiązuje do sceny z gry wideo lub futurystycznego filmu akcji, ze szczególnym naciskiem na szczegółowe oświetlenie, deszcz i efekty wizualne. Ogólna atmosfera jest surowa, intensywna i dynamiczna, oddając poczucie miejskiej przygody.
A oto co wygenerowało:

Podczas tego testu byłem pod ogromnym wrażeniem. Imagen 4 uchwycił niemal każdy kluczowy szczegół z nieskazitelną dokładnością, tworząc oszałamiający obraz, który wygląda jak wyjęty prosto z gry wideo.
Poziom szczegółowości samochodu, fluorescencyjne oświetlenie miejskiego krajobrazu, a nawet poczucie pilności sceny… wszystko to zostało oddane w sposób zrozumiały i doskonały.
Przyznam, że Imagen 4 zaskoczył mnie tym razem! Nie mogę zaprzeczyć, że wykonał fantastyczną robotę. Wygląda na to, że styl podpowiedzi modelu sztucznej inteligencji może działać lepiej z bardziej szczegółowymi instrukcjami.
Ponadto, po przejrzeniu próbek Google DeepMind Imagen 4 zamieszczonych na stronie internetowej tej firmy, wydaje się, że korzystanie z długich i szczegółowych instrukcji może być jedyną opcją pozwalającą na maksymalne wykorzystanie potencjału tego modelu sztucznej inteligencji.
Tym razem dałbym Imagen 4 ocenę 9/10 za wydajność . Bardzo dobrze wykonany.
Ponieważ ten ostatni obraz był dobry, miałem teraz pewne wątpliwości! Oczywiście postanowiłem przeprowadzić jeszcze jeden test, zanim wyrobiłem sobie zdanie na temat możliwości Imagen 4.
W tym ostatnim teście chciałem sprawdzić, jak model obrazu AI radzi sobie z typografią. Dlatego poprosiłem o wyjątkowy, w stylu retro, promocyjny plakat filmowy o rekinach z wyrazistym tytułem.
Na potrzeby tego zamówienia, Imagen 4 stworzył przyciągający wzrok plakat z wyrazistymi czcionkami w żywych kolorach. Niestety, Imagen 4 nie wyrenderował całego tekstu plakatu, co było frustrujące.

W zasadzie przedstawił mi niekompletny obraz, więc nie był on zbyt użyteczny. Poza tym muszę przyznać, że projekt plakatu nie był taki zły.
Jeśli już, to Imagen 4 dobrze oddał styl retro i stworzył coś, co wygląda ciekawie i ekscytująco. Ponownie, test przyniósł mieszane rezultaty. Szczerze mówiąc, dałbym mu ocenę 6,5/10.
Ogólnie rzecz biorąc, uważam, że Imagen 4 wymagałby nieco więcej pracy. Może i ma nowe ulepszenia w stosunku do poprzednika, ale nadal wydaje się nieco niedopracowany, zwłaszcza w przypadku złożonych scen.
Poza tym, przydałoby się też ulepszyć jego kreatywny design. Choć jakość obrazu jest niezaprzeczalna, Imagen 4 wydaje się nieco ograniczony w swojej wyobraźni.
Ponadto nowy styl podpowiedzi Imagen 4 wydaje się mniej elastyczny i intuicyjny. Dla przeciętnego użytkownika może to powodować pewną frustrację w próbie uzyskania właściwego rezultatu.
Potrzebujesz czegoś lepszego niż Imagen 4? Wypróbuj Pollo AI!
Biorąc pod uwagę, że w Imagen 4 wciąż trzeba poprawić kilka usterek, najlepszym wyborem na obecnym rynku, który gorąco polecam, jest Pollo AI.
To kompleksowa platforma do generowania obrazów i materiałów wideo , zintegrowana z kilkoma najwyższej klasy modelami generowania sztucznej inteligencji, które dostosowują się do niemal każdego stylu wizualnego.
Możesz uzyskać dostęp do modeli obrazów AI, takich jak Nano Banana , Imagen , GPT-4o , Recraft , Stable Diffusion i Flux . Pollo AI oferuje również modele wideo AI, takie jak Kling AI , PixVerse AI , Luma AI , Hailuo AI i Runway .
Mając wszystkie te opcje w jednym miejscu, możesz swobodnie przełączać się między nimi, aby tworzyć wszelkiego rodzaju wyjątkowe i pomysłowe rezultaty.
Ale to nie koniec! Czy kiedykolwiek chciałeś spersonalizować istniejące obrazy i filmy bez potrzeby posiadania profesjonalnych umiejętności edycji?
Dzięki Pollo AI uzyskasz dostęp do dziesiątek efektów AI, szablonów i narzędzi, które pomogą Ci przekształcić dowolne medium wizualne w różnego rodzaju rozrywkowe materiały.
A co najlepsze? Możesz wypróbować ogromne możliwości Pollo AI już teraz, bez konieczności płacenia, dzięki bezpłatnemu planowi próbnemu!
Wniosek
Imagen 4 to intrygujący model obrazów oparty na sztucznej inteligencji, który oferuje mnóstwo nowych funkcji, ale wciąż jest w fazie rozwoju, przynajmniej z punktu widzenia użytkownika. Dopóki nie stanie się bardziej dopracowany, sugeruję wybór bardziej spójnego, kreatywnego i niezawodnego narzędzia opartego na sztucznej inteligencji do generowania obrazów. Z mojego osobistego doświadczenia wynika, że Pollo AI to strzał w dziesiątkę!