Przetestowałem Imagen 4: Nie jest tak dobry jak Imagen 3, ale oto jak w pełni go wykorzystać!

Jeśli korzystasz z obrazów generowanych przez sztuczną inteligencję, to zapewne słyszałeś, że Google DeepMind właśnie wprowadził na rynek swój najnowszy model obrazów oparty na sztucznej inteligencji – Imagen 4. Ale czy naprawdę jest wart całego tego szumu? Nie mogłem się doczekać, żeby się przekonać!

Zaprezentowany na konferencji Google I/O 2025 nowy model sztucznej inteligencji ma na celu generowanie bogatszych i bardziej szczegółowych obrazów o jeszcze większej przejrzystości i szybkości niż jego poprzednik,Imagen 3 .

Google twierdzi również, że aplikacja potrafi realistycznie oddawać niuanse kolorów, a także skomplikowane szczegóły i tekstury, takie jak tkaniny, sierść zwierząt, a nawet krople wody.

W tym sensie model obrazu AI może doskonale sprawdzać się w fotorealizmie i stylach abstrakcyjnych. Poza tym, Imagen 4 został zaprojektowany z myślą o lepszej pisowni i typografii.

Oznacza to, że mogę go używać do tworzenia wszelkiego rodzaju obrazów z dużą ilością tekstu, takich jak plakaty, komiksy, slajdy, zaproszenia itp.

Imagen 4 oferuje również szybszą zgodność z przepisami, dostęp do szerszego zakresu proporcji obrazu i możliwość generowania obrazów o rozdzielczości do 2K.

Biorąc pod uwagę liczbę udoskonaleń, jakie oferuje Imagen 4 , wydaje się, że Google DeepMind dąży do osiągnięcia nowego poziomu kontroli i jakości kreatywnej.

Moja podróż z Imagen 4

Ale pytanie pozostaje: jak Imagen 4 sprawdza się w rękach przeciętnego użytkownika? Byłem tego ciekaw, więc postanowiłem przeprowadzić własny test.

Od razu chciałem zacząć od czegoś prostego. Dlatego poprosiłem model Imagen 4 o wygenerowanie sceny bazy wojskowej z żołnierzami przygotowującymi się do wojny.

Niestety, wygenerowany wynik był poniżej oczekiwań. Chociaż Imagen 4 zdołał stworzyć stosunkowo dobry render sceny militarnej, nie udało mu się uchwycić kluczowych szczegółów postaci.

Mówiąc dokładniej, ich twarze wyglądały po prostu na zmiażdżone i zniekształcone. Włożono bardzo mało wysiłku w oddanie właściwych i niepowtarzalnych rysów twarzy każdej z postaci w scenie.

Wygląda na to, że model sztucznej inteligencji został przygotowany do stworzenia otoczenia jako całości, ale zignorował drobne aspekty, które dodatkowo podkreśliłyby realizm obrazu.

W tym teście dałbym Imagen 4 5/10.

Ponieważ ta próba zakończyła się fiaskiem, postanowiłem spróbować czegoś prostszego. Poprosiłem Imagen 4 o stworzenie zdjęcia kobiety nad rzeką za pomocą obiektywu typu rybie oko.

Chciałem sprawdzić, czy film sprawdzi się lepiej w przypadku sceny z jednym tematem niż w scenie z wieloma postaciami. Ale nawet po tej zmianie efekt był nieco rozczarowujący.

Model sztucznej inteligencji wyrenderował nietypowy obraz kobiety z trzema rękami! Nie wiem, dlaczego tak się stało, ale widać wyraźnie, że Imagen 4 ma pewne problemy z konsekwentnym i szybkim wdrażaniem.

Jeśli w ogóle, to wydaje się jeszcze mniej skuteczny niż Imagen 3. Przyznaję, że jakość obrazu i szczegółowość tej sceny jest dobra, więc to już coś.

Ale nawet pracując nad konkretnym tematem, Imagen 4 nie zdołał stworzyć realistycznego obrazu, który mógłby zostać wykorzystany.

A sądząc po wrażeniach innych użytkowników , wygląda na to, że nie jestem jedyną osobą, która ma problem z dostosowaniem stylu podpowiedzi do tego modelu obrazu AI.

W tym teście dałbym Imagen 4 ocenę 3/10.

Aby jeszcze bardziej podkreślić moją tezę, wypróbowałem to samo polecenie w Imagen 3 i oto efekt poniżej. Jak widać, Imagen 4 niewątpliwie ustępuje swojemu poprzednikowi pod względem dokładnego wykonywania instrukcji i renderowania poprawnych obrazów.

W moim teście końcowym zdecydowałem się na użycie jeszcze bardziej szczegółowego polecenia. Oto, co wpisałam: „Futurystyczny, ciemny pojazd, przypominający poduszkowiec lub pojazd opancerzony, jest przedstawiony w powietrzu, nad nocną panoramą miasta. Pojazd jest smukły i kanciasty, z dużymi, terenowymi oponami i wieloma czerwonymi światłami z tyłu. Na jego powierzchni widoczne są smugi deszczu i wydaje się być w ruchu, prawdopodobnie latając lub unosząc się w powietrzu. Miasto jest oświetlone jaskrawymi neonami, głównie w kolorze różowym i czerwonym, co tworzy wyrazisty kontrast z ciemnym pojazdem. Miejskie otoczenie przedstawia oświetlone budynki i most w tle, co sugeruje nocny pejzaż miejski. Perspektywa jest lekko niska, jakby pojazd był oglądany z dołu, co wzmacnia wrażenie prędkości i zwinności. Kompozycja koncentruje się na pojeździe, umieszczając go centralnie w kadrze, a pejzaż miejski stanowi tło. Pojazd jest skierowany do przodu, a kolory są wyraziste, z chłodną paletą ciemnych czerni, szarości i kontrastujących, jasnych neonów. Na zdjęciu dominuje energia i dynamika. Styl jest nowoczesny, stylizowany i nawiązuje do sceny z gry wideo lub futurystycznego filmu akcji, ze szczególnym naciskiem na szczegółowe oświetlenie, deszcz i efekty wizualne. Ogólna atmosfera jest surowa, intensywna i dynamiczna, oddając poczucie miejskiej przygody.

A oto co wygenerowało:

Podczas tego testu byłem pod ogromnym wrażeniem. Imagen 4 uchwycił niemal każdy kluczowy szczegół z nieskazitelną dokładnością, tworząc oszałamiający obraz, który wygląda jak wyjęty prosto z gry wideo.

Poziom szczegółowości samochodu, fluorescencyjne oświetlenie miejskiego krajobrazu, a nawet poczucie pilności sceny… wszystko to zostało oddane w sposób zrozumiały i doskonały.

Przyznam, że Imagen 4 zaskoczył mnie tym razem! Nie mogę zaprzeczyć, że wykonał fantastyczną robotę. Wygląda na to, że styl podpowiedzi modelu sztucznej inteligencji może działać lepiej z bardziej szczegółowymi instrukcjami.

Ponadto, po przejrzeniu próbek Google DeepMind Imagen 4 zamieszczonych na stronie internetowej tej firmy, wydaje się, że korzystanie z długich i szczegółowych instrukcji może być jedyną opcją pozwalającą na maksymalne wykorzystanie potencjału tego modelu sztucznej inteligencji.

Tym razem dałbym Imagen 4 ocenę 9/10 za wydajność . Bardzo dobrze wykonany.

Ponieważ ten ostatni obraz był dobry, miałem teraz pewne wątpliwości! Oczywiście postanowiłem przeprowadzić jeszcze jeden test, zanim wyrobiłem sobie zdanie na temat możliwości Imagen 4.

W tym ostatnim teście chciałem sprawdzić, jak model obrazu AI radzi sobie z typografią. Dlatego poprosiłem o wyjątkowy, w stylu retro, promocyjny plakat filmowy o rekinach z wyrazistym tytułem.

Na potrzeby tego zamówienia, Imagen 4 stworzył przyciągający wzrok plakat z wyrazistymi czcionkami w żywych kolorach. Niestety, Imagen 4 nie wyrenderował całego tekstu plakatu, co było frustrujące.

W zasadzie przedstawił mi niekompletny obraz, więc nie był on zbyt użyteczny. Poza tym muszę przyznać, że projekt plakatu nie był taki zły.

Jeśli już, to Imagen 4 dobrze oddał styl retro i stworzył coś, co wygląda ciekawie i ekscytująco. Ponownie, test przyniósł mieszane rezultaty. Szczerze mówiąc, dałbym mu ocenę 6,5/10.

Ogólnie rzecz biorąc, uważam, że Imagen 4 wymagałby nieco więcej pracy. Może i ma nowe ulepszenia w stosunku do poprzednika, ale nadal wydaje się nieco niedopracowany, zwłaszcza w przypadku złożonych scen.

Poza tym, przydałoby się też ulepszyć jego kreatywny design. Choć jakość obrazu jest niezaprzeczalna, Imagen 4 wydaje się nieco ograniczony w swojej wyobraźni.

Ponadto nowy styl podpowiedzi Imagen 4 wydaje się mniej elastyczny i intuicyjny. Dla przeciętnego użytkownika może to powodować pewną frustrację w próbie uzyskania właściwego rezultatu.

Potrzebujesz czegoś lepszego niż Imagen 4? Wypróbuj Pollo AI!

Biorąc pod uwagę, że w Imagen 4 wciąż trzeba poprawić kilka usterek, najlepszym wyborem na obecnym rynku, który gorąco polecam, jest Pollo AI.

To kompleksowa platforma do generowania obrazów i materiałów wideo , zintegrowana z kilkoma najwyższej klasy modelami generowania sztucznej inteligencji, które dostosowują się do niemal każdego stylu wizualnego.

Możesz uzyskać dostęp do modeli obrazów AI, takich jak Nano Banana , Imagen , GPT-4o , Recraft , Stable Diffusion i Flux . Pollo AI oferuje również modele wideo AI, takie jak Kling AI , PixVerse AI , Luma AI , Hailuo AI i Runway .

Mając wszystkie te opcje w jednym miejscu, możesz swobodnie przełączać się między nimi, aby tworzyć wszelkiego rodzaju wyjątkowe i pomysłowe rezultaty.

Ale to nie koniec! Czy kiedykolwiek chciałeś spersonalizować istniejące obrazy i filmy bez potrzeby posiadania profesjonalnych umiejętności edycji?

Dzięki Pollo AI uzyskasz dostęp do dziesiątek efektów AI, szablonów i narzędzi, które pomogą Ci przekształcić dowolne medium wizualne w różnego rodzaju rozrywkowe materiały.

A co najlepsze? Możesz wypróbować ogromne możliwości Pollo AI już teraz, bez konieczności płacenia, dzięki bezpłatnemu planowi próbnemu!

Wniosek

Imagen 4 to intrygujący model obrazów oparty na sztucznej inteligencji, który oferuje mnóstwo nowych funkcji, ale wciąż jest w fazie rozwoju, przynajmniej z punktu widzenia użytkownika. Dopóki nie stanie się bardziej dopracowany, sugeruję wybór bardziej spójnego, kreatywnego i niezawodnego narzędzia opartego na sztucznej inteligencji do generowania obrazów. Z mojego osobistego doświadczenia wynika, że Pollo AI to strzał w dziesiątkę!

Przetestowałem Imagen 4: Nie jest tak dobry jak Imagen 3, ale oto jak w pełni go wykorzystać!

Moja podróż z Imagen 4

Potrzebujesz czegoś lepszego niż Imagen 4? Wypróbuj Pollo AI!

Wniosek

Może Ci się też spodobać

Recenzja ImagineArt : Przetestowałem ImagineArt i oto moja opinia dla Ciebie

Przetestowałem Invideo AI i nie jest to idealna platforma do tworzenia filmów i obrazów AI

Recenzja Leonardo.AI : może być najlepszą alternatywą dla Midjourney i Stable Diffusion

Recenzja Lovart AI : Przetestowałem Lovart AI i jestem pod wrażeniem wyników, ale nie obyło się bez wyzwań

NA TEJ STRONIE