Ich habe Imagen 4 getestet: Nicht so gut wie Imagen 3, aber so holen Sie das Beste daraus heraus!

Wer KI-generierte Bilder verwendet, hat sicher schon von Google DeepMinds neuestem KI-Bildmodell Imagen 4 gehört. Aber ist der ganze Hype wirklich gerechtfertigt? Ich war gespannt, das herauszufinden!

Dieses neue KI-Modell, das auf der Google I/O 2025 vorgestellt wurde , wurde entwickelt, um reichhaltigere und detailliertere Bilder mit noch größerer Klarheit und Geschwindigkeit als sein VorgängerImagen 3 zu erzeugen.

Google behauptete außerdem, dass es nuancierte Farben sowie komplexe Details und Texturen wie Stoffe, Tierfell oder sogar Wassertropfen realistisch darstellen könne.

In diesem Sinne zeichnet sich das KI-Bildmodell durch seine Fähigkeit aus, sowohl fotorealistische als auch abstrakte Stile zu realisieren. Darüber hinaus bietet Imagen 4 auch eine verbesserte Rechtschreibung und Typografie.

Das bedeutet, dass ich damit alle möglichen textlastigen Bilder erstellen kann, wie Poster, Comics, Präsentationen, Einladungen usw.

Bild 1

Imagen 4 soll außerdem eine verbesserte, prompte Einhaltung von Anweisungen bieten, Zugriff auf eine größere Auswahl an Seitenverhältnissen ermöglichen und Bilder mit einer Auflösung von bis zu 2K erzeugen.

Angesichts der zahlreichen Verbesserungen, die Imagen 4 bietet, scheint Google DeepMind ein neues Niveau an kreativer Kontrolle und Qualität anzustreben.

Meine Reise mit Imagen 4

Doch die Frage bleibt: Wie schlägt sich Imagen 4 im Alltag? Um das herauszufinden, habe ich einen eigenen Test durchgeführt.

Ich wollte gleich zu Beginn etwas Einfaches machen. Deshalb habe ich das Imagen 4 Modell gebeten, eine Szene eines Militärstützpunktes mit Soldaten zu generieren, die sich auf den Krieg vorbereiten.

Leider war das Ergebnis mangelhaft. Zwar gelang es Imagen 4 , eine relativ gute Darstellung einer militärischen Szene zu erzeugen, doch wichtige Details der Charaktere wurden nicht erfasst.

Bild 2

Genauer gesagt, wirkten ihre Gesichter irgendwie verwaschen und entstellt. Es wurde kaum Wert darauf gelegt, den einzelnen Figuren in der Szene individuelle und korrekte Gesichtszüge zu verleihen.

Es scheint, als sei das KI-Modell darauf ausgelegt gewesen, die Umgebung als Ganzes zu erschaffen, habe aber die kleinen Details ignoriert, die den Realismus des Bildes noch verstärkt hätten.

In diesem Test würde ich Imagen 4 eine vernichtende 5/10 geben.

Da dieser Versuch gescheitert war, beschloss ich, etwas Einfacheres auszuprobieren. Ich beauftragte Imagen 4 damit, mit einem Fischaugenobjektiv ein Bild einer Frau am Fluss zu erstellen.

Ich wollte sehen, ob es mit einer einzelnen Person besser funktionieren würde als mit einer Szene mit mehreren Figuren. Aber selbst mit dieser Änderung war das Ergebnis noch etwas enttäuschend.

Bild 3

Das KI-Modell erzeugte ein ungewöhnliches Bild einer Frau mit drei Händen! Ich bin mir nicht sicher, warum das passiert ist, aber es ist klar, dass Imagen 4 etwas Schwierigkeiten mit der konsequenten Einhaltung der Anweisungen hat.

Im Gegenteil, es scheint sogar noch weniger effektiv zu sein als Imagen 3. Zugegeben, die Bildqualität und der Detailgrad in dieser Szene sind gut, das ist immerhin etwas.

Doch selbst mit nur einem konkreten Thema als Vorlage gelang es Imagen 4 nicht, eine realistische und brauchbare Darstellung zu liefern.

Und nach den Eindrücken anderer Nutzer zu urteilen, bin ich wohl nicht der Einzige, der Schwierigkeiten hat, den Eingabeaufforderungsstil bei diesem KI-Bildmodell zum Laufen zu bringen.

Für diesen Test würde ich Imagen 4 eine 3/10 geben.

Um meinen Punkt weiter zu verdeutlichen, habe ich dieselbe Aufgabe mit Imagen 3 getestet. Das Ergebnis sehen Sie unten. Wie Sie sehen, ist Imagen 4 im Vergleich zu seinem Vorgänger in puncto korrekter Ausführung von Anweisungen und Darstellung von Bildern deutlich zurückgefallen.

Bild 4

Für meine Abschlussprüfung entschied ich mich für eine noch detailliertere Aufgabenstellung. Hier ist mein Eintrag: „Ein futuristisches, dunkel gefärbtes Fahrzeug, das an ein Hovercraft oder ein gepanzertes Fahrzeug erinnert, schwebt über der nächtlichen Skyline einer Stadt. Das Fahrzeug ist schnittig und kantig, mit großen Geländereifen und mehreren roten Lichtern am Heck. Regentropfen sind auf seiner Oberfläche sichtbar, und es scheint sich zu bewegen, möglicherweise zu fliegen oder zu schweben. Die Stadt ist von leuchtenden Neonlichtern, vorwiegend in Pink und Rot, erhellt, die einen starken Kontrast zum dunklen Fahrzeug bilden. Im Hintergrund sind beleuchtete Gebäude und eine Brücke zu sehen, die an eine nächtliche Stadtlandschaft erinnern. Die Perspektive ist leicht von unten, als ob man das Fahrzeug von unten betrachtet, was den Eindruck von Geschwindigkeit und Wendigkeit verstärkt. Die Komposition konzentriert sich auf das Fahrzeug und platziert es zentral im Bildausschnitt, während die Stadtlandschaft den Hintergrund bildet. Das Fahrzeug ist nach vorn gerichtet, und die Farben sind kräftig, mit einer kühlen Palette aus tiefen Schwarz-, Grau- und kontrastierenden hellen Neonfarben. Das Bild vermittelt ein Gefühl von Energie und Dynamik. Der Stil ist …“ Modern, stilisiert und an eine Videospielszene oder einen futuristischen Actionfilm erinnernd, mit einem besonderen Fokus auf detaillierte Beleuchtung, Regen und visuelle Effekte. Die Gesamtatmosphäre ist rau, intensiv und rasant und vermittelt ein Gefühl von urbanem Abenteuer.

Und hier ist das Ergebnis:

Bild 5

Dieser Test hat mich restlos beeindruckt. Imagen 4 hat es geschafft, nahezu jedes wichtige Detail mit makelloser Präzision einzufangen und so ein atemberaubendes Bild zu erzeugen, das aussieht, als käme es direkt aus einem Videospiel.

Der Detailgrad des Autos, die fluoreszierende Beleuchtung der Stadtkulisse und sogar das Gefühl der Dringlichkeit in der Szene… all das wurde erschreckend gut dargestellt.

Ich muss gestehen, Imagen 4 hat mich hier wirklich überrascht! Es hat wirklich hervorragende Arbeit geleistet. Offenbar funktioniert der Eingabestil des KI-Modells mit detaillierteren Anweisungen besser.

Betrachtet man die Imagen 4 Beispiele von Google DeepMind auf deren Website, so scheint es, dass die Verwendung langer und spezifischer Anweisungen die einzige Möglichkeit sein könnte, das volle Potenzial dieses KI-Modells auszuschöpfen.

Dieses Mal würde ich Imagen 4 in puncto Leistung 9 von 10 Punkten geben . Sehr gut umgesetzt.

Da das Ergebnis dieses letzten Bildes gut war, war ich nun etwas unentschlossen! Natürlich beschloss ich, noch einen Test durchzuführen, bevor ich mir ein endgültiges Urteil über die Fähigkeiten von Imagen 4 bildete.

Im letzten Test wollte ich sehen, wie sich das KI-Bildmodell bei Typografie schlägt. Deshalb bat ich um ein einzigartiges, im Retro-Stil gehaltenes Werbeplakat für einen Film über Haie mit einem markanten Titel.

Für diese Anfrage erstellte Imagen 4 ein auffälliges Poster mit fetten Schriftarten in leuchtenden Farben. Allerdings wurde der Postertext von Imagen 4 nicht vollständig dargestellt, was ärgerlich war.

Bild 6

Es präsentierte mir im Grunde ein unvollständiges Bild, ist also nicht wirklich brauchbar. Davon abgesehen muss ich aber zugeben, dass das Posterdesign gar nicht so schlecht war.

Imagen 4 hat den Retro-Stil gut umgesetzt und ein cooles und ansprechendes Ergebnis erzielt. Es war also wieder einmal ein Test mit gemischten Ergebnissen. Ehrlich gesagt würde ich ihm 6,5 von 10 Punkten geben.

Insgesamt bin ich der Meinung, dass Imagen 4 noch etwas Feinschliff vertragen könnte. Es mag zwar einige Verbesserungen gegenüber dem Vorgänger bieten, wirkt aber dennoch etwas unpräzise, ​​insbesondere bei komplexen Szenen.

Darüber hinaus könnte auch das kreative Design verbessert werden. Die Bildqualität ist zwar unbestreitbar, doch Imagen 4 wirkt in seiner Fantasie etwas eingeschränkt.

Auch der neue Eingabeaufforderungsstil von Imagen 4 wirkt weniger flexibel und intuitiv. Für den durchschnittlichen Nutzer dürfte dies bei dem Versuch, das gewünschte Ergebnis zu erzielen, zu Frustration führen.

Brauchen Sie etwas Besseres als Imagen 4? Probieren Sie Pollo AI aus!

Da Imagen 4 noch einige Kinderkrankheiten aufweist, die behoben werden müssen, ist die nächstbeste Wahl auf dem aktuellen Markt, die ich wärmstens empfehlen würde, Pollo AI.

Dies ist eine All-in-One-Plattform zur Bild- und Videogenerierung , die mit mehreren erstklassigen KI-Generierungsmodellen ausgestattet ist, die nahezu jeden visuellen Stil abdecken.

Sie können auf KI-Bildmodelle wie Nano Banana , Imagen , GPT-4o , Recraft , Stable Diffusion und Flux zugreifen. Pollo AI bietet außerdem KI-Videomodelle wie Kling AI , PixVerse AI , Luma AI , Hailuo AI und Runway an.

Da sich all diese Optionen an einem Ort befinden, können Sie frei zwischen ihnen wechseln, um alle Arten von einzigartigen und fantasievollen Ergebnissen zu erzeugen.

Aber das ist noch nicht alles! Wollten Sie schon immer vorhandene Bilder und Videos anpassen, ohne professionelle Bearbeitungskenntnisse zu benötigen?

Mit Pollo AI erhalten Sie Zugriff auf Dutzende von KI-Effekten, Vorlagen und Werkzeugen, die Ihnen dabei helfen, beliebige visuelle Medien in unterhaltsame Ergebnisse zu verwandeln.

Und das Beste daran? Sie können die vielfältigen Funktionen von Pollo AI jetzt kostenlos im Rahmen des Gratis-Testprogramms ausprobieren!

Abschluss

Imagen 4 ist ein faszinierendes KI-Bildmodell mit vielen neuen Funktionen, befindet sich aber – zumindest aus Nutzersicht – noch in der Entwicklung. Bis es ausgereifter ist, empfehle ich Ihnen ein konsistenteres, kreativeres und zuverlässigeres KI-Tool zur Bildgenerierung. Und meiner Erfahrung nach ist Pollo AI dafür absolut empfehlenswert!

Das könnte Ihnen auch gefallen

Mehr anzeigen

ImagineArt Testbericht: Ich habe ImagineArt getestet und hier sind meine Eindrücke für euch.

Möchten Sie ImagineArt nutzen? Hier finden Sie meinen ausführlichen Leitfaden zu diesem KI-Bildgenerator, der seine Funktionen und Probleme erläutert und sogar meine persönlichen Erfahrungen damit schildert!

Ich habe Invideo AI getestet und es ist keine ideale KI-Plattform zur Video- und Bilderstellung

Ich habe den KI-Videogenerator und den KI-Bildgenerator von Invideo AI getestet. Dieser Beitrag fasst meine Erfahrungen damit zusammen. Außerdem teile ich meine Meinung zu Invideo AI.

Leonardo.AI im Test: Könnte es die beste Alternative zu Midjourney und Stable Diffusion sein?

In diesem Beitrag präsentiere ich euch meinen Erfahrungsbericht zu Leonardo.AI . Ich zeige euch, wie das Programm mit verschiedenen KI-Modellen Bilder generieren und die Designarbeit verbessern kann.

Lovart AI im Test: Ich habe Lovart AI getestet und bin von den Ergebnissen begeistert, aber es gibt auch Herausforderungen.

Möchten Sie mehr über Lovart AI erfahren? Ich habe mich mit diesem neuen KI-Design-Agenten beschäftigt und hier ist meine umfassende Benutzererfahrung! Schauen Sie rein!