Startseite/Blog/Bewertungen/Google Veo 3.1 im Test: Ich habe Google Veo 3.1 getestet und fand es beeindruckend, aber nicht perfekt.

Google Veo 3.1 im Test: Ich habe Google Veo 3.1 getestet und fand es beeindruckend, aber nicht perfekt.

Google hat gerade sein neuestes Modell zur Videoerstellung, Veo 3.1, vorgestellt, das auf dem ursprünglichen Veo 3 aufbaut.

Veo 3.1 liefert nicht nur eine verbesserte Prompt-Konformität, die sicherstellt, dass Ihre Vision mit größerer Genauigkeit zum Leben erweckt wird, sondern bietet auch eine reichhaltigere native Audioausgabe, die Ton und Bewegung natürlicher als zuvor zusammenbringt.

Es wurden auch drei neue Schlüsselfunktionen eingeführt, darunter:

  • Zutaten zu Video: Generieren Sie ein vollständiges Video aus Referenzbildern und fixieren Sie so Charakter und Szenenstil.
  • Frames zu Video: Erstellen Sie flüssige, natürliche Übergänge, indem Sie den ersten und letzten Frame einer Aufnahme bereitstellen.
  • Video erweitern: Verwandeln Sie kurze Clips in längere Videos, indem Sie die Action für eine Minute oder länger erweitern.

Ein Ein-Klick-Entfernungstool ist ebenfalls auf dem Weg, das unerwünschte Objekte entfernt und den Hintergrund für ein sauberes Ergebnis rekonstruiert.

Googles Veo 3.1 ist jetzt auf dem Pollo AI Video-Generator verfügbar und bietet Kreativen Zugang zu verbesserten Funktionen zur Videoerstellung.

Ich habe eine Reihe von Tests durchgeführt, die sich auf vier wichtige Verbesserungen konzentrierten: verbesserte native Audioausgabe, Zutaten zu Video und Frames zu Video. Hier ist, was ich herausgefunden habe – Spoiler: Veo 3.1 ist ein Game-Changer.

Veo 3.1 auf dem Prüfstand

  1. Native Audioerzeugung

Prompt: „Nahaufnahme einer brutzelnden Gusseisenpfanne in einer belebten Restaurantküche. Ein Koch wendet ein Steak, und man hört das Geplapper anderer Köche und das Klappern von Töpfen und Pfannen im Hintergrund.“

Ergebnis: Die Ausgabe war beeindruckend. Der primäre Ton – das scharfe, knackende Brutzeln des Steaks – war klar und im Vordergrund. Trotzdem, dass es im Prompt explizit gewünscht war, fehlte das deutliche „Geplapper anderer Köche“. Dies ließ den Hintergrund weniger „belebt“ wirken als erwartet und es fehlte ein Schlüsselelement des menschlichen Faktors, das das Audio wirklich reichhaltig und vielschichtig gemacht hätte.

  1. Frames zu Video

Prompt: Erstellen Sie mit dem ersten und letzten Frame als Buchstützen ein 10-sekündiges, flüssiges Übergangsvideo, in dem ein Paar das Café betritt, sich hinsetzt, Kaffee bestellt und anfängt, sich lebhaft zu unterhalten, während die Nacht hereinbricht.

Start- und End-Frame-Bild Ausgabe-Video
1
2

Ergebnis: Während Charaktere und Szene visuell konsistent blieben und die Start-/End-Frames als Buchstützen verwendet wurden, schaffte es das Video nicht, einen flüssigen Übergang zu erzeugen. Aktionen wie das Bestellen waren abrupt (z. B. Kaffeetassen erschienen plötzlich), und es gab einen erheblichen Mangel an Kontinuität bis zum letzten Frame.

  1. Zutaten zu Video

Prompt: Ein bärtiger Zauberer in lila Roben in einer kerzenbeleuchteten Steingramothek liest ein antikes Buch, blickt plötzlich überrascht auf und wirkt dann einen Zauber, der Bücher um ihn herum schweben lässt

Referenzbilder Ausgabe-Video
3
4

Ergebnis: Während die Gesamtumgebung und die Stimmung hervorragend beibehalten wurden – mit einer detailreichen, kerzenbeleuchteten Steingramothek und atmosphatischer Beleuchtung – entsprach das Aussehen des Zauberers nicht vollständig dem Referenzbild.

Seine Gesichtszüge und sein Bartstil unterschieden sich merklich, was auf eine begrenzte Genauigkeit bei der Übertragung des Charakters hindeutet.

Trotz des anfänglichen Missverhältnisses zeigt das Modell eine ausgezeichnete zeitliche Kohärenz und Szenentreue und liefert eine filmische und immersive Sequenz, die gut zur beschriebenen Handlung passt.

Endgültiges Urteil

Veo 3.1 zeigt starke Fähigkeiten bei der Wiedergabe konsistenter Charaktere und Szenen und erhält erfolgreich die visuelle Integrität über Frames und angegebene Buchstützen hinweg.

Es funktioniert gut mit primären Aktionen und Objekten und kann klare primäre Audioeffekte erzeugen. Das Modell weist jedoch erhebliche Schwächen bei der Erzeugung dynamischer und nuancierter Videoinhalte auf. Es hat Schwierigkeiten mit:

  1. Flüssige Übergänge & Kontinuität: Komplexe, mehrstufige Aktionen erscheinen oft abrupt (z. B. plötzlich erscheinende Objekte), und Übergänge mangelt es an Kontinuität, was zu abgehackten Sequenzen führt, insbesondere in Richtung der End-Frames.
  2. Emotionale Nuance: Charakterausdrücke und Ton können inkonsistent sein oder die angegebene emotionale Tiefe vermissen lassen (z. B. ein „überraschter“ Blick erscheint mild, oder ein „lachendes“ Paar ist animationslos).
  3. Komplexe Objektanimation: Interaktionen mit mehreren Objekten (wie schwebende Bücher) können steif, mechanisch erscheinen oder Objekte erscheinen lassen, anstatt sich organisch zu bewegen.
  4. Vielschichtiges Audio: Während primäre Geräusche gut sind, bleibt die Erzeugung unterschiedlicher sekundärer oder Hintergrund-Audioelemente, selbst wenn sie explizit angefordert werden, eine Herausforderung und beeinträchtigt die Reichhaltigkeit der Klanglandschaft.

Warum Veo 3.1 auf Pollo AI nutzen?

Pollo AI vereint das Beste aus der KI-Videoerstellung – alles unter einem Dach. Betrachten Sie es als Ihr kreatives Kontrollzentrum, wo Leistung auf Flexibilität trifft.

Sie sind nicht auf nur einen Modus wie Veo 3.1 beschränkt. Auf Pollo AI können Sie jederzeit zwischen Top-Engines wie Sora 2, Veo 3, Kling 2.5 Turbo, Wan 2.5, Seedance und anderen wechseln.

Das bedeutet, wenn Sie die Realitätsnähe und erzählerische Tiefe von Veo 3.1 lieben (was übrigens erstaunlich ist), können Sie es genau dann nutzen, wenn es passt – und dann zu einem anderen Modell für Geschwindigkeit, Stil oder Detail wechseln. Keine Grenzen. Keine Kompromisse.

Darüber hinaus verfügt es über alle wichtigen Funktionen zur KI-Videoerstellung:

Erleben Sie Pollo AI noch heute und entfesseln Sie das volle Potenzial der KI-gesteuerten Videoproduktion.

Das könnte Ihnen auch gefallen

Mehr anzeigen

Gemini Omni im Test: Ich habe Gemini Omni getestet und war begeistert.

In diesem Gemini Omni Testbericht erfährst du, wie gut Googles neues KI-Video-Modell wirklich ist – mit Fokus auf Videoqualität, Funktionen und Zuverlässigkeit.

Adobe Firefly im Test: Ich habe Adobe Firefly getestet und möchte einige interessante Neuigkeiten dazu teilen.

Möchten Sie Adobe Firefly nutzen? Bevor Sie das tun, empfehle ich Ihnen, meinen ausführlichen Testbericht über den KI-Bild- und Videogenerator zu lesen, um zu erfahren, was mir während meiner Erfahrung damit gefallen und nicht gefallen hat!

Wie Sie Gebrauchtwagen-Werbevideos mit Gemini Omni schnell und einfach erstellen

Erstellen Sie mit Gemini Omni in wenigen Klicks professionelle Gebrauchtwagen-Werbevideos aus Fahrzeugbildern, Referenzclips und Prompts. Jetzt mit Pollo AI starten.

Wie Sie E-Commerce-Produktvideos mit Gemini Omni einfach per Prompt erstellen

Erstellen und bearbeiten Sie mit Gemini Omni ganz einfach Produktvideos per Prompt. Jetzt mit Pollo AI starten.