Google hat gerade sein neuestes Modell zur Videoerstellung, Veo 3.1, vorgestellt, das auf dem ursprünglichen Veo 3 aufbaut.
Veo 3.1 liefert nicht nur eine verbesserte Prompt-Konformität, die sicherstellt, dass Ihre Vision mit größerer Genauigkeit zum Leben erweckt wird, sondern bietet auch eine reichhaltigere native Audioausgabe, die Ton und Bewegung natürlicher als zuvor zusammenbringt.
Es wurden auch drei neue Schlüsselfunktionen eingeführt, darunter:
- Zutaten zu Video: Generieren Sie ein vollständiges Video aus Referenzbildern und fixieren Sie so Charakter und Szenenstil.
- Frames zu Video: Erstellen Sie flüssige, natürliche Übergänge, indem Sie den ersten und letzten Frame einer Aufnahme bereitstellen.
- Video erweitern: Verwandeln Sie kurze Clips in längere Videos, indem Sie die Action für eine Minute oder länger erweitern.
Ein Ein-Klick-Entfernungstool ist ebenfalls auf dem Weg, das unerwünschte Objekte entfernt und den Hintergrund für ein sauberes Ergebnis rekonstruiert.
Googles Veo 3.1 ist jetzt auf dem Pollo AI Video-Generator verfügbar und bietet Kreativen Zugang zu verbesserten Funktionen zur Videoerstellung.
Ich habe eine Reihe von Tests durchgeführt, die sich auf vier wichtige Verbesserungen konzentrierten: verbesserte native Audioausgabe, Zutaten zu Video und Frames zu Video. Hier ist, was ich herausgefunden habe – Spoiler: Veo 3.1 ist ein Game-Changer.
Veo 3.1 auf dem Prüfstand
- Native Audioerzeugung
Prompt: „Nahaufnahme einer brutzelnden Gusseisenpfanne in einer belebten Restaurantküche. Ein Koch wendet ein Steak, und man hört das Geplapper anderer Köche und das Klappern von Töpfen und Pfannen im Hintergrund.“
Ergebnis: Die Ausgabe war beeindruckend. Der primäre Ton – das scharfe, knackende Brutzeln des Steaks – war klar und im Vordergrund. Trotzdem, dass es im Prompt explizit gewünscht war, fehlte das deutliche „Geplapper anderer Köche“. Dies ließ den Hintergrund weniger „belebt“ wirken als erwartet und es fehlte ein Schlüsselelement des menschlichen Faktors, das das Audio wirklich reichhaltig und vielschichtig gemacht hätte.
- Frames zu Video
Prompt: Erstellen Sie mit dem ersten und letzten Frame als Buchstützen ein 10-sekündiges, flüssiges Übergangsvideo, in dem ein Paar das Café betritt, sich hinsetzt, Kaffee bestellt und anfängt, sich lebhaft zu unterhalten, während die Nacht hereinbricht.
| Start- und End-Frame-Bild | Ausgabe-Video |
![]() ![]() |
Ergebnis: Während Charaktere und Szene visuell konsistent blieben und die Start-/End-Frames als Buchstützen verwendet wurden, schaffte es das Video nicht, einen flüssigen Übergang zu erzeugen. Aktionen wie das Bestellen waren abrupt (z. B. Kaffeetassen erschienen plötzlich), und es gab einen erheblichen Mangel an Kontinuität bis zum letzten Frame.
- Zutaten zu Video
Prompt: Ein bärtiger Zauberer in lila Roben in einer kerzenbeleuchteten Steingramothek liest ein antikes Buch, blickt plötzlich überrascht auf und wirkt dann einen Zauber, der Bücher um ihn herum schweben lässt
| Referenzbilder | Ausgabe-Video |
![]() ![]() |
Ergebnis: Während die Gesamtumgebung und die Stimmung hervorragend beibehalten wurden – mit einer detailreichen, kerzenbeleuchteten Steingramothek und atmosphatischer Beleuchtung – entsprach das Aussehen des Zauberers nicht vollständig dem Referenzbild.
Seine Gesichtszüge und sein Bartstil unterschieden sich merklich, was auf eine begrenzte Genauigkeit bei der Übertragung des Charakters hindeutet.
Trotz des anfänglichen Missverhältnisses zeigt das Modell eine ausgezeichnete zeitliche Kohärenz und Szenentreue und liefert eine filmische und immersive Sequenz, die gut zur beschriebenen Handlung passt.
Endgültiges Urteil
Veo 3.1 zeigt starke Fähigkeiten bei der Wiedergabe konsistenter Charaktere und Szenen und erhält erfolgreich die visuelle Integrität über Frames und angegebene Buchstützen hinweg.
Es funktioniert gut mit primären Aktionen und Objekten und kann klare primäre Audioeffekte erzeugen. Das Modell weist jedoch erhebliche Schwächen bei der Erzeugung dynamischer und nuancierter Videoinhalte auf. Es hat Schwierigkeiten mit:
- Flüssige Übergänge & Kontinuität: Komplexe, mehrstufige Aktionen erscheinen oft abrupt (z. B. plötzlich erscheinende Objekte), und Übergänge mangelt es an Kontinuität, was zu abgehackten Sequenzen führt, insbesondere in Richtung der End-Frames.
- Emotionale Nuance: Charakterausdrücke und Ton können inkonsistent sein oder die angegebene emotionale Tiefe vermissen lassen (z. B. ein „überraschter“ Blick erscheint mild, oder ein „lachendes“ Paar ist animationslos).
- Komplexe Objektanimation: Interaktionen mit mehreren Objekten (wie schwebende Bücher) können steif, mechanisch erscheinen oder Objekte erscheinen lassen, anstatt sich organisch zu bewegen.
- Vielschichtiges Audio: Während primäre Geräusche gut sind, bleibt die Erzeugung unterschiedlicher sekundärer oder Hintergrund-Audioelemente, selbst wenn sie explizit angefordert werden, eine Herausforderung und beeinträchtigt die Reichhaltigkeit der Klanglandschaft.
Warum Veo 3.1 auf Pollo AI nutzen?
Pollo AI vereint das Beste aus der KI-Videoerstellung – alles unter einem Dach. Betrachten Sie es als Ihr kreatives Kontrollzentrum, wo Leistung auf Flexibilität trifft.
Sie sind nicht auf nur einen Modus wie Veo 3.1 beschränkt. Auf Pollo AI können Sie jederzeit zwischen Top-Engines wie Sora 2, Veo 3, Kling 2.5 Turbo, Wan 2.5, Seedance und anderen wechseln.
Das bedeutet, wenn Sie die Realitätsnähe und erzählerische Tiefe von Veo 3.1 lieben (was übrigens erstaunlich ist), können Sie es genau dann nutzen, wenn es passt – und dann zu einem anderen Modell für Geschwindigkeit, Stil oder Detail wechseln. Keine Grenzen. Keine Kompromisse.
Darüber hinaus verfügt es über alle wichtigen Funktionen zur KI-Videoerstellung:
- Erwecken Sie Fotos mit unserem KI-Bild-zu-Video-Tool zum Leben.
- Verwandeln Sie Skripte mit unserer KI-Text-zu-Video-Funktion in beeindruckende Bilder.
- Erstellen Sie überzeugende Clips mit dem KI-Avatar-Video-Generator.
- Erstellen Sie beruhigende Clips im Tier- oder Anime-Stil mit dem KI-Kurzvideo-Generator.
- Ahmen Sie jede Bewegung des Referenzvideos mit Pollo Mimic nach.
Erleben Sie Pollo AI noch heute und entfesseln Sie das volle Potenzial der KI-gesteuerten Videoproduktion.



