Sora 2 od OpenAI wyznaczyła nowy punkt odniesienia w generowaniu wideo przez sztuczną inteligencję, a Google może być przygotowane do odpowiedzi na to wyzwanie.
Chociaż Google nie wydało jeszcze oficjalnego komunikatu, wczesne sygnały sugerują, że Veo 3.1, udoskonalona wersja jego flagowego modelu wideo AI Veo 3, może zostać udostępniona w październiku 2025 roku.
Traktuj Veo 3.1 nie jako rewolucję, ale jako wysoce zoptymalizowaną aktualizację — bardziej responsywne podpowiedzi, personalizacja klatek początkowych i końcowych, spójność oparta na referencjach, lepsza integracja audio, płynniejszy ruch i wiele więcej.
Jeśli obecne trendy się utrzymają, Veo 3.1 może wkrótce całkowicie zastąpić Veo 3, działając pod tą samą nazwą, ale dostarczając widocznie ulepszone rezultaty "pod maską".
Przyjrzyjmy się, co wiemy — i czego oczekujemy.
Szybkie przypomnienie: Co wprowadziło Veo 3
Veo 3 od Google zostało zaprojektowane jako zaawansowany generator wideo z obrazu i tekstu, skierowany do profesjonalnych twórców treści i twórców społecznościowych.
Jego wyróżniające się funkcje obejmowały:
- Natychmiastowe generowanie dźwięku — Wbudowane głosy, dźwięki otoczenia i muzyka zsynchronizowane z generowanym wideo.
- Produkcja treści gotowych do viralizacji — Dowcipne skecze w stylu „fałszywych wiadomości”, efekty podróży w czasie, klipy parodystyczne — zaprojektowane z myślą o udostępnianiu.
- Zaawansowane rozumienie podpowiedzi — Dokładna interpretacja złożonych, wieloczęściowych kreatywnych podpowiedzi.
- Spójność postaci — Możliwość używania obrazów referencyjnych do utrzymania wizualnej ciągłości postaci.
- Dokładna kontrola stylu — Dopasowywanie stylów artystycznych z obrazów referencyjnych.
- Sterowanie kamerą — Symulacja panoramowania, zbliżeń i innych kinowych ruchów kamery.
- Manipulacja obiektami – Dynamiczne dodawanie lub usuwanie obiektów w scenie wideo.
- Elastyczna kontrola ruchu — Precyzyjne dostrajanie prędkości i ścieżek ruchu obiektów.
Czytaj więcej: Recenzja generatora wideo Google Veo AI: Szczegółowe i osobiste spostrzeżenia
Aktualizacja „.1”: Szacowanie nowych funkcji Veo 3.1
Aktualizacja przyrostowa polega na udoskonaleniu. Jeśli Veo 3 położyło podwaliny, Veo 3.1 będzie polegać na opanowaniu wykonania. Oto, co możemy realistycznie oszacować w kwestii ulepszeń:
Ulepszony natywny dźwięk
Generowanie dźwięku prawdopodobnie przejdzie od prostego "obecnego" do "ekspresyjnego". Mogłoby to oznaczać bardziej subtelne tony emocjonalne w generowanych głosach, lepsze mieszanie atmosferyczne i dźwięk, który nie tylko pasuje do akcji, ale wzmacnia nastrój.
Ulepszony realizm i fizyka
Bezpośrednio rzucając wyzwanie kluczowej funkcji Sory 2, Veo 3.1 z pewnością skupiłoby się na ulepszeniu swojego silnika fizycznego. Spodziewaj się dokładniejszych symulacji tekstur, interakcji światła i złożonych kolizji obiektów.
Spójność oparta na referencjach
Możliwość wykorzystania obrazów lub filmów referencyjnych do utrzymania spójnych postaci i stylów artystycznych w różnych scenach. Podczas gdy Veo 3 mogło utrzymać podobieństwo postaci, Veo 3.1 dążyłoby do bezbłędnej trwałości.
Oznacza to, że subtelne detale — takie jak konkretne zagniecenia na koszuli lub kosmyk włosów — pozostawałyby idealnie spójne w różnych scenach i pod różnymi kątami kamery.
Pierwsze i ostatnie klatki
Rozszerzenie interpolacji Veo 3, ta aktualizacja pozwoliłaby użytkownikom przesyłać obrazy początkowe i końcowe w celu generowania płynnych przejść, bezproblemowo wypełniając lukę narracyjną. Pomyśl o ramowaniu historii niestandardowymi wizualizacjami dla teledysków lub reklam, zapewniając, że AI wypełnia wizualia bez ostrych cięć.
Prędkość przetwarzania
Wczesne wskazania sugerują, że Veo 3.1 ma nieznacznie poprawione czasy generowania w porównaniu do Veo 3, chociaż Sora 2 pozostaje konkurencyjna w tym obszarze. Oba modele stanowią znaczący postęp w równoważeniu jakości z szybkością generowania.
Sora 2 podnosi poprzeczkę dla wideo AI — czy Veo 3.1 od Google nadąży?
Sora 2 od OpenAI, uruchomiona zaledwie kilka dni temu i dostępna teraz za pośrednictwem generatora wideo Pollo AI, stanowi większy skok w porównaniu do swojego poprzednika. Pod wieloma względami Veo 3.1 jest wydaniem konserwacyjnym, podczas gdy Sora 2 wydaje się zmianą pokoleniową.
| Funkcja | Google Veo 3.1 (Szacunkowo) | OpenAI Sora 2 (Potwierdzone) |
| Symulacja fizyki | Ulepszony realizm, ale głównie wizualny | Głęboki silnik fizyczny (grawitacja, pływalność, dokładność kolizji) |
| Spójność stanu świata | Silna w pojedynczych scenach | Wyjątkowa w narracjach wielokadrowych |
| Generowanie dźwięku | Zsynchronizowany natywny dźwięk | W pełni zsynchronizowany natywny dźwięk (głos + muzyka + efekty) |
| Rozumienie podpowiedzi | Wysoka dokładność, doskonałe dla wskazówek kinowych | Niezwykle zaawansowane, obsługuje logikę abstrakcyjną |
| Spójność postaci | Niezawodne dzięki obrazom referencyjnym | Prawie doskonała trwałość w długich sekwencjach |
| Cameo z prawdziwymi ludźmi | Niepotwierdzone | Tak — użytkownicy mogą wstawiać i zarządzać osobistymi podobiznami |
| Kontrola kamery | Zaawansowane dyrektywy kinowe | Elastyczne, z wyłaniającymi się zachowaniami |
| Transfer stylu | Doskonały za pomocą obrazów referencyjnych | Wysoka kontrola, obsługuje tryby artystyczne i fotorealistyczne |
Gdzie Sora 2 obecnie dominuje:
- Zaawansowana symulacja fizyki — realistyczna grawitacja, pływalność, obsługa kolizji.
- Trwałe narracje wielokadrowe — utrzymuje spójność stanu świata w scenach.
- Synchronizacja audio wysokiej klasy — głosy, muzyka, efekty idealnie dopasowane do wizualizacji.
- Podobieństwo do świata rzeczywistego („cameo”) — wbudowywanie ludzi w wygenerowane sceny z kontrolą praw użytkowania.
Czytaj więcej: Recenzja Sory 2: Przetestowałem nowy model wideo AI OpenAI — wyniki są nie z tej ziemi
Gdzie Veo 3.1 może konkurować:
Jeśli interpretacja podpowiedzi i integracja Flow przewyższą Sorę 2, może ona celować w kolaboracyjne, złożone storyboardy.
System dopasowywania stylów Google może lepiej odpowiadać kreatywnym, hybrydowym projektom łączącym fotografię, ilustrację i animację.
Kąt treści wirusowych Veo i presety ruchów kamery mogą bardziej przemawiać do twórców mediów społecznościowych poszukujących rozrywkowych formatów klipów, a nie kinowego realizmu.
Spojrzenie w przyszłość: Kiedy pojawi się Veo 3.1?
Oficjalny harmonogram nie został potwierdzony, ale źródła wskazują na potencjalne udostępnienie pod koniec października 2025 roku, być może zaczynając od użytkowników korporacyjnych za pośrednictwem Google Cloud.
Jeśli Veo 3.1 sprosta oczekiwaniom, może umocnić pozycję Google w wyścigu generowania wideo przez sztuczną inteligencję, szczególnie dzięki integracji z Androidem i Wear OS w celu generowania na urządzeniu.
Twórcy chętni do eksperymentowania mogą śledzić blog Google DeepMind lub aktualizacje VideoFX.
Nie czekaj na oficjalne wydanie — Veo 3 jest dostępne już teraz za pośrednictwem Pollo AI, dając Ci przedsmak tego, co nadchodzi. A kiedy pojawi się Veo 3.1, będziesz wśród pierwszych, którzy go doświadczą.
W miarę jak krajobraz AI rozgrzewa się, jedno jest jasne: rok 2025 to rok, w którym generowanie wideo stanie się prawdziwie kinowe.