OpenAI 的 Sora 2 在 AI 影片生成領域樹立了新的標竿,而 Google 可能已準備好應戰。
雖然 Google 尚未發布官方聲明,但早期跡象顯示,其旗艦 AI 影片模型 Veo 3 的改良版本 Veo 3.1 可能會在 2025 年 10 月推出。
可以將 Veo 3.1 視為一個高度優化的升級,而非一場革命 — 它擁有更靈敏的提示詞、起始與結束畫面自訂、參考式一致性、更緊密的音訊整合、更流暢的動態效果,以及更多功能。
如果目前的趨勢持續下去,Veo 3.1 很快就會完全取代 Veo 3,在相同名稱下運作,但幕後卻能帶來顯著的成果改進。
讓我們來探討一下我們所知道的 — 以及我們所期望的。
快速回顧:Veo 3 帶來了什麼
Google 的 Veo 3 被設計為一款先進的圖像轉影片和文字轉影片生成器,目標是專業及社群內容創作者。
其突出功能包括:
- 原生音訊生成 – 內建聲音、環境音效和音樂,與生成的影片同步。
- 病毒式內容生成 – 趣味性的「假新聞」短劇、時空旅行特效、惡搞片段 — 為分享性而設計。
- 進階提示詞理解 – 精確理解複雜的多部分創意提示詞。
- 角色一致性 – 可使用參考影像來維持角色的視覺連續性。
- 精確風格控制 – 匹配參考影像的藝術風格。
- 鏡頭控制 – 模擬推、拉、搖、移等電影鏡頭運鏡。
- 物件操控 – 動態地在影片場景中添加或移除主體。
- 彈性動態控制 – 精確調整物件移動的速度和路徑。
深入閱讀:Google Veo AI 影片生成器評測:詳細與個人化洞察
「.1」升級:預估 Veo 3.1 的新功能
增量更新的重點在於精煉。如果 Veo 3 奠定了基礎,那麼 Veo 3.1 將專注於完善執行。以下是我們可以現實預估的增強功能:
升級的原生音訊
音訊生成可能會從「存在」轉變為「富有表現力」。這可能意味著生成的語音帶有更細膩的情感,更好的氛圍混合,以及不僅僅是與動作匹配,更能增強情緒的音訊。
增強的真實感與物理效果
直接挑戰 Sora 2 的頭條功能,Veo 3.1 幾乎肯定會專注於改進其物理引擎。預計會看到更精確的材質、光線交互作用和複雜物件碰撞的模擬。
基於參考的一致性
利用參考影像或影片來跨場景維持一致的角色和藝術風格的能力。雖然 Veo 3 能保持角色的相似度,但 Veo 3.1 將致力於無懈可擊的持續性。
這意味著細微的細節 — 例如襯衫上的特定皺褶或一縷頭髮 — 將在不同的場景和鏡頭角度之間保持完美的連貫性。
起始與結束畫面
作為 Veo 3 插值功能的延伸,這次升級將允許用戶上傳起始和結束畫面,以生成流暢的過渡,無縫地填補敘事間隙。想像一下,為音樂影片或廣告用自訂視覺效果作為開頭和結尾,確保 AI 在影像間能流暢銜接,而不會出現生硬的剪輯。
處理速度
早期跡象顯示 Veo 3.1 的生成時間比 Veo 3 略有提高,儘管 Sora 2 在這方面仍然具有競爭力。這兩個模型在平衡品質與生成速度方面都代表了顯著的進步。
Sora 2 提高了 AI 影片的標準 — Google 的 Veo 3.1 能跟上嗎?
OpenAI 的 Sora 2 於幾天前推出,現已可透過 Pollo AI 影片生成器 使用,與其前代相比,它是一次更大規模的飛躍。在許多方面,Veo 3.1 是一個維護性更新,而 Sora 2 則感覺像是世代的轉變。
| 功能 | Google Veo 3.1 (預估) | OpenAI Sora 2 (確認) |
| 物理模擬 | 真實感增強,但主要是視覺效果 | 深度物理引擎(重力、浮力、碰撞精確度) |
| 世界狀態一致性 | 單一場景內表現良好 | 跨多鏡頭敘事表現卓越 |
| 音訊生成 | 同步的原生音訊 | 完全同步的原生音訊(語音 + 音樂 + 特效) |
| 提示詞理解 | 準確度高,對電影鏡頭指示效果極佳 | 極其先進,能處理抽象邏輯 |
| 角色一致性 | 使用參考影像時可靠 | 長序列中接近完美的持續性 |
| 真實人類客串 | 未確認 | 是 — 用戶可以插入和管理個人形象 |
| 鏡頭控制 | 先進的電影敘事指令 | 靈活,具有湧現行為 |
| 風格轉移 | 透過參考影像表現出色 | 高控制度,支援藝術和寫實模式 |
Sora 2 目前脫穎而出的地方:
- 先進的物理模擬 – 現實的重力、浮力、碰撞處理。
- 持續性的多鏡頭敘事 – 在場景間保持世界狀態的一致性。
- 高品質音訊同步 – 語音、音樂、特效與視覺效果完美同步。
- 真實世界形象(「客串」)– 將人物插入生成的場景中,並控制使用權。
深入閱讀:Sora 2 評論:我測試了 OpenAI 的新 AI 影片模型 – 結果令人難以置信
Veo 3.1 可能競爭的方面:
如果提示詞解釋和 Flow 整合能力超越 Sora 2,它可能在協作式、複雜的分鏡腳本方面表現出色。
Google 的風格匹配管線可能更能滿足混合了攝影、插畫和動畫的創意專案。
Veo 的病毒式內容角度和鏡頭運動預設可能更能吸引尋求娛樂性片段格式而非電影寫實感的社群媒體創作者。
展望未來:Veo 3.1 何時會發布?
尚未有官方時間表,但消息來源指出可能在 2025 年 10 月下旬推出,可能會先透過 Google Cloud 提供給企業用戶。
如果 Veo 3.1 達到預期,它將能鞏固 Google 在 AI 影片競賽中的地位,特別是當它與 Android 和 Wear OS 整合以進行裝置端生成時。
急於嘗試的創作者可以關注 Google 的 DeepMind 部落格或 VideoFX 的更新。
不要等到官方發布 — 現在就可以透過 Pollo AI 使用 Veo 3,讓您搶先體驗即將到來的成果。當 Veo 3.1 發布時,您將是第一批體驗到它的用戶之一。
隨著 AI 領域的競爭日趨激烈,有一點很清楚:2025 年將是影片生成真正走向電影化的關鍵一年。