私は先日、Googleの最新のAIビデオ技術であるVeo 3を試用する機会を得ました。これは、2025年5月20日に開催されたGoogle I/O 2025イベントで発表されたものです。
その優れた機能は大きな話題を呼んでいます。AI動画生成に携わる者として、このモデルに関する率直な感想や経験をぜひお伝えしたいと思います。

要約
Veo 3をテストするために、ポッドキャストといくつかのコンサート動画を生成してみました。完璧ではなく、いくつか奇妙な不具合はあるものの、リアルな動画と同期の取れた音声を非常にうまく生成してくれる点には感銘を受けました。
しかし、このモデルには時々不満を感じることもありました。音声と字幕の生成を完全に制御できるわけではなく、生成されたテキストが頻繁に乱れるからです。
| 長所 | 短所 |
| ✔️ 動画と音声を一度に生成します | ❌ 非常に高額なサブスクリプションプラン |
| ✔️リアルなリップシンクと効果音 | ❌ 音声と字幕の無制限生成 |
| ✔️ 高品質なビジュアルと優れた物理演算 | ❌ 頻繁に目に見える不具合や文字の乱れが見られる |
| ✔️ Google Flowに統合済み |
ビデオ、オーディオ、ナレーション、リップシンク…すべてを一度に
私が最初に気づいたのは、 Veo 3が複数の動画制作手順を1つのシンプルなプロセスに効率化している点でした。
Veo 3を使うと、音によって動画が生き生きとすることに驚かされます。木々の鳥のさえずりや街の喧騒といった環境音を追加できるので、シーンに本物らしさが加わります。
私が最も感銘を受けたのは、キャラクターの口の動きに合わせたセリフを生成できる点です。あまりにも自然なので、AIが生成したものとは思えないほどです。
AIビデオワークフローの再定義
この新しいマルチモーダル機能は、間違いなくこのモデルの主要な特長の1つです。音楽の調整や、ナレーションとリップシンクを別々に探す必要がなくなりました。
これは、人々がAIを使って動画を制作する方法を変える可能性がある。
- 従来のワークフロー:動画の生成 > ナレーション/効果音/音楽の生成 > リップシンク > 編集。
- Veo 3の新しいワークフロー:テキストプロンプトを入力するだけで、すべてが自動的に処理されます。
生成例
Veo 3が特定のトレンド動画のリクエストにどのように対応できるか興味があったので、4つのユニークな動画を生成するように依頼してみました。
最初の例では、タコスの大群が急速にアメリカに侵入しつつあるという内容の、本物そっくりの偽の天気予報キャスターのアナウンスを依頼しました。
映像のリアルさに驚いた。顔に多少の歪みはあったものの、アナウンサーは生身の人間のように見え、口の動きもかなり正確だった。
次の例は、リアルな見た目で喋るゴリラがイングランドの大きなサッカーの試合を観戦し、自撮り棒を掲げながら、他のファンと一緒にスタンドで審判の不公平な判定について視聴者に向かって怒鳴り散らすという、斬新な動画だった。
これは面白い結果だった。ゴリラは見た目も声も信じられないほどリアルで、表情や体の動きも自然だった。しかし、背景にはいくつかの歪みが依然として目立っていた。
3つ目の例として、野菜を半分に切った場合、内部がどのように見えるのかを知りたかったのです。
概ね私の指示通りに処理されましたが、なぜかツールが結晶化した野菜をレンダリングしてしまい、私が目指していた視覚的なリアリズムが損なわれてしまいました。ちなみに、音はリラックスできます。
この最後の例では、 Veo 3に、1912年4月14日にタイムトラベルした女性が、ニューファンドランド沖の北大西洋でタイタニック号が沈没することを乗客に警告しようとする、タイムトラベルを題材にした映像作品を制作するよう依頼しました。
今回は、シーンが誇張されすぎているし、突然消える演出も不要だと感じました。率直に言って、かなりランダムで不正確なAIビデオレンダリングでした。
総じて言えば、 Veo 3は概ね良好な結果を残しました。迅速な対応と視覚的な一貫性に若干の不具合はありましたが、時折再生成が必要になる可能性はあるものの、このAIモデルにはバイラル動画を生成する能力があると思います。
Flow:次世代AIビデオ制作のプレビュー
GoogleはVeo 3と同時にFlowをリリースしました。FlowはVeo 3とその前身となるビデオモデルを統合したAIビデオストーリーボードプラットフォームで、AIによる生成・編集ツールも豊富に搭載されています。

ストーリーボード
ストーリーボードの概念自体は新しいものではありません。Soraが導入しましたが、パフォーマンスの悪さから見過ごされていました。Google Flowは、このストーリーボードの概念をさらに発展させ、より実用的なものにしています。
アップロードしたクリップやVeoシリーズのモデルで生成したクリップをタイムラインに配置し、並べ替えたり、トリミングしたり、基本的な編集を行うことができます。しかし、最もクールな機能は「拡張機能」と呼ばれるものです。
スムーズビデオ拡張機能
仕組みはこうです。8秒間の動画を用意し、任意のフレームを起点として、その瞬間から続く新しいアニメーションを生成できます。

驚くべきは、オリジナルコンテンツと新しいコンテンツ間の移行が非常にスムーズな点です。Flowは、単一の画像を参照するのではなく、オリジナル動画の動きの傾向を分析しているようです。
この拡張機能は、AI生成動画の従来の長さ制限を打破する上で非常に重要です。短いクリップに縛られることなく、より長く、物語性のある動画を作成できるようになります。
これはSoraが約束していたものと似ているが、Googleの実装は実際に十分に機能し、役に立つ。
ただし、注意すべき点が1つあります。現時点では、拡張機能はVeo 2でのみ動作し、新しいVeo 3では動作しません。
印象的だが、一貫性に欠ける
Veo 3のクールな機能と素晴らしい動画にとても興奮していました。しかし、さらに使い込んでいくうちに、作成した動画の中には画質に問題があるものもあることに気づきました。
制御されていない音声と字幕の生成
一番気になったのは、音声と字幕の生成がランダムに感じられたことです。プロンプトで指定しても、表示されるかどうかは制御できません。
一例として、このプロンプトで生成されたこのビデオがあります。20歳の少女は非常に動揺して、「どうしたの?私が自分で書いたエッセイがAIによって生成されたと判断されたの?」と言いました。少女は頭に手を当て、不安そうな表情をしていますが、字幕はありません。
リクエストでは、女の子が何かを話すだけで字幕は不要と具体的に伝えました。ところが、動画は完全に無音で、字幕付きで届きました。
そして、歯ブラシを宣伝するこのTikTok動画の例では、音は一切聞こえません。
癖と不具合
Veo 3で生成された動画にもいくつか不具合があることに気づきました。これには、意味不明なぎこちない動きや視覚的な不具合が含まれます。
例えば、ノートパソコンの開封動画を作ろうとしたのですが、実際に誰かが箱を開けてノートパソコンを取り出す様子を見せる代わりに、段ボール箱自体がノートパソコンに変形してしまったんです!
Veo 2で見られたこれらの問題が、新しいバージョンにも依然として残っているのは残念だ。
また、音質全体にはまだ改善の余地があると思いますし、一部の効果音は不自然に聞こえました。些細なことではありましたが、注意深く聞くと気になりました。
ごちゃ混ぜになったテキスト
もう一つの問題は、テキスト生成の品質でした。Veo Veo 3は動画の字幕を生成できますが、生成されるテキストはしばしば文字が乱れていたり、スペルミスだらけだったりしました。
この問題は、前述の例でも確認できます。さらに、この問題がどれほど頻繁に発生するかを示す例をいくつかご紹介します。



これは多くのAIモデルに共通する問題だと理解しています。しかし、前述のとおり、AIモデルの外観を完全に制御することはできません。そのため、この問題を回避するには、何度か生成を試してみる必要があるかもしれません。
高額なアクセス
もう一つの欠点は、 Veo 3が非常に高価であることです。GoogleのUltraプランに加入しているユーザーのみが利用可能で、月額料金は249.99ドルです。
これはかなり高額です。もしあなたがこのモデルを試してみたい程度の一般ユーザーや小規模クリエイターであれば、これはあなたには向いていないでしょう。Googleが今後、アクセス範囲を拡大したり、より手頃な価格のオプションを提供してくれることを期待します。
Veo 3は使用できませんか? Pollo AIを試してみましょう!
高品質なAI動画生成ツールを探しているけれど、 Veo 3が使いにくいと感じているなら、ぜひPollo AIをチェックしてみてください!
Pollo AIは、あらゆる優れたビデオモデルを1か所で試せる、強力なオールインワンAIビデオ・画像生成プラットフォームです。Google Cloudの公式パートナーとして、 Pollo AI上でVeo 3を試用し、その最先端の機能を直接体験できるようになりました!

Veo 3に加え、このプラットフォームでは、 Veo 3.1 、 Vidu、 Hailuo、 Kling、 PixVerseといった他のトップティアモデルの独自の機能をシームレスに切り替えて体験できます。これにより、美しく高品質な動画を作成するために必要なすべての高度なモデルにアクセスできます。
さらに、 Pollo AIは、あらゆるクリエイティブニーズに対応する包括的なネイティブビデオツールスイートを提供します。
例えば、革新的な画像から動画へのAI変換、テキストから動画へのAI変換、参照画像から動画への変換、動画から動画へのAI変換などを試すことができます。さらに、複数のAI動画エフェクトを適用して、あらゆる種類の楽しく想像力豊かなAI動画を作成することも可能です。
最後に
ほとんどのAI動画生成ツールを試してきた者として、 Veo 3が提供する高品質には本当に感激しています。
自然な音声統合、リアルなディテール、そして効率的なビデオ制作プロセス。これらはすべて、私を本当に感心させる素晴らしい機能です。
一方で、価格が普及範囲を制限しており、発電品質と安定性にはまだ改善の余地がある。
とはいえ、 Veo 3はAIビデオ技術の未来を垣間見せてくれる興味深いものであり、 Googleをはじめとする企業がこの基盤をどのように発展させていくのか、非常に興味深く見守りたい。
また、オールインワンのAI動画生成プラットフォームをお探しなら、 Pollo AI動画ジェネレーターを試してみることをお勧めします!