
Gemini Omni AI 動画ジェネレーター (Veo 4)
Veo 4と仮定されていたGemini Omniは、動画の作成、編集、リミックスを行うGoogleのネイティブマルチモーダルモデルです。ユーザーは平易な言葉で動画を洗練させることができます。これにより、Nano Bananaの「ただ説明するだけ」の簡単さをAIビデオ作成にもたらします。Gemini Omniは、視覚的な品質と並行して文脈の正確さを重視しており、詳細なシーンを作成するのに理想的です。Gemini Omniは近日中にPollo AIに統合されます。まずはPollo AIでVeo 3を無料で始めてみましょう!
Gemini Omni (Veo 4)の期待される機能
- ネイティブマルチモーダルビデオ生成: プロンプト、画像、クリップ、オーディオ、またはテンプレートを使用して、統一されたクリエイティブワークフローでビデオを作成できます。
- 自然言語ビデオ編集: シンプルなテキスト指示で、シーン、動き、スタイル、詳細を調整します。
- ビデオのリミックス: 既存のビデオを一からやり直すことなく、新しいバージョンに再編集します。
- ターゲットシーン編集: 元のショット、動き、スタイルを維持しながら、ビデオの特定の部分を修正します。
- 一貫した視覚的物語: 長いビデオシーケンス全体で、キャラクター、環境、スタイル、書き込まれた詳細の一貫性を保ちます。
- 知識ベースのシーン作成: コンテキスト、主題、意味を理解し、より強力な内部ロジックを持つシーンを作成します。
- 正確なオーディオコントロール: ビデオのムードとトーンに完璧にマッチする、意図的でシーンに特化したオーディオを生成します。
- 多様なカメラアングル: 複数の視点からダイナミックで映画のようなショットをキャプチャし、より没入感のある体験を提供します。
- カスタマイズされたアバター生成: デジタル自己を生き生きとさせる、表現力豊かなアバターを作成します。
ネイティブマルチモーダルビデオ生成
Gemini Omniは、1つの入力タイプに限定されません。テキストからビデオ、画像からビデオのような狭い形式からAIビデオ作成を移行させ、異なる参照を1つの接続されたクリエイティブな指示として理解します。
もはやアイデアを形式で分ける必要はありません。テキストでコンセプトを説明し、画像で視覚スタイルを定義し、クリップで動きを示唆し、オーディオでトーンを導きます。
Gemini Omniはこれらの信号を統合し、より正確で表現力豊か、そしてあなたのビジョンに合致するビデオの作成を支援します。
| プロンプト | ビデオクリップ | 出力 |
| 長い赤茶色の髪、目に見えるそばかす、新鮮でミニマルなメイクをした若い女性が登場する、自然なUGCスキンケア広告。彼女は緑のフェイスクリームのジャーをカメラに近づけ、顔にクリームを塗り、テクスチャーのある素肌から、より滑らかで柔らかく輝く仕上がりへと、使用前後の肌の変化を明確に示します。 |
自然言語ビデオ編集
Gemini Omniは、編集を会話に変えます。もはやタイムラインを調整したり、手動でシーンをカットしたり、クリップを一から再構築したりする必要はありません。
変更内容を入力するだけで、モデルがビデオを修正します。この機能により、Gemini OmniはAIビデオ作成におけるNano Bananaのように感じられます。
| プロンプト | 入力ビデオ | 出力ビデオ |
| このビデオクリップからSora2のロゴを削除してください。 |
![]() |
![]() |
ビデオのリミックス
Gemini Omniを使えば、すでに持っているビデオから構築できます。毎回最初からやり直す必要はありません。
あなたのクリップは、その構造やクリエイティブな方向性を保ちながら、新しいバージョンになることができます。これにより、反復作業がより速く、より実用的になります。
| プロンプト | 入力ビデオ | 出力ビデオ |
| 「海辺を歩く少女」のクリップと製品クリップを組み合わせて、映画のようなTVCMスタイルの広告を作成してください。ライフスタイルビューティーショットと洗練された製品ビジュアルをブレンドして、プレミアムでエレガントなスキンケアコマーシャルに仕上げてください。 |
ターゲットシーン編集
Gemini Omniは、既存のビデオ内の正確な編集をサポートしています。シーン全体を再生成する代わりに、改善が必要な特定のオブジェクトや詳細に焦点を当てることができます。
この実用的なビデオ改良により、元の構成、動き、スタイルを維持しながら、小さな問題を修正できます。
| プロンプト | 入力ビデオ | 出力ビデオ |
| 両方の皿のスパゲッティをクリーミーなカボチャスープに置き換えてください。他はすべて同じにしてください。 |
一貫した視覚的物語
Gemini Omniは、AIビデオの最も難しい問題の1つである、すべてのシーンの一貫性と意味合いを維持するのに役立ちます。キャラクターのアイデンティティ、シーンの詳細、視覚スタイル、環境要素を追跡でき、各ショットがランダムに生成されるのではなく、つながりを感じるように支援します。
そのより強力なテキストと数式の整合性は、より知識重視のビデオへの扉も開きます。チョークボードに数式を書く教授のような例では、Gemini Omniは読みやすいテキスト、論理的な記号、自然な動きを同時に維持するのに優れています。
テキストと数式の整合性を向上させることにより、Gemini Omniはレッスン、解説、チュートリアル、製品デモ、アニメーションコンテンツ、ブランドストーリーテリングにさらに役立ちます。
| プロンプト | 出力ビデオ |
| 教授が伝統的なチョークボードに三角関数の恒等式の数学的証明を書き出し、現在の方程式のステップを説明しています。 |
| プロンプト | 画像入力 | ビデオ出力 |
| アップロードした画像を主要な視覚的参照として使用し、ビデオ全体でシーンの高度な一貫性を保ってください。同じアニメスタイルの田舎の夕焼けシーンを維持してください。構図、キャラクターデザイン、環境レイアウト、照明の方向、カラーパレット、全体のムードをクリップ全体でまったく同じに維持してください。微細な自然な動きのみを追加してください:そよ風がドレス、髪、ひまわりを優しく揺らし、空中に漂う光る粒子、ゆっくりとした雲の動き。カメラは安定させ、ごくわずかな映画的なプッシュインのみを行ってください。シーンの変更、キャラクターの再デザイン、オブジェクトの変更、追加の人々、レイアウトの変更は一切行わないでください。強力なシーンの一貫性、視覚的な連続性、アップロードされた画像への忠実度を優先してください。 |
![]() |
|
| アップロードした画像を参考に、非常に一貫性のあるカフェのビデオを作成してください。人物、テーブル、コーヒーカップ、窓からの眺め、照明、構図を同じに保ってください。瞬き、わずかな頭の動き、呼吸、窓の外のわずかな背景の動きなど、微妙な会話の動きだけを追加してください。カメラは安定させ、再設計、レイアウトの変更、スタイルのずれは避けてください。 |
![]() |
知識ベースのシーン作成
Gemini Omniは、Googleの幅広いAI知識をビデオ生成に活用します。より情報に基づき、構造化され、意味のあるシーンを作成できます。
歴史的なシーン、教育的な解説、製品デモを作成したい場合、Gemini Omniは正確で論理的かつ明確なビジュアルを提供できます。
| プロンプト | 出力ビデオ |
| スティーブ・ジョブズの生涯についてのビデオを作成してください。 |
正確なオーディオコントロール
Gemini Omniは、多様なカメラアングル間のシームレスな移行を可能にすることで、視覚的なストーリーテリングを再定義します。
劇的な俯瞰ショットが必要な場合でも、地上レベルの視点が必要な場合でも、Gemini Omniはプロの映画制作者が頼る映画のような柔軟性を提供します。これにより、強力なマルチアングルビデオ制作がすべてのクリエイターの手に直接届けられます。
インストラクショナルデザイナーの場合、Gemini Omniを使用して、特定のテクニックを詳細に示すアングルが変化するビデオなど、より明確なトレーニング資料を作成することもできます。
| プロンプト | ビデオ出力 |
| 古い海図の隣にいる黒人男性のリアルな映画的ショット。彼は海図を指し、それから頭を上げて言います:「この古い海図によると、失われた島は伝説ではない。すぐに探検隊を準備しなければならない。」唇の動きに正確に同期した意図的なオーディオ、クリアな声、かすかな部屋の雰囲気、そして軽い紙のガサガサ音。劇的な冒険ムード。 |
多様なカメラアングル
Gemini Omniは、多様なカメラアングル間のシームレスな移行を可能にすることで、視覚的なストーリーテリングを再定義します。
劇的な俯瞰ショットが必要な場合でも、地上レベルの視点が必要な場合でも、Gemini Omniはプロの映画制作者が頼る映画のような柔軟性を提供します。これにより、強力なマルチアングルビデオ制作がすべてのクリエイターの手に直接届けられます。
インストラクショナルデザイナーの場合、Gemini Omniを使用して、特定のテクニックを詳細に示すアングルが変化するビデオなど、より明確なトレーニング資料を作成することもできます。
| プロンプト: 濃いひげを生やし、オレンジ色のニット帽と白いジャケットを着た男性が海岸沿いの道に立っているリアルな映画的ビデオ。彼の左側には、遠くまで広がる広い海が見えます。シーンは、男性が道に静止している正面からの眺めから始まり、彼の傍には海が見えます。その後、カメラは彼の右横顔を映すように変わり、同じ環境とキャラクターの外観は一貫して保たれます。自然な屋外照明、リアルな動き、映画的なフレーミング、詳細な海岸の雰囲気、スムーズなアングルの移行、高いリアリズム。 | |
| 画像入力 | ビデオ出力 |
![]() |
|
カスタマイズされたアバター生成
あなたのデジタルプレゼンスは完全にあなた自身のものです。Gemini Omniは深いカスタマイズオプションを提供し、あなたの個性とスタイルを捉えた表現力豊かで実物そっくりなアバターをデザインする力を与えます。
ストーリーテラー、教育者、VTuberのいずれであっても、現実世界での匿名性を維持しながらオンライン視聴者を引きつけたい場合、Gemini Omniのパーソナライズされたアバターは素晴らしい解決策です。
| プロンプト: アップロードした画像を使用してリアルなビデオを作成してください。私の顔、髪型、全体的なアイデンティティを参照画像と一致させてください。私はカメラに向かって直接話し、「私はスタンドでエネルギーを感じています。あの叫び声を聞きましたか?」と言います。自然な口の動きを話されたセリフと同期させ、リアルな表情とわずかな頭の動きを加えてください。 | |
| 画像入力 | ビデオ出力 |
|
|
|
| プロンプト: アップロードした画像をアイデンティティ参照として使用し、映画のようなパーソナライズされたアバター歌唱ビデオを生成してください。私の外見は一貫してリアルに保ってください。リアルな歌唱の口パク、感情的な表情、微妙な体の動き、自信に満ちたパフォーマンスのエネルギーを含めてください。美しさ、リアリズム、アイデンティティの一貫性に焦点を当ててください。 | |
| 画像入力 | ビデオ出力 |
|
|
|
どのようなビジョンであっても、Gemini Omniが実現します
高度なビデオ生成モデルとして、Gemini Omniは様々な分野のより多くのユーザーを魅了しています。強力な機能により、Gemini Omniは様々なニーズに合わせて調整され、売上とソーシャルエンゲージメントの向上を支援します。
- 映画制作者および広告代理店: プロトタイピング、プレビジュアライゼーション、プロフェッショナルグレードのコマーシャル、短編映画を制作します。
- コンテンツクリエイター: 一貫したキャラクターと表現力豊かなオーディオを備えた高品質で魅力的なビデオ(Reels、Shorts、TikToks)を生成します。
- マーケター: プロモーションビデオ、製品ビジュアライゼーションを効率化し、ブランドコンテンツを作成します。
- 教育者: 魅力的な解説、トレーニングビデオ、教育コンテンツを制作し、複雑な概念を視覚的な物語に変換します。
- 代理店およびスタジオ: プロフェッショナルなワークフローを使用して、放送品質の出力、一貫したレンダリング、正確なクリエイティブコントロールを実現します。
Gemini Omni (Veo 4): Veo 3からの飛躍
Gemini Omniは、GoogleのAIビデオ技術がVeo 3以降どれほど進歩したかを示しています。より強力な全体的な体験と洗練された出力により、クリエイターは単純な実験を超えて、より本格的でクリエイティブなビデオ制作へと移行することができます。
| 機能 | Veo 3 | Gemini Omni (Veo 4) |
| 入力 | テキストと画像プロンプト | プロンプト、参照、クリップ、テンプレート |
| ビデオの長さ | 短いクリップ、通常約8秒 | より長いクリップ、通常15〜30秒程度、よりスムーズなペース配分と自然な移行 |
| シーンの一貫性 | フレーム間の一貫性が限定的 | シーン全体での時間的一貫性の強化、オブジェクトの永続性の向上、より安定した複数キャラクターのインタラクション |
| カメラコントロール | 基本的なプロンプトベースのカメラ移動 | レンズ、動き、フレーミング、ペース配分に対するより正確なコントロール |
| マルチアングルシーン | 未対応 | 1つのプロンプトからシーンごとに複数のカメラアングルをサポート |
| パーソナライズされたアバター | 利用不可 | 音声同期、正確な表情、同期された唇の動きを備えたパーソナライズされたアバター |
| 編集ワークフロー | 変更するにはクリップ全体を再生成 | 生成中のインタラクティブ編集、途中で調整可能 |
| 主なユースケース | 短い実験的ビデオを生成 | 製品化に対応したビデオ作成ワークフロー |
| 解像度 | 最大1080p出力 | 最大4K出力 |
| オーディオ | サイレントビデオまたは基本的なオーディオ(時間参照) | より高品質で意図的なオーディオ、より表現力豊かな音声、より良いリズム、より豊かなアンビエンス、そして一貫したサウンドデザイン |
| 多言語の正確性 | 基本 | より正確な画面上のテキスト、標識、UIレンダリング、およびさまざまな言語でのよりクリアなリップシンク |
詳細については、Gemini Omniのレビューをご覧ください。

Pollo AIでGemini Omni (Veo 4) を使用する方法
Gemini Omniモデルを選択
画像から動画へのページを開き、Gemini Omniモデル(近日公開)を選択してください。
プロンプトを入力してください
画像をアップロードし、必要に応じてプロンプトを入力したら、ビデオ設定を調整してください。
結果をダウンロード
「作成」をクリックして動画を生成し、ダウンロードしてください。
FAQs
Gemini Omni (Google Veo 4) とは何ですか?
かつてVeo 4という名称になると思われていたGemini Omniは、Googleが独自開発した、動画の作成と編集を行うためのネイティブマルチモーダルAI動画モデルです。動画生成をより会話的にすることを目的としています。Gemini Omniは、動画のリミックス、一貫性のある視覚的ナラティブ、世界知識を考慮した作成などの高度な機能により、AI動画作成における大きな飛躍となります。
Gemini Omniは、その前身であるVeo 3とどう違うのですか?
Gemini Omniは、Veo 3 を大幅に改善し、より高い解像度(最大4K)、より長い動画時間、より速い生成速度を実現します。キャラクターやオブジェクトの一貫性が向上し、より正確なシネマティックコントロール、そしてより優れたリップシンクと多言語の精度を含む高度な統合オーディオ機能を提供します。
Pollo AIでGemini Omniは無料で使えますか?
はい!当社のウェブサイトで公開されたら、Pollo AIでGemini Omniを無料で試すことができます。Pollo AIは、強力な動画生成機能を体験できるトライアルを提供しています。
Gemini Omniは初心者向けですか?
はい!Gemini Omniは初心者でも簡単に使えます。シンプルなインターフェースなので、撮影機材や編集スキルは一切不要。説明文を入力するだけで、瞬時に動画を生成します。高度な機能をマスターするには練習が必要ですが、使い始めは非常に簡単なので、経験レベルに関わらず誰でもアクセスできます。
Gemini Omni の意図的な音声機能はどのように機能しますか?
Gemini Omni の意図的なオーディオは、リップシンクによる表現豊かな対話、物理ベースのフォーリー効果、没入感のある環境サウンドスケープ、オリジナル楽曲スコアなど、文脈を認識したサウンドを作成します。すべてのオーディオは空間的に配置され、カット間で一貫して流れ、広範なポストプロダクションを不要にします。






