2024年9月に、Alibabaは独自のAI動画生成モデル「Tongyi Waniang AI」(Wan AIとも呼ばれる)を正式にリリースしました。2025年1月には、AlibabaはAI動画ジェネレーターの最新版であるWan 2.1を導入しました。
現在、OpenAIやKuaishouといったテクノロジー企業から激しい競争に直面していますが、Alibabaは差別化を図るための要素を持っているのでしょうか?
これに答えるため、Wan AIがAIビジュアルコンテンツ作成においてこれほど大きな影響力を持つ理由を深く掘り下げる包括的なガイドを作成しました。
Wan 2.1:基本情報

Wan 2.1は、VAEとDiTテクノロジーを組み合わせて、映像の動きと視覚的なつながりを改善することで、動画を非常にリアルに見せています。基本的に、正確な体の連携とスムーズな動きで、現実世界の複雑な動きを再現することに優れています。
これは、ほとんどのAI動画モデルが失敗しがちな、バレエダンサーのダンス、水泳、フィギュアスケートのような複雑なキャラクターシーンをレンダリングできることを意味します。実際、現実的な動きの軌跡に忠実である能力により、Wan 2.1はAI動画生成のVBenchリーダーボードでトップに立っています。
それに加えて、この新バージョンはさらに優れたプロンプト機能を提供し、より高速で直感的な生成を実現します。このため、15秒程度で1080p解像度の1分間の動画を生成できます。また、Wan 2.1にはT2V-1.3B、T2V-14B、I2V-14B-480P、I2V-14B-720Pの4つのバリアントがあることも注目に値します。
140億パラメータ(14B)をサポートしているため、AI動画モデルは以前よりもはるかに多くの入力とコンテキストを解釈できます。2025年2月には、4つのバリアントすべてがオープンソースになったと発表されました。これにより、Wan 2.1は一般ユーザーや開発者が自由にアクセスおよび修正できる数少ないAI動画モデルの1つとなりました。
Wan 2.1についての個人的な意見
いくつかのサンプル動画でWan 2.1をテストしてみました。いくつかの混在した感情があります。最初の試みでは、最初のプロンプトは「2頭の巨大なドラゴンが中世の王国の上空で壮大な空中戦を繰り広げ、火と混沌を解き放ち、カメラが下の破壊を映し出すようにパンする」でした。
生成された動画はこちらです。
シーンは破壊も含めて素晴らしく見えましたが、ドラゴンは?あまり良くありませんでした。空中で顔を合わせたままで何もせず、動きが硬く、がっかりしました。
より詳細なプロンプトで再試行しました。「2頭の巨大なドラゴンが中世の王国の上空で激突し、鱗が輝き、一方が爪を振り下ろして突進し、もう一方が炎のブレスで反撃し、翼を羽ばたかせながら煙たい空を渦巻きながら回避し、尾が現実的な力で鞭打つ一方、カメラは王国の広角ショットと戦いのクローズアップの間をスムーズに切り替える。」
今回は、動画ははるかに良くなりました。ドラゴンの動きはダイナミックで激しく、自然な物理法則が働き、カメラのトランジションはスムーズで生き生きとしていました。
私の意見では、Wan 2.1は特にVAEとDiTテクノロジーを使用して現実的な動きをうまく処理しているため、可能性を秘めています。しかし、それが提供するには詳細なプロンプトが必要であり、そうでなければ動きが平坦に感じられる可能性があり、最初は少しイライラしました。しかし、少し努力すれば、素晴らしいダイナミックな動画を作成できます。
Wan 2.1の最も気に入っている機能は何ですか?
Wan 2.1がAlibabaのAI動画ソリューションを次のレベルに引き上げる幅広い進歩をもたらしたことは否定できません。他のAI動画ツールと比較してもそうです。そこで、このAIモデルの主要な強みをいくつか紹介します。これらが私にとって際立っている理由です。
優れたパフォーマンス
Wan 2.1は独自のVAEテクノロジーを採用しており、スムーズな動きを損なうことなく高解像度の1080p動画を再構築できます。前述したように、視覚的なディテールもよく保持されているため、フレーム間のコヒーレンスは比較的良好です。
つまり、フレーム全体でのちらつきや歪みを心配するリスクが少なくなります。さらに、Wan 2.1のVAEアーキテクチャは、動画を驚異的な速度でエンコードおよびデコードできます。これは、ほぼリアルタイムの動画作成に頼れることを意味します。
多言語対応
Wan 2.1は、英語と中国語の両方のネイティブ言語でテキストプロンプトを理解できる最初のAI動画生成モデルです。このバイリンガル機能は、動画内のアニメーションテキストやさまざまなオーバーレイの作成に最適です。
また、Wan 2.1を使用して、製品動画やインタラクティブチュートリアルのプロンプトをネイティブオーディエンス向けに、より効果的な結果で作成することもできます。さらに、これらの堅牢なテキスト生成機能は、他のAI動画モデルに対する十分な優位性をもたらします。
比類なきモーションダイナミクス
Wan 2.1は、AI動画生成におけるモーションダイナミクスにおいて印象的な習熟度を持っています。視覚的な美しさで必ずしもリードしているとは思いませんが、このAI動画モデルは、シーンの一貫性、動きのリアリズム、空間精度の間で否定できないバランスを維持しています。
ほとんどの場合、これはWan 2.1を、リアルに見え、感じられるプロフェッショナルグレードのビジュアルを生成するのに適したものにしています。トレーラー、ミュージックビデオ、アニメーションシーン、さらにはゲームアセットであっても、スムーズで説得力のある結果を提供できると確信しています。
オープンソースによるアクセシビリティ
Alibabaは、Wan 2.1を無料のオープンソースソリューションとしてリリースすることを決定しました。これには4つのバリアントすべてが含まれます。これは、世界中のビジネス、ブランド、開発者、クリエイターにとってよりアクセスしやすくなるため、非常に感謝しています。
コーディングの専門知識がなくても、Wan 2.1を簡単に統合し、あらゆる種類の複雑な動画作成タスクを自動化できます。さらに、参入障壁が低いことで、より広範なAIコミュニティでのイノベーションを促進するのに役立つことを気に入っています。
Wan 2.1にアクセスする最も良い方法は?Pollo AIの紹介
Wan 2.1には、ローカルにインストールするか、開発者の公式ウェブサイトであるWan.Video経由でアクセスできます。ただし、これらはAI動画モデルを使用する最も簡単な方法ではないことをお伝えしておきます。
代わりに、Pollo AIの利用を検討することをお勧めします。これは、業界をリードするいくつかのAIモデルと統合された、最先端のオールインワンAI画像および動画生成プラットフォームです。それらには、Runway、Kling AI、Pixverse、Hailuo、Luma AI、そしてもちろんWan AIが含まれます。
すべてが1か所にあるため、モデル間で動画の出力を直接比較することが容易になります。
それに加えて、Pollo AIでは多数のAIツールとテンプレートにアクセスでき、さまざまなカスタム動画を瞬時に簡単に作成できます。
特に、Pollo AIにはAIショート動画ジェネレーター、汎用性の高いAI動画ジェネレーター(画像から動画へとテキストから動画へを含む)、そしてAIアバタージェネレーターも搭載されており、クリエイターに幅広いクリエイティブなオプションを提供します。
何よりも、このプラットフォームは非常に手頃な価格プランを提供しているため、そのユニークな機能やツールすべてを楽しむために大金を費やす必要はありませんでした。しかし、私の言葉を鵜呑みにする必要はありません!無料トライアルでPollo AIを今すぐ無料で試してみてください!
Wan 2.1についての最終的な意見
Wan 2.1は、あらゆるクリエイターがほぼすべてのビジュアルスタイルで、リアルで説得力のあるキャラクター動画を制作するのに役立つと確信しています。Kling AIのような他の競合他社との激しい競争に直面していますが、ダイナミックな動きとシーン全体でのパターンの一貫性の点で無敵です。今すぐPollo AIにアクセスして、Wan 2.1で動画の生成を開始し、その能力を体験してください!