В сентябре 2024 года Alibaba официально представила свою собственную модель генерации видео на основе ИИ, Tongyi Waniang AI, также известную как Wan AI. В январе 2025 года Alibaba представила Wan 2.1, последнюю версию своего генератора видео на основе ИИ.
Сейчас они сталкиваются с жесткой конкуренцией со стороны таких технологических компаний, как OpenAI и Kuaishou, но есть ли у Alibaba все необходимое, чтобы выделиться?
Чтобы ответить на этот вопрос, я подготовил подробное руководство, которое поможет понять, почему Wan AI является такой важной разработкой в области создания визуального контента на основе ИИ.
Wan 2.1: Основы

Wan 2.1 использует комбинацию технологий VAE и DiT, чтобы видео выглядели суперреалистично за счет улучшения визуального движения и связности. По сути, он отлично справляется с воспроизведением сложных движений из реального мира с точной координацией тела и плавным движением.
Это означает, что я могу использовать его для рендеринга сложных сцен с персонажами, таких как танцующие балерины, плавание и фигурное катание, с которыми большинство моделей ИИ для генерации видео часто не справляются. Фактически, именно благодаря своей способности придерживаться реалистичных траекторий движения Wan 2.1 занимает первое место в лидерборде VBench по генерации видео на основе ИИ.
Кроме того, эта новая версия обладает еще большими возможностями обработки подсказок, что приводит к более быстрой и интуитивно понятной генерации. По этой причине я могу генерировать 1-минутные видео в разрешении 1080p примерно за 15 секунд. Также стоит отметить, что Wan 2.1 имеет четыре варианта: T2V-1.3B, T2V-14B, I2V-14B-480P и I2V-14B-720P.
Поскольку он поддерживает 14 миллиардов параметров (14B), модель генерации видео на основе ИИ может интерпретировать гораздо больше входных данных и контекста, чем раньше. В феврале 2025 года было объявлено, что все четыре варианта теперь являютсяоткрытым исходным кодом. Это делает Wan 2.1 одной из немногих моделей генерации видео на основе ИИ, к которым общедоступные пользователи и разработчики могут свободно получать доступ и изменять их.
Каково мое личное мнение о Wan 2.1?
Я попробовал Wan 2.1, протестировав его с несколькими примерами видео, и у меня смешанные чувства по этому поводу. В первый раз мой первый запрос был: «Два гигантских дракона участвуют в эпической воздушной битве над средневековым королевством, извергая огонь и хаос, а камера панорамирует, показывая разрушения внизу».
Вот сгенерированное видео:
Сцена выглядела отлично — разрушения и все такое — но драконы? Не очень. Они просто висели лицом к лицу в небе, ничего не делая, из-за чего движение казалось застывшим и разочаровывающим.
Я попробовал еще раз с более подробным запросом: «Два гигантских дракона сталкиваются над средневековым королевством, их чешуя блестит, когда один ныряет, размахивая когтями, а другой контратакует огненным залпом, крылья бьются, когда они спирально движутся и уворачиваются в дымном небе, хвосты хлещут с реалистичной силой, в то время как камера плавно переключается между общими планами королевства и крупными планами битвы».
На этот раз видео было намного лучше — движения драконов были динамичными и напряженными, с естественной физикой, а переходы камеры ощущались плавными и живыми.
По моему мнению, Wan 2.1 имеет потенциал, особенно потому, что он использует технологии VAE и DiT для хорошей обработки реалистичного движения. Но он действительно требует подробных подсказок для достижения результата; в противном случае движение может показаться плоским, что поначалу немного раздражало. Однако при некоторых усилиях он может создавать потрясающие, динамичные видео.
Какие функции мне больше всего нравятся в Wan 2.1?
Я не могу отрицать, что Wan 2.1 представляет широкий спектр усовершенствований, которые выводят решение Alibaba для генерации видео на основе ИИ на новый уровень, даже в сравнении с другими инструментами для генерации видео на основе ИИ. Итак, позвольте мне разбить ключевые сильные стороны модели ИИ, которые, на мой взгляд, делают ее такой выдающейся:
Превосходная производительность
Wan 2.1 использует собственную технологию VAE, которая позволяет ему реконструировать видео высокого разрешения 1080p без ущерба для плавности движения. Как я упоминал ранее, он также хорошо сохраняет визуальные детали, поэтому согласованность между кадрами относительно хорошая.
Другими словами, риск мерцания или искажений между кадрами ниже. Кроме того, архитектура VAE Wan 2.1 может кодировать и декодировать видео с невероятно высокой скоростью. Это означает, что я могу рассчитывать на нее для создания видео практически в реальном времени.
Многоязычное понимание
Wan 2.1 — первая модель генерации видео на основе ИИ, способная понимать текстовые подсказки как на английском, так и на китайском языках. Эта двуязычная функция может быть фантастической для создания анимированных текстов и всевозможных наложений в видео.
Я также могу использовать Wan 2.1 для создания подсказок для видеороликов о продуктах или даже интерактивных руководств для местной аудитории с гораздо более эффективными результатами. Кроме того, эти надежные возможности генерации текста дают ей явное преимущество перед другими моделями генерации видео на основе ИИ.
Непревзойденная динамика движения
Wan 2.1 обладает впечатляющим мастерством в области динамики движения при генерации видео на основе ИИ. Хотя я не думаю, что он обязательно лидирует по визуальной эстетике, эта модель генерации видео на основе ИИ поддерживает неоспоримый баланс между согласованностью сцены, реализмом движения и пространственной точностью.
По большей части это делает Wan 2.1 хорошо подходящим для создания профессиональных визуальных материалов, которые выглядят и ощущаются реалистично. Будь то трейлеры, музыкальные клипы, анимированные сцены или даже игровые ресурсы, я уверен, что он может обеспечить плавные и убедительные результаты.
Доступность открытого исходного кода
Alibaba решила выпустить Wan 2.1 как бесплатное решение с открытым исходным кодом, которое включает все четыре варианта. Я очень ценю это, потому что это делает его более доступным для предприятий, брендов, разработчиков и создателей по всему миру.
Становится легко интегрировать Wan 2.1 и автоматизировать всевозможные сложные задачи по созданию видео, даже если у вас нет никаких навыков программирования. Кроме того, мне нравится, что более низкий порог входа означает, что это будет способствовать инновациям в более широком сообществе ИИ.
Как я предпочитаю получать доступ к Wan 2.1? Представляем Pollo AI
Вы можете получить доступ к Wan 2.1, установив его локально или через официальный веб-сайт разработчика Wan.Video. Однако я должен сказать вам, что это не самые простые способы использования модели генерации видео на основе ИИ.
Вместо этого я бы предложил вам рассмотреть использование Pollo AI. Это передовая универсальная платформа для генерации изображений и видео на основе ИИ, интегрированная с несколькими ведущими отраслевыми моделями ИИ. Среди них Runway, Kling AI, Pixverse, Hailuo, Luma AI и, конечно же, Wan AI.
Поскольку они все находятся в одном месте, это позволяет легко сравнивать результаты видео между моделями.
Кроме того, я могу получить доступ к многочисленным инструментам и шаблонам ИИ на Pollo AI, которые позволяют легко и быстро создавать всевозможные пользовательские видео.
Примечательно, что Pollo AI также предлагает генератор коротких видеороликов на основе ИИ, универсальный генератор видео на основе ИИ, включая изображение в видео и текст в видео, а также генератор аватаров на основе ИИ, предоставляя создателям широкий спектр творческих возможностей.
Лучше всего то, что платформа предлагает очень доступные ценовые планы, поэтому мне не пришлось тратить целое состояние, чтобы насладиться всеми ее уникальными функциями и инструментами. Но вам не обязательно верить мне на слово! Ознакомьтесь с Pollo AI бесплатно с помощью пробной версии прямо сейчас!
Мое окончательное мнение о Wan 2.1
Я считаю, что Wan 2.1 может помочь любому создателю создавать реалистичные и правдоподобные видео с персонажами практически в любом визуальном стиле. Он по-прежнему сталкивается с жесткой конкуренцией со стороны других конкурентов, таких как Kling AI, но он остается непобежденным в плане динамики движения и согласованности шаблонов между сценами. Перейдите на Pollo AI прямо сейчас и начните генерировать видео с помощью Wan 2.1, чтобы увидеть, на что он способен для вас!