Google только что представила свою новейшую модель генерации видео Veo 3.1, которая была построена на основе оригинальной Veo 3.
Veo 3.1 не только обеспечивает улучшенное соответствие запросу, гарантируя, что ваше видение воплотится в жизнь с большей точностью, но и предлагает более богатое нативное аудио, объединяя звук и движение более естественно, чем раньше.
Также были представлены три новые ключевые функции, включая:
- Ингредиенты для видео: Создавайте полное видео из референсных изображений, сохраняя стиль персонажа и сцены.
- Кадры для видео: Создавайте плавные, естественные переходы, предоставляя первый и последний кадры сцены.
- Расширить видео: Превращайте короткие клипы в более длинные видео, продлевая действие на минуту или больше.
Скоро появится инструмент удаления в один клик, который будет удалять нежелательные объекты и реконструировать фон для чистовой отделки.
Veo 3.1 от Google теперь доступен на генераторе видео Pollo AI, предоставляя создателям доступ к улучшенным возможностям генерации видео.
Я провел серию тестов, сосредоточившись на четырех ключевых улучшениях: улучшенное нативное аудио, "Ингредиенты для видео" и "Кадры для видео". Вот что я обнаружил — спойлер: Veo 3.1 — это меняющая правила игры.
Тестируем Veo 3.1
- Создание нативного аудио
Запрос: «Крупный план шипящей чугунной сковороды на оживленной кухне ресторана. Повар переворачивает стейк, и вы можете слышать болтовню других поваров и звон кастрюль и сковородок на заднем плане».
Результат: Результат был впечатляющим. Основной звук — резкое, потрескивающее шипение стейка — был четким и на переднем плане. Однако, несмотря на явный запрос в подсказке, отчетливая «болтовня других поваров» отсутствовала. Из-за этого задний план казался менее «оживленным», чем ожидалось, отсутствовал ключевой человеческий элемент, который сделал бы аудио по-настоящему богатым и многослойным.
- Кадры для видео
Запрос: Используя первый и последний кадры в качестве обрамления, создайте 10-секундное плавное переходное видео, в котором пара входит в кафе, садится, заказывает кофе и начинает оживленно болтать, когда наступает ночь.
| Стартовый и конечный кадры | Исходное видео |
![]() ![]() |
Результат: Хотя персонажи и сцена оставались визуально последовательными, а начальные/конечные кадры использовались в качестве обрамления, видео не смогло создать плавный переход. Действия, такие как заказ, были резкими (например, чашки кофе появлялись внезапно), и наблюдалось значительное отсутствие связности с финальным кадром.
- Ингредиенты для видео
Запрос: Бородатый волшебник в фиолетовых одеяниях в тускло освещенной каменной библиотеке читает древний том, внезапно удивленно поднимает глаза, а затем произносит заклинание, которое заставляет книги парить вокруг него
| Референсные изображения | Исходное видео |
![]() ![]() |
Результат: Хотя общая обстановка и настроение были превосходно сохранены — с богато детализированной освещенной свечами каменной библиотекой и атмосферным освещением — внешний вид волшебника не полностью соответствовал референсному изображению.
Его черты лица и стиль бороды заметно отличались, что предполагает ограниченную точность при переносе персонажа.
Несмотря на первоначальное несоответствие, модель демонстрирует отличную временную согласованность и соответствие сцене, создавая кинематографическую и захватывающую последовательность, которая хорошо соответствует описанному действию.
Окончательный вердикт
Veo 3.1 демонстрирует сильные возможности в создании последовательных персонажей и сцен, успешно сохраняя визуальную целостность между кадрами и указанными границами.
Он хорошо справляется с основными действиями и объектами и может генерировать четкие основные звуковые эффекты. Однако модель демонстрирует значительные недостатки в создании динамичного и нюансированного видеоконтента. Он испытывает трудности с:
- Плавные переходы и непрерывность: Сложные, многоэтапные действия часто выглядят резкими (например, внезапное появление объектов), а переходы лишены непрерывности, что приводит к разрозненным последовательностям, особенно при переходе к конечным кадрам.
- Эмоциональная выразительность: Выражения лиц персонажей и тон могут быть непоследовательными или лишенными указанной эмоциональной глубины (например, «удивленный» взгляд выглядит невыразительным, или «смеющаяся» пара лишена анимации).
- Анимация сложных объектов: Взаимодействия, включающие несколько объектов (например, парящие книги), могут выглядеть жесткими, механическими, или объекты могут «всплывать» из ниоткуда, а не двигаться органично.
- Многослойное аудио: Хотя основные звуки хороши, создание отдельных вторичных или фоновых звуковых элементов, даже при явном запросе, остается сложной задачей, что влияет на богатство звуковой картины.
Зачем использовать Veo 3.1 на Pollo AI?
Pollo AI объединяет лучшее в области генерации видео с помощью ИИ — все под одной крышей. Думайте об этом как о своем центре творческого управления, где мощность сочетается с гибкостью.
Вы не ограничены только одним режимом, таким как Veo 3.1. На Pollo AI вы можете переключаться между первоклассными движками, такими как Sora 2, Veo 3, Kling 2.5 Turbo, Wan 2.5, Seedance и другими — в любое время.
Это означает, что если вам нравится реализм и глубина повествования Veo 3.1 (что, кстати, потрясающе), вы можете использовать его именно тогда, когда он подходит — а затем переключиться на другую модель для скорости, стиля или деталей. Без ограничений. Без компромиссов.
Кроме того, у него есть все ключевые функции генерации видео с помощью ИИ:
- Оживите фотографии с помощью нашего ИИ для преобразования изображений в видео.
- Превратите сценарии в потрясающие визуальные эффекты с помощью ИИ для преобразования текста в видео.
- Создавайте увлекательные клипы с помощью генератора видео с ИИ-аватаром.
- Создавайте успокаивающие, анимальные или аниме-клипы с помощью генератора коротких видео с ИИ.
- Воспроизводите любое движение референсного видео с помощью Pollo Mimic.
Попробуйте Pollo AI сегодня и раскройте весь потенциал видеопроизводства на базе ИИ.



