Я протестировал Imagen 4: не так хорошо, как Imagen 3, но вот как извлечь из него максимум пользы!

Если вы используете изображения, созданные с помощью ИИ, то наверняка слышали о запуске Google DeepMind своей новейшей модели обработки изображений на основе ИИ — Imagen 4. Но действительно ли она оправдывает все ожидания? Мне не терпелось это выяснить!

Представленная на конференции Google I/O 2025 , эта новая модель искусственного интеллекта разработана для генерации более насыщенных и детализированных изображений с еще большей четкостью и скоростью, чем ее предшественница,Imagen 3 .

Google также утверждала, что может реалистично отображать тонкие оттенки цвета, а также сложные детали и текстуры, такие как ткани, мех животных или даже капли воды.

В этом смысле модель обработки изображений на основе ИИ может преуспеть в фотореализме и абстрактных стилях. Кроме того, Imagen 4 также разработан для улучшения орфографии и типографики.

Это значит, что я могу использовать его для создания всевозможных изображений с большим количеством текста, таких как плакаты, комиксы, слайды, приглашения и т. д.

Imagen 4 также обеспечит улучшенное соблюдение сроков, предоставит доступ к более широкому диапазону соотношений сторон и позволит создавать изображения с разрешением до 2K.

Учитывая количество улучшений, предлагаемых Imagen 4 , похоже, что Google DeepMind стремится к новому уровню творческого контроля и качества.

Мой опыт работы с Imagen 4

Но остается вопрос: как Imagen 4 покажет себя в руках обычных пользователей? Мне стало любопытно это выяснить, поэтому я решил провести собственное тестирование.

Сразу же я хотел начать с чего-нибудь простого. Поэтому я попросил модель Imagen 4 сгенерировать сцену военной базы с солдатами, готовящимися к войне.

К сожалению, полученный результат оказался неудовлетворительным. Хотя Imagen 4 и удалось создать относительно качественный рендер военной сцены, ему не удалось передать ключевые детали характеров персонажей.

Если говорить точнее, их лица выглядели просто как-то раздавленно и изуродованно. Практически не было приложено усилий для проработки правильных и уникальных черт лица каждого из персонажей в этой сцене.

Похоже, модель ИИ была настроена на создание окружения в целом, но проигнорировала мелкие детали, которые могли бы еще больше подчеркнуть реализм изображения.

По результатам этого теста я бы поставил Imagen 4 твердую оценку 5/10.

Поскольку эта попытка провалилась, я решил попробовать что-то попроще. Я попросил Imagen 4 создать изображение женщины у реки с помощью объектива «рыбий глаз».

Я хотел проверить, будет ли лучше работать с одним персонажем, чем со сценой с несколькими героями. Но даже с этим изменением результат всё равно оказался несколько разочаровывающим.

Модель искусственного интеллекта отобразила необычное изображение женщины с тремя руками! Я не уверен, почему это произошло, но очевидно, что Imagen 4 испытывает некоторые трудности с последовательным соблюдением заданий.

По сути, он кажется даже менее эффективным, чем Imagen 3. Признаю, уровень качества изображения и детализации в этой сцене хороший, так что это уже что-то.

Но даже при наличии конкретной темы для работы, Imagen 4 так и не смог создать реалистичное изображение, пригодное для использования.

Судя по отзывам других пользователей , похоже, я не единственный, кто испытывает трудности с настройкой стиля подсказок для этой модели изображений, созданной с помощью ИИ.

По результатам этого теста я бы оценил Imagen 4 на 3/10.

Чтобы еще больше подчеркнуть свою точку зрения, я попробовал тот же запрос на Imagen 3, и вот результат, представленный ниже. Как видите, Imagen 4 , несомненно, отстал от своего предшественника в плане точного выполнения инструкций и корректного отображения изображений.

Для итогового теста я решил использовать еще более подробное задание. Вот что я представил: «Футуристическое, тёмное транспортное средство, напоминающее судно на воздушной подушке или бронированную машину, изображено в воздухе над ночным городским пейзажем. Транспортное средство имеет обтекаемую угловатую форму, большие внедорожные шины и множество красных фонарей вдоль задней части. На его поверхности видны следы дождя, и оно, кажется, находится в движении, возможно, летит или зависает. Город освещён яркими неоновыми огнями, преимущественно розовыми и красными, создавая яркий контраст с тёмным транспортным средством. Городской пейзаж показывает освещённые здания и мост на заднем плане, что создаёт впечатление ночного городского пейзажа. Перспектива немного низкая, как будто вид снизу на транспортное средство, что усиливает ощущение скорости и маневренности. Композиция фокусируется на транспортном средстве, располагая его в центре кадра, а городской пейзаж служит фоном. Транспортное средство ориентировано вперёд, а цвета яркие, с холодной палитрой тёмно-чёрных, серых и контрастных ярких неоновых оттенков. В изображении преобладает ощущение энергии и динамизма». Изображение. Стиль современный, стилизованный, напоминающий сцены из видеоигр или футуристических боевиков, со значительным акцентом на детальное освещение, дождь и визуальные эффекты. Общая атмосфера — суровая, напряженная и динамичная, передающая ощущение городского приключения.

А вот что получилось в результате:

В этом тесте я был очень впечатлен. Imagen 4 удалось с безупречной точностью запечатлеть практически каждую ключевую деталь, создав потрясающее изображение, которое выглядит так, будто оно взято прямо из видеоигры.

Уровень детализации автомобиля, флуоресцентное освещение городского пейзажа и даже ощущение срочности в сцене… все это было передано на удивление хорошо.

Признаюсь, Imagen 4 меня этим удивил! Не могу отрицать, что он отлично справился с задачей. Похоже, что стиль подсказок модели ИИ может работать лучше с более подробными инструкциями.

Кроме того, судя по примерам обработки Imagen 4 на сайте Google DeepMind, использование длинных и подробных инструкций может быть единственным способом максимально эффективно использовать эту модель ИИ.

На этот раз я бы оценил производительность Imagen 4 на 9/10 . Очень хорошо реализовано.

Поскольку полученные в последний раз изображения оказались хорошими, я немного засомневался! Естественно, я решил провести еще один тест, прежде чем окончательно определиться с возможностями Imagen 4.

В этом заключительном тесте я хотел посмотреть, как модель обработки изображений на основе ИИ справится с типографикой. Поэтому я попросил создать уникальный рекламный постер к фильму в стиле ретро про акул с ярким заголовком.

В ответ на этот запрос Imagen 4 удалось создать привлекательный постер с жирными шрифтами ярких цветов. Однако Imagen 4 не смог полностью отобразить текст на постере, что вызвало разочарование.

По сути, я получил неполное изображение, поэтому оно непригодно для использования. Но, помимо этого, должен признаться, дизайн плаката был не так уж плох.

В целом, Imagen 4 хорошо передал ретро-стиль и создал нечто крутое и захватывающее. Опять же, это был тест с неоднозначными результатами. Честно говоря, я бы оценил его на 6,5/10.

В целом, я считаю, что Imagen 4 нуждается в доработке. Возможно, в нём есть новые улучшения по сравнению с предшественником, но он всё ещё выглядит несколько небрежно, особенно когда дело касается сложных сцен.

Кроме того, дизайн можно было бы улучшить. Хотя качество изображения, несомненно, на высоте, Imagen 4, кажется, несколько ограничен в своем воображении.

Кроме того, новый стиль подсказок в Imagen 4 кажется менее гибким и интуитивно понятным. Для обычного пользователя это, вероятно, вызовет определенное разочарование при попытке получить нужный результат.

Нужно что-то лучше, чем Imagen 4? Попробуйте Pollo AI!

Учитывая, что в Imagen 4 еще есть несколько недоработок, лучшим вариантом на современном рынке, который я бы настоятельно рекомендовал, является Pollo AI.

Это универсальная платформа для создания изображений и видео , в которую интегрировано несколько первоклассных моделей генерации на основе искусственного интеллекта, способных обрабатывать практически любой визуальный стиль.

Вы можете использовать модели обработки изображений, созданные с помощью ИИ, такие как Nano Banana , Imagen , GPT-4o , Recraft , Stable Diffusion и Flux . Pollo AI также предлагает модели обработки видео, созданные с помощью ИИ, такие как Kling AI , PixVerse AI , Luma AI , Hailuo AI и Runway .

Благодаря тому, что все эти возможности собраны в одном месте, вы можете свободно переключаться между ними, создавая самые разнообразные уникальные и оригинальные результаты.

Но это еще не все! Вы когда-нибудь хотели персонализировать существующие изображения и видео без необходимости профессиональных навыков редактирования?

С Pollo AI вы получите доступ к десяткам эффектов, шаблонов и инструментов на основе ИИ, которые помогут вам превратить любой визуальный контент в самые разные развлекательные результаты.

Самое приятное? Вы можете прямо сейчас опробовать обширные возможности Pollo AI совершенно бесплатно, воспользовавшись бесплатной пробной версией!

Заключение

Imagen 4 — это интригующая модель обработки изображений на основе ИИ, обладающая множеством новых функций, но, по крайней мере с точки зрения пользователя, она всё ещё находится в стадии разработки. Пока она не станет более совершенным продуктом, я рекомендую выбрать более стабильный, креативный и надёжный инструмент ИИ для генерации изображений. И, судя по моему личному опыту, с Pollo AI вы точно не прогадаете!

Я протестировал Imagen 4: не так хорошо, как Imagen 3, но вот как извлечь из него максимум пользы!

Мой опыт работы с Imagen 4

Нужно что-то лучше, чем Imagen 4? Попробуйте Pollo AI!

Заключение

Вам также может понравиться

Обзор ImagineArt : Я протестировал ImagineArt и делюсь с вами своим мнением.

Я протестировал Invideo AI, и это не идеальная платформа для создания видео и изображений на основе ИИ.

Обзор Leonardo.AI : Возможно, это лучшая альтернатива Midjourney и Stable Diffusion.

Обзор Lovart AI : Я протестировал Lovart AI и был поражен результатами, но у него есть и свои недостатки.

НА ЭТОЙ СТРАНИЦЕ