Если вы используете изображения, созданные с помощью ИИ, то вы слышали, что Google DeepMind только что запустила свою последнюю модель изображений с ИИ, Imagen 4. Но действительно ли она стоит всей этой шумихи? Мне не терпелось узнать!
По словам разработчика, эта новая модель ИИ создана для создания более насыщенных и подробных изображений с еще большей четкостью и скоростью, чем ее предшественникImagen 3 .
Google также утверждает, что может реалистично отображать тонкие оттенки цвета, а также сложные детали и текстуры, такие как ткани, шерсть животных или даже капли воды.
В этом смысле модель изображения AI может преуспеть в фотореализме и абстрактных стилях. Кроме того, Imagen 4 также разработан для обеспечения лучшей орфографии и типографики.
Это значит, что я могу использовать его для создания всевозможных изображений с большим количеством текста, таких как плакаты, комиксы, слайды, приглашения и т. д.

Imagen 4 также призван обеспечить улучшенную точность выполнения, доступ к более широкому диапазону соотношений сторон и создание изображений с разрешением до 2K.
Учитывая количество улучшений, предлагаемых Imagen 4 , создается впечатление, что Google DeepMind стремится выйти на новый уровень творческого контроля и качества.
Но вопрос остается: как себя поведет Imagen 4 в руках обычных пользователей? Мне было любопытно узнать, поэтому я решил провести собственный тест.
Сразу же мне захотелось начать с чего-то простого. Поэтому я попросил модель Imagen 4 сгенерировать сцену военной базы с солдатами, готовящимися к войне.
К сожалению, сгенерированный вывод оказался неудовлетворительным. Хотя Imagen 4 удалось создать относительно хороший рендер милитаристской сцены, он не смог запечатлеть ключевые детали персонажей.

Если говорить конкретно, их лица выглядели просто измятыми и изуродованными. Очень мало усилий было приложено к визуализации правильных и уникальных черт лица каждого из персонажей в сцене.
Похоже, модель ИИ была нацелена на создание окружающей среды в целом, но проигнорировала мелкие аспекты, которые могли бы еще больше подчеркнуть реалистичность изображения.
В этом тесте я бы дал Imagen 4 уверенную оценку 5/10.
Поскольку эта попытка оказалась неудачной, я решил попробовать что-то попроще. Я попросил Imagen 4 создать изображение женщины у реки с помощью объектива «рыбий глаз».
Я хотел посмотреть, будет ли он работать лучше с одним субъектом, а не со сценой с несколькими персонажами. Но даже с этим изменением результат все еще был немного разочаровывающим.

Модель ИИ отобразила необычное изображение женщины с тремя руками! Я не уверен, почему это произошло, но очевидно, что Imagen 4 испытывает некоторые трудности с последовательным соблюдением графика.
Если на то пошло, он кажется даже менее эффективным, чем Imagen 3. Я признаю, что уровень качества изображения и детализации в этой сцене хороший, так что это уже что-то.
Но даже при работе с конкретным объектом Imagen 4 все равно не смог создать реалистичное изображение, пригодное для использования.
И, судя по впечатлениям других пользователей , похоже, я не единственный, кто испытывает трудности с тем, чтобы заставить стиль подсказок работать с этой моделью изображения ИИ.
За этот тест я бы дал Imagen 4 оценку 3/10.
Чтобы еще больше подчеркнуть свою точку зрения, я попробовал тот же запрос на Imagen 3, и вот результат ниже. Как вы можете видеть, Imagen 4 , несомненно, отстал от своего предшественника, когда дело доходит до точного следования инструкциям и рендеринга надлежащих изображений.

Для своего последнего теста я решил использовать еще более подробную подсказку. Вот что я ввел: «Футуристическое, темное транспортное средство, напоминающее судно на воздушной подушке или бронированное транспортное средство, изображено в воздухе, над городской линией горизонта ночью. Транспортное средство гладкое и угловатое, с большими внедорожными шинами и несколькими красными огнями вдоль его задней части. Полосы дождя видны на его поверхности, и кажется, что оно находится в движении, возможно, летит или зависает. Город освещен яркими неоновыми огнями, в основном розовыми и красными, что создает яркий контраст с темным транспортным средством. Городская обстановка показывает освещенные здания и мост на заднем плане, предполагая ночной городской пейзаж. Перспектива немного низкая, как будто вид снизу транспортного средства, что усиливает ощущение скорости и маневренности. Композиция фокусируется на транспортном средстве, помещая его в центр кадра, а городской пейзаж служит фоном. Ориентация транспортного средства направлена вперед, а цвета смелые, с прохладной палитрой темных черных, серых и контрастирующих ярких неоновых оттенков. Ощущение энергии и динамизма преобладает в изображении. Стиль современный, стилизованный и напоминает сцену из видеоигры или футуристический боевик, с большим акцентом на детальное освещение, дождь и визуальные эффекты. Общая атмосфера суровая, интенсивная и стремительная, передающая ощущение городских приключений.
И вот что получилось:

В этом тесте я был полностью впечатлен. Imagen 4 удалось запечатлеть почти каждую ключевую деталь с безупречной точностью, чтобы создать потрясающее изображение, которое выглядит как будто из видеоигры.
Уровень детализации автомобиля, флуоресцентное освещение городского пейзажа и даже ощущение срочности в сцене... все это было передано на удивление хорошо.
Признаюсь, Imagen 4 застал меня врасплох! Не могу отрицать, что он отлично справился с этой задачей. Кажется, стиль подсказок модели ИИ может работать лучше с более подробными инструкциями.
Кроме того, если взглянуть на примеры Imagen 4 от Google DeepMind на их веб-сайте, то становится ясно, что использование длинных и подробных инструкций может быть единственным вариантом максимально эффективного использования этой модели ИИ.
На этот раз я бы оценил Imagen 4 на 9/10 по производительности . Очень хорошо управляется.
Поскольку последнее изображение было хорошим, я был немного в замешательстве! Естественно, я решил провести еще один тест, прежде чем составить мнение о возможностях Imagen 4.
В этом последнем тесте я хотел посмотреть, как модель изображения ИИ справляется с типографикой. Поэтому я попросил сделать уникальный ретро-стиль рекламного киноплаката об акулах с ярким дизайном заголовка.
Для этого запроса Imagen 4 удалось создать привлекательный постер с жирными шрифтами в ярких цветах. Но Imagen 4 не смог полностью отобразить текст постера, что было неприятно видеть.

По сути, он представил мне незаконченное изображение, поэтому оно не совсем пригодно для использования. Но, помимо этого, я должен признать, что дизайн постера был не так уж плох.
Если что, Imagen 4 хорошо отобразил ретро-стиль и создал нечто, что выглядит круто и захватывающе. И снова это был тест со смешанными результатами. Честно говоря, я бы оценил его на 6,5/10.
В целом, я считаю, что Imagen 4 мог бы немного поработать. Он может иметь новые улучшения по сравнению с предшественником, но он все еще кажется немного неряшливым, особенно когда дело касается сложных сцен.
Кроме того, он также мог бы улучшить свой креативный дизайн. Хотя качество изображения неоспоримо, Imagen 4 кажется немного скованным в своем воображении.
Кроме того, новый стиль подсказок Imagen 4 кажется менее гибким и интуитивным. Для обычного пользователя это, вероятно, вызовет некоторое разочарование в попытках получить правильный результат.
Нужно что-то лучше Imagen 4? Попробуйте Pollo AI!
Учитывая, что Imagen 4 все еще требует исправления нескольких недостатков, следующим лучшим выбором на текущем рынке, который я бы настоятельно рекомендовал использовать, является Pollo AI.
Это комплексная платформа для генерации изображений и видео , которая интегрирована с несколькими первоклассными моделями генерации ИИ, подходящими практически для любого визуального стиля.
Вы можете получить доступ к моделям изображений ИИ, таким как Imagen , GPT-4o , Recraft , Stable Diffusion и Flux . Pollo AI также предлагает модели видео ИИ, такие как Kling AI , PixVerse AI , Luma AI , Hailuo AI и Runway .
Собрав все эти опции в одном месте, вы можете свободно переключаться между ними, создавая всевозможные уникальные и креативные результаты.
Но это еще не все! Хотелось ли вам когда-нибудь персонализировать существующие изображения и видео без профессиональных навыков редактирования?
С Pollo AI вы получите доступ к десяткам эффектов, шаблонов и инструментов ИИ, которые помогут вам превратить любые визуальные медиа в самые разные развлекательные продукты.
А самое лучшее? Вы можете опробовать обширные возможности Pollo AI прямо сейчас, не платя ни копейки, воспользовавшись бесплатным пробным планом!
Заключение
Imagen 4 — это интригующая модель изображений ИИ, которая поставляется со всеми новыми наворотами, но она все еще находится в стадии разработки, по крайней мере с точки зрения пользователя. Пока она не станет более совершенным продуктом, я предлагаю выбрать более последовательный, креативный и надежный инструмент ИИ для создания ваших изображений. И основываясь на моем личном опыте, вы просто не ошибетесь с Pollo AI!