Главная страницаОбзорыЯ протестировал Imagen 4: не так хорошо, как Imagen 3, но вот как извлечь из него максимум пользы!

Я протестировал Imagen 4: не так хорошо, как Imagen 3, но вот как извлечь из него максимум пользы!

Если вы используете изображения, созданные с помощью ИИ, то вы слышали, что Google DeepMind только что запустила свою последнюю модель изображений с ИИ, Imagen 4. Но действительно ли она стоит всей этой шумихи? Мне не терпелось узнать!

По словам разработчика, эта новая модель ИИ создана для создания более насыщенных и подробных изображений с еще большей четкостью и скоростью, чем ее предшественникImagen 3 .

Google также утверждает, что может реалистично отображать тонкие оттенки цвета, а также сложные детали и текстуры, такие как ткани, шерсть животных или даже капли воды.

В этом смысле модель изображения AI может преуспеть в фотореализме и абстрактных стилях. Кроме того, Imagen 4 также разработан для обеспечения лучшей орфографии и типографики.

Это значит, что я могу использовать его для создания всевозможных изображений с большим количеством текста, таких как плакаты, комиксы, слайды, приглашения и т. д.

img1

Imagen 4 также призван обеспечить улучшенную точность выполнения, доступ к более широкому диапазону соотношений сторон и создание изображений с разрешением до 2K.

Учитывая количество улучшений, предлагаемых Imagen 4 , создается впечатление, что Google DeepMind стремится выйти на новый уровень творческого контроля и качества.

Но вопрос остается: как себя поведет Imagen 4 в руках обычных пользователей? Мне было любопытно узнать, поэтому я решил провести собственный тест.

Сразу же мне захотелось начать с чего-то простого. Поэтому я попросил модель Imagen 4 сгенерировать сцену военной базы с солдатами, готовящимися к войне.

К сожалению, сгенерированный вывод оказался неудовлетворительным. Хотя Imagen 4 удалось создать относительно хороший рендер милитаристской сцены, он не смог запечатлеть ключевые детали персонажей.

img2

Если говорить конкретно, их лица выглядели просто измятыми и изуродованными. Очень мало усилий было приложено к визуализации правильных и уникальных черт лица каждого из персонажей в сцене.

Похоже, модель ИИ была нацелена на создание окружающей среды в целом, но проигнорировала мелкие аспекты, которые могли бы еще больше подчеркнуть реалистичность изображения.

В этом тесте я бы дал Imagen 4 уверенную оценку 5/10.

Поскольку эта попытка оказалась неудачной, я решил попробовать что-то попроще. Я попросил Imagen 4 создать изображение женщины у реки с помощью объектива «рыбий глаз».

Я хотел посмотреть, будет ли он работать лучше с одним субъектом, а не со сценой с несколькими персонажами. Но даже с этим изменением результат все еще был немного разочаровывающим.

img3

Модель ИИ отобразила необычное изображение женщины с тремя руками! Я не уверен, почему это произошло, но очевидно, что Imagen 4 испытывает некоторые трудности с последовательным соблюдением графика.

Если на то пошло, он кажется даже менее эффективным, чем Imagen 3. Я признаю, что уровень качества изображения и детализации в этой сцене хороший, так что это уже что-то.

Но даже при работе с конкретным объектом Imagen 4 все равно не смог создать реалистичное изображение, пригодное для использования.

И, судя по впечатлениям других пользователей , похоже, я не единственный, кто испытывает трудности с тем, чтобы заставить стиль подсказок работать с этой моделью изображения ИИ.

За этот тест я бы дал Imagen 4 оценку 3/10.

Чтобы еще больше подчеркнуть свою точку зрения, я попробовал тот же запрос на Imagen 3, и вот результат ниже. Как вы можете видеть, Imagen 4 , несомненно, отстал от своего предшественника, когда дело доходит до точного следования инструкциям и рендеринга надлежащих изображений.

img4

Для своего последнего теста я решил использовать еще более подробную подсказку. Вот что я ввел: «Футуристическое, темное транспортное средство, напоминающее судно на воздушной подушке или бронированное транспортное средство, изображено в воздухе, над городской линией горизонта ночью. Транспортное средство гладкое и угловатое, с большими внедорожными шинами и несколькими красными огнями вдоль его задней части. Полосы дождя видны на его поверхности, и кажется, что оно находится в движении, возможно, летит или зависает. Город освещен яркими неоновыми огнями, в основном розовыми и красными, что создает яркий контраст с темным транспортным средством. Городская обстановка показывает освещенные здания и мост на заднем плане, предполагая ночной городской пейзаж. Перспектива немного низкая, как будто вид снизу транспортного средства, что усиливает ощущение скорости и маневренности. Композиция фокусируется на транспортном средстве, помещая его в центр кадра, а городской пейзаж служит фоном. Ориентация транспортного средства направлена ​​вперед, а цвета смелые, с прохладной палитрой темных черных, серых и контрастирующих ярких неоновых оттенков. Ощущение энергии и динамизма преобладает в изображении. Стиль современный, стилизованный и напоминает сцену из видеоигры или футуристический боевик, с большим акцентом на детальное освещение, дождь и визуальные эффекты. Общая атмосфера суровая, интенсивная и стремительная, передающая ощущение городских приключений.

И вот что получилось:

img5

В этом тесте я был полностью впечатлен. Imagen 4 удалось запечатлеть почти каждую ключевую деталь с безупречной точностью, чтобы создать потрясающее изображение, которое выглядит как будто из видеоигры.

Уровень детализации автомобиля, флуоресцентное освещение городского пейзажа и даже ощущение срочности в сцене... все это было передано на удивление хорошо.

Признаюсь, Imagen 4 застал меня врасплох! Не могу отрицать, что он отлично справился с этой задачей. Кажется, стиль подсказок модели ИИ может работать лучше с более подробными инструкциями.

Кроме того, если взглянуть на примеры Imagen 4 от Google DeepMind на их веб-сайте, то становится ясно, что использование длинных и подробных инструкций может быть единственным вариантом максимально эффективного использования этой модели ИИ.

На этот раз я бы оценил Imagen 4 на 9/10 по производительности . Очень хорошо управляется.

Поскольку последнее изображение было хорошим, я был немного в замешательстве! Естественно, я решил провести еще один тест, прежде чем составить мнение о возможностях Imagen 4.

В этом последнем тесте я хотел посмотреть, как модель изображения ИИ справляется с типографикой. Поэтому я попросил сделать уникальный ретро-стиль рекламного киноплаката об акулах с ярким дизайном заголовка.

Для этого запроса Imagen 4 удалось создать привлекательный постер с жирными шрифтами в ярких цветах. Но Imagen 4 не смог полностью отобразить текст постера, что было неприятно видеть.

img6

По сути, он представил мне незаконченное изображение, поэтому оно не совсем пригодно для использования. Но, помимо этого, я должен признать, что дизайн постера был не так уж плох.

Если что, Imagen 4 хорошо отобразил ретро-стиль и создал нечто, что выглядит круто и захватывающе. И снова это был тест со смешанными результатами. Честно говоря, я бы оценил его на 6,5/10.

В целом, я считаю, что Imagen 4 мог бы немного поработать. Он может иметь новые улучшения по сравнению с предшественником, но он все еще кажется немного неряшливым, особенно когда дело касается сложных сцен.

Кроме того, он также мог бы улучшить свой креативный дизайн. Хотя качество изображения неоспоримо, Imagen 4 кажется немного скованным в своем воображении.

Кроме того, новый стиль подсказок Imagen 4 кажется менее гибким и интуитивным. Для обычного пользователя это, вероятно, вызовет некоторое разочарование в попытках получить правильный результат.

Нужно что-то лучше Imagen 4? Попробуйте Pollo AI!

Учитывая, что Imagen 4 все еще требует исправления нескольких недостатков, следующим лучшим выбором на текущем рынке, который я бы настоятельно рекомендовал использовать, является Pollo AI.

Это комплексная платформа для генерации изображений и видео , которая интегрирована с несколькими первоклассными моделями генерации ИИ, подходящими практически для любого визуального стиля.

Вы можете получить доступ к моделям изображений ИИ, таким как Imagen , GPT-4o , Recraft , Stable Diffusion и Flux . Pollo AI также предлагает модели видео ИИ, такие как Kling AI , PixVerse AI , Luma AI , Hailuo AI и Runway .

Собрав все эти опции в одном месте, вы можете свободно переключаться между ними, создавая всевозможные уникальные и креативные результаты.

Но это еще не все! Хотелось ли вам когда-нибудь персонализировать существующие изображения и видео без профессиональных навыков редактирования?

С Pollo AI вы получите доступ к десяткам эффектов, шаблонов и инструментов ИИ, которые помогут вам превратить любые визуальные медиа в самые разные развлекательные продукты.

А самое лучшее? Вы можете опробовать обширные возможности Pollo AI прямо сейчас, не платя ни копейки, воспользовавшись бесплатным пробным планом!

Заключение

Imagen 4 — это интригующая модель изображений ИИ, которая поставляется со всеми новыми наворотами, но она все еще находится в стадии разработки, по крайней мере с точки зрения пользователя. Пока она не станет более совершенным продуктом, я предлагаю выбрать более последовательный, креативный и надежный инструмент ИИ для создания ваших изображений. И основываясь на моем личном опыте, вы просто не ошибетесь с Pollo AI!

Похожие посты

Я протестировал Hedra AI, но действительно ли он создает качественные видео с использованием ИИ?

Узнайте все о Hedra AI здесь! Я изучил эту платформу генерации ИИ и, протестировав ее возможности, суммировал все свои выводы в этой статье, включая то, почему вам следует использовать Pollo AI!

Я протестировал Medeo AI на предмет его комплексного создания мультимодального контента. Но стоит ли он такой шумихи?

Прочитайте мой обзор Medeo AI, одного из последних видеогенераторов на основе искусственного интеллекта. Я рассмотрю его особенности, преимущества и ограничения, а также поделюсь личным опытом его использования!

Честный обзор PicsArt AI: стоит ли его использовать или нет?

Хотите использовать PicsArt AI? В этом обзоре я рассмотрю его обширные возможности и поделюсь личным опытом использования этого генератора изображений AI. Читайте дальше, чтобы узнать все подробности!

Я протестировал Pictory AI, и мое честное впечатление о его возможностях может вас удивить

Планируете использовать Pictory AI? Ознакомьтесь с моим обзором инструмента для создания видео на основе ИИ, в котором я изучаю его различные функции и подробно рассказываю о своем личном опыте работы с ним!