Главная страница/Блог/Обзоры/Обзор модели изображений Kling O1: сможет ли первый генератор изображений Kling повторить успех видео?

Обзор модели изображений Kling O1: сможет ли первый генератор изображений Kling повторить успех видео?

Kling AI зарекомендовал себя как один из самых мощных генераторов ИИ-видео на рынке, неизменно впечатляя создателей своей способностью создавать высококачественные кадры из простых текстовых запросов.

Теперь они пробуют что-то новое с запуском модели генерации изображений Kling O1, своей первой специализированной модели для создания изображений. Главный вопрос: может ли Kling создавать изображения так же хорошо, как и видео?

Я уделил время обширному тестированию модели генерации изображений Kling O1 и готов поделиться своими выводами. Давайте посмотрим, что нового предлагает эта модель.

Что выделяет Kling O1?

Прежде чем перейти к подробным тестам, позвольте мне кратко представить самые впечатляющие функции Kling O1:

Потрясающая гибридная технология слияния изображений, сохраняющая исходные детали

Одна из самых сильных сторон модели генерации изображений Kling O1 — это ее способность объединять несколько эталонных изображений, прекрасно сохраняя при этом исходные характеристики каждого источника.

В отличие от многих других моделей, которые размывают детали при смешивании нескольких изображений, Kling O1 с впечатляющей точностью сохраняет отличительные черты каждого элемента.

Интеллектуальное понимание запросов и точное редактирование

Модель точно понимает инструкции по редактированию, будь то корректировка определенных областей изображения или изменение конкретных элементов.

Построенная на мощной концепции мультимодального визуального языка, она делает редактирование изображений таким же естественным, как беседа с дизайнером.

Мой процесс тестирования: Проверяем модель генерации изображений Kling O1 на прочность

Чтобы должным образом оценить возможности Kling O1, я сосредоточился на двух основных сценариях тестирования, которые выявили бы как ее сильные стороны, так и потенциальные слабости:

Тест 1: Слияние нескольких эталонных изображений

Первый тест был направлен на оценку того, насколько хорошо Kling O1 справляется с одновременной обработкой нескольких эталонных изображений и созданием единой композиции, сохраняющей характеристики каждого источника.

Я использовал четыре изображения:

Young girl in pink dress smiling at playground
Cocker spaniel dog sitting on green grass outdoors
Empty birthday party room with colorful balloons and decorations
Group of friends with surfboard celebrating at beach sunset

Затем я предоставил следующий запрос:

Создайте изображение, на котором девочка с изображения 1 держит собаку с изображения 2, фон с изображения 3, а цветовой тон и стиль изображения 4 применяются ко всей фотографии.

И вот результат, который я получил:

Birthday party room decorated with balloons and happy birthday sign

Из полученных результатов очевидно, что Kling O1 идеально следовала инструкциям, даже при одновременной обработке контента из четырех изображений. Не было никакого хаоса или отклонения от запроса, и ее мощная способность к многоуровневой обработке изображений действительно меня удивила.

Однако я считаю, что реалистичность этой фотографии можно было бы улучшить. Хотя объект и фон имеют одинаковый цветовой тон, все же ощущается некоторая разрозненность и неестественность.

Помимо смешивания сцен и объектов, я также протестировал применение стиля и материалов.

Я использовал эти два изображения:

Anime girl illustration with scarf near cherry blossom trees.
Black and white houndstooth pattern fabric texture closeup

И установил следующий запрос:

Превратите объект с изображения 1 в фотореалистичного человека, используя текстуру и материал со второго изображения для шарфа.

Финальное изображение, предоставленное Kling O1:

Smiling woman wearing checkered scarf outdoors in spring blossoms

Конечный результат демонстрирует, что Kling O1 весьма хорошо справляется с преобразованием стиля и заменой материалов.

Тем не менее, есть некоторые незначительные проблемы: дополнительная часть шарфа появилась на груди объекта, а галстук-бабочка исчез. Подобные логические несоответствия в изображении подрывают его общую реалистичность.

Тест 2: Итеративное точное редактирование

Второй тест был сосредоточен на оценке способности Kling O1 к точным, инкрементальным модификациям на основе одного эталонного изображения.

Это позволило бы выявить, может ли модель обрабатывать сложные рабочие процессы редактирования без ухудшения качества или потери контекста.

В таблице, которую я составил ниже, вы можете увидеть сравнение производительности Kling O1 в этом тесте:

Эталонное изображение Запрос и результат 1 Запрос и результат 2
Woman holding coffee cup sitting by cafe window indoors
Woman sitting at yellow tone cafe bar counter inside

Измените время суток на вечер, с теплым внутренним освещением от верхних ламп. Все остальное оставьте без изменений.

Woman relaxing with coffee at window seat in cafe

Замените чашку кофе книгой. Женщина теперь должна читать, а не смотреть в окно. Сохраните те же черты лица, одежду и фон.

Запрос и результат 3 Запрос и результат 4 Запрос и результат 5
Woman drinking coffee by window in crowded urban cafe

Добавьте легкий дождь, видимый через окно. Отрегулируйте отражение в окне, чтобы показать капли дождя. Не изменяйте внутреннюю сцену или персонажа.

Woman with coffee sitting in busy cafe by window

Измените ее повседневную одежду на деловую — пиджак и официальную блузку. Сохраните ее позу, черты лица и всю фоновую сцену.

Woman holding coffee sitting at cafe window with people

Добавьте еще одного человека на заднем плане — бариста, работающего за стойкой. Сохраните то же освещение, время суток и все остальные существующие элементы.

Результаты были действительно впечатляющими. Kling O1 продемонстрировала исключительное понимание того, что должно измениться, а что должно остаться неизменным.

Каждая итерация сохраняла замечательную согласованность с предыдущими версиями, точно реализуя запрошенные модификации.

Заключительные мысли: стоит ли пробовать Kling O1?

После обширного тестирования модель генерации изображений Kling O1, безусловно, является сильным претендентом в сфере генерации ИИ-изображений.

Мультимодальный подход работает отлично — сочетание запросов на естественном языке с эталонными изображениями создает плавный рабочий процесс, который кажется скорее совместной работой, чем источником фрустрации.

Сохранение функций является лучшим в своем классе, сохраняя отличительные черты каждого источника при объединении нескольких ссылок. Пошаговое редактирование также удивительно эффективно, позволяя вносить точные изменения без потери контекста.

Для создателей и дизайнеров, которым нужен превосходный контроль и согласованность, модель генерации изображений Kling O1 определенно стоит попробовать. Она успешно переносит видеоопыт Kling в статичные изображения, устраняя раздражающее переключение инструментов, которое встречается во многих процессах творческого ИИ.

Идеальна ли она? Нет. Но это сильный дебют, показывающий, что Kling AI серьезно относится к генерации изображений.

Готовы протестировать ее сами? Перейдите на Pollo AI, чтобы опробовать модель генерации изображений Kling O1, или изучите другие лучшие модели, доступные на генераторе изображений Pollo AI, чтобы найти ту, которая лучше всего соответствует вашим потребностям. Это ценное вложение времени для любого создателя.

Вам также может понравиться

Посмотреть больше

Обзор Sora 2 : Я протестировал новую видеомодель на основе ИИ от OpenAI – результаты потрясающие.

В этом практическом обзоре вы узнаете о видеогенераторе с искусственным интеллектом Sora 2 от OpenAI. Узнайте, почему Sora 2 меняет мир творчества. Проверено и доказано!

Обзор Nano Banana Pro: Оправдывает ли этот генератор ИИ-изображений все ожидания?

Соответствует ли Google Nano Banana Pro ожиданиям? В нашем честном обзоре мы подробно рассмотрим модель ИИ для генерации изображений Nano Banana Pro, протестируем ее превосходное отображение текста, творческие элементы управления и многое другое, чтобы выяснить, действительно ли она оправдывает ожидания.

Обзор Hailuo 2.3 : Я протестировал новейшую видеомодель Hailuo AI и был приятно удивлен ее результатами.

Откройте для себя Hailuo 2.3 на Pollo AI! Ознакомьтесь с этим подробным обзором, в котором рассматривается новейшая модель видеоанализа на основе ИИ от Hailuo AI и новые возможности, которые она предоставляет для создания видео с помощью ИИ!

Обзор Kling O1 : Я протестировал модель видеосъемки с использованием ИИ на Kling O1 , и, возможно, это будущее видеотехнологий на основе ИИ.

Я протестировал видеомодель Kling AI O1 — унифицированный мультимодальный ИИ, который бесшовно создает и редактирует видео. Узнайте, почему видеомодель Kling O1 может стать будущим ИИ-видео.