Вышел Kling 2.0 , а это значит, что в настоящее время самый высоко оцененный генератор видео AI стал еще лучше. Сегодня мы погрузимся в него, чтобы увидеть, насколько он улучшился, чего ему не хватает и чего можно ожидать от этой новой, превосходной версии.
Kling не сбавляет обороты со своей новой эрой 2.0. Мы видим, что модель 1.6 удерживает первое место в списке лидеров лучшей модели преобразования изображений в видео, в то время как модель преобразования текста в видео 1.5 заняла второе место, уступив только Veo 2 от Google . Итак, давайте посмотрим, как покажет себя версия 2.0 от Kling.
Первый взгляд на Kling 2.0 — повышение точности и согласованности
С точки зрения общей точности и быстрой согласованности, я должен признать, что новая модель Kling 2.0 идет вперед, особенно в части изображения в видео. Независимо от вашего входного изображения, все остается согласованным, с солидной общей игрой персонажей.
Оценка функции преобразования текста в видео Kling 2.0
Давайте начнем с этого примера преобразования текста в видео, начав с подсказки о лютоволке, вдохновленной «Игрой престолов», во многом вдохновленной реальной новостью о том, что компания Colossal Bioscience вернула трех вымерших лютоволков.
Видеозапрос выглядит довольно солидно, особенно для text-to-video. Хотя есть несколько проблем с перспективой и масштабом лютоволка по сравнению с темным волшебником Джоном Сноу, это также соответствует первоначальному запросу. Учитывая это, это действительно очень впечатляющий вывод text-to-video.
Оценка преобразования изображения в видео Kling 2.0
Пример 1
Если посмотреть на наш первый пример, то у нас есть 10 секунд сплошной ходьбы. Что меня впечатлило, так это то, что, несмотря на небольшую декогеренцию, фокус кадра — это идущие ноги, и он показывает очень сплошной цикл ходьбы. Шаги минимально прерывистые, и ноги, кажется, реагируют на такие вещи, как лужи в грязи.
Иногда вы можете столкнуться с летящими назад космическими кораблями, но с идущими назад людьми я не сталкивался. Хотя если вы столкнетесь с этим, быстрое решение — просто запустить его в обратном направлении.
Пример 2
Еще один пример бесшовной генерации — это снимок, вдохновленный Vogue 60-х годов. Хотя модель находится в центре внимания, несмотря на то, что она слишком крута, чтобы смотреть в камеру, она сидит пассивно. Но мое внимание привлекли другие персонажи в сцене. Мужчины, идущие по сцене, на самом деле не являются ее частью, но в контексте они выглядят так, будто принадлежат ей.
Улучшенные возможности Kling 2.0
Когерентное быстрое движение
Главным преимуществом Kling 2.0 является его исключительная способность передавать связные и быстрые движения.
Если мы посмотрим на бой кунг-фу через текст в видео. Он полностью идеален? Нет, но он довольно впечатляющий, особенно если учесть вращающуюся камеру, которая компенсирует часть декогеренции.
Тот факт, что оба парня остаются на земле и ни один из них не улетает, а фон не превращается во взрывы, свидетельствует о впечатляющем результате.
Другой вывод из того же запроса был немного более неловким с точки зрения движений персонажей, но в целом, не было большой декогеренции, персонажи слились друг с другом или некоторые другие аспекты, которые мы часто ожидаем. Если бы вы использовали некоторые навыки редактирования, вы, вероятно, могли бы получить солидную часть 10-секундного клипа.
Характеристики поколения и управление камерой
Используя Kling 2.0, мы можем генерировать с интервалом в пять или 10 секунд и использовать соотношения сторон 16:9, 9:16 и 1:1. Кроме того, если вы выберете Premier Plan, вы сможете генерировать более одного вывода за раз. В настоящее время видеовыходы имеют разрешение 720p, хотя мне сказали, что скоро будет 1080p.
Выноски движения объектива и камеры
В настоящее время в подсказках нет опций управления камерой, но я должен сказать, что модель очень отзывчива, не только на вызовы движения камеры, но даже на выбор объектива. Например, здесь мы вызываем объектив 85 мм с малой глубиной резкости и движением орбитального типа.
Примечательно, что я вижу, что таблица слегка шатается, а столб не совсем соединяется там, где должен, но интересно отметить, что она оставалась постоянно шаткой на протяжении всего. В целом, подсказка следовала инструкциям по движению камеры и типу объектива.
Затем, заменив 85-мм объектив на 20-мм, мы получаем гораздо более широкий снимок, используя то же движение, с большим вниманием к деталям, уделяемым обозначению более широкоугольного объектива. Хотя неизбежно, что кто-то укажет, что это не совсем 20-мм или 85-мм объектив, здесь фокус в том, чтобы вы получили довольно хорошее приблизительное представление того, что ищете.
Запуск новых инструментов — функция Multi-Elements
Один аспект, который я не хочу упускать из виду, — это новая функция мультиэлементов, которая также запускается. У меня не было много времени, чтобы поиграть с ней, но я думаю, что важно дать вам представление о том, что она делает, потому что у нее есть потенциал стать довольно мощным инструментом.
Открывая видео, вы можете нажать кнопку «Добавить выделение», и ваш персонаж мгновенно будет замаскирован.

Когда вы будете удовлетворены, вы можете «Подтвердить», а затем загрузить изображение другого персонажа.

В приглашении появится сообщение «Поменяйте X из (миниатюра вашего изображения) на X из (миниатюра вашего видео). Вам нужно будет ввести значения «X», в этом примере girl и girl, а затем нажать «Generate».

Инструмент заменяет один символ другим, и хотя входные данные в этом примере неидеальны, они дают хорошее представление о том, что делает функция нескольких элементов.

Поэкспериментировав и, возможно, выбрав более тональные варианты, вы сможете добиться впечатляющих результатов, особенно после выхода модели Kling 2.0 .
Окончательный вердикт: Kling AI все еще король?
Что касается преобразования текста в видео, я считаю, что он более или менее находится на равных с Veo 2, а Veo 2 немного опережает его.
Но опять же, нужно учитывать более высокую стоимость эксплуатации Veo 2. При этом мне сказали, что на подходе еще несколько моделей 2.0, так что посмотрим, останется ли Kilng королем или на его место придет другая модель.

Примечание: статья написана на основе следующего видео на YouTube .