Página inicialKling AIKling 2.0 - Ainda é o melhor gerador de IA ou foi destronado?

Kling 2.0 - Ainda é o melhor gerador de IA ou foi destronado?

O Kling 2.0 foi lançado, o que significa que o gerador de vídeo de IA atualmente mais bem classificado ficou ainda melhor. Hoje, vamos analisar em detalhe o quanto melhorou, o que falta e o que pode esperar desta nova versão superior.

A Kling continua a aquecer com a sua nova era 2.0. Podemos ver o modelo 1.6 a manter a sua primeira posição na tabela de classificação de melhor modelo de imagem para vídeo, enquanto o modelo 1.5 de texto para vídeo ficou em segundo lugar, apenas atrás do Veo 2 da Google . Vamos então ver como se sai a versão 2.0 do Kling.

Uma primeira vista de olhos ao Kling 2.0 - Aumento de fidelidade e coerência

Em termos de fidelidade geral e coerência rápida, devo admitir que o novo modelo Kling 2.0 está muito à frente, principalmente no que diz respeito à conversão de imagem para vídeo. Não importa a sua imagem de entrada, as coisas mantêm-se consistentes, com uma prestação geral sólida das personagens.

Avaliando o texto para vídeo do Kling 2.0

Vamos começar com este exemplo de texto para vídeo, começando com um prompt de lobo gigante inspirado em Game of Thrones, em grande parte inspirado na notícia real da Colossal Bioscience que traz três lobos gigantes de volta da extinção.

O prompt de vídeo parece bastante sólido, especialmente para texto em vídeo. Embora existam alguns problemas com a perspetiva e a escala do lobo gigante em comparação com o mago das trevas, Jon Snow, isto também está de acordo com a sugestão inicial. Com isto em mente, esta é realmente uma saída de texto para vídeo muito impressionante.

Avaliando a conversão de imagem para vídeo do Kling 2.0

Exemplo 1

Olhando para o nosso primeiro exemplo, temos 10 segundos de caminhada contínua. O que me impressionou é que, apesar de um pouco de decoerência, o foco da cena são os pés a caminhar e mostra um ciclo de caminhada muito sólido. Há um passo hesitante mínimo, e os pés parecem reagir a coisas como poças de lama.

Ocasionalmente, pode deparar-se com naves espaciais a voar para trás, mas pessoas a andar para trás não é algo que eu tenha visto. No entanto, se passar por isso, uma solução rápida é simplesmente executar ao contrário.

Exemplo 2

Outro exemplo de geração contínua surge na forma desta foto inspirada na Vogue dos anos 60. Embora a modelo seja o foco, apesar de ser demasiado fria para olhar para a câmara, permanece sentada passivamente. Mas foram as outras personagens da cena que me chamaram a atenção. Os homens que caminham na cena não fazem realmente parte dela, mas contextualmente, parecem pertencer àquele lugar.

Características atualizadas do Kling 2.0

Movimento Rápido Coerente

Um grande ponto forte do Kling 2.0 é que é excecional em movimentos rápidos e coerentes.

Se olharmos para a luta de Kung-fu via texto para vídeo. É completamente perfeito? Não, mas é bastante impressionante, sobretudo tendo em conta a câmara giratória, que contraria um pouco a decoerência.

O facto de ambos os rapazes estarem no chão e nenhum deles estar a voar para longe, e o fundo não se estar a transformar em explosões, mostra um resultado impressionante.

Outra saída do mesmo prompt foi um pouco mais estranha em termos de movimentos das personagens, mas, no geral, não houve muita decoerência, com as personagens a fundirem-se umas às outras ou alguns dos outros aspetos que geralmente esperamos. Se utilizar algumas habilidades de edição, provavelmente conseguirá obter uma boa parte do clipe de 10 segundos.

Especificações de geração e controlo de câmaras

Utilizando o Kling 2.0, podemos gerar em intervalos de cinco ou 10 segundos e utilizar rácios de 16:9, 9:16 e 1:1. Além disso, se escolher o Plano Premier, pode gerar mais do que uma saída de cada vez. Atualmente, as saídas de vídeo são de 720p, embora me tenham dito que 1080p está a caminho.

Chamadas de movimento de objetiva e câmara

Atualmente não existem opções de controlo da câmara dentro do prompt, mas devo dizer que o modelo é muito responsivo, não só aos comandos de movimento da câmara, mas também às escolhas da objetiva. Por exemplo, aqui, pedimos uma lente de 85 mm, com uma profundidade de campo reduzida e um movimento do tipo orbital.

Notavelmente, posso ver que a mesa está um pouco torta, com o poste a não se ligar exatamente onde deveria, mas é interessante notar que permaneceu consistentemente torta o tempo todo. No geral, o prompt seguiu as instruções sobre o movimento da câmara e o tipo de objetiva.

Depois, trocando a objetiva de 85 mm para uma de 20 mm, obtemos um plano muito mais amplo utilizando o mesmo movimento, com grande atenção aos detalhes dada à chamada da objetiva de ângulo mais amplo. Embora seja inevitável que alguém diga que não se trata propriamente de uma objetiva de 20 mm ou 85 mm, o objetivo aqui é que tenha uma boa ideia do que procura.

Lançamento de novas ferramentas - A funcionalidade Multi-Elementos

Um aspeto que não quero ignorar é a nova funcionalidade de vários elementos que também está a ser lançada. Não tive muito tempo para brincar com ele, mas acho que é importante dar uma ideia do que faz, porque tem o potencial de se tornar uma ferramenta muito poderosa.

Ao abrir um vídeo, pode clicar na opção “Adicionar seleção” e este irá mascarar a sua personagem instantaneamente.

img1

Quando estiver satisfeito, pode “Confirmar” e depois enviar uma imagem de outra personagem.

img2

O aviso apresenta "Trocar X de (miniatura da sua imagem) por X de (miniatura do seu vídeo). Terá de preencher os valores "X", neste exemplo, "rapariga" e "rapariga", e depois clicar em "Gerar".

img3

A ferramenta troca um caractere por outro e, embora a entrada neste exemplo não seja perfeita, dá uma boa indicação do que o recurso de vários elementos faz.

img4

Com alguma experimentação e talvez opções mais alinhadas com o tom, poderá obter resultados espetaculares, especialmente quando o modelo Kling 2.0 chegar.

Veredicto final: a Kling AI ainda é a rainha?

Em termos de conversão de texto em vídeo, sinto que está mais ou menos ao mesmo nível do Veo 2, com o Veo 2 à frente, mas apenas um pouco.

Mas, mais uma vez, é preciso ter em conta o maior custo operacional do Veo 2. Dito isto, disseram-me que vários outros modelos 2.0 estão a caminho, por isso veremos se o Kilng continua a reinar ou se outro modelo surge para ocupar o seu lugar.

img5

Nota: O artigo foi escrito com base no seguinte vídeo do YouTube .

Postagens relacionadas

O Kling 2.0 chegou: descubra as suas características

Descubra os avanços inovadores de IA do Kling 2.0 na geração de vídeos e imagens. Desde movimentos fluidos a ferramentas de edição poderosas, veja porque é que este é um modelo de vídeo revolucionário.

Kling 2.0: Comparação com o Kling 1.6

A Kling lançou recentemente o seu modelo de geração de vídeo Kling 2.0 AI. Aqui vamos mostrar o que o Kling 2.0 consegue criar e as diferenças entre as versões 1.6 e 2.0.

Análise Kling 2.0 : Melhor geração de vídeo dinâmico, novas funcionalidades de edição e muito mais

O Kling 2.0 chegou, melhorando a geração dinâmica de vídeos com capacidades melhoradas de imagem para vídeo e texto para vídeo. Confira aqui a minha análise!

Como usar Kling AI nos EUA

Descubra como utilizar o Kling AI nos EUA e crie vídeos de alta qualidade! Leia este post do blog para um guia passo a passo. (Também tem imagens!)