A Kling AI acaba de lançar o Kling 2.0 ao público.
Esta nova versão está repleta de grandes atualizações, conquistando o primeiro lugar no ranking de vídeos de IA. Mas será que é realmente tão inovador como parece?
Colocámos o Kling 2.0 à prova, comparando-o com outros modelos de última geração, como o Runway Gen 4 e o Veo 2 da Google .
Partilharemos os resultados em breve, mas primeiro, vamos perceber o que torna o Kling 2.0 especial.
O que há de novo no Kling 2.0 ?
O Kling 2.0 introduziu várias novidades e alterações.
Prompt visual multimodal
Uma das adições mais significativas ao ecossistema Kling é a nova funcionalidade "Multi Elementos".
É um sistema de prompts visuais multimodais que permite aos utilizadores referenciar imagens e vídeos em prompts de texto. Esta característica representa um grande avanço em termos de controlo e precisão, embora esteja atualmente separado do Kling 2.0 (com integração prevista para breve).
O sistema oferece três funções principais:
- Trocar: Substituir assuntos em vídeos existentes (a funcionalidade estava a apresentar erros durante o teste)
- Adicionar: inserir novos elementos de imagens de referência em vídeos
- Apagar: Remove objetos indesejados de cenas dinamicamente
Nos nossos testes, utilizámos com sucesso a funcionalidade "adicionar" para inserir uma mulher a correr (a partir de uma imagem de referência) numa cena de lava a entrar numa antiga casa de ópera.

Da mesma forma, a função "apagar" permitiu-nos retirar um papagaio do ombro de um robô, mantendo a coerência visual em todo o vídeo.

Notavelmente, o Kling AI fornece modelos de prompts úteis ao carregar materiais de referência, eliminando a necessidade de memorizar estruturas de prompts complexas — uma melhoria cuidadosa da experiência do utilizador.
Alterações na interface e no fluxo de trabalho
Nesta versão, a Kling AI introduziu também várias alterações na interface:
- A distinção entre os modos “padrão” e “profissional” foi removida
- Os controlos deslizantes de criatividade versus acompanhamento de prompts já não estão disponíveis
- O modo de quadro não é compatível com o Kling 2.0 de momento
- A funcionalidade de elementos originais (para localização de personagens e referências de objectos) ainda não é compatível com o Kling 2.0

Kling 2.0 vs. Kling 1.6: O que melhorou?
O Kling 2.0 destaca-se na qualidade de movimento e na simulação de física, mas ocasionalmente pode preferir a coerência de cena do Kling 1.6 para projetos específicos.
Fluidez de Movimento e Naturalismo
O Kling 2.0 melhora drasticamente a qualidade do movimento. Os animais movem-se com uma fluidez natural, em vez dos movimentos bruscos e irreais observados no Kling 1.6.
As expressões humanas são mais convincentes, eliminando o problema de "mexer os lábios sem falar". As emoções faciais parecem naturais e consistentes em todas as sequências.
Manipulação dinâmica de cenas
As criaturas voadoras apresentam movimentos de asas adequados e padrões naturais de planeio. As trajetórias de voo rígidas do Kling 1.6 são substituídas por dinâmicas aéreas realistas.
A física ambiental melhorou significativamente. Os efeitos da água, as interações dos objetos e as propriedades dos materiais comportam-se de forma mais realista.
A compensação da coerência
O Kling 2.0 produz cenas mais dinâmicas, mas por vezes à custa da coerência. As personagens podem aparecer ou desaparecer inesperadamente em sequências complexas.
O Kling 1.6, embora menos impressionante visualmente, manteve uma melhor consistência de cena em todos os vídeos.
Compreensão rápida
Instruções de câmara como panorâmica, inclinação e mudanças de focagem são executadas com maior precisão no Kling 2.0.
As ações sequenciais são melhor compreendidas. Os avisos com várias partes, como "lustre a cair na lava e a explodir em chamas", seguem a ordem lógica correta.
Limitações técnicas
Ambas as versões têm dificuldades com mãos, renderização de texto e interações complexas, embora a versão 2.0 mostre melhorias modestas nestas áreas.
Parâmetros de Geração
O Kling 2.0 remove os sliders de criatividade/seguimento de avisos e funde os modos padrão/profissional numa interface unificada.
Esta abordagem simplificada pode beneficiar os principiantes, mas limita as opções para utilizadores avançados habituados a ajustar os seus resultados.
Testando o Kling 2.0
Queríamos ver como o Kling 2.0 se comparava com o Runway Gen 4 e o Google Veo 2.
Assim, fizemos uma série de testes em todos os três geradores de vídeo de IA utilizando os mesmos prompts.
Capacidades de aderência imediata e renderização de movimento
O nosso primeiro teste centrou-se na capacidade do Kling 2.0 de compreender e executar comandos complexos que envolvem movimentos da câmara e do objeto. A tarefa era simples, mas desafiante: uma mulher olha para as suas próprias mãos, e um papagaio pousa nelas.
O Kling 2.0 fez um trabalho impressionante seguindo o prompt à risca. A ação desenrolou-se naturalmente, com uma sequência clara de acontecimentos.
A produção da Runway, por outro lado, falhou um pouco o alvo. O papagaio já estava presente quando a mulher olhou para baixo, o que não corresponde aos requisitos do prompt.
O Veo 2 da Google seguiu o exemplo, mas não tinha a ação clara e sequencial que o Kling 2.0 oferecia.
Avaliação dos Efeitos Ambientais: Simulação de Cheias
Em seguida, testámos a capacidade do Kling 2.0 de renderizar efeitos ambientais, especificamente um cenário de inundação num ambiente urbano.
O Kling 2.0 teve um desempenho admirável, retratando com precisão as águas das cheias enchendo as ruas e empurrando os carros.
A Runway teve dificuldades com este desafio, optando por mostrar uma onda gigante do oceano que não se enquadrava no prompt.
O Veo 2 conseguiu renderizar a inundação, mas faltou-lhe dinamismo e não captou completamente o cenário descrito no prompt.
Ação dinâmica e compreensão rápida em cenários de alta velocidade
Levamos o Kling 2.0 ainda mais longe ao testar a sua capacidade de lidar com sequências de ação de alta velocidade. A tarefa envolvia uma mulher a galopar num cavalo com a câmara a circular ao seu redor.
O Kling 2.0 produziu um resultado dinâmico e visualmente atraente, embora tenha tido dificuldades em manter a coerência facial durante a ação a alta velocidade.
A produção de Runway parecia mais uma cena em câmara lenta, sem o dinamismo de alta velocidade que procurávamos.
O Veo 2, infelizmente, não apresentou resultados utilizáveis neste cenário.
Renderização de objetos levitantes e movimentos complexos de câmara
Neste teste, desafiámos o Kling 2.0 a renderizar uma cena com objetos a levitar e um movimento de inclinação da câmara para baixo.
O Kling 2.0 destacou-se mais uma vez, retratando com precisão os objetos flutuantes e seguindo o movimento de câmara especificado. O Runway e o Veo 2 tiveram dificuldades nesta tarefa, não conseguindo renderizar completamente os objetos levitantes e o movimento da câmara, como descrito no prompt.
O Desafio Final: Modelos de Vídeo de IA vs. Cena de Luta de Samurai
O desafio final foi renderizar uma cena de luta entre dois samurais, uma tarefa que se revelou historicamente difícil para os modelos de vídeo de IA.
O Kling 2.0, embora melhorado em relação às versões anteriores, ainda tinha dificuldades em renderizar lutas com um aspeto natural. A coerência das espadas diminuiu, especialmente quando interagiam, e a cena geral não parecia tão realista como esperávamos.
Runway Gen 4 e Veo 2 enfrentaram problemas semelhantes, com problemas de coerência e falta de movimento natural nas cenas de luta.
Benefícios e limitações do Kling 2.0
No geral, pensamos que o Kling 2.0 vem com os seguintes prós e contras.
Pontos fortes do Kling 2.0
- Adesão imediata: O Kling 2.0 mostra uma adesão notável a prompts complexos, especialmente aqueles que envolvem múltiplas ações e efeitos ambientais.
- Realismo nas interações: o modelo destaca-se na renderização de interações subtis e movimentos realistas, melhorando a qualidade visual geral.
Desafios Kling 2.0
- Manter a coerência: o Kling 2.0 tem dificuldades com a coerência durante sequências de ação complexas e de alta velocidade, o que leva a inconsistências nos resultados.
- Renderização de cenas complexas: apesar das melhorias, o Kling 2.0 ainda enfrenta desafios na renderização de cenas de luta realistas e movimentos de câmara dinâmicos.
Preços e Acessibilidade
- Implicações de custos: o preço do Kling 2.0, especialmente para gerações de vídeos curtos, pode ser uma preocupação para alguns utilizadores, indicando a necessidade de opções mais acessíveis.
Considerações finais: o Kling 2.0 vale a pena?
O Kling 2.0 representa um avanço significativo na geração de vídeos por IA, oferecendo melhorias impressionantes na aderência a prompts complexos e renderizando interações realistas.
No entanto, ainda enfrenta desafios para manter a coerência durante as cenas dinâmicas. Apesar dos seus avanços, deve ponderar os benefícios em relação ao custo atual e às necessidades específicas dos seus projetos ao considerar o Kling 2.0.
Nota: Este artigo foi escrito com base no conteúdo do seguinte vídeo: