Página inicialKling AIKling 2.0 já foi lançado: é o melhor modelo de vídeo de IA?

Kling 2.0 já foi lançado: é o melhor modelo de vídeo de IA?

A Kling AI acaba de lançar o Kling 2.0 ao público.

Esta nova versão está repleta de grandes atualizações, conquistando o primeiro lugar no ranking de vídeos de IA. Mas será que é realmente tão inovador como parece?

Colocámos o Kling 2.0 à prova, comparando-o com outros modelos de última geração, como o Runway Gen 4 e o Veo 2 da Google .

Partilharemos os resultados em breve, mas primeiro, vamos perceber o que torna o Kling 2.0 especial.

O que há de novo no Kling 2.0 ?

O Kling 2.0 introduziu várias novidades e alterações.

Prompt visual multimodal

Uma das adições mais significativas ao ecossistema Kling é a nova funcionalidade "Multi Elementos".

É um sistema de prompts visuais multimodais que permite aos utilizadores referenciar imagens e vídeos em prompts de texto. Esta característica representa um grande avanço em termos de controlo e precisão, embora esteja atualmente separado do Kling 2.0 (com integração prevista para breve).

O sistema oferece três funções principais:

  1. Trocar: Substituir assuntos em vídeos existentes (a funcionalidade estava a apresentar erros durante o teste)
  2. Adicionar: inserir novos elementos de imagens de referência em vídeos
  3. Apagar: Remove objetos indesejados de cenas dinamicamente

Nos nossos testes, utilizámos com sucesso a funcionalidade "adicionar" para inserir uma mulher a correr (a partir de uma imagem de referência) numa cena de lava a entrar numa antiga casa de ópera.

imagem1

Da mesma forma, a função "apagar" permitiu-nos retirar um papagaio do ombro de um robô, mantendo a coerência visual em todo o vídeo.

imagem2

Notavelmente, o Kling AI fornece modelos de prompts úteis ao carregar materiais de referência, eliminando a necessidade de memorizar estruturas de prompts complexas — uma melhoria cuidadosa da experiência do utilizador.

Alterações na interface e no fluxo de trabalho

Nesta versão, a Kling AI introduziu também várias alterações na interface:

  • A distinção entre os modos “padrão” e “profissional” foi removida
  • Os controlos deslizantes de criatividade versus acompanhamento de prompts já não estão disponíveis
  • O modo de quadro não é compatível com o Kling 2.0 de momento
  • A funcionalidade de elementos originais (para localização de personagens e referências de objectos) ainda não é compatível com o Kling 2.0
imagem3

Kling 2.0 vs. Kling 1.6: O que melhorou?

O Kling 2.0 destaca-se na qualidade de movimento e na simulação de física, mas ocasionalmente pode preferir a coerência de cena do Kling 1.6 para projetos específicos.

Fluidez de Movimento e Naturalismo

O Kling 2.0 melhora drasticamente a qualidade do movimento. Os animais movem-se com uma fluidez natural, em vez dos movimentos bruscos e irreais observados no Kling 1.6.

As expressões humanas são mais convincentes, eliminando o problema de "mexer os lábios sem falar". As emoções faciais parecem naturais e consistentes em todas as sequências.

Manipulação dinâmica de cenas

As criaturas voadoras apresentam movimentos de asas adequados e padrões naturais de planeio. As trajetórias de voo rígidas do Kling 1.6 são substituídas por dinâmicas aéreas realistas.

A física ambiental melhorou significativamente. Os efeitos da água, as interações dos objetos e as propriedades dos materiais comportam-se de forma mais realista.

A compensação da coerência

O Kling 2.0 produz cenas mais dinâmicas, mas por vezes à custa da coerência. As personagens podem aparecer ou desaparecer inesperadamente em sequências complexas.

O Kling 1.6, embora menos impressionante visualmente, manteve uma melhor consistência de cena em todos os vídeos.

Compreensão rápida

Instruções de câmara como panorâmica, inclinação e mudanças de focagem são executadas com maior precisão no Kling 2.0.

As ações sequenciais são melhor compreendidas. Os avisos com várias partes, como "lustre a cair na lava e a explodir em chamas", seguem a ordem lógica correta.

Limitações técnicas

Ambas as versões têm dificuldades com mãos, renderização de texto e interações complexas, embora a versão 2.0 mostre melhorias modestas nestas áreas.

Parâmetros de Geração

O Kling 2.0 remove os sliders de criatividade/seguimento de avisos e funde os modos padrão/profissional numa interface unificada.

Esta abordagem simplificada pode beneficiar os principiantes, mas limita as opções para utilizadores avançados habituados a ajustar os seus resultados.

Testando o Kling 2.0

Queríamos ver como o Kling 2.0 se comparava com o Runway Gen 4 e o Google Veo 2.

Assim, fizemos uma série de testes em todos os três geradores de vídeo de IA utilizando os mesmos prompts.

Capacidades de aderência imediata e renderização de movimento

O nosso primeiro teste centrou-se na capacidade do Kling 2.0 de compreender e executar comandos complexos que envolvem movimentos da câmara e do objeto. A tarefa era simples, mas desafiante: uma mulher olha para as suas próprias mãos, e um papagaio pousa nelas.

O Kling 2.0 fez um trabalho impressionante seguindo o prompt à risca. A ação desenrolou-se naturalmente, com uma sequência clara de acontecimentos.

A produção da Runway, por outro lado, falhou um pouco o alvo. O papagaio já estava presente quando a mulher olhou para baixo, o que não corresponde aos requisitos do prompt.

O Veo 2 da Google seguiu o exemplo, mas não tinha a ação clara e sequencial que o Kling 2.0 oferecia.

Avaliação dos Efeitos Ambientais: Simulação de Cheias

Em seguida, testámos a capacidade do Kling 2.0 de renderizar efeitos ambientais, especificamente um cenário de inundação num ambiente urbano.

O Kling 2.0 teve um desempenho admirável, retratando com precisão as águas das cheias enchendo as ruas e empurrando os carros.

A Runway teve dificuldades com este desafio, optando por mostrar uma onda gigante do oceano que não se enquadrava no prompt.

O Veo 2 conseguiu renderizar a inundação, mas faltou-lhe dinamismo e não captou completamente o cenário descrito no prompt.

Ação dinâmica e compreensão rápida em cenários de alta velocidade

Levamos o Kling 2.0 ainda mais longe ao testar a sua capacidade de lidar com sequências de ação de alta velocidade. A tarefa envolvia uma mulher a galopar num cavalo com a câmara a circular ao seu redor.

O Kling 2.0 produziu um resultado dinâmico e visualmente atraente, embora tenha tido dificuldades em manter a coerência facial durante a ação a alta velocidade.

A produção de Runway parecia mais uma cena em câmara lenta, sem o dinamismo de alta velocidade que procurávamos.

O Veo 2, infelizmente, não apresentou resultados utilizáveis ​​neste cenário.

Renderização de objetos levitantes e movimentos complexos de câmara

Neste teste, desafiámos o Kling 2.0 a renderizar uma cena com objetos a levitar e um movimento de inclinação da câmara para baixo.

O Kling 2.0 destacou-se mais uma vez, retratando com precisão os objetos flutuantes e seguindo o movimento de câmara especificado. O Runway e o Veo 2 tiveram dificuldades nesta tarefa, não conseguindo renderizar completamente os objetos levitantes e o movimento da câmara, como descrito no prompt.

O Desafio Final: Modelos de Vídeo de IA vs. Cena de Luta de Samurai

O desafio final foi renderizar uma cena de luta entre dois samurais, uma tarefa que se revelou historicamente difícil para os modelos de vídeo de IA.

O Kling 2.0, embora melhorado em relação às versões anteriores, ainda tinha dificuldades em renderizar lutas com um aspeto natural. A coerência das espadas diminuiu, especialmente quando interagiam, e a cena geral não parecia tão realista como esperávamos.

Runway Gen 4 e Veo 2 enfrentaram problemas semelhantes, com problemas de coerência e falta de movimento natural nas cenas de luta.

Benefícios e limitações do Kling 2.0

No geral, pensamos que o Kling 2.0 vem com os seguintes prós e contras.

Pontos fortes do Kling 2.0

  • Adesão imediata: O Kling 2.0 mostra uma adesão notável a prompts complexos, especialmente aqueles que envolvem múltiplas ações e efeitos ambientais.
  • Realismo nas interações: o modelo destaca-se na renderização de interações subtis e movimentos realistas, melhorando a qualidade visual geral.

Desafios Kling 2.0

  • Manter a coerência: o Kling 2.0 tem dificuldades com a coerência durante sequências de ação complexas e de alta velocidade, o que leva a inconsistências nos resultados.
  • Renderização de cenas complexas: apesar das melhorias, o Kling 2.0 ainda enfrenta desafios na renderização de cenas de luta realistas e movimentos de câmara dinâmicos.

Preços e Acessibilidade

  • Implicações de custos: o preço do Kling 2.0, especialmente para gerações de vídeos curtos, pode ser uma preocupação para alguns utilizadores, indicando a necessidade de opções mais acessíveis.

Considerações finais: o Kling 2.0 vale a pena?

O Kling 2.0 representa um avanço significativo na geração de vídeos por IA, oferecendo melhorias impressionantes na aderência a prompts complexos e renderizando interações realistas.

No entanto, ainda enfrenta desafios para manter a coerência durante as cenas dinâmicas. Apesar dos seus avanços, deve ponderar os benefícios em relação ao custo atual e às necessidades específicas dos seus projetos ao considerar o Kling 2.0.

Nota: Este artigo foi escrito com base no conteúdo do seguinte vídeo:

Postagens relacionadas

O Kling 2.0 revolucionou a indústria de vídeos com IA

Descubra como o Kling 2.0 está a revolucionar o setor dos vídeos de IA com as suas características e capacidades impressionantes.

Kling 2.0 - Ainda é o melhor gerador de IA ou foi destronado?

O Kling 2.0 ainda é o melhor gerador de vídeos de IA ou foi destronado? Explore a nossa análise detalhada da versão mais recente para descobrir as suas melhorias, pontos fortes e fracos.

O Kling 2.0 chegou: descubra as suas características

Descubra os avanços inovadores de IA do Kling 2.0 na geração de vídeos e imagens. Desde movimentos fluidos a ferramentas de edição poderosas, veja porque é que este é um modelo de vídeo revolucionário.

Kling 2.0: Comparação com o Kling 1.6

A Kling lançou recentemente o seu modelo de geração de vídeo Kling 2.0 AI. Aqui vamos mostrar o que o Kling 2.0 consegue criar e as diferenças entre as versões 1.6 e 2.0.