A Google acabou de apresentar o seu mais recente modelo de geração de vídeo, Veo 3.1, que foi construído sobre o Veo 3 original.
O Veo 3.1 não só garante uma melhor aderência aos prompts, assegurando que a sua visão ganha vida com maior precisão, como também oferece uma saída de áudio nativa mais rica, combinando som e movimento de forma mais natural do que antes.
Introduziu também três novas funcionalidades principais, incluindo:
- Ingredientes para Vídeo: Gere um vídeo completo a partir de imagens de referência, fixando o estilo do personagem e da cena.
- Quadro a Quadro para Vídeo: Crie transições suaves e naturais fornecendo o primeiro e o último quadro de uma cena.
- Estender Vídeo: Transforme clipes curtos em vídeos mais longos, estendendo a ação por um minuto ou mais.
Uma ferramenta de remoção com um clique também está a caminho, que apagará objetos indesejados e reconstruirá o fundo para um acabamento limpo.
O Veo 3.1 da Google já está disponível no gerador de vídeo Pollo AI, oferecendo aos criadores acesso a capacidades de geração de vídeo melhoradas.
Realizei uma série de testes focados em quatro atualizações principais: saída de áudio nativa melhorada, Ingredientes para Vídeo e Quadro a Quadro para Vídeo. Eis o que descobri — spoiler: o Veo 3.1 muda o jogo.
Colocando o Veo 3.1 à Prova
- Geração de Áudio Nativa
Prompt: "Um plano aproximado de uma frigideira de ferro fundido a chiar numa cozinha de restaurante movimentada. Um chef vira um bife, e ouve-se o burburinho de outros cozinheiros e o barulho de panelas e frigideiras ao fundo."
Resultado: O resultado foi impressionante. O som principal — o chiar agudo e crepitante do bife — era nítido e em primeiro plano. No entanto, apesar de ter sido explicitamente solicitado no prompt, o distinto "burburinho de outros cozinheiros" esteve ausente. Isto fez com que o fundo parecesse menos "movimentado" do que o esperado, faltando um elemento humano chave que teria tornado o áudio verdadeiramente rico e com camadas.
- Quadro a Quadro para Vídeo
Prompt: Usando o primeiro e o último quadro como marcadores, crie um vídeo de transição suave de 10 segundos onde um casal entra no café, senta-se, pede café e começa a conversar animadamente enquanto a noite cai.
| Imagem do Quadro Inicial e Final | Vídeo de Saída |
![]() ![]() |
Resultado: Embora os personagens e a cena se tenham mantido visualmente consistentes, e os quadros inicial e final tenham sido usados como marcadores, o vídeo não conseguiu criar uma transição suave. Ações como pedir foram abruptas (por exemplo, as canecas de café apareceram subitamente), e houve uma falta significativa de continuidade para o quadro final.
- Ingredientes para Vídeo
Prompt: Um feiticeiro barbudo em vestes roxas, numa biblioteca de pedra iluminada por velas, está a ler um tomo antigo, de repente levanta o olhar surpreendido, depois lança um feitiço que faz os livros flutuarem à sua volta.
| Imagens de Referência | Vídeo de Saída |
![]() ![]() |
Resultado: Embora o cenário e o ambiente geral tenham sido mantidos de forma excelente — com uma biblioteca de pedra iluminada por velas ricamente detalhada e uma iluminação atmosférica — a aparência do feiticeiro não correspondeu totalmente à imagem de referência.
As suas características faciais e estilo de barba diferiram notavelmente, sugerindo uma fidelidade limitada na transferência de personagens.
Apesar da incompatibilidade inicial, o modelo demonstra excelente coerência temporal e aderência à cena, entregando uma sequência cinematográfica e imersiva que se alinha bem com a ação descrita.
Veredito Final
O Veo 3.1 demonstra fortes capacidades na renderização de personagens e cenas consistentes, mantendo com sucesso a integridade visual entre os quadros e os marcadores especificados.
Funciona bem com ações e objetos primários, e pode gerar efeitos de áudio primários claros. No entanto, o modelo exibe fraquezas significativas na geração de conteúdo de vídeo dinâmico e matizado. Luta com:
- Transições Suaves e Continuidade: Ações complexas e multi-etapa frequentemente parecem abruptas (por exemplo, objetos a aparecerem subitamente), e as transições carecem de continuidade, levando a sequências desconexas, particularmente em direção aos quadros finais.
- Nuance Emocional: As expressões e o tom dos personagens podem ser inconsistentes ou carecer da profundidade emocional especificada (por exemplo, um olhar "surpreendido" que parece leve, ou um casal a "rir" sem animação).
- Animação de Objetos Complexos: Interações que envolvem múltiplos objetos (como livros a flutuar) podem parecer rígidas, mecânicas, ou os objetos podem "surgir" em vez de se moverem organicamente.
- Áudio em Camadas: Embora os sons primários sejam bons, a geração de elementos de áudio secundários ou de fundo distintos, mesmo quando explicitamente solicitados, continua a ser um desafio, afetando a riqueza da paisagem sonora.
Porque Usar o Veo 3.1 no Pollo AI?
O Pollo AI reúne o melhor da geração de vídeo por IA — tudo sob o mesmo teto. Pense nisso como o seu centro de controlo criativo, onde o poder encontra a flexibilidade.
Não está limitado a um único modo como o Veo 3.1. No Pollo AI, pode alternar entre motores de ponta como Sora 2, Veo 3, Kling 2.5 Turbo, Wan 2.5, Seedance, e outros — a qualquer momento.
Isto significa que, se adora o realismo e a profundidade narrativa do Veo 3.1 (que, aliás, é incrível), pode usá-lo exatamente quando se adequa — depois, mude para outro modelo para velocidade, estilo ou detalhe. Sem limites. Sem compromissos.
Além disso, possui todas as funcionalidades chave de geração de vídeo por IA:
- Dê vida a fotos com a nossa IA de imagem para vídeo.
- Transforme guiões em visuais deslumbrantes com IA de texto para vídeo.
- Crie clipes envolventes com o gerador de vídeo com avatares de IA.
- Crie clipes relaxantes, de animais ou estilo anime com o gerador de vídeos curtos de IA.
- Imite qualquer movimento do vídeo de referência com o Pollo Mimic.
Experimente o Pollo AI hoje mesmo, e desbloqueie todo o potencial da criação de vídeo impulsionada por IA.



