Google anuncia Veo 2, nova inteligência artificial geradora de vídeos
A DeepMind do Google revelou o Veo 2, sua mais recente inteligência artificial capaz de criar vídeos, em um anúncio feito nesta segunda-feira (16). O novo modelo tem a capacidade de gerar clipes com mais de dois minutos de duração e alcançar resoluções de até 4K (4096x2160p).
O Veo 2 introduz uma “compreensão aprimorada” da física do mundo real, algo que era uma falha recorrente em modelos anteriores, e um melhor entendimento das nuances de movimentos e expressões humanas.
Aspectos únicos de cinematografia
De acordo com informações do Google, o Veo 2 é capaz de compreender aspectos únicos de cinematografia, como gêneros, lentes de câmera e efeitos cinematográficos. A empresa destaca a habilidade do Veo 2 em adicionar efeitos de câmeras de 18 mm, bem como capturar ângulos específicos.
Em termos teóricos, o Veo 2 pode gerar vídeos em resolução 4K com até 2 minutos de duração, o que o coloca como um modelo 4x superior em quantidade de pixels e com gerações até 6x mais longas do que a Sora, da OpenAI.
No entanto, essa vantagem é apenas teórica: o VideoFX, a ferramenta de testes onde o Veo 2 está disponível atualmente, é capaz de gerar vídeos em resolução 720p e de até 8 segundos de duração, enquanto a solução da OpenAI pode produzir clipes em Full HD com até 20 segundos.
Alucinações e foco em segurança
Apesar das melhorias, o Veo 2 ainda é suscetível a alucinações, conforme ressaltado pelo Google. A inteligência artificial pode falhar em detalhes, como gerar dedos extras e objetos inesperados, porém, a Gigante das Buscas afirma que o Veo 2 produz essas alucinações com menos frequência, resultando em vídeos mais realistas.
A segurança é um ponto de destaque para o Google, que está avaliando cuidadosamente a disponibilidade do Veo 2 para garantir a qualidade e confiabilidade da ferramenta.
O Veo 2 incorpora sua própria marca d’água, o SynthID, em cada resultado gerado. Esses marcadores são invisíveis, mas não são infalíveis.
Base de dados e integração
Um ponto não abordado no anúncio é a origem dos dados utilizados para treinar o modelo. Embora não esteja claro de onde o Google obteve os vídeos para alimentar o Veo 2, o YouTube é uma das possíveis fontes.
Eli Collins, vice-presidente de produto da DeepMind, mencionou que a IA é treinada utilizando pares de vídeos e descrições visuais.
As funcionalidades do Veo 2 serão integradas à ferramenta de geração de vídeo do Google Labs, VideoFX. A empresa informou que o programa foi expandido para um maior número de usuários.
Durante o período de testes, o uso da ferramenta é gratuito, porém é necessário se inscrever na fila de espera, o que pode ser feito no site oficial do VideoFX.
Já segue o macuxi nas redes sociais? Acompanhe todas as notícias em nosso Instagram, Twitter, Facebook, Telegram e também no Tiktok