Google lança Gemini Omni: o modelo que transforma qualquer coisa em qualquer coisa

O Google apresentou o Gemini Omni, um modelo multimodal que aceita texto, imagem, áudio e vídeo como entrada — e devolve qualquer combinação dessas modalidades como saída. Em um teste hands-on do The Verge, o jornalista criou um deepfake de vídeo em tempo real com precisão surpreendente usando apenas uma instrução de texto. O modelo já está disponível para usuários selecionados, com expansão sendo rollada ao longo das próximas semanas.

O que distingue o Omni dos modelos anteriores é a integração nativa entre modalidades — sem precisar encadear APIs separadas para texto → imagem → vídeo. Para times de marketing, design e produção de conteúdo, isso representa uma simplificação real de workflow: uma única instrução pode gerar um vídeo completo com narração, legendas e efeitos visuais.

Por que importa: o profissional brasileiro que hoje usa três ou quatro ferramentas separadas para produção de conteúdo pode, em breve, consolidar tudo em um único modelo. Vale acompanhar de perto o pricing e a disponibilidade no Brasil — o Gemini está se tornando a plataforma de produtividade mais abrangente do mercado.

Google lança Gemini Omni: o modelo que transforma qualquer coisa em qualquer coisa

Receba conteúdo direto no seu email

Notícias de Hoje

Deep Dive Semanal