Google lança Gemini Omni: o modelo que transforma qualquer coisa em qualquer coisa
O Google apresentou o Gemini Omni, um modelo multimodal que aceita texto, imagem, áudio e vídeo como entrada — e devolve qualquer combinação dessas modalidades como saída. Em um teste hands-on do The Verge, o jornalista criou um deepfake de vídeo em tempo real com precisão surpreendente usando apenas uma instrução de texto. O modelo já está disponível para usuários selecionados, com expansão sendo rollada ao longo das próximas semanas.
O que distingue o Omni dos modelos anteriores é a integração nativa entre modalidades — sem precisar encadear APIs separadas para texto → imagem → vídeo. Para times de marketing, design e produção de conteúdo, isso representa uma simplificação real de workflow: uma única instrução pode gerar um vídeo completo com narração, legendas e efeitos visuais.
Por que importa: o profissional brasileiro que hoje usa três ou quatro ferramentas separadas para produção de conteúdo pode, em breve, consolidar tudo em um único modelo. Vale acompanhar de perto o pricing e a disponibilidade no Brasil — o Gemini está se tornando a plataforma de produtividade mais abrangente do mercado.
Este destaque faz parte da newsletter Limiar #59 — Gemini Omni, a corrida de IPOs e a IA que recria vozes de pilotos mortos
Receba conteúdo direto no seu email
Escolha o que funciona melhor pra você.