NVIDIA Nemotron 3 Super: 120B parâmetros, apenas 12B ativos
Modelo open-weight da NVIDIA ativa apenas 12B de 120B parâmetros por token com arquitetura LatentMoE. Roda em workstations DGX Spark e GPUs RTX PRO, democratizando IA avançada.
A NVIDIA lançou o Nemotron 3 Super, um modelo open-weight de 120 bilhões de parâmetros que ativa apenas 12 bilhões por token graças à arquitetura híbrida Latent Mixture-of-Experts (LatentMoE). O resultado: desempenho de fronteira com custo de inferência de um modelo muito menor.
O impacto prático é enorme: o modelo roda em workstations DGX Spark e até em GPUs RTX PRO, colocando capacidade de raciocínio avançado ao alcance de empresas menores e desenvolvedores independentes. A democratização de modelos grandes via compressão inteligente pode ser a tendência mais transformadora de 2026.
Receba conteúdo direto no seu email
Escolha o que funciona melhor pra você.