NVIDIA Nemotron 3 Super: 120B parâmetros, apenas 12B ativos

A NVIDIA lançou o Nemotron 3 Super, um modelo open-weight de 120 bilhões de parâmetros que ativa apenas 12 bilhões por token graças à arquitetura híbrida Latent Mixture-of-Experts (LatentMoE). O resultado: desempenho de fronteira com custo de inferência de um modelo muito menor.

O impacto prático é enorme: o modelo roda em workstations DGX Spark e até em GPUs RTX PRO, colocando capacidade de raciocínio avançado ao alcance de empresas menores e desenvolvedores independentes. A democratização de modelos grandes via compressão inteligente pode ser a tendência mais transformadora de 2026.

NVIDIA Nemotron 3 Super: 120B parâmetros, apenas 12B ativos

Receba conteúdo direto no seu email

Notícias de Hoje

Deep Dive Semanal