PrismML lança Bonsai: modelo 1-bit que comprime 8B parâmetros em 1,15 GB
4 de abril de 2026
Modelos de IAEdge ComputingOpen Source
Startup do Caltech lança primeiro modelo de linguagem 1-bit comercialmente viável. Bonsai 8B é 14x menor que equivalentes em FP16 e roda a 44 tokens/s no iPhone.
A startup PrismML, nascida do Caltech, saiu do stealth com o primeiro modelo de linguagem 1-bit comercialmente viável. O Bonsai 8B representa cada peso apenas pelo seu sinal ({−1, +1}), reduzindo o modelo para 1,15 GB — 14 vezes menor que equivalentes em FP16 — enquanto mantém performance competitiva. No iPhone 17 Pro Max, roda a 44 tokens por segundo. Os modelos são open source sob Apache 2.0.
Receba conteúdo direto no seu email
Escolha o que funciona melhor pra você.