Comprimindo vetores de IA para 2 a 4 bits por número sem perda de precisão
O TurboQuant comprime cada coordenada em grandes tabelas de vetores de alta dimensão para 2 a 4 bits, com uma distorção comprovadamente quase ótima, sem overhead de memória para fatores de escala e sem necessidade de treinamento ou calibração. Ele é entre quatro e seis ordens de magnitude mais rápido que as alternativas na indexação de 4 bits, apresentando também um recall superior. Esta página explica como o TurboQuant funciona.
Avalie este artigo:
Compartilhar:
- Categoria
- CEVIU IA
- Publicado
- 28 de abril de 2026
- Fonte
- CEVIU IA
