Fujitsu One Compression: Biblioteca de Quantização de Modelos
O Fujitsu One Compression (OneComp) é uma biblioteca de Python de código aberto voltada para a quantização pós-treinamento de grandes modelos de linguagem. Ela implementa algoritmos de quantização de última geração, como GPTQ e DBF. A OneComp foi verificada em modelos como TinyLlama, Llama-2, Llama-3 e Qwen3-0.6B ~ 32B. Outros modelos compatíveis com Hugging Face podem funcionar, mas ainda não foram testados.
Avalie este artigo:
Compartilhar:
- Categoria
- CEVIU IA
- Publicado
- 04 de abril de 2026
- Fonte
- CEVIU IA
