Classificação de texto com o módulo zstd do Python 3.14
O futuro módulo Zstd da biblioteca padrão do Python 3.14 permite compressão rápida e incremental, tornando prática a classificação de texto baseada em compressão. Essa abordagem classifica documentos com base em qual compressor específico de classe produz a menor saída. Este método simples e sem gradiente atinge aproximadamente 91% de acurácia no conjunto de dados '20 Newsgroups' em menos de 2 segundos. O desempenho rivaliza com 'TF-IDF' combinado com regressão logística, sendo consideravelmente mais simples e rápido para treinar incrementalmente.
Avalie este artigo:
Compartilhar:
- Categoria
- CEVIU Dados
- Publicado
- 12 de fevereiro de 2026
- Fonte
- CEVIU Dados
