Voltar

Raro, Não Aleatório: Usando Eficiência de Tokens para Varredura de Segredos

Tradicionalmente, o Gitleaks construiu seu scanner de segredos utilizando uma combinação de regexes, entropia e filtros baseados em regras. Esta publicação detalha como a equipe adaptou o scanner para empregar a eficiência de tokens — uma técnica que avalia a frequência com que um texto surge nos dados de treinamento de um modelo, dividindo-o em tokens — em vez da entropia, visando impulsionar o desempenho. Com este método e alguns ajustes adicionais, o autor desenvolveu uma ferramenta chamada BetterLeaks, que supera outros scanners, como o CredSweeper, na detecção de segredos no dataset CredData.

Avalie este artigo:
Compartilhar:
Categoria
CEVIU Segurança da Informação
Publicado
05 de março de 2026
Fonte
CEVIU Segurança da Informação

Quer receber mais sobre CEVIU Segurança da Informação?

Conteúdo curado diariamente, direto no seu e-mail.

Conteúdo curado diariamenteDiversas categoriasCancele quando quiser
Raro, Não Aleatório: Usando Eficiência de Tokens para Varredura de Segredos — CEVIU News