🕵️♀️CEVIU DevOps
Autodiagnóstico de Alertas Kubernetes com HolmesGPT e Ferramentas da CNCF
Uma equipe SRE de duas pessoas no STCLab conseguiu reduzir o tempo de investigação de alertas de 15-20 minutos para menos de 2 minutos. Isso foi alcançado com a implantação do HolmesGPT, utilizando runbooks personalizados que diminuíram as chamadas de ferramentas desnecessárias de 16 para apenas 2 por investigação.
A equipe observou que runbooks em markdown, especificando quais ferramentas ignorar por namespace, foram mais cruciais do que a seleção do modelo. O mesmo modelo alcançou uma pontuação de 4,6 de 5 com o uso dos runbooks, em contraste com 3,6 sem eles. Atualmente, o sistema processa cerca de 12 investigações diárias únicas, com um custo mensal aproximado de US$ 12.
Avalie este artigo:
Compartilhar:
- Categoria
- CEVIU DevOps
- Publicado
- 22 de abril de 2026
- Fonte
- CEVIU DevOps
