Como o Discord Automatiza Clusters ScyllaDB em Escala
A equipe de Infraestrutura de Persistência do Discord desenvolveu o Scylla Control Plane (SCP), um framework de automação que reduziu o tempo para configurar um cluster de banco de dados de réplica de produção completo de 36 horas de trabalho manual para menos de 2 horas de operação majoritariamente autônoma. A ferramenta utiliza um sistema em camadas de tarefas, workflows e jobs, escrito em Rust com configuração YAML, para automatizar operações complexas de banco de dados em centenas de nós ScyllaDB. Isso inclui retentativas automáticas, rastreamento de estado via SQLite e tratamento inteligente de erros que distingue entre problemas recuperáveis e falhas críticas que exigem intervenção humana.
- Categoria
- CEVIU DevOps
- Publicado
- 11 de maio de 2026
- Fonte
- CEVIU DevOps
