Slack AI evolui arquitetura para multi-cloud para garantir resiliência e mitigar riscos
Aprofundamento CEVIU
Aprofundamento
O Slack AI não é um produto genérico de IA: é uma arquitetura Security-Driven, projetada desde 2023 para operar sob exigências de compliance (FedRamp Moderate), privacidade zero-knowledge e resiliência regional. A evolução até julho de 2026, com a integração do Vertex AI no GCP, fecha o ciclo de quatro fases técnicas reais, não teóricas: SageMaker (gestão manual de GPU), Bedrock Provisioned Throughput (estabilidade com over-provisioning), Bedrock On-Demand (agilidade com spillover automático) e agora multi-cloud com roteador inteligente próprio. Esse roteador não é um proxy genérico: ele abstrai APIs de AWS Bedrock e Google Vertex AI em tempo real, aplicando fallback hierárquico por modelo, métrica de latência (TTFT), taxa de throttling e feedback de usuário, tudo sem intervenção humana.
A segurança aqui não é só cifragem ou isolamento de VPC: é arquitetura defensiva. O escrow VPC usado inicialmente no SageMaker garantiu que pesos de modelos permanecessem inacessíveis ao provedor; hoje, o roteador multi-cloud mantém essa mesma barreira, mas distribuída, cada nuvem processa dados dentro de seus limites geográficos e contratuais, sem cruzamento de fronteiras regulatórias. Isso não é redundância por precaução: é exigência legal para clientes governamentais e financeiros que usam o Slack como Digital HQ.
O que mudou
A cobertura CEVIU de 29 de maio já detalhava as quatro fases e a previsão de expansão para o GCP até início de 2026. A novidade concreta de 2 de julho é que a integração com o Vertex AI saiu do estágio de piloto ou fallback e entrou em produção plena, com roteamento ativo, não apenas simbólico. Diferente do que foi reportado antes, agora há fallback *cross-cloud*: se um modelo Anthropic no Bedrock falhar na região us-east-1, o roteador não migra apenas para outro endpoint da AWS, pode redirecionar para um modelo equivalente no Vertex AI em us-central1, mantendo SLA de <500ms de TTFT. Isso só foi possível porque o Slack padronizou seu schema de requisição (prompt + metadata de contexto + política de consentimento) em um contrato interno chamado 'AI Gateway Interface', que precede qualquer integração com provedor.
Por que isso importa
Empresas que dependem de IA crítica, como bancos, órgãos públicos e provedores de saúde, não podem aceitar downtime de 5 minutos por mês. Um único incidente no Bedrock em abril de 2026 afetou 12% dos usuários corporativos do Slack AI por 18 minutos. Com a nova arquitetura multi-cloud, esse tipo de falha é contido regional e provedoramente: o roteador detectou a degradação em tempo real e desviou 97% do tráfego para endpoints Vertex AI em menos de 8 segundos. Isso não é só alta disponibilidade, é continuidade operacional certificável. Para equipes de segurança, isso significa que políticas de 'failover obrigatório' deixaram de ser checklist e viraram mecanismo executável, auditável e integrado ao SOC.
Linha do tempo
Início da fase 1: implantação do Slack AI no AWS SageMaker com escrow VPC e compliance FedRamp
Fase 2 concluída: migração para Amazon Bedrock com Provisioned Throughput e garantia de zero incidentes
Fase 3 ativada: adoção progressiva do Bedrock On-Demand com padrão de spillover e fallback hierárquico interno
Fase 4 em produção: integração ativa com Google Cloud Vertex AI via roteador multi-cloud próprio
Perguntas frequentes
O roteador multi-cloud do Slack AI é open source?
Não. O artigo-fonte não menciona disponibilização pública. É um componente interno, desenvolvido sob a filosofia Security-Driven, com foco em controle total sobre fluxo de dados, fallbacks e conformidade. Não há indícios de que será liberado como biblioteca ou serviço independente.
Quais modelos do Vertex AI estão em produção no Slack AI?
O artigo-fonte não lista modelos específicos. Informa apenas que o Slack usa o Vertex AI para 'acesso estratégico a modelos de ponta', com ênfase em tarefas de summarization e reasoning. A escolha é dinâmica: modelos são promovidos ou degradados com base em testes contínuos de qualidade e latência, não por contrato fixo.
Como o Slack garante que dados não vazem entre AWS e GCP nessa arquitetura?
Cada requisição é roteada com base em política de localização de dados definida no nível de workspace. Dados de clientes com restrições regionais (ex: UE ou Brasil) nunca saem da nuvem e região contratadas, o roteador só direciona para o Vertex AI se o workspace estiver autorizado a usar GCP. Não há cache compartilhado nem pipeline de dados cruzado entre provedores.
Essa arquitetura multi-cloud aumenta a complexidade de auditoria de segurança?
Reduz. Ao invés de auditar dezenas de endpoints customizados no SageMaker, agora o Slack audita dois contratos de API padronizados (Bedrock e Vertex AI) e um único roteador interno. Todos os logs de requisição, fallback e decisão de roteamento são centralizados em um data lake próprio, com rastreabilidade end-to-end, algo impossível na fase SageMaker.
Fontes
- slack.engineeringfonte original
- Categoria
- CEVIU Segurança da Informação
- Publicado
- 03 de julho de 2026
- Editoria
- CEVIU Segurança da Informação

