Como construímos o Inference Router da DigitalOcean
O Inference Router é uma ferramenta da DigitalOcean a nível de infraestrutura que roteia automaticamente requisições de IA para o modelo mais apropriado com base nos requisitos da tarefa. Isso ajuda desenvolvedores a cortar custos, evitando o uso desnecessário de caros frontier models para tarefas simples. O sistema é baseado no Plano, um proxy de IA de código aberto que utiliza um modelo de roteamento Mixture-of-Experts de 30B, superando o GPT-5.1 e o Claude Sonnet 4.5 em precisão de roteamento, enquanto resolve a intenção em aproximadamente 200ms.
Avalie este artigo:
Compartilhar:
- Categoria
- CEVIU DevOps
- Publicado
- 22 de maio de 2026
- Fonte
- CEVIU DevOps
