Voltar

Como construímos o Inference Router da DigitalOcean

O Inference Router é uma ferramenta da DigitalOcean a nível de infraestrutura que roteia automaticamente requisições de IA para o modelo mais apropriado com base nos requisitos da tarefa. Isso ajuda desenvolvedores a cortar custos, evitando o uso desnecessário de caros frontier models para tarefas simples. O sistema é baseado no Plano, um proxy de IA de código aberto que utiliza um modelo de roteamento Mixture-of-Experts de 30B, superando o GPT-5.1 e o Claude Sonnet 4.5 em precisão de roteamento, enquanto resolve a intenção em aproximadamente 200ms.

Avalie este artigo:
Compartilhar:
Categoria
CEVIU DevOps
Publicado
22 de maio de 2026
Fonte
CEVIU DevOps

Quer receber mais sobre CEVIU DevOps?

Conteúdo curado diariamente, direto no seu e-mail.

Conteúdo curado diariamenteDiversas categoriasCancele quando quiser