Poolside lança Laguna XS 2.1: Modelo focado em agentes autônomos e codificação complexa
Aprofundamento CEVIU
Aprofundamento
O Laguna XS 2.1 não é só uma atualização incremental: é o primeiro modelo da Poolside com suporte nativo a speculator models DFlash, técnica que acelera inferência local ao prever tokens antes do modelo principal, dobrando a taxa de tokens por segundo (tok/s) em testes internos. Isso muda o jogo para agentes locais como o pool, que depende de baixa latência e execução contínua em terminal. O modelo mantém a mesma arquitetura MoE do XS.2 (33B totais, 3B ativos por token), mas a melhoria de 5,4 pontos no SWE-bench Multilingual mostra ganho real em compreensão de código multilíngue, algo crítico para equipes globais que usam bibliotecas em Python, Rust e TypeScript sem tradução manual.
A licença OpenMDW-1.1 é um movimento estratégico: ela substitui a anterior (não especificada no artigo-fonte) e alinha a Poolside à iniciativa da NVIDIA e Linux Foundation, reduzindo ambiguidades legais em implantações comerciais. Diferente do GLM-5.1 artigo original ou do North Mini Code da Cohere, o XS 2.1 prioriza eficiência local sobre escala bruta, ele roda com INT4 em GPUs de 8 GB VRAM, enquanto o GLM-5.1 exige infraestrutura de data center.
O que mudou
O Laguna XS 2.1 substitui o XS.2 em 7 dias, o antigo modelo será retirado da API da Poolside, embora permaneça disponível na biblioteca da Baseten. A mudança mais concreta está nos checkpoints: agora há três versões quantizadas (FP8, INT4, NVFP4), além de modelos DFlash especuladores abertos, algo inédito na versão 2.0. Também houve ajuste metodológico: todos os benchmarks foram rodados com o Harbor Framework da Laude Institute, com sandboxing rigoroso e verificação pós-hoc contra reward hacking, um nível de transparência técnico ausente na cobertura anterior do CEVIU sobre o XS.2.
Por que isso importa
Agentes autônomos de codificação deixaram de ser experimentos acadêmicos. Com o XS 2.1, desenvolvedores podem rodar um agente capaz de resolver tarefas do SWE-bench Multilingual (63,1%) diretamente no terminal via pool, sem depender de APIs externas ou nuvem. Isso reduz custos operacionais, aumenta privacidade de código-fonte e permite integração nativa com ferramentas locais, Git, Make, Docker, sem orquestração adicional. Para times que já usam JetBrains Mellum 2 ou o North Mini Code, o XS 2.1 oferece um ponto intermediário: menor que o GLM-5.1 em escala, mas mais eficiente que o M.1 em uso cotidiano de longo prazo.
Repositório oficial: poolsideai/pool
Linha do tempo
Lançamento do GLM-5, modelo de 754B parâmetros com licença MIT
MiniMax lança o modelo M2.7 para fluxos de trabalho agênticos
Z.ai lança o GLM-5.1, focado em tarefas de longo prazo em engenharia agentic
CEVIU analisa Laguna XS.2 e Laguna M.1 como modelos baseados em agentes
JetBrains lança Mellum 2, modelo MoE de 12B parâmetros para programação
Cohere lança North Mini Code, modelo MoE de 30B com licença Apache 2.0
Poolside lança Laguna XS 2.1 com DFlash speculators, licença OpenMDW-1.1 e suporte a quantização avançada
Perguntas frequentes
O Laguna XS 2.1 substitui o XS.2 completamente?
Sim, mas só na API da Poolside: o XS.2 será desativado em 7 dias. Ele continua disponível na Baseten Model Library para implantações dedicadas. Localmente, ambos rodam, mas o XS 2.1 traz otimizações reais em velocidade e precisão.
Posso usar o XS 2.1 com o agente pool hoje?
Sim. O agente pool foi projetado para esse modelo. A instalação é feita via script bash ou pwsh, e ele funciona diretamente em qualquer projeto com suporte a ACP (Agent Client Protocol). A documentação oficial está no repositório [[LINK:official_repository|pool no GitHub]].
Qual a diferença entre OpenMDW-1.1 e Apache 2.0?
A OpenMDW-1.1 é específica para modelos de IA e artefatos associados, ela esclarece direitos sobre treinamento, fine-tuning e implantação comercial, algo que a Apache 2.0 não aborda com profundidade. É mais permissiva que a Llama 3 License, mas menos genérica que a MIT.
O XS 2.1 é compatível com meu Mac com M2?
Sim, desde que use os checkpoints GGUF (em breve) ou llama.cpp com quantização INT4. Os testes oficiais incluem execução em hardware com restrições de VRAM, e o modelo foi validado em ambientes com 8 GB RAM/2 CPUs, padrão acessível em laptops modernos.
Fontes
- poolside.aifonte original
- Categoria
- CEVIU IA
- Publicado
- 03 de julho de 2026
- Editoria
- CEVIU IA

