HPE AI Factory com NVIDIA expande para a era de agentes
Aprofundamento CEVIU
Aprofundamento
A HPE AI Factory com NVIDIA está migrando do conceito para a produção de IA agentic, com foco em infraestrutura nativa para agentes, não só modelos. A CPU NVIDIA Vera é a primeira projetada exclusivamente para o loop de agentes: orquestração, chamadas de ferramentas e processamento em tempo real, com 88 núcleos Olympus e até 1,2 TB/s de largura de banda LPDDR5X. Ela entrega mais de 1,8x maior desempenho em sandbox para agentes que CPUs x86 tradicionais, segundo dados divulgados pela NVIDIA na HPE Discover 2026. O servidor HPE ProLiant Compute DL394 Gen12 com Vera estará disponível em 2027, integrado à HPE Private Cloud AI, solução turnkey coengenhada com a NVIDIA.
O NVIDIA Agent Toolkit já está disponível com essa plataforma e funciona como um sistema operacional para agentes: inclui os modelos abertos Nemotron, o runtime seguro OpenShell e os blueprints NemoClaw. Ele suporta protocolos críticos como Model Context Protocol (MCP) para integração de ferramentas e Agent-to-Agent (A2A) para sistemas multiagentes distribuídos. A NYSE é cliente pioneiro testando a Vera CPU com Redpanda e HPE, um sinal de adoção empresarial real em setores regulados.
Por que isso importa
Empresas brasileiras que já usam ou planejam usar agentes de IA em produção, como em atendimento automatizado com contexto persistente, análise de contratos com encadeamento de ferramentas ou governança de dados sensíveis, agora têm uma opção on-premises com garantia de segurança, observabilidade e conformidade. A extensão do NVIDIA Confidential Computing a toda a HPE AI Factory (incluindo HPE Sovereign AI Factory e HPE AI Factory at Scale) significa que dados e modelos proprietários ficam protegidos *durante a execução*, com atestado criptográfico e encriptação de memória. Isso responde diretamente à demanda de bancos, seguradoras e órgãos públicos por soberania de IA sem abrir mão de desempenho.
O HPE ProLiant Compute DL380a foi certificado no programa NVIDIA-Certified Systems for Confidential Computing, um requisito técnico concreto para implantações críticas. Já o suporte a InfiniBand Quantum-X800 (anunciado na GTC 2026) e a Ethernet Spectrum-X como padrão reforçam que essa fábrica de IA não é só para protótipos, mas para cargas pesadas de inferência contínua e treinamento de agentes com memória estendida.
Impacto para desenvolvedores
Desenvolvedores de IA no Brasil ganham um stack completo para construir agentes produtivos localmente: desde hardware otimizado (Vera CPU, HGX Rubin NVL8 com até 128 GPUs por rack) até camadas de software com governança embutida (OpenShell, NemoClaw, MCP). A disponibilidade do NVIDIA Agent Toolkit com HPE Private Cloud AI a partir de julho de 2026 permite testar fluxos reais, como cadastro de ferramentas, auditoria de decisões e rollback via HPE Zerto ao detectar comportamento anômalo. O HPE Data Fabric com suporte a MCP para Apache Airflow (previsto para outubro de 2026) facilita a orquestração de agentes dentro de pipelines existentes, sem refatoração completa.
Não há necessidade de adaptar modelos LLM genéricos: os Nemotron são modelos abertos otimizados para tarefas de agente (ex.: Nemotron-4-340B-Instruct), e o NemoClaw oferece templates prontos para casos como 'agente de compliance' ou 'agente de suporte técnico com acesso a KB'. Tudo isso rodando em infraestrutura certificada pela NVIDIA, sem surpresas de compatibilidade ou performance.
Perguntas frequentes
O que é a NVIDIA Vera CPU e por que ela é importante para agentes de IA?
A NVIDIA Vera CPU é a primeira CPU projetada especificamente para agentes de IA, com 88 núcleos Olympus e até 1,2 TB/s de largura de banda LPDDR5X. Ela prioriza baixa latência e determinismo no loop de agentes, chamadas de ferramentas, orquestração e processamento em tempo real. Segundo dados da NVIDIA, ela oferece mais de 1,8x maior desempenho em sandbox para agentes que CPUs x86 tradicionais.
Quando o NVIDIA Agent Toolkit estará disponível com a HPE Private Cloud AI?
O NVIDIA Agent Toolkit já está disponível com a HPE Private Cloud AI. A versão completa, com suporte a NemoClaw, OpenShell e integração MCP/A2A, entra em disponibilidade geral em julho de 2026. Funcionalidades avançadas como observabilidade de agentes e suporte a storage Alletra MP X10000 chegam no quarto trimestre de 2026.
O que é o NVIDIA Confidential Computing na HPE AI Factory com NVIDIA?
É uma camada de proteção que criptografa dados e modelos *durante a execução*, com atestado criptográfico e isolamento baseado em hardware. Está disponível em toda a HPE AI Factory, incluindo HPE Private Cloud AI, HPE Sovereign AI Factory e HPE AI Factory at Scale, e já tem certificação para servidores como o HPE ProLiant Compute DL380a.
Qual é a diferença entre HPE Private Cloud AI e HPE AI Factory at Scale?
A HPE Private Cloud AI é uma solução turnkey, pré-configurada e coengenhada com a NVIDIA para implantação rápida de IA em ambiente privado. Já a HPE AI Factory at Scale é voltada para grandes implantações com escalabilidade horizontal, suporte a InfiniBand Quantum-X800 e integração com supercomputação HPE Cray GX5000, ideal para cargas de treinamento massivo ou inferência de agentes em escala nacional.
Fontes
- blogs.nvidia.comfonte original
- Categoria
- CEVIU IA
- Publicado
- 16 de junho de 2026
- Editoria
- CEVIU IA
