CEVIU News

CEVIU News - CEVIU DevOps - 30 de abril de 2026

10 notícias30 de abril de 2026CEVIU DevOps
Compartilhar:

📉 CEVIU DevOps

O GitHub afirma que as recentes interrupções foram causadas pelo rápido crescimento no desenvolvimento orientado por IA, o que levou a plataforma além de seus limites atuais de escalabilidade. A empresa está priorizando a confiabilidade ao expandir a capacidade, isolar sistemas críticos e reduzir pontos únicos de falha para lidar com o aumento.

Agentes de IA automatizam tarefas de desenvolvimento e negócios, mas introduzem novos riscos como prompt injection, escalonamento de privilégios e falhas em cascata que expandem as superfícies de ataque, gerando preocupação do NIST. A mitigação eficaz exige controles em camadas que abranjam o design do modelo, as permissões do sistema e a supervisão humana para garantir uma implantação segura.

A DigitalOcean anunciou a general availability do DeepSeek V3.2, MiniMax-M2.5 e Qwen 3.5 397B em sua plataforma Serverless Inference. A plataforma alcançou as velocidades de output mais rápidas entre todos os provedores testados, com o DeepSeek V3.2 entregando 230 tokens por segundo e tempo para o primeiro token em menos de 1 segundo para 10.000 tokens de input. Esse desempenho notável foi obtido com o uso de GPUs NVIDIA HGX B300, que contam com 288GB de memória. As otimizações incluíram a aplicação da quantization NVFP4, que resultou em uma redução de 1.8x na pegada de memória, e ajustes customizados ao framework de serving vLLM, realizados em colaboração com a Inferact.

O Kubernetes v1.36 promoveu para beta a capacidade de modificar requisições de CPU, memória, GPU e outros recursos em templates de pod de Jobs suspensos. Essa funcionalidade elimina a necessidade de deletar e recriar Jobs quando os requisitos de recursos mudam. Habilitada por padrão, ela permite que controladores de fila e administradores ajustem os recursos antes que os Jobs comecem a ser executados, sendo particularmente útil para workloads de batch e machine learning, onde a alocação ideal depende das condições atuais do cluster.

Este post descreve a experiência de IA SRE em evolução da incident.io, que automatiza a investigação, o debugging e a resolução de incidentes em um workflow unificado. Isso reduz a troca de contexto ao integrar Slack, ferramentas de codificação e atualizações, possibilitando diagnóstico rápido, correções e relatórios com esforço manual mínimo.

O GitHub mitiga dependências circulares de deployment, onde interrupções podem bloquear sua própria recuperação, ao usar eBPF para monitorar e restringir o acesso à rede de scripts de deployment e detectar dependências ocultas, diretas e transitórias. Isso permite controle por processo, interceptação de DNS e auditoria em tempo real de chamadas arriscadas, como o uso da API do GitHub durante a recuperação de incidentes.

Este artigo demonstra como construir uma plataforma Kubernetes multi-cluster escalável no OpenStack, utilizando k0s, k0rdent e Hosted Control Planes (HCP). Essa abordagem elimina a necessidade de control planes dedicados de 3 nós por cluster, centralizando-os em um único cluster de gerenciamento. A arquitetura proposta transforma a gestão de clusters individuais em um sistema declarativo que orquestra o provisionamento, a escalabilidade e os upgrades em frotas inteiras, resultando em uma significativa redução nos custos de infraestrutura e na complexidade operacional.

Mitchell Hashimoto, cofundador da HashiCorp, anunciou a mudança do projeto Ghostty para fora do GitHub após 18 anos de profundo apego pessoal e profissional, citando crescente frustração e decepção com a plataforma.

Receba as melhores notícias de tech

Conteúdo curado diariamente, direto no seu e-mail.

Conteúdo curado diariamenteDiversas categoriasCancele quando quiser