CEVIU Logo
CEVIU News

CEVIU News - CEVIU Dados - 19 de fevereiro de 2026

11 notícias19 de fevereiro de 2026CEVIU Dados
Compartilhar:

⚙️ CEVIU Dados

O API Agent da Agoda permite a transformação de qualquer API REST ou GraphQL interna em um endpoint MCP, sem necessidade de código ou deployments. Isso otimiza consultas orientadas por IA em sistemas heterogêneos. Com introspecção de esquema automatizada, DuckDB in-process para sumarização contextual limitada e suporte robusto para segurança e observability, as equipes podem conectar e consultar rapidamente múltiplas APIs a partir de um único servidor MCP, apenas atualizando configurações.

A linhagem de dados oferece às equipes um mapa claro, de ponta a ponta, de como os dados fluem e se transformam entre os sistemas, convertendo a depuração, a análise de impacto e a governança de meras suposições em processos rápidos e confiáveis. A linhagem automatizada e integrada reduz drasticamente o tempo de resolução de problemas, diminui os riscos de mudanças de esquema e é fundamental para análises confiáveis e IA em escala.

A Wix Engineering desenvolveu uma plataforma self-service Data-to-Production para preencher a lacuna entre seu data warehouse Apache Iceberg em escala de petabytes no S3 e os microsserviços em produção. ️ A plataforma é capaz de ingerir bilhões de linhas no ClickHouse por meio de pipelines dinâmicos e confiáveis, orquestrados por Airflow, utilizando estratégias como overwrites atômicos, upserts com ReplacingMergeTree e substituições de partição. A governança dos dados é assegurada por um console de metadados e revisões human-in-the-loop.

A Netflix desenvolveu um Framework de Pós-Treinamento interno para escalar o pós-treinamento de LLMs, abstraindo as complexidades de infraestrutura. Isso é alcançado através de pipelines de dados otimizados, que incluem on-the-fly sequence packing e document masking para lidar com distribuições enviesadas. O sistema também incorpora paralelismo avançado com FSDP e tensor parallelism, e utiliza workflows de orquestração baseados em Ray e Verl. A arquitetura integra PyTorch, vLLM e Hugging Face para garantir flexibilidade e suportar arquiteturas customizadas. ️

O Pinterest desenvolveu a funcionalidade Auto Memory Retries, que automaticamente retenta tarefas com falha por Out-of-Memory (OOM). O processo começa aumentando a alocação de CPU para reduzir a contenção e, subsequentemente, lança executors maiores com perfis de recursos escalados em 2x/3x/4x, ajustando memória, overhead e off-heap para jobs do Gluten. Essa abordagem resultou em uma redução de 96% nas falhas de OOM, com economia de custos de compute e diminuição significativa dos esforços de tuning manual em casos como data skew severo ou picos imprevisíveis de memória por tarefa. ️

A separação entre o Data Plane (objetos de dados brutos) e o Knowledge Plane (conceitos e relacionamentos semânticos) é essencial para arquiteturas de dados escaláveis, manteníveis e prontas para IA. O semantic linking (mapeamento explícito, em nível de metadados, entre dados e significado) possibilita reuso eficiente, definições unificadas e integração semântica robusta, superando as limitações de rótulos incorporados em nível de objeto. Manter planos distintos, mas conectados, otimiza a governança e previne silos semânticos à medida que os ambientes de dados escalam.

Uma interrupção de 10 horas no Azure em fevereiro de 2024, causada por uma política de armazenamento mal configurada, afetou operações de VMs e identidades gerenciadas em várias regiões. Isso paralisou pipelines de CI/CD e comprometeu significativamente a produtividade dos desenvolvedores. ️ As causas-raiz apontam para a crescente complexidade das plataformas, a inadequação da equipe operacional devido a cortes de custos e a insuficiência da resiliência arquitetural adotada pelas empresas.

A autorização de agentes de IA tem demandado cada vez mais o controle de acesso baseado em relacionamentos (ReBAC), em vez dos tradicionais policy engines. Isso ocorre porque as decisões de acesso dependem de relações dinâmicas e em tempo real entre usuários, agentes e dados. Enquanto policy engines como o AWS Cedar são eficazes em cenários estáticos e sem estado, eles lutam para escalar diante de contextos mutáveis e grafos de relacionamento complexos ️, resultando em schemas difíceis de gerenciar e falhas no controle de acesso. Sistemas como SpiceDB e Google Zanzibar, por outro lado, são projetados para representar e computar nativamente sobre esses relacionamentos. Isso permite permissões fluidas, granulares e escaláveis ️, adaptando-se eficientemente à medida que as entidades e os contextos de acesso mudam.

O MapTrace do Google gera e valida automaticamente milhões de imagens de mapas anotadas para treinar modelos multimodais em rastreamento de caminhos espaciais, utilizando Gemini e Imagen-4 para garantir precisão em nível de pixel. ️

O benchmark de 2026 da FloTorch revela que a fragmentação recursiva simples por caractere com 512 tokens superou, em pipelines de RAG, as estratégias complexas de chunking semântico e baseado em proposições. Este método mais direto não só alcançou a maior precisão, mas também resultou em contagens de vetores e custos de infraestrutura de 3 a 5 vezes menores.

Receba as melhores notícias de tech

Conteúdo curado diariamente, direto no seu e-mail.

Conteúdo curado diariamenteDiversas categoriasCancele quando quiser
CEVIU News - CEVIU Dados - 19 de fevereiro de 2026 — CEVIU News