CEVIU News

CEVIU News - CEVIU Dados - 25 de maio de 2026

12 notícias25 de maio de 2026CEVIU Dados
Compartilhar:

🛠️ CEVIU Dados

Grafos RDF/OWL são mais adequados para dados governados e interoperáveis, oferecendo significado formal, raciocínio, proveniência e publicação de linked-data. Por outro lado, labeled property graphs são superiores para travessia rápida, propriedades ricas de arestas e análises de grafos amigáveis ao desenvolvedor, embora o RDF 1.2 esteja diminuindo essa diferença com anotações de statement nativas.

O LinkedIn enfrentou um incidente de produção onde seu serviço FishDB, baseado em Rust, congelava completamente por 10-15 segundos, violando os SLOs de disponibilidade. A causa raiz foi o redimensionamento de um HashMap da biblioteca padrão em exatamente 58.720.256 chaves, o que disparou uma alocação massiva de memória via mmap. Isso adquiriu o mmap_lock em modo de escrita, bloqueando todas as outras threads em chamadas madvise e page faults, congelando todo o runtime assíncrono.

A IA já é robusta o suficiente para lidar com grande parte da engenharia de dados, especialmente com fluxos de trabalho declarativos e fortes "quality gates". Para gerenciar o não determinismo dos LLMs, deve-se usar o “plan mode”, redefinições de contexto frequentes e testes externos. Formatos como o Substrait podem ser mais adequados que o SQL para agentes expressarem transformações, pois comunicam operações físicas. O papel de engenheiro de dados pode se integrar a uma função de "dados" mais ampla, à medida que a ergonomia dos agentes se torna mais relevante que a humana.

Apesar de ser rotulado como um lançamento de correção (patch release), o DuckDB v1.5.3 introduz funcionalidades importantes via extensões. Destacam-se o Quack como uma extensão central em beta, o suporte do DuckLake para Quack, e novas capacidades para AWS, proxy HTTPS e Iceberg. O lançamento também inclui correções internas de empacotamento e segurança, com a expectativa de que o Quack atinja a estabilidade para produção junto com o DuckDB v2.0, previsto para o segundo semestre de 2026.

O pg_infer é uma extensão para PostgreSQL 18+ que torna os componentes internos dos modelos transformer consultáveis em SQL. Isso permite que a inference do modelo seja precificada, paralelizada, combinada e filtrada como qualquer outra operação de banco de dados. Ele opera eficientemente em CPU, suporta modelos BitNet e pode descarregar a inference para réplicas ou hosts de recuperação de desastres.

Para desafiar a alegação comum de que a JVM impõe uma penalidade significativa de performance em cargas de trabalho analíticas, kernels aritméticos vetorizados simples, executados diretamente sobre buffers Apache Arrow em Java puro, foram comparados com o arrow-rs nativo. Os resultados demonstraram performance comparável, provando que, com o mesmo layout de memória colunar e hardware, uma JVM “aquecida” não impõe nenhum “imposto” misterioso em kernels de compute brutos.

Receba as melhores notícias de tech

Conteúdo curado diariamente, direto no seu e-mail.

Conteúdo curado diariamenteDiversas categoriasCancele quando quiser