CEVIU News - CEVIU Dados - 25 de maio de 2026

12 notícias25 de maio de 2026CEVIU Dados

🛠️ CEVIU Dados

25 de mai. de 2026

🛠

De Martelos e Pregos: O que a IA Pode e Não Pode Fazer por um Analista de Dados

A IA auxilia analistas de dados na escrita de código, preparação de dados e elaboração de análises de forma mais rápida, mas ainda é muito inconsistente para respostas ad hoc confiáveis. Uma boa análise ainda requer dados limpos, contexto, julgamento e conhecimento humano.

Ler mais Original

CEVIU Dados

25 de mai. de 2026

🕸

A Escolha do Grafo Certo para o seu Projeto

Grafos RDF/OWL são mais adequados para dados governados e interoperáveis, oferecendo significado formal, raciocínio, proveniência e publicação de linked-data. Por outro lado, labeled property graphs são superiores para travessia rápida, propriedades ricas de arestas e análises de grafos amigáveis ao desenvolvedor, embora o RDF 1.2 esteja diminuindo essa diferença com anotações de statement nativas.

Ler mais Original

CEVIU Dados

25 de mai. de 2026

🧊

O Congelamento de 58 Milhões de Chaves: O Que um Redimensionamento de HashMap Ensinou Sobre Alocação de Memória em Escala

O LinkedIn enfrentou um incidente de produção onde seu serviço FishDB, baseado em Rust, congelava completamente por 10-15 segundos, violando os SLOs de disponibilidade. A causa raiz foi o redimensionamento de um HashMap da biblioteca padrão em exatamente 58.720.256 chaves, o que disparou uma alocação massiva de memória via mmap. Isso adquiriu o mmap_lock em modo de escrita, bloqueando todas as outras threads em chamadas madvise e page faults, congelando todo o runtime assíncrono.

Ler mais Original

CEVIU Dados

25 de mai. de 2026

⚙

A evolução Hugo: Engenharia da plataforma unificada de ingestão de dados one-click da Grab com Apache Flink

A Grab unificou sua ingestão de dados self-service em um workflow automatizado baseado em Flink, abrangendo CDC de RDS e pipelines Kafka. A nova plataforma reduz o tempo de integração de dias para minutos, mitiga problemas de esquema e governança precocemente, e diminui o overhead operacional.

Ler mais Original

CEVIU Dados

25 de mai. de 2026

🦆

Modo Plano o Tempo Todo, Substrait sobre SQL e o Fim do Papel de Engenheiro de Dados

A IA já é robusta o suficiente para lidar com grande parte da engenharia de dados, especialmente com fluxos de trabalho declarativos e fortes "quality gates". Para gerenciar o não determinismo dos LLMs, deve-se usar o “plan mode”, redefinições de contexto frequentes e testes externos. Formatos como o Substrait podem ser mais adequados que o SQL para agentes expressarem transformações, pois comunicam operações físicas. O papel de engenheiro de dados pode se integrar a uma função de "dados" mais ampla, à medida que a ergonomia dos agentes se torna mais relevante que a humana.

Ler mais Original

CEVIU Dados

25 de mai. de 2026

🦆

DuckDB 1.5.3: Muito Além de um Lançamento de Correção

Apesar de ser rotulado como um lançamento de correção (patch release), o DuckDB v1.5.3 introduz funcionalidades importantes via extensões. Destacam-se o Quack como uma extensão central em beta, o suporte do DuckLake para Quack, e novas capacidades para AWS, proxy HTTPS e Iceberg. O lançamento também inclui correções internas de empacotamento e segurança, com a expectativa de que o Quack atinja a estabilidade para produção junto com o DuckDB v2.0, previsto para o segundo semestre de 2026.

Ler mais Original

CEVIU Dados

25 de mai. de 2026

📈

Apresentando Dimster, uma ferramenta de benchmarking de performance para Apache Kafka

Dimster é uma ferramenta de benchmarking open-source para Kafka, projetada para simplificar testes de performance em diversas cargas de trabalho e configurações. A ferramenta suporta testes de throughput, taxa de pico, escoamento de backlog e correção, apresentando os resultados em gráficos e dashboards Grafana.

Ler mais Original

CEVIU Dados

25 de mai. de 2026

💾

Pg_infer 1.0.0 lançado – conhecimento de modelos transformer como relações SQL

O pg_infer é uma extensão para PostgreSQL 18+ que torna os componentes internos dos modelos transformer consultáveis em SQL. Isso permite que a inference do modelo seja precificada, paralelizada, combinada e filtrada como qualquer outra operação de banco de dados. Ele opera eficientemente em CPU, suporta modelos BitNet e pode descarregar a inference para réplicas ou hosts de recuperação de desastres.

Ler mais Original

CEVIU Dados

25 de mai. de 2026

☕

Mesmos buffers, mesmas instruções, mesmo hardware. Onde está o “imposto” da JVM?

Para desafiar a alegação comum de que a JVM impõe uma penalidade significativa de performance em cargas de trabalho analíticas, kernels aritméticos vetorizados simples, executados diretamente sobre buffers Apache Arrow em Java puro, foram comparados com o arrow-rs nativo. Os resultados demonstraram performance comparável, provando que, com o mesmo layout de memória colunar e hardware, uma JVM “aquecida” não impõe nenhum “imposto” misterioso em kernels de compute brutos.

Ler mais Original

CEVIU Dados

25 de mai. de 2026

7 Pontos Cegos Temporais que Comprometem Sistemas RAG Empresariais

Sistemas RAG (Retrieval Augmented Generation) em ambientes empresariais frequentemente falham por negligenciarem a dimensão do tempo.

Ler mais Original

CEVIU Dados

25 de mai. de 2026

📈

Cloud Native Computing Foundation anuncia graduação do OpenTelemetry, solidificando seu status como padrão de observability de fato

OpenTelemetry alcança o status de projeto graduado na CNCF, indicando sua maturidade para uso em produção como um padrão agnóstico de fornecedor para métricas, logs e traces.

Ler mais Original

CEVIU Dados

25 de mai. de 2026

Consultas Time-Travel no MySQL Usando Binlogs Indexados

O Bintrail permite consultas "AS OF" e snapshots de diferenças no MySQL, utilizando indexação de binlogs via ProxySQL. Essa funcionalidade é adicionada sem a necessidade de modificações de schema ou cópias de dados.

Ler mais Original

Receba as melhores notícias de tech

Conteúdo curado diariamente, direto no seu e-mail.

Assinar newsletter

Conteúdo curado diariamenteDiversas categoriasCancele quando quiser