CEVIU News - CEVIU Dados - 8 de junho de 2026

14 notícias8 de junho de 2026CEVIU Dados

🐘 CEVIU Dados

08 de jun. de 2026

🐘

PostgreSQL 19 Beta 1 está disponível para testes

O PostgreSQL 19 Beta 1 chegou para avaliação antes do lançamento oficial. As novidades incluem autoscaling de async I/O, autovacuum paralelo, inserções mais rápidas em foreign-key, consultas de grafo via SQL/PGQ, melhorias de observabilidade, replicação lógica sem reinicialização, certificados TLS por SNI, ativação de checksum em tempo real, compressão LZ4 como padrão no TOAST e remoção da autenticação RADIUS.

Ler mais Original

CEVIU Dados

08 de jun. de 2026

⚠

O perigo do vibe coding frente à engenharia com agentes

Wes McKinney alerta: vibe coding é perigoso quando envolve prompts one-shot, falta de revisão e deploy às cegas. A alternativa está na engenharia com agentes, desde que haja envolvimento humano profundo em especificações, arquitetura, testes e revisão. O workflow proposto usa IA como acelerador, preservando o julgamento de engenharia com ferramentas como Superpowers e Roborev, rastreamento de tokens e práticas rigorosas de manutenção para garantir responsabilidade dos agentes ao longo do tempo.

Ler mais Original

CEVIU Dados

08 de jun. de 2026

🤖

Como a Anthropic viabiliza analytics self-service com o Claude

A Anthropic defende que a precisão em analytics self-service com LLMs é, antes de tudo, um problema de contexto, governança e verificação, não apenas de geração de SQL. Para isso, são essenciais datasets canônicos, metadados robustos e camadas semânticas bem estruturadas. Os maiores ganhos vieram da redução de ambiguidade, prevenção de obsolescência, melhoria no retrieval e validação contínua via avaliações offline, ablações, linhagem de dados e loops de correção.

Ler mais Original

CEVIU Dados

08 de jun. de 2026

⚡

Netflix cria particionamento dinâmico no Cassandra para séries temporais de alto volume

A Netflix desenvolveu uma funcionalidade de particionamento dinâmico no Cassandra para lidar com partições extensas em workloads de séries temporais, como histórico de visualização, métricas e eventos. Em vez de depender de buckets estáticos ou ajustes manuais, o sistema detecta partições muito grandes ou sobrecarregadas em tempo de execução e as divide automaticamente em partes menores, preservando a compatibilidade de consultas e a consistência dos dados.

Ler mais Original

CEVIU Dados

08 de jun. de 2026

🧩

A lacuna de reescrita de consultas em Materialized Views com suporte a Join

Materialized views com suporte a join aceleram o BI baseado em star-schema ao manter junções entre fatos e dimensões disponíveis para reescrita de consulta. Em contrapartida, materializações de tabela única frequentemente ignoram atributos de agrupamento de dashboards. Plataformas como StarRocks, BigQuery, Redshift e Oracle oferecem suporte direto a essa funcionalidade, enquanto o Databricks aposta em Metric Views experimentais e o Snowflake mantém a capacidade fragmentada entre materialized views e Dynamic Tables.

Ler mais Original

CEVIU Dados

08 de jun. de 2026

🗂

Taxonomias e Ontologias: estruturas complementares, papéis distintos

Taxonomias organizam conceitos de negócio para humanos; ontologias definem classes, propriedades, restrições e regras formais. No contexto de IA, o vector retrieval performa melhor com textos descritivos de taxonomia, enquanto o raciocínio lógico depende dos axiomas da ontologia. A recomendação é mantê-las conectadas, porém separadas: usuários de negócio curam os conceitos, enquanto os modelos de dados preservam a precisão lógica.

Ler mais Original

CEVIU Dados

08 de jun. de 2026

🎯

Ground truth é um processo vivo, não um dataset congelado

A Amazon redefine ground truth como processo contínuo, não como dataset estático. No protocolo de verificação de fatos em relatórios complexos gerados por IA, a empresa adota a abordagem 'auditar antes de pontuar': a IA pode contestar labels de benchmark com evidências, e um auditor humano analisa as disputas e atualiza o ground truth quando necessário. O resultado? Precisão do modelo saltando para 90,9%.

Ler mais Original

CEVIU Dados

08 de jun. de 2026

⚡

Apache Arrow Flight: a infraestrutura de alta performance para mover dados em escala

O Apache Arrow Flight combina Arrow e gRPC para transferir grandes volumes de dados colunares com transferência zero-copy. Os servidores transmitem Arrow RecordBatches diretamente, suportam leituras paralelas entre múltiplos endpoints e funcionam como base para serviços de dados personalizados de alta performance, ideal para pipelines que exigem velocidade e eficiência na camada de transporte.

Ler mais Original

CEVIU Dados

08 de jun. de 2026

📊

O êxodo do Tableau começou: custo e percepção de valor aceleram a migração

Executivos estão cortando o uso do Tableau não por superioridade técnica de concorrentes, mas por enxergar a ferramenta como cara e subvalorizada. A recomendação estratégica é preservar métricas críticas exclusivas de BI, avaliar plataformas mais baratas ou consolidadas e aproveitar o momento de migração para reposicionar o valor do BI em um cenário cada vez mais orientado por IA.

Ler mais Original

CEVIU Dados

08 de jun. de 2026

🦆

Seu Obsidian Vault agora pode executar SQL e ser lido por agentes de IA

Um novo plugin integra DuckDB e MotherDuck ao Obsidian, permitindo executar blocos SQL diretamente nas notas, consultar arquivos locais ou tabelas na nuvem e fixar resultados como tabelas markdown, com agendamento de atualização diário ou semanal. O vault passa a funcionar também como fonte de dados para agentes de IA.

Ler mais Original

CEVIU Dados

08 de jun. de 2026

🎯

Calibração de LLMs: comparativo entre Temperature Scaling, Platt Scaling e Isotonic Regression

Temperature Scaling é a técnica mais simples para calibrar LLMs. Platt Scaling entrega eficiência e velocidade, mas pode perder precisão. Já a Isotonic Regression é mais flexível e precisa com grandes volumes de dados, porém apresenta risco de overfitting em conjuntos menores. Para avaliar os resultados, as referências são Expected Calibration Error (ECE), diagramas de confiabilidade e o Brier score.

Ler mais Original

CEVIU Dados

08 de jun. de 2026

⚡

Paralelismo no Broker vs. Paralelismo Local no Cliente: entenda as diferenças

No ecossistema de mensageria, há duas abordagens distintas de paralelismo: o paralelismo visível no broker, que aumenta partições ou consumidores para escalar o processamento de forma explícita; e o paralelismo local no cliente, que utiliza tarefas assíncronas, virtual threads ou filas internas dentro de um número menor de consumidores. A escolha entre as estratégias impacta diretamente a arquitetura do pipeline e o desempenho do sistema.

Ler mais Original

CEVIU Dados

08 de jun. de 2026

⚙

5 erros clássicos de dbt que travam projetos de dados em startups

Projetos iniciais com dbt costumam acumular débitos técnicos evitáveis desde cedo. Os erros mais comuns incluem reconstruções completas no CI, ausência de model contracts, desvios silenciosos em modelos incrementais, declarações incorretas de tabelas raw e o compartilhamento indevido de esquemas entre ambientes de dev e produção, armadilhas que comprometem a confiabilidade dos pipelines antes mesmo de escalarem.

Ler mais Original

CEVIU Dados

08 de jun. de 2026

⚡

O conceito fundamental do Spark que todo iniciante precisa dominar

O coração do Apache Spark está em um modelo simples, mas pouco compreendido: transformações são operações lazy e imutáveis sobre DataFrames que constroem um DAG (grafo acíclico dirigido), enquanto as ações são o gatilho que dispara a execução real distribuída entre os executors. Entender essa distinção é o que separa quem usa o Spark de quem realmente o domina.

Ler mais Original

Receba as melhores notícias de tech

Conteúdo curado diariamente, direto no seu e-mail.

Assinar newsletter

Conteúdo curado diariamenteDiversas categoriasCancele quando quiser