CEVIU News

CEVIU News - CEVIU IA - 23 de abril de 2026

15 notícias23 de abril de 2026CEVIU IA
Compartilhar:

🤖 CEVIU IA

A OpenAI introduziu agentes de workspace no ChatGPT, permitindo que equipes criem agentes de IA compartilhados para tarefas e fluxos de trabalho complexos. Esses agentes, potencializados por Codex, executam tarefas como gerar relatórios, escrever código e gerenciar comunicação, enquanto se integram a diversas ferramentas como o Slack. Os agentes de workspace estão atualmente disponíveis em prévia de pesquisa para planos selecionados do ChatGPT, com o objetivo de otimizar a colaboração e melhorar a produtividade.

Google lançou o Workspace Intelligence, aprimorando o Google Workspace com uma camada semântica para integrar e-mails, chats, arquivos e projetos para agentes movidos por Gemini. Esta atualização inclui grandes aprimoramentos de produto, como a construção de planilhas em linguagem natural no Sheets e recursos orientados por IA no Docs, Slides, Gmail e Drive. O Workspace Intelligence visa tornar o Workspace uma camada de controle centralizada para operações de negócios, enfatizando segurança, integração de contexto e funcionalidade entre aplicativos.

A Core Automation é um laboratório de IA fundado por Jerry Tworek, ex-pesquisador da OpenAI, com o objetivo de construir o laboratório de IA mais automatizado do mundo. A iniciativa começará automatizando sua própria pesquisa antes de desenvolver novos algoritmos que transcendem o pre-training e o reinforcement learning. O laboratório também se dedicará à criação de arquiteturas projetadas para escalar de forma mais eficiente do que os transformers. A equipe é composta por especialistas em frontier models, otimização e engenharia de sistemas.

A Perplexity desenvolveu um pipeline de dois estágios para modelos de linguagem aumentados por busca. Esse pipeline emprega um Supervised Fine-Tuning (SFT) inicial, seguido por Reinforcement Learning (RL), com o objetivo de otimizar a precisão factual, a preferência do usuário e a eficiência no uso de ferramentas. Essa abordagem, que começou a ser aplicada com os modelos Qwen3, separa a conformidade da melhoria na busca, visando alcançar maior precisão sem comprometer os guardrails. Os modelos demonstraram maior acurácia em benchmarks como FRAMES e FACTS OPEN, além de um custo por consulta reduzido e uma eficiência aprimorada no uso de ferramentas em comparação com modelos existentes como o GPT-5.4.

Workloads agentic estão redefinindo os benchmarks para motores de inference, exigindo cenários de múltiplas interações e uso de ferramentas. Tais cenários impõem desafios ao gerenciamento e ao escalonamento do KV cache devido a traces mais longos e a distribuições variadas de tokens. A Applied Compute introduziu três perfis de workload para auxiliar na otimização da performance de motores e aceleradores. A empresa lançou uma ferramenta de benchmarking open-source para replicar essas situações, destacando a necessidade de soluções como o offloading de KV cache e o roteamento sensível ao workload para aprimorar o throughput e a eficiência.

A maioria do conteúdo inserido em arquivos AGENTS.md não ajuda ou, na verdade, prejudica. Os padrões eficazes são específicos e podem ser aprendidos. Este artigo analisa quais padrões funcionam, quais falham e como identificar a diferença para sua codebase. Padrões distintos afetam métricas diferentes, portanto, escolha aqueles que visam resolver o problema que você realmente enfrenta.

O Qwen3.6-27B entrega performance de codificação agentic de nível flagship. A equipe Qwen afirma que ele supera o flagship da geração anterior, Qwen3.5-397B-A17B, em todos os principais benchmarks de codificação. O modelo possui 55.6 GB no Hugging Face, com versões quantizadas ainda menores disponíveis. Testes indicam que o modelo apresenta resultados excelentes, mesmo quando quantizado.

A Gemini Enterprise Agent Platform é uma plataforma abrangente para construir, escalar, governar e otimizar agentes. Ela reúne capacidades de seleção de modelos, construção de modelos e construção de agentes, juntamente com novas funcionalidades para integração de agentes, DevOps, orquestração e segurança. A Agent Platform é um destino único para equipes técnicas desenvolverem agentes que podem transformar produtos, serviços e operações. Os agentes podem ser entregues aos funcionários através do aplicativo Gemini Enterprise.

Agentes podem se conectar a sistemas externos por meio de chamadas diretas de API, CLIs e MCP. Esta publicação examina onde cada um se encaixa e os padrões para construir essas integrações de forma eficaz. MCP se torna a camada de composição crítica à medida que agentes de produção migram para a nuvem. Cada integração construída sobre MCP fortalece o ecossistema.

A personalização nas respostas dos LLM introduz variação, mas frequentemente mantém um núcleo semântico estável entre as diferentes respostas. Essa base compartilhada resulta de priors de modelo comuns, recuperações sobrepostas e restrições de produto, com as diferenças surgindo em exemplos e ênfase. Compreender esse comportamento permite que as empresas otimizem sua presença em conteúdo gerado por IA, focando em fazer parte do conhecimento central do modelo.

A IA está aprimorando os fluxos de trabalho de engenharia ao assumir a execução, permitindo que os humanos se concentrem no planejamento, revisão e garantia da qualidade do resultado. Enquanto a IA executa, os humanos se destacam na diagnóstico de problemas sob múltiplos ângulos, uma capacidade que ainda representa um desafio para a IA. No futuro, as estratégias organizacionais de IA provavelmente envolverão assistentes personalizados para os funcionários ou um super-agente singular com plugins departamentais.

Confiar em prompts para corrigir erros recorrentes de agentes de IA é uma abordagem pouco confiável e "baseada em intuição" que se degrada à medida que as conversas se tornam complexas. Para resolver isso, Garry Tan, CEO da Y Combinator, defende a "skillification". Em vez de permitir que um agente desperdice compute tentando resolver tarefas determinísticas (como consultas a calendários históricos) em seu latent space, este framework força a IA a executar scripts locais precisos.

Receba as melhores notícias de tech

Conteúdo curado diariamente, direto no seu e-mail.

Conteúdo curado diariamenteDiversas categoriasCancele quando quiser