A Cursor descreveu um sistema de sandboxing de agentes que permite que agentes de código locais operem livremente dentro de um ambiente restrito . Esse sistema solicita aprovação apenas quando os agentes precisam sair do sandbox, o que frequentemente ocorre para acessar a internet.

CEVIU News - CEVIU IA - 20 de fevereiro de 2026
🔐 CEVIU IA
O Google está testando a integração do NotebookLM em seus workflows Opal, com o objetivo de aprimorar a extração de dados e a automação. Essa integração visa otimizar processos e melhorar a eficiência dos fluxos de trabalho para os usuários.
O Google lançou o Gemini 3.1 Pro como o modelo principal aprimorado por trás das recentes melhorias "Deep Think" do Gemini 3, iniciando seu rollout para a Gemini API/AI Studio, Vertex AI, Android Studio, o aplicativo Gemini e o NotebookLM. A publicação destacou uma pontuação verificada de 77,1% no benchmark ARC-AGI-2 , mais que o dobro do resultado obtido pelo Gemini 3 Pro.
Esta publicação resume os desenvolvimentos recentes na IA desta semana . O foco está nas projeções sobre o impacto da IA nos empregos e na economia, bem como nos cronogramas para a transformação global que a tecnologia pode impulsionar. O artigo também analisa podcasts recentes com Dario Amodei e Elon Musk, e oferece um índice com descrições curtas para cada seção, facilitando a navegação pelos tópicos abordados.
O ARC-AGI-3 é um benchmark de raciocínio interativo, projetado para medir a capacidade de um agente de IA de generalizar em ambientes novos e não vistos. O Opus 4.6 demonstrou um raciocínio e uso de memória superiores ao Gemini 3.1 Pro, resolvendo mais níveis neste desafio. É possível que os modelos atuais consigam resolver o ARC-AGI-3 se tiverem acesso a um harness com uma memória simples. Scaffolds de memória são provavelmente suficientes para que o pseudo-continual learning nos impulsione a um limiar de autoaperfeiçoamento ou de agentes de pesquisa nos próximos dois anos.
Optimize_anything é uma API declarativa que otimiza qualquer artefato representável como texto. Os usuários declaram o que otimizar e como medir, e o sistema gerencia a busca. A ferramenta consistentemente iguala ou supera ferramentas específicas de domínio. Uma gama surpreendentemente ampla de problemas pode ser formulada como a otimização de um artefato de texto. Se algo pode ser serializado para uma string e sua qualidade medida, um modelo de linguagem grande pode raciocinar sobre isso e propor melhorias.
Baseando-se na arquitetura Transformer do Google, os autores propuseram o treinamento de agentes de modelo de sequência contra muitos oponentes diferentes. Isso permitiu que os agentes aprendessem a se adaptar dentro de cada jogo, eliminando a necessidade de premissas hardcoded sobre o aprendizado de outros agentes.
A OpenAI possui uma grande base de usuários, mas enfrenta engajamento e retenção limitados, além de não ter um efeito de rede. A empresa não dispõe de tecnologia exclusiva, visto que os players estabelecidos já igualaram suas capacidades e estão aproveitando seus produtos e canais de distribuição para fortalecer sua posição. Este artigo analisa a estratégia da OpenAI e como a empresa pode competir eficazmente no cenário atual da IA.
Quando não se está utilizando raciocínio, a repetição do prompt de entrada melhora o desempenho de modelos populares sem aumentar o número de tokens gerados ou a latência. É interessante que "truques" como este ainda sejam possíveis, apesar do grande volume de trabalho dedicado ao aprimoramento de Large Language Models. A descoberta demonstra o quanto ainda há espaço para melhorias nos modelos atuais.
Prototipar com o melhor e refinar pequenas joias . Use equipes de agentes de IA como microgestores e experimente diferentes ferramentas e workflows ️. Documente tudo para criar ciclos de melhoria que aprimorem as taxas de sucesso sem intervenção manual. Habilidades são mais fáceis de depurar do que código .
O DuckDuckGo lançou a edição de imagens com IA no Duck.ai, permitindo que usuários editem imagens sem a necessidade de uma conta. Embora a ferramenta esteja acessível a todos, assinantes desfrutam de limites diários mais elevados para suas edições.
Sam Altman e Dario Amodei evitaram se cumprimentar em uma cúpula de IA , atitude que ressalta a rivalidade acirrada ️ entre os CEOs.
Receba as melhores notícias de tech
Conteúdo curado diariamente, direto no seu e-mail.
