CEVIU Logo
CEVIU News

CEVIU News - CEVIU IA - 12 de fevereiro de 2026

16 notícias12 de fevereiro de 2026CEVIU IA
Compartilhar:

🧩 CEVIU IA

A pesquisa "Deep Research" reformulada da OpenAI no ChatGPT introduz sessões interativas , permitindo a aplicação de restrições em sites específicos e contextos de aplicativos, impulsionada pelo GPT-5.2. Essa atualização beneficia analistas, pesquisadores e profissionais ao aprimorar o controle de fontes, a intervenção durante o processo e a clareza dos relatórios. A expectativa aumenta para o GPT-5.3 , e potenciais "Skills" do ChatGPT podem padronizar fluxos de trabalho com instruções instaláveis para procedimentos repetíveis.

Comet é um navegador baseado em agentes que incorpora um modelo de IA capaz de interagir autonomamente com páginas web . Esta análise detalha a arquitetura do Comet, explicando a comunicação entre o modelo e o navegador, as ferramentas disponíveis e como o modelo percebe e interage com o conteúdo das páginas. A arquitetura do navegador é madura e bem projetada ️, oferecendo ao modelo acesso a funcionalidades como downloads, preenchimento de formulários, upload de arquivos e navegação arbitrária.

A OpenAI descreveu um experimento interno onde uma pequena equipe lançou um produto, cuja base de código, incluindo lógica da aplicação, testes, CI, documentação e todo o tooling, foi gerada inteiramente por agentes Codex, em vez de ser escrita por humanos.

Devin, da Cognition, é uma plataforma de agente em nuvem desenvolvida para equipes de engenharia. Ele atua como um colega de equipe, gerenciando tarefas e criando pull requests (PRs) de forma autônoma. A Cognition utiliza Devin para uma variedade de atividades, incluindo refatorações direcionadas, correções de bugs, revisões de PRs, escrita de testes unitários, e modernizações e migrações de código. Como regra geral, qualquer tarefa que um engenheiro júnior conseguiria resolver com instruções suficientes é algo que Devin provavelmente pode completar. No entanto, o sistema ainda enfrenta dificuldades em desafios de grande escala, aspectos estéticos da UI, desenvolvimento mobile e qualquer tarefa que exija testes e validações extensivos.

GLM-5 é um novo modelo com licença MIT e 754 bilhões de parâmetros. Ele oferece uma melhoria significativa em comparação com o GLM-4.7 em uma vasta gama de benchmarks acadêmicos, alcançando performance de destaque entre todos os modelos open-source em tarefas de raciocínio, codificação e baseadas em agentes. Projetado para engenharia de sistemas complexos e tarefas de longo prazo que envolvem agentes, o GLM-5 foi lançado como open-source no Hugging Face e ModelScope, e está disponível para teste gratuito em Z.ai.

A API da OpenAI agora oferece suporte a "skills" , que são pacotes reutilizáveis de arquivos que detalham fluxos de trabalho repetíveis. Com "Agent Skills", desenvolvedores podem fazer upload e reutilizar skills versionadas em ambientes de shell hospedados e locais. Essas skills são ideais quando se busca que os modelos sigam um workflow repetível, utilizem scripts ou templates, ou executem código em um ambiente sandbox . Esta postagem detalha como criar skills por meio da API.

Alethia é um agente de pesquisa matemática que gera, verifica e revisa soluções de ponta a ponta de forma iterativa em linguagem natural. Alimentado por uma versão avançada do Gemini Deep Think, o modelo consegue resolver problemas de Olimpíadas e exercícios de nível de doutorado. Este artigo apresenta e reflete sobre a primeira leva de artigos de pesquisa matemática alcançados por Alethia em colaboração com matemáticos.

Sandboxes oferecem um ambiente de trabalho onde agentes podem executar código, instalar pacotes e acessar arquivos. No contexto da integração de agentes com esses ambientes, identificam-se dois padrões arquitetônicos principais. ️ O primeiro padrão envolve o agente operando internamente ao sandbox, com a comunicação do desenvolvedor ocorrendo via rede. O segundo, por sua vez, descreve um cenário onde o agente executa localmente no servidor do desenvolvedor e aciona o sandbox remotamente para a realização das operações. O deepagents, um framework de agentes open-source com suporte nativo a sandboxes, simplifica a implementação de ambos os modelos por meio de uma configuração descomplicada.

OpenClaw e Moltbook, experimentos recentes de IA , prometem agentes de IA independentes, mas não cumprem devido a problemas de confiabilidade e segurança. O OpenClaw opera sem a permissão do usuário, apresentando riscos como o manuseio inadequado de dados, enquanto as IAs Moltbook debatem sobre autoaperfeiçoamento e filosofia. Apesar das limitações atuais , essas IAs destacam avanços futuros potenciais e desafios significativos na autonomia da IA.

As melhores equipes focadas em construir produtos baseados em agentes sustentáveis estão obcecadas com a eficiência de tokens. Cada token desperdiçado é como queimar dinheiro . O imposto de contexto pode ser evitado com a arquitetura correta. Embora a engenharia de contexto não seja glamorosa, ela é a diferença entre uma demonstração que impressiona e um produto que escala com uma margem bruta decente .

Receba as melhores notícias de tech

Conteúdo curado diariamente, direto no seu e-mail.

Conteúdo curado diariamenteDiversas categoriasCancele quando quiser
CEVIU News - CEVIU IA - 12 de fevereiro de 2026 — CEVIU News