A IA em Elden Ring depende de um design simples que usa um sistema de gestão de objetivos baseado em stack, permitindo execução dinâmica e hierárquica de estados. Cada actor usa "Goals" que podem se adaptar conforme o contexto e a aleatoriedade, o que viabiliza comportamentos complexos sem uma estrutura convoluta. Essa abordagem difere de frameworks de IA mais tradicionais, como Behavior Trees, ao oferecer um mecanismo direto para seleção de ações e transições de estado durante o gameplay.

CEVIU News - CEVIU Web Dev - 24 de junho de 2026
🎮 CEVIU Web Dev
Depois de ser demitido do Google por criar um Google Workspace CLI viral, que recebeu muita attention e uso, o criador diz que vê um conflito entre inovação e o medo corporativo de disrupção. Ele também agradece pelas experiências e pelo apoio recebidos ao longo de quase sete anos na empresa.
Construir produtos agentic envolve criar código de harness que gerencia a interação entre modelos de IA e diferentes ambientes. Mas boa parte desse trabalho de harness tende a se tornar obsoleta com a evolução das capacidades dos modelos, o que pode gerar dívida técnica se as equipes o tratarem como uma solução permanente. Os harnesses de produção e de treinamento devem ser projetados com finalidades distintas: o de produção precisa impor restrições para uma operação segura, enquanto o de treinamento deve permitir exploração e aprendizado.
Depois de anos ajudando a impulsionar a adoção de agentes em organizações de engenharia, esse engenheiro afirma que a mudança para uma abordagem solo aumentou sua produtividade. A transformação veio de um processo bagunçado, mas útil, de refinar fluxos de trabalho e incorporar agentes, o que acabou reduzindo o tempo de codificação manual e ampliando o foco no controle estratégico do processo de desenvolvimento. Isso inclui uma estrutura clara de planejamento, uso de entrada por voz e ferramentas personalizadas para remover atritos e permitir a gestão paralela de tarefas.
Os avanços recentes em automação de código apontam para uma mudança em direção a loops cada vez mais complexos, que ampliam a funcionalidade dos agentes de programação. A abordagem pode ajudar em tarefas como porting de código e exploração de performance, mas também levanta preocupações sobre fluxos mais hands-off, que tendem a produzir código menos compreensível e mais difícil de manter.
Os coding agents ficaram bons o suficiente para que escrever código esteja quase gratuito, e as equipes passam a executar vários agentes em paralelo, o que transforma a revisão humana no principal gargalo. Encaixar IA em fluxos antigos, baseados em handoffs e waterfall, mantém a entrega travada. A saída é um modelo de collaborative coding em que todo o time, incluindo PM, design e QA, trabalha diretamente com agentes e em paralelo, antecipando a validação para que a revisão final do PR trate apenas do código.
Novas ferramentas e iniciativas estão sendo introduzidas para melhorar a cibersegurança, com foco em automatizar o patching de vulnerabilidades e aprimorar a colaboração entre os atores do setor. Entre os destaques estão o lançamento do plugin Codex Security para acelerar a descoberta de vulnerabilidades e a geração de patches, além da liberação completa do modelo avançado GPT-5.5-Cyber para ajudar defensores a gerenciar e proteger sistemas de software.
Mistral OCR 4 adiciona bounding boxes, block classification e inline confidence scores. O modelo entrega desempenho melhor que outros sistemas líderes, com alta precisão e porte compacto o bastante para deployments self-hosted.
Mythos é uma ferramenta de segurança vista como muito eficaz para encontrar vulnerabilidades, mas há ceticismo sobre a validade de suas alegações e sobre os custos operacionais, que podem limitar o acesso mais amplo. Por isso, foi lançado um projeto de benchmark para testar se outros modelos de IA conseguiriam igualar o desempenho de Mythos na identificação de bugs de segurança, usando um conjunto de vulnerabilidades confirmadas que ele já havia encontrado. Os resultados preliminares mostram que alguns modelos tiveram um desempenho surpreendentemente bom, mas nenhum superou Mythos de forma consistente.
Avaliações recentes de modelos avançados de IA, incluindo Claude Fable 5, Opus 4.8 e GPT-5.5, mostram avanços na capacidade de melhorar um modelo base fixo por meio de tarefas de pós-treinamento, como FrogsGame. Entre os progressos mais importantes estão a geração de dados de melhor qualidade, estratégias mais eficazes de reinforcement learning e a calibração das próprias autoavaliações, com Fable 5 se destacando como o melhor por produzir traces de treinamento de alta qualidade e usar o tempo com mais eficiência.
Claude Tag é uma nova ferramenta colaborativa integrada ao Slack, que permite às equipes delegar tarefas com facilidade a uma IA que aprende com as interações e trabalha de forma assíncrona ao lado dos demais membros.
Em 2026, relatórios de vulnerabilidade deixaram de ser considerados especiais, já que os LLMs passaram a identificar falhas de segurança de forma semelhante à de pesquisadores humanos.
O Unsloth Studio é uma interface web para IA local que permite executar modelos avançados, como o GLM-5.2, de forma eficiente em diferentes sistemas operacionais, com recursos de download de modelos, ajuste de parâmetros e inference rápida.
Receba as melhores notícias de tech
Conteúdo curado diariamente, direto no seu e-mail.
