A Anthropic detalhou as avaliações iniciais do Claude Mythos Preview, destacando seu forte desempenho na descoberta de vulnerabilidades zero-day e na engenharia reversa de exploits. Este avanço impulsionou uma iniciativa coordenada de segurança denominada Project Glasswing.

CEVIU News - CEVIU IA - 8 de abril de 2026
🛡️ CEVIU IA
O Claude Mythos Preview da Anthropic identificou autonomamente milhares de vulnerabilidades zero-day em grandes sistemas operacionais e navegadores. Este avanço é um pilar para o Project Glasswing, que, em parceria com grandes empresas de tecnologia, utiliza essas capacidades para aprimorar a cibersegurança, detectando e corrigindo vulnerabilidades em larga escala. A Anthropic planeja desenvolver salvaguardas e expandir a cooperação industrial para enfrentar os desafios de segurança na era da IA.
Ryan Greenblatt, cientista-chefe da Redwood Research – uma organização de pesquisa com a missão de alinhar IAs super-humanas – compartilha neste artigo algumas de suas principais estimativas sobre o panorama atual da IA. O cenário previsto discute regulamentações de acesso a P&D, capacidades de engenharia e habilidades qualitativas, desalinhamento e propriedades relacionadas ao desalinhamento, ameaças cibernéticas, armas biológicas e efeitos econômicos. Algumas das afirmações apresentadas são altamente especulativas, enquanto outras possuem uma base mais sólida.
Modelos atuais de IA têm dificuldade em interpretar documentos financeiros complexos, especialmente na extração de dados visuais. GPT-5.4, Gemini 3.1 Pro e Claude Opus 4.6 falham consistentemente ao processar gráficos e imagens densas, atingindo apenas 56% a 64% de precisão, em comparação com 72% a 80% com entradas apenas textuais. Essas descobertas destacam lacunas significativas na capacidade da IA de realizar tarefas de raciocínio financeiro no mundo real, tornando prematura a substituição de analistas financeiros por IA.
GLM-5.1 é um modelo carro-chefe para engenharia agentic, criado pela Z.ai, que alcança desempenho de ponta no SWE-Bench Pro. Ele foi desenvolvido para manter a eficácia em tarefas de agente em horizontes de tempo significativamente mais longos do que as gerações anteriores, sustentando a otimização por centenas de rodadas e milhares de chamadas de ferramentas. O modelo decompõe problemas complexos, executa experimentos, lê resultados e identifica impedimentos com precisão real.
O 'warp decode' da Cursor é um design de kernel que reorganiza a MoE inference em torno dos neurônios de saída, em vez dos experts. Essa abordagem atinge um throughput aproximadamente 1.8x maior e melhora a precisão numérica em GPUs Blackwell.
As Tensor Processing Units (TPUs) do Google são fundamentais para a infraestrutura de supercomputação da empresa. Os ASICs customizados da companhia impulsionam o treinamento e o serviço tanto para o Google quanto para seus clientes Cloud. TorchTPU é um stack que facilita o acesso da comunidade de IA a todas as capacidades das TPUs, fornecendo as APIs e as ferramentas necessárias para extrair o máximo de compute do hardware do Google. Esta publicação oferece uma análise aprofundada dos princípios de engenharia por trás do TorchTPU.
SandMLE é um framework para construir ambientes MLE pequenos, mas estruturalmente realistas, que tornou o RL on-policy prático para agentes de engenharia de ML, ao reduzir o custo de execução em mais de 13 vezes.
A suíte Time Horizon da METR está sendo saturada. Modelos de IA de fronteira conseguem realizar de forma confiável quase todas as tarefas da suíte, exceto talvez uma dúzia, o que torna difícil estabelecer um limite superior para o seu horizonte temporal. A criação e avaliação de novos benchmarks estão se tornando mais caras. A situação provavelmente piorará à medida que o progresso da IA continuar. É provável que, até meados de 2027, nenhum resultado de benchmark de 2026 ou anterior seja capaz de descartar capacidades perigosas em sistemas de IA de fronteira.
O processo de Elon Musk contra a OpenAI deve ir a julgamento ainda este mês em Oakland, Califórnia. Musk alterou o processo para pedir que qualquer indenização que ele possa vir a receber seja concedida ao braço filantrópico da OpenAI, em vez de a si próprio. A emenda também solicita a remoção de Sam Altman, CEO da OpenAI, do conselho da entidade sem fins lucrativos da empresa. Musk busca mais de US$ 150 bilhões em indenizações tanto da OpenAI quanto da Microsoft. Ele alega que a OpenAI se desviou de sua missão sem fins lucrativos e o fraudou como doador ao se converter em uma empresa com fins lucrativos.
A Anthropic atingiu US$ 10 bilhões em receita em menos de quatro anos, superando amplamente o crescimento de outras empresas de software como a ServiceNow e a Shopify.
Desde 2022, o Google detém aproximadamente 25% de todo o compute vendido.
Receba as melhores notícias de tech
Conteúdo curado diariamente, direto no seu e-mail.
