A Anthropic parece estar expandindo a disponibilidade de seu modelo Claude Mythos, que agora auxiliará na proteção de um número maior de organizações. Indícios do modelo já foram encontrados em plataformas como Google Cloud e AWS, por meio de programas de descoberta de vulnerabilidades. Um lançamento do Mythos 1 parece iminente. Rumores também indicam que o Claude Opus 4.8 está em desenvolvimento para ser lançado em breve.

CEVIU News - CEVIU IA - 25 de maio de 2026
🤖 CEVIU IA
A SpaceX, ao adquirir a xAI e disponibilizar seus data centers Colossus, entrou no mercado de cloud, alugando-os para a Anthropic por US$ 15 bilhões anuais. Essa movimentação, que quase dobrou a receita da SpaceX em um trimestre, ilustra o vasto potencial do setor. A projeção é que a expansão da IA demande US$ 7,5 trilhões em investimentos nos próximos 4,5 anos, o equivalente a 5% do PIB dos EUA, comparável ao boom ferroviário do século XIX. Mesmo que as novas clouds capturem apenas 20% dos US$ 13,5 trilhões em valor gerado por essa infraestrutura, isso representa US$ 2,5 trilhões em oportunidades, pois os hyperscalers atuais não conseguirão suprir toda a demanda.
A DeepSeek cortou permanentemente os preços do seu modelo V4 Pro em 75%, uma promoção que inicialmente terminaria no final do mês. Com essa precificação, a DeepSeek se posiciona abaixo dos modelos de IA líderes como GPT-5 da OpenAI, Claude Opus 4.7 da Anthropic e Gemini 3.5 Flash do Google. A diferença de custo é mais significativa quando comparada aos modelos de raciocínio de fronteira (frontier reasoning models) que empresas utilizam para workloads mais exigentes.
O Mythos Preview é capaz de transformar vulnerabilidades em primitivos de exploit e combinar esses primitivos em cadeias de ataque completas de ponta a ponta. O conhecimento e a expertise necessários para desenvolver exploits diminuirão significativamente à medida que as capacidades do modelo se tornarem mais amplamente disponíveis. Este artigo analisa o desempenho do modelo no ExploitBench e no ExploitGym, dois benchmarks acadêmicos mais novos e desafiadores. O Mythos Preview supera consistentemente todos os outros modelos avaliados nesses testes.
A análise qualitativa envolve examinar grandes volumes de dados não estruturados para identificar padrões interessantes, recorrentes, surpreendentes ou importantes. Uma questão de pesquisa central atualmente é como realizar a análise qualitativa de forma eficaz com a ajuda de agentes de IA. Este artigo aborda o contexto do campo, propõe uma configuração experimental e discute os próximos passos. Embora ainda não esteja claro se os agentes de IA podem substituir humanos na análise qualitativa, eles já conseguem executar as partes mecânicas do processo rapidamente, embora sem a capacidade de discernimento humano.
A release candidate da próxima especificação do Model Context Protocol (MCP) já está disponível. Esta é a maior revisão do protocolo desde seu lançamento. A versão candidata introduz um core stateless que escala em infraestrutura HTTP comum, extensões, autorização que se alinha mais de perto com deployments de OAuth e OpenID Connect, uma política formal de deprecation, e muitas outras alterações. Ela contém breaking changes. A especificação final será lançada em 28 de julho.
A OpenAI descreveu um workflow de macro-avaliação para sistemas agentic que analisa padrões em populações inteiras de traces, em vez de falhas isoladas. Este método permite uma compreensão mais abrangente do comportamento e desempenho desses sistemas complexos.
O capitalista de risco David Sacks alertou o Presidente Trump, em uma ligação, que a aguardada ordem executiva sobre os perigos da inteligência artificial, que Trump estava deliberando, poderia levar a regulamentações obrigatórias que desacelerariam a indústria em sua corrida com os concorrentes chineses. Trump respondeu que compartilhava das preocupações sobre a China e estava preocupado em dificultar o investimento em IA. Ele então adiou a assinatura e disse a repórteres que não assinaria a ordem. O incidente demonstra a poderosa influência de Sacks e representa uma vitória para aqueles que se opõem a fortes guardrails para limitar os riscos apresentados pela tecnologia.
A Anthropic está a caminho de gerar US$ 10,9 bilhões em receita no segundo trimestre, um aumento em relação aos US$ 4,8 bilhões no primeiro trimestre, com um crescimento mais rápido do que a Zoom no auge da pandemia. O fator decisivo para a empresa se tornar lucrativa foi a redução dos custos de compute, que caíram de 71 centavos de compute por dólar de receita no primeiro trimestre para 56 centavos no segundo. Apenas o Claude Code é responsável por US$ 2,5 bilhões em receita, e a empresa espera um lucro de US$ 559 milhões a tempo de seu IPO em outubro. A narrativa de que "laboratórios de IA queimam dinheiro para sempre" finalmente tem uma exceção.
Usuários do ChatGPT agora podem fazer upload de uma imagem de formulário, adicionar os detalhes que desejam incluir, e o chatbot pode preenchê-lo para eles. Essa funcionalidade simplifica a interação com documentos, permitindo que a IA lide com o input de dados de forma conversacional.
A Perplexity disponibilizou o Bumblebee como open source, um scanner de segurança somente leitura projetado para identificar pacotes, extensões e configurações de ferramentas de IA de risco em máquinas de desenvolvedores. A iniciativa visa aumentar a transparência e a segurança no desenvolvimento de IA, permitindo que a comunidade contribua e melhore a ferramenta para detectar vulnerabilidades potenciais.
O modelo Gemini 3.5 Flash (Low) gera aproximadamente 45% menos tokens que o Gemini 3.5 Flash (Medium) e, de modo geral, demonstra desempenho superior ao Gemini 3.5 Flash (High) em tarefas de SWE (Software Engineering).
A Anthropic está introduzindo uma atualização de memória para o Claude através dos novos "Memory Files", que distribuem anotações por múltiplos documentos estruturados, organizados por tópico, projeto ou contexto. Essa funcionalidade promete aprimorar a capacidade do modelo de reter e organizar informações, permitindo interações mais complexas e contextualmente ricas ao longo do tempo.
Receba as melhores notícias de tech
Conteúdo curado diariamente, direto no seu e-mail.
