A Perplexity está testando um conector para o Messages em seu navegador Comet, o que aprimora a integração local com o aplicativo Messages da Apple. Essa funcionalidade visa atrair usuários avançados de macOS ao unificar o histórico de comunicação com dados da web. Paralelamente, uma nova funcionalidade "Uso e Créditos" permitirá que os usuários comprem créditos adicionais, respondendo à reação negativa pela redução dos limites do plano Pro.

CEVIU News - CEVIU IA - 24 de fevereiro de 2026
💬 CEVIU IA
O SWE-bench Verified não mede mais de forma confiável o progresso em codificação de frontier. Isso se deve a falhas nos testes de muitas tarefas, que rejeitavam correções corretas, e à contaminação do benchmark, que transformou a exposição durante o treinamento em um fator significativo para as pontuações.
A Anthropic acusou DeepSeek, Moonshot AI e MiniMax de criar mais de 24.000 contas falsas para gerar aproximadamente 16 milhões de interações com Claude, visando replicar suas capacidades de raciocínio agentic, uso de ferramentas e codificação.
A OpenAI planeja introduzir uma nova categoria de assinatura, o ChatGPT Pro Lite. Com valor de US$ 100 por mês, este novo plano visa atender usuários que atingem frequentemente os limites de requisições (rate limits) da versão Plus, mas que não necessitam do acesso ilimitado oferecido pela modalidade Pro. Além disso, pode ser uma forma de acomodar o uso do Codex. Ainda não há confirmação da data de lançamento, e o conjunto exato de funcionalidades permanece indefinido.
A OpenAI descreveu um teste de estresse de longa duração onde o GPT-5.3-Codex, recebendo um repositório vazio e acesso total, desenvolveu uma ferramenta de design ao longo de cerca de 25 horas, utilizando aproximadamente 13 milhões de tokens e produzindo cerca de 30 mil linhas de código. ️️
Daniel Litt argumenta que as limitações atuais são reais, mas provavelmente temporárias, não bloqueios fundamentais. Litt agora espera que a IA resolva autonomamente conjecturas abertas de interesse moderado já no final de 2026 e sugere que o impacto de longo prazo da IA na matemática pode exceder o do computador . Mesmo em um futuro onde as máquinas possam gerar vastos corpos de matemática correta, ele sustenta que os matemáticos humanos ainda serão relevantes, pois a motivação central permanece sendo a compreensão , e não apenas a produção de resultados.
O AWS Strands Labs é uma nova organização GitHub criada para auxiliar desenvolvedores a explorar e experimentar técnicas avançadas de IA . Atualmente, a iniciativa está disponível para três projetos específicos: robôs , robots sim e AI functions. A AWS considera essas áreas as que mais claramente revelam as mudanças quando o software se torna agentic, oferecendo à empresa e à comunidade um espaço dedicado para experimentação ousada .
O FDM-1, um modelo de base para uso computacional, treina eficientemente em 11 milhões de horas de vídeo para lidar autonomamente com tarefas como CAD, direção e fuzzing. Ao contrário dos modelos tradicionais que dependem de anotação cara e limitada, o FDM-1 utiliza um codificador de vídeo que comprime 2 horas de vídeo em 1M de tokens e prevê ações com dinâmica inversa para um treinamento escalável. Com processamento de contexto aprimorado, o FDM-1 demonstra avanços significativos na execução de tarefas de longo prazo e na exploração de árvores de estado complexas em ambientes GUI.
SAGE introduz uma abordagem de amostragem autoconsciente que permite a grandes modelos de raciocínio decidir quando parar de "pensar", reduzindo o compute desnecessário. Seu método complementar, SAGE-RL, destila esses padrões de raciocínio eficientes em inference padrão pass@1, demonstrando melhoria na acurácia com menos tokens em seis benchmarks de matemática desafiadores.
A Taalas tem desenvolvido discretamente um chip de modelo em silício que integra um LLM diretamente no hardware para entregar uma inferência por usuário absurdamente rápida . O chip HC1 executa o Llama 3.1 8B da Meta em velocidade extrema, efetivamente incorporando o modelo ao silício. Ele alcança uma performance de inference de aproximadamente 17.000 tokens por segundo por usuário. Esta é apenas a primeira versão, com as próximas iterações já projetadas para uma fidelidade consideravelmente superior.
A OpenAI está firmando parcerias plurianuais com as empresas de consultoria Accenture, Boston Consulting Group, Capgemini e McKinsey & Co. O objetivo é auxiliar na implantação de sua plataforma corporativa, Frontier , uma camada de inteligência projetada para integrar sistemas e dados díspares dentro de uma organização, visando facilitar a gestão, implantação e construção de agentes de IA pelas empresas. A decisão da OpenAI de colaborar com essas firmas de consultoria se baseia nos relacionamentos que elas já possuem com grandes corporações e em seu profundo conhecimento sobre a operação desses negócios . As consultorias serão fundamentais para ajudar a OpenAI a escalar a implementação de sua tecnologia em escala global .
A Anthropic afirma que as ferramentas Claude Code podem acelerar a refatoração de aplicativos escritos em COBOL.
DeepSeek V4, um modelo open source altamente aguardado com contexto de mais de 1M baseado na arquitetura Engram , deverá ser lançado antes do final do mês ️.
Um recente desenvolvimento da ASML em fontes de luz EUV (Extreme Ultraviolet) promete revolucionar a fabricação de semicondutores. Este avanço tecnológico pode capacitar os fabricantes de chips a aumentar a produção em até 50% até o fim da década, impactando significativamente a capacidade de oferta global de componentes.
Receba as melhores notícias de tech
Conteúdo curado diariamente, direto no seu e-mail.
