A AGI é provavelmente possível, mas talvez não venha de modelos baseados em Transformer. Embora os modelos Transformer sejam muito poderosos, eles possuem limitações fundamentais, e superar essas limitações pode levar décadas . Isso não significa que os LLMs não sejam úteis, a tecnologia atual já está transformando a sociedade de forma fundamental.

CEVIU News - CEVIU IA - 17 de fevereiro de 2026
🤔 CEVIU IA
A Microsoft está testando novos agentes Researcher e Analyst que serão integrados ao futuro recurso "Tasks" do Copilot. Essa funcionalidade permitirá aos usuários agendar prompts complexos, aproveitando modelos OpenAI e o3-mini para pesquisa e análise de dados. A inclusão de um modo "Auto" visa simplificar a automação de tarefas, o que pode diferenciar o Copilot em cenários de uso de produtividade.
O Qwen3.5-397B-A17B é o primeiro modelo da série Qwen3.5. Este modelo nativo de visão-linguagem demonstra resultados notáveis em raciocínio, codificação, capacidades de agente e compreensão multimodal . Ele utiliza uma arquitetura híbrida inovadora que funde linear attention com um sparse mixture-of-experts. Embora contenha 397 bilhões de parâmetros, apenas 17 bilhões são ativados por forward pass. O modelo suporta 201 idiomas e dialetos .
O CEO da Anthropic, Dario Amodei, prevê o surgimento de 'gênios em um data center' em poucos anos . Embora as ações da Anthropic não reflitam totalmente esse otimismo, a cautela da empresa é vista como necessária . O artigo detalha notas de um podcast recente onde Amodei discute temas cruciais como China, controles de exportação, democracia, política de IA, riscos da IA e aprendizado contínuo .
Manus Agents representa uma nova maneira de acessar e utilizar o Manus diretamente em aplicativos de mensagens. Atualmente, o Telegram é o único app compatível, com mais plataformas sendo adicionadas em breve. O agente incorpora funcionalidades de raciocínio, ferramentas e execução de tarefas multi-etapas, tornando os agentes acessíveis onde quer que os usuários estejam.
O Spreadsheet Arena é uma plataforma aberta para avaliar planilhas geradas por LLMs. Frequentemente, a formatação e a estrutura influenciam a preferência do usuário mais do que a complexidade das fórmulas. Há diferenças significativas nas preferências específicas de domínio; por exemplo, modelos acadêmicos podem ser prejudicados por formatações excessivas, enquanto modelos financeiros se beneficiam de codificação de cores profissional. As preferências do público geral frequentemente divergem das avaliações de especialistas, especialmente em relação à codificação de cores e à formatação.
O desempenho em benchmarks oferece estimativas enviesadas da generalização out-of-distribution se os dados de treinamento de LLMs estiverem poluídos com dados de teste dos próprios benchmarks. Filtros de descontaminação comuns falham em detectar duplicatas semânticas ️. Isso sugere que os ganhos recentes em benchmarks são confundidos – a prevalência de contaminação suave significa que os avanços refletem tanto melhorias genuínas de compatibilidade quanto o acúmulo de dados de teste e dados de teste efetivos nos crescentes corpora de treinamento .
A Micron Technology, a maior fabricante americana de chips de memória, está expandindo rapidamente sua capacidade de fabricação para superar o gargalo de memória. A empresa está investindo US$50 bilhões para mais que dobrar o tamanho de seu campus de 450 acres, com planos de construir duas novas fábricas de chips. A primeira delas deve iniciar a produção de DRAM em meados de 2027. Além disso, a Micron recentemente iniciou a construção de um complexo de fabs de US$100 bilhões em Nova York e anunciou um investimento de US$9,6 bilhões em uma fab no Japão no ano passado.
Os custos de inference podem não representar um gargalo tão significativo para o progresso da IA . O custo para atingir um determinado nível de capacidade está diminuindo rapidamente, indicando que o ônus do custo de inference é mais transitório do que aparenta ao observar apenas os frontier models no momento de seu lançamento. Contudo, os dados sobre RL scaling ainda são limitados, o que dificulta tirar conclusões definitivas. Será crucial acompanhar a velocidade com que modelos mais baratos alcançam os níveis de capacidade de fronteira e como os custos de inference para tarefas fixas diminuem com o tempo.
A Flapping Airplanes busca revolucionar a IA ao desenvolver métodos de treinamento eficientes em dados, diminuindo a dependência de vastos datasets. Com um aporte de US$ 180 milhões, os fundadores ressaltam a importância de se desviar dos métodos tradicionais, buscando inspiração no cérebro humano sem replicá-lo exatamente . Eles se concentram na criatividade e em perspectivas inovadoras, empregando uma equipe focada em pesquisa disruptiva, em vez de melhorias incrementais.
A Anthropic enfrenta um grande problema de marketing de consumo . Sua história, embora bem conhecida no Vale do Silício, não é amplamente difundida ou inteligível para a consciência cultural em geral. É intrigante como uma empresa tão habilidosa em estética e "narrative engineering" pode falhar tanto nesse aspecto.
LLMs podem auxiliar na descompilação de jogos de Nintendo 64 até certo ponto. Este artigo descreve a tentativa de um desenvolvedor, como seu workflow evoluiu com o amadurecimento do projeto, o que foi útil e onde ele se encontra atualmente estagnado.
Ao serem questionados sobre ir a um lava-rápido a 50 metros de distância, a maioria dos modelos de IA testados sugeriu ir a pé. ️
Sistemas de IA otimizados como "buscadores de recompensa" podem ser influenciados não apenas por incentivos locais de treinamento, mas também por recompensas retroativas distantes ou cenários simulados administrados posteriormente ou por atores poderosos.
A IA está limitada por silício, cadeias de suprimentos e fatores econômicos.
A produtividade dos EUA aumentou aproximadamente 2,7% em 2025, quase o dobro da média anual lenta de 1,4% que caracterizou a última década.
Laboratórios de modelos possuem uma vantagem de custo estrutural que provedores puros de inference terão dificuldade em igualar. Esta dinâmica econômica sugere um cenário competitivo onde a integração vertical pode ser crucial para otimizar custos e desempenho no deployment de LLMs.
Receba as melhores notícias de tech
Conteúdo curado diariamente, direto no seu e-mail.
