A Cursor, uma startup de codificação com IA, está próxima de captar US$2 bilhões em financiamento, com potencial para dobrar sua avaliação para US$50 bilhões. Espera-se que a Thrive e a Andreessen Horowitz liderem esta rodada, com a possível participação da Battery Ventures e da Nvidia. A Cursor almeja triplicar sua receita anualizada para mais de US$6 bilhões até o final de 2026, impulsionada por seu modelo proprietário Composer e por mudanças estratégicas que visam alcançar a lucratividade.

CEVIU News - CEVIU IA - 20 de abril de 2026
💰 CEVIU IA
Claude Design é uma ferramenta para criar trabalhos visuais utilizando o modelo de visão Claude Opus 4.7. Ela permite que os usuários desenvolvam protótipos, pitch decks e materiais de marketing, automatizando a consistência da marca e facilitando a colaboração. A ferramenta se integra ao Claude Code para uma transição fluida do protótipo para a produção.
A duração das tarefas que os agentes de IA conseguem realizar tem crescido exponencialmente nos últimos sete anos. Os modelos mais recentes podem (às vezes) executar tarefas que levariam algumas horas para um ser humano. Contudo, o custo para atingir esses horizontes de tempo está aumentando exponencialmente, e os custos horários de alguns modelos já se aproximam dos custos humanos. Haverá, em algum momento, uma divergência entre o que é possível em termos de tempo e o que é economicamente viável.
Dois dos arquitetos por trás das mais ambiciosas iniciativas da OpenAI, Kevin Weil e Bill Peebles, estão deixando a empresa. Weil liderou a iniciativa de pesquisa científica da companhia, enquanto Peebles foi o pesquisador responsável pelo Sora. Ambos anunciaram suas saídas na sexta-feira. A OpenAI decidiu recentemente cortar 'projetos secundários', consolidando seus esforços na IA empresarial e em seu futuro superapp.
O NEMOTRON OCR V2, desenvolvido com dados sintéticos, é um modelo OCR multilíngue rápido e preciso que alcança melhorias significativas na acurácia, reduzindo as pontuações NED para quase zero em idiomas não-ingleses. Utilizando um pipeline de dados sintéticos com texto mOSCAR e diversas fontes, o modelo é treinado com anotações pixel-perfect em diferentes idiomas, permitindo a generalização para documentos do mundo real. Sua arquitetura unificada reutiliza feature maps, atingindo velocidades de 34,7 páginas por segundo em uma única GPU A100 e superando modelos especializados em tarefas de OCR para idiomas diversos.
A Anthropic é o único grande laboratório de IA a publicar os system prompts de seus sistemas de chat voltados para o usuário. A empresa acaba de lançar o Opus 4.7, que apresenta um system prompt atualizado. O autor utilizou o Claude Code para pegar a versão em Markdown desses system prompts, dividi-los em documentos separados e, em seguida, construir um histórico Git desses arquivos com datas de commit falsas. O resultado dessa análise está disponível na publicação.
A inferência híbrida para Android é uma nova API para o Firebase AI Logic que aproveita tanto a inference on-device quanto a inference em cloud. Ela suporta os novos modelos Gemini do Google, incluindo os mais recentes modelos Nano Banana de geração de imagem. A nova API permite que aplicativos alternem dinamicamente entre o Gemini Nano rodando localmente on-device e os modelos Gemini hospedados em cloud. Este recurso ainda está em fase experimental.
A xAI lançou APIs independentes Grok de Speech-to-Text (STT) e Text-to-Speech (TTS), ampliando as opções para desenvolvedores integrarem capacidades avançadas de fala. Essas APIs oferecem alta precisão, baixa latência, timestamps em nível de palavra, diarização de locutor e normalização inversa de texto inteligente em mais de 25 idiomas. O Grok STT se destaca pela precisão na transcrição de chamadas telefônicas e em vídeos/podcasts, fornecendo soluções robustas para os setores médico, jurídico e financeiro.
Prefill-as-a-Service (PrfaaS) é uma arquitetura de serving cross-datacenter que descarrega seletivamente o prefill de contexto longo para clusters de prefill autônomos e densos em compute. Em seguida, transfere o KVCache resultante via Ethernet comercial para clusters locais de PD para decodificação. Esta abordagem combina a eficiência KV do lado do modelo com um offloading seletivo do lado do sistema, agendamento sensível à largura de banda e alocação de requisições sensível ao cache. O design do PrfaaS elimina a exigência de que aceleradores heterogêneos compartilhem o mesmo fabric RDMA de baixa latência, permitindo o escalonamento independente da capacidade de prefill e decodificação entre clusters fracamente acoplados. Uma implantação heterogênea aumentada por PrfaaS alcança maior throughput de serving, consumindo apenas uma largura de banda cross-datacenter modesta.
Claude Code é uma ferramenta de codificação baseada em agente, capaz de executar comandos de shell, editar arquivos e invocar serviços externos em nome do usuário. Este estudo detalha sua arquitetura através da análise do código-fonte TypeScript publicamente disponível, estabelecendo uma comparação com o OpenClaw. O núcleo do sistema opera em um loop 'while' simples que chama o modelo, executa ferramentas e repete a sequência. Embora o OpenClaw enfrente desafios de design semelhantes, suas respostas arquiteturais divergem conforme o contexto de deployment. A pesquisa também aponta seis direções de design em aberto para o desenvolvimento de futuros sistemas baseados em agentes.
O Google está em negociações com a Marvell Technology para desenvolver uma unidade de processamento de memória e um TPU otimizado para inference. Essa movimentação ocorre enquanto o mercado de ASICs customizados projeta um crescimento de 45% em 2026, com expectativa de alcançar US$ 118 bilhões até 2033. A Broadcom, que é a principal parceira do Google para chips customizados, anunciou recentemente um acordo de longo prazo para projetar e fornecer TPUs e componentes de rede até 2031. As conversas com a Marvell, no entanto, ainda não resultaram em um contrato assinado.
Modelos de IA aprimorados, como Opus 4.5 e GPT-5.2, resultaram em um aumento de 44% no uso de IA por desenvolvedores, permitindo a execução de tarefas mais complexas após um período inicial de adaptação. Este crescimento notável foi observado em diversos setores, incluindo mídia e publicidade, impulsionado tanto por pressões competitivas quanto pela emergência de novas oportunidades. A mudança no perfil de trabalho dos desenvolvedores se tornou evidente, com um foco crescente na gestão da saída da IA. Houve um aumento significativo em atividades relacionadas à documentação, arquitetura de sistemas e tarefas de aprendizado.
A Canon estrutura seu pipeline de busca utilizando um DAG (Directed Acyclic Graph) para assegurar concorrência automática em processos como classificação, localização, retrieval e ranking. Essa configuração proporciona controle independente sobre os nós, facilitando a modificação de subsistemas específicos sem impactar a funcionalidade geral do pipeline. O framework DAG otimiza a execução por meio de paralelismo, garante execução durável com retries específicos para cada nó e oferece introspecção clara, além de um desacoplamento eficaz da execução.
A versão Canva IA 2.0 está disponível a partir de hoje como uma prévia de pesquisa para o primeiro milhão de usuários que acessarem o site do Canva.
O Google está testando uma ponte entre as assinaturas Gemini e o AI Studio, com o objetivo de oferecer aos usuários acesso a tokens baseado em assinatura, em vez de uma cobrança separada por API-key.
Receba as melhores notícias de tech
Conteúdo curado diariamente, direto no seu e-mail.
