Apple revela nova arquitetura de IA com modelos Gemini do Google
Aprofundamento CEVIU
Aprofundamento
A nova arquitetura de IA da Apple não é uma simples integração do Gemini, é um sistema híbrido com três camadas distintas: modelos leves executados diretamente no chip A19 ou M5 (para tarefas rápidas como correção ortográfica), modelos médios rodando na Private Cloud Compute (PCC) da Apple dentro de data centers próprios (como resumos de e-mails ou tradução em tempo real), e modelos pesados, como o Gemini 3.5 Flash, operando sob contrato na Google Cloud, mas com isolamento criptográfico total via PCC. Isso explica por que a Apple paga US$ 1 bilhão por ano: não está licenciando um modelo genérico, mas uma versão personalizada do Gemini 3.5 Flash com fine-tuning específico para contexto pessoal (calendário, mensagens, fotos) e com restrições de saída que impedem a geração de conteúdo fora do escopo autorizado, algo que o Gemini padrão não faz.
O hardware exige atualização: apenas iPhone Air, iPhone 17 Pro e iPhone 17 Pro Max suportam os modelos locais mais avançados, graças aos 12 GB de memória unificada. O iPhone 17 padrão fica restrito à nuvem, e só à PCC, nunca ao Google Cloud direto. Essa divisão entre 'on-device', 'on-PCC' e 'on-Google-Cloud-via-PCC' é técnica e intencional: mantém a promessa de privacidade sem sacrificar capacidade, mas também cria uma linha de corte clara entre usuários premium e o restante.
O que mudou
Em 29 de maio, a CEVIU noticiou que a Apple 'buscava integrar o Gemini massivo' com técnicas de distillation, um plano ainda em fase de teste. Hoje, ela revelou a arquitetura final: não há distillation. A Apple descartou essa abordagem após testes com o Gemini 3.1 Pro e optou por execução nativa em múltiplas camadas, com fallback automático entre local, PCC e Google Cloud. Também mudou o modelo alvo: deixou o Gemini 3.1 Pro de lado e adotou o Gemini 3.5 Flash, lançado em 19 de maio, por sua eficiência em fluxos agenticos e janela de contexto de 1 milhão de tokens, essencial para tarefas como analisar um PDF inteiro e extrair dados para o Planilhas do Numbers.
Por que isso importa
Isso redefine o que significa 'IA de ponta' em dispositivos móveis: não é mais sobre ter o maior modelo possível, mas sobre orquestrar diferentes modelos conforme a tarefa, a latência aceitável e o custo de processamento, tudo sob controle do usuário. A escolha do Gemini 3.5 Flash, e não do GPT-4.5 ou Claude 4, mostra que a Apple priorizou desempenho em raciocínio multimodal e custo por token, não apenas fama de marca. E, embora a parceria seja estratégica, ela é temporária: a Apple já treina o Ferret-3, seu modelo de 1 trilhão de parâmetros, para substituir o Gemini em 2027, o que torna esta arquitetura menos uma aliança duradoura e mais um 'contrato de transição' com prazo certo.
Linha do tempo
Apple anuncia planos para IA multi-modelo no iOS 27, permitindo escolha de provedores de IA de terceiros
Google lança Gemini 3.5 Flash na I/O 2026, com foco em agentes autônomos e baixo custo por token
CEVIU revela que Apple testa integração do Gemini com distillation para nova Siri
Apple expande Private Cloud Compute para incluir Google Cloud com isolamento criptográfico
Apple revela nova arquitetura de IA com Gemini 3.5 Flash operando em três camadas: dispositivo, PCC própria e Google Cloud via PCC
Perguntas frequentes
A Siri vai usar Gemini o tempo todo?
Não. A Siri AI decide automaticamente qual camada usar: se for corrigir um erro de digitação, roda localmente; se for resumir uma reunião gravada de 45 minutos, usa a PCC; se for comparar preços de voos em 3 sites diferentes com filtros personalizados, aciona o Gemini 3.5 Flash na Google Cloud, mas só depois de criptografar os dados e garantir que nenhuma informação pessoal seja retida.
Por que a Apple não usou seus próprios modelos desde o início?
Seus modelos atuais, como o Ferret-2, têm bom desempenho em tarefas específicas (ex.: reconhecimento de objetos em fotos), mas falham em raciocínio complexo e multimodal. O Gemini 3.5 Flash supera o Ferret-2 em 42% nos benchmarks de matemática e 68% em análise de vídeo com áudio, lacunas que a Apple não poderia fechar sozinha até 2027.
Essa integração com o Google afeta a privacidade?
Não mais do que antes. Os dados enviados para a Google Cloud passam primeiro por um enclave seguro da PCC na infraestrutura da Apple. O Google só recebe tokens cifrados e não tem acesso à chave de decriptação. Após o processamento, os dados são apagados imediatamente, e o relatório de auditoria da PCC de 8 de junho confirma que isso já está em produção.
Quando chega para o Brasil?
A partir do outono de 2026 (setembro/outubro), mas só para dispositivos compatíveis. A versão brasileira terá suporte nativo para português do Brasil em todos os níveis, inclusive no Gemini 3.5 Flash, que foi adaptado com fine-tuning em corpus de conversas reais de apps como WhatsApp e Telegram no país.
- Categoria
- CEVIU
- Publicado
- 09 de junho de 2026
- Fonte
- CEVIU
