Google lança uso nativo de computador no Gemini 3.5 Flash
Aprofundamento CEVIU
Aprofundamento
O lançamento do Gemini 3.5 Flash com uso nativo de computador marca uma mudança estrutural na forma como os modelos de IA interagem com o ambiente digital. Antes, a capacidade de operar em desktops exigia um modelo separado, o Gemini 2.5 Computer Use, que funcionava como um agente autônomo com limitações de escalabilidade e integração. Agora, essa funcionalidade está embutida no modelo principal, o que elimina camadas intermediárias e reduz latência. O modelo não apenas interpreta imagens de tela, mas executa ações complexas como rolagem contínua, clique em elementos dinâmicos e digitação em formulários com base em contexto visual e lógico.
Isso abre caminho para automações de longo prazo em ambientes corporativos, como testes automatizados de software, migração de dados entre sistemas legacy ou preenchimento de relatórios em ferramentas como Excel ou SAP. A Google também reforça segurança com treinamento adversarial direcionado contra ataques por prompt injection, além de oferecer dois mecanismos opcionais para empresas: confirmação explícita de ações sensíveis e parada automática diante de sinais de manipulação indireta. Essa abordagem é crítica em setores regulados, onde erros de automação podem gerar falhas financeiras ou legais.
Por que isso importa
A integração nativa do uso de computador no Gemini 3.5 Flash representa um salto técnico em agentes autônomos. Em vez de depender de interfaces externas ou workflows fragmentados, o modelo agora atua diretamente no sistema operacional, com desempenho superior ao do modelo anterior. Isso muda o jogo para desenvolvedores que querem construir agentes de trabalho profissional capazes de executar tarefas end-to-end sem intervenção humana constante. Para empresas, isso significa menos dependência de scripts fixos e mais flexibilidade em processos que envolvem múltiplas aplicações. É o primeiro passo real para IA que não só entende tarefas, mas as realiza no mundo digital real.
Linha do tempo
Google lança uso nativo de computador no Gemini 3.5 Flash, integrando a funcionalidade diretamente no modelo principal
Perguntas frequentes
O que exatamente significa 'uso nativo de computador' no Gemini 3.5 Flash?
Significa que o modelo pode interagir diretamente com janelas, menus e botões do sistema operacional, sem precisar de plugins ou interfaces externas. Ele vê a tela, entende o que está lá e toma ações como clicar, rolar ou digitar, tudo dentro do próprio fluxo da aplicação.
Como o Gemini 3.5 Flash evita que um ataque por prompt injection cause danos reais?
A Google usou treinamento adversarial específico para detectar tentativas de manipulação. Além disso, oferece duas opções para empresas: exigir confirmação humana antes de ações críticas e parar automaticamente se houver sinais de injecção indireta. Isso cria uma camada de defesa prática.
Esse recurso funciona em todos os tipos de software ou apenas em navegadores?
Funciona em ambientes de desktop, incluindo aplicações nativas (como Word, Excel, Photoshop) e web. A capacidade de lidar com diferentes tipos de interface, desde páginas HTML até softwares com UI customizada, é uma das principais vantagens do modelo atual.
Posso usar esse modelo para automatizar minhas tarefas do dia a dia?
Sim. Se você tem tarefas repetitivas em seu PC, como preencher formulários, copiar dados entre planilhas ou atualizar registros, o Gemini 3.5 Flash pode ser configurado para executar essas ações com base em suas instruções. A segurança permite que você mantenha controle sobre decisões sensíveis.
Fontes
- blog.googlefonte original
- Categoria
- CEVIU IA
- Publicado
- 25 de junho de 2026
- Editoria
- CEVIU IA

