OpenAI prepara o modo de voz bidirecional para o ChatGPT
Aprofundamento CEVIU
Aprofundamento
A OpenAI está prestes a transformar a experiência de voz do ChatGPT com o Bidi 1, um modelo que pela primeira vez permite verdadeira interação bidirecional em tempo real. Diferente da versão atual, que ainda sofre com cortes abruptos e perda de contexto, o novo sistema escuta, fala e reage simultaneamente, como uma conversa humana. O modelo já aparece no seletor do app, com indicador visual amarelo, e responde com pequenos gestos sonoros, como um 'okay' ao perceber pausas, sem interromper.
O diferencial técnico está na capacidade de manter o fluxo lógico mesmo após interrupções bruscas, algo que modelos anteriores não conseguiam. Se você pede para contar até dez e depois manda inverter a contagem no meio, ele ajusta na hora. Isso indica um salto no controle de estado conversacional, provavelmente alimentado por melhorias no pipeline de latência e no gerenciamento de turnos (turn-taking) em áudio.
Por que isso importa
Essa atualização fecha uma lacuna crítica entre os modelos de texto avançados da OpenAI e a interface de voz, até agora mais limitada. Ao tornar a conversa fluida e natural, a empresa prepara o terreno para uso contínuo do ChatGPT em cenários como direção, atendimento hands-free ou auxílio a pessoas com deficiência visual. Também acirra a competição com rivais como Google e Apple, que apostam forte em assistentes com IA contextual. O timing sugere que a OpenAI quer consolidar o ChatGPT como plataforma central de interação multimodal antes do lançamento do Codex com voz, previsto para semanas depois.
Linha do tempo
OpenAI começa a liberar o modo de voz bidirecional Bidi 1 para o ChatGPT, com suporte a escuta e fala simultâneas e melhor gestão de contexto
Perguntas frequentes
O que é o modo de voz bidirecional do ChatGPT?
É uma nova funcionalidade que permite ao ChatGPT falar, ouvir e escutar ao mesmo tempo, mantendo o contexto da conversa mesmo quando interrompido. Diferente do sistema anterior, ele não corta o usuário e reage naturalmente a pausas ou mudanças de tema.
O ChatGPT com Bidi 1 pode cantar músicas famosas?
Não. O modelo recusa reproduzir canções protegidas por direitos autorais. Ele pode, no entanto, criar trechos originais no estilo de um artista, o que mostra um filtro rigoroso de copyright embutido no sistema.
Quando o recurso estará disponível para todos?
A liberação está sendo feita de forma gradual e opt-in, começando por um grupo restrito de usuários no app e web. Não há data exata para disponibilidade global, mas a expansão deve ocorrer nas próximas semanas. A região do Espaço Econômico Europeu pode ter acesso mais tarde.
Fontes
- testingcatalog.comfonte original
- Categoria
- CEVIU IA
- Publicado
- 24 de junho de 2026
- Editoria
- CEVIU IA

