O ChatGPT agora pode ouvir, ver e falar, abrindo um novo mundo de possibilidades para como interagimos com chatbots de IA. Os novos recursos desbloqueiam a capacidade de ter uma conversa de voz com o ChatGPT ou mostrar fisicamente ao bot do que você está falando.
De acordo com a postagem oficial do blog OpenAI, em breve você poderá mostrar as fotos do bot de um marco durante as férias e ter uma conversa sobre a história por trás da estrutura. Você também pode enviar ao bot uma foto do conteúdo da sua geladeira e fazer com que ele crie uma receita em potencial.
Os novos recursos serão lançados para usuários do ChatGPT Plus e Enterprise primeiro nas próximas semanas. A voz está chegando aos aplicativos iOS e Android, e as imagens estarão disponíveis em todas as plataformas. Como acontece com a maioria dos recursos do ChatGPT, os usuários que não estão inscritos na plataforma Plus provavelmente verão os recursos um pouco mais tarde.
ChatGPT fala de volta
A postagem do blog observa que agora você poderá se envolver em conversas de ida e volta com seu assistente de IA em qualquer lugar por meio do aplicativo de telefone. Pelo que podemos dizer, seria uma experiência semelhante a como você falaria com a Siri ou a Amazon Alexa.
O exemplo de vídeo na postagem do blog (abaixo) mostra uma interface de usuário elegante com uma voz pedindo ao ChatGPT para contar uma história para dormir, com o usuário interrompendo de vez em quando para fazer perguntas.
Leia também:
Independentemente de como você possa se sentir sobre a tecnologia, ainda é muito impressionante. Teremos que esperar para ver se as conversas reais combinam com o exemplo perfeito no vídeo, mas se isso acontecer, Siri e Amazon Alexa têm muito com o que se preocupar. Se eu posso acessar um chatbot falante e inteligente como o ChatGPT, que analisa imagens e pode se aprofundar sobre tópicos sem pausa, por que eu usaria outros assistentes virtuais?
Se você for assinante do Plus, vá para Configurações, clique em “Novos recursos” no aplicativo móvel e ative as conversas de voz. Você poderá escolher sua voz favorita entre cinco opções diferentes: Sky, Cove, Ember, Breeze e Juniper, e você pode ouvir cada uma delas no site oficial.
Visão para olhos cansados
O ChatGPT também pode agora ver mais de uma imagem. Você pode mostrar gráficos que precisam ser analisados, obter ajuda com a lição de casa ou apenas mostrar um rascunho do trabalho sobre o qual você gostaria de feedback, mas não pode se preocupar em digitar.
Se você quiser que ele se concentre em algo específico na foto, você pode usar a nova ferramenta de desenho dentro do aplicativo ChatGPT e circular exatamente no que você deseja que o bot se concentre.
Embora isso seja assustadoramente impressionante para um chatbot de IA generativo, há preocupações que imediatamente vêm à mente ao ouvir sobre os novos recursos.
A OpenAI reconhece essas preocupações na parte inferior do anúncio, afirmando que com os novos recursos surgem novos desafios, incluindo alucinações – basicamente uma resposta incorreta dada por um bot de IA, mas entregue com confiança – e a possibilidade dos recursos de voz que se passam por figuras públicas ou cometem fraudes.
Para combater isso, a OpenAI afirma que o Voice Chat foi criado com dubladores reais, e o recurso de entrada de imagem foi testado com domínios rosh em extremismo e proficiência científica, para “alinhar os principais recursos para o uso responsável”.
Estamos incrivelmente animados para experimentar os novos recursos, especialmente a capacidade de conversar diretamente com o ChatGPT e sondar sua mente. Também estamos ansiosos para ver como isso se estenderá a outros produtos, como Bing AI, Google Bard e até mesmo o projeto de IA emergente da Meta. Como o ChatGPT é um pioneiro em IA, a introdução de novos recursos como esse significará que todos os outros terão que se atualizar.