A Microsoft anunciou a chegada dos modelos GPT-4o Mini Audio models Realtime-Preview e GPT-4o-Mini-Audio-Preview para o Azure OpenAI Service. Essas novidades prometem transformar a maneira como as interações de voz e a criação de conteúdo com inteligência artificial são realizadas. Com esses modelos, desenvolvedores e empresas poderão criar experiências de áudio mais acessíveis e eficientes.
Novidades do Azure OpenAI com GPT-4o Mini Audio models
O modelo GPT-4o-Mini-Realtime-Preview traz uma nova abordagem para as interações de voz em tempo real. Com ele, os desenvolvedores podem criar experiências de voz para seus aplicativos, como chatbots de atendimento ao cliente e assistentes virtuais. As funcionalidades de áudio desse modelo permitem interações mais naturais e intuitivas, diminuindo os tempos de resposta.
Além da capacidade de tempo real, o modelo GPT-4o-Mini-Audio-Preview proporciona interações de áudio de alta qualidade por um custo menor em relação aos modelos de áudio GPT-4o já existentes. Essa economia torna mais acessível para as empresas utilizarem funcionalidades de áudio com inteligência artificial em seus aplicativos, desde a análise de sentimentos até a criação de conteúdo de texto para áudio.
Allan Carranza, gerente sênior de produtos do Azure OpenAI, afirma que ambos os modelos serão integrados às APIs Realtime e Chat Completion, proporcionando continuidade na experiência das famílias de modelos no serviço OpenAI do Azure. Essa integração garante que os desenvolvedores possam usar os novos modelos de forma eficiente e consistente com as ferramentas existentes.
Aplicações dos GPT-4o Mini Audio models em diversas indústrias
As aplicações para esses novos modelos são diversas e abrangem várias indústrias. Voice bots e assistentes virtuais locais poderão responder a perguntas de forma mais eficaz, aumentando a satisfação do cliente. Criadores de conteúdo poderão transformar seus fluxos de trabalho na geração de fala para videogames, podcasts e estúdios de cinema.
Leia também:
Além disso, serviços de saúde e jurídicos poderão oferecer tradução de áudio em tempo real, quebrando barreiras de idioma com essa tecnologia. A possibilidade de tradução em tempo real é uma grande vantagem para esses setores, permitindo uma comunicação mais eficaz e acessível.
Ainda segundo Carranza, os modelos GPT 4o associados às APIs Realtime e Chat Completion oferecem funcionalidades exclusivas para experiências de usuário orientadas por inteligência artificial, suportando capacidades de áudio e fala. Essa versatilidade permite que os desenvolvedores criem aplicativos inovadores e personalizados para atender às necessidades de seus usuários.
Disponibilidade e Acesso aos GPT-4o Mini Audio models
Os novos modelos GPT-4o-Mini-Realtime-Preview e GPT-4o-Mini-Audio-Preview já estão disponíveis na versão de visualização pública do Azure AI Foundry. Essa disponibilidade permite que desenvolvedores e empresas comecem a explorar e integrar esses modelos em seus projetos, aproveitando os benefícios das interações de voz em tempo real e da criação de conteúdo de áudio acessível.
A Microsoft está expandindo o acesso ao Azure OpenAI Service para mais desenvolvedores individuais na China, com algumas exceções, como parte de seus esforços para promover a inovação em IA em todo o mundo. No entanto, a empresa está encerrando o serviço para desenvolvedores individuais na China, exigindo que os usuários se inscrevam usando contas corporativas para garantir a conformidade regulatória.
Com essa medida, a Microsoft busca equilibrar a inovação com a responsabilidade, garantindo que seus serviços de IA sejam usados de forma ética e legal em todos os mercados. Essa abordagem reflete o compromisso da empresa com a segurança e a conformidade em um cenário global em constante evolução.
Este conteúdo foi auxiliado por Inteligência Artificial, mas escrito e revisado por um humano.
Via Neowin