Xiaomi libera modelo avançado de voz artificial com alto nível de naturalidade

Xiaomi disponibiliza modelo de voz AI que aprende rapidamente e entende tom, melhorando interações com tecnologia.
Xiaomi libera modelo avançado de voz artificial com alto nível de naturalidade
(Imagem/Reprodução: Xiaomitime)
Resumo da notícia
    • A Xiaomi tornou aberto o Xiaomi MiMo Audio, seu modelo avançado de voz de inteligência artificial treinado para compreensão contextual.
    • Você poderá se beneficiar de tecnologias de voz que entendem não apenas o conteúdo, mas também o tom e a intenção da fala.
    • Empresas e desenvolvedores podem treinar sistemas de voz com menos dados e conquistar respostas eficientes em diversos setores.
    • A disponibilização do código aberto estimula novas inovações e amplia o uso da inteligência artificial em voz para o público e negócios.
CONTINUA DEPOIS DA PUBLICIDADE

A Xiaomi anunciou recentemente uma grande novidade: a empresa está tornando o Xiaomi MiMo Audio, seu principal modelo de voz de inteligência artificial de ponta a ponta, de código aberto. Esta é uma notícia importante porque o Xiaomi-MiMo-Audio foi feito para aprender de verdade em contexto na fala. Isso pode mudar a forma como a IA entende e interage em plataformas de voz.

Ao invés do método antigo, que exigia muitos dados rotulados para funcionar, o Xiaomi-MiMo-Audio consegue se adaptar a novas tarefas com poucos exemplos. É como o que vimos com modelos como o Google integra inteligência artificial Gemini no mundo da linguagem, mas agora para a voz. O modelo foi treinado com centenas de milhões de horas de áudio. Isso permite que ele entenda não só o conteúdo, mas também o tom e a intenção, sendo um avanço relevante para negócios e produtos que lidam diretamente com clientes.

A Virada da Xiaomi na Inteligência Artificial de Voz

O que realmente faz o MiMo-Audio se destacar é o salto técnico na pré-treinamento de compressão sem perdas. Isso permite que o modelo consiga generalizar tarefas em grande escala. Na prática, empresas podem usar aplicações de voz com IA usando menos dados e treinando mais rápido para novas funções e setores.

CONTINUA DEPOIS DA PUBLICIDADE

A Xiaomi não está apenas criando; ela está compartilhando o conhecimento. A empresa liberou não apenas o modelo, mas também seu tokenizer, uma nova estrutura de modelo, ferramentas avançadas de treinamento e um pacote de avaliação. Esta iniciativa deve acelerar o desenvolvimento de todo o ecossistema de voz com IA. Ela oferece a desenvolvedores e empresas acesso a uma tecnologia madura e testada para diversos usos personalizados.

Para quem quer usar, os modelos de pré-treinamento e fine-tuning do Xiaomi-MiMo-Audio estão no Huggingface. O tokenizer foi lançado no GitHub. O modelo é baseado em uma arquitetura Transformer de 1.2 bilhão de parâmetros, o que o torna robusto. Ele serve tanto para reconstrução de áudio quanto para tarefas de áudio para texto.

Profissionais ou empresas que buscam aprimorar seus dispositivos podem encontrar aplicativos de sistema via HyperOSUpdates.com. Além disso, o aplicativo MemeOS Enhancer, disponível no Google Play, oferece ferramentas adicionais e acesso antecipado a recursos e atualizações do sistema HyperOS 3.

O lançamento do código aberto do Xiaomi-MiMo-Audio representa um movimento significativo para a comunidade de IA. A disponibilização de uma tecnologia tão avançada pode inspirar novas inovações e parcerias. Isso contribui para um futuro onde a interação por voz com a tecnologia se torne ainda mais natural e inteligente para todos.

Este conteúdo foi auxiliado por Inteligência Artificial, mas escrito e revisado por um humano.
Via Xiaomi Time

André atua como jornalista de tecnologia desde 2009 quando fundou o Tekimobile. Também trabalhou na implantação do portal Tudocelular.com no Brasil e já escreveu para outros portais como AndroidPIT e Techtudo. É formado em eletrônica e automação, trabalhando com tecnologia há 26 anos.