Gladia lança Solaria, modelo de reconhecimento de fala multilíngue baseado em IA

Gladia apresenta Solaria, modelo de IA para transcrição de fala em 100 idiomas, ideal para call centers e atendimento global.
Atualizado há 21 horas
Gladia lança Solaria, modelo de reconhecimento de fala multilíngue baseado em IA
Gladia transforma atendimentos globais com Solaria, a IA que transcreve em 100 idiomas. (Imagem/Reprodução: Venturebeat)
Resumo da notícia
    • A Gladia lançou o Solaria, um modelo de reconhecimento de fala baseado em IA para transcrição em tempo real.
    • O objetivo é melhorar o atendimento ao cliente em call centers e plataformas de voz com suporte a mais de 100 idiomas.
    • O impacto inclui redução de barreiras linguísticas e aumento da eficiência em operações globais.
    • O modelo também oferece análise de sentimento e tradução em tempo real, ampliando suas aplicações.
CONTINUA DEPOIS DA PUBLICIDADE

A Gladia, conhecida por suas soluções de inteligência de áudio e transcrição baseadas em IA, apresentou o Solaria. Trata-se de um modelo de reconhecimento automático de fala (ASR) projetado para comunicações em tempo real, especialmente em call centers e plataformas que utilizam voz.

O Solaria busca capacitar empresas a aprimorar suas operações de atendimento ao cliente com tecnologia de voz baseada em inteligência artificial. O modelo oferece suporte a mais de 40 idiomas que, segundo a empresa, não eram totalmente acessíveis com outras soluções, mantendo foco na qualidade e velocidade.

Embora a terceirização seja uma estratégia comum para reduzir custos em call centers, o suporte multilíngue em escala representa um desafio. Dados indicam que 49% dos executivos globais relataram perdas financeiras devido a barreiras linguísticas, aumentando a demanda por soluções multilíngues eficientes.

“Observamos um grande aumento na IA de voz no mercado. É como se a voz fizesse parte de nossas vidas novamente”, disse Jean-Louis Queguiner, CEO da Gladia. Ele acrescenta que o Solaria é um modelo em tempo real com capacidades avançadas, visando ser rápido e preciso, cobrindo 100 idiomas.

O produto também inclui funcionalidades como análise de sentimento e tradução em tempo real. Ele lida com tradução e transcrição de fala para texto, o que é útil para agentes de voz ou call centers que precisam responder a perguntas em diferentes idiomas.

CONTINUA DEPOIS DA PUBLICIDADE

Leia também:

Solaria: Um modelo para experiência do cliente global e Speech-to-text transcription

Solaria é um motor de speech-to-text transcription (STT) construído para escalabilidade global. Foi desenhado para atender às demandas dos centros de contato atuais, onde tanto a automação por IA quanto os agentes humanos necessitam de alta precisão, baixa latência e suporte multilíngue em tempo real.

O modelo apresenta resultados notáveis em reconhecimento de fala, combinando precisão com velocidade de processamento. Benchmarks recentes mostram que o Solaria alcançou uma taxa média de precisão de palavras (WAR) de 94% em inglês, espanhol, francês e outros idiomas comuns, mantendo uma latência de 270 milissegundos.

Enquanto a conversão de fala para texto em tempo real é frequentemente medida apenas pela velocidade, a precisão e a cobertura de idiomas são igualmente importantes para empresas que oferecem serviços em diversas regiões.

Diferente de outros modelos que podem priorizar a velocidade, o Solaria equilibra precisão e rapidez com uma cobertura de 100 idiomas, incluindo suporte exclusivo para 42 línguas não cobertas por concorrentes diretos. Para mercados populosos e centros de terceirização como Bangladesh, Índia e Filipinas, o Solaria oferece precisão em nível nativo para idiomas regionais.

Capacidades Empresariais do Solaria

Com transcrição em nível nativo, troca de código em tempo real e tradução entre todos os idiomas suportados, as empresas podem expandir para mercados globais. O Solaria foi projetado para automação de voz em escala empresarial, oferecendo:

  • Precisão elevada em idiomas de alta população como Tagalog, Bengali, Punjabi, Tâmil, Urdu, Persa e Marathi.
  • Capacidade de adaptar o modelo a jargões específicos da indústria (como termos médicos ou financeiros) e extrair dados críticos, como nomes, endereços e números.
  • Processamento de fala adaptativo, garantindo alta precisão em ambientes ruidosos de call center.
  • Segurança de dados de nível empresarial, em conformidade com GDRP, HIPPA e SOC 2.
CONTINUA DEPOIS DA PUBLICIDADE

Com a adição do Solaria ao seu portfólio, a Gladia permite que as empresas melhorem o atendimento ao cliente otimizando agentes de voz com IA. Isso torna IVRs e assistentes virtuais mais confiáveis em múltiplos idiomas, além de otimizar fluxos de trabalho assistidos por humanos com transcrições e traduções em tempo real.

“A fala é a forma mais natural de se conectar com o mundo. Pela primeira vez, o reconhecimento automático de fala está diminuindo a divisão, permitindo que humanos e IA realmente falem a mesma língua”, afirmou Jean-Louis Quéguiner em comunicado.

Ele complementa que com o Solaria, houve um avanço na tecnologia de voz alimentada por IA, abrindo novas oportunidades para negócios, impulsionando a eficiência e oferecendo experiências de cliente mais fluidas e impactantes em diversos idiomas e mercados.

Contexto da Empresa e Parcerias

Atendendo mais de 700 clientes empresariais globalmente, incluindo Attention, Circleback, Method Financial e VEED.IO, a Gladia oferece serviço e escalabilidade de nível empresarial. A empresa possui suporte dedicado e infraestrutura nos EUA e na Europa.

Como parte do lançamento do Solaria, a Gladia fez parceria com a LiveKit, um framework de desenvolvimento de código aberto para agentes de voz AI em tempo real. Isso visa fornecer capacidades globais de linguagem para desenvolvedores através da integração com a API da Gladia.

Após sua rodada de financiamento Series A de $16 milhões em 2024 e o lançamento do Solaria, a Gladia avança em sua meta de se estabelecer como um provedor de infraestrutura de áudio ponta a ponta. A empresa combina reconhecimento de fala, IA generativa e capacidades de geração de voz.

A Gladia, sediada em Paris, foi fundada em 2022 por Jean-Louis Queguiner (ex-OVHCloud) e Jonathan Soto (ex-MIT/Sigfox). A empresa relata mais de 150.000 usuários e 700 clientes empresariais. Existe um atraso de 300 milissegundos entre o início da fala e o primeiro evento de ativação de voz, com a transcrição levando 100 milissegundos.

Para melhorar ainda mais a precisão, Queguiner mencionou a necessidade de treinar com mais dados e trabalhar com aumentos de dados para tornar o modelo mais robusto. A empresa possui preços empresariais, ainda não divulgados, mas afirma que estarão entre as soluções mais acessíveis do mercado. A Gladia conta com quase 40 funcionários.

O desenvolvimento contínuo de tecnologias como o Solaria indica uma tendência crescente na aplicação de IA para superar barreiras de comunicação e otimizar interações em um cenário globalizado, similar aos avanços vistos em outras áreas, como a geração de imagens por IA e a otimização de softwares empresariais.

Este conteúdo foi auxiliado por Inteligência Artificial, mas escrito e revisado por um humano.

André atua como jornalista de tecnologia desde 2009 quando fundou o Tekimobile. Também trabalhou na implantação do portal Tudocelular.com no Brasil e já escreveu para outros portais como AndroidPIT e Techtudo. É formado em eletrônica e automação, trabalhando com tecnologia há 26 anos.