Pacientes paralisados podem se comunicar em tempo quase real com nova tecnologia

Nova tecnologia transforma sinais cerebrais em fala quase instantânea, revolucionando a comunicação para pacientes paralisados.
Atualizado há 2 dias
Pacientes paralisados podem se comunicar em tempo quase real com nova tecnologia
Nova tecnologia converte sinais cerebrais em fala, mudando vidas de pacientes paralisados. (Imagem/Reprodução: Neowin)
Resumo da notícia
    • Pesquisadores desenvolveram uma tecnologia que converte sinais cerebrais em fala quase instantânea para pacientes paralisados.
    • Você pode ver como essa inovação pode melhorar a qualidade de vida de pessoas com limitações de comunicação.
    • A tecnologia reduz o tempo de resposta para menos de um segundo, tornando a comunicação mais natural e eficiente.
    • A voz sintetizada pode ser personalizada para se assemelhar à voz original do paciente, aumentando a autenticidade.
CONTINUA DEPOIS DA PUBLICIDADE

Pesquisadores das universidades UC Berkeley e UC San Francisco revelaram um avanço que pode mudar a forma como pacientes paralisados se comunicam. Uma nova tecnologia transforma sinais cerebrais em fala quase instantânea, reduzindo o atraso na comunicação para menos de um segundo. Esse método usa Interface cérebro-computador alimentada por inteligência artificial para decodificar os pensamentos e convertê-los em voz, aproximando-se de um diálogo fluido.

Nova etapa no uso da Interface cérebro-computador para fala quase natural

O sistema, publicado na revista científica Nature Neuroscience, elimina o principal obstáculo que era o tempo entre a intenção de falar e a produção do som. Técnicas anteriores apresentavam uma média de oito segundos de atraso para frases completas. Agora, o intervalo fica abaixo de um segundo, trazendo uma experiência de comunicação contínua.

Nesse processo, a pessoa imagina as palavras que deseja pronunciar. Enquanto isso, sensores — que podem ser não invasivos com eletrodos na pele ou mais invasivos no cérebro — enviam sinais para um software alimentado por inteligência artificial. O algoritmo, semelhante ao que está por trás de assistentes virtuais como Siri ou Alexa, interpreta esses sinais e gera fala audível em tempo quase real.

Essa tecnologia traduz sinais do córtex motor, região que prepara os movimentos da fala. Os pesquisadores usaram gravações cerebrais de participantes tentando falar silenciosamente. O sistema aprendeu padrões neuronais ligados às palavras, preenchendo os detalhes ausentes por meio de modelos de IA para formar palavras reconhecíveis.

Além da velocidade, um dos pontos destacados pelos cientistas é que a voz sintetizada pode ser moldada para se parecer com a original do paciente. Eles usaram registros da fala antes da paralisia como referência para criar uma voz mais familiar e pessoal, tornando a experiência mais autêntica.

CONTINUA DEPOIS DA PUBLICIDADE

Leia também:

Desafios técnicos, diversidade de equipamentos e precisão na fala gerada

De acordo com a equipe, o algoritmo se adapta a diferentes níveis de captação dos sinais cerebrais, funcionando desde métodos não invasivos até as técnicas cirúrgicas que colocam eletrodos dentro do cérebro. O essencial é captar sinais confiáveis para que o sistema faça a conversão correta.

A precisão da fala gerada também impressionou no estudo, mesmo com termos que o sistema não conhecia previamente. Por exemplo, os cientistas testaram palavras incomuns como os nomes do alfabeto fonético da OTAN (‘Alpha’, ‘Bravo’, etc.) e a IA conseguiu produzi-las com clareza, sugerindo uma capacidade futura de lidar com vocabulário amplo.

Outro aspecto do projeto é a melhoria do realismo na fala sintetizada, buscando incluir variações naturais da voz. A equipe trabalha para que a tecnologia reproduza entonações emocionais, como mudanças de pitch e volume, refletindo sentimentos ou ênfases que as pessoas colocam ao falar.

Segundo o neurocirurgião Edward Chang, líder da equipe da UCSF, essa solução pode facilitar que pessoas com lesão neuromotora grave voltem a se expressar de forma mais próxima da fala normal, viabilizando a comunicação espontânea no dia a dia.

Perspectivas para uso prático e evolução da comunicação assistida

Testes apontam que a solução pode ser usada em diversos tipos de interface, desde sensores externos até implantes intracranianos. A rapidez obtida representa um avanço em relação às tecnologias tradicionais, tornando os diálogos menos truncados e mais próximos do comportamento natural.

CONTINUA DEPOIS DA PUBLICIDADE

Com o suporte do National Institute on Deafness and Other Communication Disorders, o projeto tem foco em devolver a autonomia comunicacional aos pacientes. O uso imediato envolve pessoas que perderam movimentos por AVCs, doenças neuromusculares ou acidentes, ampliando as opções além de teclados virtuais ou sintetizadores lentos.

Os próximos passos incluem personalizar ainda mais as vozes e transportar emoções verdadeiras para a fala digital. Isso ajudaria, por exemplo, gestores ou professores a manterem sua expressividade, mesmo ao usar uma neuroprótese. O desenvolvimento também considera a integração dessas tecnologias com sistemas multimodais baseados em IA, como os apresentados recentemente na área de inteligência artificial multimodal pelo Llama 4 em outro projeto com IA.

Especialmente porque a rapidez — inferior a um segundo — foi conquistada sem perder a precisão, este método pode abrir caminho para implantar de forma mais acessível e prática os sistemas de Interface cérebro-computador no futuro próximo, aproximando a fala digital da comunicação típica.

Com o progresso da inteligência artificial, como ilustram várias outras pesquisas citadas em avanços recentes, e o desenvolvimento de baterias alternativas para alimentar dispositivos médicos — caso do projeto que transforma resíduos nucleares em energia, detalhado em células feitas com resíduos nucleares —, as interfaces neurais podem ganhar ainda mais autonomia.

Na prática, a expectativa dos cientistas é que soluções como essa possam ser aplicadas para restaurar a comunicação eficiente e emocional em vários quadros neuromotores, reduzindo barreiras para quem vive com paralisia grave e outros distúrbios que afetam a fala convencional.

Este conteúdo foi auxiliado por Inteligência Artificial, mas escrito e revisado por um humano.

Via Neowin

André atua como jornalista de tecnologia desde 2009 quando fundou o Tekimobile. Também trabalhou na implantação do portal Tudocelular.com no Brasil e já escreveu para outros portais como AndroidPIT e Techtudo. É formado em eletrônica e automação, trabalhando com tecnologia há 26 anos.