Um sistema de inteligência artificial não invasivo e pioneiro no mundo pode transformar pensamentos silenciosos em texto, exigindo apenas que os usuários usem um boné confortável.
Os pesquisadores australianos que desenvolveram a tecnologia, chamada DeWave, testaram o processo usando dados de mais de duas dezenas de indivíduos.
Os participantes leram silenciosamente enquanto usavam um boné que registrava suas ondas cerebrais por meio de eletroencefalograma (EEG) e as decodificava em texto.
Com mais refinamento, o DeWave poderia ajudar pacientes com AVC e paralisia a se comunicarem e tornar mais fácil para as pessoas dirigirem máquinas como braços biônicos ou robôs.
“Esta pesquisa representa um esforço pioneiro na tradução de ondas EEG brutas diretamente para a linguagem, marcando um avanço significativo na área”, diz o cientista da computação Chin-Teng Lin, da Universidade de Tecnologia de Sydney (UTS).
Embora o DeWave tenha alcançado apenas pouco mais de 40% de precisão com base em um dos dois conjuntos de métricas em experimentos conduzidos por Lin e colegas, isso representa uma melhoria de 3% em relação ao padrão anterior para tradução de pensamentos a partir de gravações de EEG.
O objetivo dos pesquisadores é melhorar a precisão para cerca de 90%, o que está no mesmo nível dos métodos convencionais de tradução de idiomas ou software de reconhecimento de fala.
Outros métodos de tradução de sinais cerebrais em linguagem requerem cirurgias invasivas para implantar eletrodos ou máquinas de ressonância magnética volumosas e caras, tornando-os impraticáveis para uso diário – e muitas vezes precisam usar rastreamento ocular para converter sinais cerebrais em pedaços de palavras.
Quando os olhos de uma pessoa passam de uma palavra para outra, é razoável supor que seu cérebro faça uma pequena pausa entre o processamento de cada palavra. A tradução da onda EEG bruta em palavras – sem rastreamento ocular para indicar a palavra-alvo correspondente – é mais difícil.
As ondas cerebrais de pessoas diferentes nem todas representam intervalos entre palavras da mesma maneira, tornando um desafio ensinar à inteligência artificial como interpretar pensamentos individuais.
Após um treinamento extensivo, o codificador do DeWave transforma as ondas de EEG em um código que pode então ser combinado com palavras específicas com base em quão próximas elas estão das entradas no “livro de códigos” do DeWave.
“É o primeiro a incorporar técnicas de codificação discreta no processo de tradução cérebro-texto, introduzindo uma abordagem inovadora à decodificação neural”, explica Lin.
“A integração com grandes modelos de linguagem também está abrindo novas fronteiras na neurociência e na inteligência artificial.”
Lin e sua equipe usaram modelos de linguagem treinados que incluíam uma combinação de um sistema chamado BERT com GPT, e o testaram em conjuntos de dados existentes de pessoas que tiveram rastreamento ocular e atividade cerebral registrados durante a leitura de texto.
Isso ajudou o sistema a aprender a combinar os padrões de ondas cerebrais com as palavras e, em seguida, o DeWave foi treinado ainda mais com um grande modelo de linguagem de código aberto que essencialmente cria frases a partir das palavras.
A tradução de verbos é onde o DeWave teve melhor desempenho. Os substantivos, por outro lado, tendiam a ser traduzidos como pares de palavras que significam a mesma coisa, em vez de traduções exatas, como “o homem” em vez de “o autor”.
“Achamos que isso ocorre porque quando o cérebro processa essas palavras, palavras semanticamente semelhantes podem produzir padrões de ondas cerebrais semelhantes”, diz o primeiro autor Yiqun Duan, cientista da computação da UTS.
“Apesar dos desafios, nosso modelo produz resultados significativos, alinhando palavras-chave e formando estruturas de frases semelhantes.”
O tamanho relativamente grande da amostra testada aborda o fato de que as distribuições das ondas EEG das pessoas variam muito, sugerindo que a pesquisa é mais confiável do que as tecnologias anteriores que só foram testadas em amostras muito pequenas.
Há mais trabalho a ser feito, e o sinal é bastante barulhento quando os sinais de EEG são recebidos através de uma tampa em vez de eletrodos implantados no cérebro.
“A tradução de pensamentos diretamente do cérebro é um empreendimento valioso, mas desafiador, que justifica esforços contínuos significativos”, escreve a equipe.
“Dado o rápido avanço dos grandes modelos de linguagem, métodos de codificação semelhantes que unem a atividade cerebral à linguagem natural merecem maior atenção.”
Publicado em ScienceAlert
Traduzido por Mateus Lynniker