Inteligência Artificial pode prever diagnóstico de COVID-19

Algoritmos acertaram o resultado do exame em quase 80% dos casos, segundo estudo preliminar da Faculdade de Saúde Pública da USP.

0
296
Inteligência artificial se mostra uma grande aliada na luta contra a COVID-19. Fotomontagem: Jornal da USP / Luana Franzão.

Por Herton Escobar
Publicado no Jornal da USP

Imagine a seguinte situação: um paciente chega ao pronto-atendimento do hospital reclamando de tosse, dores no corpo e cansaço. A sala está lotada de pessoas com sintomas parecidos. Após uma hora de espera, o paciente é avaliado pelo médico de plantão e encaminhado para coleta de sangue, swab de garganta e raio X pulmonar. A suspeita é de COVID-19, mas o resultado do teste molecular de RT-PCR, necessário para confirmar o diagnóstico, está demorando dias para ficar pronto. O hospital está cheio, novos doentes não param de chegar, e o médico precisa decidir se faz a internação ou não, sem saber exatamente o que o paciente tem.

É uma decisão difícil, especialmente num cenário de pandemia, e considerando que alguns casos de COVID-19 podem evoluir rapidamente de sintomas leves de desconforto respiratório para quadros graves de pneumonia. Agora, imagine se esse médico – fictício, mas inspirado em situações reais – tivesse um aplicativo que pudesse lhe dizer, em questão de segundos, qual é a probabilidade desse paciente ter COVID-19 e de ele vir a precisar de internação, necessitar de ventilação mecânica, ou até mesmo vir a óbito.

É exatamente esse tipo de ferramenta, baseada em inteligência artificial, que pesquisadores da Faculdade de Saúde Pública (FSP) da Universidade de São Paulo (USP) estão desenvolvendo para ajudar os profissionais de saúde a lidar com a tempestade de emergências gerada pelo novo coronavírus. “O algoritmo não decidiria pelos médicos, mas ofereceria a eles um substrato para tomar decisões com mais respaldo e mais tranquilidade”, diz o pesquisador Alexandre Chiavegatto Filho, diretor do Laboratório de Big Data e Análise Preditiva em Saúde (Labdaps) da FSP.

O primeiro desafio é ajudar no diagnóstico da doença, que é a informação mais importante que o médico precisa ter em mãos para encaminhar o paciente da forma correta. O teste de referência para diagnóstico da COVID-19 é o molecular, de RT-PCR, mas ele depende de laboratórios especializados e reagentes importados (que estão em falta no mercado) para ser realizado, o que tem causado atrasos na realização dos exames.

Chiavegatto e sua equipe, então, resolveram checar se era possível fazer uma previsão confiável desse diagnóstico por meio de técnicas de inteligência artificial (mais especificamente, a técnica de machine learning, ou aprendizado de máquina), utilizando apenas informações que já são coletadas como procedimento de rotina nos hospitais: idade, sexo e exame de sangue (hemograma) dos pacientes. Deu certo.

Um primeiro experimento foi feito com as informações de 235 pacientes adultos, atendidos com suspeita de COVID-19 em um grande hospital particular de São Paulo, entre 17 e 30 de março – dos quais 102 (43%) tiveram o diagnóstico da doença confirmado por RT-PCR. Os pesquisadores usaram os dados de 70% desses pacientes para treinar os algoritmos, e depois desafiaram esses algoritmos a tentar “adivinhar” o diagnóstico dos outros 30%. O índice de acerto foi de 78% para diagnóstico positivo e 77%, para diagnóstico negativo.

É um índice baixo, se comparado ao de um RT-PCR (que chega próximo de 100%), porém mais alto do que o de muitos “testes rápidos” sorológicos que estão sendo comercializados (com índices de acerto abaixo de 50%); e que pode melhorar muito ainda, com a inclusão de mais dados, segundo Chiavegatto.

“Não é uma questão de tempo, é uma questão de dados”, diz o pesquisador. “O algoritmo tem fome de dados. Quanto mais dados você dá para ele, melhor ele consegue enxergar detalhes e modelar as particularidades de uma determinada situação”.

Parece mágica que um computador consiga prever o diagnóstico de uma doença viral com base em parâmetros tão simples quanto idade, sexo e hemograma, mas a beleza do aprendizado de máquina está justamente nessa capacidade de olhar para um grande volume de dados e enxergar correlações que são imperceptíveis ao olho humano. Os hemogramas usados no estudo tinham 13 parâmetros, como hemoglobina, plaquetas, leucócitos, células vermelhas e outros.

O estudo foi aprovado pela Comissão Nacional de Ética em Pesquisa (Conep) e Chiavegatto está fechando colaborações com hospitais de várias outras cidades (Ribeirão Preto, Porto Alegre, Curitiba, Juiz de Fora, Campina Grande e Belém do Pará) para ampliar a base de dados e, assim, “alimentar o algoritmo”. A técnica ainda não está sendo usada na prática em nenhum hospital, mas tem grande potencial para isso, segundo ele. “Queremos gerar produtos o mais rápido possível, para ajudar nesta pandemia e nas próximas”, ressalta. “Deixamos tudo de lado no nosso laboratório e estamos 100% focados nisso; de plantão, aguardando a chegada dos dados”.

Com a ampliação do projeto, os pesquisadores esperam testar três estratégias de aplicação dos dados, para ver qual funciona melhor: 1) algoritmos treinados individualmente para cada hospital (de modo a contemplar as particularidades clínicas e socioeconômicas da população atendida por eles); 2) algoritmos treinados em hospitais de grande porte e aplicados a hospitais de menor porte (que talvez não tenham pacientes de COVID-19 suficientes para treinar seus próprios algoritmos); e 3) algoritmos treinados com um mix de dados nacionais e dos próprios hospitais.

Se a previsão de diagnóstico der certo, o próximo passo é tentar desenvolver algoritmos para prever desfechos cruciais de encaminhamento dos pacientes, como risco de internação em unidade de terapia intensiva (UTI), risco de necessidade de ventilação mecânica e risco de morte. Nesses casos, será necessário alimentar os algoritmos com outros dados de natureza clínica, como data de início dos sintomas, gravidade dos sintomas e presença de outros fatores de risco (comorbidades), como diabete e hipertensão. Mas a ideia, segundo Chiavegatto, é trabalhar sempre com dados que já são coletados dentro da rotina dos hospitais, “para não gerar nenhum trabalho adicional para os profissionais de saúde”.

“Vamos ver até onde conseguimos chegar com esses dados de rotina”, diz. “Queremos que isso seja aplicável ao SUS (Sistema Único de Saúde)”.

Os resultados do primeiro experimento com diagnósticos de COVID-19 foram publicados na medRxiv, uma plataforma de artigos científicos em formato preprint (ainda sem revisão por pares), como forma de disponibilizá-los imediatamente para análise da comunidade científica internacional, para depois serem submetidos a uma revista científica especializada.