Descoberta de IA sugere que ainda não descobrimos metade do que está dentro de nossas células

0
79
Créditos: Iznewton / Wikimedia Commons.

Por Clare Watson
Publicado na ScienceAlert

Dentro de cada célula do corpo humano existe uma constelação de proteínas, milhões delas. Elas estão todas se espremendo, sendo rapidamente montadas, dobradas, embaladas, despachadas, cortadas e recicladas em uma variedade de atividades que funciona em um ritmo febril para nos manter vivos e operantes.

Mas sem um inventário completo do microcosmo de proteínas dentro de nossas células, os cientistas são pressionados a avaliar em um nível molecular o que há de errado em nosso corpo que leva à doença.

Agora, os pesquisadores desenvolveram uma nova técnica que usa Inteligência Artificial para assimilar dados de imagens microscópicas de células individuais e análises bioquímicas, visando criar um “mapa unificado” de componentes subcelulares – metade dos quais, ao que parece, nunca vimos antes.

“Os cientistas perceberam há muito tempo que há mais coisas que não sabemos do que sabemos, mas agora finalmente temos uma maneira de olhar mais profundamente”, disse o cientista da computação e biólogo de redes Trey Ideker, da Universidade da Califórnia (UC) em San Diego.

Os microscópios, por mais poderosos que sejam, permitem aos cientistas examinar o interior de células individuais, até o nível de organelas como as mitocôndrias, os pacotes de energia das células, e os ribossomos, as fábricas de proteínas. Podemos até adicionar corantes fluorescentes para marcar e rastrear proteínas facilmente.

As técnicas de bioquímica podem ser ainda mais profundas, concentrando-se em proteínas individuais usando, por exemplo, anticorpos direcionados que se ligam à proteína, puxando-a para fora da célula e vendo o que mais está ligado a ela.

Visão clássica de um corte transversal de eucariotos. Créditos: Mariana Ruiz / LadyofHats / Wikimedia Commons.

Combinando dados de imagem de uma biblioteca chamada Human Protein Atlas e mapas existentes de interações de proteínas, o algoritmo de aprendizado de máquina foi encarregado de calcular as distâncias entre os pares de proteínas.

O objetivo era identificar comunidades de proteínas que coexistem em células em diferentes escalas, desde as muito pequenas (menos de 50 nm) até as muito ‘grandes’ (mais de 1 μm).

Uma tímida das 70 comunidades de proteínas foi classificada pelo algoritmo, que foi treinado usando uma biblioteca de referência de proteínas com diâmetros conhecidos ou estimados e validadas com experimentos posteriores.

Cerca de metade dos componentes da proteína identificados são aparentemente desconhecidos da ciência, nunca documentados na literatura publicada, sugerem os pesquisadores.

Na mistura estava um grupo de proteínas formando uma estrutura desconhecida, que os pesquisadores descobriram ser provavelmente responsável por processar e cortar transcrições recém-feitas do código genético que são usadas para fazer proteínas.

Outras proteínas mapeadas incluíram sistemas de transporte transmembrana que bombeiam suprimentos para dentro e para fora das células, famílias de proteínas que ajudam a organizar cromossomos volumosos e complexos de proteínas cujo trabalho é produzir, digamos, mais proteínas.

Um esforço pesado, porém, não é a primeira vez que cientistas tentam mapear o funcionamento interno das células humanas.

Outros esforços para criar mapas de referência de interações de proteínas produziram números surpreendentes e tentaram medir os níveis de proteína nos tecidos do corpo humano.

Os pesquisadores também desenvolveram técnicas para visualizar e rastrear a interação e o movimento das proteínas nas células.

Este estudo pioneiro dá um passo adiante, aplicando aprendizado de máquina a imagens de microscopia celular que localizam proteínas em relação a grandes marcos celulares, como o núcleo, e dados de estudos de interação de proteínas que identificam os vizinhos mais próximos de uma proteína em nanoescala.

“A combinação dessas tecnologias é única e poderosa porque é a primeira vez que medições em escalas muito diferentes foram reunidas”, disse o bioinformático Yue Qin, também da Universidade da Califórnia em San Diego.

Ao fazer isso, a técnica de célula integrada em escala múltipla ou MuSIC (na sigla em inglês) “aumenta a resolução da imagem enquanto dá às interações de proteínas uma dimensão espacial, abrindo caminho para incorporar diversos tipos de dados em mapas celulares de todo o proteoma”, escreveram Qin, Ideker e seus colegas.

Para ser claro, esta pesquisa é muito preliminar: a equipe se concentrou em validar seu método e apenas analisou os dados disponíveis de 661 proteínas em um tipo de célula, uma linhagem de células renais que os cientistas vêm cultivando em laboratório há cinco décadas.

Os pesquisadores planejam aplicar sua técnica ultramoderna a outros tipos de células, disse Ideker.

Mas, enquanto isso, teremos que aceitar humildemente que somos meros intrusos dentro de nossas próprias células, capazes de compreender uma pequena fração do proteoma total.

“Eventualmente, poderemos ser capazes de compreender melhor a base molecular de muitas doenças, comparando o que é diferente entre células saudáveis ​​e doentes”, disse Ideker.

O estudo foi publicado na Nature.