Por Guillermo Dominguez Huerta, Ahmed Zayed, James Wainaina e Matthew Sullivan
Publicado no The Conversation
Uma análise do material genético de oceanos identificou milhares de vírus de RNA anteriormente desconhecidos e dobrou o número de filos, ou grupos biológicos, de vírus que se acredita existirem, de acordo com um novo estudo que nossa equipe de pesquisadores publicou na revista Science.
Os vírus de RNA são mais conhecidos pelas doenças que causam nas pessoas, desde o resfriado comum até a COVID-19. Eles também infectam plantas e animais importantes para as pessoas.
Esses vírus carregam suas informações genéticas em RNA, em vez de DNA. Os vírus de RNA evoluem a taxas muito mais rápidas do que os vírus de DNA. Enquanto os cientistas catalogaram centenas de milhares de vírus de DNA em seus ecossistemas naturais, os vírus de RNA têm sido relativamente pouco estudados.
Ao contrário de humanos e outros organismos compostos de células, no entanto, os vírus não possuem trechos curtos de DNA únicos que poderiam atuar como o que os pesquisadores chamam de código de barras genético. Sem esse código de barras, tentar distinguir diferentes espécies de vírus na natureza pode ser um desafio.
Para contornar essa limitação, decidimos identificar o gene que codifica uma determinada proteína que permite que um vírus replique seu material genético. É a única proteína que todos os vírus de RNA compartilham, porque desempenha um papel essencial na forma como eles se propagam. Cada vírus de RNA, no entanto, tem pequenas diferenças no gene que codifica a proteína que pode ajudar a distinguir um tipo de vírus de outro.
Então, selecionamos um banco de dados global de sequências de RNA de plâncton coletadas durante o projeto de pesquisa global de quatro anos de expedições Tara Oceans. Plâncton são quaisquer organismos aquáticos que são pequenos para nadar contra a corrente. Eles são uma parte vital das teias alimentares oceânicas e são hospedeiros comuns de vírus de RNA. Nossa triagem finalmente identificou mais de 44.000 genes que codificam a proteína do vírus.
Nosso próximo desafio, então, foi determinar as conexões evolutivas entre esses genes. Quanto mais semelhantes dois genes fossem, mais provavelmente os vírus com esses genes estavam intimamente relacionados. Como essas sequências evoluíram há muito tempo (possivelmente antes da primeira célula), os sinais genéticos indicando onde novos vírus podem ter se separado de um ancestral comum foram perdidos no tempo.
Uma forma de Inteligência Artificial chamada Aprendizado de Máquina, no entanto, nos permitiu organizar sistematicamente essas sequências e detectar diferenças de forma mais objetiva do que se a tarefa fosse feita manualmente.
Identificamos um total de 5.504 novos vírus de RNA marinho e dobramos o número de filos de vírus de RNA conhecidos de cinco para 10.
O mapeamento dessas novas sequências revelou geograficamente que dois dos novos filos eram particularmente abundantes em vastas regiões oceânicas, com preferências regionais em águas temperadas e tropicais (o Taraviricota, em homenagem às expedições dos oceanos de Tara) ou no Oceano Ártico (o Arctiviricota).
Acreditamos que Taraviricota pode ser o elo perdido na evolução dos vírus de RNA que os pesquisadores há muito procuram, conectando dois ramos diferentes conhecidos de vírus de RNA que divergiram na forma como se replicam.
Por que isso importa
Essas novas sequências ajudam os cientistas a entender melhor não apenas a história evolutiva dos vírus de RNA, mas também a evolução da vida primitiva na Terra.
Como a pandemia de COVID-19 mostrou, os vírus de RNA podem causar doenças mortais. Mas os vírus de RNA também desempenham um papel vital nos ecossistemas porque podem infectar uma ampla gama de organismos, incluindo micróbios que influenciam ambientes e teias alimentares no nível químico.
Mapear onde no mundo esses vírus de RNA vivem pode ajudar a esclarecer como eles afetam os organismos que conduzem muitos dos processos ecológicos que operam em nosso planeta. Nosso estudo também fornece ferramentas aprimoradas que podem ajudar os pesquisadores a catalogar novos vírus à medida que os bancos de dados genéticos crescem.
O que ainda não se sabe
Apesar de identificar tantos novos vírus de RNA, continua sendo um desafio identificar quais organismos eles infectam. Atualmente, os pesquisadores também estão limitados principalmente a fragmentos de genomas incompletos de vírus de RNA, em parte por causa de sua complexidade genética e limitações tecnológicas.
Nossos próximos passos seriam descobrir que tipos de genes podem estar faltando e como eles mudaram ao longo do tempo. A descoberta desses genes pode ajudar os cientistas a entender melhor como esses vírus operam.