Toda Biologia é Biologia Computacional

0
136

Por Florian Markowetz
Publicado no PLOS Biology

“Como é que pessoas como você conseguem ser o último autor dos artigos?” Uma importante bióloga celular me fez essa pergunta em 2008, durante a entrevista para meu emprego atual, o que implica que eu nunca poderia assumir um cargo sênior em projetos de pesquisa. Eu tinha sido treinado em matemática e aprendizado de máquina, mas agora estava sendo entrevistado para um emprego de biologia computacional em um instituto de pesquisa do câncer. Meu entrevistador não tinha certeza de qual poderia ser minha contribuição para a biologia. O pessoal da computação não é apenas um provedor de serviços? Prático de se ter, mas sem nenhuma visão científica real? Ela claramente se preocupou com minha capacidade de fazer pesquisas biológicas independentes.

E ela não foi a última a se preocupar. Em 2012, com vários artigos com último autor em meu nome, fui selecionado para uma bolsa de estudos para jovens investigadores da Organização Europeia de Biologia Molecular (European Molecular Biology Organization), mas não consegui. O feedback fornecido pelo painel de entrevistas chamou meu grupo de “unidade de serviço matemático”, alegou “uma falta de conhecimento profundo da biologia” e lamentou “uma dependência excessivamente forte de colaboradores”.

No ano passado, finalmente vimos como a opinião sobre o trabalho computacional realmente pode ser baixa na comunidade biomédica, quando o editor-chefe do New England Journal of Medicine usou o termo “parasitas de pesquisa” para descrever biólogos computacionais dando sentido a publicações dados[1].

Nos últimos 20 anos, os métodos computacionais se tornaram uma parte bem estabelecida da biologia, mas os exemplos acima mostram que os biólogos e médicos da “velha escola” (tradução literal de old school) – que tomam decisões sobre publicações, financiamento e carreiras – continuam a se sentir desconfortáveis ​​com pessoas como Eu, que fui treinado em outras disciplinas, busco questões biológicas diferentes das suas e uso abordagens não cobertas na maioria dos treinamentos biológicos. Se até mesmo meus colegas nas ciências da vida não veem por que a pesquisa computacional é importante, como alguém mais será capaz de ver o seu valor?

A seguir, argumentarei que o pensamento computacional e os métodos computacionais são tão centrais para a busca da compreensão da vida que hoje toda biologia é biologia computacional.

A biologia computacional traz ordem à nossa compreensão da vida

“Biologia se adaptou ao computador, não o computador à biologia”, escreve Hallam Stevens em Life Out of Sequence[2], seu relato etnográfico e histórico da biologia computacional. Ele explica: “Os computadores não apenas ampliam a velha biologia, eles trazem consigo ferramentas e questões completamente novas, como estatísticas, simulação e gerenciamento de dados, que remodelam completamente a forma como a pesquisa biológica está sendo feita”.

Um exemplo importante de como os computadores remodelaram a pesquisa biológica é o uso de bancos de dados e ontologias. O conhecimento biológico hoje é definido, organizado e acessado por meio de computação. Se Carl von Linné (também conhecido como Carl Linnaeus), o botânico sueco e pai da taxonomia, vivesse hoje, ele seria um biólogo computacional. Como botânico, ele pode assumir um papel de liderança em um projeto como o transPLANT para organizar o que sabemos sobre os genótipos e fenótipos de culturas e plantas modelo. Ou ele pode trabalhar com o Gene Ontology Consortium para criar vocabulários compartilhados que unificam o conhecimento biológico entre os organismos. Assim como Systema Naturae de Linné, esses bancos de dados são contribuições intelectuais importantes para a nossa compreensão da vida. Todos os outros tipos de pesquisa biológica se baseiam nessas bases.

A biologia computacional permite que você tenha uma visão geral

Outra forma pela qual os computadores remodelaram a biologia foi introduzindo estatísticas e métodos de análise de dados. Um bom exemplo é entender como os processos mutacionais moldam os genomas[3]. Os processos mutacionais – seja fumaça de cigarro, luz solar ou defeitos na recombinação homóloga – não são visíveis em mutações individuais, mas apenas em seus padrões globais. Com que frequência um nucleotídeo Citosina é transformada em Timina? Como essa frequência varia dependendo dos vizinhos da base mutada? Quanto dessa frequência é explicada por outras características do genoma, como o tempo de replicação? Responder a essas perguntas nos ajuda a entender as propriedades básicas dos processos mutacionais ativos nas células, e isso só é possível por meio de técnicas estatísticas que identificam padrões e correlações.

Esses tipos de análises precisam de grandes coletas de dados e, portanto, o sucesso da biologia computacional está intimamente ligado ao sucesso dos esforços em grande escala para reunir genótipos e fenótipos de organismos modelo e humanos. Um dos primeiros exemplos destacando o poder das abordagens computacionais foi o sequenciamento do genoma humano, que mostrou como o alinhamento computacional e os métodos de Scaffold foram capazes de montar os fragmentos de DNA produzidos durante o sequenciamento shotgun[4], e as técnicas modernas de sequenciamento de última geração dependem totalmente de avanços na biologia computacional para analisar grandes quantidades de leituras de sequência curta[5]. O sequenciamento de DNA já foi um desenvolvimento digno do Prêmio Nobel. Agora, a biologia computacional está liderando o caminho para transformá-la em uma abordagem amplamente disponível e prática para biologia básica e pesquisa médica, que atualmente está revolucionando o que sabemos sobre tecidos e células individuais.

A biologia computacional fornece um atlas da vida

Ao combinar grandes coleções de dados com bancos de dados e estatísticas, a biologia computacional está fornecendo um mapa de referência para a biologia – um atlas da vida que reúne percepções individuais. Este mapa não está no nível de resolução fornecido pelo Google Street View, mas sim um mapa como o usado por Colombo, Magalhães ou Vasco da Gama – exploradores intrépidos em busca de aventura. O mapa fornece um esboço geral, mas muitas áreas são incompletas e algumas partes importantes podem estar ausentes e aguardando para serem descobertas. “Aqui estão dragões”, diz apenas. Mas mesmo com todas essas deficiências, o mapa ainda é um guia indispensável: o atlas da vida fornecido pela biologia computacional forma o pano de fundo para o planejamento, execução, e interpretar todos os experimentos de pequena escala focalizados que investigam as áreas não mapeadas e expandem os limites do conhecimento biológico.

A biologia computacional transforma ideias em hipóteses

Finalmente, os computadores remodelaram a biologia, tornando os conceitos difusos rigorosos e testáveis. Aqui está um exemplo de minha própria pesquisa: por décadas, pesquisadores de câncer discutiram a ideia de que a heterogeneidade genética entre células no mesmo tumor ajuda a tornar o câncer resistente à terapia[6]. É uma ideia simples: quanto mais diversa for a população de células, mais provável será que um subconjunto de células seja resistente à terapia e possa voltar a crescer o tumor depois que todas as outras células forem mortas.

Mas como exatamente você pode medir a “heterogeneidade genética” e quão grande é sua influência no desenvolvimento da resistência? Para responder a essas perguntas, tivemos que transformar a ideia em uma hipótese testável. Usamos abordagens genômicas para medir as mudanças nos genomas do câncer em diferentes locais de um paciente e, em seguida, definimos medidas quantitativas de heterogeneidade, que poderiam ser comparadas estatisticamente às informações clínicas sobre a resistência ao tratamento. E, de fato, encontramos evidências que sustentam a ideia inicial de que a heterogeneidade determina a resistência[7].

Este é apenas um dos muitos exemplos em que uma abordagem computacional quantitativa foi necessária para transformar uma ideia difusa em uma hipótese testável. A biologia computacional se destaca em destilar grandes quantidades de dados complexos em algo testável em laboratório úmido, moldando e direcionando o acompanhamento experimental.

Descanse em paz, biologia computacional

Biólogo de pipetas. Biólogo microscópico. Biólogo em cultura de células. Você já ouviu algum desses títulos de trabalho? Não, claro que não. Todos são biólogos, porque são as questões que você aborda que importam, não as ferramentas que você usa, e os biólogos computacionais são apenas biólogos que usam uma ferramenta diferente.

A próxima síntese moderna em biologia será conduzida pela absorção de métodos matemáticos, estatísticos e computacionais no treinamento biológico convencional. Ele se parecerá cada vez mais com um treinamento em física e combinará o ensino de técnicas experimentais com teoria matemática e análise de dados. E então, mesmo os biólogos da “velha escola” verão os biólogos computacionais como um dos seus.

Referências

  1. Longo D.L. and Drazen J.M., Editorial Data Sharing, N Engl J Med 2016; 374:276–277 pmid:26789876
  2. Stevens Hallam, Life Out of Sequence: A Data-Driven History of Bioinformatics, The University of Chicago Press; 2013
  3. Alexandrov L. B. et al. Signatures of mutational processes in human cancers. Nature 2013 Aug 22; 500(7463): 415–421. pmid:23945592
  4. Weber J.L. and Myers E.W.. Human whole-genome shotgun sequencing. Genome Res. 1997 May;7(5):401–9. pmid:9149936
  5. Flicek P. and Birney E. Sense from sequence reads: methods for alignment and assembly. Nat Methods. 2009 Nov;6(11 Suppl):S6–S12. pmid:19844229
  6. Nowell P.C.. The clonal evolution of tumor cell populations. Science. 1976 Oct 1;194(4260):23–8. pmid:959840
  7. Schwarz R.F. et al. Spatial and temporal heterogeneity in high-grade serous ovarian cancer: a phylogenetic analysis. PLoS Med. 2015 Feb 24;12(2):e1001789. pmid:25710373