Pular para o conteúdo

Bioinformática, uma filha pródiga

Parece que os biólogos estão colonizando o dicionário com um monte de “biopalavras”, tais como: bioquímica, biometria, biofísica, biotecnologia e até bioterrorismo. Uma das últimas sensações é a bioinformática.

Segue um vídeo de motivação:

Funda Biologia Molecular e Ciência da Computação afim de se resolver problemas biomoleculares, tem-se a Bioinformática.
Ela é uma área relativamente nova da ciência, sendo consolidada a partir do Projeto Genoma Humano (que data 1990).

Antes da Bioinformática, o estudo do DNA era caro e demorado; agora é relativamente barato e super rápido. Atualmente é possível ter o resultado de um teste de paternidade em menos de um dia.

Segue sua definição: Bioinformática é o uso de técnicas de matemática, computação, química e estatística, visando solucionar problemas tipicamente de biologia molecular.
Portanto se trata de uma área multidisciplinar, numa época onde a interseção de ciências é muito bem-vinda.

Esta composição foi (e ainda é) um grande avanço nas pesquisas da Biologia Molecular, pois culminou num crescimento exponencial de resultados, bem como em enormes volumes de informações extraídas e armazenadas em bancos de dados – vários destes bancos são de livre acesso, assim qualquer pessoa pode baixar e usar dados para pesquisa.

O genoma humano é essencialmente informação – muita informação!

Então o uso de computação para armazenamento e processamento de dados é imediato. Atualmente o problema das ciências naturais não é obter dados, mas tratá-los, de modo a convertê-los em conhecimento.

Três referências de bases de dados:

  • A EMBL (European Molecular Biology Laboratory) é uma base de dados mantida pelo Instituto Europeu de Bioinformática em Cambridge, Inglaterra;
  • GenBank é mantido pelo Centro Nacional de Informações em Biotecnologia, situado em Maryland, EUA;
  • The DDBJ (DNA Databank of Japan) é mantido pelo Instituto Nacional de Genética em  Mishima, Japão.

As aplicações da Bioinformática geralmente consistem em: análise de dados genômicos; análise proteômica (estudo das proteínas); processamento de imagens. Um pouco sobre cada uma delas:

  • A análise de dados genômicos estuda o nosso código genético. Destes estudos podem vir respostas para um melhor entendimento da vida como a conhecemos na Terra, curas para doenças e controle fenótipo (te permitir escolher características para seu filho, por exemplo);
  • Entender a estrutura, função e dinâmica das proteínas auxilia na compreensão de sistemas moleculares e no desenvolvimento de novos fármacos;
  •  O processamento de imagens ajuda, por exemplo, o médico a identificar o tipo de câncer após uma mamografia. Como são consultadas inúmeras imagens nos bancos de dados, é tirado o subjetivismo por parte do médico de dizer qual é o tipo do câncer. Em suma, o processamento de imagens auxilia mais comumente em diagnósticos.

    Na medicina e veterinária, a Bioinformática dá ao paciente um tratamento personalizado. Isso significa que sua resposta aos tratamentos são preditas em termos de seu código genético, o que é muito mais eficaz que um tratamento genérico que ignora as diferenças entre os pacientes.

O que significa quando dizem que sequenciaram um genoma?

Ilustração do ácido desoxirribonucleico (DNA, DeoxyriboNucleic Acid). Fonte: www.onrampbioinformatics.com

Sequenciar é identificar a ordem exata de todos os pares de bases nitrogenadas num segmento de DNA, porém é raro isso acontecer. No geral, busca-se sequências similares.
Portanto, ao sequenciar o genoma humano, são definidos os três bilhões de pares de bases que constituem nosso código genético numa ordem similar à original.
Isso é importante porque ao sequenciar um gene (pedacinho de DNA) se obtém informações sobre sua estrutura, função e relação evolutiva com outros genes.

Dificuldades 

Como dito anteriormente, ainda hoje há muito dado disponível para pouco conhecimento extraído.

Quando genomas são sequenciados, por exemplo, o sequenciamento é feito em fragmentos dele, e não nele todo. Depois de sequenciar o fragmento, é preciso juntá-los para formar novamente o genoma, e aqui mora um problema atual: Como se junta isso tudo novamente? Imagine que você tem várias revistas repetidas e começa a recortá-las (sim, como na escola primária). Cada pedacinho do recorte é um fragmento sequenciado, o genoma mesmo é a revista – e há diversas iguais! Se eu te pedir pra remontá-las, você acha que consegue? Em tempo hábil? Pois é, complicou. É mais difícil ainda ensinar o computador a fazer isso, mas eles se fazem necessário, pois há muitos dados. Talvez você, leitor, crie um algoritmo eficiente que una os fragmentos na ordem correta e forme o genoma original, disso podem vir curas de diversas doenças.

Fonte: www.babs.unsw.edu.au
Fonte: www.babs.unsw.edu.au

Algoritmos em Bioinformática

Bom seria se apenas ter um algoritmo computacional para solucionar um problema fosse o suficiente para a Bioinformática. O que ocorre é que não adianta ter um método de solução correto, se o tempo computacional demandado por este é da ordem da idade do Universo.

O tempo demandado por um algoritmo é chamado no meio da computação de Complexidade Algorítmica. Essa complexidade é uma propriedade intrínseca de cada algoritmo, sendo determinada de modo analítico (matemático). O tempo costuma ser proporcional à entrada (aos dados a serem processados); pode ser uma proporção constante, logarítmica, linear, quadrática, cúbica ou até, nos piores cenários, exponencial. Naturalmente há outras, mas essas já servem de exemplo.

Portanto, o algoritmo tem que estar correto e ser eficiente – que demande um tempo esperável, digamos assim.

Algoritmos de ordenação são fundamentais no contexto em que estamos. Há vários deles, mas o mais usado é o QuickSort (fica por sua conta pesquisar sobre ele).

Buscas em textos (Strings, na computação) também são muito importantes, pois nosso DNA é interpretado pelas máquinas e essa informação é transformada em sequências de caracteres. Aqui o nome da vez é o algoritmo de Boyer-Moore.

Os algoritmos usados na área não param por aqui, mas nós paramos.

A Bioinformática nos games:

Em Assassin’s Creed o Animus é uma máquina que analisa o DNA dos indivíduos e faz eles reviverem memórias dos seus ancestrais. Este equipamento produz diversos dados analisados pela técnica Rebecca Crane (a bioinformata em questão).
Retirado de http://www.scicast.com.br/scicast-45-bioinformatica/

Como se tornar um Bioinformata?

É preciso ter uma graduação num curso específico à área (o mais próximo atualmente no Brasil é Informática Biomédica) ou em ramos de pesquisa relacionados, usualmente bacharelados em Biologia, Ciência da Computação, Física, Matemática, Estatística, Química ou Medicina. Caso queira confirmar se gosta da área, sugiro uma iniciação científica relacionada. A especificação começa no mestrado e/ou doutorado, é nessa parte que você entra na Bioinformática, se sua graduação foi genérica.

“Caio, preciso saber isso tudo?!”

Não mesmo. É Preciso uma graduação correlata para o alicerce. Um pouco de Biologia e Computação você vai ter que saber, disso não tem como fugir se você quiser ser um bom profissional.  Bioinformatas são raros e muito disputados, aqui e no exterior.

Espero ter te tirado algumas dúvidas e, sobretudo, te deixado com muitas outras!

Muito obrigado pela atenção e até a próxima.

Para ir além, curso online gratuito no Coursera (em inglês): https://pt.coursera.org/course/bioinform

REFERÊNCIAS BIBLIOGRÁFICAS

  1. Polanski, A.; Kimmel, M. (2007); Bioinformatics: Springer.
  2. Higgs, Paul G.; Attwood, Teresa K. (2005); Bioinformatics and Molecular Evolution: Blackwell Publishing.
  3. Forsdyke, Donald R. (2006); Evolutionary Bioinformatics: Springer.
  4. Claverie, Jean-Michel; Notredame, C (2003); Bioinformatics for Dummies: Wiley Publishing, Inc.
  5. Bongiolo, E. (2006); Análise Panorâmica da Bioinformática no Brasil: Universidade do Extremo Sul Catarinense – UNESC.

REFERÊNCIAS WEBGRÁFICAS

  1. Geremia, S.; Santos, A. (2014); Bioinformática. 16 de Janeiro de 2016. Disponível em <http://www.scicast.com.br/scicast-45-bioinformatica/>
  2. Moreira, Sylvio; IME-USP (2007); Introdução à Bioinformática. 17 de Janeiro de 2016. Disponível em <http://www.ime.usp.br/~msreis/docs/bioinfo_IAC.pdf>
  3. IFSC-USP, Assessoria de Comunicação (2012); O mundo, o Brasil e a Bioinformática. 17 de Janeiro de 2016. Disponível em <http://www.ifsc.usp.br/index.php?option=com_content&view=article&id=1022:o-mundo-o-brasil-e-a-bioinformatica&catid=7:noticias&Itemid=224>
Caio Dallaqua

Caio Dallaqua

Graduando em Física na USP, com um pé na Computação. Divulga Ciência e Tecnologia em seu canal do YouTube e, claro, produz conteúdo para o Universo Racionalista.