super_banner_728x90

terça-feira, 1 de dezembro de 2009

Afinal, os Biólogos deveriam estudar Ciências da Computação?

Este artigo foi publicado no Portal Brasileiro de Informática Biomédica, dia 16 de agosto de 2009.
Clique aqui para ver o artigo original.

-----

Artigo original escrito por John Timmer. Esse artigo é uma resposta a dois artigos publicados na última edição da revista Nature sobre a necessidade do conhecimento de informática por biólogos e da necessidade de inclusão de disciplinas de ciências da computação em cursos de biologia.

laptop_dna_arsComo em qualquer outro campo da ciência, os computadores se tornaram uma parte essencial das pesquisas biológicas. Algoritmos complicados e análises que, antes levavam meses de trabalho feito por especialistas agora estão disponíveis como serviços Web, e grandes áreas de estudo, como a genômica, já podem ser perseguidas na íntegra in silíco. Mas, mesmo que a maioria biólogos saibam como submeter os seus dados e interpretar os resultados produzidos pelas ferramentas computacionais, poucos compreendem realmente a matemática que está acontecendo por trás dos processos, além disso a maioria dos cursos relacionados a biologia não exigem informática ou qualquer matemática mais avançada do que Cálculo.


Dois trabalhos publicados na última edição da revista Science argumentam que isso é uma coisa muito ruim. O primeiro se baseia na capacidade de representar o comportamento de sistemas biológicos, através da notação algébrica, uma área que está gravemente ignorada nos cursos de ciências e de matemática. O segundo foca de maneira geral na incorporação de matemática relacionada a biologia e informática no sistema de educação. Ambos pressupõem que a falta de uma base matemática é um problema muito grave.

Em geral, como alguém que fez um um pouco de bioinformática e muito de biologia, sou o público-alvo perfeito para este argumento. Mas quando leio artigos científicos, tenho a sensação de que os autores colocam diferentes argumentos em conjunto de uma forma que confunde os verdadeiros problemas estudados. Então, o que se segue é a minha tentativa de separá-los e avaliar cada questão separadamente. O primeiro problema surge no artigo de Pevzner e Shamir, que trata os termos biologia computacional e bioinformática como dois nomes para a mesma disciplina. Isso pode ser entendido como coisas comuns, mas, para mim, pelo menos, são duas coisas diferentes.

Bioinformática, como seu nome sugere, é essencialmente centrada na análise assistida por computador de dados gerados em sistemas biológicos, tais como o genoma e análise de arrays de expressão gênica. Mas, iremos voltar a isso mais tarde. Biologia Computacional envolve a tentativa de modelar sistemas biológicos in silico. Estes modelos provêm da biologia, mas não necessariamente requerem nenhum dado biológico para a sua execução.

Obviamente, qualquer pessoa trabalhando com biologia computacional precisa ter um bom conhecimento tanto em biologia quanto em matemática ou informática, ou então ele não será capaz de saber se os modelos são válidos e corrigi-los caso contrário. A mesma realidade não se aplica a bioinformática. Uma vez que há sempre dados biológicos reais como fonte de informação, a computação e a análise podem ser separadas. Um bioinformata pode simplesmente dirigir-se a um biólogo e verificar os resultados.

Fundamento, ferramenta ou serviço ?

Então, mesmo se aceitarmos que todas as pessoas que estão fazendo análises em biologia computacional deveriam conhecer tanto matemática quanto biologia, o que ainda não prova que os biólogos necessitem de matemática. A maioria dos biólogos regulares acabaria usando ferramentas de bioinformática para alinhar sequências de DNA, desenhar primers, etc. Então, será que eles precisariam saber a matemática que ocorre por trás das ferramentas? Penso que para responder a essa pergunta, você tem que entender o que se entende por bioinformática ou o que eu chamo de espectro sobre fundamento / ferramenta / serviço.

bioinformaticsPara os biólogos, fundamentos são coisas como química orgânica. Todos que trabalham com biologia, dependem disso, e todo biólogo deveria realmente saber algo sobre química orgânica, mesmo biólogos de campo, que nesse caso teriam de considerar como o regime alimentar e substâncias químicas ambientais afetam os organismos que eles estudam. Bioinformática realmente não é um elemento fundamental; sabendo como certos cálculos são realizados não irão necessariamente te dizer alguma coisa sobre a biologia em si.

Na verdade, é algo entre uma ferramenta e um serviço. Uma ferramenta é algo que boa parte dos biólogos acabará utilizando e que possui algo relacionado a biologia. Assim, por exemplo, é possível utilizar o PCR para amplificar amostras de DNA sem saber nada sobre o que está acontecendo no interior dos tubos utilizados para as reações. Mas é muito melhor se o biólogo souber, as reações que acontecem durante o PCR que ilustram alguns princípios biológicos e conhecimentos que são essenciais para a solução de problemas quando algo dá errado (o que inevitavelmente acontece). Em contraste, seqüenciamento de DNA, que costumava ser um instrumento, tornou-se um serviço. Você coloca o seu DNA na amostra do correio, e faz o download da seqüência de dados a partir de uma conta de FTP poucos dias mais tarde. As informações precisas sobre as reações de seqüenciamento que foram realizadas, na verdade, não importam muito.

Para a maioria dos pesquisadores, tanto softwares de bioinformática quanto os utilizados para encontrar sequências ou fazer alinhamento são considerados como um serviço: o computador retorna um resultado útil, e você realmente não se importa como ele chegou a aquela solução. Se você não recebe um resultado aceitável, a sua primeira reação não seria procurar alguém que sabe matemática, e sim procurar alguém que conhece mais sobre o serviço, e sabe como ajustar os parâmetros de entrada. Conhecer a matemática por trás as coisas pode ajudar com os ajustes ou a interpretar os resultados biológicos, mas em muitos casos a experiência pode ser mais útil.

Em um cenário mais pessimista, naturalmente, biólogos podem sempre recorrer a alguém que tenha formação em bioinformática, da mesma forma que um bioquímico poderia contactar um imunologista se precisava saber mais sobre esse campo.

Isso deveria ser útil?

Se bioinformática é um serviço, porque não é suficiente saber usá-la como um serviço? Os autores simplesmente assumem isso, sem fornecer uma explicação. "Por exemplo, biólogos, as vezes utilizam ferramentas de bioinformática da mesma forma que um matemático desinformado poderia utilizar um kit de reação em cadeia da polimerase (PCR) ," eles escrevem, "sem saber como funciona o PCR e sem qualquer experiência em biologia". Presumivelmente, isso era para ser visto como um problema, embora os autores não expliquem exatamente o porque.

O segundo artigo, de Robeva e Laubenbacher, também não é muito brilhante na maneira como defende seu ponto de vista. É uma espécie de tentativa de incentivar a educação em modelagem algébrica, o que aparentemente pode ser usado para representar os sistemas biológicos. Os autores fazem seu argumento usando o dado exemplo: o operon Lac é um modelo de regulação gênica que aparece várias vezes durante a educação de um biólogo, provavelmente começando no ciclo AMP durante o colegial. Em termos de modelagem, no entanto, o modelo operon Lac precisa de três equações para ser descrito, uma das quais assume a forma:

L=kLβL(Le)βG(Ge)Q - 2ΦM(L)B - γLL

Eles afirmam que apresentá-lo dessa forma, em termos Boleanos, conduz a um diagrama simplificado que ainda capta as características essenciais do sistema. Mesmo quando simplificado, no entanto, não é óbvio que o modelo acima é mais informativo do que qualquer descrição textual, que refere-se diretamente a biologia do modelo estudado. E eu não acredito que saber o modelo iria realmente melhorar a capacidade dos biolólogos de realizar uma investigação biológica.

Isto provavelmente é um exagero, entretanto, os autores ainda têm um ponto válido: quanto mais os biólogos souberem sobre as ferramentas e serviços que dependem, melhor será sua visão sobre o problema biológico estudado. Pesquisadores que conhecem esses processos estão mais propensos a notar os resultados diferentes e conseguem obter mais informações dos seus dados através de uma melhor utilização das ferramentas existentes. E a sugestão dos autores de que deveriam ser criados novos cursos de matemática que iriam preparar os biólogos para resolverem os problemas que eles geralmente enfrentam, iria sem dúvida produzir uma educação mais fundamentada em matemática.

Mas o mesmo tipo de coisa pode ser dito sobre bioestatística e físico-química, e é raro ver qualquer um desses como uma exigência para graduação ou doutorado em biologia. (O que teria sido muito útil em vários pontos na minha carreira, e atualmente ainda mais útil.)

Se o argumento que está sendo feito é que os biólogos deveriam aprender mais sobre matemática e informática, então eles precisam explicar melhor o que, exatamente, os biólogos precisam entender sobre a ferramentas computacionais, e porque simplesmente saber como usar a ferramenta não é bom o suficientemente. Há também uma questão prática em jogo, os autores argumentam que estes cursos computação devem ser adicionados aos programas de educação em biologia que já estão sobrecarregados com outros cursos exigidos. Isso é difícil de se justificar, especialmente tendo em conta outros temas que já são omitidos na maioria dos programas.

No fim, as principais questões são evitadas nesses artigos: o que, especificamente, os biólogos precisam aprender, e como isso irá ajudá-los a exercer sua função primária, ou seja, a investigação biológica. Sem essa informação, será realmente impossível de definir um curso que possa melhorar alguma coisa.

Fonte: http://arstechnica.com/science/news/2009/07/should-biologists-study-computer-science.ars