Profissões do Futuro: bioinformática transforma dados em conhecimento

Quem entende de biologia e computação ajuda a resolver os problemas das ciências da vida

PUBLICIDADE

Foto do author Redação
Por Redação
Atualização:

Ao buscar na internet a palavra “bioinformacionista”, descobrimos que ela não está no dicionário e tem sido usada em uma série de estudos e em exercícios de futurologia de carreiras, como este artigo, que tentam antecipar em que estaremos trabalhando daqui a dez ou vinte anos. O bioinformacionista seria o profissional do futuro da área de saúde. Alguém que a partir de informações biológicas apoiaria cientistas da saúde na compreensão dos problemas e no desenvolvimento de modernos tratamentos e remédios.

PUBLICIDADE

A palavra surge da combinação de biologia e informação. Na prática, o especialista existe faz tempo e precede a aceitação do “novo” termo. É o bioinformático ou bioinformata. Ele entende de computação e biologia e extrapola cada vez mais esses conhecimentos a favor dos mais importantes avanços e conquistas das chamadas ciências da vida, não só da saúde.

Informatas médicos e bioinformatas podem ser considerados, entre aspas, bioinformacionistas. Ambos trabalham com informação e comunicação e usam ferramentas estatísticas e de computação para tratar e interpretar os dados. Estão envolvidos em resultados e expectativas de avanços genéticos, medicina personalizada, remédios sob medida, acurada prevenção de doenças. A vasta área de atuação inclui hospitais, laboratórios de análises clínicas, indústria farmacêutica e centros de pesquisa públicos e privados.  

Onde estudar – Os profissionais em geral investem primeiro na graduação em exatas e depois no mestrado e doutorado de bioinformática, onde complementam os conhecimentos e se especializam em biologia, patologia e/ou genética. Há ainda os cientistas da área médica e biológica que aprendem linguagem de computador e começam a programar.

O Instituto de Matemática e Estatística da Universidade de São Paulo (IME/USP), a Universidade Federal de Minas Gerais e o Instituto de Ciência da Computação da Universidade de Campinas oferecem pós em bioinformática. Na USP de Ribeirão Preto, a graduação em informática médica desde o início mescla disciplinas de biológicas e exatas. (Leia sobre histórico, formação e mercado de trabalho na entrevista do professor Roberto Marcondes Cesar Junior, do departamento de Ciência da Computação do IME/USP, abaixo deste texto).

O informata médico e o bioinformata – As trajetórias do físico Diogo Patrão e do cientista da computação Israel Trojal da Silva ajudam a entender a importância dos cientistas das informações biológicas, médicas e genéticas. Eles trabalham no hospital A.C. Camargo, em São Paulo, referência em prevenção, tratamento, ensino e pesquisa do câncer.

Patrão é informata médico. Ele lida com os dados clínicos dos pacientes. “Quando o médico tira seu histórico familiar e pergunta das doenças que os parentes da sua família têm, as doenças que você já teve, quais diagnósticos já existiram e tudo mais, isso são informações clínicas que a gente compila e coleta para fazer estudos sobre o câncer.”

Publicidade

O trabalho de Silva, que é bioinformata, envolve as informações genômicas, da genética. “Em geral, usamos a mesma linguagem de programação para lidar com dados distintos, de natureza diferente”, explica Silva. O objetivo é trabalhar junto e integrado para fazer um perfil completo e tentar detectar doenças e condições dos pacientes.

O informata médico – Gerente do laboratório de informática médica, Patrão tem 36 anos e começou a estudar programação e computadores ainda era criança. Formou-se em física em 2003 e no ano seguinte entrou para o então supernovo setor de bioinformática do hospital. Em 2014, concluiu um doutorado em ciências com especialização em oncologia, onde estudou a integração de informações de diversos bancos de dados. Quando na bioinformática, percebeu que havia uma grande dificuldade em pegar a vasta informação genômica e correlacionar com as variáveis clínicas. “Às vezes a gente encontrava semelhanças ou diferenças, mas não ficava claro em que isso refletia, se eram os pacientes que iam viver mais ou responder melhor a um remédio. Havia deficiência em organizar e utilizar a informação clínica de forma ótima na pesquisa. A partir de 2007, migrei para essas questões e já desenvolvemos um sistema dos dados clínicos. O desafio agora é integrá-lo à área genômica.”

O trabalho tem basicamente três frentes. A primeira é fazer sistema e software para ajudar quem atua na pesquisa, a exemplo o pesquisador clínico que testa uma nova droga. A segunda é extrair dados para demandas específicas, como “quais foram os pacientes que tiveram câncer de mama com determinado perfil genético desde 2000”. A terceira é conhecer o que está sendo feito na informática médica no mundo e o que pode ser aplicado na realidade, no dia a dia do hospital, avaliando e criando novos métodos.

“A realidade médica é diferente da realidade de um profissional de física ou de computação. Na medicina é muito difícil parametrizar as coisas, porque o raciocínio médico é extremamente complexo e muitas vezes baseado na experiência e a gente tem de ter a antena funcionando para captar essas coisas e aprender com os exemplos. Se você perguntar o que estudei formalmente, foi biologia celular, patologia e as disciplinas da pós, mas o diferencial é a prática, é conversar com os médicos e correr atrás para aprender. É fazer a ponte entre o que o médico sabe e necessita e o que existe de informação no sistema de informática.”

CONTiNUA APÓS PUBLICIDADE

Patrão diz que é fundamental desenvolver a capacidade analítica para transformar o problema médico na linguagem computacional ou estatística que vai resolvê-lo. “Não há fórmulas prontas para o que a gente faz e isso pode dar um pouco de medo para quem espera uma carreira mais tranquila, mas é extremamente recompensador conseguir solucionar o que não foi resolvido por ninguém. Uma das coisas que eu mais gosto é criar alguma coisa para ajudar alguém a fazer uma pesquisa e chegar em um diagnóstico e de repente num tratamento. A gente também coloca tijolinhos na construção da cura do câncer.” O conselho que se daria aos 19 anos? Trabalhar a capacidade de entender os problemas independente da faculdade. “Vejo muitas pessoas que se perguntam ‘puxa, para que eu vou usar isso no futuro?’. Ninguém sabe. Uma vez me inspirei numa aula de gravitação para resolver uma questão de informática médica. Aprenda o que você puder e não se importe com a aplicação imediata.”

O bioinformata – Diretor de bioinformática do A.C. Camargo, Israel Silva, de 39 anos, formou-se em ciência da computação em 2001. Tem especialização em bioinformática no Laboratório Nacional de Computação Científica em Petrópolis, no Rio de Janeiro, e fez doutorado em ciências, área de concentração genética, na Faculdade de Medicina da USP em Ribeirão Preto. “De 2012 a 2014, fiz pós-doutorado na Universidade Rockefeller, em Nova York, onde atuei também como pesquisador associado. Então tive um convite para montar um grupo de bioinformática aplicada ao estudo da genômica do câncer aqui no hospital.”

Silva comanda um serviço de infraestrutura, análise e interpretação da enorme quantidade (e complexidade) de dados gerada por todos os setores do hospital que trabalham na área genômica. “Nosso grupo recebe, processa, analisa e armazena dados e gera uma informação adicional sobre eles, atendendo à demanda do hospital bem como de outros projetos vinculados à instituição. Muitas vezes, os laboratórios de genética molecular têm a pergunta, a hipótese e a técnica para gerar o dado, mas não têm um corpo especializado em métodos de computação e estatística para transformar essa informação em conhecimento.” No momento, Silva é o principal investigador e tem o apoio de um profissional com sólida formação em computação e outro em matemática. “Em seus laboratórios, biólogos, médicos, farmacêuticos, pessoas da área das ciências da saúde, geram os dados com os quais vamos trabalhar.”

Publicidade

Segundo Silva, quem tem interesse em bioinformática precisa estar ciente do caráter multidisciplinar e ter uma capacidade de abstração alta para entender de fato o problema que vem em outra linguagem e converter para a linguagem que domina mais. “Eu tive a base sólida em computação e quando fui fazer estágio no final do primeiro ano da graduação, procurei um laboratório de genética molecular. Não sabia nada disso, mas interagi com outros pesquisadores e estudantes e entendi o que é uma célula, o gene e me aprofundei em conceitos biológicos, de biologia molecular e celular. Na vivência com outras pessoas, estudando livros e lendo artigos, você vai assimilando esse conteúdo diferente do que foi visto na graduação. Para mim a curva de aprendizado foi mais suave, porque durante a graduação eu busquei esse contato com a parte biológica.” Quem estuda computação e quer trabalhar com biologia e quem estuda biologia e quer trabalhar com computação deve desde cedo procurar se envolver com os assuntos em que quer se especializar, procurando estágios, por exemplo, em laboratório de biologia molecular ou de computação.

O bioinformataentende de computação e biologia e extrapola esses conhecimentos a favor dos mais importantes avanços e conquistas das chamadas ciências da vida Foto: Reprodução

A computação e as ciências da vida – O Estado conversou sobre a formação e o mercado de trabalho em bioinformática com o professor Roberto Marcondes Cesar Junior, chefe do departamento de Ciência da Computação do Instituto de Matemática e Estatística da Universidade de São Paulo e membro da Fundação de Amparo à Pesquisa do Estado de São Paulo (Fapesp).

Leia os principais tópicos da entrevista.

Por que a bioinformática é fundamental para o nosso futuro.

A dependência forte em métodos computacionais para tratar dados que vêm de uma área específica ocorre em toda as áreas, praticamente, mas em biologia avança mais rápido. Em medicina, a área de processamento de imagens médicas é um exemplo bom. Há uma série de exames de laboratório, como tomografia e ressonância, que gera imagens do paciente e permite diagnóstico. Em astronomia, você tem telescópios. Em física de altas energias, tudo o que acontece nos aceleradores. Em biologia, isso ganhou um impacto muito grande na década de 90 principalmente com as técnicas de sequenciamento do DNA (...). O que acontece é que começou a surgir tecnologia em biologia que produzia quantidade enorme de dados, muito maior do que os seres humanos conseguem tratar.

O que mudou na obtenção dos dados

Tenho vários amigos que na década de 90 faziam doutorado na biologia e depois de quatro anos trabalhando para conhecer uma cultura disso e daquilo faziam o experimento, obtinham os dados e uma planilha Excel em que os analisavam, plotavam, calculavam variância, média e tudo mais e escreviam as teses. Isso era muito típico antigamente. Hoje em dia, com esse tipo de tecnologia, no primeiro ano de doutorado ele aperta um botão e tem alguma máquina, provavelmente com robô e tudo mais, que em vez de gerar uma só planilha gera quinhentas. O que você faz com quinhentas planilhas? Não consegue nem abrir. Quando está na terceira, esqueceu da primeira. Se antes era difícil observar um fenômeno em biologia, hoje em dia há uma profusão de sensores e de tecnologias que permitem observar milhões de dados.

Publicidade

O que mudou na análise dos dados

Na ciência moderna o gargalo não é mais adquirir, mas analisar os dados. Você já deve ter ouvido falar do termo que as pessoas gostam de usar como buzzword, o tal do bigdata. O especialista humano não tem dificuldade em obter dados, mas em olhar e analisar todos eles. A ciência da computação e a modelagem matemática ajudam os cientistas das mais diversas áreas, e em biologia o caso é particular, a extrair conhecimento útil do dilúvio de dados que caiu na cabeça da pessoa quando ela estava querendo estudar alguma coisa.

Como a bioinformática tem evoluído?

A área de bioinformática nasceu nas décadas de 80 e 90. No início ela se tornou muito popular devido ao aparecimento das primeiras técnicas de sequenciamento do DNA e rapidamente não ficou só isso. Você deve lembrar quando acontecia aquela corrida do genoma humano ou no Brasil as pessoas estavam querendo sequenciar o amarelinho [Xylela fastidiosa, praga do amarelinho], micróbio que causa doença na laranja.

Hoje em dia a parte de sequenciamento é muito automatizada por máquinas e software e tudo mais, mas surgiram muitas outras oportunidades. Há uma profusão de áreas que tratam de diferentes aspectos dos seres vivos, dos seres que estão sendo estudados, desde uma bactéria até o ser humano.

São muitos os dados e eles podem ser integrados e não precisam ser só produzidos no seu laboratório, porque as pessoas que estão fazendo um experimento na China fazem o upload desde um banco de dados comum que está em algum lugar do mundo que ninguém nem sabe onde é, porque distribuído em alguma nuvem, e o cientista daqui consegue olhar esses experimentos. Os problemas migraram para a ciência dos dados. O bioinformata antigamente era um biólogo que aprendeu a programar. Depois passou a ser um cientista da computação que aprendeu um pouco de biologia.

O que faz o bioinformata

Publicidade

A primeira coisa que temos de entender é que quando a gente pensa em ciência, no sentido de física, biologia, medicina, química e tudo mais, ela é fortemente baseada em modelos. Existe um fenômeno do universo. Pode ser de um objeto inanimado ou de um organismo, um rato, uma bactéria, qualquer coisa. Normalmente você não analisa diretamente o organismo, mas faz uma análise por meio de um sensor. Isso ocorre, por exemplo, quando põe uma lâmina contendo as bactérias no microscópio e observa as bactérias através das lentes desse sensor óptico. Quando o astrônomo olha o telescópio, ele observa o que acontece no universo através do sensor que é o telescópio. Essa é uma questão muito importante.

Todos esses exemplos que eu dei, microscópio e telescópio, são tecnologias que permitem observar. Quando a gente pensa em sequenciamento de DNA é exatamente isso, exceto que em vez de ser um microscópio ou telescópio é uma tecnologia muito mais sofisticada que envolve processamento de dados e permite, por exemplo, sequenciar o meu DNA e saber qual é a sua composição, quais são os genes. O bioinformata entra nesse ponto.

O bioinformata e a medicina

O bioinformata entende como os dados são obtidos e trabalha diretamente com eles, associado a médicos, biólogos e tudo mais. Se nós sequenciamos o DNA do Roberto para saber se ele certa propensão a ter um câncer, pensando na medicina personalizada do jeito que as pessoas clamam que pode ser uma coisa do futuro, temos que comparar o DNA do Roberto com, por exemplo, um banco de dados sobre DNAs do mundo. E como fazer isso? Tem de olhar genes e mutações e compará-los com outros genes e outras mutações. O bioinformata é o responsável por olhar esses dados todos. Ele obviamente não fará o diagnóstico, mas dará informações para o médico, o oncologista.

O bioinformata entende da biologia, porque ataca um problema da biologia – ou da medicina ou da ciência da saúde ou, aliás, não precisa ser nem da saúde. Quando a gente pensa, por exemplo, em produção e melhoramento animal ou controle de praga na agricultura, qualquer coisa que tenha um ser vivo envolvido, a princípio é possível extrair dados que são capturados pelas tecnologias de observação e podem ser analisados por métodos computacionais, por programas, algoritmos e modelos matemáticos. O bioinformata extrapola e muito a biologia.

A formação do bioinformata

No mestrado e no doutorado da USP, aceitamos alunos de biológicas ou de exatas e fazemos com que o percurso de disciplinas complemente sua formação. Eu já tive alunos de doutorado que eram formados em computação e que na USP foram fazer biologia molecular, técnicas de sequenciamento, aulas de laboratório e assim por diante. Por outro lado, há médicos, biólogos e outras pessoas da área de saúde que vão aprender programação, algoritmo, algoritmo de inteligência artificial e modelo matemático.

Publicidade

Poucos lugares do mundo têm graduação em bioinformática, normalmente a pessoa tem formação básica em um curso bem estabelecido, como computação, matemática, física, química ou biologia, ciências biomédicas, medicina, enfermagem ou alguma coisa assim, e na pós-graduação se especializa. Esse percurso típico é muito importante, porque a gente garante a formação básica independente da tecnologia. É muito difícil propor um curso de graduação fortemente baseado em tecnologia. Você não sabe se essa tecnologia vai existir quando o cara for se formar daqui a quatro anos. Talvez não e talvez surjam outras que não têm nada a ver com o que existe hoje e que revolucionem completamente o mundo. A matemática, a computação e a biologia não vão mudar. O que muda é a tecnologia. Esse cara tem de estar pronto para enfrentar essas mudanças a vida inteira.

Mercado de trabalho Em primeiro lugar, existe a academia. Alguns vão virar professores e muitos vão virar pesquisadores e esses pesquisadores não precisam estar na academia, podem trabalhar em laboratórios farmacêuticos. Grandes hospitais e laboratórios de análises clínicas também contratam, bem como a indústria que depende de análise de dados de biologia, como tudo o que diz respeito a bioenergia, bioetanol, cana de açúcar e toda a parte de agroindústria ligada a análise de dados e melhoramento animal. Isso abre uma frente gigantesca, porque há muitas indústrias associadas a isso, como as do frango e do gado, que costumam contratar.  Finalmente, existe muita oportunidade no empreendedorismo. Como os sensores vão ficando cada vez mais baratos, o bioinformata pode abrir uma empresa que se especializa em tratar um certo tipo de dado. A análise de dados em empresa ou em biotecnologia tem um mundo pela frente que pode se basear nesse tipo de conhecimento. Ou seja: existe campo acadêmico e aplicado e, quando aplicado, há desde grandes laboratórios até pequenas empresas.

Comentários

Os comentários são exclusivos para assinantes do Estadão.