Onze anos atrás, quando o primeiro rascunho de sequenciamento do genoma humano foi publicado, uma das maiores surpresas foi constatar que apenas 2% das 3 bilhões de "letras" químicas que o compõem correspondem a genes propriamente ditos - sequências chamadas "codificadoras", que carregam as instruções genéticas necessárias para a síntese de proteínas. Os outros 98% foram apelidados de "DNA lixo", por não ter função conhecida no organismo. Um apelido que sempre incomodou muita gente.

Agora, mais de uma década de ciência depois, chega a redenção. Mais de 30 trabalhos publicados simultaneamente em quatro revistas científicas de peso, incluindo Nature e Science, descartam em definitivo o apelido pejorativo, confirmando várias evidências acumuladas ao longo dos anos de que o "DNA lixo", na verdade, não é lixo coisa nenhuma. Os resultados, oriundos do projeto Enciclopédia de Elementos de DNA (Encode, na abreviatura em inglês, que significa "codificar"), indicam que mais de 80% do genoma humano têm algum tipo de função bioquímica operacional.

"Eu diria que o termo DNA lixo pode ser definitivamente jogado no lixo", diz a geneticista Mayana Zatz, coordenadora do Centro de Estudos do Genoma Humano da Universidade de São Paulo (USP).

Dentro do que se chamava de lixo, os pesquisadores do Encode encontraram uma riqueza milionária de sequências chamadas reguladoras, que não codificam proteínas diretamente, mas interagem de alguma forma com o funcionamento dos genes. Algumas funcionam como interruptores, ligando-os ou desligando-os. Outras como um botão de volume, aumentando ou diminuindo a intensidade com que determinados genes se expressam em determinadas células, em determinadas situações.

É esse maquinário regulatório que permite ao ser humano ser uma espécie biologicamente tão complexa com "apenas" 20 mil genes - bem menos do que uma espiga de milho ou um grão de arroz. "O genoma humano é muito mais complexo do que imaginávamos", diz Mayana.

"O que eles estão confirmando é uma suspeita de muito tempo, de que essas sequências também têm um sentido biológico enorme", reforça Dirce Maria Carraro, diretora do Laboratório de Genômica e Biologia Molecular do Hospital A.C. Camargo. "É óbvio que elas não estão no genoma por acaso."

Os cientistas destacam a importância dos resultados para estudos clínicos que tentam relacionar mutações e outras formas de alterações genéticas à saúde. Milhares de alterações já foram identificadas que afetam a ocorrência ou a manifestação de doenças, mas a grande maioria não está nos genes (nos 2% do genoma que codificam proteínas), o que já era um forte indício de que o "DNA lixo" tinha alguma função relevante dentro das células - caso contrário, as mutações seriam inócuas.

Uma das teorias era de que o DNA lixo serviria como uma "zona de amortecimento", na qual mutações aleatórias poderiam se acumular ao longo do tempo sem maiores consequências para o organismo. Mas não. Os dados mostram que alterações nessas regiões reguladoras podem ser tão relevantes clinicamente quanto mutações nos genes.

Perspectivas. Os resultados acrescentam uma nova camada de complexidade ao estudo do genoma humano e mostram que é preciso bem mais do que uma sequência de letrinhas para entender como ele funciona. E que os genes são apenas parte de uma história que pode ser contada de diversas maneiras, dependendo de como o genoma é lido. Mayana prevê que os dados abrirão muitas perspectivas de tratamento, apontando para novos alvos genéticos fora das regiões codificadoras e melhorando o entendimento de como o genoma funciona de uma forma geral.

Uma das áreas médicas que certamente tirará proveito dos dados é a oncologia, na qual a relação entre genética e fisiologia se dá de forma mais acentuada. Dirce ressalta, porém, que os dados não têm aplicação imediata na medicina. Assim como foi o caso com o sequenciamento do genoma humano, os resultados do Encode servem como uma plataforma de conhecimento básico, sobre a qual novas pesquisas poderão ser construídas com finalidades mais aplicadas. Algo que levará tempo.

"É uma quantidade imensa de informações. Vai demorar um pouco para darmos sentido prático a tudo isso", diz a pesquisadora. "Teremos de decifrar devagarzinho todos esses achados."

Segundo uma reportagem que acompanha os trabalhos na revista Nature, se todas as sequências genéticas produzidas pelo projeto fossem impressas numa escala de mil pares de bases por centímetro quadrado, o resultado seria uma pilha de papel com 30 quilômetros de comprimento e 16 metros de altura.

Leitura suficiente para muitos e muitos anos de pesquisa.