Inteligência artificial ‘irmã’ do ChatGPT pode ajudar a criar proteínas humanas

Cientistas tentam usar as mesmas técnicas do DALL-E 2 na busca por novas moléculas

PUBLICIDADE

Por Cade Metz

No ano passado, a OpenAI, startup por trás do ChatGPT, lançou uma tecnologia que permite criar imagens digitais apenas com a descrição em texto daquilo que você deseja ver. O programa conhecido como DALL-E 2 levou a criação de uma série de ferramentas semelhantes, como Midjourney e Stable Diffusion. Com a promessa de acelerar o trabalho dos artistas digitais, esta nova geração de inteligência artificial (IA) despertou a imaginação tanto do público em geral como de especialistas – e ameaçou suscitar novos níveis de desinformação online.

PUBLICIDADE

Desde então, as redes sociais estão repletas de imagens surpreendentemente conceituais, que são detalhistas de um modo impressionante, muitas vezes realistas, geradas pelo DALL-E e outras ferramentas. Mas alguns cientistas veem nessa tecnologia mais do que apenas um modo de criar fotos falsas. Eles enxergam um caminhos para novos tratamento contra o câncer, novas vacinas contra a gripe e novas pílulas que ajudam a digerir o glúten.

Usando muitas das mesmas técnicas por trás do DALL-E e de outras ferramentas para criação de arte digital, esses cientistas estão criando modelos para novas proteínas – mecanismos biológicos minúsculos que podem mudar a maneira como nossos corpos se comportam.

Nossos corpos produzem naturalmente cerca de 20 mil proteínas, que lidam com tudo, desde a digestão de alimentos até o transporte de oxigênio pela corrente sanguínea. Agora, os pesquisadores estão trabalhando para criar proteínas que não são encontradas na natureza, na esperança de melhorar nossa capacidade de combater doenças e fazer coisas que nossos corpos não conseguem por conta própria.

David Baker, diretor do Instituto de Design de Proteínas da Universidade de Washington, vem trabalhando no desenvolvimento de proteínas artesanais há mais de 30 anos. Em 2017, ele e sua equipe mostraram que isso era possível. Mas não esperavam que o surgimento de novas tecnologias de IA aceleraria repentinamente esse trabalho.

“Precisamos de novas proteínas que possam resolver os problemas modernos, como o câncer e as pandemias virais”, disse Baker. “Agora, podemos criar essas proteínas muito mais depressa e com taxas de sucesso muito maiores, e desenvolver moléculas muito mais sofisticadas que podem ajudar a resolver esses problemas,” explica.

No ano passado, Baker e seus colegas pesquisadores publicaram alguns artigos na revista Science descrevendo como várias técnicas de IA poderiam acelerar o design de proteínas. Mas esses artigos já foram ofuscados por um mais recente, que recorre às técnicas por trás de ferramentas como o DALL-E para mostrar como novas proteínas podem ser criadas do zero, assim como as fotos digitais.

Publicidade

“Uma das coisas mais poderosas em relação a essa tecnologia é que, assim como o DALL-E, ela faz o que você diz para fazer”, afirmou Nate Bennett, um dos pesquisadores do laboratório da Universidade de Washington. “A partir de uma única solicitação, ela pode gerar um número infinito de modelos,” diz.

Conheça os modelos de difusão

Para criar imagens, o DALL-E depende do que os pesquisadores de IA chamam de rede neural, um sistema matemático livremente inspirado na rede de neurônios do cérebro. Esta é a mesma tecnologia que reconhece os comandos que você dá ao seu smartphone, permite que os carros autônomos identifiquem (e evitem) pedestres e traduz idiomas em serviços como o Google Tradutor.

Uma rede neural aprende habilidades analisando grandes volumes de dados digitais. Ao identificar padrões em milhares de fotos de “vira-lata caramelo”, por exemplo, ela consegue aprender a reconhecer um cachorro do tipo. Com o DALL-E, os pesquisadores construíram uma rede neural que procurava padrões enquanto analisava milhões de imagens digitais e as legendas de texto que descreviam o que cada uma delas retratava. Assim, o programa aprendeu a reconhecer as conexões entre as imagens e as palavras.

Imagens criadas pelas IAs (da esquerda para a direita) DALL-E 2 , MidJourney e Stable Diffusion para o especial do LINK, com comando: "Um artista, com uma pintura a óleo impressionista, em um pôr do sol de uma cidade espanhola" Foto: DALL-E 2/Midjourney/Stable Diffusion/Estadão

Quando você descreve uma imagem para o DALL-E, uma rede neural cria um conjunto de características-chave que esta imagem talvez apresente. Uma delas pode ser a curvatura da orelha de um ursinho de pelúcia. Outra poderia ser o risco na borda de um skate. Em seguida, uma segunda rede neural – chamada modelo de difusão – gera os pixels necessários para tornar realidade essas características.

O modelo de difusão é treinado com uma série de imagens nas quais o ruído – as imperfeições – é adicionado aos poucos a uma fotografia até se tornar um mar de pixels aleatórios. Ao analisar essas imagens, o modelo aprende a executar esse processo ao contrário. Quando você oferece pixels aleatórios, ele remove o ruído, transformando esses pixels numa imagem coerente.

Na Universidade de Washington, em outros laboratórios universitários e em startups, os pesquisadores estão usando técnicas semelhantes em suas iniciativas para criar novas proteínas.

Como imaginar novas proteínas

As proteínas surgem como cadeias de compostos químicos, que depois se torcem e incorporam formatos tridimensionais que definem como elas se comportam. Nos últimos anos, laboratórios de IA como a DeepMind, da mesma empresa controladora do Google, a Alphabet, têm mostrado que as redes neurais podem adivinhar com precisão o formato tridimensional de qualquer proteína no corpo com base apenas nos menores compostos químicos que ela contém – um enorme avanço científico.

Publicidade

Agora, pesquisadores como Baker estão dando mais um passo, usando esses sistemas para criar modelos para proteínas completamente novas que não existem na natureza. O objetivo é criar proteínas que apresentem formatos muito específicos; uma forma exclusiva pode servir para uma tarefa única, como combater o vírus que causa a covid-19.

Assim como o DALL-E aproveita a relação entre legendas e fotografias, sistemas semelhantes podem valer-se da relação entre uma descrição do que a proteína pode fazer e o formato que adota. Os pesquisadores podem fornecer um rascunho para a proteína que desejam, então um modelo de difusão pode criar seu formato tridimensional.

“Com o DALL-E, é possível pode pedir uma imagem de um panda comendo um broto de bambu”, disse Namrata Anand, ex-pesquisadora da Universidade Stanford que está abrindo uma empresa focada nessa área de pesquisa. “De modo semelhante, os engenheiros de proteínas podem pedir uma proteína que se conecta a outra de uma maneira particular – ou alguma outra limitação de design – e o modelo generativo pode construí-la.”

Cautela e inovação

A diferença é que o olho humano pode avaliar instantaneamente a fidelidade de uma imagem criada pelo DALL-E. Mas não é capaz de fazer o mesmo com uma estrutura proteica. Depois que as tecnologias de IA produzem esses modelos de proteínas, os cientistas ainda precisam levá-los para um laboratório úmido – onde experimentos podem ser realizados com compostos químicos de verdade – e verificar se eles fazem o que deveriam fazer.

Por essa razão, alguns especialistas dizem que as tecnologias de IA mais recentes devem ser adotadas com cautela. “Criar uma nova estrutura é apenas uma brincadeira”, disse Frances Arnold, Nobel de Química e professora especializada em engenharia de proteínas no Instituto de Tecnologia da Califórnia. “O que importa de verdade é: o que essa estrutura pode mesmo fazer?”

Uma fotografia colorida de uma estrutura de proteína em uma revista, criada pela IA Alphafold.  Foto: DALL-E 2/Midjourney/Stable Diffusion/Estadão

Mas, para muitos pesquisadores, essas novas técnicas não estão apenas acelerando a criação de possíveis novas proteínas para o laboratório úmido. Elas oferecem um modo de conhecer inovações que os pesquisadores não conseguiam explorar anteriormente por conta própria.

“O que é empolgante não é apenas que eles são criativos e exploram possibilidades inesperadas, mas que são criativos enquanto atendem certos objetivos ou restrições de design”, disse Jue Wang, pesquisador da Universidade de Washington. “Isso evita que você precise verificar todas as proteínas possíveis no universo.”

Publicidade

Com frequência, as máquinas inteligentes artificialmente são desenvolvidas para executar tarefas naturais para os seres humanos, como juntar imagens, escrever textos ou jogar jogos de tabuleiro. Os bots criadores de proteínas lançam uma pergunta mais profunda, segundo Wang: “O que as máquinas podem fazer que os humanos não são capazes de modo algum?”. / TRADUÇÃO DE ROMINA CÁCIA

Comentários

Os comentários são exclusivos para assinantes do Estadão.