Inteligência artificial ‘irmã’ do ChatGPT pode ajudar a criar proteínas humanas

No ano passado, a OpenAI, startup por trás do ChatGPT, lançou uma tecnologia que permite criar imagens digitais apenas com a descrição em texto daquilo que você deseja ver. O programa conhecido como DALL-E 2 levou a criação de uma série de ferramentas semelhantes, como Midjourney e Stable Diffusion. Com a promessa de acelerar o trabalho dos artistas digitais, esta nova geração de inteligência artificial (IA) despertou a imaginação tanto do público em geral como de especialistas – e ameaçou suscitar novos níveis de desinformação online.

Desde então, as redes sociais estão repletas de imagens surpreendentemente conceituais, que são detalhistas de um modo impressionante, muitas vezes realistas, geradas pelo DALL-E e outras ferramentas. Mas alguns cientistas veem nessa tecnologia mais do que apenas um modo de criar fotos falsas. Eles enxergam um caminhos para novos tratamento contra o câncer, novas vacinas contra a gripe e novas pílulas que ajudam a digerir o glúten.

Usando muitas das mesmas técnicas por trás do DALL-E e de outras ferramentas para criação de arte digital, esses cientistas estão criando modelos para novas proteínas – mecanismos biológicos minúsculos que podem mudar a maneira como nossos corpos se comportam.

Nossos corpos produzem naturalmente cerca de 20 mil proteínas, que lidam com tudo, desde a digestão de alimentos até o transporte de oxigênio pela corrente sanguínea. Agora, os pesquisadores estão trabalhando para criar proteínas que não são encontradas na natureza, na esperança de melhorar nossa capacidade de combater doenças e fazer coisas que nossos corpos não conseguem por conta própria.

Conheça os modelos de difusão

Para criar imagens, o DALL-E depende do que os pesquisadores de IA chamam de rede neural, um sistema matemático livremente inspirado na rede de neurônios do cérebro. Esta é a mesma tecnologia que reconhece os comandos que você dá ao seu smartphone, permite que os carros autônomos identifiquem (e evitem) pedestres e traduz idiomas em serviços como o Google Tradutor.

Uma rede neural aprende habilidades analisando grandes volumes de dados digitais. Ao identificar padrões em milhares de fotos de “vira-lata caramelo”, por exemplo, ela consegue aprender a reconhecer um cachorro do tipo. Com o DALL-E, os pesquisadores construíram uma rede neural que procurava padrões enquanto analisava milhões de imagens digitais e as legendas de texto que descreviam o que cada uma delas retratava. Assim, o programa aprendeu a reconhecer as conexões entre as imagens e as palavras.

Imagens criadas pelas IAs (da esquerda para a direita) DALL-E 2 , MidJourney e Stable Diffusion para o especial do LINK, com comando: "Um artista, com uma pintura a óleo impressionista, em um pôr do sol de uma cidade espanhola" Foto: DALL-E 2/Midjourney/Stable Diffusion/Estadão

Quando você descreve uma imagem para o DALL-E, uma rede neural cria um conjunto de características-chave que esta imagem talvez apresente. Uma delas pode ser a curvatura da orelha de um ursinho de pelúcia. Outra poderia ser o risco na borda de um skate. Em seguida, uma segunda rede neural – chamada modelo de difusão – gera os pixels necessários para tornar realidade essas características.

O modelo de difusão é treinado com uma série de imagens nas quais o ruído – as imperfeições – é adicionado aos poucos a uma fotografia até se tornar um mar de pixels aleatórios. Ao analisar essas imagens, o modelo aprende a executar esse processo ao contrário. Quando você oferece pixels aleatórios, ele remove o ruído, transformando esses pixels numa imagem coerente.

Na Universidade de Washington, em outros laboratórios universitários e em startups, os pesquisadores estão usando técnicas semelhantes em suas iniciativas para criar novas proteínas.

Como imaginar novas proteínas

As proteínas surgem como cadeias de compostos químicos, que depois se torcem e incorporam formatos tridimensionais que definem como elas se comportam. Nos últimos anos, laboratórios de IA como a DeepMind, da mesma empresa controladora do Google, a Alphabet, têm mostrado que as redes neurais podem adivinhar com precisão o formato tridimensional de qualquer proteína no corpo com base apenas nos menores compostos químicos que ela contém – um enorme avanço científico.

Agora, pesquisadores como Baker estão dando mais um passo, usando esses sistemas para criar modelos para proteínas completamente novas que não existem na natureza. O objetivo é criar proteínas que apresentem formatos muito específicos; uma forma exclusiva pode servir para uma tarefa única, como combater o vírus que causa a covid-19.

Assim como o DALL-E aproveita a relação entre legendas e fotografias, sistemas semelhantes podem valer-se da relação entre uma descrição do que a proteína pode fazer e o formato que adota. Os pesquisadores podem fornecer um rascunho para a proteína que desejam, então um modelo de difusão pode criar seu formato tridimensional.

Mark Zuckerberg não liga para diploma ao contratar na Meta; saiba o que importa para ele

“Com o DALL-E, é possível pode pedir uma imagem de um panda comendo um broto de bambu”, disse Namrata Anand, ex-pesquisadora da Universidade Stanford que está abrindo uma empresa focada nessa área de pesquisa. “De modo semelhante, os engenheiros de proteínas podem pedir uma proteína que se conecta a outra de uma maneira particular – ou alguma outra limitação de design – e o modelo generativo pode construí-la.”

Cautela e inovação

A diferença é que o olho humano pode avaliar instantaneamente a fidelidade de uma imagem criada pelo DALL-E. Mas não é capaz de fazer o mesmo com uma estrutura proteica. Depois que as tecnologias de IA produzem esses modelos de proteínas, os cientistas ainda precisam levá-los para um laboratório úmido – onde experimentos podem ser realizados com compostos químicos de verdade – e verificar se eles fazem o que deveriam fazer.

Por essa razão, alguns especialistas dizem que as tecnologias de IA mais recentes devem ser adotadas com cautela. “Criar uma nova estrutura é apenas uma brincadeira”, disse Frances Arnold, Nobel de Química e professora especializada em engenharia de proteínas no Instituto de Tecnologia da Califórnia. “O que importa de verdade é: o que essa estrutura pode mesmo fazer?”

Uma fotografia colorida de uma estrutura de proteína em uma revista, criada pela IA Alphafold. Foto: DALL-E 2/Midjourney/Stable Diffusion/Estadão

Mas, para muitos pesquisadores, essas novas técnicas não estão apenas acelerando a criação de possíveis novas proteínas para o laboratório úmido. Elas oferecem um modo de conhecer inovações que os pesquisadores não conseguiam explorar anteriormente por conta própria.

“O que é empolgante não é apenas que eles são criativos e exploram possibilidades inesperadas, mas que são criativos enquanto atendem certos objetivos ou restrições de design”, disse Jue Wang, pesquisador da Universidade de Washington. “Isso evita que você precise verificar todas as proteínas possíveis no universo.”

Com frequência, as máquinas inteligentes artificialmente são desenvolvidas para executar tarefas naturais para os seres humanos, como juntar imagens, escrever textos ou jogar jogos de tabuleiro. Os bots criadores de proteínas lançam uma pergunta mais profunda, segundo Wang: “O que as máquinas podem fazer que os humanos não são capazes de modo algum?”. / TRADUÇÃO DE ROMINA CÁCIA

Tudo Sobre

Comentários

Os comentários são exclusivos para assinantes do Estadão.

Já sou Assinante

Inteligência artificial ‘irmã’ do ChatGPT pode ajudar a criar proteínas humanas

Cientistas tentam usar as mesmas técnicas do DALL-E 2 na busca por novas moléculas

Leia também

Conheça os modelos de difusão

Como imaginar novas proteínas

Cautela e inovação

Últimas: Cultura Digital

Comprou computador com processador Intel recentemente? Sua máquina pode estar em perigo

Google tenta evitar alucinações de suas IAs com novas medidas; veja o que mudou

Seu navegador de internet está ultrapassado: conheça o Arc, o browser do futuro

Alexa: assistente da Amazon pode chegar em versão paga e mais inteligente ainda em julho

Mais lidas

Abertura das Olimpíadas de Paris mostra a Los Angeles o que não fazer em 2028

Venezuela fecha fronteiras e bloqueia avião com ex-presidentes que observariam eleições

Memes da abertura das Olimpíadas: veja os melhores da web

Olimpíadas: Zico é assaltado em Paris e sofre prejuízo de R$ 3 milhões

Por que o Brasil não está no futebol masculino nas Olimpíadas 2024?