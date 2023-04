Recentemente, a foto do Papa Francisco usando um casacão branco inspirado no estilo hip-hop jogou luzes sobre a capacidade de sistemas de inteligência artificial (IA) de gerar imagens sintéticas muito realistas a partir de comandos de texto. Com isso, elas têm sido aplicadas em diferentes áreas, como publicidade, entretenimento e arte.

As IAs geradoras de imagem são baseadas em redes neurais, sistemas treinados para interpretar dados que utilizam técnicas de aprendizado de máquina para aprender criar as imagens. Embora avançados, esses sistemas estão se proliferando e são cada vez mais comuns na rede. Conheça alguns deles.

DALL-E 2

Da mesma empresa criadora do ChatGPT, a OpenAI, o DALL-E 2 foi lançada em abril do ano passado e influenciou toda uma geração de sistemas do tipo, pois mostrou ser possível criar imagens a partir de comandos comandos de texto. Ela transforma as descrições dos usuários em imagens personalizadas e detalhadas. Essa tecnologia também permite a criação de imagens inéditas, combinando diferentes conceitos e características.

Para usar o serviço do DALL-E 2, é necessário acessar o site oficial e criar uma conta. O DALL-E 2 não é totalmente gratuito, sendo limitado por um sistema de “créditos”. Cada usuário cadastrado recebe inicialmente 50 créditos, além de 15 créditos adicionais por mês.

Cada crédito permite que o usuário realize uma solicitação no DALL-E 2, resultando na geração de um conjunto de imagens por meio do programa. É possível gerar até quatro novas imagens por solicitação. Caso o usuário esgote seus créditos gratuitos, pode adquirir mais créditos mediante pagamento. No momento, é possível comprar 115 créditos por US$ 15.

Vale ressaltar que os créditos pagos que não utilizados vão acumulando mês a mês, enquanto os créditos gratuitos não utilizados não são cumulativos. Todos os créditos têm validade de até 12 meses a partir da data da compra.

Diversas alternativas estão disponíveis na tela inicial para testar. É possível clicar no botão Surpreenda-me para o software gerar automaticamente uma descrição para exemplificar como elaborar comandos. É possível, também, enviar uma imagem e pedir para que o programa a edite de acordo com suas instruções.

Outra opção é redigir comandos para originar novas imagens. O DALL-E 2 permite que se utilize até 400 caracteres para fazer uma solicitação, e cada uma gera quatro imagens.

Midjourney

Criado em 2022, o Midjourney é a IA por trás da primeira imagem viral do Papa. Ela pode gerar imagens que se parecem com pinturas ou desenhos, com muitos detalhes e texturas. A tecnologia funciona através do treinamento de uma rede de dados com várias imagens de referência, a partir das quais a IA é capaz de criar novas imagens. Além disso, a MidJourney permite ao usuário controlar alguns aspectos das imagens geradas, como a cor, textura e forma.

Para utilizar o programa, é necessário possuir uma conta válida no Discord e entrar no servidor oficial do Midjourney por meio desse link. É importante lembrar que a conta de avaliação disponibiliza 25 solicitações gratuitas para testes, e a partir disso, é necessário assinar um plano mensal de US$ 10 (com 200 solicitações) ou US$ 30 (com solicitações ilimitadas). As solicitações incluem variações e imagens de alta resolução conforme pedido pelo usuário.

Para acessar o comando /imagine e criar as solicitações, é preciso entrar em um dos canais marcados como #newbie no servidor do Midjourney. Uma vez no canal, o usuário deve digitar o comando /imagine e inserir as palavras-chave no campo prompt para gerar a imagem desejada. É possível incluir diferentes elementos separados por vírgulas.

O bot é capaz de gerar quatro imagens em aproximadamente um minuto. Após serem geradas, as imagens são adicionadas ao final do feed do usuário para visualização.

Stable Diffusion

Lançada em 22 de agosto de 2022, a Stable Diffusion usa técnicas para criar imagens realistas e personalizadas. Ela combina dois modelos: um para gerar a imagem e outro para controlar sua complexidade. Isso permite criar imagens com muitos detalhes, parecidas com imagens reais e que, assim como no Midjourney, podem ser ajustadas pelo usuário.

Para usar o programa, basta instalar o software no seu computador por meio desse link. Assim que acessar a plataforma, envie comandos conforme desejar para ver as fotos geradas Caso queira novas opções de imagem, envie o comando novamente.

O app permite, também, que o usuário escolha o modelo de imagem, basta que ele escreva isso no comando. Por enquanto, o programa é gratuito.

NightCafe

A NightCafe é uma IA que foi lançada em 2019 capaz de criar imagens sintéticas bem realistas. Ela funciona aprendendo a representar diferentes estilos de imagens e, em seguida, gerando novas imagens com base nesses estilos. Além disso, a IA gerativa também permite que os usuários controlem certas características das imagens, como cor e textura.

Para acessar a plataforma, é necessário acessar o link oficial.Já no site, vá ao menu e selecione Iniciar a criação. Na sequência, digite um comando no campo disponível e, depois, selecione o estilo da arte a ser criada. Se desejar, alterne para o modo avançado para poder alterar mais aspectos. Em seguida, selecione entre os dois algoritmos disponíveis: Coerente ou Artístico.

Após configurar os aspectos da criação, basta pressionar o botão Criar e aguardar cerca de um minuto para que sua arte digital esteja pronta.

O NightCafe possui alguns pacotes de assinatura que permitem que os usuários criem as imagens. O pacote AI Beginner oferecer 1.240 imagens por mês por US$ 6 mensais, o pacote AI Hobbyist oferece 1.640 imagens por mês por US$ 10 mensais, o pacote AI Enthusiastic oferece 2.840 imagens por mês pelo valor de US$ 20 mensais e, por fim, o pacote AI Artist oferece 6.440 imagens por mês pelo preço de US$ 50 mensais.

DeepDream

Criada em 2015 pelo Google, a DeepDream é uma IA que gera imagens a partir de outras imagens. Ela destaca e amplia as características visuais da imagem original usada como base.

A técnica usa redes neurais treinadas em reconhecimento de padrões para identificar características específicas da imagem inicial. Ainda assim, o usuário pode controlar alguns aspectos da imagem gerada, como as áreas a serem destacadas.

Para acessar o programa, basta entrar no link e criar a sua conta na plataforma. Depois, é necessário enviar uma imagem base para que a IA seja capaz de gerar outras imagens.

Para fazer criações na plataforma, é possível escolher entre três pacotes de assinatura: Advanced (US$ 19/mês), Professional (US$ 39/mês) e Ultra (US$ 99/mês). Cada pacote, conforme maior o seu preço, mais imagens o usuário pode gerar e com maior resolução.

PixelRNN

A IA gerativa PixelRNN foi criada em 2016 e pode criar imagens pixel por pixel. Ela é treinada com várias imagens de referência, a partir das quais a IA aprende a sequência de pixels para gerar novas imagens. A tecnologia permite criar imagens realistas e personalizadas, controlando aspectos como cor e forma.

Para acessar e usar o PixelRNN, é necessário instalar o programa usando este link. Para gerar uma nova imagem, será preciso fornecer um ponto de partida, como uma imagem em branco, e alimentar a IA com essa imagem para gerar pixels que serão usados como base para os comandos enviados posteriormente.

BlueWillow

Criada em janeiro de 2023, a BlueWillow é outra IA capaz de gerar imagens originais. Essa plataforma é muito similar a Midjourney, criando imagens em vários estilos a partir de comandos enviados pelo usuário. É possível alterar detalhes da imagem gerada nas configurações ou apenas instruindo a tecnologia.

Para acessar o programa, basta ter uma conta no Discord acessar o seu servidor oficial. A partir dai, basta escrever no chat /imagine: prompt seguido do texto que descreve a imagem. No momento, a IA está com a versão Beta gratuita disponível para os usuários.

*Alice Labate é estagiária sob supervisão do editor Bruno Romani