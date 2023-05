A gigante de tecnologia Meta, entrou na corrida da inteligência artificial (IA) e anunciou sua nova IA de código aberto — chamada ImageBind — capaz de gerar resultados multissensoriais, como áudio, imagens, vídeo e até mapas de calor a partir de um comando do usuário. A apresentação do recurso foi feita nesta terça-feira, 9, no site da companhia.

A ideia é criar um ecossistema de sensações: na plataforma, o usuário pode fazer o upload de um som de floresta, por exemplo, e receber imagens geradas a partir do som. Outra possibilidade é dar um comando em texto e receber um vídeo com o pedido. Isso porque a IA consegue conectar vários fluxos de dados, sendo esses visuais, textuais, térmicos, de movimento, de profundidade e de áudio.

O novo modelo da empresa faz parte de um projeto que estuda a capacidade de IAs generativas de criar experiências multissensoriais. O foco da pesquisa é reunir vários tipos de dados em uma só plataforma, para que seja possível usá-los com a linguagem de uma inteligência artificial.

A nova IA da meta conecta vários fluxos de dados Foto: Meta/Reprodução

De acordo com a empresa, a ferramenta poderá ser utilizada com equipamentos específicos no futuro, para produzir sensações ainda mais precisas — um pedido de “dia na praia” por escrito poderá transmitir o som das ondas no mar, o calor do ambiente e até a reprodução da paisagem em vídeo.

“O modelo aprende uma única incorporação, ou espaço de representação compartilhado, não apenas para texto, imagem/vídeo e áudio, mas também para sensores que registram profundidade (3D), informações térmicas (radiação infravermelha) e unidades de medição inercial (IMU), que calculam movimento e posição”, explicou a empresa no site.

Geradores de imagens por IA mais conhecidos , como a Midjourney e o DALL E -2, por exemplo, em fase de treinamento, precisam dos sistemas que unem palavras e imagens para que a tecnologia aprenda a associar ambos. Sendo assim, essa é a forma que IAs generativas — incluindo a ImageBind — são capazes de associar mais de um tipo de informação ao mesmo tempo.

Continua após a publicidade

A Meta já havia anunciado em fevereiro que planejava criar sua própria IA e competir no mercado das inteligências artificiais junto de outras granes empresas como o Google e a Microsoft.

Essa “febre” das IAs surgiu pouco tempo depois do lançamento do ChatGPT, pela OpenAI, co-fundada por Elon Musk, um dos bilionários que assinaram a carta anti-IA pedindo para que os desenvolvimentos de IA fossem pausados.