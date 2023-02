A batalha pelas ferramentas de inteligência artificial (IA) já começou entre as grandes empresas de tecnologia. Depois de anunciar um recurso de busca conversacional — semelhante ao ChatGPT — na segunda-feira, 6, o Google retorna com outras novidades no setor de IA. Desta vez, buscas por imagens e realidade aumentada foram as estrelas do evento da companhia, realizado em Paris, França.

As novidades anunciadas pelo Google passam pelas três áreas principais da inteligência artificial: reconhecimento de informação em imagens, análise de um grande volume de dados em tempo real e processamento de linguagem natural (nas pesquisas). Além disso, a empresa também implementará no buscador uma IA generativa para dar respostas para perguntas que não têm apenas uma resposta correta. Com isso, a página de resultados trará respostas com diferentes pontos de vista.

O momento também não poderia ser mais quente: a própria Microsoft, que vem estreitando laços com a OpenAI nos últimos anos, anunciou na terça-feira, 7, que vai adicionar a IA do ChatGPT ao Bing, site de buscas da empresa, e ao navegador Edge. A aposta da Microsoft é trazer buscas mais eficientes para o site e unir a inteligência artificial conversacional a outras ferramentas da companhia.

No anúncio da ferramenta, Satya Nadella, CEO da Microsoft, afirmou que existe uma corrida pelo domínio das tecnologias de IA e que a empresa já estava se movendo “rapidamente” para conquistar seu espaço. Com o Google sendo, ainda, o maior site de pesquisas do mundo, a integração desses recursos pode mudar o cenário nas Big Techs.

Google Lens

A ferramenta de busca por imagens do Google deve ficar mais eficiente, de acordo com a empresa, que atualizou o recurso para ampliar a utilização de fotos nas pesquisas da plataforma. Até hoje, o Lens conseguia buscar parte de imagens e fornecer um resultado visual semelhante, com algumas informações ou traduções, quando solicitadas.

Segundo a companhia anunciou nesta quarta, usuários poderão utilizar o Lens para recolher informações e, se necessário, manter a identidade visual do objeto de pesquisa. Na ferramenta de tradução, por exemplo, se o texto estiver dentro de algum elemento fotográfico, como um cartaz ou uma capa de livro, a tradução gerada pelo Lens vai transpor as informações na própria imagem, por meio do celular (antes, o usuário tinha acesso apenas ao texto, quase como uma legenda).

Google Lens vai otimizar a busca de informações por imagens Foto: Estadão

Com o anúncio desta quarta, os usuários não precisarão necessariamente apontar a câmera para um objeto no mundo real para fazer uma pesquisa com o Lens. As imagens que aparecem na tela do celular também poderão ser facilmente pesquisadas. “Se você consegue ver, você consegue pesquisar”, disse Elizabeth Reid, vice-presidente de engenharia no Google.

Em relação às buscas por informações, o recurso “Multisearch” vai permitir que usuários possam juntar informações visuais e de texto para pesquisas no site. Assim, será possível inserir a foto de uma blusa, por exemplo, com uma descrição de alguma característica, como cor. O resultado da pesquisa vai mostrar modelos iguais ou semelhantes na cor escolhida pelo usuário.

A empresa também anunciou um recurso para encontrar restaurantes a partir de fotos de tipos de comida, ainda sem data de lançamento. Essa ferramenta vai mostrar quais estabelecimentos próximos possuem o prato desejado.

Falando em imagens, o Google anunciou ainda que vai usar sua inteligência artificial generativa para combinar fotos de diferentes ângulos de um mesmo produto e gerar uma visão dele em 360º.

Realidade aumentada

Outro segmento já investido pela empresa e que foi aprimorado é o Live View, recurso de realidade aumentada presente no Google Maps. Agora, além de permitir que o usuário possa visualizar, em tempo real, instruções para percorrer um trajeto, o app vai mostrar todos os estabelecimentos presentes no meio do caminho. Ao clicar no ícone de um dos restaurantes, por exemplo, vai ser possível acessar dados atualizados sobre menu, avaliação e status de lotação.

Para a navegação a pé ou de bicicleta, o Maps vai ajudar a acabar com a confusão de não saber exatamente em qual esquina virar para continuar o seu trajeto. Uma visão de cima do percurso, alinhada com a sua posição no mapa, é outra novidade.

Já o Immersive View vai fornecer dados como localização de pontos turísticos, restaurantes e lojas possam ser exibidos a partir da pesquisa visual. A função, porém, está disponível apenas em Londres, Los Angeles, Nova York, Paris, São Francisco e Tóquio — e deve chegar, nos próximos meses, em Barcelona, Dublin e Madri. Cidades brasileiras não foram mencionadas na apresentação.

Quem usa um carro 100% elétrico pode passar constantemente por momentos de ansiedade por medo de ficar sem carga na bateria. Para resolver isso, o Google utilizou uma combinação de informações para apontar o próximo ponto de recarga para fazer uma parada. A pesquisa pelo percurso no Maps, configurada para carros elétricos, vai considerar informações como a distância, o trânsito e a autonomia do veículo para encontrar a próxima parada. O Google não informou se o recurso estará disponível apenas nos Estados Unidos e na Europa ou no mundo todo.

O Google também colocou a IA para trabalhar nas interações com o Arts & Culture, app de realidade aumentada que reúne acervos de museus, mostras de arte e música. Agora, será possível brincar com IAs generativas como o Blob Opera, uma aba em que o usuário pode ser maestro e construir sua própria ópera.

Cantores de ópera treinaram IA do Google Foto: Google

Parece simples, mas é um trabalho intenso de aprendizado de máquina e IA: os Blobs, como são chamados os personagens, ganham voz a partir de mais de 16 horas de gravação de canto, para que as vozes possam ser separadas em elementos individuais — que podem ser reconstituídos pelo usuário. Na experiência, cantores de ópera ensinaram a inteligência artificial a cantar em diferentes naipes como baixos, tenores, mezzo sopranos e sopranos.

Bard

O Google também retomou brevemente seu último lançamento antes do evento em Paris: o Bard, chatbot inteligente alimentado pelo LaMDA (Language Model for Dialogue Applications). A ferramenta foi lançada na última segunda-feira, 6, e deve ser implementada em breve nos buscadores da empresa.

Inicialmente, o Google afirma que o Bard terá uma versão mais leve do LaMDA, o que permitirá torná-lo mais acessível a um público maior. Uma das dificuldades do ChatGPT é a alta demanda de recursos computacionais. Em diversos momentos, o serviço fica inacessível devido à alta demanda.

Mas a companhia de Sundar Pichai já tem planos para a tecnologia. No evento, a empresa afirmou que vai disponibilizar um API baseado no LaMDA para que clientes possam desenvolver suas próprias ferramentas a partir da IA.