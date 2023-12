O Google lançou nesta quarta-feira, 6, o que acredita ser a inteligência artificial (IA) mais potente já desenvolvida pela empresa. Chamada Gemini, a tecnologia vai estar disponível para o público a partir desta semana no Bard, chatbot que rivaliza com o ChatGPT e vai contar com três versões diferentes direcionadas para atividades que exigem maior ou menor processamento.

A IA foi anunciada em maio, no evento de desenvolvedores da empresa, o Google I/O. Na época, a companhia disse que a ferramenta estava em treinamento, sem data para estrear. A tecnologia é um modelo de fundação, ou seja, uma IA que pode receber comandos e produzir respostas em diversos formatos diferentes, como fotos, áudio, texto e expressões matemáticas, de uma forma mais abrangente e com maior capacidade do que um modelo de linguagem ampla (LLM, na sigla em inglês), como o GPT-4, da OpenAI, por exemplo.

“Estamos dando o próximo passo em nossa jornada com o Gemini, nosso modelo mais capaz e geral até o momento. Esses são os primeiros modelos da era Gemini e a primeira realização da visão que tivemos quando formamos o Google DeepMind no início deste ano. Essa nova era representa um dos maiores esforços científicos e de engenharia que já realizamos como empresa”, afirmou Sundar Pichai, presidente da empresa, em um comunicado para a imprensa.

Na demonstração realizada pelo Google, a IA interagia de forma mais natural com humanos: em vez de comandos estáticos, a máquina conseguia reconhecer imagens, emitir respostas em áudio e manter um diálogo que não dependesse sempre da iniciativa humana.

Processamento do Gemini é feito com computadores dedicados no Google Foto: Google/Divulgação

Bard muda de novo de IA

O Gemini foi desenvolvido com a DeepMind, empresa especialista em IA adquirida pelo Google em 2014. Em 2023, ela se tornou a responsável pelo desenvolvimento de produtos de IA da companhia. Inicialmente disponível em inglês, o software deve ter suporte para outros idiomas em breve e vai ser lançado em 170 países - países na Europa não estão incluídos na primeira leva do Gemini.

O Gemini é a nova tentativa do Google para alcançar o sucesso do ChatGPT, da OpenAI. A ferramenta da empresa de Sam Altman já passou por três grandes atualizações e ainda tem ditado as tecnologias no mercado de robôs de conversação.

Um indício de que o Google está tentando encurtar a distância é que essa é a terceira vez no ano que o Bard muda de “cérebro” - ou seja, que usa um modelo diferente de IA. O chatbot veio ao mundo alimentado pelo LaMDA e, posteriormente, recebeu uma atualização para o sistema PaLM 2. De acordo com o Google, porém, essa é a mudança mais significativa que o chatbot já recebeu até o momento.

Gemini estará disponível em três versões

O Gemini estará disponível em três versões, para atender diferentes demandas de processamento e sofisticação de respostas. A partir desta quarta, a primeira delas, a Gemini Pro, vai estar disponível no chatbot Bard. De acordo com a empresa, o novo software “é o modelo mais flexível até o momento, capaz de ser executado com eficiência em tudo, desde data centers até dispositivos móveis. Seus recursos de última geração aprimorarão significativamente a maneira como os desenvolvedores e clientes corporativos criam e dimensionam com IA”.

A segunda versão a ser lançada será o Gemini Nano. A ideia é que esse modelo seja mais rápido e leve para equipar ferramentas utilizadas no celular - a primeira implementação será no Pixel 8 Pro, smartphone do Google lançado neste ano.

Já o Gemini Ultra, modelo mais potente divulgado pelo Google, deve ser lançado apenas no ano que vem. Segundo uma demonstração da empresa, a IA reconhece comandos de texto, voz e vídeos, incluindo interações em tempo real durante gravações. No exemplo, um funcionário desenhava em uma folha de papel enquanto conversava com a tecnologia, que respondia perguntas sobre a figura que estava sendo feita no papel.

O Google também afirmou que esse é o primeiro modelo da empresa a atingir uma pontuação de 30 acertos em um teste de estado da arte, que mede o quanto uma IA se comporta como um cérebro humano em um questionário de 32 perguntas. O Google divulgou uma série de resultados de testes, nos quais o Gemini Ultra supostamente bate o GPT-4.

Em um desses testes, chamado Massive Multitask Language Understanding (MMLU) — reconhece a capacidade da IA de entender textos e resolver problemas propostos por ele — o Gemini obteve 90% de acertos enquanto o GPT-4 ficou com 86,4%. Em outro, que avalia a performance da IA em relação à ferramentas de compreensão de vídeos, a IA do Google foi eficaz 54,7% das vezes, enquanto o recurso da OpenAI tirou 46,3% na prova.

Além disso, a ideia da empresa é integrar o Gemini Ultra em uma plataforma chamada Bard Advanced. O site deve se parecer com o atual modelo do ChatGPT e deve ter uma assinatura mensal para acessar os recursos mais avançados. A empresa, porém, não comentou se um plano pago será implementado. Perguntado pelo Estadão, o Google afirmou que vai incluir o Gemini para sua ferramenta de buscas, que recentemente passou a incluir recursos de IA generativa, mas não informou quando isso deve acontecer.

No anúncio, o Google ainda alfinetou a rival OpenAI e afirmou que o Gemini Pro havia sido melhor avaliado em testes do que o GPT-3.5. No início deste ano, a empresa do ChatGPT lançou o GPT-4, versão que suportava conteúdos com imagem e, mais recentemente, o GPT-4 Turbo, que permite, pela primeira vez, que usuários que não possuem conhecimento de programação possam moldar o ChatGPT de acordo com suas necessidades, sem precisar contratar APIs ou serviços terceiros para isso apenas conversando com o chatbot.

O Bard com Gemini Pro já está disponível para o público a partir desta quarta-feira, enquanto as versões Nano e Ultra ficarão para o início do ano que vem, tanto para os testes beta quanto para o lançamento da versão final.