GPT-5: OpenAI apresenta o novo cérebro do ChatGPT com menos alucinações e assistente de saúde

Nova IA da companhia chega com mais de dois anos de atraso

PUBLICIDADE

Foto do autor Bruna Arimathea
Foto do autor Bruno Romani
Foto do autor Mariana Cury
Atualização:

A OpenAI lançou nesta quinta-feira, 7, o novo “cérebro” para seu chatbot, o ChatGPT. O novo modelo de inteligência artificial (IA), chamado GPT-5, foi anunciado com meses de atraso em sua previsão inicial e promete ser o novo norte de desenvolvimento de LLMs dentro da empresa. O novo modelo ficará disponível a partir desta quinta para todos os usuários do chatbot, incluindo em sua versão gratuita.

O lançamento faz parte dos esforços da OpenAI em simplificar e combinar seus grandes modelos de linguagem e se aproximar da inteligência artificial geral (AGI, na sigla em inglês) — embora as demonstrações parecessem mostrar um modelo evoluído, porém longe de qualquer coisa parecida de uma IA com capacidade e cognição humana. De fato, especialistas afirmam que não está claro se uma AGI é possível.

ChatGPT ganha novo modelo de IA para equipar chatbot Foto: Kiichiro Sato/AP

PUBLICIDADE

Antes do anúncio, o CEO da gigante, Sam Altman, se referiu ao GPT-5 como “um sistema que integra grande parte da nossa tecnologia”.

Segundo a OpenAI, a IA foca em um dos principais problemas dos grandes modelos de linguagem (LLMs): a taxa de alucinação, termo usado para descrever os erros factuais produzidos pelos modelos que são apresentados como informações corretas.

Publicidade

Segundo a companhia, as respostas do GPT-5 são cerca de 45% menos propensas a conter erros factuais do que o GPT-4o e 80% menos propensas a conter erros factuais do que o GPT-o3.

A janela de contexto também cresce no novo modelo e passa de 200 mil tokens para 256 mil tokens, o que aumenta a capacidade da IA de lembrar informações fornecidas pelo usuário, assim como preferências de configurações e pesquisas prévias.

“É significativamente melhor em aspectos óbvios e sutis”, afirmou Sam Altman, fundador da OpenAI. “O GPT-5 é o primeiro a dar a sensação de estar conversando com um especialista em qualquer assunto — um especialista com nível de doutorado", disse.

Sam Altman apresentou o GPT-5 nesta quinta-feira, 7 Foto: Reprodução/ OpenAI

Uma demonstração da empresa mostrou que o novo modelo pode fazer uma representação visual para uma explicação didática, por exemplo. Além disso, é possível pedir para o GPT-5 “pensar melhor” na resposta, caso o usuário queira um resultado diferente do oferecido pelo chatbot.

Publicidade

O chat também vai mostrar uma janela com a cadeia de pensamento (chain of thought) da IA. Nesta janela, informações usadas ao longo do raciocínio do modelo são mostradas para o usuário. A técnica tem se popularizado nos últimos meses no mundo da IA: em vez de crescer apenas os dados do modelo, as máquinas passam mais tempo processando e analisando os dados já existentes.

Na parte conversacional, a empresa afirma que o modelo é mais fluido nas respostas e nas explicações para as perguntas dos usuários. O GPT-5 também inclui uma ferramenta aprimorada de áudio, onde a IA pode entender melhor a voz do usuário e se comunicar com mais naturalidade.

Uma das apostas para o novo modelo no ChatGPT também é a personalização. Será possível mudar as cores do chat e escolher traços de personalidade do robô da OpenAI. Dentro das “personas”, o usuário pode optar pelos modos cínico, robô, ouvinte e nerd, que estarão disponíveis nos chats e, posteriormente, nas ferramentas de voz. Essas características podem ser alteradas nas configurações da conta do usuário.

O GPT-5 ainda vai ganhar integração com o Gmail e com o Google Calendário para ajudar a planejar a agenda do usuário e criar sugestões baseada na rotina e nos dados já informados ao ChatGPT.

Publicidade

ChatGPT se torna mais colorido com GPT-5 Foto: Reprodução/ OpenAI

A IA terá versões com diferentes variantes: o GPT-5 “tradicional”, para tarefas de lógica e com muitos passos, o GPT-5-mini, um modelo mais leve para aplicações de custo reduzido e o GPT-5-nano, construído para um processamento mais rápido e de baixa latência.

Reasoning

Agora, os modelos que compõem o GPT-5 são integrados, o que significa que a própria IA vai escolher qual modo usar para responder ao comando do usuário. Assim, o ChatGPT vai analisar a complexidade do pedido, e identificar se é necessário uma maior capacidade de processamento, o uso de imagens ou se é uma demanda mais simples.

Segundo a empresa, essa capacidade é possível porque o novo modelo consegue, além de identificar o prompt, alternar rapidamente entre o modo chat e o modo thinking. Com isso, usuários não terão mais a opção de escolher manualmente qual modo ou modelo será usado na interação com o chat.

Publicidade

“A decisão de “pensar mais” usa sinais do seu prompt e da conversa, bem como padrões aprendidos a partir de como as pessoas escolhem manualmente os modelos, suas preferências e a frequência com que as respostas do modelo estão corretas", afirmou a empresa em seu blog.

Mesmo durante o modo thinking, que faz uma análise mais aprofundada e demora mais tempo para oferecer uma resposta, é possível pegar um “atalho” para o resultado mais rápido.

Saúde

De acordo com a OpenAI, o GPT-5 é o “melhor modelo já feito para perguntas relacionadas à saúde”. Em comparação a três benchmarks LLM de saúde da OpenAI, o HealthBench, HealthBench Hard e HealthBench Consensus, o GPT-5-thinking supera os outros modelos “por uma margem substancial”. A nova tecnologia obteve 25,5% no HealthBench Hard, acima dos 31,6% obtidos pelo o3.

Durante a transmissão ao vivo, a empresa convidou uma paciente com câncer que disse ter usado o ChatGPT para ajudá-la a entender o diagnóstico de seus exames. Além disso, ela disse ter pedido auxílio ao chatbot na hora de escolher qual tipo de tratamento seguiria para a doença. Com o novo modelo mais aprimorado, a OpenAI pretende fazer com que mais usuários utilizem o ChatGPT dessa forma.

Publicidade

A empresa afirma porém que o ChatGPT não substitui o diagnóstico de profissionais médicos. “Pense nisso como um parceiro para ajudá-lo a entender os resultados, fazer as perguntas certas durante o tempo que você tem com os profissionais de saúde e avaliar as opções ao tomar decisões”, afirma a OpenAI.

Sam Altman durante lançamento do GPT-5; paciente com câncer afirmou ter usado o ChatGPT para decidir tratamento  Foto: OpenAI/Reprodução

Programação

O GPT-5 também promete ser o melhor modelo da OpenAI em relação a programação, com uma avaliação de 74,9% no SWE-bench Verified e 88% no Aider polyglot. A empresa define a novidade como um “verdadeiro colaborador de programação”, capaz de programar em alta qualidade, corrigir bugs, editar código e responder perguntas complexas - em resposta ao vibe coding, tipo de programação com comandos sem códigos -, além de conseguir fornecer explicações detalhadas.

A ferramenta trabalha melhor com programas como o Cursor, Windsurf, GitHub Copilot e Codex CLI, podendo gerar planos e resumos enquanto programa. Além disso, em relação aos modelos anteriores, o GPT-5 não precisa pausar para a aprovação do usuário e, também, não se recusa a trabalhar com questões de alta complexidade de programação.

Durante a transmissão, os executivos da OpenAI mostraram exemplos de como a tecnologia agora é capaz de criar sites e games personalizados com poucos prompts, com mais senso estético e menos erros.

Publicidade

Demora

O modelo, porém, chegou com atraso ao mercado, o que levou investidores e especialistas a duvidarem do progresso do modelo. Segundo uma reportagem do Wall Street Journal, a OpenAI realizou dois grandes treinamentos antes de bater o martelo no novo modelo - envolvendo meses de processamento de dados - para trabalhar na inteligência do Orion, codinome para o modelo que seria o GPT-5.

Segundo os pesquisadores, o projeto não avançou o bastante para justificar a manutenção de seu funcionamento. Apenas contando com os custos de computação, um treinamento de seis meses da tecnologia pode custar cerca de US$ 500 milhões.

Os testes, que apresentaram diversos erros operacionais, não satisfizeram as expectativas dos especialistas. A Microsoft, principal investidora da OpenAI, esperava ver resultados do GPT-5 até o meio de 2024, o que não aconteceu.

Uma das dificuldades enfrentadas pela empresa, segundo especialistas, é a forma como esse modelo é alimentado. Programada para ter uma grande concentração de dados em seu aprendizado, a IA precisaria, além das informações disponíveis para treinamento, uma quantidade grande de dados gerados por ela mesma - chamados dados sintéticos -, como uma forma de retroalimentação.

Publicidade

Esse processo, além de trabalhoso, seria caro, por precisar de um investimento maior para construir um modelo que fosse capaz de criar e reabsorver seus próprios dados.

Algumas empresas preferem criar modelos com menor quantidade de dados, entretanto, a OpenAI optou por criar dados do zero. A empresa contratou funcionários para escrever novos códigos e resolver problemas matemáticos, fazendo com que a IA aprendesse com esses comandos mais complexos.

Como funciona

Em uma prévia nesta semana, Altman publicou no X o que parecia ser um teste do GPT-5 no ChatGPT. A demonstração, porém, não mostrou nenhuma ferramenta revolucionária do modelo: na mensagem, o CEO apenas mostrou como pedir indicações de um anime ao robô.

A cadeia de raciocínio é uma técnica na qual um modelo de IA, após ser pré-treinado, passa por um período adicional de pós-treinamento. Durante esse processo, o modelo aprende a responder de maneira mais deliberada e passo a passo - como se estivesse, de fato, pensando na resposta. Esse método permite que o modelo considere diferentes caminhos até encontrar um resultado.

Publicidade

No início do ano, quando lançou o GPT-4.5, Altman já havia avisado que o modelo seria o último sem o método de cadeia de raciocínio. A ideia é que esse tipo de modelo se desenvolva cada vez mais até que a produção de seus próprios dados alcance uma automação independente.