Em setembro do ano passado, a OpenAI apresentou uma nova versão do ChatGPT projetada para raciocinar em tarefas que envolvem matemática, ciências e programação de computadores. Ao contrário das versões anteriores do chatbot, essa nova tecnologia poderia passar algum tempo “pensando” sobre problemas complexos antes de chegar a uma resposta.
Em pouco tempo, a empresa informou que sua nova tecnologia de raciocínio havia superado o desempenho dos principais sistemas do setor em uma série de testes que acompanham o progresso da inteligência artificial (IA).

Agora, outras empresas, como o Google, a Anthropic e a DeepSeek da China, apresentaram tecnologias semelhantes.
Mas a IA pode de fato raciocinar como um ser humano? O que significa para um computador “pensar”? Esses sistemas estão realmente se aproximando da verdadeira inteligência?
O que significa quando um sistema de IA raciocina?
Raciocinar significa apenas que o chatbot passa mais tempo trabalhando em um problema.
“Raciocínio é quando o sistema faz um trabalho extra depois que a pergunta é feita”, disse Dan Klein, professor de ciência da computação na Universidade da Califórnia, em Berkeley, e diretor de tecnologia da Scaled Cognition, uma startup de IA.
Ele pode dividir um problema em etapas individuais ou tentar resolvê-lo por meio de tentativa e erro.
O ChatGPT original respondia às perguntas imediatamente. Os novos sistemas de raciocínio podem trabalhar em um problema por vários segundos - ou até minutos - antes de responder.
Você pode ser mais específico?
Em alguns casos, um sistema de raciocínio refinará sua abordagem a uma pergunta, tentando repetidamente aprimorar o método escolhido. Outras vezes, ele pode tentar várias maneiras diferentes de abordar um problema antes de se decidir por uma delas. Ou pode voltar e verificar algum trabalho que fez alguns segundos antes, apenas para ver se estava correto.
Basicamente, o sistema tenta fazer o possível para responder à sua pergunta.
É como um estudante do ensino fundamental que está lutando para encontrar uma maneira de resolver um problema de matemática e rabisca várias opções diferentes em uma folha de papel.
Que tipos de perguntas exigem que um sistema de I.A. raciocine?
É possível que ele raciocine sobre qualquer coisa. Mas o raciocínio é mais eficaz quando você faz perguntas que envolvem matemática, ciências e programação de computadores.
Como um chatbot de raciocínio é diferente dos chatbots anteriores?
Você poderia pedir aos chatbots anteriores que mostrassem como eles chegaram a uma determinada resposta ou que verificassem o próprio trabalho. Como o ChatGPT original aprendeu com textos na internet, em que as pessoas mostravam como tinham chegado a uma resposta ou verificavam seu próprio trabalho, ele também podia fazer esse tipo de autorreflexão.
Mas um sistema de raciocínio vai além. Ele pode fazer esse tipo de coisa sem ser solicitado. E pode fazê-las de maneiras mais abrangentes e complexas.
As empresas o chamam de sistema de raciocínio porque parece que ele funciona mais como uma pessoa pensando em um problema difícil.
Por que o raciocínio de IA é importante agora?
Empresas como a OpenAI acreditam que essa é a melhor maneira de aprimorar seus chatbots.
Durante anos, essas empresas se basearam em um conceito simples: Quanto mais dados da internet eles injetavam em seus chatbots, melhor era o desempenho desses sistemas.
Mas em 2024, eles usaram quase todo o texto da Internet.
Isso significava que eles precisavam de uma nova maneira de aprimorar seus chatbots. Então, começaram a criar sistemas de raciocínio.
Como se constrói um sistema de raciocínio?
No ano passado, empresas como a OpenAI começaram a se apoiar fortemente em uma técnica chamada aprendizado por reforço.
Por meio desse processo, que pode se estender por meses, um sistema de inteligência artificial pode aprender o comportamento por meio de extensas tentativas e erros. Ao trabalhar com milhares de problemas de matemática, por exemplo, ele pode aprender quais métodos levam à resposta certa e quais não levam.
Os pesquisadores criaram mecanismos de feedback complexos que mostram ao sistema quando ele fez algo certo e quando fez algo errado.
“É um pouco como treinar um cachorro”, disse Jerry Tworek, pesquisador da OpenAI. “Se o sistema se sair bem, você lhe dá um biscoito. Se ele não se sair bem, você diz: ‘cachorro mau’.”

O aprendizado por reforço funciona?
Ele funciona muito bem em determinadas áreas, como matemática, ciências e programação de computadores. Essas são áreas em que as empresas podem definir claramente o comportamento bom e o ruim. Os problemas de matemática têm respostas definitivas.
O aprendizado por reforço não funciona tão bem em áreas como redação criativa, filosofia e ética, em que a distinção entre bom e ruim é mais difícil de ser definida. Os pesquisadores afirmam que esse processo pode, em geral, melhorar o desempenho de um sistema de IA, mesmo quando ele responde a perguntas que não sejam de matemática e ciências.
“Ele aprende gradualmente quais padrões de raciocínio o levam na direção certa e quais não”, disse Jared Kaplan, diretor científico da Anthropic.
A aprendizagem por reforço e os sistemas de raciocínio são a mesma coisa?
Não. O aprendizado por reforço é o método que as empresas usam para criar sistemas de raciocínio. É o estágio de treinamento que, em última análise, permite que os chatbots raciocinem.
Leia também
Esses sistemas de raciocínio ainda cometem erros?
Com certeza. Tudo o que um chatbot faz é baseado em probabilidades. Ele escolhe o caminho mais parecido com os dados que aprendeu, sejam eles provenientes da Internet ou gerados por meio do aprendizado por reforço. Às vezes, ele escolhe uma opção errada ou que não faz sentido.
Esse é o caminho para uma máquina que se iguala à inteligência humana?
Os especialistas em IA estão divididos quanto a essa questão. Esses métodos ainda são relativamente novos, e os pesquisadores ainda estão tentando entender seus limites. No campo da IA, os novos métodos costumam progredir muito rapidamente no início, antes de desacelerar.
Este conteúdo foi traduzido com o auxílio de ferramentas de Inteligência Artificial e revisado por nossa equipe editorial. Saiba mais em nossa Política de IA.