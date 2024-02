Mas as coisas não são tão simples assim. Um novo artigo de um trio de pesquisadores da Universidade Stanford postula que o surgimento repentino dessas habilidades é apenas uma consequência da forma como os pesquisadores medem o desempenho do LLM. As habilidades, segundo eles, não são imprevisíveis nem repentinas. “A transição é muito mais previsível do que as pessoas acreditam”, diz Sanmi Koyejo, cientista da computação de Stanford e autor do artigo. “As fortes suposições de habilidades emergentes estão ligados tanto à maneira como escolhemos medir quanto com o que os modelos estão fazendo.”

Só agora estamos vendo e estudando esse comportamento devido ao tamanho desses modelos. Os LLMs são treinados por meio da análise de enormes conjuntos de dados de texto - palavras de fontes online, incluindo livros, pesquisas na Web e Wikipédia - e da descoberta de vínculos entre palavras que aparecem frequentemente juntas. O tamanho é medido em termos de parâmetros, aproximadamente análogos a todas as maneiras pelas quais as palavras podem ser conectadas. Quanto mais parâmetros, mais conexões o LLM pode encontrar. O GPT-2 tinha 1,5 bilhão de parâmetros, enquanto o GPT-3.5, o LLM que alimenta a versão gratuita do ChatGPT, usa 350 bilhões. O GPT-4, que foi lançado em março de 2023 e agora é a base do Microsoft Copilot e do ChatGPT Plus, supostamente usa 1,75 trilhão (o número nunca foi confirmado).