Conheça o pesquisador skatista que criou uma das poucas IAs fluentes em português do Brasil

Pós-doutorando da Universidade de Bonn, na Alemanha, Nicholas Kluge é o criador do Tucano; entenda o que é isso no perfil dele pela série ‘Nomes para ficar de olho’

PUBLICIDADE

O jovem no Brasil nunca é levado a sério, diz uma das mais clássicas canções da banda Charlie Brown Jr. Mas talvez na Alemanha isso seja diferente. Foi lá que o gaúcho Nicholas Kluge, de 36 anos, deixou de ser apenas skatista para se tornar um dos mais promissores pesquisadores brasileiros de inteligência artificial (IA) ao desenvolver o Tucano, um dos poucos modelos de linguagem especializados em português do nosso País.

Nicholas faz parte da série do Estadão “Nomes para ficar de olho”, que traz perfis em texto e vídeo de jovens que devem ganhar projeção nos cenários nacional e internacional nos próximos anos.

Nicholas Kluge trocou o skate pela IA para desenvolver modelos de linguagem brasileiros

PUBLICIDADE

O caminho, no entanto, foi tão cheio de obstáculos quanto uma prova de skate park. Sua primeira graduação foi em Educação Física, movido pela paixão pelo esporte que consagrou nomes como Rayssa Leal. “Eu gostava muito de Educação Física. Ando de skate, queria andar de skate para a toda a vida, mas o corpo não aguenta”, conta ao Estadão da Universidade de Bonn, na Alemanha, onde é pesquisador de pós-doutorado.

Foi durante o curso de Educação Física que Nicholas descobriu o interesse pela Engenharia, em um grupo de pesquisa sobre biomecânica espacial, estudando o movimento do corpo humano em situações de gravidade reduzida.

Publicidade

Já no mestrado, conciliou seus interesses com uma tese que usava redes neurais para classificar manobras de skate como nollies, shoves e ollies, aproveitando o interesse gerado pela inclusão do esporte no programa olímpico. “A ideia era criar um classificador para detectar manobras a partir de informações de um acelerômetro”, explica. “Adorei fazer essa pesquisa. Podia andar de skate e trabalhar com o que gostava ao mesmo tempo.”

“Ele era um cara que andava de skate, que gostava de esportes radicais, mas era um hacker, tinha interesse em computação”, conta o filósofo Nythamar de Oliveira, orientador do doutorado de Nicholas no Brasil, na PUC-RS. Nythamar lembra o primeiro contato deles, ainda em um seminário de neurofilosofia, na época que o tema era tão dominante quanto a inteligência artificial.

Projeto de Nicholas foi reconhecido pela Universidade de Bonn como um dos mais interessantes a usar o supercomputador Marvin Foto: Acervo pessoal

Após ser rejeitado no doutorado em Ciência da Computação por duas universidades brasileiras, Nicholas levou sua pesquisa para a Filosofia, já inspirado pelas questões levantadas com o lançamento do GPT-2, em 2019. Analisando as intersecções entre tecnologia e ética, não só foi aprovado como recebeu uma bolsa integral para estudar na Universidade de Bonn, no Center for Science and Thought.

Na Alemanha, a infraestrutura computacional abriu caminho para trabalhos com grandes modelos de linguagem (LLMs) e o alinhamento, uma das principais áreas contemporâneas da IA, que estuda como esses sistemas podem internalizar metas e valores éticos humanos e evitar efeitos adversos indesejados. Seu doutorado em Filosofia, que analisa as condições necessárias para esse alinhamento ético, será publicado pela editora Springer Nature.

Publicidade

Desafio e oportunidade

Durante esse processo, Nicholas enfrentou um desafio: a falta de bons modelos de IA em língua portuguesa. “Eu não tinha um modelo de geração de texto que performasse bem. Tinha modelos multilinguais, que foram treinados em várias línguas. E eles são meio que uns patos: fazem tudo, mas fazem tudo meia-boca.”

Dessa necessidade surgiram iniciativas inovadoras, como o GigaVerbo, o maior banco de dados em português para treinamento de IAs, com 200 bilhões de tokens, o TeenyTinyLlama, um par de modelos compactos de linguagem, e finalmente o Tucano, um LLM de código aberto totalmente em português que supera benchmarks multilíngues, como o Llama, da Meta, em tarefas específicas do idioma.

Em 2025, o Tucano foi reconhecido pela Universidade de Bonn como um dos projetos mais interessantes a utilizar o seu supercomputador Marvin.

PUBLICIDADE

Nicholas destaca a importância do Tucano não apenas pelos benefícios diretos aos usuários, mas pelo aprendizado proporcionado pelo processo de desenvolvimento.

“Seria interessante que no Brasil a gente tivesse soberania tecnológica suficiente para desenvolver os nossos próprios modelos. Que a gente não precisasse ficar esperando Meta, Qwen, DeepSeek ou OpenAI liberar um modelo, que depois a gente pode ir lá pegar os pesos e tentar, enfim, readaptá-los para o nosso caso”, explica. “Defender isso é basicamente dizer que a gente está feliz em ser colônia, que a gente não precisa criar as nossas próprias tecnologias. Precisamos ter as nossas próprias pernas e a nossa independência.”

Eu não tinha um modelo de geração de texto que performasse bem. Tinha modelos multilinguais, que foram treinados em várias línguas. E eles são meio que uns patos: fazem tudo, mas fazem tudo meia-boca

Nicholas Kluge

O fato de o Tucano ser um modelo de código totalmente aberto, incluindo o dataset em que foi treinado, também responde a uma das principais questões da IA: a falta de reprodutibilidade de seus resultados, com modelos muitas vezes trancados atrás de códigos proprietários.

“A reprodutibilidade é um pilar epistemológico da ciência. Se eu não consigo reproduzir os teus resultados de um ponto de vista epistemológico, filosófico, da filosofia da ciência, o que tu fez não é ciência”, diz. “É importante ter primeiro modelos abertos; segundo, saber de onde vieram os dados. No Brasil, tem o Maritaca, o Bode, e eu acho que isso é muito importante, ter gente fazendo modelos brasileiros”, afirma Fernando Osório, professor da Universidade de São Paulo (USP) em São Carlos.

Desigualdade na IA

Atualmente, Nicholas trabalha na segunda versão do GigaVerbo e do Tucano. “Eu quero tentar fazer algo muito melhor do que a gente fez na primeira versão, e de novo publicar tudo de forma aberta.”

Publicidade

O pesquisador também fez uma promessa para seus colegas de time: após a nova versão do Tucano, vai continuar trabalhando em novos modelos, dessa vez em outros idiomas, reduzindo um pouco a desigualdade do campo da inteligência artificial.

“Eu gostaria de ajudar a trazer todos os outros idiomas que simplesmente não têm nada. Vamos tentar deixar o campo um pouquinho mais igual. Nunca vai ser possível ficar tudo igual. A China e os Estados Unidos vão estar sempre na frente”, diz. “Mas a gente não precisa estar tão atrás.”

Nicholas também quer trabalhar mais com as questões de alinhamento, inspirado pelo trabalho de especialistas como Amanda Askell, filósofa que atua na startup Anthropic como responsável pela personalidade do modelo Claude.

“No futuro, eu gostaria também de não só trabalhar com essa questão de modelos fundacionais, mas de voltar e trabalhar mais com questões de alinhamento. Eu acho que alinhamento é um problema muito interessante. É um problema onde várias áreas do conhecimento se juntam”, conclui. E o skate? “Tem uma pista do lado onde eu trabalho”, diz ele.

Publicidade