A Meta anunciou no sábado, 6, os primeiros modelos da nova geração de sua inteligência artificial (IA) generativa, o Llama 4. A Meta AI, assistente de IA da empresa que funciona dentro de WhatsApp, Messenger e Instagram, já passou a ser alimentada pela nova tecnologia. O Llama está disponível em 40 países, incluindo no Brasil. No entanto, os recursos que envolvem imagem só estão disponíveis em inglês e nos EUA.

Os modelos Scout e Maverick, ambos de código aberto, são os mais avançados da empresa até hoje e foram construídos a partir do Llama 4 Behemoth, um modelo ainda em desenvolvimento que, segundo a Meta, já supera o desempenho do GPT-4.5, Claude Sonnet 3.7 e Gemini 2.0 Pro em testes padronizados usados para medir a capacidade dessas IAs em tarefas de ciência, tecnologia, engenharia e matemática. Como é padrão, a Meta disponibiliza seus modelos para que sejam retreinados e ajustados por qualquer desenvolvedor, uma aposta diferente de OpenAI e Google.

Modelos Scout e Maverick, já disponíveis em mais de 40 países, vão alimentar a assistente virtual da Meta em apps como WhatsApp e Instagram Foto: Luciana Dyniewicz/Estadão

PUBLICIDADE Os novos modelos usam uma estrutura chamada “mistura de especialistas” (ou MoE, na sigla em inglês). Em vez de usar um único bloco de processamento para todas as tarefas, a IA ativa apenas partes específicas da rede, como se diferentes grupos de neurônios fossem acionados dependendo do tipo de tarefa. Além disso, os dois modelos são multimodais, capazes de entender texto e imagem ao mesmo tempo. O Scout tem 17 bilhões de parâmetros ativos, que funcionam como conexões neurais responsáveis pelo “raciocínio” da IA, e 16 especialistas, ou seja, partes diferentes da rede que são ativadas conforme a necessidade da tarefa. Já o Maverick, que é mais robusto, também usa 17 bilhões de parâmetros ativos por vez, mas conta com um total de 128 especialistas. Somando tudo, ele chega a 400 bilhões de parâmetros. Na geração de palavras, parâmetros são expressões matemáticas das conexões entre palavras.

Um dos grandes destaques do Scout é a capacidade de lidar com até 10 milhões de tokens ao mesmo tempo, pequenos pedaços de texto ou imagem que a IA analisa — e quanto mais tokens ela consegue processar de uma vez, mais informação pode entender de forma contínua. Isso torna o Scout especialmente útil para tarefas que exigem análise complexa de dados ou conversas longas. Há variação idiomática, mas estima-se que a Bíblia tem em média 800 mil tokens. Ou seja, a nova IA da Meta tem capacidade entendimento de texto equivalente a mais de 12 Bíblias.

O Maverick, por sua vez, é mais focado no entendimento de imagens. Segundo a Meta, ele apresenta ótimo desempenho em tarefas que envolvem raciocínio lógico e programação.

Outra novidade é o modo como os modelos lidam com texto e imagem ao mesmo tempo. Eles já “fundem” os dois tipos de dados no começo do processo de aprendizado, o que permite treinar a IA até com imagens que não têm legenda. A tecnologia usada para leitura visual foi adaptada do MetaCLIP, um sistema criado pela própria empresa e ajustado especialmente para o Llama 4.