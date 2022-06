A última rodada da pesquisa XP/Ipespe divulgada na semana passada provocou fortes protestos entre grupos bolsonaristas, que passaram a questionar a precisão dos dados aferidos. De modo geral, aliados do presidente Jair Bolsonaro (PL) têm procurado desqualificar os levantamentos eleitorais, que, até o momento, vêm mostrando o ex-presidente Luiz Inácio Lula da Silva (PT) à frente na corrida presidencial.

Ex-presidente Lula ocupa o primeiro lugar nas pesquisas, seguido pelo atual presidente Jair Bolsonaro. Foto: Evaristo Sá/AFP e Alan Santos/PR

O episódio mais recente levou a corretora de investimentos a alterar a periodicidade de divulgação de suas pesquisas e provocou dúvidas sobre como é feito esse tipo de levantamento. A divulgação dos dados da rodada prevista para hoje, dia 10, foi cancelada. A XP informou, por meio de nota, que a pesquisa passa a ter periodicidade mensal e terá o número de entrevistas ampliado. Questionada pelo Estadão, a corretora não informou se seguirá tendo o Ipespe como responsável pela coleta e análise de dados.

O levantamento alvo de polêmica costuma ter uma amostra em torno de mil pessoas (quantidade de eleitores consultados), margem de erro de 3,2 pontos porcentuais para mais ou para menos e o chamado nível de confiança é de 95,5%.

Esses três aspectos são essenciais para entender a lógica das sondagens, e o equilíbrio entre eles é a chave para obter um resultado preciso. O que é margem de erro? O que é índice de confiança e o que ele significa? Qual a relação desses termos com a amostra da pesquisa? As respostas estão na estatística.

Entenda

A princípio, considere uma amostra fixa de alguns milhares de indivíduos. Nesse caso, quanto maior o intervalo de confiança, maior também a margem de erro. Por exemplo, em um cenário hipotético, seria 100% confiável dizer que entre 0% e 99% da população votaria no candidato “x”. Essa conclusão não dá margem para o erro, justamente porque sua “margem de erro” é gigante e abrange praticamente todos os resultados possíveis. Nesse caso, a pesquisa não teria utilidade alguma, embora fosse completamente “confiável”.

Também seria possível ter 100% de confiança e cravar um resultado específico, sem nenhuma margem de erro, como “o candidato ‘x’ tem 35% das intenções de voto, nada a mais, nada a menos”, por exemplo. Como? Consultando todas as pessoas do País. Mas isso as urnas já farão em outubro, e não haveria lógica alguma em fazê-lo semanalmente ou mensalmente até as eleições. O papel da análise estatística é dar uma ideia sobre a realidade com a menor taxa de erro quanto for admissível.

Seguindo essa lógica, podemos concluir que a única maneira de ter uma margem de erro pequena sem comprometer demais a confiança é aumentando a amostra, isto é, o número de pessoas entrevistadas. Quanto maior a quantidade de eleitores consultados, maior a chance de ter uma margem de erro aceitável mantendo um nível de confiabilidade grande. Lembre-se do exemplo: perguntando a todas as pessoas do País, o erro é 0 e a confiança é 100.

Geralmente, o índice de confiança das pesquisas eleitorais - e também de outras, no mundo da Ciência - é de 95%, o que já é considerado alto o suficiente. Esse patamar é estabelecido pelos institutos como o equilíbrio aceitável entre confiabilidade e margem de erro, permitindo que esta fique entre 2 e 4 pontos, em média, para mais ou para menos, diante de um determinado tamanho de amostra - geralmente, em torno de 2 mil pessoas.

Na prática, isso significa que, se um candidato aparece com 40% das intenções de voto em uma pesquisa, é 95% confiável dizer que ele tem entre 38% e 42% na vida real (se a margem de erro for de 2 pontos). Em outras palavras, se essa pesquisa fosse repetida muitas vezes, o candidato apareceria dentro desse intervalo de preferência em 95% das vezes.

É questão de equilíbrio. Esse índice de confiabilidade com essa margem de erro não seria possível com uma amostra menor. Além disso, o grupo de pessoas escolhido deve ser representativo da realidade do País. Idealmente, a amostra deve reproduzir a proporcionalidade dos grupos na sociedade, como gênero, cor, escolaridade, região, renda e média da faixa etária. Desse modo, se a pesquisa for repetida inúmeras vezes, mas mantendo a mesma proporção das características sociais abordadas, o intervalo do resultado deve ser semelhante em 95% dos casos.

Esses termos vêm da matemática e estão presentes em qualquer modelo estatístico. Além deles, as pesquisas eleitorais em si têm outras peculiaridades metodológicas. A principal delas é se o levantamento foi feito por telefone ou presencialmente. Isso não tem influência nas regras de margem de erro e confiabilidade, mas pode causar algumas dissonâncias. Leia esta matéria para entender tais diferenças.