Se as eleições presidenciais fossem hoje, o ex-presidente Luiz Inácio Lula da Silva (PT) venceria no primeiro turno? O agregador de pesquisas do Estadão, que a partir desta quinta-feira, 2, passa a mostrar a taxa de votos válidos dos candidatos, mostra que o petista teria chances, mas com uma margem muito apertada.

Na Média Estadão Dados de votos válidos, formada a partir de dados e linhas de tendências de todas as pesquisas recentes, Lula aparece com 52%, contra 33% de Jair Bolsonaro (PL), candidato à reeleição. Para vencer no primeiro turno, um candidato necessita da maioria absoluta dos válidos, ou seja, 50% mais um.

O candidato do PT, portanto, poderia vencer no primeiro turno, mas é importante ressaltar que o agregador mostra o ponto médio de uma estimativa feita com base em várias pesquisas, cada uma delas sujeita a margens de erro. Sempre há incertezas envolvidas.

Por fim, nunca é demais lembrar que pesquisas são um indicador do que acontece neste momento ou no passado recente, e não uma projeção do futuro. Ainda faltam quatro meses para as eleições.

No agregador, são considerados votos válidos aqueles declarados para algum dos candidatos – não entram na conta as manifestações dos indecisos e dos que não pretendem votar em ninguém. Na eleição, os válidos são todos menos os brancos e nulos.

Considerando os votos totais, ou seja, também os dos indecisos e dos que pretendem anular, Lula tem 47% na Média Estadão Dados, 17 pontos porcentuais a mais que Bolsonaro, com 30%. Ciro Gomes (PDT) vem a seguir, com 7%. Há um empate entre André Janones (Avante) e Simone Tebet (MDB), ambos com 2%. Outros concorrentes, somados, chegam a 3%.

O agregador do Estadão usa dados de todas as pesquisas, levando em conta suas peculiaridades metodológicas, para calcular a Média Estadão Dados – o cenário mais provável da disputa a cada dia, de acordo com nosso modelo.

A média de cada candidato não é a simples soma dos resultados e divisão pelo número de pesquisas. O agregador controla diversos parâmetros e dá pesos diferentes aos levantamentos para impedir que números destoantes ou desatualizados puxem um dos concorrentes para cima ou para baixo.

A série histórica do agregador tem dados divulgados pelas seguintes empresas: Datafolha, Ipec (o antigo Ibope), Quaest, Paraná Pesquisas, Vox Populi, Sensus, MDA, PoderData, Ipespe, Ideia, Futura, FSB, Gerp e Real Time Big Data. As seis primeiras fazem pesquisas presenciais, ou seja, seus entrevistadores abordam as pessoas face a face, na rua ou em suas casas. As sete últimas promovem sondagens por telefone. O MDA usa os dois métodos.

A forma como os dados são coletados tem influência significativa nos resultados. Na média, pesquisas telefônicas tendem a subestimar a taxa de intenção de votos em Lula e a superestimar a de Bolsonaro. É possível que isso aconteça porque sondagens feitas por telefone tenham mais dificuldades de aferir a opinião dos mais pobres – segmento em que o petista se sai melhor.

Veja algumas das principais características do agregador:

1) São calculadas separadamente as médias de pesquisas presenciais e telefônicas. A média das primeiras é usada como parâmetro para estimar eventuais vieses das demais. Um fator de correção, que pode variar ao longo do tempo e é calculado para cada empresa, é aplicado para compensar esses possíveis vieses.

2) A linha de tendência de cada candidato, ou seja, a evolução de seu desempenho nas duas pesquisas mais recentes de um mesmo instituto, é levada em conta para calcular sua taxa a cada dia.

3) Há anteparos para evitar que números destoantes afetem o resultado final. Se uma pesquisa traz resultados muito diferentes de outras feitas em datas próximas e com metodologia semelhante, seu peso é reduzido no cálculo da média. O mesmo acontece quando uma determinada linha de tendência destoa das demais.

4) Quanto mais recente é uma pesquisa, maior é seu peso na definição da média final. Se uma empresa fica muito tempo sem divulgar pesquisas, suas taxas e linhas de tendências deixam temporariamente de ser consideradas, até que novos números sejam publicados. Atualmente só entram na conta dados de institutos com pesquisas divulgadas nos últimos 75 dias. Essa “janela de inclusão” vai diminuir com o tempo para que, na data do primeiro turno, sejam considerados apenas os resultados dos três dias anteriores.