Não foram apenas os institutos de pesquisa. Marcia Sensitiva também errou ao antecipar a vitória de Lula da Silva (depois disse que não disse, o que os institutos não disseram). Errar também é sobre-humano.

Os economistas também erram – e muito. No início do ano, previam que o crescimento do Produto Interno Bruto (PIB) em 2022 seria de 0,29%. Agora a estimativa é de quase dez vezes mais. Um erro de muitos bilhões de reais.

No caso mundano das pesquisas eleitorais, as enormes discrepâncias não devem causar surpresas. Há quem queira criminalizar os institutos de pesquisa, embalado pela mais rasteira visão conspiratória, muito ao gosto do terraplanismo bolsonarista. Mas o fato é que as pesquisas, da forma como são feitas e considerando as características das eleições brasileiras, sempre foram meras aproximações.

O voto obrigatório, a abstenção e a disposição de responder a perguntas com sinceridade, por exemplo, atrapalham muito a vida dos pesquisadores. Há também o problema da amostragem, menos explorado. Como escolher a amostra que será pesquisada? Há duas formas comumente utilizadas.

Pesquisas, da forma como são feitas e considerando as características das eleições brasileiras, sempre foram meras aproximações Foto: Wilton Junior/Estadão

A amostragem probabilística seleciona ao acaso as pessoas que vão responder à pesquisa. O tamanho ideal da amostra varia em função da homogeneidade da característica que será pesquisada. Quanto mais homogênea, menor poderá ser a amostra. Uma cozinheira não precisa provar mais do que uma pequena colher para saber se a sopa está com pouco sal – porque o sal está distribuído homogeneamente na panela.

A grande vantagem de amostras probabilísticas é que seus resultados podem ser generalizados para toda a população, com qualificações como intervalos de confiança e margens de erro. Mas elas têm duas (enormes) desvantagens: custam muito caro e tomam muito tempo.

A alternativa é fazer a amostragem por cotas ou estamentos. É assim que são feitas as pesquisas eleitorais. São definidas cotas que representam características da população, ou seja, as pessoas não são escolhidas aleatoriamente. Dessa forma, as pesquisas podem ser mais rápidas e muito mais baratas.

Mas não há justificativa para a utilização de testes estatísticos de margem de erro baseados em intervalos de confiança. A legislação brasileira ignora essa tecnicalidade e obriga os institutos a divulgarem uma margem de erro, o que não faz sentido. Erramos ao ler nas pesquisas o que elas não podem nos dizer. Isso é mediunidade estatística.