18 de abril de 2010

Anabolizar pesquisa é com a Databolha



O Datafolha não se contentou em "anabolizar" os bairros pesquisados na cidade de São Paulo, aumentando de 18 para 71, coisa que não fez em outras capitais, como o Rio de Janeiro e Belo Horizonte.

Resolveu também "anabolizar" a pesquisa incluindo mais cidades do Estado de São Paulo na amostragem de sua pesquisa do mês de março em relação ao mês de fevereiro.

É preciso salientar que o Datafolha mudou essa sua amostragem, quando Dilma encostou em Serra, com a diferença caindo para 4%.

Em todos os demais estados, o número de cidades escolhidas ou não variaram ou sofreram variações pequenas: uma ou duas cidades a mais ou a menos. Até aí tudo dentro do aceitável.

O que espanta é só no Estado de São Paulo ter saltado de 25 cidades em fevereiro, para 55 cidades pesquisadas em março.

Isso preocupa porque, por exemplo, um maior número de cidades do estado de São Paulo, onde José Serra (PSDB/SP) é de longe o mais conhecido, pode estar sendo computado na pesquisa nacional como se fossem amostras de outras cidades pequenas e médias, de mesmo porte, de outros estados do Brasil, onde José Serra é impopular.

Como agravante, São Paulo não é o estado que tem mais municípios no Brasil. Perde para Minas Gerais.

Assim, com essa "metodologia do Datafolha" anabolizando São Paulo, 36% (na pesquisa de março) foi até pouco para o demo-tucano.

Veja a relação de cidades "anabolizadas" na nota "Como o Datafolha manipulou as amostras para aumentar o número de Cidades pesquisadas no Estado de São Paulo"




Há uma fraude, intencional "ou não", no tamanho da amostra da pesquisa Datafolha de março em relação à de fevereiro. Da pesquisa divulgada hoje ainda não há estes dados para conferir. Mas os dados de fevereiro e março, disponíveis no TSE, são suficientes como prova.

Na pesquisa de fevereiro o instituto fez entrevistas em 18 bairros na cidade de São Paulo.

Na pesquisa de março, o Datafolha elevou a pesquisa para 71 bairros na cidade de São Paulo. Porém, inexplicavelmente, não aumentou o número de bairros nem na cidade do Rio de Janeiro, nem em Belo Horizonte.

A pesquisa do Datafolha é na rua, em lugares de movimento. Cada bairro é um ponto de coleta de entrevistas de intenção de votos.

Rio e Belo Horizonte perderam importância relativa na amostragem para São Paulo:

No Rio de Janeiro (segundo colégio eleitoral) a pesquisa foi feita em 10 bairros (10 pontos de entrevista).

O eleitorado da capital paulista é 1,8 vezes maior do que o da capital fluminense.

Pela proporção, se o Rio teve 10 pontos de coleta, São Paulo deveria escolher 18 bairros, e foi esse o número da pesquisa de fevereiro, o que estava certo. Resultado naquela data: apenas 4% de diferença entre Serra e Dilma.

Subitamente, em março, o DataFolha ampliou a coleta de amostra de São Paulo para 71 bairros. Inexplicavelmente, manteve para o Rio os mesmos 10 bairros. Resultado: a diferença aumentou para 9% entre Serra e Dilma.

Se o objetivo era ampliar a amostra para maior precisão, também seria necessário aumentar o número de bairros no Rio na mesma proporção, elevando de 10 para 39.

A mesma coisa aconteceu com Belo Horizonte. Tanto em fevereiro como em março, as pesquisas abrangeram 4 bairros. BH tem cerca de 22% do número de eleitores de São Paulo. Assim, para 18 bairros pesquisados em São Paulo em fevereiro, 4 em BH estava proporcionalmente correto. Mas para 71 bairros na capital paulista, seria necessário aumentar para 15 em BH.

O Datafolha vai argumentar que o tamanho da amostra em São Paulo não quer dizer nada, porque os resultados finais são ponderados de acordo com os dados do IBGE. É apenas uma meia verdade, pois uma pesquisa "bem feita" em São Paulo, e "mal feita" no Rio de Janeiro e Minas Gerais, afeta os resultados de toda a região sudeste e do Brasil.

Além disso, qual é a explicação para um estatístico "anabolizar" a amostragem justamente na cidade de São Paulo, onde José Serra tem índices muito melhores do que no Rio de Janeiro e em Belo Horizonte? É inexplicável que um estatístico escolha fazer esse plano de amostras desbalanceado.

Está usando critérios desproporcionais ao tamanho do eleitorado, para cidades diferentes, o que nenhum estatístico faria.

O fato indiscutível é que o Datafolha mudou sua metodologia no meio do jogo, e não comunicou ao distinto público, o que, por si só, já é prá lá de suspeito.

O segundo fato indiscutível é que o Datafolha está aumentando a importância do Estado de São Paulo na pesquisa, justamente no estado onde Serra é mais forte, o que torna tudo mais suspeito ainda.

Por fim, é um engôdo, uma forma de fraude, comparar a evolução do próprio Datafolha de fevereiro para março, quando foram feitas com metodologias diferentes, com planos de amostragem diferentes.

Qual o impacto dessa lambança no resultado nacional da pesquisa não dá para saber, inclusive porque seria necessário analisar o que foi mudado também nas demais cidades.

Só o Datafolha pode explicar. Mas quem vai confiar nas explicações do Datafolha depois disso?

Confira a relação dos bairros na pesquisa de março, feita entre 25/03/2010 a 26/03/2010 nesta página do TSE, clicando na protocolo 6617/2010:


Depois clique na parte indicada abaixo que aparecer na tela:


Confira a relação dos bairros na pesquisa de fevereiro, feita entre 24/02/2010 a 25/02/2010 repetindo o processo acima, porém clicando no protocolo 4080/2010 (é preciso virar para a página seguinte, na tela acima).

Veja a relação dos bairros "anabolizados" na nota "Como o Datafolha manipulou as amostras para aumentar o número de bairros pesquisados em São Paulo".


Não dá para deixar de publicar a fraude em todos os espaços que podemos.

2 comentários

Helen Lima

Olá, amigos!
Senti falta do ícone: envie essa mensagem.
Queria compartilhar essa farsa com outras pessoas.
abraços

Helen Lima

Apageum meus comentários, por favor. Vi logo abaixo: enviar postagem, o que é a mesm coisa.