[ABE-L] pesquisas eleitorais: Qual o problema?
Carlos Alberto de Bragança Pereira
cpereira em ime.usp.br
Seg Out 6 22:48:11 -03 2014
Prezados companheiros de rede:
Peço inicialmente desculpas por esta minha mensagem. Principalmente
pelo tamanho.
Eu vejo o problema de uma forma muito diferente dos colegas. É claro
que todos que vão ao mercado das pesquisas querem fazer o melhor mesmo
que estejam equivocados na melhor forma de coletar uma amostra. Assim
vou considerar alguns pontos que acho relevantes, pois vejo que os
colegas, sem terem ido a luta das pesquisas ficam argumentando sobre
erros de coleta. Só podemos contestar resultados no momento que
dermos nossas caras para bater e realisarmos uma pesquisa por nossa
própria conta e obtermos melhores resultados do que os institutos de
pesquisa. Se não temos recursos para fazer isso, podemos submeter um
projeto aos nossos institutos de apoio, como CNPq, CAPES, FAPESP etc.
Façamos isso como fizemos tempos atrás na eleição do Covas em segundo
turno aqui em São Paulo. Fomos financiados pela FAPESP. Posso dizer
aos colegas que tivemos sim muito sucesso, entretanto como nossas
previsões ficavam muito fora do que se publicava só pudemos falar de
nosso trabalho após a eleição, quando já não havia interesse e ninguém
iria acreditar nos nossos acertos. Não era eu, nem o Sérgio, quem
dirigia o processo administrativo da pesquisa. Claro que posso um dia
contar a vocês o que fizemos se minha memória ainda estiver em
condições. Mas devo dizer que a chance de errarmos era também muito
grande.
O risco de um erro de previsão em uma eleição com 150 milhões de
eleitores prováveis (111 milhões votaram efetivamente) será tão grande
quão pequeno for o tamanho da amostra. O Instituto Data Folha só
conseguiu fazer uma amostragem com 20 mil eleitores na pesquisa de
boca de urna porque nas outras foram no máximo de 9 mil perto das
eleições e menos de 5 mil nas anteriores. Não há dinheiro que aguente
uma amostra considerando os 5 mil municípios brasileiros. Perdoem-me
os “teóricos”, mas uma boa amostra teria de considerar vários aspectos
como rural e urbano, estados, municípios, condição sócio econômica,
qualidade de vida etc. Se colocarem a necessidade de medir
variabilidade em cada ponto, só ai daria uma amostra impossível para
nós. O ruim das cotas é que se faz otimização marginal, pois não
iriam conseguir uma amostra contemplando a otimização global com todas
as interações possíveis.
Falemos agora sobre a amostra completamente aleatória (levando-se em
conta agrupamentos etc.). Vamos pensar em uma grande urna com bolas
coloridas, a população de interesse. Construir uma amostra é dividir
essa grande urna em duas urnas, a amostra e a não amostra. Olhamos a
amostra e queremos predizer o que está na não amostra. Usar a
probabilidade de seleção como a distribuição de seleção para fazer a
predição estatística é um erro do ponto de vista da teoria de
verossimilhança. Pode-se mudar toda a composição da não amostra que a
distribuição de seleção é a mesma. Isto é verossimilhança FLAT! Quer
dizer que a verossimilhança é não informativa com relação a composição
do parâmetro de interesse; a composição da não amostra. É evidente
que se a amostra for bem grande a chance de obtermos na amostra uma
composição semelhante a não amostra aumenta, mas não é garantido meus
caros amigos.
A solução adequada em minha opinião seria lembrarmos-nos do teorema da
permutabilidade de DeFinetti e ai sim pensarmos em nossas informações
subjetivas obtidas das eleições anteriores e do conhecimento que
teríamos sobre as características das subpopulações dentro dos
subgrupos obtidos da otimização global. Não vou me alongar, pois os
detalhes são muitos para discutirmos num ambiente como o da rede.
Termino com uma provocação grande aos meus queridos amigos
randomizeiros. Se a mostra obtida de alguma forma é um possível
resultado de seleção, qual o problema de usar a estatística comum para
fazer as predições? Chacoalhar a urna e obter o mesmo resultado salva
a amostragem? Então não falo em cotas no relatório, pois ninguém
consegue provar que não randomizei.
Tenho dito!!!!!!!!
Saudações indutivas e subjetivistas
Carlinhos
--
Carlos Alberto de Bragança Pereira
http://www.ime.usp.br/~cpereira
http://scholar.google.com.br/citations?user=PXX2AygAAAAJ&hl=pt-BR
Stat Department - Professor & Head
University of São Paulo
Mais detalhes sobre a lista de discussão abe