[ABE-L] pesquisas eleitorais: Qual o problema?

Seg Out 6 22:48:11 -03 2014

Prezados companheiros de rede:

Peço inicialmente desculpas por esta minha mensagem. Principalmente  
pelo tamanho.

Eu vejo o problema de uma forma muito diferente dos colegas.  É claro  
que todos que vão ao mercado das pesquisas querem fazer o melhor mesmo  
que estejam equivocados na melhor forma de coletar uma amostra.  Assim  
vou considerar alguns pontos que acho relevantes, pois vejo que os  
colegas, sem terem ido a luta das pesquisas ficam argumentando sobre  
erros de coleta.  Só podemos contestar resultados no momento que  
dermos nossas caras para bater e realisarmos uma pesquisa por nossa  
própria conta e obtermos melhores resultados do que os institutos de  
pesquisa.  Se não temos recursos para fazer isso, podemos submeter um  
projeto aos nossos institutos de apoio, como CNPq, CAPES, FAPESP etc.   
Façamos isso como fizemos tempos atrás na eleição do Covas em segundo  
turno aqui em São Paulo.  Fomos financiados pela FAPESP. Posso dizer  
aos colegas que tivemos sim muito sucesso, entretanto como nossas  
previsões ficavam muito fora do que se publicava só pudemos falar de  
nosso trabalho após a eleição, quando já não havia interesse e ninguém  
iria acreditar nos nossos acertos.  Não era eu, nem o Sérgio, quem  
dirigia o processo administrativo da pesquisa.  Claro que posso um dia  
contar a vocês o que fizemos se minha memória ainda estiver em  
condições.  Mas devo dizer que a chance de errarmos era também muito  
grande.

O risco de um erro de previsão em uma eleição com 150 milhões de  
eleitores prováveis (111 milhões votaram efetivamente) será tão grande  
quão pequeno for o tamanho da amostra.  O Instituto Data Folha só  
conseguiu fazer uma amostragem com 20 mil eleitores na pesquisa de  
boca de urna porque nas outras foram no máximo de 9 mil perto das  
eleições e menos de 5 mil nas anteriores.  Não há dinheiro que aguente  
uma amostra considerando os 5 mil municípios brasileiros. Perdoem-me  
os “teóricos”, mas uma boa amostra teria de considerar vários aspectos  
como rural e urbano, estados, municípios, condição sócio econômica,  
qualidade de vida etc. Se colocarem a necessidade de medir  
variabilidade em cada ponto, só ai daria uma amostra impossível para  
nós.  O ruim das cotas é que se faz otimização marginal, pois não  
iriam conseguir uma amostra contemplando a otimização global com todas  
as interações possíveis.

Falemos agora sobre a amostra completamente aleatória (levando-se em  
conta agrupamentos etc.).  Vamos pensar em uma grande urna com bolas  
coloridas, a população de interesse. Construir uma amostra é dividir  
essa grande urna em duas urnas, a amostra e a não amostra.  Olhamos a  
amostra e queremos predizer o que está na não amostra.  Usar a  
probabilidade de seleção como a distribuição de seleção para fazer a  
predição estatística é um erro do ponto de vista da teoria de  
verossimilhança.  Pode-se mudar toda a composição da não amostra que a  
distribuição de seleção é a mesma.  Isto é verossimilhança FLAT!  Quer  
dizer que a verossimilhança é não informativa com relação a composição  
do parâmetro de interesse; a composição da não amostra.  É evidente  
que se a amostra for bem grande a chance de obtermos na amostra uma  
composição semelhante a não amostra aumenta, mas não é garantido meus  
caros amigos.

A solução adequada em minha opinião seria lembrarmos-nos do teorema da  
permutabilidade de DeFinetti e ai sim pensarmos em nossas informações  
subjetivas obtidas das eleições anteriores e do conhecimento que  
teríamos sobre as características das subpopulações dentro dos  
subgrupos obtidos da otimização global.  Não vou me alongar, pois os  
detalhes são muitos para discutirmos num ambiente como o da rede.

Termino com uma provocação grande aos meus queridos amigos  
randomizeiros.  Se a mostra obtida de alguma forma é um possível  
resultado de seleção, qual o problema de usar a estatística comum para  
fazer as predições?  Chacoalhar a urna e obter o mesmo resultado salva  
a amostragem?  Então não falo em cotas no relatório, pois ninguém  
consegue provar que não randomizei.

Tenho dito!!!!!!!!

Saudações indutivas e subjetivistas

Carlinhos

-- 
Carlos Alberto de Bragança Pereira
http://www.ime.usp.br/~cpereira
http://scholar.google.com.br/citations?user=PXX2AygAAAAJ&hl=pt-BR
Stat Department - Professor & Head
University of São Paulo