[ABE-L] Desculpem

Marcelo L. Arruda mlarruda em terra.com.br
Seg Out 6 19:09:15 -03 2014


Por partes:

1 - Aparentemente, o maior problema da forma como as pesquisas são 
DIVULGADAS é a tal da "margem de erro". Um aspecto que me chamou muito a 
atenção, por exemplo, foi o JN de sábado ter divulgado, para cada pesquisa 
(Ibope e Datafolha), porcentagens de intenção de voto sobre o universo total 
e sobre os votos válidos, e nos dois casos a margem de erro era a mesma ("2 
pontos percentuais para cima ou para baixo").

Ora, suponham, para facilidade de raciocínio, que os votos válidos sejam 50% 
do total. Então, a porcentagem de intenções de voto para o candidato fulano 
no universo dos votos válidos (chamemos p-linha) é o DOBRO da porcentagem de 
intenções de voto no universo total.(chamemos p). Ora, se p-linha é igual a 
2p, então qualquer estimação intervalar sobre p-linha deverá ter o dobro da 
amplitude (ou seja, "da margem de erro") da mesma estimação feita para p, 
correto?

Sendo assim, se para a transposição de votos no universo total para votos no 
universo dos válidos os institutos já cometem esse tipo de barbeiragem, vai 
saber o que mais é feito lá dentro da caixa preta?

E tem ainda o "paradoxo dos nanicos": se para TODOS os candidatos a margem 
de erro era de 2 pontos para mais ou para menos, então o Eymael poderia ter 
até -2% do total de votos? Ou, pegando o inverso, um candidato que tivesse 
99% das intenções de voto poderia ter até 101% do total dos votos?

Não sei se é possível, sem acesso às caixas pretas dos institutos, calcular 
as estimativas intervalares corretas para as intenções de voto em cada 
candidato. Mas ouso teorizar que essas estimativas estariam mais próximas 
das porcentagens efetivamente observadas do que as "margens de erro" 
efetivamente divulgadas pelos institutos.


2 - Não sei há quanto tempo existem as pesquisas de intenção de voto no 
Brasil. A mais antiga de que eu me lembro data de 1985, na famosa eleição em 
que Jânio Quadros superou FHC na reta final da campanha para prefeito de São 
Paulo. Pode ter havido pesquisas anteriores, mas é fato que faz pelo menos 
29 anos que isso existe.

Pois bem: em 29 anos, as distribuições de sexo, faixa etária, escolaridade, 
renda etc. por região/estado/cidade/zona/bairro etc. inevitavelmente muda. E 
falando particularmente das mudanças por que o Brasil passou nesses 29 anos, 
todos os universos (especialmente nos maiores centros urbanos) ficaram muito 
mais heterogêneos do que eram décadas atrás. Aí vem a dúvida, então: os 
institutos utilizam os mesmos planos e estratégias amostrais que usavam 29 
anos atrás ou esses planos e estratégias foram sendo atualizados ao longo do 
tempo? E mais: como essa atualização é operada? Se os institutos usam as 
suas próprias pesquisas como instrumento de atualização de mapeamento (da 
distribuição de sexo/faixa etária/renda/whatever por região), isso não pode 
provocar um vício recursivamente retro-alimentado?


3 - Para concluir, uma curiosidade, caso o Neale possa responder: os 
cálculos do Pollingdata se baseiam exclusivamente na última pesquisa 
realizada ou levam em conta o histórico de pesquisas e conseqüentemente uma 
eventual tendência de crescimento de X ou decrescimento de Y?

Marcelo

----- Original Message ----- 
From: "Jose Carvalho" <carvalho em statistika.com.br>
To: <abe-l em ime.usp.br>
Sent: Monday, October 06, 2014 5:08 PM
Subject: [ABE-L] Desculpem


> Não vi o email do George. Chovi no molhado. Desculpe-me George,
> desculpem-me todos. A resposta do George, cobre o que acabo de enviar.
>
> :-(
>
>
> _______________________________________________
> abe mailing list
> abe em lists.ime.usp.br
> https://lists.ime.usp.br/mailman/listinfo/abe
> 





Mais detalhes sobre a lista de discussão abe