[ABE-L] Uma provocação acadêmica

Neale El-Dash neale.eldash em gmail.com
Qui Out 23 00:58:43 -03 2014


Sempre gostei muito desses exemplos do Carlinhos envolvendo bolinhas na
urna. Acho que o exemplo desse tipo, dado pelo proprio Carlinhos (e'
claro), que mais me marcou e' quando ele pergunta se e' necessario
embaralhar a urna para que todas as bolinhas tenham a mesma probabilidade
de serem selecionadas. Pelo menos eu lembro da pergunta dessa forma,
Carlinhos me corrija se for o caso.

Sobre o modelo do PollingData, ele e' bayesiano com priori
vagas/nao-informativas/etc....a historia da "Probabilidade ser uma
quantidade invisível que está ali colada no eleitor" usei mais para
discutir amostragem probabilistica por cotas no contexto
frequentista/inferencia baseada no desenho.

O que me leva a uma pergunta para o Pedrao. Dado tudo que discutimos ate
agora na lista, sobre amostragem probabilistica na pratica, com pessoas,
com nao-resposta, realizada pelos mesmos entrevistadores que fazem
amostragem probabilistica com cotas, e' possivel afirmar que a amostra
probailistica (na pratica) e' 'replicável'?  Sem suposicoes ;)

Abraco Neale

Em 22 de outubro de 2014 23:04, Pedro Luis do Nascimento Silva <
pedronsilva em gmail.com> escreveu:

> Colegas,
>
> Quando o técnico entra em campo, é bom os jogadores ouvirem o que ele tem
> a dizer... Mesmo os supostos craques (falo por mim)...
>
> Carlinhos, a dificuldade com a amostragem por cotas, para mim, não vem de
> um argumento teórico, embora eu respeite todo os já apresentados.
>
> Eu conheço, por exemplo, os trabalhos do Migon e do Gutemberg em pesquisas
> eleitorais feitas nos anos 90 em que usaram modelos de escolha intencional
> para a amostra de sessões eleitorais cujos resultados, em eleições
> passadas, se pareciam mais com os resultados globais. Este tipo de
> abordagem tem uma propriedade fundamental: é replicável.
>
> Você também apresentou alternativas que levam a procedimentos replicáveis.
>
> Os modelos de amostragem por cotas em uso aqui e em outras partes tem um
> componente que os torna 'irreplicáveis': dão ao entrevistador que está na
> rua uma liberdade muito grande de fazer o que quiser, dentro de parâmetros
> muito frouxos de quem podem e quem não podem selecionar. Este tipo
> abordagem admite modelagem, claro, mas como se sairá o modelo com pequenas
> variações na composição da equipe que faz a coleta ou no posicionamento da
> equipe de coleta no campo?
>
> Na semana passada eu encontrei um pesquisador de um dos grandes institutos
> que fazem pesquisas eleitorais, posicionado na esquina da Av. Nossa Senhora
> de Fátima com Rua do Riachuelo, e selecionando pessoas para entrevistar com
> a seguinte estratégia: mostrava aos passantes o crachá bem grande que tinha
> com o nome do instituto, e convidava para participar da pesquisa. Quem
> conhece o local saberá que não dá para chamar os passantes de eleitores
> permutáveis...
>
> Creio que estamos num bom caminho ao explicitar o debate, trazer à tona os
> vários argumentos e alternativas, explorar suas vantagens e limitações, e
> assim, crescer no conhecimento das possibilidades.
>
> Lamentavelmente, nossa discussão aqui tem pouca chance de influenciar o
> mercado de pesquisas eleitorais (ao menos no curto prazo).
>
> Mas isto não é argumento para não continuar com a discussão.
>
> Saudações botafoguenses... Pedro
>
>
>
> Em 21 de outubro de 2014 23:07, Carlos Alberto de Bragança Pereira <
> cpereira em ime.usp.br> escreveu:
>
>
>> Caros redistas:
>>
>> É com muita satisfação ver uma discussão em nossa rede de craques: Pelé,
>> Maradona, Neymar e Messi - Zé, Pedro, Rafael e Neale. Como um coadjuvante,
>> vou tentar bater uma bola com esse pessoal da pesada.
>>
>> Nas minhas últimas intervenções tentei colocar alguns pontos esquecidos e
>> agora vejo pelos artigos apresentados que a análise sim é fundamental.  Por
>> sinal devo dizer que tive ótimas discussões com alguns redistas fora do
>> nosso fórum.   Mas o que mais me chamou atenção foi a palavra
>> probabilística acompanhando a amostragem como sendo um qualificativo.  E
>> claro o outro qualificativo cotas tende a ser pejorativo para parte do
>> nosso fórum.  O Carvalho sim explicou como as pessoas fazem a amostragem
>> por cotas e creio que ele está correto na forma equivocada como são
>> realizadas.  Contudo, creio que se feita com propriedade pode ser útil e
>> auxiliar na coleta de uma amostra “boa”.  Vou simplificar bastante minha
>> discussão para que possamos discutir com talvez mais clareza, pelo menos
>> para mim.
>>
>> Representemos nosso problema pela nossa conhecida urna com bolinhas
>> coloridas: vermelho para o PT, verde para os tucanos e brancas para o resto
>> (brancos; nulos; e não votantes).  Consideramos uma amostra informativa
>> (paramétrica) se a verossimilhança depender das frequências de cada uma das
>> categorias e ai ter-se-ia um modelo hipergeométrico multivariado, com
>> parâmetros P, T e B, população N (Número de bolas da urna) e amostra n
>> (número de bolas na amostra).  Este modelo é muito bom para partes da
>> população onde os eleitores, em nossa opinião seriam permutáveis.  Assim
>> lembrando o famoso artigo de Lindley e Novick do Annals of Statistics, a
>> permutabilidade é equivalente às estratificações e aglomerações da
>> amostragem.  Em cada núcleo pequeno teríamos assim uma urna de 3 cores.
>> Daí teríamos para cada núcleo uma hipergeométrica específica dando a
>> verossimilhança necessária para compor a verossimilhança do aglomerado que
>> em uma composição posterior formar a verossimilhança do estrato e por fim a
>> verossimilhança global que nos daria o conjunto de credibilidade para
>> formar a verossimilhança global.  Esse foi um dos dois modelos usado por
>> nós na eleição da Nicarágua.
>>
>> Agora pensemos na urna com as bolinhas marcadas com os nomes dos
>> eleitores e ai diferenciados uma a um.  O modelo agora é selecionar uma
>> amostra de tamanho n da população de tamanho N. Neste caso cada uma das
>> amostras teria probabilidade igual ao inverso de C(N;n) que é a combinação
>> de N, n a n.  Todas as amostras de tamanho n tendo a mesma probabilidade de
>> ser extraída ao chacoalharmos a urna do escritório do estatístico.  Neste
>> caso, muda-se o valor dos parâmetros P, T e B e a verossimilhança continua
>> sendo a mesma, o que chamei de flat.  Lembrem-se os colegas que por esta
>> razão chamei de flat a verossimilhança.  Assim, não há como usar o
>> estimador de Máxima verossimilhança e sim estimadores não viciados com a
>> verossimilhança Flat, sendo a variável aleatória o indicador de um eleitor
>> pertencer ou não a amostra sem referência ao fato de ele ser de alguma
>> cor.  Com o fato de usarmos estratificação e conglomeração usamos esses
>> métodos para melhorar o indicador de o eleitor i pertencer ou não a
>> amostra.  Esse foi o segundo modelo usado por nós na eleição da Nicarágua
>> como o Carvalho mencionou.  Nosso artigo está nos anais do SINAPE de 1990.
>> Devido ao tamanho do documento que preparei tentarei enviar uma cópia em um
>> próximo e-mail, pois no e-mail do IME normalmente não conseguimos enviar
>> pastas com mais de 1 megabyte.  Como o Carvalho mencionou, foi um trabalho
>> hercúleo do grupo do grande mestre OSCAR mostrar as convergências dos
>> estimadores não viciados (estimador razão) deste tipo de modelo.  Como irão
>> ver em nosso artigo os resultados foram equivalentes.
>>
>> Finalmente gostaria de mencionar a amostragem intencional que é obtida
>> por otimização global.  Nossa receita é copiar na amostra as proporções
>> populacionais para aquelas variáveis consideradas relacionadas com a
>> variável que temos interesse, a frequência de eleitores em cada núcleo
>> (estratificação e aglomeração).  O problema é que somos obrigados a usar um
>> otimizador: isto é, quais as mostras de tamanho n da população de tamanho N
>> que melhor copia a população daquele pequeno núcleo. Note que como a
>> amostragem não paramétrica é flat e esta amostra otimizada é uma possível
>> seleção daqueles modelos não paramétrico! Então, qual o problema de usarmos
>> a mesma inferência daquele modelo?  Esta é a diferença que eu e o Zé
>> teríamos.  Lembrem-se que o modelo de cotas usadas pelos institutos não
>> fazem a otimização global e sim marginal, isso se usarem o descrito pelo
>> Carvalho.
>>
>> Finalizo esta minha singela intervenção dizendo que a composição das
>> verossimilhanças pode ser pensada como uma meta análise de verossimilhanças
>> que descrevi no artigo convidado da revista Ciência e Natura do nosso
>> colega Fábio.
>> Como provocação, coloco aqui o paradigma: Por que uma amostra por cotas
>> (da forma otimizada que coloquei) passaria de ruim a boa apenas porque foi
>> selecionada por um mecanismo não informativo? Uma urna que não tem nada
>> haver com a população pode transformar uma amostra ruim em boa só porque é
>> um ponto amostral possível daquele mecanismo?
>>
>> Saudações acadêmicas de um perna de pau.
>>
>> Carlinhos
>> Vou tentar enviar o paper aqui na rede
>> Se não chegar os interessados que usam outros emails mais flexíveis  por
>> favor me escrevam que eu mando para vocês.
>>
>> --
>> Carlos Alberto de Bragança Pereira
>> http://www.ime.usp.br/~cpereira
>> http://scholar.google.com.br/citations?user=PXX2AygAAAAJ&hl=pt-BR
>> Stat Department - Professor & Head
>> University of São Paulo
>>
>>
>> _______________________________________________
>> abe mailing list
>> abe em lists.ime.usp.br
>> https://lists.ime.usp.br/mailman/listinfo/abe
>>
>
>
>
> --
> Pedro Luis do Nascimento Silva
> *ISI President-Elect 2013-2015*
> IBGE - Escola Nacional de Ciências Estatísticas
> Phone: +55 21 21424957
>
> _______________________________________________
> abe mailing list
> abe em lists.ime.usp.br
> https://lists.ime.usp.br/mailman/listinfo/abe
>
>


-- 

There are two routes to success in soccer. One is being good. The other is
being lucky. You need both to win a championship. But you only need one to
win a game. (The numbers game)

-----------------------------------------------
Neale Ahmed El-Dash
Doutor em Estatística
Celular: +55 19 998893939
Email: neale.eldash em gmail.com
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <https://lists.ime.usp.br/archives/abe/attachments/20141023/09187367/attachment.html>


Mais detalhes sobre a lista de discussão abe