[ABE-L] Uma provocação acadêmica

asimonis em ime.usp.br asimonis em ime.usp.br
Qua Out 22 23:53:29 -03 2014


Caros, supondo que o pessoal da geral (eu e + alguns) e os da  
arquibancada também possam dar pitacos, gostaria de destacar o ponto  
colocado sobre " probabilidade não existe" que é bem sabido até pela  
torcida do Flamengo (não falemos mais de futebol hoje pois o Glorioso  
hoje perdeu para aqueles).

O cálculo de probabilidades existe e é muito bem-vindo por todos. A  
réplica de experimentos foi o que deflagrou a Revolução Científica.

A estimativa por cotas se bem-feita é um belo estimador. Se é bom  
nunca saberei por não permite o cálculo a que me referi.

Mesmo com verossimilhancas "flats" devemos, por vocação, não cair em  
falácias, tais como: o meu cão recebe comida se sentar, mas não quer  
dizer que basta isto para ser alimentado. Em outras palavras,  
reproduzir as proporcionalidades populacionais na amostra não a torna  
uma amostra aleatória.

Abs


Citando Pedro Luis do Nascimento Silva <pedronsilva em gmail.com>:

> Colegas,
>
> Quando o técnico entra em campo, é bom os jogadores ouvirem o que ele tem a
> dizer... Mesmo os supostos craques (falo por mim)...
>
> Carlinhos, a dificuldade com a amostragem por cotas, para mim, não vem de
> um argumento teórico, embora eu respeite todo os já apresentados.
>
> Eu conheço, por exemplo, os trabalhos do Migon e do Gutemberg em pesquisas
> eleitorais feitas nos anos 90 em que usaram modelos de escolha intencional
> para a amostra de sessões eleitorais cujos resultados, em eleições
> passadas, se pareciam mais com os resultados globais. Este tipo de
> abordagem tem uma propriedade fundamental: é replicável.
>
> Você também apresentou alternativas que levam a procedimentos replicáveis.
>
> Os modelos de amostragem por cotas em uso aqui e em outras partes tem um
> componente que os torna 'irreplicáveis': dão ao entrevistador que está na
> rua uma liberdade muito grande de fazer o que quiser, dentro de parâmetros
> muito frouxos de quem podem e quem não podem selecionar. Este tipo
> abordagem admite modelagem, claro, mas como se sairá o modelo com pequenas
> variações na composição da equipe que faz a coleta ou no posicionamento da
> equipe de coleta no campo?
>
> Na semana passada eu encontrei um pesquisador de um dos grandes institutos
> que fazem pesquisas eleitorais, posicionado na esquina da Av. Nossa Senhora
> de Fátima com Rua do Riachuelo, e selecionando pessoas para entrevistar com
> a seguinte estratégia: mostrava aos passantes o crachá bem grande que tinha
> com o nome do instituto, e convidava para participar da pesquisa. Quem
> conhece o local saberá que não dá para chamar os passantes de eleitores
> permutáveis...
>
> Creio que estamos num bom caminho ao explicitar o debate, trazer à tona os
> vários argumentos e alternativas, explorar suas vantagens e limitações, e
> assim, crescer no conhecimento das possibilidades.
>
> Lamentavelmente, nossa discussão aqui tem pouca chance de influenciar o
> mercado de pesquisas eleitorais (ao menos no curto prazo).
>
> Mas isto não é argumento para não continuar com a discussão.
>
> Saudações botafoguenses... Pedro
>
>
>
> Em 21 de outubro de 2014 23:07, Carlos Alberto de Bragança Pereira <
> cpereira em ime.usp.br> escreveu:
>
>>
>> Caros redistas:
>>
>> É com muita satisfação ver uma discussão em nossa rede de craques: Pelé,
>> Maradona, Neymar e Messi - Zé, Pedro, Rafael e Neale. Como um coadjuvante,
>> vou tentar bater uma bola com esse pessoal da pesada.
>>
>> Nas minhas últimas intervenções tentei colocar alguns pontos esquecidos e
>> agora vejo pelos artigos apresentados que a análise sim é fundamental.  Por
>> sinal devo dizer que tive ótimas discussões com alguns redistas fora do
>> nosso fórum.   Mas o que mais me chamou atenção foi a palavra
>> probabilística acompanhando a amostragem como sendo um qualificativo.  E
>> claro o outro qualificativo cotas tende a ser pejorativo para parte do
>> nosso fórum.  O Carvalho sim explicou como as pessoas fazem a amostragem
>> por cotas e creio que ele está correto na forma equivocada como são
>> realizadas.  Contudo, creio que se feita com propriedade pode ser útil e
>> auxiliar na coleta de uma amostra “boa”.  Vou simplificar bastante minha
>> discussão para que possamos discutir com talvez mais clareza, pelo menos
>> para mim.
>>
>> Representemos nosso problema pela nossa conhecida urna com bolinhas
>> coloridas: vermelho para o PT, verde para os tucanos e brancas para o resto
>> (brancos; nulos; e não votantes).  Consideramos uma amostra informativa
>> (paramétrica) se a verossimilhança depender das frequências de cada uma das
>> categorias e ai ter-se-ia um modelo hipergeométrico multivariado, com
>> parâmetros P, T e B, população N (Número de bolas da urna) e amostra n
>> (número de bolas na amostra).  Este modelo é muito bom para partes da
>> população onde os eleitores, em nossa opinião seriam permutáveis.  Assim
>> lembrando o famoso artigo de Lindley e Novick do Annals of Statistics, a
>> permutabilidade é equivalente às estratificações e aglomerações da
>> amostragem.  Em cada núcleo pequeno teríamos assim uma urna de 3 cores.
>> Daí teríamos para cada núcleo uma hipergeométrica específica dando a
>> verossimilhança necessária para compor a verossimilhança do aglomerado que
>> em uma composição posterior formar a verossimilhança do estrato e por fim a
>> verossimilhança global que nos daria o conjunto de credibilidade para
>> formar a verossimilhança global.  Esse foi um dos dois modelos usado por
>> nós na eleição da Nicarágua.
>>
>> Agora pensemos na urna com as bolinhas marcadas com os nomes dos eleitores
>> e ai diferenciados uma a um.  O modelo agora é selecionar uma amostra de
>> tamanho n da população de tamanho N. Neste caso cada uma das amostras teria
>> probabilidade igual ao inverso de C(N;n) que é a combinação de N, n a n.
>> Todas as amostras de tamanho n tendo a mesma probabilidade de ser extraída
>> ao chacoalharmos a urna do escritório do estatístico.  Neste caso, muda-se
>> o valor dos parâmetros P, T e B e a verossimilhança continua sendo a mesma,
>> o que chamei de flat.  Lembrem-se os colegas que por esta razão chamei de
>> flat a verossimilhança.  Assim, não há como usar o estimador de Máxima
>> verossimilhança e sim estimadores não viciados com a verossimilhança Flat,
>> sendo a variável aleatória o indicador de um eleitor pertencer ou não a
>> amostra sem referência ao fato de ele ser de alguma cor.  Com o fato de
>> usarmos estratificação e conglomeração usamos esses métodos para melhorar o
>> indicador de o eleitor i pertencer ou não a amostra.  Esse foi o segundo
>> modelo usado por nós na eleição da Nicarágua como o Carvalho mencionou.
>> Nosso artigo está nos anais do SINAPE de 1990.  Devido ao tamanho do
>> documento que preparei tentarei enviar uma cópia em um próximo e-mail, pois
>> no e-mail do IME normalmente não conseguimos enviar pastas com mais de 1
>> megabyte.  Como o Carvalho mencionou, foi um trabalho hercúleo do grupo do
>> grande mestre OSCAR mostrar as convergências dos estimadores não viciados
>> (estimador razão) deste tipo de modelo.  Como irão ver em nosso artigo os
>> resultados foram equivalentes.
>>
>> Finalmente gostaria de mencionar a amostragem intencional que é obtida por
>> otimização global.  Nossa receita é copiar na amostra as proporções
>> populacionais para aquelas variáveis consideradas relacionadas com a
>> variável que temos interesse, a frequência de eleitores em cada núcleo
>> (estratificação e aglomeração).  O problema é que somos obrigados a usar um
>> otimizador: isto é, quais as mostras de tamanho n da população de tamanho N
>> que melhor copia a população daquele pequeno núcleo. Note que como a
>> amostragem não paramétrica é flat e esta amostra otimizada é uma possível
>> seleção daqueles modelos não paramétrico! Então, qual o problema de usarmos
>> a mesma inferência daquele modelo?  Esta é a diferença que eu e o Zé
>> teríamos.  Lembrem-se que o modelo de cotas usadas pelos institutos não
>> fazem a otimização global e sim marginal, isso se usarem o descrito pelo
>> Carvalho.
>>
>> Finalizo esta minha singela intervenção dizendo que a composição das
>> verossimilhanças pode ser pensada como uma meta análise de verossimilhanças
>> que descrevi no artigo convidado da revista Ciência e Natura do nosso
>> colega Fábio.
>> Como provocação, coloco aqui o paradigma: Por que uma amostra por cotas
>> (da forma otimizada que coloquei) passaria de ruim a boa apenas porque foi
>> selecionada por um mecanismo não informativo? Uma urna que não tem nada
>> haver com a população pode transformar uma amostra ruim em boa só porque é
>> um ponto amostral possível daquele mecanismo?
>>
>> Saudações acadêmicas de um perna de pau.
>>
>> Carlinhos
>> Vou tentar enviar o paper aqui na rede
>> Se não chegar os interessados que usam outros emails mais flexíveis  por
>> favor me escrevam que eu mando para vocês.
>>
>> --
>> Carlos Alberto de Bragança Pereira
>> http://www.ime.usp.br/~cpereira
>> http://scholar.google.com.br/citations?user=PXX2AygAAAAJ&hl=pt-BR
>> Stat Department - Professor & Head
>> University of São Paulo
>>
>>
>> _______________________________________________
>> abe mailing list
>> abe em lists.ime.usp.br
>> https://lists.ime.usp.br/mailman/listinfo/abe
>>
>
>
>
> --
> Pedro Luis do Nascimento Silva
> *ISI President-Elect 2013-2015*
> IBGE - Escola Nacional de Ciências Estatísticas
> Phone: +55 21 21424957






Mais detalhes sobre a lista de discussão abe