<div dir="ltr"><div class="gmail_default" style="font-family:verdana,sans-serif">Colegas,</div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif">Quando o técnico entra em campo, é bom os jogadores ouvirem o que ele tem a dizer... Mesmo os supostos craques (falo por mim)...</div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif">Carlinhos, a dificuldade com a amostragem por cotas, para mim, não vem de um argumento teórico, embora eu respeite todo os já apresentados.</div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif">Eu conheço, por exemplo, os trabalhos do Migon e do Gutemberg em pesquisas eleitorais feitas nos anos 90 em que usaram modelos de escolha intencional para a amostra de sessões eleitorais cujos resultados, em eleições passadas, se pareciam mais com os resultados globais. Este tipo de abordagem tem uma propriedade fundamental: é replicável.</div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif">Você também apresentou alternativas que levam a procedimentos replicáveis.</div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif">Os modelos de amostragem por cotas em uso aqui e em outras partes tem um componente que os torna 'irreplicáveis': dão ao entrevistador que está na rua uma liberdade muito grande de fazer o que quiser, dentro de parâmetros muito frouxos de quem podem e quem não podem selecionar. Este tipo abordagem admite modelagem, claro, mas como se sairá o modelo com pequenas variações na composição da equipe que faz a coleta ou no posicionamento da equipe de coleta no campo? </div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif">Na semana passada eu encontrei um pesquisador de um dos grandes institutos que fazem pesquisas eleitorais, posicionado na esquina da Av. Nossa Senhora de Fátima com Rua do Riachuelo, e selecionando pessoas para entrevistar com a seguinte estratégia: mostrava aos passantes o crachá bem grande que tinha com o nome do instituto, e convidava para participar da pesquisa. Quem conhece o local saberá que não dá para chamar os passantes de eleitores permutáveis... </div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif">Creio que estamos num bom caminho ao explicitar o debate, trazer à tona os vários argumentos e alternativas, explorar suas vantagens e limitações, e assim, crescer no conhecimento das possibilidades.</div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif">Lamentavelmente, nossa discussão aqui tem pouca chance de influenciar o mercado de pesquisas eleitorais (ao menos no curto prazo). </div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif">Mas isto não é argumento para não continuar com a discussão. </div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif">Saudações botafoguenses... Pedro</div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div></div><div class="gmail_extra"><br><div class="gmail_quote">Em 21 de outubro de 2014 23:07, Carlos Alberto de Bragança Pereira <span dir="ltr"><<a href="mailto:cpereira@ime.usp.br" target="_blank">cpereira@ime.usp.br</a>></span> escreveu:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><br> Caros redistas:<br> <br> É com muita satisfação ver uma discussão em nossa rede de craques: Pelé, Maradona, Neymar e Messi - Zé, Pedro, Rafael e Neale. Como um coadjuvante, vou tentar bater uma bola com esse pessoal da pesada.<br> <br> Nas minhas últimas intervenções tentei colocar alguns pontos esquecidos e agora vejo pelos artigos apresentados que a análise sim é fundamental. Por sinal devo dizer que tive ótimas discussões com alguns redistas fora do nosso fórum. Mas o que mais me chamou atenção foi a palavra probabilística acompanhando a amostragem como sendo um qualificativo. E claro o outro qualificativo cotas tende a ser pejorativo para parte do nosso fórum. O Carvalho sim explicou como as pessoas fazem a amostragem por cotas e creio que ele está correto na forma equivocada como são realizadas. Contudo, creio que se feita com propriedade pode ser útil e auxiliar na coleta de uma amostra “boa”. Vou simplificar bastante minha discussão para que possamos discutir com talvez mais clareza, pelo menos para mim.<br> <br> Representemos nosso problema pela nossa conhecida urna com bolinhas coloridas: vermelho para o PT, verde para os tucanos e brancas para o resto (brancos; nulos; e não votantes). Consideramos uma amostra informativa (paramétrica) se a verossimilhança depender das frequências de cada uma das categorias e ai ter-se-ia um modelo hipergeométrico multivariado, com parâmetros P, T e B, população N (Número de bolas da urna) e amostra n (número de bolas na amostra). Este modelo é muito bom para partes da população onde os eleitores, em nossa opinião seriam permutáveis. Assim lembrando o famoso artigo de Lindley e Novick do Annals of Statistics, a permutabilidade é equivalente às estratificações e aglomerações da amostragem. Em cada núcleo pequeno teríamos assim uma urna de 3 cores. Daí teríamos para cada núcleo uma hipergeométrica específica dando a verossimilhança necessária para compor a verossimilhança do aglomerado que em uma composição posterior formar a verossimilhança do estrato e por fim a verossimilhança global que nos daria o conjunto de credibilidade para formar a verossimilhança global. Esse foi um dos dois modelos usado por nós na eleição da Nicarágua.<br> <br> Agora pensemos na urna com as bolinhas marcadas com os nomes dos eleitores e ai diferenciados uma a um. O modelo agora é selecionar uma amostra de tamanho n da população de tamanho N. Neste caso cada uma das amostras teria probabilidade igual ao inverso de C(N;n) que é a combinação de N, n a n. Todas as amostras de tamanho n tendo a mesma probabilidade de ser extraída ao chacoalharmos a urna do escritório do estatístico. Neste caso, muda-se o valor dos parâmetros P, T e B e a verossimilhança continua sendo a mesma, o que chamei de flat. Lembrem-se os colegas que por esta razão chamei de flat a verossimilhança. Assim, não há como usar o estimador de Máxima verossimilhança e sim estimadores não viciados com a verossimilhança Flat, sendo a variável aleatória o indicador de um eleitor pertencer ou não a amostra sem referência ao fato de ele ser de alguma cor. Com o fato de usarmos estratificação e conglomeração usamos esses métodos para melhorar o indicador de o eleitor i pertencer ou não a amostra. Esse foi o segundo modelo usado por nós na eleição da Nicarágua como o Carvalho mencionou. Nosso artigo está nos anais do SINAPE de 1990. Devido ao tamanho do documento que preparei tentarei enviar uma cópia em um próximo e-mail, pois no e-mail do IME normalmente não conseguimos enviar pastas com mais de 1 megabyte. Como o Carvalho mencionou, foi um trabalho hercúleo do grupo do grande mestre OSCAR mostrar as convergências dos estimadores não viciados (estimador razão) deste tipo de modelo. Como irão ver em nosso artigo os resultados foram equivalentes.<br> <br> Finalmente gostaria de mencionar a amostragem intencional que é obtida por otimização global. Nossa receita é copiar na amostra as proporções populacionais para aquelas variáveis consideradas relacionadas com a variável que temos interesse, a frequência de eleitores em cada núcleo (estratificação e aglomeração). O problema é que somos obrigados a usar um otimizador: isto é, quais as mostras de tamanho n da população de tamanho N que melhor copia a população daquele pequeno núcleo. Note que como a amostragem não paramétrica é flat e esta amostra otimizada é uma possível seleção daqueles modelos não paramétrico! Então, qual o problema de usarmos a mesma inferência daquele modelo? Esta é a diferença que eu e o Zé teríamos. Lembrem-se que o modelo de cotas usadas pelos institutos não fazem a otimização global e sim marginal, isso se usarem o descrito pelo Carvalho.<br> <br> Finalizo esta minha singela intervenção dizendo que a composição das verossimilhanças pode ser pensada como uma meta análise de verossimilhanças que descrevi no artigo convidado da revista Ciência e Natura do nosso colega Fábio.<br> Como provocação, coloco aqui o paradigma: Por que uma amostra por cotas (da forma otimizada que coloquei) passaria de ruim a boa apenas porque foi selecionada por um mecanismo não informativo? Uma urna que não tem nada haver com a população pode transformar uma amostra ruim em boa só porque é um ponto amostral possível daquele mecanismo?<br> <br> Saudações acadêmicas de um perna de pau.<br> <br> Carlinhos<br> Vou tentar enviar o paper aqui na rede<br> Se não chegar os interessados que usam outros emails mais flexíveis por favor me escrevam que eu mando para vocês.<span class="HOEnZb"><font color="#888888"><br> <br> -- <br> Carlos Alberto de Bragança Pereira<br> <a href="http://www.ime.usp.br/~cpereira" target="_blank">http://www.ime.usp.br/~<u></u>cpereira</a><br> <a href="http://scholar.google.com.br/citations?user=PXX2AygAAAAJ&hl=pt-BR" target="_blank">http://scholar.google.com.br/<u></u>citations?user=PXX2AygAAAAJ&<u></u>hl=pt-BR</a><br> Stat Department - Professor & Head<br> University of São Paulo<br> <br> <br> ______________________________<u></u>_________________<br> abe mailing list<br> <a href="mailto:abe@lists.ime.usp.br" target="_blank">abe@lists.ime.usp.br</a><br> <a href="https://lists.ime.usp.br/mailman/listinfo/abe" target="_blank">https://lists.ime.usp.br/<u></u>mailman/listinfo/abe</a><br> </font></span></blockquote></div><br><br clear="all"><div><br></div>-- <br><div dir="ltr"><font face="verdana, sans-serif">Pedro Luis do Nascimento Silva</font><div><font face="verdana, sans-serif"><b>ISI President-Elect 2013-2015</b><br>IBGE - Escola Nacional de Ciências Estatísticas<br>Phone: +55 21 21424957</font></div></div> </div>