<html><body><div style="color:#000; background-color:#fff; font-family:HelveticaNeue, Helvetica Neue, Helvetica, Arial, Lucida Grande, sans-serif;font-size:13px"><div id="yiv4177294222"><div id="yui_3_16_0_1_1413982265035_107367"><div style="color:#000;background-color:#fff;font-family:HelveticaNeue, Helvetica Neue, Helvetica, Arial, Lucida Grande, sans-serif;font-size:13px;" id="yui_3_16_0_1_1413982265035_107366"><div id="yiv4177294222"><div id="yiv4177294222yui_3_16_0_1_1413982265035_79483"><div style="color:#000;background-color:#fff;font-family:HelveticaNeue, Helvetica Neue, Helvetica, Arial, Lucida Grande, sans-serif;font-size:13px;" id="yiv4177294222yui_3_16_0_1_1413982265035_79482"><div dir="ltr" id="yiv4177294222yui_3_16_0_1_1413982265035_72984"><span>Caro prof. Carlinhos,</span></div><div dir="ltr" id="yiv4177294222yui_3_16_0_1_1413982265035_72996"><span><br></span></div><div dir="ltr" id="yiv4177294222yui_3_16_0_1_1413982265035_72995">É sempre um prazer ouvir (ou ler) o que o senhor tem a dizer sobre assuntos tão interessantes como esse! Muito obrigado por enviar o paper para a lista. Já tinha ouvido falar sobre esse estudo em ocasiões anteriores, mas é ainda mais interessante ler os detalhes dela. </div><div dir="ltr" id="yiv4177294222yui_3_16_0_1_1413982265035_72995"><br></div><div dir="ltr" id="yiv4177294222yui_3_16_0_1_1413982265035_72995">Relacionado a amostragem intencional: assim como o senhor, sempre que possível, eu também gosto de trabalhar com amostras balanceadas. Recentemente (mas não tão recentemente assim) Deville e Tillé (Biometrika, 2004) desenvolveram um método para seleção de amostras balanceadas que pode agradar gregos e troianos. Esse método, chamado de método cubo, permite a seleção de amostras probabilísticas (com probabilidades de seleção iguais ou desiguais) de forma que as estimativas para variáveis auxiliares usadas para balanceamento da amostra, quantitativas ou qualitativas, sejam iguais ou aproximadamente iguais aos totais populacionais. </div><div dir="ltr" id="yiv4177294222yui_3_16_0_1_1413982265035_72995"><br></div><div dir="ltr" id="yiv4177294222yui_3_16_0_1_1413982265035_72995">Agora eu gostaria de lançar uma outra provocação acadêmica na lista. Alguns bayesianos criticam (e com razão, na minha opinião) o chamado "empate técnico", como muitas pesquisas de intenção de voto publicam quando os intervalos de confiança de cada candidato se sobrepõem, o que pode passar a impressão que cada candidato tem a mesma chance de vencer a eleição. Como alternativa, alguns recomendam o cálculo da probabilidade de cada candidato ganhar a eleição (no caso do 2o turno), usando métodos bayesianos, como o Neale vem fazendo no Pollingdata.com.br. Não sei se vocês vem acompanhando o site do Neale, mas nesse momento ele apresenta uma probabilidade de 51% para o Aécio e 49% para Dilma. Digamos que um dia antes do 2o turno cheguemos a 50% para cada candidato. Seria esse o "empate técnico" bayesiano? </div><div dir="ltr" id="yiv4177294222yui_3_16_0_1_1413982265035_72995"><br></div><div dir="ltr" id="yiv4177294222yui_3_16_0_1_1413982265035_72995">Um abraço,</div><div dir="ltr" id="yiv4177294222yui_3_16_0_1_1413982265035_72995">Raphael</div> <div class="yiv4177294222qtdSeparateBR" id="yiv4177294222yui_3_16_0_1_1413982265035_79486"><br><br></div><div class="yiv4177294222yahoo_quoted" style="display: block;" id="yiv4177294222yui_3_16_0_1_1413982265035_79481"> <div style="font-family:HelveticaNeue, Helvetica Neue, Helvetica, Arial, Lucida Grande, sans-serif;font-size:13px;" id="yiv4177294222yui_3_16_0_1_1413982265035_79480"> <div style="font-family:HelveticaNeue, Helvetica Neue, Helvetica, Arial, Lucida Grande, sans-serif;font-size:16px;" id="yiv4177294222yui_3_16_0_1_1413982265035_79479"> <div dir="ltr" id="yiv4177294222yui_3_16_0_1_1413982265035_79485"> <font size="2" face="Arial" id="yiv4177294222yui_3_16_0_1_1413982265035_79484"> Em Terça-feira, 21 de Outubro de 2014 21:08, Carlos Alberto de Bragança Pereira <cpereira@ime.usp.br> escreveu:<br> </font> </div> <br><br> <div class="yiv4177294222y_msg_container" id="yiv4177294222yui_3_16_0_1_1413982265035_79478"><br>Caros redistas:<br><br>É com muita satisfação ver uma discussão em nossa rede de craques: <br>Pelé, Maradona, Neymar e Messi - Zé, Pedro, Rafael e Neale. Como um <br>coadjuvante, vou tentar bater uma bola com esse pessoal da pesada.<br><br>Nas minhas últimas intervenções tentei colocar alguns pontos <br>esquecidos e agora vejo pelos artigos apresentados que a análise sim é <br>fundamental. Por sinal devo dizer que tive ótimas discussões com <br>alguns redistas fora do nosso fórum. Mas o que mais me chamou <br>atenção foi a palavra probabilística acompanhando a amostragem como <br>sendo um qualificativo. E claro o outro qualificativo cotas tende a <br>ser pejorativo para parte do nosso fórum. O Carvalho sim explicou <br>como as pessoas fazem a amostragem por cotas e creio que ele está <br>correto na forma equivocada como são realizadas. Contudo, creio que <br>se feita com propriedade pode ser útil e auxiliar na coleta de uma <br>amostra “boa”. Vou simplificar bastante minha discussão para que <br>possamos discutir com talvez mais clareza, pelo menos para mim.<br><br>Representemos nosso problema pela nossa conhecida urna com bolinhas <br>coloridas: vermelho para o PT, verde para os tucanos e brancas para o <br>resto (brancos; nulos; e não votantes). Consideramos uma amostra <br>informativa (paramétrica) se a verossimilhança depender das <br>frequências de cada uma das categorias e ai ter-se-ia um modelo <br>hipergeométrico multivariado, com parâmetros P, T e B, população N <br>(Número de bolas da urna) e amostra n (número de bolas na amostra). <br>Este modelo é muito bom para partes da população onde os eleitores, em <br>nossa opinião seriam permutáveis. Assim lembrando o famoso artigo de <br>Lindley e Novick do Annals of Statistics, a permutabilidade é <br>equivalente às estratificações e aglomerações da amostragem. Em cada <br>núcleo pequeno teríamos assim uma urna de 3 cores. Daí teríamos para <br>cada núcleo uma hipergeométrica específica dando a verossimilhança <br>necessária para compor a verossimilhança do aglomerado que em uma <br>composição posterior formar a verossimilhança do estrato e por fim a <br>verossimilhança global que nos daria o conjunto de credibilidade para <br>formar a verossimilhança global. Esse foi um dos dois modelos usado <br>por nós na eleição da Nicarágua.<br><br>Agora pensemos na urna com as bolinhas marcadas com os nomes dos <br>eleitores e ai diferenciados uma a um. O modelo agora é selecionar <br>uma amostra de tamanho n da população de tamanho N. Neste caso cada <br>uma das amostras teria probabilidade igual ao inverso de C(N;n) que é <br>a combinação de N, n a n. Todas as amostras de tamanho n tendo a <br>mesma probabilidade de ser extraída ao chacoalharmos a urna do <br>escritório do estatístico. Neste caso, muda-se o valor dos parâmetros <br>P, T e B e a verossimilhança continua sendo a mesma, o que chamei de <br>flat. Lembrem-se os colegas que por esta razão chamei de flat a <br>verossimilhança. Assim, não há como usar o estimador de Máxima <br>verossimilhança e sim estimadores não viciados com a verossimilhança <br>Flat, sendo a variável aleatória o indicador de um eleitor pertencer <br>ou não a amostra sem referência ao fato de ele ser de alguma cor. Com <br>o fato de usarmos estratificação e conglomeração usamos esses métodos <br>para melhorar o indicador de o eleitor i pertencer ou não a amostra. <br>Esse foi o segundo modelo usado por nós na eleição da Nicarágua como o <br>Carvalho mencionou. Nosso artigo está nos anais do SINAPE de 1990. <br>Devido ao tamanho do documento que preparei tentarei enviar uma cópia <br>em um próximo e-mail, pois no e-mail do IME normalmente não <br>conseguimos enviar pastas com mais de 1 megabyte. Como o Carvalho <br>mencionou, foi um trabalho hercúleo do grupo do grande mestre OSCAR <br>mostrar as convergências dos estimadores não viciados (estimador <br>razão) deste tipo de modelo. Como irão ver em nosso artigo os <br>resultados foram equivalentes.<br><br>Finalmente gostaria de mencionar a amostragem intencional que é obtida <br>por otimização global. Nossa receita é copiar na amostra as <br>proporções populacionais para aquelas variáveis consideradas <br>relacionadas com a variável que temos interesse, a frequência de <br>eleitores em cada núcleo (estratificação e aglomeração). O problema é <br>que somos obrigados a usar um otimizador: isto é, quais as mostras de <br>tamanho n da população de tamanho N que melhor copia a população <br>daquele pequeno núcleo. Note que como a amostragem não paramétrica é <br>flat e esta amostra otimizada é uma possível seleção daqueles modelos <br>não paramétrico! Então, qual o problema de usarmos a mesma inferência <br>daquele modelo? Esta é a diferença que eu e o Zé teríamos. <br>Lembrem-se que o modelo de cotas usadas pelos institutos não fazem a <br>otimização global e sim marginal, isso se usarem o descrito pelo <br>Carvalho.<br><br>Finalizo esta minha singela intervenção dizendo que a composição das <br>verossimilhanças pode ser pensada como uma meta análise de <br>verossimilhanças que descrevi no artigo convidado da revista Ciência e <br>Natura do nosso colega Fábio.<br>Como provocação, coloco aqui o paradigma: Por que uma amostra por <br>cotas (da forma otimizada que coloquei) passaria de ruim a boa apenas <br>porque foi selecionada por um mecanismo não informativo? Uma urna que <br>não tem nada haver com a população pode transformar uma amostra ruim <br>em boa só porque é um ponto amostral possível daquele mecanismo?<br><br>Saudações acadêmicas de um perna de pau.<br><br>Carlinhos<br>Vou tentar enviar o paper aqui na rede<br>Se não chegar os interessados que usam outros emails mais flexíveis <br>por favor me escrevam que eu mando para vocês.<br><br>-- <br>Carlos Alberto de Bragança Pereira<br><a rel="nofollow" class="yiv4177294222removed-link" href="">http://www.ime.usp.br/~cpereira</a><br><a rel="nofollow" class="yiv4177294222removed-link" href="">http://scholar.google.com.br/citations?user=PXX2AygAAAAJ&hl=pt-BR</a><br>Stat Department - Professor & Head<br>University of São Paulo<br><br><br>_______________________________________________<br>abe mailing list<br><a rel="nofollow" class="yiv4177294222removed-link" href="">abe@lists.ime.usp.br</a><br><a rel="nofollow" class="yiv4177294222removed-link" href="">https://lists.ime.usp.br/mailman/listinfo/abe</a><br><br><br></div> </div> </div> </div> </div></div></div></div></div></div></div></body></html>