<div dir="ltr"><div class="gmail_default" style="color:rgb(0,0,0)"><a href="https://faculty.fuqua.duke.edu/~rnau/definettiwasright.pdf">https://faculty.fuqua.duke.edu/~rnau/definettiwasright.pdf</a><br></div></div><div class="gmail_extra"><br><div class="gmail_quote">Em 22 de outubro de 2014 23:53,  <span dir="ltr"><<a href="mailto:asimonis@ime.usp.br" target="_blank">asimonis@ime.usp.br</a>></span> escreveu:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><br>
Caros, supondo que o pessoal da geral (eu e + alguns) e os da arquibancada também possam dar pitacos, gostaria de destacar o ponto colocado sobre " probabilidade não existe" que é bem sabido até pela torcida do Flamengo (não falemos mais de futebol hoje pois o Glorioso hoje perdeu para aqueles).<br>
<br>
O cálculo de probabilidades existe e é muito bem-vindo por todos. A réplica de experimentos foi o que deflagrou a Revolução Científica.<br>
<br>
A estimativa por cotas se bem-feita é um belo estimador. Se é bom nunca saberei por não permite o cálculo a que me referi.<br>
<br>
Mesmo com verossimilhancas "flats" devemos, por vocação, não cair em falácias, tais como: o meu cão recebe comida se sentar, mas não quer dizer que basta isto para ser alimentado. Em outras palavras, reproduzir as proporcionalidades populacionais na amostra não a torna uma amostra aleatória.<br>
<br>
Abs<br>
<br>
<br>
Citando Pedro Luis do Nascimento Silva <<a href="mailto:pedronsilva@gmail.com" target="_blank">pedronsilva@gmail.com</a>>:<br>
<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div><div class="h5">
Colegas,<br>
<br>
Quando o técnico entra em campo, é bom os jogadores ouvirem o que ele tem a<br>
dizer... Mesmo os supostos craques (falo por mim)...<br>
<br>
Carlinhos, a dificuldade com a amostragem por cotas, para mim, não vem de<br>
um argumento teórico, embora eu respeite todo os já apresentados.<br>
<br>
Eu conheço, por exemplo, os trabalhos do Migon e do Gutemberg em pesquisas<br>
eleitorais feitas nos anos 90 em que usaram modelos de escolha intencional<br>
para a amostra de sessões eleitorais cujos resultados, em eleições<br>
passadas, se pareciam mais com os resultados globais. Este tipo de<br>
abordagem tem uma propriedade fundamental: é replicável.<br>
<br>
Você também apresentou alternativas que levam a procedimentos replicáveis.<br>
<br>
Os modelos de amostragem por cotas em uso aqui e em outras partes tem um<br>
componente que os torna 'irreplicáveis': dão ao entrevistador que está na<br>
rua uma liberdade muito grande de fazer o que quiser, dentro de parâmetros<br>
muito frouxos de quem podem e quem não podem selecionar. Este tipo<br>
abordagem admite modelagem, claro, mas como se sairá o modelo com pequenas<br>
variações na composição da equipe que faz a coleta ou no posicionamento da<br>
equipe de coleta no campo?<br>
<br>
Na semana passada eu encontrei um pesquisador de um dos grandes institutos<br>
que fazem pesquisas eleitorais, posicionado na esquina da Av. Nossa Senhora<br>
de Fátima com Rua do Riachuelo, e selecionando pessoas para entrevistar com<br>
a seguinte estratégia: mostrava aos passantes o crachá bem grande que tinha<br>
com o nome do instituto, e convidava para participar da pesquisa. Quem<br>
conhece o local saberá que não dá para chamar os passantes de eleitores<br>
permutáveis...<br>
<br>
Creio que estamos num bom caminho ao explicitar o debate, trazer à tona os<br>
vários argumentos e alternativas, explorar suas vantagens e limitações, e<br>
assim, crescer no conhecimento das possibilidades.<br>
<br>
Lamentavelmente, nossa discussão aqui tem pouca chance de influenciar o<br>
mercado de pesquisas eleitorais (ao menos no curto prazo).<br>
<br>
Mas isto não é argumento para não continuar com a discussão.<br>
<br>
Saudações botafoguenses... Pedro<br>
<br>
<br>
<br>
Em 21 de outubro de 2014 23:07, Carlos Alberto de Bragança Pereira <<br>
<a href="mailto:cpereira@ime.usp.br" target="_blank">cpereira@ime.usp.br</a>> escreveu:<br>
<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<br>
Caros redistas:<br>
<br>
É com muita satisfação ver uma discussão em nossa rede de craques: Pelé,<br>
Maradona, Neymar e Messi - Zé, Pedro, Rafael e Neale. Como um coadjuvante,<br>
vou tentar bater uma bola com esse pessoal da pesada.<br>
<br>
Nas minhas últimas intervenções tentei colocar alguns pontos esquecidos e<br>
agora vejo pelos artigos apresentados que a análise sim é fundamental.  Por<br>
sinal devo dizer que tive ótimas discussões com alguns redistas fora do<br>
nosso fórum.   Mas o que mais me chamou atenção foi a palavra<br>
probabilística acompanhando a amostragem como sendo um qualificativo.  E<br>
claro o outro qualificativo cotas tende a ser pejorativo para parte do<br>
nosso fórum.  O Carvalho sim explicou como as pessoas fazem a amostragem<br>
por cotas e creio que ele está correto na forma equivocada como são<br>
realizadas.  Contudo, creio que se feita com propriedade pode ser útil e<br>
auxiliar na coleta de uma amostra “boa”.  Vou simplificar bastante minha<br>
discussão para que possamos discutir com talvez mais clareza, pelo menos<br>
para mim.<br>
<br>
Representemos nosso problema pela nossa conhecida urna com bolinhas<br>
coloridas: vermelho para o PT, verde para os tucanos e brancas para o resto<br>
(brancos; nulos; e não votantes).  Consideramos uma amostra informativa<br>
(paramétrica) se a verossimilhança depender das frequências de cada uma das<br>
categorias e ai ter-se-ia um modelo hipergeométrico multivariado, com<br>
parâmetros P, T e B, população N (Número de bolas da urna) e amostra n<br>
(número de bolas na amostra).  Este modelo é muito bom para partes da<br>
população onde os eleitores, em nossa opinião seriam permutáveis.  Assim<br>
lembrando o famoso artigo de Lindley e Novick do Annals of Statistics, a<br>
permutabilidade é equivalente às estratificações e aglomerações da<br>
amostragem.  Em cada núcleo pequeno teríamos assim uma urna de 3 cores.<br>
Daí teríamos para cada núcleo uma hipergeométrica específica dando a<br>
verossimilhança necessária para compor a verossimilhança do aglomerado que<br>
em uma composição posterior formar a verossimilhança do estrato e por fim a<br>
verossimilhança global que nos daria o conjunto de credibilidade para<br>
formar a verossimilhança global.  Esse foi um dos dois modelos usado por<br>
nós na eleição da Nicarágua.<br>
<br>
Agora pensemos na urna com as bolinhas marcadas com os nomes dos eleitores<br>
e ai diferenciados uma a um.  O modelo agora é selecionar uma amostra de<br>
tamanho n da população de tamanho N. Neste caso cada uma das amostras teria<br>
probabilidade igual ao inverso de C(N;n) que é a combinação de N, n a n.<br>
Todas as amostras de tamanho n tendo a mesma probabilidade de ser extraída<br>
ao chacoalharmos a urna do escritório do estatístico.  Neste caso, muda-se<br>
o valor dos parâmetros P, T e B e a verossimilhança continua sendo a mesma,<br>
o que chamei de flat.  Lembrem-se os colegas que por esta razão chamei de<br>
flat a verossimilhança.  Assim, não há como usar o estimador de Máxima<br>
verossimilhança e sim estimadores não viciados com a verossimilhança Flat,<br>
sendo a variável aleatória o indicador de um eleitor pertencer ou não a<br>
amostra sem referência ao fato de ele ser de alguma cor.  Com o fato de<br>
usarmos estratificação e conglomeração usamos esses métodos para melhorar o<br>
indicador de o eleitor i pertencer ou não a amostra.  Esse foi o segundo<br>
modelo usado por nós na eleição da Nicarágua como o Carvalho mencionou.<br>
Nosso artigo está nos anais do SINAPE de 1990.  Devido ao tamanho do<br>
documento que preparei tentarei enviar uma cópia em um próximo e-mail, pois<br>
no e-mail do IME normalmente não conseguimos enviar pastas com mais de 1<br>
megabyte.  Como o Carvalho mencionou, foi um trabalho hercúleo do grupo do<br>
grande mestre OSCAR mostrar as convergências dos estimadores não viciados<br>
(estimador razão) deste tipo de modelo.  Como irão ver em nosso artigo os<br>
resultados foram equivalentes.<br>
<br>
Finalmente gostaria de mencionar a amostragem intencional que é obtida por<br>
otimização global.  Nossa receita é copiar na amostra as proporções<br>
populacionais para aquelas variáveis consideradas relacionadas com a<br>
variável que temos interesse, a frequência de eleitores em cada núcleo<br>
(estratificação e aglomeração).  O problema é que somos obrigados a usar um<br>
otimizador: isto é, quais as mostras de tamanho n da população de tamanho N<br>
que melhor copia a população daquele pequeno núcleo. Note que como a<br>
amostragem não paramétrica é flat e esta amostra otimizada é uma possível<br>
seleção daqueles modelos não paramétrico! Então, qual o problema de usarmos<br>
a mesma inferência daquele modelo?  Esta é a diferença que eu e o Zé<br>
teríamos.  Lembrem-se que o modelo de cotas usadas pelos institutos não<br>
fazem a otimização global e sim marginal, isso se usarem o descrito pelo<br>
Carvalho.<br>
<br>
Finalizo esta minha singela intervenção dizendo que a composição das<br>
verossimilhanças pode ser pensada como uma meta análise de verossimilhanças<br>
que descrevi no artigo convidado da revista Ciência e Natura do nosso<br>
colega Fábio.<br>
Como provocação, coloco aqui o paradigma: Por que uma amostra por cotas<br>
(da forma otimizada que coloquei) passaria de ruim a boa apenas porque foi<br>
selecionada por um mecanismo não informativo? Uma urna que não tem nada<br>
haver com a população pode transformar uma amostra ruim em boa só porque é<br>
um ponto amostral possível daquele mecanismo?<br>
<br>
Saudações acadêmicas de um perna de pau.<br>
<br>
Carlinhos<br>
Vou tentar enviar o paper aqui na rede<br>
Se não chegar os interessados que usam outros emails mais flexíveis  por<br>
favor me escrevam que eu mando para vocês.<br>
<br>
--<br>
Carlos Alberto de Bragança Pereira<br>
<a href="http://www.ime.usp.br/~cpereira" target="_blank">http://www.ime.usp.br/~<u></u>cpereira</a><br>
<a href="http://scholar.google.com.br/citations?user=PXX2AygAAAAJ&hl=pt-BR" target="_blank">http://scholar.google.com.br/<u></u>citations?user=PXX2AygAAAAJ&<u></u>hl=pt-BR</a><br>
Stat Department - Professor & Head<br>
University of São Paulo<br>
<br>
<br>
______________________________<u></u>_________________<br>
abe mailing list<br>
<a href="mailto:abe@lists.ime.usp.br" target="_blank">abe@lists.ime.usp.br</a><br>
<a href="https://lists.ime.usp.br/mailman/listinfo/abe" target="_blank">https://lists.ime.usp.br/<u></u>mailman/listinfo/abe</a><br>
<br>
</blockquote>
<br>
<br>
<br>
--<br>
Pedro Luis do Nascimento Silva<br></div></div>
*ISI President-Elect 2013-2015*<span class=""><br>
IBGE - Escola Nacional de Ciências Estatísticas<br>
Phone: <a href="tel:%2B55%2021%2021424957" value="+552121424957" target="_blank">+55 21 21424957</a><br>
</span></blockquote>
<br>
<br><div class="HOEnZb"><div class="h5">
<br>
______________________________<u></u>_________________<br>
abe mailing list<br>
<a href="mailto:abe@lists.ime.usp.br" target="_blank">abe@lists.ime.usp.br</a><br>
<a href="https://lists.ime.usp.br/mailman/listinfo/abe" target="_blank">https://lists.ime.usp.br/<u></u>mailman/listinfo/abe</a><br>
</div></div></blockquote></div><br></div>