<div dir="ltr"><div class="gmail_default" style="font-family:verdana,sans-serif">Neale,</div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif">excelente que você tenha colocado referências atuais e a discussão num patamar legal.</div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif">A <span style="font-family:arial,sans-serif;font-size:13px"> amostragem probabilistica com cotas (APC) como você denominou tem alguns aspectos atraentes, mas a prática dela, até onde conheço, tem três defeitos fundamentais.</span></div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif">1) Se há uma seleção probabilística de unidades em algum(ns) estágio(s) de seleção, então a ponderação consequente com esta parte do processo de amostragem teria que ser feita quando as análises serão realizadas. Nas vezes que vi o método acima ser descrito em aplicações, esta etapa era completamente ignorada e a ponderação era feita apenas considerando a informação das cotas. Além disso, toda a estrutura de estratificação e conglomeração era ignorada nas análises posteriores, o que é incoerente com o plano praticado.</div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif">2) As afirmações sobre margem de erro das estimativas derivadas se baseia inteiramente nas expressões válidas para amostragem aleatória simples. No Brasil, nunca vi um trabalho que descrevesse uma abordagem justificável (mesmo sob um modelo ou suposições) para explicar porque estas expressões podem ou devem ser usadas para amostras coletadas pelo método em questão (APC, como você o chamou).</div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif">3) O terceiro defeito é a dificuldade (ou impossibilidade) de replicar o processo de amostragem por cotas. Se o entrevistador é quem toma decisão sobre quem entrevistar, esta dificuldade é severa. Replicabilidade é um dos pilares do método científico. Outros pesquisadores teriam que poder usar o mesmo método, mas este não é replicável porque outros pesquisadores não poderão usar os mesmos entrevistadores, etc. </div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif">Eu aprecio que a amostragem probabilística que se faz na prática também depende de suposições sobre comportamento da não resposta para poder justificar suas inferências. Mas em pesquisas onde a não resposta é menor que, digamos, 10%, os resultados são bastante robustos a diferentes suposições sobre o comportamento da não resposta. E os métodos são replicáveis.</div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif">Esta é a razão fundamental para a adoção da amostragem probabilística no ambiente das estatísticas oficiais mundo afora. </div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif">Saudações, Pedro.</div></div><div class="gmail_extra"><br><div class="gmail_quote">Em 22 de setembro de 2014 18:43, Neale El-Dash <span dir="ltr"><<a href="mailto:neale.eldash@gmail.com" target="_blank">neale.eldash@gmail.com</a>></span> escreveu:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr">Esse email passou em branco quando o Luis enviou, mas eu gostaria de fazer 2 comentarios. O email vai ser um pouco longo, mas eu acredito que esse tema merece ;) <div><br></div><div>Primeiramente, segue o link para um relatorio da associacao americana de pesquisa de opiniao publica.  Acho que quem se coloca tanto a favor como contra as pesquisas eleitorais deveria ler o relatorio. Tem muitas referencias, de academicos e pesquisadores, de estatisticos e cientistas sociais, e e' uma discussao seria e interessante. Melhor de tudo e' atual, de 2013:</div><div><br></div><div>[Ref1]REPORT OF THE AAPOR TASK FORCE ON NON-PROBABILITY SAMPLING<br></div><div><a href="http://www.aapor.org/AM/Template.cfm?Section=Reports1&Template=/CM/ContentDisplay.cfm&ContentID=5963" target="_blank">http://www.aapor.org/AM/Template.cfm?Section=Reports1&Template=/CM/ContentDisplay.cfm&ContentID=5963</a><br><div><br></div><div>1- <b><u>Amostragem Probabilistica - </u></b> No contexto de amostragem de populacoes humanas (nao estou falando de populacoes fechadas, como funcionarios de uma empresa), nao existe amostragem probabilistica estritamente falando. Nao estou preocupado aqui em distinguir entre probabilidade de selecao ou probabilidade de resposta. Simplesmente as probabilidades de todos os respondentes na sua "base de dados" nunca sao conhecidas sem suposicoes. Nem o IBGE consegue tal feito, mesmo a populacao sendo obrigada por lei a responder ao questionario e tendo uma infinidade de $$$ se comparado a qualquer instituto de pesquisa particular. Ou seja, se o criterio a ser adotado para que uma pesquisa seja "vetada" e' simplesmente ela nao ser (estritamente) probabilistica, nao sao somente pesquisas eleitorais que devem ser eliminadas, sao absolutamente todas (inclusive as do IBGE). </div><div><br></div><div>Alguem na lista conhece um contra-exemplo - uma amostra de alguma populacao humana onde os dados podem ser analisados sem se fazer uma unica suposicao? Fazer suposicoes/modelos esta em tudo que fazemos como estatisticos. Se vc utiliza uma base de dados sem se preocupar com como ela foi obtida, voce nao esta fazendo seu trabalho direito. Mas isso e' bem diferente de proibir que as pesquisas eleitorais sejam feitas.<br><div><br></div><div>2- <b><u>Amostragem Probabilistica com Cotas -</u></b> Nao acho que podemos colocar todas as amostras ditas "nao-probabilisticas" no mesmo saco. Claramente algumas sao bem melhores do que as outras.  Se em uma pesquisa existe a preocupacao em reduzir possiveis vicios antes e depois da selecao da amostra, essa pesquisa e' provavelmente melhor do que uma pesquisa que nao se preocupa com isso, por exemplo. A maioria dos institutos de pesquisa que eu conheco NAO utilizam amostragem em ponto de fluxo, pelo menos nao para pesquisas eleitorais/Opiniao publica (com excecao do Datafolha, que eu acho que faz dentro de algumas cidades). A maioria utiliza o que eu chamo de amostragem probabilistica com cotas (APC), onde os primeiros estagios sao probabilisticos, e apenas o ultimo estagio tem cotas (dentro do setor censitario). Nesse ultimo estagio impoem-se restricoes sobre como o entrevistador pode selecionar o respondente. Essa metodologia de pesquisa e' muito bem descrita em: </div><div><br></div><div><div>[Ref2]Probability SampIing with Quotas: An Experiment (C. BRUCE STEPHENSON)</div></div><div><a href="http://publicdata.norc.org:41000/gss/DOCUMENTS/REPORTS/Methodological_Reports/MR007.pdf" target="_blank">http://publicdata.norc.org:41000/gss/DOCUMENTS/REPORTS/Methodological_Reports/MR007.pdf</a>   </div><div><br></div><div> onde ale'm de tudo, e' feita uma comparacao minuciosa com  amostragem probabilistica (aquela da pratica, cheia de suposicoes). Esse relatorio mostra que foram observadas bem poucas diferencas com qualquer relevancia pratica. Essencialmente, a maior preocupacao e' que com a APC o tamanho medio dos domicilios e' usualmente maior, algo facilmente corrigido com uma simples ponderacao (e, e' claro, uma suposicao!). Meu ponto e', faz muito mais sentido usar esse artigo [Ref2] e esse tipo de amostragem como referencia para criticas/sugestoes, do que a amostragem por cotas (em ponto de fluxo) que usualmente nao e' utilizada no Brasil. A amostragem por cotas (em ponto de fluxo)  e' comparada com a amostragem probabilistica (aquela da pratica, cheia de suposicoes) nesse artigo abaixo:   </div><div><br></div><div>[Ref3]An experimental study of quota sampling (C. A. Moser and A. Stuart)<br></div><div><a href="http://www.jstor.org/discover/10.2307/2343021?uid=3737664&uid=2&uid=4&sid=21104724117583" target="_blank">http://www.jstor.org/discover/10.2307/2343021?uid=3737664&uid=2&uid=4&sid=21104724117583</a></div><div><br></div><div>Coloquei esse artigo [Ref3] para quem tem interesse poder compara-lo com o artigo [Ref2] e ver como as metodologias (e as criticas) sao muito diferentes.</div><div><br></div><div>Enfim, eu acho que a distincao entre amostragem probabilistica e nao-probabilistica, em muitos casos e' bem mais sutil do que parece. Vale a pena ler com cuidado a metodologia de qualquer pesquisa, independente desse rotulo. Assim voce ja comeca a formular um modelo para ser utilizado com os dados, e entende melhor quais podem ser o problemas em potencial ao analisar os resultados.<br></div><div><br></div><div>Abraco Neale</div><div><br></div><div><br></div></div></div></div><div class="gmail_extra"><br><div class="gmail_quote">Em 21 de setembro de 2014 22:28, Luis Paulo Braga <span dir="ltr"><<a href="mailto:lpbraga@geologia.ufrj.br" target="_blank">lpbraga@geologia.ufrj.br</a>></span> escreveu:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><a href="https://br.noticias.yahoo.com/pesquisas-eleitorais-cont%C3%AAm--problemas-s%C3%A9rios--e-deveriam-ser-vetadas--diz-estat%C3%ADstico-veterano-235137785.html" target="_blank">https://br.noticias.yahoo.com/pesquisas-eleitorais-cont%C3%AAm--problemas-s%C3%A9rios--e-deveriam-ser-vetadas--diz-estat%C3%ADstico-veterano-235137785.html</a><br></div><div class="gmail_extra"><br><div class="gmail_quote">Em 21 de setembro de 2014 18:15, Marcelo L. Arruda <span dir="ltr"><<a href="mailto:mlarruda@terra.com.br" target="_blank">mlarruda@terra.com.br</a>></span> escreveu:<div><div><br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><u></u>





<div bgcolor="#ffffff">
<div><font face="Arial">Esse é um problema sério com que freqüentemente 
lido no Chance de Gol.</font></div>
<div><font face="Arial"></font> </div>
<div><font face="Arial">    Para os estatísticos, o 
significado de "prever" pode ser longamente discutido e não vou abrir essa 
discussão agora.</font></div>
<div><font face="Arial">    Para o "povão", porém, 
"prever" significa cravar antecipadamente algo que vai acontecer, ou seja, 
"adivinhar", "profetizar", "vaticinar"! E aí sempre cabe a observação (nem 
sempre apreendida pelo interlocutor) de que 58% de probablidade de vitória de X 
não é o mesmo que afirmar categoricamente que X VAI GANHAR!</font></div><span><font color="#888888">
<div><font face="Arial"></font> </div>
<div><font face="Arial">Marcelo</font></div>
</font></span><blockquote style="BORDER-LEFT:#000000 2px solid;PADDING-LEFT:5px;PADDING-RIGHT:0px;MARGIN-LEFT:5px;MARGIN-RIGHT:0px"><div><div>
  <div style="FONT:10pt arial">----- Original Message ----- </div>
  <div style="FONT:10pt arial;BACKGROUND:#e4e4e4"><b>From:</b> 
  <a title="lpbraga@geologia.ufrj.br" href="mailto:lpbraga@geologia.ufrj.br" target="_blank">Luis 
  Paulo Braga</a> </div>
  <div style="FONT:10pt arial"><b>To:</b> <a title="neale.eldash@gmail.com" href="mailto:neale.eldash@gmail.com" target="_blank">Neale El-Dash</a> ; <a title="abe-l@ime.usp.br" href="mailto:abe-l@ime.usp.br" target="_blank">Lista da ABE</a> </div>
  <div style="FONT:10pt arial"><b>Sent:</b> Sunday, September 21, 2014 4:44 
  PM</div>
  <div style="FONT:10pt arial"><b>Subject:</b> Re: [ABE-L] Neale E-Dash prevê 
  vitória de Marina</div>
  <div><br></div>
  <div dir="ltr">Qual o significado do verbo prever?
  <div><br></div></div>
  <div class="gmail_extra"><br>
  <div class="gmail_quote">Em 21 de setembro de 2014 10:59, Neale El-Dash <span dir="ltr"><<a href="mailto:neale.eldash@gmail.com" target="_blank">neale.eldash@gmail.com</a>></span> escreveu:<br>
  <blockquote style="BORDER-LEFT:#ccc 1px solid;MARGIN:0px 0px 0px 0.8ex;PADDING-LEFT:1ex" class="gmail_quote">
    <div dir="ltr">Olá Luis, obrigado por postar a "mini" reportagem.
    <div><br></div>
    <div>Só um comentário: 58% de chance de vitoria é diferente de prever 
    vitória! </div>
    <div><br></div>
    <div>Abraço</div></div>
    <div class="gmail_extra"><br>
    <div class="gmail_quote">Em 21 de setembro de 2014 10:53, Luis Paulo Braga 
    <span dir="ltr"><<a href="mailto:lpbraga@geologia.ufrj.br" target="_blank">lpbraga@geologia.ufrj.br</a>></span> escreveu:<br>
    <blockquote style="BORDER-LEFT:#ccc 1px solid;MARGIN:0px 0px 0px 0.8ex;PADDING-LEFT:1ex" class="gmail_quote">
      <div>
      <div>
      <div dir="ltr">Veja
      <div>
      <p style="BACKGROUND-REPEAT:no-repeat;FONT-FAMILY:Verdana;COLOR:rgb(0,0,0);FONT-SIZE:16px;FONT-WEIGHT:800"><b>A 
      pesquisa das pesquisas</b></p>
      <p style="TEXT-ALIGN:justify;BACKGROUND-REPEAT:no-repeat;FONT-FAMILY:Verdana;COLOR:rgb(0,0,0);FONT-SIZE:12px" align="justify"></p>
      <p style="TEXT-ALIGN:justify;BACKGROUND-REPEAT:no-repeat;FONT-FAMILY:Verdana;COLOR:rgb(0,0,0);FONT-SIZE:12px"><span style="FONT-SIZE:14px">Desde que Marina Silva entrou na disputa 
      eleitoral, já foram divulgadas 33 pesquisas registradas na Justiça 
      Eleitoral, de cinco institutos. Esses levantamentos mostram o que os 
      analistas chamam de uma "fotografia do momento", mas dizem pouco sobre o 
      que pode acontecer no futuro. Para tentar apontar as chances de vitória de 
      cada candidato, o estatístico Neale El-Dash, ex-diretor de pesquisas do 
      instituto Ipsos nos Estados Unidos, adaptou para o Brasil o método 
      utilizado pelo matemático americano Nate Silver na eleição de 2012, quando 
      ele acertou os resultados em todos os cinquenta estados 
      americanos.</span></p>
      <p style="TEXT-ALIGN:justify;BACKGROUND-REPEAT:no-repeat;FONT-FAMILY:Verdana;COLOR:rgb(0,0,0);FONT-SIZE:12px">Por 
      meio do cruzamento dessas 33 pesquisas, inclusive a do Datafolha divulgada 
      na sexta-feira passada, o estatístico fez 15000 simulações em um programa 
      de computador que permitiram chegar aos cenários com maior probabilidade 
      de se concretizar. O trabalho mostrou que Marina tem 58% de possibilidade 
      de vencer a disputa pela Presidência da República, contra 41% de Dilma 
      Rousseff e 1% de Aécio Neves. A pesquisa de El-Dash deu pesos diferentes a 
      cada levantamento, a partir de variáveis que abrangeram desde o tamanho da 
      amostra utilizada até o histórico de aceitos de cada instituto. À medida 
      que se aproxima a data da eleição, também muda, por exemplo, a influência 
      da margem de erro dos 
      levantamentos.</p></div></div><br></div></div>_______________________________________________<br>abe 
      mailing list<br><a href="mailto:abe@lists.ime.usp.br" target="_blank">abe@lists.ime.usp.br</a><br><a href="https://lists.ime.usp.br/mailman/listinfo/abe" target="_blank">https://lists.ime.usp.br/mailman/listinfo/abe</a><br><br></blockquote></div><span><font color="#888888"><br><br clear="all">
    <div><br></div>-- <br>
    <div dir="ltr">
    <div><br></div>There are two routes to success in soccer. One is being good. 
    The other is being lucky. You need both to win a championship. But you only 
    need one to win a game. (The numbers game)<br>
    <div><br>-----------------------------------------------<br>Neale Ahmed 
    El-Dash<br>Doutor em Estatística<br>Celular: <a href="tel:%2B55%2019%20998893939" value="+5519998893939" target="_blank">+55 
    19 998893939</a><br>Email: <a href="mailto:neale.eldash@gmail.com" target="_blank">neale.eldash@gmail.com</a>
    <div style="DISPLAY:inline"></div></div></div></font></span></div></blockquote></div><br></div>
  </div></div><p>
  </p><hr><span>

  <p></p>_______________________________________________<br>abe mailing 
  list<br><a href="mailto:abe@lists.ime.usp.br" target="_blank">abe@lists.ime.usp.br</a><br><a href="https://lists.ime.usp.br/mailman/listinfo/abe" target="_blank">https://lists.ime.usp.br/mailman/listinfo/abe</a><br></span><p></p></blockquote></div>
<br>_______________________________________________<br>
abe mailing list<br>
<a href="mailto:abe@lists.ime.usp.br" target="_blank">abe@lists.ime.usp.br</a><br>
<a href="https://lists.ime.usp.br/mailman/listinfo/abe" target="_blank">https://lists.ime.usp.br/mailman/listinfo/abe</a><br>
<br></blockquote></div></div></div><br></div>
<br>_______________________________________________<br>
abe mailing list<br>
<a href="mailto:abe@lists.ime.usp.br" target="_blank">abe@lists.ime.usp.br</a><br>
<a href="https://lists.ime.usp.br/mailman/listinfo/abe" target="_blank">https://lists.ime.usp.br/mailman/listinfo/abe</a><br>
<br></blockquote></div><span class="HOEnZb"><font color="#888888"><br><br clear="all"><div><br></div>-- <br><div dir="ltr"><div><br></div>There are two routes to success in soccer. One is being good. The other is being lucky. You need both to win a championship. But you only need one to win a game. (The numbers game)<br><div><br>-----------------------------------------------<br>Neale Ahmed El-Dash<br>Doutor em Estatística<br>Celular: <a href="tel:%2B55%2019%20998893939" value="+5519998893939" target="_blank">+55 19 998893939</a><br>Email: <a href="mailto:neale.eldash@gmail.com" target="_blank">neale.eldash@gmail.com</a><div style="display:inline"></div></div></div>
</font></span></div>
<br>_______________________________________________<br>
abe mailing list<br>
<a href="mailto:abe@lists.ime.usp.br">abe@lists.ime.usp.br</a><br>
<a href="https://lists.ime.usp.br/mailman/listinfo/abe" target="_blank">https://lists.ime.usp.br/mailman/listinfo/abe</a><br>
<br></blockquote></div><br><br clear="all"><div><br></div>-- <br><div dir="ltr"><font face="verdana, sans-serif">Pedro Luis do Nascimento Silva</font><div><font face="verdana, sans-serif"><b>ISI President-Elect 2013-2015</b><br>IBGE - Escola Nacional de Ciências Estatísticas<br>Phone: +55 21 21424957</font></div></div>
</div>