<div dir="ltr"><div class="gmail_default" style="color:rgb(0,0,0)">Essa foi boa.<br><br></div><div class="gmail_default" style="color:rgb(0,0,0)">Zabala<br></div></div><div class="gmail_extra"><br><div class="gmail_quote">Em 7 de outubro de 2014 11:29, Luiz Sergio Vaz <span dir="ltr"><<a href="mailto:luizvaz@sarah.br" target="_blank">luizvaz@sarah.br</a>></span> escreveu:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Hoje é dia 07/10, mas pela margem de erro do ibope de 2 pp, Feliz Natal !<br>
<br>
-----Mensagem original-----<br>
De: abe [mailto:<a href="mailto:abe-bounces@lists.ime.usp.br">abe-bounces@lists.ime.usp.br</a>] Em nome de Elias T. Krainski<br>
Enviada em: terça-feira, 7 de outubro de 2014 10:42<br>
Para: <a href="mailto:abe@lists.ime.usp.br">abe@lists.ime.usp.br</a><br>
Assunto: Re: [ABE-L] pesquisas eleitorais: Qual o problema?<br>
<br>
Prezado professor Carlos,<br>
<br>
Infelizmente eu não entendi alguns detalhes, por exemplo, da "verossimilhança FLAT". Mas isso é discussão não para esta lista...<br>
Gostaria de colocar três pontos. 1) usar informações disponíveis para simular pesquisas no computador. 2) necessidade de considerar todas as variáveis dos indivíduos. 3) viabilidade de um plano amostral econômico.<br>
<br>
1) usar informações disponíveis para simular pesquisas no computador.<br>
Quanto à fazer pesquisa de campo usando métodos estatísticos, além de dinheiro, precisaria um grupo interessado. Uma alternativa é que talvez possamos simular essas coisas no computador. O IBGE divulgou a lista de endereços nos quais realizou o censo 2010. São 78 milhões de endereços.<br>
Uma amostra completamente aleatória é inviável na prática, mas é viável em computador. Que tal pensar um plano prático, considerando toda a informação disponível, isto é, lista de endereços, informações de cada setor censitário e dados dos orgãos eleitorais. Que tal propor um plano amostral com base nessas informações considerando localização, condição sócio economico demográfica, teoria de amostragem, minimização de custo, entre outras...<br>
<br>
2) necessidade de considerar todas as variáveis dos indivíduos. Mas pensar em tudo isso é necessário? Na minha humilde opinão acho que não.<br>
Exemplo: Um professor deseja estimar a proporção de alunos que assistiram ao último debate dos candidatos a presidente. Há 24 mulheres e 36 homens na turma. O professor resolveu selecionar 4 mulheres e 6 homens, sem considerar a faixa etária (que varia muito nessa turma). O procedimento de seleção foi: Na ele lança um dado. O número que sair e'<br>
acrescido dos números 0, 6, 12, 18 para mulheres e 0, 6, ..., 30 para homens. Ele considerará a posição dos alunos sentados na sala, numerando as mulheres de 1 a 24 e os homens de 1 a 36; e entrevistará o aluno correspondente à numeração definida pelo lançamento do dado. O ponto principal é que o efeito de faixa etária é "integrado" pela randomização. O efeito de sexo também poderia ser, recorrendo-se à amostragem aleatória simples considerando a população como um único grupo. Ou seja, a palavra chave é randomização.<br>
<br>
3) viabilidade de um plano amostral economico. O fato de não ser possível amostragem aleatória simples pode fazer parecer difícil fazer um plano amostral econômico. Mas realmente não é tão difícil assim!<br>
Concordo que seja trabalhoso, como é mais trabalhoso estratificar os alunos por gênero. Há planos amostrais complexos em dois ou três estágios que podem ser factíveis. Exemplo: Seleciona-se m municípios.<br>
Seleciona-se s_j setores em cada município. Seleciona-se os domicílios d_ji. Considerando 2010, temos o numero de domicílios em cada setor. Com auxílio da lista de endereços, a seleção é toda automática. Para a aplicação na rua basta usar os mapas de cada setor censitário (disponíveis). Basta o entrevistador de campo olhar esses mapas sobrepostos ao google mapas.<br>
<br>
Comentário:<br>
Pelo que se vê, os institutos eleitorais usam probabilidade "alta" de seleção de municípios e "baixa" de pessoas nos municípios. Por exemplo,<br>
5 mil entrevistados em 500 municípios. Os planos de amostragem complexa me parecem sugerir coisa diferente...<br>
<br>
Abs,<br>
Elias.<br>
<br>
On 07/10/14 03:48, Carlos Alberto de Bragança Pereira wrote:<br>
><br>
> Prezados companheiros de rede:<br>
><br>
> Peço inicialmente desculpas por esta minha mensagem. Principalmente<br>
> pelo tamanho.<br>
><br>
> Eu vejo o problema de uma forma muito diferente dos colegas.  É claro<br>
> que todos que vão ao mercado das pesquisas querem fazer o melhor mesmo<br>
> que estejam equivocados na melhor forma de coletar uma amostra.  Assim<br>
> vou considerar alguns pontos que acho relevantes, pois vejo que os<br>
> colegas, sem terem ido a luta das pesquisas ficam argumentando sobre<br>
> erros de coleta.  Só podemos contestar resultados no momento que<br>
> dermos nossas caras para bater e realisarmos uma pesquisa por nossa<br>
> própria conta e obtermos melhores resultados do que os institutos de<br>
> pesquisa.  Se não temos recursos para fazer isso, podemos submeter um<br>
> projeto aos nossos institutos de apoio, como CNPq, CAPES, FAPESP etc.<br>
> Façamos isso como fizemos tempos atrás na eleição do Covas em segundo<br>
> turno aqui em São Paulo.  Fomos financiados pela FAPESP. Posso dizer<br>
> aos colegas que tivemos sim muito sucesso, entretanto como nossas<br>
> previsões ficavam muito fora do que se publicava só pudemos falar de<br>
> nosso trabalho após a eleição, quando já não havia interesse e ninguém<br>
> iria acreditar nos nossos acertos.  Não era eu, nem o Sérgio, quem<br>
> dirigia o processo administrativo da pesquisa.  Claro que posso um dia<br>
> contar a vocês o que fizemos se minha memória ainda estiver em<br>
> condições.  Mas devo dizer que a chance de errarmos era também muito<br>
> grande.<br>
><br>
> O risco de um erro de previsão em uma eleição com 150 milhões de<br>
> eleitores prováveis (111 milhões votaram efetivamente) será tão grande<br>
> quão pequeno for o tamanho da amostra.  O Instituto Data Folha só<br>
> conseguiu fazer uma amostragem com 20 mil eleitores na pesquisa de<br>
> boca de urna porque nas outras foram no máximo de 9 mil perto das<br>
> eleições e menos de 5 mil nas anteriores.  Não há dinheiro que aguente<br>
> uma amostra considerando os 5 mil municípios brasileiros. Perdoem-me<br>
> os “teóricos”, mas uma boa amostra teria de considerar vários aspectos<br>
> como rural e urbano, estados, municípios, condição sócio econômica,<br>
> qualidade de vida etc. Se colocarem a necessidade de medir<br>
> variabilidade em cada ponto, só ai daria uma amostra impossível para<br>
> nós.  O ruim das cotas é que se faz otimização marginal, pois não<br>
> iriam conseguir uma amostra contemplando a otimização global com todas<br>
> as interações possíveis.<br>
><br>
> Falemos agora sobre a amostra completamente aleatória (levando-se em<br>
> conta agrupamentos etc.).  Vamos pensar em uma grande urna com bolas<br>
> coloridas, a população de interesse. Construir uma amostra é dividir<br>
> essa grande urna em duas urnas, a amostra e a não amostra.  Olhamos a<br>
> amostra e queremos predizer o que está na não amostra.  Usar a<br>
> probabilidade de seleção como a distribuição de seleção para fazer a<br>
> predição estatística é um erro do ponto de vista da teoria de<br>
> verossimilhança.  Pode-se mudar toda a composição da não amostra que a<br>
> distribuição de seleção é a mesma.  Isto é verossimilhança FLAT!  Quer<br>
> dizer que a verossimilhança é não informativa com relação a composição<br>
> do parâmetro de interesse; a composição da não amostra.  É evidente<br>
> que se a amostra for bem grande a chance de obtermos na amostra uma<br>
> composição semelhante a não amostra aumenta, mas não é garantido meus<br>
> caros amigos.<br>
><br>
> A solução adequada em minha opinião seria lembrarmos-nos do teorema da<br>
> permutabilidade de DeFinetti e ai sim pensarmos em nossas informações<br>
> subjetivas obtidas das eleições anteriores e do conhecimento que<br>
> teríamos sobre as características das subpopulações dentro dos<br>
> subgrupos obtidos da otimização global. Não vou me alongar, pois os<br>
> detalhes são muitos para discutirmos num ambiente como o da rede.<br>
><br>
> Termino com uma provocação grande aos meus queridos amigos<br>
> randomizeiros.  Se a mostra obtida de alguma forma é um possível<br>
> resultado de seleção, qual o problema de usar a estatística comum para<br>
> fazer as predições?  Chacoalhar a urna e obter o mesmo resultado salva<br>
> a amostragem?  Então não falo em cotas no relatório, pois ninguém<br>
> consegue provar que não randomizei.<br>
><br>
> Tenho dito!!!!!!!!<br>
><br>
> Saudações indutivas e subjetivistas<br>
><br>
> Carlinhos<br>
><br>
><br>
><br>
<br>
<br>
_______________________________________________<br>
abe mailing list<br>
<a href="mailto:abe@lists.ime.usp.br">abe@lists.ime.usp.br</a><br>
<a href="https://lists.ime.usp.br/mailman/listinfo/abe" target="_blank">https://lists.ime.usp.br/mailman/listinfo/abe</a><br>
_______________________________________________<br>
abe mailing list<br>
<a href="mailto:abe@lists.ime.usp.br">abe@lists.ime.usp.br</a><br>
<a href="https://lists.ime.usp.br/mailman/listinfo/abe" target="_blank">https://lists.ime.usp.br/mailman/listinfo/abe</a><br>
</blockquote></div><br></div>