<div dir="ltr"><div class="gmail_default" style="color:rgb(0,0,0)">Essa foi boa. </div><div class="gmail_default" style="color:rgb(0,0,0)">Zabala </div></div><div class="gmail_extra"> <div class="gmail_quote">Em 7 de outubro de 2014 11:29, Luiz Sergio Vaz <<a href="mailto:luizvaz@sarah.br" target="_blank">luizvaz@sarah.br</a>> escreveu: <blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Hoje é dia 07/10, mas pela margem de erro do ibope de 2 pp, Feliz Natal ! -----Mensagem original----- De: abe [mailto:<a href="mailto:abe-bounces@lists.ime.usp.br">abe-bounces@lists.ime.usp.br</a>] Em nome de Elias T. Krainski Enviada em: terça-feira, 7 de outubro de 2014 10:42 Para: <a href="mailto:abe@lists.ime.usp.br">abe@lists.ime.usp.br</a> Assunto: Re: [ABE-L] pesquisas eleitorais: Qual o problema? Prezado professor Carlos, Infelizmente eu não entendi alguns detalhes, por exemplo, da "verossimilhança FLAT". Mas isso é discussão não para esta lista... Gostaria de colocar três pontos. 1) usar informações disponíveis para simular pesquisas no computador. 2) necessidade de considerar todas as variáveis dos indivíduos. 3) viabilidade de um plano amostral econômico. 1) usar informações disponíveis para simular pesquisas no computador. Quanto à fazer pesquisa de campo usando métodos estatísticos, além de dinheiro, precisaria um grupo interessado. Uma alternativa é que talvez possamos simular essas coisas no computador. O IBGE divulgou a lista de endereços nos quais realizou o censo 2010. São 78 milhões de endereços. Uma amostra completamente aleatória é inviável na prática, mas é viável em computador. Que tal pensar um plano prático, considerando toda a informação disponível, isto é, lista de endereços, informações de cada setor censitário e dados dos orgãos eleitorais. Que tal propor um plano amostral com base nessas informações considerando localização, condição sócio economico demográfica, teoria de amostragem, minimização de custo, entre outras... 2) necessidade de considerar todas as variáveis dos indivíduos. Mas pensar em tudo isso é necessário? Na minha humilde opinão acho que não. Exemplo: Um professor deseja estimar a proporção de alunos que assistiram ao último debate dos candidatos a presidente. Há 24 mulheres e 36 homens na turma. O professor resolveu selecionar 4 mulheres e 6 homens, sem considerar a faixa etária (que varia muito nessa turma). O procedimento de seleção foi: Na ele lança um dado. O número que sair e' acrescido dos números 0, 6, 12, 18 para mulheres e 0, 6, ..., 30 para homens. Ele considerará a posição dos alunos sentados na sala, numerando as mulheres de 1 a 24 e os homens de 1 a 36; e entrevistará o aluno correspondente à numeração definida pelo lançamento do dado. O ponto principal é que o efeito de faixa etária é "integrado" pela randomização. O efeito de sexo também poderia ser, recorrendo-se à amostragem aleatória simples considerando a população como um único grupo. Ou seja, a palavra chave é randomização. 3) viabilidade de um plano amostral economico. O fato de não ser possível amostragem aleatória simples pode fazer parecer difícil fazer um plano amostral econômico. Mas realmente não é tão difícil assim! Concordo que seja trabalhoso, como é mais trabalhoso estratificar os alunos por gênero. Há planos amostrais complexos em dois ou três estágios que podem ser factíveis. Exemplo: Seleciona-se m municípios. Seleciona-se s_j setores em cada município. Seleciona-se os domicílios d_ji. Considerando 2010, temos o numero de domicílios em cada setor. Com auxílio da lista de endereços, a seleção é toda automática. Para a aplicação na rua basta usar os mapas de cada setor censitário (disponíveis). Basta o entrevistador de campo olhar esses mapas sobrepostos ao google mapas. Comentário: Pelo que se vê, os institutos eleitorais usam probabilidade "alta" de seleção de municípios e "baixa" de pessoas nos municípios. Por exemplo, 5 mil entrevistados em 500 municípios. Os planos de amostragem complexa me parecem sugerir coisa diferente... Abs, Elias. On 07/10/14 03:48, Carlos Alberto de Bragança Pereira wrote: > > Prezados companheiros de rede: > > Peço inicialmente desculpas por esta minha mensagem. Principalmente > pelo tamanho. > > Eu vejo o problema de uma forma muito diferente dos colegas. É claro > que todos que vão ao mercado das pesquisas querem fazer o melhor mesmo > que estejam equivocados na melhor forma de coletar uma amostra. Assim > vou considerar alguns pontos que acho relevantes, pois vejo que os > colegas, sem terem ido a luta das pesquisas ficam argumentando sobre > erros de coleta. Só podemos contestar resultados no momento que > dermos nossas caras para bater e realisarmos uma pesquisa por nossa > própria conta e obtermos melhores resultados do que os institutos de > pesquisa. Se não temos recursos para fazer isso, podemos submeter um > projeto aos nossos institutos de apoio, como CNPq, CAPES, FAPESP etc. > Façamos isso como fizemos tempos atrás na eleição do Covas em segundo > turno aqui em São Paulo. Fomos financiados pela FAPESP. Posso dizer > aos colegas que tivemos sim muito sucesso, entretanto como nossas > previsões ficavam muito fora do que se publicava só pudemos falar de > nosso trabalho após a eleição, quando já não havia interesse e ninguém > iria acreditar nos nossos acertos. Não era eu, nem o Sérgio, quem > dirigia o processo administrativo da pesquisa. Claro que posso um dia > contar a vocês o que fizemos se minha memória ainda estiver em > condições. Mas devo dizer que a chance de errarmos era também muito > grande. > > O risco de um erro de previsão em uma eleição com 150 milhões de > eleitores prováveis (111 milhões votaram efetivamente) será tão grande > quão pequeno for o tamanho da amostra. O Instituto Data Folha só > conseguiu fazer uma amostragem com 20 mil eleitores na pesquisa de > boca de urna porque nas outras foram no máximo de 9 mil perto das > eleições e menos de 5 mil nas anteriores. Não há dinheiro que aguente > uma amostra considerando os 5 mil municípios brasileiros. Perdoem-me > os “teóricos”, mas uma boa amostra teria de considerar vários aspectos > como rural e urbano, estados, municípios, condição sócio econômica, > qualidade de vida etc. Se colocarem a necessidade de medir > variabilidade em cada ponto, só ai daria uma amostra impossível para > nós. O ruim das cotas é que se faz otimização marginal, pois não > iriam conseguir uma amostra contemplando a otimização global com todas > as interações possíveis. > > Falemos agora sobre a amostra completamente aleatória (levando-se em > conta agrupamentos etc.). Vamos pensar em uma grande urna com bolas > coloridas, a população de interesse. Construir uma amostra é dividir > essa grande urna em duas urnas, a amostra e a não amostra. Olhamos a > amostra e queremos predizer o que está na não amostra. Usar a > probabilidade de seleção como a distribuição de seleção para fazer a > predição estatística é um erro do ponto de vista da teoria de > verossimilhança. Pode-se mudar toda a composição da não amostra que a > distribuição de seleção é a mesma. Isto é verossimilhança FLAT! Quer > dizer que a verossimilhança é não informativa com relação a composição > do parâmetro de interesse; a composição da não amostra. É evidente > que se a amostra for bem grande a chance de obtermos na amostra uma > composição semelhante a não amostra aumenta, mas não é garantido meus > caros amigos. > > A solução adequada em minha opinião seria lembrarmos-nos do teorema da > permutabilidade de DeFinetti e ai sim pensarmos em nossas informações > subjetivas obtidas das eleições anteriores e do conhecimento que > teríamos sobre as características das subpopulações dentro dos > subgrupos obtidos da otimização global. Não vou me alongar, pois os > detalhes são muitos para discutirmos num ambiente como o da rede. > > Termino com uma provocação grande aos meus queridos amigos > randomizeiros. Se a mostra obtida de alguma forma é um possível > resultado de seleção, qual o problema de usar a estatística comum para > fazer as predições? Chacoalhar a urna e obter o mesmo resultado salva > a amostragem? Então não falo em cotas no relatório, pois ninguém > consegue provar que não randomizei. > > Tenho dito!!!!!!!! > > Saudações indutivas e subjetivistas > > Carlinhos > > > _______________________________________________ abe mailing list <a href="mailto:abe@lists.ime.usp.br">abe@lists.ime.usp.br</a> <a href="https://lists.ime.usp.br/mailman/listinfo/abe" target="_blank">https://lists.ime.usp.br/mailman/listinfo/abe</a> _______________________________________________ abe mailing list <a href="mailto:abe@lists.ime.usp.br">abe@lists.ime.usp.br</a> <a href="https://lists.ime.usp.br/mailman/listinfo/abe" target="_blank">https://lists.ime.usp.br/mailman/listinfo/abe</a> </blockquote></div> </div>