[ABE-L] Pesquisas de intenção de voto: Minhas reflexões
Julio Trecenti
julio.trecenti em gmail.com
Seg Out 8 12:48:28 -03 2018
Caros,
Fico feliz que o tema tenha aparecido aqui. Fico grato (como sempre) ao
mestre Carlinhos por todos os ensinamentos.
Minha opinião é a seguinte
Depois das eleições, todo mundo vai comparar o resultado das pesquisas de
06/10 com as proporções de votos e perguntar para nós "por que deu errado"?
Minha sugestão de resposta é:
Por favor, não façam isso acriticamente. Não é assim que se avalia a
qualidade de pesquisas eleitorais. Dois links podem que ajudar nesse
sentido:
1. Por quê essa comparação é equivocada?
https://www.curso-r.com/blog/2018-08-31-eleitorais/
2. Então como faz pra detectar problemas?
A partir do viés sistemático de institutos contra outros institutos.
https://www.jota.info/dados/agregador-de-pesquisas/house-effects-institutos-pesquisas-19092018
Obrigado
Abs
On Mon, Oct 8, 2018, 12:43 Alfredo Salgado <fred20br em hotmail.com> wrote:
> Para mim o maior problema é que as pesquisas não consideram a intenção de
> voto, no geral, uma das perguntas que sinto falta em algumas pesquisas é a
> ausencia da pergunta sobre a intenção de votar. Muito declaram "votar" em
> candidato A ou B, mas sequer irão votar no dia e já sabem com antecedência
> disso. Com abstenções em 20% isso influencia muito.
>
>
> ------------------------------
> *De:* abe <abe-bounces em lists.ime.usp.br> em nome de cpereira em ime.usp.br <
> cpereira em ime.usp.br>
> *Enviado:* segunda-feira, 8 de outubro de 2018 12:30
> *Para:* abe-l em ime.usp.br; g-mae em ime.usp.br; g-mat em ime.usp.br;
> g-map em ime.usp.br; g-mac em ime.usp.br; rbras em googlegroups.com;
> Leonardo_Nakau em yahoo.com.br; sw em numberscare.com; neale.eldash em gmail.com;
> jamazzon em usp.br; elen.spreafico em ufms.br; nalvojr em gmail.com;
> pauloguilherme.gc em gmail.com; rubiaoliveira em gmail.com;
> patricia.pereira em ufms.br; mvspreafico em gmail.com
> *Assunto:* [ABE-L] Pesquisas de intenção de voto: Minhas reflexões
>
>
>
>
>
>
>
>
>
>
> *CORAJOSOS FORAM OS MEUS COLEGAS E AMIGOS ESTATíSTICOS QUE REALIZARAM
> PREDIçõES SOBRE OS RESULTADOS DAS ELEIçõES. SEMPRE PENSO QUE PARA TER UM
> COMPROMISSO DE QUALIDADE COM OS ELEITORES O ESTATíSTICO DEVE PARTICIPAR DE
> TODAS AS ETAPAS DA PESQUISA; DA DEFINIçãO DO DESENHO DA AMOSTRAGEM, PARA A
> COLETA DOS DADOS, ATé A ANáLISES ESTATíSTICAS DESSES DADOS. CLARO QUE MEUS
> COLEGAS, QUE CONSIDERO MUITO COMPETENTES, FIZERAM APENAS O ESTUDO DOS
> MéTODOS DE ESTIMAçãO SEM SABER AO CERTO COMO OS DADOS FORAM COLETADOS. NãO
> PODEM SER CULPADOS, EM MINHA OPINIãO, POR TANTOS EQUíVOCOS NAS ESTIMAçõES E
> PREDIçõES.*
>
>
>
>
>
> *CONSTANTEMENTE TENHO SIDO PROCURADO POR JORNALISTAS QUE SEMPRE FAZEM OS
> MESMOS QUESTIONAMENTOS: POR QUE AS PESQUISAS REALIZADAS POR DIFERENTES
> EMPRESAS PRODUZEM ESTIMATIVAS DãO DIFERENTES? QUAL A RAZãO DE TANTOS ERROS
> DE PREDIçãO, NãO Só NOS NúMEROS, MAS TAMBEM NA ORDEM EM QUE OS CANDIDATOS
> APARECEM NA VOTAçãO REAL E NAS AMOSTRAS EM PARTICULAR.*
>
>
>
>
>
>
>
>
> *NA SEQUêNCIA APRESENTO MINHAS RESPOSTAS A UMA DAS JORNALISTAS QUE ME
> ENTREVISTOU. TODOS PEDEM UMA ENTREVISTA ORAL, MAS EU PARA NãO TER MEU
> DISCURSO MODIFICADO, Só ACEITO RESPONDER POR ESCRITO. COMPREENDO QUE é
> DIFíCIL PARA LEIGOS ENTENDER AS ENTRANHAS DE PROCESSOS TãO TéCNICOS. AS
> REFLEXõES QUE AQUI APRESENTO é CONSEQUêNCIA DOS QUESTIONAMENTOS DO MEU
> AMIGO E COLEGA ARNALDO MANDEL. SE VOCê PRETENDE RESPONDER A UM ESTE
> BRILHANTE AMIGO, é MELHOR SE PREPARAR E DAR O MELHOR DE SI.*
>
>
> *“Jornalista”: Como são desenhadas pesquisas de intenção de voto como as
> realizadas por Ibope e Datafolha?*
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
> *PELO QUE OUçO FALAR, AS PESQUISAS USAM AMOSTRAGEM POR QUOTAS.
> PESQUISAM-SE OS NúMEROS DO CENSO E NA AMOSTRA TENTAM REPRODUZIR AS
> PORCENTAGENS COMPOSICIONAIS DE CADA UMA DAS CARACTERíSTICAS CONSIDERADAS
> RELEVANTES PARA A ESCOLHA DO VOTO. ESTA TENTATIVA DE CóPIA COMPOSICIONAL
> DAS VARIáVEIS, DE FORMA INDEPENDENTE ENTRE AS VARIáVEIS, SE DEPENDêNCIAS
> NãO HOUVESSEM ENTRE ESSAS CARACTERíSTICAS, PODERIA SER ADEQUADA. O FATO DE
> USAREM SOMENTE AS FREQUêNCIAS MARGINAIS NãO GARANTE UMA CóPIA AUTêNTICA DA
> COMPOSIçãO POPULACIONAL. VEJA QUE EU ESTOU CONJECTURANDO, POIS ME BASEIO
> AQUI NO QUE OUçO FALAR NAS ENTREVISTAS DOS ESPECIALISTAS. PARA DESCREVER
> BEM O QUE PENSO QUE DEVA SER FEITO, UMA AMOSTRAGEM INTENCIONAL, VAMOS
> IMAGINAR QUATRO CATEGORIAS RELEVANTES: LOCAL DE NASCIMENTO (REGIãO DE
> ORIGEM), CATEGORIA DE IDADES (JOVENS, ADULTOS E IDOSOS), TIPO DE ZONA
> (RURAL E URBANA) E CLASSE ECONôMICA (A, B, C E D). VAMOS TER ASSIM 5
> REGIõES, 3 “IDADES”, 2 ZONAS E 4 CLASSES ECONôMICAS. TERíAMOS ASSIM, PELO
> MENOS, 120 (= 5X3X2X4) CATEGORIAS DIFERENTES FORMANDO A POPULAçãO. COM OS
> DADOS DE NOSSO CENSO POPULACIONAL OBTERíAMOS A PORCENTAGEM DE INDIVíDUOS EM
> CADA UMA DESSAS 120 CLASSIFICAçõES. UMA AMOSTRA QUE PODERIA SER CONSIDERADA
> “BOA” DEVERIA OBEDECER A ESSAS PORCENTAGENS POPULACIONAIS: AMOSTRAL E
> POPULAçãO POSSUIRIAM A MESMA COMPOSIçãO. PARA QUE POSSAMOS AVALIAR A
> VARIABILIDADE DO END-POINT (O VOTO) TERíAMOS DE COLETAR PELO MENOS 30
> INDIVíDUOS NA CATEGORIA MENOS POPULOSA. NOTEM QUE SE TODAS AS CATEGORIAS
> FOSSEM IGUALMENTE POPULOSAS, TERíAMOS NO MíNIMO UMA AMOSTRA DE 120X30 =
> 3600 VOTANTES. É CLARO QUE TERíAMOS QUE COLETAR PROPORCIONALMENTE AS
> AMOSTRAS DE CATEGORIAS MAIS POPULOSAS. NãO SERIA ABSURDO LIMITARMOS TAMBéM
> O TAMANHO MáXIMO DA AMOSTRA DE CADA UMA DAS INúMERAS CATEGORIAS. NãO é
> VIáVEL A EXPLOSãO DO TAMANHO DAS SUBAMOSTRAS NA PESQUISA DE CAMPO! POR
> EXEMPLO, SE A MENOR CATEGORIA TIVESSE 1 MILHãO DE HABITANTES, A CATEGORIA
> COM 5 MILHõES TERIA DE NOS DAR UMA AMOSTRA DE 150 VOTANTES. UMA AMOSTRAGEM
> DESSE TIPO, SEM LIMITAR O TAMANHO MáXIMO, PRATICAMENTE INVIABILIZA QUALQUER
> PESQUISA, EMBORA O MEU IDEAL SERIA NãO LIMITARMOS O TAMANHO MáXIMO. CLARO
> EU Só FALO ISSO PORQUE NãO SOU EU QUEM FINANCIA O TRABALHO EXAUSTIVO DE
> CAMPO. PODEMOS SIM, PERDENDO UM POUCO DE PRECISãO, SUBSTITUIR 30 POR 10,
> MAS MESMO ASSIM A AMOSTRA PODERIA SER MUITO GRANDE. NO ENTANTO SE
> PROCURáSSEMOS RESULTADOS DE ELEIçõES ANTERIORES E COM UMA ANáLISE DE
> AGRUPAMENTO PODERíAMOS CERTAMENTE DIMINUIR O TAMANHO DA AMOSTRA
> CONSIDERANDO-SE AS SUBAMOSTRAS DENTRO DOS CONGLOMERADOS. TALVEZ Já
> ESTEJAMOS CAMINHANDO EM CAMPOS ABSTRATOS E FICARIA DIFíCIL ACOMPANHAR-SE O
> RACIOCíNIO DA REPRESENTATIVIDADE. EM UMA PESQUISA QUE FIZEMOS PELA
> UNIVERSIDADE DE SãO PAULO E APOIO DA FAPESP, ESTáVAMOS PREVENDO OS
> RESULTADOS DA ELEIçãO PARA GOVERNADOR NA éPOCA DO MARIO COVAS. TIVEMOS
> MUITO SUCESSO MESMO TENDO SUBSTITUíDO RIO PRETO POR SANTOS QUE é MUITO MAIS
> PRóXIMO DE SãO PAULO E ESTARIA DENTRO DE NOSSOS LIMITES ORçAMENTáRIOS.
> SANTOS E RIO PRETO ESTAVAM NO MESMO AGRUPAMENTO. OS RESPONSáVEIS PELA
> DIVULGAçãO DE NOSSOS RESULTADOS NãO DESEJARAM COLOCAR NA MíDIA, POIS
> ESTAVAM PENSANDO COMO NãO CONSTRUIR AGLOMERADOS GEOGRáFICOS. QUANDO
> DIVULGAMOS NOSSOS RESULTADOS, Já ERA TARDE, POIS OS NúMEROS DA ELEIçãO Já
> HAVIAM SIDO DIVULGADOS. Há OUTROS EPISóDIOS QUE VALERIAM DIVULGAR: QUANDO
> ESTAMOS FAZENDO O TRABALHO MAIS CIENTíFICO OS RESPONSáVEIS PELA MíDIA NãO
> ACREDITAM EM PESSOAS QUE NãO SãO DO RAMO.*
>
>
> *Quais são os problemas dessa metodologia? Por que uma mesma base de dados
> pode dar resultados diferentes?*
>
>
>
>
>
>
>
> *NOTEMOS QUE COM AS TéCNICAS ATUALMENTE USADAS INSTITUTOS PODERIAM TER
> COMPOSIçõES AMOSTRAIS COMPLETAMENTE DIFERENTES, EMBORA A CóPIA DAS
> MARGINAIS DAS VARIáVEIS FOSSE PERFEITA. VAMOS DAR UM EXEMPLO DO QUE PODE
> ESTAR ACONTECENDO. NOSSA DRAMATIZAçãO CONSIDERA APENAS DUAS
> CARACTERíSTICAS: SEXO E IDADE. AS TRêS TABELAS A SEGUIR APRESENTAM A
> COMPOSIçãO POPULACIONAL E AS COMPOSIçõES AMOSTRAIS DE DOIS INSTITUTOS
> IMAGINáRIOS:*
>
>
>
>
>
> *População Female Male
> TotAge Young 60000
> 30000 90000 Adult 40000
> 70000 100000 TotSex 100000
> 100000 200000*
>
>
>
>
>
> *Intitution 1 Female
> Male TotAge Young 900
> 0 900 Adult 100
> 1000 1100 TotSex 1000
> 1000 2000*
>
>
>
>
>
> *Institution 2 Female
> Male TotAge Young 300
> 600 900 Adult 700
> 400 1100 TotSex 1000
> 1000 2000*
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
> *Mais radical ainda, a amostra de um instituto poderia ser de 10 mulheres
> jovens e 10 homens adultos enquanto em outro instituto a amostra seria
> formada por 10 mulheres adultas e 10 homens jovens. Note que as
> composições marginais das amostras e da população são idênticas. No
> entanto, as composições compostas são completamente diferentes entre as
> três tabelas. Poderão assim produzir resultados, além de muito diferentes,
> opostos. Lembremos que muitos referem-se a amostras representativas, mas
> nunca dizem o que representam. Se soubéssemos que fossem representativas
> dos resultados, então para que a pesquisa, se já sabemos representar os
> resultados das eleições? Se fossem representativas das composições
> populacionais de variáveis, que pensamos ser correlacionadas com os
> resultados das pesquisas, e que fossem publicadas como dados censitários de
> forma composicionais, a representatividade poderia ser admitida. Não é
> isso que acontece, pois, a representatividade, como dissemos acima é só
> marginal.*
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
> *A análise de conglomerados seria melhor? Por que ela não é adotada? Da
> forma que descrevemos as composições, o número de subpopulações poderia ser
> enorme se considerarmos todas as variáveis relevantes para a escolha que o
> eleitor irá fazer. Caso dados censitários fossem descritos não seria
> absurdo uma análise de conglomerado onde as inúmeras subpopulações pudessem
> ser repartidas naquelas mais próximas composicionalmente. Assim teríamos
> conglomerados com populações de subpopulaões a serem selecionadas pela
> amostragem no conglomerado. Após o trabalho estatístico em cada um dos
> conglomerados proceder-se-ia uma composição das posteriores pelos
> conglomerados. A variabilidade seria maior, pois a influência de amostras
> menores iria se manter nesta meta-analise. (Por meta-análise aqui
> entendemos a composição de todas as posteriores nos conglomerados). O
> cálculo das posteriores nos conglomerados supõe variáveis permutáveis no
> sentido de DeFinetti. Este trabalho de cálculo probabilístico está em um
> artigo que escrevemos eu com Tereza e Adriano, arXiv:1810.01537 [pdf].
> Mestre Mandel é o culpado de escrevermos esse artigo.*
>
>
> *O fato de os entrevistadores apresentarem os candidatos ou deixarem em
> aberto (espontâneo) altera os resultados. Por quê?*
>
>
>
>
>
> *A resposta é simples, se nós não lembramos quem são todos os treze
> candidatos da eleição, certamente o eleitor irá esquecer o nome de alguns.
> Se em algum momento um indivíduo gostou do discurso de um candidato pouco
> conhecido, na hora da entrevista pode simplesmente esquecer o nome do
> candidato.*
>
> *O que é a famosa "margem de erro"?*
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
> *Os jornalistas e repórteres falam com tanta propriedade em probabilidade
> e margem de erros que o meu coração palpita. Quando construímos intervalos
> de predição, consideramos os intervalos de menor comprimento de tal forma
> que se pudéssemos repetir o experimento uma série de vezes esperaríamos por
> exemplo que 95% (ou qualquer outra porcentagem) das vezes o verdadeiro
> valor da quantidade que está sendo predita estaria no interior do
> intervalo. Mas com apenas uma amostra o intervalo contém ou não o
> verdadeiro valor daquela quantidade. Assim o argumento vem da pergunta: Por
> que o meu intervalo seria um dos 5%? De fato, “tenho confiança de 95% de
> que o intervalo observado contenha o verdadeiro valor da quantidade
> predita”. Confiança e não probabilidade é o termo correto. Este é apenas
> um dos problemas com o discurso dos jornalistas sobre predições. No caso
> de porcentagem de votos o único número que permite um intervalo simétrico
> em torno dele é 50%. Uma porcentagem de 10% por exemplo, daria uma
> assimetria grande, com o acréscimo a direita sendo muito maior do que o da
> esquerda. Quero aqui aproveitar para dizer que quando usam o termo
> probabilidade e quando usam o mesmo erro para os dois lados com estimativas
> diferentes de 50%, estão certamente dando informações equivocadas aos
> ouvintes e leitores.*
>
> *Na visão do senhor, quanto de subjetividade há em uma pesquisa eleitoral?*
>
>
>
>
>
>
>
>
>
>
>
>
>
>
> *Não há subjetividade, pois, as pessoas se baseiam em dados reais
> coletados. Se usassem subjetividade certamente iriam perceber que os
> tamanhos amostrais usados podem ser os mesmos para populações completamente
> diferentes em abundância. Será que a mágica pode ser tão forte que com 2
> mil entrevistados eu possa falar sobre a opinião de 200 milhões de
> habitantes e falar o mesmo se a população fosse de 200 mil? O pior é que
> não se percebe as injustiças que podem ser cometidas. Um amigo muito
> competente trabalhava para uma empresa de pesquisas e previu que o Brizola
> estaria na frente do Lula por muito pouco, cerca de 100 mil votos.
> Acontece que deu o contrário. Lula teve em torno de 16 milhões e Brizola
> teve 50 mil a menos. Outra empresa, hoje famosíssima, acertou a ordem, mas
> os números foram 20 milhões para o Lula e 15 milhões para o Brizola. A
> segunda foi elogiada e a primeira sofreu muitas críticas. O que acham hoje
> os senhores jornalistas?*
> _______________________________________________
> abe mailing list
> abe em lists.ime.usp.br
> https://lists.ime.usp.br/listinfo/abe
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <https://lists.ime.usp.br/archives/abe/attachments/20181008/703bcf59/attachment.html>
Mais detalhes sobre a lista de discussão abe