<div dir="ltr"><div class="gmail_default" style="font-family:verdana,sans-serif">Alexandre,</div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif">Você identificou um caso interessante de pesquisa que utilizou uma amostra de voluntários (os que se dispõem a preencher o questionário), embora extraída de um cadastro supostamente bom, e com um tamanho grande.</div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif">Dei uma rápida olhada no relatório metodológico da pesquisa, e os autores usaram métodos bem conhecidos da amostragem (calibração por totais marginais conhecidos) para adicionar pesos aos dados da amostra de voluntários. infelizmente, não é possível supor que apenas com base nesse procedimento teriam neutralizado possíveis vieses de seleção da amostra disponível.</div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif">Acho que um artigo relevante para entender os riscos de inferência com o tipo de amostra disponível é o artigo de Meng (2018) cuja referência completa vai abaixo. Os argumentos dele se aplicam a seletividade num registro administrativo ou arquivo de big data, mas podem ser aplicáveis também a uma 'grande amostra' obtida por mecanismo de participação voluntária. O indicador crucial seria estimar o 'índice de defeito dos dados' proposto pelo autor, baseado numa medida da correlação entre o indicador de pertinência a essa amostra, e uma ou mais variáveis de interesse da pesquisa, tais como a renda per capita do estudante ou do seu domicílio.</div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif">De fato, tem havido um número de referências na literatura tentando resolver como fazer inferência adequada a partir de amostras não probabilísticas - até onde eu sei, os métodos usados no artigo em questão não estão amparados por essa literatura recente.</div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif">Pode ser que seja viável aplicar métodos alternativos de inferência aos dados em questão, mas isso seria um trabalho de pesquisa interessante que talvez motive algum time de pesquisadores.</div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif">Att, Pedro.</div><div class="gmail_default" style="font-family:verdana,sans-serif"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif">MENG, Xiao Li. Statistical paradises and paradoxes in big data (I): Law of large populations, big data paradox, and the 2016 us presidential election. Annals of Applied Statistics v. 12, n. 2, p. 685–726 , 2018.<br></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">Em qua, 5 de jun de 2019 às 17:39, Alexandre Galvão Patriota <<a href="mailto:patriota.alexandre@gmail.com">patriota.alexandre@gmail.com</a>> escreveu:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr"><div>Prezados,</div><div><br></div><div>Foi divulgada a V Pesquisa Nacional de Perfil Socioeconômico e Cultural dos (as) Graduandos (as) das IFES (veja relatório de 162 páginas: <a href="http://www.andifes.org.br/wp-content/uploads/2019/05/V-Pesquisa-do-Perfil-Socioecon%C3%B4mico-dos-Estudantes-de-Gradua%C3%A7%C3%A3o-das-Universidades-Federais-1.pdf" target="_blank">http://www.andifes.org.br/wp-content/uploads/2019/05/V-Pesquisa-do-Perfil-Socioecon%C3%B4mico-dos-Estudantes-de-Gradua%C3%A7%C3%A3o-das-Universidades-Federais-1.pdf</a>).</div><div><br></div><div>A amostra foi composta por alunos que preencheram um questionário eletrônico. As universidades ajudaram na divulgação da pesquisa.<br><br>Encontrei na internet várias entidades convocando alunos bolsistas a responderem para manter programas assistenciais. A que mais me chamou atenção foi a seguinte:<br><br><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">Por esta razão, além de concorrer a um prêmio, os estudantes da UFRR 
devem sentir-se motivados a responder a pesquisa para garantir a 
continuidade do Programa Nacional de Assistência Estudantil (Pnaes), o 
qual proporciona aos discentes em situação de vulnerabilidade econômica a
 assistência necessária para garantir a permanência no Ensino Superior. (<a href="http://www.jornalroraimahoje.com.br/index.php/geral/educacao/5306-ufrr-estimula-academicos-a-participarem-da-v-pesquisa-de-perfil-dos-graduandos-das-ifes-2018" target="_blank">http://www.jornalroraimahoje.com.br/index.php/geral/educacao/5306-ufrr-estimula-academicos-a-participarem-da-v-pesquisa-de-perfil-dos-graduandos-das-ifes-2018</a>)</blockquote></div><div><br></div><div>Um pequeno apanhado das divulgações estão anexadas. Um video que me chamou atenção foi a mensagem da pró-reitora para Assuntos Estudantis, professora Ana Cabral, em que ela motiva o aluno para: "garantir inclusive a manutenção das bolsas de assistência estudantis" (<a href="https://www.youtube.com/watch?v=2t9fysLzGrY" target="_blank">https://www.youtube.com/watch?v=2t9fysLzGrY</a>)</div><div><br></div><div>Essas e outras divulgações podem ter estimulado um tipo de aluno a responder a pesquisa: os bolsistas ou pretendentes a bolsistas e estudantes que participam (ou pretendem participar) de programas estudantis.<br></div><div><br></div><div>Eu fiz um pequeno texto comentando como o viés de seleção pode influenciar os resultados inferenciais (<a href="https://medium.com/@agpatriota/efeitos-do-vi%C3%A9s-de-sele%C3%A7%C3%A3o-amostral-um-estudo-de-caso-ea6721b6a4cd" target="_blank">https://medium.com/@agpatriota/efeitos-do-vi%C3%A9s-de-sele%C3%A7%C3%A3o-amostral-um-estudo-de-caso-ea6721b6a4cd</a>). Esse texto pode ajudar os alunos de inferência a compreenderem como o viés de seleção amostral influencia nas inferências. <br></div><div><br></div><div>Uma solução: fazer uma pesquisa censitária na qual as universidades obrigariam os alunos a responderem os questionários no período de matrícula. Assim se evitaria os efeitos de divulgações inadequadas. Veja quantos alunos responderam a pesquisa por instituição na figura anexada (Alunos-por-instituicao.png)<br><div><br></div></div><div><br></div><div>Abraços,</div><div><br><div dir="ltr" class="gmail-m_4931467644071123825gmail_signature"><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr">Prof. Dr. Alexandre G. Patriota,<br>Department of Statistics,<br>Institute of Mathematics and Statistics,<br>University of São Paulo, Brazil.</div><div dir="ltr"><a href="https://twitter.com/agpatriota" target="_blank">@agpatriota</a><br></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div>
_______________________________________________<br>
abe mailing list<br>
<a href="mailto:abe@lists.ime.usp.br" target="_blank">abe@lists.ime.usp.br</a><br>
<a href="https://lists.ime.usp.br/listinfo/abe" rel="noreferrer" target="_blank">https://lists.ime.usp.br/listinfo/abe</a><br>
</blockquote></div><br clear="all"><div><br></div>-- <br><div dir="ltr" class="gmail_signature"><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><font face="verdana, sans-serif">Pedro Luis do Nascimento Silva</font><div><font face="verdana, sans-serif">IBGE - Escola Nacional de Ciências Estatísticas</font></div><div><font face="verdana, sans-serif">IBGE - National School of Statistical Sciences<br>Phone: +55 21 21424957</font></div></div></div></div></div></div></div></div></div>