[ABE-L] Fw: Causalidade X Correlacao

Marcus Nunes marcus.nunes em gmail.com
Sex Mar 5 10:22:37 -03 2021


Já que estamos falando de correlações espúrias, recomendo dar uma olhada no
pacote datasauRus do R. Pra quem manja do assunto, é como o quarteto de
Anscombe, mas com muito mais exemplos esdrúxulos. Todas as imagens abaixo
possuem eixos x e y com o mesmo valor para a correlação amostral:

[image: datasauRusPlot-1.png]

Um ano e meio atrás escrevi um post no meu blog mostrando como podemos usar
esse conjunto de dados em aula, para mostrar para os alunos como é
importante fazer uma análise exploratória gráfica em nossas análises:
https://marcusnunes.me/posts/correlacoes-e-graficos-de-dispersao/
--
Marcus Nunes
Professor Adjunto
https://marcusnunes.me/
Universidade Federal do Rio Grande do Norte
Departamento de Estatística
Laboratório de Estatística Aplicada - http://lea.estatistica.ccet.ufrn.br
Curso de Big Data - https://introbigdata.org
Aplicações em Shiny - http://shiny.estatistica.ccet.ufrn.br


On Fri, Mar 5, 2021 at 10:11 AM Basilio de Bragança Pereira <
basilio em hucff.ufrj.br> wrote:

> Sobre assunto correlato sugiro olhar na Wikipédia os dados e gráficos de
> Anscombe ‘s quartet
>
> Enviado do meu iPhone
>
> Em 5 de mar de 2021, à(s) 10:01, Julio Stern <jmstern em hotmail.com>
> escreveu:
>
>
>
> Caros Redistas
>
> Conversando com colegas de outras areas sobre a diferenca entre
> Causalidade e Correlacao, principalmente no contexto de vacinas,
> tratamentos medicos para Covid, etc. acabei conhecendo o livro:
>
>
> >>>  Tyler Vigen (2015).  Spurious Correlations.  Hachette Books.
>
>
> que tem gráficos fantasticos, com series temporais totalmente desconexas
> que exibem altíssima correlacao.
>
> Nao tenho o livro, mas alguns graficos podem ser vistos em
>
>
> >>> https://www.tylervigen.com/spurious-correlations
>
> >>> https://tylervigen.com/discover
>
>
>
> Comecei a fazer umas continhas rapidas sobre a probabilidade,  p , de
> obter, em duas series temporais, x(t) e y(t) , com dez pontos de
> abscissa  t={1,2, ... 10}  e ordenada no intervalo  [0,1] , uma alta
> correlação, i.e.,
>
>
> p = Pr ( corr ( x(t) , y(t) )  >=  (1-alpha) ) , para  alpha= 0.1  ou
> 0.05  ou  0.01
>
>
> Assumindo nao haver estrutura alguma nas series  x(t)  e  y(t) , o
> resultado eh muito baixo.
>
> Mesmo considerando uma enorme biblioteca de graficos aleatorios, nao da...
>
>
>
> Parece ser necessario assumir "a priori" a existência de alguma "estrutura
> intrinseca de associacao" entre os pontos de cada uma das series temporais,
> por exemplo, alguma estrutura de auto-correlacao.
>
>
> Antes de sair por ai tentando reinventar a roda, melhor perguntar a quem
> sabe...
>
> Alguem ja deve ter pensado neste problema!  Alguma ideia de como
> modela-lo?
>
>
> Abraco a todos e tudo de bom,
>
> ---Julio Stern
>
>
>
> _______________________________________________
> abe mailing list
> abe em lists.ime.usp.br
> https://lists.ime.usp.br/listinfo/abe
>
> _______________________________________________
> abe mailing list
> abe em lists.ime.usp.br
> https://lists.ime.usp.br/listinfo/abe
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://lists.ime.usp.br/pipermail/abe/attachments/20210305/7ca2ae9e/attachment-0001.htm>
-------------- Próxima Parte ----------
Um anexo não-texto foi limpo...
Nome: datasauRusPlot-1.png
Tipo: image/png
Tamanho: 213006 bytes
Descrição: não disponível
URL: <http://lists.ime.usp.br/pipermail/abe/attachments/20210305/7ca2ae9e/attachment-0001.png>


More information about the abe mailing list