[ABE-L] Carta aberta ao Ministério da Saúde - DEST/UFMG

'Elias T. Krainski' via abe-l@ime.usp.br abe-l em ime.usp.br
Seg Jun 8 11:59:24 -03 2020


Olá a todos, 

Dados.... dados... 

Quem se aventurou a elaborar scripts com os dados do COVID 19 já passou por várias pequenas dores de cabeça. Desde quando o MS não divulgava as planilhas com totais diários. Houve quem criou script para capturar dados de arquivos em formato PDF, que enfrentava problemas ao alterarem o formato... Depois o MS passou a divulgar as séries temporais de cada estado e para o Brasil. Mas quase a cada dia mudava o nome e formato das colunas. Há mais de um mês houve nova alteração, para muito melhor: incluiu municípios, recuperados, etc. Durante as últimas semanas (por mais de um mês) teve consistência (embora com nomes errados de uma ou duas colunas facilmente perceptível). 

A alteração ocorrida no último final de semana foi significativa para quem tem script que depende dessa planilha. Parece que foi o que ocorreu com os dados coletados pela Johns Hopkins, que ficou 2 dias (pelo que consegui perceber) sem totalizar dados. Mas não removeu o Brasil de sua base. Tenho script que depende dessa base e não quebrou, apenas ficou sem a informação atualizada. Felizmente, há pelo menos duas outras bases (criada por programadores brasileiros) de onde é possível obter a informação (só tive que incluir isso no meu script). Hoje o Brasil já aparece novamente no ranking gerado automaticamente lá no dashboard do pessoal da John Hopkins: concertaram o script deles! 

Problemas com bases de dados nós "damos um jeito". O problema maior são os que causam "descontinuidade" nas séries, como visto nos dados da China, França e Espanha, por exemplo. Entendo isso como problemas 'naturais' por enfrentamento de um problema novo adicionado aos correntes. O tamanho do sistema de saúde do Brasil aguentou até agora e não vimos esse tipo de coisa. Isso alguma coisa se levarmos em conta que gastamos cerca de 4x menos que média dos países da OCDE (ou aproximadamente 11x menos que os EUA, o "outlier"). 

Uso dados públicos para diversos fins, incluindo aulas práticas de GLM com microdados de PNADs e DATASUS. Aliás, o DATASUS tem sistemas robustos para publicação de dados (microdados e dados agregados) de forma sistemática e automatizada a décadas. Espero que a tal melhora anunciada no formato de divulgação dos dados aproveite essa experiência.

Elias T. Krainski 

    Em segunda-feira, 8 de junho de 2020 09:50:52 GMT-3, glaura em est.ufmg.br <glaura em est.ufmg.br> escreveu:  
 
 Caros redistas,
O Departamento de Estatística da UFMG elaborou o documento em anexo, ao Ministério da Saúde, a respeito das constantes mudanças na formatação e divulgação dos dados da COVID-19.
Atenciosamente,Glaura FrancoChefe do Departamento de Estatística da UFMG_______________________________________________
abe mailing list
abe em lists.ime.usp.br
https://lists.ime.usp.br/listinfo/abe
  
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <https://lists.ime.usp.br/archives/abe/attachments/20200608/47b5eed7/attachment.html>


Mais detalhes sobre a lista de discussão abe