[ABE-L] Ciência de Dados

Doris Fontes dsfontes em gmail.com
Seg Out 7 23:58:33 -03 2019


Excelentes colocações do Prof Jorge e do Prof Widemberg.

Acho que a academia não deveria condenar sistematicamente a aplicação da
estatística. Entendo que existam duas coisas distintas: a estatística
aplicada e a aplicação da estatística. No entanto, entidades como a ASA
englobam muito bem essas duas áreas. Aliás, a ASA está metida em tudo que é
possível se meter, inclusive em pareceres estatísticos do governo 9
https://community.amstat.org/governmentstatisticssection/home) e acho que a
ABE poderia ter atitudes parecidas. Ser uma associação mais atuante na
sociedade ajudará muito a divulgar a estatística, sem dúvida. O JSM da ASA
(talvez o equivalente ao SINAPE) costuma reunir mais de 6500 pessoas e há
sessões de tudo quanto é tipo: acadêmico, profissionais, treinamentos para
melhorar a carreira, assuntos de governo, recrutamento para empregos e um
monte de patrocinadores importantes. Um estatístico que foi a um desses
encontros me disse que é uma verdadeira loucura a quantidade de RHs de
empresas que compram estandes lá para fazer RECRUTAMENTO de profissionais
do mundo todo e que circulam pelo congresso (
https://ww2.amstat.org/meetings/jsm/2020/index.cfm).

Lembro-me do Clóvis Peres também relatando as dificuldades que teve no IME
para montar o que hoje é o SEA. Aplicar estatística pareceu sempre um ato
de traição, coisa de menor importância. Mas isso ajuda muito o aluno ganhar
maturidade, experiência, sensibilidade com os dados. Assim como deve ajudar
também o pesquisador/docente a entender o mundo dos dados e garantir que
isso seja passado de forma decente aos alunos.

Nessa discussão sobre a sobrevivência da estatística até como "ciência de
dados", concordo muito com o Prof Jorge: não adianta mudar só o nome se não
tiver também o "mão na massa" adequado.

Como diz o prof Dani, a Estatística quer ser POP, mas tem que ser POP
mesmo, com a ajuda de toda a comunidade acadêmica + profissionais do
mercado.

Doris


Em seg, 7 de out de 2019 às 15:59, Jorge Alberto Achcar <achcar em fmrp.usp.br>
escreveu:

> Eu não deveria me intrometer nessa discussão pois sou aposentado pelo
> ICMC-USP, São Carlos a vários anos e não atuo mais na graduação para
> bacharelados em estatística/matemática e atualmente só colaboro na área de
> estatística em PG para outros departamentos especialmente na área de
> medicina e engenharia apesar de ser pesquisador ativo na área de
> estatística onde sou pesquisador em produtividade em pesquisa na área de
> estatística a mais de 30 anos contínuos. Quando fiz meu doutorado na
> Universidade Wisconsin, Madison, entre 1979 e 1983 (muitos anos atrás) tive
> o prazer de ser aluno do George Box, Bill Hunter (meu orientador de
> doutorado), Brian Joiner (criador do software Minitab) entre outros
> destacados estatísticos. Esses pesquisadores ícones da área de estatística,
> sempre tiveram uma visão de futuro a mais de  meio século enfatizando
> aplicações e abertura da estatística para indústria, área médica, indústria
> farmacêutica, tecnologia, e problemas aplicados de interesse para a
> sociedade. Sem dúvida, isso sempre foi um grande desafio para os
> estatísticos, e isso já era discutido a mais de 40 anos nos melhores
> departamentos de estatística dos EUA, UK e outros. O departamento de
> estatística em Madison sempre foi muito forte na formação teórica dos
> alunos de PhD mas TODOS os alunos eram obrigados a fazer pelo menos uma
> disciplina de consultoria estatística desde o final dos anos 1960 comandado
> pelas ideias brilhantes do G. Box. Além disso, havia as famosas reuniões
> semanais (um seminário chamado beer and statistics) promovidas pelo G. Box
> em sua casa sempre com a participação de pessoas convidadas de outros
> departamentos ou empresas com problemas reais para serem discutidos pelos
> alunos de PG em estatística. Isso forma estatísticos com grande jogo de
> cintura para atuar nas mais diversas áreas, um dos grandes objetivos da
> estatística. Resultado, muitos PhD formados em Madison, foram para empresas
> trabalhar como pesquisadores com dados reais e muitos foram para a vida
> acadêmica, como o meu caso. Além disso, no Brasil (com raras exceções) a
> estatística surgiu e sempre foi considerada como um ramo de matemática (a
> minha graduação foi em matemática). No meu retorno ao Brasil em 1983,
> sempre tive interesse em criar disciplinas de consultoria estatística,
> planejamentos de experimentos industriais, análise de dados e talvez mais
> contato com pesquisadores de outras áreas onde surgem os problemas muitas
> vezes levando a novos modelos estatísticos e boas análises de dados
> publicáveis em boas revistas, mas sempre essas ideias não eram bem
> recebidas pela comunidade acadêmica, pois os departamentos sempre foram
> muito conservadores e muito  resistentes a possíveis aberturas da
> universidade para a sociedade. Em resumo: não adianta criar programas de
> estatística com os mais diversos nomes (por exemplo, cientista de dados) se
> os departamentos não abrirem as portas e aceitar os desafios para
> solucionar problemas nas mais diversas áreas que assume uma formação muito
> sólida dos estatísticos em praticamente todas as subáreas de estatística
> (regressão, planejamentos de experimentos industriais, confiabilidade e
> análise de sobrevivência, analise multivariada, series temporais, modelagem
> de dados categóricos, métodos bayesianos aplicados, estatística
> computacional e assim por diante). Reconheço que dentro da vida acadêmica o
> que conta para cada professor são os artigos em boas revistas, o que leva a
> maioria dos estatísticos ou outros pesquisadores a se especializar em
> alguns temas específicos que levam a publicação continua. Mas isso deveria
> ser mudado, com atesta a opinião dos pesquisadores mais jovens que estão
> preocupados (com razão) sobre o futuro da estatística brasileira.
>
> Jorge A. Achcar
>
>
>
> Em seg, 7 de out de 2019 às 13:29, Widemberg da Silva Nobre <
> widemberg em dme.ufrj.br> escreveu:
>
>> Caros,
>>
>> Apenas para diversificar as idéias e fornecer a visão de um discente de
>> pós-graduação (embora minha visão não tenha qualquer representatividade no
>> meio discente). De antemão, quero deixar claro que minhas visões convergem
>> fortemente para aquelas arguidas pelo Bernardo. Além disso, minha arguição
>> contempla apenas as discussões sobre a reformulação do curso de estatística
>> e a possível, plausível ou necessária migração para o mundo da ciências de
>> dados.
>>
>> Eu sinceramente acredito que o curso de estatística precisa de uma
>> reformulação, e, na minha opinião, essa reformulação passa necessariamente
>> pela indagação:
>> "Quais as habilidades necessárias à resolução de problemas complexos?"
>> Isso me leva a crer que um aluno de graduação precisa entender, no
>> "primeiro dia de aula", o que é um problema complexo e, também, que sua
>> resolução passa pelo aprendizado de disciplinas como Cálculo, Álgebra
>> linear, Probabilidade e Processos estocásticos.
>>
>> Buscar ferramentas que ajudem nesse entendimento é, para mim, a questão
>> primordial, e acho que a maneira "menos difícil" de atingir esse ideal é
>> motivar melhor o aluno. Para esse fim, acho que os cursos de estatística do
>> Brasil poderiam olhar com carinho para os 'conjuntos de dados crus'
>> fornecidos pelo e-Sic (https://esic.cgu.gov.br/sistema/site/index.aspx).
>> Lá podemos conseguir uma diversidade de conjunto de dados enorme e nos
>> diferentes campos nos quais dados públicos são gerados.
>>
>> Acredito que o trato com esses 'dados crus', na primeira metade do curso
>> de estatística, dará ao aluno algumas das habilidades requisitadas por um
>> cientistas de dados (vide o email anterior da Doris). Algo que os dados do
>> R, vastamente utilizados nos cursos de estatística no Brasil e
>> possivelmente no mundo, não fornece (sei que há uma questão didática aqui,
>> mas vou pular isso para não me alongar mais do que já estou me alongando).
>>
>> Acredito que mostrar um problema particular e atual do Brasil pode ajudar
>> a motivar, e demonstrar que a resolução do problema passa pelo aprendizado
>> dessas disciplinas anteriormente citadas. Algo que, penso eu, todos os
>> professores de estatística querem.
>>
>> Como consequência do trabalho com dados públicos do Brasil, creio que
>> teremos mais facilidades em divulgar a Estatística, uma vez que teremos
>> material a oferecer a mídia (Jornais, TV's e etc). Apenas para
>> exemplificar: Como estudante, senti falta de uma nota pública da ABE sobre
>> a reforma da previdência. Somos a comunidade de estatística e não acredito
>> que exista outro profissional mais preparado do que a gente para falar
>> sobre previsões. Quais seriam os benefícios/necessidades da reforma da
>> previdência a curto, médio e longo prazo? e os riscos? a discussão é válida
>> no agregado Brasil (olhar todos os estados conjuntamente)? começar a
>> discussão através de um processo amostral em dois estágios não seria o mais
>> ideal? enfim, apenas questões que, se tivéssemos discutido num período
>> anterior, poderiam ser externadas com mais facilidades para o grande
>> público.
>>
>> Aqui, busco englobar um recém formado em estatística, que está tentando
>> falar sobre a reforma da previdência para a família em um almoço de
>> domingo. Penso que há a necessidade de formar estatísticos aptos a fornecer
>> informações técnicas, sem o uso de termos do cotidiano estatístico, mesmo
>> que em ambientes de reunião de familiares e se fazer entendível. Creio que
>> o uso de dados públicos facilitaria a participação de estatísticos nesse
>> tipo de discussão que é rotineira do cotidiano social. Eu mesmo tenho
>> dificuldades de me expressar em vários momentos de reunião com meus
>> familiares e fornecer algo técnico e entendível para eles. Creio, ou
>> espero, que não seja o único.
>>
>> Também acho que precisamos, em nome da comunidade ABE, apresentar esse
>> tipo informação a sociedade via meios de comunicação como jornais,
>> revistas, rádio, TV's  e etc. Ao meu ver, discussões como essa, ajudaria a
>> fazer a estatística mais conhecida. Acho que aqui vale um adendo, nessas
>> discussões não devemos ter partido, nosso dever seria apenas divulgar
>> possíveis cenários futuros/correntes (talvez ordenados pela chance,
>> enfim...).
>>
>> Por fim, embora não consiga me expressar bem, creio que a questão maior
>> que move essa discussão Estatística x Ciências de dados é "o ser mais
>> atraente" e como sugerido pelo David Spiegelhalter no SINAPE de 2016, isso
>> passa por "saber ser atraente".
>>
>> Abs,
>> Widemberg
>>
>> Em dom, 6 de out de 2019 às 20:02, Doris Fontes <dsfontes em gmail.com>
>> escreveu:
>>
>>> Para entender um pouco do que acontece em alguns lugares, esses são os
>>> requisitos para um cargo de CIENTISTA DE DADOS numa empresa em Londres:
>>>
>>> [image: image.png]
>>>
>>>
>>>
>>> Doris
>>>
>>>
>>>
>>>
>>>
>>> Em sex, 4 de out de 2019 às 23:48, Bernardo B. Andrade <bbandrade em unb.br>
>>> escreveu:
>>>
>>>> Caros,
>>>>
>>>> Vou pegar embalo na mensagem mais recente do professor Pedro.
>>>>
>>>> Primeiramente sinto falta de uma definição (e escopo) para Ciência de
>>>> Dados... para fins desse texto vou definir:
>>>>
>>>> - Soft DS: fundamentos de bancos de dados, computação em paralelo,
>>>> visualização, text mining, web mining, BI.
>>>> - Hard DS: análise de complexidade (de algoritmos), otimização
>>>> numérica,
>>>> modelagem de dados superdimensionados, álgebra linear computacional, ML.
>>>>
>>>> (Digressão: Infelizmente muita gente (alunos em particular) adora o
>>>> soft
>>>> DS... na hora do hard DS pede pra voltar pra estatística... rsrs)
>>>>
>>>> Discordo do Wickman e do tom apocalíptico de muitas discussões sobre CD
>>>> e estatística. Nâo perdemos bonde algum. A Estatística é uma área
>>>> fértil
>>>> a qual, juntamente com as engenharias, matemática aplicada e
>>>> computação,
>>>> pariu essa criança mimada e hiperativa chamada "ciência de dados". Essa
>>>> criança vai amadurecer (está amadurecendo) e nesse processo a formação
>>>> de recursos humanos sofrerá mudanças.
>>>>
>>>> Na academia, as mudanças vão ocorrer naturalmente à medida que os
>>>> jovens
>>>> pesquisadores (ansiosos por mudanças) forem publicando em bons
>>>> periódicos de engenharias, matemática aplicada e computação (além de
>>>> estatística, obviamente), à medida que criarem grupos de pesquisa
>>>> fortes, produzirem patentes, projetos com grandes empresas, etc. A
>>>> verdadeira reforma se dá não por decreto ou mobilizações durante o
>>>> SINAPE mas por força da nossa produção.
>>>>
>>>> No mundo corporativo as mudanças ocorrem mais rápido e nem sempre
>>>> existe
>>>> um match perfeito entre o profissional (analista de dados) e o egresso
>>>> da universidade, seja ele um estatístico, engenheiro ou economista ou
>>>> até cientista de dados. Até porque o profissional que trabalha com
>>>> dados
>>>> tem inúmeros perfis e precisa ser moldado no próprio ambiente de
>>>> trabalho e em cursos de especialização. Pense não apenas no cientista
>>>> de
>>>> dados mas também no "quant" (mercado financeiro), no analista de risco,
>>>> entre outros. Alguns perfis são mais favoráveis a um atuário, outros a
>>>> um estatístico e outros a um cientista de computação. Jamais um
>>>> currículo de graduação vai atender ao mercado plenamente. Deve dialogar
>>>> com o mercado mas nunca será capaz de produzir o "data god", essa
>>>> figura
>>>> mitológica que domina estatística, BI, AI, ML, KDD, big data,
>>>> analytics,
>>>> bioinformatics... (Lembra do pato... anda, nada e voa, nenhum dos três
>>>> bem).
>>>>
>>>> Nesse sentido acho que é perfeitamente possível ter bons cursos de
>>>> estatística sem grandes conteúdos de CD. Assim como é ótimo que
>>>> tenhamos
>>>> programas com essa ênfase.
>>>>
>>>> Também discordo das queixas de que não somos multidisciplinares (seja
>>>>>>>> o que isso for). Pesquisa requer, em parte, isolamento (no bom sentido)
>>>> e foco. Na minha definição, somos uma comunidade com formação e atuação
>>>> ampla. Culturalmente somos mais próximos dos matemáticos e isso nos
>>>> torna menos dinâmicos e ousados do que, por exemplo, engenheiros e
>>>> cientistas de computação. Por outro lado, tendemos a ser mais rigorosos
>>>> em termos metodológicos. There is no free lunch! De probabilidade a
>>>> bioestatística temos muito espaço para produzir e colaborar seja dentro
>>>> como fora da academia.
>>>>
>>>> Talvez a realidade de São Carlos seja uma. A de Brasília outra.
>>>> Nordeste
>>>> uma terceira. ENCE uma quarta e por aí vai. Uns podem realizar seu
>>>> "datafest", outros optarem por eventos voltados para finanças e
>>>> econometria enquanto outros se tornam referência em bioestatística. É
>>>> bom que seja assim.
>>>>
>>>> Abraços e bom fim de semana,
>>>>
>>>> Bernardo
>>>>
>>>>
>>>> --
>>>> Prof. Bernardo Borba de Andrade
>>>> Chefe de Departamento
>>>> Estatística - IE - UnB
>>>> Tels. 61-3107-3668 - 3107-3696
>>>>
>>>>
>>>> _______________________________________________
>>>> abe mailing list
>>>> abe em lists.ime.usp.br
>>>> https://lists.ime.usp.br/listinfo/abe
>>>>
>>> _______________________________________________
>>> abe mailing list
>>> abe em lists.ime.usp.br
>>> https://lists.ime.usp.br/listinfo/abe
>>>
>>
>>
>> --
>> "If you can't excel with talent, triumph with effort!" - Dave Weinbaum.
>>
>> Widemberg Nobre
>> Doutorando em Estatística pela Universidade Federal do Rio de Janeiro
>>
>>
>> _______________________________________________
>> abe mailing list
>> abe em lists.ime.usp.br
>> https://lists.ime.usp.br/listinfo/abe
>>
> _______________________________________________
> abe mailing list
> abe em lists.ime.usp.br
> https://lists.ime.usp.br/listinfo/abe
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <https://lists.ime.usp.br/archives/abe/attachments/20191007/493248c2/attachment.html>
-------------- Próxima Parte ----------
Um anexo não-texto foi limpo...
Nome: image.png
Tipo: image/png
Tamanho: 454967 bytes
Descrição: não disponível
URL: <https://lists.ime.usp.br/archives/abe/attachments/20191007/493248c2/attachment.png>


Mais detalhes sobre a lista de discussão abe