[ABE-L] Ciência de Dados

Jorge Alberto Achcar achcar em fmrp.usp.br
Seg Out 7 15:59:06 -03 2019


Eu não deveria me intrometer nessa discussão pois sou aposentado pelo
ICMC-USP, São Carlos a vários anos e não atuo mais na graduação para
bacharelados em estatística/matemática e atualmente só colaboro na área de
estatística em PG para outros departamentos especialmente na área de
medicina e engenharia apesar de ser pesquisador ativo na área de
estatística onde sou pesquisador em produtividade em pesquisa na área de
estatística a mais de 30 anos contínuos. Quando fiz meu doutorado na
Universidade Wisconsin, Madison, entre 1979 e 1983 (muitos anos atrás) tive
o prazer de ser aluno do George Box, Bill Hunter (meu orientador de
doutorado), Brian Joiner (criador do software Minitab) entre outros
destacados estatísticos. Esses pesquisadores ícones da área de estatística,
sempre tiveram uma visão de futuro a mais de  meio século enfatizando
aplicações e abertura da estatística para indústria, área médica, indústria
farmacêutica, tecnologia, e problemas aplicados de interesse para a
sociedade. Sem dúvida, isso sempre foi um grande desafio para os
estatísticos, e isso já era discutido a mais de 40 anos nos melhores
departamentos de estatística dos EUA, UK e outros. O departamento de
estatística em Madison sempre foi muito forte na formação teórica dos
alunos de PhD mas TODOS os alunos eram obrigados a fazer pelo menos uma
disciplina de consultoria estatística desde o final dos anos 1960 comandado
pelas ideias brilhantes do G. Box. Além disso, havia as famosas reuniões
semanais (um seminário chamado beer and statistics) promovidas pelo G. Box
em sua casa sempre com a participação de pessoas convidadas de outros
departamentos ou empresas com problemas reais para serem discutidos pelos
alunos de PG em estatística. Isso forma estatísticos com grande jogo de
cintura para atuar nas mais diversas áreas, um dos grandes objetivos da
estatística. Resultado, muitos PhD formados em Madison, foram para empresas
trabalhar como pesquisadores com dados reais e muitos foram para a vida
acadêmica, como o meu caso. Além disso, no Brasil (com raras exceções) a
estatística surgiu e sempre foi considerada como um ramo de matemática (a
minha graduação foi em matemática). No meu retorno ao Brasil em 1983,
sempre tive interesse em criar disciplinas de consultoria estatística,
planejamentos de experimentos industriais, análise de dados e talvez mais
contato com pesquisadores de outras áreas onde surgem os problemas muitas
vezes levando a novos modelos estatísticos e boas análises de dados
publicáveis em boas revistas, mas sempre essas ideias não eram bem
recebidas pela comunidade acadêmica, pois os departamentos sempre foram
muito conservadores e muito  resistentes a possíveis aberturas da
universidade para a sociedade. Em resumo: não adianta criar programas de
estatística com os mais diversos nomes (por exemplo, cientista de dados) se
os departamentos não abrirem as portas e aceitar os desafios para
solucionar problemas nas mais diversas áreas que assume uma formação muito
sólida dos estatísticos em praticamente todas as subáreas de estatística
(regressão, planejamentos de experimentos industriais, confiabilidade e
análise de sobrevivência, analise multivariada, series temporais, modelagem
de dados categóricos, métodos bayesianos aplicados, estatística
computacional e assim por diante). Reconheço que dentro da vida acadêmica o
que conta para cada professor são os artigos em boas revistas, o que leva a
maioria dos estatísticos ou outros pesquisadores a se especializar em
alguns temas específicos que levam a publicação continua. Mas isso deveria
ser mudado, com atesta a opinião dos pesquisadores mais jovens que estão
preocupados (com razão) sobre o futuro da estatística brasileira.

Jorge A. Achcar



Em seg, 7 de out de 2019 às 13:29, Widemberg da Silva Nobre <
widemberg em dme.ufrj.br> escreveu:

> Caros,
>
> Apenas para diversificar as idéias e fornecer a visão de um discente de
> pós-graduação (embora minha visão não tenha qualquer representatividade no
> meio discente). De antemão, quero deixar claro que minhas visões convergem
> fortemente para aquelas arguidas pelo Bernardo. Além disso, minha arguição
> contempla apenas as discussões sobre a reformulação do curso de estatística
> e a possível, plausível ou necessária migração para o mundo da ciências de
> dados.
>
> Eu sinceramente acredito que o curso de estatística precisa de uma
> reformulação, e, na minha opinião, essa reformulação passa necessariamente
> pela indagação:
> "Quais as habilidades necessárias à resolução de problemas complexos?"
> Isso me leva a crer que um aluno de graduação precisa entender, no
> "primeiro dia de aula", o que é um problema complexo e, também, que sua
> resolução passa pelo aprendizado de disciplinas como Cálculo, Álgebra
> linear, Probabilidade e Processos estocásticos.
>
> Buscar ferramentas que ajudem nesse entendimento é, para mim, a questão
> primordial, e acho que a maneira "menos difícil" de atingir esse ideal é
> motivar melhor o aluno. Para esse fim, acho que os cursos de estatística do
> Brasil poderiam olhar com carinho para os 'conjuntos de dados crus'
> fornecidos pelo e-Sic (https://esic.cgu.gov.br/sistema/site/index.aspx).
> Lá podemos conseguir uma diversidade de conjunto de dados enorme e nos
> diferentes campos nos quais dados públicos são gerados.
>
> Acredito que o trato com esses 'dados crus', na primeira metade do curso
> de estatística, dará ao aluno algumas das habilidades requisitadas por um
> cientistas de dados (vide o email anterior da Doris). Algo que os dados do
> R, vastamente utilizados nos cursos de estatística no Brasil e
> possivelmente no mundo, não fornece (sei que há uma questão didática aqui,
> mas vou pular isso para não me alongar mais do que já estou me alongando).
>
> Acredito que mostrar um problema particular e atual do Brasil pode ajudar
> a motivar, e demonstrar que a resolução do problema passa pelo aprendizado
> dessas disciplinas anteriormente citadas. Algo que, penso eu, todos os
> professores de estatística querem.
>
> Como consequência do trabalho com dados públicos do Brasil, creio que
> teremos mais facilidades em divulgar a Estatística, uma vez que teremos
> material a oferecer a mídia (Jornais, TV's e etc). Apenas para
> exemplificar: Como estudante, senti falta de uma nota pública da ABE sobre
> a reforma da previdência. Somos a comunidade de estatística e não acredito
> que exista outro profissional mais preparado do que a gente para falar
> sobre previsões. Quais seriam os benefícios/necessidades da reforma da
> previdência a curto, médio e longo prazo? e os riscos? a discussão é válida
> no agregado Brasil (olhar todos os estados conjuntamente)? começar a
> discussão através de um processo amostral em dois estágios não seria o mais
> ideal? enfim, apenas questões que, se tivéssemos discutido num período
> anterior, poderiam ser externadas com mais facilidades para o grande
> público.
>
> Aqui, busco englobar um recém formado em estatística, que está tentando
> falar sobre a reforma da previdência para a família em um almoço de
> domingo. Penso que há a necessidade de formar estatísticos aptos a fornecer
> informações técnicas, sem o uso de termos do cotidiano estatístico, mesmo
> que em ambientes de reunião de familiares e se fazer entendível. Creio que
> o uso de dados públicos facilitaria a participação de estatísticos nesse
> tipo de discussão que é rotineira do cotidiano social. Eu mesmo tenho
> dificuldades de me expressar em vários momentos de reunião com meus
> familiares e fornecer algo técnico e entendível para eles. Creio, ou
> espero, que não seja o único.
>
> Também acho que precisamos, em nome da comunidade ABE, apresentar esse
> tipo informação a sociedade via meios de comunicação como jornais,
> revistas, rádio, TV's  e etc. Ao meu ver, discussões como essa, ajudaria a
> fazer a estatística mais conhecida. Acho que aqui vale um adendo, nessas
> discussões não devemos ter partido, nosso dever seria apenas divulgar
> possíveis cenários futuros/correntes (talvez ordenados pela chance,
> enfim...).
>
> Por fim, embora não consiga me expressar bem, creio que a questão maior
> que move essa discussão Estatística x Ciências de dados é "o ser mais
> atraente" e como sugerido pelo David Spiegelhalter no SINAPE de 2016, isso
> passa por "saber ser atraente".
>
> Abs,
> Widemberg
>
> Em dom, 6 de out de 2019 às 20:02, Doris Fontes <dsfontes em gmail.com>
> escreveu:
>
>> Para entender um pouco do que acontece em alguns lugares, esses são os
>> requisitos para um cargo de CIENTISTA DE DADOS numa empresa em Londres:
>>
>> [image: image.png]
>>
>>
>>
>> Doris
>>
>>
>>
>>
>>
>> Em sex, 4 de out de 2019 às 23:48, Bernardo B. Andrade <bbandrade em unb.br>
>> escreveu:
>>
>>> Caros,
>>>
>>> Vou pegar embalo na mensagem mais recente do professor Pedro.
>>>
>>> Primeiramente sinto falta de uma definição (e escopo) para Ciência de
>>> Dados... para fins desse texto vou definir:
>>>
>>> - Soft DS: fundamentos de bancos de dados, computação em paralelo,
>>> visualização, text mining, web mining, BI.
>>> - Hard DS: análise de complexidade (de algoritmos), otimização numérica,
>>> modelagem de dados superdimensionados, álgebra linear computacional, ML.
>>>
>>> (Digressão: Infelizmente muita gente (alunos em particular) adora o soft
>>> DS... na hora do hard DS pede pra voltar pra estatística... rsrs)
>>>
>>> Discordo do Wickman e do tom apocalíptico de muitas discussões sobre CD
>>> e estatística. Nâo perdemos bonde algum. A Estatística é uma área fértil
>>> a qual, juntamente com as engenharias, matemática aplicada e computação,
>>> pariu essa criança mimada e hiperativa chamada "ciência de dados". Essa
>>> criança vai amadurecer (está amadurecendo) e nesse processo a formação
>>> de recursos humanos sofrerá mudanças.
>>>
>>> Na academia, as mudanças vão ocorrer naturalmente à medida que os jovens
>>> pesquisadores (ansiosos por mudanças) forem publicando em bons
>>> periódicos de engenharias, matemática aplicada e computação (além de
>>> estatística, obviamente), à medida que criarem grupos de pesquisa
>>> fortes, produzirem patentes, projetos com grandes empresas, etc. A
>>> verdadeira reforma se dá não por decreto ou mobilizações durante o
>>> SINAPE mas por força da nossa produção.
>>>
>>> No mundo corporativo as mudanças ocorrem mais rápido e nem sempre existe
>>> um match perfeito entre o profissional (analista de dados) e o egresso
>>> da universidade, seja ele um estatístico, engenheiro ou economista ou
>>> até cientista de dados. Até porque o profissional que trabalha com dados
>>> tem inúmeros perfis e precisa ser moldado no próprio ambiente de
>>> trabalho e em cursos de especialização. Pense não apenas no cientista de
>>> dados mas também no "quant" (mercado financeiro), no analista de risco,
>>> entre outros. Alguns perfis são mais favoráveis a um atuário, outros a
>>> um estatístico e outros a um cientista de computação. Jamais um
>>> currículo de graduação vai atender ao mercado plenamente. Deve dialogar
>>> com o mercado mas nunca será capaz de produzir o "data god", essa figura
>>> mitológica que domina estatística, BI, AI, ML, KDD, big data, analytics,
>>> bioinformatics... (Lembra do pato... anda, nada e voa, nenhum dos três
>>> bem).
>>>
>>> Nesse sentido acho que é perfeitamente possível ter bons cursos de
>>> estatística sem grandes conteúdos de CD. Assim como é ótimo que tenhamos
>>> programas com essa ênfase.
>>>
>>> Também discordo das queixas de que não somos multidisciplinares (seja lá
>>> o que isso for). Pesquisa requer, em parte, isolamento (no bom sentido)
>>> e foco. Na minha definição, somos uma comunidade com formação e atuação
>>> ampla. Culturalmente somos mais próximos dos matemáticos e isso nos
>>> torna menos dinâmicos e ousados do que, por exemplo, engenheiros e
>>> cientistas de computação. Por outro lado, tendemos a ser mais rigorosos
>>> em termos metodológicos. There is no free lunch! De probabilidade a
>>> bioestatística temos muito espaço para produzir e colaborar seja dentro
>>> como fora da academia.
>>>
>>> Talvez a realidade de São Carlos seja uma. A de Brasília outra. Nordeste
>>> uma terceira. ENCE uma quarta e por aí vai. Uns podem realizar seu
>>> "datafest", outros optarem por eventos voltados para finanças e
>>> econometria enquanto outros se tornam referência em bioestatística. É
>>> bom que seja assim.
>>>
>>> Abraços e bom fim de semana,
>>>
>>> Bernardo
>>>
>>>
>>> --
>>> Prof. Bernardo Borba de Andrade
>>> Chefe de Departamento
>>> Estatística - IE - UnB
>>> Tels. 61-3107-3668 - 3107-3696
>>>
>>>
>>> _______________________________________________
>>> abe mailing list
>>> abe em lists.ime.usp.br
>>> https://lists.ime.usp.br/listinfo/abe
>>>
>> _______________________________________________
>> abe mailing list
>> abe em lists.ime.usp.br
>> https://lists.ime.usp.br/listinfo/abe
>>
>
>
> --
> "If you can't excel with talent, triumph with effort!" - Dave Weinbaum.
>
> Widemberg Nobre
> Doutorando em Estatística pela Universidade Federal do Rio de Janeiro
>
>
> _______________________________________________
> abe mailing list
> abe em lists.ime.usp.br
> https://lists.ime.usp.br/listinfo/abe
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <https://lists.ime.usp.br/archives/abe/attachments/20191007/53c8327c/attachment.html>
-------------- Próxima Parte ----------
Um anexo não-texto foi limpo...
Nome: image.png
Tipo: image/png
Tamanho: 454967 bytes
Descrição: não disponível
URL: <https://lists.ime.usp.br/archives/abe/attachments/20191007/53c8327c/attachment.png>


Mais detalhes sobre a lista de discussão abe