[ABE-L] Ciência de Dados
Bernardo B. Andrade
bbandrade em unb.br
Sex Out 4 23:48:25 -03 2019
Caros,
Vou pegar embalo na mensagem mais recente do professor Pedro.
Primeiramente sinto falta de uma definição (e escopo) para Ciência de
Dados... para fins desse texto vou definir:
- Soft DS: fundamentos de bancos de dados, computação em paralelo,
visualização, text mining, web mining, BI.
- Hard DS: análise de complexidade (de algoritmos), otimização numérica,
modelagem de dados superdimensionados, álgebra linear computacional, ML.
(Digressão: Infelizmente muita gente (alunos em particular) adora o soft
DS... na hora do hard DS pede pra voltar pra estatística... rsrs)
Discordo do Wickman e do tom apocalíptico de muitas discussões sobre CD
e estatística. Nâo perdemos bonde algum. A Estatística é uma área fértil
a qual, juntamente com as engenharias, matemática aplicada e computação,
pariu essa criança mimada e hiperativa chamada "ciência de dados". Essa
criança vai amadurecer (está amadurecendo) e nesse processo a formação
de recursos humanos sofrerá mudanças.
Na academia, as mudanças vão ocorrer naturalmente à medida que os jovens
pesquisadores (ansiosos por mudanças) forem publicando em bons
periódicos de engenharias, matemática aplicada e computação (além de
estatística, obviamente), à medida que criarem grupos de pesquisa
fortes, produzirem patentes, projetos com grandes empresas, etc. A
verdadeira reforma se dá não por decreto ou mobilizações durante o
SINAPE mas por força da nossa produção.
No mundo corporativo as mudanças ocorrem mais rápido e nem sempre existe
um match perfeito entre o profissional (analista de dados) e o egresso
da universidade, seja ele um estatístico, engenheiro ou economista ou
até cientista de dados. Até porque o profissional que trabalha com dados
tem inúmeros perfis e precisa ser moldado no próprio ambiente de
trabalho e em cursos de especialização. Pense não apenas no cientista de
dados mas também no "quant" (mercado financeiro), no analista de risco,
entre outros. Alguns perfis são mais favoráveis a um atuário, outros a
um estatístico e outros a um cientista de computação. Jamais um
currículo de graduação vai atender ao mercado plenamente. Deve dialogar
com o mercado mas nunca será capaz de produzir o "data god", essa figura
mitológica que domina estatística, BI, AI, ML, KDD, big data, analytics,
bioinformatics... (Lembra do pato... anda, nada e voa, nenhum dos três
bem).
Nesse sentido acho que é perfeitamente possível ter bons cursos de
estatística sem grandes conteúdos de CD. Assim como é ótimo que tenhamos
programas com essa ênfase.
Também discordo das queixas de que não somos multidisciplinares (seja lá
o que isso for). Pesquisa requer, em parte, isolamento (no bom sentido)
e foco. Na minha definição, somos uma comunidade com formação e atuação
ampla. Culturalmente somos mais próximos dos matemáticos e isso nos
torna menos dinâmicos e ousados do que, por exemplo, engenheiros e
cientistas de computação. Por outro lado, tendemos a ser mais rigorosos
em termos metodológicos. There is no free lunch! De probabilidade a
bioestatística temos muito espaço para produzir e colaborar seja dentro
como fora da academia.
Talvez a realidade de São Carlos seja uma. A de Brasília outra. Nordeste
uma terceira. ENCE uma quarta e por aí vai. Uns podem realizar seu
"datafest", outros optarem por eventos voltados para finanças e
econometria enquanto outros se tornam referência em bioestatística. É
bom que seja assim.
Abraços e bom fim de semana,
Bernardo
--
Prof. Bernardo Borba de Andrade
Chefe de Departamento
Estatística - IE - UnB
Tels. 61-3107-3668 - 3107-3696
Mais detalhes sobre a lista de discussão abe