[ABE-L] Ciência de Dados

Bernardo B. Andrade bbandrade em unb.br
Sex Out 4 23:48:25 -03 2019


Caros,

Vou pegar embalo na mensagem mais recente do professor Pedro.

Primeiramente sinto falta de uma definição (e escopo) para Ciência de 
Dados... para fins desse texto vou definir:

- Soft DS: fundamentos de bancos de dados, computação em paralelo, 
visualização, text mining, web mining, BI.
- Hard DS: análise de complexidade (de algoritmos), otimização numérica, 
modelagem de dados superdimensionados, álgebra linear computacional, ML.

(Digressão: Infelizmente muita gente (alunos em particular) adora o soft 
DS... na hora do hard DS pede pra voltar pra estatística... rsrs)

Discordo do Wickman e do tom apocalíptico de muitas discussões sobre CD 
e estatística. Nâo perdemos bonde algum. A Estatística é uma área fértil 
a qual, juntamente com as engenharias, matemática aplicada e computação, 
pariu essa criança mimada e hiperativa chamada "ciência de dados". Essa 
criança vai amadurecer (está amadurecendo) e nesse processo a formação 
de recursos humanos sofrerá mudanças.

Na academia, as mudanças vão ocorrer naturalmente à medida que os jovens 
pesquisadores (ansiosos por mudanças) forem publicando em bons 
periódicos de engenharias, matemática aplicada e computação (além de 
estatística, obviamente), à medida que criarem grupos de pesquisa 
fortes, produzirem patentes, projetos com grandes empresas, etc. A 
verdadeira reforma se dá não por decreto ou mobilizações durante o 
SINAPE mas por força da nossa produção.

No mundo corporativo as mudanças ocorrem mais rápido e nem sempre existe 
um match perfeito entre o profissional (analista de dados) e o egresso 
da universidade, seja ele um estatístico, engenheiro ou economista ou 
até cientista de dados. Até porque o profissional que trabalha com dados 
tem inúmeros perfis e precisa ser moldado no próprio ambiente de 
trabalho e em cursos de especialização. Pense não apenas no cientista de 
dados mas também no "quant" (mercado financeiro), no analista de risco, 
entre outros. Alguns perfis são mais favoráveis a um atuário, outros a 
um estatístico e outros a um cientista de computação. Jamais um 
currículo de graduação vai atender ao mercado plenamente. Deve dialogar 
com o mercado mas nunca será capaz de produzir o "data god", essa figura 
mitológica que domina estatística, BI, AI, ML, KDD, big data, analytics, 
bioinformatics... (Lembra do pato... anda, nada e voa, nenhum dos três 
bem).

Nesse sentido acho que é perfeitamente possível ter bons cursos de 
estatística sem grandes conteúdos de CD. Assim como é ótimo que tenhamos 
programas com essa ênfase.

Também discordo das queixas de que não somos multidisciplinares (seja lá 
o que isso for). Pesquisa requer, em parte, isolamento (no bom sentido) 
e foco. Na minha definição, somos uma comunidade com formação e atuação 
ampla. Culturalmente somos mais próximos dos matemáticos e isso nos 
torna menos dinâmicos e ousados do que, por exemplo, engenheiros e 
cientistas de computação. Por outro lado, tendemos a ser mais rigorosos 
em termos metodológicos. There is no free lunch! De probabilidade a 
bioestatística temos muito espaço para produzir e colaborar seja dentro 
como fora da academia.

Talvez a realidade de São Carlos seja uma. A de Brasília outra. Nordeste 
uma terceira. ENCE uma quarta e por aí vai. Uns podem realizar seu 
"datafest", outros optarem por eventos voltados para finanças e 
econometria enquanto outros se tornam referência em bioestatística. É 
bom que seja assim.

Abraços e bom fim de semana,

Bernardo


-- 
Prof. Bernardo Borba de Andrade
Chefe de Departamento
Estatística - IE - UnB
Tels. 61-3107-3668 - 3107-3696





Mais detalhes sobre a lista de discussão abe