[ABE-L] Ciência de Dados

Widemberg da Silva Nobre widemberg em dme.ufrj.br
Seg Out 7 13:28:38 -03 2019


Caros,

Apenas para diversificar as idéias e fornecer a visão de um discente de
pós-graduação (embora minha visão não tenha qualquer representatividade no
meio discente). De antemão, quero deixar claro que minhas visões convergem
fortemente para aquelas arguidas pelo Bernardo. Além disso, minha arguição
contempla apenas as discussões sobre a reformulação do curso de estatística
e a possível, plausível ou necessária migração para o mundo da ciências de
dados.

Eu sinceramente acredito que o curso de estatística precisa de uma
reformulação, e, na minha opinião, essa reformulação passa necessariamente
pela indagação:
"Quais as habilidades necessárias à resolução de problemas complexos?"
Isso me leva a crer que um aluno de graduação precisa entender, no
"primeiro dia de aula", o que é um problema complexo e, também, que sua
resolução passa pelo aprendizado de disciplinas como Cálculo, Álgebra
linear, Probabilidade e Processos estocásticos.

Buscar ferramentas que ajudem nesse entendimento é, para mim, a questão
primordial, e acho que a maneira "menos difícil" de atingir esse ideal é
motivar melhor o aluno. Para esse fim, acho que os cursos de estatística do
Brasil poderiam olhar com carinho para os 'conjuntos de dados crus'
fornecidos pelo e-Sic (https://esic.cgu.gov.br/sistema/site/index.aspx). Lá
podemos conseguir uma diversidade de conjunto de dados enorme e nos
diferentes campos nos quais dados públicos são gerados.

Acredito que o trato com esses 'dados crus', na primeira metade do curso de
estatística, dará ao aluno algumas das habilidades requisitadas por um
cientistas de dados (vide o email anterior da Doris). Algo que os dados do
R, vastamente utilizados nos cursos de estatística no Brasil e
possivelmente no mundo, não fornece (sei que há uma questão didática aqui,
mas vou pular isso para não me alongar mais do que já estou me alongando).

Acredito que mostrar um problema particular e atual do Brasil pode ajudar a
motivar, e demonstrar que a resolução do problema passa pelo aprendizado
dessas disciplinas anteriormente citadas. Algo que, penso eu, todos os
professores de estatística querem.

Como consequência do trabalho com dados públicos do Brasil, creio que
teremos mais facilidades em divulgar a Estatística, uma vez que teremos
material a oferecer a mídia (Jornais, TV's e etc). Apenas para
exemplificar: Como estudante, senti falta de uma nota pública da ABE sobre
a reforma da previdência. Somos a comunidade de estatística e não acredito
que exista outro profissional mais preparado do que a gente para falar
sobre previsões. Quais seriam os benefícios/necessidades da reforma da
previdência a curto, médio e longo prazo? e os riscos? a discussão é válida
no agregado Brasil (olhar todos os estados conjuntamente)? começar a
discussão através de um processo amostral em dois estágios não seria o mais
ideal? enfim, apenas questões que, se tivéssemos discutido num período
anterior, poderiam ser externadas com mais facilidades para o grande
público.

Aqui, busco englobar um recém formado em estatística, que está tentando
falar sobre a reforma da previdência para a família em um almoço de
domingo. Penso que há a necessidade de formar estatísticos aptos a fornecer
informações técnicas, sem o uso de termos do cotidiano estatístico, mesmo
que em ambientes de reunião de familiares e se fazer entendível. Creio que
o uso de dados públicos facilitaria a participação de estatísticos nesse
tipo de discussão que é rotineira do cotidiano social. Eu mesmo tenho
dificuldades de me expressar em vários momentos de reunião com meus
familiares e fornecer algo técnico e entendível para eles. Creio, ou
espero, que não seja o único.

Também acho que precisamos, em nome da comunidade ABE, apresentar esse tipo
informação a sociedade via meios de comunicação como jornais, revistas,
rádio, TV's  e etc. Ao meu ver, discussões como essa, ajudaria a fazer a
estatística mais conhecida. Acho que aqui vale um adendo, nessas discussões
não devemos ter partido, nosso dever seria apenas divulgar possíveis
cenários futuros/correntes (talvez ordenados pela chance, enfim...).

Por fim, embora não consiga me expressar bem, creio que a questão maior que
move essa discussão Estatística x Ciências de dados é "o ser mais atraente"
e como sugerido pelo David Spiegelhalter no SINAPE de 2016, isso passa por
"saber ser atraente".

Abs,
Widemberg

Em dom, 6 de out de 2019 às 20:02, Doris Fontes <dsfontes em gmail.com>
escreveu:

> Para entender um pouco do que acontece em alguns lugares, esses são os
> requisitos para um cargo de CIENTISTA DE DADOS numa empresa em Londres:
>
> [image: image.png]
>
>
>
> Doris
>
>
>
>
>
> Em sex, 4 de out de 2019 às 23:48, Bernardo B. Andrade <bbandrade em unb.br>
> escreveu:
>
>> Caros,
>>
>> Vou pegar embalo na mensagem mais recente do professor Pedro.
>>
>> Primeiramente sinto falta de uma definição (e escopo) para Ciência de
>> Dados... para fins desse texto vou definir:
>>
>> - Soft DS: fundamentos de bancos de dados, computação em paralelo,
>> visualização, text mining, web mining, BI.
>> - Hard DS: análise de complexidade (de algoritmos), otimização numérica,
>> modelagem de dados superdimensionados, álgebra linear computacional, ML.
>>
>> (Digressão: Infelizmente muita gente (alunos em particular) adora o soft
>> DS... na hora do hard DS pede pra voltar pra estatística... rsrs)
>>
>> Discordo do Wickman e do tom apocalíptico de muitas discussões sobre CD
>> e estatística. Nâo perdemos bonde algum. A Estatística é uma área fértil
>> a qual, juntamente com as engenharias, matemática aplicada e computação,
>> pariu essa criança mimada e hiperativa chamada "ciência de dados". Essa
>> criança vai amadurecer (está amadurecendo) e nesse processo a formação
>> de recursos humanos sofrerá mudanças.
>>
>> Na academia, as mudanças vão ocorrer naturalmente à medida que os jovens
>> pesquisadores (ansiosos por mudanças) forem publicando em bons
>> periódicos de engenharias, matemática aplicada e computação (além de
>> estatística, obviamente), à medida que criarem grupos de pesquisa
>> fortes, produzirem patentes, projetos com grandes empresas, etc. A
>> verdadeira reforma se dá não por decreto ou mobilizações durante o
>> SINAPE mas por força da nossa produção.
>>
>> No mundo corporativo as mudanças ocorrem mais rápido e nem sempre existe
>> um match perfeito entre o profissional (analista de dados) e o egresso
>> da universidade, seja ele um estatístico, engenheiro ou economista ou
>> até cientista de dados. Até porque o profissional que trabalha com dados
>> tem inúmeros perfis e precisa ser moldado no próprio ambiente de
>> trabalho e em cursos de especialização. Pense não apenas no cientista de
>> dados mas também no "quant" (mercado financeiro), no analista de risco,
>> entre outros. Alguns perfis são mais favoráveis a um atuário, outros a
>> um estatístico e outros a um cientista de computação. Jamais um
>> currículo de graduação vai atender ao mercado plenamente. Deve dialogar
>> com o mercado mas nunca será capaz de produzir o "data god", essa figura
>> mitológica que domina estatística, BI, AI, ML, KDD, big data, analytics,
>> bioinformatics... (Lembra do pato... anda, nada e voa, nenhum dos três
>> bem).
>>
>> Nesse sentido acho que é perfeitamente possível ter bons cursos de
>> estatística sem grandes conteúdos de CD. Assim como é ótimo que tenhamos
>> programas com essa ênfase.
>>
>> Também discordo das queixas de que não somos multidisciplinares (seja lá
>> o que isso for). Pesquisa requer, em parte, isolamento (no bom sentido)
>> e foco. Na minha definição, somos uma comunidade com formação e atuação
>> ampla. Culturalmente somos mais próximos dos matemáticos e isso nos
>> torna menos dinâmicos e ousados do que, por exemplo, engenheiros e
>> cientistas de computação. Por outro lado, tendemos a ser mais rigorosos
>> em termos metodológicos. There is no free lunch! De probabilidade a
>> bioestatística temos muito espaço para produzir e colaborar seja dentro
>> como fora da academia.
>>
>> Talvez a realidade de São Carlos seja uma. A de Brasília outra. Nordeste
>> uma terceira. ENCE uma quarta e por aí vai. Uns podem realizar seu
>> "datafest", outros optarem por eventos voltados para finanças e
>> econometria enquanto outros se tornam referência em bioestatística. É
>> bom que seja assim.
>>
>> Abraços e bom fim de semana,
>>
>> Bernardo
>>
>>
>> --
>> Prof. Bernardo Borba de Andrade
>> Chefe de Departamento
>> Estatística - IE - UnB
>> Tels. 61-3107-3668 - 3107-3696
>>
>>
>> _______________________________________________
>> abe mailing list
>> abe em lists.ime.usp.br
>> https://lists.ime.usp.br/listinfo/abe
>>
> _______________________________________________
> abe mailing list
> abe em lists.ime.usp.br
> https://lists.ime.usp.br/listinfo/abe
>


-- 
"If you can't excel with talent, triumph with effort!" - Dave Weinbaum.

Widemberg Nobre
Doutorando em Estatística pela Universidade Federal do Rio de Janeiro
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <https://lists.ime.usp.br/archives/abe/attachments/20191007/e6c1bb78/attachment.html>
-------------- Próxima Parte ----------
Um anexo não-texto foi limpo...
Nome: image.png
Tipo: image/png
Tamanho: 454967 bytes
Descrição: não disponível
URL: <https://lists.ime.usp.br/archives/abe/attachments/20191007/e6c1bb78/attachment.png>


Mais detalhes sobre a lista de discussão abe