[ABE-L] Ciência de Dados

Pedro Luis do Nascimento Silva pedronsilva em gmail.com
Sex Out 4 16:27:15 -03 2019


Caros redistas,

Ainda sobre a temática da Estatística e sua nêmesis (?): Ciência de Dados.

Segue em anexo um artigo mais atual sobre o tema, com uma reflexão bem
interessante sobre como caracterizar essa nova ciência. Segue também
pequena apresentação que fiz sobre o tema em evento recente (maio de 2019).

Eu penso que a Estatística como ciência não perdeu nenhum bonde, e que
evoluiu muito junto com as oportunidades favorecidas pela evolução da
tecnologia.

Claro, nem tudo são flores, e esta avaliação que faço não é motivo para
acomodação. Digo sempre aos meus alunos que escolhem estudar e fazer
Estatística como profissão: vocês estão 'condenados' a continuar estudando
e aprendendo, pois se não o fizerem, ficarão obsoletos em pouco tempo.

Ouvi do Hadley Wickham no ISI de 2017 uma frase um tanto arrogante: um
cientista de dados é um estatístico 'útil'.  Penso que fiz isso minha vida
profissional inteira, então sou um 'cientista de dados', e comecei bem
cedo, nos anos 1980!

Não me abalo com nomes e abordagens novas: "data mining" desapareceu quase
tão depressa quanto surgiu; o mesmo vale para "analytics", entre outros
modismos. Vou continuar me apresentando como Estatístico... Mas não acho
que esse seja o caminho para todos. Há espaço para novas designações, e não
tenho qualquer reserva em relação a 'cientista de dados' para os que assim
se identificarem.

Continuo pensando que o segredo da Estatística tem sido contribuir com a
solução de problemas de interesse em todas as áreas do conhecimento. Há
alguns problemas em que os dados são volumosos e requerem, portanto,
habilidades adicionais para sua preparação, análise e apresentação - mas
não é só o tamanho dos problemas / arquivos que define a ciência de dados.
Muitos de nós tiveram nossas habilidades computacionais postas à prova
muito antes da modernidade da computação em nuvem, entre outras. Por
exemplo, como trabalhador do IBGE, nossos censos representaram por muito
tempo volumes de difícil tratamento com os recursos computacionais de que
dispúnhamos à época, e nem por isso os problemas correspondentes ficaram
sem solução. Os dados que pareciam volumosos nos anos 1980 hoje não passam
de migalhas na comparação com os gerados por algumas fontes.

O desafio é modernizar o ensino e a prática profissional, sem perder a
essência: Estatística precisa ser útil e focada na solução de problemas.
Como a coleção de problemas é muito ampla, vai sempre haver espaço para
diversificar e crescer.

Então, caros redistas, mãos à obra da reforma da nossa casa (os deptos e
cursos de estatística que oferecem), pois manter a casa arrumada e pronta
para servir é tarefa de fôlego, importante e urgente.

Saudações e bom final de semana a todos.

Pedro.



Em sex, 4 de out de 2019 às 10:52, Anderson Ara <anderson.ara em ufba.br>
escreveu:

>
> Anderson Ara
> Departamento de Estatística
> Universidade Federal da Bahia
> www.mwstat.com/andersonara/
>
> Prezad*s, bom dia.
>
> Sobre a discussão "Estatística ou Ciência de Dados?" Envio um dos artigos
> no qual é atribuída a origem da palavra "Data Science" e publicado
> na International Statistical Review em 2001.
>
> Em nossa comunidade, a discussão é longa e extremamente necessária! Além
> da revisão dos cursos de Bach, noto também a importância da revisão nos
> cursos de serviço. De uma forma geral, outros futuros profissionais
> (Engenheiros, Cientistas da computação, Administradores, etc) costumam ver
> um curso de estatística muito básica, começando em descritiva e com um leve
> toque de inferência e regressão linear (exceções variam por área). Porém,
> quando tais profissionais têm contato com métodos mais sofisticados
> (puramente estatísticos - baseados em estruturas verossimilhancistas ou
> não)  têm grande dificuldade de entender que tais métodos são estatísticos.
>
> Saliento a pergunta do Prof. Raydonal, "Por que perdemos o bonde do data
> mining?" e acrescento uma frase de Hadley Wickham, cientista chefe do
> RStudio, "O fato da ciência de dados existir como uma área é uma falha
> colossal da Estatística."
>
> []s
> Anderson Ara
> Departamento de Estatística
> Laboratório de Estatística e Data Science - LED
> Universidade Federal da Bahia
> www.mwstat.com/andersonara/
>
> Em qui, 3 de out de 2019 às 06:41, Florencia Leonardi <florencia em usp.br>
> escreveu:
>
>> Até me animaria a dizer que alguns desses nomes Donoho, Candes,
>> Wasserman, Tibishirani, Michael Jordan, Girolamini, Hastie (adicionaria o
>> Efron) são pouco citados nos cursos de Estatística, o que é mais grave.
>> Há uma grande ressistência a fazer mudanças nos cursos, e as mudanças vão
>> acontecer de baixo para cima, isto é porque os alunos começam a pedir.
>> Eu não sou a favor de converter a Estatística em "ciência de dados", mas
>> o curso deveria oferecer opções, e a chamada "ciência de dados" deveria ser
>> uma. Não se pode ignorar que uma grande parte dos egressos dos cursos de
>> Estatística estão trabalhando em áreas relacionadas à "ciência de dados".
>> Saudações
>> Florencia
>>
>> On Thu, Oct 3, 2019 at 2:55 AM <abe-request em lists.ime.usp.br> wrote:
>>
>>> Enviar submissões para a lista de discussão abe para
>>>         abe em lists.ime.usp.br
>>>
>>> Para se cadastrar ou descadastrar via WWW, visite o endereço
>>>         https://lists.ime.usp.br/listinfo/abe
>>> ou, via email, envie uma mensagem com a palavra 'help' no assunto ou
>>> corpo da mensagem para
>>>         abe-request em lists.ime.usp.br
>>>
>>> Você poderá entrar em contato com a pessoa que gerencia a lista pelo
>>> endereço
>>>         abe-owner em lists.ime.usp.br
>>>
>>> Quando responder, por favor edite sua linha Assunto assim ela será
>>> mais específica que "Re: Contents of abe digest..."
>>>
>>>
>>> Tópicos de Hoje:
>>>
>>>    1. Re: Ciência de Dados (Heliton Tavares)
>>>    2. Re: Ciência de Dados (Basilio de Braganca Pereira)
>>>
>>>
>>> ----------------------------------------------------------------------
>>>
>>> Message: 1
>>> Date: Wed, 2 Oct 2019 23:41:35 -0300
>>> From: Heliton Tavares <helitontavares em gmail.com>
>>> To: Doris Fontes <dsfontes em gmail.com>
>>> Cc: abe-Lista <abe-l em ime.usp.br>
>>> Subject: Re: [ABE-L] Ciência de Dados
>>> Message-ID:
>>>         <CALaDxYe5qZbgXf+TmfO63C2t-tSfk7p+fTfY=
>>> LRZozkd-Jb_iw em mail.gmail.com>
>>> Content-Type: text/plain; charset="utf-8"
>>>
>>> Inicialmente falei que ele estava completamente equivocado. Comentei que
>>> os
>>> Estatísticos normalmente estão bem empregados, abrindo espaço para
>>> pessoas
>>> de várias outras áreas, com denominações de Cientistas de Dados,
>>> Engenheiros de Dados, Analistas de Dados etc., alguns da área de
>>> Computação.  Depois falei que aprender a programar não é tudo na
>>> ciência, e
>>> que as técnicas estatísticas vão muito além de Estatísticas Básicas. Por
>>> fim, falei que recentemente dei uma consultoria na avaliação de um App de
>>> Avaliação Educacional. Um belo layout, bem maquiado e cheiroso, mas
>>> quando
>>> eu abri o troço começou a feder. App bonitinho e ordinário! Bom, e a
>>> mensagem surtiu efeito.
>>>
>>> No entanto, mesmo sabendo que sempre haverá espaço para o Clínico Geral
>>> e o
>>> Especialista na área de Estatística, fica claro que a melhor
>>> possibilidade
>>> de crescimento da área está escorrendo entre os dedos. A propaganda é a
>>> alma do negócio, e os BI’s estão fazendo bem o dever de casa.
>>>
>>> Saudações Acadêmicas!
>>>
>>>
>>>
>>> On Wed, Oct 2, 2019 at 9:27 PM Doris Fontes <dsfontes em gmail.com> wrote:
>>>
>>> > E qual foi a intervenção que você fez, Heliton?
>>> >
>>> > Em qua, 2 de out de 2019 às 21:12, Heliton Tavares <
>>> > helitontavares em gmail.com> escreveu:
>>> >
>>> >> Prezados,
>>> >> Quando vi o comentário abaixo no site da ABE, lembrei de uma palestra
>>> de
>>> >> BI que assisti recentemente sobre Big Data, IA etc. O palestrante
>>> comentou
>>> >> que "*os Estatísticos ficaram atordoados diante de tanta informação e
>>> >> foram atropelados pelos profissionais de BI*". Após a minha
>>> intervenção
>>> >> ele falou que jamais comentaria isso novamente, o que já deve ter
>>> feito
>>> >> inúmeras vezes. *A pergunta que fica aos futuros Estatísticos é*:
>>> *qual
>>> >> a parte que te cabe nesse latifúndio?*
>>> >>
>>> >> *Site da ABE*:
>>> >>
>>> >>
>>> https://redeabe.org.br/site/noticias/matematica-da-usp-coordenara-escola-para-aplicacoes-em-ciencia-de-dados
>>> >>
>>> >>
>>> >> *Comentário*:
>>> >> *Os estatísticos poderiam estar mais ATIVOS nesse processo. Ciência de
>>> >> Dados avança rapidamente e os profissionais da estatística precisam
>>> ser
>>> >> mais pró-ativos para não ficarem para trás. A estatística está no
>>> cerne das
>>> >> análises de dados, mas a tecnologia anda assustando alguns
>>> profissionais.*
>>> >> _______________________________________________
>>> >> abe mailing list
>>> >> abe em lists.ime.usp.br
>>> >> https://lists.ime.usp.br/listinfo/abe
>>> >>
>>> >
>>> -------------- Próxima Parte ----------
>>> Um anexo em HTML foi limpo...
>>> URL: <
>>> https://lists.ime.usp.br/archives/abe/attachments/20191002/a73495f7/attachment-0001.html
>>> >
>>>
>>> ------------------------------
>>>
>>> Message: 2
>>> Date: Thu, 3 Oct 2019 02:54:34 -0300
>>> From: Basilio de Braganca Pereira <basilio em hucff.ufrj.br>
>>> To: Heliton Tavares <helitontavares em gmail.com>
>>> Cc: Doris Fontes <dsfontes em gmail.com>, abe-Lista <abe-l em ime.usp.br>
>>> Subject: Re: [ABE-L] Ciência de Dados
>>> Message-ID: <7F1837B8-1C54-48EC-AAF1-3D7B7CAAE518 em hucff.ufrj.br>
>>> Content-Type: text/plain; charset="utf-8"
>>>
>>> Na minha opinião está moda de cientista dos dados parece muito com a
>>> moda de Administração da Qualidade, Reengenharia , Qualidade Total .
>>> Empresas mandavam administradores para encontros em hotéis caríssimos até
>>> que Xeros, Coca Cola etc se convenceram que o que eles precisavam mesmo era
>>> de Inspeção da Qualidade, controle e planejamento de experimentos.
>>> Nomes como Donoho , Candes , Wasserman ,Tibishirani, Michael Jordan ,
>>> Girolamini , Hastie etc não são citados nesta ciência de dados em geral
>>> Basilio
>>>
>>> Enviado do meu iPhone
>>>
>>> Em 2 de out de 2019, à(s) 23:41, Heliton Tavares <
>>> helitontavares em gmail.com> escreveu:
>>>
>>> > Inicialmente falei que ele estava completamente equivocado. Comentei
>>> que os Estatísticos normalmente estão bem empregados, abrindo espaço para
>>> pessoas de várias outras áreas, com denominações de Cientistas de Dados,
>>> Engenheiros de Dados, Analistas de Dados etc., alguns da área de
>>> Computação.  Depois falei que aprender a programar não é tudo na ciência, e
>>> que as técnicas estatísticas vão muito além de Estatísticas Básicas. Por
>>> fim, falei que recentemente dei uma consultoria na avaliação de um App de
>>> Avaliação Educacional. Um belo layout, bem maquiado e cheiroso, mas quando
>>> eu abri o troço começou a feder. App bonitinho e ordinário! Bom, e a
>>> mensagem surtiu efeito.
>>> >
>>> > No entanto, mesmo sabendo que sempre haverá espaço para o Clínico
>>> Geral e o Especialista na área de Estatística, fica claro que a melhor
>>> possibilidade de crescimento da área está escorrendo entre os dedos. A
>>> propaganda é a alma do negócio, e os BI’s estão fazendo bem o dever de casa.
>>> >
>>> > Saudações Acadêmicas!
>>> >
>>> >
>>> >
>>> >> On Wed, Oct 2, 2019 at 9:27 PM Doris Fontes <dsfontes em gmail.com>
>>> wrote:
>>> >> E qual foi a intervenção que você fez, Heliton?
>>> >>
>>> >>> Em qua, 2 de out de 2019 às 21:12, Heliton Tavares <
>>> helitontavares em gmail.com> escreveu:
>>> >>> Prezados,
>>> >>> Quando vi o comentário abaixo no site da ABE, lembrei de uma
>>> palestra de BI que assisti recentemente sobre Big Data, IA etc. O
>>> palestrante comentou que "os Estatísticos ficaram atordoados diante de
>>> tanta informação e foram atropelados pelos profissionais de BI". Após a
>>> minha intervenção ele falou que jamais comentaria isso novamente, o que já
>>> deve ter feito inúmeras vezes. A pergunta que fica aos futuros Estatísticos
>>> é: qual a parte que te cabe nesse latifúndio?
>>> >>>
>>> >>> Site da ABE:
>>> >>>
>>> https://redeabe.org.br/site/noticias/matematica-da-usp-coordenara-escola-para-aplicacoes-em-ciencia-de-dados
>>>
>>> >>>
>>> >>> Comentário:
>>> >>> Os estatísticos poderiam estar mais ATIVOS nesse processo. Ciência
>>> de Dados avança rapidamente e os profissionais da estatística precisam ser
>>> mais pró-ativos para não ficarem para trás. A estatística está no cerne das
>>> análises de dados, mas a tecnologia anda assustando alguns profissionais.
>>> >>> _______________________________________________
>>> >>> abe mailing list
>>> >>> abe em lists.ime.usp.br
>>> >>> https://lists.ime.usp.br/listinfo/abe
>>> > _______________________________________________
>>> > abe mailing list
>>> > abe em lists.ime.usp.br
>>> > https://lists.ime.usp.br/listinfo/abe
>>> -------------- Próxima Parte ----------
>>> Um anexo em HTML foi limpo...
>>> URL: <
>>> https://lists.ime.usp.br/archives/abe/attachments/20191003/f2262d43/attachment.html
>>> >
>>>
>>> ------------------------------
>>>
>>> Subject: Legenda do Digest
>>>
>>> _______________________________________________
>>> abe mailing list
>>> abe em lists.ime.usp.br
>>> https://lists.ime.usp.br/listinfo/abe
>>>
>>>
>>> ------------------------------
>>>
>>> Fim da Digest abe, volume 65, assunto 6
>>> ***************************************
>>>
>>
>>
>> _______________________________________________
>> abe mailing list
>> abe em lists.ime.usp.br
>> https://lists.ime.usp.br/listinfo/abe
>>
> _______________________________________________
> abe mailing list
> abe em lists.ime.usp.br
> https://lists.ime.usp.br/listinfo/abe
>


-- 
Pedro Luis do Nascimento Silva
IBGE - Escola Nacional de Ciências Estatísticas
IBGE - National School of Statistical Sciences
Phone: +55 21 21424957
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <https://lists.ime.usp.br/archives/abe/attachments/20191004/6704edce/attachment.html>
-------------- Próxima Parte ----------
Um anexo não-texto foi limpo...
Nome: Donoho 2017.pdf
Tipo: application/pdf
Tamanho: 1370519 bytes
Descrição: não disponível
URL: <https://lists.ime.usp.br/archives/abe/attachments/20191004/6704edce/attachment.pdf>
-------------- Próxima Parte ----------
Um anexo não-texto foi limpo...
Nome: SlidesPedroSilva20190520.pdf
Tipo: application/pdf
Tamanho: 726917 bytes
Descrição: não disponível
URL: <https://lists.ime.usp.br/archives/abe/attachments/20191004/6704edce/attachment-0001.pdf>


Mais detalhes sobre a lista de discussão abe