[ABE-L] Ciência de Dados

Anderson Ara anderson.ara em ufba.br
Sex Out 4 21:22:52 -03 2019


Prezad*s,

Ainda sobre a temática da Estatística e sua nêmesis "Ciência de Dados",
reitero as palavras do Prof. Pedro, mãos à obra da reforma da nossa casa.

O artigo do Donoho é muito conhecido e muito relevante para tal discussão.
Enviei o artigo de Cleveland pois é pouco sabido que o próprio termo tem
origens estatísticas. Penso que a declaração de Hadley Wickham (mesmo tendo
revolucionado quase que totalmente a linguagem R) extremamente ofensiva! Em
suma, todos nós estatísticos (ou cientistas de dados por concepção) somos
valorosamente úteis!

Dentre os demais pesquisadores da estatística (e citados fortemente na
literatura de aprendizado de máquina), não podemos esquecer um dos
precursores do boom do "data mining", o criador de
CART/Bagging/RandomForest, Leo Breiman.

Em seu polêmico artigo (pra época) Statistical Modeling: The Two Cultures,
publicado na Statistical Science em 2001, Breiman faz uma comparação muito
importante entre Data Modeling Culture e  Algorithmic Modeling Culture,
este último sendo entendido hoje como métodos de aprendizado de máquina
que, em muito da sua essência, são métodos não paramétricos de modelagem. O
artigo faz referência a vasta aplicabilidade dos métodos e suas ideias
permeiam uma parte fundamental do que é conhecido hoje como ciência de
dados.

A problemática não está muito mais focada no volume, a revolução recente
realizada em R já tem boas alternativas para isso (sem precisar de Python!)
é muito simples trabalhar com bases de dados contendo seus meio bilhões de
linhas e/ou gigabytes em máquina local.

A ciência de dados existe, já há uma forte demanda de mercado e comunidades
científicas se debruçando sobre ela. Não podemos ignorar tal situação.
Porém, a ciência de dados é, em quase sua totalidade, Estatística.

Bom fim de semana a todos.

[]s
Anderson Ara
Laboratório de Estatística e Data Science - LED
Departamento de Estatística
Universidade Federal da Bahia
www.mwstat.com/andersonara/



Em sex, 4 de out de 2019 às 16:27, Pedro Luis do Nascimento Silva <
pedronsilva em gmail.com> escreveu:

> Caros redistas,
>
> Ainda sobre a temática da Estatística e sua nêmesis (?): Ciência de Dados.
>
> Segue em anexo um artigo mais atual sobre o tema, com uma reflexão bem
> interessante sobre como caracterizar essa nova ciência. Segue também
> pequena apresentação que fiz sobre o tema em evento recente (maio de 2019).
>
> Eu penso que a Estatística como ciência não perdeu nenhum bonde, e que
> evoluiu muito junto com as oportunidades favorecidas pela evolução da
> tecnologia.
>
> Claro, nem tudo são flores, e esta avaliação que faço não é motivo para
> acomodação. Digo sempre aos meus alunos que escolhem estudar e fazer
> Estatística como profissão: vocês estão 'condenados' a continuar estudando
> e aprendendo, pois se não o fizerem, ficarão obsoletos em pouco tempo.
>
> Ouvi do Hadley Wickham no ISI de 2017 uma frase um tanto arrogante: um
> cientista de dados é um estatístico 'útil'.  Penso que fiz isso minha vida
> profissional inteira, então sou um 'cientista de dados', e comecei bem
> cedo, nos anos 1980!
>
> Não me abalo com nomes e abordagens novas: "data mining" desapareceu quase
> tão depressa quanto surgiu; o mesmo vale para "analytics", entre outros
> modismos. Vou continuar me apresentando como Estatístico... Mas não acho
> que esse seja o caminho para todos. Há espaço para novas designações, e não
> tenho qualquer reserva em relação a 'cientista de dados' para os que assim
> se identificarem.
>
> Continuo pensando que o segredo da Estatística tem sido contribuir com a
> solução de problemas de interesse em todas as áreas do conhecimento. Há
> alguns problemas em que os dados são volumosos e requerem, portanto,
> habilidades adicionais para sua preparação, análise e apresentação - mas
> não é só o tamanho dos problemas / arquivos que define a ciência de dados.
> Muitos de nós tiveram nossas habilidades computacionais postas à prova
> muito antes da modernidade da computação em nuvem, entre outras. Por
> exemplo, como trabalhador do IBGE, nossos censos representaram por muito
> tempo volumes de difícil tratamento com os recursos computacionais de que
> dispúnhamos à época, e nem por isso os problemas correspondentes ficaram
> sem solução. Os dados que pareciam volumosos nos anos 1980 hoje não passam
> de migalhas na comparação com os gerados por algumas fontes.
>
> O desafio é modernizar o ensino e a prática profissional, sem perder a
> essência: Estatística precisa ser útil e focada na solução de problemas.
> Como a coleção de problemas é muito ampla, vai sempre haver espaço para
> diversificar e crescer.
>
> Então, caros redistas, mãos à obra da reforma da nossa casa (os deptos e
> cursos de estatística que oferecem), pois manter a casa arrumada e pronta
> para servir é tarefa de fôlego, importante e urgente.
>
> Saudações e bom final de semana a todos.
>
> Pedro.
>
>
>
> Em sex, 4 de out de 2019 às 10:52, Anderson Ara <anderson.ara em ufba.br>
> escreveu:
>
>>
>> Anderson Ara
>> Departamento de Estatística
>> Universidade Federal da Bahia
>> www.mwstat.com/andersonara/
>>
>> Prezad*s, bom dia.
>>
>> Sobre a discussão "Estatística ou Ciência de Dados?" Envio um dos artigos
>> no qual é atribuída a origem da palavra "Data Science" e publicado
>> na International Statistical Review em 2001.
>>
>> Em nossa comunidade, a discussão é longa e extremamente necessária! Além
>> da revisão dos cursos de Bach, noto também a importância da revisão nos
>> cursos de serviço. De uma forma geral, outros futuros profissionais
>> (Engenheiros, Cientistas da computação, Administradores, etc) costumam ver
>> um curso de estatística muito básica, começando em descritiva e com um leve
>> toque de inferência e regressão linear (exceções variam por área). Porém,
>> quando tais profissionais têm contato com métodos mais sofisticados
>> (puramente estatísticos - baseados em estruturas verossimilhancistas ou
>> não)  têm grande dificuldade de entender que tais métodos são estatísticos.
>>
>> Saliento a pergunta do Prof. Raydonal, "Por que perdemos o bonde do data
>> mining?" e acrescento uma frase de Hadley Wickham, cientista chefe do
>> RStudio, "O fato da ciência de dados existir como uma área é uma falha
>> colossal da Estatística."
>>
>> []s
>> Anderson Ara
>> Departamento de Estatística
>> Laboratório de Estatística e Data Science - LED
>> Universidade Federal da Bahia
>> www.mwstat.com/andersonara/
>>
>> Em qui, 3 de out de 2019 às 06:41, Florencia Leonardi <florencia em usp.br>
>> escreveu:
>>
>>> Até me animaria a dizer que alguns desses nomes Donoho, Candes,
>>> Wasserman, Tibishirani, Michael Jordan, Girolamini, Hastie (adicionaria o
>>> Efron) são pouco citados nos cursos de Estatística, o que é mais grave.
>>> Há uma grande ressistência a fazer mudanças nos cursos, e as mudanças
>>> vão acontecer de baixo para cima, isto é porque os alunos começam a pedir.
>>> Eu não sou a favor de converter a Estatística em "ciência de dados", mas
>>> o curso deveria oferecer opções, e a chamada "ciência de dados" deveria ser
>>> uma. Não se pode ignorar que uma grande parte dos egressos dos cursos de
>>> Estatística estão trabalhando em áreas relacionadas à "ciência de dados".
>>> Saudações
>>> Florencia
>>>
>>> On Thu, Oct 3, 2019 at 2:55 AM <abe-request em lists.ime.usp.br> wrote:
>>>
>>>> Enviar submissões para a lista de discussão abe para
>>>>         abe em lists.ime.usp.br
>>>>
>>>> Para se cadastrar ou descadastrar via WWW, visite o endereço
>>>>         https://lists.ime.usp.br/listinfo/abe
>>>> ou, via email, envie uma mensagem com a palavra 'help' no assunto ou
>>>> corpo da mensagem para
>>>>         abe-request em lists.ime.usp.br
>>>>
>>>> Você poderá entrar em contato com a pessoa que gerencia a lista pelo
>>>> endereço
>>>>         abe-owner em lists.ime.usp.br
>>>>
>>>> Quando responder, por favor edite sua linha Assunto assim ela será
>>>> mais específica que "Re: Contents of abe digest..."
>>>>
>>>>
>>>> Tópicos de Hoje:
>>>>
>>>>    1. Re: Ciência de Dados (Heliton Tavares)
>>>>    2. Re: Ciência de Dados (Basilio de Braganca Pereira)
>>>>
>>>>
>>>> ----------------------------------------------------------------------
>>>>
>>>> Message: 1
>>>> Date: Wed, 2 Oct 2019 23:41:35 -0300
>>>> From: Heliton Tavares <helitontavares em gmail.com>
>>>> To: Doris Fontes <dsfontes em gmail.com>
>>>> Cc: abe-Lista <abe-l em ime.usp.br>
>>>> Subject: Re: [ABE-L] Ciência de Dados
>>>> Message-ID:
>>>>         <CALaDxYe5qZbgXf+TmfO63C2t-tSfk7p+fTfY=
>>>> LRZozkd-Jb_iw em mail.gmail.com>
>>>> Content-Type: text/plain; charset="utf-8"
>>>>
>>>> Inicialmente falei que ele estava completamente equivocado. Comentei
>>>> que os
>>>> Estatísticos normalmente estão bem empregados, abrindo espaço para
>>>> pessoas
>>>> de várias outras áreas, com denominações de Cientistas de Dados,
>>>> Engenheiros de Dados, Analistas de Dados etc., alguns da área de
>>>> Computação.  Depois falei que aprender a programar não é tudo na
>>>> ciência, e
>>>> que as técnicas estatísticas vão muito além de Estatísticas Básicas. Por
>>>> fim, falei que recentemente dei uma consultoria na avaliação de um App
>>>> de
>>>> Avaliação Educacional. Um belo layout, bem maquiado e cheiroso, mas
>>>> quando
>>>> eu abri o troço começou a feder. App bonitinho e ordinário! Bom, e a
>>>> mensagem surtiu efeito.
>>>>
>>>> No entanto, mesmo sabendo que sempre haverá espaço para o Clínico Geral
>>>> e o
>>>> Especialista na área de Estatística, fica claro que a melhor
>>>> possibilidade
>>>> de crescimento da área está escorrendo entre os dedos. A propaganda é a
>>>> alma do negócio, e os BI’s estão fazendo bem o dever de casa.
>>>>
>>>> Saudações Acadêmicas!
>>>>
>>>>
>>>>
>>>> On Wed, Oct 2, 2019 at 9:27 PM Doris Fontes <dsfontes em gmail.com> wrote:
>>>>
>>>> > E qual foi a intervenção que você fez, Heliton?
>>>> >
>>>> > Em qua, 2 de out de 2019 às 21:12, Heliton Tavares <
>>>> > helitontavares em gmail.com> escreveu:
>>>> >
>>>> >> Prezados,
>>>> >> Quando vi o comentário abaixo no site da ABE, lembrei de uma
>>>> palestra de
>>>> >> BI que assisti recentemente sobre Big Data, IA etc. O palestrante
>>>> comentou
>>>> >> que "*os Estatísticos ficaram atordoados diante de tanta informação e
>>>> >> foram atropelados pelos profissionais de BI*". Após a minha
>>>> intervenção
>>>> >> ele falou que jamais comentaria isso novamente, o que já deve ter
>>>> feito
>>>> >> inúmeras vezes. *A pergunta que fica aos futuros Estatísticos é*:
>>>> *qual
>>>> >> a parte que te cabe nesse latifúndio?*
>>>> >>
>>>> >> *Site da ABE*:
>>>> >>
>>>> >>
>>>> https://redeabe.org.br/site/noticias/matematica-da-usp-coordenara-escola-para-aplicacoes-em-ciencia-de-dados
>>>> >>
>>>> >>
>>>> >> *Comentário*:
>>>> >> *Os estatísticos poderiam estar mais ATIVOS nesse processo. Ciência
>>>> de
>>>> >> Dados avança rapidamente e os profissionais da estatística precisam
>>>> ser
>>>> >> mais pró-ativos para não ficarem para trás. A estatística está no
>>>> cerne das
>>>> >> análises de dados, mas a tecnologia anda assustando alguns
>>>> profissionais.*
>>>> >> _______________________________________________
>>>> >> abe mailing list
>>>> >> abe em lists.ime.usp.br
>>>> >> https://lists.ime.usp.br/listinfo/abe
>>>> >>
>>>> >
>>>> -------------- Próxima Parte ----------
>>>> Um anexo em HTML foi limpo...
>>>> URL: <
>>>> https://lists.ime.usp.br/archives/abe/attachments/20191002/a73495f7/attachment-0001.html
>>>> >
>>>>
>>>> ------------------------------
>>>>
>>>> Message: 2
>>>> Date: Thu, 3 Oct 2019 02:54:34 -0300
>>>> From: Basilio de Braganca Pereira <basilio em hucff.ufrj.br>
>>>> To: Heliton Tavares <helitontavares em gmail.com>
>>>> Cc: Doris Fontes <dsfontes em gmail.com>, abe-Lista <abe-l em ime.usp.br>
>>>> Subject: Re: [ABE-L] Ciência de Dados
>>>> Message-ID: <7F1837B8-1C54-48EC-AAF1-3D7B7CAAE518 em hucff.ufrj.br>
>>>> Content-Type: text/plain; charset="utf-8"
>>>>
>>>> Na minha opinião está moda de cientista dos dados parece muito com a
>>>> moda de Administração da Qualidade, Reengenharia , Qualidade Total .
>>>> Empresas mandavam administradores para encontros em hotéis caríssimos até
>>>> que Xeros, Coca Cola etc se convenceram que o que eles precisavam mesmo era
>>>> de Inspeção da Qualidade, controle e planejamento de experimentos.
>>>> Nomes como Donoho , Candes , Wasserman ,Tibishirani, Michael Jordan ,
>>>> Girolamini , Hastie etc não são citados nesta ciência de dados em geral
>>>> Basilio
>>>>
>>>> Enviado do meu iPhone
>>>>
>>>> Em 2 de out de 2019, à(s) 23:41, Heliton Tavares <
>>>> helitontavares em gmail.com> escreveu:
>>>>
>>>> > Inicialmente falei que ele estava completamente equivocado. Comentei
>>>> que os Estatísticos normalmente estão bem empregados, abrindo espaço para
>>>> pessoas de várias outras áreas, com denominações de Cientistas de Dados,
>>>> Engenheiros de Dados, Analistas de Dados etc., alguns da área de
>>>> Computação.  Depois falei que aprender a programar não é tudo na ciência, e
>>>> que as técnicas estatísticas vão muito além de Estatísticas Básicas. Por
>>>> fim, falei que recentemente dei uma consultoria na avaliação de um App de
>>>> Avaliação Educacional. Um belo layout, bem maquiado e cheiroso, mas quando
>>>> eu abri o troço começou a feder. App bonitinho e ordinário! Bom, e a
>>>> mensagem surtiu efeito.
>>>> >
>>>> > No entanto, mesmo sabendo que sempre haverá espaço para o Clínico
>>>> Geral e o Especialista na área de Estatística, fica claro que a melhor
>>>> possibilidade de crescimento da área está escorrendo entre os dedos. A
>>>> propaganda é a alma do negócio, e os BI’s estão fazendo bem o dever de casa.
>>>> >
>>>> > Saudações Acadêmicas!
>>>> >
>>>> >
>>>> >
>>>> >> On Wed, Oct 2, 2019 at 9:27 PM Doris Fontes <dsfontes em gmail.com>
>>>> wrote:
>>>> >> E qual foi a intervenção que você fez, Heliton?
>>>> >>
>>>> >>> Em qua, 2 de out de 2019 às 21:12, Heliton Tavares <
>>>> helitontavares em gmail.com> escreveu:
>>>> >>> Prezados,
>>>> >>> Quando vi o comentário abaixo no site da ABE, lembrei de uma
>>>> palestra de BI que assisti recentemente sobre Big Data, IA etc. O
>>>> palestrante comentou que "os Estatísticos ficaram atordoados diante de
>>>> tanta informação e foram atropelados pelos profissionais de BI". Após a
>>>> minha intervenção ele falou que jamais comentaria isso novamente, o que já
>>>> deve ter feito inúmeras vezes. A pergunta que fica aos futuros Estatísticos
>>>> é: qual a parte que te cabe nesse latifúndio?
>>>> >>>
>>>> >>> Site da ABE:
>>>> >>>
>>>> https://redeabe.org.br/site/noticias/matematica-da-usp-coordenara-escola-para-aplicacoes-em-ciencia-de-dados
>>>>
>>>> >>>
>>>> >>> Comentário:
>>>> >>> Os estatísticos poderiam estar mais ATIVOS nesse processo. Ciência
>>>> de Dados avança rapidamente e os profissionais da estatística precisam ser
>>>> mais pró-ativos para não ficarem para trás. A estatística está no cerne das
>>>> análises de dados, mas a tecnologia anda assustando alguns profissionais.
>>>> >>> _______________________________________________
>>>> >>> abe mailing list
>>>> >>> abe em lists.ime.usp.br
>>>> >>> https://lists.ime.usp.br/listinfo/abe
>>>> > _______________________________________________
>>>> > abe mailing list
>>>> > abe em lists.ime.usp.br
>>>> > https://lists.ime.usp.br/listinfo/abe
>>>> -------------- Próxima Parte ----------
>>>> Um anexo em HTML foi limpo...
>>>> URL: <
>>>> https://lists.ime.usp.br/archives/abe/attachments/20191003/f2262d43/attachment.html
>>>> >
>>>>
>>>> ------------------------------
>>>>
>>>> Subject: Legenda do Digest
>>>>
>>>> _______________________________________________
>>>> abe mailing list
>>>> abe em lists.ime.usp.br
>>>> https://lists.ime.usp.br/listinfo/abe
>>>>
>>>>
>>>> ------------------------------
>>>>
>>>> Fim da Digest abe, volume 65, assunto 6
>>>> ***************************************
>>>>
>>>
>>>
>>> _______________________________________________
>>> abe mailing list
>>> abe em lists.ime.usp.br
>>> https://lists.ime.usp.br/listinfo/abe
>>>
>> _______________________________________________
>> abe mailing list
>> abe em lists.ime.usp.br
>> https://lists.ime.usp.br/listinfo/abe
>>
>
>
> --
> Pedro Luis do Nascimento Silva
> IBGE - Escola Nacional de Ciências Estatísticas
> IBGE - National School of Statistical Sciences
> Phone: +55 21 21424957
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <https://lists.ime.usp.br/archives/abe/attachments/20191004/6794c6a8/attachment.html>


Mais detalhes sobre a lista de discussão abe