[ABE-L] BACHARELADO EM CIÊNCIA DE DADOS

Hedibert Lopes hedibert em gmail.com
Sex Set 23 09:57:55 -03 2022


Prezados Pedro, Dóris, Carlos,

Acho muito oportuna essa discussão e os dados/informação divididas por vocês três e gostaria de contribuir levantando algumas questões para as quais tenho alguma respostas bem subjetivas e baseadas nas graduações, mestrados e doutorados que ajudei a construir em estatística, economia e ciência de dados nos últimos 20 anos:


1) Até quando esses “cientistas de dados” rodadores de algoritmos terão espaço/emprego?  Não muito, eu diria menos de 10 anos.  Muito do que fazem será “automatizado”, mas não para os treinados com sólida base estatística.

2)  o treinamento dessa base sólida é só encontrado na estatística?  Não necessariamente, mas temos a faca e o queijo na mão.  Entretanto, engenheiros e o pessoal da computação já estão percebendo que precisam de mais estatística e pode acabar sequestrando muitos dos melhores potenciais candidatos.

3) Devemos lutar por esse domínio?  Não creio que seja a estratégia mais apropriada.  Acho que mais programas conjuntos com a computação serão benéficos pois pelo menos teremos noção de quem está sendo formado.  Temos vários “estatísticos” e programas excelentes vindo das escolas de engenharia elétrica, economia, biologia e áreas correlatas. 

4) Quais programas em estatística que se ajustaram a ciência de dados e foram bem sucedidos nos EUA, por exemplo?  A vasta maioria vem de escolas com excelentes programas em estatística, computação, engenharias, economia, biologia e áreas médicas.

Nossos programas de estatística e afins deviam continuar a tradição de formar com sólida base estatística e com amplo domínio de computação e algum treinamento em business.  Esses egressos serão, não tenho dúvida, os chefes dos cientistas de dados vindo das várias formações e também sobreviveram a explosão da bolha que acontecerá nos próximos 10 anos.  As simple as this.  Novamente, 100% subjetive thinking ;)


Abraços,
Hedibert 


> On Sep 23, 2022, at 7:30 AM, Carlos Abdalad <carlos.abdalad em gmail.com> wrote:
> 
> 
> Caro Prof. Morettin, Doris e colegas da comunidade.
> 
> Na minha "amostragem nada aleatória", o que tenho visto no mercado de trabalho são so auto-definidos "cientistas de dados" que fizeram um curso curto de extensão, ou pior, que fizeram algum "nano-degree" das plataformas de treinamento, que passa uma noção de Estatística e Probabilidade em poucas horas, e dá muita ênfase em receitas de bolo para "rodar algoritmos". Estes cientistas de dados estão sendo procurados pelas empresas como moscas brancas, tamanha a demanda por "executores de algoritmos". Eu tenho contato com muitos deles, e a "minoria" são egressos de cursos de Estatística (bacharelado, mestrado ou doutorado). A sua grande maioria são profissionais que têm alguma formação em exatas, tais como engenheiros de todos os tipos, pessoas com background de tecnologia (ciências da computação) e mais um monte de curiosos que tentam aprender Estatística Descritiva (para fazer o tal DataViz) e saber como "rodar" os algoritmos supervisionados ou não-supervisionados, "colando" os algoritmos campeões do Kaggle ou do Github. Muito provavelmente nenhum deles nunca estudou Amostragem, Planejamento de Experimentos, Inferência, Métodos Não-paramétricos, e afins.
> 
> É preocupante, mas é o que eu vejo no mercado.
> 
> Abraços.
> Carlos Abdalad
> 
>> On Fri, Sep 23, 2022 at 9:11 AM Pedro Alberto Morettin <pam em ime.usp.br> wrote:
>> Obrigado pelos comentários, Doris. Parece que os atuais "cientistas de dados" são, na maioria, egressos dos bacharelados/mestrados em estatística.
>> Deve haver "cientistas da computação", mas a maioria sabe pouco ou nada de Estatística.
>> Eu particularmente acho que criação de bacharelado ou mestrado em CD é um equívoco. No IME-USP está-se pensando em adicionar algumas disciplinas
>> ao bacharelado e mestrado em Estatística, mas os nomes atuais continuariam. No máximo, Mestrado em Estatística com ênfase em CD. Pelo que você
>> disse, um bacharel em CD  poderia se registrar no CONRE como estatístico? 
>> 
>> Abraço,
>> 
>> Pedro
>> 
>> PS1: A Folha teve um caderno especial sobre "cientistas políticos" (mais um, além de "cientistas sociais"). Parece que eles
>> estão interessados em "dados".
>> 
>> PS2:  A discussão sobre o que é Ciência permeia o assunto. Veja o e-mail do Anderson. Tukey já achava que
>> a análise exploratória de dados era uma ciência, e justificava porque. Segundo o filósofo K. Popper, somente
>> pode-se chamar de Ciência algo que produz dados para testar hipóteses. Ou seja, dados são a essência da Ciência.
>>  Nesse sentido, Matemática e Estatística não são ciências.
>> 
>> 
>> Pedro Alberto Morettin
>> PhD in  Statistics, UC Berkeley
>> Professor  Emeritus
>> Department of  Statistics
>> Tel: (55-11) 99666-4842
>> 
>> 
>> Instituto de Matemática e Estatística
>> Universidade de São Paulo
>> Rua do Matão, 1010 - CEP 05508-090 - São Paulo, SP
>> www.ime.usp.br
>> 
>> 
>>> Em qua., 21 de set. de 2022 às 22:52, Doris Fontes <dsfontes em gmail.com> escreveu:
>>> Oi, professor Pedro,
>>> 
>>> A grande diferença entre um Bacharelado em Obstetrícia e um Bacharelado em CD é a necessidade de uma habilitação específica, ou um registro em conselho profissional. Obstetrícia já era uma especialidade do Bacharel em Enfermagem, enquanto que CD jamais foi da Estatística. O mercado de trabalho também não exigirá nenhum registro de um cientista de dados. Pelos mesmos motivos que você apontou, não dá nem para dizer qual depto seria o adequado para ser o "pai" da CD. É uma área multidisciplinar e a formação mais adequada deveria ser (eu acho) numa pós: quem fez Bacharelado em Estatística se aprofunda em computação; quem fez computação se aprofunda em estatística. 
>>> 
>>> Mas a gente sabe que o mercado está super carente de profissionais que analisam dados, mas o próprio mercado ainda nem sabe bem quem é esse profissional. Elegeram o cientista de dados agora e, além do mais, convenhamos que o estatístico nunca foi adequadamente reconhecido como "o" analista de dados.
>>> 
>>> No documento da SBC, há um parágrafo que diz:
>>> 
>>> "O Bacharel em Ciência de Dados deve ter a capacidade de atuar em várias áreas, grande parte delas de forma ética e colaborativa, com profissionais de outras áreas do conhecimento, que entendam o significado dos dados analisados e possam validar os resultados obtidos. Assim, os Bacharéis em Ciência de Dados estarão qualificados para analisar dados de áreas tão diversas como administração, agronomia, ciências florestais, ciências sociais, economia, engenharia, geografia, história, medicina e veterinária, para citar algumas."
>>> 
>>> Tem diferença com o Bacharel em Estatística?
>>> 
>>> Como você também bem apontou, o conteúdo programático proposto contém muita estatística e sabemos que os cientistas da computação (na maioria) não se sentirão à vontade para ensinar. No entanto, caso cresça o número de Bacharelado em CD dentro do depto de Ciência da Computação, não vejo como a própria comunidade de estatística, mesmo querendo, possa ajudar. Para se ter uma ideia do tamanho dos cursos de computação:
>>> 
>>> 
>>> 
>>> Comparando com a Estatística - Aqui eu somei somente os cursos mais prováveis de existir entre as privadas, porque há muitas vagas autorizadas pelo MEC há anos, mas que nunca se transformam em turmas ativas.
>>> 
>>> E os cursos de CD - Excluindo os tecnológicos
>>> 
>>> 
>>> Há quem julgue que nem precisamos nos preocupar com a formação, afinal de contas, "o próprio mercado de trabalho resolve tudo sozinho". Só acho uma pena desperdiçar recursos universitários formando profissionais deficientes para este propósito em particular: analisar dados. 
>>> 
>>> Será que o Bacharelado em Estatística atrairá mais alunos com a onda da ciência de dados?
>>> 
>>> 
>>> 
>>> 
>>> abraços,
>>> Doris
>>> 
>>> 
>>>> Em qua., 21 de set. de 2022 às 17:06, Pedro Alberto Morettin <pam em ime.usp.br> escreveu:
>>>> Doris,
>>>> 
>>>> a primeira pergunta é: quem está habilitado a formar bacharéis em Ciência de Dados? Os departamentos de computação? de Estatística?
>>>> de Matemática Aplicada? Como a computação se apossou da área de CD, talvez  os primeiros se sintam à vontade, mas os tópicos
>>>> que você elencou mostram que não. Há alguns cursos de CD no Brasil mas acho que nenhum deles já formou a primeira turma. Os conselhos estaduais de
>>>> educação e o conselho federal de educação já se manifestaram sobre essa criação?
>>>> Se não, fica como a EACH-USP, que criou um bacharelado em Obstetrícia e os formados ficaram a ver navios, porque os conselhos de enfermagem 
>>>> não aceitaram essa nova profissão.
>>>> 
>>>> abraços,
>>>> 
>>>> Pedro
>>>> 
>>>> Pedro Alberto Morettin
>>>> PhD in  Statistics, UC Berkeley
>>>> Professor  Emeritus
>>>> Department of  Statistics
>>>> Tel: (55-11) 99666-4842
>>>> 
>>>> 
>>>> Instituto de Matemática e Estatística
>>>> Universidade de São Paulo
>>>> Rua do Matão, 1010 - CEP 05508-090 - São Paulo, SP
>>>> www.ime.usp.br
>>>> 
>>>> 
>>>>> Em qua., 21 de set. de 2022 às 14:47, Doris Fontes <dsfontes em gmail.com> escreveu:
>>>>> Caros colegas,
>>>>> 
>>>>> O assunto foi levantado aqui na lista algumas vezes, mas não sei se houve algum avanço da ABE no sentido de tecer mais parcerias junto à SBC para garantir que os futuros Bacharéis em Ciência de Dados tenham uma boa base estatística.
>>>>> 
>>>>> A SBC está com uma consulta pública e circulou uma mensagem pedindo para analisarem o conteúdo curricular proposto.
>>>>> 
>>>>> Compartilho abaixo a mensagem da SBC para os que tiverem interesse em acompanhar a discussão.
>>>>> 
>>>>> Resumidamente, os eixos e os conteúdos que tem relação direta com estatística são:
>>>>> 
>>>>> 1. EIXO DE FORMAÇÃO: FUNDAMENTOS DE MATEMÁTICA, ESTATÍSTICA E COMPUTAÇÃO PARA CIÊNCIA DE DADOS
>>>>> C.1.3. Compreender os principais temas de estatística básica
>>>>> Estatística Básica
>>>>> Planejamento de Experimentos
>>>>> Teste de Hipóteses
>>>>> Distribuições de Probabilidade
>>>>> 
>>>>> 2. EIXO DE FORMAÇÃO: RESOLUÇÃO DE PROBLEMAS
>>>>> C.2.3. Compreender os principais temas relacionados e relevantes para a Ciência de Dados
>>>>> Aprendizado de máquina
>>>>> Probabilidade e Estatística
>>>>> Engenharia e Exploração de Dados
>>>>> 
>>>>> 5. EIXO DE FORMAÇÃO: Dados em Larga Escala
>>>>> C.5.2. Compreender e explicar as dimensões quantitativas de um problema
>>>>> Estatística Básica
>>>>> Métodos Quantitativos em Computação
>>>>> 
>>>>> 6. EIXO DE FORMAÇÃO: MINERAÇÃO DE DADOS E APRENDIZADO DE MÁQUINA
>>>>> C.6.1. Avaliar e tratar a qualidade dos dados
>>>>> Estatística
>>>>> Banco de Dados
>>>>> Visualização de Dados
>>>>> Pré-processamento de Dados
>>>>> 
>>>>> C.6.2. Compreender as dimensões quantitativas de um problema
>>>>> Estatística
>>>>> Métodos Quantitativos em Computação
>>>>> Visualização de Dados
>>>>> 
>>>>> C.6.3. Planejar experimentos 
>>>>> Estatística 
>>>>> Fundamentos de Programação
>>>>> Visualização de Dados
>>>>> 
>>>>> C.6.4. Avaliar necessidade e aplicar técnicas de pré-processamento de dados
>>>>> Estatística
>>>>> Fundamentos de Programação
>>>>> Introdução a Ciência de Dados
>>>>> Visualização de Dados
>>>>> Mineração de Dados
>>>>> Aprendizado de Máquina
>>>>> Álgebra Linear e Matricial
>>>>> 
>>>>> 8. EIXO DE FORMAÇÃO: CIÊNCIA, TECNOLOGIA E INOVAÇÃO
>>>>> C.8.1. Identificar problemas que tenham solução algorítmica (CG-I)
>>>>> Algoritmos
>>>>> Teoria da Computação
>>>>> Complexidade de Algoritmos
>>>>> Estatística
>>>>> 
>>>>> 
>>>>> Percebe-se que existe uma quantidade razoável de conteúdo estatístico, mas um genérico "ESTATÍSTICA" não sei bem o que seria.
>>>>> 
>>>>> Abraços,
>>>>> Doris
>>>>> 
>>>>> ================================
>>>>> 
>>>>> Prezados Membros da Comunidade SBC
>>>>> 
>>>>> Em julho de 2021, a Sociedade Brasileira de Computação (SBC) por meio de sua Diretoria e Comissão de Educação, iniciou o processo de produção de referenciais de formação para cursos emergentes, a saber: Ciência de Dados, Cibersegurança e Inteligência Artificial. São cursos já existentes em outros países e que também já existem no Brasil, porém ainda não fazem parte das Diretrizes Curriculares Nacionais (DCN) do MEC. A última DCN é de 2016 e contempla os cursos de: Ciência da Computação, Engenharia de Computação, Licenciatura em Computação, Engenharia de Software e Sistemas de Informação.
>>>>> 
>>>>> Assim, é compromisso da SBC produzir um material especializado, sobre os referidos cursos emergentes, que oriente as instituições acerca das competências requeridas para formação de profissionais desses cursos. Os referenciais estão sendo desenvolvidos por subcomissões das Comissões Especiais da SBC em interação com a Diretoria e Comissão de Educação.
>>>>> 
>>>>> Apresentamos, para consulta pública, neste momento, os referenciais para o Curso de Ciência de Dados, elaborado pela seguinte subcomissão: 
>>>>> 
>>>>> Angelo Roncalli Alencar Brayner (coordenador), do Departamento de Computação (DC) da Universidade Federal do Ceará (UFC);
>>>>> André Carlos Ponce de Leon Ferreira de Carvalho, do Instituto de Ciências Matemáticas e de Computação (ICMC) da Universidade de São Paulo (USP);
>>>>> Duncan Ruiz, da Escola Politécnica (EP) da Pontifícia Católica do Rio Grande do Sul (PUCRS); e,
>>>>> Eduardo Ogasawara, do Departamento de Computação (DC) do Centro Federal de Educação Tecnológica Celso Suckow da Fonseca (CEFET/RJ).
>>>>> A consulta pública ficará aberta de 21/09/2022 a 24/10/2022. (prazo de 2 meses)
>>>>> 
>>>>> A proposta de referenciais para o Curso de Ciência de Dados está em:
>>>>> Ref. Curricular Bacharelado em Ciência de Dados (formato pdf)
>>>>> 
>>>>>  O link para o formulário de contribuição ao documento é:
>>>>> 
>>>>> https://forms.gle/RXZ58TxjVr4tmEGE6
>>>>> 
>>>>> Acesse também: https://www.sbc.org.br/home/educacao/consulta-publica-de-referenciais-de-formacao-para-cursos-emergentes-ciencia-de-dados
>>>>> 
>>>>> 
>>>>> 
>>>>> 
>>>>> 
>>>>> 
>>>>> 
>>>>> _______________________________________________
>>>>> abe mailing list
>>>>> abe em lists.ime.usp.br
>>>>> https://lists.ime.usp.br/listinfo/abe
>> _______________________________________________
>> abe mailing list
>> abe em lists.ime.usp.br
>> https://lists.ime.usp.br/listinfo/abe
> 
> 
> -- 
> Carlos Abdalad
> _______________________________________________
> abe mailing list
> abe em lists.ime.usp.br
> https://lists.ime.usp.br/listinfo/abe
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://lists.ime.usp.br/pipermail/abe/attachments/20220923/351ad11a/attachment-0001.htm>
-------------- Próxima Parte ----------
Um anexo não-texto foi limpo...
Nome: image.png
Tipo: image/png
Tamanho: 48127 bytes
Descrição: não disponível
URL: <http://lists.ime.usp.br/pipermail/abe/attachments/20220923/351ad11a/attachment-0004.png>
-------------- Próxima Parte ----------
Um anexo não-texto foi limpo...
Nome: image.png
Tipo: image/png
Tamanho: 36119 bytes
Descrição: não disponível
URL: <http://lists.ime.usp.br/pipermail/abe/attachments/20220923/351ad11a/attachment-0005.png>
-------------- Próxima Parte ----------
Um anexo não-texto foi limpo...
Nome: image.png
Tipo: image/png
Tamanho: 62176 bytes
Descrição: não disponível
URL: <http://lists.ime.usp.br/pipermail/abe/attachments/20220923/351ad11a/attachment-0006.png>
-------------- Próxima Parte ----------
Um anexo não-texto foi limpo...
Nome: 2020 Concluintes Tipo Instituição.png
Tipo: image/png
Tamanho: 34694 bytes
Descrição: não disponível
URL: <http://lists.ime.usp.br/pipermail/abe/attachments/20220923/351ad11a/attachment-0007.png>


Mais detalhes sobre a lista de discussão abe