[ABE-L] BACHARELADO EM CIÊNCIA DE DADOS

Carlos Abdalad carlos.abdalad em gmail.com
Sex Set 23 09:29:33 -03 2022


Caro Prof. Morettin, Doris e colegas da comunidade.

Na minha "amostragem nada aleatória", o que tenho visto no mercado de
trabalho são so auto-definidos "cientistas de dados" que fizeram um curso
curto de extensão, ou pior, que fizeram algum "nano-degree" das plataformas
de treinamento, que passa uma noção de Estatística e Probabilidade em
poucas horas, e dá muita ênfase em receitas de bolo para "rodar
algoritmos". Estes cientistas de dados estão sendo procurados pelas
empresas como moscas brancas, tamanha a demanda por "executores de
algoritmos". Eu tenho contato com muitos deles, e a "minoria" são egressos
de cursos de Estatística (bacharelado, mestrado ou doutorado). A sua grande
maioria são profissionais que têm alguma formação em exatas, tais como
engenheiros de todos os tipos, pessoas com background de tecnologia
(ciências da computação) e mais um monte de curiosos que tentam aprender
Estatística Descritiva (para fazer o tal DataViz) e saber como "rodar" os
algoritmos supervisionados ou não-supervisionados, "colando" os algoritmos
campeões do Kaggle ou do Github. Muito provavelmente nenhum deles nunca
estudou Amostragem, Planejamento de Experimentos, Inferência, Métodos
Não-paramétricos, e afins.

É preocupante, mas é o que eu vejo no mercado.

Abraços.
Carlos Abdalad

On Fri, Sep 23, 2022 at 9:11 AM Pedro Alberto Morettin <pam em ime.usp.br>
wrote:

> Obrigado pelos comentários, Doris. Parece que os atuais "cientistas de
> dados" são, na maioria, egressos dos bacharelados/mestrados em estatística.
> Deve haver "cientistas da computação", mas a maioria sabe pouco ou nada de
> Estatística.
> Eu particularmente acho que criação de bacharelado ou mestrado em CD é um
> equívoco. No IME-USP está-se pensando em adicionar algumas disciplinas
> ao bacharelado e mestrado em Estatística, mas os nomes atuais
> continuariam. No máximo, Mestrado em Estatística com ênfase em CD. Pelo que
> você
> disse, um bacharel em CD  poderia se registrar no CONRE como estatístico?
>
> Abraço,
>
> Pedro
>
> PS1: A Folha teve um caderno especial sobre "cientistas políticos" (mais
> um, além de "cientistas sociais"). Parece que eles
> estão interessados em "dados".
>
> PS2:  A discussão sobre o que é Ciência permeia o assunto. Veja o e-mail
> do Anderson. Tukey já achava que
> a análise exploratória de dados era uma ciência, e justificava porque.
> Segundo o filósofo K. Popper, somente
> pode-se chamar de Ciência algo que produz dados para testar hipóteses. Ou
> seja, dados são a essência da Ciência.
>  Nesse sentido, Matemática e Estatística não são ciências.
>
>
> Pedro Alberto Morettin
>
> PhD in Statistics, UC Berkeley
>
> Professor Emeritus
>
> Department of  Statistics
>
> Tel: (55-11) 99666-4842
>
> Instituto de Matemática e Estatística
>
> Universidade de São Paulo
>
> Rua do Matão, 1010 - CEP 05508-090 - São Paulo, SP
>
> www.ime.usp.br
>
>
> Em qua., 21 de set. de 2022 às 22:52, Doris Fontes <dsfontes em gmail.com>
> escreveu:
>
>> Oi, professor Pedro,
>>
>> A grande diferença entre um Bacharelado em Obstetrícia e um Bacharelado
>> em CD é a necessidade de uma habilitação específica, ou um registro em
>> conselho profissional. Obstetrícia já era uma especialidade do Bacharel em
>> Enfermagem, enquanto que CD jamais foi da Estatística. O mercado de
>> trabalho também não exigirá nenhum registro de um cientista de dados. Pelos
>> mesmos motivos que você apontou, não dá nem para dizer qual depto seria o
>> adequado para ser o "pai" da CD. É uma área multidisciplinar e a formação
>> mais adequada deveria ser (eu acho) numa pós: quem fez Bacharelado em
>> Estatística se aprofunda em computação; quem fez computação se aprofunda em
>> estatística.
>>
>> Mas a gente sabe que o mercado está super carente de profissionais que
>> analisam dados, mas o próprio mercado ainda nem sabe bem quem é esse
>> profissional. Elegeram o cientista de dados agora e, além do mais,
>> convenhamos que o estatístico nunca foi adequadamente reconhecido como "o"
>> analista de dados.
>>
>> No documento da SBC, há um parágrafo que diz:
>>
>> "O Bacharel em Ciência de Dados deve ter a capacidade de atuar em várias
>> áreas, grande parte delas de forma ética e colaborativa, com profissionais
>> de outras áreas do conhecimento, que entendam o significado dos dados
>> analisados e possam validar os resultados obtidos. Assim, os Bacharéis em
>> Ciência de Dados estarão qualificados para analisar dados de áreas tão
>> diversas como administração, agronomia, ciências florestais, ciências
>> sociais, economia, engenharia, geografia, história, medicina e veterinária,
>> para citar algumas."
>>
>> Tem diferença com o Bacharel em Estatística?
>>
>> Como você também bem apontou, o conteúdo programático proposto contém
>> muita estatística e sabemos que os cientistas da computação (na maioria)
>> não se sentirão à vontade para ensinar. No entanto, caso cresça o número de
>> Bacharelado em CD dentro do depto de Ciência da Computação, não vejo como a
>> própria comunidade de estatística, mesmo querendo, possa ajudar. Para se
>> ter uma ideia do tamanho dos cursos de computação:
>>
>> [image: image.png]
>>
>> Comparando com a Estatística - Aqui eu somei somente os cursos mais
>> prováveis de existir entre as privadas, porque há muitas vagas autorizadas
>> pelo MEC há anos, mas que nunca se transformam em turmas ativas.
>> [image: image.png]
>> E os cursos de CD - Excluindo os tecnológicos
>> [image: image.png]
>>
>> Há quem julgue que nem precisamos nos preocupar com a formação, afinal de
>> contas, "o próprio mercado de trabalho resolve tudo sozinho". Só acho uma
>> pena desperdiçar recursos universitários formando profissionais deficientes
>> para este propósito em particular: analisar dados.
>>
>> Será que o Bacharelado em Estatística atrairá mais alunos com a onda da
>> ciência de dados?
>>
>> [image: 2020 Concluintes Tipo Instituição.png]
>>
>>
>> abraços,
>> Doris
>>
>>
>> Em qua., 21 de set. de 2022 às 17:06, Pedro Alberto Morettin <
>> pam em ime.usp.br> escreveu:
>>
>>> Doris,
>>>
>>> a primeira pergunta é: quem está habilitado a formar bacharéis em
>>> Ciência de Dados? Os departamentos de computação? de Estatística?
>>> de Matemática Aplicada? Como a computação se apossou da área de CD,
>>> talvez  os primeiros se sintam à vontade, mas os tópicos
>>> que você elencou mostram que não. Há alguns cursos de CD no Brasil mas
>>> acho que nenhum deles já formou a primeira turma. Os conselhos estaduais de
>>> educação e o conselho federal de educação já se manifestaram sobre essa
>>> criação?
>>> Se não, fica como a EACH-USP, que criou um bacharelado em Obstetrícia e
>>> os formados ficaram a ver navios, porque os conselhos de enfermagem
>>> não aceitaram essa nova profissão.
>>>
>>> abraços,
>>>
>>> Pedro
>>>
>>> Pedro Alberto Morettin
>>>
>>> PhD in Statistics, UC Berkeley
>>>
>>> Professor Emeritus
>>>
>>> Department of  Statistics
>>>
>>> Tel: (55-11) 99666-4842
>>>
>>> Instituto de Matemática e Estatística
>>>
>>> Universidade de São Paulo
>>>
>>> Rua do Matão, 1010 - CEP 05508-090 - São Paulo, SP
>>>
>>> www.ime.usp.br
>>>
>>>
>>> Em qua., 21 de set. de 2022 às 14:47, Doris Fontes <dsfontes em gmail.com>
>>> escreveu:
>>>
>>>> Caros colegas,
>>>>
>>>> O assunto foi levantado aqui na lista algumas vezes, mas não sei se
>>>> houve algum avanço da ABE no sentido de tecer mais parcerias junto à SBC
>>>> para garantir que os futuros Bacharéis em Ciência de Dados tenham uma boa
>>>> base estatística.
>>>>
>>>> A SBC está com uma consulta pública e circulou uma mensagem pedindo
>>>> para analisarem o conteúdo curricular proposto.
>>>>
>>>> Compartilho abaixo a mensagem da SBC para os que tiverem interesse em
>>>> acompanhar a discussão.
>>>>
>>>> Resumidamente, os eixos e os conteúdos que tem relação direta com
>>>> estatística são:
>>>>
>>>> *1. EIXO DE FORMAÇÃO: FUNDAMENTOS DE MATEMÁTICA, ESTATÍSTICA E
>>>> COMPUTAÇÃO PARA CIÊNCIA DE DADOS*
>>>> C.1.3. Compreender os principais temas de estatística básica
>>>> Estatística Básica
>>>> Planejamento de Experimentos
>>>> Teste de Hipóteses
>>>> Distribuições de Probabilidade
>>>>
>>>> *2. EIXO DE FORMAÇÃO: RESOLUÇÃO DE PROBLEMAS*
>>>> C.2.3. Compreender os principais temas relacionados e relevantes para a
>>>> Ciência de Dados
>>>> Aprendizado de máquina
>>>> Probabilidade e Estatística
>>>> Engenharia e Exploração de Dados
>>>>
>>>> *5. EIXO DE FORMAÇÃO: Dados em Larga Escala*
>>>> C.5.2. Compreender e explicar as dimensões quantitativas de um problema
>>>> Estatística Básica
>>>> Métodos Quantitativos em Computação
>>>>
>>>> *6. EIXO DE FORMAÇÃO: MINERAÇÃO DE DADOS E APRENDIZADO DE MÁQUINA*
>>>> C.6.1. Avaliar e tratar a qualidade dos dados
>>>> Estatística
>>>> Banco de Dados
>>>> Visualização de Dados
>>>> Pré-processamento de Dados
>>>>
>>>> C.6.2. Compreender as dimensões quantitativas de um problema
>>>> Estatística
>>>> Métodos Quantitativos em Computação
>>>> Visualização de Dados
>>>>
>>>> C.6.3. Planejar experimentos
>>>> Estatística
>>>> Fundamentos de Programação
>>>> Visualização de Dados
>>>>
>>>> C.6.4. Avaliar necessidade e aplicar técnicas de pré-processamento de
>>>> dados
>>>> Estatística
>>>> Fundamentos de Programação
>>>> Introdução a Ciência de Dados
>>>> Visualização de Dados
>>>> Mineração de Dados
>>>> Aprendizado de Máquina
>>>> Álgebra Linear e Matricial
>>>>
>>>> *8. EIXO DE FORMAÇÃO: CIÊNCIA, TECNOLOGIA E INOVAÇÃO*
>>>> C.8.1. Identificar problemas que tenham solução algorítmica (CG-I)
>>>> Algoritmos
>>>> Teoria da Computação
>>>> Complexidade de Algoritmos
>>>> Estatística
>>>>
>>>>
>>>> Percebe-se que existe uma quantidade razoável de conteúdo estatístico,
>>>> mas um genérico "ESTATÍSTICA" não sei bem o que seria.
>>>>
>>>> Abraços,
>>>> Doris
>>>>
>>>> ================================
>>>>
>>>>
>>>> *Prezados Membros da Comunidade SBC*
>>>>
>>>> *Em julho de 2021, a Sociedade Brasileira de Computação (SBC) por meio
>>>> de sua Diretoria e Comissão de Educação, iniciou o processo de produção de
>>>> referenciais de formação para cursos emergentes, a saber: Ciência de Dados,
>>>> Cibersegurança e Inteligência Artificial. São cursos já existentes em
>>>> outros países e que também já existem no Brasil, porém ainda não fazem
>>>> parte das Diretrizes Curriculares Nacionais (DCN)
>>>> <http://portal.mec.gov.br/escola-de-gestores-da-educacao-basica/323-secretarias-112877938/orgaos-vinculados-82187207/12991-diretrizes-curriculares-cursos-de-graduacao> do MEC
>>>> <http://portal.mec.gov.br/>. A última DCN é de 2016 e contempla os cursos
>>>> de: Ciência da Computação, Engenharia de Computação, Licenciatura em
>>>> Computação, Engenharia de Software e Sistemas de Informação.*
>>>>
>>>> *Assim, é compromisso da SBC produzir um material especializado, sobre
>>>> os referidos cursos emergentes, que oriente as instituições acerca das
>>>> competências requeridas para formação de profissionais desses cursos. Os
>>>> referenciais estão sendo desenvolvidos por subcomissões das Comissões
>>>> Especiais da SBC em interação com a Diretoria e Comissão de Educação.*
>>>>
>>>> *Apresentamos, para consulta pública, neste momento, os referenciais
>>>> para o Curso de Ciência de Dados, elaborado pela seguinte subcomissão: *
>>>>
>>>>    - *Angelo Roncalli Alencar Brayner (coordenador), do Departamento
>>>>    de Computação (DC)
>>>>    <https://centrodeciencias.ufc.br/pt/departamentos/departamento-de-computacao/> da Universidade
>>>>    Federal do Ceará (UFC) <https://www.ufc.br/>;*
>>>>
>>>>
>>>>    - *André Carlos Ponce de Leon Ferreira de Carvalho, do Instituto de
>>>>    Ciências Matemáticas e de Computação (ICMC)
>>>>    <https://www.icmc.usp.br/> da Universidade de São Paulo (USP)
>>>>    <https://www5.usp.br/>;*
>>>>
>>>>
>>>>    - *Duncan Ruiz, da Escola Politécnica (EP)
>>>>    <https://www.pucrs.br/politecnica/> da Pontifícia Católica do Rio Grande do
>>>>    Sul (PUCRS) <https://www.pucrs.br/>; e,*
>>>>
>>>>
>>>>    - *Eduardo Ogasawara, do Departamento de Computação (DC)
>>>>    <https://eic.cefet-rj.br/portal/> do Centro Federal de Educação Tecnológica
>>>>    Celso Suckow da Fonseca (CEFET/RJ) <http://www.cefet-rj.br/>.*
>>>>
>>>> *A consulta pública ficará aberta de 21/09/2022 a 24/10/2022. (prazo de
>>>> 2 meses)*
>>>>
>>>>
>>>> *A proposta de referenciais para o Curso de Ciência de Dados está
>>>> em:Ref. Curricular Bacharelado em Ciência de Dados
>>>> <https://www.sbc.org.br/documentos-da-sbc/send/131-curriculos-de-referencia/1402-ref-curricular-bacharelado-em-ciencia-de-dados> (formato
>>>> pdf)*
>>>>
>>>> * O link para o formulário de contribuição ao documento é:*
>>>>
>>>> *https://forms.gle/RXZ58TxjVr4tmEGE6*
>>>> <https://forms.gle/RXZ58TxjVr4tmEGE6>
>>>>
>>>> *Acesse
>>>> também: https://www.sbc.org.br/home/educacao/consulta-publica-de-referenciais-de-formacao-para-cursos-emergentes-ciencia-de-dados
>>>> <https://www.sbc.org.br/home/educacao/consulta-publica-de-referenciais-de-formacao-para-cursos-emergentes-ciencia-de-dados>*
>>>>
>>>>
>>>>
>>>>
>>>> _______________________________________________
>>>> abe mailing list
>>>> abe em lists.ime.usp.br
>>>> https://lists.ime.usp.br/listinfo/abe
>>>>
>>> _______________________________________________
> abe mailing list
> abe em lists.ime.usp.br
> https://lists.ime.usp.br/listinfo/abe
>


-- 
Carlos Abdalad
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://lists.ime.usp.br/pipermail/abe/attachments/20220923/c6de6818/attachment-0001.htm>
-------------- Próxima Parte ----------
Um anexo não-texto foi limpo...
Nome: image.png
Tipo: image/png
Tamanho: 48127 bytes
Descrição: não disponível
URL: <http://lists.ime.usp.br/pipermail/abe/attachments/20220923/c6de6818/attachment-0004.png>
-------------- Próxima Parte ----------
Um anexo não-texto foi limpo...
Nome: image.png
Tipo: image/png
Tamanho: 36119 bytes
Descrição: não disponível
URL: <http://lists.ime.usp.br/pipermail/abe/attachments/20220923/c6de6818/attachment-0005.png>
-------------- Próxima Parte ----------
Um anexo não-texto foi limpo...
Nome: image.png
Tipo: image/png
Tamanho: 62176 bytes
Descrição: não disponível
URL: <http://lists.ime.usp.br/pipermail/abe/attachments/20220923/c6de6818/attachment-0006.png>
-------------- Próxima Parte ----------
Um anexo não-texto foi limpo...
Nome: 2020 Concluintes Tipo Instituição.png
Tipo: image/png
Tamanho: 961268 bytes
Descrição: não disponível
URL: <http://lists.ime.usp.br/pipermail/abe/attachments/20220923/c6de6818/attachment-0007.png>


Mais detalhes sobre a lista de discussão abe