[ABE-L] Polêmica sobre pesquisa estatística da FEE

Elias T. Krainski eliaskrainski em yahoo.com.br
Qua Maio 13 18:25:05 -03 2015


Eu sinceramente nao queria discutir...

Ha' varios ranking de softwares associados a termos estatisticos. O 
problema e' que todos refletem algo "retrospectivo". Por exemplo, numero 
de oportunidades de empregos que citam software estatistico colocam SAS 
em primeiro. Numero de artigos cientificos colocam SPSS em primeiro 
(muitos artigos usando qui-quadrado ou teste-t :).

O ponto que me motivou a escrever e' a avaliacao sob a perspectiva 
prospectiva. Um software com mais metodos implementados (prontos para 
uso) tende a se tornar mais utilizado.

Considerando a evolucao temporal dos rankings citados anteriormente, 
observa-se o crescimento exponencial do R e o decaimento dos dois 
outros. Isso pelo desenvolvimento exponencial em torno do R. Pela 
recente popularidade em listas de discussao e blogs (ha mais de 500 
blogs dedicados a R: http://www.r-bloggers.com/).

Problemas faceis de resolver em R e que passaram a ser interessantes nos 
ultimos anos:
  - leia os posts no twitter a cada hora, crie um grafico com as K 
palavras mais citadas com tamanho proporcional a frequencia (word cloud) 
e adicione esse resultado a uma pagina de internet.
  - leia uma pagina de resultados de busca de anuncios de automoveis de 
um site e crie um modelo de regressao para estimar o efeito de ano de 
fabricacao no preco
  - estime uma rede Bayesiana para um conjunto de dados medicos com 2000 
variaveis
  - com os dados da PNAD, estime um mapa da taxa de desemprego
  - estime um modelo para probabilidade de uma crianca nascer com certo 
problema considerando efeito suavizado de idade da mae (biologia da 
mae), coorte (quando a mae nasceu) e evolucao espaco-temporal 
considerando local de residencia da mae e ano de nascimento da crianca

Os primeiros problemas acima sao, do ponto de vista de uso de metodos 
estatistico, triviais. Mas esses e outros mostram a facilidade de unir o 
ambiente de analise estatistica com ferramental tecnologico. Fazer isso 
em Python ou outra linguagem "mais de computeiros" pode ser ate' mais 
facil. Os ultimos problemas ja requerem metodos estatisticos que estao 
(praticamente) prontos para uso em poucos ambientes de analise de dados 
alem do R. Nesse sentido temos um ambiente com variedade de metodos e 
funcionalidades tecnologicas para analise de dados.

Para conhecer mais de R da uma olhada em
http://www.r-bloggers.com/
http://cran.r-project.org/web/views/
http://cran.r-project.org/web/packages/

Elias.

On 13/05/15 22:22, Richard Santos wrote:
> O IBGE disponibiliza os inputs das bases de dados em SAS e em R. Se o 
> único software estatístico de verdade fosse o R o IBGE não poderia dar 
> input em SAS, seria só em R.
>
> Em 13 de maio de 2015 16:55, Richard Santos 
> <jamesrichardsantos em gmail.com <mailto:jamesrichardsantos em gmail.com>> 
> escreveu:
>
>     Eu não conheço o R, mas a ordem de software pode ser 1-R, 2-SAS,
>     3-SPSS, tudo bem. Mas esses três são bons softwares estatísticos e
>     que podem ser usados.
>
>     Em 13 de maio de 2015 16:46, Richard Santos
>     <jamesrichardsantos em gmail.com
>     <mailto:jamesrichardsantos em gmail.com>> escreveu:
>
>         Isso de "o R é o único software estatístico", não existe,
>         rsrs. O SAS e o SPSS são muito bons softwares estatísticos
>         também e que podem sim ser usados também. Mas o R pode ser
>         dado como título de "o melhor", tudo bem, rsrs.
>
>         Em 13 de maio de 2015 16:41, Richard Santos
>         <jamesrichardsantos em gmail.com
>         <mailto:jamesrichardsantos em gmail.com>> escreveu:
>
>             O que eu acho genial em softwares, é poder ter BOAS opções
>             de preferência. Usuário de linguagem tem mais adaptação em
>             uma ou a outra.
>             Cada software tem suas vantagens e desvantagens, verdade.
>             Não acredito e nem gosto de um software que é melhor em tudo.
>
>             Em 13 de maio de 2015 16:38, Richard Santos
>             <jamesrichardsantos em gmail.com
>             <mailto:jamesrichardsantos em gmail.com>> escreveu:
>
>                 Não, as planilhas e edição de texto citei como de fora
>                 da estatística, e da computação também.
>                 Entendi, essa velocidade de pessoas implementando o
>                 código aberto deve ser maior mesmo, esqueci disso.
>                 Na verdade, eu não comparo softwares. Não acho o R, ou
>                 SAS, ou o SPSS melhor de forma absoluta. Há preferências.
>
>                 Em 13 de maio de 2015 16:28, Elias T. Krainski
>                 <eliaskrainski em yahoo.com.br
>                 <mailto:eliaskrainski em yahoo.com.br>> escreveu:
>
>
>                     On 13/05/15 20:50, Richard Santos wrote:
>
>                         o software livre ainda tem pouco tempo de
>                         desenvolvimento com relação ao software
>                         proprietário,
>
>
>                     software livre tem mais tempo de desenvolvimento
>                     que o proprietario. Quando voce inverte uma matriz
>                     no Matlab, voce esta usando biblioteca Lapack, que
>                     e' livre.
>
>                         assim, ainda leva mais tempo para, em algumas
>                         áreas, o software livre chegar à completude e
>                         à confiança de um software proprietário.
>
>
>                     E' dificil conseguir implementacao melhor que
>                     Lapack. Em analise estatistica o R e' o unico que
>                     tem certificado de compliance.
>                     http://www.r-project.org/doc/R-FDA.pdf
>
>                     Nao se compara mais R com SAS e muito menos com
>                     SPSS. Essa comparacao era feita a mais de cinco
>                     anos atras. O desenvolvimento no mundo de software
>                     livre e' muito mais veloz. Alia's a SAS admitiu
>                     isso a alguns anos atras quando criou uma API
>                     possibilitando usarios SAS a usarem codigo R. O R
>                     tem hoje 6643 pacotes contribuidos oficiais (ha'
>                     tambem os nao oficiais). Ha' quantos
>                     comandos/procs em SAS e SPSS?
>
>                     E' economicamente inviavel pagar alguem para
>                     implementar todo e qualquer metodo. Ha' metodo tao
>                     especialista que seria caro pagar alguem para
>                     implementar. E ao implementa-lo, nao haveria muito
>                     cliente interessado em comprar para justificar o
>                     investimento.
>
>                     O R possui limitacoes, por sua natureza de ser uma
>                     linguagem interpretada. Mas ha' verdadeiros genios
>                     que estao trabalhando para superar suas
>                     limitacoes. No entanto, ha' tambem o aparecimento
>                     de outros softwares livres, como alternativas. Um
>                     exemplo e' a liguagem Julia, que busca ser mais
>                     eficiente. Na "computacao", ocorreu o contrario:
>                     Java e Python apareceram com o objetivo de
>                     aumentar produtividade e tendo eficiencia como nao
>                     sendo a questao central.
>
>                     Quanto 'as planilhas... nao as coloque como sendo
>                     softwares estatisticos...
>
>                     Elias
>
>
>                     _______________________________________________
>                     abe mailing list
>                     abe em lists.ime.usp.br <mailto:abe em lists.ime.usp.br>
>                     https://lists.ime.usp.br/mailman/listinfo/abe
>
>
>
>
>
>

-- 
In God we trust, all others bring data.
  – William Edwards Deming (1900-1993)

-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <https://lists.ime.usp.br/archives/abe/attachments/20150513/5176a001/attachment.html>


Mais detalhes sobre a lista de discussão abe