[ABE-L] Polêmica sobre pesquisa estatística da FEE

Richard Santos jamesrichardsantos em gmail.com
Qua Maio 13 18:28:50 -03 2015


Elias,
Concordo com vc sobre a evolução atual e futura do R.
Nos problemas interessantes que você citou concordo que o R une a
estatística à ferramenta computacional. O SAS e o SPSS também o fazem,
estes pontos que você citou. :-)
De fato nós estatísticos estamos muito bem servidos de software, que bom
que estamos discutindo capacidades dos nossos softwares, e não lacunas. :-)

Em 13 de maio de 2015 18:25, Elias T. Krainski <eliaskrainski em yahoo.com.br>
escreveu:

>  Eu sinceramente nao queria discutir...
>
> Ha' varios ranking de softwares associados a termos estatisticos. O
> problema e' que todos refletem algo "retrospectivo". Por exemplo, numero de
> oportunidades de empregos que citam software estatistico colocam SAS em
> primeiro. Numero de artigos cientificos colocam SPSS em primeiro (muitos
> artigos usando qui-quadrado ou teste-t :).
>
> O ponto que me motivou a escrever e' a avaliacao sob a perspectiva
> prospectiva. Um software com mais metodos implementados (prontos para uso)
> tende a se tornar mais utilizado.
>
> Considerando a evolucao temporal dos rankings citados anteriormente,
> observa-se o crescimento exponencial do R e o decaimento dos dois outros.
> Isso pelo desenvolvimento exponencial em torno do R. Pela recente
> popularidade em listas de discussao e blogs (ha mais de 500 blogs dedicados
> a R: http://www.r-bloggers.com/).
>
> Problemas faceis de resolver em R e que passaram a ser interessantes nos
> ultimos anos:
>  - leia os posts no twitter a cada hora, crie um grafico com as K palavras
> mais citadas com tamanho proporcional a frequencia (word cloud) e adicione
> esse resultado a uma pagina de internet.
>  - leia uma pagina de resultados de busca de anuncios de automoveis de um
> site e crie um modelo de regressao para estimar o efeito de ano de
> fabricacao no preco
>  - estime uma rede Bayesiana para um conjunto de dados medicos com 2000
> variaveis
>  - com os dados da PNAD, estime um mapa da taxa de desemprego
>  - estime um modelo para probabilidade de uma crianca nascer com certo
> problema considerando efeito suavizado de idade da mae (biologia da mae),
> coorte (quando a mae nasceu) e evolucao espaco-temporal considerando local
> de residencia da mae e ano de nascimento da crianca
>
> Os primeiros problemas acima sao, do ponto de vista de uso de metodos
> estatistico, triviais. Mas esses e outros mostram a facilidade de unir o
> ambiente de analise estatistica com ferramental tecnologico. Fazer isso em
> Python ou outra linguagem "mais de computeiros" pode ser ate' mais facil.
> Os ultimos problemas ja requerem metodos estatisticos que estao
> (praticamente) prontos para uso em poucos ambientes de analise de dados
> alem do R. Nesse sentido temos um ambiente com variedade de metodos e
> funcionalidades tecnologicas para analise de dados.
>
> Para conhecer mais de R da uma olhada em
> http://www.r-bloggers.com/
> http://cran.r-project.org/web/views/
> http://cran.r-project.org/web/packages/
>
> Elias.
>
>
> On 13/05/15 22:22, Richard Santos wrote:
>
> O IBGE disponibiliza os inputs das bases de dados em SAS e em R. Se o
> único software estatístico de verdade fosse o R o IBGE não poderia dar
> input em SAS, seria só em R.
>
> Em 13 de maio de 2015 16:55, Richard Santos <jamesrichardsantos em gmail.com>
> escreveu:
>
>> Eu não conheço o R, mas a ordem de software pode ser 1-R, 2-SAS, 3-SPSS,
>> tudo bem. Mas esses três são bons softwares estatísticos e que podem ser
>> usados.
>>
>> Em 13 de maio de 2015 16:46, Richard Santos <jamesrichardsantos em gmail.com
>> > escreveu:
>>
>>> Isso de "o R é o único software estatístico", não existe, rsrs. O SAS e
>>> o SPSS são muito bons softwares estatísticos também e que podem sim ser
>>> usados também. Mas o R pode ser dado como título de "o melhor", tudo bem,
>>> rsrs.
>>>
>>> Em 13 de maio de 2015 16:41, Richard Santos <
>>> jamesrichardsantos em gmail.com> escreveu:
>>>
>>>> O que eu acho genial em softwares, é poder ter BOAS opções de
>>>> preferência. Usuário de linguagem tem mais adaptação em uma ou a outra.
>>>> Cada software tem suas vantagens e desvantagens, verdade. Não acredito
>>>> e nem gosto de um software que é melhor em tudo.
>>>>
>>>> Em 13 de maio de 2015 16:38, Richard Santos <
>>>> jamesrichardsantos em gmail.com> escreveu:
>>>>
>>>>> Não, as planilhas e edição de texto citei como de fora da estatística,
>>>>> e da computação também.
>>>>> Entendi, essa velocidade de pessoas implementando o código aberto deve
>>>>> ser maior mesmo, esqueci disso.
>>>>> Na verdade, eu não comparo softwares. Não acho o R, ou SAS, ou o SPSS
>>>>> melhor de forma absoluta. Há preferências.
>>>>>
>>>>> Em 13 de maio de 2015 16:28, Elias T. Krainski <
>>>>> eliaskrainski em yahoo.com.br> escreveu:
>>>>>
>>>>>>
>>>>>> On 13/05/15 20:50, Richard Santos wrote:
>>>>>>
>>>>>>> o software livre ainda tem pouco tempo de desenvolvimento com
>>>>>>> relação ao software proprietário,
>>>>>>>
>>>>>>
>>>>>>  software livre tem mais tempo de desenvolvimento que o proprietario.
>>>>>> Quando voce inverte uma matriz no Matlab, voce esta usando biblioteca
>>>>>> Lapack, que e' livre.
>>>>>>
>>>>>>  assim, ainda leva mais tempo para, em algumas áreas, o software
>>>>>>> livre chegar à completude e à confiança de um software proprietário.
>>>>>>>
>>>>>>
>>>>>>  E' dificil conseguir implementacao melhor que Lapack. Em analise
>>>>>> estatistica o R e' o unico que tem certificado de compliance.
>>>>>> http://www.r-project.org/doc/R-FDA.pdf
>>>>>>
>>>>>> Nao se compara mais R com SAS e muito menos com SPSS. Essa comparacao
>>>>>> era feita a mais de cinco anos atras. O desenvolvimento no mundo de
>>>>>> software livre e' muito mais veloz. Alia's a SAS admitiu isso a alguns anos
>>>>>> atras quando criou uma API possibilitando usarios SAS a usarem codigo R. O
>>>>>> R tem hoje 6643 pacotes contribuidos oficiais (ha' tambem os nao oficiais).
>>>>>> Ha' quantos comandos/procs em SAS e SPSS?
>>>>>>
>>>>>> E' economicamente inviavel pagar alguem para implementar todo e
>>>>>> qualquer metodo. Ha' metodo tao especialista que seria caro pagar alguem
>>>>>> para implementar. E ao implementa-lo, nao haveria muito cliente interessado
>>>>>> em comprar para justificar o investimento.
>>>>>>
>>>>>> O R possui limitacoes, por sua natureza de ser uma linguagem
>>>>>> interpretada. Mas ha' verdadeiros genios que estao trabalhando para superar
>>>>>> suas limitacoes. No entanto, ha' tambem o aparecimento de outros softwares
>>>>>> livres, como alternativas. Um exemplo e' a liguagem Julia, que busca ser
>>>>>> mais eficiente. Na "computacao", ocorreu o contrario: Java e Python
>>>>>> apareceram com o objetivo de aumentar produtividade e tendo eficiencia como
>>>>>> nao sendo a questao central.
>>>>>>
>>>>>> Quanto 'as planilhas... nao as coloque como sendo softwares
>>>>>> estatisticos...
>>>>>>
>>>>>> Elias
>>>>>>
>>>>>>
>>>>>> _______________________________________________
>>>>>> abe mailing list
>>>>>> abe em lists.ime.usp.br
>>>>>> https://lists.ime.usp.br/mailman/listinfo/abe
>>>>>>
>>>>>
>>>>>
>>>>
>>>
>>
>
> --
> In God we trust, all others bring data.
>  – William Edwards Deming (1900-1993)
>
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <https://lists.ime.usp.br/archives/abe/attachments/20150513/f369ca0e/attachment.html>


Mais detalhes sobre a lista de discussão abe