<div dir="ltr">Elias,<div>Concordo com vc sobre a evolução atual e futura do R.</div><div>Nos problemas interessantes que você citou concordo que o R une a estatística à ferramenta computacional. O SAS e o SPSS também o fazem, estes pontos que você citou. :-)</div><div>De fato nós estatísticos estamos muito bem servidos de software, que bom que estamos discutindo capacidades dos nossos softwares, e não lacunas. :-)</div></div><div class="gmail_extra"><br><div class="gmail_quote">Em 13 de maio de 2015 18:25, Elias T. Krainski <span dir="ltr"><<a href="mailto:eliaskrainski@yahoo.com.br" target="_blank">eliaskrainski@yahoo.com.br</a>></span> escreveu:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div text="#000000" bgcolor="#FFFFFF">
Eu sinceramente nao queria discutir... <br>
<br>
Ha' varios ranking de softwares associados a termos estatisticos. O
problema e' que todos refletem algo "retrospectivo". Por exemplo,
numero de oportunidades de empregos que citam software estatistico
colocam SAS em primeiro. Numero de artigos cientificos colocam SPSS
em primeiro (muitos artigos usando qui-quadrado ou teste-t :). <br>
<br>
O ponto que me motivou a escrever e' a avaliacao sob a perspectiva
prospectiva. Um software com mais metodos implementados (prontos
para uso) tende a se tornar mais utilizado. <br>
<br>
Considerando a evolucao temporal dos rankings citados anteriormente,
observa-se o crescimento exponencial do R e o decaimento dos dois
outros. Isso pelo desenvolvimento exponencial em torno do R. Pela
recente popularidade em listas de discussao e blogs (ha mais de 500
blogs dedicados a R: <a href="http://www.r-bloggers.com/" target="_blank">http://www.r-bloggers.com/</a>). <br>
<br>
Problemas faceis de resolver em R e que passaram a ser interessantes
nos ultimos anos: <br>
- leia os posts no twitter a cada hora, crie um grafico com as K
palavras mais citadas com tamanho proporcional a frequencia (word
cloud) e adicione esse resultado a uma pagina de internet.<br>
- leia uma pagina de resultados de busca de anuncios de automoveis
de um site e crie um modelo de regressao para estimar o efeito de
ano de fabricacao no preco<br>
- estime uma rede Bayesiana para um conjunto de dados medicos com
2000 variaveis<br>
- com os dados da PNAD, estime um mapa da taxa de desemprego<br>
- estime um modelo para probabilidade de uma crianca nascer com
certo problema considerando efeito suavizado de idade da mae
(biologia da mae), coorte (quando a mae nasceu) e evolucao
espaco-temporal considerando local de residencia da mae e ano de
nascimento da crianca <br>
<br>
Os primeiros problemas acima sao, do ponto de vista de uso de
metodos estatistico, triviais. Mas esses e outros mostram a
facilidade de unir o ambiente de analise estatistica com ferramental
tecnologico. Fazer isso em Python ou outra linguagem "mais de
computeiros" pode ser ate' mais facil. Os ultimos problemas ja
requerem metodos estatisticos que estao (praticamente) prontos para
uso em poucos ambientes de analise de dados alem do R. Nesse sentido
temos um ambiente com variedade de metodos e funcionalidades
tecnologicas para analise de dados.<br>
<br>
Para conhecer mais de R da uma olhada em <br>
<a href="http://www.r-bloggers.com/" target="_blank">http://www.r-bloggers.com/</a><br>
<a href="http://cran.r-project.org/web/views/" target="_blank">http://cran.r-project.org/web/views/</a><br>
<a href="http://cran.r-project.org/web/packages/" target="_blank">http://cran.r-project.org/web/packages/</a><br>
<br>
Elias.<div><div class="h5"><br>
<br>
<div>On 13/05/15 22:22, Richard Santos
wrote:<br>
</div>
<blockquote type="cite">
<div dir="ltr">O IBGE disponibiliza os inputs das bases de dados
em SAS e em R. Se o único software estatístico de verdade fosse
o R o IBGE não poderia dar input em SAS, seria só em R.</div>
<div class="gmail_extra"><br>
<div class="gmail_quote">Em 13 de maio de 2015 16:55, Richard
Santos <span dir="ltr"><<a href="mailto:jamesrichardsantos@gmail.com" target="_blank">jamesrichardsantos@gmail.com</a>></span>
escreveu:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div dir="ltr">Eu não conheço o R, mas a ordem de software
pode ser 1-R, 2-SAS, 3-SPSS, tudo bem. Mas esses três são
bons softwares estatísticos e que podem ser usados.</div>
<div>
<div>
<div class="gmail_extra"><br>
<div class="gmail_quote">Em 13 de maio de 2015 16:46,
Richard Santos <span dir="ltr"><<a href="mailto:jamesrichardsantos@gmail.com" target="_blank">jamesrichardsantos@gmail.com</a>></span>
escreveu:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div dir="ltr">Isso de "o R é o único software
estatístico", não existe, rsrs. O SAS e o SPSS
são muito bons softwares estatísticos também e
que podem sim ser usados também. Mas o R pode
ser dado como título de "o melhor", tudo bem,
rsrs.</div>
<div>
<div>
<div class="gmail_extra"><br>
<div class="gmail_quote">Em 13 de maio de
2015 16:41, Richard Santos <span dir="ltr"><<a href="mailto:jamesrichardsantos@gmail.com" target="_blank">jamesrichardsantos@gmail.com</a>></span>
escreveu:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div dir="ltr">O que eu acho genial em
softwares, é poder ter BOAS opções de
preferência. Usuário de linguagem tem
mais adaptação em uma ou a outra.
<div>Cada software tem suas vantagens
e desvantagens, verdade. Não
acredito e nem gosto de um software
que é melhor em tudo.</div>
</div>
<div>
<div>
<div class="gmail_extra"><br>
<div class="gmail_quote">Em 13 de
maio de 2015 16:38, Richard
Santos <span dir="ltr"><<a href="mailto:jamesrichardsantos@gmail.com" target="_blank">jamesrichardsantos@gmail.com</a>></span>
escreveu:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div dir="ltr">Não, as
planilhas e edição de texto
citei como de fora da
estatística, e da computação
também.
<div>Entendi, essa
velocidade de pessoas
implementando o código
aberto deve ser maior
mesmo, esqueci disso.</div>
<div>Na verdade, eu não
comparo softwares. Não
acho o R, ou SAS, ou o
SPSS melhor de forma
absoluta. Há preferências.</div>
</div>
<div>
<div>
<div class="gmail_extra"><br>
<div class="gmail_quote">Em
13 de maio de 2015
16:28, Elias T.
Krainski <span dir="ltr"><<a href="mailto:eliaskrainski@yahoo.com.br" target="_blank">eliaskrainski@yahoo.com.br</a>></span>
escreveu:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><span><br>
On 13/05/15 20:50,
Richard Santos
wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
o software livre
ainda tem pouco
tempo de
desenvolvimento
com relação ao
software
proprietário,<br>
</blockquote>
<br>
</span>
software livre tem
mais tempo de
desenvolvimento que
o proprietario.
Quando voce inverte
uma matriz no
Matlab, voce esta
usando biblioteca
Lapack, que e'
livre.<span><br>
<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
assim, ainda
leva mais tempo
para, em algumas
áreas, o
software livre
chegar à
completude e à
confiança de um
software
proprietário.<br>
</blockquote>
<br>
</span>
E' dificil conseguir
implementacao melhor
que Lapack. Em
analise estatistica
o R e' o unico que
tem certificado de
compliance. <a href="http://www.r-project.org/doc/R-FDA.pdf" target="_blank">http://www.r-project.org/doc/R-FDA.pdf</a><br>
<br>
Nao se compara mais
R com SAS e muito
menos com SPSS. Essa
comparacao era feita
a mais de cinco anos
atras. O
desenvolvimento no
mundo de software
livre e' muito mais
veloz. Alia's a SAS
admitiu isso a
alguns anos atras
quando criou uma API
possibilitando
usarios SAS a usarem
codigo R. O R tem
hoje 6643 pacotes
contribuidos
oficiais (ha' tambem
os nao oficiais).
Ha' quantos
comandos/procs em
SAS e SPSS?<br>
<br>
E' economicamente
inviavel pagar
alguem para
implementar todo e
qualquer metodo. Ha'
metodo tao
especialista que
seria caro pagar
alguem para
implementar. E ao
implementa-lo, nao
haveria muito
cliente interessado
em comprar para
justificar o
investimento.<br>
<br>
O R possui
limitacoes, por sua
natureza de ser uma
linguagem
interpretada. Mas
ha' verdadeiros
genios que estao
trabalhando para
superar suas
limitacoes. No
entanto, ha' tambem
o aparecimento de
outros softwares
livres, como
alternativas. Um
exemplo e' a
liguagem Julia, que
busca ser mais
eficiente. Na
"computacao",
ocorreu o contrario:
Java e Python
apareceram com o
objetivo de aumentar
produtividade e
tendo eficiencia
como nao sendo a
questao central.<br>
<br>
Quanto 'as
planilhas... nao as
coloque como sendo
softwares
estatisticos...<span><font color="#888888"><br>
<br>
Elias</font></span>
<div>
<div><br>
<br>
_______________________________________________<br>
abe mailing list<br>
<a href="mailto:abe@lists.ime.usp.br" target="_blank">abe@lists.ime.usp.br</a><br>
<a href="https://lists.ime.usp.br/mailman/listinfo/abe" target="_blank">https://lists.ime.usp.br/mailman/listinfo/abe</a><br>
</div>
</div>
</blockquote>
</div>
<br>
</div>
</div>
</div>
</blockquote>
</div>
<br>
</div>
</div>
</div>
</blockquote>
</div>
<br>
</div>
</div>
</div>
</blockquote>
</div>
<br>
</div>
</div>
</div>
</blockquote>
</div>
<br>
</div>
</blockquote>
<br>
</div></div><span class="HOEnZb"><font color="#888888"><pre cols="72">--
In God we trust, all others bring data.
– William Edwards Deming (1900-1993)</pre>
</font></span></div>
</blockquote></div><br></div>