[ABE-L] Resgatando o p-value
Carlos Alberto de Bragança Pereira
cpereira em ime.usp.br
Sex Mar 6 19:04:03 -03 2015
Resgatando o p-value
Caros redistas gostaria muito de entrar nesta discussão que faz parte
de minha vida acadêmica. Assim vou contar algumas coisas que acho que
vale a pena. De forma alguma gostaria que pensassem que este texto é
autopromoção: Não é!
Anos atrás (muitos) quando estava em meu doutorado, conheci grandes
professores. O saudoso Oscar Kempthorne foi um deles e por eu ser
amigo do Zé ele também me deu muita atenção. Certo dia estava
escrevendo meus trabalhos em minha mesa quando chegou por traz e me
disse o seguinte: Carlos, a inferência Bayesiana só vai vingar e ser
usada quando tivermos uma alternativa Bayesiana para o p-value! (É
minha a tradução, como entendi.) Claro que me deu outros ensinamentos
importantes mas creio que para mim este foi fundamental.
Voltando ao Brasil aquela afirmação não me deixava em paz e persegui a
solução por 35 ou mais anos. Meu primeiro trabalho nessa linha foi
minha livre docência, na qual usava integrais de superfície para
distribuir priores para os subconjuntos paramétricos precisos -
dimensão menor do que o espaço original -. N mesma época orientei a
dissertação de mestrado da Telba que mais tarde resultou em dois
trabalhos que publicamos:
1. TZ Irony; CAB Pereira (1986), Exact tests for equality of two
proportions: Fisher v. Bayes. J Statistical Computation & Simulation
25:93-114.
2. TZ Irony; CAB Pereira (1995), Bayesian hypothesis test: using
surface inte-grals to distribute prior information among the
hypotheses, Resenhas 2(1);27-46.
Esse nosso trabalho na verdade foi baseado no teste generalizado de
Neyman-Pearson descrito pelo teorema 1 da seção de testes de Hipótese
do livro do DeGroot. Vou tentar descrever abaixo o que fizemos durante
todos esses anos.
Descobrimos que os frequentistas não conseguiam definir f_H(x) e
f_A(x), pois não sabiam colocar as funções dependendo apenas das
hipóteses A e H e não do parâmetro . Claro que poderiam usar o máximo
em cada uma das hipóteses. Nós então usamos o fator de Bayes (uma
função dividida pela outra no mesmo ponto x) para usar o teorema
generalizado de Neyman-Person, pois minimizávamos a combinação linear
das probabilidades dos dois tipos de erro. O lema de NP servia para
aceitar/rejeitar a hipótese, mas não para calcular o p-value. Com o
Sergio escrevemos então o P-value (não p-value) no seguinte trabalho:
3. CAB Pereira; S Wechsler (1993), On the concept of P-Value,
Brazilian J Probability & Statistics 7;159-77.
Neste artigo mostramos como calcular o novo p-value que usava as duas
hipóteses em sua definição. De fato nossa densidade de cálculo passou
a ser a f_H(x). Não ficava claro ali que estávamos ordenando o espaço
amostral pela razão de Bayes. Não ficou claro ali também que nosso
nível de significância era definido pelo alfa obtido pela minimização
da função linear das probabilidades dos dois erros. Mesmo em outro
artigo usando esta técnica não ficava claro qual a definição do nível
de significância. Importante notar que o nível assim obtido se
modifica com a mudança do tamanho da amostra e com as constantes da
combinação. Vejam o nosso artigo em genética onde nossos resultado
foram bem adequados:
4. LE Montoya-Delgado; TZ Irony; CAB Pereira; MR Whittle (2001), An
unconditional exact test for the Hardy-Weimberg Equilibrium Law:
Sample space ordering using the Bayes Factor, Genetics 158:875-83.
Como sabem minha preferência é para a estatística aplicada e usei essa
técnica muitas vezes em nossos trabalhos sem problemas com os referees.
Mas foi recentemente que acho que conseguimos discutir apropriadamente
essas coisas que tanto nos deu satisfação. Com meu amigo Luis Pericchi
escrevemos uma carta para o PNAS onde discutíamos uma carta de outro
professor. A discussão foi ótima e vocês podem conferir na seguinte
lista:
5. Johnson VE (2013) Revised standards for statistical evidence. PNAS
110(48):19313–17
6. A Gelman; CP Robert (2014), Letter PNAS 2014 111 (19) E1933
7. J Gaudart; L Huiart; PJ Milligan; R Thiebaut; R Giorgi (2014) PNAS
2014 111 (19) E1934
8. LR Pericchi; CAB Pereira; ME Pérez (2014) PNAS 2014 111 (19) E1935
9. Johnson VE (2014) Reply to Gelman, Gaudart, Pericchi: More reasons
to revise standards for statistical evidence PNAS 2014 111 (19)
E1936-E1937
Completando esse nosso trabalho frequentista/Bayesianista, eu e o Luis
estamos esperando a publicação de nosso artigo em BJPS que acreditamos
ter acabado com o paradoxo “aumente a amostra para rejeitar”. O artigo
está disponível na página da revista em
http://imstat.org/bjps/papers/BJPS257.pdf
Gostaria, no entanto, de dizer que temos a versão do p-value puramente
Bayesiana que denominamos e-value. O primeiro trabalho foi publicado
em 1999 e daí para frente a nossa lista de publicações com nosso valor
de evidência ficou bem grande. Evidentemente que vou fazer um pouco
de propaganda de nosso e-value colocando aqui alguns dos artigos mais
relevantes:
10. CAB Pereira; JM Stern (1999), Evidence and credibility: Full
Bayesian significance test of precise hypothesis, Entropy 1:99-110
11. CAB Pereira; MR Madruga; JM Stern (2002). Bayesian evidence test
for precise hypotheses. JSPI117:185-98.
12. MS Lauretto; CAB Pereira; JM Stern; S Zacks S (2003), Full
Bayesian Significance Test Applied to Multivariate Normal Structure
Models. BJPS 17:147-68.
13. CAB Pereira; JM Stern; S Wechsler (2008), Can a significance test
be genuinely Bayesian? Bayesian Analysis 3(1):79-100
14. JM Stern; CAB Pereira (2014) Bayesian epistemic values: focus on
surprise, measure probability! Logic Journal IGPL (2014) 22 (2): 236-254
Este último artigo é fruto dos muitos trabalhos em fundamentos lógicos
do FBST que meu colega e amigo Julio escreveu desde a criação de nosso
teste de significância. Lembro aos colegas que temos uma lista bem
grande de artigos com o FBST onde nós e outros colegas resolvemos
problemas muito interessantes.
Quando o assunto é teste de hipótese e de significância eu fico mesmo
sensibilizado pois lembro dos meus mestres Oscar Kempthorne e Dev Basu.
Para terminar gostaria de dizer que depois de meu primeiro trabalho
resolvi reler o livro do mestre Kemp e no capítulo de testes de
significância vejo a recomendação que fez para os Bayesianos e vi que
era justamente o que tinha realizado. Meus caros tudo que fizerem de
interessante voltem aos livros dos grandes mestres que encontrarão
tudo ali se tiverem fazendo a coisa correta.
Saudações a todas as mulheres da ABE-L
Lembro que nesse dia a minha ex aluna Telba copmpleta mais um ano de
vida. Meu amigo e mano Sergio Wechsler se não me engano é amanhã
Saudações
C
--
Carlos Alberto de Bragança Pereira
http://www.ime.usp.br/~cpereira
http://scholar.google.com.br/citations?user=PXX2AygAAAAJ&hl=pt-BR
Stat Department - Professor & Head
University of São Paulo
Mais detalhes sobre a lista de discussão abe