<div dir="ltr"><div class="gmail_default" style="font-family:verdana,sans-serif;font-size:small">Prezados(as) aos que puderem participar, sejam bem vindos.</div><div class="gmail_default" style="font-family:verdana,sans-serif;font-size:small"><br></div><div class="gmail_default" style="font-family:verdana,sans-serif;font-size:small">dia 20/02/2020 as 14:00 na sala 221, IMECC-UNICAMP</div><div class="gmail_default" style="font-family:verdana,sans-serif;font-size:small"><blockquote type="cite" style="font-family:Arial,Helvetica,sans-serif"><div dir="ltr"><div><br></div></div></blockquote></div><div class="gmail_default" style="font-family:verdana,sans-serif;font-size:small"><blockquote type="cite" style="font-family:Arial,Helvetica,sans-serif"><div dir="ltr"><div><p lang="en-US" align="center" style="margin-bottom:0cm;line-height:18px;break-before:page;direction:ltr"><font face="Times, serif"><font face="Times New Roman,
                serif"><font style="font-size:11pt"><b>An Extended Random-effects Approach to Modeling Repeated, Overdispersed Count Data</b></font></font></font></p><p lang="en-US" align="center" style="margin-bottom:0cm;line-height:18px;direction:ltr"><font face="Times, serif"><font face="Times New Roman,
                serif"><font style="font-size:11pt"><u>Clarice G.B. Demétrio</u></font></font><sup><font face="Times New Roman, serif"><font style="font-size:11pt">1</font></font></sup><font face="Times New Roman, serif"><font style="font-size:11pt">, Geert Molenberghs</font></font><sup><font face="Times
                  New Roman, serif"><font style="font-size:11pt">2</font></font></sup><font face="Times New Roman, serif"><font style="font-size:11pt">, Geert Verbeke</font></font><sup><font face="Times New
                  Roman, serif"><font style="font-size:11pt">3</font></font></sup></font></p><p align="center"><sup><font style="font-size:11pt"><i>1</i></font></sup><font style="font-size:11pt"><i>Departmeno de Ciências Exatas, ESALQ/USP, São Paulo, Brazil</i></font></p><p align="center"><sup><font style="font-size:11pt"><span lang="en-US"><i>2</i></span></font></sup><font style="font-size:11pt"><span lang="en-US"><i>Center for Statistics, Hasselt University, Diepenbeek, Belgium</i></span></font></p><p align="center"><sup><font style="font-size:11pt"><span lang="en-US"><i>3</i></span></font></sup><font style="font-size:11pt"><span lang="en-US"><i>Biostatistical Centre, Katholieke Universiteit Leuven, Leuven, Belgium</i></span></font></p><p lang="en-US" align="center"><br></p><p><font style="font-size:11pt"><span lang="en-US">Non-Gaussian outcomes are often modeled using members of the so-called exponential family. The Poisson model for count data falls within this tradition. The family in general, and the Poisson model in particular, are at the same time convenient since mathematically elegant, but in need of extension since often somewhat restrictive. Two of the main rationales for existing extensions are (1) the occurrence of overdispersion (Hinde and Demétrio 1998, </span></font><font style="font-size:11pt"><span lang="en-US"><i>Computational Statistics and Data Analysis</i></span></font><font style="font-size:11pt"><span lang="en-US"> </span></font><font style="font-size:11pt"><span lang="en-US"><b>27</b></span></font><font style="font-size:11pt"><span lang="en-US">, 151-170), in the sense that the variability in the data is not adequately captured by the model's prescribed mean-variance link, and (2) the accommodation of data hierarchies owing to, for example, repeatedly measuring the outcome on the same subject (</span></font><font style="font-size:11pt"><span lang="en-US">Molenberghs and Verbeke 2005, </span></font><font style="font-size:11pt"><span lang="en-US"><i>Models for Discrete Longitudinal Data</i></span></font><font style="font-size:11pt"><span lang="en-US">, Springer)</span></font><font style="font-size:11pt"><span lang="en-US">, recording information from various members of the same family, etc. There is a variety of overdispersion models for count data, such as, for example, the negative-binomial model. Hierarchies are often accommodated through the inclusion of subject-specific, random effects. Though not always, one conventionally assumes such random effects to be normally distributed. While both of these issues may occur simultaneously, models accommodating them at once are less than common. This paper proposes a generalized linear model, accommodating overdispersion and clustering through two separate sets of random effects, of gamma and normal type, respectively (</span></font><font style="font-size:11pt"><span lang="en-US">Molenberghs, Verbeke and Demétrio 2007, </span></font><font style="font-size:11pt"><span lang="en-US"><i>LIDA</i></span></font><font style="font-size:11pt"><span lang="en-US">, </span></font><font style="font-size:11pt"><span lang="en-US">13, 513-531, </span></font><font style="font-size:11pt"><span lang="en-US">Molenberghs et al, 2010, </span></font><font style="font-size:11pt"><span lang="en-US"><i>Statistical Science, </i></span></font><font style="font-size:11pt"><span lang="en-US">25:</span></font><font style="font-size:11pt"><span lang="en-US"> 325–347, Vangeneugden et al</span></font><font style="font-size:11pt"><span lang="en-US">, 2011, </span></font><font style="font-size:11pt"><span lang="en-US"><i>Journal of Applied Statistics</i></span></font><font style="font-size:11pt"><span lang="en-US">, 38: 215-232</span></font><font style="font-size:11pt"><span lang="en-US">).</span></font><font style="font-size:11pt"><span lang="en-US"> This is in line with the proposal by Booth, Casella, Friedl and Hobert (2003, </span></font><font style="font-size:11pt"><span lang="en-US"><i>Statistical Modelling</i></span></font><font style="font-size:11pt"><span lang="en-US"> </span></font><font style="font-size:11pt"><span lang="en-US"><b>3</b></span></font><font style="font-size:11pt"><span lang="en-US">, 179-181). The model extends both classical overdispersion models for count data (Breslow 1984, </span></font><font style="font-size:11pt"><span lang="en-US"><i>Applied Statistics</i></span></font><font style="font-size:11pt"><span lang="en-US"> </span></font><font style="font-size:11pt"><span lang="en-US"><b>33</b></span></font><font style="font-size:11pt"><span lang="en-US">, 38-44), in particular the negative binomial model, as well as the generalized linear mixed model (Breslow and Clayton 1993, </span></font><font style="font-size:11pt"><span lang="en-US"><i>JASA</i></span></font><font style="font-size:11pt"><span lang="en-US"> </span></font><font style="font-size:11pt"><span lang="en-US"><b>88</b></span></font><font style="font-size:11pt"><span lang="en-US">, 9-25). Apart from model formulation, we briefly discuss several estimation options, and then settle for maximum likelihood estimation with both fully analytic integration as well as hybrid between analytic and numerical integration. The latter is implemented in the SAS procedure NLMIXED. The methodology is applied to data from a study in epileptic seizures.</span></font></p><p lang="en-US"><br></p></div></div></blockquote><br class="gmail-Apple-interchange-newline"></div><br clear="all"><div><br></div>-- <br><div dir="ltr" class="gmail_signature" data-smartmail="gmail_signature"><div dir="ltr"><div><div dir="ltr"><div><div>Ronaldo Dias, Ph.D.</div>Professor<div>Dept. of Statistics-IMECC, UNICAMP</div><div><a href="http://www.ime.unicamp.br/~dias" target="_blank">www.ime.unicamp.br/~dias</a></div><div><br></div></div></div></div></div></div></div>