<div dir="ltr">Caros,<br><br>Na próxima sexta-feira (<i><font color="#ff0000">14 de janeiro</font></i>, às <i><font color="#ff0000">13:30h</font></i>) o ciclo de Seminários do <i>Departamento de Estatística da UFMG</i> terá a apresentação de <b>Rosangela H. Loschi</b>.<br><br>Rosangela é Professora Titular do Departamento de Estatística da UFMG e atual coordenadora do Programa de Pós-Graduação em Estatística da UFMG. Ela obteve o grau de Doutora em Estatística pelo IME-USP. Suas linhas de pesquisa envolvem diversos temas dentro da Estatística Bayesiana e Pesquisa Operacional.<br><br>O seminário será transmitido ao vivo pelo canal do Youtube "<i><a href="https://www.youtube.com/channel/UCoZC2_pME9ca_-Hx4djd60w">Seminários DEST - UFMG</a></i>".<br><br>At.te,<br>Vinícius Mayrink<br><br><b>********** Título e Resumo **********<br></b><br>Rosangela H. Loschi (Departamento de Estatística, UFMG)<br><br><i>Handling categorical features with many levels using a product partition model.</i><br><br>A common difficulty in data analysis is how to handle categorical predictors with a large number of levels or categories. Few proposals have been developed to tackle this important and frequent problem. We introduce a generative model that simultaneously carries out the model fitting and the aggregation of the categorical levels into larger groups. We represent the categorical predictor by a graph where the nodes are the categories and establish a probability distribution over meaningful partitions of this graph. Conditionally on the observed data, we obtain a posterior distribution for the levels aggregation, allowing the inference about the most probable clustering for the categories. Simultaneously, we extract inference about all the other regression model parameters. We compare our and state-of-art methods showing that it has equally good predictive performance and more interpretable results. Our approach balances out accuracy versus interpretability, a current important concern in statistics and machine learning. Joint work with: Tulio Criscuolo (Google-USA), Renato Assunção (ESRI, USA), Wagner Meira (DCC, UFMG) and Danna Cruz (Universidad del Rosario, Co).<br clear="all"><div><br></div>-- <br><div dir="ltr" class="gmail_signature" data-smartmail="gmail_signature"><div dir="ltr"><div dir="ltr"><div dir="ltr"><i><font color="#999999">Vinícius D. Mayrink</font></i><div><i><font color="#999999">Professor Associado - Departamento de Estatística</font></i></div><div><i><font color="#999999">ICEx, Universidade Federal de Minas Gerais<br></font></i></div></div></div></div></div></div>