<div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr"><div dir="ltr"><p style="background:transparent;margin-bottom:0.28cm;line-height:15.84px;font-family:Calibri,serif;font-size:11pt;color:rgb(0,0,0)"><span lang="pt-BR">Prezados</span></p>Dando continuidade a programação do <b>Omega Talk da RBras/UFPR</b>, o grupo de Jovens Pesquisadores da RBRas (JP) convida para a palestra de <b>Marcos Prates </b>Prof. do Departamento de Estatístisca da UFMG. Divulguem e participem.</div><div dir="ltr"><br>  <p style="background:transparent;margin-bottom:0.28cm;line-height:15.84px;font-family:Calibri,serif;font-size:11pt;direction:ltr;color:rgb(0,0,0)"><span lang="pt-BR"><b>Título:</b></span><span lang="pt-BR"> </span><span style="font-family:Arial,Helvetica,sans-serif;font-size:small;color:rgb(34,34,34)"> Is augmentation effective to improve prediction in imbalanced text datasets?</span></p>
        
        

<p style="background:transparent;margin-bottom:0.28cm;line-height:15.84px;font-family:Calibri,serif;font-size:11pt;direction:ltr;color:rgb(0,0,0)"><span lang="pt-BR"><b>Data: 25</b></span><span lang="pt-BR"><b>/10/2023 (quarta-feira)</b></span></p><p style="background:transparent;margin-bottom:0.28cm;line-height:15.84px;font-family:Calibri,serif;font-size:11pt;direction:ltr;color:rgb(0,0,0)"><span lang="pt-BR"><b>Horário:</b></span><span lang="pt-BR"> 20:00h</span></p><p style="background-image:initial;background-position:initial;background-size:initial;background-repeat:initial;background-origin:initial;background-clip:initial;margin-bottom:0.28cm;line-height:15.84px;direction:ltr"><span lang="pt-BR" style="color:rgb(0,0,0);font-family:Calibri,serif;font-size:11pt;background-color:transparent"><b>Resumo:</b></span><span style="color:rgb(34,34,34);font-family:"Times New Roman",serif;font-size:13pt;background-color:transparent"> </span>Imbalanced datasets present a significant challenge for machine learning models, often leading to biased predictions. To address this issue, data augmentation techniques are widely used in natural language processing (NLP) to generate new samples for the minority class. However, in this paper, we challenge the common assumption that data augmentation is always necessary to improve predictions on imbalanced datasets. Instead, we argue that adjusting the classifier cutoffs without data augmentation can produce similar results to oversampling techniques. Our study provides theoretical and empirical evidence to support this claim.  Our findings contribute to a better understanding of the strengths and limitations of different approaches to dealing with imbalanced data, and help researchers and practitioners make informed decisions about which methods to use for a given task.<br><br>Joint work with Gabriel Assunção e Rafael Izbicki.<br><br></p><p style="font-family:Verdana,Geneva,sans-serif;font-size:13.3333px"></p><p style="background:transparent;margin-bottom:0.28cm;line-height:15.84px;font-family:Calibri,serif;font-size:11pt;direction:ltr"><span style="font-family:Verdana,Geneva,sans-serif;font-size:13.3333px"><font color="#000000">Link da transmissão no YouTube:</font></span><span style="color:rgb(11,83,148);font-family:Verdana,Geneva,sans-serif;font-size:13.3333px"> </span><a href="https://www.youtube.com/watch?v=J-Xh7pq8ZtE" style="background-color:transparent;font-family:Arial,Helvetica,sans-serif;font-size:small;color:rgb(0,0,128)">https://www.youtube.com/watch?v=J-Xh7pq8ZtE</a></p>
        
        


<p style="margin-left:1.13cm;margin-bottom:0.42cm;line-height:100%;background:transparent">
<br>
<br>

</p>
<p style="margin-left:1.13cm;margin-bottom:0.42cm;line-height:100%;background:transparent"><img src="cid:ii_lo4qwzqe2" alt="image.png" width="398" height="398" style="margin-right: 0px;"><br></p></div></div></blockquote><div><br></div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr"><div dir="ltr"><b>Biografia: </b>Marcos Prates formou-se em 2006 no curso de Matemática Computacional da Universidade Federal de Minas Gerais (UFMG) e fez mestrado em Estatística em 2008 na mesma instituição. Em 2011 recebeu seu Ph.D. em Estatística pela University of Connecticut onde foi professor Visitante nos anos de 2019 e 2020. Atualmente, é Professor Associado do departamento de Estatística da UFMG. Suas principais áreas de pesquisa são Estatística Bayesiana, Modelos Lineares Mistos Generalizados, Aprendizado de Máquina e Estatística Espacial. Foi coordenador do programa de Pós-Graduação em Estatística da UFMG (2016-2018), secretário do ISBRA - capítulo brasileiro do ISBA (2015-2016) e foi Presidente da Associação Brasileira de Estatística - ABE (2020-2022). Atualmente é tesoureiro do ISBRA.os em periódicos internacionais.Organizador de Eventos da JP-RBras<p style="font-family:Verdana,Geneva,sans-serif;font-size:13.3333px"><br></p><p style="font-family:Verdana,Geneva,sans-serif;font-size:13.3333px"><br></p><div style="font-family:Verdana,Geneva,sans-serif;font-size:13.3333px"><p style="text-align:center"><img src="cid:18a3c561863a290f0331" width="116" height="123" style="display: block; margin-left: auto; margin-right: auto;"></p><p style="text-align:center"><strong>Jovens Pesquisadores da Região Brasileira</strong></p><p style="text-align:center"><strong>da Sociedade Internacional de Biometria</strong></p><p style="text-align:center">Histagram: @jp_rbras</p><p style="text-align:center">Site:<a href="https://jp83495.wixsite.com/jp-rbras" target="_blank">https://jp83495.wixsite.com/jp-rbras</a> </p><p style="text-align:center"><br></p><p style="text-align:center"><img></p></div></div></div>
</blockquote></div></div></div></div></div>