Uso das distribuições Poisson, Poisson-Gama, Poisson-Inversa Gaussiana e Poisson-Lindley Generalizada para dados de contagem
Palavras-chave:
Poisson, Superdispersão, Distribuições Compostas, Modelos Lineares Generalizados, Modelos HierárquicosResumo
A análise usual para dados discretos é através de uma distribuição de Poisson, Binomial ou Binomial Negativa, via Modelos Lineares Generalizados (MLG). Entretanto, um dos cuidados que se deve ter ao fazer a análise de dados discretos, é com a superdispersão. Esse termo é utilizado quando a presença de variação nos dados excede à variância nominal estipulada pelo modelo proposto. Dessa forma, a utilização de um modelo com base apenas na distribuição Poisson, que tem como suposição a equidispersão, não se apresenta como uma opção adequada. Uma alternativa para dados com essa característica é o uso das distribuições compostas, através dos modelos em dois estágios, ou hierárquicos, como uma forma para modelar essa superdispersão. A metodologia dos modelos em dois estágios associa, uma distribuição à resposta condicionada a sua média e, posteriormente, uma distribuição ao parâmetro de média, de forma que, incondicionalmente, se tem uma distribuição composta para a variável resposta. Neste trabalho é utilizada a distribuição clássica de Poisson, para dados de contagem, e as distribuições Gama, Inversa Gaussiana e Lindley Generalizada para o parâmetro de média da Poisson, que implicam nas distribuições compostas Poisson-Gama, Poisson-Inversa Gaussiana e a Poisson-Lindley Generalizada. Assim, o objetivo principal deste trabalho é apresentar esses modelos hierárquicos, que permitem a modelagem de dados de contagem com superdispersão. Também foram abordados alguns tipos de resíduos da estrutura dos MLGs, adaptados para as distribuições compostas.
Referências
ATKINSON, A. C. Plots, transformations, and regression : an introduction to graphical methods of diagnostic regression analysis. Oxford New York: Clarendon Press Oxford University Press, 1985.
BÉLISLE, C. Convergence theorems for a class of simulated annealing algorithms on d. Journal of Applied Probability, v. 29, p. 885–895, 1992.
BICKEL, P.; DOKSUM, K. Mathematical Statistics. Oakland: Holden-day, Inc., 1977.
BRESLOW, N. Extra-poisson variation in log-linear models. Applied Statistics, v.33, 1984.
CORDEIRO, G. M.; DEMÉTRIO, C. G. B. Modelos lineares generalizados e extensões. Departamento de Estística e Informática, Recife, PE. Departamento de Ciências Exatas, USP, 2008.
COSTA, S. C. Modelos Lineares Generalizados Mistos para Dados Longitudinais. Tese (Doutorado em Agronomia) Escola Superior de Agricultura, USP, 2003.
COX, D.; SNELL, E. A general definition of residuals. Journal of the Royal Statistical Society. Series B, v.30, 07 1968.
DUNN, P. K.; SMYTH, G. K. Randomized quantile residuals. Journal of Computational and Graphical Statistics, [American Statistical Association, Taylor Francis, Ltd., Institute of Mathematical Statistics, Interface Foundation of America], v.5, n.3, p.236–244, 1996.
ELBATAL, I.; MEROVCI, F.; ELGARHY, M. A new generalized lindley distribution. Mathematical Theory and Modeling, v.3, p.30–47, 2013.
FAHRMEIR, L.; TUTZ, G. Multivariate statistical modelling based on generalized linear models. 2nd ed. Journal of the American Statistical Association, v.91, 1996.
GREENWOOD, M.; YULE, G. U. An inquiry into the nature of frequency distributions representative of multiple happenings with particular reference to the occurrence of multiple attacks of disease or of repeated accidents. Journal of the Royal Statistical Society, [Wiley, Royal Statistical Society], v. 83, n. 2, p. 255–279, 1920.
HILBE, J. M. Modeling Count Data. Cambridge University Press, 2014.
HINDE, J.; DEMETRIO, C. Overdispersion: Models and estimation. Computational Statistics Data Analysis, v. 27, p. 151–170, 1998.
HOLLA, M. On a poisson-inverse gaussian distribution. Metrika, v. 11, p. 115–121, 1967.
LAMBERT, D. Zero-inflated poisson regression, with an application to defects in manufacturing. Technometrics, v. 34, 1992.
LINDLEY, D. Fiducial distributions and bayes’ theorem. Journal of the Royal Statistical Society. Series B, v. 20, 1958.
MAHMOUDI, E.; ZAKERZADEH, H. Generalized poisson–lindley distribution. Communications in Statistics—Theory and Methods, v. 39, p. 1785–1798, 2010.
MARCIANO, F. W. P. Principais tipos de resíduos utilizados na análise de diagnóstico em MLG com aplicações para os modelos: Poisson, ZIP e ZINB, 2009.
MCCULLAGH, J. A.; NELDER, P. Generalized linear models. Boca Raton London New York: Chapman and Hall, 1989.
MENDES, A. M. F. Modelo Poisson-Lindley Generalizada para dados de contagem com superdispersão. Monografia (Graduação em Estatística) – Departamento de Estatística e Matemática Aplicada, UFC, Fortaleza, 2017.
NELDER, J.A; WEDDERBURN, R.W.M. Generalized linear models. Journal of the Royal Statistical Society. Series A (General), v.135, n.3, p.370-384, 1972.
MYERS, R.; MONTGOMERY, D.; VINING, G.; ROBINSON, T. Generalized linear models: With applications in engineering and the sciences: Second edition. 2010.
PAULA, G. A. Modelos de regressão: com apoio computacional. 2013.
POISSON, S. Probabilité des jugements en matière criminelle et en matière civile, précédées des règles générales du calcul des probabilitiés. Paris, France: Bachelier, 1837.
PUTRI, G.; NURROHMAH, s.; FITHRIANI, I. Comparing poisson-inverse gaussian model and negative binomial model on case study: horseshoe crabs data. Journal of Physics: Conference Series, 2020.
RSTUDIO TEAM. RStudio: Integrated Development Environment for R. Boston, MA, 2020. Disponível em: http://www.rstudio.com/.
SANKARAN, M. The discrete poisson-lindley distribution. Biometrics, v.26, p.145, 1970.
WONGRIN, W.; BODHISUWAN, W. The poisson-generalized lindley distribution and its applications. v. 38, p. 645–656, 2016.
ZAKERZADEH, H.; DOLATI, A. Generalized lindley distribution. Journal of Mathematical Extension, v.3, p.13–25, 2009.
Downloads
Publicado
Como Citar
Edição
Seção
Licença
Proposta de Política para Periódicos de Acesso Livre
Autores que publicam nesta revista concordam com os seguintes termos:
- Autores mantém os direitos autorais e concedem à revista o direito de primeira publicação, com o trabalho simultaneamente licenciado sob a Licença Creative Commons Attribution que permite o compartilhamento do trabalho com reconhecimento da autoria e publicação inicial nesta revista.
- Autores têm autorização para assumir contratos adicionais separadamente, para distribuição não-exclusiva da versão do trabalho publicada nesta revista (ex.: publicar em repositório institucional ou como capítulo de livro), com reconhecimento de autoria e publicação inicial nesta revista.
- Autores têm permissão e são estimulados a publicar e distribuir seu trabalho online (ex.: em repositórios institucionais ou na sua página pessoal) a qualquer ponto antes ou durante o processo editorial, já que isso pode gerar alterações produtivas, bem como aumentar o impacto e a citação do trabalho publicado (Veja O Efeito do Acesso Livre).