Modelagem probabilística de dados de pagamentos de provedor de internet usando variável mista

Authors

  • Shirlley Oliveira da Silva Bacharela em Estatística pela Universidade Estadual da Paraíba
  • Divanilda Maia Professora do Departamento de Estatística da Universidade Estadual da Paraíba
  • Gustavo H. Esteves Professor do Departamento de Estatística da Universidade Estadual da Paraíba

Keywords:

Dados inflacionados de zeros, distribuição exponencial, variável degenerada em zero

Abstract

The objective of this work is to use a mixed random variable to model data from payments made by customers of a Paraíba city. In a data analysis, one of the first steps is to observe the nature of the variables involved and to make a graphical analysis of them. Generally, these variables can be classified as discrete or continuous. The discrete ones arise predominantly from categorizations or countings, while the continuous ones arise from measures. But there are still the mixed variables, which are obtained by making a weighted sum of discrete and continuous variables. In the case of the data used here, the graphical analysis indicated an exponential behavior, which is a continuous model for positive data. However, there was a large amount of null values, which gave rise to the idea of using a mixed variable, and the positive part will be modeled by the exponential distribution and the null ones by a degenerate variable at zero point.

References

AITCHISON, J. On the distribution of a positive random variable having a discrete probability mass at the origim. Journal of the American Statistical Association, vol. 50 n. 271, p. 901-908. 1955.

CHANDRA, S. On the mixtures of probability distributions. Scandinavian Journal of Statistics, vol. 4 n. 3, p. 105-112. 1977.

DAROS, M.; PINTO, N.~G.~M. Inadimplência no Brasil: uma análise das evidências empíricas. Revista de Administração IMED, vol. 7 n. 1, p. 208-229. 2017.

HAZRA, A.; BHATTACHARYA, S.; BANIK, P. A Bayesian zero-inflated exponential distribution model for the analysis of weekly rainfall of the eastern plateau region of India. MAUSAM, vol. 69 n. 1, p. 19-28. 2018.

HUANG, D.; HU, H.; LI, Y. Zero-Inflated Exponential Distribution of Casualty Rate in Ship Collision. J. Shanghai Jiao Tong Univ., vol. 24 n. 6, p. 739-744. 2019.

JAMES, B.R. Probabilidade: um curso em nível intermediário. 2ª Edição. Rio de Janeiro: IMPA, 2002. (Projeto Euclides).

MIN, Y.; AGRESTI, A. Modeling nonnegative data with clumping at zero: a survey. JIRSS., vol. 1 n. 1-2, p. 7-33. 2002.

R CORE TEAM. R: A Language and Environment for Statistical Computing. Vienna, Austria, 2020. Disponível em: http://www.R-project.org/.

ROSS, S. Probabilidade: um curso moderno com aplicações. [S.l.]:

Bookman, 2010.

WELD, C.; LEEMIS, L. Modeling mixed type random variables. Proceedings of the 2017 Winter Simulation Conference, p. 1595-1606. 2017.

WIKIPEDIA. Brejo Paraibano. Acesso em: 18 mar 2020. Disponível em: https://pt.wikipedia.org/wiki/Lista_de_mesorregiões_e_microrregiões_da_Paraíba#/media/Ficheiro:Paraiba_Micro_BrejoParaibano.svg

ZAMRI, N.S.N.; ZAMZURI, Z.H. A review on models for count data with extra zeros. AIP Conference Proceedings, vol. 1830. 2017.

Published

07-04-2021

How to Cite

da Silva, S. O. ., Maia, D., & Esteves, G. H. (2021). Modelagem probabilística de dados de pagamentos de provedor de internet usando variável mista. Sigmae, 9(2), 37–44. Retrieved from https://publicacoes.unifal-mg.edu.br/revistas/index.php/sigmae/article/view/1163

Issue

Section

Applied Statistics