Modelagem probabilística de dados de pagamentos de provedor de internet usando variável mista
Keywords:
Dados inflacionados de zeros, distribuição exponencial, variável degenerada em zeroAbstract
The objective of this work is to use a mixed random variable to model data from payments made by customers of a Paraíba city. In a data analysis, one of the first steps is to observe the nature of the variables involved and to make a graphical analysis of them. Generally, these variables can be classified as discrete or continuous. The discrete ones arise predominantly from categorizations or countings, while the continuous ones arise from measures. But there are still the mixed variables, which are obtained by making a weighted sum of discrete and continuous variables. In the case of the data used here, the graphical analysis indicated an exponential behavior, which is a continuous model for positive data. However, there was a large amount of null values, which gave rise to the idea of using a mixed variable, and the positive part will be modeled by the exponential distribution and the null ones by a degenerate variable at zero point.
References
AITCHISON, J. On the distribution of a positive random variable having a discrete probability mass at the origim. Journal of the American Statistical Association, vol. 50 n. 271, p. 901-908. 1955.
CHANDRA, S. On the mixtures of probability distributions. Scandinavian Journal of Statistics, vol. 4 n. 3, p. 105-112. 1977.
DAROS, M.; PINTO, N.~G.~M. Inadimplência no Brasil: uma análise das evidências empíricas. Revista de Administração IMED, vol. 7 n. 1, p. 208-229. 2017.
HAZRA, A.; BHATTACHARYA, S.; BANIK, P. A Bayesian zero-inflated exponential distribution model for the analysis of weekly rainfall of the eastern plateau region of India. MAUSAM, vol. 69 n. 1, p. 19-28. 2018.
HUANG, D.; HU, H.; LI, Y. Zero-Inflated Exponential Distribution of Casualty Rate in Ship Collision. J. Shanghai Jiao Tong Univ., vol. 24 n. 6, p. 739-744. 2019.
JAMES, B.R. Probabilidade: um curso em nível intermediário. 2ª Edição. Rio de Janeiro: IMPA, 2002. (Projeto Euclides).
MIN, Y.; AGRESTI, A. Modeling nonnegative data with clumping at zero: a survey. JIRSS., vol. 1 n. 1-2, p. 7-33. 2002.
R CORE TEAM. R: A Language and Environment for Statistical Computing. Vienna, Austria, 2020. Disponível em: http://www.R-project.org/.
ROSS, S. Probabilidade: um curso moderno com aplicações. [S.l.]:
Bookman, 2010.
WELD, C.; LEEMIS, L. Modeling mixed type random variables. Proceedings of the 2017 Winter Simulation Conference, p. 1595-1606. 2017.
WIKIPEDIA. Brejo Paraibano. Acesso em: 18 mar 2020. Disponível em: https://pt.wikipedia.org/wiki/Lista_de_mesorregiões_e_microrregiões_da_Paraíba#/media/Ficheiro:Paraiba_Micro_BrejoParaibano.svg
ZAMRI, N.S.N.; ZAMZURI, Z.H. A review on models for count data with extra zeros. AIP Conference Proceedings, vol. 1830. 2017.
Downloads
Published
How to Cite
Issue
Section
License
Proposta de Política para Periódicos de Acesso Livre
Autores que publicam nesta revista concordam com os seguintes termos:
- Autores mantém os direitos autorais e concedem à revista o direito de primeira publicação, com o trabalho simultaneamente licenciado sob a Licença Creative Commons Attribution que permite o compartilhamento do trabalho com reconhecimento da autoria e publicação inicial nesta revista.
- Autores têm autorização para assumir contratos adicionais separadamente, para distribuição não-exclusiva da versão do trabalho publicada nesta revista (ex.: publicar em repositório institucional ou como capítulo de livro), com reconhecimento de autoria e publicação inicial nesta revista.
- Autores têm permissão e são estimulados a publicar e distribuir seu trabalho online (ex.: em repositórios institucionais ou na sua página pessoal) a qualquer ponto antes ou durante o processo editorial, já que isso pode gerar alterações produtivas, bem como aumentar o impacto e a citação do trabalho publicado (Veja O Efeito do Acesso Livre).