Modelagem probabilística de dados de pagamentos de provedor de internet usando variável mista
Palabras clave:
Dados inflacionados de zeros, distribuição exponencial, variável degenerada em zeroResumen
O objetivo deste trabalho é usar uma variável aleatória mista para modelar dados de pagamentos de provedor de internet feitos pelos clientes de uma empresa de um cidade da Paraíba. Numa análise de dados, um dos primeiros passos é observar a natureza das variáveis envolvidas e fazer uma análise gráfica delas. Geralmente, essas variáveis podem ser classificadas como discretas ou contínuas. As discretas surgem preponderantemente de categorizações ou de contagens, enquanto que as contínuas surgem de medidas. Mas existem ainda as variáveis mistas, que são obtidas fazendo-se uma soma ponderada de variáveis discretas e contínuas. No caso dos dados aqui utilizados, a análise gráfica indicou um comportamento exponencial, que é um modelo contínuo para dados positivos. No entanto, havia uma grande quantidade de valores nulos, de onde surgiu a ideia de usar uma variável mista, sendo que a parte positiva será modelada pela distribuição exponencial e os valores nulos por uma variável degenerada no ponto zero.
Citas
AITCHISON, J. On the distribution of a positive random variable having a discrete probability mass at the origim. Journal of the American Statistical Association, vol. 50 n. 271, p. 901-908. 1955.
CHANDRA, S. On the mixtures of probability distributions. Scandinavian Journal of Statistics, vol. 4 n. 3, p. 105-112. 1977.
DAROS, M.; PINTO, N.~G.~M. Inadimplência no Brasil: uma análise das evidências empíricas. Revista de Administração IMED, vol. 7 n. 1, p. 208-229. 2017.
HAZRA, A.; BHATTACHARYA, S.; BANIK, P. A Bayesian zero-inflated exponential distribution model for the analysis of weekly rainfall of the eastern plateau region of India. MAUSAM, vol. 69 n. 1, p. 19-28. 2018.
HUANG, D.; HU, H.; LI, Y. Zero-Inflated Exponential Distribution of Casualty Rate in Ship Collision. J. Shanghai Jiao Tong Univ., vol. 24 n. 6, p. 739-744. 2019.
JAMES, B.R. Probabilidade: um curso em nível intermediário. 2ª Edição. Rio de Janeiro: IMPA, 2002. (Projeto Euclides).
MIN, Y.; AGRESTI, A. Modeling nonnegative data with clumping at zero: a survey. JIRSS., vol. 1 n. 1-2, p. 7-33. 2002.
R CORE TEAM. R: A Language and Environment for Statistical Computing. Vienna, Austria, 2020. Disponível em: http://www.R-project.org/.
ROSS, S. Probabilidade: um curso moderno com aplicações. [S.l.]:
Bookman, 2010.
WELD, C.; LEEMIS, L. Modeling mixed type random variables. Proceedings of the 2017 Winter Simulation Conference, p. 1595-1606. 2017.
WIKIPEDIA. Brejo Paraibano. Acesso em: 18 mar 2020. Disponível em: https://pt.wikipedia.org/wiki/Lista_de_mesorregiões_e_microrregiões_da_Paraíba#/media/Ficheiro:Paraiba_Micro_BrejoParaibano.svg
ZAMRI, N.S.N.; ZAMZURI, Z.H. A review on models for count data with extra zeros. AIP Conference Proceedings, vol. 1830. 2017.
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Proposta de Política para Periódicos de Acesso Livre
Autores que publicam nesta revista concordam com os seguintes termos:
- Autores mantém os direitos autorais e concedem à revista o direito de primeira publicação, com o trabalho simultaneamente licenciado sob a Licença Creative Commons Attribution que permite o compartilhamento do trabalho com reconhecimento da autoria e publicação inicial nesta revista.
- Autores têm autorização para assumir contratos adicionais separadamente, para distribuição não-exclusiva da versão do trabalho publicada nesta revista (ex.: publicar em repositório institucional ou como capítulo de livro), com reconhecimento de autoria e publicação inicial nesta revista.
- Autores têm permissão e são estimulados a publicar e distribuir seu trabalho online (ex.: em repositórios institucionais ou na sua página pessoal) a qualquer ponto antes ou durante o processo editorial, já que isso pode gerar alterações produtivas, bem como aumentar o impacto e a citação do trabalho publicado (Veja O Efeito do Acesso Livre).