Modelagem probabilística de dados de pagamentos de provedor de internet usando variável mista

Autores/as

  • Shirlley Oliveira da Silva Bacharela em Estatística pela Universidade Estadual da Paraíba
  • Divanilda Maia Professora do Departamento de Estatística da Universidade Estadual da Paraíba
  • Gustavo H. Esteves Professor do Departamento de Estatística da Universidade Estadual da Paraíba

Palabras clave:

Dados inflacionados de zeros, distribuição exponencial, variável degenerada em zero

Resumen

O objetivo deste trabalho é usar uma variável aleatória mista para modelar dados de pagamentos de provedor de internet feitos pelos clientes de uma empresa de um cidade da Paraíba. Numa análise de dados, um dos primeiros passos é observar a natureza das variáveis envolvidas e fazer uma análise gráfica delas. Geralmente, essas variáveis podem ser classificadas como discretas ou contínuas. As discretas surgem preponderantemente de categorizações ou de contagens, enquanto que as contínuas surgem de medidas. Mas existem ainda as variáveis mistas, que são obtidas fazendo-se uma soma ponderada de variáveis discretas e contínuas. No caso dos dados aqui utilizados, a análise gráfica indicou um comportamento exponencial, que é um modelo contínuo para dados positivos. No entanto, havia uma grande quantidade de valores nulos, de onde surgiu a ideia de usar uma variável mista, sendo que a parte positiva será modelada pela distribuição exponencial e os valores nulos por uma variável degenerada no ponto zero.

Citas

AITCHISON, J. On the distribution of a positive random variable having a discrete probability mass at the origim. Journal of the American Statistical Association, vol. 50 n. 271, p. 901-908. 1955.

CHANDRA, S. On the mixtures of probability distributions. Scandinavian Journal of Statistics, vol. 4 n. 3, p. 105-112. 1977.

DAROS, M.; PINTO, N.~G.~M. Inadimplência no Brasil: uma análise das evidências empíricas. Revista de Administração IMED, vol. 7 n. 1, p. 208-229. 2017.

HAZRA, A.; BHATTACHARYA, S.; BANIK, P. A Bayesian zero-inflated exponential distribution model for the analysis of weekly rainfall of the eastern plateau region of India. MAUSAM, vol. 69 n. 1, p. 19-28. 2018.

HUANG, D.; HU, H.; LI, Y. Zero-Inflated Exponential Distribution of Casualty Rate in Ship Collision. J. Shanghai Jiao Tong Univ., vol. 24 n. 6, p. 739-744. 2019.

JAMES, B.R. Probabilidade: um curso em nível intermediário. 2ª Edição. Rio de Janeiro: IMPA, 2002. (Projeto Euclides).

MIN, Y.; AGRESTI, A. Modeling nonnegative data with clumping at zero: a survey. JIRSS., vol. 1 n. 1-2, p. 7-33. 2002.

R CORE TEAM. R: A Language and Environment for Statistical Computing. Vienna, Austria, 2020. Disponível em: http://www.R-project.org/.

ROSS, S. Probabilidade: um curso moderno com aplicações. [S.l.]:

Bookman, 2010.

WELD, C.; LEEMIS, L. Modeling mixed type random variables. Proceedings of the 2017 Winter Simulation Conference, p. 1595-1606. 2017.

WIKIPEDIA. Brejo Paraibano. Acesso em: 18 mar 2020. Disponível em: https://pt.wikipedia.org/wiki/Lista_de_mesorregiões_e_microrregiões_da_Paraíba#/media/Ficheiro:Paraiba_Micro_BrejoParaibano.svg

ZAMRI, N.S.N.; ZAMZURI, Z.H. A review on models for count data with extra zeros. AIP Conference Proceedings, vol. 1830. 2017.

Publicado

07-04-2021

Cómo citar

da Silva, S. O. ., Maia, D., & Esteves, G. H. (2021). Modelagem probabilística de dados de pagamentos de provedor de internet usando variável mista. Sigmae, 9(2), 37–44. Recuperado a partir de https://publicacoes.unifal-mg.edu.br/revistas/index.php/sigmae/article/view/1163

Número

Sección

Applied Statistics