Rotulaçao de outliers: método de Faleschini para dados quantitativos univariados
Palabras clave:
Outliers, Rotulação de Outliers, FaleschiniResumen
O objetivo deste trabalho é apresentar o método de Faleschini para a rotulação de outliers para dados quantitativos univariados. O método de Faleschini utiliza a média, desvio padrão, coeficientes momentos de assimetria e curtose, resultando em uma equação do quarto grau, onde a menor raiz e a maior raiz podem ser adotados como rotuladores de outliers. O método de Faleschini é comparado com o método de Tukey e com o método recente de Adil e Zaman. Para as distribuições teóricas contínuas que não apresentem parâmetros ou de média, ou de desvio padrão, ou de assimetria ou de curtose, propõe-se “pseudos” parâmetros baseados em percentis e quartis, e também estes “pseudos” parâmetros são utilizados para distribuições discretas e para dados amostrais, bem como uma proposta para o cálculo destes percentis e quartis. O artigo finaliza apontando que o método de Faleschini apresenta vantagem conceitual, pois além de levar os parâmetros de localização, dispersão, assimetria e curtose, não faz distinção entre distribuições com cauda leve ou pesada, contudo, são necessárias novas pesquisas visando tanto o aperfeiçoamento dos “pseudo” parâmetros como ampliação para outros campos, como análise multivariada, série temporais e outros.
Citas
ADIL, Iftikhar Hussain; IRSHAD, Ateeq ur Rehman. A modified approach for detection of outliers. Pakistan
Journal of Statistics and Operation Research, Lahore, v. 11, n. 1, p. 91-102, Apr. 2015.
ADIL, Iftikhar Hussain; ZAMAN, Asad. Outliers detection in skewed distributions: split sample skewness
based boxplot. Economic Computation and Economic Cybernetics Studies and Research, Bucharest, v.
, n. 3, p. 279-296, 2020.
ANDRADE, Larissa Ribeiro de; CIRILLO, Marcelo Angelo; BEIJO, Luiz Alberto. Proposal of a bootstrap
procedure using measures of influence in non-linear regression models with outliers; doi:
4025/actascitechnol.v36i1.17564. Acta Scientiarum. Technology, v. 36, n. 1, p. 93-99, 7 jan. 2014.
BABURA, Babangida Ibrahim; ADAM, Mohd Bakri; FRITIANTO, Anwar; SAMAD, Abdul Rahim Abdul.
Modified boxplot for extreme data. AIP Conference Proceedings, New York, v. 1842, issue 1, May 2017.
BARBOSA, Josino José; PEREIRA, Tiago Martins; OLIVEIRA, Fernando Luiz Pereira de. Uma proposta
para identificação de outliers multivariados. Ciência e Natura, [S. l.], v. 40, p. e40, 2018. DOI:
5902/2179460X29535. Disponível em: https://periodicos.ufsm.br/cienciaenatura/article/view/29535
Acesso em: 21 ago. 2023.
BARBOSA, Josino José; DUARTE, Anderson Ribeiro; MARTINS, Helgem Souza Ribeiro. A performance
evaluation in multivariate outliers identification methods. Ciência e Natura, [S. l.], v. 42, p. e16, 2020. DOI:
5902/2179460X41662. Disponível em: https://periodicos.ufsm.br/cienciaenatura/article/view/41662
Acesso em: 21 ago. 2023.
BARNETT, Vic; LEWIS, Toby. Outliers in statistical data. 3 ed. Chichester: John Wiley & Sons, 1994.
BRYS, Guy; HUBERT, Mia; STRUYF, Anja. A robust measure of skewness. Journal of computacional and
graphical statistics, v. 13, n. 4, p. 996-1017, December 2004.
BRUFFAERTS, Christopher; VERARDI, Vincenzo; VERMANDELE, Catherine. A generalized boxplot for
skewed and heavy-tailed distributions. Statistics and Probability Letters, Amsterdam, v. 95, p. 110-117,
Dec. 2014.
CARLING, Kenneth. Resistance outlier rules and the non-Gaussian case. Computational Statistics & Data
Analysis. V. 33, n. 3, p. 249-258, 2000.
CHAMBERS, J. M. et al. Graphical methods for data analysis. USA: Wadsworth, 1983.
FALESCHINI, Luigi. Su alcune proprietà dei momenti impegati nello studio dela variabilità, assimetria e
curtosi. Statistica, anno VIII, n. 4, p. 503-513, Ottobre-Dicembre 1948.
FIORI, Anna Maria; ZENGA, Michele. The meaning of kurtosis, the influence function and an early intuition
by L. Faleschini. Statistica, anno LXV, n. 2, 2005, p. 135-144.
HUBERT, M.; VANDERVIEREN, E. An adjusted boxplot for skewed distributions. Computational
Statistics & Data Analysis, Amsterdam, v. 52, n. 12, p. 5186-5201, Aug. 2008.
JONES, M. C.; ROSCO, J. F.; PEWSEY, Arthur. Skewness-Invariant Measures of Kurtosis. The American
Statistician, v. 65, n. 2 , p. 89-95, May 2011.
KIMBER, A. C. Exploratory data analysis for possibly censored data from skewed distributions. Applied
Statistics. V. 39, n. 1, p. 21-30, 1990.
LIMA, Luís Fernando Maia; MAROLDI, Alexandre Masson; SILVA, Dávilla Vieira Odízio da; HAYASHI,
Carlos Roberto Massao; HAYASHI, Maria Cristina Piumbato Innocentini. Métricas científicas em estudos
bibliométricos: detecção de outliers para dados univariados. Em Questão, Porto Alegre, v. 23, Edição Especial
EBBC, p. 254-273, jan. 2017.
LIMA, Luís Fernando Maia; MAROLDI, Alexandre Masson; SILVA, Dávilla Vieira Odízio da; HAYASHI,
Carlos Roberto Massao; HAYASHI, Maria Cristina Piumbato Innocentini. A influência de outliers nos estudos
métricos da informação: uma análise de dados univariados. Em Questão, Porto Alegre, v. 24, Edição Especial
EBBC, p. 216-235, 2018.
PEREIRA, Tiago Martins; CIRILLO, Marcelo Ângelo; OLIVEIRA, Fernando Luiz Pereira de. Chisquaremax
rotation criterion in factor analysis: a Monte Carlo assessment of the effect of outliers. Acta Scientiarum.
Technology, v. 36, n. 4, p. 643-649, 12 set. 2014.
RODRIGUES, Paulo Jorge Canas; ALMEIDA, Rafael; MUSTAFA, Kézia. The usefulness of robust
multivariate methods: A case study with the menu items of a fast food restaurant chain. Ciência e Natura, [S.
l.], v. 42, p. e17, 2020. DOI: 10.5902/2179460X39892. Disponível em:
https://periodicos.ufsm.br/cienciaenatura/article/view/e18%27 Acesso em: 21 ago. 2023.
ROSADO, Fernando. Outliers em dados estatísticos. Lisboa: Sociedade Portuguesa de Estatística, 2006.
SILVA, Kelly C. Ramos da; OLIVEIRA, Helder L. Costa de; CARVALHO, André C.P.L.F. de. Performance
evaluation of outlier rules for labelling outliers in multidimensional dataset. International Journal of
Business and Data Mining, v. 19, n. 2, p. 135-152, 21 July 2021.
SILVA, Kelly Cristina Ramos da. Regras robustas para rotular outliers em dados de caudas leves e caudas pesadas. Tese de Doutorado. 2019. Disponível em: https://teses.usp.br/teses/disponiveis/55/55134/tde-
-145141/pt-br.php Acesso em 12 ago. 2023.
TAMBAY, Jean-Louis. An integrated approach for the treatment of outliers in sub-annual economic surveys.
American Statistical Association Proceedings of the Survey Research Methods. Alexandria, VA:
American Statistical Association, p. 229-234, 1988.
TRIOLA, Mario F. Introdução à Estatística. 10. ed. Rio de Janeiro: LTC, 2012.
TUKEY, John Wilder. Exploratory data analysis. Reading: Massachusetts, Addison-Wesley, 1977.
VELLEMAN, P. F.; HOAGLIN, D.C. Applications, basics, and computings of exploratory data analysis.
Boston: Duxbury, 1981.
VELOSO, Manoel Vitor de; CIRILLO, Marcelo Angelo. Principal components in the discrimination of
outliers: A study in simulation sample data corrected by Pearson’s and Yates ́s chi-square distance. Acta
Scientiarum. Technology, v. 38, n. 2, p. 193-200, 1 Apr. 2016.
VISSOTTO JUNIOR, Dornelles; DIAS, Nelson Luís. Método Empírico para Determinação de outliers em
Séries de Fluxos de dados Micrometeorológicos Pós-processados. Ciência e Natura, [S. l.], v. 35, p. 169–171,
DOI: 10.5902/2179460X11585. Disponível em:
https://periodicos.ufsm.br/cienciaenatura/article/view/11585 Acesso em: 21 ago. 2023.
WALKER, M. L; DOVOEDO, Y. H.; CHAKRABORTI, S.; HILTON, C. W. An improved boxplot for
univariate data. The American Statistician, v. 72, n. 4, p. 348-353, November 2018.
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Proposta de Política para Periódicos de Acesso Livre
Autores que publicam nesta revista concordam com os seguintes termos:
- Autores mantém os direitos autorais e concedem à revista o direito de primeira publicação, com o trabalho simultaneamente licenciado sob a Licença Creative Commons Attribution que permite o compartilhamento do trabalho com reconhecimento da autoria e publicação inicial nesta revista.
- Autores têm autorização para assumir contratos adicionais separadamente, para distribuição não-exclusiva da versão do trabalho publicada nesta revista (ex.: publicar em repositório institucional ou como capítulo de livro), com reconhecimento de autoria e publicação inicial nesta revista.
- Autores têm permissão e são estimulados a publicar e distribuir seu trabalho online (ex.: em repositórios institucionais ou na sua página pessoal) a qualquer ponto antes ou durante o processo editorial, já que isso pode gerar alterações produtivas, bem como aumentar o impacto e a citação do trabalho publicado (Veja O Efeito do Acesso Livre).