Transformação de dados sob heterocedasticidade e normalidade

um estudo de simulação

Autores/as

Palabras clave:

Poder do teste, nível de significância , pressuposições

Resumen

A Análise de Variância (ANOVA) é uma das técnicas de inferência estatística mais utilizadas nas ciências biológicas, ecológicas e agrícolas e depende significativamente da pressuposição de variâncias homogêneas ao longo dos tratamentos. Pouco é conhecido sobre as propriedades do teste F com diferentes transformações sob normalidade e heterocedasticidade. Por isso, este estudo tem o objetivo de avaliar o impacto da transformação no poder e no nível de significância do teste F sob heterocedasticidade. Para isso, um estudo de simulação foi realizado utilizando 6 transformações, 3 níveis de desigualdade de variâncias, 7 repetições e 10.000 dados simulados.  As proporções de médias 5-5-5 e 5-5-6 foram utilizadas para avaliar o nível de significância e o poder do teste, respectivamente. O teste de Bartlett foi realizado em cada dado simulado visando definir o Índice de Capacidade de Homogeneização (ICH) para cada transformação. Os resultados foram analisados usando o teste F da ANOVA ao nível de 5% de probabilidade e as médias foram comparadas pelo teste de Tukey, após a verificação das pressuposições. A transformação de dados não aumenta o poder do teste, não mantém o nível de significância e reduz o HCI para todos os níveis de heterocedasticidade. Uma vez que o ICH se mantém em torno de 40% após a aplicação das transformações, é possível obter resultados positivos em testes de pressuposições apesar da redução na qualidade do teste. O uso de transformações para lidar com a heterocedasticidade para dados normais não é uma estratégia efetiva e testes robustos devem ser utilizados.

Citas

ASLAM, Muhammad. Design of the Bartlett and Hartley tests for homogeneity of variances under

indeterminacy environment. Journal Of Taibah University For Science, [S.L.], v. 14, n. 1, p. 6-10, 10 dez.

Informa UK Limited. http://dx.doi.org/10.1080/16583655.2019.1700675.

BLANCA, María J.; ALARCÓN, Rafael; ARNAU, Jaume. Non-normal data: is anova still a valid option?.

Psicothema, [S.L.], n. 294, p. 552-557, nov. 2017. C.O.P. del Ppdo. de Asturias.

http://dx.doi.org/10.7334/psicothema2016.383.

BLANCA, María J.; ALARCÓN, Rafael; ARNAU, Jaume; BONO, Roser; BENDAYAN, Rebecca. Effect of

variance ratio on ANOVA robustness: might 1.5 be the limit?. Behavior Research Methods, [S.L.], v. 50, n.

, p. 937-962, 22 jun. 2017. Springer Science and Business Media LLC. http://dx.doi.org/10.3758/s13428-

-0918-2.

FERNANDEZ, George C.J.. Residual Analysis and Data Transformations: important tools in statistical

analysis. Hortscience, [S.L.], v. 27, n. 4, p. 297-300, abr. 1992. American Society for Horticultural Science.

http://dx.doi.org/10.21273/hortsci.27.4.297.

KARIYA, Takeaki; KURATA, Hiroshi. Generalized Least Squares. Wiley Series In Probability And

Statistics, [S.L.], p. 500-545, 25 jun. 2004. Wiley. http://dx.doi.org/10.1002/0470866993.

KNIEF, Ulrich; FORSTMEIER, Wolfgang. Violating the normality assumption may be the lesser of two evils.

Behavior Research Methods, [S.L.], v. 53, n. 6, p. 2576-2590, 7 maio 2021. Springer Science and Business

Media LLC. http://dx.doi.org/10.3758/s13428-021-01587-5.

Kozak, M. Analyzing one-way experiments: a piece of cake or a pain in the neck. Sci. Agric, 4, 556–562.

https://www.scielo.br/j/sa/a/6nsk8bJv9zsyWR7SbPfwmQG/?format=pdf.

MAHAPOONYANONT, Natcha; MAHAPOONYANONT, Tharadeth; PENGKAEW, Nussara;

KAMHANGKIT, Rojarek. Power of the test of One-Way Anova after transforming with large sample size

data. Procedia - Social And Behavioral Sciences, [S.L.], v. 9, p. 933-937, 2010. Elsevier BV.

http://dx.doi.org/10.1016/j.sbspro.2010.12.262.

MODER, K. Alternatives to F-test in one way ANOVA in case of heterogeneity of variances (a simulation

study). Psychological Test and Assessment Modeling, 52(4), 343–353, 2010.

MORRIS, Tim P.; WHITE, Ian R.; CROWTHER, Michael J.. Using simulation studies to evaluate statistical

methods. Statistics In Medicine, [S.L.], v. 38, n. 11, p. 2074-2102, 16 jan. 2019. Wiley.

http://dx.doi.org/10.1002/sim.8086.

OSBORNE, Jason. Notes on the use of data transformations. University Of Massachusetts Amherst, [S.L.],

p. 37-45, 2002. University of Massachusetts Amherst. http://dx.doi.org/10.7275/4VNG-5608.

PEK, J.; WONG, O.; WONG, A. C.. Data Transformations for Inference with Linear Regression: clarifications

and recommendations. University Of Massachusetts Amherst, [S.L.], p. 22-35, 2017. University of

Massachusetts Amherst. http://dx.doi.org/10.7275/2W3N-0F07.

SNEDECOR, G. W.. Statistical methods applied to experiments in agriculture and biology, 1st–5th editions.

Ames, IA: Collegiate Press, 1956.

STANTON, Maureen L.; THIEDE, Denise A.. Statistical convenience vs biological insight: consequences of

data transformation for the analysis of fitness variation in heterogeneous environments. New Phytologist,

[S.L.], v. 166, n. 1, p. 319-338, 12 jan. 2005. Wiley. http://dx.doi.org/10.1111/j.1469-8137.2004.01311.x.

ST‐PIERRE, Anne P.; SHIKON, Violaine; SCHNEIDER, David C.. Count data in biology—Data

transformation or model reformation? Ecology And Evolution, [S.L.], v. 8, n. 6, p. 3077-3085, 16 fev. 2018.

Wiley. http://dx.doi.org/10.1002/ece3.3807.

Publicado

21-08-2024

Cómo citar

Oliveira, C. A. C. de. (2024). Transformação de dados sob heterocedasticidade e normalidade: um estudo de simulação. Sigmae, 13(2), 91–103. Recuperado a partir de https://publicacoes.unifal-mg.edu.br/revistas/index.php/sigmae/article/view/2341

Número

Sección

Applied Statistics