Avaliação da probabilidade de classificação incorreta em análises discriminantes para duas populações normais

  • Izabela Regina Cardoso de Oliveira DEX/UFLA
  • Daniel Furtado Ferreira UFLA
Palavras-chave: custo de classificação incorreta, normal multivariada, homocedástica, erro quadrático médio.

Resumo

Este trabalho teve por objetivo avaliar o desempenho do método de Lachenbruch e Mickey (1968) com a modificação proposta por Giri (2004) utilizando métodos de simulação Monte Carlo mensurando-se as taxas de classificação incorreta  e  comparando-as com o método original. Em todos os casos os custos de classificação incorreta e as probabilidades a priori foram considerados iguais em ambas as populações. Para isso foram consideradas k=2 populações homocedásticas normais multivariadas  e custos de classificação incorreta e probabilidades a priori idênticos nas duas populações. Foram simuladas diferentes configurações populacionais utilizando-se N=2000 repetições Monte Carlo. Em cada uma das simulações foi estimada a taxa de classificação incorreta total utilizando os métodos modificado e original de Lachenbruch e Mickey (1968). Em cada caso, como os parâmetros populacionais são conhecidos a probabilidade real de classificação incorreta foi determinada. Para avaliar o desempenho de ambos os estimadores foi determinado o viés e o erro quadrático médio. Ambos os métodos, original e modificado, são viesados e possuem grandes vieses com amostras pequenas, e pequenos vieses com amostras grandes. Os vieses dos dois métodos decrescem com o aumento da distância de Mahalanobis entre as duas populações. O método original é superior ao método modificado, principalmente em pequenas amostras.

Biografia do Autor

Daniel Furtado Ferreira, UFLA
Estatística, Departamento de Ciências Exatas

Referências

GIRI, N. C. Multivariate statistical analysis. 2th. ed. New York: Marcel Dekker, 2004. 558p.

LACHENBRUCH, P. A.; MICKEY, M. R. Estimation of error rates in discriminant analysis. Technometrics, v. 10, n. 1, p. 1–11, 1968.

Publicado
31-12-2013
Seção
Probability and Statistics