Algoritmos genéticos e de aprendizado de máquina na otimização em problemas de classificação

Ricardo Theodoro; André G. C. Pereira; Davi Rogério de Moura Costa; Viviane S.M.  Campos

Autores

Ricardo Theodoro Universidade de São Paulo https://orcid.org/0000-0001-6741-5153
André G. C. Pereira Universidade Federal do Rio Grande do Norte https://orcid.org/0000-0001-6835-2318
Davi Rogério de Moura Costa Universidade de São Paulo https://orcid.org/0000-0001-5653-478X
Viviane S.M. Campos Universidade Federal do Rio Grande do Norte https://orcid.org/0000-0002-4797-3665

Palavras-chave:

Algoritmo Genético Elitista, K-Nearest Neighbors KNN, Floresta Aleatória

Resumo

Existem diversos tipos de algoritmos de otimização, bem como algoritmos de classificação. Dentre tais algoritmos, o Algoritmo Genético Elitista é um representante dos algoritmos de otimização, enquanto o KNN, a Árvore de Classificação e a Floresta Aleatória são representantes dos algoritmos de classificação. O objetivo desse trabalho é mostrar, através de uma aplicação, como é possível usar essas duas classes de algoritmos em conjunto para não apenas otimizar o número de acertos de classificação, mas também para reduzir a dimensão do problema. A situação utilizada é a classificação de cooperativas de crédito brasileiras usando o texto de seus estatutos. O banco de palavras utilizado constava de 8.293 palavras que ao longo do processo foi reduzido para 1.037 palavras com proporção de acertos de classificação foi maior 81\% usando o KNN e de 1.936 e com proporção de acertos maior que 82\% usando a Floresta Aleatória.

Referências

ACOSTA-GONZ ́aLEZ, E.; FERN ́aNDEZ-RODR ́ıGUEZ, F. Model selection via genetic

algorithms illustrated with cross-country growth data. Empirical Economics, n. 33, p. 313–337,

BOUCHARD, M.J.; ROUSSELI`eRE, D.; GUERNIC, M. Le. Conceptual Framework for the

purpose of Measurement of Cooperatives and its Operationalization. [S.l.], 2017. Dispon ́ıvel em:

⟨https://shorturl.at/xLQZ8⟩.

BOUCHARD, M. J. et al. Statistics on cooperatives: concepts, classification, work and

economic contribution measurement. ILO, CIRIEC, COPAC: Geneva, Switzerland, 2020.

CAMPOS, V.S.M.; PEREIRA, A.G.C.; CRUZ, J.A. Rojas. Modeling the genetic algorithm by

a non-homogeneous markov chain: Weak and strong ergodicity. Theory of Probability and its

Applications, v. 57, p. 185–192, 2012.

EUM, H.; CARINI, C.; BOUCHARD, M. J. Classification of cooperatives. a proposed

typology. Statistics on cooperatives: Concepts, classification, work and economic contribution

measurement, p. 13–22, 2020.

HOLLAND, J.H. Adaptation in natural and artificial systems. [S.l.]: Ann Arbor: The

University of Michigan Press, 1975.

JAMES, G. et al. An introduction to statistical learning with R applications. [S.l.]: Springer,

KASAMBARA, A. Machine Learning Essentials : Practical Guide in R. [S.l.]: Published by

STHDA, 2017, 2017.

KI-MOON, B. Organiza ̧c ̃ao das Na ̧c ̃oes Unidas (ONU), Secret ́ario Geral (2007-2017: Ban

Ki-Moon). Mensagem do Secret ́ario Geral por ocasi ̃ao da celebra ̧c ̃ao do Dia Mundial da

Alimenta ̧c ̃ao. 16 out 2012. 2012. Online. Acessado em 19/02/2024, ⟨https://shorturl.at/qruI7⟩.

LACERDA, E. G.; CARVALHO, A. C.; LUDERMIR, T. B. Model selection via genetic

algorithms for rbf networks. Journal of Intelligent & Fuzzy Systems, IOS Press, v. 13, p.

–122, 2002.

LANTZ, B. Machine Learning with R : Expert techniques for predictive modeling. [S.l.]: Packt,

Birmingham, 2019.

LOPES, L. P. Predi ̧c ̃ao do pre ̧co do caf ́e naturais brasileiro por meio de modelos de statistical

machine learning. Sigmae, Alfenas, v. 7, p. 1–16, 2018.

OCB. Ramos do Cooperativismo - conhe ̧ca nossa nova organiza ̧c ̃ao. Bras ́ılia,. [S.l.], 2019.

Acessado em 19/02/2024, ⟨https://shorturl.at/cDZ19⟩.

PATERLINI, S.; MINERVA, T. Regression model selection using genetic algorithms. In:

Proceedings of the 11th WSEAS international conference on nural networks and 11th WSEAS

international conference on evolutionary computing and 11th WSEAS international conference

on Fuzzy systems. World Scientific and Engineering Academy and Society (WSEAS). [S.l.:

s.n.], 2010. p. 19–27.

PEREIRA, A. G. C.; ANDRADE, B.B. On the genetic algorithm with adaptive mutation rate

and selected statistical applications. Computational Statistics (Zeitschrift), v. 30, p. 131–150,

PEREIRA, A. G. C. et al. Convergence analysis of an elitist non-homogeneous genetic

algorithm with crossover/mutation probabilities adjusted by a fuzzy controller. Chilean

Journal of Statistics, v. 9, p. 19–32, 2018.

. On the convergence rate of the elitist genetic algorithm based on mutation probability.

Communications in Statistics - Theory and Methods, v. 49, p. 769–780, 2019.

RUDOLPH, G. Convergence analysis of canonical genetic algorithms. IEEE Transactions on

Neural Networks, v. 5, p. 96–101, 1994.

Algoritmos genéticos e de aprendizado de máquina na otimização em problemas de classificação

Autores

Palavras-chave:

Resumo

Referências

Downloads

Publicado

Como Citar

Edição

Seção

Licença

Proposta de Política para Periódicos de Acesso Livre

Desenvolvido por

Enviar Submissão

Idioma

Informações