Aprendizagem com pequenas amostras na era do Big Data

uma revisão de literatura sobre perspectivas e desafios

Autores

  • João Carlos Pereira Alves Universidade Federal de Alfenas (UNIFAL-MG)
  • Eric Batista Ferreira Universidade Federal de Alfenas (UNIFAL-MG)
  • Iago Augusto de Carvalho Universidade Federal de Alfenas (UNIFAL-MG)

Palavras-chave:

Aprendizagem de máquina, Few-shot learning, Big Data, Pequenas amostras, Questionário de opinião

Resumo

O avanço do Big Data trouxe um grande volume de dados que possibilitou o uso de técnicas de aprendizagem de máquina para a tomada de decisões em diferentes áreas. Contudo, a efetividade desses modelos depende da disponibilidade de grandes quantidades de dados, levantando o desafio de como lidar com a aprendizagem com poucas amostras. Aprender a partir de poucas amostras é importante em muitas aplicações quando grandes volumes não estão disponíveis, como no caso de pesquisas de opinião, devido aos desafios da coleta de informações, principalmente devido à falta de engajamento e participação em questionários. Esta abordagem pode facilitar ou minimizar o uso de questionários de opinião. No entanto, existem desafios que precisam ser superados para obter um desempenho preciso em tarefas de aprendizagem com poucas amostras, como a seleção de amostras relevantes, a escolha de métodos de treinamento adequados, entre outros. Diante disso, discutiremos as perspectivas e desafios da aprendizagem com poucas amostras na era do Big Data. Será realizada uma revisão das técnicas de Few-shot learning e suas aplicações como uma alternativa para lidar com poucas amostras. A revisão dessas técnicas e sua aplicação em conjuntos de dados limitados podem fornecer insights valiosos para a melhoria de modelos de aprendizagem de máquina em diferentes áreas de aplicação.

Referências

FE-FEI, L. et al. A bayesian approach to unsupervised one-shot learning of object categories. In: IEEE. proceedings ninth IEEE international conference on computer vision. [S.l.], 2003. p. 1134–1141.

FINN, C.; OTHERS. Online meta-learning. In: PMLR. International Conference on Machine Learning. [S.l.], 2019. p. 1920–1930.

HOWARD, A. G.; ZHU, M.; CHEN, B.; KALENICHENKO, D.; WANG, W.; WEYAND, T.; ANDREETTO, M.; ADAM, H. Mobilenets: Efficient convolutional neural networks for mobile vision applications. arXiv preprint arXiv:1704.04861, 2017.

KANG, B.; LIU, Z.; WANG, X.; YU, F.; FENG, J.; DARRELL, T. Few-shot object detection via feature reweighting. In: ICCV. Proceedings of the IEEE/CVF International Conference on Computer Vision. [S.l.], 2019. p. 8420–8429.

KNAGG, O. Advances in Few-Shot Learning: A Guided Tour. 2022. Acessado em 31 de dezembro de 2023. Disponível em: https://towardsdatascience.com/advances-in-few-shot-learning-a-guided-tour-36bc10a68b77.

KOCH, G.; ZEMEL, R.; SALAKHUTDINOV, R.; OTHERS. Siamese neural networks for one-shot image recognition. In: ICML Deep Learning Workshop. [S.l.: s.n.], 2015. v. 2, p. 0.

KUNDU, R. Few-Shot Learning. 2022. Acessado em 31 de dezembro de 2023. Disponível em: https://blog.paperspace.com/few-shot-learning/.

LEAO, P. P. de S.; SANTOS, E. M. dos; PINTO, R. A.; EVANGELISTA, L. G. C. Detecção de pneumonia causada por covid-19 utilizando few-shot learning. In: SBC. Anais do XXII Simpósio Brasileiro de Computação Aplicada à Saúde. [S.l.], 2022. p. 391–400.

LU, J.; GONG, P.; YE, J.; ZHANG, C. Learning from very few samples: A survey. 2020. ArXiv preprint arXiv:2009.02653.

MCCULLOCH, W. S.; PITTS, W. A logical calculus of the ideas immanent in nervous activity. The bulletin of mathematical biophysics, Springer, v. 5, p. 115–133, 1943.

MILLER, E. G.; MATSAKIS, N. E.; VIOLA, P. A. Learning from one example through shared densities on transforms. In: IEEE. Proceedings IEEE Conference on Computer Vision and Pattern Recognition (CVPR 2000). [S.l.], 2000. p. 464–471.

MONARD, M. C.; BARANAUSKAS, J. A. Conceitos sobre aprendizado de m´aquina. Sistemas inteligentes-Fundamentos e aplica¸c˜oes, v. 1, n. 1, p. 32, 2003.

PENG, B.; OTHERS. Few-shot natural language generation for task-oriented dialog. 2020. ArXiv preprint arXiv:2002.12328.

RAUTENBERG, S.; CARMO, P. R. V. D. Big data e ciência de dados: complementariedade conceitual no processo de tomada de decis˜ao. Brazilian Journal of Information Science, v. 13, n. 1, p. 56–67, 2019.

RUSSELL, S.; NORVIG, P. Inteligência Artificial. 3. ed. S˜ao Paulo: Elsevier, 2013.

SANCHES, M. K. Aprendizado de máquina semi-supervisionado: proposta de um algoritmo para rotular exemplos a partir de poucos exemplos rotulados. Tese (Doutorado) — Universidade de São Paulo, 2003.

SNELL, J.; SWERSKY, K.; ZEMEL, R. Prototypical networks for few-shot learning. In: Advance in Neural Information Pro cessing Systems. [S.l.]: Curran Associates, Inc., 2017. v. 30. Disponível em: https://proceedings.neurips.cc/paper/2017/file/cb8da6767461f2812ae4290eac7cbc42-Paper.pdf.

VINYALS, O.; BLUNDELL, C.; LILLICRAP, T.; WIERSTRA, D.; OTHERS. Matching networks for one shot learning. Advances in neural information processing systems,

v. 29, p. 3630–3638, 2016.

WANG, Y.; YAO, Q.; KWOK, J. T.; NI, L. M. Generalizing from a few examples: A survey on few-shot learning. ACM computing surveys (csur), ACM New York, NY, USA, v. 53, n. 3, p. 1–34, 2020.

ZHENG, Y. et al. Principal characteristic networks for few-shot learning. Journal of Visual Communication and Image Representation, v. 59, p. 563–573, 2019.

Downloads

Publicado

02-01-2024

Como Citar

Pereira Alves, J. C., Ferreira , E. B. ., & Carvalho , I. A. de . (2024). Aprendizagem com pequenas amostras na era do Big Data: uma revisão de literatura sobre perspectivas e desafios. Sigmae, 12(3), 108–124. Recuperado de https://publicacoes.unifal-mg.edu.br/revistas/index.php/sigmae/article/view/2246

Edição

Seção

Data Science & Machine Learning