Estatísticas descritivas e técnicas de visualização na análise de textos

Authors

Keywords:

Linguística quantitativa, métodos quantitativos, visualização de dados

Abstract

O uso de métodos quantitativos para a análise de textos possui inúmeras aplicações em diversas áreas, como na identificação de autores, na crítica e no estudo da história da literatura, no mapeamento de vocabulário e ainda na análise sociolinguística. A identificação e classificação automática de textos também é beneficiada pelas técnicas da linguística quantitativa. Por outro lado, sabe-se da dificuldade no ensino da estatística e dos métodos quantitativos, especialmente para alunos das áreas biológicas e humanas, não familiarizados às ciências exatas. Assim, o presente trabalho demonstra o uso da estatística descritiva e da visualização de dados aplicadas na análise de texto, poéticos e científicos, com o objetivo de oferecer ferramentas para profissionais que se deparem com a necessidade desse tipo de análise, mas também para disponibilizar exemplos de aplicação que possam facilitar o ensino dos conceitos estatísticos para alunos mais afeitos às ciências humanas e biológicas. O uso de estatísticas simples (como médias, frações e proporções) e de gráficos, se mostrou mais útil na distinção de poemas e resumos científicos do que apenas as suas características quantitativas absolutas.

Author Biographies

Alfredo José Barreto Luiz, Embrapa Meio Ambiente

Estatística Aplicada na Pesquisa Agropecuária

Carolina Borges da Silva Luiz, FFLCH/USP

Historiadora, mestranda em História Social

References

ALEXA, M.; ZUELL, C. Text analysis software: commonalities, differences and limitations: the results of a review. Quality & Quantity, v. 34, n. 3, p. 299–32, 2000. DOI: 10.1023/A:1004740203542

AZEVEDO, A. Lira dos Vinte Anos. São Paulo: Martins Fontes, 1996. 346 p.

BORDAG, S.; HEYER, G. A. Structuralist Framework for Quantitative Linguistics. In: Aspects of Automatic Text Analysis. Berlin: Springer, p. 171-189, 2007. DOI: 10.1007/978-3-540-37522-7_8

CAMARGO, B. V.; JUSTO, A. M. IRAMUTEQ: Um software gratuito para análise de dados textuais. Temas em Psicologia, v. 21, n. 2, p. 513-518, 2013. DOI: 10.9788/TP2013.2-16

EFRON, B.; THISTED, R. Estimating the number of unseen species: how many words did Shakespeare know? Biometrika, v. 63, n. 3, p. 435-447, 1976.

FRANZOSI, R.; DOYLE, S.; McCLELLAND, L. E.; RANKIN, C. P.; VICARI, S. Quantitative narrative analysis software options compared: PC-ACE and CAQDAS (ATLAS.ti, MAXqda, and NVivo). Quality & Quantity, v. 47, n. 6, Page 3219, 2013. DOI: 10.1007/s11135-012-9714-3

HILST, H. Da poesia. São Paulo: Companhia das Letras, 2017. 584 p.

LIMA, D. V.M.; MACHADO, E. J.; MACHADO, F. M. O ensino de estatística em curso de licenciatura em Ciências biológicas: o uso do laboratório de Informática. In: 12º CONGRESSO NACIONAL DE EDUCAÇÃO, 2017, Curitiba. Anais. Curitiba: Champagnat, p. 22244-22252, 2017. Disponível em http://educere.bruc.com.br/arquivo/pdf2017/24720_12503.pdf

LUIZ, A.J.B. Importância de textos em português para a apropriação do conhecimento em ciência e tecnologia no Brasil. Cadernos de Ciência & Tecnologia, Brasília, v. 20, n. 3, p. 543­554, 2003.

OLIVEIRA, A. J. Quantitative analysis in the study of language variation: notions of statistical and comparative analysis Varbrul and SPSS. Revista de Estudos da Linguagem, v. 17, n. 2, p. 93-119, jul./dez., 2009. DOI: 10.17851/2237-2083.17.2.93-119

OUSHIRO, L. Análise sociolinguística da posição variável do constituinte interrogativo. Revista da ABRALIN, v. 11, n. 2, p. 43-87, jul./dez., 2012

POPESCU, I. I.; LUPEA, M.; TATAR, D.; ALTMANN, G. Quantitative Analysis of Poetic Texts. Berlin/Boston: de Gruyter. 2015. 280 p.

QUIRINO, T. R.; LUIZ, A. J. B.; DIAS, E. C. Tecnologias agropecuárias e impacto ambiental: uma agenda para a pesquisa. Cadernos de Ciência & Tecnologia, Brasília, v. 16, n. 2, p. 69-96, 1999.

SCHULTZ, B.; FORMAGGIO, A. R.; EBERHARDT, I. D. R.; SANCHES, I. D.; OLIVEIRA, J. C. de; LUIZ, A. J. B. Classificação orientada a objetos em imagens multitemporais Landsat aplicada na identificação de cana-de-açúcar e soja. Revista Brasileira de Cartografia, Rio de Janeiro, v. 68, n. 1, p. 131-143, 2016.

TUFTE, E. R. The visual display of quantitative information. 2 ed. Connecticut: Graphics Press. 2001. 200 p.

TURIK, C.; VIALI, L.; MORAES, J. F. D. Análise de atitudes de alunos universitários em relação à estatística por meio da teoria de resposta ao item. Ciência & Educação, v. 18, n. 1, p. 231-243, 2012. Disponível em: http://www.scielo.br/pdf/ciedu/v18n1/14.pdf

WATANABE, M. A.; LUIZ, A. J. B.; ABREU, L. S. de. Preços de hortifrútis convencionais e orgânicas em feiras livres e supermercado de Barão Geraldo, Campinas, SP, Brasil. In: 56º CONGRESSO DA SOCIEDADE BRASILEIRA DE ECONOMIA, ADMINISTRAÇÃO E SOCIOLOGIA RURAL, 2018, Campinas. Anais. Campinas: SOBER, 2018. 11 p. Disponível em: http://icongresso.itarget.com.br/tra/arquivos/ser.8/1/8675.pdf

Published

29-07-2019

How to Cite

Luiz, A. J. B., & Luiz, C. B. da S. (2019). Estatísticas descritivas e técnicas de visualização na análise de textos. Sigmae, 8(2), 67–75. Retrieved from https://publicacoes.unifal-mg.edu.br/revistas/index.php/sigmae/article/view/935