Estatísticas descritivas e técnicas de visualização na análise de textos

  • Alfredo José Barreto Luiz Embrapa Meio Ambiente
  • Carolina Borges da Silva Luiz FFLCH/USP
Palavras-chave: Linguística quantitativa, métodos quantitativos, visualização de dados

Resumo

O uso de métodos quantitativos para a análise de textos possui inúmeras aplicações em diversas áreas, como na identificação de autores, na crítica e no estudo da história da literatura, no mapeamento de vocabulário e ainda na análise sociolinguística. A identificação e classificação automática de textos também é beneficiada pelas técnicas da linguística quantitativa. Por outro lado, sabe-se da dificuldade no ensino da estatística e dos métodos quantitativos, especialmente para alunos das áreas biológicas e humanas, não familiarizados às ciências exatas. Assim, o presente trabalho demonstra o uso da estatística descritiva e da visualização de dados aplicadas na análise de texto, poéticos e científicos, com o objetivo de oferecer ferramentas para profissionais que se deparem com a necessidade desse tipo de análise, mas também para disponibilizar exemplos de aplicação que possam facilitar o ensino dos conceitos estatísticos para alunos mais afeitos às ciências humanas e biológicas. O uso de estatísticas simples (como médias, frações e proporções) e de gráficos, se mostrou mais útil na distinção de poemas e resumos científicos do que apenas as suas características quantitativas absolutas.

Biografia do Autor

Alfredo José Barreto Luiz, Embrapa Meio Ambiente
Estatística Aplicada na Pesquisa Agropecuária
Carolina Borges da Silva Luiz, FFLCH/USP
Historiadora, mestranda em História Social

Referências

ALEXA, M.; ZUELL, C. Text analysis software: commonalities, differences and limitations: the results of a review. Quality & Quantity, v. 34, n. 3, p. 299–32, 2000. DOI: 10.1023/A:1004740203542

AZEVEDO, A. Lira dos Vinte Anos. São Paulo: Martins Fontes, 1996. 346 p.

BORDAG, S.; HEYER, G. A. Structuralist Framework for Quantitative Linguistics. In: Aspects of Automatic Text Analysis. Berlin: Springer, p. 171-189, 2007. DOI: 10.1007/978-3-540-37522-7_8

CAMARGO, B. V.; JUSTO, A. M. IRAMUTEQ: Um software gratuito para análise de dados textuais. Temas em Psicologia, v. 21, n. 2, p. 513-518, 2013. DOI: 10.9788/TP2013.2-16

EFRON, B.; THISTED, R. Estimating the number of unseen species: how many words did Shakespeare know? Biometrika, v. 63, n. 3, p. 435-447, 1976.

FRANZOSI, R.; DOYLE, S.; McCLELLAND, L. E.; RANKIN, C. P.; VICARI, S. Quantitative narrative analysis software options compared: PC-ACE and CAQDAS (ATLAS.ti, MAXqda, and NVivo). Quality & Quantity, v. 47, n. 6, Page 3219, 2013. DOI: 10.1007/s11135-012-9714-3

HILST, H. Da poesia. São Paulo: Companhia das Letras, 2017. 584 p.

LIMA, D. V.M.; MACHADO, E. J.; MACHADO, F. M. O ensino de estatística em curso de licenciatura em Ciências biológicas: o uso do laboratório de Informática. In: 12º CONGRESSO NACIONAL DE EDUCAÇÃO, 2017, Curitiba. Anais. Curitiba: Champagnat, p. 22244-22252, 2017. Disponível em http://educere.bruc.com.br/arquivo/pdf2017/24720_12503.pdf

LUIZ, A.J.B. Importância de textos em português para a apropriação do conhecimento em ciência e tecnologia no Brasil. Cadernos de Ciência & Tecnologia, Brasília, v. 20, n. 3, p. 543­554, 2003.

OLIVEIRA, A. J. Quantitative analysis in the study of language variation: notions of statistical and comparative analysis Varbrul and SPSS. Revista de Estudos da Linguagem, v. 17, n. 2, p. 93-119, jul./dez., 2009. DOI: 10.17851/2237-2083.17.2.93-119

OUSHIRO, L. Análise sociolinguística da posição variável do constituinte interrogativo. Revista da ABRALIN, v. 11, n. 2, p. 43-87, jul./dez., 2012

POPESCU, I. I.; LUPEA, M.; TATAR, D.; ALTMANN, G. Quantitative Analysis of Poetic Texts. Berlin/Boston: de Gruyter. 2015. 280 p.

QUIRINO, T. R.; LUIZ, A. J. B.; DIAS, E. C. Tecnologias agropecuárias e impacto ambiental: uma agenda para a pesquisa. Cadernos de Ciência & Tecnologia, Brasília, v. 16, n. 2, p. 69-96, 1999.

SCHULTZ, B.; FORMAGGIO, A. R.; EBERHARDT, I. D. R.; SANCHES, I. D.; OLIVEIRA, J. C. de; LUIZ, A. J. B. Classificação orientada a objetos em imagens multitemporais Landsat aplicada na identificação de cana-de-açúcar e soja. Revista Brasileira de Cartografia, Rio de Janeiro, v. 68, n. 1, p. 131-143, 2016.

TUFTE, E. R. The visual display of quantitative information. 2 ed. Connecticut: Graphics Press. 2001. 200 p.

TURIK, C.; VIALI, L.; MORAES, J. F. D. Análise de atitudes de alunos universitários em relação à estatística por meio da teoria de resposta ao item. Ciência & Educação, v. 18, n. 1, p. 231-243, 2012. Disponível em: http://www.scielo.br/pdf/ciedu/v18n1/14.pdf

WATANABE, M. A.; LUIZ, A. J. B.; ABREU, L. S. de. Preços de hortifrútis convencionais e orgânicas em feiras livres e supermercado de Barão Geraldo, Campinas, SP, Brasil. In: 56º CONGRESSO DA SOCIEDADE BRASILEIRA DE ECONOMIA, ADMINISTRAÇÃO E SOCIOLOGIA RURAL, 2018, Campinas. Anais. Campinas: SOBER, 2018. 11 p. Disponível em: http://icongresso.itarget.com.br/tra/arquivos/ser.8/1/8675.pdf

Publicado
29-07-2019