Analysis of conjunctions and conjunctive phrases of addition as indicators of informational complementarity

Authors

  • Jackson Wilke da Cruz Souza Universidade Federal de São Carlos, UFSCAR, Brasil.

Keywords:

Complementarity. Natural Language Processing. Corpus linguistics.

Abstract

With the aim of promoting theoretical subsidies for the identification of informational complementarity according to the CST theoretical model, in this paper, we verified the occurrence of conjunctions and conjunctive phrases of addition. For that, from the CSTNews corpus, we selected pairs of sentences previously annotated with the Follow-up, Historical background, and Elaboration relations, which translate the phenomenon of complementarity. Then, we submitted the pairs of sentences to the AntConc software, which allowed the construction of placed lists. The results demonstrate that conjunctions and conjunctive phrases are potential indicators of informational complementarity and, more specifically, of Follow-up and Elaboration relationships.

Author Biography

Jackson Wilke da Cruz Souza , Universidade Federal de São Carlos, UFSCAR, Brasil.

Doutor em Linguística (2019) pelo Programa de Pós-Graduação da Universidade Federal de São Carlos (PPGL-UFSCar) , na linha de pesquisa Descrição, Análise e Processamento Automático de Línguas Naturais (PLN). Mestre (2015) e Bacharel (2013) em Linguística pela UFSCar, com ênfase em PLN, atuando principalmente nas subáreas de Linguística de corpus, Semântica computacional, Terminologia, Sumarização automática e Análise textual. É professor adjunto na Universidade Federal de Alfenas (Unifal/MG), campus avançado de Varginha. É pesquisador em Grupo de Pesquisas Linguísticas Descritivas, Teóricas e Aplicadas (GPLING-UNIFAL/MG) e Data Science Research Group (DSRG-UFLA). É membro do Núcleo de Estudos Afro-brasileiros e Indígenas (NEABI-UNIFAL/MG) e do Núcleo de Diversidade Sexual e Gêneros (Diverges-UNIFAL/MG). É embaixador da Olimpíada Brasileira de Linguística na Unifal/MG.

References

ALEIXO, P.; PARDO, T.A.S. CSTNews: um corpus de textos jornalísticos anotados segundo a teoria discursiva multidocumento CST (cross-document structure theory). Série de relatórios técnicos do NILC (NILC-TR-08/05). São Carlos/SP, p. 15, 2008.
ANTHONY, L. AntConc: design and development of a freeware corpus analysis toolkit for the technical writing classroom. In: IPCC 2005. Proceedings. International Professional Communication Conference, 2005. IEEE, 2005. p. 729-737.
BAPTISTA, J. HAGÈGE, C. MAMEDE, N. Proposta de anotação e normalização de expressões temporais da categoria TEMPO para o HAREM II. In: Actes de Encontros do Segundo HAREM. 2008.
CARDOSO, P.C.F.; MAZIERO, E.G.; JORGE, M.L.C.; SENO, E.M.R.; DI FELIPPO, A.; RINO, L.H.M.; NUNES, M.G.V.; PARDO, T.A.S. CSTNews - A discourse-annotated corpus for single and multi-document summarization of news texts in brazilian portuguese. In: Proceedings of the 3rd RST Brazilian Meeting, pp. 88-105. Cuiabá/MT, Brasil. 2011.
GEERAERTS, D. Theories of Lexical Semantics. New York: Oxford University Press, 2010
MANN, W.C.; THOMPSON, S.A. Rhetorical structure theory: A theory of text organization. University of Southern California, Information Sciences Institute, 1987.
MAZIERO, E. G.; JORGE, M. L. C.; PARDO, T. A. S. Identifying multi-document relations. In Proceedings of International Workshop on Natural Language Processing and Cognitive Science. Funchal/Madeira. p. 60-9. 2010.
MAZIERO, E.G. Identificação automática de relações multidocumento. 2012. 118 f. Dissertação (Mestrado em Ciências de computação e Matemática computacional) – Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos, 2012.
RADEV, D. R. A common theory of information fusion from multiple text sources step one: cross-document structure. In Proceedings of the 1st SIGdial workshop on Discourse and dialogue. Vol 10. p. 74-83. 2000.
SILVA, N.; DI-FELIPPO, A. Descrição e análise do fenômeno da contradição para a Sumarização Automática Multidcoumento. Série de relatórios técnicos do NILC. NILC-TR-14-03. São Carlos/SP. 2014.
SOUZA, J. W. C.; DI-FELIPPO, A.; PARDO, T. A. S. Investigação de métodos de identificação de redundância para Sumarização Automática Multidocumento. Série de Relatórios do NILC. NILC-TR-12. São Carlos-SP. 2012.
SOUZA, J.W.C. Descrição linguística da complementaridade para a sumarização automática multidocumento. 2015. 102 f. Dissertação (Mestrado em Linguística) - Programa de Pós-graduação em Linguística, Universidade Federal de São Carlos, São Carlos, 2015.
STUBBS, Michael. Conrad, concordance, collocation: heart of darkness or light at the end of the tunnel?. The Third Sinclair Open Lecture, University of Birmingham, 2004.
TABOADA, M.; DAS, D. Annotation upon Annotation: Adding Signalling Information to a Corpus of Discourse Relations. In: Dipper, S.; Zinsmeister, H.; Webber, B. (orgs). Dialogue and Discourse., v.4, n. 2, p. 249-281. 2013.
TAUFER, P. Massa de informações digitais pode ser usada em benefício da população. Jornal da Globo, 26 dez. 2013. Disponível em: <http://g1.globo.com/jornal-da-globo/noticia/2013/12/massa-de-informacoes-digitais-pode-ser-usada-em-beneficio-da-populacao.html> Acesso em: 02 fev. 2015.

Published

21-12-2018

How to Cite

SOUZA , Jackson Wilke da Cruz. Analysis of conjunctions and conjunctive phrases of addition as indicators of informational complementarity. Trem de Letras, [S. l.], v. 5, n. 1, p. e018009, 2018. Disponível em: https://publicacoes.unifal-mg.edu.br/revistas/index.php/tremdeletras/article/view/1824. Acesso em: 18 may. 2024.

Issue

Section

Artigos - Estudos linguísticos