Analysis of conjunctions and conjunctive phrases of addition as indicators of informational complementarity
Keywords:
Complementarity. Natural Language Processing. Corpus linguistics.Abstract
With the aim of promoting theoretical subsidies for the identification of informational complementarity according to the CST theoretical model, in this paper, we verified the occurrence of conjunctions and conjunctive phrases of addition. For that, from the CSTNews corpus, we selected pairs of sentences previously annotated with the Follow-up, Historical background, and Elaboration relations, which translate the phenomenon of complementarity. Then, we submitted the pairs of sentences to the AntConc software, which allowed the construction of placed lists. The results demonstrate that conjunctions and conjunctive phrases are potential indicators of informational complementarity and, more specifically, of Follow-up and Elaboration relationships.
References
ANTHONY, L. AntConc: design and development of a freeware corpus analysis toolkit for the technical writing classroom. In: IPCC 2005. Proceedings. International Professional Communication Conference, 2005. IEEE, 2005. p. 729-737.
BAPTISTA, J. HAGÈGE, C. MAMEDE, N. Proposta de anotação e normalização de expressões temporais da categoria TEMPO para o HAREM II. In: Actes de Encontros do Segundo HAREM. 2008.
CARDOSO, P.C.F.; MAZIERO, E.G.; JORGE, M.L.C.; SENO, E.M.R.; DI FELIPPO, A.; RINO, L.H.M.; NUNES, M.G.V.; PARDO, T.A.S. CSTNews - A discourse-annotated corpus for single and multi-document summarization of news texts in brazilian portuguese. In: Proceedings of the 3rd RST Brazilian Meeting, pp. 88-105. Cuiabá/MT, Brasil. 2011.
GEERAERTS, D. Theories of Lexical Semantics. New York: Oxford University Press, 2010
MANN, W.C.; THOMPSON, S.A. Rhetorical structure theory: A theory of text organization. University of Southern California, Information Sciences Institute, 1987.
MAZIERO, E. G.; JORGE, M. L. C.; PARDO, T. A. S. Identifying multi-document relations. In Proceedings of International Workshop on Natural Language Processing and Cognitive Science. Funchal/Madeira. p. 60-9. 2010.
MAZIERO, E.G. Identificação automática de relações multidocumento. 2012. 118 f. Dissertação (Mestrado em Ciências de computação e Matemática computacional) – Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos, 2012.
RADEV, D. R. A common theory of information fusion from multiple text sources step one: cross-document structure. In Proceedings of the 1st SIGdial workshop on Discourse and dialogue. Vol 10. p. 74-83. 2000.
SILVA, N.; DI-FELIPPO, A. Descrição e análise do fenômeno da contradição para a Sumarização Automática Multidcoumento. Série de relatórios técnicos do NILC. NILC-TR-14-03. São Carlos/SP. 2014.
SOUZA, J. W. C.; DI-FELIPPO, A.; PARDO, T. A. S. Investigação de métodos de identificação de redundância para Sumarização Automática Multidocumento. Série de Relatórios do NILC. NILC-TR-12. São Carlos-SP. 2012.
SOUZA, J.W.C. Descrição linguística da complementaridade para a sumarização automática multidocumento. 2015. 102 f. Dissertação (Mestrado em Linguística) - Programa de Pós-graduação em Linguística, Universidade Federal de São Carlos, São Carlos, 2015.
STUBBS, Michael. Conrad, concordance, collocation: heart of darkness or light at the end of the tunnel?. The Third Sinclair Open Lecture, University of Birmingham, 2004.
TABOADA, M.; DAS, D. Annotation upon Annotation: Adding Signalling Information to a Corpus of Discourse Relations. In: Dipper, S.; Zinsmeister, H.; Webber, B. (orgs). Dialogue and Discourse., v.4, n. 2, p. 249-281. 2013.
TAUFER, P. Massa de informações digitais pode ser usada em benefício da população. Jornal da Globo, 26 dez. 2013. Disponível em: <http://g1.globo.com/jornal-da-globo/noticia/2013/12/massa-de-informacoes-digitais-pode-ser-usada-em-beneficio-da-populacao.html> Acesso em: 02 fev. 2015.
Downloads
Published
How to Cite
Issue
Section
License
1. Proposta de Política para Periódicos de Acesso Livre
Autores que publicam nesta revista concordam com os seguintes termos:
- Autores mantém os direitos autorais e concedem à revista o direito de primeira publicação, com o trabalho simultaneamente licenciado sob a Licença Creative Commons Attribution que permite o compartilhamento do trabalho com reconhecimento da autoria e publicação inicial nesta revista.
- Autores têm autorização para assumir contratos adicionais separadamente, para distribuição não-exclusiva da versão do trabalho publicada nesta revista (ex.: publicar em repositório institucional ou como capítulo de livro), com reconhecimento de autoria e publicação inicial nesta revista.
- Autores têm permissão e são estimulados a publicar e distribuir seu trabalho online (ex.: em repositórios institucionais ou na sua página pessoal) após o processo editorial, no todo ou em partes, já que isso pode gerar alterações produtivas, bem como aumentar o impacto e a citação do trabalho publicado.