Crible, Ludivine
[UCL]
Degand, Liesbeth
[UCL]
Discourse markers and their functions have been modeled through a large number of very diverse frameworks. Most of these models target written language and the discourse relations which hold between sentences. In this paper, we present, assess and apply a new annotation taxonomy, which targets discourse markers (instead of discourse relations) in spoken language, addressing their polyfunctionality in an alternative way. In particular, its main innovative feature is to distinguish between two independent layers of semantic-pragmatic information (i.e. domains and functions) which, once combined, provide a fine-grained disambiguation of discourse markers. We compare the affordances of this model to existing proposals, and illustrate them with a corpus study. A sample of conversational French containing 423 discourse marker tokens was fully analyzed by two independent annotators. We report on inter-annotator agreement scores, as well as quantitative analyses of the distribution of domains and functions in the sample. Both powerful and economical, this proposal advocates for a flexible and modular approach to discourse analysis, and paves the way for further corpus-based studies on the challenging category of discourse markers.
(fre)
Les marqueurs du discours et leurs fonctions ont fait l’objet de modélisations nombreuses et variées. La plupart de ces modèles portent sur l’écrit et sur les relations discursives entre énoncés. Dans cet article, nous présentons, évaluons et appliquons un nouveau modèle d’annotation qui porte sur les marqueurs du discours (et non sur les relations discursives) à l’oral, offrant une perspective nouvelle sur la polyfonctionnalité des marqueurs. Sa caractéristique la plus innovante est de définir deux couches indépendantes d’information sémantico-pragmatique (c.à.d domaines et fonctions) qui, une fois combinées, fournissent une désambigüisation fine des marqueurs du discours. Nous comparons les apports de ce modèle à d’autres approaches existantes et les illustrons dans une étude de corpus. Un échantillon de français conversationnel contenant 423 marqueurs du discours a été entièrement analysé par deux annotateurs. Nous analysons les scores d’accord inter-annotateurs, ainsi que la distribution des domaines et des fonctions dans l’échantillon. À la fois puissant et économique, ce modèle prône une approche flexible et modulaire de l’analyse du discours, et jette les bases pour de futures études de corpus sur la catégorie complexe des marqueurs du discours.
Référence bibliographique |
Crible, Ludivine ; Degand, Liesbeth. Domains and functions: A two-dimensional account of discourse markers. In: Discours : revue de linguistique, psycholinguistique et informatique, Vol. 24 (2019) |
Permalien |
http://hdl.handle.net/2078.1/215771 |