Abstract
Partant du constat qu’il n’existe pas de catégorie fermée de marqueurs discursifs (MD) et que la définition de ces marqueurs varie fortement selon le cadre épistémologique adopté, l’objectif du projet MDMA (« Model for Discourse Marker Annotation ») est d’établir une méthode empirique d’identification et d’annotation des MD en français oral. La méthode vise tout d’abord à décrire les MD en faisceaux de variables et ensuite, d’un point de vue combinatoire, en patrons spécifiques. Notre démarche comprend trois étapes : (i) repérage manuel de tous les MD dits « potentiels » dans un corpus équilibré en français oral (5 000 mots ; Belgique et France) ; (ii) extraction automatique de toutes les formes qui correspondent aux MD potentiels identifiés précédemment (1 181 occurrences) ; (iii) analyse paramétrique d’un échantillon aléatoire de 200 MD potentiels en contexte (variables syntaxiques, formelles et sémantico-pragmatiques). L’hypothèse est que l’analyse statistique des contraintes distributionnelles imposées aux différents MD potentiels devrait révéler une certaine hiérarchisation entre variables annotées, concernant leur pertinence, leur fiabilité et leur généralisabilité (voire leur spécificité). Dans cet article, nous présenterons les principes d’annotation des MD, nous aborderons ensuite la problématique de l’accord inter-juges, pour finalement discuter de manière plus approfondie les résultats de l’analyse sur corpus.
Cite
CITATION STYLE
Bolly, C. T., Crible, L., Degand, L., & Uygur-Distexhe, D. (2015). MDMA. Un modèle pour l’identification et l’annotation des marqueurs discursifs « potentiels » en contexte. Discours, (16). https://doi.org/10.4000/discours.9009
Register to see more suggestions
Mendeley helps you to discover research relevant for your work.