La grande majorité des applications de traitement automatique des langues qui ont pour domaine les langues de spécialité sont des outils d’extraction terminologique. Elles se concentrent donc naturellement sur l’identification des groupes nominaux et des groupes prépositionnels ou prémodificateurs qui leur sont associés. En nous fondant sur un corpus bilingue anglais-français composé d’articles de recherche médicale, nous proposons un modèle d’extraction phraséologique semi-automatisée, dont le point de départ est la recherche des co-occurrents les plus fréquents des formes verbales du texte original (l’anglais), étiqueté morpho-syntaxiquement (POS-tagged). L’indice de probabilité de co-occurrence (z-score) permet dans un premier temps d’établir la liste des collocants les plus fréquents d’un verbe donné dans les classes des adverbes et des noms. On recherche ensuite les adjectifs qui entrent en co-occurrence avec les adverbes et les noms relevés lors de la première étape. Une deuxième méthode utilisant les adverbes comme point de départ de la recherche a été testée et semble donner de meilleurs résultats.
CITATION STYLE
Maniez, F. (2002). Un modèle d’extraction des collocations en langue de spécialité. ASp, (35–36), 35–47. https://doi.org/10.4000/asp.1597
Mendeley helps you to discover research relevant for your work.