Un modèle d’extraction des collocations en langue de spécialité

  • Maniez F
N/ACitations
Citations of this article
10Readers
Mendeley users who have this article in their library.

Abstract

La grande majorité des applications de traitement automatique des langues qui ont pour domaine les langues de spécialité sont des outils d’extraction terminologique. Elles se concentrent donc naturellement sur l’identification des groupes nominaux et des groupes prépositionnels ou prémodificateurs qui leur sont associés. En nous fondant sur un corpus bilingue anglais-français composé d’articles de recherche médicale, nous proposons un modèle d’extraction phraséologique semi-automatisée, dont le point de départ est la recherche des co-occurrents les plus fréquents des formes verbales du texte original (l’anglais), étiqueté morpho-syntaxiquement (POS-tagged). L’indice de probabilité de co-occurrence (z-score) permet dans un premier temps d’établir la liste des collocants les plus fréquents d’un verbe donné dans les classes des adverbes et des noms. On recherche ensuite les adjectifs qui entrent en co-occurrence avec les adverbes et les noms relevés lors de la première étape. Une deuxième méthode utilisant les adverbes comme point de départ de la recherche a été testée et semble donner de meilleurs résultats.

Cite

CITATION STYLE

APA

Maniez, F. (2002). Un modèle d’extraction des collocations en langue de spécialité. ASp, (35–36), 35–47. https://doi.org/10.4000/asp.1597

Register to see more suggestions

Mendeley helps you to discover research relevant for your work.

Already have an account?

Save time finding and organizing research with Mendeley

Sign up for free