"Old Spanish Textual Archive", diseño y desarrollo de un corpus de textos medievales: lematización y etiquetado gramatical

  • Gago Jover F
  • Pueyo Mena F
N/ACitations
Citations of this article
7Readers
Mendeley users who have this article in their library.

Abstract

Este trabajo expone los aspectos relacionados con el procesamiento de las formas, lemas, análisis gramatical y textos en el Old Spanish Textual Archive (OSTA), un corpus lingüístico de más de 32 millones de palabras, basado en las más de 400 transcripciones semi-paleográficas de textos medievales escritos en castellano, asturiano, leonés, navarro-aragonés y aragonés realizadas por los colaboradores del Hispanic Seminary of Medieval Studies (HSMS). Se describe además el proceso de etiquetado y lematización mediante el uso de Freeling, una herramienta de  Procesamiento del Lenguaje Natural, y de HSMS-app, una herramienta de análisis textual desarrollada para este proyecto.

Cite

CITATION STYLE

APA

Gago Jover, F., & Pueyo Mena, F. J. (2018). “Old Spanish Textual Archive”, diseño y desarrollo de un corpus de textos medievales: lematización y etiquetado gramatical. Scriptum Digital, 7, 25–35. https://doi.org/10.5565/rev/scriptum.88

Register to see more suggestions

Mendeley helps you to discover research relevant for your work.

Already have an account?

Save time finding and organizing research with Mendeley

Sign up for free