Método para la representación semi-automática de modelos conceptuales desde documentos de negocio escritos en lenguaje natural en español

  • Marín-Alvarez D
  • Manrique-Losada B
  • Quintero J
N/ACitations
Citations of this article
5Readers
Mendeley users who have this article in their library.

Abstract

Currently, the software development industry presents challenges for processing business information, specifically that contained in textual documents. In the process of software requirements elicitation, a potential source of relevant information is business documents, since they can facilitate the knowledge understanding about a domain, as well as know the evolution of a product. Despite its usefulness, requirements engineers do not always use it for their work because of time and costs involved. In this paper this problem is addressed and it is recognized through a systematic literature review, the potentiality of using Natural Language Processing (NLP) techniques to extract relevant textual information from business documents, and the utility of its representation in conceptual models. Starting from this, a semiautomatic method of extracting information from business documents written in natural language in Spanish and its representation in a conceptual model is proposed. The method is supported in a reference methodological framework for Text Analytics projects, is based on NLP techniques, and the output is represented in a class diagram. The method was evaluated through a case study with software analysts in Medellin-Colombia, taking as input telecommunications resolution documents. The evaluation allows us to conclude that the model is a satisfactory approach to solving the problem, and some lines of work are identified to generalize a solution. (English) [ABSTRACT FROM AUTHOR] Actualmente la industria de desarrollo de software presenta grandes retos para el procesamiento de información de negocio, particularmente aquella contenida en documentos textuales. En el proceso de educción de requisitos de software una fuente potencial de información relevante son los documentos de negocio, pues a partir de éstos se puede facilitar la comprensión de conocimiento de un dominio, así como conocer la evolución de un producto. A pesar de su utilidad, los ingenieros de requisitos no siempre la usan para su labor por los tiempos y costos que implica. En el presente trabajo se aborda esta problemática y se reconoce por medio de una revisión sistemática, la potencialidad de usar técnicas de Procesamiento de Lenguaje Natural (NLP por sus siglas en inglés) para extraer información textual relevante de documentos de negocio, y la utilidad de representarla en modelos conceptuales. A partir de esto, se propone un método semi-automático de extracción de información desde documentos de negocio escritos en lenguaje natural en español y su representación en un modelo conceptual. El método se soporta en un marco metodológico de referencia para proyectos de Analítica de Texto, se fundamenta en técnicas de NLP, y se representa la salida en un diagrama de clases. El método fue evaluado mediante un caso de estudio con analistas de software en Medellín-Colombia, tomando como entrada documentos de resolución de telecomunicaciones. La evaluación permite concluir que el modelo es una satisfactoria aproximación a solucionar el problema planteado mejorando el tiempo de procesamiento y manteniendo un nivel de interpretación similar al proceso manual. (Spanish) [ABSTRACT FROM AUTHOR] Copyright of INGENIARE - Revista Chilena de Ingeniería is the property of Universidad de Tarapaca and its content may not be copied or emailed to multiple sites or posted to a listserv without the copyright holder's express written permission. However, users may print, download, or email articles for individual use. This abstract may be abridged. No warranty is given about the accuracy of the copy. Users should refer to the original published version of the material for the full abstract. (Copyright applies to all Abstracts.)

Cite

CITATION STYLE

APA

Marín-Alvarez, D. A., Manrique-Losada, B., & Quintero, J. B. (2020). Método para la representación semi-automática de modelos conceptuales desde documentos de negocio escritos en lenguaje natural en español. Ingeniare. Revista Chilena de Ingeniería, 28(4), 565–584. https://doi.org/10.4067/s0718-33052020000400565

Register to see more suggestions

Mendeley helps you to discover research relevant for your work.

Already have an account?

Save time finding and organizing research with Mendeley

Sign up for free