Text Simplification as Tree Transduction

  • Paetzold G
  • Specia L
  • 27


    Mendeley users who have this article in their library.
  • N/A


    Citations of this article.


Lexical and syntactic simplification aim to make texts more accessible to certain audiences. Syntactic simplification uses either hand-crafted linguis-tic rules for deep syntactic transformations, or machine learning techniques to model simpler transformations. Lexical simplification performs a lookup for synonyms followed by context and/or frequency-based models. In this paper we investigate modelling both syntactic and lexical simplification through the learning of general tree transduction rules. Experiments with the Simple En-glish Wikipedia corpus show promising results but highlight the need for clever filtering strategies to remove noisy transformations. Resumo. A simplifica ao em nível lexical e sintático objetiva tornar textos mais acessíveis a certos públicos-alvo. Simplifica ao em nível sintático usa regras confeccionadas manualmente para empregar transforma oes sintáticas, ou técnicas de aprendizado de máquina para modelar transforma oes mais sim-ples. Simplifica ao em nível lexical emprega busca por sinônimos para palavras complexas seguida por análise de contexto e/ou busca em modelos de frequência de palavras. Neste trabalho investiga-se a modelagem de ambas estratégias de simplifica ao em nível sintático e lexical pelo aprendizado de regras através da transdu ao dé arvores. Experimentos com dados da Simple English Wikipedia mostram resultados promissores, porém destacam a necessidade de estratégias inteligentes de filtragem para remover transforma oes ruidosas.

Get free article suggestions today

Mendeley saves you time finding and organizing research

Sign up here
Already have an account ?Sign in

Find this document

There are no full text links


  • GH Paetzold

  • Lucia Specia

Cite this document

Choose a citation style from the tabs below

Save time finding and organizing research with Mendeley

Sign up for free