SATO-XML : une plateforme Internet ouverte pour l'analyse de texte assistée par ordinateur
Abstract
Abstract In this contribution, we present a computer-based infrastructure available on the Internet, which allows the manipulation and analysis of text corpora. By the way of an HTML interface the researcher is given access to a personal workspace, a text library, some lexical resources, as well as software applications and procedures for a collaborative work respectful of everyones data and specific analysis strategies. The SATO software, available in a client-server mode, allows the categorization of data and the iterative construction of protocols of analysis. XML gives the opportunity to save and exchange data in a standard format. Thus, the described data can be either imported from or exported to other software applications for statistical, linguistic or graphic treatments. The interface available on the Internet includes modes of simplified access to large documented corpora, in particular those of interest for Professor Jules Duchastels Canada Research Chair in Globalization, Citizenship and Democracy. In this contribution, we are presenting a few exploratory analyses as examples of the possibilities of this computer-based infrastructure. Résumé Cet article présente une infrastructure informatique, accessible par le Web, qui permet de manipuler et danalyser des corpus de textes. Une interface HTML donne au chercheur laccès à un espace de travail personnel et à des librairies de textes, de ressources lexicales, de programmes et de procédures permettant denvisager un travail coopératif qui respecte les stratégies danalyse et les données de chacun. Au niveau des traitements, le logiciel SATO, accessible en mode client-serveur permet de catégoriser les données et de construire des protocoles danalyse de façon itérative. La normalisation XML permet une conservation et un échange des données dans un format standard. Ainsi, les données décrites peuvent être importées ou exportées pour être traitées par divers logiciels statistiques, linguistiques ou graphiques. Linterface Web comprend aussi des modes simplifiés daccès à de grands corpus documentés, en particulier ceux faisant partie des axes de recherche de la Chaire de recherche du Canada en Mondialisation, citoyenneté et démocratie du professeur Jules Duchastel. Dans cet article, quelques analyses exploratoires illustrent lutilisation de cette infrastructure logicielle. Mots-clés : analyse de texte par ordinateur, SATO-XML, interface HTML, corpus sur le Web.
Sign up today - FREE
Mendeley saves you time finding and organizing research. Learn more
- All your research in one place
- Add and import papers easily
- Access it anywhere, anytime

