Cet article synthétise les acquis et développements issus de projets de recherche menés depuis 2013 à propos de l’analyse d’un type particulier de données CMC (Computer-mediated communication) : les tweets politiques. Après une caractérisation de ce genre de discours, et des problématiques soulevées, l’article développe les enjeux de l’exploration des corpus de ce genre ; l’appréhension et la constitution de ces données sociales en corpus ; la production de résultats scientifiques, et la mise en place de différents types d’exploration de corpus. Les méthodes de constitution de corpus, la standardisation et la mise au format TEI, l’utilisation d’outils d’analyse des données textuelles, et le développement de plateformes, sont ainsi présentés, comme différents points d’une même recherche qui vise à caractériser et comprendre une pratique sociale avec une méthode scientifique et une portée citoyenne. L’exploration de corpus peut ainsi passer par des nouvelles productions de ressources, outils, interfaces, dont l’interactivité, l’hypertextualité, et l’ouverture, garantissent la validité des corpus, et la possibilité d’y accéder de manière contextuelle, et outillée.
CITATION STYLE
Longhi, J. (2020). Explorer des corpus de tweets : du traitement informatique à l’analyse discursive complexe. Corpus, (20). https://doi.org/10.4000/corpus.4567
Mendeley helps you to discover research relevant for your work.