Contenu de l'article

Titre Représentations du texte pour la classification arborée et l'analyse automatique de corpus. Application à un corpus d'historiens latins
Auteur Sylvie Mellet, Nguyen Xuan Luong, Dominique Longrée, Jean-Pierre Barthelemy
Mir@bel Revue Mathématiques et sciences humaines
Numéro no 187, automne 2009 Journée 2007 de la Société Francophone de Classification
Page 107-121
Résumé Nous exposons ici différentes méthodes de classification automatique des textes littéraires et nous en comparons les performances, notamment en ce qui concerne leur aptitude à traduire les structurations génériques du corpus. Nous montrons qu'une approche topologique des textes, qui prend en compte leur linéarité fondamentale, c'est-à-dire l'ordre macro- et micro-structurel de leurs différentes unités constitutives, permet d'obtenir de meilleurs résultats classificatoires que les méthodes traditionnelles qui tendent à négliger cette structure linéaire.
Source : Éditeur (via OpenEdition Journals)
Résumé anglais In this paper, we present different methods of automatic classification applied to a corpus of literary texts and we compare their different results; in particular we evaluate how each of them is suitable for exhibiting the generic classification of the corpus. We demonstrate that a topological approach of the texts which takes into account their linearity, i.e. the order of their micro- and macro-structures, results in better clustering than traditional quantitative methods which leave generally out of count this linear structure.
Source : Éditeur (via OpenEdition Journals)
Article en ligne http://msh.revues.org/11152