Titre | Représentations du texte pour la classification arborée et l'analyse automatique de corpus. Application à un corpus d'historiens latins | |
---|---|---|
Auteur | Sylvie Mellet, Nguyen Xuan Luong, Dominique Longrée, Jean-Pierre Barthelemy | |
Revue | Mathématiques et sciences humaines | |
Numéro | no 187, automne 2009 Journée 2007 de la Société Francophone de Classification | |
Page | 107-121 | |
Résumé |
Nous exposons ici différentes méthodes de classification automatique des textes littéraires et nous en comparons les performances, notamment en ce qui concerne leur aptitude à traduire les structurations génériques du corpus. Nous montrons qu'une approche topologique des textes, qui prend en compte leur linéarité fondamentale, c'est-à-dire l'ordre macro- et micro-structurel de leurs différentes unités constitutives, permet d'obtenir de meilleurs résultats classificatoires que les méthodes traditionnelles qui tendent à négliger cette structure linéaire. Source : Éditeur (via OpenEdition Journals) |
|
Résumé anglais |
In this paper, we present different methods of automatic classification applied to a corpus of literary texts and we compare their different results; in particular we evaluate how each of them is suitable for exhibiting the generic classification of the corpus. We demonstrate that a topological approach of the texts which takes into account their linearity, i.e. the order of their micro- and macro-structures, results in better clustering than traditional quantitative methods which leave generally out of count this linear structure. Source : Éditeur (via OpenEdition Journals) |
|
Article en ligne | http://msh.revues.org/11152 |