Contenu de l'article

	Titre	Représentations du texte pour la classification arborée et l'analyse automatique de corpus. Application à un corpus d'historiens latins
	Auteur	Sylvie Mellet, Nguyen Xuan Luong, Dominique Longrée, Jean-Pierre Barthelemy
	Revue	Mathématiques et sciences humaines
	Numéro	no 187, automne 2009 Journée 2007 de la Société Francophone de Classification
	Page	107-121
	Résumé	Nous exposons ici différentes méthodes de classification automatique des textes littéraires et nous en comparons les performances, notamment en ce qui concerne leur aptitude à traduire les structurations génériques du corpus. Nous montrons qu'une approche topologique des textes, qui prend en compte leur linéarité fondamentale, c'est-à-dire l'ordre macro- et micro-structurel de leurs différentes unités constitutives, permet d'obtenir de meilleurs résultats classificatoires que les méthodes traditionnelles qui tendent à négliger cette structure linéaire. Source : Éditeur (via OpenEdition Journals)
	Résumé anglais	In this paper, we present different methods of automatic classification applied to a corpus of literary texts and we compare their different results; in particular we evaluate how each of them is suitable for exhibiting the generic classification of the corpus. We demonstrate that a topological approach of the texts which takes into account their linearity, i.e. the order of their micro- and macro-structures, results in better clustering than traditional quantitative methods which leave generally out of count this linear structure. Source : Éditeur (via OpenEdition Journals)
	Article en ligne	http://msh.revues.org/11152