Contenu de l'article

Titre Une nouvelle méthode de classification pour des données intervalles
Auteur André Hardy, Nathanael Kasoro
Mir@bel Revue Mathématiques et sciences humaines
Numéro no 187, automne 2009 Journée 2007 de la Société Francophone de Classification
Page 79-91
Résumé Cet article propose une nouvelle méthode de classification automatique pour des données intervalles. C'est une extension d'une méthode de classification classique à des données intervalles. La procédure classique est basée sur la théorie des processus ponctuels, et plus particulièrement sur le processus de Poisson homogène. La première partie de la nouvelle méthode est une procédure de classification monothétique divisive. La règle de coupure utilise une extension à des données intervalles du critère de classification des Hypervolumes. L'étape d'élagage utilise deux tests statistiques du quotient de vraisemblance basés sur le processus de Poisson homogène : le test des Hypervolumes et le Gap test. Nous obtenons alors un arbre de décision. La seconde partie de la méthode est une procédure de recollement qui permet, dans certains cas, d'améliorer la classification obtenue à la fin de la première partie de l'algorithme. La méthode est évaluée sur des données générées et sur des données réelles. Elle est comparée à d'autres méthodes de classification disponibles pour des données intervalles.
Source : Éditeur (via OpenEdition Journals)
Résumé anglais This paper presents a new clustering method for interval data. It is an extension of a classical clustering method to interval data. The classical procedure is based on the theory of point processes, and more particularly on the homogeneous Poisson process. The first part of the new method is a monothetic divisive procedure. The cut rule is an extension to interval data of the Hypervolumes clustering criterion. The pruning step uses two statistical likelihood ratio tests based on the homogeneous Poisson process: the Hypervolumes test and the Gap test. The output is a decision tree. The second part of the method is a merging process, that allows in particular cases to improve the classification obtained at the end of the first part of the algorithm. The method is applied to a generated data set and to a real data set. It is compared with other clustering methods available for interval data.
Source : Éditeur (via OpenEdition Journals)
Article en ligne http://msh.revues.org/11138