Contenu de l'article

Titre A different approach to multiple correspondence analysis (MCA) than that of specific MCA
Auteur Odysseas E. Moschidis
Mir@bel Revue Mathématiques et sciences humaines
Numéro no 186, été 2009
Page 77-88
Résumé Dans l'analyse des correspondances multiples, la contribution de chaque variable nominale à l'inertie est différente selon le nombre des modalités, ou des catégories de cette variable. Habituellement, pour les variables ayant beaucoup de modalités (ou catégories) il y a des modalités peu fréquentes (les « classes faibles ») qui contribuent à l'inertie de la variable correspondante de façon disproportionnée. Souvent, ces modalités contribuent fortement à la détermination des premiers axes factoriels ce qui a pour conséquence de ne pas correctement représenter le problème étudié. L'analyse spécifique des correspondances multiples traite le problème des modalités peu fréquentes en les supprimant. C'est-à-dire, qu'elle les ignore purement et simplement dans le calcul des distances entre les individus [Le Roux B., 1999 ; Le Roux B., Rouanet H., 2004].Dans cet article, nous traitons ce problème d'une façon différente. Nous maintenons les modalités faibles dans l'analyse. Ce que réalise notre analyse, c'est de remplacer la métrique du khi-deux, par une nouvelle métrique qui prend également en compte le nombre de modalités de chaque variable : c'est aussi d'attribuer un effet raisonnable aux modalités faibles et d'équilibrer toutes les variables nominales. En outre, nous tenons compte, uniformément, des modalités faibles, qu'elles dérivent de beaucoup ou de peu de variables, bien que la plupart des cas « dangereux » sont ceux des variables qui ont beaucoup de modalités. Seules les variables à deux modalités ne sont pas concernées
Source : Éditeur (via OpenEdition Journals)
Résumé anglais In multiple correspondence analysis, each nominal variable affects the analysis with a different amount of inertia, depending on the number of its modalities or categories. Usually in variables with many modalities – categories created infrequent (weak classes) modalities which contribute disproportionally to the inertia of the corresponding variable. Often these modalities contribute heavily to the determination of the first factorial axes and as a result this cannot clearly represent the investigated problem. Specific multiple correspondence analysis deals with the problem of infrequent (weak) modalities by removing them. That is, it simply ignores them in the calculation of distances between individuals [Le Roux B., 1999; Le Roux B., Rouanet H., 2004].In this paper we deal with this problem in a different manner. We keep the weak modalities in the analysis. Replacing the khi2 metric by a new metric which also takes into account the number of modalities of each variable, a reasonable effect of the weak modalities and a balancing of all the nominal variables is achieved in the analysis.We also encounter uniformly the weak modalities, whether they derive from many or few variables, even though the most “dangerous” case is the one variables where have many modalities. Only variables of two modalities are not affected.
Source : Éditeur (via OpenEdition Journals)
Article en ligne http://msh.revues.org/11091