Analyses factorielles multivariées et classification - 4 jours (*) Référence : STA-N2-StatAFM Durée : 4 jours soit 28 heures (*) : La durée proposée est une durée standard. Elle peut être adaptée selon les besoins, les acquis, les niveaux des participants et le contexte. Filière : Statistique Population visée : Employé Technicien Cadre Chercheur Etudiant Public concerné : Toute personne souhaitant comprendre et mettre en œuvre les procédures d analyses factorielles multivariées EN QUELQUES MOTS Cette formation s'adresse à des personnes souhaitant maîtriser les concepts et l application des méthodes d analyses multifactorielles. Cette formation conviendra à des personnes venant chercher du savoir statistique sur : Les concepts d utilisation des méthodes de statistique exploratoire multidimensionnelle Les différents contextes d application de chaque méthode Les fondements mathématiques de ces analyses La mise en application et l interprétation des résultats des différentes méthodes La mise en application s'effectuera autour du logiciel XlStat. Cette formation inclut donc la prise en main rapide de l'interface XlStat. PRÉ-REQUIS En prérequis, il est INDISPENSABLE d avoir des connaissances de base en statistique. THEMES PRINCIPAUX Analyse en composantes principales (ACP) Positionnement multidimensionnel (MDS) Analyse factorielle des correspondances simples (AFC) Analyse factorielle des correspondances multiples (AFCM) Analyse canonique des corrélations (ACC) Analyse factorielle discriminante (AFD) Classification ascendante hiérarchique (CAH) Classification par réallocation dynamique (k-means) OBJECTIFS PEDAGOGIQUES A l issue de cette formation, l apprenant sera capable : D identifier quelle méthode d analyse multivariée ou de classification utiliser selon le contexte Page 1/5 - Analyses factorielles multivariées et classification
De connaître les concepts mathématiques inhérents à ces méthodes De mettre en œuvre les différentes analyses D interpréter les résultats de chaque méthode et d analyser les différents graphiques qui en découlent De connaître les coefficients permettant d estimer la qualité de l analyse statistique De mesurer la contribution de chaque variable et de chaque individu sur les axes factoriels OUTILS LOGICIELS Cette formation n est pas dédiée à la pratique d un logiciel particulier. Les exercices et les illustrations se feront avec des logiciels de traitements spécialisés à l analyse multivariée (R, XLSTAT ) en tenant compte des outils pratiqués par les utilisateurs. QUELQUES MOTS-CLES XlStat Réduction de dimension Corrélation Matrice de variance-covariance Distance, projection, inertie Valeurs propres Tableau de contingence ACP MDS AFC AFCM ACC AFD CAH K-means Graphique des axes factoriels Graphique des individus Dendrogramme OBJECTIFS OPERATIONNELS ET CONTENU DE LA FORMATION Prendre en main l'outil XlStat (si nécessaire) Généralités et interface utilisateur Interface de base Rappel sur quelques outils Excel nécessaires à la manipulation d'xlstat. Activation, chargement et fermeture d'xlstat Gestion et organisation des données L'interface XlStat Menus et barre d'outils Principes de paramétrage des boîtes de dialogue Gestion des classeurs et des feuilles Excel Paramétrage de base de l'outil Présentations des différentes analyses statistiques disponibles Complémentarités entre Excel et XlStat Outils XlStat non statistiques Repérage de données selon critères Différents types de fonctionnalités de préparation des données Regroupement des données en classes Transformation de données Outils complémentaires aux graphiques (étiquettes, axes, facteur de zoom, ) Page 2/5 - Analyses factorielles multivariées et classification
Codage de données Connaitre les généralités sur les méthodes d'analyses factorielles et sur la classification Limites des statistiques classiques Structure des jeux de données Champs d'application des méthodes d'analyses multifactorielles Les objectifs des techniques d'analyse Objectifs de description Objectifs de prédiction Présentation de l'éventail des méthodes Analyse en composantes principales Positionnement multidimensionnel Analyse factorielle des correspondances Analyse factorielle des correspondances multiples Analyse canonique des corrélations Analyse factorielle discriminante Méthodes de classification : classification ascendante hiérarchique, réallocation dynamique Les outils mathématiques Notion de distances Notion de corrélations Méthodes factorielles multidimensionnelles Mettre en œuvre l ACP et contexte d application Matrice de corrélations, de variance-covariance Inertie et variance Choix des axes de représentation (choix du nombre de composantes principales) Interprétation des axes factoriels Contribution des individus et des variables aux axes Qualité de représentation des individus et des variables sur les axes Les différentes ACP : normée et non normée, non paramétrique, polychorique Représentations graphiques diverses Positionnement d une variable illustrative catégorielle et ellipses de confiance Page 3/5 - Analyses factorielles multivariées et classification
Mettre en œuvre la MDS Contexte d'utilisation de la méthode du positionnement multidimensionnel Notions de similarité, dissimilarité, distance Lien et différence entre ACP et MDS Principes de la MDS Mettre en œuvre l AFC Contexte d'utilisation d'une analyse factorielle des correspondances Tableau de contingence Données individus, variables qualitatives Différence entre ACP et AFC Proximités et oppositions entre les modalités, liaison entre deux variables qualitatives Profils lignes et profils colonnes Choix des axes de représentation Représentation des modalités de base autour des composantes Contributions des modalités à l inertie Mettre en œuvre l AFCM Contexte d'utilisation d'une analyse factorielle des correspondances multiples Différence entre AFC et AFCM Tableau disjonctif complet, tableau de Burt Valeurs propres et choix des axes de représentation Information sur les individus Rapports de corrélation Mettre en œuvre l ACC Contexte d'utilisation d'une analyse canonique des corrélations Analogie avec l ACP, la régression linéaire et les autres méthodes d analyse factorielle Objectifs et principes de l ACC Notion de proximité entre 2 groupes de variables quantitatives Vocabulaire spécifique : variables canoniques, coefficients de corrélation canonique Représentation des variables et des individus dans les sous-espaces de chaque groupe Méthodes de classification, de classement Mettre en œuvre l AFD Contexte d'utilisation de l analyse factorielle discriminante Notions de classement et de discrimination Méthodologie de l AFD Comparaison avec l ACP Page 4/5 - Analyses factorielles multivariées et classification
Mettre en œuvre la CAH Présentation des objectifs de la classification ascendante hiérarchique Choix de la distance, dissimilarité, similarité entre les individus : distance euclidienne Choix du linkage (saut, critère de «rapprochement» entre les classes) : méthode de Ward Lecture d un dendrogramme Choix du nombre de classes Classification sur les individus Classification sur les variables (distance de corrélation et composantes latentes) Mettre en œuvre la classification par réallocation dynamique (centres mobiles) Contexte d'utilisation de la classification par réallocation dynamique Principe général des différentes méthodes Comparaison avec la CAH Présentation de la méthode k-means Les différentes variantes de classification par réallocation dynamique Conseils de mise en œuvre Méthodes et moyens : Explications théoriques suivies de pratiques guidées puis mises en autonomie 1 vidéoprojecteur par salle 1 ordinateur par stagiaire Méthodes d évaluation des acquis : Exercices de synthèse et d évaluation Evaluation de fin de stage Profil formateur : Nos formateurs sont certifiés à l issue d un parcours organisé par nos soins. Ils bénéficient d un suivi de compétences aussi bien au niveau technique que pédagogique. Support stagiaire : Support papier ou électronique (dématérialisé) Les exercices d accompagnement peuvent être récupérés sur clef USB Page 5/5 - Analyses factorielles multivariées et classification