Partie I. Les données qualitatives



Documents pareils
c. Calcul pour une évolution d une proportion entre deux années non consécutives

Initiation à l analyse factorielle des correspondances

Statistique descriptive bidimensionnelle

SÉRIES STATISTIQUES À DEUX VARIABLES

Exo7. Déterminants. = 4(b + c)(c + a)(a + b). c + a c + b 2c Correction. b + a 2b b + c. Exercice 2 ** X a b c a X c b b c X a c b a X

Chapitre 3 : Fonctions d une variable réelle (1)

EXERCICES : DÉNOMBREMENT

Statistiques appliquées à la gestion Cours d analyse de donnés Master 1

Université de Bordeaux - Master MIMSE - 2ème année. Scoring. Marie Chavent machaven/

Exercice I ( non spé ) 1/ u 1 = u / Soit P la propriété : u n + 4. > 0 pour n 1. P est vraie au rang 1 car u 1

Module 3 : Inversion de matrices

Limites des Suites numériques

Comportement d'une suite

[ édité le 10 juillet 2014 Enoncés 1. Exercice 6 [ ] [correction] Si n est un entier 2, le rationnel H n =

CHAPITRE 2 SÉRIES ENTIÈRES

Intégration et probabilités ENS Paris, TD (20)13 Lois des grands nombres, théorème central limite. Corrigé :

FEUILLE D EXERCICES 17 - PROBABILITÉS SUR UN UNIVERS FINI

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

Consolidation. C r é e r un nouveau classeur. Créer un groupe de travail. Saisir des données dans un groupe

1 Mesure et intégrale

Séquence 5. La fonction logarithme népérien. Sommaire

Polynésie Septembre Exercice On peut traiter la question 4 sans avoir traité les questions précédentes.

Cours de Statistiques inférentielles

dénombrement, loi binomiale

Groupe orthogonal d'un espace vectoriel euclidien de dimension 2, de dimension 3

Baccalauréat S Asie 19 juin 2014 Corrigé

Dénombrement. Introduction. 1 Cardinaux d'ensembles nis. ECE3 Lycée Carnot. 12 novembre Quelques dénitions

. (b) Si (u n ) est une suite géométrique de raison q, q 1, on obtient : N N, S N = 1 qn+1. n+1 1 S N = 1 1

Etude de la fonction ζ de Riemann

Deuxième partie : LES CONTRATS D ASSURANCE VIE CLASSIQUES

Séries réelles ou complexes

Les Nombres Parfaits.

UNIVERSITE MONTESQUIEU BORDEAUX IV. Année universitaire Semestre 2. Prévisions Financières. Travaux Dirigés - Séances n 4

La France, à l écoute des entreprises innovantes, propose le meilleur crédit d impôt recherche d Europe

Dénombrement. Chapitre Enoncés des exercices

L Analyse Factorielle des Correspondances

DETERMINANTS. a b et a'

Chapitre 3 : Transistor bipolaire à jonction

Des familles de deux enfants

Module : réponse d un système linéaire

Statistique Numérique et Analyse des Données

LES ÉCLIPSES. Éclipser signifie «cacher». Vus depuis la Terre, deux corps célestes peuvent être éclipsés : la Lune et le Soleil.

20. Algorithmique & Mathématiques

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation

Convergences 2/2 - le théorème du point fixe - Page 1 sur 9

Le Sphinx. Enquêtes, Sondages. Analyse de données. Internet :

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation

II LES PROPRIETES DES ESTIMATEURS MCO 1. Rappel : M1 LA REGRESSION : HYPOTHESES ET TESTS Avril 2009

RECHERCHE DE CLIENTS simplifiée

Chap. 5 : Les intérêts (Les calculs financiers)

Partie 1 Automatique 1 et 2 (Asservissements Linéaires Continus)

Processus et martingales en temps continu

Cours 5 : ESTIMATION PONCTUELLE

TRANSFERT DE CHARGE DANS UN RÉSEAU DE PROCESSEURS TOTALEMENT CONNECTÉS (*) par Maryse BÉGUIN ( 1 )

n tr tr tr tr tr tr tr tr tr tr n tr tr tr Nom:... Prénom :...

Le marché du café peut être segmenté en fonction de deux modes de production principaux : la torréfaction et la fabrication de café soluble.

x +1 + ln. Donner la valeur exacte affichée par cet algorithme lorsque l utilisateur entre la valeur n =3.

Accès optiques : la nouvelle montée en débit

Tableaux Croisés et Diagrammes en Mosaïque : Pour Voir Les Probabilités Marginales et Conditionnelles.

55 - EXEMPLES D UTILISATION DU TABLEUR.

4 Approximation des fonctions

La maladie rénale chronique

Chapitre 2 SONDAGE ALEATOIRE SIMPLE OU A PROBABILITES EGALES. 2.1 DEFINITIONS 2.2 SONDAGE ALEATOIRE SIMPLE SANS REMISE (PESR) 2.2.

Etude Spéciale SCORING : UN GRAND PAS EN AVANT POUR LE MICROCRÉDIT?

STATISTIQUE : TESTS D HYPOTHESES

Sommaire Chapitre 1 - L interface de Windows 7 9

Découvrez les bâtiments* modulaires démontables

Séries numériques. Chap. 02 : cours complet.

Université Victor Segalen Bordeaux 2 Institut de Santé Publique, d Épidémiologie et de Développement (ISPED) Campus Numérique SEME

PROMENADE ALÉATOIRE : Chaînes de Markov et martingales

prix par consommateur identiques différents prix par identiques classique 3 unité différents 2 1

capital en fin d'année 1 C 0 + T C 0 = C 0 (1 + T) = C 0 r en posant r = 1 + T 2 C 0 r + C 0 r T = C 0 r (1 + T) = C 0 r 2 3 C 0 r 3...

UNIVERSITÉ DE SFAX École Supérieure de Commerce

14 Chapitre 14. Théorème du point fixe

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

STATISTIQUE AVANCÉE : MÉTHODES

MUTUELLE D&O MUTUELLE D&O. Copilote de votre santé. AGECFA-Voyageurs CARCEPT CARCEPT-Prévoyance CRC CRIS CRPB-AFB

Procès - Verbal du Conseil Municipal Du lundi 15 décembre 2014

1 Complément sur la projection du nuage des individus

S2I 1. quartz circuit de commande. Figure 1. Engrenage

INTRODUCTION AUX MATRICES ALÉATOIRES. par. Djalil Chafaï

Gérer les applications

ESIEA PARIS

Principes et Méthodes Statistiques

UV SQ 20. Automne Responsable d Rémy Garandel ( m.-el. remy.garandel@utbm.fr ) page 1

One Office Voice Pack Vos appels fixes et mobiles en un seul pack

Université Pierre et Marie Curie. Biostatistique PACES - UE

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES

Suites et séries de fonctions

POLITIQUE ECONOMIQUE ET DEVELOPPEMENT

Mobile Business. Communiquez efficacement avec vos relations commerciales 09/2012

TP : Outils de simulation. March 13, 2015

Échantillonnage et estimation

2 ième partie : MATHÉMATIQUES FINANCIÈRES

La tarification hospitalière : de l enveloppe globale à la concurrence par comparaison

Terminale S. Terminale S 1 F. Laroche

Résolution numérique des équations aux dérivées partielles (PDE)

Exercices de révision

Une action! Un message!

Transcription:

Variables qualitatives : aalyse des corresodaces Jea-Marc Lasgouttes htt://www-rocqiriafr/~lasgoutt/aa-doees L aalyse factorielle des corresodaces But O cherche à décrire la liaiso etre deux variables qualitatives Exemle o eut regarder la réartitio de la couleur des yeux e foctio de la couleur des cheveux Différece avec l ACP l ACP se fait das u cadre différet ; les variables sot quatitatives et doc il est ossible de faire des oératios mathématiques sur les valeurs des variables ; ar cotre il est e gééral as ossible de comter les idividus qui ot ue caractéristique doée taille 83m) Pourquoi deux variables? le cas de lus de deux variables est l aalyse de corresodace multiles traité lus tard das le cours Partie I Les doées qualitatives Variables qualitatives Soit X ue variable qualitative O disose d u échatillo de idividus sur lesquels la variable est mesurée Modalités ou catégories) les valeurs que eut redre ue variable qualitative ; si la variable a m modalités valeurs ossibles) o ote x i i m ces modalités ou lus simlemet i Effectif le ombre d occurrece de la modalité i das l échatillo ; o le ote i et o a m i i Profil c est l esemble des valeurs i / ; la somme du rofil sur les modalités est Tableau de cotigece Soiet X et X 2 deux variables qualitatives à m et m 2 modalités resectivemet décrivat u esemble de idividus Défiitio le tableau de cotigece est ue matrice à m liges et m 2 coloes refermat les effectifs ij d idividus tels que X i et X 2 j 2 m2 2 22 N ij m mm 2 La costitutio de ce tableau est aussi aelé u «tri croisé» Marges et rofils Marge e lige c est la somme i m 2 j ij c est-à-dire l effectif total de la modalité i de X O défiit aussi le rofil margial des liges i / Marge e coloe c est la somme j m i ij c est-àdire l effectif total de la modalité j de X 2 O défiit aussi le rofil margial des coloes j / Deux lectures ossibles selo la variable que l o rivilégie o eut défiir le tableau des rofils-liges ij / i qui rerésete la fréquece de la modalité j coditioellemet à X i ; la somme de chaque lige est rameée à 00% le tableau des rofils-coloes ij / j qui rerésete la fréquece de la modalité i coditioellemet à X j ; la somme de chaque coloe est rameée à 00% Proriétés des rofils Moyee la moyee des rofils-liges avec oids corresodat aux rofils margiaux des liges) est le rofil margial des coloes : m i i ij i j et de même our les coloes m 2 j j ij j Idéedace emirique i lorsque tous les rofils liges sot idetiques il y a idéedace etre X et X 2 uisque la coaissace de X e chage as la réartitio de X 2 O a our tout j j 2j 2 m j m et doc ij i j j + + mj + + m j

Le χ 2 d écart à l idéedace Défiitio X 2 c est la gradeur suivate aussi otée χ 2 ou m m 2 d 2 ij i j i j i j m 2 ij i j i j d 2 0 les variables sot idéedates Bore suérieure m i j 2 m ij i j comme ij i o a i j ij m i ij j j j j et doc d 2 m 2 ) O fait de même our m et ϕ 2 d2 mim m 2 ) Le χ 2 d écart à l idéedace suite) j j m 2 Déedace foctioelle si ϕ 2 m 2 alors our chaque i soit ij i soit ij 0 : il existe ue uique case o ulle ar lige X 2 est doc foctioellemet liée à X Déedace iverse cette relatio e sigifie as que X est foctioellemet liée à X 2 sauf si m m 2 O eut alors reréseter le tableau comme ue matrice diagoale Cotributio au χ 2 c est le terme ij i j i j qui ermet de mettre e évidece les associatios sigificatives etre modalités de deux variables Caractère sigificatif du χ 2 Problème à artir de quelle valeur de d 2 doit-o cosidérer que les variables X et X 2 sot déedates? Méthode o suose que X et X 2 sot issus de tirages de deux variables aléatoires idéedates O eut alors motrer que d 2 est ue réalisatio d ue variable aléatoire D 2 qui suit ue loi χ 2 m )m 2 ) Défiitio Loi du khi-deux à degrés de libertés χ 2 est la loi de la variable i U i 2 où les U i sot des variables gaussiees réduites idéedates Le test du χ 2 o se fixe u risque d erreur α 00 ou 005 e gééral) et) o calcule la valeur d 2 c telle que P χ 2 m > )m 2 ) d2 c α Si d 2 > d 2 c o cosidère que l évéemet est tro imrobable et que doc que l hyothèse origiale d idéedace doit être rejetée O trouvera e gééral ces valeurs das ue table récalculée Cas grad quad > 30 o cosidère que 2χ 2 2 est distribué comme ue variable gaussiee cetrée réduite N0 ) Partie II Géométrie de uages de rofils Aalyse des corresodaces de deux variables : les doées Effectifs o a u tableau de cotigece N à m liges et m 2 coloes résultat du croisemet de deux variables qualitatives X et X 2 à m et m 2 modalités resectivemet O ote D et D 2 les matrices diagoales des effectifs margiaux 0 2 D 0 m D 2 0 2 0 m2 Profils le tableau des rofils des liges ij / i est doé ar D N et celui des rofils des coloes ij/ j ar ND 2 Rerésetatio géométrique des rofils Nuage de oits les rofils-liges formet u uage de m oits de R m2 Chaque oit est affecté d u oids égal à sa fréquece margiale i / et la matrice des oids est doc D Cetre de gravité c est le rofil margial car g l ) D N) D m m 2 Profils-coloes les liges du tableau D 2 N formet u uage de m 2 oits de R m avec matrice de oids D 2 et cetre de gravité g c ) m 2 Cours d aalyse de doées Jea-Marc Lasgouttes aée 205-206

Commet étudier ces doées Cas idéedat e cas d idéedace emirique o a ij j i et ij j i Les deux uages sot doc réduits à leurs cetres de gravité Dimesio des uages comme les rofils sommet à les m rofils-liges sot situés das le sous-esace W de dimesio m 2 défii ar m 2 j x j et x j 0 ACP l étude de la forme des uages au moye de l aalyse e comosates riciales ermettra de redre comte de la structure des écarts à l idéedace La métrique du χ 2 Profils-liges la distace du χ 2 etre les rofils-liges e i et e i est défiie ar d 2 χ 2 l e i e i ) j j ij i j i i ce qui reviet à utiliser la métrique diagoale D 2 Iertie l iertie totale du uage des rofils-liges ar raort à g l est I gl m i m i m d2 χ e 2 i g l ) l i j i j i i j j ij i j ϕ 2 ij j i Cette iertie mesure doc l écart à l idéedace Pourquoi la métrique du χ 2? Podératio la odératio / j ermet de doer des imortaces comarables aux différetes «variables» Équivalece distributioelle si deux coloes j et j de N ot le même rofil il est logique de les regrouer e ue seule d effectif ij + ij ; o a alors quad ij / j ij / j j ij j + ij j i j i ij + ij j + j i j + j La distace etre les rofils-lige est doc ichagée Autres roriétés de la métrique du χ 2 Proriétés de g l Tous les vecteurs cetrés du uage sot orthogoaux à g l car x g l g l χ 2 l x g l ) D 2 g l x g l ) m2 0 La orme de g l est g l 2 χ 2 l g l D 2 g l g l m 2 Profils-coloes o défiit la distace etre deux rofilscoloes e j et e j comme d 2 χ 2 c e j e j ) m i i ij j ij j ce qui corresod à ue métrique de matrice D Ses roriétés sot similaires à celles sur les rofils-liges Partie III L AFC : ue ACP sur u uage de rofils ACP des deux uages de rofils Commet? exacte tableau de doées métrique oids Il y a deux ossibilités qui sot e dualité Profils-liges Profils-coloes X D N X D 2 N M D 2 M D D D Autres doées Cetre de gravité g X D Matrice de variace-covariace D D2 V X DX gg X g ) DX g ) Vecteurs rores de VM Cetrage g est u facteur ricial g est vecteur rore de VM associé à la valeur rore 0 car g est χ 2 -orthogoal à W : VMg X g ) DX g )Mg 0 O a doc X DXMg VMg + gg Mg 0 + g g χ 2 g Autres axes les autres valeurs et vecteurs rores de VM et X DXM sot idetiques car our tout vecteur u g X DXMu VMu+gg Mu VMu+g g u χ 2 VMu Cetrage il est iutile ici : o effectue ue ACP o cetrée et o élimie la valeur rore associée à l axe ricial g et au facteur ricial Mg Calcul de l ACP O fait d abord le calcul our les rofils-liges Facteurs riciaux MX DX D D 2 )D N) ils sot vecteurs rores de D O a doc our chaque axe ricial k D 2 N D Nu k λ k u k N) D 2 N D N Cours d aalyse de doées Jea-Marc Lasgouttes aée 205-206 3

Comosates riciales la comosate riciale associée au facteur u k est a k Xu k D Nu k ; elle est vecteur rore de la matrice D ND 2 N car o échage les idices et 2 et o tras- Profils-coloes ose N D ND 2 N a k D ND 2 N D Nu k λ k D Nu k λ k a k Comaraiso liges-coloes Facteurs riciaux Comosates riciales ACP rofils-liges ACP rofils-coloes Vecteurs rores de Vecteurs rores de D 2 N D N D ND 2 N Vecteurs rores de D ND 2 N ormalisés ar var a k a k D a k λ k Vecteurs rores de D 2 N D N ormalisés ar var b k b k D2 b k λ k Comaraiso les deux aalyses coduiset aux mêmes valeurs rores et les facteurs riciaux de l ue sot les comosates riciales de l autre à u facteur rès) Partie IV Asects ratiques Iterrétatio des résultats Coordoées des oits Les coordoées des oitsliges et oits-coloes s obtieet e cherchat les vecteurs rores des roduits des deux tableaux de rofils Ce sot les gradeurs riciales à obteir Projectio des uages il est ossible de rojeter les deux uages de oits sur le même rerésetatios O justifiera lus tard le ses de cette rerésetatio et so iterrétatio Cercle des corrélatios il a aucu itérêt ici uisque les véritables variables sot qualitatives o) effet de taille comme les comosates variables sot cetrées m i i a ik m 2 j jb jk 0) ot sait que les coordoées des a k et b k e euvet être toutes de même sige ; il y a doc jamais d effet de «taille» Cotributios à l iertie Cotributio des rofils-liges O sait que λ k m i i a ik où a ik est la coordoée du rofil-lige i sur la kième comosate riciale de l ACP sur les rofilsliges O défiit doc la cotributio de la modalité i à l axe ricial k comme i a ik λ k O cosidérera les modalités ayat l ifluece la lus imortate tyiquemet > α i / α 2 ou 3) comme costitutives des axes ; o regardera aussi le sige de la coordoée Il y a as ici de modalités sur-rerésetées uisqu o e eut as les retirer Cotributio des rofils-coloes our les mêmes raisos la cotributio du de la modalité j de X 2 à l axe k est j b jk λ k Qualité de la rerésetatio Profils-liges l AFC est ue ACP et o eut doc mesurer la qualité de la rerésetatio de la modalité i so rofillige) ar u sous-esace factoriel La qualité le cos 2 de l agle etre le oit et sa rojectio) s écrit ecore our le la formé des q remiers axes : q k a ik m2 k a ik) 2 Comme our l ACP > 08 sigifie «très bie reréseté» et < 05 veut dire «mal reréseté» Les valeurs sot souvet doées e 0000è Profils-coloe Le ricie est le même mais la formule deviet our la modalité j : q k b jk m k b jk) 2 Formules de trasitio But o cherche ue relatio etre les vecteurs a k et b k our éviter de faire deux diagoalisatio de matrice Par exemle si m < m 2 o diagoalisera la matrice D ND 2 N Formules u calcul simle doe les formules suivates b k D 2 N a k soit b jk m ij a ik λk λk j i a k D Nb k soit a ik ij b jk λk λk i j Méthode comme a k est à ue ormalisatio rès) le facteur ricial associé à b k o sait que b k αd 2 N a k Pour détermier α il suffit d écrire que b k D2 b k λ k Décomositio de l iertie ϕ 2 et valeurs rores l iertie totale et doc la somme des valeurs rores) est égale à ϕ 2 Comme il y a au lus mim m 2 ) valeurs rores o obtiet si m < m 2 ϕ 2 m k λ k Choix du ombre de valeurs rores O se cotete souvet de regarder le remier la ricial car la règle de Kaiser λ k > ϕ 2 /m ) s alique mal ; la règle du coude reste valide mais est subjective ; il existe u test sur de la art d iertie o exliquée mais il est u eu comliqué 4 Cours d aalyse de doées Jea-Marc Lasgouttes aée 205-206

Partie V Aalyse des corresodaces multiles Aalyse des corresodaces multiles But o veut étedre l AFC au cas de 2 variables X X 2 X à m m 2 m modalités Ceci est articulièremet utile our l exloratio d equêtes où les questios sot à réoses multiles Problème l aalyse des corresodaces utilise ue table de cotigece qui est difficilemet gééralisable au cas > 2 Méthode o cherche u moye différet d aalyser > 2 variables et o vérifie que les résultats sot comarables à l AFC our 2 Les doées Doées brutes chaque idividu est décrit ar les uméros des modalités qu il ossède our chacue des variables Il est as ossible de faire des calculs sur ce tableau où les valeurs sot arbitraires Tableau disjoctif o remlace la v-ième coloe ar m v coloes d idicatrices : o met u zéro das chaque coloe sauf celle corresodat à la modalité de l idividu i qui reçoit Exemle O iterroge 6 ersoes sur la couleur de leurs cheveux CB CC et CR our blod châtai et roux) la couleur de leurs yeux YB YV et YM our bleu vert et marro) et leur sexe H/F) O a doc trois variables avec resectivemet 3 3 et 2 modalités) mesurées sur 6 idividus Les tableaux brut ci-dessous à gauche) sot équivalets aux tableaux disjoctifs à droite) CB YB H 0 0 0 0 0 CB YV H 0 0 0 0 0 CC YB F 0 0 0 0 0 CC YM H 0 0 0 0 0 CR YV F 0 0 0 0 0 CB YB F 0 0 0 0 0 Tableau disjoctif et tableau de cotigece Tableau disjoctif à la variable X v o associe le tableau disjoctif X v à liges et m v coloes Tableau de cotigece o vérifie facilemet que le tableau de cotigece des variables X v et X w est doé ar N vw X vx w Effectifs margiaux la matrice diagoale des effectifs margiaux de la variable X v est doée ar D v X vx v Exemle suite) Table de cotigece Cheveux/Yeux et matrice d effectif margiaux de la couleur de cheveux 2 0 3 0 0 N 2 0 D 0 2 0 0 0 0 0 Tableau disjoctif joit Défiitio c est la matrice X X X 2 X ) qui ossède liges et m + + m coloes Chaque coloe rerésete ue catégorie c est-à-dire ue modalité d ue variable Exemle our l exemle de variables récédetes o a le tableau disjoctif joit suivat 0 0 0 0 0 0 0 0 0 0 X 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Chaque somme de liges vaut 3 Les sommes de coloes valet 3 2 3 2 3 3 ) Le tableau de Burt Défiitio c est u suer-tableau de cotigece des variables X X formé de tableaux de cotigece et de matrices d effectifs margiaux : X X X X 2 X X B X X 2X X 2X 2 X X X X X D N 2 N N 2 D 2 N D Exemle Toujours our les mêmes variables 3 0 0 2 0 2 0 2 0 0 0 0 0 0 0 B 2 0 3 0 0 2 0 0 2 0 0 0 0 0 0 2 0 3 0 2 0 0 3 Partie VI L ACM : ue AFC sur tableau disjoctif Commet utiliser l AFC our aalyser variables But o cherche à faire ue rerésetatio des m + +m catégories comme oits d u esace de faible dimesio Méthode o fait ue AFC sur le tableau disjoctif joit X X X 2 X ) Les liges la somme des élémets de chaque lige de X est égale à Le tableau des rofils-liges est doc X Cours d aalyse de doées Jea-Marc Lasgouttes aée 205-206 5

Les coloes la somme des élémets de chaque coloe de X est égale à l effectif margial de la catégorie corresodate Le tableau des rofils coloes est doc XD où D est la matrice diagoale ar blocs D 0 D 0 D Les coordoées factorielles des catégories Notatio O ote a k a k a k ) le vecteur à m + + m comosates des coordoées factorielles des catégories sur l axe k Calcul de l AFC sur X comme la matrice des rofils liges est X et celle des rofils coloes XD a k est vecteur rore de XD ) X D X X D B et doc l équatio des coordoées des catégories est D Ba k µ k a k avec la covetio de ormalisatio a kda k µ k Résolutio das le cas 2 O ote a k res b k ) les m remières res m 2 derières) coordoées de la comosate riciale k et µ k la valeur rore corresodate : 2 D B ak b k 2 I m D N D 2 N I m2 ak O obtiet les équatios { D Nb k 2µ k )a k D 2 N a k 2µ k )b k b k µ k ak b k et doc o retrouve les coordoées des modalités de liges et de coloes das l AFC classique avec λ k 2µ k ) : { D 2 N D Nb k 2µ k b k D ND 2 N a k 2µ k a k Différeces ACM/AFC our 2 Nombre de valeurs rores o a a riori m + m 2 2 valeurs rores o ulles ce qui est lus imortat que das le cas classique E articulier our chaque λ k o a deux µ k ossibles µ k + λ ak k 2 associée à b k µ k λ k a k 2 associée à b k O e garde doc que les valeurs µ k > 2 O eut motrer qu il y e a mim m 2 ) Iertie L iterrétatio de la art d iertie exliquée ar les valeurs rores est maiteat très différete E articulier les valeurs rores qui étaiet très séarées das l AFC de N le beaucou mois das celle de X Partie VII Asects ratiques Formules barycetriques Les coordoées des idividus Soit c k le vecteur à comosates des coordoées des idividus sur l axe factoriel associé à la valeur rore µ k D arès les résultats de sur l AFC o a c k Xa k et doc c ik j catégorie de i Les seuls termes o uls das le calcul de Xa k sot les coordoées de la catégorie de chaque variable ossédée ar l idividu Comme o est est das le cadre de l AFC la variace de c k est toujours var c k c kc k µ k Barycetre des catégories À / µ k rès la coordoée d u idividu est égale à la moyee arithmétique simle des coordoées des catégories auxquelles il aartiet Formules barycetriques suite) O a de même la secode formule a k D X c k c-à-d a jk j a jk i de catégorie j Les seuls termes o uls de X c k sot les coordoées des idividus ayat ue catégorie doée Barycetre des idividus À / µ k rès la coordoée d ue catégorie est égale à la moyee arithmétique des coordoées des j idividus de cette catégorie Barycetres et rerésetatio Rerésetatio commue Les oits rerésetatifs des catégories sot barycetres des groues d idividus O eut doc reréseter idividus et catégories das u même la factoriel Moyees Comme c k est ue variable de moyee ulle la formule de barycetre idique que our chaque variable X i les coordoées de ses catégories odérés ar les effectifs) sot de moyee ulle Aucu cetrage est doc écessaire Échelle our que les catégories se trouvet visuellemet au barycetre des idividus qui les rerésetet o eut remlacer a k ar α k D X c k µ k a k c ik 6 Cours d aalyse de doées Jea-Marc Lasgouttes aée 205-206

Proriétés des valeurs rores Valeur rores triviales La valeur rore est associée comme e AFC) à la comosate z 0 ) das l esace des idividus Les autres vecteurs rores lui sot orthogoaux et doc de moyee ulle Autres valeurs rores Si > v m v le rag de X est v m v + et le ombre de valeurs rores o trivialemet égales à 0 ou est q v m v Somme La somme des valeurs rores o triviales est doc q ) µ k Tr D B m v q k v La moyee des q valeurs rores vaut / Sélectio de variables et axes Sélectio des variables o décide souvet de e garder qu u ombre réduit de variables actives et de garder les autres comme variables sulémetaires Sélectio des axes règle courate : garder les axes tels que µ k > / la moyee des valeurs rores est /) les axes itéressats sot ceux que l o eut iterréter e regardat les cotributios des variables actives et les valeurs-tests associées aux variables sulémetaires défiies lus tard) E ratique o se cotete souvet d iterréter le remier la ricial Iertie exliquée Catégories et axes factoriels elle est mois itéressate qu e ACP Si j est l effectif de la catégorie j et a jk sa coordoée sur l axe factoriel k alors Catégorie est j var a k a jk µ k j catégories La cotributio de la catégorie j à l axe factoriel j a jk µ k itéressate si elle est suérieure au oids j / à u facteur rès comme e ACP et AFC) Variable la cotributio totale de la variable X v à l axe factoriel est µ k j modalité de X v j a jk Idividus et axes factoriels Cotributio d u idividu elle est égale our l idividu i à c ik µ k Cette cotributio est jugée e la comarat au oids / comme e ACP et AFC Qualité de la rerésetatio our le sous-esace formé ar les l remier axes la qualité de la rerésetatio de l idividu i est le cosius carré habituel l k c ik q k c ik O défiit de même sur les a jk la qualité de la rerésetatio d ue catégorie j Cotributio à l iertie totale Soit x j x j i ) le vecteur coloe de X corresodat à ue catégorie j O raelle que l iertie totale vaut j I g d2 z j g) j catégories m v v où la distace du rofil-coloe j au cetre de gravité des rofils-coloes g / est d 2 z j g) i ) x j 2 i j ) j 2 + j 2 2 j j i x j i 2 j j Cotributio à l iertie totale suite) Cotributio d ue catégorie la catégorie à l iertie est j d2 z j g) + 2 2xj i j ) La cotributio absolue de j qui est ue foctio décroissate de l effectif Il faut doc éviter les catégories d effectif tro faible qui d ailleurs se retrouverot das les remiers axes Cotributio d ue variable X v est ) j j modalité de X v ) La cotributio de la variable m v Elle est d autat lus grade que le ombre de modalités de X i est élevé Il faut doc éviter les disarités tro grades etre les ombre de modalités quad o a le choix du découage) La ormalisatio de c k est i c ik µ k où c ik est la coordoée de l idividu i sur l axe factoriel k associé à la valeur rore µ k Cours d aalyse de doées Jea-Marc Lasgouttes aée 205-206 7

Partie VIII Iterrétatio extere Les variables sulémetaires Leur usage est très courat e aalyse des corresodaces multiles Variables quatitatives o calcule «à la mai» leur corrélatio avec les axes factoriels et o les lace sur u cercle de corrélatios Si ẑ est ue versio cetrée-réduite de la variable alors corẑ c k ) ẑ i c ik i O eut aussi les découer e classes et les traiter comme des variables qualitatives Variables qualitatives o calcule directemet les coordoées de leurs modalités e utilisat la formule de barycetre des idividus : la coordoée la catégorie sulémetaire ĵ sur l axe ricial k est aĵk ĵ i de catégorie ĵ Valeurs-test our les variables sulémetaires qualitatives But o cherche à savoir si ue catégorie ĵ d effectif ĵ et de coordoée aĵk sur cet axe est liée à cet axe Idée du calcul si les ĵ idividus d ue catégorie étaiet ris au hasard la moyee de leurs coordoées serait ue variable aléatoire cetrée les c sot de moyee ulle) et de variace µ k ĵ ĵ De lus la moyee des coordoées est égale à µ k aĵk Valeur-test c est la versio cetrée et réduite de la moyee des coordoées aĵk ĵ ĵ Quad ĵ et ĵ sot assez grad e gééral > 30) elle est sigificative si elle est suérieure à 2 ou 3 O e doit as l utiliser sur les variables actives c ik Partie IX AFC vs ACM Poits commus etre AFC et ACM But Cas 2 Rerésetatio Cotributio d ue modalité à u axe Qualité de la rerésetatio d ue modalité ar u sous esace décrire les liaisos etre lusieurs variables qualitatives les coordoées des modalités sot les mêmes our les deux aalyses toutes les modalités euvet être rerésetées sur le même diagramme oids coordoée)2 valeur rore coord sur l axe cos 2 axes du sous es θ coord sur l axe tous les axes Différeces etre AFC et ACM AFC ACM Idividus o oui Doées Poids d ue modalité Nb de val rores Axes à coserver Variables sulémetaires tableau de cotigece rofils liges/coloes i rofil-lige) j rofil-coloe) mim m 2 ) as de règle Kaiser ; eut-être art d iertie as vraimet de ses tableau disjoctif tableau de Burt j v m v µ > qualitatives et quatitatives 8 Cours d aalyse de doées Jea-Marc Lasgouttes aée 205-206