But de l Analyse Factorielle des Correspondances: généralisation de l ACP pour le traitement de données qualitatives.

Dimension: px
Commencer à balayer dès la page:

Download "But de l Analyse Factorielle des Correspondances: généralisation de l ACP pour le traitement de données qualitatives."

Transcription

1 Chapitre Analyse Factorielle des correspondances binaires (ACOBI). Introduction But de l Analyse Factorielle des Correspondances: généralisation de l ACP pour le traitement de données qualitatives. Se divise en 2 aires: Analyse des correspondances binaires (ACOBI): tableau de contingence (2 variables) Analyse des correspondances multiples (AFCM): tableau Individus variables ( > 2 variables).

2 CHAPITRE. ANALYSE FACTORIELLE DES CORRESPONDANCES BINAIRES (ACOBI)2 Origine: chez Procter & Gamble: - Richardson & Kuder (933) Formalisation mathématique: - ACOBI: Hirschfeld, (935), A connection between correlation and contingency., Proc. Camb. Phil. Soc., 3, AFCM: Guttman, (94), The quantification of a class of attributes: a theory and method of a scale construction. In: The prediction of personal adjustement (Horst P., Ed.), , SSCR New York. Essor: Benzecri, (973), L analyse des données. Tome : La taxinomie. Tome 2: L analyse des correspondances (2 de. éd. 976). Dunod, Paris.

3 CHAPITRE. ANALYSE FACTORIELLE DES CORRESPONDANCES BINAIRES (ACOBI)3 Objectif de l ACOBI: Mise en évidence sous forme de graphique des liaisons entre X et Y à partir du tableau de contingence Etape : ACP du tableau des profils-lignes Etape 2: ACP du tableau des profils-colonnes Etape 3: Etude des liens entre les deux ACP Etape 4: Construction de graphiques mettant en évidence les proximités entre les profilslignes, proximités entre les profils-colonnes et nature de la liaison entre les lignes et les colonnes.

4 CHAPITRE. ANALYSE FACTORIELLE DES CORRESPONDANCES BINAIRES (ACOBI)4.2 Rappels Exemple: Enquête auprès de 200 étudiants Variable X: Choix de la Faculté à l université (3 modalités): A =Sciences Humaines, A 2 =Sciences, A 3 =Médecine. Variable Y : Orientation en humanités (3 modalités): B =Latin-Grec, B 2 =Math Sciences, B 3 =Latin-Math. n jk B B 2 B 3 n j. A A A n.k

5 CHAPITRE. ANALYSE FACTORIELLE DES CORRESPONDANCES BINAIRES (ACOBI)5 Formalisation 2 variables qualitatives (nominales) X et Y : - X prend J modalités: A,..., A J - Y prend K modalités: B,..., B K. X et Y sont observés sur un échantillon de taille n = Tableau de contingence (N): X Y B... B k... B K Kk= A n... n k... n K n. A j n j... n jk... n ip n j. A J n J... n Jk... n JK n J. Jj= n.... n.k... n.k n où les effectifs n jk représentent le nombre d individus ayant simultanément les modalités A j et B k. Notons que n j. = K k= n jk et n.k = J j= n jk.

6 CHAPITRE. ANALYSE FACTORIELLE DES CORRESPONDANCES BINAIRES (ACOBI)6 Analyse exploratoire du tableau de contingence Tableau des fréquences relatives F Proportion d individus possédant simultanément les modalités A j et B k : f jk = n jk n (j =..., J; k =,..., K). Les fréquences relatives marginales sont: et f j. = n j. n f.k = n.k n (j =..., J) (k =,..., K).

7 CHAPITRE. ANALYSE FACTORIELLE DES CORRESPONDANCES BINAIRES (ACOBI)7 Remarquons que: f jk est une estimation de π jk = P (X A j, Y B k ) f j. est une estimation de π j. = P (X A j ) f.k est une estimation de π.k = P (Y B k ) Exemple. f jk B B 2 B 3 f j. A A A f.k

8 CHAPITRE. ANALYSE FACTORIELLE DES CORRESPONDANCES BINAIRES (ACOBI)8 Tableaux des fréquences conditionnelles. Tableau des profils-lignes: Proportion des individus présentant la modalité B k parmi les individus ayant la modalité A j : f k j = n jk n j. = n jk/n n j. /n = f jk f j. (j = fixé; k =,..., K). = estimation de la probabilité conditionnelle: Exemple : P (Y B k X A j ) f jk f j. B B 2 B 3 Totaux A A A f.k

9 CHAPITRE. ANALYSE FACTORIELLE DES CORRESPONDANCES BINAIRES (ACOBI)9 2. Tableau des profils-colonnes: Proportion des individus présentant la modalité A j parmi les individus ayant la modalité B k : f j k = n jk n.k = n jk/n n.k /n = f jk f.k (j =,..., J; k = fixé). = estimation de la probabilité conditionnelle: Exemple : P (X A j Y B k ) f jk f.k B B 2 B 3 f j. A A A Totaux

10 CHAPITRE. ANALYSE FACTORIELLE DES CORRESPONDANCES BINAIRES (ACOBI)0 Situation d indépendance Si 2 variables aléatoires X et Y sont indépendantes, alors j {,..., J} et k {,..., K}: a)p (X A j, Y B k ) = P (X A j )P (Y B k ) b)p (Y B k X A j ) = P (Y B k ) c)p (X A j Y B k ) = P (X A j ) L échantillon de taille n nous permet d estimer ces quantités, dès lors sous l hypothèse d indépendance, on devrait avoir: a )f jk f j. f.k j {,..., J} k {,..., K} b )f k j = f jk f j. f.k j, k c )f j k = f jk f.k f j. j, k. Ainsi tous les profils-lignes (b) et les profilscolonnes (c) sont pratiquement égaux.

11 CHAPITRE. ANALYSE FACTORIELLE DES CORRESPONDANCES BINAIRES (ACOBI) Nous allons donc définir les fréquences (relatives) théoriques vérifiant l hypothèse d indépendance: f jk = f j.f.k et n jk = nf jk = n j.n.k n Exemple. Effectifs et effectifs théoriques: n jk B B 2 B 3 n j. A A A n.k n jk B B 2 B 3 n j. A A A n.k

12 CHAPITRE. ANALYSE FACTORIELLE DES CORRESPONDANCES BINAIRES (ACOBI)2 Fréquences et fréquences théoriques: f jk B B 2 B 3 f j. A A A f.k fjk B B 2 B 3 f j. A A A f.k

13 CHAPITRE. ANALYSE FACTORIELLE DES CORRESPONDANCES BINAIRES (ACOBI)3 Indice d attraction/répulsion L élément jk de la matrice D d attraction/répulsion (J K) est défini par: d jk = n jk n jk = f jk f jk = f jk f j. f.k. Interprétations: d jk > f jk > f j. f.k f jk > f j. f.k f k j > f.k et f j k > f j. les modalités A j et B k s attirent d jk < f jk < f j. f.k f jk < f j. f.k f k j < f.k et f j k < f j. les modalités A j et B k se repoussent.

14 CHAPITRE. ANALYSE FACTORIELLE DES CORRESPONDANCES BINAIRES (ACOBI)4 Exemple. f jk B B 2 B 3 fjk B B 2 B 3 A R A R A R = d jk U U 2 U 3 R R R Donc on peut remarquer que les modalités Sciences et Latin Math s attirent fortement alors que les modalités Sciences et Latin Grec se repoussent fortement.

15 CHAPITRE. ANALYSE FACTORIELLE DES CORRESPONDANCES BINAIRES (ACOBI)5 Mesures d association La statistique du χ 2 : Conditions d application: n 30 n jk j, k au moins 80% des n jk 5 Si les conditions ne sont pas rencontrées = regrouper des classes. J K χ 2 (n jk n jk = )2. j= k= n jk On rejette l hypothèse d indépendance entre X et Y avec une erreur de ère espèce de α% si χ 2 > χ 2 (J )(K ); α.

16 CHAPITRE. ANALYSE FACTORIELLE DES CORRESPONDANCES BINAIRES (ACOBI)6 La statistique du φ 2 = χ2 n : φ 2 = J j= K k= (f jk f jk )2 f jk = J j= K k= ( n jk n n jk n )2 n jk n Rem: Pondérons les indices d attraction-répulsion par les fréquences ( J j= Kk= f jk = ): d = = s 2 d = J j= J j= J j= K k= K k= K k= f jk d jk = f jk = J j= K k= fjk f jk fjk f jk (d jk ) 2 = χ2 n = φ2 = Mesure de la dispersion des indices d attractionrépulsion autour de leur moyenne (égale à ):

17 CHAPITRE. ANALYSE FACTORIELLE DES CORRESPONDANCES BINAIRES (ACOBI)7.3 Etude du nuage des profils-lignes Le nuage ℵ l des profils-lignes A chaque ligne A j du tableau des profilslignes, on associe un point L j de IR K ayant comme coordonnées: l = (f j j,..., f k j,..., f K j ). Au profil-ligne l j (j {,..., J}), on associe le poids f j. (% d individus ayant la modalité A j ) = Le nuage ℵ l de points de IR K formé par les J profils-lignes pondérés: ℵ l = {(L ; f. ), (L 2 ; f 2. ),..., (L J ; f J. )}.

18 CHAPITRE. ANALYSE FACTORIELLE DES CORRESPONDANCES BINAIRES (ACOBI)8 Centre de gravité de ℵ l Les coordonnées du centre de gravité sont calculées comme une moyenne pondérée des J profilslignes: g l = J f j. l j j= La kème coordonnée de g l est donnée par: J f j. f k j = j= J j= f j. f jk f j. = donc ḡ l = (f.,..., f.k ). J f jk = f.k j= = les coordonnées du centre de gravité G l du nuage des J profils-lignes (pondérés) sont données par le profil-ligne marginal (% d individus prenant les modalités B k ).

19 CHAPITRE. ANALYSE FACTORIELLE DES CORRESPONDANCES BINAIRES (ACOBI)9 La métrique du khi-deux dans IR K Définition: La distance du khi-deux entre les points X et Y de coordonnées (x,..., x K ) et (y,..., y K ) est donnée par: K d 2 (x χ 2 (X, Y ) = k y k ) 2 k= f.k Accorde la même importance à toutes les colonnes (quelles que soient leurs fréquences relatives) dans le calcul de la distance entre deux profilslignes.

20 CHAPITRE. ANALYSE FACTORIELLE DES CORRESPONDANCES BINAIRES (ACOBI)20 Inertie totale du nuage ℵ l Inertie totale tenant compte du poids de chaque profil-ligne et de la distance du χ 2 dans IR K : J I χ 2(ℵ l, G l ) = f j. d 2 χ 2 (L j, G l ) = = = = j= J K f j. j= k= J K f j. j= J j= J j= K k= K k= k= f.k (f k j f.k ) 2 f.k ( f jk f j. f.k ) 2 f j. f.k ( f jk f j. f.k f j. ) 2 (f jk f.k f j. ) 2 f j. f.k = φ 2 = χ2 n = justification du nom de la distance!

21 CHAPITRE. ANALYSE FACTORIELLE DES CORRESPONDANCES BINAIRES (ACOBI)2 Interprétation de l inertie totale: Mesure de la dépendance qui existe entre les variables qualitatitives X et Y Indépendant de l effectif total n Si I χ 2(ℵ l, G l ) = 0 cela signifie que tous les profils-lignes L,..., L J sont confondus avec le centre de gravité G l : k {,..., K} et j {,..., J} f k j = f.k f jk f j. = f.k f jk = f j. f.k donc inertie nulle = indépendance parfaite entre lignes et colonnes du tableau de contingence.

22 CHAPITRE. ANALYSE FACTORIELLE DES CORRESPONDANCES BINAIRES (ACOBI)22.4 ACP du nuage ℵ l des profils-lignes (Etape ) Démarche similaire avec 2 adaptations: Tous les individus n ont plus le même poids: le poids de l individu A j vaut f j. La distance utilisée pour mesurer les proximités entre deux individus n est plus la distance euclidienne, mais bien la distance du χ 2. L ACP ne va pas être effectuée sur le nuage: ℵ l = {(L, f. ),..., (L J, f J. )} mais sur le nuage de points transformés: ℵ = {(L, f.),..., (L J, f J.)} où L j a pour coordonnées: f j l j = ( f.,..., f j. f. f jk f j. f.k f.k ) NB: Nuage de point centré à l origine.

23 CHAPITRE. ANALYSE FACTORIELLE DES CORRESPONDANCES BINAIRES (ACOBI)23 Premier Axe Principal Le premier axe principal du nuage ℵ l est la droite passant par l origine ajustant le mieux possible le nuage de points au sens du critère de l inertie: I(ℵ l, ) = min :droite passant par l origine I(ℵ l, ) où I(ℵ l, ) = J j= f j. d 2 (L l, P (L j )). Problème: Chercher l axe engendré par le vecteur normé u qui maximise I(0, P (L j )): J max j= sous la contrainte f j. d 2 (0, P (L j )) u =

24 CHAPITRE. ANALYSE FACTORIELLE DES CORRESPONDANCES BINAIRES (ACOBI)24 = Problème de maximisation sous contrainte. Solution: Recherche des valeurs et vecteurs propres de la matrice: V = J j= f j. l j (l j ) = u est le vecteur propre normé associé à la plus grande valeur propre λ = I(0, P (L j )). Remarque: La matrice V (K K) a comme élément (k, k ): ( ) ( ) J fjk f j. f.k fjk f j. f.k v kk = fj. f.k fj. f.k j= donc ceci nous permet d écrire: V = X X où la matrice X(J K) a comme élément: x jk = f jk f j. f.k fj. f.k

25 CHAPITRE. ANALYSE FACTORIELLE DES CORRESPONDANCES BINAIRES (ACOBI)25 Première Composante Principale étant connu, le nuage de points-individus ℵ l est projeté sur celui-ci: P (ℵ l ) = {P (L ),..., P (L J )}. ce qui nous permet de définir j =,..., J: K φ,j = OP (L j ) =< OL j, u >= u,k (l j ) k k= j ) K = u, (l j ) + u,2 (l j ) u,k (l où φ,j correspond à la valeur de la première composante principale pour le jème profil-ligne. On peut démontrer (exercice) que la composante principale φ - est centrée J j= f j. φ,j = 0 - de variance λ.

26 CHAPITRE. ANALYSE FACTORIELLE DES CORRESPONDANCES BINAIRES (ACOBI)26 Qualité globale de la première composante principale: taux d inertie = % d inertie expliqué par : λ φ 2 puisque, I(ℵ l, 0) = I(ℵ l, )+I(0, P (L j )) Contribution des modalités A j, j =,..., J Sachant que λ = s 2 φ = J J f j. φ 2,j = f j. d 2 (0, P (L j )) j= j= la contribution de la modalités A j à la variance de φ est donnée par: CT R λ (A j ) = f j.φ 2,j λ. = L interprétation de φ repose en priorité sur les modalités A j à contributions élevées.

27 CHAPITRE. ANALYSE FACTORIELLE DES CORRESPONDANCES BINAIRES (ACOBI)27 Qualité de représentation des modalités La qualité de la représentation des profils-lignes L j sur l axe est mesurée par le cosinus carrés de l angle entre le vecteur OL j et l axe : cos 2 (OL j, ) = ( < OL j, u > OL j u ) 2 = φ2,j OL j 2. Le poids f j. n intervient pas dans cette formule = un point peut dès lors être très: - proche de l axe et donc bien représenté (points expliqués) - sans contribuer fortement à sa construction à cause d un f j. faible (points non explicatifs)

28 CHAPITRE. ANALYSE FACTORIELLE DES CORRESPONDANCES BINAIRES (ACOBI)28 Etude des autres dimensions Le deuxième axe principal 2 est déterminé par le vecteur normé u 2 tel que: - u 2 u - l inertie par rapport à l origine du nuage projeté sur l axe principal 2 est maximale = u 2 est le vecteur propre normé de la matrice V associé à la deuxième plus grande valeur propre λ 2. On peut chercher, suivant les mêmes critères, les axes principaux 3, 4,...

29 CHAPITRE. ANALYSE FACTORIELLE DES CORRESPONDANCES BINAIRES (ACOBI)29 Combien d axes principaux peut-on construire? ℵ l est contenu dans un hyperplan de dimension H min(j, K ) où H est égal au rang de la matrice V center au plus H axes principaux

30 CHAPITRE. ANALYSE FACTORIELLE DES CORRESPONDANCES BINAIRES (ACOBI)30.5 Analyse en composantes principales du nuage ℵ c des profils-colonnes (Etape 2) Les définitions et résultats de l analyse du nuage ℵ l des profils-lignes se transposent immédiatement à l analyse du nuage ℵ c des profils-colonnes. Le nuage ℵ c des points de IR J des K profilscolonnes: ℵ c = {(C ; f. ), (L 2 ; f.2 ),..., (C K ; f.k )} où le point C k de IR J a comme coordonnées: c = (f k k,..., f j k,..., f J k ).

31 CHAPITRE. ANALYSE FACTORIELLE DES CORRESPONDANCES BINAIRES (ACOBI)3 Transformation des profils-colonnes pour utiliser la distance euclidienne et travailler par rapport à l origine dans IR J : ℵ c = {(C, f. ),..., (C K, f.k )} ℵ c = {(C, f.),..., (C K, f.k)} où C j a pour coordonnées c j = ( f k f.,..., f J k f J. ) f. fj.

32 CHAPITRE. ANALYSE FACTORIELLE DES CORRESPONDANCES BINAIRES (ACOBI)32 Axes principaux du nuage ℵ c Les axes principaux Γ,..., Γ H du nuage ℵ c: -passent par l origine -sont engendrés par les vecteurs propres orthonormés v,..., v H de la matrice W = XX associés aux H(= min(j, K )) valeurs propres non nulles λ,..., λ H rangées par ordre décroissant. La matrice X(J K) a comme élément: x jk = f jk f j. f.k fj. f.k Remarque: Les valeurs propres de W sont identiques à celles de V

33 CHAPITRE. ANALYSE FACTORIELLE DES CORRESPONDANCES BINAIRES (ACOBI)33 Composantes Principales Les composantes principales ψ,..., ψ H fournissent les coordonnées des profils-colonnes dans le nouveau repère (orthonormé) v,..., v H de l hyperplan de dimension H dans lequel est contenu le nuage ℵ c: k =,..., K: ψ h,k = OP Γh (C k ) =< OC k, v h >= = v h, (c k ) + v h,2 (c J j= k ) J k ) v h,j (c v h,j (c k ) j Notons que ψ, ψ 2,..., ψ H sont h {,..., H}: - centrées J j= f j. ψ h,j = 0 - de variance λ h (inertie par rapport à l origine du nuage projeté) - non corrélées.

34 CHAPITRE. ANALYSE FACTORIELLE DES CORRESPONDANCES BINAIRES (ACOBI)34 Qualité globale des Γ h % d inertie expliqué par la hème composante principale: λ h φ 2 Contribution des modalités B k, j =,..., J Sachant que λ h = s 2 ψ h = K f.k ψh,k 2 k= la contribution de la modalités B k à la variance de ψ h est donnée par: CT R λh (B k ) = f.kψ 2 h,k λ h. Qualité de représentation du profil-colonne C k sur l axe Γ h cos 2 (OC k, Γ h) = ( < OC k, v h > OC k v h ) 2 = ψ2 h,k OC k 2.

35 CHAPITRE. ANALYSE FACTORIELLE DES CORRESPONDANCES BINAIRES (ACOBI)35.6 Lien entre les 2 analyses (Etape 3) L analyse du nuage de points ℵ c se déduit de celle sur ℵ l et vice versa. = Richesse de l ACOBI provient des relations entre les analyses des 2 nuages de points.

36 CHAPITRE. ANALYSE FACTORIELLE DES CORRESPONDANCES BINAIRES (ACOBI)36 Profils-lignes ℵ l : IRK Profils-colonnes ℵ c: IR J (λ h, u h ) où h =,..., H (λ h, v h ) où h =,..., H sont couples propres de la matrice V = X X W = XX ce qui veut dire: V u h = λ h u h X Xu h = λ h u h Ainsi on a: W v h = λ h v h XX v h = λ h v h XX Xu h = λ h Xu h X XX v h = λ h X v h W Xu h = λ h Xu h Xu h vect. propre de W = V X v h = λ h X v h X v h vect. propre de V La norme de ces vecteurs étant donnée par Xu h = λ h X v h = λ h les vecteurs propres normés associés à λ h sont: Xu h X v h λh λh En conclusion on a les relations: v h = Xu h u h = X v h λh λh

37 CHAPITRE. ANALYSE FACTORIELLE DES CORRESPONDANCES BINAIRES (ACOBI)37 Ceci mène (après plusieurs calculs et démonstrations) à une égalité donnant la manière dont les coordonnées des composantes principales φ h et ψ h traduisent l écart à l indépendance de la cellule (j, k) du tableau de contingence: f jk f j. f.k = + d jk = + H h= H h= λh φ h,j ψ h,k λh φ h,j ψ h,k

38 CHAPITRE. ANALYSE FACTORIELLE DES CORRESPONDANCES BINAIRES (ACOBI)38.7 Représentations graphiques.7. Représentation pseudo-barycentrique Superposition des cartes - (, 2 ) représentant la projection sur le er plan principal du nuage de points ℵ l - (Γ, Γ 2 ) représentant la projection sur le er plan principal du nuage de points ℵ c. = Représentation simultanée des ensembles de modalités {A,..., A J } et {B,..., B K }. La modalité A j est représentée par le point A j de coordonnées (φ,j, φ 2,j ) et la modalité B k est représentée par le point Bk de coordonnées (ψ,k, ψ 2,k ).

39 CHAPITRE. ANALYSE FACTORIELLE DES CORRESPONDANCES BINAIRES (ACOBI)39 Interprétation des projections sur le premier axe Si cos 2 (OL j, ) grand = le profil L j est proche de sa projection P (L j ) sur l axe H = l j = h= φ h,j ū h = l j φ,jū Ceci implique donc que k {,..., K}: d jk = f jk f j. f.k + λ φ,j ψ,k. En conclusion: - Les modalités A j et B k s attirent (d jk > ) si φ,j > 0 et ψ,k > 0 si φ,j < 0 et ψ,k < 0 - Les modalités A j, B k se repoussent (d jk < ) si φ,j > 0 et ψ,k < 0 si φ,j < 0 et ψ,k > 0

40 CHAPITRE. ANALYSE FACTORIELLE DES CORRESPONDANCES BINAIRES (ACOBI)40 Interprétation pour le er plan (, 2 ) Si cos 2 (OL j, (, 2 )) grand = le profil L j est proche de sa projection P (, 2 ) (L j ) H = l j = h= φ h,j ū h = l j φ,jū + φ 2,j ū 2 Ceci implique donc que k {,..., K}: d jk = f jk f j. f.k + λ φ,j ψ,k + λ2 φ 2,j ψ 2,k. En conclusion: - Les modalités A j et B k s attirent (d jk > ) si A j et B k au même quadrant - Les modalités A j, B k se repoussent (d jk < ) si A j et B k à des quadrants opposés - On ne peut rien conclure si A j et B k à des quadrants adjacents

41 CHAPITRE. ANALYSE FACTORIELLE DES CORRESPONDANCES BINAIRES (ACOBI)4 Attraction (d_{jk} > ) RØpulsion (d_{jk} < ) Gamma2, Delta Aj* Bj* Gamma2, Delta Bj* Aj* Gamma, Delta Gamma, Delta Pas de conclusion Gamma2, Delta Bj* Aj* Gamma, Delta Pour une modalité bien représentée sur le premier plan principal, on peut conclure que celle-ci est attirée ou repoussée par certaines modalités B k :

42 CHAPITRE. ANALYSE FACTORIELLE DES CORRESPONDANCES BINAIRES (ACOBI) Représentation barycentrique Conclusions plus fines dans les cas d incertitude. On sait que: d jk = + H h= λh φ h,j ψ h,k = on va projetter les composantes principales ψ h réduite: ψ h = ψ h λh. = Représentation simultanée des ensembles de modalités {A,..., A J } et {B,..., B K } sur un plan où: - la modalité A j est représentée par le point A j de coordonnées (φ,j, φ 2,j ) - la modalité B k est représentée par le point B k de coordonnées ( ψ,k, ψ 2,k ) = ( ψ,k, ψ 2,k ). λ λ2

43 CHAPITRE. ANALYSE FACTORIELLE DES CORRESPONDANCES BINAIRES (ACOBI)43 Interprétation pour le er plan Pour une modalité A j bien représentée dans le plan, 2, on a: d jk + φ,j ψ,k + φ 2,j ψ2,k + < OA j, O B k > où <.,. > est le produit scalaire usuel dans IR 2. En conclusion: Les modalités A j et B k s attirent (d jk > ) - si l angle entre OA j et O B k est aigu puisque alors < OA j, O B k > est positif Les modalités A j, B k se repoussent (d jk < ) - si l angle entre OA j et O B k est obtu puisque alors < OA j, O B k > est négatif

44 CHAPITRE. ANALYSE FACTORIELLE DES CORRESPONDANCES BINAIRES (ACOBI)44 Attraction (angle aigu) RØpulsion (angle obtus) Gamma2, Delta Aj* Bj* Gamma2, Delta Bj* Aj* Gamma, Delta Gamma, Delta Exemples de cas d incertitude pour la représentation pseudo-barycentrique mais où avec une représentation barycentrique, on a une réponse: Règle générale: la droite A j et orthogonale au vecteur OA j passant par l origine partage les modalités B k en 2 groupes: celles du même coté que A j donc attirées par A j et celles repoussées par A j.

45 CHAPITRE. ANALYSE FACTORIELLE DES CORRESPONDANCES BINAIRES (ACOBI) Biplot Pour plus de lisibilité du graphique, et puisque nous nous intéressons uniquement aux angles, on va diviser les coordonnées relatives aux profilslignes par λ : = Représentation simultanée des ensembles de modalités {A,..., A J } et {B,..., B K } sur un plan où: - la modalité A j est représentée par le point à j de coordonnées ( φ,j, φ 2,j ) = ( φ,j λ, φ 2,j λ ). - la modalité B k est représentée par le point B k de coordonnées ( ψ,k, ψ 2,k ) = ( ψ,k, ψ 2,k ). λ λ2 Cette représentation s appelle un BIPLOT.

46 CHAPITRE. ANALYSE FACTORIELLE DES CORRESPONDANCES BINAIRES (ACOBI)46.8 Exercices Pratiques Exemple: Elections Présidentielles de 98 en France

47 47 Chapitre 2 Analyse Factorielle des correspondances multiples (AFCM) But de l AFCM: généralisation de l ACP (variables quantitatives) pour le traitement d un tableau individus variables qualitatitives. Procédure: effectuer une ACOBI (comparaison de 2 variables qualitatives) sur le tableau disjonctif complet.

48 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM)48 2. Données, Tableaux et Distances 2.. Tableaux binaires et tableau disjonctif complet Exemple 4 individus: n = 4 3 variables: P = 3 Y : sexe 2 modalités donc K = 2 (masculin=, féminin=2) Y 2 : état-civil 3 modalités donc K 2 = 3 (célibataire=, marié=2, divorcé ou veuf=3) Y 3 : niveau d étude 2 modalités: K 3 = 2 (primaire ou sec=, sup ou universitaire=2) K = = 7.

49 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM)49 Tableau logique condensé (les valeurs des modalités sont codées) n P Y Y 2 Y Tableau disjonctif complet (TDC) X X 2 X 3 X X 2 X 2 X 22 X 23 X 3 X 32 P n pl

50 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM)50 Notations: - n individus, P variables: Y,..., Y P - la variable Y p prend K p modalités = K = P p= K p nombre total - n pl effectif observé de la modalité l de Y p - x ipl = si l individu i prend l pour Y p, 0 sinon - X pl variable indicatrice de la modalité l de Y p - X p = (X p,..., X pkp ) vecteurs des indicatrices de Y p Bien évidemment, on que K p l= n pl = n et P p= K p l= n pl = np

51 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM)5 = tableau binaire X p associé à la variable Y p :... l... K p Kp l= x p... x pl... x pkp i x ip... x ipl... x ipkp n x np... x npl... x npkp ni= n p... n pl... n pkp n - Tableau disjonctif complet: X = (X,..., X P ) x... p... P P p= Kp l= P.... i x (n K )... x p (n K p )... x P (n K P ) P.... n P n i=.... np

52 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM) Profils-lignes, profils-colonnes, profils marginaux et indice d attraction/répulsion AFCM sur Y,..., Y P = ACOBI sur le TDC. Il faut donc construire le tableau des fréquences relatives du TDC: Y... Y p... Y P... l... K l... K p l... K P n n i... f ipl = x ipl np... n n n n... f.pl = n pl np... où les fréquences relatives marginales sont: f i.. = n et f.pl = n pl np

53 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM)53 Profil-ligne L i de l individu i: l i ( K) la plème composante du ième profil-ligne: p =,..., P ; (l i) pl = f ipl = x ipl/np f i.. /n l =,..., K p = x ipl P Profil-colonne C pl de la modalité l de Y p : c pl (n ) la ième composante du plème profil-colonne: i =,..., n. (c pl) i = f ipl f.pl = x ipl/np n pl /np = x ipl n pl Notation (l i) pl : plème composante du ième profil-ligne (c pl) i : ième composante du plème profil-colonne

54 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM)54 Exemple Tableau des profils-lignes: X X 2 X 3 X X 2 X 2 X 22 X 23 X 3 X P. Ligne M Tableau des profils-colonnes: X X 2 X 3 X X 2 X 2 X 22 X 23 X 3 X 32 P. colonne M

55 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM)55 Indice d attraction/répulsion entre individu i et modalité l de Y p : d i,pl = f ipl f i.. f.pl = x ipl np n pl nnp = x ipl n pl /n Donc comme x ipl = {0, } et n pl /n, on a d i,pl = 0 si x ipl = 0 d i,pl = n n pl si x ipl = Interprétation: Si l individu i possède la modalité l de la variable Y p, alors l indice d attraction/répulsion d i,pl est d autant plus élevé que la modalité l de la variable Y p est rare (n pl petit)

56 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM) Nuages de points et distances des profils-lignes Etude du nuage - des n profils-lignes L,..., L n - dans IR K où K = P p= K p - avec comme poids /n - et la métrique du χ 2. Le centre de gravité G l a comme plème coordonnées (p =,..., P ; l =,..., K p ): n n (l i) pl = n x np ipl = n pl np i= i= = G l = profil-ligne marginal (fréquence relative marginal)

57 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM)57 Quelques Propriétés Distance entre individus (profils-lignes) d 2 χ 2 (L i, L i2 ) = = Interprétation: = n P P p= P p= K p l= K p l= P p= f.pl ((l i ) pl (l i 2 ) pl ) 2 n pl ( x i pl P np K p l= x i 2 pl P )2 n pl (x i pl x i2 pl) 2 2 individus sont d autant plus proche qu ils prennent les mêmes modalités

58 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM)58 Exemple Calculons la distance entre individus et 2: K 3 d 2 p χ 2 (L, L 2 ) = ((l ) f pl (l 2) pl ) 2.pl p= l= = 2(0 0) ( 3 3 ) ( 3 3 ) (0 0)2 + 2(0 0) 2 + 6( 3 0)2 + 6(0 3 )2 = 4 3 =.33 Autre possibilité pour calculer les distances: d 2 χ 2 (L, L 2 ) = n P 3 p= K p l= n pl (x i pl x i2 pl) 2 = 4 3 ((0 0)2 + ( ) ( )2 + (0 0) 2 + (0 0) ( 0)2 + 2 (0 )2 ) = 4 3 =.33

59 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM)59 Matrice des distances au carré et des distances entre individus (profils-lignes) d 2 χ 2 (L i, L j ) L L 2 L 3 L 4 L L L L d χ 2(L i, L j ) L L 2 L 3 L 4 L L L L Conclusions individus et 2 proches (assez similaires) individus et 3 ainsi que 3 et 4 très différents

60 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM)60 Distance du profil-ligne L i au centre de gravité: d 2 χ 2 (L i, G l ) = = = = n P = n P = n P P p= P p= P p= K p l= K p l= K p l= P p= P p= P p= f.pl ((l i) pl n pl np )2 np n pl ( x ipl P n pl np )2 ( ) n x 2 ipl + n2 pl P n pl n 2x n pl 2 ipl n K p l= K p l= K p l= x ipl + n pl np P p= K p l= x ipl + n pl np np 2 P P x ipl n pl n pl 2 P P p= K p l= x ipl = Plus un individu prend des modalités rares (x ipl = et n pl petit), plus il est éloigné de G l.

61 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM)6 Inertie totale du nuage ℵ l autour de G l : n I χ 2(ℵ l, G l ) = f i.. d 2 χ 2 (L i, G l ) où K P variable = = P = P i= n i= n P p= P p= = K P n P K p l= K p l= P p= n i= K p l= n pl n pl n x ipl x ipl n pl n n pl n i= n i= est le nombre moyen de modalités par

62 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM)62 Cette inertie dépend uniquement du nombre de modalités et de variables et non des liaisons entre les variables. C est une quantité qui, dans le cadre de l AFCM (comme dans celui de l ACP normé), n a pas de signification statistique i {,..., n} le profil-ligne l i vérifie les P contraintes linéaires: K p (l i ) pl = l= K p l= x ipl P = P p =,..., P = le nuage ℵ l se trouve dans un espace de dimension au plus égale à K P.

63 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM) Nuages de points et distances des profils-colonnes Le nuage des - K = P p= K p profils-colonnes C pl - dans IR n - avec comme poids f.pl = n pl np - et la métrique du χ 2. Le centre de gravité G c a comme ième coordonnées (i =,..., n): P p= K p l= f.pl (c pl) i = P p= K p l= n pl np x ipl n pl = n = G c = profil-colonne marginal (fréquence relative marginale)

64 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM)64 Quelques Propriétés Distance entre modalités (profils-colonnes) Distance du χ 2 entre la modalité l de la variable Y p et la modalité l 2 de Y p2 est: n d 2 χ 2 (c pl, c p2l2 ) = ((c pl) f i (c p2l2) i ) 2 i.. Interprétation: = = n i= n i= n n p=i ( x ipl n pl x ip2l2 n p2l2 ) 2 ( x ipl n pl x ip2l2 n p2l2 ) 2-2 modalités sont d autant plus proche que les mêmes individus les prennent - modalité rare est éloignée des autres.

65 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM)65 Exemple Distance entre modalités de Y et 2 de Y 2 : n d 2 χ 2 (c, c 22 ) = ((c f ) i (c 22 ) i ) 2 i= i.. = 4 ((0 0) 2 + (0 0) 2 + ( 0) 2 + (0 ) 2) = 8 d χ 2(, ) et 2 sont assez proches (50% des individus ont choisis ces 2 modalités)

66 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM)66 Distance du profil-colonne C pl au centre de gravité: d 2 χ 2 (C pl, G c ) = = = n n((c pl) i n )2 i= n i= n i= = n n 2 pl n( x ipl n pl n )2 n x2 ipl n 2 pl n i= = n n pl + n n n n 2 2 i= x ipl + 2 n pl n i= = Plus la modalité l de la variable Y p i= est rare (effectif n pl petit), plus le profil colonne associé est éloigné de G c. x ipl x ipl n pl

67 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM)67 Inertie totale du nuage ℵ c autour de G c : I χ 2(ℵ c, G c ) = = = = P p= P p= P p= P p= K p l= K p l= K p l= f.pl d 2 χ 2 (C pl, G c ) n pl np ( n n pl ) P ( n pl n ) P (K p ) = P (K P ) = K P Remarque: I χ 2(ℵ c, G c ) = si toutes les variables ont 2 modalités. L inertie totale dépend uniquement du nombre de variables et de modalités, et non des liaisons entre les variables.

68 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM)68 Contribution de la modalité l de la variable Y p à l inertie totale du nuage ℵ c : f.pl d 2 χ 2 (C pl, G c ) = n pl np ( n ) n pl = P n pl np = P ( n pl n ) = Une modalité a une contribution à l inertie totale d autant plus forte que sa fréquence est faible (donc elle est rare) La contribution de la variable Y p (somme des contributions des modalités) vaut: K p l= P ( n pl n ) = P (K p ) = Une variable a une contribution à l inertie totale d autant plus forte que son nombre de modalités est élévé

69 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM)69 Si on veut faire jouer le même rôle à toutes les variables et à toutes les modalités, il est préférable dans la pratique, d utiliser des variables ayant plus ou moins le même nombre de modalités à fréquences relativement équilibrées.

70 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM) AFCM 2.2. Recherche des axes principaux (Résultats similaires à l ACOBI) Profils-lignes ℵ l = {(L ; n ),..., (L n; n )} muni de la distance χ 2 dans IR K où L i a comme coordonnées: l = x ipl i P p =,..., P ; l =,..., K p Profils-colonnes ℵ c = {(C pl ; f.pl = n pl n ) où p =,..., P et l =,..., K p } muni de la distance χ 2 dans IR n où C pl a comme ième coordonnées pl c = x ipl n pl i =,..., n

71 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM)7 Profils-lignes ℵ l : IRK Profils-colonnes ℵ c: IR n (λ h, u h ) où h =,..., H (λ h, v h ) où h =,..., H sont couples propres de la matrice V = T T W = T T V u h = λ h u h Ainsi on a: W v h = λ h v h où T est une matrice n K avec coordonnées: t i,pl = f ipl f i.. f.pl fi.. f.pl = x ipl n pl n P npl Construction des composantes principales (projection des profils-lignes* et colonnes* sur les axes): φ h,j = OP h (L j ) =< OL j, u h >= ψ h,pl = OP Γh (C pl ) =< OC pl, v h >= K k= n i= u h,k (l j ) k v h,j (c pl ) i

72 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM)72 Nombre de dimensions à garder En ACP, on utilise comme règle de ne retenir une composante principale que si la valeur propre correspondante est supérieure à la moyenne des valeurs propres, c est-à-dire. En AFCM, cette règle devient: Ne retenir une composante principale que si la valeur propre associée est supérieur à P En effet, supposons que H = K P (cas le plus fréquent), alors la moyenne de toutes les valeurs propres non nulles vaut: des valeurs propres non nulles K P = K P inertie totale du nuage ℵ l autour de G l = K P (K P ) = P d où la règle proposée.

73 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM) Qualité de représentation des modalités La qualité de la représentation de la modalité l de la variable Y p sur l axe principal Γ h est: cos 2 ( angle entre le vecteuroc pl et l axe Γ h) cos 2 ( β h,pl ) = ψ2 h,pl OC pl 2 On peut démontrer qu on a la relation suivante: cos(β h,pl ) = r Xpl,φ h Donc comme en ACP où on construit le cercle des corrélations des variables, en AFCM on construit celui des modalités.

74 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM) Contribution des modalités Contribution de la modalité l de Y p à la variance de ψ h : CT R Γh (X pl ) = f.plψ 2 h,pl λ h = n pl np λ h ψ 2 h,pl Contribution d autant plus forte que X pl est corrélée avec φ h et que la modalité est rare (n pl petit) Contribution globale d une variable (toutes les modalités) à la variance de ψ h : CT R Γh (Y p ) = K p l= CT R Γh (X pl )

75 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM) Formules de reconstitution Les formules introduitent en ACOBI deviennent: H f ipl = f i.. f.pl ( + φ h,i ψ h,pl ) λh h= = x ipl np = n H pl nnp ( + h= = x ipl = n pl n ( + H h= λh φ h,i ψ h,pl ) λh φ h,i ψ h,pl ) L écart entre la probabilité observée que l individu i possède la modalité l de Y p (x ipl ) et la probabilité globale de posséder cette modalité ( n pl n ) s exprime en fonction des composantes principales Comparaison entre un indicidu i et une modalité l associée à la variable Y p

76 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM)76 Deux autres formules de décomposition peuvent être introduite: La fréquence absolue d association n pl,p l = nombre d individus ayant la modalité l pour Y p et la modalité l pour Y p est: n pl,p l = = n x ipl x ip l i= n i= n pl n ( + H h= λh φ h,i ψ h,pl ) n p l H n ( + φ h,i ψ h,p l ) λh h= =... = n pln p l H ( + ψ n h,pl ψ h,p l ) h= = Comparaisons entre modalités

77 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM)77 Or l indice d attraction/répulsion d pl,p l entre la modalité l de Y p et la modalité l de Y p est égal à: d pl,p l = n pl,p l /n n pl n = n pl,p l p l n pl n p l n n n H = d pl,p l = + ψ h,pl ψ h,p l h= La proximité entre 2 individus i et i peut être définie par: p i,i = + H φ h,i φ h,i h= Deux individus sont proches s ils se ressemblent, c est-à-dire s ils ont choisi globalement les mêmes modalités

78 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM) Représentations graphiques Deux types de représentations graphiques: Représentation standard (pseudo-barycentrique) Représentation biplot (barycentrique) 2.3. Représentation standard Nous nous restreignons au er plan principal mais d autres dimensions peuvent également être envisagées ( suivre la règle concernant le choix du nombre de dimensions à conserver). La carte des individus est construite en projettant les 2 ACP, c est-à-dire on projette: - les points individus A i (i =,..., n) de coordonnées (φ,i, φ 2,i ) - les points modalités Bpl (p =,..., P ; l =,..., K p ) de coordonnées (ψ,pl, ψ 2,pl )

79 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM)79 Delta 2,Gamma B_p l * A_i * A_i* B_pl* Delta, Gamma Cette représentation donne l image la plus fidèle dans un plan des nuages ℵ l et ℵ c

80 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM)80 Interprétations: Comparaison des modalités bien représentées dans le er plan principal entre elles en utilisant l approximation de la formule d attraction/répulsion: 2 d pl,p l + ψ h,pl ψ h,pl h= = + < 0B pl, 0B p l > = + 0B pl 0B p l cos(0b pl, 0B p l ) Le plan est partagé en 2 partie par l axe B pl : - du coté de Bpl : modalités attirées par la modalité l de Y p - du coté opposé à Bpl : modalités repoussées par la modalité l de Y p. L attraction/répulsion sera d autant plus forte que < 0B pl, 0B p l > est grand.

81 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM)8 Gamma B_pl,perp* B_p l * B_p l * B_pl* Gamma Si les modalités pl, p l et p l sont bien représentées dans le plan (pas de condition sur les individus), on peut conclure que les modalités pl et p l s attirent, alors que les modalités pl et p l se repoussent

82 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM)82 Comparaison des individus bien représentés dans le premier plan principal entre eux en utilisant l approximation de la formule de proximité entre individus: 2 p i,i + φ h,i φ h,i h= = + < 0A i, 0A i > = + 0A i 0A i cos(0a i, 0A i ) Le plan est partagé en 2 partie par l axe A i : - coté de A i où les individus ont tendance à avoir des modalités communes avec l individu i et cela d autant plus que < 0A i, 0A i > est elevé - coté opposé de A i où l interprétation est inverse

83 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM)83 Delta A_i * A_iperp* A_i * A_i* Delta Si les individus i, i et i sont bien représentés dans le plan (pas besoin de critères sur les modalités), on peut conclure que i ressemble à i et a peu de caractéristiques communes avec i

84 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM)84 Comparaison individus bien représentés dans le er plan et modalités bien représentées dans le er plan en utilisant la formule de reconstitution des données: x ipl n pl n ( + 2 h= λh φ h,i ψ h,pl ) La présence des coefficients λh nous empêche de conclure aussi directement que précédemment. Si A i et B pl sont bien représentés et dans le même quadrant, l individu i aura tendance à posséder la modalité pl. Si A i et Bpl sont bien représentés et dans des quadrants opposés, il est probable que l individu i ne possédera pas la modalité pl. Mais on ne peut pas conclure lorque A i et Bpl sont dans des quadrants adjacents.

85 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM) Représentation Biplot Dans la représentation standard, les individus et les modalités ont un rôle similaire. Dans la représentation biplot, il sera plus facile d interpréter les comparaisons entre les individus et les modalités. Les individus seront représentés par les points à i de coordonnées: ( φ,i, φ 2,i ) = ( φ,i λ, φ 2,i λ2 ) Les modalités seront représentés par les points B pl (p =,..., P ; l =,..., K p ) de coordonnées (ψ,pl, ψ 2,pl ).

86 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM)86 Pour comparer individus et variables, on utilise: x ipl n pl n ( + 2 h= φ h,i ψ h,pl ) = n pl n (+ < 0Ã i, 0B pl >) = n pl n ( + 0Ã i 0B pl cos(0ã i, 0B pl )) Donc on déduit que l axe Bpl partage le biplot en 2 parties: - du coté de Bpl se trouve les individus ayant probablement la modalité pl (plus < A i, 0B pl > est grand en valeur absolue, plus on peut conclure avec confiance que i possède ou non la modalité pl) - du coté opposé c est exactement le contraire

87 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM)87 Axe B_pl,perp* ~A_ip * ~A_i* B_pl* Axe Si la modalité pl est bien représentée dans le plan, alors l individu i possède probablement la modalité pl et l individu i ne la possède pas

88 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM)88 Remarques: codages des variables L ACOBI et l AFCM concernent le traitement des variables qualitatives. Donc, s il y a des variables quantitatives dans l étude, il est courant de les regrouper en classes pour les transformer par codage en variable qualitatives. Le nombre de classe ne doit pas être trop grand ni petit (généralement entre 3 et 8) Si le choix n est pas dicté par des considérations pratiques (facilité de l obtention des données, maintien d un choix antérieur, etc), il est conseillé de prendre des classes qui contiennent approximativement le même nombre d individus pour éviter les modalités rares. Si une des variables projettées sur les graphiques est ordonnée, il peut être utile de tracer la trajectoire qui relie les modalités ordonnées.

89 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM) Le tableau de Burt (TB) Quand utiliser le TB au lieu du TDC? Si n est très grand (plusieurs centaines), la représentation simultanée des individus et des modalités est illisible. Si les individus sont anonymes, les données ne présentent de l intérêt que par l intermédiaire de leurs caractéristiques. Tableau de contingence (symétrique) obtenu en croissant 2 à 2 les K = K +...+K P modalités des P variables.

90 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM)90 Y... Y p... Y P... K K p K P n P n Y..... n l,pl. n l,p l. K 0 n K P n K n p 0... P n p Y p. n pl,l..... n pl,p l. K p... 0 n pkp... P n pkp n P l,pl... n P 0 P n P Y p. n P l,l K p n P KP P n P KP P n... P n K... P n p... P n pkp... P n P... P n P KP np 2 Au lieu de faire une ACOBI sur le tableau disjonctif complet (TDC), on peut la faire sur le tableau de Burt. NB: Les profils-colonnes sont identiques aux profilslignes puisque le tableau de Burt est symétrique.

91 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM) Liens entre l AFCM réalisée sur le TDC et celle réalisée sur le tableau de Burt Les inerties associées au TB sont les carrés de celles associées au TDC, et donc: λ T B,h = λ 2 h h =,..., H Notons les composantes principales associées au TB ψ T B,h, nous avons les relations suivantes: s 2 ψ = λ h h et s 2 Ψ = λ T B,h T B,h = λ 2 h On peut également montrer h =,..., H: ψ T B,h = λ h ψ h

92 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM) Example: What are the characteristics of socialist voters? Other question: Are the Muslims behaviors different from Catholics and Non-beleivers? Database: Votes for the PS in the regional elections of June 2004 in the Brussels Region

93 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM) Society-oriented questions: Mail services should be privatized; Trade Unions should weigh heavily in major economic decisions; Homosexual couples should be allowed to adopt children; Consumption of cannabis should be forbidden; People don t feel at home in Belgium anymore; Abolishing the death penalty was the right decision. The answers proposed to these questions are: Total agreement (), Rather in agreement (2), Rather opposed (3), Totally opposed (4), No opinion (5).

94 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM) χ 2 independence test Analyze of each society-oriented question separately by testing its dependency with respect to the belief variable using a χ 2 independence test. χ 2 Mail Trade Union Homosexual Test p-value (0.00) (0.00) (0.00) χ 2 Cannabis Home D. Penalty Test p-value (0.00) (0.00) (0.6) The assumption of independence between the society-oriented questions and belief-oriented question is rejected for all of the questions (at the 5% level) except for the question on the death penalty (very small variation inside the question).

95 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM) Attraction-repulsion indexes Links between each pair of modalities of two variables with the attraction-repulsion indexes d jk defined as d jk = f jk f j. f.k where f jk is the observed frequency and f j. f.k is the theoretical frequency under the independence hypothesis. Interpretation: d jk > the two modalities attract each others d jk < the two modalities push each other away d jk the two modalities are close to being. independent

96 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM)96 Mail services should be privatized Mail services should be privatized Attraction Index Non-believer Catholic Muslim Total agreement Rather in agreement Rather opposed Totally opposed No opinion Proportion of Muslim PS-voters who declare having no opinion on the subject is much higher than the corresponding proportions of Catholic and Non-believer PS-voters. Proportion of Catholics who are in total agreement to a privatization of mail services is much higher.

97 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM)97 Trade Unions should weigh heavily in major economic decisions Trade Unions Attraction Index Non-believer Catholic Muslim Total agreement Rather in agreement Rather opposed Totally opposed No opinion

98 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM)98 Homosexual couples should be allowed to adopt children Homosexual couples should be allowed to adopt children Attraction Index Non-believer Catholic Muslim Total agreement Rather in agreement Rather opposed Totally opposed No opinion Very clear-cut. Non-believers are proportionally much more in agreement with the assertion than others Catholics generally seem to oppose or totally oppose it. A vast majority of Muslims declare themselves totally opposed to the proposition.

99 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM)99 Consumption of cannabis should be forbidden Consumption of cannabis should be forbidden Attraction Index Non-croyant Catholique Musulma Total agreement Rather in agreement Rather opposed Totally opposed No opinion Majority of Muslims agree with the proposal, Majority of Non-believers declare themselves opposed to it.

100 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM)00 People don t feel at home in Belgium anymore People don t feel at home in Belgium anymore Attraction Index Non-believer Catholic Muslim Total agreement Rather in agreement Rather opposed Totally opposed No opinion Strong opposition between Non-believers and Catholics. Muslims also seem to agree on the fact that they don t feel at home in Belgium anymore.

101 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM)0 Abolishing the death penalty was the right decision Abolishing the death penalty was the right decision Attraction Index Non-believer Catholic Muslim Total agreement Rather in agreement Rather opposed Totally opposed No opinion High number of totally in agreement with abolishing it Muslims don t really show a tendency one way or another with respect to the others. Catholics seem to be more prone than Nonbelievers to be against the abolishment of the death penalty.

102 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM) Multiple correspondance analysis (AFCM) Multivariate vision of the set of society-oriented questions (active variables) First factorial plan CAN4 POSTE4 0.5 HOMO POL OG BEL4 Second factor 0 PM NON BELIEVER POL2 HOMO2 CAN3 OG2 POL3 MUSLIM POL4 CATHOLIC HOMO4 CAN POL5 OG4 BEL2 POSTE2 PM4 PM3 BEL 0.5 POSTE3 CAN3 OG3 POL6 POL7 POSTE BEL3 HOMO3 PM First factor Figure 2.: Multiple Correspondence Analysis on society-oriented questions. Belief and the political scale are added as illustrative variables. Two illustrative variables: belief and the political scale The first axis represents a left-right dimension.

103 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM)03 Inertia explained by the first plane: 20% Contributors on first factorial axis: 24.8% feeling at home in Belgium 22.7% the death penalty 7.9% adoption by homosexual couples 7% prohibition of cannabis consumption 0.4% privitization of mail services 7.2% Trade Unions in political decisions Contributors on second factorial axis: 24.2% privitization of mail services 9.3% adoption by homosexual couples 6.5% prohibition of cannabis consumption 4.7% the death penalty 3.6% feeling at home in Belgium.8% Trade Unions in political decisions

104 CHAPITRE 2. ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES (AFCM) Econometric Model Multivariate data analysis doesn t take into account the influence of other variables which may strongly influence the results Dependent variable: the left-right indicator built on the basis of the six society-oriented questions Regression Regression 2 Variable Coefficient Std. Error Coefficient Std. Error C -0.66*** (0.027) *** (0.078) NONCROYANT -0.39*** (0.050) *** (0.048) MUSULMAN (0.055) 0.52*** (0.055) AGE 0.008*** (0.00) AUCUN 0.37*** (0.2) PRIMAIRE 0.42*** (0.094) PROFESSIONNEL 0.30*** (0.083) SECINF 0.46*** (0.068) SECSUP 0.274*** (0.053) SUPNONUNIV 0.63*** (0.054) TECHNIQUE 0.5 (0.096) R-squared: 2.6 % R-squared: 24.4 % Sample size: 676, *Statistically different from zero at 0%,

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et

Plus en détail

Statistique Descriptive Multidimensionnelle. (pour les nuls)

Statistique Descriptive Multidimensionnelle. (pour les nuls) Publications de l Institut de Mathématiques de Toulouse Statistique Descriptive Multidimensionnelle (pour les nuls) (version de mai 2010) Alain Baccini Institut de Mathématiques de Toulouse UMR CNRS 5219

Plus en détail

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES Dominique LAFFLY Maître de Conférences, Université de Pau Laboratoire Société Environnement Territoire UMR 5603 du CNRS et Université de Pau Domaine

Plus en détail

1 Complément sur la projection du nuage des individus

1 Complément sur la projection du nuage des individus TP 0 : Analyse en composantes principales (II) Le but de ce TP est d approfondir nos connaissances concernant l analyse en composantes principales (ACP). Pour cela, on reprend les notations du précédent

Plus en détail

Chapitre 3. Les distributions à deux variables

Chapitre 3. Les distributions à deux variables Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles

Plus en détail

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI 1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage

Plus en détail

Statistiques Descriptives à une dimension

Statistiques Descriptives à une dimension I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des

Plus en détail

Cours d Analyse. Fonctions de plusieurs variables

Cours d Analyse. Fonctions de plusieurs variables Cours d Analyse Fonctions de plusieurs variables Licence 1ère année 2007/2008 Nicolas Prioux Université de Marne-la-Vallée Table des matières 1 Notions de géométrie dans l espace et fonctions à deux variables........

Plus en détail

Analyse en Composantes Principales

Analyse en Composantes Principales Analyse en Composantes Principales Anne B Dufour Octobre 2013 Anne B Dufour () Analyse en Composantes Principales Octobre 2013 1 / 36 Introduction Introduction Soit X un tableau contenant p variables mesurées

Plus en détail

Introduction. Préambule. Le contexte

Introduction. Préambule. Le contexte Préambule... INTRODUCTION... BREF HISTORIQUE DE L ACP... 4 DOMAINE D'APPLICATION... 5 INTERPRETATIONS GEOMETRIQUES... 6 a - Pour les n individus... 6 b - Pour les p variables... 7 c - Notion d éléments

Plus en détail

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Valentin Patilea 1 Cesar Sanchez-sellero 2 Matthieu Saumard 3 1 CREST-ENSAI et IRMAR 2 USC Espagne 3 IRMAR-INSA

Plus en détail

Principe de symétrisation pour la construction d un test adaptatif

Principe de symétrisation pour la construction d un test adaptatif Principe de symétrisation pour la construction d un test adaptatif Cécile Durot 1 & Yves Rozenholc 2 1 UFR SEGMI, Université Paris Ouest Nanterre La Défense, France, cecile.durot@gmail.com 2 Université

Plus en détail

Introduction à l approche bootstrap

Introduction à l approche bootstrap Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?

Plus en détail

Analyse des correspondances avec colonne de référence

Analyse des correspondances avec colonne de référence ADE-4 Analyse des correspondances avec colonne de référence Résumé Quand une table de contingence contient une colonne de poids très élevé, cette colonne peut servir de point de référence. La distribution

Plus en détail

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures) CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un

Plus en détail

Natixis Asset Management Response to the European Commission Green Paper on shadow banking

Natixis Asset Management Response to the European Commission Green Paper on shadow banking European Commission DG MARKT Unit 02 Rue de Spa, 2 1049 Brussels Belgium markt-consultation-shadow-banking@ec.europa.eu 14 th June 2012 Natixis Asset Management Response to the European Commission Green

Plus en détail

Exercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015

Exercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015 Exercices M1 SES 214-215 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 215 Les exemples numériques présentés dans ce document d exercices ont été traités sur le logiciel R, téléchargeable par

Plus en détail

UNE REPRESENTATION GRAPHIQUE DE LA LIAISON STATISTIQUE ENTRE DEUX VARIABLES ORDONNEES. Éric TÉROUANNE 1

UNE REPRESENTATION GRAPHIQUE DE LA LIAISON STATISTIQUE ENTRE DEUX VARIABLES ORDONNEES. Éric TÉROUANNE 1 33 Math. Inf. Sci. hum., (33 e année, n 130, 1995, pp.33-42) UNE REPRESENTATION GRAPHIQUE DE LA LIAISON STATISTIQUE ENTRE DEUX VARIABLES ORDONNEES Éric TÉROUANNE 1 RÉSUMÉ Le stéréogramme de liaison est

Plus en détail

Leçon N 4 : Statistiques à deux variables

Leçon N 4 : Statistiques à deux variables Leçon N 4 : Statistiques à deux variables En premier lieu, il te faut relire les cours de première sur les statistiques à une variable, il y a tout un langage à se remémorer : étude d un échantillon d

Plus en détail

INF6304 Interfaces Intelligentes

INF6304 Interfaces Intelligentes INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie

Plus en détail

Probabilités sur un univers fini

Probabilités sur un univers fini [http://mp.cpgedupuydelome.fr] édité le 7 août 204 Enoncés Probabilités sur un univers fini Evènements et langage ensembliste A quelle condition sur (a, b, c, d) ]0, [ 4 existe-t-il une probabilité P sur

Plus en détail

Probabilités sur un univers fini

Probabilités sur un univers fini [http://mp.cpgedupuydelome.fr] édité le 10 août 2015 Enoncés 1 Proailités sur un univers fini Evènements et langage ensemliste A quelle condition sur (a,, c, d) ]0, 1[ 4 existe-t-il une proailité P sur

Plus en détail

Filtrage stochastique non linéaire par la théorie de représentation des martingales

Filtrage stochastique non linéaire par la théorie de représentation des martingales Filtrage stochastique non linéaire par la théorie de représentation des martingales Adriana Climescu-Haulica Laboratoire de Modélisation et Calcul Institut d Informatique et Mathématiques Appliquées de

Plus en détail

Exemple PLS avec SAS

Exemple PLS avec SAS Exemple PLS avec SAS This example, from Umetrics (1995), demonstrates different ways to examine a PLS model. The data come from the field of drug discovery. New drugs are developed from chemicals that

Plus en détail

Angles orientés et trigonométrie

Angles orientés et trigonométrie Chapitre Angles orientés et trigonométrie Ce que dit le programme : CONTENUS CAPACITÉS ATTENDUES COMMENTAIRES Trigonométrie Cercle trigonométrique. Radian. Mesure d un angle orienté, mesure principale.

Plus en détail

Extraction d informations stratégiques par Analyse en Composantes Principales

Extraction d informations stratégiques par Analyse en Composantes Principales Extraction d informations stratégiques par Analyse en Composantes Principales Bernard DOUSSET IRIT/ SIG, Université Paul Sabatier, 118 route de Narbonne, 31062 Toulouse cedex 04 dousset@irit.fr 1 Introduction

Plus en détail

Statistique Descriptive Élémentaire

Statistique Descriptive Élémentaire Publications de l Institut de Mathématiques de Toulouse Statistique Descriptive Élémentaire (version de mai 2010) Alain Baccini Institut de Mathématiques de Toulouse UMR CNRS 5219 Université Paul Sabatier

Plus en détail

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/ Recherche opérationnelle Les démonstrations et les exemples seront traités en cours Souad EL Bernoussi Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/ Table des matières 1 Programmation

Plus en détail

Relation entre deux variables : estimation de la corrélation linéaire

Relation entre deux variables : estimation de la corrélation linéaire CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence

Plus en détail

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre : Terminale STSS 2 012 2 013 Pourcentages Synthèse 1) Définition : Calculer t % d'un nombre, c'est multiplier ce nombre par t 100. 2) Exemples de calcul : a) Calcul d un pourcentage : Un article coûtant

Plus en détail

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens Chapitre 7 Statistique des échantillons gaussiens Le théorème central limite met en évidence le rôle majeur tenu par la loi gaussienne en modélisation stochastique. De ce fait, les modèles statistiques

Plus en détail

I. Ensemble de définition d'une fonction

I. Ensemble de définition d'une fonction Chapitre 2 Généralités sur les fonctions Fonctions de références et fonctions associées Ce que dit le programme : Étude de fonctions Fonctions de référence x x et x x Connaître les variations de ces deux

Plus en détail

T de Student Khi-deux Corrélation

T de Student Khi-deux Corrélation Les tests d inférence statistiques permettent d estimer le risque d inférer un résultat d un échantillon à une population et de décider si on «prend le risque» (si 0.05 ou 5 %) Une différence de moyennes

Plus en détail

Contexte. Pour cela, elles doivent être très compliquées, c est-à-dire elles doivent être très différentes des fonctions simples,

Contexte. Pour cela, elles doivent être très compliquées, c est-à-dire elles doivent être très différentes des fonctions simples, Non-linéarité Contexte Pour permettre aux algorithmes de cryptographie d être sûrs, les fonctions booléennes qu ils utilisent ne doivent pas être inversées facilement. Pour cela, elles doivent être très

Plus en détail

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1 UN GROUPE D INDIVIDUS Un groupe d individus décrit par une variable qualitative binaire DÉCRIT PAR UNE VARIABLE QUALITATIVE BINAIRE ANALYSER UN SOUS-GROUPE COMPARER UN SOUS-GROUPE À UNE RÉFÉRENCE Mots-clés

Plus en détail

Improving the breakdown of the Central Credit Register data by category of enterprises

Improving the breakdown of the Central Credit Register data by category of enterprises Improving the breakdown of the Central Credit Register data by category of enterprises Workshop on Integrated management of micro-databases Deepening business intelligence within central banks statistical

Plus en détail

Chapitre 2 Le problème de l unicité des solutions

Chapitre 2 Le problème de l unicité des solutions Université Joseph Fourier UE MAT 127 Mathématiques année 2011-2012 Chapitre 2 Le problème de l unicité des solutions Ce que nous verrons dans ce chapitre : un exemple d équation différentielle y = f(y)

Plus en détail

Data mining 1. Exploration Statistique

Data mining 1. Exploration Statistique PUBLICATIONS DU LABORATOIRE DE STATISTIQUE ET PROBABILITÉS Data mining 1 Exploration Statistique ALAIN BACCINI & PHILIPPE BESSE Version septembre 2004 mises à jour : wwwlspups-tlsefr/besse Laboratoire

Plus en détail

Instructions Mozilla Thunderbird Page 1

Instructions Mozilla Thunderbird Page 1 Instructions Mozilla Thunderbird Page 1 Instructions Mozilla Thunderbird Ce manuel est écrit pour les utilisateurs qui font déjà configurer un compte de courrier électronique dans Mozilla Thunderbird et

Plus en détail

3 Approximation de solutions d équations

3 Approximation de solutions d équations 3 Approximation de solutions d équations Une équation scalaire a la forme générale f(x) =0où f est une fonction de IR dans IR. Un système de n équations à n inconnues peut aussi se mettre sous une telle

Plus en détail

Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS

Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence

Plus en détail

ISFA 2 année 2002-2003. Les questions sont en grande partie indépendantes. Merci d utiliser l espace imparti pour vos réponses.

ISFA 2 année 2002-2003. Les questions sont en grande partie indépendantes. Merci d utiliser l espace imparti pour vos réponses. On considère la matrice de données : ISFA 2 année 22-23 Les questions sont en grande partie indépendantes Merci d utiliser l espace imparti pour vos réponses > ele JCVGE FM1 GM JCRB FM2 JMLP Paris 61 29

Plus en détail

Chapitre 3. Quelques fonctions usuelles. 1 Fonctions logarithme et exponentielle. 1.1 La fonction logarithme

Chapitre 3. Quelques fonctions usuelles. 1 Fonctions logarithme et exponentielle. 1.1 La fonction logarithme Chapitre 3 Quelques fonctions usuelles 1 Fonctions logarithme et eponentielle 1.1 La fonction logarithme Définition 1.1 La fonction 7! 1/ est continue sur ]0, +1[. Elle admet donc des primitives sur cet

Plus en détail

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé Baccalauréat S ntilles-guyane 11 septembre 14 Corrigé EXERCICE 1 6 points Commun à tous les candidats Une entreprise de jouets en peluche souhaite commercialiser un nouveau produit et à cette fin, effectue

Plus en détail

Calcul matriciel. Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes.

Calcul matriciel. Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes. 1 Définitions, notations Calcul matriciel Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes. On utilise aussi la notation m n pour le

Plus en détail

Exo7. Matrice d une application linéaire. Corrections d Arnaud Bodin.

Exo7. Matrice d une application linéaire. Corrections d Arnaud Bodin. Exo7 Matrice d une application linéaire Corrections d Arnaud odin. Exercice Soit R muni de la base canonique = ( i, j). Soit f : R R la projection sur l axe des abscisses R i parallèlement à R( i + j).

Plus en détail

Une variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants)

Une variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants) CIVILITE-SES.doc - 1 - Une variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants) 1 PRÉSENTATION DU DOSSIER CIVILITE On s intéresse

Plus en détail

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE UE4 : Biostatistiques Chapitre 6 Test de comparaison de pourcentages χ² José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Nature des variables

Plus en détail

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R Yves Aragon, David Haziza & Anne Ruiz-Gazen GREMAQ, UMR CNRS 5604, Université des Sciences

Plus en détail

Cours 9 : Plans à plusieurs facteurs

Cours 9 : Plans à plusieurs facteurs Cours 9 : Plans à plusieurs facteurs Table des matières Section 1. Diviser pour regner, rassembler pour saisir... 3 Section 2. Définitions et notations... 3 2.1. Définitions... 3 2.2. Notations... 4 Section

Plus en détail

LES TYPES DE DONNÉES DU LANGAGE PASCAL

LES TYPES DE DONNÉES DU LANGAGE PASCAL LES TYPES DE DONNÉES DU LANGAGE PASCAL 75 LES TYPES DE DONNÉES DU LANGAGE PASCAL CHAPITRE 4 OBJECTIFS PRÉSENTER LES NOTIONS D ÉTIQUETTE, DE CONS- TANTE ET DE IABLE DANS LE CONTEXTE DU LAN- GAGE PASCAL.

Plus en détail

NON-LINEARITE ET RESEAUX NEURONAUX

NON-LINEARITE ET RESEAUX NEURONAUX NON-LINEARITE ET RESEAUX NEURONAUX Vêlayoudom MARIMOUTOU Laboratoire d Analyse et de Recherche Economiques Université de Bordeaux IV Avenue. Leon Duguit, 33608 PESSAC, France tel. 05 56 84 85 77 e-mail

Plus en détail

Statistique : Résumé de cours et méthodes

Statistique : Résumé de cours et méthodes Statistique : Résumé de cours et méthodes 1 Vocabulaire : Population : c est l ensemble étudié. Individu : c est un élément de la population. Effectif total : c est le nombre total d individus. Caractère

Plus en détail

Seconde Généralités sur les fonctions Exercices. Notion de fonction.

Seconde Généralités sur les fonctions Exercices. Notion de fonction. Seconde Généralités sur les fonctions Exercices Notion de fonction. Exercice. Une fonction définie par une formule. On considère la fonction f définie sur R par = x + x. a) Calculer les images de, 0 et

Plus en détail

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes IUT HSE Probabilités et Statistiques Feuille : variables aléatoires discrètes 1 Exercices Dénombrements Exercice 1. On souhaite ranger sur une étagère 4 livres de mathématiques (distincts), 6 livres de

Plus en détail

I. Polynômes de Tchebychev

I. Polynômes de Tchebychev Première épreuve CCP filière MP I. Polynômes de Tchebychev ( ) 1.a) Tout réel θ vérifie cos(nθ) = Re ((cos θ + i sin θ) n ) = Re Cn k (cos θ) n k i k (sin θ) k Or i k est réel quand k est pair et imaginaire

Plus en détail

Les indices à surplus constant

Les indices à surplus constant Les indices à surplus constant Une tentative de généralisation des indices à utilité constante On cherche ici en s inspirant des indices à utilité constante à définir un indice de prix de référence adapté

Plus en détail

Analyse de la variance Comparaison de plusieurs moyennes

Analyse de la variance Comparaison de plusieurs moyennes Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction

Plus en détail

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée. ANALYSE 5 points Exercice 1 : Léonie souhaite acheter un lecteur MP3. Le prix affiché (49 ) dépasse largement la somme dont elle dispose. Elle décide donc d économiser régulièrement. Elle a relevé qu elle

Plus en détail

Exercices - Polynômes : corrigé. Opérations sur les polynômes

Exercices - Polynômes : corrigé. Opérations sur les polynômes Opérations sur les polynômes Exercice 1 - Carré - L1/Math Sup - Si P = Q est le carré d un polynôme, alors Q est nécessairement de degré, et son coefficient dominant est égal à 1. On peut donc écrire Q(X)

Plus en détail

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

La survie nette actuelle à long terme Qualités de sept méthodes d estimation La survie nette actuelle à long terme Qualités de sept méthodes d estimation PAR Alireza MOGHADDAM TUTEUR : Guy HÉDELIN Laboratoire d Épidémiologie et de Santé publique, EA 80 Faculté de Médecine de Strasbourg

Plus en détail

Exercices - Fonctions de plusieurs variables : corrigé. Pour commencer

Exercices - Fonctions de plusieurs variables : corrigé. Pour commencer Pour commencer Exercice 1 - Ensembles de définition - Première année - 1. Le logarithme est défini si x + y > 0. On trouve donc le demi-plan supérieur délimité par la droite d équation x + y = 0.. 1 xy

Plus en détail

REVUE DE STATISTIQUE APPLIQUÉE

REVUE DE STATISTIQUE APPLIQUÉE REVUE DE STATISTIQUE APPLIQUÉE H. ABDALLAH G. SAPORTA Mesures de distance entre modalités de variables qualitatives; application à la classification Revue de statistique appliquée, tome 51, n o 2 (2003),

Plus en détail

VI. Tests non paramétriques sur un échantillon

VI. Tests non paramétriques sur un échantillon VI. Tests non paramétriques sur un échantillon Le modèle n est pas un modèle paramétrique «TESTS du CHI-DEUX» : VI.1. Test d ajustement à une loi donnée VI.. Test d indépendance de deux facteurs 96 Différentes

Plus en détail

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers

Plus en détail

LE PRODUIT SCALAIRE ( En première S )

LE PRODUIT SCALAIRE ( En première S ) LE PRODUIT SCALAIRE ( En première S ) Dernière mise à jour : Jeudi 4 Janvier 007 Vincent OBATON, Enseignant au lycée Stendhal de Grenoble ( Année 006-007 ) 1 Table des matières 1 Grille d autoévaluation

Plus en détail

Calcul différentiel sur R n Première partie

Calcul différentiel sur R n Première partie Calcul différentiel sur R n Première partie Université De Metz 2006-2007 1 Définitions générales On note L(R n, R m ) l espace vectoriel des applications linéaires de R n dans R m. Définition 1.1 (différentiabilité

Plus en détail

TESTS D HYPOTHÈSE FONDÉS SUR LE χ². http://fr.wikipedia.org/wiki/eugénisme

TESTS D HYPOTHÈSE FONDÉS SUR LE χ². http://fr.wikipedia.org/wiki/eugénisme TESTS D HYPOTHÈSE FONDÉS SUR LE χ² http://fr.wikipedia.org/wiki/eugénisme Logo du Second International Congress of Eugenics 1921. «Comme un arbre, l eugénisme tire ses constituants de nombreuses sources

Plus en détail

Formulaire de candidature pour les bourses de mobilité internationale niveau Master/ Application Form for International Master Scholarship Programme

Formulaire de candidature pour les bourses de mobilité internationale niveau Master/ Application Form for International Master Scholarship Programme Formulaire de candidature pour les bourses de mobilité internationale niveau Master/ Application Form for International Master Scholarship Programme Année universitaire / Academic Year: 2013 2014 A REMPLIR

Plus en détail

PEUT-ON «VOIR» DANS L ESPACE À N DIMENSIONS?

PEUT-ON «VOIR» DANS L ESPACE À N DIMENSIONS? PEUT-ON «VOIR» DANS L ESPACE À N DIMENSIONS? Pierre Baumann, Michel Émery Résumé : Comment une propriété évidente visuellement en dimensions deux et trois s étend-elle aux autres dimensions? Voici une

Plus en détail

Cheque Holding Policy Disclosure (Banks) Regulations. Règlement sur la communication de la politique de retenue de chèques (banques) CONSOLIDATION

Cheque Holding Policy Disclosure (Banks) Regulations. Règlement sur la communication de la politique de retenue de chèques (banques) CONSOLIDATION CANADA CONSOLIDATION CODIFICATION Cheque Holding Policy Disclosure (Banks) Regulations Règlement sur la communication de la politique de retenue de chèques (banques) SOR/2002-39 DORS/2002-39 Current to

Plus en détail

RAPID 3.34 - Prenez le contrôle sur vos données

RAPID 3.34 - Prenez le contrôle sur vos données RAPID 3.34 - Prenez le contrôle sur vos données Parmi les fonctions les plus demandées par nos utilisateurs, la navigation au clavier et la possibilité de disposer de champs supplémentaires arrivent aux

Plus en détail

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007 Vision industrielle et télédétection - Détection d ellipses Guillaume Martinez 17 décembre 2007 1 Table des matières 1 Le projet 3 1.1 Objectif................................ 3 1.2 Les choix techniques.........................

Plus en détail

Formulaire de candidature pour les bourses de mobilité internationale niveau Master/ Application Form for International Master Scholarship Program

Formulaire de candidature pour les bourses de mobilité internationale niveau Master/ Application Form for International Master Scholarship Program Formulaire de candidature pour les bourses de mobilité internationale niveau Master/ Application Form for International Master Scholarship Program Année universitaire / Academic Year: 2013 2014 INTITULE

Plus en détail

LES GENERATEURS DE NOMBRES ALEATOIRES

LES GENERATEURS DE NOMBRES ALEATOIRES LES GENERATEURS DE NOMBRES ALEATOIRES 1 Ce travail a deux objectifs : ====================================================================== 1. Comprendre ce que font les générateurs de nombres aléatoires

Plus en détail

Pratique de l analyse de données SPSS appliqué à l enquête «Identités et Capital social en Wallonie»

Pratique de l analyse de données SPSS appliqué à l enquête «Identités et Capital social en Wallonie» Centre de recherche en démographie et sociétés UCL/IACCHOS/DEMO Pratique de l analyse de données SPSS appliqué à l enquête «Identités et Capital social en Wallonie» 1 2 3+ analyses univariées Type de variables

Plus en détail

Complément d information concernant la fiche de concordance

Complément d information concernant la fiche de concordance Sommaire SAMEDI 0 DÉCEMBRE 20 Vous trouverez dans ce dossier les documents correspondants à ce que nous allons travailler aujourd hui : La fiche de concordance pour le DAEU ; Page 2 Un rappel de cours

Plus en détail

I - PUISSANCE D UN POINT PAR RAPPORT A UN CERCLE CERCLES ORTHOGONAUX POLES ET POLAIRES

I - PUISSANCE D UN POINT PAR RAPPORT A UN CERCLE CERCLES ORTHOGONAUX POLES ET POLAIRES I - PUISSANCE D UN POINT PAR RAPPORT A UN CERCLE CERCLES ORTHOGONAUX POLES ET POLAIRES Théorème - Définition Soit un cercle (O,R) et un point. Une droite passant par coupe le cercle en deux points A et

Plus en détail

Évaluation de la régression bornée

Évaluation de la régression bornée Thierry Foucart UMR 6086, Université de Poitiers, S P 2 M I, bd 3 téléport 2 BP 179, 86960 Futuroscope, Cedex FRANCE Résumé. le modèle linéaire est très fréquemment utilisé en statistique et particulièrement

Plus en détail

Collecter des informations statistiques

Collecter des informations statistiques Collecter des informations statistiques FICHE MÉTHODE A I Les caractéristiques essentielles d un tableau statistique La statistique a un vocabulaire spécifique. L objet du tableau (la variable) s appelle

Plus en détail

Suites numériques 3. 1 Convergence et limite d une suite

Suites numériques 3. 1 Convergence et limite d une suite Suites numériques 3 1 Convergence et limite d une suite Nous savons que les termes de certaines suites s approchent de plus en plus d une certaine valeur quand n augmente : par exemple, les nombres u n

Plus en détail

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1 La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1 La licence Mathématiques et Economie-MASS de l Université des Sciences Sociales de Toulouse propose sur les trois

Plus en détail

Correction de l examen de la première session

Correction de l examen de la première session de l examen de la première session Julian Tugaut, Franck Licini, Didier Vincent Si vous trouvez des erreurs de Français ou de mathématiques ou bien si vous avez des questions et/ou des suggestions, envoyez-moi

Plus en détail

Limites finies en un point

Limites finies en un point 8 Limites finies en un point Pour ce chapitre, sauf précision contraire, I désigne une partie non vide de R et f une fonction définie sur I et à valeurs réelles ou complees. Là encore, les fonctions usuelles,

Plus en détail

La Routine Quotidienne. Le docteur se lave les mains

La Routine Quotidienne. Le docteur se lave les mains La Routine Quotidienne Le docteur se lave les mains 1 Doing daily activities la routine prendre un bain prendre une douche se réveiller se lever se laver se brosser se raser se maquiller se peigner s'habiller

Plus en détail

1 radian. De même, la longueur d un arc de cercle de rayon R et dont l angle au centre a pour mesure α radians est α R. R AB =R.

1 radian. De même, la longueur d un arc de cercle de rayon R et dont l angle au centre a pour mesure α radians est α R. R AB =R. Angles orientés Trigonométrie I. Préliminaires. Le radian Définition B R AB =R C O radian R A Soit C un cercle de centre O. Dire que l angle géométrique AOB a pour mesure radian signifie que la longueur

Plus en détail

Construction d un cercle tangent à deux cercles donnés.

Construction d un cercle tangent à deux cercles donnés. Préparation au CAPES Strasbourg, octobre 2008 Construction d un cercle tangent à deux cercles donnés. Le problème posé : On se donne deux cercles C et C de centres O et O distincts et de rayons R et R

Plus en détail

NORME INTERNATIONALE INTERNATIONAL STANDARD. Dispositifs à semiconducteurs Dispositifs discrets. Semiconductor devices Discrete devices

NORME INTERNATIONALE INTERNATIONAL STANDARD. Dispositifs à semiconducteurs Dispositifs discrets. Semiconductor devices Discrete devices NORME INTERNATIONALE INTERNATIONAL STANDARD CEI IEC 747-6-3 QC 750113 Première édition First edition 1993-11 Dispositifs à semiconducteurs Dispositifs discrets Partie 6: Thyristors Section trois Spécification

Plus en détail

Géométrie dans l espace Produit scalaire et équations

Géométrie dans l espace Produit scalaire et équations Chapitre 11. 2ème partie Géométrie dans l espace Produit scalaire et équations Terminale S Ce que dit le programme : CONTENUS CAPACITÉS ATTENDUES COMMENTAIRES 2ème partie Produit scalaire Produit scalaire

Plus en détail

CALCUL DE LA CONTRIBUTION - FONDS VERT Budget 2008/2009

CALCUL DE LA CONTRIBUTION - FONDS VERT Budget 2008/2009 Société en commandite Gaz Métro CALCUL DE LA CONTRIBUTION - FONDS VERT Budget 2008/2009 Taux de la contribution au Fonds vert au 1 er janvier 2009 Description Volume Coûts Taux 10³m³ 000 $ /m³ (1) (2)

Plus en détail

Principe d un test statistique

Principe d un test statistique Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre

Plus en détail

Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT

Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT Ces exercices portent sur les items 2, 3 et 5 du programme d informatique des classes préparatoires,

Plus en détail

Représentation géométrique d un nombre complexe

Représentation géométrique d un nombre complexe CHAPITRE 1 NOMBRES COMPLEXES 1 Représentation géométrique d un nombre complexe 1. Ensemble des nombres complexes Soit i le nombre tel que i = 1 L ensemble des nombres complexes est l ensemble des nombres

Plus en détail

Corrigé du baccalauréat S Pondichéry 12 avril 2007

Corrigé du baccalauréat S Pondichéry 12 avril 2007 Corrigé du baccalauréat S Pondichéry 1 avril 7 EXERCICE 1 Commun à tous les candidats 4 points 1 a Les vecteurs AB et AC ont pour coordonnées AB ; ; ) et AC 1 ; 4 ; 1) Ils ne sont manifestement pas colinéaires

Plus en détail

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique»

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Tests de comparaison de moyennes Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Test de Z ou de l écart réduit Le test de Z : comparer des paramètres en testant leurs différences

Plus en détail

1S Modèles de rédaction Enoncés

1S Modèles de rédaction Enoncés Par l équipe des professeurs de 1S du lycée Parc de Vilgénis 1S Modèles de rédaction Enoncés Produit scalaire & Corrigés Exercice 1 : définition du produit scalaire Soit ABC un triangle tel que AB, AC

Plus en détail

Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes

Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes Zohra Guessoum 1 & Farida Hamrani 2 1 Lab. MSTD, Faculté de mathématique, USTHB, BP n 32, El Alia, Alger, Algérie,zguessoum@usthb.dz

Plus en détail

Résumé du Cours de Statistique Descriptive. Yves Tillé

Résumé du Cours de Statistique Descriptive. Yves Tillé Résumé du Cours de Statistique Descriptive Yves Tillé 15 décembre 2010 2 Objectif et moyens Objectifs du cours Apprendre les principales techniques de statistique descriptive univariée et bivariée. Être

Plus en détail

Small Businesses support Senator Ringuette s bill to limit credit card acceptance fees

Small Businesses support Senator Ringuette s bill to limit credit card acceptance fees For Immediate Release October 10, 2014 Small Businesses support Senator Ringuette s bill to limit credit card acceptance fees The Senate Standing Committee on Banking, Trade, and Commerce resumed hearings

Plus en détail