ANALYSE DES DONNÉES TEST DU KHI-DEUX ANALYSE FACTORIELLE DES CORRESPONDANCES SIMPLES Perre-Lous Gozalez
Mesure de la laso etre deux varables qualtatves Kh deux Equête : Êtes-vous «pas du tout d accord» () «pas tellemet d accord» () «peut-être d accord» (3) «be d accord» (4) «etèremet d accord» (5) avec cette phrase? : «O e a assez de ceux qu bloquet la ve du pays par leurs revedcatos». Tedace poltque 3 4 5 TOTAL Extrême gauche 0 0 4 Gauche 34 0 94 8 60 47 Cetre 7 58 85 6 54 Drote 5 7 49 85 48 34 Extrême drote 0 3 9 4 Idéret 5 5 5 63 55 09 No-répose 7 4 5 55 45 93 Kh-deux = 39,48 d.d.l. = 4 Proba =.0-53
Exste-t-l u le etre les réposes et la tedace poltque? Tableau des prols lges Tedace poltque 3 4 5 TOTAL Extrême gauche 74 7 0 43 7 000 Gauche 84 6 99 74 7 000 Cetre 87 06 8 335 44 000 Drote 6 86 56 7 47 000 Extrême drote 7 7 0 4 643 000 Idéret 8 0 44 30 63 000 No-répose 88 4 69 85 33 000
DIAGRAMME EN BATONS 400 300 00.......................................................... No répose Idéret Extrême drote Drote Cetre Gauche Extrême gauche 00 0 Accord -- Accord -- Accord = Accord + Accord + REPRESENTATION GRAPHIQUE DES COLONNES
TEST DU KHI-DEUX Il s agt de tester l dépedace de deux varables qualtatves. Y a-t-l dépedace etre : la catégore socoproessoelle et le vote à l électo présdetelle? le veau d études et les ouraux lus?. Tableau de cotgece Crosemet de deux varables qualtatves I et J à p et q modaltés. q p q = = p = = p q = = = (total lge) (total coloe) (total)
. Prols lges - prols-coloes - prols margaux Prol lge : O dvse chaque terme de la lge par l eect de la lge...... q Prol margal correspodat : J...... q S les deux varables qualtatves I et J étaet dépedates, les prolslges seraet tous detques, et doc detques au prol margal correspodat. = =
Remarques O pouvat établr la relato précédete e rasoat sur les prolscoloes. Souvet cette relato est exprmée = avec = et = = Elle exprme claremet que das le cas de l dépedace le tableau de cotgece est etèremet détermé par ses marges.
3. Déto du Kh-deux Pour chaque case, o peut doc calculer le ombre de cas attedus (sous hypothèse d dépedace) = O peut comparer les ombres de cas attedus E aux ombres observés. χ χ = = p = p = q = q = ( E) E 4. Test S les deux varables sot réellemet dépedates, cette expresso sut ue dstrbuto du Kh-deux avec u ombre de degrés de lberté égal à : ( p ) ( q ) Das ue table o lt χ α,k valeur ayat ue probablté pour ue dstrbuto du kh-deux avec k= ( p ) ( q ) lberté. α d être dépassée degrés de S S χ χ,k o accepte H0 : dépedace χ α >,k o reette H0. χ α
Remarque : test du kh-deux Les logcels statstques proposet la présetato suvate : calcul du χ assocé au tableau de cotgece oté χ. obs probablté pour ue v.a. suvat ue lo du kh-deux à ( ) ( ) p q d.d.l. de dépasser χ obs. Prob χ [ ( )( ) χ ] p q > obs χ obs S cette probablté est able (e gééral < 5 %), o reette l hypothèse d dépedace etre les deux varables qualtatves.
5. Autres coecets Du χ d assocato. assocé à u tableau de cotgece, o dédut d autres mesures Coecet de cotgece x + x φ de Pearso φ = x Coecet de Tschuprow T = φ p q où p et q = ombre de modaltés des varables Ce coecet comprs etre 0 et est e at l aalogue d u coecet de corrélato. T = laso octoelle récproque Coecet de Cramer C = I, ( p q ) φ
L aalyse des correspodaces smples (A.F.C.) Méthode proposée par J.P. Bezecr das le but d étuder la laso dte ecore correspodace etre deux varables qualtatves. Exemple : répartto des habtats de Pars selo leur leu d habtato : u des 80 quarters et leur C.S.P. Questos : Certas quarters sot-ls proches? au ses même répartto des C.S.P.? Certaes C.S.P. sot-telles proches? Certaes C.S.P. sot-elles plus souvet assocées à certas quarters? L aalyse des correspodaces trate des tableaux de cotgece.
I. NOTATIONS ET PRÉSENTATION ) Notatos : tableau de cotgece : N Crosemet de deux varables qualtatves à p et q modaltés p q Var I Var J ( ) = N pq, p Prols des lges = prol de la lge oté q q...... q Prols des coloes prol de la coloe oté c p p
) Représetato des prols a) Les prols-lges Les prols lges sot cosdérés comme des dvdus. Les p prols-lges ormet u uage de p pots das R q A chaque prol-lge est assocé u pods égal à sa réquece margale. O ote NI ( ) le uage de pots ormé des prols-lges podérés : ( ; ) prol lge pods Le cetre de gravté g est dé par : p g = = La ème coordoée de g vaut E eet : p = = p = = Doc g = prol margal de la varable J (à q modaltés) g = J 3
b) Les prols-coloes ( ) = uage de pots ormé des q prols - coloes podérés ( c, ) NJ Le cetre de gravté g c est le prol margal de la varable I à p modaltés. g c = I 4
Le problème qu se pose est l étude de la dépedace etre les deux varables qualtatves. Das le cas où les deux varables sot dépedates, o a detté des prols : = prol - lge ( ) ( ) = prol - coloe = Das le cas de l dépedace, le uage des prols-lges se rédut à u pot g De même, le uage des prols-coloes se rédut à u pot g c. L étude de la dépedace cosste à étuder la orme des uages. Problème d aalyse e composates prcpales. Quelle métrque? Remarque Remarquos que les prols ayat pour somme, les p prols-lges sot e réalté stués das le sous-espace de dmeso q dé par q x = (avec x 0). = De même pour les q prols-coloes. 5
Métrque du χ a) Pour les prols lges : d χ ( ), q = = Justcatos : Doe u pods mportat aux déreces portat sur les petts pourcetages. Vére le prcpe d équvalece dstrbutoelle : s deux coloes ot le même prol, o les réut e ue seule d eect somme sas moder les dstaces etre prolslges. b) Pour les prols-coloes : d χ ( c, c ) p = = 6
Exemple de calcul de la dstace etre deux prols-lges Dstace du χ : d ( EXPA,LICS ) = ( 0566. 055. ) +... +... +... 0. 59 drot SCEC + + LETT + SCIE 0 005 07 0 890. MEDD PHAR PLUR 0. 057 IUT + (.. ) +... +...+ ( 035. 0. 06) cotrbuto das le calcul de la dstace du pour MEDD pour IUT : 0,30 : 0,33 χ avec la dstace eucldee usuelle : pour MEDD pour IUT : 0,06 : 0,0076 la cotrbuto d IUT aurat été trop able : E eet :,35 % des ls d EXPA vot à l IUT au leu de 5,7 % pour l esemble de la populato (sot le double),6 % des eats de LICS vot à l IUT au leu de 5,7 % populato etère 7
Ierte du uage N(I) I NI ( ) l erte du uage NI ( ) calculée par rapport au cetre de gravté vaut J χ où χ = Kh-deux assocé au tableau de cotgece étudé. E eet : I p NI χ = () = d (, J ) p = q = = p q = = = p q = = = = p = = χ q = Remarque : o obtet le même résultat pour l erte du uage NJ ( ). 8
II. L ANALYSE EN COMPOSANTES PRINCIPALES DU NUAGE DES PROFILS-LIGNES, DES PROFILS- COLONNES. O réalse l A.C.P. du uage des prols-lges : Les prols-lges ouet le rôle d dvdus ; ls sot aectés des pods La métrque utlsée pour le calcul des dstaces etre dvdus est la métrque du kh-deux. Le premer axe prcpal du uage des prols-lges est la drote passat le plus près possble de l esemble des pots de N( I. ) Notos a la premère composate prcpale a =... coordoées des p prols-lges sur l'axe Notos λ la varace de a (égale à l erte portée par l axe qu lu est assocé). a = deuxème composate prcpale de varace λ a 3 = trosème composate prcpale de varace λ 3 9
. O peut égalemet réalser l A.C.P. du uage des prolscoloes aectés des pods e utlsat la métrque du χ. Notos b la premère composate prcpale b =... coordoées des q prols-coloes sur l'axe b = deuxème composate prcpale Les composates prcpales de l A.C.P. des prols-coloes sot assocées aux mêmes valeurs propres que les composates prcpales de l A.C.P. des prols-lges. b a pour varace λ b a pour varace λ..... 0
3. Le etre les deux aalyses : ormules de trasto (deuxème orme) E otat b et a les ème et ème coordoées des composates prcpales b et a assocées à la même valeur propre λ : λ b = p = a λ a = q = b avec a = a a a p... b = b b b... q À λ près, la coordoée d ue modalté d ue varable est la moyee des coordoées des catégores de l autre varable podérées par les réqueces codtoelles du prol de.
III. REPRÉSENTATIONS GRAPHIQUES A.F.C. Dvers types de représetatos sot possbles :. Les modaltés de la varable I sot représetées e tat qu dvdus (prols-lges) de l A.C.P. des prols-lges. La modalté de la varable I a pour coordoées das u espace de dmeso k : k ( a, a,..., a ) avec a a ème = coordoée du vecteur a ème = coordoée du vecteur a... Pour les modaltés de la varable J, la modalté a pour coordoées : k ( λ b, λ b,... λk b ) b b ème = coordoée du vecteur b ème = coordoée du vecteur b Les modaltés du deuxème groupe ( J ) sot les barycetres des modaltés du premer groupe (varable I). (vor ormules de trasto)
. Même prcpe mas e versat les rôles des deux groupes de modaltés. 3. Abado du prcpe barycetrque Les modaltés de chaque esemble sot représetées par les : a b k k =... p =... q Cette derère soluto est la plus pratque (be que les deux groupes de modaltés se trouvet e réalté das des espaces dérets). Cette représetato permet de détermer les proxmtés etre certas élémets de I et certas élémets de J (compte teu de la qualté de la représetato). 3
4. Ades à l terprétato : detques à celles de l A.C.P. a) Cotrbutos de la lge à l axe k ( a ) k λ k avec = de la coloe à l axe k ( a ) λ k k avec = b) Cosus carrés Modalté représetée sur l axe k d ( a ) k (, G) Modalté représetée sur l axe k d ( b ) k (, G) 4
c) Aspects pratques de l terprétato L terprétato peut se are à partr des représetatos graphques (e s assurat de la qualté de représetato de chaque modalté à l ade des cos ). Quad le ombre de modaltés est élevé, l est cosellé d édter d abord le graphque des prols-lges, pus celu des prolscoloes, e la représetato smultaée. Les prols ayat des pods dérets la lecture de leurs cotrbutos à l erte de chaque axe s avère très utle. O peut repérer les prols dot la cotrbuto est supéreure au pods 5