ANALYSE FACTORIELLE DES CORRESPONDANCES SIMPLES



Documents pareils
II - Notions de probabilité. 19/10/2007 PHYS-F-301 G. Wilquet 1

Semestre : 4 Module : Méthodes Quantitatives III Elément : Mathématiques Financières Enseignant : Mme BENOMAR

LE PRINCIPE DU RAISONNEMENT PAR RÉCURRENCE

Coefficient de partage

SYSTEME FERME EN REACTION CHIMIQUE

" BIOSTATISTIQUE - 1 "

CHAPITRE 6 : LE BIEN-ETRE. Durée : Objectif spécifique : Résumé : I. L agrégation des préférences. Cerner la notion de bien-être et sa mesure.

L Analyse Factorielle des Correspondances

Ressources pour le lycée général et technologique

Incertitudes expérimentales

Conception d un outil décisionnel pour la gestion de la relation client dans un site de e-commerce

Application de la théorie des valeurs extrêmes en assurance automobile

Conception d un outil décisionnel pour la gestion de la relation client dans un site de e-commerce

COURS DE MATHEMATIQUE FINANCIERE A COURT ET LONG TERME Promotion : Première année de graduat

Mesure avec une règle

Une méthode alternative de provisionnement stochastique en Assurance Non Vie : Les Modèles Additifs Généralisés

GEA I Mathématiques nancières Poly. de révision. Lionel Darondeau

Module 3 : Inversion de matrices

UNIVERSITE MONTESQUIEU BORDEAUX IV. Année universitaire Semestre 2. Prévisions Financières. Travaux Dirigés - Séances n 4

Les sinistres graves en assurance automobile : Une nouvelle approche par la théorie des valeurs extrêmes

Mathématiques Financières : l essentiel Les 10 formules incontournables (Fin de période)

Statistique descriptive bidimensionnelle

Exo7. Déterminants. = 4(b + c)(c + a)(a + b). c + a c + b 2c Correction. b + a 2b b + c. Exercice 2 ** X a b c a X c b b c X a c b a X

Les jeunes économistes

Groupe orthogonal d'un espace vectoriel euclidien de dimension 2, de dimension 3

OBLIGATION DU SECTEUR PRIVE : EVALUATION ET OUTIL DE GESTION DU RISQUE DE TAUX D INTERET

Polynésie Septembre Exercice On peut traiter la question 4 sans avoir traité les questions précédentes.

Remboursement d un emprunt par annuités constantes

SÉRIES STATISTIQUES À DEUX VARIABLES

Le Sphinx. Enquêtes, Sondages. Analyse de données. Internet :

Chapitre 3 : Fonctions d une variable réelle (1)

1 Mesure et intégrale

Interface OneNote 2013

EXERCICES : DÉNOMBREMENT

Limites des Suites numériques

Intégration et probabilités ENS Paris, TD (20)13 Lois des grands nombres, théorème central limite. Corrigé :

Comportement d'une suite

BUREAU D'APPLICATION DES METHODES STATISTIQUES ET INFORMATIQUES

Statistiques appliquées à la gestion Cours d analyse de donnés Master 1

[ édité le 10 juillet 2014 Enoncés 1. Exercice 6 [ ] [correction] Si n est un entier 2, le rationnel H n =

FEUILLE D EXERCICES 17 - PROBABILITÉS SUR UN UNIVERS FINI

Soutenue publiquement le Mardi 04/Mai/2010 MEMBRES DU JURY

Montage émetteur commun

Initiation à l analyse factorielle des correspondances

Université de Bordeaux - Master MIMSE - 2ème année. Scoring. Marie Chavent machaven/

Plan. Gestion des stocks. Les opérations de gestions des stocks. Les opérations de gestions des stocks

MÉTHODES DE SONDAGES UTILISÉES DANS LES PROGRAMMES D ÉVALUATIONS DES ÉLÈVES

Dénombrement. Introduction. 1 Cardinaux d'ensembles nis. ECE3 Lycée Carnot. 12 novembre Quelques dénitions

Assurance maladie et aléa de moralité ex-ante : L incidence de l hétérogénéité de la perte sanitaire

c. Calcul pour une évolution d une proportion entre deux années non consécutives

20. Algorithmique & Mathématiques

STATISTIQUE AVEC EXCEL

Généralités sur les fonctions 1ES

Exercice I ( non spé ) 1/ u 1 = u / Soit P la propriété : u n + 4. > 0 pour n 1. P est vraie au rang 1 car u 1

LE RÉGIME DE RETRAITE DU PERSONNEL CANADIEN DE LA CANADA-VIE (le «régime») INFORMATION IMPORTANTE CONCERNANT LE RECOURS COLLECTIF

Les Nombres Parfaits.

GENESIS - Generalized System for Imputation Simulations (Système généralisé pour simuler l imputation)

GIN FA INSTRUMENTATION P Breuil

Chapitre 3 : Transistor bipolaire à jonction

TD 1. Statistiques à une variable.

BTS GPN 2EME ANNEE-MATHEMATIQUES-MATHS FINANCIERES MATHEMATIQUES FINANCIERES

Consolidation. C r é e r un nouveau classeur. Créer un groupe de travail. Saisir des données dans un groupe

Dirigeant de SAS : Laisser le choix du statut social

. (b) Si (u n ) est une suite géométrique de raison q, q 1, on obtient : N N, S N = 1 qn+1. n+1 1 S N = 1 1

Statistique Numérique et Analyse des Données

Processus et martingales en temps continu

Calcul de tableaux d amortissement

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

Université Victor Segalen Bordeaux 2 Institut de Santé Publique, d Épidémiologie et de Développement (ISPED) Campus Numérique SEME

Estimation des incertitudes sur les erreurs de mesure.

Formation d un ester à partir d un acide et d un alcool

TRANSFERT DE CHARGE DANS UN RÉSEAU DE PROCESSEURS TOTALEMENT CONNECTÉS (*) par Maryse BÉGUIN ( 1 )

Q x2 = 1 2. est dans l ensemble plus grand des rationnels Q. Continuons ainsi, l équation x 2 = 1 2

Baccalauréat S Asie 19 juin 2014 Corrigé

capital en fin d'année 1 C 0 + T C 0 = C 0 (1 + T) = C 0 r en posant r = 1 + T 2 C 0 r + C 0 r T = C 0 r (1 + T) = C 0 r 2 3 C 0 r 3...

Gérer les applications

Dénombrement. Chapitre Enoncés des exercices

Chap. 5 : Les intérêts (Les calculs financiers)

II LES PROPRIETES DES ESTIMATEURS MCO 1. Rappel : M1 LA REGRESSION : HYPOTHESES ET TESTS Avril 2009

MUTUELLE D&O MUTUELLE D&O. Copilote de votre santé. AGECFA-Voyageurs CARCEPT CARCEPT-Prévoyance CRC CRIS CRPB-AFB

Examen final pour Conseiller financier / conseillère financière avec brevet fédéral. Recueil de formules. Auteur: Iwan Brot

Le marché du café peut être segmenté en fonction de deux modes de production principaux : la torréfaction et la fabrication de café soluble.

LES ÉCLIPSES. Éclipser signifie «cacher». Vus depuis la Terre, deux corps célestes peuvent être éclipsés : la Lune et le Soleil.

x +1 + ln. Donner la valeur exacte affichée par cet algorithme lorsque l utilisateur entre la valeur n =3.

santé Les arrêts de travail des séniors en emploi

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation

2 ième partie : MATHÉMATIQUES FINANCIÈRES

1.0 Probabilité vs statistique Expérience aléatoire et espace échantillonnal Événement...2

La France, à l écoute des entreprises innovantes, propose le meilleur crédit d impôt recherche d Europe

Terminal numérique TM 13 raccordé aux installations Integral 33

Etude Spéciale SCORING : UN GRAND PAS EN AVANT POUR LE MICROCRÉDIT?

Contrats prévoyance des TNS : Clarifier les règles pour sécuriser les prestations

Statistique Descriptive Multidimensionnelle. (pour les nuls)

Séries réelles ou complexes

Tableaux Croisés et Diagrammes en Mosaïque : Pour Voir Les Probabilités Marginales et Conditionnelles.

COMPARAISON DE MÉTHODES POUR LA CORRECTION

Les prix quotidiens de clôture des échanges de quotas EUA et de crédits CER sont fournis par ICE Futures Europe

1 Introduction. 2 Définitions des sources de tension et de courant : Cours. Date : A2 Analyser le système Conversion statique de l énergie. 2 h.

Dérivation : Résumé de cours et méthodes

Le chef d entreprise développe les services funéraires de l entreprise, en

Transcription:

ANALYSE DES DONNÉES TEST DU KHI-DEUX ANALYSE FACTORIELLE DES CORRESPONDANCES SIMPLES Perre-Lous Gozalez

Mesure de la laso etre deux varables qualtatves Kh deux Equête : Êtes-vous «pas du tout d accord» () «pas tellemet d accord» () «peut-être d accord» (3) «be d accord» (4) «etèremet d accord» (5) avec cette phrase? : «O e a assez de ceux qu bloquet la ve du pays par leurs revedcatos». Tedace poltque 3 4 5 TOTAL Extrême gauche 0 0 4 Gauche 34 0 94 8 60 47 Cetre 7 58 85 6 54 Drote 5 7 49 85 48 34 Extrême drote 0 3 9 4 Idéret 5 5 5 63 55 09 No-répose 7 4 5 55 45 93 Kh-deux = 39,48 d.d.l. = 4 Proba =.0-53

Exste-t-l u le etre les réposes et la tedace poltque? Tableau des prols lges Tedace poltque 3 4 5 TOTAL Extrême gauche 74 7 0 43 7 000 Gauche 84 6 99 74 7 000 Cetre 87 06 8 335 44 000 Drote 6 86 56 7 47 000 Extrême drote 7 7 0 4 643 000 Idéret 8 0 44 30 63 000 No-répose 88 4 69 85 33 000

DIAGRAMME EN BATONS 400 300 00.......................................................... No répose Idéret Extrême drote Drote Cetre Gauche Extrême gauche 00 0 Accord -- Accord -- Accord = Accord + Accord + REPRESENTATION GRAPHIQUE DES COLONNES

TEST DU KHI-DEUX Il s agt de tester l dépedace de deux varables qualtatves. Y a-t-l dépedace etre : la catégore socoproessoelle et le vote à l électo présdetelle? le veau d études et les ouraux lus?. Tableau de cotgece Crosemet de deux varables qualtatves I et J à p et q modaltés. q p q = = p = = p q = = = (total lge) (total coloe) (total)

. Prols lges - prols-coloes - prols margaux Prol lge : O dvse chaque terme de la lge par l eect de la lge...... q Prol margal correspodat : J...... q S les deux varables qualtatves I et J étaet dépedates, les prolslges seraet tous detques, et doc detques au prol margal correspodat. = =

Remarques O pouvat établr la relato précédete e rasoat sur les prolscoloes. Souvet cette relato est exprmée = avec = et = = Elle exprme claremet que das le cas de l dépedace le tableau de cotgece est etèremet détermé par ses marges.

3. Déto du Kh-deux Pour chaque case, o peut doc calculer le ombre de cas attedus (sous hypothèse d dépedace) = O peut comparer les ombres de cas attedus E aux ombres observés. χ χ = = p = p = q = q = ( E) E 4. Test S les deux varables sot réellemet dépedates, cette expresso sut ue dstrbuto du Kh-deux avec u ombre de degrés de lberté égal à : ( p ) ( q ) Das ue table o lt χ α,k valeur ayat ue probablté pour ue dstrbuto du kh-deux avec k= ( p ) ( q ) lberté. α d être dépassée degrés de S S χ χ,k o accepte H0 : dépedace χ α >,k o reette H0. χ α

Remarque : test du kh-deux Les logcels statstques proposet la présetato suvate : calcul du χ assocé au tableau de cotgece oté χ. obs probablté pour ue v.a. suvat ue lo du kh-deux à ( ) ( ) p q d.d.l. de dépasser χ obs. Prob χ [ ( )( ) χ ] p q > obs χ obs S cette probablté est able (e gééral < 5 %), o reette l hypothèse d dépedace etre les deux varables qualtatves.

5. Autres coecets Du χ d assocato. assocé à u tableau de cotgece, o dédut d autres mesures Coecet de cotgece x + x φ de Pearso φ = x Coecet de Tschuprow T = φ p q où p et q = ombre de modaltés des varables Ce coecet comprs etre 0 et est e at l aalogue d u coecet de corrélato. T = laso octoelle récproque Coecet de Cramer C = I, ( p q ) φ

L aalyse des correspodaces smples (A.F.C.) Méthode proposée par J.P. Bezecr das le but d étuder la laso dte ecore correspodace etre deux varables qualtatves. Exemple : répartto des habtats de Pars selo leur leu d habtato : u des 80 quarters et leur C.S.P. Questos : Certas quarters sot-ls proches? au ses même répartto des C.S.P.? Certaes C.S.P. sot-telles proches? Certaes C.S.P. sot-elles plus souvet assocées à certas quarters? L aalyse des correspodaces trate des tableaux de cotgece.

I. NOTATIONS ET PRÉSENTATION ) Notatos : tableau de cotgece : N Crosemet de deux varables qualtatves à p et q modaltés p q Var I Var J ( ) = N pq, p Prols des lges = prol de la lge oté q q...... q Prols des coloes prol de la coloe oté c p p

) Représetato des prols a) Les prols-lges Les prols lges sot cosdérés comme des dvdus. Les p prols-lges ormet u uage de p pots das R q A chaque prol-lge est assocé u pods égal à sa réquece margale. O ote NI ( ) le uage de pots ormé des prols-lges podérés : ( ; ) prol lge pods Le cetre de gravté g est dé par : p g = = La ème coordoée de g vaut E eet : p = = p = = Doc g = prol margal de la varable J (à q modaltés) g = J 3

b) Les prols-coloes ( ) = uage de pots ormé des q prols - coloes podérés ( c, ) NJ Le cetre de gravté g c est le prol margal de la varable I à p modaltés. g c = I 4

Le problème qu se pose est l étude de la dépedace etre les deux varables qualtatves. Das le cas où les deux varables sot dépedates, o a detté des prols : = prol - lge ( ) ( ) = prol - coloe = Das le cas de l dépedace, le uage des prols-lges se rédut à u pot g De même, le uage des prols-coloes se rédut à u pot g c. L étude de la dépedace cosste à étuder la orme des uages. Problème d aalyse e composates prcpales. Quelle métrque? Remarque Remarquos que les prols ayat pour somme, les p prols-lges sot e réalté stués das le sous-espace de dmeso q dé par q x = (avec x 0). = De même pour les q prols-coloes. 5

Métrque du χ a) Pour les prols lges : d χ ( ), q = = Justcatos : Doe u pods mportat aux déreces portat sur les petts pourcetages. Vére le prcpe d équvalece dstrbutoelle : s deux coloes ot le même prol, o les réut e ue seule d eect somme sas moder les dstaces etre prolslges. b) Pour les prols-coloes : d χ ( c, c ) p = = 6

Exemple de calcul de la dstace etre deux prols-lges Dstace du χ : d ( EXPA,LICS ) = ( 0566. 055. ) +... +... +... 0. 59 drot SCEC + + LETT + SCIE 0 005 07 0 890. MEDD PHAR PLUR 0. 057 IUT + (.. ) +... +...+ ( 035. 0. 06) cotrbuto das le calcul de la dstace du pour MEDD pour IUT : 0,30 : 0,33 χ avec la dstace eucldee usuelle : pour MEDD pour IUT : 0,06 : 0,0076 la cotrbuto d IUT aurat été trop able : E eet :,35 % des ls d EXPA vot à l IUT au leu de 5,7 % pour l esemble de la populato (sot le double),6 % des eats de LICS vot à l IUT au leu de 5,7 % populato etère 7

Ierte du uage N(I) I NI ( ) l erte du uage NI ( ) calculée par rapport au cetre de gravté vaut J χ où χ = Kh-deux assocé au tableau de cotgece étudé. E eet : I p NI χ = () = d (, J ) p = q = = p q = = = p q = = = = p = = χ q = Remarque : o obtet le même résultat pour l erte du uage NJ ( ). 8

II. L ANALYSE EN COMPOSANTES PRINCIPALES DU NUAGE DES PROFILS-LIGNES, DES PROFILS- COLONNES. O réalse l A.C.P. du uage des prols-lges : Les prols-lges ouet le rôle d dvdus ; ls sot aectés des pods La métrque utlsée pour le calcul des dstaces etre dvdus est la métrque du kh-deux. Le premer axe prcpal du uage des prols-lges est la drote passat le plus près possble de l esemble des pots de N( I. ) Notos a la premère composate prcpale a =... coordoées des p prols-lges sur l'axe Notos λ la varace de a (égale à l erte portée par l axe qu lu est assocé). a = deuxème composate prcpale de varace λ a 3 = trosème composate prcpale de varace λ 3 9

. O peut égalemet réalser l A.C.P. du uage des prolscoloes aectés des pods e utlsat la métrque du χ. Notos b la premère composate prcpale b =... coordoées des q prols-coloes sur l'axe b = deuxème composate prcpale Les composates prcpales de l A.C.P. des prols-coloes sot assocées aux mêmes valeurs propres que les composates prcpales de l A.C.P. des prols-lges. b a pour varace λ b a pour varace λ..... 0

3. Le etre les deux aalyses : ormules de trasto (deuxème orme) E otat b et a les ème et ème coordoées des composates prcpales b et a assocées à la même valeur propre λ : λ b = p = a λ a = q = b avec a = a a a p... b = b b b... q À λ près, la coordoée d ue modalté d ue varable est la moyee des coordoées des catégores de l autre varable podérées par les réqueces codtoelles du prol de.

III. REPRÉSENTATIONS GRAPHIQUES A.F.C. Dvers types de représetatos sot possbles :. Les modaltés de la varable I sot représetées e tat qu dvdus (prols-lges) de l A.C.P. des prols-lges. La modalté de la varable I a pour coordoées das u espace de dmeso k : k ( a, a,..., a ) avec a a ème = coordoée du vecteur a ème = coordoée du vecteur a... Pour les modaltés de la varable J, la modalté a pour coordoées : k ( λ b, λ b,... λk b ) b b ème = coordoée du vecteur b ème = coordoée du vecteur b Les modaltés du deuxème groupe ( J ) sot les barycetres des modaltés du premer groupe (varable I). (vor ormules de trasto)

. Même prcpe mas e versat les rôles des deux groupes de modaltés. 3. Abado du prcpe barycetrque Les modaltés de chaque esemble sot représetées par les : a b k k =... p =... q Cette derère soluto est la plus pratque (be que les deux groupes de modaltés se trouvet e réalté das des espaces dérets). Cette représetato permet de détermer les proxmtés etre certas élémets de I et certas élémets de J (compte teu de la qualté de la représetato). 3

4. Ades à l terprétato : detques à celles de l A.C.P. a) Cotrbutos de la lge à l axe k ( a ) k λ k avec = de la coloe à l axe k ( a ) λ k k avec = b) Cosus carrés Modalté représetée sur l axe k d ( a ) k (, G) Modalté représetée sur l axe k d ( b ) k (, G) 4

c) Aspects pratques de l terprétato L terprétato peut se are à partr des représetatos graphques (e s assurat de la qualté de représetato de chaque modalté à l ade des cos ). Quad le ombre de modaltés est élevé, l est cosellé d édter d abord le graphque des prols-lges, pus celu des prolscoloes, e la représetato smultaée. Les prols ayat des pods dérets la lecture de leurs cotrbutos à l erte de chaque axe s avère très utle. O peut repérer les prols dot la cotrbuto est supéreure au pods 5