1. Le khi2 et la mesure des écarts à l indépendance.

Documents pareils
Module 16 : Les fonctions de recherche et de référence

Leçon N 4 : Statistiques à deux variables

Exo7. Calculs de déterminants. Fiche corrigée par Arnaud Bodin. Exercice 1 Calculer les déterminants des matrices suivantes : Exercice 2.

Tout ce que vous n avez jamais voulu savoir sur le χ 2 sans jamais avoir eu envie de le demander

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)

Se Perfectionner à Excel

Manuel d utilisation 26 juin Tâche à effectuer : écrire un algorithme 2

Comment générer des revenus en Affiliation

Quelques précisions concernant les commandes de Ticket Restaurant électronique par fichier Excel

Fonctions de plusieurs variables

Classe de première L

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

Annexe commune aux séries ES, L et S : boîtes et quantiles

Gestion des Factures

Un autre regard sur. Michel R. WALTHER. Directeur général de la Clinique de La Source 52 INSIDE

SERIE 1 Statistique descriptive - Graphiques

III- Raisonnement par récurrence

L analyse boursière avec Scilab

MÉTHODE Investir en bourse avec Isiotrade. " Hier est derrière. Demain est un mystère. Ce qui compte, c est ce que l'on fait dans l instant.

Stratégie d assurance retraite

FONCTION DE DEMANDE : REVENU ET PRIX

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

COMBIEN UN MÉDECIN A-T-IL BESOIN D ARGENT POUR SA RETRAITE?

AC AB. A B C x 1. x + 1. d où. Avec un calcul vu au lycée, on démontre que cette solution admet deux solutions dont une seule nous intéresse : x =

POURQUOI LES ETATS ET LES ENTREPRISES ONT NORMALEMENT UNE TRESORERIE NETTE NEGATIVE OU POURQUOI LES ETATS SONT NORMALEMENT EN «DEFICIT»

I. Introduction. 1. Objectifs. 2. Les options. a. Présentation du problème.

DEVENEZ UN POKER-KILLER AU TEXAS HOLD EM!

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

SPAM POURRIELS POLLUPOSTAGE

Les clients puissance cube

Techniques d interaction dans la visualisation de l information Séminaire DIVA

Probabilités conditionnelles Loi binomiale

avec des nombres entiers

Les Différents types de Requêtes dans Access

Défi SSQ Groupe financier

P1 : Corrigés des exercices

Excel avancé. Frédéric Gava (MCF)

COMMENT GAGNER DE L ARGENT AUX PARIS FOOT

TP de risque management Risque Forex

Taux global d actualisation - Comment analyser une transaction immobilière?

Excel. Identification. Informations sur vos besoins et objectifs. Notions fondamentales. Fiche de validation des besoins en formation Bureautique

Exo7. Probabilité conditionnelle. Exercices : Martine Quinio

Business Intelligence avec Excel, Power BI et Office 365

ETUDE SUR LES STAGIAIRES AYANT SUIVI UNE FORMATION DIPLOMANTE DANS LA BRANCHE DES ACTEURS DU LIEN SOCIAL ET FAMILIAL

Eteindre. les. lumières MATH EN JEAN Mme BACHOC. Elèves de seconde, première et terminale scientifiques :

Microsoft Excel : tables de données

Propriétés des options sur actions

La pratique du coaching en France. Baromètre 2010

Contenu Acomba 9.57 ATELIER 1 VUE D ENSEMBLE DU PROGRAMME ATELIER 3 RAPPORTS ATELIER 2 MODULE COMPTABILITÉ TRANSACTIONS ATELIER 4 MODULE CLIENTS.

Localisation des fonctions

EdIntégral. Module ENCAISSEMENT. Le logiciel d encaissement multifonctions, évolutif et tactile

Mobilité bancaire : des mythes à la réalité 2 milliards d euros de pouvoir d achat économisables. UFC-Que Choisir, 9 décembre 2014

Une dérivation du paradigme de réécriture de multiensembles pour l'architecture de processeur graphique GPU

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

Sommaire Livre blanc CGIDEV2 pour RePeGlio

EXCEL et base de données

Régime à cotisation déterminée. On sait ce qu on met dedans; ce qu on retirera à la retraite dépend du rendement.

intrication quantique corrélations à distance et instantanées

Exercice 6 Associer chaque expression de gauche à sa forme réduite (à droite) :

La Théorie de la relativité des Loyers Par Alain BECHADE

Stratégie simple et efficace pour augmenter officieusement le taux de vos livrets d épargne défiscalisés

Arithmétique binaire. Chapitre. 5.1 Notions Bit Mot

LETTRE-CIRCULAIRE CONCERNANT LES COURS BUREAUTIQUES

La valeur présente (ou actuelle) d une annuité, si elle est constante, est donc aussi calculable par cette fonction : VA = A [(1-1/(1+k) T )/k]

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1

LE BATON D ISHANGO. Une machine à calculer vieille de ans...

La consolidation à une date ultérieure à la date d acquisition

Rappel sur les bases de données

La fonction ET et la fonction OU. La Fonction ET

Direction de la recherche parlementaire

L ABSENCE DE COMPLEMENTAIRE SANTE CHEZ LES ETUDIANTS Résultats d une enquête déclarative

Bases de données documentaires et distribuées Cours NFE04

Guide pratique : Les coûts d emprunt d argent

LISTE D EXERCICES 2 (à la maison)

Santé des TPE face à la crise

Les élasticités-prix de la demande de transport interurbain des personnes. préparé pour. La Commission royale sur le transport des voyageurs au Canada

COURT CIRCUIT 2 à Laon,

UNE EXPERIENCE, EN COURS PREPARATOIRE, POUR FAIRE ORGANISER DE L INFORMATION EN TABLEAU

Utiliser un tableau de données

Quelle est l influence d une réduction des prestations d 1/5, via le crédit-temps et l interruption de carrière, sur le revenu du ménage?

Hedging delta et gamma neutre d un option digitale

UN REVENU QUOI QU IL ARRIVE

Baromètre France générosités- CerPhi Evolution des dons des particuliers et du profil des donateurs & 2011

PRÉSENTÉ PAR : NOVEMBRE 2007

Saisissez le login et le mot de passe (attention aux minuscules et majuscules) qui vous ont

RapidMiner. Data Mining. 1 Introduction. 2 Prise en main. Master Maths Finances 2010/ Présentation. 1.2 Ressources

Le poste de travail, les dossiers et les fichiers

Garth LARCEN, Directeur du Positive Vibe Cafe à Richmond (Etats Unis Virginie)

Atelier Fichier Client

Fonctionnement et procédure Prêt REER-RAP La Capitale

Compte d exploitation Assurance vie collective.

Qui fait quoi sur internet?

LE PERP retraite et protection

SIG ET ANALYSE EXPLORATOIRE

Transcription:

MODULE 6 : Deux variables sont-elles liées? Nous avons vu précédemment comment composer un tableau de contingence, permettant de visualiser l interaction entre deux variables. A priori, vous savez même comment lire ce genre de tableaux, non pas uniquement en comparant ligne par ligne ou colonne par colonne, mais bien en vérifiant si le comportement de chaque cellule est conforme à celui de l ensemble de l échantillon. Mais avant de lire un tableau, il est intéressant de savoir si, en toute rigueur, la distribution de chacune des variables qui y est représentée est due au hasard ou non. Si c est le cas, il n y aura pas d interaction entre les variables. Plus exactement, il y a des risques qu une interprétation ne soit pas possible avec une assez grande fiabilité. Il existe différents tests permettant de s assurer de cette fiabilité et de l interaction entre deux variables, sans même avoir à regarder le tableau dans son ensemble. Le plus célèbre de ces tests porte le nom de «Khi2». Il permet de tester l interaction de deux ou trois variables dans un tableau et donc de savoir s il vaut la peine d être étudié ou bien s il faut essayer de le recomposer différemment. Cela est très pratique lorsqu il y a beaucoup de tableaux à analyser dans une enquête. Imaginez en effet que vous posiez 50 questions dans une enquête. Ces 50 questions débouchent sur un nombre supérieur de variables. Disons 70. Si vous croisez ces 70 variables entre elles (ce qui, reconnaissons-le, n aurait pas toujours du sens), vous obtiendriez 70x70=4900 tableaux! Supprimons tous ceux qui n auraient aucun sens. Vous auriez tout de même plusieurs centaines de tableaux dignes d intérêt. Pour commencer à les trier et à organiser votre travail le test du khi2 est précieux. On l assorti généralement d un autre test, le test de Cramer, qui permet quant à lui de connaître l intensité d une relation entre les variables d un tableau croisé. Pour faire simple, disons que le test du Khi2 permet de savoir si des variables agissent les unes sur les autres, et que le test de Cramer permet de mesurer l intensité de ces effets. Regardons cela dans le détail. 1. Le khi2 et la mesure des écarts à l indépendance. Pour comprendre le test du khi2, il faut imaginer ce qui se passerait dans un tableau de contingence s il ne s y passait rien. Si les deux variables qui y sont exposées étaient totalement indépendantes l une de l autre. Valider le test du khi2 revient à «écarter l hypothèse de l indépendance entre les variables». Examinons cela avec un exemple. 1

TABLEAU 1 tris croisé sentiment de bonheur/niveau de revenus en effectifs situation observée Reprenons notre tableau croisé exposant la relation entre niveau de revenus et sentiment de bonheur. Ce premier tableau correspond à la situation observée dans notre enquête. A quoi ressemblerait ce tableau si rien ne se passait. Pour le savoir, il faut composer un tableau dit «de situation à l indépendance». La plupart des logiciels de traitements statistiques vous proposent de le faire, mais il est assez aisé de le faire soi-même. Faisons cela, car cela permet de bien comprendre la logique du calcul du khi2. Si la variable «niveau de revenus en 3» n agissait pas sur la variable «niveau de bonheur», on devrait observer une distribution de cette dernière analogue dans chacune des lignes de revenus. 2

Prenons la ligne «Jusqu à 1900 euros». Nous avons 271 individus à répartir dans les 4 colonnes de la variable «sentiments de bonheur». Comme nous avons 188 individus au total qui se déclarent «très heureux», pour connaître la répartition probable d en avoir parmi ceux qui gagnent 1900 euros, il faut appliquer la formule mathématique suivante : 188 * 271 / 826. Cela nous donne un effectif de 62. En toute logiques, nous devrions avoir 62 individus se déclarant très heureux parmi ceux qui gagnent jusqu à 1900 euros, au lieu de 44 individus observés. Appliquons cette logique sur l ensemble du tableau. 3

TABLEAU 2 tris croisé sentiment de bonheur/niveau de revenus en effectifs situation à l indépendance On observe des bien des écarts en situation observée et situation à l indépendance au sein de chacune des cellules. Le test du khi2 est une mesure de l ensemble de ces écarts. Afin de mesurer aussi bien les écarts positifs que négatifs, on élève tous ces écarts au carré. 4

TABLEAU 3 tris croisé sentiment de bonheur/niveau de revenus en effectifs écarts à l indépendance élevés au carré 5

Enfin, on rapporte cette différence à l effectif théorique (celui qui correspond l indépendance) de chaque cellule en le divisant. Le tableau obtenu s appelle «tableau des contributions absolues» TABLEAU 4 tris croisé sentiment de bonheur/niveau de revenus en effectifs contributions absolues 6

Le khi2 correspond à l addition de tous ces écarts à l indépendance élevés au carré et divisés par l effectif théorique. Autrement dit, le khi2 est la somme de toutes les cellules de notre tableau. Mettez sur pause, sortez votre calculatrice et additionnez : vous obtiendrez le chiffre de 69. Ce chiffre correspond au «khi2 calculé», soit à la somme des contributions absolues. 7

Je vous indique la formule du khi2 pour plus de clarté, même si tous les logiciels de traitements statistiques vous permettent de le produire en un quart de secondes. 8