Saisir dans EXCEL les résultats du bac comme dans le tableau suivant (cf. figure n 1).



Documents pareils
EXCEL PERFECTIONNEMENT CALCULS AVANCES

Guide d'utilisation. OpenOffice Calc. AUTEUR INITIAL : VINCENT MEUNIER Publié sous licence Creative Commons

Cours Excel : les bases (bases, texte)

EXCEL PERFECTIONNEMENT SERVICE INFORMATIQUE. Version /11/05

La Clé informatique. Formation Excel XP Aide-mémoire

POUR ALLER UN PEU PLUS LOIN SUR UN TABLEUR. Version EXCEL

INSERER DES OBJETS - LE RUBAN INSERTION... 3 TABLEAUX

Modèle de calcul des paramètres économiques

LibreOffice Calc : introduction aux tableaux croisés dynamiques

TD3 - Facturation avec archivage automatisé

Parcours FOAD Formation EXCEL 2010

Date M.P Libellé Catégorie S.Catégorie Crédit Débit Solde S.B

Logiciel XLSTAT version rue Damrémont PARIS

SOMMAIRE. Travailler avec les requêtes... 3

Traitement des données avec Microsoft EXCEL 2010

RÉALISATION DE GRAPHIQUES AVEC OPENOFFICE.ORG 2.3

C est quoi un tableur?

COPIER, COUPER, COLLER, SELECTIONNER, ENREGISTRER.

Évaluation des compétences. Identification du contenu des évaluations. Septembre 2014

Traitement de texte : Quelques rappels de quelques notions de base

T de Student Khi-deux Corrélation

BML Informatique Tableur OpenOffice.org Calc Mercredi 8 avril 2015

Comptabilité - USR. Logiciel : Comptabilité USR - Version 2,16 Documentation réalisée par JJ Gorge Trésorier Tir à l'arc le 04/04/ / 15

TABLEAU CROISE DYNAMIQUE

COURS BARDON - EXCEL 2010

les Formulaires / Sous-Formulaires Présentation Créer un formulaire à partir d une table...3

1. Introduction Création d'une macro autonome Exécuter la macro pas à pas Modifier une macro... 5

Valeur cible et solveur. Les calculs effectués habituellement avec Excel utilisent des valeurs numériques qui constituent les données d'un problème.

Comment mettre en page votre livre

Table des matières A. Introduction... 4 B. Principes généraux... 5 C. Exemple de formule (à réaliser) :... 7 D. Exercice pour réaliser une facture

SRAL Saint Raphaël. Maison des associations 213, rue de la Soleillette Saint Raphaël. : : dromain.jean-pierre@neuf.

Université Ibn Zohr Excel Résume de cours

A - Créer une Base de données au format dbase

Importation des données dans Open Office Base

Exploitation des données issues de BE ( utilisation du tableur CALC) Fiche de travail (individuelle ou en binôme)

TESTS D'HYPOTHESES Etude d'un exemple

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Programme d Accès Communautaire / Atelier 4 Initiation à Microsoft Excel PLAN DE COURS 3 MICROSOFT EXCEL 4 LANCER EXCEL 4

MAÎTRISE DE L ENVIRONNEMENT WINDOWS VISTA

Créer une base de données

GUIDE Excel (version débutante) Version 2013

Astuces_Générales1_excel.doc - bitsch.gerard@orange.fr VERTOU Page : 1 / 29

TUTORIAL REUTERS. Utilisation de l'utilitaire de recherche Reuters

Affectation standard Affectation modifiée (exemple)

Sage Start Saisie des collaborateurs Instructions. A partir de la version

Gérer ses impressions en ligne

"! "#$ $ $ ""! %#& """! '& ( ")! )*+

Tous les autres noms de produits ou appellations sont des marques déposées ou des noms commerciaux appartenant à leurs propriétaires respectifs.

Débuter avec Excel. Excel

RapidMiner. Data Mining. 1 Introduction. 2 Prise en main. Master Maths Finances 2010/ Présentation. 1.2 Ressources

Université Bordeaux 1. Formation Excel Initiation. Hanquiez Vincent, UMR 5805-EPOC

GESTION DES BONS DE COMMANDE

Alain DI MAGGIO Mise à jour sur le site 11/01/10

Saisissez le login et le mot de passe (attention aux minuscules et majuscules) qui vous ont

Automatisation d'une Facture 4. Liste Déroulante Remises Case à cocher Calculs

Formation tableur niveau 1 (Excel 2013)

Perfectionnement Excel 2007

Saisir et traiter les engagements de coûts

EXCEL TUTORIEL 2012/2013

ASSOCIATION NATIONALE D'ASSISTANCE ADMINISTRATIVE ET FISCALE DES AVOCATS

Initiation à Excel. Frédéric Gava (MCF)

Onglet sécurité de Windows XP Pro et XP Home

Une variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants)

Dans la série. présentés par le site FRAMASOFT

1 CRÉER UN TABLEAU. IADE Outils et Méthodes de gestion de l information

Microsoft Excel. Tableur

Utiliser Access ou Excel pour gérer vos données

A.-M. Cubat PMB - Import de notices à partir d un tableur Page 1 Source :

Comment bien démarrer avec. NetAirClub GUIDE ADMINISTRATEUR V1.5. Table des matières

Module 5 : Lier des classeurs

Le générateur d'activités

Création d un site web avec Nvu

Créer un tableau avec LibreOffice / Calc

TD de supervision. J.P. Chemla. Polytech Tours Département productique 2ème année

Le cas «BOURSE» annexe

Importer les fichiers élèves - professeurs du secrétariat

TABLE DES MATIERES 1 PRÉSENTATION...1

TABLEAU CROISE DYNAMIQUE

Transférer et enregistrer les photos sur l'ordinateur


Mémo d'utilisation de BD Dico1.6

Support de Cours Formation de base

Note de cours. Introduction à Excel 2007

Progression secrétariat

La correction des erreurs d'enregistrement et de traitement comptables

Excel avancé. Frédéric Gava (MCF)

Le cas «BOURSE» annexe

COURS HOMOLOGUE ECDL/PCIE EXCEL 2013

Utiliser les supports d'exemplaires

Trajet d'une recette payée par un tiers (2)

Chaque ordinateur est constitué de différentes unités de stockage de données (Disque dur, Graveur ) que l on peut imaginer comme de grandes armoires.

MODE D'EMPLOI DE LA CALCULATRICE POUR LES COURTS SÉJOURS DANS L'ESPACE SCHENGEN

SAP BusinessObjects Web Intelligence (WebI) BI 4

F7n COUP DE BOURSE, NOMBRE DÉRIVÉ

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1

CAP BOX Note utilisateurs

Transcription:

TP n 2 - Calcul du Khi2 Le but de ce TP est de réaliser, à l'aide d'excel, un modèle réutilisable d'analyse bivarié entre des variables qualitatives. Ce modèle permet d aller de la saisie dans un tableau à double entrée, appelé tableau croisé ou table de contingence, jusqu au calcul du degré de liaison (par la méthode du χ 2, pour des échantillons indépendants), en passant par les tableaux de pourcentages. Les tableaux présentés ici ont un maximum de cinq lignes et de cinq colonnes. La plupart des manipulations et tableaux proposés ici sont issus d'excel4 pour Mac (les adapter à EXCEL5 ou plus si nécessaire). Une refonte Office 2007 est en cours. 1 La table de contingence Nous prendrons ici l'exemple d'un chef d'établissement qui cherche à savoir qui, des filles ou des garçons, réussit le mieux au bac. Pour chaque élève, il connaît son sexe (Garçons ou Filles) et son résultat (Réussite ou Échec) au bac. Dans le cas présent, les deux variables sont qualitatives, nominales, dichotomiques et repérées. La variable sexe est explicative et la variable résultats est expliquée. Saisir dans EXCEL les résultats du bac comme dans le tableau suivant (cf. figure n 1). Vous vous inspirerez de cette figure pour présenter votre table de contingence. Figure n 1 En face de la rubrique total, il faut effectuer la somme modalité par modalité. C'est le calcul des distributions marginales. Pour le total de la ligne 15 (Total colonnes), il faut d'abord se placer en C15. V. GODARD 1 Enq-TP2-Calcul du Khi2

Il est possible de calculer la somme des réussites, filles et garçons confondus, comme indiqué cidessous : =SOMME(C10:C14) - Toutefois, afin d'éviter de remplir de zéro les cellules totalisatrices qui font faces aux modalités non utilisées, il est préférable d'ajouter un test : =SI(C10="";"";SOMME(C10:C14)) La fonction SI() teste d'abord si la cellule C10 est égale à rien (""), dans ce cas elle n'affiche rien (""), sinon elle inscrit la somme. - Ensuite vous recopierez la formule de C15 en G15 pour compléter cette ligne. - Rappel : pour recopier faire un cliquer-glisser de C15 en G15, puis un recopier à droite (CTRL + D) Pour le total de la colonne H (Total Lignes), vous vous placerez en H10 et calculerez la somme des filles et des garçons, réussites et échecs confondus, sur le même principe : =SI(C10="";"";SOMME(C10:G10)) - Ensuite vous recopierez votre formule de H10 en H15 pour compléter cette ligne. En H15, vous avez maintenant également le total général calculé sur la ligne 15. On pourrait tout aussi bien le calculer sur la colonne H. Comme il n'y a pas le même nombre de filles que de garçons, il est difficile de savoir qui réussit le mieux. Nous allons analyser les résultats au bac à l aide des valeurs relatives. 2. Analyse des pourcentages Deux calculs de pourcentages sont possibles, ceux des pourcentages en lignes et ceux des pourcentages en colonnes. Pour ne pas avoir à refaire tout le travail de mise en page (bordures, graisse, centrage, etc.), il est conseillé de sélectionner le tableau de contingence de A7 jusqu'à H15, de le copier, puis de faire un collage standard (CTRL + V) à partir de la cellule A17 (cf. figure n 2). Vous saisirez alors un nouveau titre comme "2.1 Pourcentages en lignes" à la place de "Table de contingence", etc. Cependant, pour faciliter les mises à jour automatiques, chaque cellule doit être liée à celle du tableau de contingence. Á savoir : - en A22, à la place de Sexe, vous saisirez =$A$12 - en E18, à la place de Résultats, vous saisirez =$E$8 - en C19, à la place de Réussite, vous saisirez =SI(C9="";"";C9) Cette formule permet de nommer les modalités du tableau des pourcentages à partir de celles du tableau de contingence. Il suffit pour cela de recopier cette formule de C19 en G19. Le test permet de laisser en blanc les modalités non renseignées et de mettre à jour les autres. V. GODARD 2 Enq-TP2-Calcul du Khi2

- en B20, à la place de Garçons, vous saisirez =SI(B10="";"";B10) puis vous recopierez de B20 à B24. A l'écran, dans les cellules, ce sont les mêmes intitulés de variables et de modalités qui apparaissent, mais lorsque l'on clique sur la cellule, on voit, dans la barre des formules, le lien qui effectue les mises à jour automatiques. 2.1 Pourcentage en lignes Ce tableau est destiné à rendre le nombre de filles et de garçons identiques, égale à 100 par exemple. Pour des raisons d'encombrement, le total est ramené de 100 à 1. Ce n'est donc pas vraiment des pourcentages malgré le titre, mais des fréquences. Figure n 2 Il est possible, en C20, de calculer le pourcentage des garçons qui réussissent par rapport à l ensemble des résultats des garçons.(pourcentages en lignes) par : =C10/$H10 mais pour éviter les divisions par zéro lorsque la cellule est vide, il est préférable de saisir : =SI(C10="";"-";C10/$H10) De plus, si des cellules du tableau de contingence sont vides (""), la fonction SI() les remplace, dans le tableau 2.1, par des tirets ("-"). - Recopier cette formule de C20 à G20, comme effectué précédemment. Constater comment la mise à jour des cellules s'est effectuée. - Pour recopier cette formule de C20 à G25, sélectionner la ligne de C20 à G20, puis, sans relâcher, tirer jusqu'en G25 et relâcher. Recopier vers le bas (CTRL + B). V. GODARD 3 Enq-TP2-Calcul du Khi2

On obtient ainsi, non seulement le pourcentage bivarié [Garçons/Réussite (43 p.100), Garçons/Échec (57 p.100), etc.] en ligne, mais aussi le pourcentage en lignes du total des réussites (60 p.100) et des échecs (40 p.100). Le calcul de la somme des pourcentages en lignes, en H20, s'effectue comme suit : =SI(C20="-";"-";SOMME(C20:G20)) Ce test, non indispensable, contrôle que l'on a bien entré des données dans l'extrémité NW du tableau à double entrée, puis fait la somme en lignes. Le total doit être de 1. - Recopier la formule jusqu'en H25. On constate que : - les filles de cet établissement réussissent mieux au bac que les garçons : 69 contre 43 p.100 ; - le taux d'échec des garçons y est supérieur à celui des filles : 57 contre 31 p.100 ; - le taux de réussite global y est supérieur au taux d'échec : 60 contre 40 p.100. S'il y avait indépendance, ces résultats seraient identiques. Que ce passe-t-il si le taux de réussite est identique au taux d'échec? 2.2 Pourcentage en colonnes Pour conserver les liens automatiques avec le tableau de contingence, il suffit maintenant de recopier le tableau 2.1 (cf. figure n 2) moyennant quelques adaptations : - Sélection du tableau 2.1 de A17 jusqu'à H25 ; - Collage standard en A27 ; - Remplacement du titre du tableau 2.1 par "2.2 Pourcentages en colonnes" (cf. figure n 3). Figure n 3 V. GODARD 4 Enq-TP2-Calcul du Khi2

Le pourcentage des garçons qui réussissent sur l'ensemble des réussites (pourcentages en colonnes) se calcule comme suit en C30 : =SI(C10="";"-";C10/C$15) - Recopier de C30 à H30. En H30, on a le pourcentage de garçons par rapport au pourcentage de filles tous résultats confondus. - Pour recopier cette formule de C30 à G34, sélectionner la ligne de C30 à G30, puis, sans relâcher, tirer jusqu'en G34 et relâcher. Recopier vers le bas (CTRL + B). Le calcul de la somme des pourcentages en colonnes, en C35, s'effectue comme suit : =SI(C30="-";"-";SOMME(C30:C34)) Là aussi, le total doit être de 1. - Recopier la formule jusqu'en H35. On constate cette fois-ci que, les garçons qui représentent 35 p.100 de l'effectif contribuent pour : - 25 p.100 des réussites ; - 50 p.100 des échecs. Or, ils étaient supérieurs pour le calcul en lignes!!! La méthode des pourcentages ne permet de raisonner que sur l'axe des 100 p.100. 3 Analyse de l'écart à l'indépendance Rien n'est perdu, il est possible de compléter notre analyse par un autre raisonnement. Nous allons comparer les résultats observés à ceux obtenus s'il y avait indépendance entre le sexe et les résultats au bac. V. GODARD 5 Enq-TP2-Calcul du Khi2

3.1 Les effectifs théoriques (ou calculés) Toujours pour conserver les liens automatiques avec le tableau de contingence, il faut recopier le tableau 2.1 (cf. figure n 2) moyennant quelques adaptations : - Sélection du tableau 2.1 de A17 jusqu'à H25 ; - Collage standard en A37 ; - Remplacement du titre du tableau 2.1 par "3.1 Effectifs théoriques (ou calculés)" (cf. figure n 4). Pour calculer l'effectif théorique de la distribution bivariée des garçons et des filles par rapport à la réussite et à l'échec, il faut tenir compte de la disparité entre le nombre de filles et de garçons. Le calcul théorique de l'effectif d'une case s'effectue de la façon suivante pour l'intersection garçons/réussite : [(Total ligne garçons) * (Total colonne réussite)] / Nb total d'élèves - Cela se traduit en C40 par : =SI(C10="";"-";C$15*$H10/$H$15) - Recopier de C40 à G40. - Pour recopier cette formule de C40 à G44, sélectionner la ligne de C40 à G40, puis, sans relâcher, tirer jusqu'en G44 et relâcher. Recopier vers le bas (CTRL + B). Figure n 4 Il n'est pas indispensable de calculer la somme des pourcentages en colonnes ou en lignes, car en théorie ces sommes sont identiques à celles qui ont été calculées sur les effectifs observés (cf. tableau de contingence, figure n 1). Toutefois, plutôt que de faire un lien de mise à jour automatique avec le tableau croisé, il est préférable de calculer les sommes en lignes et colonnes à titre de contrôle des erreurs. - En C45, le calcul de la somme en colonnes s'effectue comme suit : =SI(C40="-";"-";SOMME(C40:C44)) V. GODARD 6 Enq-TP2-Calcul du Khi2

Le total doit être égal à celui lu en C15. - Recopier la formule jusqu'en H45. Ce total général doit être égal à l'effectif total lu en H15. - En H40, le calcul de la somme en lignes s'effectue comme suit : =SI(C40="-";"-";SOMME(C40:G40)) Le total doit être égal à celui lu en H10. - Recopier la formule jusqu'en H44. Nous allons maintenant calculer l'écart entre l'effectif théorique (calculé) et l'effectif observé. 3.2 Les écarts bruts à l'indépendance Toujours pour conserver les liens automatiques avec le tableau de contingence, il faut recopier le tableau 2.1 (cf. figure n 2) moyennant quelques adaptations : - Sélection du tableau 2.1 de A17 jusqu'à H25 ; - Collage standard en A47 ; - Remplacement du titre du tableau 2.1 par "3.2 Écarts bruts à l'indépendance" (cf. figure n 5). Figure n 5 L'écart entre l'effectif observé dans le tableau de contingence (cf. figure n 1) et l'effectif théorique en cas d'indépendance (cf. figure n 4) se calcule comme suit : - En C50 : =SI(C10="";"-";C10-C40) - Recopier de C50 à G50 ; V. GODARD 7 Enq-TP2-Calcul du Khi2

- Pour recopier cette formule de C50 à G54, sélectionner la ligne de C50 à G50, puis, sans relâcher, tirer jusqu'en G54 et relâcher. Recopier vers le bas (CTRL + B). Lecture des résultats : s'il y avait indépendance entre le résultat et le sexe, - il y aurait 42 garçons qui auraient été reçus au Bac. Il n'ont en réalité été que 30 à être reçus, soit un écart de 12. Il y a donc sous représentation de la réussite des garçons par rapport à l'indépendance. - en revanche, il aurait dû y avoir 78 filles reçues au Bac. Elles ont été en réalité 90, soit là aussi un écart de 12, mais positif cette fois-ci. Il y a donc sur représentation de la réussite des filles par rapport à l'indépendance, etc. On peut donc dire en première lecture, que les filles réussissent autant que les garçons échouent. Les sommes marginales sont calculées pour vérifier qu'il n'y a pas d'erreurs de calcul. - En C55, le calcul de la somme en colonnes s'effectue comme suit : =SI(C50="-";"-";SOMME(C50:C54)) Le total doit être égal à zéro. - Recopier la formule jusqu'en H55. Ce total général n'est pas indispensable, mais doit être égal à zéro. - En H50, le calcul de la somme en lignes s'effectue comme suit : =SI(C50="-";"-";SOMME(C50:G50)) Le total, là aussi, doit être égal à zéro. - Recopier la formule jusqu'en H54. En résumé : - Un résultat positif signifie une sur représentation par rapport à l'indépendance. - Un résultat négatif signifie une sous représentation par rapport à l'indépendance. Bien que ces résultats aillent dans le sens d'une dépendance des résultats au bac (dans ce lycée), par rapport au sexe des élèves, il convient de relativiser les écarts bruts à l'aide des effectifs théoriques attendus. Car, nous avons, par exemple, des écarts bruts identiques de +12 pour l'intersection Garçons/Échec et Filles/Réussite, alors que leurs effectifs théoriques sont respectivement de 28 et 78. Il convient, dès lors, de relativiser ces écarts bruts par l'effectif théorique de chaque case pour apprécier si les garçons échouent plus que les filles ne réussissent, ou au contraire, si les filles réussissent plus que les garçons n'échouent. 3.3 Les écarts pondérés à l'indépendance Toujours pour conserver les liens automatiques avec le tableau de contingence, il faut recopier le tableau 2.1 (cf. figure n 2) moyennant quelques adaptations : V. GODARD 8 Enq-TP2-Calcul du Khi2

- Sélection du tableau 2.1 de A17 jusqu'à H25 ; - Collage standard en A57 ; - Remplacement du titre du tableau 2.1 par "3.3 Écarts pondérés à l'indépendance" (cf. figure n 6). Figure n 6 L'écart pondéré entre l'effectif observé dans le tableau de contingence (cf. figure n 1) et l'effectif théorique en cas d'indépendance (cf. figure n 4) se calcule comme suit : - En C60 : [(Effectif observé) - (Effectif calculé)] / Effectif calculé =SI(C10="";"-";C50/C40) - Recopier de C60 à G60 ; - Pour recopier cette formule de C60 à G64, sélectionner la ligne de C60 à G60, puis, sans relâcher, tirer jusqu'en G64 et relâcher. Recopier vers le bas (CTRL + B). Les sommes marginales ne sont plus calculées. Elles sont mises à blanc. Lecture des résultats : on recherche l'écart pondéré le plus important en positif ou négatif. - c'est l'échec relatif des garçons qui contribue le plus à l'écart globale. C'est lui qui apporte le plus d'information sur le lien entre les deux variables. - la "sur" réussite des filles n'arrive en revanche qu'en dernière position, en terme d'écart, derrière la "sous" réussite des garçons et le "sous" échec des filles. Remarque : si les effectifs théoriques sont faibles (cf. 4.1 et le cours), il faut prendre avec circonspection les écarts pondérés. Ce résultat est plus informatif que celui des écarts bruts. Il complète efficacement l'analyse des pourcentages. Reste à savoir si le degré de liaison entre les deux variables est significatif ou dû au hasard. V. GODARD 9 Enq-TP2-Calcul du Khi2

4. Évaluation globale du lien Il est intéressant d'aller plus loin que la seule analyse des sur ou sous représentations, cellule par cellule, c'est-à-dire d'apprécier l'intensité et le degré de liaison globale du lien qui unit les deux variables étudiées. 4.1 Indice du χ 2 4.1.1 Rappel Comme nous l'avons vu en cours, il s'agit de réaliser un test qui permet d'apprécier si les résultats des filles et des garçons sont, ou ne sont pas, significativement différents, et cela en fonction des écarts observés dans le tableau de contingence. Ce test est réalisé à l'aide d'un indice dû à Karl Pearson (Mathématicien anglais, 1857-1936), dit indice du χ 2 (prononcer "khi deux"), dont le calcul s'effectue de la manière suivante : χ 2 = K k = 1 o i - c i 2 c i avec, o i l'effectif observé et c i l'effectif calculé (théorique). - Son interprétation est fonction du degré de liberté, noté DDL, dont le calcul s'effectue de la manière suivante : DDL = (L - 1) * (C - 1) avec, L le nombre de modalités de la variable en lignes et C le nombre de modalités de la variable en colonnes. - Toutefois le χ 2 n'est significatif que si tous les effectifs calculés sont supérieurs à cinq (c i. 5). Sinon, il est possible dans certains cas d'effectuer une correction (cf. 4.2 Correction de YATES). - Le degré de signification est lu dans une table dite "table de χ 2 " pour le degré de liberté précédemment trouvé. 4.1.2 Calculs intermédiaires Figure n 7 V. GODARD 10 Enq-TP2-Calcul du Khi2

Présentation de la zone de résultats - En A67, vous mettrez le titre comme indiqué à la figure 7. - En E69, vous saisirez la formule qui permet de calculer automatiquement le nombre de degrés de liberté (DDL) : =(NB(C40:C44)-1)*(NB(C40:G40)-1) La fonction NB() recherche le nombre de valeurs numériques (à l'exclusion de tout autre symbole) contenues dans l'ensemble des cellules indiquées entre parenthèses. Vous remarquerez que le nombre de colonnes et de lignes avec des modalités non nulles est recherché sur le tableau des effectifs théoriques. Il est tout à fait possible d'effectuer ce calcul sur le tableau de contingence, celui des effectifs observés. - En D69, vous saisirez le titre qui convient en alignant à droite votre texte, pour améliorer la présentation. Il faut maintenant faire réaliser par EXCEL les calculs intermédiaires nécessaires à l'obtention du χ 2. Sautons quelques lignes avant de positionner les derniers résultats (cf. figure n 7). V. GODARD 11 Enq-TP2-Calcul du Khi2

Toujours pour conserver les liens automatiques avec le tableau de contingence, il faut recopier le tableau 2.1 (cf. figure n 2) moyennant quelques adaptations : - Sélection du tableau 2.1 de A17 jusqu'à H25 ; - Collage standard en A75 ; - Remplacement du titre du tableau 2.1 par "4.1 Calculs intermédiaires du Khi deux (Khi2 par cellules)" (cf. figure n 7). Le calcul du χ 2 correspond à la distance élevée au carré entre l'effectif observé (o i ), lu dans le tableau de contingence, et l'effectif théorique ou calculé (c i ), lu dans le tableau 3.1 des effectifs théoriques. Cette distance élevée au carré est ensuite divisée par l'effectif théorique (c i ). Ces différentes opérations sont effectuées cellule par cellule, puis sommées. Cela correspond, en C78, à la formule suivante : =SI(C10="";"-";(C10-C40)^2/C40) - Recopier la formule jusqu'en G78. - Puis jusqu'en G82, comme vu précédemment. Il faut maintenant réaliser le total par lignes et par colonnes. - Pour les totaux en colonnes, vous commencerez par compléter la cellule C83 comme suit : =SI(C78="-";"-";SOMME(C78:C82)) Puis vous recopierez jusqu'en G83. - Pour les totaux en lignes, vous commencerez par compléter la cellule H78 comme suit : =SI(C78="-";"-";SOMME(C78:G78)) Puis vous recopierez jusqu'en H82. Le χ 2, qui est la somme des lignes ou des colonnes, peut se calculer comme suit, en H83 : =SI(C83="-";"-";SOMME(C83:G83)) Il faut maintenant remplir la zone de résultats laissée libre en E71. Nous savons que le χ 2 ne peut être un test valable que si les effectifs calculés, lus cellule par cellule dans le tableau 3.1, sont tous supérieurs ou égaux à cinq. Il faut donc tester cette condition de la manière suivante : =SI(MIN(C40:G44)<5;"?????";H83) Cela signifie que si EXCEL rencontre, dans le tableau des effectifs théoriques, une cellule dont la valeur est inférieure à cinq, alors il affiche des points d'interrogation, sinon il affiche la valeur du χ 2 lu dans le tableau 4.1, en H83. Que faire si les points d'interrogation apparaissent? V. GODARD 12 Enq-TP2-Calcul du Khi2

Il existe deux solutions : - Soit votre tableau de contingence contient une ou deux variables à plus de deux modalités, alors il faut tenter un regroupement pour les modalités les plus proches et voir si cela entraîne un franchissement de la valeur seuil de cinq pour les effectifs théoriques et ce, sans pour autant faire perdre toute signification au tableau. - Soit votre tableau de contingence est dichotomique (tableau à quatre cases effectivement remplies), alors il faut tenter la correction de YATES. Celle-ci ne sera toutefois valable que si les effectifs calculés, lus cellule par cellule dans le tableau 3.1, sont tous strictement supérieurs à un. 4.1.3 Correction de YATES Uniquement pour les tableaux dichotomiques Toujours pour conserver les liens automatiques avec le tableau de contingence, il faut recopier le tableau 2.1 (cf. figure n 2) moyennant quelques adaptations : - Sélection du tableau 2.1 de A17 jusqu'à H25 ; - Collage standard en A85 ; - Remplacement du titre du tableau 2.1 par "4.2 Corrections de YATES" (cf. figure n 7). La formule du χ 2 modifiée par la correction de YATES est la suivante : χ c 2 = 4 i = 1 o i - c i - 1 2 c i 2 C'est une solution approchée (simple diminution d'une valeur de 1/2 de la distance en valeur absolue o i / c i ) pour laquelle vous trouverez des explications complémentaires en page 94 du livre de Daniel SCHWARTZ (SCHWARTZ (D) - 1991 - Méthodes statistiques à l'usage des médecins et des biologistes. Paris, Flammarion, 3ème éd., 310 p.). - Cette correction est valable quelque soit la taille de l'échantillon mais n'est efficace que dans le cas des petits échantillons avec des effectifs théoriques (c i ) inférieurs à cinq mais supérieurs à un. - Si on n'applique pas cette correction, on risque de conclure à tort à une signification du test dans le cas des petits échantillons. Pour compléter le tableau 4.2, il faut là aussi tester un certain nombre de conditions. Commençons en C88 : =SI(C10="";"";SI($E$69>1;"";SI(ET(MIN($C$40:$G$44)>1;MIN($C$40:$G$44)<5); (ABS(C10-C40)-0,5)^2/C40;""))) Cela signifie que si EXCEL rencontre dans le tableau de contingence une cellule "à blanc", alors il la laisse à blanc, sinon il fait un test où si le degré de liberté lu en $E$69 (référence absolue) est supérieur à un, alors il laisse encore à blanc, sinon il fait un autre test où il faut que les effectifs théoriques, lus dans les cellules du tableau 3.1, soient compris entre un et cinq. Si c'est le cas, il V. GODARD 13 Enq-TP2-Calcul du Khi2

calcule la valeur absolue de la différence entre l'effectif observé et l'effectif théorique, il soustrait 0,5 à cette différence, élève le résultat au carré et divise le tout par l'effectif théorique. Sinon, dans le cas où l'effectif théorique est supérieur à cinq, il laisse à blanc. - Recopier la formule jusqu'en G88. - Puis jusqu'en G92, comme vu précédemment. Il faut maintenant réaliser le total par lignes et par colonnes. - Pour les totaux en colonnes, vous commencerez par compléter la cellule C93 comme suit : =SI(C88="-";"-";SOMME(C88:C92)) Puis vous recopierez jusqu'en G93. - Pour les totaux en lignes, vous commencerez par compléter la cellule H88 comme suit : =SI(C88="-";"-";SOMME(C88:G88)) Puis vous recopierez jusqu'en H92. Le χ c 2 corrigé est la somme des lignes ou des colonnes, peut se calculer comme suit, en H93. Cependant, un certain nombre de tests sont à effectuer pour ne pas remplir inutilement le tableau et la zone de résultats. =SI(E69>1;"tab.>2*2";SI(ET(MIN($C$40:$G$44)>1;MIN($C$40:$G$44)<5); SOMME(C93:G93);SI(MIN($C$40:$G$44)<=1;"ef.théo <1";"Sans objet"))) Cela signifie que si EXCEL rencontre en E69 une valeur du degré de liberté supérieure à un, alors il indique une formule en H93 du genre "tab.>2*2" (tableau non dichotomique), sinon il fait un test où : si les effectifs théoriques, lus dans les cellules du tableau 3.1, sont compris entre un et cinq, alors il fait la somme des totaux en colonnes pour calculer le χ c 2 corrigé, sinon, il refait encore un test où : si les effectifs théoriques sont inférieurs ou égaux à un, il inscrit dans la cellule "ef.théo<=1", sinon, il inscrit "sans objet", nous sommes dans le cas où les effectifs théoriques sont tous supérieurs à cinq. Il faut maintenant que, le cas échéant, la zone de résultats laissée libre en E73 soit remplie automatiquement si la correction de YATES s'applique, ou si un quelconque message doit apparaître. En E73, vous inscrirez simplement : =H93 En F73, il est utile d'ajouter une explication concernant une condition de non application de la correction de Yates. En effet, si dans la fenêtre E73 apparaît "tab.>2*2", il me paraît utile, pour le lecteur, de lui indiquer par une formule du type " donc ne permet pas la correction de Yates" qu'il se trouve dans un cas excluant la correction de Yates. En F73, vous inscrirez le test suivant : =SI(E73="tab.>2*2";" donc ne permet pas la correction de Yates";"") V. GODARD 14 Enq-TP2-Calcul du Khi2

Cela signifie que si EXCEL rencontre en E73 la valeur alphanumérique "tab.>2*2", alors il inscrit en F73 " donc ne permet pas la correction de Yates", sinon il laisse à blanc. Pour conclure, sous forme de rappel, l'intensité du lien global s'évalue de la façon suivante : - Quelque soit la provenance du χ 2, corrigé ou non par Yates, le degré de signification est lu dans une table dite "table de χ 2 " pour la valeur du degré de liberté trouvé en E69. - Avec un χ 2 de 13,19, caractérisant la relation entre les variables sexes des candidats et résultats au bac, la différence est hautement significative (α > 1 p.1 000), même pour un degré de liberté. On rejette donc l'hypothèse nulle qui voudrait que la différence entre les résultats des garçons et ceux des filles ne soit pas significative car seulement imputable à l'erreur d'échantillonnage ou autre. Dans la mesure où l'on a un tableau dichotomique, et uniquement dans ce cas là, il est possible d'affiner le risque d'erreur que l'on prend en affirmant que la différence de résultats entre les sexes est significative. Pour cela on recherche dans la table de l'écart réduit le risque correspondant à : la χ 2. χ 2 = 13,19 = ε = 3,63 3,29 < χ 2 < 3,89 d'où 0,001 < α < 0,000 1 Donc la différence est significative pour un seuil α compris entre 1 p.1 000 et 1 p.10 000. Le directeur est maintenant sûr que le sexe des élèves influence le résultat (test du χ 2 ), que les filles de son établissement réussissent mieux que les garçons et que la réussite est globalement supérieure à l'échec (tableau des pourcentages en lignes), mais aussi que les garçons échouent de manière anormalement élevée (tableau des écarts pondérés). Vous rendrez la feuille de calcul, où seront successivement positionnés les tableaux permettant l'analyse, assortie d'un commentaire d'analyse. Pour cela, vous fournirez une impression des tableaux avec les valeurs et une autre avec les formules dans les cellules (Menu Option, Affichage, puis Formules pour EXCEL4, et Menu Outils, Option, Affichage, puis Formules pour EXCEL5). Les commentaires seront mis en page dans un traitement de texte. Vous indiquerez également le temps passé. Vous rendrez également les tableaux d'analyse concernant Volx assortis d'un commentaire sur l'évolution du bâti entre 1960 et 1990. Choisissez judicieusement la variable indépendante, à mettre en lignes, et la variable dépendante, à mettre en colonnes. Vous m'informerez là aussi du temps passé. V. GODARD 15 Enq-TP2-Calcul du Khi2