Relation entre deux variables : estimation de la corrélation linéaire
|
|
- Alain Fortier
- il y a 9 ans
- Total affichages :
Transcription
1 CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence une éventuelle liaison entre deux variables numériques ; il s agit du coefficient de corrélation qui, grâce à un calcul simple, permet de déterminer s il existe ou non une relation entre deux variables numériques et quelle est l intensité de cette relation. Ainsi, le coefficient de corrélation va révéler (ou non l existence et la force d un lien entre deux séries d observations quantitatives. I. LOGIQUE DE LA CORRÉLATION La corrélation met en évidence un lien entre deux variables. En effet, comme il est précisé dans tous les ouvrages de statistiques, corrélation n est pas causalité. Ceci est très important car cette phrase signifie que l opération statistique effectuée, du fait de son statut descriptif, permet seulement de montrer que les variables entretiennent une relation et pas du tout qu une variable explique ou cause l autre variable. Il est fondamental d insister ici sur l importance à ne pas confondre corrélation et causalité : le fait que deux variables sont corrélées montre simplement qu elles covarient, c est-à-dire que les changements de valeurs de l une sont associés, de manière significative, avec des changements de valeurs de l autre. La corrélation est une statistique descriptive et non inférentielle. Si le but des calculs entrepris est de montrer qu une variable en explique une autre, il faudra alors recourir à des statistiques inférentielles (et notamment aux techniques de régression, pour pouvoir parler de causalité. En outre, la relation mise en évidence par le coefficient de corrélation étudié ciaprès est seulement une relation stochastique linéaire ; ce qui signifie que, si les variables entretiennent un autre type de relation plus complexe, ce lien ne sera pas «détecté» par le coefficient de corrélation. Il faudra alors recourir à d autres types d indices de statistiques. Ainsi, lorsqu un chercheur travaille avec un échantillon représentatif et qu il a calculé un indice de liaison entre deux variables, il est légitime qu il se demande si l indice qu il a obtenu est significatif. Pour cela, il suivra une procédure précise, expliquée dans ce chapitre. 68
2 Par exemple, il est possible grâce au coefficient de corrélation linéaire, de valider les liens suivants : «plus le taux de gaz carbonique en ville est important, plus les jeunes enfants développent des rhinites» ; ou encore : «moins les lapins absorbent de vitamine C, plus ils dorment longtemps», etc. Ce lien est généralement assorti d un graphique le nuage de points qui permet de déterminer à l avance le sens de la relation entre les variables. II. COMMENT CALCULER LE COEFFICIENT DE CORRÉLATION? Le coefficient de corrélation utilisé avec deux variables métriques (i.e., échelles d intervalles est le coefficient de corrélation r de Bravais-Pearson. Dans le cas de variables ordinales, un autre type de coefficient de corrélation est calculé, il s agit du rhô (symbolisé par la lettre grecque ρ de Spearman qui est un coefficient de corrélation par rangs. Ce coefficient fait partie des statistiques dites non paramétriques et sera donc abordé dans le chapitre 10. La formule dite de compréhension (c est-à-dire qui permet de comprendre la logique du calcul du r est la suivante : Σ(x m x Σ(y m y sx sy r = n où x représente les valeurs de la première variable et y celles de la seconde ; m est le symbole de la moyenne, (celui de l écart type et n représente l effectif de la distribution. Si cette formule est développée, en utilisant des lois mathématiques, elle va donner une formule de calcul plus simple et plus rapide : Σxy Σx Σy n r = 0 Σx2 (Σ x 2 n Σy 2 (Σ y 2 n Une autre formule peut également être utilisée pour calculer le coefficient de corrélation : Σ(x m x (y m y r = 0Σ(x m x 2 cσ(y mc y 2 Elle consiste donc à soustraire la moyenne à chacune des valeurs de chaque distribution et à en faire la somme. Si les deux distributions comportent beaucoup de valeurs, les calculs peuvent être longs et fastidieux, c est pourquoi il est conseillé d utiliser la formule de calcul rapide. Enfin, puisque le coefficient de corrélation met en évidence le fait que deux variables varient conjointement, sa formule peut également utiliser celle de la covariance CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire 69
3 et il est alors possible de calculer r en divisant la covariance des deux variables par leurs écarts types qui ont été multipliés : Cov xy r = sx s y Σ(x m x (y m y où Cov xy est égal à : Cov xy = n 1 Et il existe encore d autres formules pour calculer cet indice! Le coefficient de corrélation varie de + 1 à 1: + 1 indique une corrélation positive maximale entre les deux variables, ce qui signifie qu elles varient exactement dans le même sens : plus les valeurs de l une augmentent (ou diminuent, plus les valeurs de l autre augmentent (ou diminuent ; ceci indique une relation fonctionnelle de type linéaire croissante. 1 indique en revanche une très forte corrélation négative ; il signifie cette fois une liaison maximale négative, c est-à-dire que les variables covarient inversement : plus les valeurs de l une augmentent, plus celles de l autre diminuent (et inversement bien sûr ; il s agit cette fois d une relation fonctionnelle de type linéaire décroissante. Une valeur proche de 0 signifie que les deux variables ne varient pas ensemble, en tout cas que la relation qui pourrait éventuellement les unir n est pas linéaire. Ainsi, plus la valeur du coefficient est proche de 1, plus la corrélation entre les deux variables est forte. Pour toute valeur intermédiaire et lorsque l échantillon peut être considéré comme extrait d une population parente (ceci est fondamental, sinon il est impossible de généraliser, même si l indice obtenu est très élevé et/ou significatif, il faut se reporter à la table du r de Bravais-Pearson. Cette table se présente sous forme d un tableau à deux dimensions. Dans la première colonne, se trouvent les valeurs des degrés de liberté, qui correspondent à la taille de l échantillon 2 (ou au nombre de couples 2, ce qui revient évidemment strictement au même et dans la première ligne, le seuil de probabilité α. À l intersection de chaque ligne et de chaque colonne, il est possible de lire les valeurs critiques de r, c est-à-dire les valeurs au dessus desquelles le r calculé est significatif et pour lesquelles la corrélation entre les deux variables est donc significative. Ce qui signifie (et c est là le sens du terme significatif que la corrélation entre les deux variables est différente de zéro au niveau de la population parente. Pour les valeurs éloignées de + 1 ou de 1, la significativité du coefficient va largement dépendre du nombre d individus de l échantillon : plus l échantillon est important, plus une corrélation, même très faible (i.e., r = 0,25 par exemple, pourra être significative. Il faut donc être vigilant quant à l interprétation d une telle relation entre deux variables. En résumé, pour estimer précisément la significativité d un coefficient de corrélation, il suffit de comparer la valeur du r calculé à une valeur r critique, en se reportant à la table des valeurs critiques du r. Pour cela il faut déterminer un seuil de significativité 70
4 (appelé α cf. chapitre 4 qui varie selon les tables entre.20 qui indique 20 chances sur 100 de se tromper et.0001 qui indique une chance sur de se tromper et un degré de liberté ; ce dernier correspond toujours au nombre de couples de l ensemble de la distribution auquel on retire 2. Remarque : les notions relatives à la significativité, au degré de liberté et au seuil à choisir sont des notions fondamentales en statistiques. Elles seront plus amplement présentées dans le chapitre 4 consacré au t de Student et dans le chapitre 6 relatif à l analyse de variance. Par exemple, si chaque variable comprend 20 observations, le degré de liberté (abrégé en ddl sera égal à 20 2 = 18. Dans la table du r de Bravais-Pearson (cf. annexe 1, pour ddl = 18 et α =.05 (qui est un seuil raisonnable, on lit r critique = 0,4439. Cette valeur signifie que le r calculé doit être supérieur ou égal à cette valeur pour être considéré comme significatif, quel que soit son signe (+ ou, avec 5 % de risques de commettre une erreur. Pour un risque d erreur moins élevé, il faut choisir un seuil inférieur, α =.01 (et r critique = 0,5616 ou même α =.001 (et r critique = 0,6789. Ainsi, moins on prend de risques, plus le r calculé doit être important pour pouvoir conclure qu il existe une relation significative entre les deux variables. Si r calculé est strictement inférieur à r critique, au seuil α choisi et à ddl = n 2, il n est pas possible de conclure à une relation entre les deux variables. Si r calculé est supérieur ou égal à r critique, il existe bien une relation entre les deux variables. À ce moment-là, le signe du r calculé va permettre d indiquer le sens de la liaison. Aux valeurs de r sont associés des nuages de points typiques dont les plus fréquents sont présentés dans le paragraphe suivant. III. REPRÉSENTATION GRAPHIQUE DE LA CORRÉLATION Comme cela a été montré dans le chapitre 2, un nuage de points permet de représenter sur le même schéma deux variables quantitatives. L une des variables apparaît en abscisse tandis que l autre est en ordonnée. Un point sur le graphique caractérise un individu, ou plus précisément les valeurs qu il a obtenues pour chacune des deux variables. Lorsque la corrélation est très forte et positive (proche de + 1, le nuage de points, qui a généralement la forme d une ellipse, s étire du bas gauche au haut droit du graphique, comme sur la figure 11 ci-dessous. Ce premier exemple classique, concernant la liaison entre le poids (en kilogrammes et la taille (en centimètres, reprend les mêmes données que celles utilisées dans le chapitre consacré à la présentation des statistiques descriptives, mais augmentées de quelques individus. CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire 71
5 FIGURE 11 Corrélation positive entre le poids et la taille Taille Poids Ce graphique met en évidence que plus le poids augmente, plus la taille augmente (et inversement. Le coefficient de corrélation est ici égal à r =+0, ; il est très proche de + 1 et donc très significatif. Le risque d erreur est très faible, sans doute autour d une chance sur de commettre une erreur en disant qu il existe une relation linéaire positive et significative entre les deux variables ; le seuil α pourrait être égal à Lorsque la corrélation est significative et proche de 1, le nuage de points présente alors une allure inverse : il s étire du haut gauche au bas droit. Par exemple, la relation suivante peut être constatée et représentée graphiquement ci-dessous : moins la température est élevée, plus les personnes absorbent de potage (sans doute pour se réchauffer. Le coefficient de corrélation est cette fois égal à : r = 0, , avec ddl = 30 2 = 28. Là encore, le risque d erreur est extrêmement faible : il existe bien une liaison très forte entre la température et l absorption de potage. FIGURE 12 Relation négative forte entre la température et l absorption de potage Température Entre ces extrêmes, des corrélations non significatives se traduiront par des nuages de points dispersés, ne suivant pas une direction précise, comme dans les exemples cidessous. Litres de potage La première figure montre qu il n existe pas de relation linéaire entre l âge et la taille du gros orteil (r = 0, À ddl = 10 2, le r calculé est toujours inférieur au r lu dans la table de Bravais- Pearson. L arc de cercle pourrait toutefois faire penser à un autre type de relation, éventuellement! 72
6 FIGURE 13 Âge et taille du gros orteil chez dix enfants La seconde figure montre que, contrairement aux idées reçues, il n y a pas de relation entre le salaire perçu, en euros, et le nombre d années passées à étudier après le baccalauréat (même si les diplômes ont été obtenus bien évidemment! : FIGURE 14 Y a-t-il une relation entre le salaire et les diplômes? Salaires (en euros Âge Le coefficient de corrélation est ici égal à : r = 0, , ce qui traduit vraiment une absence très nette de relation entre les deux variables. Il ne faut pas abandonner ses études pour autant! IV. UN EXEMPLE À TRAVERS L ÉTUDE DE LA LECTURE L objectif de la recherche conduite par Rocher et Chanquoy ([2004], «Discrimination et attention visuelle : quel impact sur la reconnaissance de lettres et de mots au cours de la lecture?», Le Langage et l homme : logopédie, psychologie, audiologie, 39 (2, pp , dans une perspective de psychologie du développement, était d examiner, au cours de la lecture, les relations entre les processus visuels perceptifs, les habiletés phonologiques et les compétences des jeunes enfants à reconnaître des lettres et des mots écrits. Pour cela, des épreuves de perception visuelle, verbales et phonologiques ont été proposées à des enfants scolarisés en grande section de maternelle (GSM et en première année d école primaire (CP. Au regard des conceptions théoriques et des études existantes, le but de cette recherche était, entre autres, de rendre compte des relations entre trois domaines de CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire 73
Chapitre 3. Les distributions à deux variables
Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles
Plus en détailStatistique Descriptive Élémentaire
Publications de l Institut de Mathématiques de Toulouse Statistique Descriptive Élémentaire (version de mai 2010) Alain Baccini Institut de Mathématiques de Toulouse UMR CNRS 5219 Université Paul Sabatier
Plus en détailPremiers pas avec SES-Pegase (version 7.0) SES : Un Système Expert pour l analyse Statistique des données. Premiers pas avec SES-Pegase 1
Premiers pas avec SES-Pegase 1 Premiers pas avec SES-Pegase (version 7.0) SES : Un Système Expert pour l analyse Statistique des données www.delta-expert.com Mise à jour : Premiers pas avec SES-Pegase
Plus en détailStatistiques Descriptives à une dimension
I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des
Plus en détailTABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.
STATISTIQUE THÉORIQUE ET APPLIQUÉE Tome 2 Inférence statistique à une et à deux dimensions Pierre Dagnelie TABLE DES MATIÈRES Bruxelles, De Boeck, 2011, 736 p. ISBN 978-2-8041-6336-5 De Boeck Services,
Plus en détail1 Complément sur la projection du nuage des individus
TP 0 : Analyse en composantes principales (II) Le but de ce TP est d approfondir nos connaissances concernant l analyse en composantes principales (ACP). Pour cela, on reprend les notations du précédent
Plus en détailLogiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS
Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence
Plus en détailSeconde Généralités sur les fonctions Exercices. Notion de fonction.
Seconde Généralités sur les fonctions Exercices Notion de fonction. Exercice. Une fonction définie par une formule. On considère la fonction f définie sur R par = x + x. a) Calculer les images de, 0 et
Plus en détailComment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie
Partie I : Séries statistiques descriptives univariées (SSDU) A Introduction Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie et tous sont organisés selon le même
Plus en détailDéroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI
1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage
Plus en détailLa survie nette actuelle à long terme Qualités de sept méthodes d estimation
La survie nette actuelle à long terme Qualités de sept méthodes d estimation PAR Alireza MOGHADDAM TUTEUR : Guy HÉDELIN Laboratoire d Épidémiologie et de Santé publique, EA 80 Faculté de Médecine de Strasbourg
Plus en détailAnalyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés
Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour francour@unice.fr Une grande partie des illustrations viennent
Plus en détailAide-mémoire de statistique appliquée à la biologie
Maxime HERVÉ Aide-mémoire de statistique appliquée à la biologie Construire son étude et analyser les résultats à l aide du logiciel R Version 5(2) (2014) AVANT-PROPOS Les phénomènes biologiques ont cela
Plus en détailTableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1
UN GROUPE D INDIVIDUS Un groupe d individus décrit par une variable qualitative binaire DÉCRIT PAR UNE VARIABLE QUALITATIVE BINAIRE ANALYSER UN SOUS-GROUPE COMPARER UN SOUS-GROUPE À UNE RÉFÉRENCE Mots-clés
Plus en détailt 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :
Terminale STSS 2 012 2 013 Pourcentages Synthèse 1) Définition : Calculer t % d'un nombre, c'est multiplier ce nombre par t 100. 2) Exemples de calcul : a) Calcul d un pourcentage : Un article coûtant
Plus en détailAnnexe commune aux séries ES, L et S : boîtes et quantiles
Annexe commune aux séries ES, L et S : boîtes et quantiles Quantiles En statistique, pour toute série numérique de données à valeurs dans un intervalle I, on définit la fonction quantile Q, de [,1] dans
Plus en détailVision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007
Vision industrielle et télédétection - Détection d ellipses Guillaume Martinez 17 décembre 2007 1 Table des matières 1 Le projet 3 1.1 Objectif................................ 3 1.2 Les choix techniques.........................
Plus en détailINTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES
INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES Dominique LAFFLY Maître de Conférences, Université de Pau Laboratoire Société Environnement Territoire UMR 5603 du CNRS et Université de Pau Domaine
Plus en détailTraitement des données avec Microsoft EXCEL 2010
Traitement des données avec Microsoft EXCEL 2010 Vincent Jalby Septembre 2012 1 Saisie des données Les données collectées sont saisies dans une feuille Excel. Chaque ligne correspond à une observation
Plus en détailLes indices à surplus constant
Les indices à surplus constant Une tentative de généralisation des indices à utilité constante On cherche ici en s inspirant des indices à utilité constante à définir un indice de prix de référence adapté
Plus en détail1 Définition de la non stationnarité
Chapitre 2: La non stationnarité -Testsdedétection Quelques notes de cours (non exhaustives) 1 Définition de la non stationnarité La plupart des séries économiques sont non stationnaires, c est-à-direqueleprocessusquiles
Plus en détailBiostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke
www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3
Plus en détailLA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers
Plus en détailNotion de fonction. Résolution graphique. Fonction affine.
TABLE DES MATIÈRES 1 Notion de fonction. Résolution graphique. Fonction affine. Paul Milan LMA Seconde le 12 décembre 2011 Table des matières 1 Fonction numérique 2 1.1 Introduction.................................
Plus en détailTABLE DES MATIERES. C Exercices complémentaires 42
TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence
Plus en détailL ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ
L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et
Plus en détailMesures et incertitudes
En physique et en chimie, toute grandeur, mesurée ou calculée, est entachée d erreur, ce qui ne l empêche pas d être exploitée pour prendre des décisions. Aujourd hui, la notion d erreur a son vocabulaire
Plus en détailUNE FORMATION POUR APPRENDRE À PRÉSENTER DES DONNÉES CHIFFRÉES : POUR QUI ET POURQUOI? Bénédicte Garnier & Elisabeth Morand
UNE FORMATION POUR APPRENDRE À PRÉSENTER DES DONNÉES CHIFFRÉES : POUR QUI ET POURQUOI? Bénédicte Garnier & Elisabeth Morand Service méthodes statistiques Institut National d Etudes Démographiques (Ined)
Plus en détailComplément d information concernant la fiche de concordance
Sommaire SAMEDI 0 DÉCEMBRE 20 Vous trouverez dans ce dossier les documents correspondants à ce que nous allons travailler aujourd hui : La fiche de concordance pour le DAEU ; Page 2 Un rappel de cours
Plus en détailL allocataire dans un couple : l homme ou la femme?
L allocataire dans un couple : l homme ou la femme? par Alain Jacquot CNAF-Bureau des Prévisions Les CAF versent une trentaine de prestations (prestations familiales stricto sensu, aides au logement, et
Plus en détailTests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique»
Tests de comparaison de moyennes Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Test de Z ou de l écart réduit Le test de Z : comparer des paramètres en testant leurs différences
Plus en détailFORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)
87 FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc) Dans le cadre de la réforme pédagogique et de l intérêt que porte le Ministère de l Éducation
Plus en détailStatistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier
Statistiques Appliquées à l Expérimentation en Sciences Humaines Christophe Lalanne, Sébastien Georges, Christophe Pallier Table des matières 1 Méthodologie expérimentale et recueil des données 6 1.1 Introduction.......................................
Plus en détailCours de Tests paramétriques
Cours de Tests paramétriques F. Muri-Majoube et P. Cénac 2006-2007 Licence Ce document est sous licence ALC TYPE 2. Le texte de cette licence est également consultable en ligne à l adresse http://www.librecours.org/cgi-bin/main?callback=licencetype2.
Plus en détailUne variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants)
CIVILITE-SES.doc - 1 - Une variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants) 1 PRÉSENTATION DU DOSSIER CIVILITE On s intéresse
Plus en détailUNE REPRESENTATION GRAPHIQUE DE LA LIAISON STATISTIQUE ENTRE DEUX VARIABLES ORDONNEES. Éric TÉROUANNE 1
33 Math. Inf. Sci. hum., (33 e année, n 130, 1995, pp.33-42) UNE REPRESENTATION GRAPHIQUE DE LA LIAISON STATISTIQUE ENTRE DEUX VARIABLES ORDONNEES Éric TÉROUANNE 1 RÉSUMÉ Le stéréogramme de liaison est
Plus en détailPrincipe d un test statistique
Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre
Plus en détailChapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE
UE4 : Biostatistiques Chapitre 3 : Principe des tests statistiques d hypothèse José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Introduction
Plus en détailLe chiffre est le signe, le nombre est la valeur.
Extrait de cours de maths de 6e Chapitre 1 : Les nombres et les opérations I) Chiffre et nombre 1.1 La numération décimale En mathématique, un chiffre est un signe utilisé pour l'écriture des nombres.
Plus en détailQuantification Scalaire et Prédictive
Quantification Scalaire et Prédictive Marco Cagnazzo Département Traitement du Signal et des Images TELECOM ParisTech 7 Décembre 2012 M. Cagnazzo Quantification Scalaire et Prédictive 1/64 Plan Introduction
Plus en détailFonctions de plusieurs variables
Module : Analyse 03 Chapitre 00 : Fonctions de plusieurs variables Généralités et Rappels des notions topologiques dans : Qu est- ce que?: Mathématiquement, n étant un entier non nul, on définit comme
Plus en détailStatistique : Résumé de cours et méthodes
Statistique : Résumé de cours et méthodes 1 Vocabulaire : Population : c est l ensemble étudié. Individu : c est un élément de la population. Effectif total : c est le nombre total d individus. Caractère
Plus en détailExploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction.
Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction. Etudes et traitements statistiques des données : le cas illustratif de la démarche par sondage INTRODUCTION
Plus en détailLe calcul du barème d impôt à Genève
Le calcul du barème d impôt à Genève Plan : 1. Historique Passage d un système en escalier à une formule mathématique 2. Principe de l imposition Progressivité, impôt marginal / moyen ; barème couple/marié
Plus en détailLa problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites
La problématique des tests Cours V 7 mars 8 Test d hypothèses [Section 6.1] Soit un modèle statistique P θ ; θ Θ} et des hypothèses H : θ Θ H 1 : θ Θ 1 = Θ \ Θ Un test (pur) est une statistique à valeur
Plus en détailCONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)
CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un
Plus en détailVI. Tests non paramétriques sur un échantillon
VI. Tests non paramétriques sur un échantillon Le modèle n est pas un modèle paramétrique «TESTS du CHI-DEUX» : VI.1. Test d ajustement à une loi donnée VI.. Test d indépendance de deux facteurs 96 Différentes
Plus en détail4. Résultats et discussion
17 4. Résultats et discussion La signification statistique des gains et des pertes bruts annualisés pondérés de superficie forestière et du changement net de superficie forestière a été testée pour les
Plus en détailFonctions linéaires et affines. 1 Fonctions linéaires. 1.1 Vocabulaire. 1.2 Représentation graphique. 3eme
Fonctions linéaires et affines 3eme 1 Fonctions linéaires 1.1 Vocabulaire Définition 1 Soit a un nombre quelconque «fixe». Une fonction linéaire associe à un nombre x quelconque le nombre a x. a s appelle
Plus en détailLeçon N 4 : Statistiques à deux variables
Leçon N 4 : Statistiques à deux variables En premier lieu, il te faut relire les cours de première sur les statistiques à une variable, il y a tout un langage à se remémorer : étude d un échantillon d
Plus en détail1. Vocabulaire : Introduction au tableau élémentaire
L1-S1 Lire et caractériser l'information géographique - Le traitement statistique univarié Statistique : le terme statistique désigne à la fois : 1) l'ensemble des données numériques concernant une catégorie
Plus en détailLe retard scolaire en fonction du milieu parental : l influence des compétences des parents
ENSEIGNEMENT - ÉDUCATION Le retard scolaire en fonction du milieu parental : l influence des compétences des parents Fabrice Murat* La sociologie de l éducation met souvent en avant les inégalités de réussite
Plus en détailTP 7 : oscillateur de torsion
TP 7 : oscillateur de torsion Objectif : étude des oscillations libres et forcées d un pendule de torsion 1 Principe général 1.1 Définition Un pendule de torsion est constitué par un fil large (métallique)
Plus en détailNombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN
Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN Table des matières. Introduction....3 Mesures et incertitudes en sciences physiques
Plus en détailLecture graphique. Table des matières
Lecture graphique Table des matières 1 Lecture d une courbe 2 1.1 Définition d une fonction.......................... 2 1.2 Exemple d une courbe........................... 2 1.3 Coût, recette et bénéfice...........................
Plus en détailTable des matières. I Mise à niveau 11. Préface
Table des matières Préface v I Mise à niveau 11 1 Bases du calcul commercial 13 1.1 Alphabet grec...................................... 13 1.2 Symboles mathématiques............................... 14 1.3
Plus en détailBac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)
Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures) Eercice 1 (5 points) pour les candidats n ayant pas choisi la spécialité MATH Le tableau suivant donne l évolution du chiffre
Plus en détailCet article s attache tout d abord
Méthodes internationales pour comparer l éducation et l équité Comparaison entre pays des coûts de l éducation : des sources de financement aux dépenses Luc Brière Marguerite Rudolf Bureau du compte de
Plus en détaildonnées en connaissance et en actions?
1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)
Plus en détailIntroduction à la statistique non paramétrique
Introduction à la statistique non paramétrique Catherine MATIAS CNRS, Laboratoire Statistique & Génome, Évry http://stat.genopole.cnrs.fr/ cmatias Atelier SFDS 27/28 septembre 2012 Partie 2 : Tests non
Plus en détailPetit lexique de calcul à l usage des élèves de sixième et de cinquième par M. PARCABE, professeur au collège Alain FOURNIER de BORDEAUX, mars 2007
Petit lexique de calcul à l usage des élèves de sixième et de cinquième par M. PARCABE, professeur au collège Alain FOURNIER de BORDEAUX, mars 2007 page 1 / 10 abscisse addition additionner ajouter appliquer
Plus en détailSimulation d application des règles CNAV AGIRC ARRCO sur des carrières type de fonctionnaires d Etat
CONSEIL D ORIENTATION DES RETRAITES Séance plénière du 10 avril 2014 à 9 h 30 «Carrières salariales et retraites dans les secteurs et public» Document N 9 Document de travail, n engage pas le Conseil Simulation
Plus en détailLocalisation des fonctions
MODALISA 7 Localisation des fonctions Vous trouverez dans ce document la position des principales fonctions ventilées selon l organisation de Modalisa en onglets. Sommaire A. Fonctions communes à tous
Plus en détailStatistiques à deux variables
Statistiques à deux variables Table des matières I Position du problème. Vocabulaire 2 I.1 Nuage de points........................................... 2 I.2 Le problème de l ajustement.....................................
Plus en détailÉtude sur les taux de revalorisation des contrats individuels d assurance vie au titre de 2013 n 26 mai 2014
n 26 mai 2014 Étude sur les taux de revalorisation des contrats individuels d assurance vie au titre de 2013 Sommaire 1.INTRODUCTION 4 2.LE MARCHÉ DE L ASSURANCE VIE INDIVIDUELLE 6 2.1.La bancassurance
Plus en détailExtraction d informations stratégiques par Analyse en Composantes Principales
Extraction d informations stratégiques par Analyse en Composantes Principales Bernard DOUSSET IRIT/ SIG, Université Paul Sabatier, 118 route de Narbonne, 31062 Toulouse cedex 04 dousset@irit.fr 1 Introduction
Plus en détailBaccalauréat ES Pondichéry 7 avril 2014 Corrigé
Baccalauréat ES Pondichéry 7 avril 204 Corrigé EXERCICE 4 points Commun à tous les candidats. Proposition fausse. La tangente T, passant par les points A et B d abscisses distinctes, a pour coefficient
Plus en détailLa construction du nombre en petite section
La construction du nombre en petite section Éléments d analyse d Pistes pédagogiquesp 1 La résolution de problèmes, premier domaine de difficultés des élèves. Le calcul mental, deuxième domaine des difficultés
Plus en détailFORMULAIRE DE STATISTIQUES
FORMULAIRE DE STATISTIQUES I. STATISTIQUES DESCRIPTIVES Moyenne arithmétique Remarque: population: m xμ; échantillon: Mx 1 Somme des carrés des écarts "# FR MOYENNE(série) MOYENNE(série) NL GEMIDDELDE(série)
Plus en détailRésumé du Cours de Statistique Descriptive. Yves Tillé
Résumé du Cours de Statistique Descriptive Yves Tillé 15 décembre 2010 2 Objectif et moyens Objectifs du cours Apprendre les principales techniques de statistique descriptive univariée et bivariée. Être
Plus en détailChapitre 1 : Évolution COURS
Chapitre 1 : Évolution COURS OBJECTIFS DU CHAPITRE Savoir déterminer le taux d évolution, le coefficient multiplicateur et l indice en base d une évolution. Connaître les liens entre ces notions et savoir
Plus en détailAnalyse des coûts. 1 ère année DUT GEA, 2005/2006 Analyse des coûts
Analyse des coûts Les techniques de calcul et d analyse des coûts portent le nom de comptabilité analytique ou comptabilité de gestion. Ces deux termes seront utilisés indifféremment dans ce cours. Contrairement
Plus en détailLa classification automatique de données quantitatives
La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations
Plus en détailFctsAffines.nb 1. Mathématiques, 1-ère année Edition 2007-2008. Fonctions affines
FctsAffines.nb 1 Mathématiques, 1-ère année Edition 2007-2008 Fonctions affines Supports de cours de mathématiques de degré secondaire II, lien hpertete vers la page mère http://www.deleze.name/marcel/sec2/inde.html
Plus en détailChapitre 2. Eléments pour comprendre un énoncé
Chapitre 2 Eléments pour comprendre un énoncé Ce chapitre est consacré à la compréhension d un énoncé. Pour démontrer un énoncé donné, il faut se reporter au chapitre suivant. Les tables de vérité données
Plus en détailTests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE
Chapitre 5 UE4 : Biostatistiques Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés.
Plus en détailM2 IAD UE MODE Notes de cours (3)
M2 IAD UE MODE Notes de cours (3) Jean-Yves Jaffray Patrice Perny 16 mars 2006 ATTITUDE PAR RAPPORT AU RISQUE 1 Attitude par rapport au risque Nousn avons pas encore fait d hypothèse sur la structure de
Plus en détailCAPTEURS - CHAINES DE MESURES
CAPTEURS - CHAINES DE MESURES Pierre BONNET Pierre Bonnet Master GSI - Capteurs Chaînes de Mesures 1 Plan du Cours Propriétés générales des capteurs Notion de mesure Notion de capteur: principes, classes,
Plus en détailPlus petit, plus grand, ranger et comparer
Unité 11 Plus petit, plus grand, ranger et comparer Combien y a-t-il de boules sur la tige A? Sur la tige B? A B Le nombre de boules sur la tige A est plus grand que sur la tige B. On écrit : > 2 On lit
Plus en détailéclairages QUI SONT LES ALLOCATAIRES INDEMNISÉS PAR L ASSURANCE CHÔMAGE? Près de 3 demandeurs d emploi sur 5 sont couverts par l Assurance chômage
éclairages ÉTUDES ET ANALYSES N 5 AVRIL 213 QUI SONT LES ALLOCATAIRES INDEMNISÉS PAR L ASSURANCE CHÔMAGE? L Unédic a réalisé une étude pour approfondir la compréhension de la population des allocataires
Plus en détailPROJET DE GESTION PORTEFEUILLE. Evaluation d une Stratégie de Trading
PROJET DE GESTION PORTEFEUILLE Evaluation d une Stratégie de Trading Encadré par M. Philippe Bernard Master 1 Economie Appliquée-Ingénierie Economique et Financière Taylan Kunal 2011-2012 Sommaire 1) Introduction
Plus en détailÉvaluation de la régression bornée
Thierry Foucart UMR 6086, Université de Poitiers, S P 2 M I, bd 3 téléport 2 BP 179, 86960 Futuroscope, Cedex FRANCE Résumé. le modèle linéaire est très fréquemment utilisé en statistique et particulièrement
Plus en détailDirection des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels
Etab=MK3, Timbre=G430, TimbreDansAdresse=Vrai, Version=W2000/Charte7, VersionTravail=W2000/Charte7 Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels
Plus en détailL analyse boursière avec Scilab
L analyse boursière avec Scilab Introduction La Bourse est le marché sur lequel se traitent les valeurs mobilières. Afin de protéger leurs investissements et optimiser leurs résultats, les investisseurs
Plus en détail3. Caractéristiques et fonctions d une v.a.
3. Caractéristiques et fonctions d une v.a. MTH2302D S. Le Digabel, École Polytechnique de Montréal H2015 (v2) MTH2302D: fonctions d une v.a. 1/32 Plan 1. Caractéristiques d une distribution 2. Fonctions
Plus en détailBaccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé
Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé A. P. M. E. P. Exercice 1 5 points 1. Réponse d. : 1 e Le coefficient directeur de la tangente est négatif et n est manifestement pas 2e
Plus en détailT de Student Khi-deux Corrélation
Les tests d inférence statistiques permettent d estimer le risque d inférer un résultat d un échantillon à une population et de décider si on «prend le risque» (si 0.05 ou 5 %) Une différence de moyennes
Plus en détailMATHÉMATIQUES. Les préalables pour l algèbre MAT-P020-1 DÉFINITION DU DOMAINE D EXAMEN
MATHÉMATIQUES Les préalables pour l algèbre MAT-P020-1 DÉFINITION DU DOMAINE D EXAMEN Mars 2001 MATHÉMATIQUES Les préalables pour l algèbre MAT-P020-1 DÉFINITION DU DOMAINE D EXAMEN Mars 2001 Direction
Plus en détailREFORME DU CREDIT A LA CONSOMMATION DECRET SUR LE REMBOURSEMENT MINIMAL DU CAPITAL POUR LES CREDITS RENOUVELABLES
REFORME DU CREDIT A LA CONSOMMATION DECRET SUR LE REMBOURSEMENT MINIMAL DU CAPITAL POUR LES CREDITS RENOUVELABLES DOSSIER DE PRESSE FICHE 1 Une réforme pour réduire le coût des crédits renouvelables et
Plus en détailLes nombres entiers. Durée suggérée: 3 semaines
Les nombres entiers Durée suggérée: 3 semaines Aperçu du module Orientation et contexte Pourquoi est-ce important? Dans le présent module, les élèves multiplieront et diviseront des nombres entiers concrètement,
Plus en détailTRAVAUX PRATIQUES SCIENTIFIQUES SUR SYSTÈME
Baccalauréat Professionnel SYSTÈMES ÉLECTRONIQUES NUMÉRIQUES Champ professionnel : Alarme Sécurité Incendie SOUS - EPREUVE E12 TRAVAUX PRATIQUES SCIENTIFIQUES SUR SYSTÈME Durée 3 heures coefficient 2 Note
Plus en détailChapitre 3 : Le budget des ventes. Marie Gies - Contrôle de gestion et gestion prévisionnelle - Chapitre 3
Chapitre 3 : Le budget des ventes Introduction 2 Rappel des différents budgets opérationnels - budget des ventes (chapitre 3) - budget de production (chapitre 4) - budget des approvisionnements et des
Plus en détailLoi binomiale Lois normales
Loi binomiale Lois normales Christophe ROSSIGNOL Année scolaire 204/205 Table des matières Rappels sur la loi binomiale 2. Loi de Bernoulli............................................ 2.2 Schéma de Bernoulli
Plus en détailBaccalauréat ES/L Métropole La Réunion 13 septembre 2013 Corrigé
Baccalauréat S/L Métropole La Réunion 13 septembre 2013 Corrigé A. P. M.. P. XRCIC 1 Commun à tous les candidats Partie A 1. L arbre de probabilité correspondant aux données du problème est : 0,3 0,6 H
Plus en détailLa notion de besoin peut décrire : La notion de besoin peut décrire :
La notion de besoin peut décrire : une expérience vécue dont la personne est parfaitement consciente : Exemple : «J ai besoin de me divertir»; La notion de besoin peut décrire : 2. «une exigence née de
Plus en détailLois de probabilité. Anita Burgun
Lois de probabilité Anita Burgun Problème posé Le problème posé en statistique: On s intéresse à une population On extrait un échantillon On se demande quelle sera la composition de l échantillon (pourcentage
Plus en détailA quels élèves profite l approche par les compétences de base? Etude de cas à Djibouti
A quels élèves profite l approche par les compétences de base? Etude de cas à Djibouti Hamid Mohamed Aden, Directeur du CRIPEN, Djibouti Xavier Roegiers, Professeur à l Université de Louvain, Directeur
Plus en détailProbabilités sur un univers fini
[http://mp.cpgedupuydelome.fr] édité le 10 août 2015 Enoncés 1 Proailités sur un univers fini Evènements et langage ensemliste A quelle condition sur (a,, c, d) ]0, 1[ 4 existe-t-il une proailité P sur
Plus en détailSUIVI CINETIQUE PAR SPECTROPHOTOMETRIE (CORRECTION)
Terminale S CHIMIE TP n 2b (correction) 1 SUIVI CINETIQUE PAR SPECTROPHOTOMETRIE (CORRECTION) Objectifs : Déterminer l évolution de la vitesse de réaction par une méthode physique. Relier l absorbance
Plus en détail