Relation entre deux variables : estimation de la corrélation linéaire

Save this PDF as:
 WORD  PNG  TXT  JPG

Dimension: px
Commencer à balayer dès la page:

Download "Relation entre deux variables : estimation de la corrélation linéaire"

Transcription

1 CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence une éventuelle liaison entre deux variables numériques ; il s agit du coefficient de corrélation qui, grâce à un calcul simple, permet de déterminer s il existe ou non une relation entre deux variables numériques et quelle est l intensité de cette relation. Ainsi, le coefficient de corrélation va révéler (ou non l existence et la force d un lien entre deux séries d observations quantitatives. I. LOGIQUE DE LA CORRÉLATION La corrélation met en évidence un lien entre deux variables. En effet, comme il est précisé dans tous les ouvrages de statistiques, corrélation n est pas causalité. Ceci est très important car cette phrase signifie que l opération statistique effectuée, du fait de son statut descriptif, permet seulement de montrer que les variables entretiennent une relation et pas du tout qu une variable explique ou cause l autre variable. Il est fondamental d insister ici sur l importance à ne pas confondre corrélation et causalité : le fait que deux variables sont corrélées montre simplement qu elles covarient, c est-à-dire que les changements de valeurs de l une sont associés, de manière significative, avec des changements de valeurs de l autre. La corrélation est une statistique descriptive et non inférentielle. Si le but des calculs entrepris est de montrer qu une variable en explique une autre, il faudra alors recourir à des statistiques inférentielles (et notamment aux techniques de régression, pour pouvoir parler de causalité. En outre, la relation mise en évidence par le coefficient de corrélation étudié ciaprès est seulement une relation stochastique linéaire ; ce qui signifie que, si les variables entretiennent un autre type de relation plus complexe, ce lien ne sera pas «détecté» par le coefficient de corrélation. Il faudra alors recourir à d autres types d indices de statistiques. Ainsi, lorsqu un chercheur travaille avec un échantillon représentatif et qu il a calculé un indice de liaison entre deux variables, il est légitime qu il se demande si l indice qu il a obtenu est significatif. Pour cela, il suivra une procédure précise, expliquée dans ce chapitre. 68

2 Par exemple, il est possible grâce au coefficient de corrélation linéaire, de valider les liens suivants : «plus le taux de gaz carbonique en ville est important, plus les jeunes enfants développent des rhinites» ; ou encore : «moins les lapins absorbent de vitamine C, plus ils dorment longtemps», etc. Ce lien est généralement assorti d un graphique le nuage de points qui permet de déterminer à l avance le sens de la relation entre les variables. II. COMMENT CALCULER LE COEFFICIENT DE CORRÉLATION? Le coefficient de corrélation utilisé avec deux variables métriques (i.e., échelles d intervalles est le coefficient de corrélation r de Bravais-Pearson. Dans le cas de variables ordinales, un autre type de coefficient de corrélation est calculé, il s agit du rhô (symbolisé par la lettre grecque ρ de Spearman qui est un coefficient de corrélation par rangs. Ce coefficient fait partie des statistiques dites non paramétriques et sera donc abordé dans le chapitre 10. La formule dite de compréhension (c est-à-dire qui permet de comprendre la logique du calcul du r est la suivante : Σ(x m x Σ(y m y sx sy r = n où x représente les valeurs de la première variable et y celles de la seconde ; m est le symbole de la moyenne, (celui de l écart type et n représente l effectif de la distribution. Si cette formule est développée, en utilisant des lois mathématiques, elle va donner une formule de calcul plus simple et plus rapide : Σxy Σx Σy n r = 0 Σx2 (Σ x 2 n Σy 2 (Σ y 2 n Une autre formule peut également être utilisée pour calculer le coefficient de corrélation : Σ(x m x (y m y r = 0Σ(x m x 2 cσ(y mc y 2 Elle consiste donc à soustraire la moyenne à chacune des valeurs de chaque distribution et à en faire la somme. Si les deux distributions comportent beaucoup de valeurs, les calculs peuvent être longs et fastidieux, c est pourquoi il est conseillé d utiliser la formule de calcul rapide. Enfin, puisque le coefficient de corrélation met en évidence le fait que deux variables varient conjointement, sa formule peut également utiliser celle de la covariance CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire 69

3 et il est alors possible de calculer r en divisant la covariance des deux variables par leurs écarts types qui ont été multipliés : Cov xy r = sx s y Σ(x m x (y m y où Cov xy est égal à : Cov xy = n 1 Et il existe encore d autres formules pour calculer cet indice! Le coefficient de corrélation varie de + 1 à 1: + 1 indique une corrélation positive maximale entre les deux variables, ce qui signifie qu elles varient exactement dans le même sens : plus les valeurs de l une augmentent (ou diminuent, plus les valeurs de l autre augmentent (ou diminuent ; ceci indique une relation fonctionnelle de type linéaire croissante. 1 indique en revanche une très forte corrélation négative ; il signifie cette fois une liaison maximale négative, c est-à-dire que les variables covarient inversement : plus les valeurs de l une augmentent, plus celles de l autre diminuent (et inversement bien sûr ; il s agit cette fois d une relation fonctionnelle de type linéaire décroissante. Une valeur proche de 0 signifie que les deux variables ne varient pas ensemble, en tout cas que la relation qui pourrait éventuellement les unir n est pas linéaire. Ainsi, plus la valeur du coefficient est proche de 1, plus la corrélation entre les deux variables est forte. Pour toute valeur intermédiaire et lorsque l échantillon peut être considéré comme extrait d une population parente (ceci est fondamental, sinon il est impossible de généraliser, même si l indice obtenu est très élevé et/ou significatif, il faut se reporter à la table du r de Bravais-Pearson. Cette table se présente sous forme d un tableau à deux dimensions. Dans la première colonne, se trouvent les valeurs des degrés de liberté, qui correspondent à la taille de l échantillon 2 (ou au nombre de couples 2, ce qui revient évidemment strictement au même et dans la première ligne, le seuil de probabilité α. À l intersection de chaque ligne et de chaque colonne, il est possible de lire les valeurs critiques de r, c est-à-dire les valeurs au dessus desquelles le r calculé est significatif et pour lesquelles la corrélation entre les deux variables est donc significative. Ce qui signifie (et c est là le sens du terme significatif que la corrélation entre les deux variables est différente de zéro au niveau de la population parente. Pour les valeurs éloignées de + 1 ou de 1, la significativité du coefficient va largement dépendre du nombre d individus de l échantillon : plus l échantillon est important, plus une corrélation, même très faible (i.e., r = 0,25 par exemple, pourra être significative. Il faut donc être vigilant quant à l interprétation d une telle relation entre deux variables. En résumé, pour estimer précisément la significativité d un coefficient de corrélation, il suffit de comparer la valeur du r calculé à une valeur r critique, en se reportant à la table des valeurs critiques du r. Pour cela il faut déterminer un seuil de significativité 70

4 (appelé α cf. chapitre 4 qui varie selon les tables entre.20 qui indique 20 chances sur 100 de se tromper et.0001 qui indique une chance sur de se tromper et un degré de liberté ; ce dernier correspond toujours au nombre de couples de l ensemble de la distribution auquel on retire 2. Remarque : les notions relatives à la significativité, au degré de liberté et au seuil à choisir sont des notions fondamentales en statistiques. Elles seront plus amplement présentées dans le chapitre 4 consacré au t de Student et dans le chapitre 6 relatif à l analyse de variance. Par exemple, si chaque variable comprend 20 observations, le degré de liberté (abrégé en ddl sera égal à 20 2 = 18. Dans la table du r de Bravais-Pearson (cf. annexe 1, pour ddl = 18 et α =.05 (qui est un seuil raisonnable, on lit r critique = 0,4439. Cette valeur signifie que le r calculé doit être supérieur ou égal à cette valeur pour être considéré comme significatif, quel que soit son signe (+ ou, avec 5 % de risques de commettre une erreur. Pour un risque d erreur moins élevé, il faut choisir un seuil inférieur, α =.01 (et r critique = 0,5616 ou même α =.001 (et r critique = 0,6789. Ainsi, moins on prend de risques, plus le r calculé doit être important pour pouvoir conclure qu il existe une relation significative entre les deux variables. Si r calculé est strictement inférieur à r critique, au seuil α choisi et à ddl = n 2, il n est pas possible de conclure à une relation entre les deux variables. Si r calculé est supérieur ou égal à r critique, il existe bien une relation entre les deux variables. À ce moment-là, le signe du r calculé va permettre d indiquer le sens de la liaison. Aux valeurs de r sont associés des nuages de points typiques dont les plus fréquents sont présentés dans le paragraphe suivant. III. REPRÉSENTATION GRAPHIQUE DE LA CORRÉLATION Comme cela a été montré dans le chapitre 2, un nuage de points permet de représenter sur le même schéma deux variables quantitatives. L une des variables apparaît en abscisse tandis que l autre est en ordonnée. Un point sur le graphique caractérise un individu, ou plus précisément les valeurs qu il a obtenues pour chacune des deux variables. Lorsque la corrélation est très forte et positive (proche de + 1, le nuage de points, qui a généralement la forme d une ellipse, s étire du bas gauche au haut droit du graphique, comme sur la figure 11 ci-dessous. Ce premier exemple classique, concernant la liaison entre le poids (en kilogrammes et la taille (en centimètres, reprend les mêmes données que celles utilisées dans le chapitre consacré à la présentation des statistiques descriptives, mais augmentées de quelques individus. CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire 71

5 FIGURE 11 Corrélation positive entre le poids et la taille Taille Poids Ce graphique met en évidence que plus le poids augmente, plus la taille augmente (et inversement. Le coefficient de corrélation est ici égal à r =+0, ; il est très proche de + 1 et donc très significatif. Le risque d erreur est très faible, sans doute autour d une chance sur de commettre une erreur en disant qu il existe une relation linéaire positive et significative entre les deux variables ; le seuil α pourrait être égal à Lorsque la corrélation est significative et proche de 1, le nuage de points présente alors une allure inverse : il s étire du haut gauche au bas droit. Par exemple, la relation suivante peut être constatée et représentée graphiquement ci-dessous : moins la température est élevée, plus les personnes absorbent de potage (sans doute pour se réchauffer. Le coefficient de corrélation est cette fois égal à : r = 0, , avec ddl = 30 2 = 28. Là encore, le risque d erreur est extrêmement faible : il existe bien une liaison très forte entre la température et l absorption de potage. FIGURE 12 Relation négative forte entre la température et l absorption de potage Température Entre ces extrêmes, des corrélations non significatives se traduiront par des nuages de points dispersés, ne suivant pas une direction précise, comme dans les exemples cidessous. Litres de potage La première figure montre qu il n existe pas de relation linéaire entre l âge et la taille du gros orteil (r = 0, À ddl = 10 2, le r calculé est toujours inférieur au r lu dans la table de Bravais- Pearson. L arc de cercle pourrait toutefois faire penser à un autre type de relation, éventuellement! 72

6 FIGURE 13 Âge et taille du gros orteil chez dix enfants La seconde figure montre que, contrairement aux idées reçues, il n y a pas de relation entre le salaire perçu, en euros, et le nombre d années passées à étudier après le baccalauréat (même si les diplômes ont été obtenus bien évidemment! : FIGURE 14 Y a-t-il une relation entre le salaire et les diplômes? Salaires (en euros Âge Le coefficient de corrélation est ici égal à : r = 0, , ce qui traduit vraiment une absence très nette de relation entre les deux variables. Il ne faut pas abandonner ses études pour autant! IV. UN EXEMPLE À TRAVERS L ÉTUDE DE LA LECTURE L objectif de la recherche conduite par Rocher et Chanquoy ([2004], «Discrimination et attention visuelle : quel impact sur la reconnaissance de lettres et de mots au cours de la lecture?», Le Langage et l homme : logopédie, psychologie, audiologie, 39 (2, pp , dans une perspective de psychologie du développement, était d examiner, au cours de la lecture, les relations entre les processus visuels perceptifs, les habiletés phonologiques et les compétences des jeunes enfants à reconnaître des lettres et des mots écrits. Pour cela, des épreuves de perception visuelle, verbales et phonologiques ont été proposées à des enfants scolarisés en grande section de maternelle (GSM et en première année d école primaire (CP. Au regard des conceptions théoriques et des études existantes, le but de cette recherche était, entre autres, de rendre compte des relations entre trois domaines de CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire 73

TABLEAU 5 Nombre moyen (et écarts types) de mots produits selon le niveau scolaire et les trois conditions de révision

TABLEAU 5 Nombre moyen (et écarts types) de mots produits selon le niveau scolaire et les trois conditions de révision Dans ce tableau, si le chercheur ne s intéresse pas aux notes item par item mais simplement à la note globale, alors il conservera seulement les première et dernière colonnes et calculera des statistiques

Plus en détail

Module 2 29 Décembre 2009 Intervenant: Dhuin STATISTIQUES

Module 2 29 Décembre 2009 Intervenant: Dhuin STATISTIQUES STATISTIQUES I. Séries statistiques simples... 1 A. Définitions... 1 1. Population... 1 2. Caractère statistique... 1 B. Séries classées / représentations graphiques.... 2 1. Séries classées... 2 2. Représentations

Plus en détail

Chapitre 3 RÉGRESSION ET CORRÉLATION

Chapitre 3 RÉGRESSION ET CORRÉLATION Statistique appliquée à la gestion et au marketing http://foucart.thierry.free.fr/statpc Chapitre 3 RÉGRESSION ET CORRÉLATION La corrélation est une notion couramment utilisée dans toutes les applications

Plus en détail

Série statistique double à l aide d un exemple

Série statistique double à l aide d un exemple Série statistique double à l aide d un exemple Série statistique double: exemple... 2 Série statistique double: questions posées... 3 Calcul de la covariance sur la base de l'exemple... 4 Calcul du coefficient

Plus en détail

MATHÉMATIQUES ET SCIENCES HUMAINES

MATHÉMATIQUES ET SCIENCES HUMAINES MATHÉMATIQUES ET SCIENCES HUMAINES B. MARCHADIER Dépendance et indépendance de deux aléas numériques images Mathématiques et sciences humaines, tome 25 (1969), p. 2534.

Plus en détail

Loi normale ou loi de Laplace-Gauss

Loi normale ou loi de Laplace-Gauss LivreSansTitre1.book Page 44 Mardi, 22. juin 2010 10:40 10 Loi normale ou loi de Laplace-Gauss I. Définition de la loi normale II. Tables de la loi normale centrée réduite S il y avait une seule loi de

Plus en détail

Chapitre 3. Les distributions à deux variables

Chapitre 3. Les distributions à deux variables Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles

Plus en détail

Statistique : Résumé de cours et méthodes

Statistique : Résumé de cours et méthodes Statistique : Résumé de cours et méthodes 1 Vocabulaire : Population : c est l ensemble étudié. Individu : c est un élément de la population. Effectif total : c est le nombre total d individus. Caractère

Plus en détail

Annexe commune aux séries ES, L et S : boîtes et quantiles

Annexe commune aux séries ES, L et S : boîtes et quantiles Annexe commune aux séries ES, L et S : boîtes et quantiles Quantiles En statistique, pour toute série numérique de données à valeurs dans un intervalle I, on définit la fonction quantile Q, de [,1] dans

Plus en détail

SCI03 - Analyse de données expérimentales

SCI03 - Analyse de données expérimentales SCI03 - Analyse de données expérimentales Introduction à la statistique Thierry Denœux 1 1 Université de Technologie de Compiègne tél : 44 96 tdenoeux@hds.utc.fr Automne 2014 Qu est ce que la statistique?

Plus en détail

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1 UN GROUPE D INDIVIDUS Un groupe d individus décrit par une variable qualitative binaire DÉCRIT PAR UNE VARIABLE QUALITATIVE BINAIRE ANALYSER UN SOUS-GROUPE COMPARER UN SOUS-GROUPE À UNE RÉFÉRENCE Mots-clés

Plus en détail

Chapitre 1 : Évolution COURS

Chapitre 1 : Évolution COURS Chapitre 1 : Évolution COURS OBJECTIFS DU CHAPITRE Savoir déterminer le taux d évolution, le coefficient multiplicateur et l indice en base d une évolution. Connaître les liens entre ces notions et savoir

Plus en détail

MÉTHODES ET STATISTIQUES POUR LIRE UN ARTICLE

MÉTHODES ET STATISTIQUES POUR LIRE UN ARTICLE MÉTHODES ET STATISTIQUES POUR LIRE UN ARTICLE Forum HH 05.02.2013 Ghislaine Gagnon Unité HPCI Qualitatif ou quantitatif? Les 2 méthodes peuvent être utilisées séparément ou en conjonction - le qualitatif

Plus en détail

Emilien Suquet, suquet@automaths.com

Emilien Suquet, suquet@automaths.com STATISTIQUES Emilien Suquet, suquet@automaths.com I Comment réagir face à un document statistique? Les deux graphiques ci-dessous représentent l évolution du taux de chômage en France sur les 1 mois de

Plus en détail

L'APPROCHE EXPERIMENTALE EN RECHERCHE: introduction aux statistiques.

L'APPROCHE EXPERIMENTALE EN RECHERCHE: introduction aux statistiques. L'APPROCHE EXPERIMENTALE EN RECHERCHE: introduction aux statistiques 1 BUTS DU COURS : se familiariser avec le vocabulaire statistique o variable dépendante, variable indépendante o statistique descriptive,

Plus en détail

1. La fonction de consommation keynésienne

1. La fonction de consommation keynésienne Rappels de cours Aix- Marseille Université - Faculté des Sciences Economiques Licence EM 1ère année - 2ème semestre Travaux dirigés de Macroéconomie Karine CONSTANT Gilles DE TRUCHIS 1. La fonction de

Plus en détail

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique»

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Tests de comparaison de moyennes Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Test de Z ou de l écart réduit Le test de Z : comparer des paramètres en testant leurs différences

Plus en détail

Simulation Examen de Statistique Approfondie II **Corrigé **

Simulation Examen de Statistique Approfondie II **Corrigé ** Simulation Examen de Statistique Approfondie II **Corrigé ** Ces quatre exercices sont issus du livre d exercices de François Husson et de Jérôme Pagès intitulé Statistiques générales pour utilisateurs,

Plus en détail

STATISTIQUES À UNE VARIABLE

STATISTIQUES À UNE VARIABLE STATISTIQUES À UNE VARIABLE Table des matières I Méthodes de représentation 2 I.1 Vocabulaire.............................................. 2 I.2 Tableaux...............................................

Plus en détail

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et

Plus en détail

La gestion des ventes.

La gestion des ventes. I. La prévision des ventes. A. Principe. La gestion des ventes. Elle consiste à déterminer les ventes futures à la fois en quantité et en valeur en tenant compte des tendances et contraintes imposées à

Plus en détail

RAPPORT SUR L ETUDE DES DONNEES FINANCIERES ET STATISTIQUES A L AIDE DU LOGICIEL SCILAB

RAPPORT SUR L ETUDE DES DONNEES FINANCIERES ET STATISTIQUES A L AIDE DU LOGICIEL SCILAB RAPPORT SUR L ETUDE DES DONNEES FINANCIERES ET STATISTIQUES A L AIDE DU LOGICIEL SCILAB PAR : MAROOF ASIM DAN BENTOLILA WISSAM ESSID GROUPE 1 LM206 Lundi 10H45 INTRODUCTION : ( Ce rapport est un compte

Plus en détail

11 OSMOLARITÉ, MULTIPLES SOURCES DE VARIATION

11 OSMOLARITÉ, MULTIPLES SOURCES DE VARIATION 11 OSMOLARITÉ, MULTIPLES SOURCES DE VARIATION Dans cette étude de cas nous nous retrouvons face à des données dont la variabilité court terme est très différente de celle à long terme. Les cartes de contrôle

Plus en détail

Le coût du crédit aux entreprises

Le coût du crédit aux entreprises Frédérique EDMOND Direction des Études et Statistiques monétaires Service des Analyses et Statistiques monétaires L enquête trimestrielle sur le coût du crédit aux entreprises est réalisée auprès d un

Plus en détail

Correction de l épreuve de Statistiques et Informatique appliquées à la Psychologie

Correction de l épreuve de Statistiques et Informatique appliquées à la Psychologie Université de Bretagne Occidentale Année Universitaire 2013-2014 U.F.R. de Lettres et Sciences Humaines CS 93837-29238 BREST CEDEX 3 Section : Psychologie - Licence 3è année Enseignant responsable : F.-G.

Plus en détail

L essentiel sur les tests statistiques

L essentiel sur les tests statistiques L essentiel sur les tests statistiques 21 septembre 2014 2 Chapitre 1 Tests statistiques Nous considérerons deux exemples au long de ce chapitre. Abondance en C, G : On considère une séquence d ADN et

Plus en détail

Cahier de vacances - Préparation à la Première S

Cahier de vacances - Préparation à la Première S Cahier de vacances - Préparation à la Première S Ce cahier est destiné à vous permettre d aborder le plus sereinement possible la classe de Première S. Je vous conseille de le travailler pendant les 0

Plus en détail

Baccalauréat ST2S Antilles Guyane juin 2013 Correction

Baccalauréat ST2S Antilles Guyane juin 2013 Correction Baccalauréat ST2S Antilles Guyane juin 2013 Correction EXERCICE 1 6 points Le tableau ci-dessous donne le nombre d abonnements au service de téléphonie mobile en France entre fin 2001 et fin 2009, exprimé

Plus en détail

Equations de droites. Coefficient directeur

Equations de droites. Coefficient directeur Equations de droites. Coefficient directeur I) Caractérisation analytique d une droite m, p et c désignent des nombres réels. 1) Propriété : Dans un repère l ensemble des points M de coordonnées ( ; )

Plus en détail

Master 1 de Psychologie du Travail et des Organisations : Recueil et analyse des données - Corrigés des T.D. ( 2014/2015) -

Master 1 de Psychologie du Travail et des Organisations : Recueil et analyse des données - Corrigés des T.D. ( 2014/2015) - Dominique Ferrieux - Université Paul Valéry - Montpellier III Master de Psychologie du Travail et des Organisations : Recueil et analyse des données - Corrigés des T.D. ( /) - Deuxième partie : Plans :

Plus en détail

1S DS 4 Durée :?mn. 2. La courbe ci-dessous est la représentation graphique de la fonction g, définie sur I = [ 1; 3].

1S DS 4 Durée :?mn. 2. La courbe ci-dessous est la représentation graphique de la fonction g, définie sur I = [ 1; 3]. 1S DS 4 Durée :?mn Exercice 1 ( 5 points ) Les trois questions sont indépendantes. 1. Soit f la fonction définie par f(x) = 3 x. a) Donner son ensemble de définition. Il faut 3 x 0 3 x donc D f =] ; 3]

Plus en détail

Cours de Mathématiques Seconde. Généralités sur les fonctions

Cours de Mathématiques Seconde. Généralités sur les fonctions Cours de Mathématiques Seconde Frédéric Demoulin 1 Dernière révision : 16 avril 007 Document diffusé via le site www.bacamaths.net de Gilles Costantini 1 frederic.demoulin (chez) voila.fr gilles.costantini

Plus en détail

Probabilités et Statistiques. Chapitre 1 : Statistique descriptive

Probabilités et Statistiques. Chapitre 1 : Statistique descriptive U.P.S. I.U.T. A, Département d Informatique Année 2008-2009 Probabilités et Statistiques Emmanuel PAUL Chapitre 1 : Statistique descriptive 1 Objectifs des statistiques. Il s agit d étudier un ou plusieurs

Plus en détail

Statistiques Descriptives à une dimension

Statistiques Descriptives à une dimension I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des

Plus en détail

STATISTIQUES A UNE VARIABLE EXERCICES CORRIGES

STATISTIQUES A UNE VARIABLE EXERCICES CORRIGES STATISTIQUES A UNE VARIALE EXERCICES CORRIGES Exercice n Les élèves d une classe ont obtenu les notes suivantes lors d un devoir : Note 4 5 8 0 4 5 8 0 Effectif 4 7 6 4 ) Déterminer l étendue et le mode

Plus en détail

I. LA VARIABILITE AU SEIN DES POPULATIONS

I. LA VARIABILITE AU SEIN DES POPULATIONS I. LA VARIABILITE AU SEIN DES POPULATIONS La notion de population recouvre un concept difficilement réductible à une définition unique. Au sens de la génétique, une population représente une entité de

Plus en détail

9. Distributions d échantillonnage

9. Distributions d échantillonnage 9. Distributions d échantillonnage MTH2302D S. Le Digabel, École Polytechnique de Montréal H2015 (v3) MTH2302D: distributions d échantillonnage 1/46 Plan 1. Échantillons aléatoires 2. Statistiques et distributions

Plus en détail

Cours de Statistiques

Cours de Statistiques Cours de Statistiques Romain Raveaux 1 1 Laboratoire L3I Université de La Rochelle romain.raveaux01 at univ-lr.fr Octobre 24-11, 2008 1 / 35 Sommaire 1 Quelques Rappels 2 numériques Relations entre deux

Plus en détail

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre : Terminale STSS 2 012 2 013 Pourcentages Synthèse 1) Définition : Calculer t % d'un nombre, c'est multiplier ce nombre par t 100. 2) Exemples de calcul : a) Calcul d un pourcentage : Un article coûtant

Plus en détail

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Le Data Mining au service du Scoring ou notation statistique des emprunteurs! France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative

Plus en détail

Traitement des données avec Microsoft EXCEL 2010

Traitement des données avec Microsoft EXCEL 2010 Traitement des données avec Microsoft EXCEL 2010 Vincent Jalby Septembre 2012 1 Saisie des données Les données collectées sont saisies dans une feuille Excel. Chaque ligne correspond à une observation

Plus en détail

UNE ESTIMATION DU PARC AUTOMOBILE À L AIDE DES DURÉES DE VIE DES VÉHICULES

UNE ESTIMATION DU PARC AUTOMOBILE À L AIDE DES DURÉES DE VIE DES VÉHICULES UNE ESTIMATION DU PARC AUTOMOBILE À L AIDE DES DURÉES DE VIE DES VÉHICULES François JEGER Le parc de véhicules automobiles en service vieillit de trois mois par an depuis 1993 : la durée de vie médiane

Plus en détail

Organisation et gestion de données cycle 3

Organisation et gestion de données cycle 3 Organisation et gestion de données cycle 3 Clarifier les enjeux de cet enseignement Formation d enseignants de cycle 3 Circonscription de Grenoble 2 Positionnement de la pratique. En classe, comment travaillez-

Plus en détail

Document d orientation sur les allégations issues d essais de non-infériorité

Document d orientation sur les allégations issues d essais de non-infériorité Document d orientation sur les allégations issues d essais de non-infériorité Février 2013 1 Liste de contrôle des essais de non-infériorité N o Liste de contrôle (les clients peuvent se servir de cette

Plus en détail

Analyse des Données. Questions de cours. Exercice n o 1. Examen terminal - Durée 3h

Analyse des Données. Questions de cours. Exercice n o 1. Examen terminal - Durée 3h I.U.T de Caen STID 2ème année Département STID Année Universitaire 2002-2003 Responsable de cours : Alain LUCAS Seule la calculatrice type collège est autorisée. Seul le cours est autorisé. On rappelera

Plus en détail

Table des matières LES FONCTIONS POLYNOMIALES

Table des matières LES FONCTIONS POLYNOMIALES Table des matières LES FONCTIONS POLYNOMIALES 1 Différents types de fonctions polynomiales Étude des différentes fonctions polynomiales.1 Les fonctions constantes.1.1 La fonction constante de base.1. La

Plus en détail

Cours 1: lois discrétes classiques en probabilités

Cours 1: lois discrétes classiques en probabilités Cours 1: lois discrétes classiques en probabilités Laboratoire de Mathématiques de Toulouse Université Paul Sabatier-IUT GEA Ponsan Module: Stat inférentielles Définition Quelques exemples loi d une v.a

Plus en détail

Outils méthodologiques et astuces pour la thèse de médecine Les statistiques, comment faire?

Outils méthodologiques et astuces pour la thèse de médecine Les statistiques, comment faire? Outils méthodologiques et astuces pour la thèse de médecine Les statistiques, comment faire? Cyril Ferdynus, USM, CHU RECUEIL DE DONNEES Recueil hors ligne Epidata (http://www.epiconcept.fr/html/epidata.html)

Plus en détail

Un corrigé de l épreuve de mathématiques du baccalauréat blanc

Un corrigé de l épreuve de mathématiques du baccalauréat blanc Terminale ES Un corrigé de l épreuve de mathématiques du baccalauréat blanc EXERCICE ( points). Commun à tous les candidats On considère une fonction f : définie, continue et doublement dérivable sur l

Plus en détail

I] ETUDE STATISTIQUES SIMPLE

I] ETUDE STATISTIQUES SIMPLE INTRODUCTION Scilab (contraction de Scientific Laboratory) est un logiciel libre, développé à l'inria Rocquencourt. C'est un environnement de calcul numérique qui permet d'effectuer rapidement toutes les

Plus en détail

Introduction à l analyse des données. Olivier Godechot

Introduction à l analyse des données. Olivier Godechot Introduction à l analyse des données Olivier Godechot Introduction. Les données statistiques : de très nombreuses variables. Aucune n est parfaite La perception d un phénomène appréhendée comme la combinaison

Plus en détail

FONCTIONS FINANCIÈRES

FONCTIONS FINANCIÈRES FONCTIONS FINANCIÈRES Les fonctions financières d Excel permettent de calculer des mensualités, des taux d intérêts, des durées, etc. À chaque fois, il faudra faire très attention au niveau de la durée

Plus en détail

Paramètres de position

Paramètres de position Paramètres de position 1 On va parler ici des statistiques quantitatives. On veut les résumer par des nombres. On a deux types de nombres Les paramètre de position : ce sont ceux qui définissent une notion

Plus en détail

Utilisation du logiciel Excel pour des analyses simples de bases données

Utilisation du logiciel Excel pour des analyses simples de bases données Utilisation du logiciel Excel pour des analyses simples de bases données Catherine Raux (interne Santé Publique) et Benoît Lepage (AHU), Service d Epidémiologie du CHU de Toulouse Version 1.1 Avril 2012

Plus en détail

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

NOTE SUR LA MODELISATION DU RISQUE D INFLATION NOTE SUR LA MODELISATION DU RISQUE D INFLATION 1/ RESUME DE L ANALYSE Cette étude a pour objectif de modéliser l écart entre deux indices d inflation afin d appréhender le risque à très long terme qui

Plus en détail

1ES Février 2013 Corrigé

1ES Février 2013 Corrigé 1ES Février 213 Corrigé Exercice 1 Le tableau ci-dessous renseigne sur les besoins en eau dans le monde : Population mondiale (Milliards d habitants) Volume moyen par habitant ( ) 195 2,5 4 1 197 3,6 5

Plus en détail

Introduction à l'analyse statistique des données

Introduction à l'analyse statistique des données INTRODUCTION À L'ANALYSE STATISTIQUE DES DONNÉES CONCEPTS DE BASE Un certain nombre de concepts, préalables indispensables à la compréhension des analyses présentées, sont définis ici. De même pour quelques

Plus en détail

UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire 2013 2014 MATHS/STATS. 1 Généralités sur les tests statistiques 2

UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire 2013 2014 MATHS/STATS. 1 Généralités sur les tests statistiques 2 UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire 2013 2014 Master d économie Cours de M. Desgraupes MATHS/STATS Document 4 : Les tests statistiques 1 Généralités sur les tests

Plus en détail

SESSION 2014 MATHÉMATIQUES. Série : SCIENCES ET TECHNOLOGIES DU MANAGEMENT ET DE LA GESTION STMG. DURÉE DE L ÉPREUVE : 3 heures COEFFICIENT : 3

SESSION 2014 MATHÉMATIQUES. Série : SCIENCES ET TECHNOLOGIES DU MANAGEMENT ET DE LA GESTION STMG. DURÉE DE L ÉPREUVE : 3 heures COEFFICIENT : 3 BACCALAURÉAT TECHNOLOGIQUE SESSION 2014 MATHÉMATIQUES Série : SCIENCES ET TECHNOLOGIES DU MANAGEMENT ET DE LA GESTION STMG DURÉE DE L ÉPREUVE : 3 heures COEFFICIENT : 3 Calculatrice autorisée, conformément

Plus en détail

Fonctions homographiques

Fonctions homographiques Fonctions homographiques On donne ci-dessous deux définitions des fonctions homographiques, et on montre que ces deux définitions sont équivalentes. On décrit la courbe représentative d une fonction homographique.

Plus en détail

Rapport. Analyse scientifique du basic-check

Rapport. Analyse scientifique du basic-check Rapport Analyse scientifique du basic-check Suisse romande Mars 2009 Donneur d ordre Urs Martini, CEO basic-check sa Tellistrasse 58 5004 Aarau info@basic-check.ch www.basic-check.ch Auteur Dr. Daniel

Plus en détail

En 2005, année de sa création, un club de randonnée pédestre comportait 80 adhérents. Chacune des années suivantes on a constaté que :

En 2005, année de sa création, un club de randonnée pédestre comportait 80 adhérents. Chacune des années suivantes on a constaté que : Il sera tenu compte de la présentation et de la rédaction de la copie lors de l évaluation finale. Les élèves n ayant pas la spécialité mathématique traiteront les exercices 1, 2,3 et 4, les élèves ayant

Plus en détail

Collecter des informations statistiques

Collecter des informations statistiques Collecter des informations statistiques FICHE MÉTHODE A I Les caractéristiques essentielles d un tableau statistique La statistique a un vocabulaire spécifique. L objet du tableau (la variable) s appelle

Plus en détail

Extraction d informations stratégiques par Analyse en Composantes Principales

Extraction d informations stratégiques par Analyse en Composantes Principales Extraction d informations stratégiques par Analyse en Composantes Principales Bernard DOUSSET IRIT/ SIG, Université Paul Sabatier, 118 route de Narbonne, 31062 Toulouse cedex 04 dousset@irit.fr 1 Introduction

Plus en détail

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé A. P. M. E. P. Exercice 1 5 points 1. Réponse d. : 1 e Le coefficient directeur de la tangente est négatif et n est manifestement pas 2e

Plus en détail

Statistiques à une variable

Statistiques à une variable Statistiques à une variable Objectif : connaissances des termes et formules statistiques Acquis : Programme de seconde professionnelle. 1/ Généralités : Exploitation d une base de données. Vie économique

Plus en détail

Questions pratiques 4: Transformer la variable dépendante

Questions pratiques 4: Transformer la variable dépendante Questions pratiques 4: Transformer la variable dépendante Jean-François Bickel Statistique II SPO8 Transformer une variable consiste en une opération arithmétique qui vise à construire une nouvelle variable

Plus en détail

Définition 0,752 = 0,7 + 0,05 + 0,002 SYSTÈMES DE NUMÉRATION POSITIONNELS = 7 10 1 + 5 10 2 + 2 10 3

Définition 0,752 = 0,7 + 0,05 + 0,002 SYSTÈMES DE NUMÉRATION POSITIONNELS = 7 10 1 + 5 10 2 + 2 10 3 8 Systèmes de numération INTRODUCTION SYSTÈMES DE NUMÉRATION POSITIONNELS Dans un système positionnel, le nombre de symboles est fixe On représente par un symbole chaque chiffre inférieur à la base, incluant

Plus en détail

VI. Tests non paramétriques sur un échantillon

VI. Tests non paramétriques sur un échantillon VI. Tests non paramétriques sur un échantillon Le modèle n est pas un modèle paramétrique «TESTS du CHI-DEUX» : VI.1. Test d ajustement à une loi donnée VI.. Test d indépendance de deux facteurs 96 Différentes

Plus en détail

Outils Statistiques du Data Mining

Outils Statistiques du Data Mining Outils Statistiques du Data Mining Pr Roch Giorgi roch.giorgi@univ-amu.fr SESSTIM, Faculté de Médecine, Aix-Marseille Université, Marseille, France http://sesstim-orspaca.org http://optim-sesstim.univ-amu.fr

Plus en détail

Complément d information concernant la fiche de concordance

Complément d information concernant la fiche de concordance Sommaire SAMEDI 0 DÉCEMBRE 20 Vous trouverez dans ce dossier les documents correspondants à ce que nous allons travailler aujourd hui : La fiche de concordance pour le DAEU ; Page 2 Un rappel de cours

Plus en détail

1 Grad Info Soir Langage C - Juin 2006

1 Grad Info Soir Langage C - Juin 2006 1 Grad Info Soir Langage C - Juin 2006 1. Explications L'examen comprend 3 parties - un programme à réaliser à domicile - une partie écrite qui comprend un certain nombre de petits paragraphes de code

Plus en détail

(Statistical Package for the Social Sciences)

(Statistical Package for the Social Sciences) Initiation à l utilisation de SPSS (Statistical Package for the Social Sciences) 1 SPSS 2 3 Plan de l exposé Faire une recherche (bibliographique) sur le test; Définir le test à mesurer; Expliquer les

Plus en détail

Leçon N 4 : Statistiques à deux variables

Leçon N 4 : Statistiques à deux variables Leçon N 4 : Statistiques à deux variables En premier lieu, il te faut relire les cours de première sur les statistiques à une variable, il y a tout un langage à se remémorer : étude d un échantillon d

Plus en détail

Exercice 1 Métropole juin 2014 5 points

Exercice 1 Métropole juin 2014 5 points Le sujet comporte 6 pages. Seule l annexe est à rendre avec la copie. BAC BLANC MATHÉMATIQUES TERMINALE STMG Durée de l épreuve : 3 heures Les calculs doivent être détaillés. Les calculatrices sont autorisées,

Plus en détail

Principe des tests statistiques

Principe des tests statistiques Principe des tests statistiques Jean Vaillant Un test de signification est une procédure permettant de choisir parmi deux hypothèses celles la plus probable au vu des observations effectuées à partir d

Plus en détail

UE ADP1 Durée de l'épreuve : 1 heure 30 mn. Aucun document n'est autorisé. Seule la calculette (sans sa documentation) est autorisée.

UE ADP1 Durée de l'épreuve : 1 heure 30 mn. Aucun document n'est autorisé. Seule la calculette (sans sa documentation) est autorisée. Université René Descartes- Paris V Licence de Psychologie Année L1, Semestre S1-2005 /2006 Page 1/5 UE ADP1 Durée de l'épreuve : 1 heure 30 mn. Aucun document n'est autorisé. Seule la calculette (sans

Plus en détail

Lycée Fénelon Sainte-Marie Préparation Science-Po/Prépa HEC

Lycée Fénelon Sainte-Marie Préparation Science-Po/Prépa HEC Lycée Fénelon Sainte-Marie Préparation Science-Po/Prépa HEC Dénombrement et probabilités Version du juillet 05 Enoncés Exercice - YouTube Sur YouTube, les vidéos sont identifiées à l aide d une chaîne

Plus en détail

Régression linéaire et corrélation

Régression linéaire et corrélation CHAPITRE 10 Régression linéaire et corrélation 1. Introduction Dans ce chapitre, nous regarderons comment vérifier si une variable à un influence sur une autre variable afin de prédire une des variables

Plus en détail

Courbes représentatives de fonctions

Courbes représentatives de fonctions Courbes représentatives de fonctions I) Définitions. Soit une fonction définie sur un intervalle, à valeurs dans. 1) Graphe de la fonction. a) Définition. Le graphe de la fonction est l ensemble des couples

Plus en détail

Analyse factorielle des correspondances de Benzécri

Analyse factorielle des correspondances de Benzécri Analyse factorielle des correspondances de Benzécri One Pager Décembre 2013 Vol. 8 Num. 011 Copyright Laréq 2013 http://www.lareq.com Analyse Factorielle des Correspondances de Benzécri Une illustration

Plus en détail

ECHANTILLONNAGES Fiche de repérage

ECHANTILLONNAGES Fiche de repérage M Objectifs pédagogiques généraux : Fiche de repérage Type : Activité d approche de la notion de fluctuation d échantillonnage et d intervalle de confiance à travers quelques simulations. Niveau : Lycée

Plus en détail

Conversion d un entier. Méthode par soustraction

Conversion d un entier. Méthode par soustraction Conversion entre bases Pour passer d un nombre en base b à un nombre en base 10, on utilise l écriture polynomiale décrite précédemment. Pour passer d un nombre en base 10 à un nombre en base b, on peut

Plus en détail

NOTION DE CORRELATION

NOTION DE CORRELATION Coefficient de de Bravais-Pearson, ou encore linéaire. Le permet de mesurer la liaison ou le lien entre 2 ensembles de données. Par exemple : -Existe-t-il un lien entre le fait que les enfants mangent

Plus en détail

Ressources pour le lycée technologique

Ressources pour le lycée technologique éduscol Enseignement de mathématiques Classe de première STMG Ressources pour le lycée technologique Dérivation : Approximation affine et applications aux évolutions successives Contexte pédagogique Objectifs

Plus en détail

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures) CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un

Plus en détail

Ministère de la Jeunesse et des Sports Institut Royal de Formation des Cadres Département des Sciences de la Vie. A. Arfaoui

Ministère de la Jeunesse et des Sports Institut Royal de Formation des Cadres Département des Sciences de la Vie. A. Arfaoui Ministère de la Jeunesse et des Sports Institut Royal de Formation des Cadres Département des Sciences de la Vie A. Arfaoui PLA Définitions Paramètres marginaux Covariance Coefficient de Corrélation Coefficient

Plus en détail

Cours 2-3 Analyse des données multivariées

Cours 2-3 Analyse des données multivariées Cours 2-3 des données s Ismaël Castillo École des Ponts, 13 Novembre 2012 Plan 1 2 3 4 1. On s intéresse à un jeu de données multi-dimensionel, avec n individus observés et p variables d intérêt ( variables

Plus en détail

Fonctions de plusieurs variables

Fonctions de plusieurs variables Module : Analyse 03 Chapitre 00 : Fonctions de plusieurs variables Généralités et Rappels des notions topologiques dans : Qu est- ce que?: Mathématiquement, n étant un entier non nul, on définit comme

Plus en détail

Lecture graphique. Table des matières

Lecture graphique. Table des matières Lecture graphique Table des matières 1 Lecture d une courbe 2 1.1 Définition d une fonction.......................... 2 1.2 Exemple d une courbe........................... 2 1.3 Coût, recette et bénéfice...........................

Plus en détail

«Monsieur, on fait quoi?»

«Monsieur, on fait quoi?» Nous avons le plaisir aujourd hui de vous proposer une séance de travaux pratiques de statistique, c est-à-dire, une séance où vous allez pouvoir mettre les mains dans le cambouis (dans les données) et

Plus en détail

Baccalauréat ES/L Métropole La Réunion 13 septembre 2013 Corrigé

Baccalauréat ES/L Métropole La Réunion 13 septembre 2013 Corrigé Baccalauréat S/L Métropole La Réunion 13 septembre 2013 Corrigé A. P. M.. P. XRCIC 1 Commun à tous les candidats Partie A 1. L arbre de probabilité correspondant aux données du problème est : 0,3 0,6 H

Plus en détail

FctsAffines.nb 1. Mathématiques, 1-ère année Edition 2007-2008. Fonctions affines

FctsAffines.nb 1. Mathématiques, 1-ère année Edition 2007-2008. Fonctions affines FctsAffines.nb 1 Mathématiques, 1-ère année Edition 2007-2008 Fonctions affines Supports de cours de mathématiques de degré secondaire II, lien hpertete vers la page mère http://www.deleze.name/marcel/sec2/inde.html

Plus en détail

Chapitre 9 ANALYSE MULTIDIMENSIONNELLE

Chapitre 9 ANALYSE MULTIDIMENSIONNELLE Statistique appliquée à la gestion et au marketing http://foucart.thierry.free.fr/statpc Chapitre 9 ANALYSE MULTIDIMENSIONNELLE L analyse des données multidimensionnelles regroupe un ensemble de méthodes

Plus en détail

Le chiffre est le signe, le nombre est la valeur.

Le chiffre est le signe, le nombre est la valeur. Extrait de cours de maths de 6e Chapitre 1 : Les nombres et les opérations I) Chiffre et nombre 1.1 La numération décimale En mathématique, un chiffre est un signe utilisé pour l'écriture des nombres.

Plus en détail

Baccalauréat ST2S Antilles-Guyane 16 juin 2014 Correction

Baccalauréat ST2S Antilles-Guyane 16 juin 2014 Correction Baccalauréat ST2S Antilles-Guyane 16 juin 2014 Correction EXERCICE 1 6 points Le tableau ci-dessous donne le nombre de maladies professionnelles ayant entrainé un arrêt de travail de 2003 à 2010 : Année

Plus en détail

Devoir maison Info 2 A rendre pour le 15 décembre au plus tard

Devoir maison Info 2 A rendre pour le 15 décembre au plus tard Devoir maison Info 2 A rendre pour le 15 décembre au plus tard Exercice 1 : Exécutez un algorithme Considérez l algorithme suivant. Variables A, B, C en Entier; Début Lire A; Lire B; TantQue B 0 C A; TantQue

Plus en détail

Seconde Généralités sur les fonctions Exercices. Notion de fonction.

Seconde Généralités sur les fonctions Exercices. Notion de fonction. Seconde Généralités sur les fonctions Exercices Notion de fonction. Exercice. Une fonction définie par une formule. On considère la fonction f définie sur R par = x + x. a) Calculer les images de, 0 et

Plus en détail

Compte rendu de LA37 B, TP numéro 1. Evolution de la température et du degrée d'hydratation

Compte rendu de LA37 B, TP numéro 1. Evolution de la température et du degrée d'hydratation 4 6 8 2 4 8 22 26 3 34 38 42 46 5 54 58 62 66 7 74 78 83 89 96 8 44 Bertin Morgan Compte rendu de LA37 B, TP numéro. Les essais effectués par le laboratoire des ponts et chaussés nous ont fournis la température

Plus en détail