CUEEP Département Mathématiques E903 Corrélation p1/12

Documents pareils
Leçon N 4 : Statistiques à deux variables

EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)

Annexe commune aux séries ES, L et S : boîtes et quantiles

Activité 11 : Nuage de points ou diagramme de dispersion

Création d un formulaire de contact Procédure

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

Logiciel XLSTAT version rue Damrémont PARIS

Fonctions linéaires et affines. 1 Fonctions linéaires. 1.1 Vocabulaire. 1.2 Représentation graphique. 3eme

SOMMAIRE OPÉRATIONS COURANTES OPÉRATIONS D INVENTAIRE

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)

Chapitre 3. Les distributions à deux variables

Baccalauréat ES Amérique du Nord 4 juin 2008

EXCEL PERFECTIONNEMENT SERVICE INFORMATIQUE. Version /11/05

manuellement. Le prototype ayant obtenu des résultats satisfaisants aux différents essais de labour est validé sur le plan suivant :

REPUBLIQUE ALGERIENNE DEMOCRATIQUE ET POPULAIRE MINISTERE DE LA FORMATION PROFESSIONNELLE. Microsoft. Excel XP

données en connaissance et en actions?

Fête de la science Initiation au traitement des images

Relation entre deux variables : estimation de la corrélation linéaire

Sillage Météo. Notion de sillage

Chapitre 3 : Le budget des ventes. Marie Gies - Contrôle de gestion et gestion prévisionnelle - Chapitre 3

CREATION D UNE EVALUATION AVEC JADE par Patrick RUER (

Exercice 6 Associer chaque expression de gauche à sa forme réduite (à droite) :

Fonctions de deux variables. Mai 2011

FctsAffines.nb 1. Mathématiques, 1-ère année Edition Fonctions affines

F7n COUP DE BOURSE, NOMBRE DÉRIVÉ

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES

Statistiques à deux variables

Activités numériques [13 Points]

LE BUDGET DES VENTES

L inégale répartition de l énergie solaire est à l origine des courants atmosphériques

SINE QUA NON. Découverte et Prise en main du logiciel Utilisation de bases

Deux disques dans un carré

Etude de fonctions: procédure et exemple

Chapitre 5. Calculs financiers. 5.1 Introduction - notations

Infolettre #18 : Les graphiques avec Excel 2010

NOTICE D INSTALLATION ET D UTILISATION DE LIVE BACKUP

Statistique Descriptive Élémentaire

Formation tableur niveau 1 (Excel 2013)

TP Blender n 2 : Importation d un modèle SketchUp et animation

CUEEP Département Mathématiques E 821 : Problèmes du premier degré 1/27

Chapitre 4: Dérivée d'une fonction et règles de calcul

Programmation linéaire

Statistique : Résumé de cours et méthodes

Optimisation, traitement d image et éclipse de Soleil

Manuel d Utilisateur - Logiciel ModAFi. Jonathan ANJOU - Maud EYZAT - Kévin NAVARRO

Note de service À : De :

Calculs de probabilités avec la loi normale

TP 7 : oscillateur de torsion

Théorie et codage de l information

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007

Cours 7 : Utilisation de modules sous python

Chafa Azzedine - Faculté de Physique U.S.T.H.B 1

Rappels sur les suites - Algorithme

1. Vocabulaire : Introduction au tableau élémentaire

2010 Minitab, Inc. Tous droits réservés. Version Minitab, le logo Minitab, Quality Companion by Minitab et Quality Trainer by Minitab sont des

L ALGORITHMIQUE. Algorithme

Table des matières. Table des matières

Table des matières. I Mise à niveau 11. Préface

Cours pratique Excel. Dans chacune des feuilles, les donnés sont déjà entrées afin de gagner du temps.

Probabilité. Table des matières. 1 Loi de probabilité Conditions préalables Définitions Loi équirépartie...

Plan. 5 Actualisation. 7 Investissement. 2 Calcul du taux d intérêt 3 Taux équivalent 4 Placement à versements fixes.

Comment insérer une image de fond?

INTRODUCTION. A- Modélisation et paramétrage : CHAPITRE I : MODÉLISATION. I. Paramétrage de la position d un solide : (S1) O O1 X

Chapitre 0 Introduction à la cinématique

Classe de première L

Faire un semi variograme et une carte krigée avec surfer

SOMMAIRE. 1. Préambule Le calendrier Trajectoire d un objet lancé Régression linéaire...9

GUIDE Excel (version débutante) Version 2013

Utilisation du module «Geostatistical Analyst» d ARCVIEW dans le cadre de la qualité de l air

1- Enregistrer le nouveau planning

EVALUATION À 360 Demonstration MICHEL DUPONT RAPPORT PERSONNEL 360. rapport généré:

LibreOffice Calc : introduction aux tableaux croisés dynamiques

Définir la gestion de projets 11. Exploiter les techniques de gestion de projets 11. Planifier un projet 12. Lister les tâches et les jalons 13

TABLE DES MATIERES. C Exercices complémentaires 42

Cours d Analyse. Fonctions de plusieurs variables

FORMULAIRE DE STATISTIQUES

Chapitre 02. La lumière des étoiles. Exercices :

TSTT ACC OUTILS DE GESTION COMMERCIALE FICHE 1 : LES MARGES

Chapitre 1 Régime transitoire dans les systèmes physiques

Plus courts chemins, programmation dynamique

AUTRES ASPECTS DU GPS. Partie I : tolérance de Battement Partie II : tolérancement par frontières

EXCEL Les tableaux croisés dynamiques

Temps forts départementaux. Le calcul au cycle 2 Technique opératoire La soustraction

Notion de fonction. Résolution graphique. Fonction affine.

L analyse boursière avec Scilab

Analyse en Composantes Principales

Découverte du logiciel ordinateur TI-n spire / TI-n spire CAS

Nombre dérivé et tangente

Techniques d interaction dans la visualisation de l information Séminaire DIVA

L assurance de la qualité à votre service

EXCEL PERFECTIONNEMENT CALCULS AVANCES

TUTORIAL 1 ETUDE D UN MODELE SIMPLIFIE DE PORTIQUE PLAN ARTICULE

Manuel de formation Spaceman 1 ère journée

Création de Site Web. Atelier Cyber-Base Emploi Pays Beaujolais

La place de SAS dans l'informatique décisionnelle

Premiers pas avec SES-Pegase (version 7.0) SES : Un Système Expert pour l analyse Statistique des données. Premiers pas avec SES-Pegase 1

1 Presentation du bandeau. 2 Principe de création d un projet : C2 industrialisation Apprendre Gantt project Ver 2.6 planifier

Transcription:

La corrélation Pré requis Notion qualitative de corrélation par interprétation de nuage de points Ajustement linéaire par la méthode des moindres carrés Formalisme Droite de régression Dans la réalisation d'un ajustement linéaire, on cherche à rendre minimale la somme des carrés des écarts Mi Pi afin d'obtenir la droite D d'équation y = ax + b. y est exprimé en fonction de x Dans l ajustement linéaire les deux variables x et y n ont pas un rôle symétrique. Il y a une «entrée» x et une «sortie» y. Dans de nombreux cas, cette orientation a un sens concret car une des variables est explicative de l autre ou il y a une causalité sous jacente. Exemples : âge poids Frais de publicité volume des ventes Année chiffre d affaires Mais dans d autres cas le problème n est pas orienté et les deux variables peuvent alternativement jouer le rôle d»entrée» et de «sortie» Exemple : taille poids CUEEP Département Mathématiques E903 Corrélation p1/12

On peut ainsi définir de la même façon une droite d'ajustement D' telle que la somme des carrés des écarts MiQi soit minimale. On cherche alors la droite D' (x en fonction de y) d'équation x = a y + b Cette droite D' s'appelle la droite de régression de x par rapport à y. et D s'appelle la droite de régression de y par rapport à x. CUEEP Département Mathématiques E903 Corrélation p2/12

Corrélation linéaire Le coefficient de corrélation linéaire est défini par r = aa ' a et a étant les coefficients directeurs respectifs des droites D et D', on les détermine par les formules : a = ( xi x)( y ( x x)² i i y) a' = ( xi x)( y ( y i i y)² y) Le coefficient de corrélation mesure l'écart entre les 2 droites de régression D et D'. r est toujours compris entre -1 et + 1. Il sera positif si les variables varient dans le même sens, négatif si elles varient en sens contraire. Plus le coefficient se rapproche de 1 ou -1 meilleure est la corrélation. CUEEP Département Mathématiques E903 Corrélation p3/12

a) r = 1 (ou r = -1) : Les points sont alignés sur une droite ascendante (respectivement descendante) et traduisent donc une variation des 2 variables dans le même sens (respectivement de sens contraire). CUEEP Département Mathématiques E903 Corrélation p4/12

b) r est proche de 1 (respectivement -1) : les 2 variables x et y montrent une liaison marquée et croissante (respectivement décroissante). La régression est dans ce cas intéressante. On dit qu'il existe une forte corrélation entre x et y. CUEEP Département Mathématiques E903 Corrélation p5/12

c) r = 0 ou proche de 0 : Il y a absence de liaison linéaire ; la régression est alors peu justifiée. La dispersion des points Mi est dans ce cas maximale. Quand r = 0 les droites D et D sont perpendiculaires y Rappelons qu il ne faut pas confondre absence de corrélation linéaire et absence de toute corrélation. Il se peut que les points s organisent autour d une courbe (parabole, exponentielle..). Dans ce cas on se ramène par un changement de variable à un ajustement linéaire soit en utilisant du papier fonctionnel (semi log, log log, gausso arithmétique) Remarque : Un fort coefficient de corrélation n'implique par l'existence d'un lien de causalité entre les 2 variables. Les variations de ces 2 variables peuvent notamment être conséquence toutes deux des variations d'une 3ème variable (ex les ventes de lunettes de soleil et les ventes de glaces). Elles peuvent aussi n'avoir aucun lien logique entre elles. En matière de corrélation, il faut donc se montrer extrêmement prudent quant aux conclusions relatives aux liens qui unissent éventuellement les 2 phénomènes étudiés. x CUEEP Département Mathématiques E903 Corrélation p6/12

Exercice d application Situation : Le lancer de poids Rependre l exemple du lancer de poids des gauchers. Adolescent Bras gauche Bras droit 1 5,1 4,5 2 6,2 5,5 3 6,8 5,2 4 5,5 4,3 5 6,6 5,1 6 5,8 4,6 7 7,2 6 8 5,5 4,5 9 5,7 4,5 10 6,7 5,8 Déterminer s il y a une bonne corrélation entre le lancer du bras gauche et le lancer du bras droit CUEEP Département Mathématiques E903 Corrélation p7/12

Corrigé Dans ce cas, la variable x sera le lancer du bras gauche et la variable y sera le lancer du bras droit. Il faut d abord calculer x et y x = 6,11 et y = 5 On organise les calculs dans le tableau suivant : x y ( x i x)² ( y i y)² ( xi x)( yi y) 5,1 4,5 1,0201 0,25 0,505 6,2 5,5 0,0081 0,25 0,045 6,8 5,2 0,4761 0,04 0,138 5,5 4,3 0,3721 0,49 0,427 6,6 5,1 0,2401 0,01 0,049 5,8 4,6 0,0961 0,16 0,124 7,2 6 1,1881 1 1,09 5,5 4,5 0,3721 0,25 0,305 5,7 4,5 0,1681 0,25 0,205 6,7 5,8 0,3481 0,64 0,472 4,289 3,34 3,36 La dernière ligne indique la somme des colonnes : 3,36 a = 0,7834 a' = 4,289 3,36 3,34 1,006 CUEEP Département Mathématiques E903 Corrélation p8/12

9 y : bras droit 9 x : bras gauche 8 7 8 7 x= 1,006y + 1,0801 6 6 5 y = 0,7834x + 0,2134 5 4 4 3 3 2 2 1 x : bras gauche 1 y : bras droit 0 1 2 3 4 5 6 7 8 9 10 11 0 1 2 3 4 5 6 7 8 9 10 11 droite D de régression du bras droit en fonction du bras gauche droite D de régression du bras gauche en fonction du bras droit Si on superpose les deux droites dans le même repère, l angle formé par les deux droites n est pas très important : CUEEP Département Mathématiques E903 Corrélation p9/12

9 y : bras droit 8 7 6 5 G 4 3 2 1 0 1 x : bras gauche 2 3 4 5 6 7 8 9 10 11 r = aa' = 0,7834 1,006 0,89 Le coefficient de corrélation a une valeur assez proche de 1, on peut dire qu il y a une corrélation significative entre les deux lancers. Interprétation du coefficient Si votre calculatrice vous permet de faire des statistiques à 2 variables, vous avez la possibilité de visualiser le coefficient r. CUEEP Département Mathématiques E903 Corrélation p10/12

Le logiciel Excel vous fournit quant à lui r² (coefficient de détermination). Il suffit pour cela lors de l insertion de la courbe de tendance de cocher dans la rubrique «options» la case «Afficher le coefficient de détermination (R²) sur le graphique» CUEEP Département Mathématiques E903 Corrélation p11/12

Si on mélange les deux populations droitiers et gauchers on obtient le graphique suivant : Mélange droitiers et gauchers 7,5 7 6,5 6 gauchers 5,5 5 4,5 4 3,5 3 4 4,5 5 5,5 6 6,5 7 7,5 droitiers Dans ce cas les points sont trop dispersés et on ne peut pas faire d ajustement. Noter que l on retrouve visuellement les deux sous populations. Dans tout ajustement vérifier qu on a bien affaire à une même population et qu il n y a pas une variable cachée qui partagerait la population en deux ou plusieurs sous populations (exemple : filles et garçons droitier ou gauchers ) CUEEP Département Mathématiques E903 Corrélation p12/12