Leçon 2 L analyse de la relation entre 2 variables

Documents pareils
Relation entre deux variables : estimation de la corrélation linéaire

Chapitre 3. Les distributions à deux variables

Logiciel XLSTAT version rue Damrémont PARIS

I. Ensemble de définition d'une fonction

I - PUISSANCE D UN POINT PAR RAPPORT A UN CERCLE CERCLES ORTHOGONAUX POLES ET POLAIRES

Fonctions de deux variables. Mai 2011

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

Fonctions de plusieurs variables

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

FONCTIONS DE PLUSIEURS VARIABLES (Outils Mathématiques 4)

Fonctions homographiques

1. Vocabulaire : Introduction au tableau élémentaire

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)

Comment tracer une droite représentative d'une fonction et méthode de calcul de l'équation d'une droite.

RÉALISATION DE GRAPHIQUES AVEC OPENOFFICE.ORG 2.3

Copropriété: 31, rue des Abondances Boulogne-Billancourt

NOTATIONS PRÉLIMINAIRES

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES

FctsAffines.nb 1. Mathématiques, 1-ère année Edition Fonctions affines

Chapitre 3. Quelques fonctions usuelles. 1 Fonctions logarithme et exponentielle. 1.1 La fonction logarithme

CCP PSI Mathématiques 1 : un corrigé

INTRODUCTION. A- Modélisation et paramétrage : CHAPITRE I : MODÉLISATION. I. Paramétrage de la position d un solide : (S1) O O1 X

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007

Structures algébriques

D.E.S.C.F - UV 1 - Module 8 Consolidation dans les groupes de sociétés. Corrigé - Cas IG/IP/MEE

La problématique des tests. Cours V. 7 mars Comment quantifier la performance d un test? Hypothèses simples et composites

Exercices - Fonctions de plusieurs variables : corrigé. Pour commencer

Chapitre 3 : Le budget des ventes. Marie Gies - Contrôle de gestion et gestion prévisionnelle - Chapitre 3

Introduction : Cadkey

Théorie et codage de l information

1 Complément sur la projection du nuage des individus

Raisonnement par récurrence Suites numériques


Système binaire. Algèbre booléenne

Statistiques à deux variables

DÉRIVÉES. I Nombre dérivé - Tangente. Exercice 01 (voir réponses et correction) ( voir animation )

Exposing a test of homogeneity of chronological series of annual rainfall in a climatic area. with using, if possible, the regional vector Hiez.

TESTS D'HYPOTHESES Etude d'un exemple

Formes quadratiques. 1 Formes quadratiques et formes polaires associées. Imen BHOURI. 1.1 Définitions

Leçon N 4 : Statistiques à deux variables

Régime de retraite patronal-syndical (Québec) de l'association internationale des machinistes (A.I.M.)

L'équilibre général des échanges

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Continuité et dérivabilité d une fonction

Sites web éducatifs et ressources en mathématiques

- un jeu de K cartes représentées par des nombres C 1, C 2 à C K avec K entier strictement

Statistique Descriptive Élémentaire

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

Introduction. I Étude rapide du réseau - Apprentissage. II Application à la reconnaissance des notes.

CAPTEURS - CHAINES DE MESURES

Les travaux doivent être remis sous forme papier.

EXCEL PERFECTIONNEMENT CALCULS AVANCES

Cours 7 : Utilisation de modules sous python

1 EVALUATION DES OFFRES ET NEGOCIATIONS

SOMMAIRE. 1. Préambule Le calendrier Trajectoire d un objet lancé Régression linéaire...9

3. Faut-il établir un autre document de vente lors de la vente d'un véhicule de seconde main?

MESURE DE LA TEMPERATURE

DUT Techniques de commercialisation Mathématiques et statistiques appliquées

Chp. 4. Minimisation d une fonction d une variable

AFFAIBLISSEMENT DÛ AUX NUAGES ET AU BROUILLARD

Chapitre 0 Introduction à la cinématique

TOUT CE QU IL FAUT SAVOIR POUR LE BREVET

Mortalité observée et mortalité attendue au cours de la vague de chaleur de juillet 2006 en France métropolitaine

Systèmes de transmission

TEMPÉRATURE DE SURFACE D'UNE ÉTOILE

Exo7. Calculs de déterminants. Fiche corrigée par Arnaud Bodin. Exercice 1 Calculer les déterminants des matrices suivantes : Exercice 2.

S'orienter et se repérer sur le terrain avec une carte

Les algorithmes de base du graphisme

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé

TD1 Signaux, énergie et puissance, signaux aléatoires

Limites finies en un point

AP Formation 14, rue Pierre BAYLE T OULOUSE

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable T : pour travailler et mémoriser le cours

Les pôles commerciaux et leurs magasins

Optimisation Discrète

Chapitre 7 - Relativité du mouvement

Fiche conseil n 16 Audit

Statistiques - Cours. 1. Gén éralités. 2. Statistique descriptive univari ée. 3. Statistique descriptive bivariée. 4. Régression orthogonale dans R².

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

Le défi : L'avantage Videojet :

I- Définitions des signaux.

UEO11 COURS/TD 1. nombres entiers et réels codés en mémoire centrale. Caractères alphabétiques et caractères spéciaux.

ANTISELECTION ET CHOIX D'ASSURANCE : LE CAS DU VOL EN HABITATION UNE APPROCHE DE LA MESURE DU PHENOMENE

M2 IAD UE MODE Notes de cours (3)

Biostatistiques : Petits effectifs

Faciliter l adhésion à une complémentaire santé

Mesurer les altitudes avec une carte

Dérivation : Résumé de cours et méthodes

Chapitre 6. Fonction réelle d une variable réelle

Garde des enfants et droit de visite

Cours d Analyse. Fonctions de plusieurs variables

Dérivées et différentielles des fonctions de plusieurs variables

3 Approximation de solutions d équations

Cours Fonctions de deux variables

modélisation solide et dessin technique

Téléchargement du micrologiciel de téléviseur ACL AQUOS

RÉSOLUTION DE SYSTÈMES À DEUX INCONNUES

Comparaison de fonctions Développements limités. Chapitre 10

Transcription:

Leçon 2 L analyse de la relation entre 2 variables

C est une technique qui permet d'étudier la relation qui pourrait exister entre deux variables X et Y. L analyse porte alors sur une distribution à 2 caractères ou bivariée 2 Tests de corrélation seront évoqués dans ce cours: Corrélation de Pearson Corrélation de Spearman valable pour les variables quantitatives valable pour les variables qualitatives

Le diagramme de corrélation Pour savoir s'il existe une relation entre deux caractères, on établit un diagramme de corrélation, c'est à dire un diagramme croisant les modalités de X et de Y. Chaque élément i est représenté par le point de coordonnées (X i,y i ). L'ensemble des points forme un nuage de points dont la forme permet de caractériser la relation à l'aide de trois critères : - intensité de la relation - forme de la relation - sens de la relation

L'intensité de la relation Une relation est nulle => le nuage de point a le forme d'un carré, d'un cercle sans véritables lignes directrices. Une relation est faible => le nuage de point n'a pas la forme d'une ligne ou d'une courbe, ou seulement de façon très grossière. Une relation est forte => le nuage de point prend alors la forme d'une ligne ou d'une courbe dont les points s'écartent peu.

La forme de la relation Une relation est linéaire si l'on peut trouver une relation entre X et Y de la forme Y=aX+b, => le nuage de point peut s'ajuster correctement à une droite. Une relation est non-linéaire si la relation entre X et Y n'est pas de la forme Y=aX+b, mais de type différent (parabole, hyperbole, sinusoïde, etc). => Le nuage de point présente alors une forme complexe avec des courbures. Une relation non-linéaire est monotone si elle est strictement croissante ou strictement décroissante, c'est-à-dire si elle ne comporte pas de minima ou de maxima.

Le sens de la relation Une relation monotone (linéaire ou non) est positive si les deux caractères varient dans le même sens Une relation monotone est négative si les deux caractères varient en sens inverse

La corrélation linéaire simple Les tests de corrélation simple sont utilisés pour mesurer et tester l intensité de la relation entre deux variables quantitatives. Le coefficient le plus utilisé est le coefficient de corrélation linéaire de Pearson (ou coefficient de Bravais Pearson)

Propriétés et interprétation de r (XY) Ce coefficient varie entre -1 et +1 ; l'intensité de la relation linéaire sera donc d'autant plus forte que la valeur du coefficient est proche de +1 ou de - 1, et d'autant plus faible qu'elle est proche de 0. une valeur proche de +1 montre une forte liaison entre les deux caractères. La relation linéaire est ici croissante (c'est-à-dire que les variables varient dans le même sens) une valeur proche de -1 montre également une forte liaison mais la relation linéaire entre les deux caractères est décroissante (les variables varient dans le sens contraire); une valeur proche de 0 montre une absence de relation linéaire entre les deux caractères. une absence de relation -1-0,5 0 +0,5 +1 Relation de dépendance inverse Relation de dépendance directe

Propriétés et interprétation de r (XY) Le signe de r indique le sens de la relation tandis que la valeur absolue de r indique l'intensité de la relation c'est-àdire la capacité à prédire les valeurs de Y en fonctions de celles de X. Corrélation négative Corrélation positive Nulle Très forte Forte Faible Faible Forte Très forte -1-0,5 0 +0,5 +1 Relation de dépendance inverse Relation de dépendance directe

La formule du coefficient de corrélation linéaire de Bravais-Pearson est la suivante La covariance est la moyenne du produit des écarts à la moyenne.

(Xi-X) (Yi-Y) (Xi-X)x (Xi-Y) La covariance de X et Y étant égal à 64.1 On obtient le coefficient de corrélation de X et de Y en divisant la covariance par le produit de l'écart-type de X et de l'écart-type de Y : r (X,Y) = 64.1 / (2.4 * 32) = +0.83 Nous sommes en présence d'une corrélation positive forte, qui semble indiquer qu'il existe une relation linéaire (de type Y=aX+b) reliant X et Y

Limites du coefficient de Pearson Le coefficient de Pearson peut aboutir à des conclusions erronées sur la présence ou l'absence d'une relation pour mesurer la relation entre deux variables X et Y ne comportant pas de valeur exceptionnelles. L absence d'une relation linéaire ne signifie pas l'absence de toute relation entre les deux caractères étudiés.