La corrélation : présentation et test du coefficient de corrélation de Pearson
|
|
- Sévérine Nadeau
- il y a 7 ans
- Total affichages :
Transcription
1 La corrélation : présentation et test du coefficient de corrélation de Pearson C. Bardel Septembre 26 Master 2 Neurosciences / 38
2 Plan du cours Introduction Mesure de la corrélation : covariance et coefficient de corrélation de Pearson Rappels sur la covariance Le coefficient de corrélation de Pearson Test sur le coefficient de corrélation de Pearson Déroulement du test Réalisation du test avec le logiciel R Test sur le coefficient de corrélation de Spearman 2 / 38
3 Introduction Contexte général d utilisation Étude de la relation entre 2 variables quantitatives Exemples : Taille et poids des enfants entre 5 et 6 ans Âge et fréquence cardiaque Les données n individus Pour chaque sujet : mesure des 2 variables quantitatives X et Y Pour chaque individu i, on a un couple d observations (x i, y i ) correspondant aux valeurs prises par X et Y pour l individu i Attention : les mesures ne sont pas toujours réalisées strictement sur les mêmes individus. Par exemple : Poids des nouveaux-nés et poids de leur mère avant grossesse 3 / 38
4 Différence entre corrélation et régression Corrélation Mesure l association entre 2 variables quantitatives jouant des rôles symétriques Graphiquement, on place indifféremment l une ou l autre variable en abscisse et en ordonnée On recherche s il existe une liaison linéaire entre les 2 variables et à la quantifier Régression Les 2 variables jouent des rôles dissymétriques étude des variations de l une (Y) en fonction de l autre (X) X = variable explicative = variable indépendante Y = variable à expliquer = variable dépendante Dans ce cours, on se focalisera sur la corrélation 4 / 38
5 Rappel : notion de covariance Signification intuitive La covariance mesure la variation simultanée de 2 variables Plus elle est élevée (val. abs.), + la liaison entre les variables est forte Définition mathématique Soient X et Y, 2 va quantitatives Espérances : µ X et µ Y Variances : σ 2 X et σ2 Y cov(x, Y ) = E((X µ X )(Y µ Y )) = E(XY ) E(X ) E(Y ) Propriétés cov(x, Y ) = cov(y, X ) cov(x, X ) = var(x ) X et Y indépendantes cov(x, Y ) = Attention, réciproque fausse! 5 / 38
6 Rappel : notion de covariance (2) Calcul de la covariance en statistiques Calcul de la covariance dans une population (description) ( n ) cov(x, Y ) = (x i m x )(y i m y ) n i= Estimation non biaisée de la covariance à partir d un échantillon de n couples de valeurs ( n ) cov(x, Y ) = (x i m x )(y i m y ) n i= 6 / 38
7 Rappel : notion de covariance (3) Interprétation géométrique I. (-) II. (+) A y m Y > Aire A = (x m x ) (y m Y ) m Y III. (+) IV. (-) y m Y < I. et IV. : (x m x ) (y m Y ) < II. et III. : (x m x ) (y m Y ) < La covariance est la moyenne des produits (x m x ) (y m Y ) m X x m X < x m X > 7 / 38
8 Rappels sur la covariance (4) Signe de la covariance Covariance négative Covariance positive Absence de correlation I. (-) II. (+) y my > I. (-) II. (+) y my > I. (-) II. (+) y my > my my my III. (+) IV. (-) y my < III. (+) IV. (-) y my < III. (+) IV. (-) y my < x mx < mx x mx > x mx < mx x mx > x mx < mx x mx > Problème La valeur de la covariance dépend des unités de X et Y 8 / 38
9 Rappel : notion de covariance Exemple : taille et poids de 6 enfants de 6 ans Enfant taille (cm) poids (kg) Comment calculer la covariance? Covariance (description) : cov e = 4.83 cov e > : lorsque la taille, le poids et vice versa taille exprimée en mètres : cov e =.483 Dans un tableur : fonction covar ou covariance (covariance dans la population) Avec R : fonction cov (estimation de la covariance) La covariance ne permet pas d avoir une bonne idée de l intensité de la liaison entre X et Y 9 / 38
10 Coefficient de corrélation de Pearson Définition Estimation de ρ : r r X,Y = r X,Y = ρ X,Y = cov(x, Y ) σ X σ Y i (x i m X )(y i m y ) i (x i m x ) 2 i (y i m Y ) 2 i x iy i ( i x2 i ( i x i ) 2 n i x i n i y i ) ( i y 2 i ( i y i ) 2 n ) Calcul en utilisant un logiciel Avec un tableur : fonction coefficient.correlation Avec R commander : Statistiques Résumés Matrice de corrélations / 38
11 Interprétation du coefficient de corrélation Y Y r< r> X X Corrélation positive Y r= Corrélation négative Absence de corrélation X / 38
12 Interprétation du coefficient de corrélation Y r=.5 Y r=.9 X X Y r= Y r= X La valeur de r indique la force de la liaison linéaire : plus r est proche de, plus la liaison linéaire est forte 2 / 38 X
13 Propriétés du coefficient de corrélation Propriétés ρ X,Y Le coefficient de corrélation fait jouer un rôle symétrique à X et Y : ρ X,Y = ρ Y,X Le coefficient de corrélation s exprime sans unité. Il ne change pas si on change les unités ou l origine des X ou des Y Si X et Y sont indépendantes alors ρ X,Y = La réciproque est fausse, mais... Si (X,Y ) suit une loi binormale et que ρ X,Y = alors X et Y sont indépendantes 3 / 38
14 Quelques cas problématiques () Le coefficient de corrélation est très sensible aux points extrêmes et aux valeurs aberrantes Le point extrême masque la corrélation point extrême r=.9 Le point extrême crée une fausse corrélation extrême r=.946 point 4 / 38
15 Quelques cas problématiques (2) Les mélanges de population peuvent créer de fausses corrélations Ex : corrélation entre taille et longueur de cheveux. facteur de confusion : le sexe Hommes Femmes Le problème des effets de seuil liaison linéaire 5 / 38
16 Quelques cas problématiques (3) Importance de visualiser les données Exemple : le quartet d Anscombe (973) I II III IV x y x y x y x y moy sd r xy / 38
17 Quelques cas problématiques (3) Importance de visualiser les données Exemple : le quartet d Anscombe (973) dataset dataset 2 y y x x2 dataset 3 dataset 4 y y / 38
18 Corrélation et causalité Attention! Une corrélation n implique pas une relation de cause à effet entre l une et l autre des variables Ex : taux de divorce et consommation de Margarine par habitant Source : http :// correlation?id=73 Deux possibilités : Corrélation fortuite Existence d un facteur de confusion Exemple : consommation de glace et la vente de lunettes de soleil 8 / 38
19 Plan du cours Introduction Mesure de la corrélation : covariance et coefficient de corrélation de Pearson Rappels sur la covariance Le coefficient de corrélation de Pearson Test sur le coefficient de corrélation de Pearson Déroulement du test Réalisation du test avec le logiciel R Test sur le coefficient de corrélation de Spearman 9 / 38
20 Rappel : les étapes d un test statistique Réalisation d un test statistique. Identifier le test à réaliser : la question statistique 2. Poser les hypothèses statistiques 3. Vérifier les conditions d application du test 4. Définir la statistique du test et calculer sa valeur dans l échantillon 5. Prendre la décision statistique 6. Conclure 2 / 38
21 Test du coefficient de corrélation de Pearson Le test de nullité du coefficient de corrélation (= test de non corrélation ) La question statistique La question : existe-t il une liaison linéaire entre les 2 variables? Les données : échantillon de n individus pour lesquels on mesure 2 variables Les hypothèses statistiques Elles sont posées sur les valeurs théoriques H : ρ = Absence de liaison linéaire, X et Y sont indépendantes si elles suivent des loi normales H : ρ Existence d une liaison linéaire (ou test unilatéral ρ > ou ρ < ) Étude des données Calcul de l estimation du coefficient de corrélation, r 2 / 38
22 Test du coefficient de corrélation de Pearson (2) Conditions d application du test Indépendance des observations (X, Y) suit une loi binormale En pratique, on vérifie : Indépendance des observations Normalité de X et Y (test de Shapiro-Wilk + qqplot ou histogramme) Représentation graphique du nuage de points pour vérifier la linéarité Si les conditions ne sont pas vérifiées Test non paramétrique sur le coefficient de corrélation de Spearman 22 / 38
23 Test du coefficient de corrélation de Pearson (3) Statistique du test et calcul Statistique du test (R = estimateur de ρ) : R S R Student à n-2 ddl Valeur calculée de la statistique du test : t = r r 2 n 2 Prise de décision statistique et conclusion On lit la valeur seuil t seuil pour (n 2) ddl et un risque α dans la table de Student Si t t seuil Rejet de H, existence d une liaison linéaire significative entre les variables Si t < t seuil Non rejet de H, pas de liaison linéaire 23 / 38
24 Exemple Problème Dosage d une hormone dans le sang et le liquide amniotique (LA) chez 2 femmes enceintes LA (X) Sang (Y) Représentation graphique LA Sang 24 / 38
25 Exemple Problème Dosage d une hormone dans le sang et le liquide amniotique (LA) chez 2 femmes enceintes LA (X) Sang (Y) Existence d une liaison linéaire significative? Calcul de l estimation du coefficient de corrélation i x i iy i x i i y i n ( ) ( i x2 i ( i x i ) 2 ) n i y i 2 ( i y i ) 2 n AN : x = 39, y 2 = , x 2 = 659, xy = 8.7 y = 66.9, r = / 38
26 Exemple (2) Réalisation du test Hypothèses statistiques : H : ρ = H : ρ, existence d une liaison linéaire Conditions : indépendance, binormalité de (X, Y) (cf suivant) Calcul de la valeur de la statistique du test : r =.975, n = 2 t = r r 2 n 2 t 3.9 Lecture de la valeur seuil dans la table de Student : (n-2) = ddl, risque α =.5 : t seuil = Conclusion : t > t seuil, rejet de H Il existe une liaison linéaire statistiquement significative entre la quantité d hormone dans le sang et dans le LA au risque 5% 25 / 38
27 Vérification des hypothèses Hypothèse d indépendance Voir le protocole Normalité La vérification de l hypothèse de binormalité n est pas simple. Le test étant relativement robuste aux écarts à cette hypothèse, on se contente souvent de : Vérifier la normalité de X et Y (qq-plot, histogramme, test de Shapiro-Wilk) Vérifier que la relation entre X et Y est linéaire (graphique) 26 / 38
28 Réalisation du test avec R Calcul du coefficient de corrélation Statistiques Résumés Matrice de corrélations LA Sang Vérification des hypothèses : normalité des distributions Statistiques Résumés Test de normalité de Shapiro-Wilk Shapiro-Wilk normality test data: la W =.976, p-value =.966 Shapiro-Wilk normality test data: s W =.9535, p-value = / 38
29 Réalisation du test avec R (2) Vérification des hypothèses de normalité LA Sang norm quantiles norm quantiles 28 / 38
30 Réalisation du test avec R (3) Test de non corrélation Statistiques Résumés Test de corrélation Pearson s product-moment correlation data: la and s t = 3.969, df =, p-value = 7.69e-8 alternative hypothesis: true correlation is not equal to 95 percent confidence interval: sample estimates: cor Conclusion Rejet de H au risque α = 5% Il existe une liaison linéaire statistiquement significative entre la quantité d hormone dans le sang et dans le liquide amniotique au risque 5%. 29 / 38
31 Autres tests sur le coefficient de corrélation de Pearson Tests possibles Comparaison de ρ à une autre valeur que zéro Comparaison de 2 coefficients de corrélation Principe des tests ( ) Réaliser la transformation de Fisher : Z = 2 ln +R R Z suit approximativement une loi normale de variance n 3 3 / 38
32 Le coefficient de corrélation des rangs de Spearman Contexte d utilisation Conditions de binormalité non respectée Variables ordinales Utilisation d un test non paramétrique, basé sur les rangs des valeurs Définition du coefficient de corrélation de Spearman Pas d hypothèse sur les distributions Classement des valeurs x i et y i par ordre croissant Définition les rangs x i et y i de chaque couple de valeur En cas d ex-aecquo, on attribue le rang moyen r s = 6 i (x i y i )2 n(n 2 ) Estimation de l écart-type du coefficient de corrélation de Spearman rs 2 s r = n 2 3 / 38
33 Test sur le coefficient de Spearman Déroulement du test Hypothèses statistiques H : ρ s =, pas de corrélation H : ρs, existence d une corrélation (hypothèses unilatérales possibles corrélation positive ou négative) Conditions d application du test : pas de conditions Valeur de la variable de décision (cas n ) t = r s s r Sous H, la variable de décision T Student à (n-2) ddl Conclusion (Cas n ) Si t t α (n 2) Rejet de H, existence d une liaison linéaire significative entre les variables (n 2) Si t < t α Non rejet de H, pas de liaison linéaire Remarque : si n<, on utilise directement une table du ρ S de Spearman 32 / 38
34 Exemple Les données Poids de naissance de nouveaux nés et nombre de cigarettes fumées par jour par leur mère pendant les 2 premiers mois de grossesse. Pds (g) Nb cig Calcul du r s r s = 6 i (x i y i )2 n(n 2 ) Pds (g) Nb cig x i y i (x i y i ) r s = ( ) = / 38
35 Exercice (2) Déroulement du test Hypothèses statistiques H : ρs = H : ρ S Pas de conditions particulières Valeur de la variable de décision : t = Valeur seuil : t 8.5 = (.6727) Conclusion : t > t.5 8 Rejet de H Il existe une corrélation significative entre le poids de naissance et le nombre de cigarettes fumées par la mère pendant les 2 premiers mois de grossesse. 34 / 38
36 p Réalisation du test en R Calcul du coefficient de corrélation de Spearman > cor(p, nb, method="spearman") nb Réalisation du test (Package stats : fonction cor.test) > cor.test(p, nb, method="spearman") Spearman s rank correlation rho data: p and nb S = 276, p-value =.3938 alternative hypothesis: true rho is not equal to sample estimates: rho / 38
37 Réalisation du test en R (2) Réalisation du test (Package pspearman, fonction spearman.test) > spearman.test(p, nb, approximation = "exact") Spearman s rank correlation rho data: p and nb S = 276, p-value =.3897 alternative hypothesis: true rho is not equal to sample estimates: rho Différence avec la fonction précédente : Meilleures approximations pour le calcul de la p-value Choix de l approximation : distribution exacte (pour n<22) : exact p =.3897 approximation AS89 : AS89 p =.3938 (cf cor.test) approximation de Student : t-distribution p = / 38
38 Autre test Test sur le τ de Kendall Test non paramétrique, équivalent au ρ de Spearman Peut être calculé en R avec la fonction cor (method= kendall ) Test du τ de Kendall implémenté dans la fonction cor.test D autres packages proposent ce test, voir l aide de la fonction cor.test pour les références 37 / 38
39 Conclusion Résumé des principales notions à retenir Covariance : définition et interprétation Coefficient de corrélation de Pearson : Mesure l intensité et le signe de la liaison linéaire entre 2 variables quantitatives Plus r est proche de, plus la liaison linéaire est forte Ne pas confondre corrélation et causalité Compétences à acquérir Savoir tester s il existe une liaison linéaire significative Choisir entre le test de Pearson et de Spearman Réalisation du test Source : http ://xkcd.com/552/ 38 / 38
Introduction à la statistique non paramétrique
Introduction à la statistique non paramétrique Catherine MATIAS CNRS, Laboratoire Statistique & Génome, Évry http://stat.genopole.cnrs.fr/ cmatias Atelier SFDS 27/28 septembre 2012 Partie 2 : Tests non
Plus en détailRelation entre deux variables : estimation de la corrélation linéaire
CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence
Plus en détailTests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE
Chapitre 5 UE4 : Biostatistiques Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés.
Plus en détailLire ; Compter ; Tester... avec R
Lire ; Compter ; Tester... avec R Préparation des données / Analyse univariée / Analyse bivariée Christophe Genolini 2 Table des matières 1 Rappels théoriques 5 1.1 Vocabulaire....................................
Plus en détaildistribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position
Arbre de NESI distribution quelconque Signe 1 échantillon distribution symétrique non gaussienne Wilcoxon gaussienne Student position appariés 1 échantillon sur la différence avec référence=0 2 échantillons
Plus en détailTests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique»
Tests de comparaison de moyennes Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Test de Z ou de l écart réduit Le test de Z : comparer des paramètres en testant leurs différences
Plus en détailChapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE
UE4 : Biostatistiques Chapitre 3 : Principe des tests statistiques d hypothèse José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Introduction
Plus en détailChapitre 3. Les distributions à deux variables
Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles
Plus en détailCours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES
LES STATISTIQUES INFERENTIELLES (test de Student) L inférence statistique est la partie des statistiques qui, contrairement à la statistique descriptive, ne se contente pas de décrire des observations,
Plus en détailCONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)
CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un
Plus en détailStatistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année 2010-2011
Master 1 Biologie et technologie du végétal Année 010-011 Statistiques Rappels de cours et travaux dirigés (Seul ce document sera autorisé en examen) auteur : Jean-Marc Labatte jean-marc.labatte@univ-angers.fr
Plus en détailIntroduction aux Statistiques et à l utilisation du logiciel R
Introduction aux Statistiques et à l utilisation du logiciel R Christophe Lalanne Christophe Pallier 1 Introduction 2 Comparaisons de deux moyennes 2.1 Objet de l étude On a mesuré le temps de sommeil
Plus en détailExercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015
Exercices M1 SES 214-215 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 215 Les exemples numériques présentés dans ce document d exercices ont été traités sur le logiciel R, téléchargeable par
Plus en détailBiostatistiques : Petits effectifs
Biostatistiques : Petits effectifs Master Recherche Biologie et Santé P. Devos DRCI CHRU de Lille EA2694 patrick.devos@univ-lille2.fr Plan Données Générales : Définition des statistiques Principe de l
Plus en détailAnalyse de la variance Comparaison de plusieurs moyennes
Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction
Plus en détailAnalyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés
Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour francour@unice.fr Une grande partie des illustrations viennent
Plus en détail1 Définition de la non stationnarité
Chapitre 2: La non stationnarité -Testsdedétection Quelques notes de cours (non exhaustives) 1 Définition de la non stationnarité La plupart des séries économiques sont non stationnaires, c est-à-direqueleprocessusquiles
Plus en détailBiostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke
www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3
Plus en détailLecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888
Lecture critique d article Rappels Bio statistiques Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888 Plan du cours Rappels fondamentaux Statistiques descriptives Notions de tests statistiques
Plus en détailPrincipe d un test statistique
Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre
Plus en détailChapitre 6 Test de comparaison de pourcentages χ². José LABARERE
UE4 : Biostatistiques Chapitre 6 Test de comparaison de pourcentages χ² José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Nature des variables
Plus en détailLa problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites
La problématique des tests Cours V 7 mars 8 Test d hypothèses [Section 6.1] Soit un modèle statistique P θ ; θ Θ} et des hypothèses H : θ Θ H 1 : θ Θ 1 = Θ \ Θ Un test (pur) est une statistique à valeur
Plus en détailCours de Tests paramétriques
Cours de Tests paramétriques F. Muri-Majoube et P. Cénac 2006-2007 Licence Ce document est sous licence ALC TYPE 2. Le texte de cette licence est également consultable en ligne à l adresse http://www.librecours.org/cgi-bin/main?callback=licencetype2.
Plus en détailTABLE DES MATIERES. C Exercices complémentaires 42
TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence
Plus en détailChapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens
Chapitre 7 Statistique des échantillons gaussiens Le théorème central limite met en évidence le rôle majeur tenu par la loi gaussienne en modélisation stochastique. De ce fait, les modèles statistiques
Plus en détailCours Fonctions de deux variables
Cours Fonctions de deux variables par Pierre Veuillez 1 Support théorique 1.1 Représentation Plan et espace : Grâce à un repère cartésien ( ) O, i, j du plan, les couples (x, y) de R 2 peuvent être représenté
Plus en détailIntroduction à l approche bootstrap
Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?
Plus en détailMODELE A CORRECTION D ERREUR ET APPLICATIONS
MODELE A CORRECTION D ERREUR ET APPLICATIONS Hélène HAMISULTANE Bibliographie : Bourbonnais R. (2000), Econométrie, DUNOD. Lardic S. et Mignon V. (2002), Econométrie des Séries Temporelles Macroéconomiques
Plus en détailUne introduction. Lionel RIOU FRANÇA. Septembre 2008
Une introduction INSERM U669 Septembre 2008 Sommaire 1 Effets Fixes Effets Aléatoires 2 Analyse Classique Effets aléatoires Efficacité homogène Efficacité hétérogène 3 Estimation du modèle Inférence 4
Plus en détailExercices - Fonctions de plusieurs variables : corrigé. Pour commencer
Pour commencer Exercice 1 - Ensembles de définition - Première année - 1. Le logarithme est défini si x + y > 0. On trouve donc le demi-plan supérieur délimité par la droite d équation x + y = 0.. 1 xy
Plus en détailAide-mémoire de statistique appliquée à la biologie
Maxime HERVÉ Aide-mémoire de statistique appliquée à la biologie Construire son étude et analyser les résultats à l aide du logiciel R Version 5(2) (2014) AVANT-PROPOS Les phénomènes biologiques ont cela
Plus en détailT de Student Khi-deux Corrélation
Les tests d inférence statistiques permettent d estimer le risque d inférer un résultat d un échantillon à une population et de décider si on «prend le risque» (si 0.05 ou 5 %) Une différence de moyennes
Plus en détailVI. Tests non paramétriques sur un échantillon
VI. Tests non paramétriques sur un échantillon Le modèle n est pas un modèle paramétrique «TESTS du CHI-DEUX» : VI.1. Test d ajustement à une loi donnée VI.. Test d indépendance de deux facteurs 96 Différentes
Plus en détailAnalyse de corrélation Étude des dépendances - Variables quantitatives
Ricco Rakotomalala Analyse de corrélation Étude des dépendances - Variables quantitatives Version 1.1 Université Lumière Lyon 2 Page: 1 job: Analyse_de_Correlation macro: svmono.cls date/time: 8-Mar-2015/7:21
Plus en détail21 mars 2012. Simulations et Méthodes de Monte Carlo. DADI Charles-Abner. Objectifs et intérêt de ce T.E.R. Générer l'aléatoire.
de 21 mars 2012 () 21 mars 2012 1 / 6 de 1 2 3 4 5 () 21 mars 2012 2 / 6 1 de 2 3 4 5 () 21 mars 2012 3 / 6 1 2 de 3 4 5 () 21 mars 2012 4 / 6 1 2 de 3 4 de 5 () 21 mars 2012 5 / 6 de 1 2 3 4 5 () 21 mars
Plus en détailUne variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants)
CIVILITE-SES.doc - 1 - Une variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants) 1 PRÉSENTATION DU DOSSIER CIVILITE On s intéresse
Plus en détailSTATISTIQUES. UE Modélisation pour la biologie
STATISTIQUES UE Modélisation pour la biologie 2011 Cadre Général n individus: 1, 2,..., n Y variable à expliquer : Y = (y 1, y 2,..., y n ), y i R Modèle: Y = Xθ + ε X matrice du plan d expériences θ paramètres
Plus en détailStatistiques Descriptives à une dimension
I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des
Plus en détailCorrélation entre deux classements. ρ Le coefficient de rang de Spearman
Corrélation entre deux classements Cas: échelle ordinale On peut utilisé le Rhô ρ Le coefficient de rang de Spearman Cours réalisé par Benjamin Putois Novembre 2008 bputois@gmail.com Indice statistique
Plus en détailUFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES
Université Paris 13 Cours de Statistiques et Econométrie I UFR de Sciences Economiques Année 2008-2009 Licence de Sciences Economiques L3 Premier semestre TESTS PARAMÉTRIQUES Remarque: les exercices 2,
Plus en détailStatistique Descriptive Élémentaire
Publications de l Institut de Mathématiques de Toulouse Statistique Descriptive Élémentaire (version de mai 2010) Alain Baccini Institut de Mathématiques de Toulouse UMR CNRS 5219 Université Paul Sabatier
Plus en détailFORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)
87 FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc) Dans le cadre de la réforme pédagogique et de l intérêt que porte le Ministère de l Éducation
Plus en détailTESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION
TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION Bruno Saussereau Laboratoire de Mathématiques de Besançon Université de Franche-Comté Travail en commun
Plus en détail8.1 Généralités sur les fonctions de plusieurs variables réelles. f : R 2 R (x, y) 1 x 2 y 2
Chapitre 8 Fonctions de plusieurs variables 8.1 Généralités sur les fonctions de plusieurs variables réelles Définition. Une fonction réelle de n variables réelles est une application d une partie de R
Plus en détailLa place de SAS dans l'informatique décisionnelle
La place de SAS dans l'informatique décisionnelle Olivier Decourt ABS Technologies - Educasoft Formations La place de SAS dans l'informatique décisionnelle! L'historique de SAS! La mécanique! La carrosserie
Plus en détailAnnexe commune aux séries ES, L et S : boîtes et quantiles
Annexe commune aux séries ES, L et S : boîtes et quantiles Quantiles En statistique, pour toute série numérique de données à valeurs dans un intervalle I, on définit la fonction quantile Q, de [,1] dans
Plus en détailLA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers
Plus en détailQue faire lorsqu on considère plusieurs variables en même temps?
Chapitre 3 Que faire lorsqu on considère plusieurs variables en même temps? On va la plupart du temps se limiter à l étude de couple de variables aléatoires, on peut bien sûr étendre les notions introduites
Plus en détailProbabilité et Statistique pour le DEA de Biosciences. Avner Bar-Hen
Probabilité et Statistique pour le DEA de Biosciences Avner Bar-Hen Université Aix-Marseille III 2000 2001 Table des matières 1 Introduction 3 2 Introduction à l analyse statistique 5 1 Introduction.................................
Plus en détailFORMULAIRE DE STATISTIQUES
FORMULAIRE DE STATISTIQUES I. STATISTIQUES DESCRIPTIVES Moyenne arithmétique Remarque: population: m xμ; échantillon: Mx 1 Somme des carrés des écarts "# FR MOYENNE(série) MOYENNE(série) NL GEMIDDELDE(série)
Plus en détailProbabilités III Introduction à l évaluation d options
Probabilités III Introduction à l évaluation d options Jacques Printems Promotion 2012 2013 1 Modèle à temps discret 2 Introduction aux modèles en temps continu Limite du modèle binomial lorsque N + Un
Plus en détailBases de données documentaires et distribuées Cours NFE04
Bases de données documentaires et distribuées Cours NFE04 Scalabilité Auteurs : Raphaël Fournier-S niehotta, Philippe Rigaux, Nicolas Travers prénom.nom@cnam.fr Département d informatique Conservatoire
Plus en détailDéroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI
1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage
Plus en détaildonnées en connaissance et en actions?
1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)
Plus en détailLES DIFFERENTS TYPES DE MESURE
LES DIFFERENTS TYPES DE MESURE Licence - Statistiques 2004/2005 REALITE ET DONNEES CHIFFREES Recherche = - mesure. - traduction d une réalité en chiffre - abouti à des tableaux, des calculs 1) Qu est-ce
Plus en détailExemples d application
AgroParisTech Exemples d application du modèle linéaire E Lebarbier, S Robin Table des matières 1 Introduction 4 11 Avertissement 4 12 Notations 4 2 Régression linéaire simple 7 21 Présentation 7 211 Objectif
Plus en détailThéorie des sondages : cours 5
Théorie des sondages : cours 5 Camelia Goga IMB, Université de Bourgogne e-mail : camelia.goga@u-bourgogne.fr Master Besançon-2010 Chapitre 5 : Techniques de redressement 1. poststratification 2. l estimateur
Plus en détailL ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ
L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et
Plus en détailFonctions de deux variables. Mai 2011
Fonctions de deux variables Dédou Mai 2011 D une à deux variables Les fonctions modèlisent de l information dépendant d un paramètre. On a aussi besoin de modéliser de l information dépendant de plusieurs
Plus en détailÉtude des flux d individus et des modalités de recrutement chez Formica rufa
Étude des flux d individus et des modalités de recrutement chez Formica rufa Bruno Labelle Théophile Olivier Karl Lesiourd Charles Thevenin 07 Avril 2012 1 Sommaire Remerciements I) Introduction p3 Intérêt
Plus en détailTests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles
Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Valentin Patilea 1 Cesar Sanchez-sellero 2 Matthieu Saumard 3 1 CREST-ENSAI et IRMAR 2 USC Espagne 3 IRMAR-INSA
Plus en détail23. Interprétation clinique des mesures de l effet traitement
23. Interprétation clinique des mesures de l effet traitement 23.1. Critères de jugement binaires Plusieurs mesures (indices) sont utilisables pour quantifier l effet traitement lors de l utilisation d
Plus en détailChapitre 3. Quelques fonctions usuelles. 1 Fonctions logarithme et exponentielle. 1.1 La fonction logarithme
Chapitre 3 Quelques fonctions usuelles 1 Fonctions logarithme et eponentielle 1.1 La fonction logarithme Définition 1.1 La fonction 7! 1/ est continue sur ]0, +1[. Elle admet donc des primitives sur cet
Plus en détailCOMPARAISON DE LOGICIELS TESTANT L INDEPENDANCE DE VARIABLES BINAIRES
J. sci. pharm. biol., Vol.9, n - 00, pp. 9-0 EDUCI 00 9 VALLEE POLNEAU S.* DIAINE C. COMPARAISON DE LOGICIELS TESTANT L INDEPENDANCE DE VARIABLES BINAIRES Notre étude visait à comparer les résultats obtenus
Plus en détailLe risque Idiosyncrasique
Le risque Idiosyncrasique -Pierre CADESTIN -Magali DRIGHES -Raphael MINATO -Mathieu SELLES 1 Introduction Risque idiosyncrasique : risque non pris en compte dans le risque de marché (indépendant des phénomènes
Plus en détailLogiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS
Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence
Plus en détailAnalyses multivariées avec R Commander (via le package FactoMineR) Qu est ce que R? Introduction à R Qu est ce que R?
Analyses multivariées avec R Commander Analyses multivariées avec R Commander (via le package FactoMineR) Plate-forme de Support en Méthodologie et Calcul Statistique (SMCS) - UCL 1 Introduction à R 2
Plus en détailEVALUATION DE LA QUALITE DES SONDAGES EN LIGNE : CAS D UN SONDAGE D OPINION AU BURKINA FASO
EVALUATION DE LA QUALITE DES SONDAGES EN LIGNE : CAS D UN SONDAGE D OPINION AU BURKINA FASO Auteur Baguinébié Bazongo 1 Ingénieur Statisticien Economiste Chef de l Unité de recherche à l Institut national
Plus en détailINTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES
INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES Dominique LAFFLY Maître de Conférences, Université de Pau Laboratoire Société Environnement Territoire UMR 5603 du CNRS et Université de Pau Domaine
Plus en détailReconstruction de bâtiments en 3D à partir de nuages de points LIDAR
Reconstruction de bâtiments en 3D à partir de nuages de points LIDAR Mickaël Bergem 25 juin 2014 Maillages et applications 1 Table des matières Introduction 3 1 La modélisation numérique de milieux urbains
Plus en détailRésumé du Cours de Statistique Descriptive. Yves Tillé
Résumé du Cours de Statistique Descriptive Yves Tillé 15 décembre 2010 2 Objectif et moyens Objectifs du cours Apprendre les principales techniques de statistique descriptive univariée et bivariée. Être
Plus en détailL'évaluation par les pairs dans un MOOC. Quelle fiabilité et quelle légitimité? Rémi Bachelet Ecole Centrale de Lille 24 novembre 2014, Université
L'évaluation par les pairs dans un MOOC. Quelle fiabilité et quelle légitimité? Rémi Bachelet Ecole Centrale de Lille 24 novembre 2014, Université Paris-Est séminaire annuel IDEA Les diapos seront tweetées
Plus en détailDegré de confiance pour les indicateurs de performance : degré de fiabilité du processus de production et écart significatif 1
Degré de confiance pour les indicateurs de performance : degré de fiabilité du processus de production et écart significatif 1 L utilisation des indicateurs de performance ne peut se faire de manière pertinente
Plus en détailUNE REPRESENTATION GRAPHIQUE DE LA LIAISON STATISTIQUE ENTRE DEUX VARIABLES ORDONNEES. Éric TÉROUANNE 1
33 Math. Inf. Sci. hum., (33 e année, n 130, 1995, pp.33-42) UNE REPRESENTATION GRAPHIQUE DE LA LIAISON STATISTIQUE ENTRE DEUX VARIABLES ORDONNEES Éric TÉROUANNE 1 RÉSUMÉ Le stéréogramme de liaison est
Plus en détail3. Caractéristiques et fonctions d une v.a.
3. Caractéristiques et fonctions d une v.a. MTH2302D S. Le Digabel, École Polytechnique de Montréal H2015 (v2) MTH2302D: fonctions d une v.a. 1/32 Plan 1. Caractéristiques d une distribution 2. Fonctions
Plus en détailStatistique : Résumé de cours et méthodes
Statistique : Résumé de cours et méthodes 1 Vocabulaire : Population : c est l ensemble étudié. Individu : c est un élément de la population. Effectif total : c est le nombre total d individus. Caractère
Plus en détailLimitations of the Playstation 3 for High Performance Cluster Computing
Introduction Plan Limitations of the Playstation 3 for High Performance Cluster Computing July 2007 Introduction Plan Introduction Intérêts de la PS3 : rapide et puissante bon marché L utiliser pour faire
Plus en détailIntroduction à l économétrie : Spécifications, formes fonctionnelles, hétéroscédasticité et variables instrumentales
Introduction à l économétrie : Spécifications, formes fonctionnelles, hétéroscédasticité et variables instrumentales Pierre Thomas Léger IEA, HEC Montréal 2013 Table des matières 1 Introduction 2 2 Spécifications
Plus en détailModèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes
de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes Zohra Guessoum 1 & Farida Hamrani 2 1 Lab. MSTD, Faculté de mathématique, USTHB, BP n 32, El Alia, Alger, Algérie,zguessoum@usthb.dz
Plus en détailUNE FORMATION POUR APPRENDRE À PRÉSENTER DES DONNÉES CHIFFRÉES : POUR QUI ET POURQUOI? Bénédicte Garnier & Elisabeth Morand
UNE FORMATION POUR APPRENDRE À PRÉSENTER DES DONNÉES CHIFFRÉES : POUR QUI ET POURQUOI? Bénédicte Garnier & Elisabeth Morand Service méthodes statistiques Institut National d Etudes Démographiques (Ined)
Plus en détail1 Importer et modifier des données avec R Commander
Université de Nantes 2015/2016 UFR des Sciences et Techniques Département de Mathématiques TP1 STATISTIQUE DESCRIPTIVE Frédéric Lavancier Avant propos Ouvrir l application R Saisir dans la console library(rcmdr)
Plus en détailRégression linéaire. Nicolas Turenne INRA nicolas.turenne@jouy.inra.fr
Régression linéaire Nicolas Turenne INRA nicolas.turenne@jouy.inra.fr 2005 Plan Régression linéaire simple Régression multiple Compréhension de la sortie de la régression Coefficient de détermination R
Plus en détailIntroduction à la Statistique Inférentielle
UNIVERSITE MOHAMMED V-AGDAL SCIENCES FACULTE DES DEPARTEMENT DE MATHEMATIQUES SMI semestre 4 : Probabilités - Statistique Introduction à la Statistique Inférentielle Prinemps 2013 0 INTRODUCTION La statistique
Plus en détailLes travaux doivent être remis sous forme papier.
Physique mathématique II Calendrier: Date Pondération/note nale Matériel couvert ExercicesSérie 1 : 25 septembre 2014 5% RH&B: Ch. 3 ExercicesSérie 2 : 23 octobre 2014 5% RH&B: Ch. 12-13 Examen 1 : 24
Plus en détailExamen de Logiciels Statistiques
G. Hunault Angers, mai 2011 Licence MEF Examen de Logiciels Statistiques On s intéresse ici au dossier EAEF01 qui contient un extrait des données du recensement américain. On trouvera ces données et leur
Plus en détailExercice autour de densité, fonction de répatition, espérance et variance de variables quelconques.
14-3- 214 J.F.C. p. 1 I Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques. Exercice 1 Densité de probabilité. F { ln x si x ], 1] UN OVNI... On pose x R,
Plus en détailFeuille d exercices 2 : Espaces probabilisés
Feuille d exercices 2 : Espaces probabilisés Cours de Licence 2 Année 07/08 1 Espaces de probabilité Exercice 1.1 (Une inégalité). Montrer que P (A B) min(p (A), P (B)) Exercice 1.2 (Alphabet). On a un
Plus en détail1 Objectifs. Traitement statistique des données d enquête avec introduction à SPSS. Plan
1 Objectifs Traitement statistique des données d enquête avec introduction à SPSS Gilbert Ritschard Département d économétrie, Université de Genève gilbert.ritschard@themes.unige.ch Bamako, 7-11 octobre
Plus en détailCours 9 : Plans à plusieurs facteurs
Cours 9 : Plans à plusieurs facteurs Table des matières Section 1. Diviser pour regner, rassembler pour saisir... 3 Section 2. Définitions et notations... 3 2.1. Définitions... 3 2.2. Notations... 4 Section
Plus en détailTraitement des données avec Microsoft EXCEL 2010
Traitement des données avec Microsoft EXCEL 2010 Vincent Jalby Septembre 2012 1 Saisie des données Les données collectées sont saisies dans une feuille Excel. Chaque ligne correspond à une observation
Plus en détail(51) Int Cl.: H04L 29/06 (2006.01) G06F 21/55 (2013.01)
(19) TEPZZ 8 8 4_A_T (11) EP 2 838 241 A1 (12) DEMANDE DE BREVET EUROPEEN (43) Date de publication: 18.02.1 Bulletin 1/08 (1) Int Cl.: H04L 29/06 (06.01) G06F 21/ (13.01) (21) Numéro de dépôt: 141781.4
Plus en détailBaccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé
Baccalauréat S ntilles-guyane 11 septembre 14 Corrigé EXERCICE 1 6 points Commun à tous les candidats Une entreprise de jouets en peluche souhaite commercialiser un nouveau produit et à cette fin, effectue
Plus en détailStatistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier
Statistiques Appliquées à l Expérimentation en Sciences Humaines Christophe Lalanne, Sébastien Georges, Christophe Pallier Table des matières 1 Méthodologie expérimentale et recueil des données 6 1.1 Introduction.......................................
Plus en détailLocalisation des fonctions
MODALISA 7 Localisation des fonctions Vous trouverez dans ce document la position des principales fonctions ventilées selon l organisation de Modalisa en onglets. Sommaire A. Fonctions communes à tous
Plus en détailCorrection du bac blanc CFE Mercatique
Correction du bac blanc CFE Mercatique Exercice 1 (4,5 points) Le tableau suivant donne l évolution du nombre de bénéficiaires de minima sociaux en milliers : Année 2002 2003 2004 2005 2006 2007 2008 2009
Plus en détailLe Modèle Linéaire par l exemple :
Publications du Laboratoire de Statistique et Probabilités Le Modèle Linéaire par l exemple : Régression, Analyse de la Variance,... Jean-Marc Azaïs et Jean-Marc Bardet Laboratoire de Statistique et Probabilités
Plus en détailBIOSTATISTIQUES AVANCEES PLAN. Quelques références. Master Biologie Intégrative 1 ère année
Master Biologie Intégrative 1 ère année 1 BIOSTATISTIQUES AVANCEES Yves Desdevises! Observatoire Océanologique de Banyuls-sur-Mer (www.obs-banyuls.fr)! 04 68 88 73 13! desdevises@obs-banyuls.fr! http://desdevises.free.fr
Plus en détail1. Vocabulaire : Introduction au tableau élémentaire
L1-S1 Lire et caractériser l'information géographique - Le traitement statistique univarié Statistique : le terme statistique désigne à la fois : 1) l'ensemble des données numériques concernant une catégorie
Plus en détailM2 IAD UE MODE Notes de cours (3)
M2 IAD UE MODE Notes de cours (3) Jean-Yves Jaffray Patrice Perny 16 mars 2006 ATTITUDE PAR RAPPORT AU RISQUE 1 Attitude par rapport au risque Nousn avons pas encore fait d hypothèse sur la structure de
Plus en détailAnalyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9
Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9 L analyse de variance à un facteur permet de vérifier, moyennant certaines hypothèses, si un facteur (un critère de classification,
Plus en détail