Chapitre 8 STATISTICA Test d hypothèses La relation linéaire entre deux variables continues Corrélation & Régression linéaire Corrélation et droite de régressions But des tests d hypothèse: Les hypothèses sont des prévisions apriorique nous faisons sur lastructure des résultats. But des relations entre deux variables continues. Je souhaite savoir s il existe un lien entre l âge et le salaire, la consommationdecigaretteetleniveaud anxiété jesouhaite savoir s il existe une relation entre deux variables numériques. Je souhaite à partir de mes observations prédire le taux de réussites aux examens finaux en fonction d un test de rentrée. cour réalisé par B.Putois 1
Corrélation et droite de régressions A quoi cela sert? En probabilités et en statistique, étudier la corrélation entre deux ou plusieurs variables aléatoires numérique, c est étudier l intensité de la liaison qui peut exister entre ces variables. La liaison recherchée est une relation affine. Dans le cas de deux variables, il s'agit de la régression linéaire. Unemesuredecettecorrélationestobtenueparlecalculdu coefficient de corrélation linéaire. Ce coefficient est égal au rapport de leur covariance et du produit non nul de leurs écarts types (en anglais standard deviations). Le coefficient de corrélation est compris entre 1 et1. Rappel: une corrélation n est pas une causalité. Statistica Matrices de corrélations Exemple sur le fichier exercice 01.xls cour réalisé par B.Putois 2
Stat élémentaires Matrices de corrélations Base Si vous voulez faire des corrélations entre des groupes de variables Sélectionnez vos variables numériques Stat élémentaires Matrices de corrélations Avancé/tracé Synthèse de vos matrices de corrélations Création de nuage de point en sélectionnant vos variables d intérêt. cour réalisé par B.Putois 3
STATISTICA Psychologie niv L3 chapitre 8 12/05/2009 Stat élémentaires Matrices de corrélations Options Coefficient de corrélation linéaire de Bravais Pearson Coefficient de corrélation linéaire de Bravais Pearson + probabilité de l effet Prédiction de la note de psycho à partir de la note de stat. Prédiction de la note de stat à partir de la note de psycho. Stat élémentaires Matrices de corrélations Options A partir de X (stat), je prédit Y (psycho): Pente = Cov(X,Y)/var X = 11,77 / 39,64 = 0,297 Constante = Moyenne Y (Pente * Moyenne X) = 10,15 ( 0,297*10,21) = 13,18966 A partir de Y (psycho), je prédit X (stat): Pente = Cov(X,Y)/var Y = 11,77 / 31,18 = 0,377 Constante = Moyenne X (Pente * Moyenne Y) = 10,21 ( 0,377*10,15) = 14,044 cour réalisé par B.Putois 4
Stat élémentaires Matrices de corrélations ex01 Entrainez vous! Ouvrez le fichier exercice 02.sta Cette exercice contient deux variables croisées: MATIERE (note de stat/ note de psycho) NIVEAU (L1/L2) Calculer les corrélations entre : Les notes de stats et les notes de psychos pour le niveau L1 Les notes de stats et les notes de psychos pour le niveau L2 Les notes de stats entre le niveau L1 et L2 Les notes de psycho entre le niveau L1 et L2 Pour chacune de ces corrélations: Calculer le coefficient de corrélation linéaire et les probabilités associés Représenter graphiquement ces corrélations Calculer les droites de régressions linéaires Stat élémentaires Matrices de corrélations Ex01 Correction (remarque): Toutes les analyses Analyses de corrélation des modalités du facteurs NIVEAU d une seule modalité du facteur MATIERE cour réalisé par B.Putois 5
Stat élémentaires Matrices de corrélations ex01 Correction (remarque): Analyses par rapport aux modalités du facteur MATIERE Analyses par rapport aux modalités du facteur NIVEAU Stat élémentaires Matrices de corrélations 01 cour réalisé par B.Putois 6
Entrainez vous! Ouvrez le fichier exercice 06.sta Le mariage et l argent! Nous avons questionner 100 couples sur leur âge au moment du mariage et leur salaire. 1. Y a t il une corrélation entre l âge de la marié et son salaire au moment du mariage? age 2. Y a t il une corrélation entre l âge du marié et son salaire au moment du mariage? 3. Y a t il une corrélation entre l âge de la mariée et le salaire de son futur époux? 4. Y a t il une corrélation entre l âge du mariée et le salaire de sa future épouse? Calculez les coefficient de corrélation, la probabilité associée et interprétez ces indices. Représentez graphiquement ces corrélations. Prédisez le salaire que vous devez avoir si vous voulez épouser une personne de 18 ans! Remarquez la probabilité de vos prédictions. Prédisez l âge que vous devez avoir pour épouser une personne qui gagne 50 000 Remarquez la probabilité de vos prédictions. Faites le même exercice mais avec le fichier exercice 07.sta AIDE exercice 06.sta Prédisez le salaire que vous devez avoir si vous voulez épouser une personne de 18 ans! Remarquez la probabilité de vos prédictions. Si vous êtes une femme: e Je connais l âge de l homme que je veux épouser Je veux savoir mon salaire cour réalisé par B.Putois 7
AIDE exercice 06.sta Salaire de la mariée = 34264 + (48.497*18) = 35136,946 Selon la régression linéaire, une femme devrait gagner 35136,946 quand elle se marie avec un homme de 18 ans! AIDE exercice 06.sta Prédisez le salaire que vous devez avoir si vous voulez épouser une personne de 18 ans! Remarquez la probabilité de vos prédictions. Si vous ousêtes un homme: Je connais l âge de la femme que je veux épouser Je veux savoir mon salaire cour réalisé par B.Putois 8
AIDE exercice 06.sta Salaire du marié = 36514 + (22.44*18) = 36917,92 Selon la régression linéaire, une homme devrait gagner 36917,92 quand il se marie avec un homme de 18 ans! AIDE exercice 06.sta Je vous laisse vous entraîner avec la dernière question: Prédisez l âge que vous devez e avoir ao pour épouser une personne e qui gagne 50 000 Remarquez la probabilité de vos prédictions. Quelques remarques: 1. Les deux droites que nous venons de calculer n ont pas la même équation, c est normal. 2. "Remarquer la probabilité de vos prédictions«quand on fait des prédictions avec des régressions linéaires souvent nos prédictions sont bonnes pour des valeurs médianes, mais deviennent absurdes pour des valeurs extrêmes. Par exemple, nous aurions pu prévoir le salaire que nous devrions avoir pour se marier avec une personne de 2 ans! Donc à utiliser avec prudence. cour réalisé par B.Putois 9
Matrices de corrélations Acquis Ce que vous devez savoir faire à l issu de ce chapitre pour les corrélations: Connaître l intérêt et les propriétés des corrélations*** Sélectionner des variables de vos matrices de corrélations Calculer les coefficients de corrélations de Bravais Pearson et les probabilités associées Interpréter les coefficients de corrélations de Bravais Pearson et les probabilités associées*** Quelle représentation graphique pour les corrélations?*** Faire des nuages de points et les tracer de droite de régression linéaire Trouver les formules des droites de régression linéaire Connaître l intérêt des droites de régressions*** cour réalisé par B.Putois 10