Statistique n 1 Susanna Davoust

Documents pareils
Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

Estimation et tests statistiques, TD 5. Solutions

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

VI. Tests non paramétriques sur un échantillon

Principe d un test statistique

T de Student Khi-deux Corrélation

Biostatistiques : Petits effectifs

Relation entre deux variables : estimation de la corrélation linéaire

Lecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888

Lois de probabilité. Anita Burgun

Introduction à l approche bootstrap

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Chapitre 3. Les distributions à deux variables

Analyse de la variance Comparaison de plusieurs moyennes

Introduction aux Statistiques et à l utilisation du logiciel R

Annexe commune aux séries ES, L et S : boîtes et quantiles

Estimation: intervalle de fluctuation et de confiance. Mars IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison

Exo7. Calculs de déterminants. Fiche corrigée par Arnaud Bodin. Exercice 1 Calculer les déterminants des matrices suivantes : Exercice 2.

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1

Document d orientation sur les allégations issues d essais de non-infériorité

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

LEÇON N 7 : Schéma de Bernoulli et loi binomiale. Exemples.

TESTS D HYPOTHÈSE FONDÉS SUR LE χ².

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position

Équivalence et Non-infériorité

Une variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants)

Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux

La problématique des tests. Cours V. 7 mars Comment quantifier la performance d un test? Hypothèses simples et composites

a et b étant deux nombres relatifs donnés, une fonction affine est une fonction qui a un nombre x associe le nombre ax + b

Cours de Tests paramétriques

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes

Introduction à la statistique non paramétrique

Probabilités sur un univers fini

Pratique de l analyse de données SPSS appliqué à l enquête «Identités et Capital social en Wallonie»

La crise économique vue par les salariés français

Analyse Combinatoire

Exemples d application

Exprimer ce coefficient de proportionnalité sous forme de pourcentage : 3,5 %

Introduction à la Statistique Inférentielle

Calcul élémentaire des probabilités

Statistiques Descriptives à une dimension

23. Interprétation clinique des mesures de l effet traitement

Statistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année

TABLE DES MATIERES. C Exercices complémentaires 42

Représentation d une distribution

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

Feuille d exercices 2 : Espaces probabilisés

TSTI 2D CH X : Exemples de lois à densité 1

Chapitre 6. Fonction réelle d une variable réelle

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

Bureau : 238 Tel : dominique.muller@upmf-grenoble.fr

PROTEGER SON DOS ex. Cliniques St Luc

Cours 9 : Plans à plusieurs facteurs

Chapitre 3. Quelques fonctions usuelles. 1 Fonctions logarithme et exponentielle. 1.1 La fonction logarithme

Le conseil d enfants La démocratie représentative à l école

Il y a trois types principaux d analyse des résultats : l analyse descriptive, l analyse explicative et l analyse compréhensive.

données en connaissance et en actions?

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Gestion de projet- Indicateurs de performance

Exercices M1 SES Ana Fermin ( fermin.perso.math.cnrs.fr/ ) 14 Avril 2015

A. BONNEFOND Maître de conférences en neuroscience cognitive Laboratoire d imagerie et de neuroscience cognitive Université de Strasbourg

quelles sont les spécificités du système de gouvernance des PME - PMI?

Qu est-ce qu une probabilité?

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Indépendance Probabilité conditionnelle. Chapitre 3 Événements indépendants et Probabilités conditionnelles

CONFIGURATION DE L AUTOMATE SIEMENS

S initier aux probabilités simples «Un jeu de cartes inédit»

Organisme d arbitrage autorisé par la Régie du bâtiment : Centre canadien d arbitrage commercial (CCAC)

Probabilité et Statistique pour le DEA de Biosciences. Avner Bar-Hen

Introduction : Les modes de fonctionnement du transistor bipolaire. Dans tous les cas, le transistor bipolaire est commandé par le courant I B.

Intérêt du découpage en sous-bandes pour l analyse spectrale

DÉCISION DU TRIBUNAL DE LA SÉCURITÉ SOCIALE Division d appel Décision d appel

Probabilités. I Petits rappels sur le vocabulaire des ensembles 2 I.1 Définitions... 2 I.2 Propriétés... 2

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

FORMULAIRE DE STATISTIQUES

La séquence des comptes

DOCM Solutions officielles = n 2 10.

MODELE A CORRECTION D ERREUR ET APPLICATIONS

La fumée de tabac secondaire (FTS) en Mauricie et au Centre-du- Québec, indicateurs du plan commun tirés de l ESCC de

LE JUGEMENT SOMMAIRE À LA COUR FÉDÉRALE ET À LA COUR D APPEL FÉDÉRALE. Document de travail du sous-comité des Règles sur le jugement sommaire

STA108 Enquêtes et sondages. Sondages àplusieurs degrés et par grappes

FONCTION DE DEMANDE : REVENU ET PRIX

Annexe 5. CONTRAT CYBERPLUS PRO Souscrit dans le cadre du Titre 1Conditions Particulières

Programmes des classes préparatoires aux Grandes Ecoles

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)

Lire ; Compter ; Tester... avec R

1. Vocabulaire : Introduction au tableau élémentaire

Multichronomètre SA10 Présentation générale

Table des matières. Avant-propos. Chapitre 2 L actualisation Chapitre 1 L intérêt Chapitre 3 Les annuités III. Entraînement...

Journée technique ARRA Gestion quantitative de la ressource en eau

Tests du χ 2. on accepte H 0 bonne décision erreur de seconde espèce on rejette H 0 erreur de première espèce bonne décision

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie

Exo7. Probabilité conditionnelle. Exercices : Martine Quinio

Transcription:

CORRECTION de la Conférence du 28 Septembre 2010 Statistique n 1 Susanna Davoust Question de Statistiques Section I : -16. Statistique descriptive : estimation des paramètres d une population, intervalle de confiance d une moyenne et d une proportion -17. Test paramétriques de comparaison : -Comparaison unilatérale ou bilatérale : -de deux variances observées -d une moyenne observées à une valeur théorique -de deux moyennes observées -Comparaison unilatérale ou bilatérale dans le cas de grands échantillons : -d une proportion observée à une proportion théorique -de deux proportions observées -18. Tests de liaison : -Régression linéaire : estimation et intervalle de confiance de la pente et de l ordonnée à l origine. Comparaison à une valeur théorique de la pente et de l ordonnée à l origine. -Corrélation linéaire : estimation et test du coefficient de corrélation (r). -Test du Chi-deux d indépendance. Exercice 1 : Calcul des différents paramètres : -Femmes Début 79 80 75 74 76 71 69 65 Fin 75 72 74 71 71 66 65 63 Différences 4 8 1 3 5 5 4 2 -Hommes Début 78 85 88 84 82 79 96 102 95 83 81 82 Fin 71 80 84 80 80 73 87 91 90 80 77 88 Différences 7 5 4 4 2 6 9 11 5 3 4-6 Femmes : n f =8 Hommes : n h =12 =4kg = 4,5714 kg donc s=2,138kg =4,5kg = 17,364 kg donc s=4,167kg Test de comparaison de deux moyennes observées, petits échantillons (n A et/ou n B 30) H 0 : μ 0 : le régime n est pas efficace. (la différence de poids n est pas significativement différente de 0) H 1 : μ 0 : le régime est efficace. (la différence de poids est significativement différente de 0) Sous H 0,, ~ S(n-1) Condition de validité D~ N( ; ) dans la population -Chez la femme : On réalise un test unilatéral. Au risque 5%, on lit, =1,895 dans la table de la loi de Student =5,292 ; 1,895, On conclut H 1 au risque α=0,05. Le régime est efficace chez la femme. -Chez l homme : On réalise un test unilatéral. Au risque 5%, on lit, =1,796 dans la table de la loi de Student, =3,741 ; 1,796, On conclut H 1 au risque α=0,05. Le régime est efficace chez l homme.

Exercice 2 : Effectif de l échantillon n=100 Proportion théorique p th =0,30 Proportion observée p ob =0,41 Test de comparaison d une proportion observée à une théorique : Hypothèse : H 0 : la proportion théorique de guérison sous traitement est égale à celle sans traitement. H 1 : la proportion théorique de guérison sous traitement n est pas égale à celle sans traitement. Sous H 0, ~ N(0 ;1) Conditions de validité de la loi normale : n*p th = 100*0,3 = 30 5 et n *(1-p th ) = 100*0,7 = 70 5 On réalise un test bilatéral. Au risque α=0,05, on lit u α =1,96 dans la table de la loi normale centrée réduite,, = 2,4 1,96 ; 1,96,, On conclut H 1 au risque α=0,05. La fréquence de guérison avec traitement est significativement différente de la fréquence de guérison sans traitement. Ce type de question peut aussi être traité en réalisant un test équivalent, Test du χ 2 d ajustement entre une proportion observée à une théorique connue: Hypothèse : H 0 : la proportion théorique de guérison sous traitement est égale à celle sans traitement. H 1 : la proportion théorique de guérison sous traitement n est pas égale à celle sans traitement. Guérison oui Pas guérison Effectifs observés (0 i ) 0,41*100=41 59 100 Effectifs théoriques (C i ) 30 70 100 Sous H 0, χ2 ~ χ 2 à k-1 degré de liberté soit 1ddl K = 5,762 > 3,841 (lu dans la table de la loi du χ 2 ) On conclut H 1 au risque α=0,05. La fréquence de guérison avec traitement est significativement différente de la fréquence de guérison sans traitement (degré de signification p<0,02) Remarque : il y a une équivalence entre les deux tests : z 2 = χ 2 (2,4 2 =5,76 et 1,96 2 =3,84) Exercice 3: 1) Effectif de port de lunettes dans le secondaire : n l =100 Effectif total dans le secondaire : n t = 100+130= 230 Cas de variables qualitatives Estimation de la proportion de sujets portant des lunettes chez les sujet de niveau d étude secondaire p ob = =0,43 Intervalle de confiance d une proportion théorique IC 1-α (p)=[p ob u α ; p ob + u α ] = [p i ; p s ]

Conditions de validité : np i ; np s ; n(1-p i ) ; n(1-p s ) 5,,,, IC 95% (p)=[0,43 1,96 ; 0,43 + 1,96 ] = [0,37 ;0,49] 2) Comparaison d une répartition observée à la répartition théorique : Je l avoue la formulation de la question était un peu ambigüe (d où le débat ) de toutes façons, si on pose bien ses hypothèses et qu on ne va pas à l encontre de l intitulé du problème, ça devrait passer. Donc ma vision initiale du problème était de traiter le problème comme un test d homogénéité simple en ne m intéressant qu à la modalité lunettes. A ce moment là, le seul changement par rapport à l exercice précédent est obtention des effectifs théoriques qui seront ici calculés. Hypothèse : H 0 : la proportion théorique de sujets portant des lunettes ne varie pas avec le niveau d étude H 1 : la proportion théorique de sujets portant des lunettes varie avec le niveau d étude Lunettes Primaire Secondaire Supérieur Tous niveaux Effectifs observés 10 100 50 160 Effectifs théoriques 160x160/530=48,3 230x160/530=69,4 140x160/530=42,3 160 Effectifs Total 160 230 140 530 Sous H 0, 2 ~ χ 2 à (c-1)(l-1) degré de liberté soit 2ddl,,,,, 45,26> 5,991 (lu dans la table de la loi du χ 2 ), On conclut H 1 au risque α=0,05. La proportion de sujets portant des lunettes varie avec le niveau d étude.(elle est significativement différente pour au moins un niveau) Deuxième option qui est peut être préférable après réflexion, c est de s intéresser à la dépendance entre deux variables qualitatives à plusieurs modalités : Test d indépendance (tableau de contingence) H 0 : indépendance entre le niveau d étude et l état de la vue (port de lunette ou non) H 1 : dépendance entre le niveau d étude et l état de la vue Primaire Secondaire Supérieur Tous niveaux Lunettes 10 (48,3) 100 (69,4) 50 (42,3) 160 Pas de lunettes 150 (111,7) 130 (160,6) 90 (97,7) 370 Effectifs Total 160 230 140 530 Sous H 0, χ2 ~ χ 2 à (c-1)(l-1) degré de liberté soit 2ddl K,, loi du χ 2 ),,,,,,,, 64,83> 5,991 (lu dans la table de la,, On conclut H 1 au risque α=0,05. Il existe une dépendance entre le niveau d étude et l état de la vue. Rq : petit point sur le test du khi2 test d ajustement/de conformité/d adéquation On connait, sur un échantillon, une distribution, et on se pose la question de savoir si cette distribution est conforme à une certaine loi. On compare donc une distribution observée (pop test d homogénéité On connait, sur plusieurs échantillons, plusieurs distributions, et, on se pose la question de savoir si ces distributions sont semblables. On compare donc plusieurs distributions Test d indépendance On a classé les individus d un échantillon suivant deux caractères à plusieurs modalités et on dénombre ceux qui présentent une certaine modalité de ces deux caractères. On pose la question de

inconnue) à une distribution théorique. observées (population inconnues) savoir si ces deux caractères sont indépendants Entre une expérience et un modèle Entre deux ou plus expériences Entre deux ou plus expériences H 0 : pas de différence entre les distributions observée et théorique (conformité, adéquation) H 1 : différence (non-conformité, nonadéquation) H 0 : Les distributions observées sont identique (homogénéité de répartition) H 1 : distribution ne sont pas identique (non-homogénéité) H 0 : indépendance entre les deux variables H 1 : dépendance entre les deux variables t pour théorique c pour calculé Exemple : exercice 2 Exemple exercice 4 Exemple exercice 3 Exercice 4: Bon, voilà, de retour au calme, j ai trouvé d où j avais sortie cette formule donc la méthode qui me parait être la plus simple est la suivante : (je ne l ai pas inventé, elle est utilisé pour les essais cliniques) 1) Test de comparaison de deux proportions observées sur des séries appariées (les sujets sont pris comme leurs propres témoins) H 0 : Les proportions théoriques avec les traitements A et B sont égales H 1 : Les proportions théoriques avec les traitements A et B sont différentes On note : a : nombre d individus pour lesquels A est un succès, B un échec (A+B-) b : nombre d individus pour lesquels A est un échec, B un succès (A-B+) On s intéresse au nombre de cas où la réponse aux traitements diffère. En effet une réponse A+B+ ou A-Bn apporte rien dans la différenciation en terme d efficacité des deux traitements. Sous H 0, z= ~ N(0 ;1) Conditions de validité : a+b 10 Test bilatéral : Z c = =1,103 1,96 ; 1,96 Au risque α=0,05, on ne rejette pas H 0, on ne peut donc pas conclure à une différence d efficacité entre les traitements A et B. Rq : on aurait pu utiliser un test de χ 2 d homogénéité sur séries appariées : H 0 : «désaccord» de réponse lié au hasard ; les traitements sont équivalents entre eux H 1 : la différence est significative et non liée au hasard ; les traitements ne sont pas équivalents A+B- A-B+ Effectifs observés 100 85 Effectifs calculés 92,5 92,5 ~ χ2 à c 1l 1 degré de liberté soit 1ddl, K c =, 1,216 > 3,841 (lu dans la table de la loi du χ 2 ),, En décomposant on a : Ainsi, la encore on constate que les deux méthodes sont équivalentes avec z(=1,103)=k c (=1,216)

Attention nuance, si la question avait été de savoir si la réponse aux deux traitements été liée, on aurait alors fait un test d indépendance sur l ensemble du tableau : Test de χ 2 d homogénéité : H 0 : Réponse aux deux traitements sont indépendantes H 1 : Réponse aux deux traitements sont liées ~ χ2 à c 1l 1 degré de liberté soit 2ddl Dans le cas d un tableau de contingence à 2X2, on peut simplifier : =0,43< 5,991 Au risque de 5%, on ne peut rejeter H 0. Les réponses aux traitements sont indépendantes (nuance avec l équivalence assez intéressante!) 2) Idem pour les groupe I et II Groupe I : z c =-0,084 1,96 ; 1,96 Au risque α=0,05, on ne rejette pas H 0, on ne peut donc pas conclure à une différence d efficacité entre les traitements A et B pour les sujets dont l année de naissance est paire Groupe II : z c =2,412 1,96 ; 1,96 Au risque α=0,05, on conclut H 1, les traitements A et B ont des efficacités différentes pour les sujets dont l année de naissance est impaire. Il faut donc se méfier des découpages abusifs en sous groupes Exercice 5 : 1) Test de comparaison de deux moyennes observées, grands échantillons (n A et n B 30) H 0 : μ μ : les survies moyennes théoriques en heures sont égales avec les traitements A et B H 1 : μ μ : les survies moyennes théoriques en heures sont différentes avec les traitements A et B Sous H 0, z= ~ N(0 ;1) Test bilatéral : Z c = =-2,58 1,96 ; 1,96 Au risque α=0,05, on conclut H 1. Les durées de survie moyennes avec le traitement A et le B sont significativement différentes. Exercice 6 : 1) Calcul des variances : On note : x Ai et x Bi les concentrations en théophylline respectivement aux températures T A et T B pour le i ème prélèvement. Variances observée des concentrations à T A : s A = x Ai n A *) idem pour T B Avec A= 15,3 g/l ; x Ai=12+13+17+ +19=2147 (g/l) d où s A = 2417 10 15,3 8,456 (g/l) et B=18,5 g/l ; x Ai=3477 (g/l) d où s B =6,056 (g/l) Test de comparaison de deux variances observées: H 0 : σ les variances théoriques σ et σ sont égales H 1 : σ les variances théoriques σ et σ sont différentes

Sous H 0, = ~ F à n A-1 et n B -1 ddl, soit 9 et 9ddl. Conditions de validité : la concentration en théophylline suit une loi normale dans les deux populations. On réalise un test bilatéral, F c =, = 1,40 <,,,=4,03 (lire dans la table unilatérale de la loi de Fischer α/2=0,025). Au risque α=0,05 on ne peut pas conclure à une différence entre les variances des concentrations en théophylline à T A et T B. 2) Test de comparaison de deux moyennes observées cas de petits échantillons (n A et/ou n B < 30) H 0 : μ μ : les concentrations moyennes théoriques en théophylline à T A et T B sont égales H 0 : μ μ : la concentration moyenne théorique en théophylline à T A est supérieure à celle à T B Sous H 0, ~ student à n A +n B -2 ddl soit 18ddl Où s c est l estimation de la variance commune :,, 7,256 Conditions de validité : -les concentrations en théophylline suivent une loi normale dans chaque population -les variances théoriques des concentrations en théophylline sont égales dans les deux populations (voir le test de comparaison de deux variances observées en question 1 ) Test unilatérale (A > B),,,, loi de Student) 2,656 1,734; 1,734 (t 18ddl,α=0,05, unilatérale = t 18ddl,α=0,10, bilatérale = 1,734 lu dans la table de la On conclut H 1 au risque α=0,05 les concentrations moyennes en théophylline à T A et T B sont significativement différentes.