Uiversité de Bourgoge Faculté de Médecie et de Pharmacie Résumé de statistique iductive NB : les iformatios coteues das ce polycopié e fot e aucu cas office de référece pour le cocours, il s agit uiquemet d u résumé o exhaustif du cours officiel. I) Itroductio à l iductive, formules La statistique descriptive se bore à décrire des populatios de taille (N) raisoables (100 rats de laboratoire, 00 P, 100 P1 ) et à e doer des paramètres : moyee, variace, écart type otés avec des lettres grecques (respectivemet,, et e gééral ). Cepedat, la populatio est souvet trop grade pour être étudiée exhaustivemet (150 000 dijoais, 66 millios de fraçais ). Pour e faire l étude, il faut doc tirer au sort u échatillo de taille (modérée mais suffisammet grade pour être représetative) de cette populatio. Ce tirage au sort, pour être représetatif (o biaisé), doit respecter certais pricipes tels que : - l uiversalité : tout idividu de la populatio peut être tiré au sort, - l équiprobabilité : tout idividu à la même chace d être tiré au sort. La méthode type d échatilloage est le sodage. Das cet échatillo, serot calculés u certai ombre de paramètres : moyee, variace, écart type otés cette fois avec des lettres laties (respectivemet m, s, s et e gééral t) Les formules pour calculer ces paramètres das la populatio ou das l échatillo sot semblables mais légèremet différetes : Formule das la populatio Formule das l'échatillo Paramètre gééral θ t Moyee x i x x i f i m i x i f i N Variace (x (x (x i ) i ) s i m) x i m f i 1 1 x i f i N Ecart-type et si 100 x s i m s s Variables biaire : proportio p 1
C est à partir des paramètres d échatillo que l o va chercher à approximer les paramètres de la populatio : c est le pricipe de la statistique iductive. Estimatio : évaluer, à partir des paramètres d échatillo, les paramètres caractérisat ue variable das la populatio e doat u ordre de gradeur de l icertitude. Test : éprouver ue hypothèse : la décisio prise (rejet o o de l hypothèse) dépedra du risque d erreur lié aux caractères partiels des doées. Il existe des tests de coformité : pour détermier si certaies caractéristiques de l échatillo étudié coïcidet avec ue référece coue (la populatio). Et des tests d homogééité : pour détermier si les différeces etre échatillos sot attribuables au hasard (idépedace) ou si elles sot sigificatives. II) Fluctuatio, stadardisatio, lois ormale et gaussiee A) Fluctuatio et loi gaussiee Doc : - t est eviro égal à mais différet. - m est eviro égal à mais différet. Doc, si l o fait plusieurs échatillos (A, B, C ), o obtiet plusieurs moyees (m A, m B, m C ) qui sot toutes plus ou mois proches de la moyee de populatio. Si l o fait ue ifiité d échatillo et que l o trace ue courbe des valeurs de moyees d échatillo e foctio de leur ombre d apparitio, o obtiet la courbe suivate : Qui est ue courbe de distributio dite gaussiee.
O dit que m fluctue autour de µ. Autremet dit : - la moyee de moyees : E(m) = µ - et la variace des moyees V(m) =. Doc, si augmete ifiimet (ted vers N) V(m) ted vers 0 doc m ted vers. De même, la variace d échatillo fluctue autour de la variace de populatio tel que : - la moyee des variaces E(s ) =, - il existe ue variace des variaces V(s ). Et doc, si augmete ifiimet (ted vers N), s ted vers. B) Stadardisatio et loi ormale Si o a ue variable X de moyee et d écart type, o dit qu o la cetre e cosidérat so écart à la moyee (X - ) et qu o la réduit e rapportat cet écart à l écart type. O obtiet la variable cetrée réduite (ou stadardisée). U X De la même maière, o peut stadardiser la moyee (avec : E(m) = et V(m) = U m Cette moyee stadardisée est appelée écart réduit. L écart réduit fluctue autour de 0 et respecte aisi la loi ormale : ) : 3
III) Itervalles de paris / de cofiace A) Gééralités Nous avos doc vu que l écart réduit fluctue autour de 0, ces fluctuatios respectet ue loi de probabilité caractérisable : Proba (- a < U < + a) = 1 α, O peut alors faire u pari au risque α : le pari que U e soit pas compris das l itervalle [- a ; + a] au risque α : a U m a a a m a m a Qui est l itervalle de pari (das ce cas o ecadre u paramètre d échatillo) De même, o peut bâtir l itervalle : m a m a Qui est l itervalle de cofiace. (das ce cas o ecadre u paramètre théorique) Avec das les deux cas : - u risque d erreur α (probabilité que m ou µ e soit pas compris das l itervalle). - le iveau de cofiace 1 α (probabilité que m ou µ soit compris das l itervalle). B) Cas d ue variable biaire Ici, o e parle pas de moyees mais de proportios, l écart réduit s écrit doc : U p ( 1 ) O peut esuite parier sur u : - e utilisat la loi ormale si.φ et.(1-φ) 10. 4
1) Itervalle de pari (o ecadre la proportio de l échatillo) a.( 1).(1 ) p a ) Itervalle de cofiace (o ecadre la proportio de la populatio) p a.( 1 ).(1 ) p a C) Cas d ue variable quatitative Si l écart type théorique (de populatio) est cou, o parie sur l écart exactemet réduit : (La variace théorique est coue) T m Sio, o parie sur l écart approximativemet réduit : (La variace théorique est icoue, o pred celle de l échatillo) T m s Das les cas, o bâtit l itervalle e utilisat : - la loi de Studet à (-1) degrés de liberté si < 30, - la loi ormale si 30. IV) Les tests, comparaisos de moyees A) Gééralités Tests de sigificatio = tests d hypothèses car ils se baset sur la vérificatio d ue hypothèse. La démarche à suivre est codifiée : 1) Défiitio de la populatio, de ou des échatillos que l o étudie. ) Défiitio de la variable : biaire, qualitative géérale, quatitative 3) Choisir le type de test : coformité ou homogééité. 5) Défiir les hypothèses : H 0 et H 1. 6) Choisir la statistique sur laquelle est fodée le test (la loi de probabilité utilisée). 7) Vérifier les coditios d applicatios. 8) Faire les calculs sous l hypothèse H 0. 9) Predre la décisio de rejeter ou o H 0. 10) Coclure 5
B) Variables biaires 1) Test de coformité - Hypothèses : H 0 : φ = φ 0 versus H 1 : φ φ 0 - Critère de test : écart réduit pour ue variable biaire p 0 U 1 ) - Coditios d applicatio : 0 ( 0 Si les effectifs théoriques sot suffisammet grads, c est-à-dire si.φ 0 10 et.(1- φ 0 ) 10, ou si les effectifs attedus sot suffisammet grads, c est-à-dire si.φ 10 et.(1- φ) 10, o compare U à la valeur a correspodate trouvée das la table de la loi ormale au risque α. - Règle de décisio : Si U > a : o rejette H 0 : les proportios diffèret sigificativemet. Si U a : o e peut pas rejeter H 0 : p et φ 0 e sot pas sigificativemet différetes. ) Test d homogééité (fréqueces idépedates) Ce sot des tests où chaque idividu apparaît que das l u des deux groupes. - Hypothèses : H 0 : φ 1 = φ versus H 1 : φ 1 φ - Critère de test : écart approximativemet réduit p T 1 p pq pq 1 Avec p la proportio commue telle que : p 1p 1 p 1 Et pq la variace commue. et q = 1-p. - Coditios d applicatios : Si 1 p, p, 1 q et q sot tous 10, o compare T à la valeur a correspodate trouvée das la table de la loi ormale au risque α. 6
- Règle de décisio : Si T > a, o rejette H 0 : les proportios diffèret sigificativemet. Si T a, o e peut pas rejeter H 0 : les proportios e diffèret pas sigificativemet. 3) Test de coformité (fréqueces appariées) Ce sot des tests où chaque idividu apparaît das chacu des groupes (avat/après u traitemet ). Exemple type : comparaiso, chez 100 malades, de traitemets reçus successivemet, das u ordre tiré au sort pour chaque malade. = 100 couples de réposes (résultat avec A, résultat avec B) où les résultats sot otés - si échec et + si succès. Résultat avec A Résultat avec B Nombre de malades - - 35 - + 5 + - 15 + + 45 Total : 100 Il faut doc réaliser u test de Mc Nemar : le procédé correct est de regarder les = 5 + 15 = 0 paires discordates. O veut doc regarder si les pourcetages observés (5/0 et 15/0) sot compatibles avec u pourcetage théorique φ = 1/. - Hypothèses : H 0 : φ = 0,5 et H 1 : φ 0,5 - Critère de test : écart réduit ormal u = 5 1-0 0,5 0 ou u = 15 1-0 0,5 0 Car, sous H 0 : - moyee μ = φ = 1/ - variace σ = φ (1- φ) = 0,5 - Coditios d applicatios : Si o a u grad échatillo, c est-à-dire effectifs attedus φ et (1 φ) 10, où φ=1/, c est-à-dire si le ombre de paires discordates 10 o pred a das la table de la loi ormale au risque α. - Règle de décisio : u > a : o rejette H 0. Attetio : Pour ue variable biaire, o peut égalemet réaliser le test du Chi-. 7
B) Variables qualitatives géérales Ce sot des variables qualitatives à plus de modalités, les tests utilisés sot les tests du Chi-. (NB : o peut parfaitemet utiliser le Chi- sur ue variable biaire). 1) Chi- de coformité Exemple : soit le tableau de cotigece suivat : Couleur des cheveux Bru Châtai Blod Total Effectif échatillo 3 8 15 6 Proportio populatio 0,3 0,54 0,16 1 O pose H 0 : la distributio de la couleur des cheveux das l échatillo e diffère pas sigificativemet de celles das la populatio. Das le tableau précédet, il y avait les effectifs observés (o i ), o calcule maiteat les effectifs attedus (c i ) : Bru Châtai Blod Total o i (échatillo) 3 8 15 6 c i 6 x 0,3 = 7,8 6 x 0,54 = 14,04 6 x 0,16 = 4,16 6 o i - c i - 4,8-6,64 10,84 O vérifie que tous les c i sot supérieurs ou égaux à 10 (si ce est pas le cas, o e peut pas cotiuer). O calcule le critère de test : écart quadratique Q k i1 o i c i O compare Q à la valeur lue das la table du χ pour (ombre de modalités 1) degrés de libertés et au risque α. Si Q > χ o rejette H 0, les valeurs diffèret sigificativemet Si Q < χ o e peut pas rejeter H 0. ) Chi- d homogééité (= d idépedace) Tableau de cotigece à k coloes et l liges, par exemple : Couleur des cheveux Couleur des yeux Blod Bru Noir Roux Total Bleu 5 9 3 7 44 Gris ou vert 13 17 10 7 47 Marro 7 13 8 5 33 Total 45 39 1 19 14 NB : ici ce sot les effectifs observés qui sot otés (les o i ). - O pose H 0 : les variables sot idépedates. Exemple : o se demade s il existe ue liaiso etre les deux caractères qualitatifs : couleur des cheveux (4 modalités) et couleur des yeux (3 modalités) : c i 8
- O calcule les effectifs théoriques (les c i ) par la formule suivate : Total lige Total coloe c i Total gééral O dresse u ouveau tableau de cotigece avec, cette fois les effectifs théoriques (c i ): Couleur des cheveux Couleur des yeux Blod Bru Noir Roux Total Bleu (45x44) / 14 = 15.97 13.84 7.45 6.74 44 Gris ou vert 17.06 14.78 7.96 7.0 47 Marro 11.98 13.38 5.59 5.06 33 Total 45 39 1 19 14 Remarque : o doit coserver les décimales sur les c i das les calculs. - Critère de test : Q k i1 o i c i c i - Coditios d applicatios : o vérifie les coditios de Cochra Si o a liges et coloes (cas d ue variable biaire) : tous les c i doivet être > à 10 Si o a plus de deux liges et/ou coloes : tous les c i > 1. - Règle de décisio : O compare Q à la valeur lue das la table du Chi- pour [(ombre de lige - 1).(ombre de coloe 1)] degrés de libertés et au risque α : Si Q > χ o rejette H 0, il y a u lie sigificatif etre les variables. Si Q < χ o e peut pas rejeter H 0. 9
D) Variable quatitative 1) Test de coformité - Hypothèses : H 0 : μ = μ 0 versus H 1 : μ μ 0. - Critère de test : Si l o coaît σ : écart exactemet réduit : U m 0 0 Si l o e coaît pas σ : écart approximativemet réduit : - Coditios d applicatios : T m 0 s Si 30, comparer U ou T à a de la loi ormale au risque α. Si < 30, comparer U ou T à t de la table de Studet à (-1) degrés de libertés, e admettat la ormalité de la distributio. - Règle de décisio : Si U ou T > a (ou à t), o rejette H 0. Si U ou T a (ou à t), o e peut pas rejeter H 0. ) Test d homogééité (échatillos idépedats) - Hypothèses : H 0 : µ 1 = µ versus H 1 : µ 1 µ a. Cas où les variaces théoriques sot coues - Critère de test : - Coditios d applicatios : U m m 1 1 1 Si 1 et 30, comparer U à a de la loi ormale au risque α. Si 1 et/ou < 30, comparer U à t de la table de Studet à ( 1 1 + - 1) = ( 1 + - ) degrés de libertés, e admettat la ormalité de la distributio. - Règle de décisio : Si U > a (ou à t), o rejette H 0. 1 10
Si U a (ou à t), o e peut pas rejeter H 0. b. Cas où les variaces théoriques sot icoues b.1. Si 1 et 30 O suppose que les estimatios sot assez proches des valeurs théoriques car les échatillos sot assez grads. - Critère de test : - Règle de décisio : T m m 1 s 1 s 1 O compare T à a lue das la table de la loi ormale au risque α : - Si T > a : o rejette H 0 - Si T a : o e peut pas rejeter H 0 b.. Si 1 et/ou < 30 Les variaces d échatillo e sot pas ue boe estimatio des variaces théoriques ; das ce cas : Avat de tester, il faut vérifier l homoscédasticité (= égalité des variaces théoriques) e pratiquat le test de Fischer. O pose H 0 : σ 1 = σ cotre H 1 : σ 1 σ O peut alors calculer f tel que : f s max s où s max est la variace la plus grade des deux. mi O compare ce f au F de la table de Fischer au risque α/ et V 1 = ( associé à Smax - 1) degrés de libertés et V = ( associé à Smi -1) degrés de libertés. si F < f : o e peut pas cotiuer si F > f : les variaces théoriques e diffèret pas sigificativemet (o e rejette pas l homoscédasticité), o peut cotiuer. - O calcule alors le critère de test : - Règle de décisio : T m m 1 s c s c 1 Avec s c ( 1) s 1 1 ( 1) s ( 1 1) ( 1) O compare T au t de la loi de Studet à ( 1 + ) degrés de libertés : - Si T > t : o rejette H 0. - Si T t : o e peut pas rejeter H 0. 11
) Test d homogééité (échatillos appariés) Les échatillos sot dits appariés lorsque l o répète ue mesure chez la même persoe (qui sera alors présete das les groupes). Exemple type : mesure d ue cocetratio saguie avat et après prise médicameteuse O a aisi les valeurs y (de moyee m ) et les valeurs y (de moyee m ), o défiit la moyee des différeces m Z (tel que m Z m -m ) et la variace des différeces s Z. - Hypothèse : H 0 : µ - µ = µ Z = 0 - Critère de test : - Coditios d applicatios : t m Z Z s Z m Z 0 s Z Si 30, o utilise la loi ormale. Si < 30, o utilise la loi de Studet à (-1) ddl. - Règle de décisio : Si t > valeur tablée, o rejette H 0. Si t valeur tablée, o e peut pas rejeter H 0. Bo courage à tous, et boes révisios! O compte sur vous!! Vos tuteurs de l UE4 de 010 à 014. 1