Tests de comparaison de pourcentages

Tests de comparaison de pourcentages Docteur Alexandrine Lambert > Faculté de Pharmacie

Comparer deux pourcentages Pourcentage Variable qualitative dichotomique (Présence/Absence, Malades/Non malades, Décès/Survie, ) π est le pourcentage (inconnu) d individus présentant la caractéristique dans la population π est estimé par le pourcentage p observé sur un échantillon de taille n dont k individus présentent la caractéristique k p = n

Comparer deux pourcentages Comparaison de deux pourcentages dans le cas des grands échantillons. Comparaison d un pourcentage observé à un pourcentage théorique Comparaison de deux pourcentages observés Échantillons indépendants Échantillons appariés

Comparer un pourcentage à une valeur théorique Problème : déterminer si un pourcentage observé p sur un échantillon de taille n est différent d une valeur théorique π th Comparer π à π th Population π (inconnu) Échantillon p Population de référence π th (connu)

Formuler une hypothèse Hypothèse nulle H 0 Comparer un pourcentage à une valeur théorique π = π th où π est le pourcentage de la population dont est issu l échantillon Hypothèses alternatives H 1 Test bilatéral : π π th Test unilatéral àgauche ou àdroite : π < π th ou π > π th

Fixer le risque α Choisir la statistique Comparer un pourcentage à une valeur théorique Test du χ de conformité (loi du X ) Test z (loi normale) Conditions d application : n. π th 5 et n.(1 π th ) 5 (cas des grands échantillons)

Test du χ de conformité Comparer un pourcentage à une valeur théorique Calculer la valeur χ prise par la statistique du test Tableau Conditions d application : C 1 5 et C 5 χ Effectifs observés O 1 = n.p O = n.(1 p) n Effectifs calculés C 1 = n.π th C = n.(1 π th ) n = (O 1 C C 1 1 ) + (O C C Sous H 0 la statistique suit une loi du X à1 ddl )

Test du χ de conformité Confronter χ àla valeur seuil Comparer un pourcentage à une valeur théorique Lecture de la valeur seuil dans la table de la loi du χ Test bilatéral : on rejette H 0 au risque α si χ En pratique, si α = 5%, χ 1,α = 3,84 Si χ 3,84 : rejet de H 0 χ 1,α Si χ < 3,84 : non rejet de H 0 χ 1,α

Exemple 1 Comparer un pourcentage à une valeur théorique En France, 7% des personnes hospitalisées contractent une infection nosocomiale dans l'établissement où elles sont soignées. Sur un échantillon de 50 personnes soignées à l hôpital H, 8 ont contracté une infection nosocomiale. Le pourcentage observé sur l échantillon diffère t il de la référence nationale au risque α = 5%?

Comparer un pourcentage à une valeur théorique 8 n = 50 ; p = 0,11 ; πth 50 = = 0,07 Infection nosocomiale OUI NON Total Effectifs observés O 1 = 8 O = 50 Effectifs calculés C 1 = 50x0,07 = 17,5 C = 50x0,93 = 3,5 50 χ = (8 17,5) 17,5 + ( 3,5) 3,5 = 6,77

Test du χ : exemple 1 Lecture Comparer un pourcentage à une valeur théorique χ = 6,77 χ1,5% = 3,84 : rejet de H 0 On montre, au risque 5%, une différence significative entre le pourcentage de personnes hospitalisées contractant une infection nosocomiale à l hôpital H et dans l ensemble du pays (p < 0,01).

Test z Comparer un pourcentage à une valeur théorique Calculer la valeur zprise par la statistique Z p πth z πth.(1 πth) n Sous H 0, Z suit une loi normale centrée réduite = Équivalence entre χ et test z : χ = z Conditions d application : n.π th 5 et n.(1 π th ) 5 χ à1 ddl est le carré d une loi normale centrée réduite Équivalent àc1 et C 5

Comparer un pourcentage à une valeur théorique Test z Confronter zàla valeur critique z α Test bilatéral : on rejette H 0 si z z α Test unilatéral : si H 1 s écrit π > πth, on rejette H 0 si z z α si H 1 s écrit π < πth, on rejette H 0 si z z α Pour un même risque d erreur, les valeurs seuil du χ sont donc les carrés des valeurs seuil de z : χ 1,α=(z α ) (3,84 =1,96 )

Comparer un pourcentage à une valeur théorique Test z: exemple 1 8 Données : n = 50 ; p = = 0,11 ; πth = 0,07 50 Hypothèses : H 0 : π = 0,07 ; H 1 : π 0,07 Calcul 0,11 0,07 z = =,60 0,07.(1 0,93) 50 Conditions d application vérifiées : 50 x 0,07 5 et 50 x 0,93 5

Test z: exemple 1 Lecture Comparer un pourcentage à une valeur théorique z =,60 z 0,05 =1,96 : rejet de H 0 (même conclusion que test précédent) Degré de signification lu dans la table : p < 0,01

Comparer pourcentages observés - Échantillons indépendants - Problème : comparer proportions (p 1 et p ) dans groupes indépendants de tailles n 1 et n Comparer π 1 à π Population π 1 Échantillon p 1 Population π Échantillon p

Comparer pourcentages observés - Échantillons indépendants - Formuler une hypothèse Hypothèse nulle H 0 Les échantillons sont issus de la même population ayant comme pourcentage π 0 π 1 = π (= π 0 ) où π 1 et π pourcentages de la population dont sont issus les échantillons 1 et Hypothèses alternatives H 1 Test bilatéral : π 1 π Test unilatéral : π 1 < π ou π 1 > π

Fixer le risque α Comparer pourcentages observés - Échantillons indépendants - Choisir la statistique : Test du χ (loi du χ ) Test z (loi normale) Conditions d application : n 1. π 0 5 et n 1.(1 π 0 ) 5 n. π 0 5 et n 1.(1 π 0 ) 5

Test du χ Comparer pourcentages observés - Échantillons indépendants - Calculer la valeur χ prise par la statistique Tableau de contingence (tableau à4 cases) Succès Échec Total Groupe 1 O 11 (C 11 ) O 1 (C 1 ) n 1 Groupe O 1 (C 1 ) O (C ) n Total n 1 n N Effectifs calculés sous H 0 : n' i nj Cij = N Conditions d application : C ij 5 = (Oij Cij) χ i, j Cij Sous H O la statistique suit une loi du X à1 ddl

Comparer pourcentages observés - Échantillons indépendants - Test du χ : Remarques Dans le cas des tableaux de contingence à 4 cases, il est possible d utiliser la correction de continuité, surtout lorsque les valeurs attendues sont faibles (en pratique C ij < 5) χ ( O C 0,5) = ij ij C i, j ij Petits échantillons : test exact de Fisher (hors programme)

Test du χ Comparer pourcentages observés - Échantillons indépendants - χ Confronter àla valeur critique Lecture de la valeur seuil dans la table Test bilatéral : χ χ1,α χ < χ Si : rejet de H 0 Si : non rejet de H 0 1,α χ 1,α

Exemple Comparer pourcentages observés - Échantillons indépendants - On désire comparer l efficacité de deux traitements T1 et T sur 100 patients atteints d une maladie M. On tire au sort deux groupes de 50 patients, un groupe est soumis àt1, le second àt. Le pourcentage de guérison chez les patients soumis à T1 est de 30%, chez ceux soumis àt de 40%. Le taux de guérison est il différent entre les traitements?

Comparer pourcentages observés - Échantillons indépendants - Test du χ : exemple Données : n = 50 ; p1 = 0,3 et n = 50 ; p 1 = 0,4 Hypothèses : H 0 : π 1 = π ; H 1 : π 1 π Calcul Guéris Non guéris Total Groupe T1 15 (17,5) 35 (3,5) 50 Groupe T 0 (17,5) 30 (3,5) 50 Total 35 65 100 Conditions d application vérifiées : C ij 5 (15 17,5) (0 17,5) (35 3,5) (30 3,5) χ = + + + = 1,10 17,5 17,5 3,5 3,5

Comparer pourcentages observés - Échantillons indépendants - Test du χ : exemple Lecture χ = 1,10 < χ1,5% = 3,84 : H 0 acceptable. On ne met pas en évidence, au risque 5%, de différence significative entre les taux de guérison avec les traitements

Test z Comparer pourcentages observés - Échantillons indépendants - Calculer la valeur zprise par la statistique Z p1 p n 1.p z avec p0 = p0.(1 p0) p0.(1 p0) n + n n 1 = χ = (z) 1 p 0 est l'estimation de la proportion commune π 0 Z suit une loi normale centrée réduite Conditions d application : n 1. π 0 5 et n 1.(1 π 0 ) 5 n. π 0 5 et n.(1 π 0 ) 5 1 + n + n.p Х à1 ddl est le carré d une loi normale centrée réduite C ij 5

Comparer pourcentages observés - Échantillons indépendants - Test z Confronter zàla valeur critique z α Test bilatéral : on rejette H 0 si z z α Test unilatéral : si H 1 s écrit π 1 > π, on rejette H 0 si z z α si H 1 s écrit π 1 < π, on rejette H 0 si z z α

Comparer pourcentages observés - Échantillons indépendants - Test z: exemple Données : n = 50 ; p1 = 0,3 et n = 50 ; p 1 = 0,4 Hypothèses : H 0 : π 1 = π ; H 1 : π 1 π Calcul 50x0,3 + 50x0,4 p 0 = = 0,35 50 + 50 0,3 0,4 z = = 1,05 0,35x0,65 0,35x0,65 + 50 50 Conditions d application vérifiées : 50 x 0,35 5 et 50 x 0,65 5

Test z: exemple Lecture Comparer pourcentages observés - Échantillons indépendants - z = 1,05 < z 0,05 = 1,96 : H 0 acceptable (Même conclusion que le test précédent)

Comparer pourcentages observés - Séries appariées - Variable aléatoire qualitative dichotomique Cas des grands échantillons Individus de échantillons liés Présence d une caractéristique sur les mêmes sujets Présence d une caractéristique chez des sujets appariés Problème : on s intéresse aux taux de guérison chez des sujets ayant reçus un traitement T1 et des sujets appariés ayant reçus un traitement T : on cherche à comparer p 1 et p les taux de guérison avec T1 et T.

Comparer pourcentages observés - Séries appariées - Formuler une hypothèse Hypothèse nulle H 0 π 1 = π où π 1 et π pourcentages inconnus des populations d où sont issus les échantillons Hypothèses alternatives H 1 Test bilatéral : π 1 π Test unilatéral : π 1 < π ou π 1 > π

Comparer pourcentages observés - Séries appariées - Tableau des valeurs Pour tenir compte de l appariement, il faut faire apparaître quels sont les sujets qui appartiennent aux mêmes paires. Pour chaque paire d individus, on peut observer, selon s il y a présence (+) ou absence ( ) du caractère étudié, l une des 4 configurations possibles. Échantillon 1 Échantillon Nombre de paires + + a + b + c d

Comparer pourcentages observés - Séries appariées - Éch. 1 Éch. + Total + a b a+b c d c+d Total a+c b+d n Les paires concordantes n apportent pas d information sur la liaison entre le traitement et la guérison. On doit donc se fonder sur la répartition des paires discordantes. Si l hypothèse H 0 est vraie, il doit y avoir autant de paires discordantes du type + que de type + Tester H 0 revient donc à tester si le pourcentage observé de paires + est significativement différent de la valeur théorique 0,5.

Fixer le risque α Comparer pourcentages observés - Séries appariées - Choisir la statistique Test du χ de McNemar (loi du X ) Test z (loi normale) Conditions d application

Comparer pourcentages observés - Séries appariées - χ = b + c b b + c b + c c + b + c + + Effectifs observés b c b+c b c b c Effectifs calculés b+c b + c 5 (b c) = b + c

Comparer pourcentages observés - Séries appariées - Test de McNemar (χ ) : remarques Il est possible d utiliser la correction de continuité, surtout lorsque les valeurs attendues sont faibles χ 0 b c b + 0,5 = b + c b c c + 0,5 + b + c = ( b c 1) b + c

Comparer pourcentages observés - Séries appariées - Test de McNemar (χ ) Confronter χ àla valeur critique Lecture de la valeur seuil dans la table Test bilatéral : on rejette H 0 si χ χ Si : rejet de H 0 1,α χ < χ1,α Si : non rejet de H 0 χ 1,α

Test z Comparer pourcentages observés - Séries appariées - Calculer la valeur zprise par la statistique Z b + c b b c z = (b + c).0,5.0,5 b + c = χ = (z) Z suit une loi normale centrée réduite Conditions d application : b+c 10 Х à1 ddl est le carré d une loi normale centrée réduite

Comparer pourcentages observés - Séries appariées - Test z Confronter zàla valeur critique z α Test bilatéral : on rejette H 0 si z z α Test unilatéral : si H 1 s écrit π 1 > π, on rejette H 0 si z z α si H 1 s écrit π 1 < π, on rejette H 0 si z z α

Exemple 3 Comparer pourcentages observés - Séries appariées - On désire comparer l efficacité de deux traitements T 1 et T chez 100 patients atteint d une maladie M. Les deux traitements sont administrés aux patients. L ordre d administration des traitements est tiré au sort en ménageant une période dite de wash out entre les administrations. Les résultats sont les suivants : Succès T 1 Échec T Succès 4 16 Échec 6 54 Le taux de guérison est il différent entre les deux traitements?

Comparer pourcentages observés - Séries appariées - Test de McNemar : exemple 3 On cherche àcomparer les pourcentages observés : 4 + 6 4 + 16 p1 = = 0, 3 p = = 0, 4 100 100 Hypothèses : H 0 : π 1 = π ; H 1 : π 1 π Conditions d application vérifiées : nombre de paires discordantes = 16 + 6 = 10 (16 6) χ = = 4,55 (16 + 6)

Comparer pourcentages observés - Séries appariées - Test de McNemar : exemple 3 Lecture χ = 4,55 χ = 3,84 : H 0 rejetée 1,5% On montre, au risque 5%, une différence significative entre les taux de guérison avec les traitements (p<0,05).