Université de Rouen UFR de Médecine et Pharmacie Année Universitaire 2014-2015 GFGSP 3 Epreuve de Statistiques Mme Le Clézio Date de l épreuve : mardi 6 janvier Durée de l épreuve : 1 heure Session 1 Le sujet comporte 2 pages et se trouve accompagné d un formulaire et des tables usuelles. Consignes pour tous les tests, vous choisirez un risque α de 5%; tout autre document est interdit; la calculatrice est autorisée. Questions de cours Indiquez sur votre copie la(les) bonne(s) réponse(s) sous la forme : Question x, réponse y. 1. La puissance d un test augmente, toutes choses égales par ailleurs, lorsque : (A) la taille de l échantillon augmente, (B) la magnitude de l effet augmente, (C) la variance de la variable d intérêt augmente, (D) la variance de la variable d intéret diminue. 2. Lorsque l on souhaite comparer entre deux groupes indépendants la moyenne d une variable continue dont la distribution est fortement bimodale dans chacun des groupes, on utilise : (A) un test de comparaison des proportions, (B) un test non paramétrique de Mann-Whitney/Wilcoxon pour échantillons indépendants, (C) un test de Student de comparaison de moyennes pour données appariées, (D) un test de Student de comparaison de moyennes pour échantillons indépendants. 1. A, B, D 2. B 1
Exercice 1 Un clinicien évalue l effet d une nouvelle molécule de chimiothérapie sur la résorption de tumeurs du sein. L efficacité de cette nouvelle molécule doit être comparée à celle du traitement actuel de référence. Pour cela, on administre le nouveau traitement T à un groupe de 35 patientes, tandis que le traitement R de référence est attribué à 35 autres patientes. Les patientes ont été attribuées à leur groupe de traitement de façon aléatoire. Après traitement, on observe que 26 patientes présentent une réponse complète au traitement T, tandis que 17 seulement présentent une réponse complète au traitement R. Toutes les autres présentent des résidus de tumeur. On désire savoir si le nouveau traitement T est plus efficace que le traitement de référence. 1. Donnez l intervalle de confiance à 95% de la proportion de patientes présentant une réponse totale au traitement dans chacun des groupes. 2. Définissez les hypothèses à tester. 3. Proposez une statistique de test permettant de répondre à la question. 4. Comment concluez-vous le test? 5. Donnez un encadrement du degré de significativité du test. On note π R (resp. π T ) la proportion théorique de patientes présentant une réponse totale au traitement de référence (resp. au nouveau traitement T). Intervalle de confiance à 95% pour chacun des groupes Pour chaque intervalle de confiance, on utilise le quantile à 97,5% (bilatéral) d une loi normale, lu dans la dernière ligne de la table de la loi de Student, soit 1,96. p i (1 p i ) IC 95% (π i ) = [p i ± z 97,5% ] n i Soit, avec p R = 0, 486 et p T = 0, 743 : IC 95% (π R ) = [ 17 17/35 18/35 ± 1, 96 ] = [32, 0% 65, 1%] 35 35 IC 95% (π T ) = [ 26 26/35 9/35 ± 1, 96 ] = [59, 8% 88, 8%] 35 35 Hypothèses à tester : Test unilatéral de comparaison de deux proportions H 0 : Les patientes ont la même probabilité de présenter une réponse totale au traitement dans les deux groupes. H 1 : Les patientes ayant reçu le traitement T ont une probabilité supérieure de présenter une réponse totale. { H 0 : π T = π R H 1 : π T > π R Pas de significatif dans la formulation des hypothèses. Cohérence entre la formulation mathématique et la formulation en français. Attention aux notations et à leur définition
Statistique de test On considère la statistique de test suivante : T = p T p R p(1 p)(1/np + 1/n T ) où p estime la proportion commune : p = (17 + 26)/70 = 61, 4% t obs = 0, 743 0, 486 0, 614 (1 0, 614) ( 135 + 135 ) = 2, 21 Attention aux erreurs de calculs (somme de fractions) Conclusion du test La statistique de test T suit approximativement sous l hypothèse nulle une loinormale, donc on compare t obs au quantile à 95% (test unilatéral) d une loi normale, soit 1,64. Comme t obs > 1, 64, on rejette l hypothèse nulle et on conclut que le nouveau traitement augmente significativement, au risque de 5%, la probabilité que les patientes présentent une réponse totale, il est significativement plus efficace que le traitement de référence. Attention au quantile, ce n est pas le même que pour les intervalles de confiance! Préciser que la conclusion est au risque de 5%. Autre option équivalente : test de comparaison des proportions avec un test du χ 2. Encadrement du degré de significativité On lit dans la dernière ligne de la table de Student que la valeur t obs est comprise entre 1,960 et 2,327 qui sont respectivement les quantiles à 97,5% et 99% de la loi normale. Le degré de significativité du test est donc compris entre 1% et 2,5%. Exercice 2 Un laboratoire souhaite comparer la précision de deux kits enzymo-immunologiques pour le dosage d un médicament. La précision de l ancien kit est mesurée à partir de l ensemble des 75 dosages contrôles à concentration connue et fixe de 30 mg/l, prélevés sur la chaîne de production la semaine précédente. Le laboratoire mesure une variance s 2 1 de 3,4 (mg/l) 2. La précision du nouveau kit est mesurée sur 20 dosages contrôles à concentration identique connue et fixe de 30mg/L. La variance s 2 2 de ces mesures est alors de 2,1 (mg/l) 2. Au vu de ces mesures, peut-on valider que le nouveau kit est plus précis que l ancien?
On note σ 1 (resp. σ 2 ) la variance des mesures de l ancien kit (resp. du nouveau). Hypothèses à tester : Test unilatéral à droite de comparaison de deux variances { H 0 : La variance du nouveau kit est égale à celle de l ancien. H 1 : La variance du nouveau kit est plus petite que celle de l ancien. { H 0 : σ 2 = σ 1 H 1 : σ 2 < σ 1 Pas de significatif dans la formulation des hypothèses. Cohérence entre la formulation mathématique et la formulation en français. Les mesures du maître sont estimées dans les mêmes conditions que celles de l étudiant, il ne s agit pas d une comparaison à une norme. Statistique de test On considère la statistique de test suivante : F = s2 1 s 2 2 f obs = 3, 4 = 1, 619 2, 1 On veut savoir si σ 1 est supérieur à σ 2 donc s 1 est au numérateur. L énoncé donne directement les variances. Conclusion du test La statistique de test F suit sous l hypothèse nulle une loi de Fisher à n 2 1 et n 1 1 ddl, soit 19 et 74 ddl. Dans la table, on prend le plus proche, soit 18 et 70, ce qui donne un quantile à 95% de 1,753. Comme f obs < 1, 753, on ne rejette pas l hypothèse nulle et on conclut que le nouveau kit n est pas significativement plus précis que l ancien, au risque de 5%. Pas de problème s ils choisissent des ddl de 20 ou 80. Exercice 3 Un anesthésiste a comparé les effets de 4 anesthésiants couramment utilisés. 80 patients ont été attribués aléatoirement à 4 groupes de traitement. Il compare alors, pour chacun des groupe, la durée jusqu à la reprise de respiration non-assistée des patients après arrêt du traitement. Il observe les moyennes et écart-types suivants dans chacun des groupes : Traitement A B C D Moyenne par groupe m j (min) 5.4 3.25 3.05 4.35 Ecart-type par groupe s j (min) 5.0 3.0 3.1 3.1
Son logiciel d analyse préféré lui donne les résultats d analyse de la variance suivants : Df Sum Sq Mean Sq F value P r(> F ) Traitement 3 70,94 23,646 1,7757 0,1589 Résidus 76 1012,05 13,316 1. L anesthésiste souhaite comparer les durées moyennes jusqu à la reprise de la respiration non-assistée entre ces 4 traitements. Définissez les hypothèses du test statistique correspondant. 2. Comment concluez-vous ce test? 1. Soient µ A,µ B,µ C,µ D les espérances dans chaque groupe. On teste les hypothèses suivantes : { H 0 : µ A = µ B = µ C = µ D H 1 : au moins un µ i différent des autres 2. Il suffit de lire le degré de significativité du test dans la table. Comme 0, 1589 > 5%, on ne rejette pas l hypothèse nulle, les durées moyennes jusqu à reprise de la respiration non-assistée des 4 traitements sont comparables.