COURS N 6 : Estimations

COURS N 6 : Estimatios O peut rappeler que les biostatistiques ot pour objectif de predre e compte la variabilité iteridividuelle, de résumer et décrire des doées et de comparer des échatillos. Nous avos fait, durat les 5 premiers cours, des statistiques descriptives, ous coaissios les caractéristiques des populatios et ous avos calculé des probabilités d'évéemets pour teter de prévoir certaies choses cocerat des échatillos. Nous allos maiteat réaliser des statistiques iféretielles, c'est-à-dire qu'o va predre e compte des résultats expérimetaux obteus sur des échatillos pour teter de gééraliser des doées sur toute ue populatio. C'est cette secode partie de l'eseigemet qui est le plus importat et qui permet aux biostatistiques d'avoir ue place importate e médecie, das plusieurs domaies : E recherche cliique, où l'o va étudier et comparer des groupes de malades pour gééraliser des doées sur ue populatio. E recherche diagostique, pour évaluer la performace des tests ou des stratégies diagostiques. E recherche thérapeutique, pour : Pour évaluer la toxicité et l'efficacité de médicamets. Pour comparer les ouveaux traitemets par rapport aux précédets. Pour predre e compte la variabilité des réposes aux traitemets etre patiets pour adapter le traitemet. - E recherche proostique, pour évaluer ou prédire l'évolutio des maladies sous différetes stratégies thérapeutiques. [Je passe les rappels de la moyee de variables aléatoires et l'itervalle de pari] I. Théorie de l'estimatio A. Itroductio Pour les itervalles de pari, o coait les valeurs théoriques de la moyee et de la variace (ou de l'écart-type). E statistiques, o a la problématique iverse : o a u échatillo de valeurs et o veut e déduire quelque chose au iveau d'ue populatio. Se poset alors les questios de la précisio de otre étude et de la taille efficiete ou o de otre échatillo.

B. Estimatio statistique L'estimatio statistique cosiste à obteir le maximum d'iformatios d'u échatillo e vue d'estimer u ou plusieurs paramètres icous das la populatio. O se base alors sur l'échatillo représetatif qui est u sous-esemble de la populatio d'étude costitué par tirage au sort (de faço aléatoire doc). Cepedat, souvet e médecie, o réalise u échatilloage «systématique» (o va par exemple predre tous les patiets d'u service etc...). Soit u -échatillo de X (X 1, X 2,..., X ) (les X sot idépedats) dot o cherche le paramètre θ icou. NB : θ 'est pas ue variable aléatoire! U estimateur de θ est ue foctio des valeurs de l'échatillo. O le ote T. T =T X 1, X 2,..., X A chaque fois qu'o tire u au sort u ouvel échatillo, l'applicatio de la foctio T doe u résultat différet : o parle d'estimatio de θ otée t. t =T x 1, x 2,..., x Les fluctuatios d'échatilloage de t sot liées aux valeurs x 1, x 2,..., x observées. C. Propriétés d'u estimateur 1. Biais d'u estimateur Le biais d'u estimateur est l'écart etre la vraie valeur et la valeur idiquée. O parle aussi de déformatio systématique. Le biais d'u estimateur est doée par la relatio : E T θ U estimateur est sas biais si E(T ) = θ : les estimatios obteues e s'écartet pas de la vraie valeur de faço systématique. Notre but est d'avoir u estimateur sas biais pour otre étude.

2. Variace d'u estimateur La variace d'u estimateur correspod à la dispersio des estimatios. Elle est otée Var(T ). Quad les estimatios sot peu dispersées, la variace est faible. Notre but est d'avoir ue variace la plus basse possible. 3. Covergece d'u estimateur U estimateur est dit coverget si E([T θ]²) ted vers 0 lorsque ted vers l'ifii. E([T θ]²) est l'erreur quadratique moyee (car elle déped du biais et de la variace) : E [T θ]² =E T ² 2θ E T θ²=e T ² E T ² E T ² 2θ E T θ² D'après la défiitio de variace, o a Var(T ) = E(T ²) E(T )² O remarque aussi que E(T )² 2θE(T ) + θ² = (E[T ] θ)² or E(T ) θ est le biais de l'estimateur. Doc : E [T θ] ² =Var T E[T ] θ ²=Var T biais² D. Estimateur de la moyee µ Il est possible d'utiliser 3 estimateurs pour la moyee µ : T = X 1 T = X 1, X 2,..., X 1 T =M = X 1, X 2,..., X

Pour cet estimateur, o a : 1. Estimateur 1 : T = X 1 - E(T ) = E(X 1 ) = µ ; d'où E(T ) µ = 0 L'estimateur est doc sas biais. - Var(T ) = Var(X 1 ) = σ² - E([T µ]²) = σ² (pas de biais) Cette valeur e déped pas de doc elle e ted pas vers 0 quad augmete. L'estimateur 'est pas coverget. 2. Estimateur 2 : T = X 1, X 2,..., X 1 Pour cet estimateur, équivalet à M 1, o a : - E T = E M = µ 1 1 L'estimateur est biaisé (E[T ] est différet de µ). Le biais équivaut à µ 1 µ= µ 1 - Var T =Var M σ² = 1 1 ² - E [T µ]² = σ² 2 1 ² µ 1 L'erreur quadratique moyee ted vers 0 quad ted vers 0 doc l'estimateur est coverget.

Pour cet estimateur, o a : 3. Estimateur 3 : T =M = X 1, X 2,..., X - E(T) = E(M) = µ L'estimateur 'est pas biaisé. - Var T =Var M = σ² - E [T µ] ² = σ² L'erreur quadratique moyee ted vers 0 quad ted vers 0 doc l'estimateur est coverget. M est doc u «bo» estimateur de la moyee (e tout cas le meilleur des 3). La moyee expérimetale m est ue estimatio de µ et doc ue réalisatio de M. E. Estimateur de la variace A partir d'u -échatillo, o pred ue variable aléatoire V e tat qu'estimateur de la variace σ², défiie par : V = 1 1 X i M 2 = 1 1 X 2 i M 2 Ue réalisatio de V sur u échatillo est s², variace «expérimetale» ou bie estimatio de la variace : s²= 1 1 x i m 2 = 1 1 x 2 i m 2 [à coaître pour estimer des variaces! Cette formule 'est pas das le formulaire.] Biais de l'estimateur : E V = 1 1 E[ X 2 i ] E[M 2 ] O sait que Var(X) = E(X²) E(X)² doc : E(X i ²) = E(X²) = Var(X) + E(X)² = σ² + µ² doc E[ X 2 i ]= σ² µ² =σ² µ²

De la même faço : E M 2 =Var M E M 2 = σ² µ² Doc E V = 1 1 E V = 1 1 E[ X i 2 ] E[M 2 ] = 1 1 σ²[ 1] =σ² =σ² 1 E(V) σ² = 0 L'estimateur 'est pas biaisé. 1 σ² µ² [σ² µ²] = 1 1 σ² µ² σ² µ² E V =σ² La variace expérimetale s² est ue estimatio de σ². C'est aussi ue réalisatio de V. F. Estimateur d'ue proportio Soit π la moyee d'ue variable de Beroulli. L'estimateur de π est doé par : T =P = ombre de X i =1 = X 1, X 2,..., X C'est u estimateur o biaisé et coverget (il a doc les propriétés de M). La proportio observée p est ue estimatio de π. C'est aussi ue réalisatio de P. II. Itervalle de cofiace Soit u échatillo X 1, X 2,..., X d'ue loi ayat u paramètre θ icou. O pourrait doer ue estimatio poctuelle de θ à partir d'u estimateur. Mais cela 'est pas très satisfaisat puisque l'estimatio déped de l'échatillo et qu'il existe de ombreuses fluctuatios d'échatilloage. O peut aussi doer u itervalle de valeurs possibles (ou ue «fourchette») de θ pour doer ue précisio à la valeur estimée.

A. Défiitio L'itervalle de cofiace de iveau 1 α, oté IC 1 α, est u itervalle qui a pour probabilité 1 α de coteir la vraie valeur θ. (Si o calcule IC 1 α sur u ombre ifii d'échatillos, alors θ IC 1 α das ue proportio de 1 α cas.) B. Itervalle de cofiace pour la moyee Soit X ue variable aléatoire cotiue défiie par E(X) = µ et Var(X) = σ². O cosidère qu'o a u grad échatillo et que 30 (o peut appliquer le TLC). O sait que : P µ M ε α σ² =1 α O obtiet l'estimatio par itervalle de µ, ou l'itervalle de cofiace de µ, e cosidérat que µ est l'icoue que que σ² est estimé par s² (le calcul est impossible sio). Sur u échatillo de valeurs, o observe la moyee m et la variace s², toutes deux expérimetales, pour calculer l'itervalle de cofiace de µ de iveau 1 α, ou de risque α (e cosidérat que 30 ) : IC 1 α =[m±ε α s² ] Remarque : souvet, α = 5% et doc ε α = 1,96 2, d'où : IC 95 =[m±2 s² ]

C. Itervalle de cofiace pour ue proportio Soit X ue variable de Beroulli de paramètre π. O admet qu'o est sur u grad échatillo et que π 5 ET 1 π 5 O sait que : P π M ε α π 1 π =1 α O obtiet l'estimatio par itervalle de π, ou l'itervalle de cofiace de π, e cosidérat que π est l'icoue que que π est estimé par p (le calcul est impossible sio). Sur u échatillo de valeurs, o observe la proportio p expérimetale, pour calculer l'itervalle de cofiace de π de iveau 1 α, ou de risque α (e cosidérat que π 5 ET 1 π 5 ) : IC 1 α =[ p±ε α p 1 p ] Attetio : Après votre calcul, il faut vérifier les coditios de validité aux bores de l'itervalle de cofiace. Avec vos deux valeurs de π limites π 1 et π 2, il faut s'assurer que les quatre termes π 1 ; 1 π 1 ; π 2 ; 1 π 2 sot tous supérieurs ou égaux à 5. Remarque : souvet, α = 5% et doc ε α = 1,96 2, d'où : IC 95 =[ p±2 [formulaire page 2] p 1 p ] D. Largeur, précisio et ombre de sujets écessaires pour u itervalle de cofiace La largeur d'u itervalle [a ; b] vaut b a. - Pour l'itervalle de cofiace d'ue moyee, la largeur l est doée par : Elle déped de s et. l=2ε α s

- Pour l'itervalle de cofiace d'ue proportio, la largeur l est doée par : l=2ε α p 1 p Elle déped de p et de. (Pour diviser par 2 la largeur, il faut multiplier par 4). Pour rappel, la précisio i est la demi-largeur. Nombre de sujets écessaires pour avoir ue précisio i doée : - Pour l'itervalle de cofiace d'ue moyee, o a : ε 2 α s² i² Il faut se doer ue valeur à priori pour s². augmete avec s². - Pour l'itervalle de cofiace d'ue proportio, o a : ε 2 α p 1 p i² Il faut se doer ue valeur à priori pour p. est maximum pour p = 0,5. [Ces formules sot à coaître ou à retrouver, elles e sot pas das le formulaire. Il e faut pas les cofodre avec le ombre de sujets écessaires pour les tests que ous allos voir plus tard! Je passe sur la coclusio, tout est das le cours.] Ce documet, aisi que tous les cours P1, sot dispoibles gratuitemet sur http://coursp1bichat-larib.weebly.com