Master 1 de Saté Publique UE de biostatistique : cours 3 Estimatio Itervalle de cofiace Estimatio - Itervalle de cofiace 1
Estimatio Valeur théorique (ou vraie) Populatio Prédictio Valeur attedue Itervalle de fluctuatio Estimatio Estimatio poctuelle Itervalle de cofiace Observatios Echatillo Estimatio poctuelle O doe ue uique valeur calculée à partir des observatios faites sur l'échatillo Estimatio par itervalle O doe u itervalle qui a de "fortes chaces" de coteir la vraie valeur. M1 de Saté Publique Biostatistique - Cours 3 Estimatio - Itervalle de cofiace 1
Qualités d ue estimatio Pas de biais Variace miimum Variace faible Variace élevée Absece de biais 1 2 Présece de biais 3 4 Le choix etre 2 et 3 'est pas évidet e terme "d'éloigemet moye" etre l'échatillo et la vraie valeur (cetre de la cible). E gééral, o privilégie l'absece de biais (c'est-à-dire 2) M1 de Saté Publique Biostatistique - Cours 3 Estimatio - Itervalle de cofiace 2
Facteurs de biais d ue estimatio La formule utilisée pour calculer l'estimateur Elle repose sur des développemets mathématiques ou statistiques plus ou mois compliqués (voir par exemple pour la variace) La faço dot a été costitué l échatillo - échatilloage complexe (podératio, grappes...) adaptatio des formules Nous ous limiteros aux cas où l échatillo est obteu par tirage au sort simple - biais de sélectio healthy worker effect perdus de vue, o réposes Les erreurs liées à u mauvais choix de l échatillo ot des coséqueces d autat plus graves qu elles sot souvet beaucoup plus difficiles à déceler et à corriger que des erreurs de formules. M1 de Saté Publique Biostatistique - Cours 3 Estimatio - Itervalle de cofiace 3
Estimatio poctuelle Pricipaux estimateurs Les estimatios "ituitives" sot souvet "les boes"... Estimatio d u pourcetage P = pourcetage vrai de malades das la populatio Echatillo compreat sujets dot k malades Estimatio de P : p o = k Estimatio d ue moyee µ = moyee vraie de X Echatillo de sujets tirés au sort das la populatio valeurs observées : x 1,, x Estimatio de µ : m = i=1 x i M1 de Saté Publique Biostatistique - Cours 3 Estimatio - Itervalle de cofiace 4
mais pas toujours... Estimatio d ue variace µ = moyee vraie de X σ 2 = variace vraie de X Estimatio de σ2 : i=1 (x i µ) 2 comme µ est icoue s 2 = i=1 (x i m) 2 1 Autres expressios de s2 : s 2 = 2 x i m 2 i=1 1 ou s 2 = 2 x i 1 i=1 ( x i i=1 1 ) 2 M1 de Saté Publique Biostatistique - Cours 3 Estimatio - Itervalle de cofiace 5
Méthode du maximum de vraisemblace (Pricipale méthode d'estimatio) Vraisemblace d'u échatillo = probabilité d'observer cet échatillo coaissat les vrais paramètres das la populatio (pourcetage, moyee ou variace). L'estimatio par maximum de vraisemblace d'u paramètre à partir des observatios faites sur u échatillo cosiste à choisir la valeur qui red sa probabilité (càd sa vraisemblace) maximum. Les estimateurs précédets de P et de µ sot les estimateurs du maximum de vraisemblace. Celui de σ 2 est i=1 (x i µ) 2. Les estimatios obteues par la méthode du maximum de vraisemblace sot sas biais (asymptotiquemet) et de variace miimum. M1 de Saté Publique Biostatistique - Cours 3 Estimatio - Itervalle de cofiace 6
Doées groupées Temps de survie ( jours) 0-4 5-9 10-14 15-19 20-24 25-29 30-34 35-39 Temps de survie (cetre des 2 7 12 17 22 27 32 37 classes) Nbre de souris 4 6 25 28 20 15 0 2 x = 4 2 + 6 7 = j x j = 1745 x 2 = 4 2 2 + 6 7 2 2 = j x j = 35 355 m = x = 1745 100 = 17,45 s 2 = x 2 ( ) 2 1 x 1 = 35355 1 100 17452 99 = 49,5 m = j x j s 2 = ( j x j m) 2 1 Autres expressios de s 2 s 2 = 2 j x j m 2 1 = 2 j x j 1 ( x ) 2 j j 1 M1 de Saté Publique Biostatistique - Cours 3 Estimatio - Itervalle de cofiace 7
Estimatio par itervalle Itervalle de cofiace Valeur théorique (ou vraie) Populatio Prédictio : Itervalle de fluctuatio Estimatio : Itervalle de cofiace Observatios Echatillo Défiitio L itervalle de cofiace à (1-α) (ou au risque α) est u itervalle qui a ue probabilité (1-α) de coteir la vraie valeur (icoue) du paramètre M1 de Saté Publique Biostatistique - Cours 3 Estimatio - Itervalle de cofiace 8
Itervalle de cofiace d ue moyee 1. Grads échatillos ( 30) moyee et variace de X das la populatio : µ et σ 2 sur u échatillo de sujets : m, s 2 si est grad, Z = m µ σ 2 / ormale cetrée réduite suit approximativemet ue loi -> Itervalle de fluctuatio de Z : z α / 2 ; z α / 2 <=> P z α/2 < m µ σ 2 / < z α/2 = 1 α m µ σ 2 / < z α/2 m µ < z α/2 σ 2 / m z α/2 σ 2 / < µ z α/2 < m µ z σ 2 α/2 σ 2 / < m µ µ < m + z α/2 σ 2 / / d où : σ 2 P m z α/2 < µ < m + z α/2 σ 2 = 1 α M1 de Saté Publique Biostatistique - Cours 3 Estimatio - Itervalle de cofiace 9
σ 2 P m z α/2 < µ < m + z α/2 σ 2 = 1 α L itervalle m ± z α/2 σ 2 cotiet µ avec ue probabilité (1 α) <=> c est l itervalle de cofiace de µ à (1-α) (ou au risque α) E pratique, puisque est grad, o remplace σ 2 par s 2. Itervalle de cofiace de µ : s 2 m ± z α / 2 (si 30) M1 de Saté Publique Biostatistique - Cours 3 Estimatio - Itervalle de cofiace 10
Exemples Tesio artérielle de 41 hommes de plus de 65 as Echatillo 1 : m = 14,97 s 2 = 85,91 I.C. de µ : 14,97 ± 1,96 85,91 41 = 14,97 ± 2,84 = 12,13 ; 17,81 Echatillo 2 : m = 15,24 s 2 = 78,12 I.C. de µ : 15,24 ± 1,96 78,12 41 = 15,24 ± 2,71 = 12,53 ; 17,95 M1 de Saté Publique Biostatistique - Cours 3 Estimatio - Itervalle de cofiace 11
Autre présetatio de l itervalle de cofiace Itervalle de fluctuatio de la moyee si la vraie valeur est µ' µ' m µ i µ i : valeur miimum compatible avec l'observatio m µ s : valeur maximum compatible avec l'observatio m µ s µ i m µ s Itervalle de cofiace de µ M1 de Saté Publique Biostatistique - Cours 3 Estimatio - Itervalle de cofiace 12
Itervalle de cofiace d ue moyee 2. Petits échatillos (<30) moyee et variace de X das la populatio : µ et σ 2 sur u échatillo de sujets : m, s 2 Si la distributio de X est ormale : T 1 = m µ Studet à (-1) ddl s 2 / suit ue loi de Itervalle de fluctuatio de T -1 : t 1;α / 2 ; t 1;α / 2 <=> P t 1,α/2 < m µ s 2 / < t 1,α/2 = 1 α s 2 d où : P m t 1,α/2 < µ < m + t 1,α/2 s 2 = 1 α Itervalle de cofiace de µ : s 2 m ± t 1,α / 2 (si la distributio de X est ormale) M1 de Saté Publique Biostatistique - Cours 3 Estimatio - Itervalle de cofiace 13
Loi de Studet Défiitio Z : variable suivat ue loi ormale cetrée réduite Y : variable suivat ue loi de χ2 à k ddl idépedate de Z T = Z Y / k loi de Studet à k ddl Table 3 : Loi de Studet (T) α La table doe la valeur t α telle que α = P(T > t α ) t α α d.d.l. 0,30 0,20 0,10 0,05 0,025 0,01 0,005 0,001 0,0005 1 0,727 1,376 3,078 6,314 12,706 31,821 63,657 318,31 636,62 2 0,617 1,061 1,886 2,920 4,303 6,965 9,925 22,327 31,598 29 0,530 0,854 1,311 1,699 2,045 2,462 2,756 3,396 3,659 30 0,530 0,854 1,310 1,697 2,042 2,457 2,750 3,385 3,646 40 0,529 0,851 1,303 1,684 2,021 2,423 2,704 3,307 3,551 60 0,527 0,848 1,296 1,671 2,000 2,390 2,660 3,232 3,460 100 0,526 0,845 1,290 1,660 1,984 2,364 2,625 3,174 3,391 0,524 0,842 1,282 1,645 1,960 2,326 2,576 3,09 3,291 Exemples : P(T 2 > 22,327) = 0,001 P(T 60 > a) = 0,01 => a = 2,390 M1 de Saté Publique Biostatistique - Cours 3 Estimatio - Itervalle de cofiace 14
Table 3 : Loi de Studet (T) La table doe la valeur t α telle que α = P(T >t α ) α t α α d.d.l. 0,30 0,20 0,10 0,05 0,025 0,01 0,005 0,001 0,0005 1 0,727 1,376 3,078 6,314 12,706 31,821 63,657 318,31 636,62 2 0,617 1,061 1,886 2,920 4,303 6,965 9,925 22,327 31,598 29 0,530 0,854 1,311 1,699 2,045 2,462 2,756 3,396 3,659 30 0,530 0,854 1,310 1,697 2,042 2,457 2,750 3,385 3,646 40 0,529 0,851 1,303 1,684 2,021 2,423 2,704 3,307 3,551 60 0,527 0,848 1,296 1,671 2,000 2,390 2,660 3,232 3,460 100 0,526 0,845 1,290 1,660 1,984 2,364 2,625 3,174 3,391 0,524 0,842 1,282 1,645 1,960 2,326 2,576 3,09 3,291 Quad le ombre de degrés de liberté est élevé, t suit approximativemet ue loi ormale de moyee 0 et de variace 1. La lige ddl = cotiet les mêmes valeurs que la table de Z. M1 de Saté Publique Biostatistique - Cours 3 Estimatio - Itervalle de cofiace 15
Itervalle de cofiace d ue moyee Petits échatillos ( < 30) Itervalle de cofiace de µ : s 2 m ± t 1,α / 2 (si la distributio de X est ormale) Exemple 1 : tesio artérielle de 12 hommes de plus de 65 as m = 12,58 s 2 = 60,08 I.C. de µ à 95% : 12,58 ± 2,201 60,08 12 = 12,58 ± 4,93 = 7,66 ; 17,52 Coditio d applicatio : distributio de la tesio artérielle ormale chez les hommes de plus de 65 as. M1 de Saté Publique Biostatistique - Cours 3 Estimatio - Itervalle de cofiace 16
Exemple 2 : tesio artérielle de 41 hommes de plus de 65 as m = 14,97 s 2 = 85,91 Calcul de l itervalle de cofiace avec la loi de Studet m ± t 40,α/2 s 2 = [12,06 ; 17,88] =14,97 ± 2,021 85,91 41 = 14,97 ± 2,91 Coditio d applicatio : distributio de la tesio artérielle ormale chez les hommes de plus de 65 as. Calcul de l itervalle de cofiace avec l approximatio par la loi ormale m ± z α/2 s 2 = [12,13 ; 17,81] =14,97 ± 1,96 85,91 41 = 14,97 ± 2,84 Pas de coditio d applicatio M1 de Saté Publique Biostatistique - Cours 3 Estimatio - Itervalle de cofiace 17
Itervalle de cofiace d u pourcetage 1. Grads échatillos P : pourcetage vrai das la populatio p 0 : pourcetage observé sur u échatillo de sujets si est grad (P et Q 5), Z = p 0 P suit approximativemet PQ ue loi ormale cetrée réduite. => P z α/2 < p o P PQ / < z α/2 = 1 α D où : P p 0 z α/2 PQ < P < p 0 + z α/2 PQ = 1 α I.C. au risque α de P : p 0 ± z α/2 PQ M1 de Saté Publique Biostatistique - Cours 3 Estimatio - Itervalle de cofiace 18
I.C. de P : p 0 ± z α/2 PQ Coditios d applicatio : P et Q 5 E pratique, o remplace PQ par p 0 q 0 : I.C. de P : p 0 ± z α/2 p o q o = p i ; p s La coditio d'applicatio P et Q 5 est approchée par : p i, p s, q i et q s 5 P p i p 0 p s Itervalle de cofiace de P : p p i ; p s = p 0 ± z o q o α / 2 (si p i, p s, q i et q s 5) M1 de Saté Publique Biostatistique - Cours 3 Estimatio - Itervalle de cofiace 19
Exemples 1. = 60 sujets 18 malades => p 0 = 0,30 I.C. (à 95%) de P : 0,30 ± 1,96 0,30 0,70 60 = 0,18 ; 0,42 Coditios d applicatio : p i = 10,8 p s = 25,2 q i = 49,2 q s = 34,8 5 2. = 40 sujets 8 malades => p 0 = 0,20 I.C. (à 95%) de P : 0,20 ± 1,96 0,20 0,80 40 = 0,08 ; 0,32 Coditios d applicatio o satisfaites : p i = 40 x 0,08 = 3,2 M1 de Saté Publique Biostatistique - Cours 3 Estimatio - Itervalle de cofiace 20
Itervalle de cofiace d u pourcetage 2. Petits échatillos L approximatio par la loi ormale est plus possible -> il faut utiliser la loi biomiale E pratique, recours à des tables costruites à partir de la loi biomiale. Exemple : = 40 sujets 8 malades p o = 0,20 I.C. de P : 00,20 ± 0,20 0,80 40 = 0,08 ; 0,32 Coditios d applicatio o satisfaites : p i = 40 0,08 = 3,2 Table 5 : [9,05% ; 35,65%] Table 5 : Itervalle de cofiace d u pourcetage Pour chaque valeur du ombre de sujets N, les coloes de la table doet successivemet le ombre d évéemets, le pourcetage correspodat (multiplié par 100) et les deux bores de l itervalle de cofiace à 95% (multipliées par 100). N = 40 0 0,00 0,00-8,81 1 2,50 0,06-13,16 2 5,00 0,61-16,92 3 7,50 1,57-20,39 4 10,00 2,79-23,66 5 12,50 4,19-26,80 6 15,00 5,71-29,84 7 17,50 7,34-32,78 8 20,00 9,05-35,65 9 22,50 10,84-38,45 40 100,00 91,19-100,00 M1 de Saté Publique Biostatistique - Cours 3 Estimatio - Itervalle de cofiace 21
Exemple 2 = 60 sujets 18 malades d où : p 0 = 0,30 I.C. (à 95%) de P : 0,30 ± 1,96 0,30 0,70 60 = 0,18 ; 0,42 Coditios d applicatio satisfaites car : p i =10,8 p s =25,2 q i =49,2 q s =34,8 Table 5 : I.C. (à 95%) de P : [18,85% ; 43,21%] N = 60 0 0,00 0,00-5,96 1 1,67 0,04-8,94 2 3,33 0,41-11,53 18 30,00 18,85-43,21 59 98,33 91,06-99,96 60 100,00 94,04-100,00 M1 de Saté Publique Biostatistique - Cours 3 Estimatio - Itervalle de cofiace 22
Itervalle de cofiace d ue variace Si la distributio de X est ormale, s 2 1 σ 2 1 -> P a < s 2 < b = 1 α σ 2 2 χ 1 2 où [a ; b] = itervalle de fluctuatio à (1-α) de χ 1 1 1 a < s 2 σ 2 < s 2 σ 2 a 1 1 s 2 < b s 2 σ 2 b < σ2 D où : P 1 b s2 < σ 2 < 1 a s2 = 1 α Itervalle de cofiace de σ2 1 b s2 ; 1 a s2 (si la distributio de X est ormale) Grads échatillos ( 30) Approximatio par la loi ormale : 2s 4 s 2 ± z α/2 1 (si 30 et distributio de X ormale) M1 de Saté Publique Biostatistique - Cours 3 Estimatio - Itervalle de cofiace 23
Exemple Tesio artérielle de 41 hommes de plus de 65 as m = 14,97 s 2 = 85,91 Itervalle de cofiace de σ2 : 1 b s2 ; 1 a s2 = 40 40 85,91 ; b a 85,91 La table de χ 2 pour ddl = 40 doe : a = 24,43 (pour α = 0,975) et b = 59,34 (pour α = 0,025) I.C. de σ 2 : [57,91 ; 140,66] Coditio d applicatio : distributio de la tesio artérielle ormale chez les hommes de plus de 65 as. Approximatio par la loi ormale : 85,91± 1,96 2 85,912 40 I.C. de σ 2 : [48,26 ; 123,56] Coditios d applicatio : distributio de la tesio artérielle ormale chez les hommes de plus de 65 as 30 M1 de Saté Publique Biostatistique - Cours 3 Estimatio - Itervalle de cofiace 24
Formules de l itervalle de cofiace Grads échatillos Petits échatillos Pourcetage p 0 ± z α / 2 p o q o Tables p i,q i,p s,q s 5 Moyee m ± z α / 2 s 2 30 Variace s 2 ± z α / 2 2s 4 1 30 X = loi ormale m ± t 1,α / 2 s 2 X = loi ormale 1 b s2 ; 1 a s2 X = loi ormale M1 de Saté Publique Biostatistique - Cours 3 Estimatio - Itervalle de cofiace 25
Itervalle de cofiace et itervalle de fluctuatio Les expressios de ces itervalles sot très semblables Ils sot cepedat fodametalemet différets Itervalle de fluctuatio Calculé à partir des valeurs vraies (P, µ, σ 2 ) Fixe O parle d itervalle de fluctuatio du paramètre observé (m ou p 0 ) et o du paramètre vrai (µ ou P) Itervalle de cofiace Calculé à partir des valeurs observées Aléatoire (chage d u échatillo à l autre) O parle d itervalle de cofiace du paramètre vrai (µ ou P) et o du paramètre observé (m ou p 0 ) M1 de Saté Publique Biostatistique - Cours 3 Estimatio - Itervalle de cofiace 26
Nombre de sujets écessaire pour ue précisio doée Pourcetage p 0 ± z α / 2 p 0 q 0 Imprécisio : i = z α / 2 p 0 q 0 = z 2 α / 2 i 2 p 0 q 0 Moyee m ± z α/2 s 2 Imprécisio : i = z α/2 s 2 = z 2 α / 2 i 2 s 2 M1 de Saté Publique Biostatistique - Cours 3 Estimatio - Itervalle de cofiace 27
Exemple O voudrait estimer la prévalece de l'isuffisace réale chez les hommes. O sait qu'elle est de l'ordre de 10% et o voudrait ue précisio de ±1%. Combie faut-il de sujets? = z 2 α/2 p 0 q 0 = 1,962 0,10 0,90 = 3457 i 2 0,01 2 Si e fait la prévalece est 12% = z 2 p α/2 0 q 0 = 1,962 0,12 0,88 = 4057 i 2 0,01 2 Si o 'a pris que 3457 sujets (et que P=12%) la précisio deviet : i = z α/2 p 0 q 0 = 1,96 0,12 0,88 3547 = 0,011 M1 de Saté Publique Biostatistique - Cours 3 Estimatio - Itervalle de cofiace 28