MB6 Statitique decriptive Etimation nctuelle Etimation par intervalle de confiance MB6 - - - UFR médecine Montpellier-îme Objectif pédagogique Donner la définition d'une variable aléatoire Reconnaître une variable qualitative dan de exemple Reconnaître une variable quantitative dan de exemple Donner la définition de la moyenne,variance, médiane, quartile, percentile Ditinguer pulation/échantillon dan de exemple concret Définir la notion de repréentativité d'un échantillon Traduire un problème clinique en une de problématique tatitique uivante : Etimation d' une fréquence théorique à partir d'une fréquence obervée par un intervalle de confiance Etimation d' une moyenne théorique à partir d'une moyenne obervée par un intervalle de confiance. Statitique decriptive : pulation, échantillon Population élection tirage au ort repréentativité Echantillon Enemble exhautif de ujet dont on a défini le caractéritique Sou-enemble fini iu d une pulation Paramètre théorique Paramètre obervé 3
. Statitique decriptive : Variable aléatoire Variable Aléatoire : Pour un ujet donné, la valeur de la variable ne peut être prévue avec certitude. Type de variable aléatoire (VA) VA quantitative : fruit d une meure d un intrument, meure une quantité continue ex : glycémie dicrète ex : nb de elle/jour VA qualitative : Catégorie excluive ominale : catégorie an relation d ordre dichotomique ( booléenne, binaire) ex : exe Ordinale : catégorie ordonnée ex : protéinurie (,+,++ ) VA cenurée : Survenue d un événement Ex : Survenue d un décè dan le ix moi..statitique decriptive : VA qualitative Population Fréquence théorique tirage au ort Echantillon Fréquence obervée Répartition de groupe anguin dan la pulation françaie Groupe anguin O A B AB total 43% 45% 9% 3% % Répartition de groupe anguin dan échantillon TAS Groupe anguin O A B AB total ni 4 47 8 3 % 4% 47% 8% 3% % Fréquence théorique : pi Σpi= = Σni Effectif ob : ni Fréquence ob : fi=ni/ 5... Statitique decriptive : VA qualitative Population tirage au ort Echantillon Tableau de fréquence théorique Tableau de contingence Répartition de groupe anguin dan la pulation françaie Rhéu Groupe anguin O A B AB Total Rh+ 37 % 39 % 7 % % 85 % rh- 6 % 6 % % % 5 % Total : 43 % 45 % 9 % 3 % % Répartition de groupe anguin dan échantillon TAS Rhéu Groupe anguin O A B AB Rh+ 36 4 6 84 rh- 6 7 6 Total Total : 4 47 8 3 Probabilité marginale Effectif marginaux obervé 6
.. Statitique decriptive : VA quantitative - Population Dan pulation VA dicrète Chaque valeur x i a proba p i avec Σp i = Paramètre de ition : Moyenne théorique µ = E(X) = Σ x i p i Paramètre de diperion : Variance théorique V(X)= σ (X) = Σ (x i - µ) p i Ecart-type (tandard deviation) théorique σ toujour >; paramètre de diperion autour de moyenne VA continue denité de proba f(x) = P(x X x+dx) Moyenne théorique µ = E(X) = xf ( x ) dx Variance théorique V = σ (X) = ( x µ ) f ( x ) dx Ecart-type théorique σ 7.. Statitique decriptive : VA quantitative Loi de laplace Gau = Loi normale : LG (µ,σ) µ-σ Symétrique par raprt à µ µ+σ Écart-type : 7% valeur de la VA ont contenue dan intervalle µ-σ et µ+σ ; prob(µ-σ <X< µ+σ ),7 Loi normale centrée réduite : µ = ; σ = ; LG (,) 8.. Statitique decriptive : VA quantitative Table de la loi normale centrée réduite LG (,) LG(,) α/ - α Table de la loi ormale centrée réduite α α/ La table donne la probabilité α ur que l écart-réduit égale ou dépae, en valeur abolue, une valeur donnée, c et à dire la probabilité extérieure à l intervalle (-, +). α,,,,3,4,5,6,7,8,9, +,57 6,3 6,7,5 4,96,88,8,75,69 5,,64 5,59 8,55 5,5 4,47 6,44,4 5,37,34,3 3 couple de valeur doivent être connu α =,5 corrend à =,96 α =, corrend à =,576 α =, corrend à = 3,9 3
.. Statitique decriptive : VA quantitative Paage de LG (µ,σ) à LG (,) Ditribution de X LG(µ,σ) Ditribution de écart-réduit LG(,) X µ -σ µ µ +σ - Changement de variable = ( X σ µ ) ( X ) : écart-réduit uit LG (,).. Statitique decriptive : VA quantitative - Population Propriété Epérance (moyenne théorique) Soient X, une variable aléatoire, et a et b deux contante E(X +a) = E(X) + a E(aX) = a E(X) Si X et Y ont variable aléatoire E(X + Y) = E(X) + E(Y) E(aX + by) = a E(X) + b E(Y) E(X Y) = E(X) E(Y) Variance V(X+a) = V(X) V(aX) = a V(X) Si X et Y ont variable aléatoire indépendante : V(X+Y) = V(X) + V(Y) V(aX + by) = a V(X) + b V(Y) V(X Y) = V(X) + V(Y).. Statitique decriptive : VA quantitative - échantillon Population tirage au ort Dan un échantillon de taille Echantillon Enemble de valeur x i Paramètre de ition Moyenne arythmétique obervée m = E(X) = Σ x i / Paramètre de diperion Variance obervée =Σ (x i - m) /(-) Ecart-type obervé 4
5 45 4 35 3 5 5 5 3 4 5 8 5 43 8 49 86 379 447 448 339 7 4 5 Cadre upérieur Cadre moyen Ouvrier profeionnel Cadre moyen,5% 7 Ouvrier pécialié 6 7 9 3 5 7 9 3 5 7 9 3 33 35 37 39 4 43 45 47 > 49 Poid de nai ance Répartition par catégorie ocio-profeionnelle de employé d'une entreprie,5% 5,%,5% 5,% % % % 3% 4% 5% 6% Répartition par catégorie ocio-profeionnelle de employé d'une entreprie Cadre upérieur 5,% Ouvrier profeionnel,5% Ouvrier pécialié 5,%.. Statitique decriptive : VA quantitative Autre paramètre de ition Médiane Médiane : valeur de X qui partage la érie ordonnée en groupe de même effectif Quartile : valeur de X qui partage la érie ordonnée en 4 groupe de même effectif Premier quartile : valeur de X telle que 5% de individu ont x < er quartile Décile, percentile Mode : Valeur de X la plu fréquente dan une ditribution Autre paramètre de diperion Etendue (range) : minimum ; maximum Ditance interquartile : Q Q3 ou P5 P75.3. Statitique decriptive : graphique tatitique Diagramme en barre Diagramme circulaire Hitogramme b d e nouveau-né Catégorie excluive et exhautive, effectif Diagramme à moutache. Etimation d un paramètre théorique à partir d un paramètre obervé pulation valeur probable? Echantillon repréentatif Tirage au ort échantillon VA qualitative Etimation f th à partir d une f ob VA quantitative Etimation µ à partir d une m ob 5
. Etimation d un paramètre théorique pulation valeur probable? échantillon Exemple échantillon de femme tirée au ort dan la pulation françaie âge moyen à la ménopaue : m = 5,7 an écart-type : = an Quetion : A partir de ce donnée (obervée) quel et l âge moyen (théorique) à la ménopaue µ, de l enemble de femme françaie?. Etimation - nctuelle et par intervalle de confiance Etimation nctuelle = valeur obervée du paramètre ur l échantillon ex : âge moyen de femme à la ménopaue dan la pulation françaie : 5,7 an Problème : autre échantillon : 5,5 an Etimation par intervalle ou intervalle de confiance Donner un intervalle qui a une probabilité (-α) de contenir la valeur théorique du paramètre => intervalle de confiance de niveau -α Probabilité fixée en général à 95 % => 95% a 95% de chance de contenir la vraie valeur du paramètre Un intervalle de confiance et toujour défini par on niveau et e deux borne éceite que l échantillon oit repréentatif de la pulation. Etimation par intervalle de confiance () Principe Echantillon et extrait au haard de la pulation Paramètre théorique θ et voiin du paramètre obervé avec une probabilité -α que l on e fixe VA quantitative : µ voiine de m VA qualitative : fth voiine de fob Écart réduit et voiin de au niveau - α que l on e fixe Intervalle de confiance à - α - α : Prob (θ -c < θ < θ +c) = - α - α : Prob (-u α < < u α ) = - α i ~ LG (,) : 95% : Prob (-,96 < <,96) =,95 - α LG(,) α/ - u α u α α/ 6
. Etimation par intervalle de confiance d une moyenne théorique Moyenne obervée ex: âge moyen pulation Variable X: âge moyenne théorique µ écart-type théorique σ Tirage de individu au haard recommencé K foi Échantillon Σx m = i m = moyenne obervée (âge moyen) µ mai voiine m m m 3 m 4 tou voiin et µ 9. Etimation par intervalle de confiance d une moyenne théorique Propriété de la moyenne obervée m Variable aléatoire Moyenne théorique E(m) = µ Variance théorique Var(m)= σ / Loi de ditribution de m dépend de la loi de X et de l effectif Si σ connu Loi de X LG (µ, σ) Unimodale,? σ / Effectif 3 LG (µ, ) LG (µ, ) σ / <3 LG (µ, )? σ /. Etimation par intervalle de confiance d une moyenne théorique Ca où σ inconnue ( x i Etimation de Var(X) = Écart-réduit (): = ( m µ ) / n et une variable aléatoire de ditribution m ) Si σ inconnu Loi de X LG (µ, σ) Unimodale,? Effectif 3 Student à - ddl LG (,) Student à - ddl LG (,) <3 Student à - ddl? 7
.. Etimation par intervalle de confiance d une moyenne théorique - Table de Student La table donne la probabilité α ur que t égale ou dépae, en valeur abolue, une valeur donnée, en fonction du nombre de degré de liberté (d.d.l.). ddl / α,9,5,3,,,5,,,,58,,963 3,78 6,34,76 3,8 63,657 636,6 9,4,86,386,886,9 4,33 6,965 9,95 3,598 3,37,765,5,638,353 3,8 4,54 5,84,94 4,34,74,9,553,3,776 3,747 4,64 8,6 5,3,77,56,476,5,57 3,365 4,3 6,869 6,3,78,34,44,943,447 3 3,77 5,959 +,6,674,36,8,645,96,36,576 3,9. Etimation par intervalle de confiance d une moyenne théorique LG(,) Student α/ - u α - t α Echantillon repréentatif On commet erreur faible en conidérant σ => Intervalle de confiance de niveau - α Si 3 : uit LG(,) u α t α α/ = ( m µ)/ n α :[ m uα ; m + uα 95% : u α =,96 - α : -proba (-t α < < t α ) = - α α :[ m tα, ddl ; m + tα, ddl Si < 3 et X uit LG : - α : proba (-u α < < u α ) = - α. Etimation par intervalle de confiance d une moyenne théorique Exemple : âge moyen de la ménopaue dan la pulation françaie Echantillon de femme tiré au ort dan la pulation françaie, âge moyen à la ménopaue m = 5,7 an ; écart-type =. Problématique: etimation d une moyenne théorique à partir d une moyenne obervée Etimation nctuelle : 5,7 an Etimation par intervalle de confiance : > 3 donc uit LG(,) α : [ m uα ; m + uα 95 % : [5,7,96 ;5,7 +,96 95% : [5,5 an 5,9 an a 95% de chance de contenir la vraie valeur de l âge moyen de la ménopaue dan pulation françaie 8
. Etimation par intervalle de confiance d une moyenne théorique : Influence de et de α Exemple : âge moyen de la ménopaue dan la pulation françaie Echantillon de 5 femme tiré au ort dan la pulation françaie, âge moyen à la ménopaue m = 5,7 an ; écart-type =. Etimation par - α : < 3, et âge moyen ~ LG donc uit loi de Student à 4 ddl (,) :[ m tα,4 ; m tα, 4 α + % :[5,7,64 ;5,7 5 % :[5,7,797 ;5,7 5 95 + 99 +,64 5,797 5 [49,3 an 5, an [48,8 an 5,6 an.. Etimation par intervalle de confiance d une fréquence théorique pulation Fréquence théorique f th = P valeur probable? échantillon Fréquence obervée f ob = f Fréquence obervée ( modalité) Echantillon repréentatif de la pulation f : variable aléatoire ditribuée autour de P elon LG (P, P ( P ) ) i P 5, et (-P) 5 Ecart réduit = f P P ( P ) ~ LG (, ) i P 5, et (-P) 5.. Etimation par intervalle de confiance d une fréquence théorique On commet une erreur faible en conidérant P = p Intervalle de confiance de niveau -α α LG(,) α/ - u α - α = Proba(-u α < < u α ) = - α :[ p u o α Condition de validité : *( ) ; + u p inf * 5, et (-p inf )* 5, et p up * 5, et (-p up )* 5 α u α α/ = *( ) f P P ( P ) Si condition de validité non remplie : utilier de table ou autre méthode 9
.. Etimation par intervalle de confiance d une fréquence théorique Exemple : Quel et le taux de céarienne chez femme préentant un diabète getationnel? femme préentant un diabète getationnel 3 femme ont eu une céarienne Problématique: etimation d une fréquence théorique à partir d une fréquence obervée Etimation nctuelle : = 3/ =,56 Etimation par intervalle de confiance *( ) *( ) α :[ uα ; + uα,56*(-,56),56*(-,56) 95% =,56,96 ;,56+,96 95% : [8% ; 33% Condition de validité :,8* 5; (-,8)* 5;,33* 5; (-,33)* 5; Récapitulatif Statitique decriptive Paramètre de ition Paramètre de diperion Attention au niveau où on e place (pulation ou échantillon) et au type de variable Etimation nctuelle (inuffiante) Etimation par intervalle de confiance d un paramètre théorique Identifier le type de variable Formuler la problématique Ex : etimation d une moyenne théorique à partir d une moyenne obervée Vérifier le condition de validité Appliquer la formule appropriée La préciion de l etimation du paramètre théorique augmente avec, à niveau de confiance donné. 9