Biostatistiques Licece Chapitre : Statistique descriptive uivariée Itroductio Statistique : esemble de méthodes scietifiques destiées à la collecte, la présetatio et l aalyse de doées. Jeux de doées Applicatio Résultats d u questioaire soumis à des étudiats de l UM2 : Tailles de 50 cm 50 60 60 70 70 80 80 90 + de 90 cm Effectifs 7 25 54 69 4 4 Applicatio 2 Oiseaux observés le 5/02/20 etre 8h et 9h sur u poste d observatio de l étag de Thau : Applicatio 3 Espèces Aigrette Héro Goélad Cigoge Flamat Effectifs 7 23 253 9 46 Quatité de pricipe actif e mg recueillie das 20 pilules à la sortie d ue usie pharmaceutique : 02, 04, 97, 98, 98, 0, 03, 04, 99, 96, 00, 02, 00, 98, 00, 0, 00, 97, 0, 00. Applicatio 4 Doées extraites des déclaratios d impôts 200 pour l arrodissemet de Béziers : Applicatio 5 Nombre d efats 0 2 3 4 5 6 Effectifs 6268 4233 5287 309 46 509 224 Metios des bacheliers 20 au lycée de la Borde-Basse : 2 U peu de vocabulaire 2. Populatio, échatillo, idividus Metio Passable Assez bie Bie Très bie Effectifs 6 42 33 8 populatio échatillo idividus Figure Populatio, échatillo, idividus
idividus : objets de l étude populatio : esemble des idividus échatillo : sous-esemble des idividus observés 2.2 Les variables statistiques variable : caractère d itérêt sur lequel porte l étude modalités de la variable : valeurs prises par la variable domaie de la variable : esemble de ses modalités Les variables peuvet être de différetes atures ou types : variables qualitatives quatitatives omiales lagues parlées ordiales degré de satisfactio cotiues températures discrètes ombre couleurs otes alphabétiques (A,B... ) poids d efats Âge Pour les 5 applicatios, idetifier la populatio, la variable et ses caractéristiques. 3 Orgaisatio des doées 3. Série statistique Quelques otatios : om de la variable : X taille de l échatillo : observatios de X das l échatillo (série statistique) : x = (x,, x ). observatios classées par ordre croissat : x () x (). modalités observées : m < m 2 <... < m K. Exemple : Si x = (5, 3, 2, 5), alors = 4, K = 3, x () = m = x 3 = 2, x (2) = m 2 = x 2 = 3 et x (3) = x (4) = m 3 = x = x 4 = 5. Attetio! Ne pas cofodre doées brutes (série statistique) et distributio de la variable (liste des modalités accompagées des effectifs ou fréqueces correspodats). 3.2 Doées groupées e classes Pour les variables quatitatives cotiues, les K modalités sot gééralemet des itervalles (ouverts, fermés, semi-ouverts) appelés classes. O les ote C,, C K. 3.3 Tableaux Objectif : sythétiser les doées brutes. 3.3. Variables quatitatives A chaque modalité m k (avec k =,..., K) correspod : effectif : k, ombre d idividus pour lesquels X = m k fréquece : f k = k, proportio d idividus pour lesquels X = m k effectif cumulé (croissat) : N k = + + k, ombre d idividus pour lesquels X m k fréquece cumulée (croissate) : F k = f + + f k = N k, proportio d idividus pour lesquels X m k 2
3.3.2 Variables quatitatives regroupées e classes A chaque classe C k = [b k, B k ] (ou ]b k, B k [ ou ]b k, B k ] ou [b k, B k [) correspod : effectif : k, ombre d idividus pour lesquels X C k fréquece : f k = k, proportio d idividus pour lesquels X C k effectif cumulé (croissat) : N k = + + k, ombre d idividus pour lesquels X B k fréquece cumulée (croissate) : F k = f + + f k = N k, proportio d idividus pour lesquels X B k amplitude : a k = B k b k, c est la logueur de C k. desité d effectif : d k = k a k. desité de fréquece : φ k = f k a k = d k. cetre : c k = b k+b k 2, c est le milieu de C k. Regrouper les doées de l applicatio 3 e classes. O privilégiera les classes de même largeur. Idetifier les frotières et les cetres des classes. Idem pour l applicatio. 3.4 Graphiques Objectif : résumer l iformatio d u tableau de doées. 3.4. Variables omiales Modalités o classées Ordre aléatoire Deux graphes possibles : diagramme e bâtos : chaque modalité est représetée par u segmet dot la hauteur est proportioelle à l effectif ou la fréquece de la modalité. diagramme circulaire : chaque modalité est représetée par u secteur dot l aire est proportioelle à l effectif ou la fréquece de la modalité. Illustrer l applicatio 2 par u diagramme circulaire. 3.4.2 Variables ordiales ou discrètes Diagramme e bâtos avec modalités classées par ordre croissat. Illustrer les applicatios 4 et 5 par des diagrammes e bâtos. 3.4.3 Variables cotiues Doées groupées e classes histogramme : chaque classe est représetée par u rectagle dot l aire est égale à la fréquece de la classe (la hauteur de chaque rectagle est la desité de fréquece). Illustrer les applicatios et 3 par u histogramme. 3.5 Courbe des fréqueces cumulées Uiquemet pour variables quatitatives, gééralemet cotiues. Graphe de la foctio F (t) = Card{x i t}, pour tout t R. C est ue lige brisée reliat les poits de coordoées (b, 0), (B, F ), (B 2, F 2 ),, (B K, ). O la prologe aux extrémités par des demi-droites horizotales (cf figure 2). Dessier la courbe des fréqueces cumulées pour les applicatios et 3. 3
Figure 2 Exemple d histogramme et de courbe des fréqueces cumulées pour ue variable cotiue 4 Mesures de tedace cetrale 4. Moyee (arithmétique) Pour des doées brutes Calculer la moyee pour l applicatio 3. x. = x + + x = x i. i= Pour des doées groupées, o calcule ue approximatio x c de la moyee : x c. = c + + K c K = K k c k. Calculer la moyee pour l applicatio puis la moyee par classes pour l applicatio 3. Pour des doées discrètes, x et x c coïcidet. Calculer la moyee pour l applicatio 4. 4.2 Médiae La médiae m "coupe" les observatios e deux k= Card{x i m} = Card{x i m} Pour des doées brutes m =. x ( + 2 ), si est impair, x ( 2 ) +x ( 2 +) 2, si est pair. Calculer la médiae pour l applicatio 3. Si la variable est discrète, o peut utiliser les fréqueces cumulées pour trouver m. Calculer la médiae pour l applicatio 4. 4
Pour des doées groupées, o peut utiliser la courbe des fréqueces cumulées pour trouver m. Calculer la médiae pour l applicatio. 4.3 Mode C est la valeur la plus souvet observée. Pour des doées groupées e classes, o pred le cetre de la classe la plus observée. Calculer le mode pour chacue des applicatios. 4.4 Comparaiso 4.4. Moyee et médiae Médiae : peu sesible aux valeurs extrêmes. Moyee : sesible aux valeurs extrêmes mais plus facilemet calculable. Moyee et médiae (TD). 4.4.2 Exemples de distributios Les différetes valeurs cetrales (moyees, médiae, mode) peuvet être cofodues ou différetes suivat les répartitios comme le motre l exemple de la figure 3. (a) (b) Figure 3 La moyee (rouge), médiae (bleu) et mode (vert) de deux séries statistiques. La distributio (b) est dite symétrique. 5 Mesure de dispersio 5. Variace et écart type empiriques La variace empirique d u échatillo s 2 est la moyee du carré des écarts à la moyee. Pour des doées brutes O a aussi s 2. = (x x) 2 + + (x x) 2 s 2 = x 2 i i= ( = (x i x) 2. i= ) 2 x i = x 2 x 2. i= L écart-type est la racie carrée de la variace : s = s 2. Calculer la variace et l écart type empiriques pour l applicatio 3. 5
Pour des doées groupées, o calcule ue approximatio s 2 c de la variace : s 2 c = K k= k c 2 k ( ) 2 K k c k = x 2 c x 2 c. k= Calculer la variace et l écart type empiriques pour l applicatio puis pour l applicatio 3 e classes. Pour des doées discrètes, s 2 et s 2 c coïcidet. Calculer l écart type empirique pour l applicatio 4. Ecart-type (TD). 5.2 Ecart iterquartile 5.2. Les quatiles Soit α ]0, [. Le quatile d ordre α est oté q α et o a Card{x i q α } O appelle quartiles les quatiles d ordre 4, 2 et 3 4 Pour des doées brutes = α. q α. = x( h ) + (h h ) ( x ( h +) x ( h ) ). où h = ( + )α et t h est la partie etière de h. Calculer le premier et derier quartiles de l applicatio 3. et déciles les quatiles d ordre 0,..., 9 0. Si la variable est discrète, o peut utiliser les fréqueces cumulées pour trouver q α. Calculer le premier et derier quartiles de l applicatio 4. Pour des doées groupées, o peut utiliser la courbe des fréqueces cumulées pour trouver q α. Calculer le premier et derier quartiles de l applicatio. 5.2.2 Ecart iterquartile Il mesure la dispersio des doées : 5.2.3 Boîtes à moustaches (boxplot) eiq. = q 0.75 q 0.25. C est u moye rapide de représeter le profil d ue série statistique quatitative (cf fig. 4). q 0.05 q 0.25 m q 0.75 q 0.95 Figure 4 U exemple de boîte à moustaches Tracer les box-plot des applicatios 3 et 4. 6