ISTITUT SUPERIEUR DE L EDUCATIO ET DE LA FORMATIO COTIUE Départemet Bologe Géologe S0/ " BIOSTATISTIQUE - " Cours & Actvtés : Modher Abrougu Aée Uverstare - 008 Modher Abrougu Bostatstque «I» ISEFC - 008
PLA DU COURS - BIOSTATISTIQUE BIOSTATISTIQUE L : Statstques descrptves à ue ou deux varables BIOSTATISTIQUE L : Statstques féretelles à ue ou deux varables BIOSTATISTIQUE 3 L3 : Statstques multfactorelles descrptve et féretelles BIOSTATISTIQUE STATISTIQUES DESCRIPTIVES À UE OU DEUX VARIABLES CHAPITRE I. ELEMETS DE STATISTIQUE ET DE BIOSTATISTIQUE. ITRODUCTIO A LA STATISTIQUE. OBJECTIF DES MODULES DE BIOSTATIQUE.. Le module bostatstque I : Statstques descrptves.. Le module bostatstque II : Statstques féretelles.3. Le module bostatstque III : Statstques multfactorelles descrptve et féretelle 3. DEMARCHE GEERALE E STATISTIQUE 3.. L detfcato du problème 3.. Le recuel des doées 3.3. L'aalyse et l'terprétato des doées 4. OTIOS DE BASE ET TERMIOLOGIE 4.. Esemble / Populato / Echatllo / Elémet / Idvdu 4.. Recesemet / Echatlloage 4... Le recesemet 4... L échatlloage 4.3. Caractère / Modalté / Varable: 4.3.. Le caractère 4.3.. Modalté / Mesure 4.3.3. Tableau élémetare 4.3.4. La varable statstque 4.3.5. ature des varables statstques et échelles de mesures 4.3.5.. Varable quattatf. 4.3.5.. Varable qualtatve 4.3.5.3. Exemple d llustrato des prcpaux types de descrpteurs 4.3.6. Varables dépedates et dépedates 4.3.6.. Les varables dépedates 4.3.6.. Les varables dépedates 4.3.7. La varablté et l'certa e bologe 4.3.7. La varablté bologque 4.3.7. La varablté métrologque 4.3.8. Proprétés des varables 4.4. Iférece et rsque statstque 4.5. Ue défto plus explcte de la bostatstque : 4.6. Déomato mathématque : Modher Abrougu Bostatstque «I» ISEFC - 008
5. REPRESETATIO DES DOEES 5.. Tableaux statstques 5.. Représetatos graphques et statstque descrptve 5... L hstogramme 5... L hstogramme : paramètres de descrpto (mode et symétre) 5... Barre à moustache - Box Plot 6. STATISTIQUES DESCRIPTIVES UIVARIEES 6.. Paramètre de posto et valeurs cetrales 6... Le mode, ou valeur domate 6... La moyee 6.... Calcul de la moyee par chagemet d orge et d uté. 6... Autres dcateurs de moyee : 6..3. La médae et la classe médae 6..3.. Défto géérale : 6..3.. Médae, pour les doées ragées 6..3.3. Médae, pour les doées codesées 6..3.4. Médae, pour les doées répartes par classes 6..4 Quatles : Mesures de posto statstque e référece à la médae 6..4.. Défto des quatles 6..4.. Les quartles 6..4.3. Les décles 6..4.4. Les cetles 6..4.5. Calculs des quatles 6..4.5.. Détermato des valeurs de la varable à partr d u rag cetle doées. 6..4.5.. Détermato du rag cetle à partr d ue valeur doée de la varable. 6..5. Moyee et médae 6..6. Avatages et covéets des dfféretes valeurs cetrales : 6.. Paramètre de dsperso 6... Les paramètres de dsperso absolue 6... L étedue de la varato 6... Quartle et tervalle terquartle : Mesures de la dsperso statstque e référece à la médae 6... L'tervalle terquartle 6... L'tervalle ter-décle 6...3. Mesures de la dsperso statstque e utlsat l écart sem-terquartle 6...4. Mesures de la dsperso statstque e référece à la moyee arthmétque 6...4.. Ecart absolu moye ou Ecart Moye Absolu «EMA» 6... Varace et écart-type : 6... Les paramètres de dsperso relatve 6.3 Exercces d Applcatos avec explctato et utlsato du logcel Excel 6.3. Paramètres de forme 6.3.. Coeffcet d asymétre et de dérve 6.3... Coeffcet d asymétre 6.3... Coeffcet de dérve 6.3.. Coeffcet d aplatssemet PARTIE EXERCICES CHAPITRE II Modher Abrougu Bostatstque «I» ISEFC - 008 3
ETUDE DE DEUX VARIABLES STATISTIQUES - SERIE STATISTIQUE DOUBLE -. PRESETATIO D UE SERIE A DEUX VARIABLES. GEERALISATIO DES REPRESETATIOS 3. CALCUL DES FREQUECES D UE STATISTIQUE A DEUX VARIABLES 3.. Fréqueces relatves partelles 4. CALCUL DES MOYEES MARGIALES D UE STATISTIQUE A DEUX VARIABLES 5. COVARIACE 6. COEFFICIET DE CORRELATIO 7. DROITE DE REGRESSIO OU D AJUSTEMET 7.. Importace de l étude de corrélato etre varables statstques 7.. Drote de régresso léare CHAPITRE III. IFORMATIQUE ET STATISTIQUE : Pré-requs, mse à veau et appretssages. IFORMATIQUE : PRE-REQUIS ET MISE A IVEAU.. Matérels et terfaces utles. Pré requs.3 Mse à veau théorque et pratque. APPRETISSAGES IFORMATIQUE ORIETE STATISTIQUE.. Gesto de doées umérque et de tableau sur Word et Excel.. Gesto de calculs et de formules statstque das Excel.3. Gesto et élaborato de calcul statstque sur Excel.4. Gesto et élaborato de représetatos graphques sur Excel.5. Utlsato et serto de Macro das Excel.6. Représetato de séres et calculs statstque (tableau et graphque).7. Ajustemet léare de séres chroologques avec et sas varatos sasoères..8. Présetato et prcpe de logcel d aalyse de doée statstque.9. Utlsato Excel et présetato d XLSTAT comme outl pour statstque descrptve APPLICATIOS ET TRAVAUX DIRIGES EXERCICES APPLIQUES : STATISTIQUES ET IFORMATIQUE PLACHE D ACTIVITES QUELQUES STATISTICIES LEXIQUE FRAÇAIS / AGLAIS BIBLIOGRAPHIE Modher Abrougu Bostatstque «I» ISEFC - 008 4
CHAPITRE I. ELEMETS DE STATISTIQUE ET DE BIOSTATISTIQUE. ITRODUCTIO A LA STATISTIQUE Statstque : le terme statstque désge à la fos : ) l'esemble des doées umérques cocerat ue catégore de fats (ses très ace). Il s'agt de l'expresso das sa sgfcato la plus usuelle. ) l'esemble des méthodes mathématques permettat : a) de résumer quattatvemet l'formato recuelle sur u esemble d'élémets au moye d'ue vestgato exhaustve. C'est la statstque descrptve, qu fat l'objet de ce cours. b) de gééralser à de grads esembles d'élémets les coclusos trées des résultats obteus avec des esembles beaucoup plus restrets appelés échatllos. C'est la statstque féretelle ou probablste, qu sera brèvemet explctée das ce module et plus explctée das les modules de Bostatstque II et III. Les statstques ot pour orge le beso des États pour gérer ratoellemet leurs ressources. Pour cela, l état écessare après collecte d'formatos (écessté de techques de quatfcato ; producto de doées ombreuses, orgasées e tableaux) de dsposer de méthodes permettat de défr les varatos, les évolutos, les ressemblaces ou les dfféreces etre régos, etre aées, etre catégores. Exemple de problèmes : Déombremet des populatos humaes : recesemets Déombremet des terres et leur répartto. Calcul et répartto des mpôts. Ces techques se sot mses e place grâce au développemet du calcul des probabltés au 8 ème sècle; pus, au 9 ème sècle grâce à l émergece des méthodes statstques. Il s'agssat au départ de l'étude méthodque des fats socaux par des procédés umérques : classemets, déombremets, vetares chffrés, recesemets, destés à reseger et à ader les gouveremets das leurs prses de décsos. À partr de 843, la statstque désge l'esemble de techques d'terprétato mathématque applquées à des phéomèes pour lesquels ue étude exhaustve de tous les facteurs est mpossble, à cause de leur grad ombre ou de leur complexté. Les statstques s'appuet sur les probabltés et sur la lo des grads ombres. La statstque vse à décrre, à résumer et à terpréter des phéomèes dot le caractère essetel est la varablté. Elle fourt de la maère la plus rgoureuse possble des élémets d'apprécato utles à l'explcato ou à la prévso de ces phéomèes, mas elle 'explque e prévot aucu d'etre eux (Vgero 997). La méthode statstque permet égalemet d'éprouver la valdté de résultats (obteus, mesurés, collectés) e focto même de leur varablté, das les domaes où les varatos sot la règle, c'est-à-dre les domaes de la bologe sesu lato, das celu des sceces de l'evroemet égalemet. La méthode statstque fourt de ce fat à tous les persoels cofrotés à l'terprétato de résultats d'observato ou d'expérmetato, u outl d'terprétato adapté aux codtos partculères de leur domae d'actvté. Modher Abrougu Bostatstque «I» ISEFC - 008 5
L'attrat des chffres tet das la croyace que la mesurato est le crtère prmordal de toute étude scetfque (Fracs Galto (8-9)). Cette fascato répod à l'dée que ce que ous voyos et mesuros das le mode 'est que la représetato superfcelle et mparfate d'ue réalté cachée. Il faut se méfer de cette tedace qu veut que les mesures abstrates résumat de grads tableaux de doées dovet exprmer écessaremet quelque chose de plus réel et de plus fodametal que les doées elles-mêmes. Tout statstce dot fare u effort pour cotrebalacer cette tedace. C'est pourquo toute terprétato statstque dot précser claremet quelles doées (populato, échatllo), et quelles hypothèses ot été utlsées pour aboutr à u certa type de cocluso.. OBJECTIF DES MODULES DE BIOSTATIQUE L esegemet de la bostatstque est subdvsé e 3 modules : Bostatstque I, Bostatstque II et Bostatstque III. Ces tros modules complémetares ot pour objectfs de permettre aux étudats de développer des compéteces qu leur permettrot : - d acquérr et de parfare la coassace des prcpales otos relatves à l utlsato des méthodes statstques, - de résoudre des questos emprques par l utlsato des tests statstques, - de maîtrser et de compléter les otos de bases des statstques e vue de les applquer à des exemples spécfques aux sceces bologques, prses das leur ses gééral (bologe, médece, pharmace, écologe ) - d applquer ces otos et méthodes sur des doées bologques à partr de logcels smples - d utlser des logcels de statstque et d appredre la lecture de leurs résultats. Les statstques costtuet, e bologe, l'outl permettat de répodre à de ombreuses questos qu se poset e permaece aux bologstes, e voc, à ttre d exemples quelques ues : - Quelle est la valeur ormale d'ue gradeur bologque, talle, pods, glycéme? - Quelle est la fablté d'ue mesure ou d ue observato? - Quel est le rsque ou l avatage d u tratemet? - Les codtos expérmetales A sot-elles plus effcaces que celles des codtos de B? - Les effets de la varable A sot-ls les mêmes ou dffèret-ls des effets de la varable B? Ces cours vset à développer la compréheso coceptuelle des bostatstques, à travers l applcato, les suppostos sous-jacetes, et l terprétato d aalyses statstques présetées avec u mmum de formules et avec l assstace d terface et de logcels formatques... Le module bostatstque I : Statstques descrptves Ce module est ue tato aux otos fodametales de statstque descrptve (o paramétrque et paramétrque). Il explctera les procédés classques de la statstque à ue dmeso, u-modale, bmodale et u-varée qu permettet de résumer et d aalyser l formato recuelle sur chaque caractère (varable (cotue ou dscrète, qualtatve ou quattatve)) prs solémet. Ce module de Bostatstque, vse à ter les étudats aux statstques et à préseter brèvemet la premère étape de l aalyse des doées : la descrpto. L objectf poursuv das ue telle aalyse est de 3 ordres : - tout d abord, obter u cotrôle des doées et élmer les doées aberrates, - esute, résumer les doées (opérato de réducto) sous forme graphque ou umérque, - ef, étuder les partculartés de ces doées Modher Abrougu Bostatstque «I» ISEFC - 008 6
Ce qu permettra évetuellemet de chosr des méthodes plus complexes. Les méthodes descrptves se classet e deux catégores qu souvet sot complémetares : la descrpto umérque et la descrpto graphque. La présetato sythétque d u grad esemble de doées résultat de l étude de pluseurs caractères quattatfs ou qualtatfs sur ue populato sera tratée par le module de bostatstque III... Le module bostatstque II : Statstques féretelles Ce module repred les élémets de bases des statstques descrptves e y trodusat ue approche plus probablste. Les méthodes statstques sot oretées vers des études classques d estmato et d hypothèse, de maère à satsfare les codtos d'applcatos des méthodes de l'férece (approche déductvste). Il four des outls statstque qu permettet d'étedre ou de gééralser, das certaes codtos, les coclusos obteues par la statstque descrptve à partr de la fracto des dvdus (échatllo) que l'o a observé ou étudé expérmetalemet, à l'esemble des dvdus costtuat la populato. L'objectf de ce module de statstque féretelle est de fourr des résultats relatfs à ue populato à partr de mesures statstques réalsées sur des échatllos ou de comparer statstquemet et de faço sgfcatve s des échatllos sot detques ou o selo u ou pluseurs paramètres ou tests (dépedace, hypothèses, estmato, )..3. Le module bostatstque III : Statstques multfactorelles descrptve et féretelle Ce module complète les modules de bostatstque I et II. Il sera cetré sur l étude multfactorelle qu fourt des méthodes vsat à décrre l formato globale dot o dspose quad o cosdère les caractères étudés das leur esemble. Les terrelatos etre les caractères et leurs effets sur la structurato de la populato serot prs e cosdératos. L Aalyse e Composates Prcpales (ACP) et l Aalyse Factorelle des Correspodaces (AFC) ot pour but de révéler ces terrelatos etre caractères et de proposer ue structure de la populato. U des térêts majeurs de ces aalyses est de fourr ue méthode de représetato d ue populato décrte par u esemble de caractères dot les modaltés sot quattatves (mesures cotues), pour ue ACP, ou qualtatves (pour ue AFC). 3. DEMARCHE GEERALE E STATISTIQUE Toute étude statstque peut être décomposée e deux phases au mos : le recuel ou la collecte des doées statstques, et leur aalyse ou leur terprétato. 3.. L detfcato du problème La phase prélmare à toute approche statstque vse à détermer et detfer le problème par u esemble de questoemets qu permettrot de délmter les vestgatos et les dfféretes approches : Quels sot les objectfs? Quelle est la populato ou l échatllo à étuder? Quels sot les caractérstques et les varables? Que pourra apporter ue étude statstque? Modher Abrougu Bostatstque «I» ISEFC - 008 7
3.. Le recuel des doées ous appelleros doées les valeurs obteus et référecées sute à ue vestgato ou ue étude réalsée (mesures, observatos, equêtes, ). Le recuel des doées peut être réalsé sot par la smple observato des phéomèes, sot par l'expérmetato, c'est-à-dre e provoquat volotaremet l'apparto de certas phéomèes cotrôlés. Exemple : le rôle de quelques substaces (, P, K) das la producto de bomasse chez les végétaux. Lorsque les doées sot très ombreuses, ou partculèremet dffcles à obter, l sera écessare pour la mse e oeuvre ratoelle du recuel de défr des méthodes approprées de collecte. Il s'agra de plas d'échatlloage ou de plas d'expérece dot la mse e oeuvre sera focto du type de problème que l'o est ameé à résoudre. Exemple : la umérato des mammfères d'ue are protégée : vetare et recesemet. Il exste de ce fat pluseurs méthodes de collecte des doées (vor otos de base et termologe): 3.3. L'aalyse et l'terprétato des doées L'aalyse statstque se subdvse e deux étapes : - La statstque déductve ou descrptve : elle a pour but de résumer et de préseter les doées observées sous la forme la plus accessble (smplfcato et réducto des doées, à la fos vsuelle et coceptuelle). - L'aalyse ductve ou férece statstque est l'esemble des méthodes permettat de formuler e termes probablstes u jugemet sur ue populato, à partr des résultats observés sur u échatllo extrat au hasard de cette populato. Les méthodes statstques les plus classques sot celles de l'estmato (estmato par domae de coface) et celles de l'épreuve d'hypothèse. Leurs coceptos de base sot dues essetellemet à R.A. Fsher (890-96). Elle permet d'étedre ou de gééralser, das certaes codtos, les coclusos obteues par la statstque descrptve à partr de la fracto des dvdus (échatllo) que l'o a observé ou étudé expérmetalemet, à l'esemble des dvdus costtuat la populato. Les codtos (de valdté) sot lées aux hypothèses fates sur la populato coteat les dvdus et sur la faço dot ot été prses les mesures. Cette phase ductve comporte des rsques d'erreur qu'l covet d'apprécer. Ces deux étapes sot terdépedates. E partculer, l'observato et l'expérmetato dovet être orgasées (protocole) de maère à satsfare les codtos d'applcatos des méthodes de l'férece. L'objectf de la statstque féretelle est de fourr des résultats relatfs à ue populato à partr de mesures statstques réalsées sur des échatllos (prévso, décso..) Modher Abrougu Bostatstque «I» ISEFC - 008 8
4. OTIOS DE BASE ET TERMIOLOGIE 4.. Esemble / Populato / Echatllo / Elémet / Idvdu - L esemble e statstque, est la collecto (fe ou fe) d'utés, ou d'élémets, sur laquelle porte l'observato. Pour que cet esemble sot correctemet déf, l faut lu doer ue défto précse de faço à ce que deux persoes dfféretes aboutsset toujours à la même lste d'élémets. L'esemble des élémets observés sera appelé E. - Les élémets sot les objets costtutfs de l'esemble. Ce sot des objets détermés dot l'apparteace à tel ou tel esemble E est sas ambguïté. Les élémets peuvet être désgés par leur posto das le tableau de doées : pour le premer, pour u élémet quelcoque, pour le derer élémet, pour la somme des élémets costtuat l esemble. * Exemple : Élémet : membre d'ue populato statstque (spécme, prélèvemet d'eau, dvdu...) * Questo Quel est l'élémet? Il faut le défr de maère à pouvor le recoaître sas ambguïté. - La populato correspod à l'esemble des dvdus sur lequel porte l étude ou la prévso, (l est gééralemet dffcle de l étuder das sa totalté), et l échatllo représete la fracto de cette populato qu est réellemet observée ou étudée : - Populato-cble : esemble des élémets vsés, e prcpe, par l'échatlloage. * Questo Quelle est la populato-cble? Il s'agt là de la populato sur laquelle o amerat be que les coclusos de l'étude portet. - Populato statstque : esemble des élémets effectvemet représetés par l'échatlloage. Les élémets qu la composet se caractérset par au mos ue caractérstque commue et exclusve qu permet de les dstguer sas ambguïté. * Questo Quelle est la populato statstque? Il faut metoer la ou les caractérstques qu permettet de la dstguer de tout autre populato statstque. - Populato bologque: esemble des dvdus d'ue même espèce habtat u leu doé à u momet doé. oto qu relève davatage de la bologe que de la statstque. * Questo Quelle est la populato bologque? Il faut spécfer le temps et le leu. - Commuauté : esemble des dvdus de dverses espèces retrouvés das u espace et u temps doés. oto qu relève davatage de la bologe que de la statstque. - Quelle est la commuauté? Il faut spécfer le temps et le leu. Exemples gééraux: - Pour les sttuts de sodage, la populato étudée sera u esemble d'hommes et de femmes occupat ue porto défe de l'espace (pays, régo, commue) et l'échatllo " représetatf" sera u ombre lmté mas représetatf des catégores pertetes e focto Modher Abrougu Bostatstque «I» ISEFC - 008 9
du problème posé (âge, sexe, catégores soco-professoelles, orge géographque, etc.) (Pour la Tuse, échatllos de 000 à 00 dvdus pour ue populato de près de 0 mllos d'habtats). - Toute l'eau qu s'écoule d'ue rvère à u momet doé costtue la populato. Les 0 prélèvemets de 0 cm 3 que l'o va aalyser costtuet l'échatllo. - Le sag d ue persoe peut être cosdéré comme ue populato, ue prse de sag comme u prélèvemet (dvdu, observato) et l esemble des prélèvemets sera cosdéré comme u échatllo. La oto d dvdu est très large : les élémets d u échatllo ou d ue populato sot appelés gééralemet des dvdus, cepedat cette oto peut être remplacé par pluseurs déomatos: uté statstque, sujet, objet, élémet, observato, mesure, doses, toutefos, dès que la déomato est chos aucue ambguïté e dot persstée. 4.. Recesemet / Echatlloage 4... Le recesemet : qu cosste gééralemet e u recuel d formatos auprès de tous les dvdus d ue populato (ce qu est très dffcle das le cas de la Bostatstque, mas plus facle das des études démographque). Il est plus adapté à l étude des populatos. Il cosste e u déombremet de toutes les persoes ou dvdus ou attrbuts d ue populato das sa totalté. Il s agt de la source de doées la plus complète dot o dspose sur la populato. La méthode est très fastdeuse car re est églgé pour ter compte de chaque dvdu. E effet, le recesemet est très mportat pusqu l s agt de la seule equête permettat de brosser u tableau détallé de toute la populato. L equête ou la prse de doées ou le référecemet des attrbuts couvre toute la populato, ce qu faclte la comparaso des resegemets eregstrés. Exemples : populato d u pays ; polluto modale ; amaux e voe de dsparto ; géome huma ;. 4... L échatlloage : qu cosste gééralemet e u recuel d formatos auprès de quelques dvdus ou parte d ue populato «l échatllo», (ce qu est gééralemet le cas e Bostatstque). Parfos l échatlloage se fat par sodage (cas e géologe (tremblemet de terre), e médece) Échatllo : fragmet d'u esemble prélevé pour juger de cet esemble. Fracto de la populato statstque sur laquelle des mesures sot fates pour coaître les proprétés de cette populato. * Questo - quel est l'échatllo? Quel est so effectf? Modher Abrougu Bostatstque «I» ISEFC - 008 0
Fgure : Populatos et échatllos Échatllo représetatf : échatllo qu représete fdèlemet la composto et la complexté de la populato statstque. - pour être représetatf, u échatllo dot être aléatore. - représetatf e veut pas dre "coforme à l'dée que le chercheur se fat de la populato"! Échatllo aléatore: échatllo prélevé de maère à ce que chacu des élémets de la populato statstque at ue probablté coue et o ulle d'apparter à cet échatllo. - u échatllo aléatore est représetatf de sa populato statstque - aléatore e sgfe pas "'mporte commet"! Échatllo aléatore smple : prélèvemet au hasard, de faço dépedate, d'u certa ombre d'élémets de la populato statstque. Tous les élémets ot la même probablté d'être clus das l'échatllo. 4.3. Caractère / Modalté / Varable: 4.3.. Le caractère, les élémets d'u esemble sot décrts par u caractère. Cela revet à établr ue correspodace etre chaque élémet de l'esemble E et l'esemble X des modaltés ou des valeurs du caractère. La focto f : E X x est ue applcato au ses mathématque : chaque élémet de E a ue modalté (caractère qualtatf) ou ue valeur (caractère quattatf) et ue seule das X. As le caractère peut être déf comme ue des caractérstques ou des attrbuts d u dvdu, 4.3.. Modalté / Mesure : la modalté (respectvemet la mesure) est l ue des formes partculère d u caractère. Les dfféretes stuatos où les élémets de E peuvet se trouver à l'égard d'u caractère qualtatf cosdéré, sot les dfféretes modaltés du caractère qualtatf X. Das le cas ou le caractère X est quattatf, les dfféretes stuatos où les élémets de E peuvet se trouver sot des mesures. Ces modaltés ou ces mesures dovet être à la fos compatbles (u élémet de E e peut predre qu'ue seule modalté) et exhaustve (à chaque élémet de E dot pouvor correspodre ue modalté de X) de sorte que chaque élémet de E at ue modalté et ue seule das X. Modher Abrougu Bostatstque «I» ISEFC - 008
E statstque, chaque dvdu peut être déft par u esemble d attrbuts qu le caractérse das le cotexte d u problème étudé. La couleur du pelage est u caractère Les varates de la couleur du pelage sot des modaltés : or, grs,... Le sexe est u caractère, ses modaltés sot de types : sot male sot femelle La talle peut predre pluseurs modaltés : m ;,m ;,m etc Autres exemple de caractères : Le taux de glycéme, la vtesse de coagulato ; la producto latère ; 4.3.3. Tableau élémetare : c'est u tableau à smple etrée où les lges correspodet aux élémets de l'esemble étudé et les coloes aux caractères (ou varables) décrvat ces élémets (Tableau (. et.)). Observatos Varables Varable Varable Varable Varable p Observato Observato Observato Observato Tableau. : exemple de tableau de sase élémetare La premère coloe est e prcpe réservée à la lste omale des élémets. Tableau. : Exemples de tableaux de doées 4.3.4. La varable statstque, chaque attrbut (ou caractère ou caractérstque) a des modaltés, ou peut s exprmer selo ue mesure, celles-c varet d u dvdu à l autre ou d u groupe d dvdus à u autre groupe d dvdus. La varable statstque est le om que l o doe à ces caractères (attrbuts, caractérstques). Modher Abrougu Bostatstque «I» ISEFC - 008
Explctato de varable e bologe : caractérstque mesurable ou observable sur u élémet (varable propre) ou das so evroemet (varable assocée). 4.3.5. ature des varables statstques et échelles de mesures Das chaque étude statstque l est très mportat de cosdérer la ature des doées (observatos, caractères, attrbuts) que l'o va tester. D'elle déped la ature des opératos possbles et doc des statstques utlsables das chaque stuato. Il est doc prmordal de précser la ature de chaque varable, ou caractère. Il exste deux types de varables (ou observatos, celles-c peuvet être sot quattatves sot qualtatves. Ces varables peuvet être mesurées d où l mportace du chox des échelles de mesures, c'est-à-dre, des règles permettat d affecter ue valeur à chaque dvdu de la populato ou de l échatllo. 4.3.5.. Varable quattatf : c'est u caractère auquel o peut assocer u ombre c'est-àdre, pour smplfer, que l'o peut "mesurer" (gradeur mesurable). Les dfféretes stuatos où peuvet se trouver les élémets sot des mesures; elles sot ordoables et la moyee a ue sgfcato O dstgue alors deux types de caractère quattatf : a - Varable dscrète ou dscotue : c'est u caractère quattatf, u tel caractère e pred qu'u ombre f de valeurs (valeur etère déombrable et sas aucue valeur termédare). Les dfféretes stuatos où peuvet se trouver les élémets (observatos, mesures, valeurs, ) sot des ombres solés dot la lste peut être étable a pror. Exemple: (ombre d'efats, ombre de pétales d ue fleur, ombre de dets,..) : ( ; ; 3 ; 4 ; 5 ;.0 ; ; ) b - Varable cotue : c'est u caractère quattatf, u tel caractère peut, théorquemet, predre toutes les valeurs d'u tervalle de l'esemble des ombres réels. Toutes les valeurs e sot pas déombrables et e peuvet pas être établt a pror. Ses valeurs sot alors regroupées e classes (talle, temps, pods, vtesse, glycéme, alttude, surfaces,.) (,60 m ;,6 m ;,6 m ;..) c - Les mesures des doées ou varables quattatves compreet les déombremets (ou comptages) et les mesures (ou mesuratos). c - Das le cas des déombremets, la caractérstque étudée est ue varable dscrète ou dscotue, e pouvat predre que des valeurs etères o égatves (ombre de fruts par rameau, ombre de pétales par fleur, ombre de têtes de bétal..). Il sufft de compter le ombre d'dvdus affectés par chacue des valeurs de la varable. Exemple : ombre de pétales par fleur das u échatllo de 000 fleurs de Reoculus repes. ombre de pétales par fleur 3 4 5 6 7 ombre de fleurs 0 959 8 c - Das le cas des mesures, la varable est de ature cotue (hauteur, pods, surface, cocetrato, température..). Les valeurs possbles sot llmtées mas du fat des méthodes de mesure et du degré de précso de l'apparel de mesure, les doées varet toujours de faço dscotue. Modher Abrougu Bostatstque «I» ISEFC - 008 3
Les mesuratos peuvet être réalsées das pluseurs échelles de mesure : l échelle umérque, l'échelle de rapport, l'échelle d'tervalle. Elles sot mapulables suvat les opératos de l'arthmétque. c. - L'échelle umérque est caractérsée par l mportace des valeurs mesurées. Le (0) sgfe be l'absece du phéomèe. Exemple : populato, taux de fécodté, précptatos. c. - L'échelle de rapport ou de taux exprme le rapport etre deux valeurs. Leur total 'a pas de sgfcato et caractérsé par l'exstece d'u zéro absolu et de dstaces de talle coue etre deux valeurs quelcoque de l'échelle. C'est le cas de la mesure de la masse ou du pods. E effet, les échelles de mesure des pods e pouds ou e grammes ot toutes deux u zéro absolu et le rapport etre deux pods quelcoque d'ue échelle est dépedat de l'uté de mesure (le rapport des pods de deux objets mesurés e pouds et celu de ces mêmes objets mesurés e grammes sot detques). (Desté de populato, proporto à ue date ou à u leu doée). c.3 - Das l'échelle d'tervalle, le pot zéro et l'uté de mesure sot arbtrares mas les dstaces etre deux valeurs quelcoques de l'échelle sot de talle coue. Ue telle échelle permet de repérer la posto de chaque élémet par rapport à ue orge arbtrare. La valeur 0 est doc covetoelle et e sgfe pas l'absece du phéomèe C'est le cas de la mesure de la température (échelle Fahrehet ou Celsus), de la Lattude de la Logtude, l alttude,... Ces échelles quattatves sot compatbles avec l'utlsato de tests paramétrques. 4.3.5.. Varable qualtatve : c'est u caractère qualtatf, das ce type de varable les modaltés e sot pas quatfables (pas mesurables) (couleur des yeux, douleur, ). Ce sot des oms ou ce qu revet au même des sgles ou des codes. Les dfféretes modaltés e sot pas ordoables. Atteto, même s les modaltés sot des codes umérques, les opératos sur les modaltés 'ot aucu ses. Exemple : type de relef avec tros modaltés (plae, motage, plateau), ou ecore talle d ue che écologque avec quatre modaltés (pette, moyee, grade, très grade). Les doées qualtatves peuvet être assmlées au cas des varables dscotues, e supposat que les dfféretes varates du caractère qualtatf sot ragées das u ordre correspodat par exemple à la sute des ombres eters postfs (dfféretes couleurs, dfférets degrés d'fecto...). Les doées qualtatves peuvet être réalsées das deux échelles de mesure : échelle de ragemet et l'échelle omale. Ces doées e sot pas mapulables par l'arthmétque. a - Das l'échelle ordale (de ragemet), o parle das ce cas de caractère ordal (caractères qu peuvet être exprmés sur ue échelle ordale) : das cette échelle chaque modalté est explctemet sgfcatve du rag prs par chaque dvdu pour le caractère cosdéré. S E possède élémets, les modaltés serot er, eme, 3 eme,... eme. Comme o possède juste l'ordre des dvdus, o e sat re de l'tervalle des valeurs. Il exste ue certae relato etre les objets du type plus grad que, supéreur à, plus dffcle que, préférée à... Ue trasformato e chageat pas l'ordre des objets est admssble. La statstque la plus approprée pour décrre la tedace cetrale des doées est la médae. b - Das l'échelle omale, les ombres ou symboles detfet les groupes auxquels dvers objets apparteet. C'est le cas des uméros d'mmatrculato des votures ou de sécurté Modher Abrougu Bostatstque «I» ISEFC - 008 4
socale (chaîes de caractères). Le même ombre peut être doé aux dfféretes persoes habtat le même départemet ou de même sexe costtuat des sous-classes. Les symboles désgat les dfféretes sous-classes das l'échelle omale peuvet être modfés sas altérer l'formato essetelle de l'échelle. Les seules statstques descrptves utlsables das ce cas sot le mode, la fréquece... et les tests applcables serot cetrés sur les fréqueces des dverses catégores. Ces deux derères échelles e permettet que l'utlsato de tests o paramétrques. 4.3.5.3. Exemple d llustrato des prcpaux types de descrpteurs Fgure : Typologe des caractères pour ue approche statstque Modher Abrougu Bostatstque «I» ISEFC - 008 5
Fgure 3 : Exemples de varables statstques et échelles de mesures Modher Abrougu Bostatstque «I» ISEFC - 008 6
APPLICATIO I Applcato I. Idetfez le type (et le sous-type) des varables suvates : Réposes a) Le ombre d amaux par laboratore ; a) quattatf dscret b) La che écologque prcpale ; b) qualtatf omal c) Le modèle de matérel utlsé ; c) qualtatf omal d) La dstace e klomètre etre le prélèvemet A et le prélèvemet B ; d) quattatf cotue e) Être végétare ou o ; e) qualtatf ordal f) Le temps passé à observer le comportemet X ; f) quattatf cotue g) Avor ou o ue répose; g) qualtatf ordal h) Le ombre de frères et soeurs. h) quattatf dscret 4.3.6. Varables dépedates et dépedates E statstque o adopte ecore ue autre dchotome pour le cocept de varable e parlat de varables dépedates et de varables dépedates. 4.3.6.. Les varables dépedates sot celles qu sot mapulées par l expérmetateur (l apparteace au groupe et ous cotrôlos les tratemets applqués aux dfférets groupes). 4.3.6.. Les varables dépedates sot celles qu sot mesurés, référecés, exemple de doées (surve, résstaces, tolérace, performace, ). Fodametalemet, ue étude porte sur les varables dépedates et les résultats de l étude (les doées) sot les varables dépedates. 4.3.7. La varablté et l'certa e bologe Toutes les questos, propremet bologque e relato avec les statstques, reflètet ue proprété fodametale des systèmes bologques qu est leur varablté. Cette varablté est la somme d'ue varablté expérmetale (lée au protocole de mesure) et d'ue varablté propremet bologque. O peut as décomposer la varablté d'ue gradeur mesurée e deux grades composates : Varablté Totale Varablté Bologque + Varablté Métrologque 4.3.7. La varablté bologque Elle peut être décomposée e deux termes : - d'ue part la varablté tra-dvduelle, qu fat que la même gradeur mesurée chez u sujet doé peut être soumse à des varatos aléatores ; - d'autre part la varablté terdvduelle qu fat que cette même gradeur vare d'u dvdu à l'autre. Modher Abrougu Bostatstque «I» ISEFC - 008 7
Varablté Bologque Varablté tra-dvduelle + Varablté terdvduelle La varablté tra-dvduelle peut être observée lors de la mesure de la performace d'u athlète qu 'est pas capable des mêmes performaces à chaque essa, mas qu se dfférece des autres athlètes (varablté terdvduelle). E gééral, la varablté tra est modre que la varablté ter. 4.3.7. La varablté métrologque Elle peut être elle auss décomposée e deux termes : d'ue part les codtos expérmetales dot les varatos etraîet u facteur d'aléas ; et d'autre part les erreurs dutes par l'apparel de mesure utlsé. Varablté Métrologque Varablté Expérmetale + Varablté strumetale (apparel de mesure) La mesure de la presso artérelle peut grademet varer sur u dvdu doé suvat les codtos de cette mesure ; l est as recommadé de la mesurer après u repos d'au mos 5 mutes, allogé, e mettat le patet das des codtos de calme maxmal. Cette recommadato vse à mmser la varablté due aux codtos expérmetales. La précso de l'apparel de mesure est ue doée trsèque de l'apparel, et est foure par le costructeur. 4.3.8. Proprétés des varables Caractérstques mesurables ou observables. Propres (attrbut de l'élémet) ou assocées (composate de so evroemet). Aléatores (dfféretes varates peuvet apparaître, chacue avec ue certae probablté) ou cotrôlées (le chercheur obtet avec certtude la varate désrée, e gééral par mapulato). Dépedates (o cherche à e compredre ou prévor le comportemet) ou dépedates (explquet par hypothèse au mos ue parte du phéomèe étudé). Smples ou complexes (ex.: rapports, pourcetages...). Dvers types mathématques et échelles de varato. 4.4. Iférece et rsque statstque Iférece statstque: gééralsato à la populato statstque des résultats d'u test statstque réalsé sur u échatllo représetatf de cette populato. Cette gééralsato se fat au rsque du statstce. Gééralsato à la populato-cble: lorsque cette derère est dfférete de la populato statstque, cette gééralsato se fat au rsque du bologste. Modher Abrougu Bostatstque «I» ISEFC - 008 8
Fgure 4 : Représetato graphque de dfféretes populatos et des rsques 4.5. Ue défto plus explcte de la bostatstque : La statstque est u esemble d strumets scetfques par lesquels o recherche à explquer certas phéomèes. Elle se compose de méthodes permettat de recuellr, de classer, de préseter et d aalyser des observatos relatves à ces phéomèes pour e trer esute des coclusos et predre des décsos. E bologe, la statstque est u esemble de méthodes vsat à décrre, à résumer et à terpréter des phéomèes dot le caractère essetel est la varablté. 4.6. Déomato mathématque : - E : représete l esemble de tous les dvdus sur lequel porte l étude statstque - Ω : représete la populato sur laquelle porte l étude statstque, S E est ue éumérato exhaustve de tous les dvdus susceptbles d être aalysés, l peut être appelé populato ou uvers et sera oté Ω. Das le cas cotrare, E sera u échatllo de Ω. - E : représete le cardal de E, c est le ombre de doées (ou d observatos) référecées, l correspod à l effectf ou la talle qu est gééralemet oté. La talle de l échatllo est l effectf ou le ombre d dvdus sur lequel sot réalsé effectvemet les observatos, c est u sous esemble de E (das le cas où E caractérse la populato etère), l correspod gééralemet au cardal E. - : représete la talle d ue populato ou d u échatllo, c est u ombre qu désge le ombre d dvdu que rassemble u échatllo ou ue populato. Modher Abrougu Bostatstque «I» ISEFC - 008 9
- p : représete l esemble des varables caractérsat les dvdus sur lequel porte l étude statstque. E est de dmeso p, s l aalyse de E est fate selo p varables (où p IΝ (eter aturel)). Exemple : Das ue populato E, o étude 4 varables (w, x, y, et z) : w : age, x : le sexe, y : la talle et z : le pods. Das ce cas E est de dmeso p, ou de dmeso 4 - Système de otato Lorsqu'o mesure la valeur ou observe l'état d'u certa ombre de varables sur u élémet, o utlse l'ue ou l'autre des otatos suvates pour désger les varables : - s'l y a ue, deux ou tros varables : x, y et z - s'l y a plus de tros varables: x, x, x3... xj... xp Les varables sot doc umérotées de la premère, à la p-ème, ue varable quelcoque état la jème. U jeu de doées (p.ex. u échatllo) comporte élémets. U quelcoque de ces élémets est le -ème. Ces élémets sot souvet qualfés d'observatos ou d'objets. - lorsqu'o mesure la valeur d'ue varable x sur u élémet quelcoque (le -ème), o désge cette valeur par x. - vare de à, doc o a les mesures x, x,... x... x. S le jeu de doées cosste e u tableau de élémets décrts par p varables (tableau p), o ote: Il arrve que les élémets soet réparts e k groupes caractérsés par ue varable qualtatve. Das ce cas, o peut auss oter les observatos d'ue varable par u double dce, le premer désgat le uméro de l'observato au se d'u groupe (-ème élémet), le deuxème désgat le uméro du groupe (gème groupe ou j-ème groupe): - xg ou ecore xj la mesure prse sur le -ème élémet du g-ème (ou j-ème) groupe. Modher Abrougu Bostatstque «I» ISEFC - 008 0
- otato somme (sgma) La lettre grecque sgma majuscule désge ue sommato (addto de tous les élémets d'u esemble). La sommato des valeurs des observatos d'ue varable x, sot de tous les x pour allat de à, se ote: Doc x x x x x + +... +.. + x S l'o veut fare la somme de tous les élémets d'u tableau de observatos et p varables, o écrra: p xj x + x +... + x.. + x + x + x +... + xj.. + x j p S a est ue costate, tous les a sot égaux. Doc: a a + a +... + a.. + a a ( x + a) a + x ax a x O se sert de ces proprétés des sommatos pour smplfer ou développer des expressos comportat des sommatos. Modher Abrougu Bostatstque «I» ISEFC - 008
Applcato I. Smplfer le plus possble l'expresso suvate: Développer le plus possble l'expresso suvate: Modher Abrougu Bostatstque «I» ISEFC - 008
- Fréqueces absolues, relatves et cumulées (vor tableau exemple) Désgé par «F» ou «f» La oto de fréquece peut être exprmée de pluseurs maères : * Fréquece absolue (effectf) * Fréquece relatve (ou fréquece) * Fréqueces cumulées Varables Exemples de Fréqueces x x x 3 x 4 Total Effectf ou Fréquece absolue ( ) 8 9 3 Fréquece absolue cumulée crossate 8 8+0 0+99 9+3 Fréquece absolue cumulée décrossate -84 4- -93 Fréquece relatve (f ) 8/ / 9/ 3/ / Fréquece relatve cumulée crossate 8/ 8/+/0/ 9/ / Fréquece relatve cumulée décrossate ou fréquece cumulée décrossate / /-8/ 4/ (4-)/ /0 (-9)/ 3/ Tableau : Exemples explcatfs des fréqueces (Ce tableau servra d exemple pour compredre les otos de fréqueces) * Fréqueces absolues Effectf Le terme de fréquece absolue désge les effectfs : a chaque modalté x du caractère X, peut correspodre u ou pluseurs dvdus das l'échatllo de talle. O appelle effectf (ou fréquece absolue) de la modalté x, le ombre où d dvdu de chacue des modaltés * Fréquece relatve Fréqueces O appelle fréquece de la modalté x, le ombre f tel que f est le ombre Remarques : Rq : Le pourcetage est ue fréquece exprmée e pour cet. Il est égal à 00 f. Rq : L emplo des fréqueces ou fréqueces relatves s avère utle pour comparer deux dstrbutos de fréqueces étables à partr d échatllos de talle dfférete. * Fréqueces cumulées fréqueces relatves cumulées O appelle fréqueces cumulées ou fréqueces relatves cumulées e x, le ombre f cum tel que f cum Remarques p f p Rq : la talle de l échatllo est k f Rq : Modher Abrougu Bostatstque «I» ISEFC - 008 3
- Foctos cumulatves * focto cumulée crossate ou ascedate * focto cumulée décrossate ou descedate Déftos Sot S ue sére statstque à ue varable de type quattatf et a ue modalté de S. La fréquece cumulée crossate assocée à a est la somme des fréqueces de toutes les modaltés féreures ou égales à a das la sére S. Das le cas d'ue sére S dot les modaltés sot regroupées e classes, la fréquece cumulée crossate de la classe [a ; b[ est la somme des fréqueces de cette classe et des classes qu précèdet (c'est-à-dre dot les élémets sot strctemet féreurs à a) s'l y e a. Remarques * La fréquece cumulée crossate de la plus pette modalté ou de la classe à laquelle apparteet les plus pettes modaltés est égale à la fréquece de cette modalté ou de cette classe; * La fréquece cumulée crossate de la plus grade modalté ou de la classe à laquelle apparteet les plus grades modaltés est égale à (ou à 00 % pour les fréqueces exprmées e pourcetages). 5. REPRESETATIO DES DOEES Il exste pluseurs veaux de descrpto statstque : la présetato brute des doées, des présetatos par tableaux umérques, des représetatos graphques et des résumés umérques fours par u pett ombre de paramètres caractérstques. ous revedros sur les représetatos graphques et les tableaux respectvemet das les paragraphes suvats et das les exemples 5.. Tableaux statstques E gééral ue sére statstque à caractère dscret se présete sous la forme : Valeurs X X.. Xp Effectfs.. p Fréqueces F F.. Fp Plutôt que réécrre ce tableau o écrra souvet : la sére (x, ). (O 'dque pas le ombre de valeurs lorsqu'l 'y a pas d'ambgüté). Souvet o otera l'effectf total de cette sére doc ++...+p. (Vor paragraphe 4.3.3 ; 4.6 Tableau et ) Modher Abrougu Bostatstque «I» ISEFC - 008 4
Applcato I.3 : Caractères quattatfs dscrets Das le cas d u caractère quattatf dscret, l établssemet de la dstrbuto des doées observées assocées avec leurs fréqueces est mmédat. Exemple : La cécdomye du hêtre provoque sur les feulles de cet arbre des galles dot la dstrbuto de fréqueces observées est la suvate : Caractère X : x : ombre de galles 0 3 4 5 6 7 8 9 0 par feulle : ombre de feulles portat x galles 8 98 46 8 5 0 0 f : fréq. relatve 0,485 0,6 0,3 0,075 0,03 0,03 0,005 0,003 0 0,003 0 f cum. : fréq. Relatve cumulée 0,485 0,746 0,869 0,944 0,976 0,989 0,994 0,997 0,997 La talle de l échatllo étudé est 375 feulles Applcato I.4 : Utlser le logcel Excel pour dresser ces tableaux et réalser les calculs Applcato I.5 : Caractères quattatfs cotus (Mots clés : ombre de classes, tervalle etre classe (ampltude), étedu de la varable X) Das le cas d'u caractère quattatf cotu, l établssemet du tableau de fréqueces mplque d effectuer au préalable ue répartto e classes des doées. Cela écesste de défr le ombre de classes attedu et doc l ampltude assocée à chaque classe ou tervalle de classe. E règle géérale, o chost des classes de même ampltude. Pour que la dstrbuto e fréquece est u ses, l faut que chaque classe compree u ombre suffsat de valeurs ( ). Dverses formules emprques permettet d établr le ombre de classes pour u échatllo de talle. La règle de STURGE : ombre de classe + (3,3log ) La règle de YULE : ombre de classe 4,5 L'tervalle etre chaque classe est obteu esute de la maère suvate : Itervalle de classe (X max - X m) / ombre de classes Avec X max et X m, respectvemet la plus grade et la plus pette valeur de X das la sére statstque. A partr de X m o obtet les lmtes de classes ou bores de classes par addto successve de l tervalle de classe. E règle gééral, o tete de fare coïcder l dce de classe ou valeur cetrale de la classe avec u ombre eter ou ayat peu de décmales. Toutes les doées sot comprses etre X m et X max et chaque doée appartet à ue et ue seule classe. Modher Abrougu Bostatstque «I» ISEFC - 008 5
Exemple : Das le cadre de l étude de la populato de gélottes huppées (Boasa umbellus), les valeurs de la logueur de la rectrce prcpale peuvet être répartes de la faço suvate : 58 5 7 63 40 57 6 7 58 64 63 59 53 60 49 58 5 65 56 6 50 54 55 6 55 64 64 57 59 58 59 53 63 58 74 6 56 5 60 58 6 66 6 64 58 53 65 58 50 60 Défto du ombre de classes : Règle de Sturge : + (3,3 log 50) 6,60 Règle de Yule :,5 4 50 6,64 Les deux valeurs sot très peu dfféretes Défto de l tervalle de classe : 74 40 IC 5, 5mm que l o arrodt à 5 mm par commodté 6,6 Tableau de dstrbuto des fréqueces Caractère X : x : logueur de la rectrce bores des classes e mm Valeur médae des classes x [40-45[ [45-50[ [50-55[ [55-60[ [60-65[ [65-70[ [70-75[ 4,5 47,5 5,5 57,5 6,5 67,5 7,5 : ombre d dvdu par classe 9 7 6 3 3 de talle x f : fréquece relatve 0,0 0,0 0,8 0,34 0,3 0,06 0,06 f cum. : fréquece relatve cumulée (crossate) 0,0 0,04 0, 0,56 0,88 0,94 Applcato I.6 : Utlser le logcel Excel pour dresser ce tableau, calculer l tervalle des classes et réalser les calculs Modher Abrougu Bostatstque «I» ISEFC - 008 6
5.. Représetatos graphques et statstque descrptve Les représetatos graphques sot très mportates e statstque descrptve. Elles ot l avatage de reseger mmédatemet sur l allure géérale de la dstrbuto. Elles facltet l terprétato des doées recuelles. La représetato graphque des doées motre la forme géérale de la dstrbuto et doe ue mage de la gradeur des ombres qu costtuet les doées. D autres statstques smples sot utlsées pour représeter le cetre de la dstrbuto et les mesures lées à la dsperso des observatos autour de cette tedace cetrale. Das cette parte, ous e préseteros que les cas partculers de l hstogramme et des Barres à moustaches (Box Plot) cepedat, d autres représetatos serot abordées das les dfféretes partes de ce fasccule. De plus, pluseurs actvtés pratques de costructo (vor TD) explcterot les costructos de pluseurs types de graphes et préseteros leurs ombreux avatages (pour plus d formatos cosulter le documet «représetato graphque» du TD). Exemple de graphe sous Excel Exemple de costructo e TD 5... L hstogramme Défto : L'hstogramme cosste à fare fgurer les effectfs d'ue varable par classe de valeur. Il est représeté quad la varable est quattatve cotue par des rectagles dot la surface (et o la hauteur) est proportoelle aux effectfs. Modher Abrougu Bostatstque «I» ISEFC - 008 7
APPLICATIO II Applcato II. - L hstogramme : exemple A partr de la lste des valeurs du tableau des effectfs suvate, costrure l hstogramme correspodat (utlser le logcel Excel) classes (mettre l uté) effectf (e ombre) 4 3 5 0 6 4 7 6 8 6 9 0 4 7 5 3 Tableau d effectfs Applcato II. : Les classes peuvet être défes d tervalles égaux ou o. Das ce derer cas, seule la surface sera proportoelle à l effectf (et o la hauteur) 5... L hstogramme : paramètres de descrpto Pour décrre la forme d'u hstogramme o utlse les otos de mode et de symétre : le mode est la valeur domate, dot l'effectf est le plus élevé. U hstogramme peut avor aucu, u ou pluseurs modes. Das u hstogramme, le mode est le rectagle qu a l'are la plus grade. Modher Abrougu Bostatstque «I» ISEFC - 008 8
La symétre tradut la dstrbuto des valeurs de part et d autre du ou des modes Cas d ue dstrbuto bmodale asymétrque Applcato II.3 : Caractères quattatfs dscrets Pour les caractères quattatfs dscrets, la représetato graphque est le dagramme e bâtos où la hauteur des bâtos correspod à l effectf assocé à chaque modalté du caractère x. Modher Abrougu Bostatstque «I» ISEFC - 008 9
Exemple : Das l exemple de la cécdomye du hêtre, la dstrbuto des fréqueces observées du ombre de galles par feulle peut être représetée par u dagramme e bâtos avec e ordoée les effectfs et e abscsse les dfféretes modaltés de la varable étudée. Applcato II.4 : Caractères quattatfs cotus Pour les caractères quattatfs cotus, la représetato graphque est l hstogramme où la hauteur du rectagle est proportoelle à l effectf. Cec est vra que s l tervalle de classe est costat. Das ce cas l are comprse sous l hstogramme s avère proportoelle à l effectf total. E revache lorsque les tervalles de classe sot égaux, des modfcatos s mposet pour coserver cette proportoalté. Das ce cas, e ordoée, au leu de porter l effectf, o dque le rapport de la fréquece sur l tervalle de classe. As la superfce de chaque rectagle représete alors l effectf assocé à chaque classe. Exemple : Das l exemple de la logueur de la rectrce cetrale des dvdus mâles de la gélotte huppée, la dstrbuto des fréqueces observées est représetée par u hstogramme avec e ordoée les effectfs et e abscsse les lmtes de classe de la varable étudée. Applcato II.5 : Utlser le logcel Excel pour réalser l hstogramme de l applcato Modher Abrougu Bostatstque «I» ISEFC - 008 30
5... Barre à moustache - Box Plot Remarque : Pour compredre cette parte l est écessare de se référer au paragraphe «6.. Paramètre de posto et valeurs cetrales». Ue "boîte à moustaches" (traducto fraçase du terme "Box ad Whskers Plot", ou e abrégé "Box Plot") est ue représetato graphque de quelques paramètres de dstrbuto d'ue varable, vetée par Tukey e 977. C est ue représetato graphque d ue varable quattatve qu permet d appréheder (résumer ue dstrbuto emprque) la dsperso d u échatllo. Rappel (E référece au paragraphe «6.. Paramètre de posto et valeurs cetrales».) O appelle tervalle ter-quatles l tervalle [Q (0,5), Q (0,75)], qu cotet la moté cetrale des valeurs de l échatllo. O appelle tervalle ter-décles l'tervalle [Q (0,), Q (0,9)], qu cotet 80% des valeurs cetrales de l'échatllo. Ces tervalles sot à la base d'ue représetato très compacte de la dstrbuto emprque : le dagramme e bote (ou boîte à moustaches, box plot, box-ad-whsker plot). Il 'y a pas de défto stadardsée de cette représetato. Elle cosste e ue boîte rectagulare, dot les deux extrémtés sot les quartles. Ces extrémtés se prologet par des trats termés par des segmets orthogoaux (les moustaches). La logueur de ces segmets vare selo les auteurs. Il exste doc pluseurs varates pour représeter les botes à moustache, ous trateros de celle la plus fréquemmet utlsée. ous proposos par exemple de fxer la logueur des segmets aux décles extrêmes. O représete auss la médae par u trat das la boîte, et parfos les valeurs extrêmes par des pots (vor fgure c-dessous). Exemples de représetatos graphques: boîtes à moustache (box-plot) Modher Abrougu Bostatstque «I» ISEFC - 008 3
Aalysos rapdemet les botes à moustaches c dessus : La boîte à moustaches utlse gééralemet 5 valeurs qu résumet des doées : - Le mmum, - Les 3 quartles Q, Q (médae) et Q3, - Le maxmum. Les quartles Q, Q, Q3 sot les élémets essetels de ce type de graphque. ous détalleros les étapes de la costructo des quartles et de l'écart terquartle e TD. - les premer et trosème quartles (Q (0,5) et Q3 (0,75)) : bordures féreure et supéreure de la boîte rectagulare - la médae : trat horzotal log au se de la boîte rectagulare (Q (0,5)) - la moyee : marque plus (+) au se de la boîte, pouvat être cofodue avec la médae - les extrémtés féreure et supéreure des moustaches : marques e forme de tret (-) stuée sur le trat vertcal, et correspodat respectvemet à la plus pette doée supéreure à ue valeur a, et à la plus grade doée féreure à ue valeur a 3 ; Il est possble de calculer ces extrémtés avec les formules suvates : a Q-.5*(Q3-Q) Q-,5QI a 3 Q3+.5*(Q3-Q) Q3-,5QI avec QI Itervalle ter-quartles - les mmum et maxmum : marques extrêmes e forme de cercle (o) ; s le mmum ou le maxmum 'est pas cofodu avec le tret d'extrémté de moustache, c'est qu'l s'agt d'ue valeur atypque ("outler"). Les valeurs atypques peuvet être stuées strctemet e dessous de la moustache féreure a (b atyp. f.) ou strctemet e dessus de la moustache supéreure a 3 (b atyp. sup.). Pour plus de détals sur l'utlsato des boîtes à moustaches, vor TD. Applcato II.6 : Créato et test d ue macro BoxPlot sous Excel vor TD. Remarque : La médae est ue valeur cetrale de l'échatllo : l y a autat de valeurs qu lu sot féreures que supéreures. S la dstrbuto emprque de l'échatllo est peu dssymétrque, comme par exemple pour u échatllo smulé à partr d'ue lo uforme ou ormale, la moyee et la médae sot proches. S l'échatllo est dssymétrque, avec ue dstrbuto très étalée vers la drote, la médae pourra être ettemet plus pette que la moyee. Cotraremet à la moyee, la médae est sesble aux valeurs aberrates. Elle possède ue proprété d'optmalté par rapport à l'écart absolu moye. Modher Abrougu Bostatstque «I» ISEFC - 008 3
6. STATISTIQUES DESCRIPTIVES UIVARIEES Quelques exemples * Exemples de séres uvarées Ue sére uvarée est formée par ue sére de mesures d'ue varable quattatve, gééralemet cotue (valeurs décmales), effectuées sur u même échatllo : Exemple : - 5 mesures du pods d'u orgae (e g) : 4,5 3, 8,63 5,0 3,33 Evetuellemet : o peut avor à fare u varable quattatve dscrète (valeurs etères), pourvu que la oto de moyee at u ses par rapport à cette varable (ce 'est pas u "code"): Exemple : - 7 mesures du "ombre de pols aux pattes d'ue mouche" : 7 8 5 8 9 0 * Doées de deux séres uvarées Das cette stuato, les deux séres de doées coceret la même varable. Das la stuato la plus courate, la premère sére provet d'u échatllo "témo", la secode d'u échatllo "traté" : Exemple : - O dspose de deux échatllos de rats males, dot o a mesuré le pods corporel (e g): 3 rats TEMOIS : 40 43 47 5 rats TRAITES par u aabolsat : 435 48 457 50 473 Autre stuato fréquete : o observe le même échatllo "avat" et "après" u tratemet : Exemple : - O mesure l'hématocrte (utés arbtrares) avat et après u tratemet atcoagulat : les mesures AVAT le tratemet : 97 03 95,5 0 00 les mesures APRES le tratemet : 84 78 90,5 85 76 O peut auss comparer des échatllos qu dffèret par l'orge bo-géographque, l'âge, le sexe... * Doées de pluseurs séres uvarées Les dfféretes séres de doées coceret la même varable. Pluseurs tratemets ot été applqués (ou be o a échatlloé des populatos réputées dfféretes) : Exemple : - O dspose de tros échatllos de rats males, dot o a mesuré le pods corporel (e g): 3 rats TEMOIS : 40 ; 43 ; 47 5 rats TRAITES par u aabolsat : 435 ; 48 ; 457 ; 50 ; 473 4 rats tratés par u PLACEBO : 4 ; 437 ; 395 ; 4 Les statstques descrptves vset à représeter des doées dot o veut coaître les prcpales caractérstques quatfat leur varablté. Modher Abrougu Bostatstque «I» ISEFC - 008 33
Tros aspects sot essetels à l'terprétato d'ue dstrbuto : - Paramètre de posto : le cetre de la dstrbuto et la répartto autour d'ue valeur cetrale (moyee, mode, médae, quatles,..) - Paramètre de dsperso ou d étedue : les valeurs sot-elles dspersées ou cocetrées? - Paramètre de forme : la forme de la dstrbuto : la symétre, l aplatssemet 6.. Paramètre de posto et valeurs cetrales Le but des valeurs cetrales est de résumer e ue seule valeur l'esemble des valeurs d'ue dstrbuto statstque. Il exste quatre valeurs de postos : - Le mode (Mo), - La moyee ( X ou µ) - La médae ou le méda (Me ou Md) - Les fractles (Quatles) (Q) Parm ces valeurs les tros premères sot des valeurs de posto cetrales : 6... Le mode, ou valeur domate, est la valeur la plus fréquete d'ue dstrbuto. Cette valeur se calcule toujours à partr d'u déombremet des modaltés du caractère. Il faut doc dstguer le cas des caractères dscrets et des caractères cotus (vor otos de bases). * Caractère qualtatf et caractère dscret : Pour u caractère qualtatf, ou pour u caractère quattatf dscret ayat u ombre de modaltés féreur au ombre d'élémets, le mode est la modalté ou la valeur qu a la fréquece smple la plus élevée (ou l'effectf le plus élevé, ce qu revet au même). * Caractère quattatf cotu : Les modaltés état e ombre f, l est peu probable que deux élémets aet la même valeur. Das ce cas, le mode e peut pas être déf drectemet, l faut au préalable établr ue partto e classes. Le mode est alors le cetre de la classe modale, c'est à dre de la classe qu a la fréquece moyee la plus élevée. Le mode correspod à la valeur lue e abscsse du sommet de l'hstogramme. Lorsque celu-c présete deux pcs séparés par u creux, o dt que la dstrbuto est bmodale. APPLICATIO III Applcato III. : Cas de calcul des modes : - Cas : Doées ragées : le mode est la valeur de la doée qu apparaît le plus fréquemmet (celle qu a le plus d occurreces) : 40 ; 4 ; 44 ; 44 ; 48 ; 48 ; 5 ; 5 ;5 ; 54 ; 55 ; 58 ; 58 ; 6 ; 70 ; 7 Le mode est 5 car l possède le plus grad ombre d occurreces (l est référecé 3 fos) - Cas : Doées codesées : le mode est la valeur de la doée qu possède la fréquece la plus élevée (relatve ou absolue). Modaltés x (age e aées) 4 6 8 4 5 Total Fréqueces absolues 5 0 8 7 3 56 Fréqueces relatves 0,089 0,4 0,79 0,43 0,96 0,5 0,054,000 Das cette sére statstque, le mode est égal à Mo 6 as Modher Abrougu Bostatstque «I» ISEFC - 008 34
- Cas 3 : Doées groupées e classes : la classe modale est la classe ayat la plus haute fréquece (relatve ou absolue). Das le tableau des classes relatves à la logueur de la rectrce de Boasa umbellus, la classe modale est [55mm-60mm[. Il est possble de calculer de faço plus précse le mode e applquat la formule suvate : Mo bmo + ( ) Lmo + bmo : Bore féreur de la classe modale Lmo : largeur de la classe modale dfférece etre l effectf de la classe modale et l effectf de la classe précédete. dfférece etre l effectf de la classe modale et l effectf de la classe qu sut. (7-9) 8 ; (7-6) ; bmo 55 ; Lmo 5 8 Mo 55 + ( )5 59 8 + 6... La moyee mm Formalsato mathématque de la moyee arthmétque La moyee arthmétque, oté X ou µ, est la mesure la plus commue de tedace cetrale, elle se déft comme la somme des scores dvsée par le ombre de scores. Par exemple, e bologe la moyee peut être résumée par la somme des observatos dvsée par l effectf de l échatllo étudé: Elle est calculée pour les caractères quattatfs. X X * Calcul à partr du tableau élémetare : La moyee est la somme des valeurs dvsée par le ombre d'élémets : X X * Calcul à partr du tableau de déombremet : O effectue ue moyee podérée e assmlat chaque classe j à so cetre l'effectf j de la classe. X j et e podérat par X k j ( X j j ) * Moyee podérée : Modher Abrougu Bostatstque «I» ISEFC - 008 35
Plus gééralemet, o recourt à la podérato lorsque les utés 'ot pas le même pods. S chaque uté est décrte par sa modalté x et so pods p, la moyee podérée est : X p ( X p ) p * Proprétés de la moyee ) S A moyee de X X X ) La somme des écarts à la moyee est égale à zéro. ( X X ) 0 3) La moyee mmse les dstaces au carré ( X A) est mmum s,et seulemet s, A est la moyee du caractère X Applcato III. : ) Exemple avec llustrato Sot les valeurs de quatre otes : 0,, 3 et 6, la moyee arthmétque est: ( + + 3 + 6) / 4 3 Illustrato 7 6 otes Moyee 5 4 3 0 3 4 La moyee arthmétque doe ue valeur telle que la somme des écarts (rectagles jaues) est ulle Modher Abrougu Bostatstque «I» ISEFC - 008 36
La somme de fos la moyee doe la somme des valeurs Les ombres a, b, c, d,... sot dts e progresso arthmétque, das cet ordre, s la dstace qu les sépare est costate : b - a c -b d - c... Avec tros ombres, s b a + c alors b est la moyee arthmétque de a et c ) Exemple Sot la sére statstque suvate : valeurs 0 3 4 effectfs 4 La moyee est : x 0 + + + + 3 + 3 + 3 + 3 + 4 + 4 + + + 4 + 0 + + + 4 3 + 4 O préférera écrre : x 4 + + + 4 + 0,4 4 0,4 3) Calcul de la moyee Sot la sére statstque suvate : valeurs x x x p effectfs p La moyee est : x x + x + + p x p + + + p Remarque : S les doées ot été regroupées e classes, o e peut calculer la valeur exacte de la moyee. O peut toutefos e détermer ue boe approxmato e remplaçat chaque classe par so mleu. 4) Das les séres statstques suvates détermer les moyees : a) Tableau de fréqueces valeurs 3 4 5 6 fréqueces 0,05 0,7 0,43 0,30 0,05 x b) Doées répartes e classes classes [0 ; 5[ [5 ; 0[ [0 ; 5[ [5 ; 0] effectfs 7 4 Modher Abrougu Bostatstque «I» ISEFC - 008 37
Remplaços chaque classe par so mleu : x 5) Proprétés a) Addto ou Multplcato de toutes les doées par u même ombre : Ex : Sot la sére : 0,, 4. x Ajoutos : la ouvelle sére est :, 4, 6. x Dvsos par : la ouvelle sére est : 6, 7, 8. x Cas gééral : Sot α u réel quelcoque : S l'o ajoute α à toutes les doées, la moyee augmete d'α S o multple toutes les doées par α, la moyee est multplée par α S o dvse toutes les doées par α, la moyee est dvsée par α b) Moyees partelles Ex : Sur u patet dabétque après 0 prses de sag, le taux moye de glycéme est régulé à,5g/l. La valeur de la glycéme à la ème prse est de 0,8 g/l. Quel est le ouveau taux moye de glycéme de ce patet? - Calculos la somme des 0 prses de sag,5 x 0,5 g/l - Calculos la ouvelle somme des prses de sag,5 x 0 + 0,8 3,3 g/l - Calculos la ouvelle moyee des prses de sag 3,3/,0g/l Cas gééral : S o réu deux groupes dsjots ayat respectvemet pour moyees et effectfs, x et d'ue part, x et d'autre part, la moyee de l'esemble sera alors : x x + x + Applcato III.3 : Calculer des moyees e utlsat le logcel Excel et calculer la moyee de l exemple de l Applcato III. : 6.... Calcul de la moyee par chagemet d orge et d uté. (Vor parte Applcato VII : Approfodssemet) 6... Autres dcateurs de moyee : Il exste des dcateurs de la moyee autre que la moyee arthmétque. éamos, ls sot mos utlsés e bostatstque car ls e présetet d'térêt que das des cas très partculers. Ils e ferot pas l objet de ces modules: la moyee géométrque, la moyee harmoque, la moyee quadratque, la moyee arthmétco-géométrque. Modher Abrougu Bostatstque «I» ISEFC - 008 38
6..3. La médae et la classe médae 6..3.. Défto géérale : O appelle médae la valeur "du mleu". O dt qu'elle partage la sére statstque e deux motés : l y a autat de valeurs e dessous qu'au dessus. (C est la doée qu permet de dvser ue sére ordoée d ue faço crossate e partes égales (50%, 50%). La médae e peut être calculée que pour les caractères quattatfs. 6..3.. Médae, pour les doées ragées : Les valeurs du caractère X état classées par ordre crossat, la médae est la valeur du caractère qu partage l'esemble décrt par X e deux sous esembles d'effectfs égaux : 50 % des élémets ot des valeurs de X supéreures à X méd et 50% preet des valeurs féreures. - Méthode Sot ue sére statstque d'effectf total, ragée par ordre crossat. Pour détermer so rag, l y a cas : s est mpar : la médae est la valeur de rag + s est par : ous predros la dem-somme des deux valeurs dot les rags etouret le ombre + 8 43 44 46 6 8 43 44 46 6 95 méd 44 méd 45 APPLICATIO IV Applcato IV. Cas de doées dscrètes "e vrac" 0, 7,, 8, 6, 5, 5,,, 0, 5,, 8, 4 Ordoos la sére par ordre crossat : 5, 7, 0,,,,, 4, 5, 5, 6, 8, 8, 0 Il y a 4 termes or la valeur de rag est 4+ 7,5. La médae est doc la dem somme des 7 ème et 8 ème termes : médae + 4 6..3.3. Médae, pour les doées codesées : La défto est la même, elle correspod das ce cas à la premère modalté ou valeur dot la fréquece relatve cumulée dépasse 0,500 ou l effectf cumulé dépasse les 50%. Méthode : Il faut calculer les fréqueces ou les effectfs cumulés dès que celle-c attet respectvemet 0.5 ou 50% l sufft de chosr le ombre à m chem etre la modalté ou valeur cocerée et la suvate. 3 Modher Abrougu Bostatstque «I» ISEFC - 008 39
Applcato IV. Cas d u tableau d'effectfs O ordoe le tableau, et o cherche l'élémet qu partage la dstrbuto e deux partes égales: o repère l'élémet qu a le rag (+)/ pour le caractère X. S la dstrbuto a u ombre mpar d'élémets o trouve ue valeur uque qu est la médae, s la dstrbuto a u ombre par d'élémets, o trouve deux valeurs qu détermet u tervalle méda : o pred alors pour médae le cetre de cet tervalle méda. valeurs 3 4 5 6 effectfs 6 5 9 5 5 effectfs cumulés 6 7 4 6 76 8 fréquece 7 4 6 76 8 fréquece 0,07 0,4 0,3 0,3 0,9 0,06 fréqueces cumulées 0,07 0, 0,5 0,75 0,94,00 Atteto, l faut be terpréter cette derère lge : Les doées qu valet 3 ot u rag comprs etre 8 et 4 clus L'effectf total est de 8 or la valeur de rag 8+ 4. La médae est doc le 4 ème terme : médae 3 6..3.4. Médae, pour les doées répartes par classes Remarque S les doées ot été regroupées e classes, o e peut détermer la valeur exacte de la médae. E revache, o appellera classe médae, la classe qu la cotet (et permet doc d'e doer u ecadremet). La classe médae est la premère classe où la fréquece cumulée est supéreure à 0,500. Applcato IV.3 classe [0 ; [ [ ; 4[ [4 ; 6[ [6 ; 8] fréquece 0% 38% 45% 7% fréquece cumulée 0% 48% 93% 00% 48% des valeurs sot strctemet féreures à 4 Et 93% des valeurs sot strctemet féreures à 6 La classe médae est doc la classe [4 ; 6[ O peut doc e dédure l'ecadremet suvat 4 < méd < 6 Méthode de calcul Pour précser la valeur de la médae, l faut supposer que toutes les doées sot répartes uformémet (c'est-à-dre que les doées sot répartes sur u cotuum). O repère la classe qu cotet la médae, pus o réalse ue terpolato léare pour estmer la valeur de celle-c selo la formule suvate : 0,500 Fmd ) Md Bmd + ( Lmd Fmd Où : Bmd : Bore féreure de la classe médae Fmd- : Fréquece relatve cumulée de la classe qu précède la classe médae. Fmd : Fréquece relatve de la classe médae. Lmd : largeur, ampltude des classes Modher Abrougu Bostatstque «I» ISEFC - 008 40
Applcato pour l exemple précédet : 0,500 0,48) Md 4 + ( 4,088 0,45 Remarques : Rq : Autre méthode de calcul de la médae : l est auss possble de détermer la médae à l'ade des polygoes des effectfs cumulés (vor TD) Rq : Proprétés de la médae : La médae est la valeur du caractère qu est la plus proche de toutes les autres. C'est celle qu mmse les dstaces e valeur absolue : Σ x - x méd est mmum s et seulemet s x méd est la médae du caractère X 6..4 Quatles : Mesures de posto statstque e référece à la médae Il a été vu précédemmet que la médae partage la dstrbuto des fréqueces e partes égales. Il est possble de partager ue dstrbuto de fréquece e 4 partes égales (quartles), e 0 partes égales (décles), e 00 partes égales (cetles), e partes égales. 6..4.. Défto des quatles : o appelle quatles les valeurs du caractère qu défsset les bores d'ue partto e classes d'effectfs égaux. 6..4.. Les quartles sot les tros valeurs qu permettet de découper la dstrbuto e quatre classes d'effectfs égaux. O les otes X Q, X Q et X Q3 Représetato des quartles Partto du caractère Fréquece des élémets X m tervalle terquartle 5% X Q ¼ Quartle féreur tervalle terquartle 5% X Q ½ Médae tervalle terquartle 3 5% X Q3 ¾ Quartle supéreur X max tervalle terquartle 4 5% - Q : quartle féreur, 5% des valeurs de la varable lu sot féreures et 75% lu sot supéreures - Q : médae, 50% des valeurs de la varable lu sot féreures et 50% lu sot supéreures - Q : quartle supéreur, 75% des valeurs de la varable lu sot féreures et 5% lu sot supéreures Remarque : X Q est égal à la médae. 6..4.3. Les décles sot les 9 valeurs de X qu permettet de découper la dstrbuto e dx classes d'effectfs égaux. 0 les ote X d...x d9. Représetato des décles Partto du caractère X m X d X d It- /0 It- /0 It-3 Fréquece des élémets 0% 0% 0% X d3 /30.. X d8 /0 It-9 0% X d9 9/0 X max It-0 0% Modher Abrougu Bostatstque «I» ISEFC - 008 4
It-(tervalle terdécle) - D : décle féreur, 0% des valeurs de la varable lu sot féreures et 90% lu sot supéreures - D : 0% des valeurs de la varable lu sot féreures et 80% lu sot supéreures - D3 : 30% des valeurs de la varable lu sot féreures et 70% lu sot supéreures - D4 :. - D5 : médae, 50% des valeurs de la varable lu sot féreures et 50% lu sot supéreures. - D9 : décle supéreur, 90% des valeurs de la varable lu sot féreures et 0% lu sot supéreures 6..4.4. Les cetles sot les 99 valeurs de X qu permettet de découper la dstrbuto e 00 classes d'effectfs égaux. 0 les ote X c...x c99. Remarques Les dfféretes mesures de posto (quartle, décle, ) e sot que des cas partculers des cetles. Les cetles sot doc très utles pour détermer les valeurs des autres mesures de postos Exemple de correspodaces etre mesures de postos Q C5 5 ème cetle Q C50 D50 50 ème cetle Médae Q3 C75 75 ème cetle D C0 0 ème cetle D C0 0 ème cetle D9 C90 90 ème cetle 6..4.5. Calculs des quatles ous ous lmteros aux cas des cetles car ous pouvos faclemet fare des correspodaces avec les autres mesures de postos. 6..4.5.. Détermato des valeurs de la varable à partr d u rag cetle doées. Cα : rag du cetle (le rag est doée, quelle est la valeur de la varable correspodat à ce rag?) a) Cas des doées ragées : α α Cα : rag du cetle : Il correspod à la doée dot le rag est l eter qu sut : s 00 00 α est pas u eter. Das le cas cotrare s 00 α posto (le rag) est a ms chem etre le rag doée par : 00 : ombre total de valeurs das la sére statstque α : le rag du cetle est u eter, Cα correspod à la doées dot la et la posto suvate Modher Abrougu Bostatstque «I» ISEFC - 008 4
Applcato IV.4 Exemples : Sot la sére statstque suvate : 58 ; 59 ; 64 ; 64 ; 64 ; 68 ; 7 ; 7 ; 79 ; 8 ; 8 ; 85 ; 9 ; 9 ; 9 ; 95 - trouver les cetles suvats : C5 ; C40 - trouver les quartles : Q et Q3 Réposes : : 6 - Pour cetle C5 : α 6x5 α 5, le rag de la doée est détermé par la formule, 4 00 00 La valeur est pas u eter, le rag est doc le premer eter suvat,4 as C5 correspod au rag 3, ce derer correspod à la valeur : 64 - Pour cetle C40 (qu correspod au décle 4) : α 6x40 α 0 le rag de la doée est détermé par la formule 6, 4 00 00 La valeur est pas u eter, le rag est doc le premer eter suvat 6,4 as C40 (ou D4) correspod au rag 7, ce derer correspod à la valeur : 7 - Pour cetle C50 ou quartle Q ou la médae (qu correspod au décle 5) : α 6x50 α 50 le rag de la doée est détermé par la formule 8 00 00 La valeur est u eter, Cα correspod à la doées dot la posto (le rag) est a ms chem etre le rag 8 et le rag 9, as Q correspod à la moyee des valeurs du au rag 8 (qu 7+ 79 correspod à la valeur 7) et le rag 9 (qu correspod à la valeur 7) : Q 75 - Pour cetle C75 ou quartle 3: α 6x75 α 75 le rag de la doée est détermé par la formule 00 00 La valeur est u eter, Cα correspod à la doées dot la posto (le rag) est a ms chem etre le rag et le rag 3, as Q3 correspod à la moyee des valeurs du au rag (qu 85 + 9 correspod à la valeur 85) et le rag 3 (qu correspod à la valeur 9) : Q 3 88, 5 b) Cas des doées codesées : La méthode est detque à la précédete, mas l est auss possble de travaller avec les fréqueces relatves. Das le cas de détermato avec les fréqueces, Cα correspod à la premère modalté α α dot la fréquece cumulée dépasse. Das le cas où est u eter, l suffra de chosr le 00 00 ombre à m-chem etre la modalté cocerée et la suvate. Modher Abrougu Bostatstque «I» ISEFC - 008 43
Applcato IV.5 Calculos C69 pour des doées codesées x eff cum f F (freq cum) Chosr C 69 8 8 8 0, 0, calcul avec les effectfs 45 3 0,8 0,9 C 69 49,68 60 4 35 0,9 0,49 calcul avec les fréqueces 80 6 5 0, 0,7 C 69 0,69 95 6 0,5 0,86 97 7 69 0,0 0,96 09 3 7 0,04,00 Somme 7 Pour le calcul avec les effectfs : la formule est la suvate : (7) α 7x69 49,68 00 00 C69 correspod à la modalté occupat le rag 50 das la dstrbuto, elle correspod doc à la valeur 80 Pour le calcul avec les fréqueces : la formule est la suvate : α 69 /00 0,69 00 C69 correspod à la modalté dot la fréquece relatve cumulée dépasse 0,69. Das la dstrbuto, cette fréquece correspod à la valeur 80 c) Cas des doées groupées e classes : La classe coteat Cα correspod à la premère classe où la fréquece cumulée attet ou α dépasse, par référece à la formule du calcul de la médae (vue précédemmet) l est possble 00 d écrre la formule suvate de Cα α Fcα C α Bcα + ( 00 ) Lcα Fcα Où : Bcα : Bore féreure de la classe coteat cα Fcα - : Fréquece relatve cumulé de la classe qu précède la classe coteat cα Fcα : Fréquece relatve de la classe coteat cα. Lcα : largeur, ampltude de la classe coteat cα Modher Abrougu Bostatstque «I» ISEFC - 008 44
Applcato IV.6 Calculer C80 des classes suvates : lmtes féreures des classes (cm) m eff cum f F (freq cum) 30 35 0,903 0,90 40 45 0 3 0,505 0,344 50 55 4 56 0,5806 0,60 60 65 77 0,58 0,88 70 75 88 0,88 0,946 80 85 5 93 0,05376,000 Somme 93,00000 α La classe coteat Cα (C80) est la premère classe où F > 80 /00 0, 80 00 C80 correspod à la classe [60-70[ Calcul de la valeur de la modalté correspodat à C80 α Fcα C α Bcα + ( 00 ) Lcα Fcα Bcα : Bore féreure de la classe coteat C80 60 cm Fcα - : Fréquece relatve cumulé de la classe qu précède la classe coteat C80 0,88 Fcα : Fréquece relatve de la classe coteat C80 0,58 Lcα : largeur, ampltude de la classe coteat C80 30-4050-40 0cm A (applcato umérque) 80 0,88 C80 60 + ( 00 )0 68, 769cm 0,58 6..4.5.. Détermato du rag cetle à partr d ue valeur doée de la varable. Cet détermato est le processus verse par rapport aux élémets précédet du paragraphe : 5..4.5.., ce qu cosste à recherche Cα pour ue valeur cou X d ue sére statstque X. a) Cas des doées ragées ou codesées Il sufft de calculer smplemet le pourcetage des doées féreures à la valeur (ou observato) doée. Modher Abrougu Bostatstque «I» ISEFC - 008 45
Applcato IV.7 Exemple : sére ordoée crossate Das les valeurs de la glycéme de la sére statstque suvate trouver le cetle Cα de la valeur 0,96g/l : 0,6 g/l; 0,6 g/l; 0,65 g/l; 0,7 g/l; 0,7 g/l; 0,7 g/l; 0,7 g/l; 0,74 g/l; 0,75 g/l; 0,75 g/l; 0,76 g/l; 0,78 g/l; 0,78 g/l; 0,8 g/l; 0,8 g/l; 0,83 g/l; 0,83 g/l; 0,84 g/l; 0,84 g/l; 0,84 g/l; 0,9 g/l; 0,96 g/l;,0 g/l;,0 g/l;, g/l;, 5 g/l;,6 g/l;,8g/l ;,g/l. Il s agt de trouver le pourcetage des doées dot la valeur de la glycéme est féreure à 0,96g/l : Cette valeur est à la postos ( ème valeur de la sére ordoée de faço crossate), l y a valeurs de la glycéme féreures à 0,96g/l sur u total de 9 valeurs ( 9),le pourcetage est doc de : 00 Χ ( ) 7,4%, as le rag cetle Cα de la valeur de la glycéme de 9 0,96g/l est de 7 (la valeur de 0,96g/l de glycéme correspod au cetle C7) Applcato IV.8 Exemple : tableau de dstrbuto codesée Das le tableau de dstrbuto des valeurs de la glycéme suvate trouver le cetle Cα de la valeur,g/l : x (g/l) 0,6 0,65 0,7 0,75 0,8 0,85 0,9 0,95,05,,5, 8 4 6 3 3 8 6 4 0 8 (cum) 8 0 44 70 0 34 6 88 09 33 53 7 8 Il s agt de trouver le pourcetage des doées dot la valeur de la glycéme est féreure à,g/l : Cette valeur est à la 53 postos (53 ème valeurs des effectfs cumulés), l y a 33 valeurs de la glycéme féreures à,g/l sur u total de 8 valeurs ( 8), le pourcetage est doc de : 33 00 Χ ( ) 8,6%, as le rag cetle Cα de la valeur de la glycéme de,g/l est de 8 8 (au mos 8% des valeurs de la glycéme sot féreures à,g/l). b) Cas des doées ragées e classes Le rag cetle Cα d ue doée (ou observato) est obteu par la formule suvate x b r r 00 ( ) fr + Fr Lr Xr : la doée dot o recherche le rag cetle Cα br : bore féreure de la classe coteat Xr Lr : largeur de la classe coteat Xr fr : fréquece relatve de la classe coteat Xr Fr- : fréquece relatve cumulée de la classe qu précède la classe coteat Xr Modher Abrougu Bostatstque «I» ISEFC - 008 46
Applcato IV.9 Exemple : tableau de dstrbuto groupé e classes Das le tableau de dstrbuto des valeurs de la glycéme suvate trouver le cetle Cα de la valeur,g/l : x (g/l) [0,6-0,7[ [0,7-0,8[ [0,8-0,9[ [0,9-,0[ [,0-,[ [,-,[ [,-,3[ [,3-,4[ [,4-,5[ somme 0 8 6 8 9 5 0 08,00 f 0,0 0,09 0,3 0,3 0,4 0, 0,0 0,0 0,0,00 (cum) 0 38 64 9 46 67 87 08 F cum 0,0 0,8 0,3 0,44 0,58 0,70 0,80 0,90,00 Recherchos les rags cetle des valeurs de la glycéme suvate : 0,8g/l ;,g/l et,8g/l * Pour la valeur de la glycéme de 0,8g/l 0,8g/l se stue das la classe [0,8-0,9[, le rag cetle de 0,8g/l est l eter féreur à : x b r r 00 ( ) fr + Fr Lr Xr : la doée dot o recherche le rag cetle Cα 0,8 br : bore féreure de la classe coteat Xr 0,80 Lr : largeur de la classe coteat Xr 0, fr : fréquece relatve de la classe coteat Xr 0,3 Fr- : fréquece relatve cumulée de la classe qu précède la classe coteat Xr0,8 Applcato umérque 0,8 0,8 00 ( )0,3 + 0,8 9,3 0, Le rag cetle de 0,8g/l est 9, as au mos 9% des doées sot féreures à 0,8g/l * Pour les valeurs de la glycéme de,g/l et,8g/l Elles sot les se stuées das la classe [,-,[, le rag cetle de,g/l et,8g/l est l eter féreur à : x b r r 00 ( ) fr + Fr Lr Xr : la doée dot o recherche le rag cetle Cα, br : bore féreure de la classe coteat Xr, Lr : largeur de la classe coteat Xr 0, fr : fréquece relatve de la classe coteat Xr 0, Fr- : fréquece relatve cumulée de la classe qu précède la classe coteat Xr0,58 Applcato umérque,, 00 ( )0, + 0,58 60,4 0, Le rag cetle de,/l est 60, as au mos 60% des doées sot féreures à,/l Modher Abrougu Bostatstque «I» ISEFC - 008 47
Le rag cetle de,8/l est 67, as au mos 67% des doées sot féreures à,8/l Calcul de Cα Valeurs Valeurs Valeurs Xr : la doée dot o recherche le rag cetle Cα 0,8,,8 br : bore féreure de la classe coteat Xr 0,8,, Lr : largeur de la classe coteat Xr 0, 0, 0, fr : fréquece relatve de la classe coteat Xr 0,3 0, 0, Fr- : fréquece relatve cumulée de la classe qu précède la classe coteat Xr 0,8 0,58 0,58 xr-br 0,0 0,0 0,08 (xr-br)/lr 0, 0, 0,8 ((xr-br)/lr)xfr 0,03 0,04 0,096 (((xr-br)/lr)xfr)+fr- 0,93 0,604 0,676 (((xr-br)/lr)+fr-)x00 9,3 60,4 67,6 Cα 9 60 67 6..5. Moyee et médae Quad o modfe les valeurs extrêmes d'ue sére, la moyee chage cotraremet à la médae qu e chage pas. O dt que la moyee est "sesble aux valeurs extrêmes". Il arrve que certaes de ces valeurs extrêmes soet douteuses ou fluet de faço exagérée sur la moyee. O peut alors, sot calculer ue moyee élaguée (c'est à dre recalculer la moyee sas ces valeurs gêates), sot utlser la médae. Commet terpréter u écart etre la moyee et la médae? Sot la sére suvate : 8 9 0 Ic la moyee et la médae sot detques : la sére est be "cetrée". Sot la ouvelle sére : 8 9 0 4 Ic la moyee est plus mportate que la médae : la sére est plus "étalée à drote". 6..6. Avatages et covéets des dfféretes valeurs cetrales : Le statstce Yule (XIXème sècle) a déf sx proprétés souhatables pour les valeurs cetrales. Le tableau c-dessous permet de motrer les avatages et covéets des tros valeurs cetrales (Mode, Médae, Moyee arthmétque) Proprétés Mode Médae Moyee ) est défe de faço objectve + + + ) déped de toutes les valeurs observées - - + 3) a ue sgfcato cocrète + + - 4) est smple à calculer + + + 5) est peu sesble aux fluctuatos de l'échatllo - + - 6) se prête au calcul algébrque - - + Tableau 3 : Avatages et covéets des tros valeurs cetrales (proprété + réalsée, - o réalsée) 6.. Paramètre de dsperso Dsperso statstque : O appelle dsperso statstque, la tedace qu'ot les valeurs de la dstrbuto d'u caractère à s'étaler, à se dsperser, de part et d'autre d'ue valeur cetrale. O Modher Abrougu Bostatstque «I» ISEFC - 008 48
dstgue la dsperso absolue (mesurée das l'uté de mesure du caractère) et la dsperso relatve (mesurée par u ombre sas dmeso). 6... Les paramètres de dsperso absolue Les paramètres de dsperso absolue dquet de combe les valeurs d'ue dstrbuto s'écartet e gééral de la valeur cetrale de référece. U paramètre de dsperso absolue s'exprme toujours das l'uté de mesure de la varable cosdérée. Les quatre paramètres de dsperso absolue les plus courats sot : - l'étedue, - l'tervalle ter quatle (écarts ter quatles), - l'écart absolu moye - l'écart type. 6... L étedue de la varato: l'étedue d'ue dstrbuto est égale à la dfférece etre la plus grade et la plus pette valeur de la dstrbuto : Etedue de X Xmax - Xm Plus l étedu est grade plus les valeurs sot dspersées. Exemple : l'étedue est doée par la valeur mmale et la valeur maxmale : das le cas de l'exemple précédet l s'agt de la dfférece : 4 mm - 4 mm 0 mm La moyee et la médae sot les estmateurs statstques du cetre d ue dstrbuto a) cas de doées ragées : L étedu de la dstrbuto de la sére statstque : 0,5 g/l; 0,58 g/l; 0,65 g/l; 0,7 g/l; 0,7 g/l;.;, 5 g/l;,6 g/l;,8g/l ;,g/l. La plus grade valeur est:,g/l La plus pette valeur est :0,6g/l L étedue de la varato :,-0,5 0,7 b) cas de doées groupées e classes : [0,6-0,7[ [0,7-0,8[ [0,8-0,9[ [0,9-,0[ [,0-,[ [,-,[ [,-,3[ [,3-,4[ [,4-,5[ La derère classe a comme bore supéreure,5 La premère classe a comme bore féreure 0,6 L étedue de la varato est :,5 0,6 0,9 6... Quartle et tervalle terquartle : Mesures de la dsperso statstque e référece à la médae 6... L'tervalle terquartle est l'étedue de la dstrbuto sur laquelle se trouvet cocetrée la moté des élémets dot les valeurs de X sot les plus proches de la médae. O exclut alors de la dstrbuto les 5% des valeurs les plus fables et les 5 % des valeurs les plus fortes de X. Cet tervalle se ote:(x q3 -X q ). Modher Abrougu Bostatstque «I» ISEFC - 008 49
6... L'tervalle ter-décle est l'étedue de la dstrbuto sur laquelle se trouvet cocetrés 80% des élémets dot les valeurs de X sot les mos dfféretes de la médae. O exclut alors de la dstrbuto les 0 % des valeurs les plus fables et les 0% des valeurs les plus fortes. Il se ote (X d9 -X d ). 6...3. Mesures de la dsperso statstque e utlsat l écart sem-terquartle Cet écart mesure la moté de l étedue de la moté cetrale des doées Il est calculé selo la formule suvate : APPLICATIO V : Q Q 3 Q75 Q5 Q Applcato V. (calculos l écart sem-terquartle) - Cas : Doées ragées Le tableau de dstrbuto obteu par Excel Rag 3 4 5 6 7 8 9 0 Varables 0 3 33 34 36 36 39 40 43 0 Moyee 33,3 Mode 36 Q 3,5 Q3 38,5 Médae Q 35 Q arrod 3 Q3 arrod 39 Sem Iterquartle 3,54 9,8 < 50% des valeurs < 36,8 Rappel Q correspod à la doée dot le rag est l eter qu sut la formule α Cα : rag du cetle : Il correspod à la doée dot le rag est l eter qu sut : 00 Q et Q 3 correspodet respectvemet au C 5 et C 75 Calculs : 0 (ombre de doées pour le caractère étudé), la Moyee 33,3 α - Pour rechercher la doée correspodat au Q, (au cetle 5), l sufft de calculer 00 0x5,5 de predre l approxmato supéreure ce qu correspod au 3 ème rag et doc à la 00 doée 3 α - Pour rechercher la doée correspodat au Q3, (au cetle 75), l sufft de calculer 00 0x75 7,5 00 doée 39 Doc : Q de predre l approxmato supéreure ce qu correspod au 8 ème rag et doc à la Q Q Q 39 3 Q 4 (sur Excel 3,5) 3 75 5 Iterprétato : Coteu de la valeur de la moyee 33,3 l y statstquemet 50% des valeurs de la sére umérque comprse etre 9,8 et 36,8 Moyee Q < 50% des valeurs < et Moyee + Q Modher Abrougu Bostatstque «I» ISEFC - 008 50
- Cas : Doées codesées : Varables 40 45 48 5 56 58 66 70 Total (effectf) 8 6 4 6 8 5 8 7 Cumulé 8 4 6 50 76 04 9 7 x 30 70 576 48 456 64 990 560 7044 Total eff 7 Moyee 55,46 Mode 8 Calcul des Quartles (par méthode des cetles) Cetle Rag Rag Arrod > Quartles Valeurs Q C > 5 3,75 3 Q 5 Q3 C > 75 95,5 96 Q3 58 Q C > 50 63,5 Q Médae 56 Sem Iterquartle 3 5,46 < 50% des valeurs < 58,46 Calculs : 7 (ombre de doées pour le caractère étudé), 8 + 6 + + +8 7, la Moyee 7044/7 55 α - Pour rechercher la doée correspodat au Q, (au cetle 5), l sufft de calculer 00 7x5 3,75 de predre l approxmato supéreure ce qu correspod à la valeur cumulée 50, 00 (l sufft de chosr das les effectfs cumulés la valeur qu est supéreure à 3,75 ce qu correspod à la valeur cumulée 50) pus par correspodace détermer la varable qu correspod à cette valeur cumulée. As la valeur cumulée 50 correspod à la varable 5 > Q (cetle 5) 5 - Pour rechercher la doée correspodat au Q3, (au cetle 75), l sufft de calculer : α 7x75 95, 5 00 00 Pus, de predre l approxmato supéreure, ce qu correspod à la valeur cumulée 04, (l sufft de chosr das les effectfs cumulés la valeur qu est supéreure à 95,5 ce qu correspod à la valeur cumulée 04) pus par correspodace détermer la varable qu correspod à cette valeur cumulée. As, la valeur cumulée 04 correspod à la varable 58 > Q3 (cetle 75) 58 Doc : Q Q Q Q 58 5 Q 3 (sur Excel 3) 3 75 5 Iterprétato : Compte teu de la valeur de la moyee 55, l y statstquemet 50% des valeurs de la sére umérque comprses etre 5 et 58 Moyee Q < 50% des valeurs < et Moyee + Q - Cas 3 : Doées groupés e classes : Le calcul de l écart sem-terquartle sera traté par chaque étudat avec le logcel Excel. Pour cela, utlser les valeurs du tableau de dstrbuto des valeurs de la glycéme de l Applcato IV.9 Modher Abrougu Bostatstque «I» ISEFC - 008 5
6...4. Mesures de la dsperso statstque e référece à la moyee arthmétque 6...4.. Ecart absolu moye ou Ecart Moye Absolu «EMA»: Ce paramètre est la moyee arthmétque de la valeur absolue des écarts à la moyee. Il correspod à la moyee des valeurs absolues de chaque doée par rapport à la moyee. a) Doées ragées : L écart absolu moye est la moyee des dstaces mesurées postvemet (e valeur absolue) etre les doées et la moyee. EMx x x Exemple : Pods (kg) 65 66 67 68 68 69 70 70 7 7 7 7 73 74 74 75 75 75 8 ; Moyee 70,77kg 65 70,77 + 66 70,77 + 67 70,77... + 75 70,77 EMA 0,43 8 L écart absolu moye est fable et les valeurs sot très cocetrées autour de la moyee b) Doées ragées : le calcul de EMA s exprme par les formules suvates : EMx x x ce qu équvaut avec les fréqueces à la formule EMx f x x b) Doées groupées e classes : le calcul de EMA s exprme par l ue des 4 formules suvates : EMx x x ou EMx m x EMx f x x ou EMx fm x 6... Varace et écart-type : La varace et écart-type servet à évaluer la dsperso d ue dstrbuto autour d'ue valeur cetrale, la moyee. Modher Abrougu Bostatstque «I» ISEFC - 008 5
Applcato V. : (dstrbuto stadardsée ou o?) Sot deux séres de mcroscopes produts das deux uses dfféretes. ous désros juger de la stadardsato de chacue des deux séres. Je choss de comparer le pods maxmal de chaque mcroscope. - s les écarts à la moyee sot fables la producto est stadardsée - s les écarts à la moyee sot élevés, la producto est peu stadardsée a - Varace : La varace, otée (σ x ) ² est la moyee du carré des écarts à la moyee. (δ x ) ( x x) La varace 'est pas u paramètre de dsperso absolue mas plutôt ue mesure globale de la varato d'u caractère de part et d'autre de la moyee arthmétque (quatté d'formato). Pour obter u paramètre de dsperso absolue, o effectue la race carrée de la varace, appelé écart-type et que l'o ote σx La varace pour des doées ragées ou groupées e classe devet : (δ x ) ( x x) Ou désge les effectfs de chaque doée ou de chaque classe b - Ecart-type : L'écart type, oté σx est la race carré de la moyee du carré des écarts à la moyee, c'est à dre la race carrée de la varace. Modher Abrougu Bostatstque «I» ISEFC - 008 53
δ x (δ x ) ( x x) L'écart-type est ue mesure de dsperso par rapport à la moyee qu tègre les valeurs algébrques des écarts à la moyee et qu pourra, à ce ttre être rétrodute das des calculs algébrques ultéreurs. Elle présete de plus l'avatage d'avor ue sgfcato probablste que e possède pas l'écart absolu moye. La théore des probabltés permet e effet d'estmer la chace qu à ue valeur d'être élogée de la moyee de plus d'u certa ombre d'écart-types. Lorsqu'ue dstrbuto est gaussee (o dt auss "ormale") les probabltés de trouver les valeurs a ue dstace doée de la moyee sot les suvates : 68.3 % des valeurs sot comprses etre (x-σ x ) et (x-σ x ) 95.5 % des valeurs sot comprse etre (x-σ x ) et (x+σ x ) 99.7 % des valeurs sot comprses etre (x-3σ x ) et (x+3σ x ) Fgure 5: Représetato graphque d ue dstrbuto «ormale» (Lo de Gauss ou Lo ormale) L'écart-type pour des doées ragées ou groupées e classe devet : δ x (δ x ) ( x x) Modher Abrougu Bostatstque «I» ISEFC - 008 54
B : sur des échatllos de fable talle (<30), o utlse l'écart-type modfé, sot e dvsat par - au leu de (les calculatrces le fot automatquemet). Fgure 6: Destés de los gaussees ayat ue même varace mas des moyees dfféretes Fgure 7 : Destés de los gaussees ayat ue même moyee mas des varaces dfféretes Modher Abrougu Bostatstque «I» ISEFC - 008 55
Modher Abrougu Bostatstque «I» ISEFC - 008 56 c- Smplfcato des écrtures des varaces (respectvemet des écart-types) La formule de la varace peut être remplacée par ue formule plus facle à utlser (formule pratque de calcul) à savor : x x x ) ( ) (δ x x x ) ( ) ( δ Démostrato : Rappel : (a-b) a - ab + b de même ) ( x xx x x x + as + x xx x x x ) ( ) ( du fate que la moyee est ue costate, la formule peut s écrre : ) ( ) ( x x x x x xx x x x + + Or : x x l sufft alors de le remplacer par sa valeur das la derère expresso : ) ( ) ( + + x x x x x x x x x x ) ( x x x x x x x x x + + ) ( ) ( x x x x as x x x x ) ( ) (
Pour des doées codesées la formule pratque de calcul devet : x ( x) ce qu équvaux à x ( x) x x Atteto Remarque Das le cas d u échatllo la formule de la varace devet : ( x x) x ( x) Seule la valeur du déomateur commu est remplacée par - 6... Les paramètres de dsperso relatve La comparaso des paramètres de dsperso absolue de deux caractères 'a de ses que s les deux caractères sot de même ature et de même ordre de gradeur. Das le cas cotrare, la comparaso 'est possble qu'e ayat recours à des mesures de dsperso relatve, c'est à dre e effectuat le rapport etre u paramètre de dsperso absolue et la valeur cetrale qu lu tet de référece. U paramètre de dsperso relatve est ue mesure de l'écart relatf des valeurs d'ue dstrbuto à ue valeur cetrale. C'est doc le rapport d'u paramètre de dsperso absolue dvsé par ue valeur cetrale. O obtet u ombre sas dmeso qu peut être exprmé e %. Dsperso relatve Paramètre de dsperso absolue/valeur cetrale - le coeffcet terquartle relatf (X q3 -X q )/ médae X - l'écart moye relatf E.A.M. / X - le coeffcet de varato σ x / X Remarque très mportate : Le calcul d'u paramètre de dsperso relatve 'est possble que pour les caractères quattatfs postfs (toutes les modaltés sot des ombres postfs). Modher Abrougu Bostatstque «I» ISEFC - 008 57
Explcato des paramètres de dsperso relatve pour la varace et l écart-type : Ces deux mesures de dsperso (varace et écart-type) sot des gradeurs de même ordre de la varable étudée : l s'agt d'ue mesure de dsperso absolue or pour comparer des séres dfféretes, l faut élmer l'uté de mesure af d'obter ue mesure de dsperso relatve o utlse alors le coeffcet de varato exprmé e % : Cv 00 δ x Plus le coeffcet de varato est fable, plus la dsperso est fable. 6.3 Exercces d Applcatos avec explctato et utlsato du logcel Excel APPLICATIO VI Applcato VI. - Exemple : Sot u tableau de doées ssu d'ue écropole : ombre total ombres d'objets ombre de tombes d'objets 44 3 5 45 4 0 80 5 9 45 - Calculez : a Le ombre moye d'objets par tombe b Le ombre méda d'objets par tombe c L écart-type du ombre d'objets d Le coeffcet de varato - Tracez l'hstogramme Répose : - Calculs a- Le ombre moye d'objets par tombe, revet à rechercher la moyee arthmétque : elle est égale au ombre total d'objets dvsé par le ombre total de tombes, sot X 5/67 3, objets par tombe b- Le ombre méda d'objets par tombe : revet à rechercher la médae das ue sére mpare de type ( p + ), la tombe de rag p +, sot la 34ème tombe doe ce ombre méda, sot 3 objets par tombe M 3 : la moté des tombes possèdet de à 3 objets et la moté de 3 à 5 objets. Explctato des calculs : Calculos le ombre de tombes 67 tombes Recherchos le rag (67+)/ 34 ème tombes Retrouvos le ombre d'objets das la 34 ème tombe Pour ce fare l est possble de calculer les effectfs cumulés des tombes ombres d'objets ombre de tombes Effectfs cumulés de tombes 3 3 5 38 4 0 58 5 9 67 Il y a 3 objets de la 3 ème tombe à la 38 ème tombe. Doc das la 3 ème tombe l y a 3 objets. La médae est doc égale à 3 objets par tombe. Modher Abrougu Bostatstque «I» ISEFC - 008 58
c- l'écart-type du ombre d'objets : δ L écart type est la race carrée de la varace, calculos la varace - La varace (δ ) est égale à la somme des dfféreces au carré etre le ombre d'objets de chaque tombe et le ombre moye d'objets dvsée par le ombre total de tombes : δ ((-3,)+ x ((-3,))+ 5 x ((3-3,))+ 0 x ((4-3,))+ 9 x (5-3,))) / 67 4,84 + 3,68 + 0,6 +,8 + 9,6 / 67 79,08 / 67,8 L écart type est doc δ,8,08 objets d- Le coeffcet de varato exprmé e pourcetage est égal à 00 fos l'écart-type dvsé par la moyee : Cv 00 x (,08/ 3,) 33,75 % Ce coeffcet motre ue fable dsperso des valeurs autour de la moyee. Exemple de tableau obteu sur Excel ombre d'objets (x) ombre de tombes (p) Effectfs cumulés des tombes Total partel des objets (px) (x-x) (x-x) p(x-x) -, 4,88 4,88 3 44 -,,46 3,5 3 5 38 45-0, 0,04 0,65 4 0 58 80 0,79 0,63,5 5 9 67 45,79 3, 8,87 Total des tombes 67 Total des objets 5 Somme 79,07 Moyee (objets / tombe) 3, Varace,8 Médae (objets / tombe) 3 Ecart-type (objet),09 Cœff. de varato 33,85% Applcato VI. - Exemple Le ombre d'ossemets coservés a été eregstré pour dx stes : ste : 0 ste 6 : 5 Calculez successvemet pour les stes à 0 pus à 9 ste : 50 ste 7 : 3 - Le ombre moye d'ossemets par ste ste 3 : 07 ste 8 : 903 - Le ste méda de la dstrbuto - L'écart-type ste 4 : 355 ste 9 : 535 - Le coeffcet de varato ste 5 : 983 ste 0 : 663 - Trer des coclusos Elémets de répose : Pour calculer la médae mauellemet: l faut ordoer les séres e focto du ombre d ossemets. ombre d'ossemets Séres classées par ordre d ossemets crossat - Pour les 0 séres (ombre pare de séres) : Le rag est etre 5 et 6 sot la médae (07+5)/ 9 ossemets 3 S7 Rag 355 S4 Rag 50 S Rag 3 903 S8 Rag 4 07 S3 Rag 5 5 S6 Rag 6 0 S Rag 7 335 S9 Rag 8 983 S5 Rag 9 663 S0 Rag 0 - Pour les 9 séres (ombre mpare de séres) : Le rag est (9+)/ sot 5, la médae correspodate est doc 07 ossemets Modher Abrougu Bostatstque «I» ISEFC - 008 59
Elémets de correcto e utlsat Excel Séres x ombre de séres 0 S 0 Somme 8500 S 50 Médae 9 S3 07 Moyee 850 S4 355 Varace 486796,44 S5 983 Ecartype 498,6 S6 5 Coeff. Varato 7,9% S7 3 ombre de séres 9 S8 903 Somme 869 S9 535 Médae 07 S0 663 Moyee 38,78 Varace 94549,9 Ecartype 97,33 Coeff. Varato 73,73% Modher Abrougu Bostatstque «I» ISEFC - 008 60
APPLICATIO VII : Approfodssemet EXEMPLE DE CALCULS PAR CHAGEMET D ORIGIE * Calcul de la moyee par chagemet d orge et d uté. Das certas cas la recherche de la moyee d ue sére statstque etraîe des calculs lourds et fastdeux. Das de telles stuatos, l est cosellé, vore utle, d effectuer u chagemet de varable (ou de code) permettat d accélérer et de smplfer le calcul. Ce chagemet peut à la fos toucher l orge et l uté. Par exemple l est possble d effectuer ue trasformato léare de la forme y ax + b L objectf est de rechercher la melleure valeur de x pour smplfer au meux les calculs. - La méthode des ζ (lre ks) das le cas de doées répartes e classes (Par commodtés d écrture ζ peut être remplacé par la lettre u, ou autres lettre (l sufft juste de le précser)) Das cette méthode y ζ ax+b et les paramètres a et b de la trasformato sot xo choss de faço à ce que ζ x Avec : * est le paramètre «a» de la trasformato y ax + b ; * est la largeur de la classe (valeur séparat les valeurs cetrales de classes cosécutves) xo * - est le paramètre «b» de la trasformato y ax + b ; * xo est la valeur cetrale de la classe cetrale xo x Avec m x est la valeur cetrale de chaque classe m xo est la valeur cetrale de la classe cetrale x xo Cette formule ζ peut auss être écrte ζ ou ecore mx mxo ζ Explctato et avatage de la trasformato selo la méthode des ζ ( lre ks) E effectuat la trasformato réalsées sur la dstrbuto tale : mx mxo ζ deux opératos sot smultaémet Opérato : Ue traslato de la courbe tale sur l axe des x qu amèera le sommet approxmatvemet au veau de l orge des coordoées. Ce déplacemet est obteu e retrachat ue même valeur xo de chacue des mesures Modher Abrougu Bostatstque «I» ISEFC - 008 6
Opérato : ue cocetrato de la dstrbuto des mesures autour de la moyee, pusque toutes les dfféreces x-xo sot dvsées par (qu correspod à la largeur de la classe). Explctato graphque Avat traslato Après traslato 0 8 6 4 0 8 6 4 0 35 45 55 65 75 85 95,8,6,4, 0,8 0,6 0,4 0, 0-3 - - 0 3 Calcul des valeurs de ζ Avec cette derère formule dfféretes valeurs de ζ. ζ mx mxo, pour chaque x l est alors possble de calculer les Dfférets calcul de x Pour rever à x l suffra doc de coaître, xo et ζ de partr de la formule suvate x xo ζ et de calculer x ζ + xo - Pour calculer la moyee µ x(x ) : La moyee des ζ se calcule selo la formule µζ Ce qu est recherché ce est pas la µζ mas la moyee Il faut doc rever au système tal : x xo ζ S l est facle de compredre que ζ µ x µx xo µζ C'est-à-dre que la moyee d u échatllo d ue populato x peut-être calculée selo l équato suvate : µ x µζ + xo * Pour calculer la varace V (δ ) et l écart-type δ : Selo le même prcpe Vx est calculé selo la formule suvate : Modher Abrougu Bostatstque «I» ISEFC - 008 6
(δ x ) Vx (δζ) Vζ (pour des commodtés d écrture ζ est parfos remplacée par u) ( Vζ δζ ) ( ζ µζ ) Pour les doées ragées e classes : ( Vζ δζ ) ( ζ µζ ) L écart-type est obteu de la faço suvate : δx Vx Vζ Explctato avec exemple : Calculez la moyee de la sére suvate avec ue trasformato selo x u + xo 0u + 65 Classes 30-40 40-50 50-60 60-70 70-80 80-90 90-00 (effectfs respectfs) 3 0 5 8 5 0 Elémets de correcto : Les calculs sot reportés das le tableau suvat : Classes 30-40 40-50 50-60 60-70 70-80 80-90 90-00 m (mleu des classes) 35 45 55 65 75 85 95 (effectfs respectfs) 3 0 5 8 5 0 x m 3405 450 735 0970 765 850 390 ζ (ks) -3 - - 0 3 x ζ -9-0 -5 0 5 0 6 chagemet des 0,3,5,8,5 0, Formules et applcatos umérques ζ (3+0+5+8+5+0+) 73 (dstace terclasse) 45-35 55-45 95-85 0 xo m Chox de la classe :[60-70[ 65 65 Equato y ax+b a/0, ; b-xo/ 65/06,5 Y 0,X- 6,5 Y 0,X- 6,5 mx mxo ζ 35 65 45 65 55 65 65 65 ; ; ; ;... 0 0 0 0-3 ; - ; - ; 0 ; ; ; 3 ζ (-9-0-5+0+5 +0+6) -3 Moyee µζ ζ x µζ + xo -3/73-0,0409589 Moyee µ -0,0409589x0 +65 64,58904 Modher Abrougu Bostatstque «I» ISEFC - 008 63
Ue correcto avec calcul et graphe est auss foure sur le fcher Excel des correctos Exemple : Calculer la moyee, la varace et l écart-type de la sére statstque suvate : Elémets de soluto ζ classe 00-50 5 50-300 0 300-350 38 350-400 5 400-450 (5+0+38+5+) 09 (dstace terclasse) 50-00 450-400 50 xo m Chox de la classe :[300-350[ 35 35 a//500.0 ; b-xo/ 35/506,5 Equato y ax+b mx mxo 35 y x 0,0x - 6,5 y 0,0x 6, 5 50 50 5 35 75 35 35 35 375 35 45 35 ; ; ; ; ζ 50 50 50 50 50 - ; - ; 0 ; ; ζ (-30-0+0+5+) -3 ζ Moyee : µζ -3/09-0,07594 Moyee Vζ x µζ + xo µ -0,07594x50+35 33,6385 Varace de ζ ( δζ ) ( ζ µζ ) (δ x ) Vx (δζ) 5 ( ( 0,075) 0 ( ( 0,075) + 09 09 48,97/09 +...,366497 Vζ 50x50x,366497 345,5374 δx Vx Vζ 345,5374 58,445993 Modher Abrougu Bostatstque «I» ISEFC - 008 64
Méthode avec chagemet de varable : x u + xo 50u + 35 classe cetre des x u u u-u (u-u) (u-u) 00-50 5 5 50 - -30 -,97 3,89066 58,3599 50-300 0 75 50 - -0-0,97 0,9457 8,94 300-350 38 35 50 0 0 0,07 0,00075 0,0878 350-400 5 375 50 5,07,05580 6,3950 400-450 45 50,07 4,084 45,93 Somme 09-3 48,97 Moyee u -0,07594 Moyee x 33,6385 Vu,366497 Vx 345,5374 Ecart-type x 58,445993 Astuces : Das la pratque, lors de l utlsato de la méthode des ζ l sufft drectemet : / d affecter la valeur 0 das la coloe des ζ à la classe la plus cetrale. Esute à partr de ce 0 cetral d affecter les valeurs -, -,-3,, - das valeurs ζ des classes plus fables et +, +,+3,, + das les valeurs ζ des classes plus fortes. / d effectuer les produts de ζ par les effectfs des classes ; 3/ pour le calcul de la moyee µζ, de fare le total des de ζ et de les dvser par l effectf total. 4/ d utlser les formules pour le calcul des moyees, des varaces et des écart-types Modher Abrougu Bostatstque «I» ISEFC - 008 65
6.3. Paramètres de forme Ces paramètres permettet de précser la forme de la dstrbuto expérmetale. Ils affet la descrpto de la dstrbuto d ue varable et faclte la comparaso de pluseurs dstrbutos expérmetales. Les paramètres de forme que ous aborderos sot : () le coeffcet d asymétre l permet de ous reseger sur la faço régulère ou o dot les observatos se répartsset de part et d autre d ue valeur cetrale. () le coeffcet d aplatssemet dot l objet et de fare apparaître s ue fable varato de la varable etraîe ou o ue forte varato des fréqueces relatves. Remarque O dt qu ue varable est u-modale s sa dstrbuto e présete qu u maxmum, bmodale s elle e présete deux. 6.3.. Coeffcet d asymétre et de dérve Le coeffcet d asymétre resege sur l asymétre et évetuellemet la dérve par rapport à ue valeur cetrale chose. La dstrbuto d ue varable est symétrque s les observatos sot égalemet dspersées de part et d autre d ue valeur cetrale. As, das le cas de dstrbutos symétrques, moyee et médae sot cofodues, so elles sot dstctes. Fgure 8 : Exemple de dstrbutos symétrque et de dssymétre 6.3... Coeffcet d asymétre Ce coeffcet mesure l'asymétre d'ue dstrbuto, l resege sur ue asymétre égatve (dssymétre à gauche), ou ue asymétre postve (dssymétre à drote), c'est-à-dre l précse s la répartto "peche" d'u côté ou de l'autre. Selo la valeur cetrale chose (mode, médae ou moyee arthmétque), l exste dfféretes maères de caractérser et de mesurer ue dssymétre. Modher Abrougu Bostatstque «I» ISEFC - 008 66
Astuce : - Das le cas d ue dssymétre postve o a gééralemet (parte drote plus logue que la parte gauche) : Mo (Mode) < Md (Médae) < µ (Moyee) - Das le cas d ue dssymétre égatve o a gééralemet (parte gauche plus logue que la parte drote) : Mo (Mode) > Md (Médae) > µ (Moyee) Fgure 9 : Exemple de dssymétre à drote (dstrbuto étré à drote et oblque à gauche) - Les coeffcets d asymétre de Yule, s la valeur cetrale chose est la médae : Yule propose ue mesure de l asymétre e comparat l étalemet vers la gauche et l étalemet vers la drote, tous deux repérés par la posto des quartles (Q, Médae (Q) et Q3) s ( Q 3 ( Q 3 Q) ( Q Q) + ( Q Q ) Q ) S : S 0 symétre parfate S > 0 oblque à gauche (ou étalemet à drote) dssymétre à drote S < 0 oblque à drote (ou étalemet à gauche) dssymétre à gauche - Les coeffcets d asymétre de Pearso, s les valeurs cetrales choses sot le mode et la moyee. Pearso propose deux coeffcets : a) le premer coeffcet d asymétre de Pearso aalyse la posto de deux valeurs cetrales (le mode et la moyee arthmétque) relatvsée par la dsperso de la sére : p µ Mode δ Mode Médae Moyee S : p 0 symétre parfate p > 0 oblque à gauche (ou étalemet à drote) dssymétre à drote p < 0 oblque à drote (ou étalemet à gauche) dssymétre à gauche Remarque : ce coeffcet est plutôt performat pour des dstrbutos fablemet asymétrques. b) le secod coeffcet d asymétre de Pearso ( β ) est plus élaboré : l s appue sur le calcul des momets cetrés. Il s écrt : β µ µ 3 3 Où µ m 3m m + m et 3 3 µ m m s 3 Avec m x x ; m x et m 3 x 3 Modher Abrougu Bostatstque «I» ISEFC - 008 67
De faço plus géérale, o a : Momet d ordre r : Momet cetré d ordre r : k r mr x k µ r ( x x) S : β 0 symétre β > 0 oblque à gauche (ou étalemet à drote) dssymétre à drote β < 0 oblque à drote (ou étalemet à gauche) dssymétre à gauche - Les coeffcets d asymétre de Fsher, s la valeur cetrale chose est la moyee : Fsher propose u coeffcet qu correspod à la race carrée du coeffcet β de Pearso : Où µ 3 γ 3 δ 3 s u 3 S : γ 0 symétre γ > 0 oblque à gauche (ou étalemet à drote) dssymétre à drote γ < 0 oblque à drote (ou étalemet à gauche) dssymétre à gauche 6.3... Coeffcet de dérve Le coeffcet d asymétre de Fsher calculé c-dessus correspod pour certas auteurs au coeffcet de dérve «d» as µ 3 d γ 3 δ Les coeffcets d et δ sot très sesbles aux fluctuatos d échatlloage, l faudra dsposer d u grad ombre d observatos pour les utlser. r Modher Abrougu Bostatstque «I» ISEFC - 008 68
APPLICATIO VIII Applcato VIII. Reprodure sur Excel ce tableau de dstrbuto et calculer les coeffcets de forme Modher Abrougu Bostatstque «I» ISEFC - 008 69
6.3.. Coeffcet d aplatssemet Le coeffcet d aplatssemet, par référece à la courbe de la lo ormale, dque s la dstrbuto de la varable est leptocurtque (potue), mésocurtque (ormale) ou As, ue dstrbuto est dte aplate s ue forte varato de la varable etraîe ue fable varato de la fréquece relatve (et versemet). Fgure 0 : Hstogrammes llustrat les caractérstques mportates d'ue dstrbuto leptocurtque (potue), mésocurtque (ormale) platycurtque (aplate). Fgure : Courbe avec coeffcet d aplatssemet dfféret Modher Abrougu Bostatstque «I» ISEFC - 008 70
- Coeffcet d aplatssemet de Pearso Il s écrt : µ µ 4 β 4 µ δ 4 Ce coeffcet est toujours supéreur ou égal à. Plus ce coeffcet est fable plus la répartto est aplate (plus la courbe est platcurtque). Plus l est grad, plus les observatos sot plus regroupées autour de la moyee. β pred la valeur 3 pour ue dstrbuto ormale. - Coeffcet d aplatssemet de Fsher Il s écrt : µ 4 µ 4 γ β 3 3 4 µ δ 3 S : γ 0 dstrbuto ormale, l aplatssemet est le m^me que celu de la lo de Gauss rédute γ < 0 la dstrbuto est plus aplate (platcurtque) γ > 0 la dstrbuto est mos aplate (leptocurtque) Modher Abrougu Bostatstque «I» ISEFC - 008 7
Applcato VIII. Utlser les tableaux de dstrbuto suvat et réalser les calculs sur Excel Modher Abrougu Bostatstque «I» ISEFC - 008 7
PARTIE EXERCICES Exercces d applcatos I : Moyee, Médae, Etedue, Quatles Etuder les séres suvates : Sére à étuder Sére A : (rag) valeur : Sére B : (rag) valeur : Sére C : (rag) valeur : Sére D : (rag) valeur : 4.3 9. 8 7 3.85 3.4 9.06 9 3 30 3 33.6 3 3 3 9.09 4 30 4 3.3 5 36 4 36.8 5 3.5 4 34.49 6 36 5 38.9 6 34.7 5 34.9 7 37 8 4 7 34.9 6 35.76 9 4 8 36.6 7 36.73 Questos : Pour chacue des séres détermer : - Quel est l'effectf de cette sére? - Quelle est la médae de cette sére? 3- Quelle est l'étedue de cette sére? 4- Quelle est la moyee de cette sére? 5- Quel est le er quartle de cette sére? 6- Quel est le 3ème quartle de cette sére? 9 37. 8 37. 0 39.4 Réposes Sére A - L'effectf () de cet échatllo caractérse sa talle; c, 5 9 37.8 0 37.68 La médae est u dcateur de posto cetrale. Elle correspod à la valeur "cetrale" de la sére cosdérée Médae 33.6 L'étedue est u dcateur de dsperso que l'o déterme as : Etedue Maxmum - Mmum Ce qu doe c : Etedue 38.9-4.3 4,6 4.7 La moyee est ue caractérstque de posto "cetrale" qu est détermée as : L'applcato de cette formule ous doe as : effectf 5 somme des doées 65.49 Modher Abrougu Bostatstque «I» ISEFC - 008 73
moyee de l'échatllo 33, Les quartles sot auss des dcateurs de posto, ls dvset chacue des parttos défes par la médae e sous-parttos d'effectfs égaux. er quartle Q 3,85 3ème quartle Q3 36,8 Répose Sére B Répose Sére C Répose Sére D Bla Résultats attedus Effectf 0 Médae 33.6 Etedue 0. Moyee 34 Q er quartle 3 Q 3 3ème quartle 36.6 Bla Résultats attedus Effectf Médae 35.76 Etedue 3.7 Moyee 34.67 Q er quartle 9.09 Q 3 3ème quartle 37.8 Bla Résultats attedus Effectf 9 Médae 36 Etedue 5 Moyee 34 Q er quartle 9.5 Q 3 3ème quartle 39 Modher Abrougu Bostatstque «I» ISEFC - 008 74
Exercces d applcatos II - REPRESETATIO DE SERIES ET CALCUL STATISTIQUE Actvtés et Applcatos I. Tracer l'hstogramme représetat ue sére statstque : Exemple : répartto suvat leur âge de doeurs de sag [ 5, 5[ [ 5, 30[ [ 30, 35[ [ 35, 40[ [ 40, 45[ [ 45, 50[ 4 3 43 53 7 9 Méthode : o costrut des rectagles dot les ares sot proportoelles aux effectfs des classes correspodates. La premère classe ayat ue ampltude double de celle des autres sera représetée par u rectagle de hauteur fos plus pette. De même la derère classe est représetée par u rectagle de hauteur 3 fos plus pette. Soluto : 55 50 45 53 40 35 43 Effectfs 30 5 0 3 7 5 9 0 5 4 0 0 5 0 5 30 35 40 45 50 55 60 65 Ages II. Établr le tableau permettat d'obter les caractérstques de la sére : Soluto : Ages Effectfs Cetres Produts Cumuls Cumuls Carrés Produts x x cros. décr. x x [5,5[ 4 0,0 80,00 4 00 400,00 5 600,00 [5,30[ 3 7,5 880,00 46 86 756,5 4 00,00 [30,35[ 43 3,5 397,50 89 54 056,5 45 48,75 [35,40[ 53 37,5 987,50 4 406,5 74 53,5 [40,45[ 7 4,5 47,50 69 58 806,5 48 768,75 [45,50[ 9 47,5 90,50 88 3 56,5 4 868,75 [50,65[ 57,5 690,00 00 3 306,5 39 675,00 00 7 85,00 8 06,50 Modher Abrougu Bostatstque «I» ISEFC - 008 75
III. Détermer la moyee podérée de la sére : Soluto : x 785 x 36, 43 as 00 IV. Détermer la médae à l'ade des polygoes des effectfs cumulés : Soluto : POLYGOES CUMULATIFS 00 80 60 Effectfs cumulés 40 0 00 80 60 40 0 0 36,04 0 5 0 5 30 35 40 45 50 55 60 65 Ages V. Calculer la médae de la sére : Soluto : 00 00 dem-effectf : 35; 40 classe de la 00 e persoe : [ [ rag das cette classe : 00-89 ampltude de cette classe : 40 35 5 effectf de cette classe : 53 Q 35 + 5 36, 04 médae : 53 VI. Calculer l'écart-type de la sére : Méthode : o utlse l'ue des formules suvates Soluto : Utlsos c la deuxème formule : σ σ σ 78, 676 8, 84 ( x x ) σ (, ) x x 806, 50 36 43 00 405, 35 37, 449 Modher Abrougu Bostatstque «I» ISEFC - 008 76
CHAPITRE II ETUDE DE DEUX VARIABLES STATISTIQUES - SERIE STATISTIQUE DOUBLE -. PRESETATIO D UE SERIE A DEUX VARIABLES L objectf de cette étude statstque est d étuder sur ue même populato de dvdus, deux caractères dfférets (ou modaltés dfféretes) et de rechercher s l exste u le ou corrélato etre ces deux varables. Exemple de relatos possbles etre les varables suvates : talle et âge ; dabète et pods ; taux de cholestérol et régme almetare ; che écologque et populato ; esolellemet et crossace végétale ; toxe et réacto métabolque ; surve et polluto ; effets et doses; orgae et ; orgae et focto bologque ; Les caractères étudés peuvet être auss be qualtatfs que quattatfs. Les résultats sot gééralemet représetés sous forme d u tableau à double etrée, appelé tableau à deux dmesos, ou tableau crosé ou tableau de cotgece, ou parfos tableau de corrélato. Exemple de tableau de cotgece Effets de doses (varable y) Sexe (varable x) Effet Effet Effet 3 total H 43 36 3 Total des H : 8 F 49 Total des F : 73 Total effet : Total effet : Total effet 3 : Total des H et F : Total 9 48 5 55 Effets de doses selo le sexe H ou F. GEERALISATIO DES REPRESETATIOS Désgos par (X, Y) le couple de caractères étudés. A chaque observato cojote (x, y j ) est assocée le ombre d dvdus ayat smultaémet la valeur x pour le caractère X et la valeur yj pour le caractère Y. Ce ombre est oté j et appelé l effectf assocé à l observato (x,y j ). Modher Abrougu Bostatstque «I» ISEFC - 008 77
y j y y.. y j.. y z TOTAL x x j z x j z. x j z x. x k k k kj kz Total k k.. j. j z. z k Effectfs Margaux de Y k z j z j z j z j j. j. j. kj k. E F F E C T I F S M A R G I A U X D E X La lge et la coloe total correspodet aux marges du tableau. 3. CALCUL DES FREQUECES D UE STATISTIQUE A DEUX VARIABLES 3.. Fréqueces relatves partelles La fréquece de l observato (x, y j ) s exprme par l expresso fj. Elle correspod à la proporto d dvdus qu possèdet smultaémet les valeurs x et y j. Elle est obteue par la formule suvate : k z j f j l est a remarquer que f j j 3.. Fréqueces relatves margales f. et f.j Il s agt des fréqueces relatves des dstrbutos margales.. f. et f. j Exemple. j Effets de doses (varable y) Sexe (varable x) Effet Effet Effet 3 total H 43 36 3 Total des H : 8 F 49 Total des F : 73 Total Total effet : 9 Total effet : 48 Total effet 3 : 5 Total des H et F : 55 Modher Abrougu Bostatstque «I» ISEFC - 008 78
Tableau des fréqueces de l effet des doses selo le sexe Sexe Effet Effet Effet 3 total H (43/55) 0,8 (36/55) 0,3 (3/55) 0,0 (8/55) 0,53 F (49/55) 0,3 (/55) 0,08 (/55) 0,08 (73/55) 0,47 Total (9/55) 0,59 (48/55) 0,3 (5/55) 0,0 Représetato graphque : Représetato graphque Fréqueces 0,35 0,30 0,5 0,0 0,5 0,0 0,05 0,00 Effet Effet Effet 3 Effets du dosage H F 4. CALCUL DES MOYEES MARGIALES D UE STATISTIQUE A DEUX VARIABLES Das certaes dstrbutos statstques bdmesoelles l est possble de calculer les moyees, les varaces et les écart-types margaux. ous explcteros ces calculs à travers u exemple. Sot la sére statstque bdmesoelle du couple (X, Y) suvate : Y X - 0 3 3 4 0 6 3 4 3 3 4 3 3 Calculer respectvemet: - Les moyees margales de X pus de Y - Les varaces et l écart-type margaux de X pus de 3- La moyee codtoelle de X quad Y 4- La moyee codtoelle de Y quad X3 et - Les moyees margales, c est le calcul des moyees des effectfs margaux. - les varaces et les écart-types margaux se calculs auss sur les effectfs margaux. Les formules respectves serot utlsées : x Pour les moyees : a) x et b) y Pour les varaces : c) x j yj δ x x et d) δ y j yj y Modher Abrougu Bostatstque «I» ISEFC - 008 79
Dressos le tableau des dstrbutos af de faclter les calculs Y Pour les paramètres de la varable X X - 0 3. x.x 3 4 0 6 3 4 5 3 4 3 3 9 08 4 3 3 0 6 60.j 9 0 6 0 35 somme 30 Pour les paramètres de la varable Y yj 4 0 4 9 somme.jyj 36 0 4 90 50 Moy margale X,9 Var X 0,64 écart-type X 0,80 Moy margale Y 0,68 Var Y 3,8 écart-type Y,95 Applcatos umérques x (x3) + (3x) + (4x0) 0 a) x, 9 35 35 yj j ( x9) + (0x0) + (x6) + (3x0) 4 b) y 0, 68 35 35 x ( 3x4 + x9 + 0x6) 30 c) δ x x (,9) 8,46 0, 64 35 35 j yj ( 50) d) δ y y (0,68) 3, 8 35 (Correcto détallée sur fcher Excel) 3 Pour détermer la moyee codtoelle de X quad Y, l sufft d observer le comportemet de X relatf à la coloe Y X Y 0 3 3 4 3.j 6 x x (0x) + (3x3) + (3x4) 0 0 y 4 Pour détermer la moyee codtoelle de Y quad X3, l sufft d observer le comportemet de Y relatf à la coloe X3 Y - 0 3. X3 4 3 3 y, yj ( x4) + (0x3) + (x3) + (3x) 4 j x 3 0,33 Modher Abrougu Bostatstque «I» ISEFC - 008 80
5. COVARIACE Ue premère approche etre de la relato évetuelle des valeurs d ue varable X avec des valeurs d ue varable Y est doée par le calcul de la covarace. La covarace du couple (X, Y), otée Cov (X,Y) correspod à la moyee de ( X X )( Y Y ) La formule est doc la suvate : ( x x)( y y) Cov Aalogue à la combaso des deux formules suvates ( x x) ( x x)( x x) ( y y) ( y y)( y y) (δ ) (δ ) x y Das cette formule la «co-varace» apparaît be comme ue combaso de la varace de X et celle de Y. Par aaloge aux formules précédetes les formules pratques de calculs de la covarace peuvet auss s écrre : xy - Pour des doées o groupées : Cov x y xy - Pour des doées groupées : Cov x y Proprétés de la covarace - Cov (X, X) var (X) - Cov( X, Y ) δ ( X ) δ ( Y ) - Le sge de la Cov est u dcateur de la tedace de la relato ses postf ou égatf (drecto d étremet du uage de pot) - Ue covarace postve dque ue tedace «crossate» des valeurs de Y e focto de X, ue covarace égatve ue tedace «décrossate» Modher Abrougu Bostatstque «I» ISEFC - 008 8
Exemples de calcul de la covarace : Exemple : Dstrbuto bmodale das u tableau de cotgece Y X - 0 0 4 0 5 5 4 4 7 Recherchos la covarace (X,Y) - dressos le tableau de cotgece avec les varables calculées Y X - 0 x 0 4 0 5 9 0 5 4 4 4 7 0 40 j 9 0 50 8 jyj - 0 0 moy mar X,64 moy mar Y -0,04 Cov (X,Y) -0,4 - la moyee margale de x x (0x9) + (x) + (4x0) x 50 - la moyee margale de y 8 50,64 yj j ( x) + (0x9) + (x0) y 0,4 50 50 Cov /50 ((-x4x0)+(0x0x0)+(x5x0)+(-x5x)+(0xx)+(x4x)+(-xx4)+(0x7x4)+(xx4) Cov (X,Y) -0,4 Exemple : Dstrbuto bmodale das u tableau smple. 6. COEFFICIET DE CORRELATIO La covarace est pas u dcateur dépedat de l ordre de gradeur des varables mplquées (de l uté employée, par exemple). Le coeffcet de corrélato, oté r, permet de résoudre cette dffculté. Ce coeffcet pour le couple (X,Y) s écrt selo la formule suvate : r Cov( X, Y ) δxδy où δx et δx désget respectvemet l écart-type de la sére statstque X et celu de la séres statstque Y Modher Abrougu Bostatstque «I» ISEFC - 008 8
Proprété de r : - r est toujours comprs etre - et, c est ue covarace «rédute» - quad ( r ), les pots représetatfs des couples (x, y), sot parfatemet algés sur le graphque : - quad ( r est vos de ), l exste ue forte corrélato etre X et Y. éamos (atteto), cec e veut pas dre qu l exste ue relato de cause à effet etre elles. - pour r, la drote de la pete est crossate - S 0 < r <, la corrélato est postve, X et Y varet das le même ses. - S - < r < 0, la corrélato est égatve, X et Y varet das le ses cotrare. - pour r -, la drote de la pete est décrossate - quad (r 0), aucue tedace e peut être détermée 7. DROITE DE REGRESSIO OU D AJUSTEMET 7.. Importace de l étude de corrélato etre varables statstques L ue des méthodes smple d étude de corrélato etre varables cosste à rechercher ue courbe d équato y f(x) qu passe au plus proche de tous les pots expérmetaux. Ue telle courbe permet d avor ue dée sur la tedace de la relato etre les varables étudées et de formuler d évetuelles prévsos. 7.. Drote de régresso léare Ue drote de régresso léare s écrt selo l équato : «y ax +b». Cette approche de corrélato repose sur l hypothèse que la relato etre deux varables est de ature léare. E fate, l est possble de soupçoer ue relato dfférete etre ces varables : - courbe de pussace - courbe expoetelle - courbe logarthmque, - courbe hyperbolque, etc Cepedat, l exste de ombreuses méthodes permettat de «léarser» u grad ombre de ces courbes. As, o se retrouve souvet das des stuatos où l est alors possble de tester l exstece d ue relato léare etre les varables auxlares. y ax + b E partat de l équato, a et b dovet être choss coveablemet de sorte que la drote passe au plus proche (ou par le plus possble) des pots expérmetaux. Pour ce fare, o utlse la méthode des modres carrés : O cherche les coeffcets a et b de la drote qu mmse la somme des carrés des dstaces etre les pots expérmetaux et la drote de régresso (les pots théorques). - le coeffcet a (pete) se déterme comme sut : ^ Cov( X, Y ) a δ x - le coeffcet b (ordoée à l orge) se déterme comme sut : Modher Abrougu Bostatstque «I» ISEFC - 008 83
^ b ^ y a x As la drote de régresso de Y e X a pour équato : Cov( X, Y ) y ax + b ( x X ) + Y δ x Pour exprmer X e focto de Y, l sufft d verser les rôles de X et Y Cov( X, Y ) x a' y + b' ( y Y ) + X δ y Ces équatos permettet de défr deux drotes dfféretes de régresso à l téreur du uage de pot. éamos cette verso, qu permet d obter l équato x a y + b (régresso de x e y) est pas souvet téressate, car e gééral, Y est ue varable à exprmer et X est ue varable potetellemet explcatve. Proprété de ces deux drotes de régresso : ) les deux drotes de régresso se coupet e u pot qu a pour coordoées les moyees de x et de y, pot ( x, y), (e remplaçat das l équato x par sa moyee, l est as possble de retrouver y (qu correspod à la moyee de y)). ) les coeffcets a et a (qu sot les petes) sot toujours de même sge (sot (corrélato égatve) sot + (corrélato postve)), as les deux drotes sot oretées das le même ses que le uage de pot. 3) l agle maxmum des deux drotes de régresso est de 90 (drotes perpedculares). Das ce cas, les pots sot dspersés das tout le pla. La corrélato est ulle. Les drotes sot respectvemet parallèles à l axe des x et à l axe des y. Remarque : Les «fausses corrélatos» Qu'est-ce qu'ue corrélato? C'est ue relato postve ou égatve etre deux phéomèes, mas elle est pas absolue. As, l y a ue corrélato postve etre la talle et le pods des hommes : ceux qu mesuret u mètre quatre-vgt pèset e gééral plus lourd que ceux dot la talle e dépasse pas u mètre soxate. Mas l y a des petts gros et des grads magres. Souvet, ue corrélato est le sge d'ue relato de cause à effet. Le plus souvet, o sat ce qu est la cause et ce qu est l'effet : c'est la cosommato de tabac qu provoque le cacer du poumo et o la prédsposto à ce cacer qu doe eve de fumer. Mas das certas cas, les choses sot beaucoup mos évdetes. Et l peut arrver auss que chacu des deux phéomèes sot à la fos cause et effet. E outre, l y a beaucoup de corrélatos statstques qu e résultet aucuemet d'ue relato de cause à effet et qu sot de ce fat trompeuses. C'est otammet le cas pour les séres statstques qu évoluet parallèlemet das le temps, avec le progrès écoomque et scetfque. Certes, s l'espérace de ve augmete, e même temps que dmue la fréquetato des cémas (corrélato égatve), persoe 'ra souter que l'o vt plus veux parce que l'o va mos souvet au céma. Mas das be des cas, surtout s l'o veut prouver quelque chose, o 'héstera pas à vor ue relato de cause à effet là où l 'y a re d'autre que l'évoluto parallèle de deux séres statstques. Modher Abrougu Bostatstque «I» ISEFC - 008 84
APPLICATIO IX: AJUSTEMET LIÉAIRE I. Savor représeter graphquemet ue sére chroologque : Exemple : O référece sur hut aées, le ombre d espèces affectées par ue substace toxque Aées 0 0 03 04 05 06 07 08 b d espèces 70 735 730 765 790 80 870 895 Représeter graphquemet cette sére. x Méthode : ( 8) o porte e abscsse les uméros des aées, x ordoées les effectfs des espèces affectées par cette toxe. et respectvemet e II. Ajuster la sére chroologque par la méthode des pots moyes: Exemple : ajuster la sére précédete à l'ade d'ue drote e utlsat la méthode des pots moyes. Méthode : o déterme l'équato de la drote passat par deux pots moyes A et B. A a pour abscsse la moyee des abscsses correspodat des aées à 4 et pour ordoée la moyee des espèces. De même B pour les aées 5 à 8. Soluto : soet A ( x ; y A A ) et B ( x ; y B B ) les deux pots moyes. + + L+ 4 70 + 735 + 730+ 765 xa,5 y A 737,5 4 4 5 + 6 + L+ 8 790 + 80 + 870 + 895 xb 6,5 y B 84,5 4 4 Le coeffcet drecteur de la drote d'équato géérale y ax + b est : y B y A 84,5 737,5 a 5,9 x x 6,5,5 B A Sur A o a : y A ax A + b 737,5 5,9, 5 + b D'où b 737,5 5,9,5 67,75 La drote a doc pour équato : y 5,9x + 67,75 Cela permet d'effectuer des prévsos. Par exemple, pour l'aée 9, le ombre d espèces affectés prévsoel sera de : y 5,9 9 + 67,75 905,85 (sot evro 906 espèces) 9 Modher Abrougu Bostatstque «I» ISEFC - 008 85
III. Ajuster la sére par la méthode des modres carrés : Exemple : ajuster la sére précédete à l'ade d'ue drote e utlsat la méthode modres carrés. Méthode : o commece par calculer la moyee x des aées (x) et la moyee y des espèces (y). O obtet le pot moye M de la sére, pot par lequel passe la drote d'ajustemet. X Y a O calcule esute le coeffcet drecteur de la drote : X X x x avec et Y y y (écarts par rapport aux moyees respectves). Soluto : o costrut le tableau de calculs suvats : Aées Espèces X Y XY x y 70-3,5-69,38 4,8 735 -,5-54,38 35,94 3 730 -,5-59,38 89,06 4 765-0,5-4,38,9 5 790 0,5 0,63 0,3 6 80,5 0,63 30,94 7 870,5 80,63 0,56 8 895 3,5 05,63 369,69 36 6 35 08,50 36 635 x 4,5 y 789,375 O a : 8 et 8 coordoées du pot moye M. 08,50 a 5,77 Coeffcet drecteur de la drote : 4 Sur M o a : y ax + b 789,375 5,77 4, 5 + b D'où b 789,375 5,77 4,5 673,4 La drote a doc pour équato : y 5,77x + 673,4 Cela permet d'effectuer des prévsos. Par exemple, pour l'aée 9, le CA prévsoel sera de : y 9 5,77 9 + 673,4 906,34 espèces (evro 907 espèces) légèremet dfférete de la méthode des pots moyes. Graphque : Modher Abrougu Bostatstque «I» ISEFC - 008 86
IV. Méthode des modres carrés : démostrato O dspose de la sére statstque c-dessous, de pots. x y x y x y...... x y O suppose que la forme du " uage de pots " permet d'evsager légtmemet u ajustemet léare à l'ade d'ue drote. La drote a ue équato de la forme y ax + b. Pour chaque x, o va chercher à mmser les carrés des écarts etre les ordoées y du pot correspodat de la sére et les ordoées des pots de la drote y ax + b. Le problème cosste doc à détermer les coeffcets a et b tels que s o calcule y ax + b, o dot redre mmum l'expresso : ( y y ) ( y ax b) Supposos a cou, doc fxé. Seul b " bouge ". La focto du ème degré f ( b) ( y ax b) passe par u mmum quad la dérvée par rapport à b s'aule ( ( y ax b) ) 0 ( y ax b) 0 y ax b 0 y x D'où : b a b y ax avec y y (moyee des y) et x x (moyee des x). Autremet dt, la focto + coeffcets est telle que y ax + b, la drote d'ajustemet passe doc par le pot moye M ( x, y). O a doc détermé b e focto de a. y ax + y ax y y a x x L'équato cherchée devet ( ) Y y y X x x ce qu revet à predre M ( x, y) y ax b dot ous cherchos les Posos et comme ouvelle orge. otre drote d'ajustemet passat par cette orge aura ue équato de la forme Y ax. Das ce ouveau repère, les pots de otre sére statstque aurot pour coordoées : X x x et Y y y. Pour obter a, o dot mmser l expresso ( y ax b) ( y ax y ax) ) ( y y a( x x) ) ( Y ax ) ( ( ) ( ) Seul a " bouge " et est varable. La focto du ème g a degré Y ax passe par u mmum lorsque la dérvée par rapport à a s'aule. Y ax 0 Y ax X 0 X Y a X 0 D'où l'o tre : a X Y ( ( ) ) ( ) X. Modher Abrougu Bostatstque «I» ISEFC - 008 87
CHAPITRE III. IFORMATIQUE ET STATISTIQUE : Pré-requs, mse à veau et appretssages. IFORMATIQUE : PRE-REQUIS ET MISE A IVEAU.. Matérels et terfaces utles (dspoble au laboratore d formatque) - Calculatrce scetfque (possble d utlser celle du PC ou celles fours) - PC terface avec offce 003 et plus (Word, Excel,..), - Autres logcels et plug-: adobe acrobate reader (lecture et mpresso des fchers PDF), flash player (plug- pour avgateur et lecteur d amatos SWF (Amatos Flash)), compresso/décompresso (wzp et wrar), Exlstat (outl d'aalyse de doées et de statstques pour Mcrosoft Excel), lecteur de format et fcher «chm» ;. Pré requs - Iterface Wdows (de préférece XP ou Vsta) - Iterface et fcher Word - Iterface et fcher Excel - Iterface et fcher PDF - Gesto d mages et de format d mages (jpg, gf, pg,...) - oto d Iteret (avgato, téléchargemet, malg, forum, ) - Gesto de fchers compressés (Wzp, wrar,..).3 Mse à veau théorque et pratque - Mse à veau des pré-requs. APPRETISSAGES IFORMATIQUE ORIETE STATISTIQUE.. Gesto de doées umérque et de tableau sur Word et Excel.. Gesto de calculs et de formules statstque das Excel.3. Gesto et élaborato de calcul statstque sur Excel.4. Gesto et élaborato de représetatos graphques sur Excel.5. Utlsato et serto de Macro das Excel.6. Représetato de séres et calculs statstque (tableau et graphque).7. Ajustemet léare de séres chroologques avec et sas varatos sasoères..8. Présetato et prcpe de logcel d aalyse de doée statstque.9. Utlsato Excel et présetato d XLSTAT comme outl pour statstque descrptve Modher Abrougu Bostatstque «I» ISEFC - 008 88
APPLICATIOS ET TRAVAUX DIRIGES EXERCICES APPLIQUES : STATISTIQUES ET IFORMATIQUE OBJECTIF Ces travaux drgés sot l occaso d llustrer à travers des smulatos et des exemples cocrets les dfféretes otos de base de statstque vues e cours. ous ssteros sur les résultats fours par les logcels statstques car ceux-c sot de plus e plus élaborés, et les résultats qu ls foursset sot plus ou mos faclemet terprétables. Le logcel que ous utlseros tout le log de ces travaux drgés est Excel et Exstat. - TD - IITIATIO A LA MAIPULATIO D U TABLEUR (oto d formatque) (Tableur Excel) Actvté I : Mse à veau des pré-requs Exercce. Evaluato des pré-requs et mse e pratque Actvté II. Gesto de doées umérques et de tableau sur Word et Excel Exercce : Costructo de table, Exercce : Coverso, trasformato et ajustemet de doées alphaumérques Exercce 3 : Tre, sélecto, substtuto de doées alphaumérques Actvté III : Utlsato de feulle de calcul Excel Exercce : Costructo de table de multplcato dyamque (Utlser le tutorel (table_multplcato.swf) e flash) Exercce : Foctos de bases d Excel Explotato de la focto formule Actvté IV : Excel : Costructo graphque et applcato statstque smple Exercce : Costructo d u hstogramme Vor tutorel: Exemple hstogramme 3D sur Excel.av Exercce : Costructo de courbes Modher Abrougu Bostatstque «I» ISEFC - 008 89
TD : Actvtés : Itato aux utltares mathématque et statstque de l terface Mcrosoft A. Quelques utltares de l terface Mcrosoft - La calculatrce scetfque de l terface Mcrosoft - L serto de symbole de Mcrosoft Word 3- L édteur d équato de Mcrosoft Word Actvté A: Calculez avec la calculatrce scetfque la somme, la moyee et l écart-type de la sére statstque suvate : 0,,, 9, 3, B. Quelques foctos usuelles d Excel Rechercher das l ade de Mcrosoft Excel : - les foctos mathématques et trgoométrques 3- quelques astuces sur Excel (raccourcs clavers, oto de macro...) - les foctos statstques C. Applcato et utlsato de foctos statstques sur Excel - Passage de doées e vrac aux doées ragées et aux doées codesées. - Elaborato de doées e classes 3- Tableau des fréqueces 4- Tableau de dstrbuto 5- Elaborato et gesto des graphques 6- Gesto des calculs Sommes, Moyee, Mode, Médae, Quartle, Décle, Cetles, Maxmal, Mmal Fréqueces, Varace, Ecart-type, Covarace, Coeffcet de varato D. Costructo de représetatos graphques élaborées - Costructo de séres chroologques - Costructo de Pyramde 3- Costructo et explotato de barres à moustaches TD3: Actvtés questos de sythèses : - Eumérer à travers le fasccule l esemble des questos qu peuvet être posées. - Eocer les formules respectves des paramètres suvats : Moyee, Moyee podéré, la varace et l Ecart-type avec >30 et <30, - Calculer : les fréqueces relatves et absolues - Calculer : la moyee, le mode, la médae, la varace, l écart-type, - Calculer : les effectfs cumulés crossat et décrossat - Calculer la moyee, la varace et l écart-type e utlsat la méthode des ζ - Trouver la valeur X du rag décle Cα - Trouver le rag décle Cα de la valeur X - Elaborer u tableau détallé de dstrbuto, e dquat respectvemet les valeurs x, m,, f et F. - Tracer u hstogramme des effectfs - Tracer u hstogramme des fréqueces - Tracer la courbe des fréqueces cumulées crossate et décrossate, e dédure la médae - Tracer des barres à moustaches et compredre leurs dcateurs - Ajuster ue sére chroologque par les méthodes des pots moyes et des modres carrés Modher Abrougu Bostatstque «I» ISEFC - 008 90
PLACHE D ACTIVITES Pour toutes les actvtés, vous devez formuler u esemble de questos, pus aalyser la stuato e chosssat la procédure et les tests statstques approprés. La correcto dot être foure sur documet Word et sur documet Excel. Sur le documet dquez : om, Préom, d scrpto TABLEAU A Adultes Trglycérde de 8 à 0 as 5 59 3 7 4 54 5 93 6 76 7 79 8 89 9 307 0 88 99 5 3 58 4 98 5 0 6 7 7 8 8 86 9 7 0 7 07 80 3 47 4 95 5 40 6 77 7 57 8 95 9 480 30 94 TABLEAU B Taux de cholestérol 97 8 90 3 7 33 (30 étudats) 37 85 8 67 70 57 94 55 34 0 58 5 94 07 98 89 6 75 58 5 8 64 TABLEAU C Pérmètre Pods de du troc l arbre 358 760 375 8 393 98 394 009 360 766 35 76 398 09 36 750 409 036 406 094 487 635 498 57 438 97 465 44 469 495 440 06 376 9 444 398 438 97 467 63 448 475 478 57 457 506 456 458 389 944 405 4 405 03 39 067 37 693 395 085 47 4 385 07 404 084 46 5 479 38 ACTIVITE : Le tableau A présete les résultats d u test de dépstage de trglycérdes chez des adultes de 8 à 0 as. Avat de fare ue aalyse statstque, regrouper ces résultats sous forme de doées codesées. ACTIVITE : Lors d u exame médcal, o a voulu mettre e place u dépstage de lpdes sagus chez ue promoto d étudat e médece. Le but état de s assurer que le taux de cholestérol moye des étudats est féreur à 90 (taux au dessus duquel le cholestérol peut être ocf). Les doées sot résumées das le tableau B. ACTIVITE 3 : Les doées du tableau C proveet des archves d u laboratore de recherche. Elles reseget sur u suv (de plus de 30 aées) de l évoluto des arbres d ue réserve aturelle. Ces doées ous permettet d obter des estmatos de pods sas avor à couper les arbres pour les peser, méthode destructve et problématque. Fates ue aalyse des relatos etre ces varables. Peut o estmer de faço précse le pods d u arbre dot le pérmètre est égal à 55? Modher Abrougu Bostatstque «I» ISEFC - 008 9
QUELQUES STATISTICIES Pour ue hstore de la statstque. Tome. Isee, Imprmere atoale, 593 pp. - ACHEWALL Gottfred Jurste allemad (79-77). Professeur de drot teratoal et de scece poltque à Goettgue, l dffusa le mot "statstque". Il empruta ce mot à Marto Schmezel, qu fut so professeur et qu état lu-même élève de Corg. - ARBUTHOT J. Médec et écrva écossas (Arbuthot, Kcardeshre, 667 - Lodres, 735). Il remarqua que, parm les efats baptsés à Lodres chaque aée de 69 à 70, le ombres des garços dépassat toujours celu des flles. Cosdérat que celà prouvat que les probabltés, pour chaque assace, d'obter u garço ou ue flle 'étaet pas égales, l attrbua cette égalté à la "Dve Provdece". Certas fot remoter les méthodes o paramétrques à cette observato. 70. A argumet for Dve Provdece, take from the costat regularty observ'd the brths of sexes. Phl. Tras. R. Soc, 7: 86-90. - ARISTOTE (e grec Arstotelês, dt le Stagrte) Phlosophe grec (Stagre, Macédoe, aujourd'hu Stavro, - 384 - Chalcs, Eubée, -3). L'oeuvre d'arstote comporte égalemet des tratés de poltque (Poltque, où apparaît l'orge des statstques descrptves qu se répadrot e Europe au XVIe sècle; Costtuto d'athèes) - ARTHASASTRA Traté de scece poltque et écoomque rédgé par Kautlya, mstre du ro Cadragupta du premer Empre de des Maurya (IVe sècle avat otre ère). Il est remarquable, etre autre, par la descrpto des techques perfectoées de recesemet de la populato et de statstques. - BODI Jea Ecoomste et phlosophe fraças (Agers, 530 - Lao, 596). Das so traté Methodus ad faclem hstorarum cogtoem, l a motré l'mportace de la coassace de l'hstore pour la compréheso du drot et de la poltque. Ecoomste, l a aalysé le phéomèe de la motée des prx au XVIe sècle e relato avec l'apport des métaux préceux d'amérque (Répose aux paradoxes de Malestrot).Das so traté de scece poltque (La Républque, 576), théore de la moarche absolue, l démotre l'térêt de l'dée de déombremet, base de la statstque descrptve. Cette dée coaîtra u grad succès et sera reprse, plagée sas que les empruteurs ctet leur source; as le Mror des Fraços de. de Motad (58) et le Traté de l'écoome poltque d'atoe de Motchréte (65). - BURT sr Cyrl Psychologue brtaque (Lodres, 883-97). Il fut le psychologue offcel du Lodo Couty Coucl, resposable de l'applcato et de l'terprétato des tests metaux das les écoles de Lodres. Il succéda à Charles spearma à la chare de l'uversty College de Lodres (93-950). Spécalste de la statstque pyschologque, l réfa l'aalyse factorelle e assmlat u axe factorel mathématque au cocept d'"tellgece géérale", à la sute de C. Spearma. Il cosdérat que l'tellgece, cocept ébuleux, pouvat s'detfer à ue "chose" possédat ue localsato précse das le cerveau et u degré d'hértablté, chose que l'o pouvat mesurer et rédure à u chffre permettat de classer les dvdus e focto de la quatté qu'ls e possèdet. Sa théore hérédtarste de l'tellgece état basée sur l'étude de couples de jumeaux vras (ue cquatae) élevés séparemet dot les QI étaet e forte corrélato. Il fut célèbre et couvert d'hoeurs. Il fut démotré, quelques aées après sa mort, qu'l état l'auteur d'ue ggatesque superchere scetfque. Il avat veté ses couples de jumeaux, sa collaboratrce et ses résultats. Metal ad scolastc tests. Lodo Coutry Coucl, 43 p., 9; The backward chld, Appleto, Modher Abrougu Bostatstque «I» ISEFC - 008 9
ew York, 694 p., 937; The factors of md, Uv. Lodo Press, 509 p., 940; Itellgece ad fertlty, Eugecs Socety, 43 p., 946; The Causes ad treatmet of Backwardess, 95. - CORIG Herma Jurste allemad (606-63). Professeur de drot publc à Helmstedt, l trodust pour la premère fos l'esegemet de la statstque à l'uversté. Ses otes de cours (Exame rerum publcarum potorum totus urbs) furet publé e 667. Il y décrt de ombreux pays europées et o europées, sas apporter de doées chffrées. La statstque est la scece de la costtuto de l'état, mas elle est puremet descrptve. - FISHER Roald Statstce aglas (890-96). À partr de ses expérmetatos agroomques, l teta de motrer que, même s les postulats de ormalté relevaet souvet de l'abus de coface, cela e détérorat pas trop la valdté des coclusos. Das ce cadre, l fut l'u des premers à développer les tests de permutatos des rags ou de radomsato avec Ptma et Welch. The desg of expermets. Olver & Boyd, Edmbourg, 935. - GALTO sr Fracs Physologste, athropologue et psychologue aglas (Brmgham, 8 - Haslemere, 9). Cous de C. Darw, l fut u poer des statstques moderes. Il pesat que la mesurato état le crtère prmordal de toute étude scetfque. Il etreprt même ue equête statstque sur l'effcacté de la prère. Sa croyace, que même les comportemets les plus eracés das la socété avaet ue composate ée, l'amea à étuder l'hérédté et les dfféreces dvduelles (hérédtarsme; Heredtary Geus, 869; Eglsh me of scece, ther ature ad urture, 874; Iqures to Huma Faculty ad ts Developmet, 883; atural Ihertace, 889). L'athropométre et le mesurage des crâes et des corps furet parm les crtères les plus utlsés. Il étuda le veau d'tellgece d'u dvdu à l'ade de l'étaloage des tests. Il fut u des fodateurs de "l'eugésme" (Essays o Eugecs, 909). Mas, l fut u des premers à réalser que les valeurs moyees attachées à des populatos bologques plees de varablté e sot que des artfces de calcul. - KAUTILYA Mstre du ro Cadragupta, fodateur de la dyaste et du premer Empre de des Maurya (33-6). Il rédgea u traté de scece poltque et d'écoome. Il justfe le recours aux recesemets, à la statstque et au cadastre pour remplr so rôle de plafcateur. Il motre l'térêt porté par les empres asatques (populatoste) au déombremet de leur populato. - MORTO Samuel George Médec et athropologue amérca (Phladelphe, 799-85). Il collectoa jusqu'à sa mort plus d'u mller de crâes humas et fut recou comme le premer objectvste de la scece amércae. Cette collecto état réalsée e vue d'établr ue classfcato objectve des races humaes e se fodat sur les caractères physques du cerveau et de sa talle. Il fourt et aalysa les doées permettat de souter le polygésme et devt u des drgeats du mouvemet polygéste amérca. Il publa toutes ses doées brutes, mas ses résumés sot u ramasss d'erreurs de calcul, d'astuces et de trpotages de chffres, coscets, tedat à cofrmer ses covctos préalables (vor S.J. Gould). Craa amercaa (839) est u traté sur l'férorté de l'tellgece chez les des, coteat des erreurs statstques et u échatllo basé lu permettat de "calculer" ue moyee fable pour les cerveau des des, ettemet féreure à celle des blacs. Le Craa Aegyptaca (844) établt à partr d'u échatllo de 00 crâes proveat des catacombes de l'acee Egypte lu permt de parfare sa thèse e démotrat que l'écart séparat les blacs des ors état ecore plus grad. O y retrouve les ombreuses pettes erreurs umérques du premer lvre et l'erreur, plus fodametale, de la o laso etre capacté crâee et talle, sas compter la varablté trodute par sa procédure de mesure de la capacté crâee. Modher Abrougu Bostatstque «I» ISEFC - 008 93
- PEARSO Karl Statstce aglas (857-936). "Il s'est doé pour msso de fare fructfer au veau théorque les problèmes posés par l'applcato de la statstque à la bologe : l se cosacre doc à l'étude des probabltés, mettat au pot la fameuse formule du ch carré". F. Bédarda, 977. Statstque et socété e Agleterre au XIX e sècle. I Pour ue hstore de la statstque, ISEE. Il soutt Galto et sa théore de "l'eugésme". - PITMA EJG. Il fut l'u des premers à développer les tests de permutatos des rags ou de radomsato avec Fsher et Welch. Sgfcace tests that may be appled to samples from ay populato. J. R. Stat. Soc., Suppl., 4: 9-30, 937. Sgfcace tests that may be appled to samples from ay populato. III. The aalyss of varace test. Bometrka, 9: 3-335, 938. - PLAYFAIR Wllam XIXe sècle. Voyageur, dessateur, statstce, écoomste, veteur. Il veta la méthode d'expresso des fats statstques par des procédés géométrques. La premère llustrato de la méthode graphque a été doé das Commercal ad poltcal atlas 786. Il présete deux types de graphques : des courbes et des hstogrammes. Le om de ce derer a été veté par Pearso e 895. Il présete les graphes crculares et les dagrammes à sectos das Statstcal brevary 80. - QUETELET Adolphe Statstce belge (796-874). Il fut u dscple de Laplace. Il recherchat des los détermstes et espérat calculer les caractérstques de "l'homme moye", c'est-à-dre de découvrr l'essece (le type) de l'homme. Les varatos 'étaet que des "erreurs" autour de la moyee. Il joua u rôle émet das la créato de la statstque mathématque. - SPEARMA Charles Psychologue et statstce aglas (Lodres, 863 - Lodres, 945). Fodateur de la psychologe dfféretelle, l ms au pot la méthode mathématque de l'aalyse factorelle (904). Il admt que la réusste à ue tâche (test) est détermée par ue apttude géérale, le facteur g (tellgece globale) terveat das toutes les épreuves psychologques et ue apttude spécfque à la tâche partculère. Il justfa, d'u pot de vue théorque, l'usage d'ue échelle léare de Q.I., que Bet avat proposé comme u smple gude emprque, sur l'aalyse factorelle elle-même. Il s'eferma das de profodes erreurs coceptuelles dot la prcpale fut le réfcato de l'tellgece. Il detfa u cocept ébuleux, socalemet déf, comme l'tellgece à ue "chose" possédat ue localsato précse das le cerveau et u degré d'hértablté. Il état alors possble de mesurer cette chose et de la rédure à u chffre uque permettat de classer les dvdus e focto de la quatté qu'ls e possèdet (Q.I.). Il proposa le coeffcet de corrélato de rags qu porte so om, premer test de statstque oparamétrque. The proof ad measuremet of assocato betwee two thgs. Am. J. Psychol., 5: 7-0, 904. The ature of "tellgece" ad the prcples of cogto. Lodres, McMlla, 358p., 93; Les apttudes de l'homme. Leur ature et leur mesure. McMlla, Lodres, 97; Psychology dow the ages. McMlla, Lodres, vol., 454 et 355 p., 937; Spearma C. & J. L. Wy : Huma ablty, McMlla, 98 p., Lodres, 950. - STUDET (GOSSET) Wllam Sealy Statstce aglas (876-937). W.S. Gosset a publé sous le om de Studet. Il travallat pour l'dustre de la bère (maso Guess). Il ft progresser la statstque das le domae des probabltés. Modher Abrougu Bostatstque «I» ISEFC - 008 94
LEXIQUE FRAÇAIS / AGLAIS Ecart-type ou écart quadratque moye ou dévato stadard : Stadard devato échatllo : Sample échatlloage : Samplg Erreur de secode espèce : Secod kd error, bêta-error. Erreur de premère espèce : Frst kd error, alpha-error Hypothèse alteratve (H ) : o-ull hypothess ou Alteratve hypothess Hypothèse ulle (H 0 ) : ull hypothess Homoscédastcté : Homoscedastcty veau de sgfcato (alpha ) : Sgfcace level Populato : Populato Pouvor d'u test : Test power Régo d'acceptato ou de o-rejet : Acceptace rego Régo de rejet ou domae de rejet ou régo crtque: Rejecto rego Seul de sgfcato ou valeur crtque : Sgfcat pot ou Crtcal value Tests d'ajustemet : Test of goodess of ft Test bomal : Bomal test Test d'hypothèses ou tests de sgfcato : Test of hypothess ou Sgfcace tests Tests statstques blatéraux :Double-taled test ou two-sded test Tests ulatéraux : Sgle-taled test ou oe-sded test Acceptace rego : Régo d'acceptato ou de o-rejet Bomal test : Test bomal Double-taled test or two-sded test : Tests statstques blatéraux Double-taled test or two-sded test : Tests statstques blatéraux Frst kd error, alpha-error : Erreur de premère espèce Homoscedastcty : Homoscédastcté o-ull hypothess or Alteratve hypothes s : Hypothèse alteratve (H) ull hypothess : Hypothèse ulle (H0) Rejecto rego or crtcal rego : Régo de rejet Sample : échatllo Samplg : échatlloage Secod kd error, bêta-error. : Erreur de secode espèce Sgfcace level : veau de sgfcato (alpha) Sgfcat pot or Crtcal value : Seul de sgfcato ou valeur crtque Stadard devato : Ecart-type ou écart quadratque moye ou dévato stadard Test of goodess of ft : Tests d'ajustemet Test of hypothess ou Sgfcace tests : Test d'hypothèses ou tests de sgfcato Test power : Pouvor d'u test Modher Abrougu Bostatstque «I» ISEFC - 008 95
Bblographe BERTI J. 977. La graphque et le tratemet graphque de l'formato. ouvelle bblothèque scetfque, Flammaro. CAPERAA Phlppe & VA CUTSEM Berard, 988. Méthodes et modèles e statstque o paramétrque. Exposé fodametal. Presses Uversté Laval, Duod, 357 pp. DAGELIE Perre, 969-970. Théore et méthodes statstques. Applcatos agroomques (3 vol.). Duculot, Gembloux, Presses Agro., 378 + 45 pp. FISHER R.A., 946.Statstcal methods for research workers, Olver & Boyd, Lodo. traducto fraçase aux Presses Uverstares. HAYS W. L., 963. Statstcs for psychologsts. Holt, Rehart & Wsto. LE GUELTE L., LE BERRE M., DAHA G., RAMOUSSE R. & COULO J. 983. Tratemet stattstque formatsé des doées e éthologe. Études et aalyses comportemetales, (4) :0-68. Pour ue hstore de la statstque. Tome. Isee, Imprmere atoale, 593 pp. SCHWARTZ D. 963. Méthodes statstques à l'usage des médecs et des bologstes. Pars, Flammaro Médece Sceces. SIEGEL Sdey, 956. o parametrc statstcs for the behavoral sceces, McGraw Hll, 3 pp. SEDECOR G.W. Calculato ad terpretato of aalyss of varace ad covarace, Collegate Press, Ames, Iowa. SPRET P. 99. Pratque des statstques oparmétrques. IRA Edtos. VESSEREAU A. 948. Méthodes statstques e bologe et e agroome. Ballère et fls, Pars, p.38. VIGERO E. 997. Géographe et statstque. Que sas-je?, PUF. WIER B.J. 970. Statstcal prcples expermetal desg. McGraw-Hll, Mladska Kjga, p. 67. Modher Abrougu Bostatstque «I» ISEFC - 008 96