1 ère partie : STATISTIQUE DESCRIPTIVE



Documents pareils
II - Notions de probabilité. 19/10/2007 PHYS-F-301 G. Wilquet 1

Semestre : 4 Module : Méthodes Quantitatives III Elément : Mathématiques Financières Enseignant : Mme BENOMAR

LE PRINCIPE DU RAISONNEMENT PAR RÉCURRENCE

SYSTEME FERME EN REACTION CHIMIQUE

Incertitudes expérimentales

" BIOSTATISTIQUE - 1 "

Coefficient de partage

CHAPITRE 6 : LE BIEN-ETRE. Durée : Objectif spécifique : Résumé : I. L agrégation des préférences. Cerner la notion de bien-être et sa mesure.

Application de la théorie des valeurs extrêmes en assurance automobile

GIN FA INSTRUMENTATION P Breuil

Les sinistres graves en assurance automobile : Une nouvelle approche par la théorie des valeurs extrêmes

COURS DE MATHEMATIQUE FINANCIERE A COURT ET LONG TERME Promotion : Première année de graduat

Mathématiques Financières : l essentiel Les 10 formules incontournables (Fin de période)

Une méthode alternative de provisionnement stochastique en Assurance Non Vie : Les Modèles Additifs Généralisés

OBLIGATION DU SECTEUR PRIVE : EVALUATION ET OUTIL DE GESTION DU RISQUE DE TAUX D INTERET

Estimation des incertitudes sur les erreurs de mesure.

Ressources pour le lycée général et technologique

TD 1. Statistiques à une variable.

SÉRIES STATISTIQUES À DEUX VARIABLES

STATISTIQUE AVEC EXCEL

FEUILLE D EXERCICES 17 - PROBABILITÉS SUR UN UNIVERS FINI

UNIVERSITE MONTESQUIEU BORDEAUX IV. Année universitaire Semestre 2. Prévisions Financières. Travaux Dirigés - Séances n 4

Les jeunes économistes

Conception d un outil décisionnel pour la gestion de la relation client dans un site de e-commerce

Conception d un outil décisionnel pour la gestion de la relation client dans un site de e-commerce

Limites des Suites numériques

Montage émetteur commun

La France, à l écoute des entreprises innovantes, propose le meilleur crédit d impôt recherche d Europe

Dénombrement. Chapitre Enoncés des exercices

L Analyse Factorielle des Correspondances

Mesure avec une règle

II LES PROPRIETES DES ESTIMATEURS MCO 1. Rappel : M1 LA REGRESSION : HYPOTHESES ET TESTS Avril 2009

Exercices d Électrocinétique

Comportement d'une suite

Plan. Gestion des stocks. Les opérations de gestions des stocks. Les opérations de gestions des stocks

LES ÉCLIPSES. Éclipser signifie «cacher». Vus depuis la Terre, deux corps célestes peuvent être éclipsés : la Lune et le Soleil.

Polynésie Septembre Exercice On peut traiter la question 4 sans avoir traité les questions précédentes.

Remboursement d un emprunt par annuités constantes

Exercice I ( non spé ) 1/ u 1 = u / Soit P la propriété : u n + 4. > 0 pour n 1. P est vraie au rang 1 car u 1

Les Nombres Parfaits.

Dénombrement. Introduction. 1 Cardinaux d'ensembles nis. ECE3 Lycée Carnot. 12 novembre Quelques dénitions

. (b) Si (u n ) est une suite géométrique de raison q, q 1, on obtient : N N, S N = 1 qn+1. n+1 1 S N = 1 1

Chapitre 3 : Fonctions d une variable réelle (1)

Université Victor Segalen Bordeaux 2 Institut de Santé Publique, d Épidémiologie et de Développement (ISPED) Campus Numérique SEME

Calculer le coût amorti d une obligation sur chaque exercice et présenter les écritures dans les comptes individuels de la société Plumeria.

Soutenue publiquement le Mardi 04/Mai/2010 MEMBRES DU JURY

2 ième partie : MATHÉMATIQUES FINANCIÈRES

EXERCICES : DÉNOMBREMENT

1 Mesure et intégrale

STATISTIQUE : TESTS D HYPOTHESES

[ édité le 10 juillet 2014 Enoncés 1. Exercice 6 [ ] [correction] Si n est un entier 2, le rationnel H n =

LE RÉGIME DE RETRAITE DU PERSONNEL CANADIEN DE LA CANADA-VIE (le «régime») INFORMATION IMPORTANTE CONCERNANT LE RECOURS COLLECTIF

20. Algorithmique & Mathématiques

Fiche n 7 : Vérification du débit et de la vitesse par la méthode de traçage

Chapitre 3 : Transistor bipolaire à jonction

Séquence 5. La fonction logarithme népérien. Sommaire

1 Introduction. 2 Définitions des sources de tension et de courant : Cours. Date : A2 Analyser le système Conversion statique de l énergie. 2 h.

Divorce et séparation

Contrats prévoyance des TNS : Clarifier les règles pour sécuriser les prestations

Généralités sur les fonctions 1ES

Intégration et probabilités ENS Paris, TD (20)13 Lois des grands nombres, théorème central limite. Corrigé :

55 - EXEMPLES D UTILISATION DU TABLEUR.

Deuxième partie : LES CONTRATS D ASSURANCE VIE CLASSIQUES

1.0 Probabilité vs statistique Expérience aléatoire et espace échantillonnal Événement...2

stages 2015 paris saint-germain ACADEMY Dossier d inscription

Chapitre IV : Inductance propre, inductance mutuelle. Energie électromagnétique

Statistique descriptive bidimensionnelle

Principes et Méthodes Statistiques

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation

Etude de la fonction ζ de Riemann

Chap. 5 : Les intérêts (Les calculs financiers)

Consolidation. C r é e r un nouveau classeur. Créer un groupe de travail. Saisir des données dans un groupe

Gérer les applications

MUTUELLE D&O MUTUELLE D&O. Copilote de votre santé. AGECFA-Voyageurs CARCEPT CARCEPT-Prévoyance CRC CRIS CRPB-AFB

Formation d un ester à partir d un acide et d un alcool

Assurance maladie et aléa de moralité ex-ante : L incidence de l hétérogénéité de la perte sanitaire

Sommaire Chapitre 1 - L interface de Windows 7 9

Le Sphinx. Enquêtes, Sondages. Analyse de données. Internet :

Editions ENI. Project Collection Référence Bureautique. Extrait

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation

Séries réelles ou complexes

RECHERCHE DE CLIENTS simplifiée

Q x2 = 1 2. est dans l ensemble plus grand des rationnels Q. Continuons ainsi, l équation x 2 = 1 2

Convergences 2/2 - le théorème du point fixe - Page 1 sur 9

Mobile Business. Communiquez efficacement avec vos relations commerciales 09/2012

Dirigeant de SAS : Laisser le choix du statut social

Comment les Canadiens classent-ils leur système de soins de santé?

Le marché du café peut être segmenté en fonction de deux modes de production principaux : la torréfaction et la fabrication de café soluble.

TRANSFERT DE CHARGE DANS UN RÉSEAU DE PROCESSEURS TOTALEMENT CONNECTÉS (*) par Maryse BÉGUIN ( 1 )

14 Chapitre 14. Théorème du point fixe

Exo7. Déterminants. = 4(b + c)(c + a)(a + b). c + a c + b 2c Correction. b + a 2b b + c. Exercice 2 ** X a b c a X c b b c X a c b a X

EH SmartView. Identifiez vos risques et vos opportunités. Pilotez votre assurance-crédit. Services en ligne Euler Hermes

MÉTHODES DE SONDAGES UTILISÉES DANS LES PROGRAMMES D ÉVALUATIONS DES ÉLÈVES

Baccalauréat S Asie 19 juin 2014 Corrigé

GEA I Mathématiques nancières Poly. de révision. Lionel Darondeau

GENESIS - Generalized System for Imputation Simulations (Système généralisé pour simuler l imputation)

Une action! Un message!

santé Les arrêts de travail des séniors en emploi

Module 3 : Inversion de matrices

CHAPITRE 2 SÉRIES ENTIÈRES

Transcription:

ère parte : STATISTIQUE DESCRIPTIVE CHAPITRE : COLLECTE DE L INFORMATION, TABLEAUX ET GRAPHIQUES. I. Défto et vocabulare Défto : la statstque est ue méthode scetfque qu cosste à réur des doées chffrées sur des esembles ombreu, pus à aalser, à commeter et à crtquer ces doées. Cette scece a pas pour objet la coassace des élémets des esembles das ce qu fat leur dvdualté, mas au cotrare das ce qu ls ot e commu : l s agt d obter des résultats globau. As, ue equête statstque portat sur des persoes a pas beso de fare terver leurs oms, mas seulemet les resegemets que l o désre étuder : elle permet de coaître la répartto de ces persoes par âge, par see, groupe sagu Comme toute scece, la statstque fat appel à u vocabulare spécalsé : - Les esembles sot appelés populatos. Comme u esemble, ue populato statstque dot être claremet défe. - Les élémets de la populato sot appelés dvdus ou utés statstques, (que ce soet des hommes ou des automobles). - La populato est étudée selo u ou pluseurs caractères. - U caractère permet de détermer ue partto de la populato selo dverses modaltés. As le see est u caractère à deu modaltés : mascul et fém. - Lorsque les modaltés du caractère sot des ombres, le caractère est dt quattatf ; o lu doe souvet le om de varable statstque. Ue varable statstque peut être dscrète s elle e pred que des valeurs solées ou cotue s elle peut predre mporte quelle valeur termédare etre deu valeurs doées. - Lorsque les modaltés du caractère e sot pas mesurables, le caractère est dt qualtatf. Les modaltés d u caractère qualtatf peuvet fare l objet d ue omeclature ou éumérato ; la omeclature dot e prcpe être courte (ue dzae pour ue étude statstque smple). Mas les egeces de l étude sot parfos telles que la omeclature occupe des volumes eters : c est le cas de omeclatures codées des catégores socoprofessoelles et des professos fates par l I.N.S.E.E. Eemples : Pour des chômeurs, l âge est u caractère quattatf cotu ; le ombre d efats est u caractère quattatf dscret. Pour des automobles, la couleur est u caractère qualtatf. II. La collecte des formatos Le premer objet de la méthode statstque est de réur les formatos avat de les trater.

Voc quelques gééraltés : - Objectf de l formato. Equête : Il mporte, dès le départ, de be défr le ou les objectf(s) avat de réalser l equête. S u élémet est oublé das les premères recherches, l rsque d être log et coûteu de le rechercher esute. Eemple : S l o réalse ue equête sur l emplo das u secteur détermé, l e faut oubler aucue varable. O peut demader au persoes terrogées leur qualfcato professoelle, leur âge, etc Mas s esute o s aperçot que le salare est u caractère mportat, l est trop tard et l faut refare l equête. - Quatté d formato : Cepedat l e faut pas être trop ambteu. Il e dot pas avor de lacues das l formato mas l e dot pas avor trop d formatos, car l devet alors mpossble d e trer ue sthèse. - Collecte de doées : Les doées sot recuelles sot par observato drecte, sot drectemet. - observato drecte : equête meée par les statstces à l ade de questoares qu sot esute dépoullés. - Observato drecte statstques d ue etreprse trées de sa comptablté, statstques de assaces et des décès trées de l état cvl. - Dfférets modes de collecte de l formato : - Les résultats statstques peuvet être obteus à partr d ue equête ehaustve stataée (déombremet stataé ou recesemet) ou d u relevé cotu (état cvl). - De même, l equête peut être ehaustve ou partelle. L equête ehaustve porte sur toutes les utés de la populato ; elle est utle mas souvet coûteuse. C est pourquo o a recours à des equêtes partelles fates sur u échatllo de la populato : l s agt alors de sodage, et l faut détermer u échatllo représetatf, de maère que les résultats statstques trouvés sur cet échatllo soet voss de ceu que l o aurat obteus s o avat étudé la populato etère. III. Dépoullemet des observatos Lorsque les observatos sot obteues, elles dovet être classées et eplotées. Auparavat ue crtque des réposes dot être fate af d élmer les cotradctos et les vrasemblaces. Pour chaque caractère à étuder, o déft u certa ombre de classes selo les modaltés, pus o fat le tr des observatos, c est à dre ue répartto par classes. Ces opératos peuvet être fates à la ma ou à l ade d u ordateur. Le documet d equête dot être au mos partellemet codé pour évter la surcharge des mémores. IV Tableau statstques O peut représeter les doées brutes d ue étude das u tableau. Mas l est possble d e dédure u tableau plus clar, e fasat u regroupemet par classes. O chost les classes pas trop ombreuses, mas suffsammet pour qu l at pas de perte d formato. Il

mporte que les classes recouvret tous les résultats et aet ue tersecto vde, d où les formulatos du tpe «de à mos de» ; la dfférece etre les deu etrémtés est appelé ampltude de la classe. O peut fer le ombre de classes selo l u des deu formules suvates : ) Règle de Sturge : b. de classes + (3.3 log ) ) Règle de Yule : b. de classes.5 4 Avec effectf de l échatllo. L ampltude de classe est alors doée par : valeur ma.- valeur m. b. de classes L effectf d ue classe est le ombre d élémets de la populato observés das cette classe. La fréquece est le rapport de cet effectf à l effectf total de la populato. La fréquece est eprmée e pourcetage. Eemple : O s téresse à la charge de rupture d u fl e grammes. 7 86 85 9 9 79 85 935 895 758 846 95 873 96 864 800 93 7 774 903 95 8633 853 700 885 857 844 907 97 786 80 930 8499 789 790 753 90 847 784 936 706 758 887 860 94 909 784 88 859 903 95 704 79 888 8587 890 95 895 768 869 89 895 9 850 90 886 763 805 796 759 96 853 789 94 7 764 8099 89 893 95 890 888 865 909 93 70 798 869 94 794 93 70 77 935 887 880 933 905 865 889 79 78 73 74 868 84 89 905 79 898 84797 O va regrouper ces doées e classes. Nous avos u effectf de 00 ce qu ous doe e ombre de classes d après les règles de Sturge et de Yule : 7 classes. E fat das l eemple ls e preet 6. 3

Charge e grammes Effectfs Fréqueces 700 à mos de 750 750 à mos de 800 800 à mos de 840 840 à mos de 880 880 à mos de 90 90 et plus 0 3 4 5 3 6 0, 0,3 0,04 0,5 0,3 0,6 TOTAL 00 IV. Graphques 4.. Cas de dstrbutos quattatves Les graphques sot ormalemet réalsés e portat e abscsse la varable observée et e ordoée l effectf ou la fréquece. - das le cas d ue varable dscrète, le graphque est u dagramme à bâtos, as apparaît la dscotuté etre deu valeurs. - das le cas d ue varable cotue, le graphque est u hstogramme. La surface lmtée par l hstogramme dot être proportoelle à l effectf ou la fréquece. Il covet de predre garde à l ampltude des classes (o se ramèe à la plus pette ampltude, ampltude élémetare, et o dvse la hauteur du rectagle par la mesure de l ampltude de la classe par rapport à cette ampltude élémetare). hauteur du rectagle effectf ou fréquece ampltude élémetar e ampltude de la classe Eemple : O a récolté les doées suvates : 4

charges e g. (classes) effectfs ampltude hauteur du rectagle 700 à mos de 750 0 50 (0*40)/508 750 à mos de 800 3 50 (3*40)/508,4 800-840 4 40 4 840-880 5 40 5 880-90 3 40 3 effectfs par classes 35 30 5 0 5 sas tercompte de l'ampltude e teat compte de l'ampltude 0 5 0 3 4 5 4.. Cas de dstrbutos qualtatves Dverses méthodes sot possbles, par eemple : - o peut réalser des dagrammes à bades - ou des dagrammes à secteurs 5

CHAPITRE : ETUDE DES SERIES STATISTIQUES SIMPLES. I. Itroducto U tableau statstque ou u graphque sot parfos log à cosulter, sas permettre d avor ue dée suffsammet cocse de la dstrbuto statstque observée. O cherche alors à résumer celle-c par ue caractérstque de tedace cetrale, c est à dre par u seul ombre desté à caractérser l esemble d ue faço objectve et mpersoelle, comme par eemple la moee arthmétque, la médae ou le mode. II. La moee arthmétque La moee arthmétque d ue sére de valeurs d ue varable statstque est égale à la somme de ces valeurs dvsée par leur ombre... Cas de doées éumérées La formule géérale est, pour observatos,, 3, : + +... +.. Cas d ue varable dscrète S la varable est dscrète o emploe la formule de la moee podérée. Pour t classes d effectfs ou de fréqueces f la moee s écrt pour les valeurs,, 3, t de la varable : + +... + t t + +... + O a l habtude de résumer cette écrture e emploat le sge Σ : t f + f +... + f t t f + f +... + f t t t t t f f.3. Varable cotue et doées groupées. S la varable est cotue et s les doées sot groupées o e peut que rechercher arbtraremet ue moee à l téreur de chaque classe ; à défaut o chost le «cetre de 6

classe». Le calcul est effectué comme s tous les dvdus d ue classe avaet pour caractère le cetre de classe, avec toute la part d appromato que cela comporte. Eemple : Lors d ue étude sur la résstace d u métal, o a réalsé 00 epéreces de rupture e charge d u fl de même épasseur et l o a oté les pods lmtes das chaque cas. Le tableau c-dessous représete la répartto par classes des résultats. O calcule la moee de la charge de rupture d u fl, à partr des effectfs. Tableau effectfs cetre de classe charge e grammes 700 750 800 840 0 3 4 5 75 775 80 860 750 785 380 900 880 3 900 8800 90 960 6 940 5040 TOTAL 00 85095 85095 00 850,95 85 g. Remarque : s o avat fat le calcul sur les doées brutes o aurat trouvé : 848g. Cette perte de précso est due au regroupemet des doées e classes, et au cho des cetres de classes comme moee de la classe, d où perte d formato. III. Le mode ou la classe modale Le mode ou valeur modale est la valeur que la varable statstque pred le plus fréquemmet. - Das le cas d ue varable dscrète, le mode peut être trouvé mmédatemet, au vu du tableau des fréqueces ou des effectfs. - S la varable est cotue, et s les doées sot groupées e classes, o parle plutôt de classe modale : la classe aat l effectf le plus élevé (effectf rameé à l uté d ampltude). Atteto l peut arrver que la classe modale e sot pas celle où l effectf apparaît, sur le tableau, le plus élevé. E effet, cette derère classe peut avor ue ampltude plus grade qu ue autre dot l effectf par uté d ampltude, est plus élevé. Sur l eemple précédet, s la classe 700 à mos de 800 fgurat, so effectf serat 33, supéreur à celu reteu pour la classe modale. Mas rameé à l uté d ampltude 40, l effectf e serat plus que : 33*40/003.. La répartto des charges de rupture d u fl a pour classe modale la classe «880 à mos de 90», d effectf 3. 7

IV. La médae La médae d ue sére statstque est ue valeur de la varable telle qu l at autat d observatos aat ue valeur supéreure à la médae que d observatos aat ue valeur féreure à la médae. Eemple : s ous cosdéros les cq valeurs suvates : 7 86 85 9 9. Ces valeurs peuvet être ragées selo les gradeurs crossates : 7 85 86 9 9. La valeur 86 est telle que deu observatos ot ue valeur féreure et deu autres ue valeur supéreure : c est la médae. Lorsque les observatos sot toutes doées, l sufft doc de les classer par ordre de gradeurs crossates (ou décrossates), et de predre celle qu se trouve au mleu. S le ombre des observatos est par, la médae peut être théorquemet l ue quelcoque des valeurs comprses etre les deu valeurs cetrales observées ; le plus souvet o chost leur dem-somme. S par cotre les observatos sot regroupées e classes, l est écessare de recourr au effectfs ou au fréqueces- cumulés. V. Effectfs ou fréqueces cumulés. Il est souvet téressat, devat ue sére statstque, de pouvor dre «l a tat d observatos» ou «l a tel pourcetage d observatos» féreures à telle valeur (ou supéreures). C est à ce gere de préoccupato que répod le calcul des fréqueces ou des effectfs cumulés. 5.. Varable cotue O ajoute l effectf d ue classe à l effectf cumulé précédet, e commeçat par le haut du tableau pour l effectf cumulé «mos de» et le bas pour l effectf «plus de», vor tableau. La seule dffculté est de be commecer ; pour cela, l sufft de se référer à la sgfcato des résultats ; s l o cherche combe de fl ot pu résster à u pods de mos de 700g, le tableau permet de répodre qu l e a aucu, o écrt l effectf cumulé 0 e face du pods 700g. O lt par eemple que 67 fls ot supporté ue charge de plus de 800g. Il est possble d effectuer ue représetato graphque des effectfs cumulés. 8

Tableau effectfs cetre de classe effectfs cumulés charge e grammes "- de" "+ de" 700 750 800 0 3 4 75 775 80 750 785 380 0 0 33 00 90 67 840 880 5 3 860 900 900 8800 37 5 63 48 90 6 940 5040 84 6 960 00 0 TOTAL 00 85095 Effectfs cumulées 00 80 60 40 "+ de" "- de" 0 0 600 700 800 900 000 charge e g. 5.. Varable dscrète S la varable est dscrète, ue pette dffculté supplémetare apparaît, au veau de la sgfcato. Pluseurs déftos des effectfs ou fréqueces cumulés sot possbles Il faut fare atteto s o parle au ses strcte ou au ses large. VI. Calcul de la médae La médae est la valeur de la varable qu correspod à la fréquece cumulée 50% ou à l effectf cumulé /. O calcule la valeur de la varable correspodat à la fréquece cumulée 50%. Cosdéros les doées du tableau : la médae M correspod à l effectf 00/50. O procède à l terpolato léare sur les effectfs cumulés «mos de» (ou évetuellemet «plus de») : 9

effectfs cumulés "mos de" 840 37 880 5 55 50 45 40 35 30 5 0 830 840 850 860 870 880 890 Le pot de coordoées (M,50) est sur la drote passat par les pots A et B. Trouvos l équato de cette drote : a+b. A(840,37) et B(880,5) 37 5 840 880 a a + + b b 5 40 a a 3 8 b 78 b a M 50 + 78 874,67 875g. 3 8 Remarque : Cette valeur peut être lue sur le graphque des effectfs cumulés ; c est la valeur de la varable correspodat à l effectf 50 ; o lt evro 875g. VII. Etedue. L étedue est la dfférece etre la valeur mamale et la valeur mmale d ue sére. VIII. Caractérstques de dsperso O cosdère les deu séres de doées suvates : 95 97 00 03 05 50 75 00 5 50 Elles ot même moee arthmétque et même médae (00). Cepedat elles dffèret profodémet. Ce qu fat leur dfférece, c est ce qu e statstque o omme la dsperso ; la deuème sére est beaucoup plus dspersée que la premère. Il est doc mportat de résumer ue sére statstque o seulemet par des caractérstques de tedace cetrale, mas auss par des caractérstques de dsperso. Nous e défros de deu sortes : celle lées à la moee : écart absolu moe et écart-tpe ; celles lées à la médae : écart terquartle, écart terdécle, etc 0

IX. Ecart absolu moe O calcule d abord l écart à la moee. Pour chaque valeur de la varable, o calcule l écart de cette valeur à la moee ; o cherche esute à résumer ces écarts e calculat ue moee. Pour les deu séres du VII, les écarts sot : -5-3 0 3 5-50 -5 0 5 50 Il est mpossble de résumer ces écarts par leur moee arthmétque, pusque par défto même de : Cepedat, la smple vue des deu lges d écart calculées c-dessus motre que ceu-c caractérset coveablemet la dsperso. O a alors recours à la moee des valeurs absolues des écarts, c est l écart absolu moe : Ou, s les observatos sot répartes par classes : Pour la premère sére observée o a : Et pour la deuème : ( ) + + 0 6 e 5 50 e 5 30 e e 3, Cette caractérstque red coveablemet compte de la dfférece de dsperso etre les deu séres. Elle est cepedat peu utlsée. E outre, la formulato des los statstques fat appel à ue autre caractérstque : l'écart tpe. X. Ecart-tpe 0.. Défto La caractérstque de dsperso la plus usuelle est e effet l écart-tpe. Pusque la moee arthmétque des écarts à la moee est ulle, o a recours à la moee quadratque de ces écarts. O déft :

- la varace d ue sére : c est ue moee arthmétque des carrés des écarts à la moee : V ( ) - L écart tpe d ue sére : c est la moee quadratque des écarts à la moee, autremet dt, c est la race carrée de la varace. σ V ( ) E repreat les séres du 7, o a pour la premère : Et pour la deuème : 5 + 9 + 5 + 9 v 3,6 et σ 5 3,69 500+ 65+ 65+ 500 650 v 50 et σ 5 5 35,36 0.. Méthode de calcul Les calculs rsquet de dever laboreu s la moee est pas etère : o a à trater des «écarts à la moee» o eters avec d évtables arrods, d où des calculs lourds et forcémet peu précs. Pour alléger les calculs, o se sert du théorème de Koeg. Développos : S ( ) + 3 + car O eprme souvet ce théorème à partr de la formule de la varace qu s e dédut : V(X) ()

La varace est égale à la moee des carrés mos le carré de la moee. Ce résultat smplfe cosdérablemet les calculs écessares pour obter la varace et l écart-tpe ; c est sous cette forme que le théorème de Koeg est utlsé dès qu o dspose d ue mache à calculer. Remarque : cette derère formulato de la varace lmte les erreurs d arrods car la moee tervet qu ue seule fos alors que das la formulato précédete elle tervet fos. 0.3. Eemples Il est possble de calculer la varace et l écart tpe sur l eemple du. Pour la rupture e charge des fls, sur les doées groupées du tableau. O utlse la formule : V(X) () Tableau 3 charge e grammes effectfs cetre de classe 700 750 0 3 75 775 750 785 55650 384375 800 840 4 5 80 860 380 900 689600 094000 880 3 900 8800 590000 90 960 6 940 5040 437600 TOTAL 00 85095 7985 V(X) () σ 7985 00 (850,95) 500,35 70,73 g. 500,35 0.4. Sgfcato de l écart tpe Remarque : Il este ue autre quatté représetate de la dsperso d ue sére, c est l étedue : étedue valeur mamale valeur mmale. 3

Lorsque l o compare deu séres de même ature, celle qu a l écart tpe le plus élevé est la plus dspersée. Cepedat, par référece à ue lo statstque usuelle, la lo ormale, l est possble de précser u peu la sgfcato de l écart tpe. Lorsqu ue sére statstque satsfat à la lo ormale, 95% des observatos sot comprses etre σ et + σ : plus l écart tpe est élevé, plus les observatos sot dspersées. S la sére statstque étudée, sas suvre ue lo ormale, est pas trop dssmétrque, la même proprété est appromatvemet vrae. O dédut de la proprété éocée c-dessus das le cas de la lo ormale, la règle de vérfcato suvate : l étedue d ue sére statstque (dfférece etre observato la plus élevée et la plus basse) est du même ordre de gradeur que quatre écart-tpes. Par eemple : pour la rupture e charge de fls, l étedue est certaemet féreure à 960-70060g (e effet 960 et 700 sot des etrémtés de classes dot o sat par les doées brutes qu elles e sot pas toutes deu attetes) et 4σ83g : les deu ombres e sot pas égau mas ls sot du même ordre de gradeur. 0.5. Coeffcet de varato L étedue, la varace et l écart tpe sot des paramètres de dsperso absolue qu mesuret la varato absolue des doées. Cepedat, u écart tpe de 6 mm a pas la même sgfcato s l se rapporte à des mesures de l ordre de 60 mm ou à des mesures de l ordre de 80 mm. Auss dspose-t-o d u dce de dsperso relatve appelé coeffcet de varato, oté CV. Par défto, le coeffcet de varato est égal à 00σ CV Remarque : ce coeffcet cesse d être effcace pour pett. Ce coeffcet de varato a l avatage d être comparable pour toutes les séres statstques. Eemple : (rupture e charges ) le coeffcet de varato de la sére étudée c-dessus est : 70,73 850,95 0.08 La sére de pods apparaît peu dspersée, parce que toutes les observatos sot «relatvemet» voses de la moee. XI. Caractérstques de posto : quartles, décles, cetles 4

Les quartles, décles et cetles sot des caractérstques qu correspodet au même gere de préoccupato que la médae. Il s agt des valeurs de la varable qu correspodet au effectfs cumulés : /4, /4, 3/4 /0, /0, 9/0 /00, /00, 99/00 pour des quartles, le ème quartle est la médae, pour les décles ; le 5 ème décle est la médae, pour les cetles ; le 50 ème cetle est la médae. O les appelle caractérstques de posto, pusqu elle permettet de placer les valeurs de la varable. - Cas d ue varable cotue Les calculs s effectuet comme ceu cocerat la médae. Repreos l eemple de rupture des fls. Les quartles peuvet être détermés sot graphquemet, sot par u calcul d terpolato léare. La premer quartle Q correspod à l effectf cumulé 5% sot : A 750 0? Q 5 B 800 33 0 750a + b 3 50a a 33 800a + b 3 50 et 3 b 0 750 335 50 Ce qu doe : 3 50 5 Q 335 Q (5 + 335) 78,6 783g. 50 3 De même o peut trouver pour le 3 ème quartle : (Q 3,75) Q 3 908,75g 909g. O calculerat de la même maère les décles. Pour le er et le 9 ème décle, o obtet : D 750 g et D 9 935 g. - Cas d ue varable dscrète Le prcpe est le même. Pour des populatos ombreuses, o calculerat de même certas cetles, partculèremet les cetles etrêmes, C et C 99. XII. Caractérstques de dsperso : étedue, écarts terdécles, écarts terquartles 5

Les caractérstques de posto défes au X suggèret ue maère de caractérser la dsperso sesblemet dfférete de celle qu aboutt à l usage de l écart-tpe. E effet, u tervalle das lequel o trouve toute la populato étudée, ou u tervalle à l téreur duquel se stue 80% de cette populato, les 0% etrêmes (les plus aberrats) état élmés des deu côtés, peut doer ue dée de la faço dot se répart ue sére. Le premer tervalle as déf est l étedue, dfférece etre l observato la plus élevée et l observato la plus fable. Le secod est l écart terdécle : D 9 D. O déft de la même maère l écart terquartle : Q 3 Q. As pour la sére des charges de rupture du fl, l étedue est : e 960-700 60 g. L écart terdécle est : D9-D 935-75085 g Iterprétato de ce résultat : E élmat les 0% les plus résstats et les 0% les mos résstats, les charges de rupture des fls sot répartes à l téreur d ue plage de 85 g. L écart terquartle est : Q3-Q 909-7836 g. Iterprétato : 50% de la populato des fls a ue charge de rupture réparte sur 6g. Cet écart est élevé par rapport au précédet : mas la répartto des charges de rupture fat apparaître e quelque sorte deu populatos dstctes ; l élmato des 0% ou des 50% de l esemble qu se trouvet au etrémtés e fat pas dsparaître la classe cetrale «800 à mos de 840» dot l effectf est très fable. O peut fare les mêmes calculs pour ue varable dscrète. Les résultats sot sesblemet mos téressats. E effet, l est fréquet que des quartles ou des décles soet égau à la médae. XIII. Quelques cosels pour l étude de séres statstques smples Il est écessare de séparer claremet deu tpes de calculs : - moee, écart-tpe.. à réalser à partr des cetres de classes et des effectfs de classes. - médae, quartles, tervalles terquartles.. à réalser à partr des etrémtés de classes et des effectfs cumulés. 6

CHAPITRE 3 : ETUDE DES SERIES STATISTIQUES DOUBLES I. Posto du problème Das les chaptres précédets o étudat ue populato selo u seul caractère. Cepedat l est souvet utle de cosdérer à la fos pluseurs caractères de la même populato : talle, âge, pods d u groupe d efats ; qualfcato et salare de salarés ; température et presso d u mleu à dfféretes heures Nous ous lmteros c à l étude smultaée de deu caractères ; l aalse des doées permet d e étuder u grad ombre. II. Notatos et représetato des séres statstques doubles Ue sére statstque double peut être doée comme l éumérato d u certa ombre de résultats. La tableau c-dessous doe la cosommato e mllers de calores de douze famlles e moee par jour. Chaque homme adulte est compté pour ue «uté de cosommato» ; u efat est compté pour ue part d uté, dépedat de so âge et de so see. Tableau de uté de calores famlle cosommato par jour 5,3 3 7, 8 3 5,6 9,4 4 7, 5,4 5 5 7,8 6 3,3 9,3 7 5, 0, 8 4,5 7, 9 4 8,9 0 4,4 5,7, 4,7,5 TOTAL 59,6 7 O peut avor des doées groupées : o parle alors de tableau carrés ou de tableau à double etrée. Il est alors écessare d emploer des otatos précses. Soet et deu caractères (quattatfs ou o). Les classes du caractère sot désgées par les dces,,j,.,p, celles du caractère par,,,,q. j est le ombre d utés représetat la modalté de et la modalté j de. Les sommes des effectfs de la lge, de la coloe j et de l esemble sot otés respectvemet : 7

p j j q p q.,. j.j, j j.. Tableau : Notato des tableau carrés caractère j p total j p. caractère j. : : : : : : : : : : j. : : : : : : : q q qp q. total....j...p.. La derère lge et la derère coloe du tableau représetet les dstrbutos margales, c est à dre la dstrbuto de sas ter compte du caractère ou celle de sas ter compte de. La dstrbuto margale des, comme celle des j, peut être tratée comme ue sére smple. O déft e partculer la moee, la varace V() et l écart tpe σ(). De même, l ue quelcoque des lges ou des coloes du tableau peut être terprétée comme ue dstrbuto codtoelle. Il est possble d étuder les dstrbutos codtoelles comme des séres statstques smples. III. Ajustemet léare. Prcpe de la méthode des modres carrés Les doées du tableau peuvet être représetées graphquemet : 8

b. de calores par jour 0 8 6 4 0 8 6 4 0 0 4 6 8 b. d'utés de cosommato O costate sur la fgure c-dessus que les pots représetatfs de la sére des cosommatos e sot pas rgoureusemet algés, mas qu ls formet u uage de pots allogé. Il est pas alors dépourvu de ses de chercher s l o peut trouver ue drote qu résume appromatvemet l esemble des pots. La recherche d ue telle drote est u ajustemet léare. 3.. Ajustemet graphque Théorquemet, dverses sortes d ajustemet léares sot possbles. La plus smple est l ajustemet graphque, réalsé par le dessateur. L covéet majeur de l ajustemet graphque est qu l est subjectf. 3.. Autres ajustemets D autres ajustemets peuvet être réalsés de faço plus objectve, par eemple e utlsat les pots etrêmes ou les moees de certas groupes de résultats. Lorsqu l s agt de séres chroologques, l est usuel de réalser u ajustemet léare par de telles méthodes. 3.3. Méthode des modres carrés La méthode des modres carrés présete u caractère plus rgoureu que les précédetes. Elle cosste à rechercher ue drote telle que la somme de ses dstaces au dfférets pots représetat les doées sot mmale. Le mot dstace est prs au ses large. La dstace chose est le carré de la dfférece des ordoées etre chaque pot et le pot de la drote aat même abscsse. 3.4. Noto de corrélato léare La méthode des modres carrés peut être utlsée pour mporte quelle sére double. Quelle que sot cette sére, l este ue drote d estmato par la méthode des modres carrés. Pour s assurer de faço objectve que l ajustemet est valable, o calcule le coeffcet de corrélato léare : r cov(, ) σ σ 9

Ce coeffcet est comprs etre et +. S l est vos e valeur absolu de, l ajustemet est valde (0.70 < r < ). La covarace joue u rôle aalogue à la varace das les séres statstques smples, elle est défe par : cov(, ) ( )( ) Remarque : s o fat, o retrouve la formule de la varace. Sur l eemple du tableau, calculos le coeffcet de corrélato léare. A l ade de ce tableau, o peut effectuer les calculs suvats : Tableau 3 de uté de calores famlle cosommato par jour 5,3 3 8,09 69 68,9 7, 8 5,84 34 9,6 3 5,6 9,4 3,36 88,36 5,64 4 7, 5,4 50,4 37,6 09,34 5 5 7,8 5 60,84 39 6 3,3 9,3 0,89 86,49 30,69 7 5, 0, 7,04 0,0 5,5 8 4,5 7, 0,5 50,4 3,95 9 4 8,9 6 79, 35,6 0 4,4 4 9,36 8,8 5,7, 3,49 46,4 68,97 4,7,5,09 3,5 54,05 TOTAL 59,6 7 39,46 495,5 68,06 59,6 4,97 5 utés de cosommato 7 3 0.58 0,6.0 calores. 39,46 V() (4,97),95 σ.4 utés de cosommat o V ( ) 495.5 (0.58 ) 3 σ 3,55.0 calores.6 0

68.06 cov(, ) 4.97 0.58 4.6 Le coeffcet de corrélato est alors : r cov(, ) σ σ 4.6.4 355 Sas dquer ue boe corrélato (l faudrat qu l sot supéreur à 0.95), ce coeffcet autorse l ajustemet léare. 0.86 IV. Applcato de la méthode des modres carrés à des doées dvduelles 4.. Prcpe de la méthode La drote défe au paragraphe (3.3) a pour équato : ŷ a + O recherche les paramètres a et b. La dfférece des ordoées etre u pot(, ) et le pot de la drote aat même abscsse est : b ŷ a b La somme des carrés de ces dfféreces dot être mmum : S ( a b) mmum Pour défr les coeffcets a et b, o développe S et o le cosdère successvemet comme u trôme e b, pus b état détermé, comme u trôme e a. O trouve : b a a ( )( O recoaît au umérateur la covarace de et de et au déomateur la varace de, au coeffcet près. ) ( )

a cov(, ) V ( ) La forme du coeffcet b permet de costater que la drote d ajustemet passe par le «pot moe» (,). So équato est : ŷ + a ( ) 4.. Applcato à l eemple du tableau 3 : E utlsat les formules c-dessus, o trouve : 4.6 a.95.8 ŷ a + b a + a + a( ) ŷ 0.6 +.( 5) drote d'estmato de e. 4.3. Drote d estmato de e Le calcul précédet fat jouer u rôle dssmétrque à et à. Or re au pla statstque e permet de dre s ue varable déped de l autre. Il est alors auss logque de recommecer les calculs précédets, mas e versat les rôles des deu varables. O déft ue drote d estmato de e, d équato : cov(, ) 4.6 ˆ + a ( ) avec a 0.34 V().6 ˆ 5 + 0.34( 0.6) qu peut s' écrre 5 ŷ + 0.6 ŷ 0.6 + 3( 5) 0.34 f () Elle dffère de la précédete par sa pete. 30 b. de calores par jour 5 0 5 0 5 0 0 4 6 8 0 b. d'utés de cosommato

4.4. Retour sur le coeffcet de corrélato léare Les deu drotes d estmato trouvées sot dfféretes. Le carré du coeffcet de corrélato léare est précsémet égal au produt des petes. cov(, ) cov(, ) a a V ( )V ( ) σ σ r aa 0.86 0.75 r S les deu drotes étaet detques, r serat e valeur absolue égal à. S les drotes sot proches, r est vos de. Par cotre s r est vos de 0, les deu petes sot lo d être verse l ue de l autre, et par coséquet les drotes d ajustemet sot sesblemet dfféretes : les pots représetatfs sot lo d être réellemet algés. V. Applcato de la méthode des modres carrés à des doées groupées 5.. Méthode Le prcpe de la méthode est le même, calculer s écessare les cetres de classes. Le tableau c-dessous représete la répartto des dstaces parcourues par des véhcules après u coup de fre selo la vtesse. dstace (m) vtesse (km/h) 70 80 90 00 0 0... j j 0 3 4 5 3 3 5 75 875 5 75 565 30 5 5 30 35 050 36750 300 76,67 80500 40 3 3 9 4 78 50 3900 95000 6980 89,49 349000 60 4 6 5 56 70 390 74400 5300 94,64 37000 80 00 5 0 6 5 33 90 970 67300 3375 0,3 303750.j 47 48 55 40 0 00 95 77535 880 09875 j.j j 355 4080 55 400 50 880.j j 64375 346800 496375 44000 350 680800 j 00 645 3570 880 800 95 75 85 95 05 5 4,9787 55,047 64,90909 7 80 j 5500 485 33950 30400 9000 09875 Les coloes.,. et les lges.j j et.j j permettet de calculer les caractérstques des deu dstrbutos margales. 3

880 90.9 km / h 00 680800 V() (90.9) 00 σ.9 km/h 4.9 95 59.58 m 00 77535 V() (59.58) 00 σ 8. m 37.44 5.. Dstrbutos codtoelles : courbes de régresso Sur ce tableau l est possble d aalser les dstrbutos codtoelles. E calculat sur ue lge j j j Il est possble de calculer, c est à dre la moee (codtoelle) de pour u doé (plus eactemet, pour comprs etre les lmtes de classes). As pour comprs etre 30 et 40 m. (lge ) : j j j j j 300 30 76.67 km/h. De même, e coloe, o calcule les moees codtoelles de pour doé. Pour comprs etre 00 et 0 km/h : 4 4 7 m. Il serat possble de même de calculer les écart-tpes codtoels. L esemble des pots de coordoées (, ) costtue la courbe de régresso de e, et l esemble des pots de coordoées (, ) costtue la courbe de régresso de e. Ces deu courbes représetet valablemet la dstrbuto. O peut e dédure que s o roule à telle vtesse, o s arrête e moee e tat de mètres. Ou s l o a beso de tat de mètres pour s arrêter, c est qu o roulat e moee à telle vtesse. Il est guère possble de décrre effcacemet l esemble des 00 observatos. 4

Fgure dstace e m 00 90 80 70 60 50 40 30 0 70 80 90 00 0 0 30 vtesse e km/h courbe de régressode e courbe de régressode e Léare (courbe de régressode e ) Léare (courbe de régressode e ) 5.3. Coeffcet de corrélato léare O peut costater que les deu courbes de régresso sot sesblemet dfféretes de drotes. Il est possble e effet de vérfer que le coeffcet de corrélato léare etre et est assez mauvas. Pour obter la covarace o calcule : j j j j j j j j j 09875 cov(, ) (90.9)(59.58 ) 00 D où le coeffcet de corrélato léare : 33.55 33.55 r 8..9 0.6 Ce coeffcet est presque égal à 0.60, ce qu est fable. L ajustemet léare e représete pas u bo résumé des observatos. Pusqu l est toujours possble de calculer les drotes des modres carrés, ous allos vérfer que l ajustemet léare est mauvas e calculat les équatos de ces drotes. 5.4. Drotes d estmato par la méthode des modres carrés Pour la drote d estmato de e : cov(, ) 33.55 a V ( ) 4.9 0.95 5

D où l équato : ŷ + a ( ) 59.58 + 0.95 ( 90.9 ) Pour la drote d estmato de e : cov(, ) 33. 55 a V ( ) 37. 44 0. 4 L équato est, e rétablssat les aes : ˆ ˆ + a ( ) ŷ + ŷ 59.58 +.44 ( 90.9) a Ces deu drotes, tracées sur la fgure, sot dfféretes ; par cotre, elles e sot pas très élogées chacue de la courbe de régresso correspodate. Ce résultat eplque la fréquete cofuso etre «courbe de régresso» et «drote d ajustemet par la méthode des modres carrés». VI. Ajustemet o léare Il peut arrver que les pots représetat ue sére double e soet pas algés, mas soet voss d ue courbe coue. O se sert alors e gééral de la méthode des modres carrés, mas e trasformat au préalable l ue des varables. As, u ajustemet etre et doe u ajustemet de la forme a + b ; u ajustemet etre et l doe : b e a. Relatos usuelles : a 0 ab ca ab + a ep( b ) a + b log c a b - a + a b a (géométrq ue) (Gompertz) ep( a b + d b b (parabole) ) (Webull) Il est égalemet possble de réalser des ajustemets léares ou o, à pluseurs varables, toujours sur le prcpe de la méthode des modres carrés. 6

VII. Quelques cosels pour l ajustemet léare - Fare d abord ue étude graphque. O dstguera as s u ajustemet, léare ou o peut se justfer. - U coeffcet de corrélato est comprs etre et +. - Calculer le coef. de corrélato avat d effectuer l ajustemet, s ce coef est trop fable e valeur absolue, e pas cotuer les calculs (chercher u ajustemet o léare) - La covarace est du même sge que la pete de la drote ajustée. 7

CHAPITRE 4 : LES PRINCIPALES LOIS DE PROBABILITE I. Lo bomale Lorsque les évetualtés se réduset à ue alteratve («succès» ou «échec»), la varable aléatore «ombre de succès» sut ue lo de probablté appelée lo bomale défe par : - chaque épreuve doe leu à deu évetualtés eclusves de probablté costate p (succès) et doc q-p (échecs). - Les épreuves répétées sot dépedates. La lo bomale est otée B(,p) et a pour caractérstque : E(X)p V(X) (p p ) p( p) pq et σ pq Remarques : la lo bomale est smétrque pour p/, et dssmétrque so, la dssmétre est d autat plus forte : - Pour fe, que p est dfféret de q - Pour p fe, que est pett. II. Lo hpergéométrque Das le cas de la lo bomale, la proporto p d élémets possédat le caractère recherché est fe, ce qu peut chager s par eemple le trage se fat sas remse. Pour ue populato d effectf N dot o tre u échatllo d effectf sas remse : E ( X ) p et V ( X ) pq N N S N est grad par rapport à et s p est pas trop vos de 0 ou de, l est possble de fare ue appromato de la lo hpergéométrque par la lo bomale. III. Lo de Posso O appelle processus de Posso, la réalsato d évéemets aléatores das le temps et das l espace, obéssat au codtos suvates : - la probablté de réalsato de l évéemet au cours d ue pette pérode ou sur ue pette porto d espace t est proportoelle à t, sot p t, - la probablté de deu appartos sur le même t est églgeable. As des évéemets qu se réalset de faço aléatore das le temps : appels téléphoques sur u cetral, paes de maches, arrvées à u péage d autoroute ou à u guchet de vete, ou das l espace : répartto de pots au hasard sur ue drote peuvet être cosdérés comme réalsés par u processus de Posso. 8

E(X) 0 e m m! E utlsat e m m! V ( X ) m E ( X ) m Remarque : O substtue e gééral ue lo de Posso à ue lo bomale s l o a à la fos : >50 et p<5. IV. Lo ormale O parle de lo ormale ou lo de Laplace Gauss ou lo de Gauss ou ecore deuème lo de Laplace, lorsqu o a affare à ue varable aléatore cotue dépedat d u grad ombre de causes dépedates, dot les effets s addtoet et dot aucue est prépodérate (codtos de Borel). Eemple : les dmesos de pèces fabrquées dépedet du réglage de l apparel de fabrcato, des vbratos auquelles l est soums, de l homogéété de la matère premère, de la température, de l humdté Lorsque tous ces facteurs sot dépedats et qu aucu est prépodérat, o peut supposer que les dmesos suvet ue lo ormale. Ue varable aléatore cotue X est dstrbuée selo ue lo ormale s sa desté de probablté est f ( ) e σ π ( m ) σ, R la lo de probablté déped de deu paramètres : m et σ ; o la ote N(m, σ). O a l habtude d effectuer le chagemet de varable : T X σ m La lo de dstrbuto de T est alors : f (t) π e t otée N(0,). Cette lo est déommée lo ormale cetrée rédute. Remarque : f est ue focto pare. Voc les caractérstques d ue varable aléatore X dstrbuée selo N(0,) : 9

E utlsat l tégrale de Gauss : O démotre que : E(X)0, σ(x). Sa forme est : + e t dt π Remarque : La valeur m déterme l ae de smétre de la courbe. Pour ue lo N(m,σ), E(X) m médae mode Ecart-tpe σ Remarque : Du fat de la multplcté des facteurs qu terveet das de ombreu phéomèes phsologques, géétques, éco ou éthologques, le lo ormale est fodametale e bologe. V. Lo du χ de Pearso Défto : état doées ν varables aléatores ormales cetrées, rédutes et dépedates X, la somme : χ ν X sut ue lo du χ, dte à ν degrés de lberté. O calcule sa moee et sa varace : E( χ ) ν et V ( χ ) ν 30

La dstrbuto du χ ted à dever smétrque quad augmete, o peut l assmler à la dstrbuto ormale pour ν>30. Importate e bologe : comparasos (moee, varace), calcul des tervalles de coface, tests de coformté, d dépedace de deu caractères. VI. Lo de Studet Soet X et Z deu varables aléatores dépedates. Z sut ue lo du χ lberté et X ue lo N(0,). La varable aléatore à ν degrés de T X Z ν sut ue lo de Studet (ou lo de Studet-Fsher) à ν degrés de lberté. O calcule sa moee et sa varace pour ν > : E ( T ) 0 et V ( T ) ν ν Il este des tables de la lo de Studet qu doet t tel que : Utlsée pour les comparasos de paramètres (moee), estmato des paramètres d ue populato à partr d u échatllo. 3

VII. Lo de Fsher-Sedecor S X et X sot u couple de varables aléatores dépedates suvates deu los du χ à ν et ν d.d.l., alors : sut ue lo F(ν, ν ). X F X ν ν La lo de Fsher-Sedecor s applque lors de la comparaso de varaces epérmetales et pour l aalse de varace et covarace. Sa focto de desté est toujours postve : 3

33