Statistiques. 2. Statistique descriptive monovariée Objectifs de la statistique descriptive monovariée La table de fréquences...

Documents pareils
II - Notions de probabilité. 19/10/2007 PHYS-F-301 G. Wilquet 1

Semestre : 4 Module : Méthodes Quantitatives III Elément : Mathématiques Financières Enseignant : Mme BENOMAR

SYSTEME FERME EN REACTION CHIMIQUE

CHAPITRE 6 : LE BIEN-ETRE. Durée : Objectif spécifique : Résumé : I. L agrégation des préférences. Cerner la notion de bien-être et sa mesure.

Coefficient de partage

LE PRINCIPE DU RAISONNEMENT PAR RÉCURRENCE

" BIOSTATISTIQUE - 1 "

Incertitudes expérimentales

Application de la théorie des valeurs extrêmes en assurance automobile

COURS DE MATHEMATIQUE FINANCIERE A COURT ET LONG TERME Promotion : Première année de graduat

Comportement d'une suite

La France, à l écoute des entreprises innovantes, propose le meilleur crédit d impôt recherche d Europe

FEUILLE D EXERCICES 17 - PROBABILITÉS SUR UN UNIVERS FINI

UNIVERSITE MONTESQUIEU BORDEAUX IV. Année universitaire Semestre 2. Prévisions Financières. Travaux Dirigés - Séances n 4

Mathématiques Financières : l essentiel Les 10 formules incontournables (Fin de période)

OBLIGATION DU SECTEUR PRIVE : EVALUATION ET OUTIL DE GESTION DU RISQUE DE TAUX D INTERET

GIN FA INSTRUMENTATION P Breuil

TD 1. Statistiques à une variable.

II LES PROPRIETES DES ESTIMATEURS MCO 1. Rappel : M1 LA REGRESSION : HYPOTHESES ET TESTS Avril 2009

Conception d un outil décisionnel pour la gestion de la relation client dans un site de e-commerce

Dénombrement. Chapitre Enoncés des exercices

20. Algorithmique & Mathématiques

Les sinistres graves en assurance automobile : Une nouvelle approche par la théorie des valeurs extrêmes

Conception d un outil décisionnel pour la gestion de la relation client dans un site de e-commerce

2 ième partie : MATHÉMATIQUES FINANCIÈRES

Chapitre 3 : Fonctions d une variable réelle (1)

Consolidation. C r é e r un nouveau classeur. Créer un groupe de travail. Saisir des données dans un groupe

Chap. 5 : Les intérêts (Les calculs financiers)

Limites des Suites numériques

STATISTIQUE AVEC EXCEL

Groupe orthogonal d'un espace vectoriel euclidien de dimension 2, de dimension 3

Statistique descriptive bidimensionnelle

L Analyse Factorielle des Correspondances

Deuxième partie : LES CONTRATS D ASSURANCE VIE CLASSIQUES

Ressources pour le lycée général et technologique

Une méthode alternative de provisionnement stochastique en Assurance Non Vie : Les Modèles Additifs Généralisés

Module 3 : Inversion de matrices

Divorce et séparation

Généralités sur les fonctions 1ES

LES ÉCLIPSES. Éclipser signifie «cacher». Vus depuis la Terre, deux corps célestes peuvent être éclipsés : la Lune et le Soleil.

SÉRIES STATISTIQUES À DEUX VARIABLES

. (b) Si (u n ) est une suite géométrique de raison q, q 1, on obtient : N N, S N = 1 qn+1. n+1 1 S N = 1 1

Contrats prévoyance des TNS : Clarifier les règles pour sécuriser les prestations

EXERCICES : DÉNOMBREMENT

Polynésie Septembre Exercice On peut traiter la question 4 sans avoir traité les questions précédentes.

Intégration et probabilités ENS Paris, TD (20)13 Lois des grands nombres, théorème central limite. Corrigé :

Université Victor Segalen Bordeaux 2 Institut de Santé Publique, d Épidémiologie et de Développement (ISPED) Campus Numérique SEME

Sommaire Chapitre 1 - L interface de Windows 7 9

Exo7. Déterminants. = 4(b + c)(c + a)(a + b). c + a c + b 2c Correction. b + a 2b b + c. Exercice 2 ** X a b c a X c b b c X a c b a X

Exercices d Électrocinétique

Mesure avec une règle

Les jeunes économistes

Remboursement d un emprunt par annuités constantes

TRANSFERT DE CHARGE DANS UN RÉSEAU DE PROCESSEURS TOTALEMENT CONNECTÉS (*) par Maryse BÉGUIN ( 1 )

Dénombrement. Introduction. 1 Cardinaux d'ensembles nis. ECE3 Lycée Carnot. 12 novembre Quelques dénitions

14 Chapitre 14. Théorème du point fixe

Chapitre 3 : Transistor bipolaire à jonction

Séquence 5. La fonction logarithme népérien. Sommaire

Principes et Méthodes Statistiques

Etude de la fonction ζ de Riemann

CHAPITRE 14 : RAISONNEMENT DES SYSTÈMES DE COMMANDE

Etude Spéciale SCORING : UN GRAND PAS EN AVANT POUR LE MICROCRÉDIT?

Mobile Business. Communiquez efficacement avec vos relations commerciales 09/2012

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation

1 Mesure et intégrale

GEA I Mathématiques nancières Poly. de révision. Lionel Darondeau

Exercice I ( non spé ) 1/ u 1 = u / Soit P la propriété : u n + 4. > 0 pour n 1. P est vraie au rang 1 car u 1

RECHERCHE DE CLIENTS simplifiée

Les Nombres Parfaits.

La maladie rénale chronique

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation

STATISTIQUE : TESTS D HYPOTHESES

Interface OneNote 2013

Montage émetteur commun

LES MESURES CLÉS DU PROJET DE LOI ÉCONOMIE SOCIALE ET SOLIDAIRE

Le marché du café peut être segmenté en fonction de deux modes de production principaux : la torréfaction et la fabrication de café soluble.

Gérer les applications

capital en fin d'année 1 C 0 + T C 0 = C 0 (1 + T) = C 0 r en posant r = 1 + T 2 C 0 r + C 0 r T = C 0 r (1 + T) = C 0 r 2 3 C 0 r 3...

55 - EXEMPLES D UTILISATION DU TABLEUR.

[ édité le 10 juillet 2014 Enoncés 1. Exercice 6 [ ] [correction] Si n est un entier 2, le rationnel H n =

One Office Voice Pack Vos appels fixes et mobiles en un seul pack

MUTUELLE D&O MUTUELLE D&O. Copilote de votre santé. AGECFA-Voyageurs CARCEPT CARCEPT-Prévoyance CRC CRIS CRPB-AFB

Baccalauréat S Asie 19 juin 2014 Corrigé

BTS GPN 2EME ANNEE-MATHEMATIQUES-MATHS FINANCIERES MATHEMATIQUES FINANCIERES

Grandeur physique, chiffres significatifs

Editions ENI. Project Collection Référence Bureautique. Extrait

Examen final pour Conseiller financier / conseillère financière avec brevet fédéral. Recueil de formules. Auteur: Iwan Brot

Assurance maladie et aléa de moralité ex-ante : L incidence de l hétérogénéité de la perte sanitaire

Télé OPTIK. Plus spectaculaire que jamais.

Estimation des incertitudes sur les erreurs de mesure.

STATISTIQUE AVANCÉE : MÉTHODES

Cours de Statistiques inférentielles

Une action! Un message!

c. Calcul pour une évolution d une proportion entre deux années non consécutives

Calculer le coût amorti d une obligation sur chaque exercice et présenter les écritures dans les comptes individuels de la société Plumeria.

Simulations interactives de convertisseurs en électronique de puissance

Compte Sélect Banque Manuvie Guide du débutant

Séries réelles ou complexes

santé Les arrêts de travail des séniors en emploi

Quand BÉBÉ VOYAGE. Guide pratique sur les précautions à prendre

Transcription:

Statstques Statstques. Statstque descrptve moovarée.... Objectfs de la statstque descrptve moovarée.... La table de fréqueces... 3.3 Les représetatos graphques... 5.3. Fréqueces... 5.3. Fréqueces cumulées... 7.3.3 Valeurs cumulées... 8.4 Les caractérstques de posto... 9.4. Mode... 9.4. Moyee arthmétque... 9.4.3 Moyees gééralsées... 0.4.4 Médae....4.5 Autres fractles....5 Les caractérstques de dsperso... 3.5. Etedue... 3.5. Itervalle ter-quartles, ter-décles... 3.5.3 Ecart absolu moye. Ecart-type... 3.6 Cocetrato... 5 Mchel Armatte - 004

Statstques. Statstque descrptve moovarée. Objectfs de la statstque descrptve moovarée Partos du tableau de doées dvduelles tel qu'l a été déf au chaptre précédet, avec les dvdus e lge et les varables e coloe. S o lt u tableau de doées dvduelles lge par lge, o retrouve pour chaque lge la sute des modaltés j des dfféretes varables pour u même dvdu, et l'o obtedra as ue sorte de portrat de cet dvdu qualfé par ses réposes au dfféretes questos de l'equête. Cec correspod à ue sorte de sythèse de la méthode moographque, avec toute la rchesse de chaque "portrat", mas avec auss so mpossble gééralsato. S au cotrare o lt ce tableau coloe par coloe, o répod pour chaque varable à la questo de la répartto des modaltés sur la populato étudée. O perd alors de vue tout ce qu fasat l'uté, la cohérece, et la spécfcté de chaque dvdu, vsble das so "portrat-lge". Mas o gage quelque chose de ouveau das cette lecture vertcale, qu est l'dée statstque de répartto ou dstrbuto. La statstque descrptve moovarée a pour objectf de résumer cette formato sur la dstrbuto d'ue varable das ue populato par des résumés graphques et umérques qu dépedet du type de la varable. Résumer c'est be sûr perdre de l'formato, mas c'est auss gager de la pertece. Il est mpossble d'utlser ou de trasmettre à quelqu'u d'autre ue formato auss rche que celle qu est das u fcher de doées dvduelles sas e fare ue sythèse. L'formato utle 'est pas l'formato brute du fcher, c'est celle qu permet de sasr ue structure de la populato das ses grades lges, de coaître juste ce qu'l faut pour predre les boes décsos, sas se perdre das les détals. Il faut doc appredre à résumer sas trahr et e perdat u mmum d'formato. Les techques de résumé sot successvemet celles de la table de fréquece, de sa représetato graphque, des caractérstques de posto et e partculer de valeurs cetrales, celles de dsperso et de cocetrato. Mas atteto, les résumés d'ue même caractérstque sot multples et l covet de be coaître : a) leur domae de valdté, et e partculer leur pertece pour chaque type de varable (cf. leço précédete), b) leurs proprétés sytaques (formules) et sématques (sgfcatos), qu gudet le cho de l'ue ou l'autre comme résumé. Mchel Armatte - 004

Statstques. La table de fréqueces Le dépoullemet d'ue equête passe e premer leu par ce qu'o appelle ue sére de trs à plat, ou trs de profodeur, fats sur ue seule varable à la fos. U tel tr sur ue coloe (ue varable) du tableau des doées dvduelles ( j ) se fasat par marquage mauel (bâtos ou carrés de 5 bâtos) lorsque le dépoullemet état mauel. Etre 890 et 950, l s'est fat par la mécaographe avec des doées sases sur cartes perforées. Aujourd'hu l se fat par u programme formatque qu lt le champ N j de tous les eregstremets-dvdus et crémete des compteurs dfférets pour chacue des k modaltés de la varable. Le résultat d'u tel tr est ue table de fréquece das laquelle o a perdu l'formato de qu a telle modalté de la varable pour e reter que combe ot cette modalté. a) S la questo état ue questo ouverte, ce balayage peut codure à ue lste très logue de modaltés dfféretes (certaes dfféreces e sot parfos que typographques ou orthographques) qu'l faut eploter et reclasser "à la ma" ou avec des outls d'aalyse tetuelle. b) S la questo est qualtatve mas précodée (omale ou ordale), ou ecore quattatve (cardale) dscrète avec u pett ombre de modaltés, le tr codut à ue table de fréquece qu, à la ème modalté, fat correspodre l'effectf de ceu qu ot cette modalté, ou be ecore la fréquece relatve f défe comme rapport de cette effectf à l'effectf total : f = /. Atteto ue fréquece relatve est toujours u ombre comprs etre 0 et qu s'eprme e gééral sous ue forme décmale (par e. 0,473, que l'o peut dre s l'o veut comme ue fracto : 47,3/00 ou comme u pourcetage : 47,3%). La table de fréquece est doc ue table à autat de lges (k) que de modaltés et à deu coloes au mmum : (, ) ou (, f ) pusque l'o sat toujours passer de à f. Mas o peut y rajouter des coloes supplémetares au fur et à mesure des calculs. E partculer, o peut rajouter des cumuls, das le cas où cela a u ses, c'est à dre pour ue varable dot les modaltés sot ordoées. O appellera N le cumul des effectfs et F le cumul des fréqueces f : = = N k k = k N est le cumul des k pour k varat de à. C'est le ombre d'dvdus ayat au plus la modalté k = k = k N F = f k = = : k = k = F est le cumul des f k pour k varat de à. C'est la fréquece relatve d'dvdus ayat au plus la modalté. f N F Valeur Effectf Fréquece Effectf cumulé Fréquec e cumulée = f N F =k k k f k Total Mchel Armatte - 004 3

Statstques O pourrat auss défr les effectfs et fréqueces cumulées descedats de ceu qu ot ue modalté supéreure à. Comme ces ombres sot respectvemet les complémets à et à de N et F, ous e le feros pas. c) S la varable est quattatve cotue (ou quas cotue avec u grad ombre de modaltés) cette table de fréquece aura u grad ombre de lges (autat que d'dvdus à la lmte) et elle costtuera u très mauvas résumé de l'formato. O préfère das ce cas recoder la varables e regroupat les modaltés observées par classes de valeurs. O parle alors de varable classée. Ces classes peuvet être prédétermées (avat equête) ou défes a posteror e focto des besos de l'aalyse. Il faut e chosr le ombre : classes grossères et peu ombreuses, fes et ombreuses. Il faut e chosr la largeur : classes de largeurs égales (ce qu faclte les calculs et les représetatos) ou classes d'effectfs égau (qu doe ue représetato plus souceuse des déséqulbres observés). Das le cas d'ue dstrbuto uforme (c'est à dre avec le même effectf par uté de largeur), et das ce cas seulemet, ces deu derers cho se cofodet. Das le cas d'ue varable classée o défra comme l'effectf de la classe de modaltés [ -, ] pour laquelle est la bore supéreure (cluse) de la ème classe. O e dédut de la même faço qu'e b) la fréquece f de cette même classe as que les effectfs cumulés N et les fréqueces cumulées F. Mchel Armatte - 004 4

Statstques.3 Les représetatos graphques L'objectf d'ue représetato graphque est de tradure ue dstrbuto de gradeur e ue mpresso vsuelle sythétque. Il covet de be chosr la règle sématque du graphque c'est à dre la correspodace etre objet arthmétque et objet géométrque - pour que cette traducto e sot pas ue trahso et procure ue mage o déformate de la réalté..3. Fréqueces Les effectfs des modaltés d'ue varable sot représetés par des élémets graphques qu vot tradure leurs valeurs par des élémets géométrques de talle proportoelle. La représetato graphque des fréqueces relatves f sera la même que celle des effectfs pusque ces deu séres de ombres sot elles mêmes proportoelles etre elles. La représetato graphque déped du type de l'échelle de mesure utlsée (vor ecart). a) S l'o a affare à ue varable qualtatve omale, la seule proprété des modaltés est de costtuer ue partto de catégores eclusves et complémetares. O chost l'mage du camembert, ou e aglas de la tarte (pe), pour représeter cela, avec la proprété sématque suvate : chaque effectf est représeté par ue "part" c'est à dre u secteur dot l'agle (et par coséquet la surface) est proportoel à ce ombre : Effectf agle α = k où k est u facteur de proportoalté déf par : k 360 α = 360 = 360 k = 360 k = 360 = α α L'agle qu représete l'effectf de la modalté est das la proporto f du cercle complet. b) S l'o a affare à ue varable qualtatve ordale l vaudra meu abadoer cette représetato pour ue autre qu sache tradure l'ordre des modaltés. O prvlége alors ue représetato e "tuyau d'orgue" ou e "bâtos" das u graphque cartése à deu aes dot celu des abscsses tradut l'ordre des modaltés et l'ae des ordoées tradut la valeur de ou f. Atteto : le tableur Ecel appelle ce graphque à tort u hstogramme. c) S la dstrbuto représetée est celle d'ue varable quattatve dscrète, le prcpe de la représetato est ecore celu du dagramme e bâtos, mas cette fosc l'ae des abscsses tradut plus qu'u ordre : l red compte par ue échelle approprée d'ue sute de valeurs umérques (souvet etères) dot les écarts ot u ses : l'écart etre et 5 dot par eemple être trple de celu qu este etre et. Atteto le tableur Ecel appelle ce graphque à tort u hstogramme. Mchel Armatte - 004 5

Statstques d) S la varable étudée est (quas) cotue et que l'o a dû regrouper les modaltés e ombre (très grad) f das des classes, l faut be vor que l'o a perdu ue parte de l'formato du fcher e passat à la table des fréqueces par classes. Le fat de représeter les effectfs par des rectagles est la coséquece d'ue hypothèse mplcte de répartto uforme das chaque classe que l'o substtue à l'formato perdue. Deu cho sot possbles. Le premer cho (règle ) cosste à représeter les effectfs par des rectagles de hauteur proportoelle à ces ombres. Ue telle règle a cepedat l'covéet majeur de doer ue représetato graphque qu déped de la faço dot o a fat les classes. S l'o regroupe deu classes cotguës, leurs effectfs vot s'ajouter et la hauteur du rectagle correspodat de l'hstogramme va augmeter de faço arbtrare pusque re 'a chagé das la dstrbuto des effectfs. Vce versa s l'o affe le découpage e dvsat e deu ue classe les effectfs et dot les hauteurs des rectagles serot abassés artfcellemet. Cette règle permet toute mapulato des représetatos foures : o pourrat déformer à losr l'hstogramme e jouat sur le découpage e classe. Hstogramme orgal Règle : h = k Règle : h = k /l E représetat les effectfs par la surface des rectagles (règle ), o évte cette sesblté du graphque au découpage e classe. E effet cette ouvelle règle cosste à predre : Surface rectagle = hauteur largeur = h l = k doc h = k / l Ce qu revet à dre que la hauteur est cette fos-c proportoelle à l'effectf par largeur de classe, ce que l'o peut appeler la desté. Avec cette ouvelle règle, le regroupemet de deu classes codut à remplacer deu rectagles de hauteur h et h par u seul rectagle dot la hauteur est moyee etre les deu autres. La surface totale est la même das les deu cas. C'est ce qu'o appelle le prcpe de coservato des ares. (vor auss la smulato). Notos pour fr que le tableur Ecel e sat pas représeter u vra hstogramme das le cas de classes de largeurs égales. Il est écessare de recourr à u artfce termédare pour y arrver. L'hstogramme pred auss le om de courbe de desté emprque. Le polygoe des fréqueces que l'o vot parfos dessé e jogat les cetres du côté haut des rectagles est le plus souvet sas sgfcato. Auss est-l préférable de e pas utlser cette représetato. Le seul térêt de celle-c est das la courbe de desté cotue qu'l peut représeter à la lmte, lorsque le ombre des classes ted vers l'f (et leur largeur vers zéro), comme o le verra e calcul des probabltés. Mchel Armatte - 004 6

Statstques.3. Fréqueces cumulées a)le graphque des fréqueces cumulées 'este pas s celles-c 'ot pas de sgfcato, ce qu est le cas d'ue varable omale. b) Das le cas d'ue varable ordale, les fréqueces cumulées ot u ses même s la varable est qualtatve parce que l'o peut répodre à la questo combe de persoes ot au plus telle modalté. Ce ombre N peut être représeté par u tuyau ou bâto de hauteur N. O obtet as u dagramme e bâtos cumulés. N c) Das le cas d'ue varable quattatve dscrète l e est de même, mas o peut auss répodre à la même questo pour des valeurs termédares etre deu valeurs observées. Par eemple "combe de persoes ot au plus,5 efats" a pour répose le même ombre que "combe de persoes ot au plus efats" : c'est le ombre de celles qu e ot 0 plus le ombre de celles qu e ot. Et cette répose serat la même pour, ; pour,8 et pour,9999. Ce qu codut à tracer u segmet de drote horzotal etre et,9999 avec u saut à ue autre valeur dès que l'o arrve à parce qu'l faudra rajouter au précédet ceu qu ot deu efats. Le graphque obteu est alors celu d'ue courbe e escaler avec dscotuté à drote à chaque valeur observée. N d) Das le cas de doées umérques classées (varable quas cotue), o peut ecore fare correspodre au valeurs des fs de classe (et pas des mleu de classe) les effectfs cumulés N de tous ceu qu ot au plus cette valeur. Mas aucue courbe e pourrat être tracé etre les pots (, N ) s l'o e fasat ue hypothèse partculère. E effet cette courbe déped de la répartto des dvdus das la classe. Ue cocetrato d'dvdus au début de la classe et la courbe des destés sera décrossate tads que celle des cumuls sera covee. A l'verse s'ls se stuet e majorté e f de classe, la courbe de desté sera crossate et la courbe des cumuls sera cocave. C'est seulemet sous l'hypothèse (courate) d'ue répartto uforme das la classe que l'o a ue desté costate (rectagle) et ue courbe de cumul léare : o accumule régulèremet des effectfs quad o avace das la classe. Cette hypothèse permet alors de jodre les pots (, N ) par des segmets de drote et la courbe pred la forme d' u polygoe de fréqueces cumulées, ou courbe de la focto de répartto emprque. Mchel Armatte - 004 7

Statstques N e) Le etre desté et répartto : Pour ue valeur quelcoque a la valeur F(a) de la courbe de répartto correspod à la part de la surface de l'hstogramme (ou courbe de desté) stuée à gauche de cette même valeur a. F(a) N F(a).3.3 Valeurs cumulées a Mchel Armatte - 004 8

Statstques.4 Les caractérstques de posto L'dée cetrale de cette secto est celle de résumé umérque. Commet sythétser ue dstrbuto statstque par quelques ombres be choss. E partculer commet défr le mleu d'ue dstrbuto de valeurs. Les astroomes du XVIIIème sècle ot utlsé ce terme (cf. ecyclopéde méthodque) das leurs recherches sur le mleu à predre etre pluseurs observatos, pour estmer le "leu vra" d'u corps céleste. Commet, de pluseurs mesures dscordates pour dverses causes d'erreur, peut o dédure ue vrae valeur? Ue questo assez dfférete s'est posée e sceces socales das le cadre de la théore des moyees du belge Quetelet au mleu du XIXème sècle : commet décrre ue populato humae? E s'appuyat dt-l sur so cetre de gravté, l'homme moye. Les réposes à la questo des astroomes peuvet alors être trasposées e sceces socales..4. Mode Le mode est la valeur la plus fréquete. La valeur "à la mode" e quelque sorte. Celle pour laquelle la desté est mamale. Elle est défe auss be pour ue varable omale que pour ue varable ordale ou cardale (umérque). Il sufft de chercher das la table de fréquece la fréquece mamale : la modalté correspodate est le mode. S la varable est (quas) cotue le mode correspodra au mamum de la desté. E fat l'formato dspoble s la varable est classée e permet pas de détermer ue valeur modale mas seulemet ue classe modale : celle pour laquelle la desté (ou l'effectf par uté de largeur de classe / l ) est mamale..4. Moyee arthmétque a) La moyee arthmétque est la valeur fctve de la gradeur étudée qu caractérserat chaque dvdu, s l'o répartssat égalemet le total de toutes les valeurs etre tous les dvdus. Elle résulte doc d'ue smple dvso du total des valeurs de la varable par le ombre d'dvdus. Cette moyee, otée peut s'eprmer de deu faços : = = = k j= : c la somme porte sur les dvdus qu varet de à j j : c la somme porte sur les k modaltés j de la varable, et e gééral k est be plus pett que. mas l faut podérer chaque valeur j par le ombre de fos j où o l'a observée. Sot par eemple la sute de 0 ombres :, 5, 7,, 8,,, 5,, 5 Le premer calcul doe = (+5+7++8+++5++7) /0 = 5/0 = 5, Le secod calcul doe = (4* + *5 + *7 + *8 + *) /0 = 5/0 = 5, b) Proprétés de la moyee arthmétque - Elle 'est défe que s l'addto des modaltés a u ses, ce qu est le cas pour des varables umérques (quattatves dscrètes ou cotues) - La moyee e gééral "e tombe pas juste". Ce 'est pas forcémet ue valeur possble. C'est ue fcto. Mchel Armatte - 004 9

Statstques - Elle est très sesble et doc peu robuste : l'ajout d'u u dvdu à valeur eceptoellemet fable ou forte modfe de faço mportate sa valeur. - Léarté : S j'ajoute ue costate b à toutes les valeurs la moyee augmet de b : + b = + b - Léarté : S je multple toutes les valeurs par ue costate a la moyee est multplée par a : a = a - Ehaustvté : S je coas les moyees partelles A et B de deu groupes dsjots A et B d'effectf A et B alors je peu e dédure la moyee géérale du groupe A B : A BB = A +.4.3 Moyees gééralsées La moyee arthmétque 'est pas toujours la moyee qu a les boes proprétés. a) Sot ue somme de 000 F placée pedat u a à 5% pus u a à 5% pus u a à 5%. Le tau moye est-l de (5+5+5)/3 = 5%? No! Il dot vérfer : 000 (+0,05)(+0,5)(+0,5) = 000 (+t m ) 3 sot (+t m ) = [(+0,05)(+0,5)(+0,5)] /3 Ce qu doe t m = 4,7%. La formule précédete s'écrt : log(+t m ) = (Log,05 + Log,5 + Log,5)/3 sot "Log de la moyee = moyee arthmétque des Log des valeurs" La formule précédete déft ue moyee géométrque, utle chaque fos que l'o cherche ue moyee de tau ou de gradeurs qu sot e crossace (quas) epoetelle. b) Sot u avo parcourat u carré de côté 00 km à la vtesse de 00 km/h sur le premer côté, 00 km/h sur le secod, 300 km/h sur le trosème, et 400 km/h sur le quatrème. Sa vtesse moyee est-elle (00 + 00 + 300 + 400)/4 = 50 km/h? No. Sa vtesse moyee est défe par le quotet d'ue dstace totale par ue durée totale. La dstace totale est de 400 km. La durée totale est : 00 00 00 00 + + + = h + 30m + 0m + 5m = h05m =, 083h 00 00 300 400 Sa vtesse moyee est doc : 400 400 V m = = = 9km/ h 00 00 00 00 + + +,083 00 00 300 400 Mchel Armatte - 004 0

Statstques Remarquos que la formule précédete peut s'écrre : v m = 00 + 00 + 4 300 + 400 sot "verse de la moyee = moyee arthmétque des verses". Cec déft ue moyee harmoque, utle chaque fos qu'o cherche ue moyee de rapports. c) Quel serat le champ moye etre 3 champs carrés de côté, 3, 5 hectomètres? Ce 'est pas u champ de côté (+3+5)/3 = 3,33 hm. Mas u champ dot la surface est la moyee des surfaces des tros carrés, doc tel que : + 3 + 5 38 a = a = = 3, 56 3 3 sot "carré de la moyee = moyee arthmétque des carrés". a est la moyee quadratque des ombres, 3 et 5. d) E gééralsat ces tros eemples, o vot que l'o peut costrure des moyees gééralsées sur le prcpe "truc de la moyee = moyee arthmétque des truc des valeurs" où "truc" désge ue trasformato des doées par ue focto mootoe du type logarthme, verse, carré.4.4 Médae a) S l'o ordoe la populato étudée des dvdus par valeur crossate de la varable étudée, avec d'évetuels e-aequo, l'dvdu méda dvse la populato étudée e deu partes de même effectf. S est mpar, c'est l'dvdu uméro (+)/. S est par, o peut héster etre l'dvdu uméro / ou (/+). Pour de grads effectfs c'est peu mportat. O appelle médae m la valeur de la varable pour l'dvdu méda. O peut la défr formellemet comme la soluto m de l'équato F(m) = 0,5 das laquelle F est la focto de répartto. Cocrètemet o peut l'obter sur le graphque de cette focto (établ à partr des fréqueces cumulées) de la faço suvate : N N / / m a m b Das le cas d'ue varable ordale ou quattatve dscrète, la médae est ue valeur de la table de fréqueces. Das le cas d'ue varable classée (graphque de drote) Mchel Armatte - 004

Statstques o e peut e prcpe que stuer la médae das ue classe. L'hypothèse de répartto uforme das la classe permet cepedat de précser la valeur de la médae par u calcul d'terpolato léare : s a et b sot les bores de la classe médae, et et les effectfs cumulés correspodats, alors o a : m a b a = d'où ( ) m = a + ( ) ( b a) b) Proprétés de la médae : - Elle est défe pour toute varable dot les modaltés sot ordoées. - Elle est toujours ue valeur cocrète et observable. - Elle est plus robuste que la moyee : l'ajout d'u dvdu à valeur eceptoellemet fable ou forte e chage quasmet pas la valeur de la médae. - Toute trasformato mootoe (léare ou o) sur la varable (qu e chage pas l'ordre des modaltés) doe le même dvdu méda et se répercute doc par la même trasformato sur la médae. - La médae d'u groupe e peut être détermée à partr des médaes de deu sous-groupes..4.5 Autres fractles De la même faço que ous avos déf la médae, ous pouvos défr : - les quartles : l y e a 3, otés Q, Q, Q3, qu découpet la populato étudée e quatre parts d'effectf égau (à 5% de l'effectf total). - les décles : l y e a 9, otés D, D, D9, qu découpet la populato étudée e d parts d'effectf égau (à 0% de l'effectf total). - les cetles : l y e a 99, otés C, C, C99, qu découpet la populato étudée e cet parts d'effectf égau (à % de l'effectf total). - les fractles (ou quatles) d'ordre α, otés (α) tels que F( (α) )= α : c'est la valeur de telle que la proporto des dvdus qu ot au plus cette valeur est α. Mchel Armatte - 004

Statstques.5 Les caractérstques de dsperso Le salare des hommes est o seulemet plus élevé e moyee que celu des femmes, l a plus de chace de s'éloger beaucoup de la moyee. S le premer résumé umérque d'ue dstrbuto cherche à détermer so "mleu", l faut le compléter écessaremet par ue mesure de dsperso..5. Etedue L'étedue est tout smplemet l'écart (valeur ma valeur m). C'est ue mesure très frustre de la dsperso qu a l'avatage d'être facle à calculer mas d'être peu robuste parce que beaucoup trop sesble au valeurs etrêmes..5. Itervalle ter-quartles, ter-décles Pour reméder à ce derer défaut o lu préfère par eemple l'tervalle terdécles D9-D qu est l'étedue des 80% de la populato obteue après suppresso des valeurs féreures à D et supéreures à D9. Cette mesure est plus robuste mas elle est sesble à des modfcatos de valeurs teres à cet tervalle..5.3 Ecart absolu moye. Ecart-type a) L'dée est doc de predre "ue moyee des écarts au mleu de la dstrbuto". Remarquos que ous e pouvos pas predre "la moyee arthmétque des écarts à la moyee" : car celle-c est toujours ulle car les écarts à la moyee se compeset eactemet: ( ) = = = 0 b) Ue soluto est de predre ue moyee des écarts absolus à u certa mleu a. Or o peut motrer que le mleu qu mmse cette moyee des écarts est la médae. O peut doc predre comme mesure l'écart absolu moye à la médae : EAMM = m c) Ue autre soluto qu a des proprétés mathématques plus téressates est de predre ue moyee quadratque des écarts à u certa mleu. C'est la moyee arthmétque qu mmse cette moyee. La moyee quadratque des écarts à la moyee ou écart-type ("stadard devato" e aglas) s'écrt : EQMM = σ = ( ) ( ). La quatté σ = s'appelle varace. Das la formule précédete, la somme porte sur les observatos de. S l'o veut regrouper ces observatos par valeurs, o écrra : ( ) j j j σ = das laquelle j représete l'effectf de la modalté j. Mchel Armatte - 004 3

Statstques Ef, s l'o fat les calculs à la ma ou à la calculette, o préférera la formule j : suvate obteue e développat ( ) j j j σ = : moyee des carrés mos carré de la moyee. e) Proprétés de la varace et de l'écart-type : - L'écart-type s'eprme das la même uté que la varable et s'terprète comme ue moyee des fluctuatos autour de la moyee. La varace 'a pas d'terprétato cocrète. - L'écart-type d'ue costate est zéro. - Traslato : S l'o ajoute b à toutes les valeurs de, varace et écart-type e chaget pas : σ = σ + b - Homothéte : S l'o multple toutes les valeurs de par a, l'écart-type est multplé par a (et la varace par a ) : σ = aσ - S l'o a deu groupes A et B de doées, la varace totale de se décompose e varace tra-classes et varace ter-classes : la premère est la somme des varaces à l'téreur de chaque groupe autour de la moyee de chaque groupe. La secode est la varace des moyees de groupe par rapport à la moyee géérale. a f) Coeffcet de varato. S l'o veut comparer les dspersos das deu populatos (par eemple homme et femme) o est gêé par la proprété d'homothéte : s les salares des hommes sot,5 fos ceu des femmes à poste égal, alors la moyee et l'écart type serot pour les hommes,5 fos ceu des femmes. Pour reméder à cet effet d'échelle, o cherche ce que serat les dspersos s les moyees étaet les mêmes : o se ramèe à la même moyee e comparat les rapports écart-type / moyee des deu populatos. C'est ce rapport que l'o appelle coeffcet de varato : σ CV = Mchel Armatte - 004 4

Statstques.6 Cocetrato La table de fréquece d'u varable cotue peut être complétée par le calcul des valeurs cumulées de la faço suvate : f N F = Σf v = q = f Q = Σq / Valeur moye e de la classe Effectf de la classe Fréque ce relatve Effectf cumulé Fréque ce cumulée Valeur de la classe Valeur par dvdu TOTAL Val. Tot. Moy. Valeur relatve cumulée Les quattés v = représetet à chaque lge de la table les valeurs totales de la classe. S par eemple est u salare, cette quatté est la masse salarale de la classe. Leur somme est la valeur totale sur la populato, das l'eemple la masse salarale totale. q est obteue e dvsat v par ; so total est la moyee arthmétque. Ef la quatté Q est u cumul des q rapportés à leur somme : elle doe à la lge la part de la valeur totale attrbuable à la classe. Il est alors téressat de porter sur u graphque pour chaque classe ces parts Q de la valeur totale cumulées par les classes les plus pauvres (jusqu'à la ème) e regard des parts de la populato F qu'elles représetet. E jogat ces pots par des segmets de drote (coformes à l'hypothèse de répartto uforme das chaque classe) o obtet ue courbe polygoale dte courbe de cocetrato de Loretz. Q 50% F 80% Cette courbe permet par eemple de dre que 80% des plus pauvres 'ot que 50% de la masse salarale, ou ecore que 0% des plus rches ot 50% de la masse salarale. Cette courbe occupe ue posto termédare etre la dagoale, correspodat à u égaltarsme total, et l'ae horzotal avec saut fal au pot (00%, 00%) qu correspodrat à la cocetrato mamale des bes etre les mas d'u seul dvdu. Mchel Armatte - 004 5

Statstques Le statstce tale G a proposé sur cette base le calcul d'u coeffcet de cocetrato dt de G égal au rapport des surfaces comprses etre courbe et dagoale das le cas observé et das le cas d'ue cocetrato mamale; sot e remarquat que la surface du tragle OAB est ½ : G = fos (surface comprse etre la coure de Loretz et la dagoale) As G vare de 0 à quad la courbe passe de la dagoale à l'ae horzotal. La valeur de telle que Q() = 50% s'appelle la médale. Pusque la médale est toujours supéreure à la médae (et égale à la médae das le seul cas lmte de l'égaltarsme), o peut auss predre pour mesure de la cocetrato l'écart etre médale et médae. Mchel Armatte - 004 6

Statstques Quelques pots mportats de statstque descrptve moovarée Hstogramme : Nom réservé au graphque représetat des doées classées. Le prcpe das ce cas est que l'o représete les fréqueces (absolues ou relatves) par des surfaces de rectagles. Dt autremet, les hauteurs sot proportoelles au effectfs par largeur de classe. Polygoe des fréqueces cumulées : Les pots ot pour abscsse les fs de classe et pour ordoées les fréqueces cumulées e f de classe. Ces pots sot lés par des segmets de drote, parce que l'o fat ue hypothèse de répartto uforme das chaque classe. Pour 'mporte quelle valeur a de la varable, la fréquece cumulée F(a) représete la surface de l'hstogramme à gauche de a. Courbe de cocetrato : Les pots du graphque ot pour abscsse F(s) = part cumulée des dvdus jusqu'à = s, et pour ordoée la quatté Q() = s = f / qu est la part du cumul total de la varable (reveu, surfaces ) pour ces dvdus. Quatles ou fractles : ls doet leu à ue modalté (ou valeur) observée das le cas de varables ordales ou cardales dscrètes. Das le cas de varables cotues classées et das ce cas seulemet, o peut e avor ue estmato par terpolato léare : s F(a) et F(b) sot les fréqueces cumulées des bores de la classe [a b] etre lesquelles se trouve le quatle cherché Q α (tel que F(Q α ) = α), alors (Q α - a)/(b-a) = (α-f(a))/(f(b)-f(a)) Moyee arthmétque : moy () = = Proprétés : moy(a) = a moy() Moy ( + y) = moy () + moy (y) Moyee géérale = moyee podérée des moyees de classes Moyees gééralsées : f(moy) = moy (f()). f = logarthme : moyee géométrque. f = verse : moyee harmoque. f = carré : moyee quadratque Varace = var () = σ² = ( ) f = f ( ) = f _ Proprétés : Var(a) = a² var() Var ( + y) = var() + var(y) + cov (,y) Coeffcet de varato : σ / moy() = Mchel Armatte - 004 7

Statstques Statstque descrptve moovarée Varable omale Varable ordale Varable quattatve dscrète Varable quattatve cotue Table des fréqueces absolues (effectfs) et relatves f pour chaque f A 5 0,3 B 4 0,37 C 4 0, D 7 0, E 5 0,08 Total 65,00 f F A 5 0,3 0,3 B 4 0,37 0,60 C 4 0, 0,8 D 7 0, 0,9 E 5 0,08,00 Total 65,00 f F 5 0,3 0,3 4 0,37 0,60 3 4 0, 0,8 4 7 0, 0,9 5 5 0,08,00 Total 65,00 a b f F 0 5 7,5 5 0,3 0,3 5 5 0 4 0,37 0,60 5 35 30 4 0, 0,8 5 45 35 7 0, 0,9 45 55 50 5 0,08,00 Total 65,00 Graphque des fréqueces absolues ou relatves Dagramme e secteurs crculares D E A Dagramme e tuyau d orgue 30 0 0 Dagramme e bâtos 30 0 0 30 0 0 Hstogramme (, ) ou ( ; f ) C B 0 A B C D E 0 3 4 5 0 0 0 0 30 40 50 60 Graphque des fréqueces cumulées ( ; F ) No déf Dagramme e tuyau d orgue,00 0,75 0,50 0,5 0,00 A B C D E Courbe e escaler,00 0,75 0,50 0,5 0,00 0 3 4 5,00 0,75 0,50 0,5 0,00 Polygoe des fréqueces cumulées 0 0 0 30 40 50 60 Mode valeur la plus fréquete Mode = B Mode = B Mode = Classe modale : 5-5 Quatles c α : plus pett tel que F α No défs Q = c 5% = B Me= c 50% = B Q 3 = c 75% = C Q = Me = Q 3 = 3 Q = 5,5 Me =,3 Q 3 = 3,8 Moyee f = Ecart-type s f ( ) ρ f No défe No défe =,43 = 3,7 No déf No déf s =,8 s =,5 Mchel Armatte - 004 8