Chapitre 1 : Statistique descriptive univariée

Documents pareils
Université Victor Segalen Bordeaux 2 Institut de Santé Publique, d Épidémiologie et de Développement (ISPED) Campus Numérique SEME

Principes et Méthodes Statistiques

Statistiques appliquées à la gestion Cours d analyse de donnés Master 1

STATISTIQUE : TESTS D HYPOTHESES

Statistique descriptive bidimensionnelle

Statistique Numérique et Analyse des Données

FEUILLE D EXERCICES 17 - PROBABILITÉS SUR UN UNIVERS FINI

Intégration et probabilités ENS Paris, TD (20)13 Lois des grands nombres, théorème central limite. Corrigé :

20. Algorithmique & Mathématiques

Deuxième partie : LES CONTRATS D ASSURANCE VIE CLASSIQUES

SÉRIES STATISTIQUES À DEUX VARIABLES

Cours 5 : ESTIMATION PONCTUELLE

Université Pierre et Marie Curie. Biostatistique PACES - UE

Exercice I ( non spé ) 1/ u 1 = u / Soit P la propriété : u n + 4. > 0 pour n 1. P est vraie au rang 1 car u 1

1 Mesure et intégrale

LES ÉCLIPSES. Éclipser signifie «cacher». Vus depuis la Terre, deux corps célestes peuvent être éclipsés : la Lune et le Soleil.

Baccalauréat S Asie 19 juin 2014 Corrigé

55 - EXEMPLES D UTILISATION DU TABLEUR.

Chapitre 2 SONDAGE ALEATOIRE SIMPLE OU A PROBABILITES EGALES. 2.1 DEFINITIONS 2.2 SONDAGE ALEATOIRE SIMPLE SANS REMISE (PESR) 2.2.

Cours de Statistiques inférentielles

Université de Bordeaux - Master MIMSE - 2ème année. Scoring. Marie Chavent machaven/

Etude Spéciale SCORING : UN GRAND PAS EN AVANT POUR LE MICROCRÉDIT?

Le Sphinx. Enquêtes, Sondages. Analyse de données. Internet :

Chapitre 3 : Fonctions d une variable réelle (1)

STATISTIQUE AVANCÉE : MÉTHODES

Initiation à l analyse factorielle des correspondances

Statistiques Descriptives à une dimension

Échantillonnage et estimation

II LES PROPRIETES DES ESTIMATEURS MCO 1. Rappel : M1 LA REGRESSION : HYPOTHESES ET TESTS Avril 2009

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation

UV SQ 20. Automne Responsable d Rémy Garandel ( m.-el. remy.garandel@utbm.fr ) page 1

Examen final pour Conseiller financier / conseillère financière avec brevet fédéral. Recueil de formules. Auteur: Iwan Brot

[ édité le 10 juillet 2014 Enoncés 1. Exercice 6 [ ] [correction] Si n est un entier 2, le rationnel H n =

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation

Comportement d'une suite

. (b) Si (u n ) est une suite géométrique de raison q, q 1, on obtient : N N, S N = 1 qn+1. n+1 1 S N = 1 1

II - Notions de probabilité. 19/10/2007 PHYS-F-301 G. Wilquet 1

Séries réelles ou complexes

Le marché du café peut être segmenté en fonction de deux modes de production principaux : la torréfaction et la fabrication de café soluble.

Statistique : Résumé de cours et méthodes

La France, à l écoute des entreprises innovantes, propose le meilleur crédit d impôt recherche d Europe

x +1 + ln. Donner la valeur exacte affichée par cet algorithme lorsque l utilisateur entre la valeur n =3.

Séquence 5. La fonction logarithme népérien. Sommaire

Probabilités et statistique pour le CAPES

Séries Statistiques Simples

UNIVERSITE MONTESQUIEU BORDEAUX IV. Année universitaire Semestre 2. Prévisions Financières. Travaux Dirigés - Séances n 4

COMMENT ÇA MARCHE GUIDE DE L ENSEIGNANT 9 E ANNÉE

Formation d un ester à partir d un acide et d un alcool

Dominique Tapsoba, Vincent Fortin, François Anctil et Mario Haché

GUIDE METHODOLOGIQUE INDUSTRIES, OUVREZ VOS PORTES

Solutions particulières d une équation différentielle...

Limites des Suites numériques

EXERCICES : DÉNOMBREMENT

RESOLUTION DES FLOW SHOP STOCHASTIQUES PAR LES ORDRES STOCHASTIQUES. DERBALA Ali *)

Chapitre 3 : Transistor bipolaire à jonction

Chaînes de Markov. Arthur Charpentier

Chap. 5 : Les intérêts (Les calculs financiers)

Les Nombres Parfaits.

Suites et séries de fonctions

Dares Analyses. Plus d un tiers des CDI sont rompus avant un an

Processus et martingales en temps continu

Divorce et séparation

La maladie rénale chronique

Exo7. Déterminants. = 4(b + c)(c + a)(a + b). c + a c + b 2c Correction. b + a 2b b + c. Exercice 2 ** X a b c a X c b b c X a c b a X

Exercices de mathématiques

Donnez de la liberté à vos données. BiBOARD.

Tableaux Croisés et Diagrammes en Mosaïque : Pour Voir Les Probabilités Marginales et Conditionnelles.

Neolane Leads. Neolane v6.0

Annexe commune aux séries ES, L et S : boîtes et quantiles

CHAPITRE 2 SÉRIES ENTIÈRES

c. Calcul pour une évolution d une proportion entre deux années non consécutives

STRATÉGIE DE REMPLACEMENT DE LUTTE CONTRE LA PUNAISE TERNE DANS LES FRAISERAIES DE L ONTARIO

Tempêtes : Etude des dépendances entre les branches Automobile et Incendie à l aide de la théorie des copulas Topic 1 Risk evaluation

LES MESURES CLÉS DU PROJET DE LOI ÉCONOMIE SOCIALE ET SOLIDAIRE

Consolidation. C r é e r un nouveau classeur. Créer un groupe de travail. Saisir des données dans un groupe

TRANSFERT DE CHARGE DANS UN RÉSEAU DE PROCESSEURS TOTALEMENT CONNECTÉS (*) par Maryse BÉGUIN ( 1 )

Gérer les applications

La tarification hospitalière : de l enveloppe globale à la concurrence par comparaison

Terminale S. Terminale S 1 F. Laroche

Statistiques 0,14 0,11

Dénombrement. Chapitre Enoncés des exercices

Un nouvel opérateur de fusion adaptatif. A new adaptive operator of fusion. 1. introduction

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

LE WMS EXPERT DE LA SUPPLY CHAIN DE DÉTAIL

Les algorithmes de tri

PROMENADE ALÉATOIRE : Chaînes de Markov et martingales

Simulations interactives de convertisseurs en électronique de puissance

Polynésie Septembre Exercice On peut traiter la question 4 sans avoir traité les questions précédentes.

Sommaire Chapitre 1 - L interface de Windows 7 9

Processus géométrique généralisé et applications en fiabilité

Guide des logiciels de l ordinateur HP Media Center

La gestion commerciale dans QuadraENTREPRISE. > Edition personnalisée des pièces

Réseaux d ondelettes et réseaux de neurones pour la modélisation statique et dynamique de processus

Présentation & organisation du cours. Introduction : décider en milieu industriel. Les méta-heuristiques. Le travail à réaliser

RECHERCHE DE CLIENTS simplifiée

Télé OPTIK. Plus spectaculaire que jamais.

RÈGLES ORDINALES : UNE GÉNÉRALISATION DES RÈGLES D'ASSOCIATION

POLITIQUE ECONOMIQUE ET DEVELOPPEMENT

Neolane Message Center. Neolane v6.0

Risque de longévité et détermination du besoin en capital : travaux en cours

Transcription:

Biostatistiques Licece Chapitre : Statistique descriptive uivariée Itroductio Statistique : esemble de méthodes scietifiques destiées à la collecte, la présetatio et l aalyse de doées. Jeux de doées Applicatio Résultats d u questioaire soumis à des étudiats de l UM2 : Tailles de 50 cm 50 60 60 70 70 80 80 90 + de 90 cm Effectifs 7 25 54 69 4 4 Applicatio 2 Oiseaux observés le 5/02/20 etre 8h et 9h sur u poste d observatio de l étag de Thau : Applicatio 3 Espèces Aigrette Héro Goélad Cigoge Flamat Effectifs 7 23 253 9 46 Quatité de pricipe actif e mg recueillie das 20 pilules à la sortie d ue usie pharmaceutique : 02, 04, 97, 98, 98, 0, 03, 04, 99, 96, 00, 02, 00, 98, 00, 0, 00, 97, 0, 00. Applicatio 4 Doées extraites des déclaratios d impôts 200 pour l arrodissemet de Béziers : Applicatio 5 Nombre d efats 0 2 3 4 5 6 Effectifs 6268 4233 5287 309 46 509 224 Metios des bacheliers 20 au lycée de la Borde-Basse : 2 U peu de vocabulaire 2. Populatio, échatillo, idividus Metio Passable Assez bie Bie Très bie Effectifs 6 42 33 8 populatio échatillo idividus Figure Populatio, échatillo, idividus

idividus : objets de l étude populatio : esemble des idividus échatillo : sous-esemble des idividus observés 2.2 Les variables statistiques variable : caractère d itérêt sur lequel porte l étude modalités de la variable : valeurs prises par la variable domaie de la variable : esemble de ses modalités Les variables peuvet être de différetes atures ou types : variables qualitatives quatitatives omiales lagues parlées ordiales degré de satisfactio cotiues températures discrètes ombre couleurs otes alphabétiques (A,B... ) poids d efats Âge Pour les 5 applicatios, idetifier la populatio, la variable et ses caractéristiques. 3 Orgaisatio des doées 3. Série statistique Quelques otatios : om de la variable : X taille de l échatillo : observatios de X das l échatillo (série statistique) : x = (x,, x ). observatios classées par ordre croissat : x () x (). modalités observées : m < m 2 <... < m K. Exemple : Si x = (5, 3, 2, 5), alors = 4, K = 3, x () = m = x 3 = 2, x (2) = m 2 = x 2 = 3 et x (3) = x (4) = m 3 = x = x 4 = 5. Attetio! Ne pas cofodre doées brutes (série statistique) et distributio de la variable (liste des modalités accompagées des effectifs ou fréqueces correspodats). 3.2 Doées groupées e classes Pour les variables quatitatives cotiues, les K modalités sot gééralemet des itervalles (ouverts, fermés, semi-ouverts) appelés classes. O les ote C,, C K. 3.3 Tableaux Objectif : sythétiser les doées brutes. 3.3. Variables quatitatives A chaque modalité m k (avec k =,..., K) correspod : effectif : k, ombre d idividus pour lesquels X = m k fréquece : f k = k, proportio d idividus pour lesquels X = m k effectif cumulé (croissat) : N k = + + k, ombre d idividus pour lesquels X m k fréquece cumulée (croissate) : F k = f + + f k = N k, proportio d idividus pour lesquels X m k 2

3.3.2 Variables quatitatives regroupées e classes A chaque classe C k = [b k, B k ] (ou ]b k, B k [ ou ]b k, B k ] ou [b k, B k [) correspod : effectif : k, ombre d idividus pour lesquels X C k fréquece : f k = k, proportio d idividus pour lesquels X C k effectif cumulé (croissat) : N k = + + k, ombre d idividus pour lesquels X B k fréquece cumulée (croissate) : F k = f + + f k = N k, proportio d idividus pour lesquels X B k amplitude : a k = B k b k, c est la logueur de C k. desité d effectif : d k = k a k. desité de fréquece : φ k = f k a k = d k. cetre : c k = b k+b k 2, c est le milieu de C k. Regrouper les doées de l applicatio 3 e classes. O privilégiera les classes de même largeur. Idetifier les frotières et les cetres des classes. Idem pour l applicatio. 3.4 Graphiques Objectif : résumer l iformatio d u tableau de doées. 3.4. Variables omiales Modalités o classées Ordre aléatoire Deux graphes possibles : diagramme e bâtos : chaque modalité est représetée par u segmet dot la hauteur est proportioelle à l effectif ou la fréquece de la modalité. diagramme circulaire : chaque modalité est représetée par u secteur dot l aire est proportioelle à l effectif ou la fréquece de la modalité. Illustrer l applicatio 2 par u diagramme circulaire. 3.4.2 Variables ordiales ou discrètes Diagramme e bâtos avec modalités classées par ordre croissat. Illustrer les applicatios 4 et 5 par des diagrammes e bâtos. 3.4.3 Variables cotiues Doées groupées e classes histogramme : chaque classe est représetée par u rectagle dot l aire est égale à la fréquece de la classe (la hauteur de chaque rectagle est la desité de fréquece). Illustrer les applicatios et 3 par u histogramme. 3.5 Courbe des fréqueces cumulées Uiquemet pour variables quatitatives, gééralemet cotiues. Graphe de la foctio F (t) = Card{x i t}, pour tout t R. C est ue lige brisée reliat les poits de coordoées (b, 0), (B, F ), (B 2, F 2 ),, (B K, ). O la prologe aux extrémités par des demi-droites horizotales (cf figure 2). Dessier la courbe des fréqueces cumulées pour les applicatios et 3. 3

Figure 2 Exemple d histogramme et de courbe des fréqueces cumulées pour ue variable cotiue 4 Mesures de tedace cetrale 4. Moyee (arithmétique) Pour des doées brutes Calculer la moyee pour l applicatio 3. x. = x + + x = x i. i= Pour des doées groupées, o calcule ue approximatio x c de la moyee : x c. = c + + K c K = K k c k. Calculer la moyee pour l applicatio puis la moyee par classes pour l applicatio 3. Pour des doées discrètes, x et x c coïcidet. Calculer la moyee pour l applicatio 4. 4.2 Médiae La médiae m "coupe" les observatios e deux k= Card{x i m} = Card{x i m} Pour des doées brutes m =. x ( + 2 ), si est impair, x ( 2 ) +x ( 2 +) 2, si est pair. Calculer la médiae pour l applicatio 3. Si la variable est discrète, o peut utiliser les fréqueces cumulées pour trouver m. Calculer la médiae pour l applicatio 4. 4

Pour des doées groupées, o peut utiliser la courbe des fréqueces cumulées pour trouver m. Calculer la médiae pour l applicatio. 4.3 Mode C est la valeur la plus souvet observée. Pour des doées groupées e classes, o pred le cetre de la classe la plus observée. Calculer le mode pour chacue des applicatios. 4.4 Comparaiso 4.4. Moyee et médiae Médiae : peu sesible aux valeurs extrêmes. Moyee : sesible aux valeurs extrêmes mais plus facilemet calculable. Moyee et médiae (TD). 4.4.2 Exemples de distributios Les différetes valeurs cetrales (moyees, médiae, mode) peuvet être cofodues ou différetes suivat les répartitios comme le motre l exemple de la figure 3. (a) (b) Figure 3 La moyee (rouge), médiae (bleu) et mode (vert) de deux séries statistiques. La distributio (b) est dite symétrique. 5 Mesure de dispersio 5. Variace et écart type empiriques La variace empirique d u échatillo s 2 est la moyee du carré des écarts à la moyee. Pour des doées brutes O a aussi s 2. = (x x) 2 + + (x x) 2 s 2 = x 2 i i= ( = (x i x) 2. i= ) 2 x i = x 2 x 2. i= L écart-type est la racie carrée de la variace : s = s 2. Calculer la variace et l écart type empiriques pour l applicatio 3. 5

Pour des doées groupées, o calcule ue approximatio s 2 c de la variace : s 2 c = K k= k c 2 k ( ) 2 K k c k = x 2 c x 2 c. k= Calculer la variace et l écart type empiriques pour l applicatio puis pour l applicatio 3 e classes. Pour des doées discrètes, s 2 et s 2 c coïcidet. Calculer l écart type empirique pour l applicatio 4. Ecart-type (TD). 5.2 Ecart iterquartile 5.2. Les quatiles Soit α ]0, [. Le quatile d ordre α est oté q α et o a Card{x i q α } O appelle quartiles les quatiles d ordre 4, 2 et 3 4 Pour des doées brutes = α. q α. = x( h ) + (h h ) ( x ( h +) x ( h ) ). où h = ( + )α et t h est la partie etière de h. Calculer le premier et derier quartiles de l applicatio 3. et déciles les quatiles d ordre 0,..., 9 0. Si la variable est discrète, o peut utiliser les fréqueces cumulées pour trouver q α. Calculer le premier et derier quartiles de l applicatio 4. Pour des doées groupées, o peut utiliser la courbe des fréqueces cumulées pour trouver q α. Calculer le premier et derier quartiles de l applicatio. 5.2.2 Ecart iterquartile Il mesure la dispersio des doées : 5.2.3 Boîtes à moustaches (boxplot) eiq. = q 0.75 q 0.25. C est u moye rapide de représeter le profil d ue série statistique quatitative (cf fig. 4). q 0.05 q 0.25 m q 0.75 q 0.95 Figure 4 U exemple de boîte à moustaches Tracer les box-plot des applicatios 3 et 4. 6