Les statistiques descriptives et les intervalles de confiance



Documents pareils
Représentation d une distribution

Statistique : Résumé de cours et méthodes

Séries Statistiques Simples

Statistiques Descriptives à une dimension

Annexe commune aux séries ES, L et S : boîtes et quantiles

Loi binomiale Lois normales

Estimation: intervalle de fluctuation et de confiance. Mars IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison

3. Caractéristiques et fonctions d une v.a.

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

Statistique Descriptive Élémentaire

Estimation et tests statistiques, TD 5. Solutions

Résumé du Cours de Statistique Descriptive. Yves Tillé

Chapitre 3 : INFERENCE

Logiciel XLSTAT version rue Damrémont PARIS

Statistiques 0,14 0,11

Principe d un test statistique

STATISTIQUES DESCRIPTIVES

Lois de probabilité. Anita Burgun

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

1. Vocabulaire : Introduction au tableau élémentaire

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier

TSTI 2D CH X : Exemples de lois à densité 1

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé

Statistiques descriptives

MATHÉMATIQUES. Mat-4104

Lecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Biostatistiques : Petits effectifs

Calcul élémentaire des probabilités

Bulletin d information statistique

Statistiques à une variable

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

Aide-mémoire de statistique appliquée à la biologie

Statistiques avec la graph 35+

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Analyse de la variance Comparaison de plusieurs moyennes

Séquence 4. Statistiques. Sommaire. Pré-requis Médiane, quartiles, diagramme en boîte Moyenne, écart-type Synthèse Exercices d approfondissement

Probabilités III Introduction à l évaluation d options

- Ressources pour les classes

LE RÔLE DE LA STATISTIQUE DANS UN PROCESSUS DE PRISE DE DÉCISION

IBM SPSS Statistics Base 20

Correction du baccalauréat ES/L Métropole 20 juin 2014

Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie

Observatoire Economique et Statistique d Afrique Subsaharienne

BACCALAURÉAT PROFESSIONNEL SUJET

données en connaissance et en actions?

PROBABILITES ET STATISTIQUE I&II

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

OUTILS STATISTIQUES ET NUMÉRIQUES

FPSTAT 2 í La dçecision statistique. 1. Introduction ça l'infçerence. 1

Licence Economie-Gestion, 1ère Année Polycopié de Statistique Descriptive. Année universitaire :

Statistiques - Cours. 1. Gén éralités. 2. Statistique descriptive univari ée. 3. Statistique descriptive bivariée. 4. Régression orthogonale dans R².

Licence MASS (Re-)Mise à niveau en Probabilités. Feuilles de 1 à 7

d évaluation de la toux chez l enfant

Lire ; Compter ; Tester... avec R

Traitement des données avec Microsoft EXCEL 2010

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

Document d orientation sur les allégations issues d essais de non-infériorité

Classe de première L

Introduction aux Statistiques et à l utilisation du logiciel R

Étude sur les taux de revalorisation des contrats individuels d assurance vie au titre de 2013 n 26 mai 2014

La nouvelle planification de l échantillonnage

MESURE ET PRECISION. Il est clair que si le voltmètre mesure bien la tension U aux bornes de R, l ampèremètre, lui, mesure. R mes. mes. .

PLAN DE COURS CEGEP DU VIEUX-MONTRÉAL

VI. Tests non paramétriques sur un échantillon

1 Importer et modifier des données avec R Commander

UNE FORMATION POUR APPRENDRE À PRÉSENTER DES DONNÉES CHIFFRÉES : POUR QUI ET POURQUOI? Bénédicte Garnier & Elisabeth Morand

Test de reconnaissance des faux pas (version adulte)

IBM SPSS Direct Marketing 21

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #12

La simulation probabiliste avec Excel

2010 Minitab, Inc. Tous droits réservés. Version Minitab, le logo Minitab, Quality Companion by Minitab et Quality Trainer by Minitab sont des

1 radian. De même, la longueur d un arc de cercle de rayon R et dont l angle au centre a pour mesure α radians est α R. R AB =R.

Fluctuation d une fréquence selon les échantillons - Probabilités

Autoroute A16. Système de Repérage de Base (SRB) - Localisation des Points de repère (PR) A16- A16+

Unité E Variation et analyse statistique

La problématique des tests. Cours V. 7 mars Comment quantifier la performance d un test? Hypothèses simples et composites

TABLE DES MATIERES. C Exercices complémentaires 42

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

Programmes des classes préparatoires aux Grandes Ecoles

glossaire Appellation commerciale Voir nom de marque.

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes

Probabilités stationnaires d une chaîne de Markov sur TI-nspire Louis Parent, ing., MBA École de technologie supérieure, Montréal, Québec 1

Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques.

Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux

INFIRMIER(E) GRADUE(E) SPECIALISE(E) EN SANTE COMMUNAUTAIRE HAUTE ECOLE DE LA PROVINCE DE LIEGE PROFESSEUR : RENARD X.

Analyse et interprétation des données

Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN

Evaluation d un nouveau vidéo endoscope bronchique à usage unique avec canal opérateur en réanimation

4 Statistiques. Les notions abordées dans ce chapitre CHAPITRE

Statistique descriptive. Fabrice MAZEROLLE Professeur de sciences économiques Université Paul Cézanne. Notes de cours

Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA

Exercices sur le chapitre «Probabilités»

Chapitre 3. Les distributions à deux variables

I. Ensemble de définition d'une fonction

Transcription:

Les statistiques et les intervalles de Yohann.Foucher@univ-nantes.fr Equipe d Accueil 4275 "Biostatistique, recherche clinique et mesures subjectives en santé", Université de Nantes Master 2 - Cours #2 1 / 30

Plan 1. 2. 2 / 30

Plan 1. 2. 3 / 30

Deux grandes catégories d indicateurs Les statistiques dites de localisation. Les statistiques dites de dispersion. * Auteur : Christophe Dang Ngoc Chan 4 / 30

Plan 1. 2. 5 / 30

Les indicateurs de localisation La moyenne est l indicateur de localisation le plus fréquemment utilisé. Soit X cette v.a. dont on observe N expériences : x 1, x 2,..., x N. N i=1 x = x i N = x 1 + x 2 +... + x N N La médiane est la valeur qui partage l échantillon en deux groupes de même effectif. Pour le calcul, ordonner les valeurs observées : 1.1, 7.8, 9.9, 3.3, 5.4 1.1, 3.3, 5.4, 7.8, 9.9 6 / 30

Les indicateurs de localisation Le 1er quartile (Q 1 ) est la valeur qui identifie le quart des données inférieures. Le 2nd quartile est aussi la médiane... Le 3ème quartile (Q 3 ) est la valeur qui identifie le quart des données supérieures. Le mode est la valeur la plus représentée. Le minimum est la valeur la plus faible. Le maximum est la valeur la plus forte. 7 / 30

Les indicateurs de dispersion La variance mesure la variabilité autour de la moyenne. N s 2 i=1 = (x i x) 2 N 1 L écart-type respecte la même unité que la variance (plus facile à interpréter) s = s 2 L intervalle interquartiles (IQ) est la distance entre le 1er et le 3ème quartile. L étendue est la distance entre le minimum et la maximum. 8 / 30

Quelques conventions Grands échantillons : 1 moyenne (± écart-type) 2 moyenne (minimum-maximum) Petits échantillons : 1 médiane (intervalle interquartiles) 2 médiane (minimum-maximum) 9 / 30

Quelques conventions Grands échantillons : 1 moyenne (± écart-type) 2 moyenne (minimum-maximum) Petits échantillons : 1 médiane (intervalle interquartiles) 2 médiane (minimum-maximum) Problèmes liés à la moyenne : Sensible aux valeurs extrêmes (en particulier pour les petits échantillons). N a de sens que pour des lois symétriques et unimodales. 9 / 30

Les règles à respecter pour un graphique Libellés des deux axes. Unités des deux axes. Légende explicite. Titre. Eviter les couleurs ou la 3D sauf nécessité. 10 / 30

La boite à moustache ction de la boite à moustaches a 1 est la plus petite valeur supérieure à Q 1 1.5 IQ a 3 est la plus grande valeur inférieure à Q 3 + 1.5 IQ Les valeurs en dehors de ces bornes sont "extrêmes" 4 a3 Troisieme quartile Mediane 0 Moyenne Premier quartile a1-4 * Auteur : Hélène Guérin 11 / 30

La boite à moustache pour comparer deux groupes 12 / 30

La boite à moustache pour décrire une évolution 13 / 30

L histogramme (les rectangles sont contigus) 14 / 30

L histogramme pour comparer deux groupes 15 / 30

Plan 1. 2. 16 / 30

Contexte général On s intéresse à un v.a. aléatoire discrète X à p modalités à partir d un échantillon de taille N : Modalités x 1 x 2... x p Effectifs N 1 N 2... N p Fréquences f 1 = N 1 /N f 2 = N 2 /N... f p = N p /N Deux représentations couramment utilisées : le graphique en bâtons le camembert le graphique en araignée 17 / 30

Graphique en bâtons 18 / 30

Graphique en bâtons 19 / 30

Camembert 20 / 30

Graphique en araignée 21 / 30

Les tableaux de contingence On s intéresse à 2 v.a. aléatoires discrètes. Exemple : Tests diagnostiques. Test diagnostique T + T Total Statut M + a b a + b de référence M c d c + d Total a + c b + d N Le statut de référence est défini par le gold standard. Deux types d erreurs : b faux négatifs : sujets ayant un test négatif alors qu ils sont malades. c faux positifs : sujets ayant un test positif alors qu ils sont sains. 22 / 30

Plan 1. 2. 23 / 30

Plan 1. 2. 24 / 30

Soit un échantillon de taille N et x 1, x 2,, x N les observations d une variable aléatoire continue. La moyenne de la population (µ) est estimée par x. Si N > 30 (TCL), alors on sait aussi que X N (µ, s/ N) En centrant et réduisant, on obtient : X µ s/ N N (0, 1) Pour obtenir l intervalle de à 95% de la moyenne estimée, on cherche l intervalle à l intérieur duquel on a 95% de chance de retrouver la moyenne théorique de la population : Pr( 1.96 < X µ s/ N < 1.96) = 0.95 25 / 30

26 / 30

( Pr 1.96 < X µ ) s/ N < 1.96 = 0.95 ( s Pr X 1.96 < µ < X + 1.96 s ) = 0.95 N N IC 95% (µ) = [ x ± 1.96 s ] N 27 / 30

Exemple On cherche à estimer l âge moyen au diagnostic d un cancer du sein. On observe une moyenne x de 58 ans et l écart-type estimé de l âge est à 30 ans (échantillons de 100 femmes). Quelle est l intervalle de de la moyenne? IC 95% (µ) = [ 58 ± 1.96 30 ] 100 = [52.12; 63.88] Si on réalise 100 échantillons comme celui-ci, on attend 95 moyennes estimées comprises entre 52 et 63 ans. 28 / 30

Plan 1. 2. 29 / 30

Soit un échantillon de taille N et x 1, x 2,, x i,, x N les observations d une variable aléatoire discrète X = {0, 1}. La proportion p de {X = 1} de la population est estimée par la fréquence f = i x i/n. Comme précédemment grâce au théorème central limite, nous pouvons utiliser les propriétés de la loi normale. Si N > 30 Np > 5 et N(1 p) > 5 (TCL), alors on sait aussi que ( p(1 p) ) F N p, N En respectant les mêmes développements que précédemment, on démontre : [ f (1 f ) ] IC 95% (p) = f ± 1.96 N 30 / 30