Chapitre 6 : Problème récapitulatif

Documents pareils
Fonction réciproque. Christelle MELODELIMA. Chapitre 2 :

Dérivées et différentielles des fonctions de plusieurs variables

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Professeur Patrice FRANCOIS

Représentation d une distribution

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

Professeur Diane GODIN-RIBUOT

Principe d un test statistique

Statistiques Descriptives à une dimension

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

Séries Statistiques Simples

Statistique : Résumé de cours et méthodes

TSTI 2D CH X : Exemples de lois à densité 1

Interactions des rayonnements avec la matière

Docteur José LABARERE

Annexe commune aux séries ES, L et S : boîtes et quantiles

Probabilités sur un univers fini

Statistiques avec la graph 35+

Evaluation des stages hospitaliers par les étudiants en médecine

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

Probabilités conditionnelles Loi binomiale

Les responsabilités des professionnels de santé

Probabilité. Table des matières. 1 Loi de probabilité Conditions préalables Définitions Loi équirépartie...

Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé

Transport des gaz dans le sang

3. Caractéristiques et fonctions d une v.a.

LOGICIELS DE GESTION. Cabinet dentaire AGATHA JULIE GESDENT LOGOS MACDENT POM DADENT TROPHY GESTION VISIODENT ET LES AUTRES

Lois de probabilité. Anita Burgun

Chapitre 1 Evaluation des caractéristiques d un test diagnostique. José LABARERE

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes

Probabilités sur un univers fini

La pompe cardiaque, le débit cardiaque et son contrôle

Loi binomiale Lois normales

Unité de Recherche Clinique St Louis - Lariboisière Fernand Widal Le 03 Février 2012

I - CLASSIFICATION DU DIABETE SUCRE

Chapitre 7 : Structure de la cellule Le noyau cellulaire

1. Vocabulaire : Introduction au tableau élémentaire

Continuité en un point

Distribution Uniforme Probabilité de Laplace Dénombrements Les Paris. Chapitre 2 Le calcul des probabilités

Cours Fonctions de deux variables

Logiciel XLSTAT version rue Damrémont PARIS

Probabilités conditionnelles Exercices corrigés

Les devoirs en Première STMG

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

DIPLOMES OUVRANT DROIT A L'EXERCICE DE LA MEDECINE EN FRANCE AUTORISATIONS MINISTERIELLES D'EXERCICE

Introduction au métier d ARC. en recherche clinique

Transport des gaz dans le sang

Correction du baccalauréat ES/L Métropole 20 juin 2014

Didier Pietquin. Timbre et fréquence : fondamentale et harmoniques

BTS Groupement A. Mathématiques Session Spécialités CIRA, IRIS, Systèmes électroniques, TPIL

MATHÉMATIQUES. Mat-4104

Rôle de l ARCl. V Grimaud - UE recherche clinique - 18 mars Définitions

Logiciels d éducation à la Nutrition et à l activité physique

UNE FORMATION POUR APPRENDRE À PRÉSENTER DES DONNÉES CHIFFRÉES : POUR QUI ET POURQUOI? Bénédicte Garnier & Elisabeth Morand

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

gros L abonnement L abonnement qui peut rapporter gros J aide un organisme et je m abonne à la chance! POSSIBILITÉ DE PAIEMENT DIFFÉRÉ

Base de données bibliographiques Pubmed-Medline

Statistiques 0,14 0,11

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé

Études. Coût de la chirurgie d une hernie discale

EXERCICE 4 (7 points ) (Commun à tous les candidats)

La filtration glomérulaire et sa régulation

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Statistique Descriptive Élémentaire

Analyse et interprétation des données

enquête pour les fautes sur le fond, ce qui est graves pour une encyclopédie.

FORMATION CONTINUE RECHERCHE APPLIQUÉE OUTILS PÉDAGOGIQUES. Promouvoir les soins pharmaceutiques

FORMULAIRE DE STATISTIQUES

Exercices sur le chapitre «Probabilités»

Baccalauréat ES/L Métropole La Réunion 13 septembre 2013 Corrigé

TS 35 Numériser. Activité introductive - Exercice et démarche expérimentale en fin d activité Notions et contenus du programme de Terminale S

Probabilités Loi binomiale Exercices corrigés

Une offre de lecture numérique sur liseuses et Smartphones pour les patients de l Assistance Publique-Hôpitaux de Paris

Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie

Chapitre 2 Le problème de l unicité des solutions

Le modèle de Black et Scholes

OPTIMISATION À UNE VARIABLE

Licence MASS (Re-)Mise à niveau en Probabilités. Feuilles de 1 à 7

STATISTIQUES DESCRIPTIVES

Règlement du Jeu SMS CASINO

Les Français et le courrier publicitaire. Rapport

TRACER LE GRAPHE D'UNE FONCTION

REGLEMENT COMPLET Jeu «Gagnez un séjour Thalasso» Du 31 mars au 24 mai 2014

Formulaire de dépôt. Office Benelux de la Propriété intellectuelle. Zone réservée à l Office Benelux de la Propriété intellectuelle Numéro

DIABETE ET SPORT. Dominique HUET Hopital Saint Joseph PARIS

Lecture critique et pratique de la médecine

STACCINI Pascal UFR Médecine Nice Université Nice-Sophia Antipolis

Dossier de candidature

Préparation d un post (article) pour idweblogs

Petit lexique de calcul à l usage des élèves de sixième et de cinquième par M. PARCABE, professeur au collège Alain FOURNIER de BORDEAUX, mars 2007

Liège, le 29 juillet APPEL INTERNE et EXTERNE AUX CANDIDATURES N

EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG

Probabilités (méthodes et objectifs)

Simulation de variables aléatoires

La question est : dans 450 combien de fois 23. L opération est donc la division. Le diviseur. Le quotient

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé

Transcription:

UE4 : Biostatistiques Chapitre 6 : Problème récapitulatif Professeur Philippe CINQUIN Année universitaire 2011/2012 Université Joseph Fourier de Grenoble - Tous droits réservés.

Plan A) Introduction B) Statistiques descriptives C) Probabilités D) Estimation E) Intervalles de confiance F) Problème récapitulatif G) Résumé des objectifs

Problème récapitulatif NB vous n avez pas besoin de calculette pour ce problème (vous n aurez pas droit aux calculettes au concours). Les calculs sont ou bien suffisamment simples pour pouvoir se faire de tête (par exemple, sommes ou soustractions de nombres entiers, divisions par 1000, divisions donnant des résultats entiers, ), ou bien plus difficiles, mais dans ce cas vous trouverez dans l énoncé des tableaux résumant les résultats de certaines opérations, parmi lesquelles celles dont vous aurez besoin 1) On étudie les mesures de la concentration sanguine en glucose (glycémie) sur un échantillon de n = 1000 prélèvements réalisés sur un an à l entrée des patients, choisis par tirage au sort sur des patients différents, sur la base du numéro de patient, dans un hôpital qui reçoit environ 10 000 patients/an. 1.1) Quelle est selon vous la population qu un tel échantillonnage permet d étudier? 1.2) Que pensez-vous de la méthode d échantillonnage retenue? 1.3) quel type de variable est la variable «glycémie»? 1.4) quels autres types de variable connaissez-vous?

Problème récapitulatif 2) Les données sont connues sous la forme du tableau 1. 2.1) Comment s appelle un tel tableau? Que permetil d étudier? Pourquoi est-il licite de regrouper les données par classes? 2.2) Calculez la fréquence de la classe [5, 6[ Classes (glycémie en mmoles/l) Effectifs 2-2.99 0 3-3.99 11 4-4.99 80 5-5.99 166 6-6.99 159 7-7.99 116 8-8.99 95 9-9.99 112 10 10.99 133 11-11.99 72 12-12.99 38 13-13.99 17 14-14.99 1 ou plus... 0

Problème récapitulatif On complète ce tableau de la manière suivante 2.3) Calculez la moyenne de la glycémie à partir de ce tableau 2.4) quel est le moyen graphique le mieux adapté pour représenter ces données? Pourquoi? 2.5 Mettez en œuvre ce moyen graphique et commentez le résultat 2.6 Quels paramètres pouvez-vous estimer à partir de ce graphique? Donnez leurs valeurs 2.7) Proposez un moyen graphique d estimer la médiane, et le 3 ème quartile, et mettez le en œuvre. Somme des valeurs observées dans la classe

Problème récapitulatif 3) Intrigué par le caractère bi-modal de l échantillon, le statisticien a demandé des données cliniques complémentaires, et s est aperçu que le CHU concerné disposait d un service de diabétologie important, dont l activité représente environ la moitié de celle de l hôpital. Il reprend l analyse sur les seuls patients issus de ce service de diabétologie. Les données sont fournies sous la forme suivante (où x i représente la valeur du i ème individu de l échantillon) : taille de l échantillon : n = 501; x i = 4 509mmoles/l; x i2 = 42 000 (mmoles/l) 2 Pour les calculs, on pourra noter que 4 509 2 /501 = 40 581 et utiliser le tableau des racines de nombres ci-joint : nombre racine 1,419 1,19 2,838 1,68 4,257 2,06 5,676 2,38

Problème récapitulatif 3.1) quelle peut être la population de référence? 3.2) estimer la moyenne et l écart-type de la variable aléatoire «glycémie» dans la population d où est extrait l échantillon observé 3.3) on suppose que la variable aléatoire «glycémie» suit une loi normale ; quelle est la probabilité qu un patient de la population ait une glycémie inférieure à 12 mmoles/l?

Problème récapitulatif On donne Racine(500) = 22.3 et nombre nombre/22.3 3/nombre 1,19 0,053 2,52 1,68 0,075 1,79 2,06 0,092 1,46 2,38 0,107 1,26 3.4) quels sont les intervalles de confiance à 95%, à 99%, à 999, de l estimation de la moyenne de la glycémie dans la population d où est extrait l échantillon? 3.5) admettons que la variance de la glycémie dans la population soit exactement celle que l on a estimée avec cet échantillon : combien de prélèvements faudrait-il inclure dans l échantillon pour que l intervalle de confiance à 95% de la moyenne ait une étendue réduite de moitié par rapport à celle que vous avez calculée dans la question précédente?

Problème récapitulatif 4) On sait qu une personne sur 100 présente une pathologie associée, indépendante du diabète, mais qui aggrave ce dernier. Quelle est la probabilité que, dans un échantillon de dix diabétiques, on trouve au moins une personne présentant cette pathologie associée? On donne : Ln (99) = 4.595 Ln (100) = 4.605 exp(0.1) = 1.11 exp(0) = 1 exp(-0.1) = 0.90 exp(-0.2) = 0.82

1) On étudie les mesures de la concentration sanguine en glucose (glycémie) sur un échantillon de n = 1000 prélèvements réalisés sur un an à l entrée des patients, choisis par tirage au sort sur des patients différents, sur la base du numéro de patient, dans un hôpital qui reçoit environ 10 000 patients/an. 1.1) Quelle est selon vous la population qu un tel échantillonnage permet d étudier? Pourquoi? population utilisant l hôpital étudié (NB acceptée aussi toute autre formulation équivalente ou montrant qu on a compris que l échantillon ne pouvait être représentatif de la glycémie de la population de la planète ) 1.2) Que pensez-vous de la méthode d échantillonnage retenue? Satisfaisante (randomisée) : le tirage au sort garantit le caractère randomisé de l échantillonage, qui permet donc d étudier la glycémie dans la population dont est extrait l échantillon 1.3) quel type de variable est la variable «glycémie»? Quantitative, continue 1.4) quels autres types de variable connaissez-vous? Qualitative, ordinale, quantitative et discrète,

2) Les données sont connues sous la forme du tableau 1. 2.1) Comment s appelle un tel tableau? Que permet-il d étudier? Pourquoi est-il licite de regrouper les données par classes? Tableau des effectifs. Il permet d étudier la distribution dans l échantillon considéré de la variable aléatoire «glycémie». Cette variable étant continue, il est impératif de regrouper les données par classes (NB un tel regroupement peut aussi être utile pour une variable discrète présentant un grand nombre de valeurs d effectif non nul). 2.2) Calculez la fréquence de la classe [5, 6[ 166/1000 = 0.166 Classes (glycémie en mmoles/l) Effectifs 2-2.99 0 3-3.99 11 4-4.99 80 5-5.99 166 6-6.99 159 7-7.99 116 8-8.99 95 9-9.99 112 10 10.99 133 11-11.99 72 12-12.99 38 13-13.99 17 14-14.99 1 ou plus... 0

On complète ce tableau de la manière suivante 2.3) Calculez la moyenne de la glycémie à partir de ce tableau Moyenne = 8030/1000 = 8.03 mmoles/l 2.4) quel est le moyen graphique le mieux adapté pour représenter ces données? Pourquoi? Histogramme (variable quantitative) Somme des valeurs observées dans la classe

2.5 Mettez en œuvre ce moyen graphique et commentez le résultat Histogramme bimodal, asymétrique 2.6 Quels paramètres pouvez-vous estimer à partir de ce graphique? Donnez leurs valeurs Modes (classes [5,6[ et [10,11[). On peut aussi donner les valeurs centrales des classes modales, soit 5.5. et 10.5 Minimum : 3 et Maximum : 15

2.7) Proposez un moyen graphique d estimer la médiane, et le 3 ème quartile, et mettez le en œuvre. Calculer le tableau des fréquences cumulées. On peut y lire directement la classe médiane (la première à égaler ou dépasser 50%) et la classe «3 ème Quartile» (la première à égaler ou dépasser 75%) Somme des valeurs observées dans la classe Exemple de calcul des fréquences cumulées : valeur de la classe [5,6[ 0.26 = (0 + 11 + 80 +166)/1000 = 257/1000 26% 2-2.99

2.7) Proposez un moyen graphique d estimer la médiane, et le 3 ème quartile, et mettez le en œuvre (suite). La classe Médiane est [7,8[ parce que c est la première classe dont la représentation graphique est coupée par la ligne horizontale 50% La classe 3ème Quartile est [10,11[ parce que c est la première classe dont la représentation graphique est coupée par la ligne horizontale 75% Fréquences cumulées Somme des valeurs observées dans la classe Effectifs

3) taille de l échantillon : n = 501; x i = 4 509mmoles/l; x i2 = 42 000 (mmoles/l) 2 Pour les calculs, on pourra noter que 4 509 2 /501 = 40 581 et utiliser le tableau des racines de nombres ci-joint : 3.1) quelle peut être la population de référence? Population des diabétiques utilisant l hôpital étudié 3.2) estimer la moyenne et l écart-type de la variable aléatoire «glycémie» dans la population d où est extrait l échantillon observé La moyenne inconnue est estimée par m = x i /n = 4 509 / 501 mmoles/l = 9 mmoles/l L écart type inconnu est estimé par 42000 40581 500 2 x i x i nombre 2 /n n 1 racine 1,419 1,19 2,838 1,68 4,257 2,06 5,676 2,38 42000 45092 /501 500 1419 500 2838 1000 2.838 1.68

3.3) on suppose que la variable aléatoire «glycémie» suit une loi normale ; quelle est la probabilité qu un patient de la population ait une glycémie inférieure à 12 mmoles/l? = (12-9)/1.68 = 3/1.68 = 1.79 = 0.075 (milieu entre 0.07 et 0.08) nombre nombre/22.3 3/nombre 1,19 0,053 2,52 1,68 0,075 1,79 2,06 0,092 1,46 2,38 0,107 1,26 P( G < 12) = P[(G-9)/1.68 < 1.79] = 1 - /2 = 1-0.0375 = 0.96

On donne Racine(500) = 22.3 et 3.4) quels sont les intervalles de confiance à 95%, à 99%, à 999, de l estimation de la moyenne de la glycémie dans la population d où est extrait l échantillon? Il faut aller lire dans la table de l écart réduit les valeurs de pour les trois valeurs de (1- choisies

Pour = 0.05, on sait que = 2 (1.96 si on veut être précis, mais retenez la valeur 2) Pour = 0.01, on lit = 2.576 = 2.6 (une décimale suffit ici) Pour = 0.001, on lit = 3.29 = 3.3 (une décimale suffit ici) En appliquant la formule [m- e ; m+ e ] nous obtenons donc les 3 intervalles : [8.85 ; 9.15] pour 95% [8.81 ; 9.19] pour 99% [8.75 ; 9.25] pour 999 NB il faut ici effectuer les multiplications de 0.075 par 2, par 2.6 et par 3.3; qui doivent pouvoir être réalisées manuellement

3.5) admettons que la variance de la glycémie dans la population soit exactement celle que l on a estimée avec cet échantillon : combien de prélèvements faudrait-il inclure dans l échantillon pour que l intervalle de confiance à 95% de la moyenne ait une étendue réduite de moitié par rapport à celle que vous avez calculée dans la question précédente? Il en faut 4 fois plus, soit 4 x 501 = 2004 En effet, l étendue de l intervalle de confiance est proportionnelle à e. Or, n intervient dans le calcul de e par sa racine, et est au dénominateur.

4) On sait qu une personne sur 100 présente une pathologie associée, indépendante du diabète, mais qui aggrave ce dernier. Quelle est la probabilité que, dans un échantillon de dix diabétiques, on trouve au moins une personne présentant cette pathologie associée? Il s agit d une loi binomiale, avec n = 10 et p = 0.01 (donc q = 0.99). Soit B cette loi, on cherche P(B 1) Or P(B 1) = 1 - P(B=0) P(B=0) = q 10 = 0.99 10 Or, Ln(0.99 10 ) = 10 x [Ln (99) - Ln(100)] = 10 x (4.595-4.605) = 10 x (-0.01) = -0.1 P(B=0) = 0.99 10 = exp(ln0.99 10 ) = exp(-0.1) = 0.90 Donc P(B 1) = 1-0.9 = 0.1

Mentions légales L'ensemble de cette œuvre relève des législations française et internationale sur le droit d'auteur et la propriété intellectuelle, littéraire et artistique ou toute autre loi applicable. Tous les droits de reproduction, adaptation, transformation, transcription ou traduction de tout ou partie sont réservés pour les textes ainsi que pour l'ensemble des documents iconographiques, photographiques, vidéos et sonores. Cette œuvre est interdite à la vente ou à la location. Sa diffusion, duplication, mise à disposition du public (sous quelque forme ou support que ce soit), mise en réseau, partielles ou totales, sont strictement réservées à l université Joseph Fourier (UJF) Grenoble 1 et ses affiliés. L utilisation de ce document est strictement réservée à l usage privé des étudiants inscrits à l Université Joseph Fourier (UJF) Grenoble 1, et non destinée à une utilisation collective, gratuite ou payante. Ce document a été réalisé par la Cellule TICE de la Faculté de Médecine et de Pharmacie de Grenoble (Université Joseph Fourier Grenoble 1)