COURS N 6 : Estimations

Documents pareils
II LES PROPRIETES DES ESTIMATEURS MCO 1. Rappel : M1 LA REGRESSION : HYPOTHESES ET TESTS Avril 2009

Limites des Suites numériques

Cours de Statistiques inférentielles

STATISTIQUE : TESTS D HYPOTHESES

Comportement d'une suite

c. Calcul pour une évolution d une proportion entre deux années non consécutives

SÉRIES STATISTIQUES À DEUX VARIABLES

Cours 5 : ESTIMATION PONCTUELLE

Convergences 2/2 - le théorème du point fixe - Page 1 sur 9

Université Victor Segalen Bordeaux 2 Institut de Santé Publique, d Épidémiologie et de Développement (ISPED) Campus Numérique SEME

STATISTIQUE AVANCÉE : MÉTHODES

. (b) Si (u n ) est une suite géométrique de raison q, q 1, on obtient : N N, S N = 1 qn+1. n+1 1 S N = 1 1

Etude de la fonction ζ de Riemann

Polynésie Septembre Exercice On peut traiter la question 4 sans avoir traité les questions précédentes.

Statistique descriptive bidimensionnelle

x +1 + ln. Donner la valeur exacte affichée par cet algorithme lorsque l utilisateur entre la valeur n =3.

Université Pierre et Marie Curie. Biostatistique PACES - UE

Intégration et probabilités ENS Paris, TD (20)13 Lois des grands nombres, théorème central limite. Corrigé :

FEUILLE D EXERCICES 17 - PROBABILITÉS SUR UN UNIVERS FINI

Dénombrement. Chapitre Enoncés des exercices

Deuxième partie : LES CONTRATS D ASSURANCE VIE CLASSIQUES

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation

Chapitre 2 SONDAGE ALEATOIRE SIMPLE OU A PROBABILITES EGALES. 2.1 DEFINITIONS 2.2 SONDAGE ALEATOIRE SIMPLE SANS REMISE (PESR) 2.2.

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation

Principes et Méthodes Statistiques

Processus et martingales en temps continu

EXERCICES : DÉNOMBREMENT

CHAPITRE 2 SÉRIES ENTIÈRES

Chapitre 3 : Transistor bipolaire à jonction

Chapitre 3 : Fonctions d une variable réelle (1)

Formation d un ester à partir d un acide et d un alcool

Les Nombres Parfaits.

1 Mesure et intégrale

4 Approximation des fonctions

LES ÉCLIPSES. Éclipser signifie «cacher». Vus depuis la Terre, deux corps célestes peuvent être éclipsés : la Lune et le Soleil.

Statistique Numérique et Analyse des Données

[ édité le 10 juillet 2014 Enoncés 1. Exercice 6 [ ] [correction] Si n est un entier 2, le rationnel H n =

Séquence 5. La fonction logarithme népérien. Sommaire

20. Algorithmique & Mathématiques

Chap. 5 : Les intérêts (Les calculs financiers)

Module 3 : Inversion de matrices

UNIVERSITE MONTESQUIEU BORDEAUX IV. Année universitaire Semestre 2. Prévisions Financières. Travaux Dirigés - Séances n 4

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

55 - EXEMPLES D UTILISATION DU TABLEUR.

Le marché du café peut être segmenté en fonction de deux modes de production principaux : la torréfaction et la fabrication de café soluble.

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

capital en fin d'année 1 C 0 + T C 0 = C 0 (1 + T) = C 0 r en posant r = 1 + T 2 C 0 r + C 0 r T = C 0 r (1 + T) = C 0 r 2 3 C 0 r 3...

14 Chapitre 14. Théorème du point fixe

Suites et séries de fonctions

Séries réelles ou complexes

Statistiques appliquées à la gestion Cours d analyse de donnés Master 1

La France, à l écoute des entreprises innovantes, propose le meilleur crédit d impôt recherche d Europe

Processus géométrique généralisé et applications en fiabilité

La maladie rénale chronique

Consolidation. C r é e r un nouveau classeur. Créer un groupe de travail. Saisir des données dans un groupe

TRANSFERT DE CHARGE DANS UN RÉSEAU DE PROCESSEURS TOTALEMENT CONNECTÉS (*) par Maryse BÉGUIN ( 1 )

Exercices de mathématiques

Dénombrement. Introduction. 1 Cardinaux d'ensembles nis. ECE3 Lycée Carnot. 12 novembre Quelques dénitions

2 ième partie : MATHÉMATIQUES FINANCIÈRES

Université de Bordeaux - Master MIMSE - 2ème année. Scoring. Marie Chavent machaven/

Réseaux d ondelettes et réseaux de neurones pour la modélisation statique et dynamique de processus

Exo7. Déterminants. = 4(b + c)(c + a)(a + b). c + a c + b 2c Correction. b + a 2b b + c. Exercice 2 ** X a b c a X c b b c X a c b a X

RECHERCHE DE CLIENTS simplifiée

Exercice I ( non spé ) 1/ u 1 = u / Soit P la propriété : u n + 4. > 0 pour n 1. P est vraie au rang 1 car u 1

Comment les Canadiens classent-ils leur système de soins de santé?

Régulation analogique industrielle ESTF- G.Thermique

PROBLEMES DIOPTIMISATION EN NOMBRES ENTIERS J. L. NICOLAS

Etude Spéciale SCORING : UN GRAND PAS EN AVANT POUR LE MICROCRÉDIT?

Le chef d entreprise développe les services funéraires de l entreprise, en

Le Sphinx. Enquêtes, Sondages. Analyse de données. Internet :

Initiation à l analyse factorielle des correspondances

Baccalauréat S Asie 19 juin 2014 Corrigé

LE PRINCIPE DU RAISONNEMENT PAR RÉCURRENCE

RÈGLES ORDINALES : UNE GÉNÉRALISATION DES RÈGLES D'ASSOCIATION

La tarification hospitalière : de l enveloppe globale à la concurrence par comparaison

Nous imprimons ce que vous aimez!

Risque de longévité et détermination du besoin en capital : travaux en cours

Des résultats d irrationalité pour deux fonctions particulières

RESOLUTION PAR LA METHODE DE NORTON, MILLMAN ET KENNELY

Sommaire Chapitre 1 - L interface de Windows 7 9

Un nouvel opérateur de fusion adaptatif. A new adaptive operator of fusion. 1. introduction

MUTUELLE D&O MUTUELLE D&O. Copilote de votre santé. AGECFA-Voyageurs CARCEPT CARCEPT-Prévoyance CRC CRIS CRPB-AFB

3.1 Différences entre ESX 3.5 et ESXi 3.5 au niveau du réseau. Solution Cette section récapitule les différences entre les deux versions.

Échantillonnage et estimation

PROMENADE ALÉATOIRE : Chaînes de Markov et martingales

La coloration vitale au diacétate de fluorescéine permet un diagnostic plus précoce de la tuberculose à germes résistants à la rifampicine

S-PENSION. Constituez-vous un capital retraite complémentaire pour demain tout en bénéficiant d avantages fiscaux dès aujourd hui.

Solutions particulières d une équation différentielle...

UV SQ 20. Automne Responsable d Rémy Garandel ( m.-el. remy.garandel@utbm.fr ) page 1

Divorce et séparation

L Objectif National des Dépenses d Assurance Maladie : d un outil global de régulation à une simple prévision des dépenses.

DETERMINANTS. a b et a'

UNIVERSITÉ DE SFAX École Supérieure de Commerce

Les nouveaux relevés de compte

Renseignements et monitoring. Renseignements commerciaux et de solvabilité sur les entreprises et les particuliers.

Probabilités et statistique pour le CAPES

n tr tr tr tr tr tr tr tr tr tr n tr tr tr Nom:... Prénom :...

La fibre optique arrive chez vous Devenez acteur de la révolution numérique

Tempêtes : Etude des dépendances entre les branches Automobile et Incendie à l aide de la théorie des copulas Topic 1 Risk evaluation

Protection de votre réseau d entreprise:

Transcription:

COURS N 6 : Estimatios O peut rappeler que les biostatistiques ot pour objectif de predre e compte la variabilité iteridividuelle, de résumer et décrire des doées et de comparer des échatillos. Nous avos fait, durat les 5 premiers cours, des statistiques descriptives, ous coaissios les caractéristiques des populatios et ous avos calculé des probabilités d'évéemets pour teter de prévoir certaies choses cocerat des échatillos. Nous allos maiteat réaliser des statistiques iféretielles, c'est-à-dire qu'o va predre e compte des résultats expérimetaux obteus sur des échatillos pour teter de gééraliser des doées sur toute ue populatio. C'est cette secode partie de l'eseigemet qui est le plus importat et qui permet aux biostatistiques d'avoir ue place importate e médecie, das plusieurs domaies : E recherche cliique, où l'o va étudier et comparer des groupes de malades pour gééraliser des doées sur ue populatio. E recherche diagostique, pour évaluer la performace des tests ou des stratégies diagostiques. E recherche thérapeutique, pour : Pour évaluer la toxicité et l'efficacité de médicamets. Pour comparer les ouveaux traitemets par rapport aux précédets. Pour predre e compte la variabilité des réposes aux traitemets etre patiets pour adapter le traitemet. - E recherche proostique, pour évaluer ou prédire l'évolutio des maladies sous différetes stratégies thérapeutiques. [Je passe les rappels de la moyee de variables aléatoires et l'itervalle de pari] I. Théorie de l'estimatio A. Itroductio Pour les itervalles de pari, o coait les valeurs théoriques de la moyee et de la variace (ou de l'écart-type). E statistiques, o a la problématique iverse : o a u échatillo de valeurs et o veut e déduire quelque chose au iveau d'ue populatio. Se poset alors les questios de la précisio de otre étude et de la taille efficiete ou o de otre échatillo.

B. Estimatio statistique L'estimatio statistique cosiste à obteir le maximum d'iformatios d'u échatillo e vue d'estimer u ou plusieurs paramètres icous das la populatio. O se base alors sur l'échatillo représetatif qui est u sous-esemble de la populatio d'étude costitué par tirage au sort (de faço aléatoire doc). Cepedat, souvet e médecie, o réalise u échatilloage «systématique» (o va par exemple predre tous les patiets d'u service etc...). Soit u -échatillo de X (X 1, X 2,..., X ) (les X sot idépedats) dot o cherche le paramètre θ icou. NB : θ 'est pas ue variable aléatoire! U estimateur de θ est ue foctio des valeurs de l'échatillo. O le ote T. T =T X 1, X 2,..., X A chaque fois qu'o tire u au sort u ouvel échatillo, l'applicatio de la foctio T doe u résultat différet : o parle d'estimatio de θ otée t. t =T x 1, x 2,..., x Les fluctuatios d'échatilloage de t sot liées aux valeurs x 1, x 2,..., x observées. C. Propriétés d'u estimateur 1. Biais d'u estimateur Le biais d'u estimateur est l'écart etre la vraie valeur et la valeur idiquée. O parle aussi de déformatio systématique. Le biais d'u estimateur est doée par la relatio : E T θ U estimateur est sas biais si E(T ) = θ : les estimatios obteues e s'écartet pas de la vraie valeur de faço systématique. Notre but est d'avoir u estimateur sas biais pour otre étude.

2. Variace d'u estimateur La variace d'u estimateur correspod à la dispersio des estimatios. Elle est otée Var(T ). Quad les estimatios sot peu dispersées, la variace est faible. Notre but est d'avoir ue variace la plus basse possible. 3. Covergece d'u estimateur U estimateur est dit coverget si E([T θ]²) ted vers 0 lorsque ted vers l'ifii. E([T θ]²) est l'erreur quadratique moyee (car elle déped du biais et de la variace) : E [T θ]² =E T ² 2θ E T θ²=e T ² E T ² E T ² 2θ E T θ² D'après la défiitio de variace, o a Var(T ) = E(T ²) E(T )² O remarque aussi que E(T )² 2θE(T ) + θ² = (E[T ] θ)² or E(T ) θ est le biais de l'estimateur. Doc : E [T θ] ² =Var T E[T ] θ ²=Var T biais² D. Estimateur de la moyee µ Il est possible d'utiliser 3 estimateurs pour la moyee µ : T = X 1 T = X 1, X 2,..., X 1 T =M = X 1, X 2,..., X

Pour cet estimateur, o a : 1. Estimateur 1 : T = X 1 - E(T ) = E(X 1 ) = µ ; d'où E(T ) µ = 0 L'estimateur est doc sas biais. - Var(T ) = Var(X 1 ) = σ² - E([T µ]²) = σ² (pas de biais) Cette valeur e déped pas de doc elle e ted pas vers 0 quad augmete. L'estimateur 'est pas coverget. 2. Estimateur 2 : T = X 1, X 2,..., X 1 Pour cet estimateur, équivalet à M 1, o a : - E T = E M = µ 1 1 L'estimateur est biaisé (E[T ] est différet de µ). Le biais équivaut à µ 1 µ= µ 1 - Var T =Var M σ² = 1 1 ² - E [T µ]² = σ² 2 1 ² µ 1 L'erreur quadratique moyee ted vers 0 quad ted vers 0 doc l'estimateur est coverget.

Pour cet estimateur, o a : 3. Estimateur 3 : T =M = X 1, X 2,..., X - E(T) = E(M) = µ L'estimateur 'est pas biaisé. - Var T =Var M = σ² - E [T µ] ² = σ² L'erreur quadratique moyee ted vers 0 quad ted vers 0 doc l'estimateur est coverget. M est doc u «bo» estimateur de la moyee (e tout cas le meilleur des 3). La moyee expérimetale m est ue estimatio de µ et doc ue réalisatio de M. E. Estimateur de la variace A partir d'u -échatillo, o pred ue variable aléatoire V e tat qu'estimateur de la variace σ², défiie par : V = 1 1 X i M 2 = 1 1 X 2 i M 2 Ue réalisatio de V sur u échatillo est s², variace «expérimetale» ou bie estimatio de la variace : s²= 1 1 x i m 2 = 1 1 x 2 i m 2 [à coaître pour estimer des variaces! Cette formule 'est pas das le formulaire.] Biais de l'estimateur : E V = 1 1 E[ X 2 i ] E[M 2 ] O sait que Var(X) = E(X²) E(X)² doc : E(X i ²) = E(X²) = Var(X) + E(X)² = σ² + µ² doc E[ X 2 i ]= σ² µ² =σ² µ²

De la même faço : E M 2 =Var M E M 2 = σ² µ² Doc E V = 1 1 E V = 1 1 E[ X i 2 ] E[M 2 ] = 1 1 σ²[ 1] =σ² =σ² 1 E(V) σ² = 0 L'estimateur 'est pas biaisé. 1 σ² µ² [σ² µ²] = 1 1 σ² µ² σ² µ² E V =σ² La variace expérimetale s² est ue estimatio de σ². C'est aussi ue réalisatio de V. F. Estimateur d'ue proportio Soit π la moyee d'ue variable de Beroulli. L'estimateur de π est doé par : T =P = ombre de X i =1 = X 1, X 2,..., X C'est u estimateur o biaisé et coverget (il a doc les propriétés de M). La proportio observée p est ue estimatio de π. C'est aussi ue réalisatio de P. II. Itervalle de cofiace Soit u échatillo X 1, X 2,..., X d'ue loi ayat u paramètre θ icou. O pourrait doer ue estimatio poctuelle de θ à partir d'u estimateur. Mais cela 'est pas très satisfaisat puisque l'estimatio déped de l'échatillo et qu'il existe de ombreuses fluctuatios d'échatilloage. O peut aussi doer u itervalle de valeurs possibles (ou ue «fourchette») de θ pour doer ue précisio à la valeur estimée.

A. Défiitio L'itervalle de cofiace de iveau 1 α, oté IC 1 α, est u itervalle qui a pour probabilité 1 α de coteir la vraie valeur θ. (Si o calcule IC 1 α sur u ombre ifii d'échatillos, alors θ IC 1 α das ue proportio de 1 α cas.) B. Itervalle de cofiace pour la moyee Soit X ue variable aléatoire cotiue défiie par E(X) = µ et Var(X) = σ². O cosidère qu'o a u grad échatillo et que 30 (o peut appliquer le TLC). O sait que : P µ M ε α σ² =1 α O obtiet l'estimatio par itervalle de µ, ou l'itervalle de cofiace de µ, e cosidérat que µ est l'icoue que que σ² est estimé par s² (le calcul est impossible sio). Sur u échatillo de valeurs, o observe la moyee m et la variace s², toutes deux expérimetales, pour calculer l'itervalle de cofiace de µ de iveau 1 α, ou de risque α (e cosidérat que 30 ) : IC 1 α =[m±ε α s² ] Remarque : souvet, α = 5% et doc ε α = 1,96 2, d'où : IC 95 =[m±2 s² ]

C. Itervalle de cofiace pour ue proportio Soit X ue variable de Beroulli de paramètre π. O admet qu'o est sur u grad échatillo et que π 5 ET 1 π 5 O sait que : P π M ε α π 1 π =1 α O obtiet l'estimatio par itervalle de π, ou l'itervalle de cofiace de π, e cosidérat que π est l'icoue que que π est estimé par p (le calcul est impossible sio). Sur u échatillo de valeurs, o observe la proportio p expérimetale, pour calculer l'itervalle de cofiace de π de iveau 1 α, ou de risque α (e cosidérat que π 5 ET 1 π 5 ) : IC 1 α =[ p±ε α p 1 p ] Attetio : Après votre calcul, il faut vérifier les coditios de validité aux bores de l'itervalle de cofiace. Avec vos deux valeurs de π limites π 1 et π 2, il faut s'assurer que les quatre termes π 1 ; 1 π 1 ; π 2 ; 1 π 2 sot tous supérieurs ou égaux à 5. Remarque : souvet, α = 5% et doc ε α = 1,96 2, d'où : IC 95 =[ p±2 [formulaire page 2] p 1 p ] D. Largeur, précisio et ombre de sujets écessaires pour u itervalle de cofiace La largeur d'u itervalle [a ; b] vaut b a. - Pour l'itervalle de cofiace d'ue moyee, la largeur l est doée par : Elle déped de s et. l=2ε α s

- Pour l'itervalle de cofiace d'ue proportio, la largeur l est doée par : l=2ε α p 1 p Elle déped de p et de. (Pour diviser par 2 la largeur, il faut multiplier par 4). Pour rappel, la précisio i est la demi-largeur. Nombre de sujets écessaires pour avoir ue précisio i doée : - Pour l'itervalle de cofiace d'ue moyee, o a : ε 2 α s² i² Il faut se doer ue valeur à priori pour s². augmete avec s². - Pour l'itervalle de cofiace d'ue proportio, o a : ε 2 α p 1 p i² Il faut se doer ue valeur à priori pour p. est maximum pour p = 0,5. [Ces formules sot à coaître ou à retrouver, elles e sot pas das le formulaire. Il e faut pas les cofodre avec le ombre de sujets écessaires pour les tests que ous allos voir plus tard! Je passe sur la coclusio, tout est das le cours.] Ce documet, aisi que tous les cours P1, sot dispoibles gratuitemet sur http://coursp1bichat-larib.weebly.com