Résumé de statistique inductive

Documents pareils
II LES PROPRIETES DES ESTIMATEURS MCO 1. Rappel : M1 LA REGRESSION : HYPOTHESES ET TESTS Avril 2009

Université Victor Segalen Bordeaux 2 Institut de Santé Publique, d Épidémiologie et de Développement (ISPED) Campus Numérique SEME

Échantillonnage et estimation

Cours de Statistiques inférentielles

FEUILLE D EXERCICES 17 - PROBABILITÉS SUR UN UNIVERS FINI

UNIVERSITE MONTESQUIEU BORDEAUX IV. Année universitaire Semestre 2. Prévisions Financières. Travaux Dirigés - Séances n 4

STATISTIQUE : TESTS D HYPOTHESES

Statistique descriptive bidimensionnelle

Deuxième partie : LES CONTRATS D ASSURANCE VIE CLASSIQUES

Chapitre 2 SONDAGE ALEATOIRE SIMPLE OU A PROBABILITES EGALES. 2.1 DEFINITIONS 2.2 SONDAGE ALEATOIRE SIMPLE SANS REMISE (PESR) 2.2.

Principes et Méthodes Statistiques

Intégration et probabilités ENS Paris, TD (20)13 Lois des grands nombres, théorème central limite. Corrigé :

Dénombrement. Chapitre Enoncés des exercices

Comportement d'une suite

55 - EXEMPLES D UTILISATION DU TABLEUR.

Statistiques appliquées à la gestion Cours d analyse de donnés Master 1

Consolidation. C r é e r un nouveau classeur. Créer un groupe de travail. Saisir des données dans un groupe

Limites des Suites numériques

La maladie rénale chronique

LES ÉCLIPSES. Éclipser signifie «cacher». Vus depuis la Terre, deux corps célestes peuvent être éclipsés : la Lune et le Soleil.

c. Calcul pour une évolution d une proportion entre deux années non consécutives

Etude Spéciale SCORING : UN GRAND PAS EN AVANT POUR LE MICROCRÉDIT?

Initiation à l analyse factorielle des correspondances

Université Pierre et Marie Curie. Biostatistique PACES - UE

Les Nombres Parfaits.

EXERCICES : DÉNOMBREMENT

STATISTIQUE AVANCÉE : MÉTHODES

Cours 5 : ESTIMATION PONCTUELLE

Université de Bordeaux - Master MIMSE - 2ème année. Scoring. Marie Chavent machaven/

Exo7. Déterminants. = 4(b + c)(c + a)(a + b). c + a c + b 2c Correction. b + a 2b b + c. Exercice 2 ** X a b c a X c b b c X a c b a X

Baccalauréat S Asie 19 juin 2014 Corrigé

[ édité le 10 juillet 2014 Enoncés 1. Exercice 6 [ ] [correction] Si n est un entier 2, le rationnel H n =

Polynésie Septembre Exercice On peut traiter la question 4 sans avoir traité les questions précédentes.

Sommaire Chapitre 1 - L interface de Windows 7 9

SÉRIES STATISTIQUES À DEUX VARIABLES

Processus et martingales en temps continu

Chapitre 3 : Transistor bipolaire à jonction

2 ième partie : MATHÉMATIQUES FINANCIÈRES

. (b) Si (u n ) est une suite géométrique de raison q, q 1, on obtient : N N, S N = 1 qn+1. n+1 1 S N = 1 1

Chapitre 3 : Fonctions d une variable réelle (1)

20. Algorithmique & Mathématiques

x +1 + ln. Donner la valeur exacte affichée par cet algorithme lorsque l utilisateur entre la valeur n =3.

UNIVERSITÉ DE SFAX École Supérieure de Commerce

capital en fin d'année 1 C 0 + T C 0 = C 0 (1 + T) = C 0 r en posant r = 1 + T 2 C 0 r + C 0 r T = C 0 r (1 + T) = C 0 r 2 3 C 0 r 3...

Statistique Numérique et Analyse des Données

Neolane Leads. Neolane v6.0

Chap. 5 : Les intérêts (Les calculs financiers)

Tableaux Croisés et Diagrammes en Mosaïque : Pour Voir Les Probabilités Marginales et Conditionnelles.

Probabilités et statistique pour le CAPES

Examen final pour Conseiller financier / conseillère financière avec brevet fédéral. Recueil de formules. Auteur: Iwan Brot

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation

La France, à l écoute des entreprises innovantes, propose le meilleur crédit d impôt recherche d Europe

Suites et séries de fonctions

Module 3 : Inversion de matrices

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation

Séries réelles ou complexes

UV SQ 20. Automne Responsable d Rémy Garandel ( m.-el. remy.garandel@utbm.fr ) page 1

Tempêtes : Etude des dépendances entre les branches Automobile et Incendie à l aide de la théorie des copulas Topic 1 Risk evaluation

3.1 Différences entre ESX 3.5 et ESXi 3.5 au niveau du réseau. Solution Cette section récapitule les différences entre les deux versions.

Un nouvel opérateur de fusion adaptatif. A new adaptive operator of fusion. 1. introduction

14 Chapitre 14. Théorème du point fixe

Exercice I ( non spé ) 1/ u 1 = u / Soit P la propriété : u n + 4. > 0 pour n 1. P est vraie au rang 1 car u 1

PROBLEMES DIOPTIMISATION EN NOMBRES ENTIERS J. L. NICOLAS

Séquence 5. La fonction logarithme népérien. Sommaire

Groupe orthogonal d'un espace vectoriel euclidien de dimension 2, de dimension 3

Terminale S. Terminale S 1 F. Laroche

Compte Sélect Banque Manuvie Guide du débutant

Comment les Canadiens classent-ils leur système de soins de santé?

CHAPITRE 2 SÉRIES ENTIÈRES

Renseignements et monitoring. Renseignements commerciaux et de solvabilité sur les entreprises et les particuliers.

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

Neolane Message Center. Neolane v6.0

STRATÉGIE DE REMPLACEMENT DE LUTTE CONTRE LA PUNAISE TERNE DANS LES FRAISERAIES DE L ONTARIO

Formation d un ester à partir d un acide et d un alcool

Etude de la fonction ζ de Riemann

Dares Analyses. Plus d un tiers des CDI sont rompus avant un an

Convergences 2/2 - le théorème du point fixe - Page 1 sur 9

Le chef d entreprise développe les services funéraires de l entreprise, en

TRANSFERT DE CHARGE DANS UN RÉSEAU DE PROCESSEURS TOTALEMENT CONNECTÉS (*) par Maryse BÉGUIN ( 1 )

MUTUELLE D&O MUTUELLE D&O. Copilote de votre santé. AGECFA-Voyageurs CARCEPT CARCEPT-Prévoyance CRC CRIS CRPB-AFB

LES MESURES CLÉS DU PROJET DE LOI ÉCONOMIE SOCIALE ET SOLIDAIRE

Donnez de la liberté à vos données. BiBOARD.

Risque de longévité et détermination du besoin en capital : travaux en cours

PLAN D ORGANISATION RÉGIONALE DE SÉCURITÉ CIVILE du SAGUENAY LAC-SAINT-JEAN MISSION SANTÉ

Le marché du café peut être segmenté en fonction de deux modes de production principaux : la torréfaction et la fabrication de café soluble.

1 Mesure et intégrale

Quand BÉBÉ VOYAGE. Guide pratique sur les précautions à prendre

POLITIQUE ECONOMIQUE ET DEVELOPPEMENT

4 Approximation des fonctions

Solutions particulières d une équation différentielle...

RECHERCHE DE CLIENTS simplifiée

Options Services policiers à Moncton Rapport de discussion

La coloration vitale au diacétate de fluorescéine permet un diagnostic plus précoce de la tuberculose à germes résistants à la rifampicine

Mécanismes de protection contre les vers

RESOLUTION DES FLOW SHOP STOCHASTIQUES PAR LES ORDRES STOCHASTIQUES. DERBALA Ali *)

Dénombrement. Introduction. 1 Cardinaux d'ensembles nis. ECE3 Lycée Carnot. 12 novembre Quelques dénitions

La tarification hospitalière : de l enveloppe globale à la concurrence par comparaison

Processus géométrique généralisé et applications en fiabilité

Protection de votre réseau d entreprise:

Transcription:

Uiversité de Bourgoge Faculté de Médecie et de Pharmacie Résumé de statistique iductive NB : les iformatios coteues das ce polycopié e fot e aucu cas office de référece pour le cocours, il s agit uiquemet d u résumé o exhaustif du cours officiel. I) Itroductio à l iductive, formules La statistique descriptive se bore à décrire des populatios de taille (N) raisoables (100 rats de laboratoire, 00 P, 100 P1 ) et à e doer des paramètres : moyee, variace, écart type otés avec des lettres grecques (respectivemet,, et e gééral ). Cepedat, la populatio est souvet trop grade pour être étudiée exhaustivemet (150 000 dijoais, 66 millios de fraçais ). Pour e faire l étude, il faut doc tirer au sort u échatillo de taille (modérée mais suffisammet grade pour être représetative) de cette populatio. Ce tirage au sort, pour être représetatif (o biaisé), doit respecter certais pricipes tels que : - l uiversalité : tout idividu de la populatio peut être tiré au sort, - l équiprobabilité : tout idividu à la même chace d être tiré au sort. La méthode type d échatilloage est le sodage. Das cet échatillo, serot calculés u certai ombre de paramètres : moyee, variace, écart type otés cette fois avec des lettres laties (respectivemet m, s, s et e gééral t) Les formules pour calculer ces paramètres das la populatio ou das l échatillo sot semblables mais légèremet différetes : Formule das la populatio Formule das l'échatillo Paramètre gééral θ t Moyee x i x x i f i m i x i f i N Variace (x (x (x i ) i ) s i m) x i m f i 1 1 x i f i N Ecart-type et si 100 x s i m s s Variables biaire : proportio p 1

C est à partir des paramètres d échatillo que l o va chercher à approximer les paramètres de la populatio : c est le pricipe de la statistique iductive. Estimatio : évaluer, à partir des paramètres d échatillo, les paramètres caractérisat ue variable das la populatio e doat u ordre de gradeur de l icertitude. Test : éprouver ue hypothèse : la décisio prise (rejet o o de l hypothèse) dépedra du risque d erreur lié aux caractères partiels des doées. Il existe des tests de coformité : pour détermier si certaies caractéristiques de l échatillo étudié coïcidet avec ue référece coue (la populatio). Et des tests d homogééité : pour détermier si les différeces etre échatillos sot attribuables au hasard (idépedace) ou si elles sot sigificatives. II) Fluctuatio, stadardisatio, lois ormale et gaussiee A) Fluctuatio et loi gaussiee Doc : - t est eviro égal à mais différet. - m est eviro égal à mais différet. Doc, si l o fait plusieurs échatillos (A, B, C ), o obtiet plusieurs moyees (m A, m B, m C ) qui sot toutes plus ou mois proches de la moyee de populatio. Si l o fait ue ifiité d échatillo et que l o trace ue courbe des valeurs de moyees d échatillo e foctio de leur ombre d apparitio, o obtiet la courbe suivate : Qui est ue courbe de distributio dite gaussiee.

O dit que m fluctue autour de µ. Autremet dit : - la moyee de moyees : E(m) = µ - et la variace des moyees V(m) =. Doc, si augmete ifiimet (ted vers N) V(m) ted vers 0 doc m ted vers. De même, la variace d échatillo fluctue autour de la variace de populatio tel que : - la moyee des variaces E(s ) =, - il existe ue variace des variaces V(s ). Et doc, si augmete ifiimet (ted vers N), s ted vers. B) Stadardisatio et loi ormale Si o a ue variable X de moyee et d écart type, o dit qu o la cetre e cosidérat so écart à la moyee (X - ) et qu o la réduit e rapportat cet écart à l écart type. O obtiet la variable cetrée réduite (ou stadardisée). U X De la même maière, o peut stadardiser la moyee (avec : E(m) = et V(m) = U m Cette moyee stadardisée est appelée écart réduit. L écart réduit fluctue autour de 0 et respecte aisi la loi ormale : ) : 3

III) Itervalles de paris / de cofiace A) Gééralités Nous avos doc vu que l écart réduit fluctue autour de 0, ces fluctuatios respectet ue loi de probabilité caractérisable : Proba (- a < U < + a) = 1 α, O peut alors faire u pari au risque α : le pari que U e soit pas compris das l itervalle [- a ; + a] au risque α : a U m a a a m a m a Qui est l itervalle de pari (das ce cas o ecadre u paramètre d échatillo) De même, o peut bâtir l itervalle : m a m a Qui est l itervalle de cofiace. (das ce cas o ecadre u paramètre théorique) Avec das les deux cas : - u risque d erreur α (probabilité que m ou µ e soit pas compris das l itervalle). - le iveau de cofiace 1 α (probabilité que m ou µ soit compris das l itervalle). B) Cas d ue variable biaire Ici, o e parle pas de moyees mais de proportios, l écart réduit s écrit doc : U p ( 1 ) O peut esuite parier sur u : - e utilisat la loi ormale si.φ et.(1-φ) 10. 4

1) Itervalle de pari (o ecadre la proportio de l échatillo) a.( 1).(1 ) p a ) Itervalle de cofiace (o ecadre la proportio de la populatio) p a.( 1 ).(1 ) p a C) Cas d ue variable quatitative Si l écart type théorique (de populatio) est cou, o parie sur l écart exactemet réduit : (La variace théorique est coue) T m Sio, o parie sur l écart approximativemet réduit : (La variace théorique est icoue, o pred celle de l échatillo) T m s Das les cas, o bâtit l itervalle e utilisat : - la loi de Studet à (-1) degrés de liberté si < 30, - la loi ormale si 30. IV) Les tests, comparaisos de moyees A) Gééralités Tests de sigificatio = tests d hypothèses car ils se baset sur la vérificatio d ue hypothèse. La démarche à suivre est codifiée : 1) Défiitio de la populatio, de ou des échatillos que l o étudie. ) Défiitio de la variable : biaire, qualitative géérale, quatitative 3) Choisir le type de test : coformité ou homogééité. 5) Défiir les hypothèses : H 0 et H 1. 6) Choisir la statistique sur laquelle est fodée le test (la loi de probabilité utilisée). 7) Vérifier les coditios d applicatios. 8) Faire les calculs sous l hypothèse H 0. 9) Predre la décisio de rejeter ou o H 0. 10) Coclure 5

B) Variables biaires 1) Test de coformité - Hypothèses : H 0 : φ = φ 0 versus H 1 : φ φ 0 - Critère de test : écart réduit pour ue variable biaire p 0 U 1 ) - Coditios d applicatio : 0 ( 0 Si les effectifs théoriques sot suffisammet grads, c est-à-dire si.φ 0 10 et.(1- φ 0 ) 10, ou si les effectifs attedus sot suffisammet grads, c est-à-dire si.φ 10 et.(1- φ) 10, o compare U à la valeur a correspodate trouvée das la table de la loi ormale au risque α. - Règle de décisio : Si U > a : o rejette H 0 : les proportios diffèret sigificativemet. Si U a : o e peut pas rejeter H 0 : p et φ 0 e sot pas sigificativemet différetes. ) Test d homogééité (fréqueces idépedates) Ce sot des tests où chaque idividu apparaît que das l u des deux groupes. - Hypothèses : H 0 : φ 1 = φ versus H 1 : φ 1 φ - Critère de test : écart approximativemet réduit p T 1 p pq pq 1 Avec p la proportio commue telle que : p 1p 1 p 1 Et pq la variace commue. et q = 1-p. - Coditios d applicatios : Si 1 p, p, 1 q et q sot tous 10, o compare T à la valeur a correspodate trouvée das la table de la loi ormale au risque α. 6

- Règle de décisio : Si T > a, o rejette H 0 : les proportios diffèret sigificativemet. Si T a, o e peut pas rejeter H 0 : les proportios e diffèret pas sigificativemet. 3) Test de coformité (fréqueces appariées) Ce sot des tests où chaque idividu apparaît das chacu des groupes (avat/après u traitemet ). Exemple type : comparaiso, chez 100 malades, de traitemets reçus successivemet, das u ordre tiré au sort pour chaque malade. = 100 couples de réposes (résultat avec A, résultat avec B) où les résultats sot otés - si échec et + si succès. Résultat avec A Résultat avec B Nombre de malades - - 35 - + 5 + - 15 + + 45 Total : 100 Il faut doc réaliser u test de Mc Nemar : le procédé correct est de regarder les = 5 + 15 = 0 paires discordates. O veut doc regarder si les pourcetages observés (5/0 et 15/0) sot compatibles avec u pourcetage théorique φ = 1/. - Hypothèses : H 0 : φ = 0,5 et H 1 : φ 0,5 - Critère de test : écart réduit ormal u = 5 1-0 0,5 0 ou u = 15 1-0 0,5 0 Car, sous H 0 : - moyee μ = φ = 1/ - variace σ = φ (1- φ) = 0,5 - Coditios d applicatios : Si o a u grad échatillo, c est-à-dire effectifs attedus φ et (1 φ) 10, où φ=1/, c est-à-dire si le ombre de paires discordates 10 o pred a das la table de la loi ormale au risque α. - Règle de décisio : u > a : o rejette H 0. Attetio : Pour ue variable biaire, o peut égalemet réaliser le test du Chi-. 7

B) Variables qualitatives géérales Ce sot des variables qualitatives à plus de modalités, les tests utilisés sot les tests du Chi-. (NB : o peut parfaitemet utiliser le Chi- sur ue variable biaire). 1) Chi- de coformité Exemple : soit le tableau de cotigece suivat : Couleur des cheveux Bru Châtai Blod Total Effectif échatillo 3 8 15 6 Proportio populatio 0,3 0,54 0,16 1 O pose H 0 : la distributio de la couleur des cheveux das l échatillo e diffère pas sigificativemet de celles das la populatio. Das le tableau précédet, il y avait les effectifs observés (o i ), o calcule maiteat les effectifs attedus (c i ) : Bru Châtai Blod Total o i (échatillo) 3 8 15 6 c i 6 x 0,3 = 7,8 6 x 0,54 = 14,04 6 x 0,16 = 4,16 6 o i - c i - 4,8-6,64 10,84 O vérifie que tous les c i sot supérieurs ou égaux à 10 (si ce est pas le cas, o e peut pas cotiuer). O calcule le critère de test : écart quadratique Q k i1 o i c i O compare Q à la valeur lue das la table du χ pour (ombre de modalités 1) degrés de libertés et au risque α. Si Q > χ o rejette H 0, les valeurs diffèret sigificativemet Si Q < χ o e peut pas rejeter H 0. ) Chi- d homogééité (= d idépedace) Tableau de cotigece à k coloes et l liges, par exemple : Couleur des cheveux Couleur des yeux Blod Bru Noir Roux Total Bleu 5 9 3 7 44 Gris ou vert 13 17 10 7 47 Marro 7 13 8 5 33 Total 45 39 1 19 14 NB : ici ce sot les effectifs observés qui sot otés (les o i ). - O pose H 0 : les variables sot idépedates. Exemple : o se demade s il existe ue liaiso etre les deux caractères qualitatifs : couleur des cheveux (4 modalités) et couleur des yeux (3 modalités) : c i 8

- O calcule les effectifs théoriques (les c i ) par la formule suivate : Total lige Total coloe c i Total gééral O dresse u ouveau tableau de cotigece avec, cette fois les effectifs théoriques (c i ): Couleur des cheveux Couleur des yeux Blod Bru Noir Roux Total Bleu (45x44) / 14 = 15.97 13.84 7.45 6.74 44 Gris ou vert 17.06 14.78 7.96 7.0 47 Marro 11.98 13.38 5.59 5.06 33 Total 45 39 1 19 14 Remarque : o doit coserver les décimales sur les c i das les calculs. - Critère de test : Q k i1 o i c i c i - Coditios d applicatios : o vérifie les coditios de Cochra Si o a liges et coloes (cas d ue variable biaire) : tous les c i doivet être > à 10 Si o a plus de deux liges et/ou coloes : tous les c i > 1. - Règle de décisio : O compare Q à la valeur lue das la table du Chi- pour [(ombre de lige - 1).(ombre de coloe 1)] degrés de libertés et au risque α : Si Q > χ o rejette H 0, il y a u lie sigificatif etre les variables. Si Q < χ o e peut pas rejeter H 0. 9

D) Variable quatitative 1) Test de coformité - Hypothèses : H 0 : μ = μ 0 versus H 1 : μ μ 0. - Critère de test : Si l o coaît σ : écart exactemet réduit : U m 0 0 Si l o e coaît pas σ : écart approximativemet réduit : - Coditios d applicatios : T m 0 s Si 30, comparer U ou T à a de la loi ormale au risque α. Si < 30, comparer U ou T à t de la table de Studet à (-1) degrés de libertés, e admettat la ormalité de la distributio. - Règle de décisio : Si U ou T > a (ou à t), o rejette H 0. Si U ou T a (ou à t), o e peut pas rejeter H 0. ) Test d homogééité (échatillos idépedats) - Hypothèses : H 0 : µ 1 = µ versus H 1 : µ 1 µ a. Cas où les variaces théoriques sot coues - Critère de test : - Coditios d applicatios : U m m 1 1 1 Si 1 et 30, comparer U à a de la loi ormale au risque α. Si 1 et/ou < 30, comparer U à t de la table de Studet à ( 1 1 + - 1) = ( 1 + - ) degrés de libertés, e admettat la ormalité de la distributio. - Règle de décisio : Si U > a (ou à t), o rejette H 0. 1 10

Si U a (ou à t), o e peut pas rejeter H 0. b. Cas où les variaces théoriques sot icoues b.1. Si 1 et 30 O suppose que les estimatios sot assez proches des valeurs théoriques car les échatillos sot assez grads. - Critère de test : - Règle de décisio : T m m 1 s 1 s 1 O compare T à a lue das la table de la loi ormale au risque α : - Si T > a : o rejette H 0 - Si T a : o e peut pas rejeter H 0 b.. Si 1 et/ou < 30 Les variaces d échatillo e sot pas ue boe estimatio des variaces théoriques ; das ce cas : Avat de tester, il faut vérifier l homoscédasticité (= égalité des variaces théoriques) e pratiquat le test de Fischer. O pose H 0 : σ 1 = σ cotre H 1 : σ 1 σ O peut alors calculer f tel que : f s max s où s max est la variace la plus grade des deux. mi O compare ce f au F de la table de Fischer au risque α/ et V 1 = ( associé à Smax - 1) degrés de libertés et V = ( associé à Smi -1) degrés de libertés. si F < f : o e peut pas cotiuer si F > f : les variaces théoriques e diffèret pas sigificativemet (o e rejette pas l homoscédasticité), o peut cotiuer. - O calcule alors le critère de test : - Règle de décisio : T m m 1 s c s c 1 Avec s c ( 1) s 1 1 ( 1) s ( 1 1) ( 1) O compare T au t de la loi de Studet à ( 1 + ) degrés de libertés : - Si T > t : o rejette H 0. - Si T t : o e peut pas rejeter H 0. 11

) Test d homogééité (échatillos appariés) Les échatillos sot dits appariés lorsque l o répète ue mesure chez la même persoe (qui sera alors présete das les groupes). Exemple type : mesure d ue cocetratio saguie avat et après prise médicameteuse O a aisi les valeurs y (de moyee m ) et les valeurs y (de moyee m ), o défiit la moyee des différeces m Z (tel que m Z m -m ) et la variace des différeces s Z. - Hypothèse : H 0 : µ - µ = µ Z = 0 - Critère de test : - Coditios d applicatios : t m Z Z s Z m Z 0 s Z Si 30, o utilise la loi ormale. Si < 30, o utilise la loi de Studet à (-1) ddl. - Règle de décisio : Si t > valeur tablée, o rejette H 0. Si t valeur tablée, o e peut pas rejeter H 0. Bo courage à tous, et boes révisios! O compte sur vous!! Vos tuteurs de l UE4 de 010 à 014. 1