Tests d hypothèses via une Approche Expérimentale des Probabilités



Documents pareils
Intégration et probabilités ENS Paris, TD (20)13 Lois des grands nombres, théorème central limite. Corrigé :

Chapitre 3 : Fonctions d une variable réelle (1)

[ édité le 10 juillet 2014 Enoncés 1. Exercice 6 [ ] [correction] Si n est un entier 2, le rationnel H n =

1 Mesure et intégrale

STATISTIQUE : TESTS D HYPOTHESES

Statistique descriptive bidimensionnelle

Comportement d'une suite

Deuxième partie : LES CONTRATS D ASSURANCE VIE CLASSIQUES

STATISTIQUE AVANCÉE : MÉTHODES

Chapitre 2 SONDAGE ALEATOIRE SIMPLE OU A PROBABILITES EGALES. 2.1 DEFINITIONS 2.2 SONDAGE ALEATOIRE SIMPLE SANS REMISE (PESR) 2.2.

Les Nombres Parfaits.

c. Calcul pour une évolution d une proportion entre deux années non consécutives

Limites des Suites numériques

UNIVERSITÉ DE SFAX École Supérieure de Commerce

UNIVERSITE MONTESQUIEU BORDEAUX IV. Année universitaire Semestre 2. Prévisions Financières. Travaux Dirigés - Séances n 4

Consolidation. C r é e r un nouveau classeur. Créer un groupe de travail. Saisir des données dans un groupe

II LES PROPRIETES DES ESTIMATEURS MCO 1. Rappel : M1 LA REGRESSION : HYPOTHESES ET TESTS Avril 2009

Cours 5 : ESTIMATION PONCTUELLE

Cours de Statistiques inférentielles

. (b) Si (u n ) est une suite géométrique de raison q, q 1, on obtient : N N, S N = 1 qn+1. n+1 1 S N = 1 1

Processus et martingales en temps continu

20. Algorithmique & Mathématiques

CHAPITRE 2 SÉRIES ENTIÈRES

Un nouvel opérateur de fusion adaptatif. A new adaptive operator of fusion. 1. introduction

Compte Sélect Banque Manuvie Guide du débutant

x +1 + ln. Donner la valeur exacte affichée par cet algorithme lorsque l utilisateur entre la valeur n =3.

Exo7. Déterminants. = 4(b + c)(c + a)(a + b). c + a c + b 2c Correction. b + a 2b b + c. Exercice 2 ** X a b c a X c b b c X a c b a X

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation

Statistique Numérique et Analyse des Données

55 - EXEMPLES D UTILISATION DU TABLEUR.

La France, à l écoute des entreprises innovantes, propose le meilleur crédit d impôt recherche d Europe

Université Victor Segalen Bordeaux 2 Institut de Santé Publique, d Épidémiologie et de Développement (ISPED) Campus Numérique SEME

Échantillonnage et estimation

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation

Séries réelles ou complexes

S euls les flux de fonds (dépenses et recettes) définis s ent l investissement.

Chap. 5 : Les intérêts (Les calculs financiers)

Etude de la fonction ζ de Riemann

Tempêtes : Etude des dépendances entre les branches Automobile et Incendie à l aide de la théorie des copulas Topic 1 Risk evaluation

Statistiques appliquées à la gestion Cours d analyse de donnés Master 1

3.1 Différences entre ESX 3.5 et ESXi 3.5 au niveau du réseau. Solution Cette section récapitule les différences entre les deux versions.

Université de Bordeaux - Master MIMSE - 2ème année. Scoring. Marie Chavent machaven/

Examen final pour Conseiller financier / conseillère financière avec brevet fédéral. Recueil de formules. Auteur: Iwan Brot

Exercice I ( non spé ) 1/ u 1 = u / Soit P la propriété : u n + 4. > 0 pour n 1. P est vraie au rang 1 car u 1

Principes et Méthodes Statistiques

Le marché du café peut être segmenté en fonction de deux modes de production principaux : la torréfaction et la fabrication de café soluble.

Convergences 2/2 - le théorème du point fixe - Page 1 sur 9

Télé OPTIK. Plus spectaculaire que jamais.

Suites et séries de fonctions

Chapitre 3 : Transistor bipolaire à jonction

Université Pierre et Marie Curie. Biostatistique PACES - UE

TRANSFERT DE CHARGE DANS UN RÉSEAU DE PROCESSEURS TOTALEMENT CONNECTÉS (*) par Maryse BÉGUIN ( 1 )

UV SQ 20. Automne Responsable d Rémy Garandel ( m.-el. remy.garandel@utbm.fr ) page 1

FEUILLE D EXERCICES 17 - PROBABILITÉS SUR UN UNIVERS FINI

Séries numériques. Chap. 02 : cours complet.

Réseaux d ondelettes et réseaux de neurones pour la modélisation statique et dynamique de processus

SÉRIES STATISTIQUES À DEUX VARIABLES

Séquence 5. La fonction logarithme népérien. Sommaire

Initiation à l analyse factorielle des correspondances

Nous imprimons ce que vous aimez!

Solutions particulières d une équation différentielle...

LES ÉCLIPSES. Éclipser signifie «cacher». Vus depuis la Terre, deux corps célestes peuvent être éclipsés : la Lune et le Soleil.

14 Chapitre 14. Théorème du point fixe

EXERCICES : DÉNOMBREMENT

Processus géométrique généralisé et applications en fiabilité

Logiciel de synchronisation de flotte de baladeurs MP3 / MP4 ou tablettes Androïd

Risque de longévité et détermination du besoin en capital : travaux en cours

Etude Spéciale SCORING : UN GRAND PAS EN AVANT POUR LE MICROCRÉDIT?

LES ESCALIERS. Du niveau du rez-de-chaussée à celui de l'étage ou à celui du sous-sol.

Les algorithmes de tri

Tests non paramétriques de spécification pour densité conditionnelle : application à des modèles de choix discret

Dénombrement. Chapitre Enoncés des exercices

capital en fin d'année 1 C 0 + T C 0 = C 0 (1 + T) = C 0 r en posant r = 1 + T 2 C 0 r + C 0 r T = C 0 r (1 + T) = C 0 r 2 3 C 0 r 3...

One Office Voice Pack Vos appels fixes et mobiles en un seul pack

Mécanismes de protection contre les vers

Groupe orthogonal d'un espace vectoriel euclidien de dimension 2, de dimension 3

Module 3 : Inversion de matrices

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

Le chef d entreprise développe les services funéraires de l entreprise, en

Une action! Un message!

Sommaire Chapitre 1 - L interface de Windows 7 9

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

4 Approximation des fonctions

Comment les Canadiens classent-ils leur système de soins de santé?

Terminale S. Terminale S 1 F. Laroche

Les solutions mi-hypothécaires, mi-bancaires de Manuvie. Guide du conseiller

Divorce et séparation

Formation d un ester à partir d un acide et d un alcool

Opérations bancaires avec l étranger *

Baccalauréat S Asie 19 juin 2014 Corrigé

Gérer les applications

PROBLEMES DIOPTIMISATION EN NOMBRES ENTIERS J. L. NICOLAS

Les nouveaux relevés de compte

RECHERCHE DE CLIENTS simplifiée

Petit recueil d'énigmes

Probabilités et statistique pour le CAPES

n tr tr tr tr tr tr tr tr tr tr n tr tr tr Nom:... Prénom :...

Renseignements et monitoring. Renseignements commerciaux et de solvabilité sur les entreprises et les particuliers.

Dénombrement. Introduction. 1 Cardinaux d'ensembles nis. ECE3 Lycée Carnot. 12 novembre Quelques dénitions

Neolane Message Center. Neolane v6.0

Transcription:

Tests d hypothèses via ue Approche Expérimale des Probabilités CQLS : cqls@upmf-greoblefr http://cqlsupmf-greoblefr Itroductio gééralités Cadre d estimatio à u échatillo Das ce cadre, tout problème pratique doit se rameer à l étude d ue uique variable d itérêt otée ici Y pouvat aussi être vue comme ue future uique doée E pratique, ous disposeros d u jeu de doées y = y,, y ie u vecteur ou paqu de observatios idépedates de Y qui peut par coséqu être vu comme u résultat possible d u futur jeu de doées Y = Y,, Y Afi d expliciter le paramètre d itérêt itimem lié das les problématiques du cours à la variable d itérêt Y, ous imagieros disposer d ue ifiité de doées virtuelles y [],, y [m], dot la otatio e idice re croch ie [ ] ous rappelle qu il e faut pas les cofodre avec le jeu des doées y,, y qui serot bie réelles Rappelos aussi que das ce cours les tailles des doées réelles m des doées virtuelles ot a priori des ordres de gradeur complètem différs, à savoir plutôt raisoablem grad m aussi grad que possible voire ifii Paramètres proportio moyee La moyee otée µ Y ou plus simplem µ plutôt appelée espérace de Y das l Approche Mathématique des Probabilités otée EY s exprime via l Approche Expérimale des Probabilités par : y[ ] = m y m [k] y [ ] m = µ Y = E Y k= Souligos toutefois que si les doées sot exclusivem à valeurs 0 ou, la moyee devi ue proportio ou probabilité sera otée p plutôt que µ Rappelos qu ue future estimatio µ Y Y de µ Y est tout simplem Y = Y i otée aussi Y Paramètre variace La variace otée σ Y ou plus simplem σ coservat la même déomiatio das l AMP otée VarY s exprime via l AEP par : m y[ ] m = y [k] y [ ] m m y[ ] = σ Y = Var Y = σy k= Das le cadre de grads échatillos voir plus loi, il est plus qu itéressat de oter que la variace est aussi ue moyee E eff, ous pouvos écrire σ Y = µ Ÿ puisque VarY = EY µ Y = EŸ où Ÿ = Y µ Y est le carré de la variable aléatoire Y préalablem crée Le vecteur des futures doées Y µ Y,, Y µ Y état iaccessible puisque µ Y est icou, ous le remplaceros par Ÿ = Y Y,, Y Y Aisi, ous pourrios aussi proposer µÿ Ÿ comme future estimatio de σ Y = µ Ÿ plutôt lorsque la taille des doées sera suffisamm grade

Cadre d estimatio à deux échatillos idépedats ll y a das ce cadre deux variables d itérêts Y Y idépedates dot o cherche soit à comparer les moyees soit les variaces à partir de deux échatillos, l u y = y,, y de taille l autre y = y,, y de taille Il e découle deux futurs jeux de doées Y = Y,, Y Y = Y,, Y Pour homogééiser ce cas avec celui à u seul échatillo, ous oteros Y, le vecteur aggrégé de toutes les futures doées Y = Y, Y de taille = + De maière aalogue au cas d u seul échatillo, ous imagios disposer de deux ifiités de doées virtuelles, l ue y [],, y [m], relative à Y l autre y [],, y [m], relative à Y Pour j = ou j =, o peut alors exprimer : la moyee µ Y j ou plus simplem µ j par y j [ ] m y j [ ] = µ j la variace σ ou plus simplem σ Y j j défiie par y j [ ] m y j [ ] = σ Nous sommes alors e mesure d itroduire les paramètres servat à comparer respectivem les moyees les variaces comparaiso de moyees s étudiat soit à partir de la différece de moyees d µ = µ µ soit à partir du rapport de moyees r µ = µ /µ si µ 0 comparaiso de variaces s étudiat soit à partir de la différece de variaces d σ = σ σ soit à partir du rapport de variaces r σ = σ /σ si σ 0 Isistos sur le fait que les utilisatios d ue différece ou d u rapport e sot pas aodies puisqu elles permt de traiter des assertios d itérêt différes 3 Les deux cadres usuels : asymptotique gaussie Cadre asymptotique ou grads échatillos : par grad échatillo, o ed das ce cours ue taille de doées 30 pour le cas u seul échatillo des tailles 30 30 pour celui de deux échatillos Cadre gaussie : si ue variable d itérêt est supposée suivre ue loi Normale o dit que l échatillo associé est gaussie Ce cadre d étude est a priori itéressat que s il est possible de vérifier évuellem à partir d u outil statistique cte hypothèse de Normalité de la variable d itérêt Alors qu il faudrait disposer d u grad échatillo pour cte vérificatio, l usage das la littérature statistique est d utiliser ce cadre d étude même pour des pits échatillos Les résultats repos alors sur la validité de l a priori que la variable d itérêt suit ue loi Normale Cepedat, certais phéomèes étudiés peuv laisser peser que cte hypothèse sur la ou les variables d itérêt e doit pas être aberrate 4 Comparaiso re AMP, AEP Pratique Das le tableau suivat, le jour J désige le jour où les doées sot réellem récoltées Idic : voir fi de docum pour les différes otatios j

Avat le jour J θ fixé évuellem à ue valeur arbitraire pour l expérimatio Mathématique Y Y θy ou Θ ty ou T y [] y [] Expérimal y [] y [m] θy[] ou θ [] ty [] ou t [] y [] y [+] θy[] ou θ [] ty [] ou t [] y [] y [m +] Moyee = µ := y [ ] = E Y Ecart-Type = σ := y [ ] = σy θy[m] ou θ [m] ty [m] ou t [m] y [m ] = Var Y θ y[ ] = E θ Y ty [ ] = E ty σ θ := θ y[ ] = σ θ Y = Var θ Y ty [ ] = σty = Var ty Proportio das [a, b[ = y[ ] [a, b[ θ y[ ] [a, b[ ty [ ] [a, b[ = PY [a, b[ = P θ Y [a, b[ = PtY [a, b[ Histogramme à pas zéro = f Y f θy ou f Θ f gy ou f T Surface brique m fii = m m Après le jour J θ est égal à θ qui est toujours icou y Pratique y θy ou θ ty ou t y Le jour J θ = θ, si o essaye d associer des temps de cojugaiso aux différs cocepts, ous pouvos dire : le jeu de doées réel y représe le prés le jeu de doées aléatoire Y représe le futur o pourra alors aussi l appeler futur jeu de doées les jeux de doées virtuels y [j] représ le coditioel ils représ ue ifiité de jeux de doées que l o aurait pu avoir à la place de y m 3

Test d hypothèses De maière géérale, la rédactio stadard d u test d hypothèses s écrit toujours de la même faço Elle est décrite ci-dessous pour u paramètre θ qui devra être remplacé par p pour ue proportio, µ pour ue moyee, σ pour ue variace, d µ resp r µ pour ue différece resp rapport de moyees efi d σ resp r σ pour ue différece resp rapport de variaces La valeur de référece θ 0 la loi L 0 devrot être adaptée selo la problématique Rédactio stadard d u test d hypothèses paramétrique Hypothèses de test : θ > θ 0 H 0 : θ = θ 0 cotre H : θ < θ 0 θ θ 0 cas a : test uilatéral droit cas b : test uilatéral gauche cas c : test bilatéral Statistique de test sous H 0 : δ θ,θ0 Y L 0 où L 0 est ue loi stadard à préciser selo la problématique evisagée Règle de décisio : o accepte H si p valeur < α ou de maière équivale δ θ,θ0 y > δ + lim,α δ θ,θ0 y < δ lim,α δ θ,θ0 y < δ lim,α/ ou δ θ,θ0 y > δ + lim,α/ où δ lim,α = q α δ + lim,α = q α désig respectivem les quatiles d ordre α α associés à la loi L 0 où la p valeur est défiie mathématiquem par : P θ=θ0 δθ,θ0 Y > δ θ,θ0 y a : p-valeur droite p-valeur = P θ=θ0 δθ,θ0 Y < δ θ,θ0 y b : p-valeur gauche mip θ=θ0 δ θ,θ0 Y < δ θ,θ0 y,p θ=θ0 δ θ,θ0 Y > δ θ,θ0 y c : p-valeur bilatérale a b c Coclusio : Applicatio de la règle de décisio au vu des doées y Propriétés : La somme des p-valeur gauche p-valeur droite est égale à La p-valeur bilatérale est égale à deux fois la plus pite des p-valeurs gauche droite Tableaux récapitulatifs : Il sera aussi supposé que les doées ot été saisies das le logiciel R soit sous le om y pour u uique échatillo soit sous les oms y y pour deux échatillos idépedats 4

σ Y θ θ Y θ y e R σ θ σ θ Y σ θ y e R p p Y = Y = p p p Y p Y Yi meay σ p = semeay µ µ Y = Y = Yi meay σ µ = σ Y semeay σ σ σ Y = σ σ Ÿ Yi Y Ÿ Ÿ vary = σ σ sevary Y dµ =µ µ dµ Y = µ Y µ Y meay-meay d σ =σ σ dσ Y = σ rµ = µ µ rµ Y = r σ = σ σ r σ Y = Y σ µ Y σ dµ = σ + σ σ Y vary-vary σ = Ÿ dσ + σ Ÿ µ Y meay/meay σ rµ = µ σ Y σ vary/vary σ rσ = σ Y σ Cas Gaussie σ = σ = σ : σ Y = σ σ + r µ σ Y µ σ σ Ÿ +r Ÿ σ σ Y + σ Ÿ Ÿ σ σ Ÿ + Y sedmeay,y Y + σ Y sedmeagy,y + σÿ Ÿ + rµ Y Ÿ + r σ Y sedvary,y σ σ Ÿ Y sermeay,y Ÿ servary,y θ θ0 σ θ sous H0 δθ,θ0 = θ θ 0/σ θ p 0 p0 δp,p0 = p p 0 p0 p0 p p0 µ µ 0 σ µ δµ,µ 0 = µ µ 0 σ µ Cadre Asymptotique Cadre Gaussie δθ,θ0 Y sa loi sous H 0 δθ,θ0 δp,p0 Y = p Y p 0 p0 p0 δµ,µ 0 Y = µ Y µ 0 σ µ Y approx N 0, approx N 0, δµ,µ 0 = µ µ 0 σ µ δθ,θ0 Y sa loi sous H 0 δµ,µ 0 Y = µ Y µ 0 σ µ Y St σ σ 0 σ σ δ σ,σ 0 = σ σ 0 σ σ dµ =µ µ d0 σ dµ δdµ,d0 = d µ d0 δ σ,σ 0 Y = σ Y σ 0 σ σ Y σ dµ δdµ,d0 Y = dµ Y d0 σ dµ Y approx N 0, δ σ,σ 0 = σ σ 0 approx N 0, δdµ,d0 = d µ d0 δ σ,σ 0 Y = σ Y σ 0 δdµ,d0 Y = dµy d0 σ dµ Y σ dµ χ St + d σ =σ σ d0 σ dσ δd σ,d0 = d σ d 0 σ dσ rµ = µ µ r0 σ rµ δrµ,r0 = r µ r0 δd σ,d0 Y = d σ Y d0 approx σ Y N 0, dσ σ rµ δrµ,r0 Y = r µ Y r0 σ rµ Y approx N 0, r σ = σ σ r0 σ rσ δr σ,r0 = r σ r 0 σ rσ δr Y = r σ Y r 0 approx σ,r0 σ rσ Y N 0, δr = r σ σ,r0 r0 δr σ,r0 Y = r σ Y r0 F, 5

3 Itervalle de cofiace 3 Gééralités Le cocept d itervalle de cofiace d u paramètre quelcoque θ cosiste à proposer u ecadrem ou ue fourchte représé par u itervalle de variables aléatoires [ θif Y, θ sup Y ] de sorte que le paramètre d itérêt θ icou ait u iveau de cofiace α plutôt élevé si α raisoablem pit d être à l itérieur de c itervalle Mathématiquem cela s exprime par : P θ [ θif Y, θ sup Y ] = α Par l approche expérimale, si ous pouvios imagier répéter autat de fois que possible la coceptio d itervalles de cofiace [ θif ] y[], θsup y[],, [ θif ] y[m], θsup y[m], obteus respectivem sur ue ifiité de jeux de doées virtuels y [],, y [m],, ous costaterios alors qu il y e aurait qu ue proportio α qui cotiedrai le paramètre d itérêt θ icou La costructio de ces itervalles déped e gééral de la caractérisatio du comportem aléatoire de la mesure d écart stadardisée δ θ,θ Y proposée das toutes les problématiques das le tableau suivat : Cadre Asymptotique Cadre Gaussie θ δ θ,θ Y δ θ,θ Y p p Y p approx δ p,p Y = N 0, σ p Y µ µ Y µ approx µ Y µ δ µ,µ Y = N 0, δ µ,µ Y = St σ µ Y σ µ Y σ δ σ Y = σ Y σ approx N 0,,σ Y Y = σ Y,σ σ σ σ χ d µ =µ µ δ dµ,d µ Y = d µ Y d µ σ dµ Y approx N 0, δ dµ,d µ Y = d µ Y d µ St + Y σ dµ d σ =σ σ δ dσ,d σ Y = d σ Y d σ σ dσ Y approx N 0, r µ = µ µ δ rµ,r µ Y = r µ Y r µ approx N 0, σ rµ Y r σ = σ σ δ rσ,r σ Y = r σ Y r σ σ rσ Y 3 Cadre asymptotique approx N 0, δ rσ,r Y = r σ Y σ F, r σ Tous les itervalles de cofiace relatifs à toutes les problématiques du cours s obtie das le cadre de grads échatillos par la même méthode Après substitutio du paramètre d itérêt de votre problématique au choix parmi p, µ, σ, d µ, d σ, r µ r σ otée ici de maière géérale θ, ous allos aturellem utiliser la caractérisatio du comportem aléatoire de l écart re θ Y θ exprimée via la mesure d écart stadardisée δ θ,θ Y suivat approximativem ue loi Normale N 0, Très facilem, ous pouvos affirmer que : α P δ θ,θ Y < δ + lim, α = P θ Y δ + lim, α } {{ } θify σ θ Y < θ < θ Y + δ + lim, α σ θ Y } {{ } θsupy où δ + lim, α est le quatile d ordre α de la loi N 0, 33 Cadre gaussie Pour costruire u itervalle de cofiace das u cadre gaussie du paramètre θ au choix µ, σ, d µ ou r σ, ous allos aturellem utiliser la caractérisatio du comportem aléatoire de 6

l écart re θ Y θ exprimée via la mesure d écart stadardisée δ θ,θ Y Il s agit alors de trouver θif Y θ sup Y tels que α = P θif Y < θ < θ sup Y e utilisat le fait que α = P q α < δ θ,θ Y < q α où q α est le quatile d ordre α de la loi de la mesure d écart stadardisée δ θ,θ Y L exercice est plus difficile que das le cadre asymptotique d ue part parce que la mesure d écart stadardisée δ θ,θ Y θ état au choix µ, σ, d µ ou r σ e se déclie pas toujours sur le même schéma de costructio d autre part parce que la loi de δ θ,θ Y est plus ue loi Normale stadard Sas trop ous attarder, voici les différs itervalles de cofiace pour les différs choix de θ : θ = µ : µ if Y = µ Y q α où q α est le quatile d ordre α θ = σ : σ Y σ if Y = σ Y q α de la loi St µ sup Y = µ Y + q α σ sup Y = σ Y q α où q α resp q α est le quatile d ordre α resp α de la loi χ θ = d µ : d µif Y = d µ Y q α d µsup Y = d µ Y + q α σ Y + σ Y + σ Y où q α est le quatile d ordre α de la loi St + La quatité σ Y est défiie comme das le tableau récapitulatif des tests d hypothèses partie cadre gaussie θ = r σ : r σ if Y = r σ Y q α r σ sup Y = r σ Y q α où q α resp q α est le quatile d ordre α resp α de la loi F, 4 Lagage mathématique Systèmes de otatio Das ce cours, deux systèmes de otatio sot utilisés pour décrire des expressios mathématiques dédiées à la statistique Le premier, appelé Norme CQLS ou Norme CQLS Stadard cosiste e u système de otatio riche peut-être u peu lourde dot le pricipal avatage est qu il est taillé sur mesure pour être traduisible das le lagage littéral Le deuxième système, appelé Norme SSE ou Norme CQLS Simplifié, a pour vocatio à être Simple, Sythétique Explicite ou du mois le plus possible Il demade cepedat das so utilisatio u meilleur iveau d expertise essiellem dû au fait que sa traductio das le lagage littéral est mois explicite que celle pour la Norme CQLS Notre coseil est de commecer par l utilisatio de la Norme CQLS pour, au fur à mesure du cours, passer à la Norme SSE Covios commues aux deux Normes CQLS SSE : Majuscule versus Miuscule : ue variable aléatoire ou susceptible de l être est otée e majuscule quad ue variable dot o sait qu elle est détermiiste ie o aléatoire est oté e miuscule Le Chapeau au dessus d ue quatité par exemple, θ désige gééralem u remplaçat appelé plus commuém estimatio das le cas où la quatité est u paramètre ici θ 3 U vecteur est oté e caractères gras Remarque : ue expressio écrite sur u docum imprimé e caractères gras ex : expressio e gras est subtituée sur u tableau ou sur ue feuille papier par sa versio souligée ex : expressio e gras 7

4 Delta δ e miuscule e majuscule est utilisé pour désiger u écart le plus souv additif ie ue soustractio mais parfois multiplicatif ie ue divisio La Norme CQLS a été itroduite pour décrire le plus précisém possible l Approche Expérimale des Probabilités AEP L AEP s articulat sur ue distictio des différs jeux de doées, la Norme CQLS repose sur la covio suivate : Toute statistique ie va dépedat d u jeu de doées s écrit comme ue foctio du jeu de doées Il y a pas vraim de covio propre à la Norme SSE So objectif est cepedat de e pas respecter la covio spécifique ci-dessus à la Norme CQLS das le but de redre plus sythétique les otatios mathématiques Le tableau ci-dessous exprime plus clairem la spécificité des Normes CQLS SSE e proposat les pricipales expressios utilisées e statistique das les ormes Statistique Aléatoire ou futur Réalisé ou prés Réalisable ou coditioel va foctio de l échatillo CQLS SSE CQLS SSE CQLS SSE Estimatio de θ θ Y Θ θ y θ θ y [k] θ [k] Estimatio de p p Y P p y p p y [k] Estimatio de µ µ Y M µ y µ µ y [k] Estimatio de σ σ Y Σ σ y σ Erreur stadard de θ σ θ Y Σθ σ θ y σ θ σ θ σ y [k] y [k] p [k] µ [k] σ,[k] σ θ,[k] Ecart re θ θ δ θ Y,θ θ δ θ y δ,θ θ δ θ y,θ [k] δ θ,[k] Estimatio de δ θ,θ 0 ou δ θ0 δ θ,θ 0 Y θ0 δ θ,θ 0 y δθ0 δ θ,θ 0 y [k] δθ0,[k] Le tableau ci-dessous illustre comm covertir ue otatio e sa défiitio littérale ou mathématique pour des cocepts de base de la statistique La coversio das le lagage R y est aussi proposée permtat à l utilisateur de savoir comm obteir ces quatités e Pratique : Notatio Défiitio littérale Défiitio mathématique y Vecteur des réels y,, y y,, y ou y y i est la ième composate de y e R : y <- cy,,y #y Nombre de composates de y = R legthy R y ou y Moyee empirique de y y i = meay y = a Proportio des y,, y R ou yi=a = meay==a y = a égaux à a a y b Proportio des y,, y ou a y b das [a, b] avec a b y ou y y ou y Ecart-type empirique de y Variace empirique de y [a,b] y i R = meaa<= y & y<= b y i y R = sdy y i y = R vary q α y Quatile d ordre α de y y [α]+ impair y [α]++y [α]+ pair R ou q α y 0 < α < = quatiley,alpha 5 Quelques istructios R Istructios de base par l exemple : des exemples commés val peut-être mieux que de logs discours! > c-, # Créatio du vecteur -, [] - 3 > 4+*c-,0, # Trasformatio 4+*x appliqué pour chaque composate de y 4 [] 4 6 5 > y<-c,3,,4,7,6 8

6 > y 7 [] 3 4 7 6 8 > 4+*y 9 [] 6 0 8 8 6 0 > meay # Moyee de y [] 3833333 > sdy # Ecart-type de y 3 [] 36607 4 > yc <- y-meay # yc correspod au vecteur y cré 5 > yc 6 [] -8333333-08333333 -8333333 0666667 3666667 666667 7 > meayc # Moyee ulle 8 [] -48097e-6 9 > sdyc # Idem que l écart-type de y 0 [] 36607 > ycr <- y-meay/sdy # ycr correspod au vecteur y cré réduit > meaycr # Moyee ulle 3 [] -74039e-7 4 > sdycr # Ecart-type à 5 [] 6 > vary # Variace de y 7 [] 5366667 8 > sqrtvary # Ecart-type = racie carrée de variace 9 [] 36607 30 > sdy^ # Variace = carré de l écart-type 3 [] 5366667 Quatiles foctios de répartitio avec R : Soit p u réel apparteat à ]0, [, o défiit le quatile d ordre p associée à ue loi de probabilité le réel qui via l approche expérimale peut être vu comme le réel qui sépare l ifiité des observatios associée à la loi de probabilité e deux, ue proportio p à gauche ue proportio p à droite O défiit égalem la foctio de répartitio e u réel q, la proportio parmi l ifiité des observatios qui se situ avat q Ces deux otios sot illustrées das la figure Figure Si X loi va cotiue, alors f x R = dloi x, représe sa desité de probabilité, p = F q = P X q R = ploi q, sa foctio de répartitio q = F p R = qloi p, so quatile d ordre p Le tableau suivat résume les différes lois de probabilités cosidérées das ce cours de deuxième aée aisi que les istructios R permtat d évaluer les quatiles foctios de répartitios associés à ces lois de probabilités 9

Applicatio : lois de probabilités loi R quatile d ordre p foctio de répartitio e q Normale N µ, σ orm qormp, µ, σ pormq,µ, σ Normale N 0, orm qormp pormq Chisquare χ chisq qchisqp, pchisqq, Fisher F, f qfp,, pfq,, Stud St t qtp, ptq, > porm6449 # proba N0, plus pit que 6449 [] 09500048 3 > qorm095 # quatile N0, d ordre 95% proche de 6449 4 [] 644854 5 > -porm96 # proba N0, plus grad que 96 proche de 5% 6 [] 0049979 7 > qormc95,975,99 # quatiles N0, d ordre 95%, 975% 99% 8 [] 644854 959964 36348 9 > qtc95,975,99,0 # quatiles St0 d ordre 95%, 975% 99% 0 [] 846 839 763769 > ptc846,839,763769,0 # les probas correspodates [] 0950 0975 0990 3 > qchisqc95,975,99,0 # quatiles Khi0 d ordre 95%, 975% 99% 4 [] 830704 04838 3095 5 > pchisqc830704,04838,3095,0 # les probas correspodates 6 [] 0950 0975 0990 7 > qfc95,975,99,0,0 # quatiles F0,0 d ordre 95%, 975% 99% 8 [] 347878 77367 336886 9 > pfc347878,77367,336886,0,0 # les probas correspodates 0 [] 0950 0975 0990 Illustratio du lie re AEP AMP : Ue istructio rloi, du même type que les itructios ploiq, qloip, présées précédemm perm de géérer simultaém réalisatios y := y,, y d ue va Y ayat pour loi loi Illustros-le sur ue vérificatio expérimale AEP d obtio de probabilité, quatile, moyee variace relatifs à ue loi N, > yy<-rorm0000,, # les m=0000 réalisatios ot stockées das le vecteur yy > yy # les 0 premières 0 derières composates de yy 3 [] 4634e+00 33707e+00 34303e+00 3406e+00 588605e+00 4 [6] 6705e-0 4665e+00 59937e+00 945e+00 9303e+00 5 6 [999] 576079e-0 466938e+00 99998e+00-509e+00 4084307e+00 7 [9996] -84305e+00 564039e+00-463e+00 360034e+00-3056839e+00 8 > meayy<05 # proportio des m=0000 composates strictem iférieur à 05 9 [] 0397 0 > porm05,, # idem si m=ifii [] 040937 > meayy==05 # proportio des m=0000 composates égale à 05 =0 si m=ifii 3 [] 0 4 > mea05<=yy && yy<=3 # proportio des m=0000 composates compris re 05 3 5 [] 0 6 > porm3,,-porm5,, # idem si m=ifii 7 [] 044005 8 > quatileyy,95 # quatile d ordre 95% des m=0000 composates 9 95% 0 46358 > qorm95,, # idem si m=ifii [] 489707 3 > meayy # moyee des m=0000 composates = si m=ifii 4 [] 098355 0

5 > varyy # variace des m=0000 composates =^=4 si m=ifii 6 [] 393396

Tables de lois usuelles de variables aléatoires cotiues pour la statistique Nom Graphe Desité de probabilité Espérace Variace Remarques Uiforme X U [a, b] a < b f x = si x [a, b] b a 0 sio E X = a + b V ar X = b a La desité de probabilité d ue loi uiforme est u histogramme à classe U [0, ] U [, 4] Normale X N µ, σ µ réel σ réel > 0 f x = σ π e x µ σ E X = µ V ar X = σ Si X N µ, σ alors X µ σ N 0, Si X N µ X, σx Y N µ Y, σy sot des va idépedates alors X + Y N µ X + µ Y, σ X + σ Y N, 05, N 0, puis N 4, Chisquare X χ ν ν ier > 0 f x = e x x ν ν Γ si x > 0 ν 0 sio E X = ν V ar X = ν Si X,, X sot lois N 0, idépedates alors Y = Xi χ ν = 3, ν = 6 puis ν = 9 Stud X St ν ν ier > 0 f x = + x ν β, ν ν+ E X = 0 si ν ν V ar X = ν ν si ν 3 Si X N 0, Y χ ν sot idépedates alors Z = X Y ν St ν ν = ν = 30 Fisher X F ν, ν ν, ν iers > 0 F 5, 00, F 00, 5 puis F 30, 30 f x = si x > 0 ν ν ν ν x ν νx+ν ν +ν β ν, ν f x = 0 sio { E X = ν si ν 3 ν V ar X = ν ν +ν νν ν 4 si ν 5 Si X χ ν X χ ν sot idépedates alors Y = X/ν X/ν F ν, ν