Statistique Numérique et Analyse des Données

Dimension: px
Commencer à balayer dès la page:

Download "Statistique Numérique et Analyse des Données"

Transcription

1 Statistique Numérique et Aalyse des Doées Arak DALALYAN Septembre 2011

2

3 Table des matières 1 Élémets de statistique descriptive Répartitio d ue série umérique uidimesioelle Statistiques d ue série umérique uidimesioelle Statistiques et représetatios graphiques de deux séries umériques Résumé du Chapitre Aalyse des doées multivariées Itroductio Exemple : billets suisses La théorie de l Aalyse e Composates Pricipales Représetatios graphiques et iterprétatio Résumé du Chapitre Rappel des bases de la statistique paramétrique Itroductio Modèle statistique Estimatio Itervalle de cofiace Test d hypothèses Exercices Résumé du Chapitre Régressio liéaire multiple Gééralités Lois associées aux échatillos gaussies Le modèle gaussie Régressio liéaire multiple Exercices Résumé du Chapitre Tests d adéquatio Itroductio Tests du chi-deux Test de Kolmogorov Résumé du Chapitre

4 4 Table des matières Chapitre 0 6 Tables umériques Quatiles de la loi ormale cetrée réduite Table de la loi du khi-deux Table de la loi de Studet Quatiles pour le test de Kolmogorov

5 Table des figures 1.1 Histogrammes Foctio de répartitio empirique Répartitios asymétriques Boxplot Nuage de poits Nuage de poits pour les doées trasformées Nuage de poit et droite de régressio QQ-plots Fracs Suisses Billets suisses : boxplots Billets Suisses : matrice de scatter plots Billets suisses : projectio des idividus Billets suisses : scree-graph et cercle des corrélatios La log-vraisemblace du modèle de Beroulli La log-vraisemblace du modèle expoetielle La log-vraisemblace du modèle Uiforme Itervalles de cofiace pour le modèle de Beroulli Les quatiles de la loi N (0, 1) Doées de pluie La répartitio des doées du taux d alcool Doées de pluie : droite de régressio Le test de Kolmogorov s appuie sur la distace etre foctio de répartitio empirique et théorique Présetatio usuelle de la distace de Kolmogorov

6

7 Liste des tableaux 1.1 Doées PIB-Cosommatio d éergie par habitat Doées des billets suisses authetiques Doées des billets suisses cotrefaits Hauteurs d arbres das 3 forêts Jour et quatité de pluie par aées Quatiles de la statistique de Kolmogorov

8

9 1 Élémets de statistique descriptive Le but de ce chapitre est de préseter les outils graphiques les plus répadus de la statistique descriptive. O cosidérera les cas d ue série umérique uidimesioelle et bidimesioelle. Avat de retrer das le vif du sujet, apportos ue petite précisio à ue idée très largemet répadue, selo laquelle le but de la disciplie statistique est d aalyser des doées issues d ue expériece à caractère aléatoire. Cela sous-eted qu il est pas possible ou qu il est pas utile d appliquer la méthodologie statistique aux doées recueillies par u procédé détermiiste (o aléatoire). Cette ue déductio erroée. La boe défiitio de l objectif de la Statistique e tat que disciplie scietifique, à otre avis, serait d explorer les «propriétés fréquetielles» d u jeu de doées. Par «propriétés fréquetielles», o compred les propriétés qui restet ivariates par toute trasformatio des doées (comme, par exemple, la permutatio) qui e modifie pas la fréquece des résultats. Le but de ce chapitre est d itroduire les statistiques pricipales et de doer u aperçu des outils graphiques les plus utilisés. 1.1 Répartitio d ue série umérique uidimesioelle Supposos que les doées qu o a à otre dispositio représetet valeurs réelles otées x 1,..., x costituat les résultats d ue certaie expériece répétée fois. Des exemples de source de telles doées sot : les sodages, les expérieces scietifiques (physiques, chimiques, médicales,...), les eregistremets historiques (météorologiques, socioécoomiques,...). Das certais cas, ces doées sot volumieuses et difficiles à iterpréter. O a alors besoi de les résumer et de trouver des outils pertiets pour les visualiser. Afi que l aalyse statistique d ue série umérique ait u ses, il faut que les différets élémets de cette série représetet la même quatité mesurée sur des etités différetes. Par exemple, x 1,..., x peuvet être les hauteurs de immeubles choisis au hasard à Paris, ou les températures jouralières moyees à Paris eregistrées au cours de l aée 2009, etc. O dit alors que x 1,..., x sot les valeurs d ue variable (statistique) observées sur idividus.

10 10 Élémets de statistique descriptive Chapitre 1 O va différecier deux types de séries umériques : celles qui représetet ue variable discrète et celles qui représetet ue variable cotiue 1. O dit qu ue variable est discrète, si le ombre de valeurs différetes parmi x 1,..., x est petit devat. Cette défiitio est loi d être rigoureuse, mais cela est e gééral pas très gêat. Das les deux exemples doés au paragraphe précédet, les variables «hauteur d immeuble» et «température jouralière moyee» sot cotiues. Si au lieu de mesurer la hauteur d u immeuble, o comptait le ombre d étages, ce serait ue variable discrète Histogramme Pour les séries umériques représetates ue variable discrète, o défiit l histogramme comme la foctio h : R N qui à chaque x R associe le ombre d élémets das la série x 1,..., x égaux à x. Par exemple, l histogramme de la série umérique (1.1) est tracé das la Figure 1.1 (à gauche). Ue approche alterative cosiste à défiir h(x) comme la proportio des élémets das la série égaux à x. O utilise alors la forme aalytique h(x) = 1 1(x i = x). i=1 Das le cas où la série umérique qu o cherche à aalyser est cotiue, o commece par choisir ue partitio de R e u ombre fii d itervalles : I 0, I 1,..., I k. Ayat fixé la partitio, o défiit l histogramme de la série x 1,..., x comme la foctio h : R R + doée par la formule h(x) = j I j, si x I j, où j est le ombre d élémets de la série qui se trouvet das le jème itervalle I j de la partitio et I j est la logueur de l itervalle I j. Le choix de la partitio est ue questio délicate que l o approfodira pas ici. Das la plupart des cas, o choisit ue partitio uiforme (c est-à-dire, tous les I j sot de même logueur) d u itervalle coteat toutes les valeurs de la série umérique. De plus, o essaye de faire e sorte qu il y ait au mois 5 observatios das chaque itervalle o-vide. Par exemple, l histogramme de la série umérique (1.2) est tracé das la Figure 1.1 (à droite) Foctio de répartitio empirique Ue représetatio alterative des fréqueces des valeurs coteues das ue série umérique est la foctio de répartitio, appelée égalemet histogramme cumulé. Pour u x R, 1. Le terme variable cotiue est pas très bie choisi, mais cela e pose pas de problème majeur.

11 Sectio 1.2 Statistiques d ue série umérique uidimesioelle 11 FIGURE 1.1 Exemples d histogrammes. A gauche : l histogramme de la série discrète (1.1). A droite : l histogramme de la série (1.2). FIGURE 1.2 Foctio de répartitio empirique (FDRE). A gauche : la FDRE de la série discrète (1.1). A droite : la FDRE de la série (1.2). O voit bie que c est ue foctio e escalier croissate, qui vaut 0 sur l itervalle ], mi i x i [ et qui vaut 1 sur l itervalle ] max i x i, + [. la valeur e x de la foctio de répartitio d ue série umérique x 1,..., x est la proportio des élémets de la série iférieurs ou égaux à x, c est-à-dire : ˆF (x) = 1 1(x i x). i=1 L avatage de la foctio de répartitio, comparé à l histogramme, est que sa défiitio est idetique das le cas d ue variable discrète et das le cas d ue variable cotiue. 1.2 Statistiques d ue série umérique uidimesioelle O appelle ue statistique toute foctio qui associe aux doées x 1,..., x u vecteur S(x 1,..., x ) R p. O utilise les statistiques pour résumer les doées Statistiques de tedace cetrale et de dispersio Les trois statistiques de tedace cetrale les plus utilisées sot la moyee, la médiae et le mode. O les appelle égalemet les statistiques de positio.

12 12 Élémets de statistique descriptive Chapitre 1 La moyee, otée x, est défiie par : x = 1 x i. i=1 La médiae, otée Med x, est u ombre réel tel qu au mois la moitié des doées sot Med x et au mois la moitié des doées sot Med x. Le mode, oté Mode x, est la valeur la plus fréquete à l itérieur de l esemble des doées. Cotrairemet à la moyee, la médiae et le mode e sot pas toujours uiques. Les trois statistiques de dispersio les plus utilisées sot la variace, l écart-type et l écart iterquartile. La variace, otée v x, est la valeur moyee des carrés des écarts etre les doées et la moyee : v x = 1 i=1 (x i x) 2. L écart-type, otée s x, est la racie carré de la variace : s x = v x. L écart iterquartile est la différece etre le troisième et le premier quartile : Q 3 Q 1, où le premier quartile Q 1 (respectivemet, le troisième quartile Q 3 ) est la médiae des doées < Med x (resp. > Med x ) Statistiques d ordre et quatiles Etat doé ue série de doées uidimesioelles x 1,..., x, o s itéresse souvet à la plus petite valeur mi i x i ou à la plus grade valeur max i x i prise par les x i. E statistique, o utilise les otatios x (1) = mi 1 i x i, x () = max 1 i x i, et o les appelle première et derière statistiques d ordre. Plus gééralemet, o défiit la statistique d ordre de rag k, otée x (k), comme la k ème plus petite valeur parmi x 1,..., x. Plus précisémet, soit (i 1,..., i ) ue permutatio (il peut y e avoir plusieurs) des idices (1,..., ) qui classe les doées das l ordre croissat : x i1 x i2... x i. O appelle alors statistique d ordre k la valeur x (k) = x ik. Pour toute valeur α [0, 1], o appelle quatile d ordre α, oté q x α, de la série x 1,..., x, la statistique d ordre x (m) avec m = [α]. E utilisat la otio de quatile, o peut redéfiir les quartiles et la médiae comme suit : Q 1 = q x 0.25, Med x = q x 0.5, Q 3 = q x E pratique, ces défiitios de quartiles et médiae coduiset vers des résultats qui diffèret légèremet de ceux obteus par la première défiitio, mais gééralemet la différece est pas importate et décroît lorsque la taille de la série augmete.

13 Sectio 1.2 Statistiques d ue série umérique uidimesioelle Statistiques de forme Les deux statistiques de forme les plus utilisées sot le coefficiet d asymétrie et le coefficiet d aplatissemet. Le coefficiet d asymétrie (skewess), otée α x, et le coefficiet d aplatissemet (kurtosis), otée β x, sot défiis par : α x = 1 s 3 x i=1 (x i x) 3, β x = s 4 x i=1 (x i x) 4. O peut facilemet vérifier que le coefficiet d asymétrie de toute série umérique symé- FIGURE 1.3 Exemples de répartitios asymétriques : le coefficiet d asymétrie est positive pour la distributio à gauche et égative pour celle de droite. trique est ul. (O dit qu ue série umérique est symétrique par rapport à u ombre réel mu, si pour tout a > 0 la fréquece de la valeur µ + a das la série est égale à celle de µ a. O peut égalemet vérifier que le coefficiet d aplatissemet ted vers zéro lorsque si la série umérique représete des réalisatios idépedates de la loi gaussiee N (0, 1) Box plots (Boîtes à moustaches) U résumé simple et pratique de la répartitio d ue série x 1,..., x est doé par le quituplé (A, Q 1, Med x, Q 3, B), où A et B représetet les limites iférieure et supérieure de l itervalle e dehors duquel les doées sot cosidérées comme aberrates (o les appelle aussi atypiques ou des outliers). Q 1 et Q 3 sot respectivemet le premier et le troisième quartile. Med x est la médiae de l échatillo. Ce quituplé est utilisé pour costruire le diagramme e boîte ou à moustaches que ous appelleros désormais boxplot. La forme géérale d u boxplot est motrée das la Figure 1.4. Les valeurs A et B sot détermiées par les formules { } A = mi x i : x i Q 1 1.5(Q 3 Q 1 ), { } B = max x i : x i Q (Q 3 Q 1 ). Si la série umérique a ue répartitio ormale (Gaussiee), la probabilité qu ue valeur de la série se trouve e dehors de l itervalle [A, B] est de 0.7%.

14 14 Élémets de statistique descriptive Chapitre 1 FIGURE 1.4 La forme typique d ue boîte à moustaches (ou boxplot), le rectagle bleu état la boîte et les segmets [A, Q 1 ] et [Q 3, B] état les moustaches. Pour compléter le boxplot, o fait apparaître les valeurs aberrates. Toutes les valeurs qui se trouvet e dehors de l itervalle [A, B] sot désigées par u symbole (souvet par ue étoile). Das l exemple de la Fig. 1.4, il y a pas de valeur aberrate. Pour iterpréter u boxplot, il faut oter que la moitié des valeurs de la série se trouvet etre Q 1 et Q 3, c est-à-dire das la boîte du boxplot, la moitié des valeurs de la série se trouvet à gauche de la médiae, s il y a pas de valeurs aberrates, toutes les valeurs de la série se trouvet etre A et B. Les boxplots sot pratiques pour comparer deux séries statistiques. 1.3 Statistiques et représetatios graphiques de deux séries umériques Cosidéros maiteat le cas de deux séries umériques x 1,..., x et y 1,..., y correspodat aux valeurs de deux variables prélevées sur le même idividu. Par exemple, x i et y i peuvet costituer la taille et le poids d ue persoe, la température moyee et le iveau de pollutio à Paris u jour doé, Covariace et corrélatio La statistique la plus utilisée das le cotexte de deux séries umériques est la corrélatio. Pour la défiir, la otio de covariace doit être itroduite. O appelle covariace des séries umériques x 1,..., x et y 1,..., y la valeur s xy = 1 i=1 (x i x)(y i ȳ), où x et ȳ sot respectivemet la moyee des x i et celle des y i. O appelle coefficiet corrélatio ou coefficiet corrélatio liéaire des séries umériques x 1,..., x et y 1,..., y la valeur ρ xy = s xy s x s y, où s x et s y sot respectivemet l écart-type des x i et celui des y i. Par covetio, o pose ρ xy = 0 si au mois l u des deux écart-types s x, s y est ul. Propositio 1.1. Le coefficiet de corrélatio est toujours etre 1 et +1 : 1 ρ xy 1.

15 Sectio 1.3 Statistiques et représetatios graphiques de deux séries umériques 15 De plus, ρ xy = 1 si et seulemet si les séries x 1,..., x et y 1,..., y sot liées par ue relatio affie, c est-à-dire x i = ay i + b pour tout i = 1,...,. Démostratio. E utilisat l iégalité de Cauchy-Schwarz, o vérifie que s xy 1 (x i x)(y i ȳ) 1 ( i=1 i=1 (x i x) 2 i=1 (y i ȳ) 2) 1 2 = s x s y. Cela implique que le coefficiet de corrélatio ρ xy = s xy /(s x s y ) est toujours etre 1 et +1. De plus, l iégalité de Cauchy-Schwarz est ue égalité si et seulemet si x i x = a(y i ȳ), ce qui etraîe la secode assertio de la propositio Nuage de poits et droite de régressio Supposos que l o dispose de deux séries umériques x 1,..., x et y 1,..., y représetat les valeurs de deux variables prélevées sur idividus. Il est aturel et pratique de représeter ces doées sous forme d u uage de poits. Il s agit de représeter par u symbole (losage, das l exemple de la Fig. 4.1) les poits de coordoées (x i, y i ). A titre d exemple, cosidéros les doées présetées das la Table 1.1. Ces doées représetet deux variables dot les valeurs sot eregistrées pour = 38 idividus. Les idividus sot des pays, alors que les deux variables X et Y sot respectivemet le PIB (produit itérieur brut) par habitat et la cosommatio d éergie par habitat. Le uage de poit de ces doées est affiché das la partie haute de la Figure 4.1. Das ce cotexte, l idetité des idividus représete u itérêt (cela est pas toujours le cas). Il est alors pratique de marquer à côté de chaque poit du uage ue chaîe de caractère permettat l idetificatio de l idividu représeté par le poit. C est ce qui est fait das la partie basse de la Fig Cosommatio d éergie Cosommatio d éergie ArSa Kow Ca Aus 4 Rus CorS Alm Fr R UJap Sui Isr Esp It AfS Por Gr 2 Ir Ve Arg Nig Egy Ch Alg BréTur Vie Bé Id Par Mar Col 0 Sé Phi FIGURE 1.5 Le uage de poits représetat les doées de la Table 1.1. E haut : le uage simple. E bas : le uage aoté PIB E U Suè Nor Lu x 10 4

16 16 Élémets de statistique descriptive Chapitre 1 Pour redre le uage de poit plus lisible, o a souvet recours à ue trasformatio d ue ou des deux variables. Das l exemple de la Table 1.1, o obtiet u uage de poit plus iterprétable (voir la Fig. 4.3) e preat le logarithme des deux variables. log(cosommatio d éergie) Nig Vie Bé Id Sé Egy Par Phi Ch Mar Ir Col Alg Bré Arg Rus Ve Tur AfS log(pib) ArSa Kow Ca E U Aus Suè Nor Fr CorS Alm Jap Esp Sui Isr It R U Por Gr FIGURE 1.6 Le uage de poits représetat les logarithmes des doées de la Table 1.1. Lu Afi d obteir ue droite approximat le uage de poits, o calcule la droite de régressio de Y sur X, doée par l équatio y = ax + b où a = s xy s 2, b = ȳ a x. (1.3) x Pour les doées de la Table 1.1, la droite de régressio aisi que so équatio sot doées das la Fig O voit das la formule (1.3) que la droite de régressio de Y sur X e coïcide pas, e gééral, avec la droite de régressio de X sur Y. Si l o ote M i le poit qui a pour coordoées (x i, y i ) et par d i la distace etre M i et le poit M i = (x i, ax i + b), alors la droite de régressio est la droite pour laquelle la somme des d i au carré est miimale. C est la raiso pour laquelle o dit que la droite de régressio est obteue par la méthode des moidres carrés. O reparlera de cette propriété das u cadre plus gééral plus loi das ce documet. Cosommatio d éergie y = *x FIGURE 1.7 Le uage de poits représetat les doées de la Table 1.1 superposé de la droite de régressio. PIB d i M i x QQ-plot (graphiques quatile-quatile) U QQ-plot permet de voir rapidemet l adéquatio d ue série umérique à ue distributio, ou comparer les répartitios de deux séries umériques. 1er cas : Lorsque l o s itéresse à l adéquatio à ue distributio, l axe des ordoées porte les quatiles q j de la distributio observée, tadis que l axe des abscisses porte les quatiles q j correspodats de la loi théorique.

17 Sectio 1.3 Statistiques et représetatios graphiques de deux séries umériques 17 2ème cas : Lorsque l o s itéresse à la comparaiso de deux distributios, l axe des ordoées porte les quatiles q x j de la série x 1,..., x, tadis que l axe des abscisses porte les quatiles q y j de la série y 1,..., y. Le uage des poits (q j, q j) (respectivemet (q y j, qx j )) s alige sur la première bissectrice lorsque la distributio théorique proposée est ue boe représetatio des observatios (resp., lorsque les répartitios des x i et des y i sot égales). Si le uage des poits (q j, q j) s alige sur ue droite, alors il existe ue trasformatio affie des observatios telle que la distributio théorique proposée est ue boe représetatio des observatios trasformées. Quatiles of Iput Sample 8 x Y Quatiles Stadard Normal Quatiles X Quatiles x 10 4 FIGURE 1.8 QQ-plots pour les doées de la Table 1.1. Le graphe de gauche idique que la répartitio du PIB est sigificativemet différete d ue loi ormale. Le graphe de droite motre que les répartitios du PIB et de la cosommatio d éergie e sot pas liées par ue trasformatio affie. Exercice 1.1. Le tableau suivat présete les doées du PIB par habitat pour 15 pays dot la majeure partie se trouve e Asie. Ces doées ot été obteues sur le site http: //www.statistiques-modiales.com/. Le boxplot de ces doées a la forme suivate : 1. Selo ce diagramme, quelle est la valeur médiae du PIB/habitat e Asie? 2. Y a-t-il des doées atypiques? 3. La répartitio du PIB/habitat est-elle symétrique? Commet s iterprète cette asymétrie? 4. Répodre à la questio 3 e utilisat l iformatio que la moyee des 15 observatios qu o dispose est de Pays PIB / habitat (e $ US, 2004) Afghaista 174 Arabie Saoudite 9285 Arméie 1034 Chie 1258 Corée du Sud Ide 631 Ira 2350 Israël Japo Koweït Pakista 81 Philippies 948 Russie 4071 Turquie 4296 Vietam 520

18 18 Élémets de statistique descriptive Chapitre Résumé du Chapitre 1 Série umérique : Variable discrète : Variable cotiue : Histogramme : variable discrète : variable cotiue : Foctio de répartitio empirique : Statistiques de tedace cetrale : moyee : médiae : mode : Statistiques de dispersio : variace : écart-type : écart iterquartile : Statistiques d ordre : Quatiles : Boxplots : Covariace : Corrélatio : Nuage de poits : Droite de régressio : QQ-plot :

19 Sectio 1.4 Résumé du Chapitre 1 19 Pays PIB par habitat Cosommatio d éergie par habitat (e $ US, e 2004) (e Toes d équivalet pétrole, e 2002) Afrique du sud Algérie Béi Egypte Maroc Nigeria Séégal Allemage Espage Frace Grèce Italie Luxembourg Norvège Portugal Royaume-Ui Suède Suisse Arabie Saoudite Chie Corée du Sud Ide Ira Israël Japo Koweït Philippies Russie Turquie Vietam Argetie Brésil Caada Colombie Etats-Uis Paraguay Veezuela Australie TABLE 1.1 Ces doées sot obteues du site

20

21 2 Aalyse des doées multivariées 2.1 Itroductio Objectif Das toute étude appliquée, la démarche première du statisticie est de décrire et d explorer les doées dot il dispose, avat d e tirer de quelcoques lois ou modèles prédictifs. Or la statistique traite gééralemet du grad ombre et, les outils iformatiques aidat, les bases de doées devieet de plus e plus volumieuses, tat e largeur (quatité d iformatios recueillies) qu e hauteur (ombre d uités sur lesquelles ces iformatios sot recueillies). Cette phase d exploratio descriptive des doées est e coséquece pas aisée. Si le statisticie est déjà outillé pour aalyser la distributio d ue variable ou la relatio etre deux variables, ces outils basiques e permettet pas d appréheder ce vaste esemble iformatif das sa globalité. Il e s agit aturellemet pas d e doer alors ue visio exhaustive, mais bie de répodre à l ue des pricipales missios du statisticie : extraire d ue masse de doées ce qu il faut e reteir, e la sythétisat ou e simplifiat les structures. Les techiques d aalyse de doées répodet à ce besoi. O présetera ici l Aalyse e Composates Pricipales (ACP) qui s appuie sur la réductio de rag découlat des travaux de décompositio matricielle d Eckart et Youg (1936). Le but pricipal de l ACP est de détermier les pricipales relatios liéaires das u esemble de variables umériques. Il s agit bie de réduire u esemble complexe et de grade dimesio à ses pricipaux élémets, de faço à e mieux compredre les structures sous-jacetes Notatios O dispose de p variables X 1,..., X j,..., X p, que l o observe sur uités statistiques - ou idividus : o ote x j i la valeur de la variable Xj observée sur le i-ème idividu. Cet esemble de doées peut doc être mis sous la forme d u tableau X à liges et p coloes, et de terme courat x j i.

22 22 Aalyse des doées multivariées Chapitre 2 Das la suite - et c est très gééralemet le cas e aalyse des doées, cotrairemet aux autres domaies de la statistique - o cofodra la otio de variable avec le vecteur de dimesio qui la défiit sur otre échatillo, c est-à-dire X j = (x j 1,..., xj ). De même, chaque idividu sera assimilé au vecteur de dimesio p qui compile ses valeurs sur les variables : X i = (x 1 i,..., xp i ). x xp 1 X =..... x 1... x p } {{ } p variables idividu # 1, oté X 1 idividu #, oté X. 2.2 Exemple : billets suisses Nous choisiros ici u exemple décrivat 6 mesures, otée X 1,..., X 6, relevées sur 200 billets de 1000 Fracs Suisses. La Figure 2.1 présete la ature des mesures effectuées alors que l esemble des doées recueillies est doé das les Tables 2.1 et 2.2. Sur les 200 billets examiés, il y a eu 100 billets authetiques et 100 billets cotrefaits. Cet exemple comporte volotairemet u ombre réduit de variables, pour e faciliter la compréhesio. Pour compredre ce qu apportet les méthodes d aalyse de doées, meos au préalable ue brève aalyse descriptive de ces tableaux du poit de vue des variables. FIGURE 2.1 Cette figure motre ue coupure de 1000 Fracs Suisses (acies) avec les 6 mesures effectuées. Etude descriptive des variables Classiquemet, o peut se livrer à ue aalyse de la distributio de chaque variable. Cela peut se faire, par exemple, e visualisat les boxplots de chacue des 6 variables X i. La Fig. 2.2 motre ces boxplots, qui ous reseiget sur les caractéristiques idividuelles des variables X i. O y voit, etre autre, qu il y a 2 billets dot la logueur est aormalemet

23 Sectio 2.3 La théorie de l Aalyse e Composates Pricipales 23 grade et u billet dot la logueur est aormalemet petite. O remarque égalemet, e comparat les boxplots de X 2 et X 3, que la largeur à gauche est typiquemet légèremet plus grade que la largeur à droite. X 1 X 2 X 3 X 4 X 5 X 6 FIGURE 2.2 Les boxplots des doées de billets suisses Cette figure e dit cepedat rie sur la relatio etre les variables. Pour appréheder les distributios bivariées, des outils d aalyse vus à la fi du chapitre précédet peuvet être appliqués à tous les paires de variables. Exemples de tels outils sot la matrice de «scatter plots» (voir Fig. 2.3), ou la matrice des coefficiets de corrélatio liéaire. Ce derier représete u itérêt surtout lorsque les uages sot aplatis ou les répartitios bidimesioelles sot approximativemet gaussiees. Voici le tableau des corrélatios : X 1 X 2 X 3 X 4 X 5 X 6 X X X X X X Ce tableau motre que les variables X 2 et X 3 sot les plus corrélées, ce qui est tout à fait logique et cela se voyait déjà sur le scatter plot de la Fig O voit doc qu o dispose des outils qui ous permettet d aalyser les variables idividuellemet ou deux par deux. Il ous maque cepedat des outils de sythèse, qui permettraiet de dégager la structure globale de ces doées. Nous allos e développer u, parmi les plus utilisés. 2.3 La théorie de l Aalyse e Composates Pricipales Problématique O se place ici das la situatio où les p variables d itérêt X 1,..., X j,..., X p, sot umériques. Pour appréheder l iformatio coteue das le tableau umérique X, o peut teter de visualiser le uage de poits représetat les idividus das R p. Mais très souvet, le ombre de variables p peut atteidre quelques dizaies. Quoiqu il e soit, même

24 24 Aalyse des doées multivariées Chapitre 2 FIGURE 2.3 Scatter plots des différetes variables avec des outils de visualisatio performats, X e peut être appréhedé de faço simple das sa globalité, i les relatios etre les variables. La problématique est alors double : Commet visualiser la forme du uage des idividus? Commet sythétiser les relatios etre variables? L ACP permet justemet de répodre à ce type de besoi Choix de la métrique La méthode d Aalyse e Composates Pricipales requiert u espace vectoriel mui d u produit scalaire. Das ce chapitre, ous cosidéreros l espace euclidie R p mui de so produit scalaire caoique. La métrique associée est doée par X i X i 2 = p ( j x i ) 2. xj i j=1 Défiitio 2.1. Soiet x j = 1 i=1 xj i et s 2 j = 1 i=1 ( x j i xj) 2 la moyee et la variace de la variable d itérêt X j. La représetatio cetrée de l idividu i est doée par x j 1,..., xj p, où pour tout 1 j p, x j i = xj i xj.

25 Sectio 2.3 La théorie de l Aalyse e Composates Pricipales 25 La représetatio cetrée-réduite de l idividu i est doée par x j 1,..., xj p, où pour tout 1 j p, x j i = xj i xj s j. Ue ACP ormée est ue ACP meée sur la représetatio cetrée-réduite. L ACP opère toujours sur les représetatios cetrées. Pour simplifier la présetatio, o cosidérera das la suite que les variables ot été déjà cetrées, das le ses où i=1 X i = 0. Les différetes variables X j pouvat être hétérogèes, et correspodre à des échelles de mesure disparates, la représetatio cetrée-réduite est utilisée pour éviter que le choix de ces uités ait ue ifluece das le calcul des distaces. Cette représetatio red les variables cetrées et de variace Moidre déformatio du uage Pour visualiser le uage des idividus (et doc e coaître la forme, pour savoir commet sot liées os p variables), il est écessaire de réduire la dimesio de l espace qui le porte. L ACP réduit cette dimesio par projectio orthogoale sur des sous-espaces affies. Défiitio 2.2. Soit X 1,..., X u uage de poits dot le barycetre coïcide avec l origie (c est le cas pour des variables réduites). L iertie du uage X 1,..., X est doée par I = 1 X i 2. i=1 L iertie J H du uage autour du sous-espace liéaire H est doée par J H = 1 où P H X i le projeté orthogoal de X i sur H. X i P H X i 2, i=1 L iertie J H autour de H mesure la déformatio du uage lorsque celui-ci est projeté orthogoalemet sur H. Pour que la représetatio des doées par leur projectio sur u sous-espace affie ait u ses, il faut qu elle modifie peu la forme du uage de poits, doc qu elle miimise l iertie J H. Remarquos que d après le théorème de Pythagore, o a I = 1 ( Xi P H X i 2 + P H X i 2) déf = J H + I H. i=1 Par coséquet, la moidre déformatio d u uage de poits par projectio orthogoale sur u sous-espace liéaire est obteue, de maière équivalete, par miimisatio de l iertie par rapport au sous-espace liéaire ou par maximisatio de l iertie du uage projeté. Das le but de pouvoir visualiser le uage de poits des idividus, o aimerait trouver das R p u sous-espace liéaire de dimesio 2 (c est-à-dire, u pla) qui approche bie les doées. O est doc tout aturellemet itéressé par la résolutio du problème H 2 = arg mi J H = arg max I H H:dim(H)=2 H:dim(H)=2 } {{ } } {{ } miimisatio de la déformatio du uage maximisatio de l iértie du uage projeté

26 26 Aalyse des doées multivariées Chapitre 2 D ue faço plus géérale, o s itéresse aux sous-espaces liéaires H k, pour k {1,..., p 1}, défiis par H k = arg mi J H = arg max I H. (2.1) H:dim(H)=k H:dim(H)=k Par exemple, si le uage des idividus das R p est pas bie approximable par u pla, il pourrait être plus itéressat de cosidérer ue visualisatio 3 dimesioelle e projetat les doées sur H 3. Das certais cas, cela peut cosidérablemet augmeter l iertie du uage projeté. Motros maiteat que la recherche d u sous-espace affie de dimesio fixée maximisat l iertie du uage projeté peut être meée de maière séquetielle et que l iertie se décompose e la somme des ierties moyees du uage projeté sur des droites orthogoales, dites directios pricipales de l ACP. Soit Γ la matrice de variace-covariace associée au uage de poits (das la représetatio cetrée, les moyees X j sot ulles) : Γ = 1 (X)t X, autremet dit Γ j,j = i=1 xj i xj i est la covariace etre les variables d itérêt X j et X j. Notos au passage que lorsqu o cosidère des variables réduites, la matrice Γ est égalemet la matrice des corrélatios des variables X j. Théorème 2.1. Les assertios suivates caractériset la résolutio séquetielle du problème de réductio de dimesio par moidre déformatio. Soit u k u vecteur propre uitaire de Γ associée à la k-ième plus grade valeur propre. Alors H k = Vect(u 1,..., u k ) est l espace vectoriel egedré par les k premiers vecteurs propres de Γ. La k-ième plus grade valeur propre λ k de Γ vaut l iertie du uage projeté sur le k-ième axe propre u k : I uk = λ k. l iertie sur H k est la somme des ierties moyees sur les k axes propres pricipaux : I Hk = k λ l. l=1 Démostratio. Cherchos d abord le vecteur uitaire, i.e. de orme 1, u maximisat l iertie du uage projeté sur u. Cosidéros la projectio du uage sur la directio doée par le vecteur uitaire u. Le projeté X i de l idividu i s écrit X i = u, X i u et l iertie du uage projeté (ous ous plaços toujours das le cadre de la représetatio réduite) est I u = 1 i=1 u, X i u 2 = 1 i=1 u, X i 2 = 1 u t X i (X i ) t u = u t Γu. i=1 La matrice Γ est symétrique, semi-défiie positive ; elle est diagoalisable, a toutes ses valeurs propres réelles, et il existe ue base orthoormale de vecteurs propres de R p. Notos λ 1... λ p les valeurs propres triées par ordre décroissat, et u 1,..., u p les vecteurs propres uitaires associés. Alors I u = p p 2 2 λ j u, uj λ 1 u, uj = λ 1 u 2 = λ 1. j=1 j=1

27 Sectio 2.4 Représetatios graphiques et iterprétatio 27 Il suffit alors de choisir u = u 1 pour maximiser I u. Par coséquet, la meilleure droite de projectio du uage est celle de vecteur directeur u 1, associé à la plus grade valeur propre λ 1 de la matrice Γ. O admet sas démostratio que pour tout etier k < p, l espace H k+1 est obteu à partir de l espace H k par H k+1 = Vect(H k, v k+1 ) où v k+1 est u vecteur orthogoal à H k. Pour les H k suivats, o procède par récurrece. Asi, pour H 2 o cherche le vecteur directeur u 2 orthogoal à u 1 portat l iertie maximale. Pour tout vecteur u orthogoal à u 1, o a p 2 I u = λ j u, uj λ 2. j=2 Doc le maximum est atteit pour u = u 2, et aisi de suite. Au passage, o a égalemet prouvé la deuxième assertio du théorème : I uk = λ k. La troisième assertio découle alors du théorème de Pythagore. L iertie I du uage de poits est doc égale à la trace de matrice de variace-covariace, ce qui implique I = p, e ACP ormée. (E ACP o ormée, elle vaut la somme des variaces : I = p j=1 s2 j = p l=1 λ l.) O défiit la part d iertie expliquée sur le l-ième axe propre : τ l = λ l /I. L iertie portée par u sous-espace de dimesio k est doc au mieux k l=1 τ l pour cet de l iertie totale I. 2.4 Représetatios graphiques et iterprétatio Sur otre exemple cocerat les billets suisses, o peut chercher à visualiser les proximités (e termes de distace ormée sur les 6 caractéristiques) etre billets sur le premier pla factoriel (u 1 horizotalemet, u 2 verticalemet) (voir Fig.2.4 à gauche). Das cet exemple, FIGURE 2.4 A gauche : projectio des idividus sur le premier pla factoriel. A droite : la même projectio avec des symboles différets pour les billets authetiques et les billets cotrefaits. Les triagles correspodet aux billets cotrefaits, alors que les cercles représetet les billets authetiques. l iertie I = se décompose sur les premiers axes aisi : I 1 = 3 (doc τ 1 = 66.7%), I 2 = 0, 93 (doc τ 2 = 20.8%). O visualise doc de faço simplifiée, mais optimale (τ 1 2 = I u1 u 2 /I =87.5% de l iertie représetée sur ce pla), les proximités etre les billets. Les vecteurs directeurs de ces deux premiers axes s exprimet aisi, das l aciee base :

28 28 Aalyse des doées multivariées Chapitre 2 Vecteur propre X 1 X 2 X 3 X 4 X 5 X 6 u u Reste à iterpréter véritablemet ces axes, et à compredre quels sot les pricipales relatios liéaires etre les caractéristiques techiques Pricipales relatios etre variables Les composates pricipales La diagoalisatio vue précédemmet permet de défiir p ouvelles variables 1 appelées composates pricipales : p C α = uαx j j = Xu α R, j=1 ou ecore Ci α = X i, u α. Elles sot doc combiaisos liéaires des variables d itérêt X j iitiales. Elles sot cetrées puisque les X j le sot, et o a : ( Cov C α, C β) = p j=1 p j =1 u j αu j β Cov (X j, X j ) = u t αγu β = λ β u t αu β. Doc Cov ( { C α, C β) 0 si α = β, =, ce qui veut dire que les différetes composates pricipales sot λ α si α = β, o-corrélées. O peut calculer la covariace etre les composates pricipales et les variables iitiales : ( Cov C α, X j) = p ( uαcov j X j, X j) = j =1 p uα j Γ j,j = λ α uα. j j =1 Il s esuit que ( Corr C α, X j) = Cov ( C α, X j) Var(C α )Var(X j ) = λ α u j α/s j. Doc p j=1 s2 j Corr2 ( C α, X j) = λ α. Pour visualiser les corrélatios etre les composates pricipales et les X j, o établit des représetatios plaes où, e preat par exemple ( C 1, C 2) comme base orthogoale de ce pla, chaque X j est figuré par u vecteur de coordoées ( Corr ( C 1, X j), Corr ( C 2, X j)), à l itérieur du cercle uité 2, dit des corrélatios. 1. De même que précédemmet, o cofodra sous le vocable variable la forme liéaire, et sa réalisatio sur os idividus, soit ecore le vecteur de R associé. 2. Ce vecteur est das le cercle uité car, das R mui du produit scalaire x, y = i=1 x iy i, c est le vecteur projeté orthogoal du vecteur uitaire X j /s j sur le pla egedré par les vecteurs orthoormés C 1 / Var(C 1 ) et C 2 / Var(C 2 ).

29 Sectio 2.4 Représetatios graphiques et iterprétatio 29 Retour à l exemple O voit, das cet exemple (voir la partie droite de la Fig. 2.5), que les variables X 1, X 2 et X 3 sot mal expliquées par les deux premiers axes pricipaux, car les poits représetat ces variables sot éloigés du cercle. E revache, les 3 autres poits sot quasimet sur le cercle, ce qui veut dire que les variables X 4, X 5, X 6 sot très bie expliquées par C 1 et C 2. De plus, comme l agle formé par les vecteurs OX 4 et OX 5 est proche de 90, les variables X 4 et X 5 sot très faiblemet corrélées Nombre d axes (ou de composates) à aalyser Combie d axes aalyser? Il existe plusieurs critères de décisio. Le premier (Kaiser) veut qu o e s itéresse e gééral qu aux axes dot les valeurs propres sot supérieures à la moyee (qui vaut 1 e ACP ormée). U secod (dit du coude, ou de Cattell) utilise le résultat suivat : lorsque des variables sot peu corrélées, les valeurs propres de la matrice d iertie décroisset régulièremet - et l ACP présete alors peu d itérêt. A l iverse, lorsqu il existe ue structure sur les doées, o observe des ruptures das la décroissace des valeurs propres (cf. Fig.2.5). O cherchera doc à e reteir que les axes correspodat aux valeurs qui précèdet la décroissace régulière. Aalytiquemet, cela reviet à chercher u poit d iflexio das la décroissace des valeurs propres, et de e pas aller au-delà das l aalyse. Aisi, das otre exemple, o e s itéressera qu aux 2 premiers axes. FIGURE 2.5 Représetatio des valeurs propres et cercle des corrélatios pour le premier pla factoriel Aides à l iterprétatio Si, pour les variables umériques, la visualisatio des vecteurs à l itérieur du cercle des corrélatios doe toute l iformatio écessaire à l aalyse, il peut être utile de défiir, pour chaque idividu, les aides suivates : La cotributio à l iertie du uage, qui croît avec l excetricité de l idividu : CTR (X i ) = X i 2 I

30 30 Aalyse des doées multivariées Chapitre 2 La cotributio à l iertie portée par u axe (O, u α ) : CTR α (X i ) = ( C α i ) 2 λ α Par costructio : i=1 CTR (X i) = 1, et i=1 CTR α (X i ) = 1. La valeur de ces cotributios déped doc fortemet du ombre d idividus : ue cotributio de 5% sera cosidérée comme forte si l o maipule les doées de milliers d idividus, ettemet mois si l o e a qu ue vigtaie (de faço géérale, o cosidèrera que l idividu i a ue cotributio importate si elle dépasse so poids 1/). La qualité de projectio sur l axe (O, u α ) est doée par le carré du cosius de l agle : CO2 α (X i ) = ( C α i ) 2 X i 2. Par orthogoalité des u α, la qualité de projectio d u idividu sur u sous-espace pricipal est additive : CO2 α+β (X i ) = CO2 α (X i ) + CO2 β (X i ). D autre part, o remarque que p α=1 CO2 α (X i ) = 1 ; de même que précédemmet, cette qualité déped fortemet du ombre iitial de variables : o pourra être exigeat si l o e maipule qu ue poigée, o le sera mois s il y e a davatage. Pour u axe doé, l exame parallèle des CTR et des CO2 des idividus qui s y projettet peut doer lieu à quatre cas de figure, dot u pose problème (CO2 faible-ctr forte), qui apparaît lorsqu u idividu a u poids trop fort par rapport aux autres : CTR faible CTR forte CO2 faible Elémet peu cotributif Elémet très cotributif quasi idépedat de l axe mais peu illustratif de l axe CO2 forte Elémet peu cotributif Elémet particulièremet mais bie illustratif de l axe caractéristique de l axe 2.5 Résumé du Chapitre 2 Tableau de doées multivariées : variables : idividus : Matrice des corrélatios : Matrice de scatter-plots : Représetatio cetrée :

31 Sectio 2.5 Résumé du Chapitre 2 31 Représetatio cetrée-réduite : Aalyse e Composates Pricipales (ACP) : ACP ormée : Iertie du uage : Iertie autour d u sous-espace : Composates pricipales : Représetatio graphiques dérivées de l ACP : Projectio des idividus : Scree-graph : Projectio des variables :

32 32 Aalyse des doées multivariées Chapitre 2 X 1 X 2 X 3 X 4 X 5 X X 1 X 2 X 3 X 4 X 5 X TABLE 2.1 Les doées de billets suisses authetiques. Le tableau compred 100 liges (idividus) et 6 coloes (variables). Ces variables sot décrites das la Fig Toutes les valeurs sot e mm.

33 Sectio 2.5 Résumé du Chapitre 2 33 X 1 X 2 X 3 X 4 X 5 X X 1 X 2 X 3 X 4 X 5 X TABLE 2.2 Les doées de billets suisses cotrefaits. Le tableau compred 100 liges (idividus) et 6 coloes (variables). Ces variables sot décrites das la Fig Toutes les valeurs sot e mm.

34

35 3 Rappel des bases de la statistique paramétrique Das ce chapitre, ous survolos rapidemet les bases du calcul des probabilités et de la statistique. Toutes les otios et tous les résultats présetés ci-dessous costituet les prérequis pour ce cours de «Statistique umérique et aalyse des doées». Pour ue présetatio plus détaillée des sujets traités das ce chapitre voir le polycopié du cours de 1ère aée Itroductio Les problèmes statistiques que ous allos étudier das le cadre de ce module peuvet se résumer de la faço suivate : ous disposos d u jeu de doées qui sot supposées être géérées par u phéomèe aléatoire. (Rappelos que tout phéomèe aléatoire est etièremet caractérisé par sa loi de probabilité.) De plus, ous cosidéros qu u travail de modélisatio a été effectué à l issue duquel la loi de probabilité régissat les doées a été détermiée à u paramètre icou près. Das ce cotexte, les trois types de problèmes que ous allos étudier sot : estimatio : trouver ue valeur approchée du paramètre icou, régio de cofiace : détermier ue régio (aussi petite que possible) qui cotiet le paramètre icou avec ue probabilité prescrite (gééralemet 95%), test d hypothèse : pour u esemble Θ 0 de valeurs possibles du paramètre icou, décider au vu des doées si oui ou o le paramètre icou appartiet à Θ 0. Afi de faciliter la compréhesio, les différetes otios itroduites das ce chapitre serot illustrées das les deux exemples suivats. Exemple 1. (Qualité de l air) O cherche à évaluer la fréquece des jours où l idice ATMO (mesurat la qualité de l air) à Paris dépasse 2 le iveau 8. Pour avoir ue estimatio simple, o choisit au hasard jours das le passé et o regarde si oui ou o le iveau 8 a été dépassé ces jours-là. O obtiet aisi u échatillo x 1,..., x où chaque x i pred 1. B. Jourdai, Probabilités et statistique, 2. L idice ATMO varie sur ue échelle allat de 1 (très boe) à 10 (exécrable). Lorsque la valeur de cet idice dépasse le iveau 8, la qualité de l air est cosidérée comme mauvaise.

36 36 Rappel des bases de la statistique paramétrique Chapitre 3 deux valeurs : 0 ou 1. Par covetio, la valeur 0 correspod à u jour où le iveau 8 a pas été dépassé. Nous modélisos le dépassemet du iveau 8 par l idice ATMO par ue variable aléatoire X de loi de Beroulli ; Proba(X = 1) = ϑ, Proba(X = 0) = 1 ϑ pour ue valeur ϑ ]0, 1[ qui ous est icoue. Cette valeur représete la fréquece moyee des jours où la qualité de l air a été mauvaise à Paris. Exemple 2. (Vitesse du vet) Afi d étudier la possibilité de l istallatio d ue cetrale éoliee sur u site doé, o cherche à estimer la probabilité de l évéemet «la vitesse du vet sur le site e questio est iférieure à 10km/h». L itérêt à l égard de cet évéemet viet du fait que, lorsque la vitesse du vet est iférieure à 10km/h, ue cetrale éoliee s arrête e raiso des forces de frottemet sec qui s opposet à la rotatio de l hélice. L approche la plus simple cosiste à modéliser la vitesse du vet sur le site e questio à u istat doé par ue variable aléatoire de loi expoetielle. E d autres termes, si X représete la vitesse du vet, o suppose que Proba(X [a, b]) = b a p(ϑ ; x) dx, p(ϑ ; x) = 1 ϑ e x/ϑ 1l [0, [ (x), où ϑ > 0 est u paramètre icou. Si l o admet que cette modélisatio est correcte, o peut calculer la probabilité de l évéemet A = «la vitesse du vet est iférieure à 10km/h» par la formule Proba(A) = ϑ e x/ϑ dx = 1 e 10/ϑ. Par coséquet, ue valeur approchée de ϑ ous permettrait de calculer ue valeur approchée de la probabilité de l évéemet A. Pour pouvoir estimer ϑ, ous mesuros la vitesse du vet à istats suffisammet espacés das le temps, ce qui ous fourit les observatios x 1,..., x. Le but d u statisticie est, etre autre, d utiliser ces observatios pour estimer le paramètre ϑ. 3.2 Modèle statistique Nous commeços par doer la défiitio géérale d u modèle statistique, que ous illustros par la suite das les deux exemples présetés ci-dessus. Défiitio 3.1. O appelle modèle statistique la doée d u espace mesurable (X, F ) et d ue famille de mesures de probabilité P = {P,ϑ, ϑ Θ} défiies sur (X, F ). L espace X, appelé espace d états, est costitué de toutes les valeurs qu aurait pu predre le jeu de doées étudié. La famille P décrit l esemble des lois de probabilité pouvat avoir gééré le jeu de doées étudié. Pour u modèle statistique doé, la problématique géérale de la théorie statistique s éoce de la faço suivate : au vu d ue réalisatio x () X tiré au hasard selo ue loi P,ϑ P, étudier certaies propriétés de P,ϑ. Le plus souvet x () est u vecteur. O cherche doc à caractériser la loi d u vecteur aléatoire X () à partir d ue réalisatio x (). Bie-etedu, si l o autorise la famille P à être ue collectio quelcoque de lois sur (X, F ), la tâche de l extractio de l iformatio fiable sur la loi du vecteur aléatoire X () à partir d ue seule réalisatio est irréalisable. Afi de pouvoir élaborer ue théorie raisoable et utile pour les

37 Sectio 3.3 Estimatio 37 applicatios, o se restreit au cas où la famille P a ue certaie «structure». Exemples de telles structures sot le modèle à observatios i.i.d., le modèle de régressio liéaire, etc. Ce chapitre est etièremet dédié à l étude du modèle à observatios i.i.d. (idépedates et idetiquemet distribuées). Il s agit du cas où x () = (x 1,..., x ) est u vecteur das R dot les coordoées représetet copies idépedates d ue même variable aléatoire X. Cela reviet à postuler que x () est ue réalisatio du vecteur aléatoire X () = (X 1,..., X ) composé de variables aléatoires idépedates distribuées selo la même loi que X. Das ce cas, la loi de X () est etièremet caractérisée par celle de X, car Proba(X 1 A 1,..., X A ) = Proba(X 1 A 1 )... Proba(X A ) = Proba(X A 1 )... Proba(X A ) quels que soiet les itervalles A 1,..., A R. Si P désige la loi de X, o dit alors que X () est u échatillo i.i.d. de loi P. Par coséquet, pour défiir u modèle à observatios i.i.d., il suffit de décrire la famille P = {P ϑ } qui est sesée coteir la loi P de X. Les deux exemples présetés das l itroductio correspodet à des modèles à observatios i.i.d. : das le premier exemple P = {B(ϑ) : ϑ ]0, 1[} où B(ϑ) désige la loi de Beroulli de paramètre ϑ, tadis que das le deuxième exemple P = {E(ϑ 1 ) : ϑ > 0}, où E(λ) désige la loi expoetielle de paramètre λ > 0. E coséquece, das le premier exemple Θ = [0, 1] alors que das le deuxième exemple Θ =]0, [. Tout au log de ce chapitre, o appellera statistique toute foctio de l échatillo X (). 3.3 Estimatio Supposos maiteat qu o dispose d u échatillo i.i.d. X 1,..., X de loi P P = {P ϑ : ϑ Θ}. Cela veut dire que pour u ϑ Θ icou, o a X 1,..., X iid Pϑ. Par la suite, o appellera ϑ la vraie valeur du paramètre. La première questio qu o se pose est celle du calcul d ue valeur approchée de ϑ e utilisat uiquemet l échatillo observé. Défiitio 3.2. Soit X 1,..., X u échatillo i.i.d. de loi P P = {P ϑ : ϑ Θ} avec Θ R p pour u p N. O appelle estimateur de ϑ toute applicatio mesurable ϑ : R R p. Das la statistique théorique, o idetifie l applicatio ϑ au vecteur aléatoire ϑ(x 1,..., X ). U estimateur a pour objectif d approcher la vraie valeur ϑ. Cepedat, la défiitio cidessus e reflète absolumet pas cet objectif. E effet, même si ϑ(x 1,..., X ) est très éloigé de ϑ, ϑ sera appelé u estimateur si peu qu il soit mesurable. Afi de restreidre la classe de tous les estimateurs à ceux qui représetet u itérêt pratique, o spécifie des propriétés qu o aimerait voir satisfaites par u estimateur. Par la suite, pour souliger le fait que l estimateur ϑ déped de (la taille de l échatillo), o utilisera la otatio ϑ. Défiitio 3.3. O dit que l estimateur ϑ est sas biais, si E ϑ [ ϑ ] = ϑ, ϑ Θ,

38 38 Rappel des bases de la statistique paramétrique Chapitre 3 où l expressio E ϑ [ ϑ ] doit être lue comme «espérace du vecteur aléatoire ϑ (X 1,..., X ) sachat iid que X 1,..., X P ϑ». O dit que l estimateur ϑ est coverget (ou cosistat), s il coverge e probabilité vers la vraie valeur, c est-à-dire lim P ϑ ( ϑ ϑ > ε) = 0, ε > 0, ϑ Θ. La propriété de covergece est cetrale e statistique, car elle idique que la valeur estimée de ϑ calculée à l aide de l estimateur ϑ est proche de ϑ si la taille de l échatillo est suffisammet grade. Das beaucoup de situatios, il existe de ombreux estimateurs covergets. O s itéresse alors aux propriétés plus raffiées des estimateurs : la vitesse à laquelle ϑ ted vers ϑ et la loi asymptotique de la différece ϑ ϑ propremet ormalisée. Défiitio 3.4. O dit que l estimateur coverget ϑ est asymptotiquemet de loi P ϑ avec la vitesse γ, où γ > 0, si γ ( ϑ ϑ ) L P ϑ, ϑ Θ, où L désige la covergece e loi. Si P ϑ est la loi gaussiee N (0, σ2 ϑ ), o dit alors que ϑ est asymptotiquemet ormal avec la vitesse γ et la variace limite σ 2 ϑ. Pour démotrer la covergece et la ormalité asymptotique des estimateurs, o utilise le plus souvet les résultats probabilistes présetés das le paragraphe suivat Quelques résultats sur la covergece des variables aléatoires Soit ξ 1, ξ 2,..., ξ,... et ξ des variables aléatoires et soit F ξ (x) = P(ξ x) la foctio de répartitio de ξ, N { }. O distigue les quatre types de covergece (de {ξ } vers ξ ) suivats : 1. covergece e probabilité : pour tout ε > 0, o a lim P( ξ ξ > ε) = 0, 2. covergece presque sûr : P(lim sup ξ ξ = 0) = 1, 3. covergece e moyee quadratique : lim E[(ξ ξ ) 2 ] = 0, 4. covergece e loi : lim F ξ (x) = F ξ (x) pour tout x R tel que F ξ est cotiue e x. Rappelos que les covergeces presque sûr et e moyee quadratique etraîet la covergece e probabilité et cette derière etraîe à so tour la covergece e loi. Notos aussi que la défiitio de la covergece e loi, cotrairemet aux autres types de covergeces précitées, e sous-eted pas que les variables ξ soiet défiies sur le même espace probabilisé. Théorème 3.1 (Loi forte des grads ombres). Soit X 1,..., X des variables aléatoires i.i.d. itégrables : E[ X 1 ] <. Alors, X = 1 où p.s. désige la covergece presque-sûr. p.s. X i E[X 1 ], lorsque, i=1 Théorème 3.2 (Théorème de la limite cetrale). Soit X 1,..., X des variables aléatoires i.i.d. de carré itégrables : E[X 2 1 ] <. Alors, (X E[X 1 ]) L N (0, Var[X 1 ]), lorsque.

39 Sectio 3.3 Estimatio 39 Théorème 3.3 (Méthode delta). Soit X 1,..., X des variables aléatoires i.i.d. de carré itégrables et soit G ue foctio cotiûmet différetiable sur u esemble ouvert A tel que P(X 1 A) = 1. Alors, ( G(X ) G(E[X 1 ]) ) L N (0, σ 2 ), lorsque, avec la variace limite σ 2 = G (E[X 1 ]) 2 Var[X 1 ]. Ces résultats se gééraliset à ue suite de vecteurs aléatoires, auquel cas la variace est remplacée par la matrice de covariace Var[X 1 ] = E[X 1 X1 ] E[X 1]E[X1 ] et la variace limite das la méthode delta est doée par σ 2 = G(E[X 1 ]) Var[X 1 ] G(E[X 1 ]). Théorème 3.4 (Théorème de Slutsky). Soit {ξ } N {η } N deux suites de variables aléatoires défiies sur le même espace probabilisé. Si pour ue costate a R et pour ue variable aléatoire ξ o a L ξ ξ P, et η a alors ξ + η L ξ L + a, et ξ η aξ Estimateur du maximum de vraisemblace Après avoir vu ce que c est u estimateur et quelles sot les propriétés souhaitées d u estimateur, o s itéresse aturellemet à la mise e place d ue procédure géérique permettat la costructio d u estimateur pour ue large classe de modèles. O se focalise ici sur la méthode d estimatio la plus utilisée : le maximum de vraisemblace. De plus, pour éviter le rappel de otios abstraites (absolue cotiuité, théorème de Rado-Nykodim) de la théorie de la mesure, o e doera pas la défiitio de l estimateur du maximum de vraisemblace (EMV) das le cas le plus gééral des modèles domiés, mais seulemet das le cadre des modèles i.i.d. discrets et à desité. Défiitio 3.5. O dira que le modèle à observatios i.i.d. {P ϑ : ϑ Θ} est discret, s il existe u esemble A = {a 1, a 2,...} au plus déombrable tel que P ϑ (A) = 1 pour tout ϑ Θ. E d autres termes, l esemble A cotiet toutes les valeurs possibles prises par les variables de l échatillo. L exemple 1 cosidéré au début de ce chapitre porte sur u modèle discret, car les variables aléatoires costituat l échatillo sot des variables de Beroulli et, par coséquet, preet leurs valeurs das l esemble fii {0, 1}. O caractérise u modèle discret par les probabilités discrètes p(ϑ; a k ) = Proba(X i = a k ), a k A où X 1,..., X iid Pϑ. (3.1) Défiitio 3.6. O dira que le modèle à observatios i.i.d. {P ϑ : ϑ Θ} est à desité, si pour tout ϑ Θ il existe ue foctio (appelée desité) p(ϑ; ) : R R telle que pour tout a, b R. P ϑ ([a, b]) = Proba(X i [a, b]) = b a p(ϑ; x) dx, où X i P ϑ, (3.2)

40 40 Rappel des bases de la statistique paramétrique Chapitre 3 Défiitio 3.7. Soit P = {P ϑ : ϑ Θ} u modèle i.i.d. discret ou à desité et soit p(ϑ, x) la foctio défiie par (3.1) das le cas discret et par (3.2) das le cas à desité. O appelle foctio de vraisemblace l applicatio p : Θ R R +, p (ϑ; x 1,..., x ) = p(ϑ; x i ). (3.3) i=1 O appelle estimateur du maximum de vraisemblace (EMV), oté ˆϑ MV, le poit du maximum global (s il existe) de l applicatio ϑ p (ϑ, X 1,..., X ). O écrit alors ˆϑ MV L EMV das l exemple 1 = arg max ϑ Θ p (ϑ; X 1,..., X ). Das l exemple 1 portat sur la qualité de l air, o dispose d u échatillo i.i.d. X 1,..., X de loi de Beroulli B(ϑ ) avec ϑ Θ =]0, 1[. Il s agit d u modèle discret avec A = {0, 1} et { ϑ, si x = 1, p(ϑ; x) = 1 ϑ, si x = 0. O vérifie facilemet que cela équivaut à p(ϑ; x) = ϑ x (1 ϑ) 1 x, x {0, 1}. Par coséquet, la foctio de vraisemblace s écrit comme p (ϑ; x 1,..., x ) = i=1 ϑ x i (1 ϑ) 1 x i = ϑ i x i (1 ϑ) i x i. O remarque d abord que la foctio de vraisemblace est strictemet positive sur ]0, 1[. Il e résulte qu o peut remplacer le problème de maximisatio de p par celui de maximisatio de l = log p : ˆϑ MV = arg max ϑ ]0,1[ log p (ϑ; X 1,..., X ) = arg max ϑ ]0,1[ où X = 1 i X i. O vérifie aisémet que la foctio l (ϑ) = X log ϑ + (1 X) log(1 ϑ), { } X log ϑ + (1 X) log(1 ϑ), appelée foctio de log-vraisemblace est strictemet cocave sur ]0, 1[ et que X est le seul poit où la dérivée de l s aule. Or, si la dérivée d ue foctio cocave s aule e u poit alors c est le poit de maximum global. Il e découle que das le modèle de Beroulli ˆϑ MV = X. Par la liéarité de l espérace, o motre que cet estimateur est sas biais : E ϑ [X] = 1 E ϑ [X i ] = 1 ϑ = ϑ, ϑ [0, 1]. i=1 i=1 De plus, c est u estimateur cosistat et asymptotiquemet ormal de vitesse 1/ et de variace limite ϑ(1 ϑ). La courbe de la foctio de log-vraisemblace l pour trois échatillos i.i.d. de loi B(1/2) est représetée das la Figure 3.1. O y voit clairemet la ature aléatoire de l estimateur du maximum de vraisemblace, qui est dû au fait que l échatillo a été obteu par u tirage aléatoire.

41 Sectio 3.3 Estimatio 41 FIGURE 3.1 Modèle de Beroulli : la foctio de log-vraisemblace et so maximum global. Les trois courbes représetet la log-vraisemblace pour trois échatillos différets de taille 40. La vraie valeur du paramètre das les trois cas est ϑ = 1/2. Les valeurs estimées qu o obtiet pour ces échatillos sot ˆϑ MV = 0.5 ; 0.55 ; L EMV das l exemple 2 Das l exemple 2 portat sur la vitesse du vet, o dispose d u échatillo i.i.d. X 1,..., X de loi Expoetielle E(1/ϑ ) avec ϑ Θ =]0, + [. Il s agit d u modèle à desité avec : O e déduit la foctio de vraisemblace p (ϑ; x 1,..., x ) = p(ϑ; x) = ϑ 1 e x/ϑ 1l [0, [ (x). i=1 { ϑ 1 e xi/ϑ = ϑ exp 1 ϑ } x i i=1 pour tout x 1,..., x 0. Comme o sait que l échatillo X 1,..., X est gééré par ue loi expoetielle, P(X i 0; i = 1,..., ) = 1. O a doc la foctio de log-vraisemblace l (ϑ) = (log ϑ + ϑ 1 X), ϑ > 0. Cette foctio est pas cocave sur R +, mais o vérifie aisémet qu elle est croissate sur ]0, X] et décroissate sur [X, + [. Il e découle que X est le poit de maximum global de l, ce qui etraîe que ˆϑ MV = X. Comme das l exemple précédet, ici aussi l estimateur X est sas biais. De plus, e vertu de la loi forte des grads ombres et du théorème de la limite cetrale, X est cosistat et asymptotiquemet ormal de vitesse 1/2 et de variace limite ϑ 2, c est-à-dire (X ϑ ) L N (0, ϑ 2 ). Remarque 3.1. Das les deux exemples précédets la méthode du maximum de vraisemblace ous a coduit à des estimateurs sas biais, cosistats et asymptotiquemet ormaux de vitesse 1/2. O peut aturellemet se demader si ces propriétés sot caractéristiques aux deux modèles cosidérés ou si elles restet valables das u cadre plus gééral. Nous e doeros pas ici ue répose exhaustive à cette questio, mais seulemet quelques élémets de répose : - l EMV est e gééral pas sas biais (o dit qu il est biaisé), mais so biais ted vers zéro lorsque sous certaies coditios de régularité ; - il existe des coditios de régularité assez faibles sur l applicatio (ϑ, x) p(ϑ; x) garatissat la cosistace de l EMV aisi que sa ormalité asymptotique avec la vitesse 1/2.

42 42 Rappel des bases de la statistique paramétrique Chapitre 3 FIGURE 3.2 Modèle expoetiel : la foctio de log-vraisemblace et so maximum global. Les trois courbes représetet la log-vraisemblace pour trois échatillos différets de taille 40. La vraie valeur du paramètre das les trois cas est ϑ = 20. Les valeurs estimées qu o obtiet pour ces échatillos sot ˆϑ MV = ; ; U exemple de modèle irrégulier : modèle uiforme Pour se covaicre que l EMV est pas toujours sas biais et qu il peut coverger à ue vitesse différete de 1/2, cosidéros le modèle suivat. O dispose d u échatillo i.i.d. X 1,..., X de loi uiforme sur l itervalle [0, ϑ ], otée U([0, ϑ ]). Le paramètre icou ϑ est supposé apparteir à l esemble R +. C est u modèle à desité avec p(ϑ; x) = 1 ϑ 1l [0,ϑ](x). Par coséquet, la foctio de vraisemblace a la forme p (ϑ; x 1,..., x ) = 1 ϑ { 1, si x i [0, ϑ] i, 0, sio où x () = max i=1,..., x i. L EMV est doc défii par = ϑ 1l [x(),+ [(ϑ), ˆϑ MV = arg max ϑ>0 ϑ 1l [X(),+ [(ϑ) = X () (= max 1 i X i). Vérifios d abord que X () est biaisé. Pour cela, o itroduit l évéemet A = {X 1 ϑ /2;... X ϑ /2} qui vérifie P ϑ (A) = (1/2) > 0. Comme sur cet évéemet X () ϑ /2, o a Il e résulte que ˆϑ MV E ϑ [X () ] = E ϑ [X () 1l A ] + E ϑ [X () 1l A c] 1 2 ϑ P ϑ (A) + ϑ P ϑ (A c ) = ϑ 1 2 ϑ P ϑ (A) < ϑ. = X () est u estimateur biaisé. Exercice 3.1. Soit X 1,..., X iid U([0, ϑ ]) avec ϑ ]0, + [ et soit ˆϑ MV = X ().

43 Sectio 3.4 Itervalle de cofiace 43 FIGURE 3.3 Modèle uiforme : la foctio de vraisemblace et so maximum global. Les trois courbes représetet la vraisemblace pour trois échatillos différets de taille 10. La vraie valeur du paramètre das les trois cas est ϑ = 1. Les valeurs estimées qu o obtiet pour ces échatillos sot ˆϑ MV = 0.98 ; 0.95 ; Vérifier que la foctio de répartitio F de X () est doée par 0, si x ], 0], F (ϑ, x) = (x/ϑ ), si x ]0, ϑ ], 1, si x ]ϑ, + ]. E déduire la desité de ˆϑ MV. 2. Vérifier que la quatité B (ϑ ) = E ϑ [ ˆϑ MV ] ϑ, appelée le biais de ˆϑ MV, est égale à ϑ /( + 1). 3. E utilisat la défiitio de la covergece e loi, prouver que ˆϑ MV loi expoetielle E(1/ϑ ) avec la vitesse 1/, c est-à-dire 3.4 Itervalle de cofiace (ϑ ˆϑ MV L ) E(1/ϑ ). est asymptotiquemet de La méthode du maximum de vraisemblace ous permet de calculer ue estimatio de la vraie valeur du paramètre. Cepedat, ayat calculé cette estimatio, o peut aturellemet s iterroger sur sa qualité. Ue faço largemet répadue pour décrire la qualité de l estimatio cosiste à fourir u itervalle de cofiace ou, plus gééralemet, ue régio de cofiace. Défiitio 3.8. Soit X 1,..., X u échatillo i.i.d. de loi P ϑ avec ϑ Θ R p. O appelle régio de cofiace de iveau prescrit 1 α, avec α [0, 1], tout sous-esemble I = I(X 1,..., X ) de R p tel que P ϑ ( I cotiet ϑ ) 1 α, ϑ Θ. (3.4) Si p = 1 et I est u itervalle, o l appelle itervalle de cofiace. Si au lieu d avoir (3.4) pour fixé, o l a de faço asymptotique, c est-à-dire lim P ϑ ( I cotiet ϑ ) 1 α, ϑ Θ, (3.5) alors o dit que I est ue régio de cofiace de iveau asymptotique 1 α.

44 44 Rappel des bases de la statistique paramétrique Chapitre 3 La démarche géérale pour costruire u itervalle de cofiace peut se résumer de la maière suivate. 1. O détermie u estimateur cosistat ϑ ; das la plupart des cas, la loi de ϑ est cocetrée autour de la vraie valeur ϑ. 2. O cherche u δ = δ(x 1,..., X ) > 0 tel que et l o défiit I = [ ϑ δ, ϑ + δ ]. P ϑ ( ϑ ϑ > δ ) α, ϑ Θ, Remarque 3.2. Si la loi de ϑ ϑ est fortemet asymétrique, o remplace la secode étape par la recherche de deux variables aléatoires δ = δ(x 1,..., X ) > 0 et δ = δ (X 1,..., X ) > 0 telles que ( P ϑ ϑ ϑ ) α < δ 2, et P ( ϑ ϑ ϑ > δ ) α 2, pour tout ϑ Θ, et l o défiit I = [ ϑ δ, ϑ + δ ]. Afi de clarifier le schéma préseté ci-dessus, cosidéros deux exemples Modèle de Beroulli : itervalle de cofiace par excès Rappelos que das l exemple 1 portat sur la qualité de l air, o dispose de variables i.i.d. de loi B(ϑ ) avec ϑ ]0, 1[. Nous avos déjà vu que l EMV ˆϑ MV = X est cosistat das ce modèle. O cherche doc u δ tel que D après l iégalité de Tchebychev, o a P ϑ ( X ϑ > δ ) α, ϑ ]0, 1[. (3.6) P ϑ ( X ϑ ) E > δ ϑ [(X ϑ ) 2 ] δ 2. Or, comme X est sas biais, il viet E ϑ [(X ϑ ) 2 ] = Var ϑ (X ) = [ ] Var ϑ i=1 X i 2 = ϑ (1 ϑ ). E combiat les deux iégalités précédetes avec l iégalité élémetaire ab (a + b) 2 /4, o obtiet ( P ϑ X ϑ ) ϑ > (1 ϑ ) δ δ 2 1 4δ 2. Il e résulte qu e choisissat δ 2 = 1/(4α), l iégalité (3.6) sera satisfaite. Par coséquet, I = [ X 1 2 α ; X + 1 ] 2 α est u itervalle de cofiace (IC) de iveau 1 α pour ϑ. O remarque que le δ qu o a trouvé est pas aléatoire. E d autres termes, la logueur de l IC e déped pas de l échatillo qu au travers de sa taille.

45 Sectio 3.4 Itervalle de cofiace 45 FIGURE 3.4 A gauche : les itervalles de cofiace de iveau 90% pour ϑ = 0.25 das le modèle de Beroulli. O a tiré au hasard 40 échatillos de taille 400. E particulier, o remarque sur le graphe ci-dessus que tous les 40 itervalles cotieet la valeur 0.25 et sot tous de même taille. A droite : les itervalles de cofiace de iveau 90% pour ϑ = 5 das le modèle expoetiel. O remarque que sur 40 échatillos de taille 400 tirés au hasard, 4 fois l itervalle de cofiace calculé e cotiet pas la vraie valeur Modèle expoetiel : itervalle de cofiace asymptotique Cosidéros maiteat l exemple de modèle expoetielle : X 1,..., X iid E(1/ϑ ), ϑ ]0, [. Nous avos vu que das cet exemple l EMV de ϑ est la moyee empirique X. De plus, e vertu de la loi des grads ombres X est u estimateur cosistat. O cherche doc u itervalle de cofiace sous la forme [X δ, X + δ ]. Das ce cas, il est impossible d appliquer la stratégie utilisée das l exemple précédet, car la variace de X égale à ϑ 2 / est pas borée sur Θ =]0, + [. Supposos que la taille de l échatillo est suffisammet grade. O peut alors utiliser ue approximatio de la loi de X par ue loi ormale, car e vertu du théorème de la limite cetrale (TLC), (X ϑ L ) N (0, ϑ 2 ). (L utilisatio du TLC est justifiée puisque E ϑ [X2 1 ] = Var ϑ [X 1] + (E ϑ [X 1 ]) 2 = 2ϑ 2 <.) Cela implique que ( ) X ϑ 1 L N (0, 1) et, par coséquet, ( ( ) ) lim P X ϑ ϑ 1 A = P(ξ A), A B R, où ξ N (0, 1). O peut démotrer que le plus petit esemble A tel que P(ξ A) = 1 α pour ξ N (0, 1) est A = [ q1 α/2 N, qn 1 α/2 ] où qn 1 α/2 désige le quatile d ordre 1 α/2 de

46 46 Rappel des bases de la statistique paramétrique Chapitre 3 FIGURE 3.5 La courbe de la desité de la loi ormale cetrée réduite et les quatiles d ordre 1 α/2. la loi ormale cetrée réduite (voir la Figure 3.5). E choisissat A de cette faço, o obtiet ( ( ) ) lim P X ϑ ϑ 1 [ q N1 α/2, qn1 α/2 ] = 1 α. Pour coclure, il suffit de remarquer que ( ) X ϑ 1 [ q1 α/2 N, qn 1 α/2 ] X [ ϑ 1 qn 1 α/2 [ ϑ O e déduit que [ ] X I = 1 + (q1 α/2 N / ), X 1 (q1 α/2 N / ) est u itervalle de cofiace de iveau asymptotique 1 α pour ϑ. ], 1 + qn 1 α/2 X 1 + (q N 1 α/2 / ), X 1 (q N 1 α/2 / ) Exercice 3.2. Soit X 1,..., X u échatillo i.i.d. de loi E(1/ϑ ) avec ϑ ]0, [. 1. Prouver que 2. E déduire que Ĩ = est i IC de iveau asymptotique α pour ϑ. (X ϑ L ) N (0, 1). X ( ) ( )] [X 1 qn 1 α/2, X 1 + qn 1 α/2 3. Démotrer que, pour les grades valeurs de, les itervalles I et Ĩ sot très proches. Plus précisémet, motrer que si qn 1 α/2 1/2 alors I \ Ĩ + Ĩ \ I Ĩ 2qN 1 α/2. Exercice 3.3. Vérifier que, das le modèle de Beroulli X 1,..., X iid B(ϑ ), [ Ĩ = X qn 1 α/2 ; X + qn ] 1 α/2 est u itervalle de cofiace de iveau asymptotique 1 α pour le paramètre ϑ ].

SÉRIES STATISTIQUES À DEUX VARIABLES

SÉRIES STATISTIQUES À DEUX VARIABLES 1 ) POSITION DU PROBLÈME - VOCABULAIRE A ) DÉFINITION SÉRIES STATISTIQUES À DEUX VARIABLES O cosidère deux variables statistiques umériques x et y observées sur ue même populatio de idividus. O ote x 1

Plus en détail

Statistique descriptive bidimensionnelle

Statistique descriptive bidimensionnelle 1 Statistique descriptive bidimesioelle Statistique descriptive bidimesioelle Résumé Liaisos etre variables quatitatives (corrélatio et uages de poits), qualitatives (cotigece, mosaïque) et de types différets

Plus en détail

Loi binomiale. Niveau : Première S + SUP (Convergence) Prérequis : Variable aléatoire, espérance, variance, théorème limite central, loi de Poisson

Loi binomiale. Niveau : Première S + SUP (Convergence) Prérequis : Variable aléatoire, espérance, variance, théorème limite central, loi de Poisson 4 L E Ç O N Loi biomiale Niveau : Première S + SUP (Covergece) Prérequis : Variable aléatoire, espérace, variace, théorème limite cetral, loi de Poisso 1 Loi de Beroulli Défiitio 41 Loi de Beroulli Soit

Plus en détail

Chapitre 3 : Fonctions d une variable réelle (1)

Chapitre 3 : Fonctions d une variable réelle (1) Uiversités Paris 6 et Paris 7 M1 MEEF Aalyse (UE 3) 2013-2014 Chapitre 3 : Foctios d ue variable réelle (1) 1 Lagage topologique das R Défiitio 1 Soit a u poit de R. U esemble V R est u voisiage de a s

Plus en détail

1 Mesure et intégrale

1 Mesure et intégrale 1 Mesure et itégrale 1.1 Tribu boréliee et foctios mesurables Soit =[a, b] u itervalle (le cas où b = ou a = est pas exclu) et F ue famille de sous-esembles de. OditqueF est ue tribu sur si les coditios

Plus en détail

STATISTIQUE : TESTS D HYPOTHESES

STATISTIQUE : TESTS D HYPOTHESES STATISTIQUE : TESTS D HYPOTHESES Préparatio à l Agrégatio Bordeaux Aée 203-204 Jea-Jacques Ruch Table des Matières Chapitre I. Gééralités sur les tests 5. Itroductio 5 2. Pricipe des tests 6 2.a. Méthodologie

Plus en détail

. (b) Si (u n ) est une suite géométrique de raison q, q 1, on obtient : N N, S N = 1 qn+1. n+1 1 S N = 1 1

. (b) Si (u n ) est une suite géométrique de raison q, q 1, on obtient : N N, S N = 1 qn+1. n+1 1 S N = 1 1 Premières propriétés des ombres réels 2 Suites umériques 3 Suites mootoes : à faire 4 Séries umériques 4. Notio de série. Défiitio 4.. Soit (u ) ue suite de ombres réels ou complexes. Pour N N, o ote S

Plus en détail

Limites des Suites numériques

Limites des Suites numériques Chapitre 2 Limites des Suites umériques Termiale S Ce que dit le programme : CONTENUS CAPACITÉS ATTENDUES COMMENTAIRES Limite fiie ou ifiie d ue suite. Limites et comparaiso. Opératios sur les ites. Comportemet

Plus en détail

Apprentissage: cours 3a Méthodes par moyennage local

Apprentissage: cours 3a Méthodes par moyennage local Appretissage: cours 3a Méthodes par moyeage local Guillaume Oboziski 1 er mars 2012 Réferece : chap. 6 of [Hastie et al., 2009] ad chap. 6 of [Devroye et al., 1996]. Algorithmes par moyeage local O cosidère

Plus en détail

Exercice I ( non spé ) 1/ u 1 = 3 4. 2 3 u 2 4 + 3 9. 19 4 2/ Soit P la propriété : u n + 4. > 0 pour n 1. P est vraie au rang 1 car u 1

Exercice I ( non spé ) 1/ u 1 = 3 4. 2 3 u 2 4 + 3 9. 19 4 2/ Soit P la propriété : u n + 4. > 0 pour n 1. P est vraie au rang 1 car u 1 Bac blac TS Correctio Exercice I ( Spé ) / émotros par récurrece que 5x y = pour tout etier aturel 5x y = 5 8 = La propriété est doc vraie au rag = Supposos que la propriété est vraie jusqu au rag, o a

Plus en détail

Inégalités souvent rencontrées

Inégalités souvent rencontrées Iégalités souvet recotrées Recotres Putam 004 Uiversité de Sherbrooke Jea-Philippe Mori Théorie Certaies iégalités sot deveues célèbres e raiso de leur grade utilité Elles sot aussi souvet au coeur de

Plus en détail

I. Quitte ou double. Pour n = 1 : C 0 + (2p 1) E (M k ) = C 0 + (2p 1) E (M 1 ) = E (C 1 ) d après le 1. Soit n N tel que E (C n ) = C 0 + (2p 1)

I. Quitte ou double. Pour n = 1 : C 0 + (2p 1) E (M k ) = C 0 + (2p 1) E (M 1 ) = E (C 1 ) d après le 1. Soit n N tel que E (C n ) = C 0 + (2p 1) Corrigé ESSEC III 008 par Pierre Veuillez Das certaies situatios paris sportifs, ivestissemets fiaciers..., o est ameé à miser de l arget de faço répétée sur des paris à espérace favorable. O se propose

Plus en détail

Cours 5 : ESTIMATION PONCTUELLE

Cours 5 : ESTIMATION PONCTUELLE Cours 5 : ESTIMATION PONCTUELLE A- Gééralités B- Précisio d u estimateur C- Exhaustivité D- iformatio E-estimateur sas biais de variace miimale, estimateur efficace F- Quelques méthode s d estimatio A-

Plus en détail

STATISTIQUE AVANCÉE : MÉTHODES

STATISTIQUE AVANCÉE : MÉTHODES STATISTIQUE AVANCÉE : MÉTHODES NON-PAAMÉTIQUES Ecole Cetrale de Paris Arak S. DALALYAN Table des matières 1 Itroductio 5 2 Modèle de desité 7 2.1 Estimatio par istogrammes............................

Plus en détail

Séquence 5. La fonction logarithme népérien. Sommaire

Séquence 5. La fonction logarithme népérien. Sommaire Séquece 5 La foctio logarithme épérie Objectifs de la séquece Itroduire ue ouvelle foctio : la foctio logarithme épérie. Coaître les propriétés de cette foctio : sa dérivée, ses variatios, sa courbe, sa

Plus en détail

Intégration et probabilités ENS Paris, 2012-2013. TD (20)13 Lois des grands nombres, théorème central limite. Corrigé :

Intégration et probabilités ENS Paris, 2012-2013. TD (20)13 Lois des grands nombres, théorème central limite. Corrigé : Itégratio et probabilités EN Paris, 202-203 TD 203 Lois des grads ombres, théorème cetral limite. Corrigé Lois des grads ombres Exercice. Calculer e cet leços Détermier les limites suivates : x +... +

Plus en détail

FEUILLE D EXERCICES 17 - PROBABILITÉS SUR UN UNIVERS FINI

FEUILLE D EXERCICES 17 - PROBABILITÉS SUR UN UNIVERS FINI FEUILLE D EXERCICES 7 - PROBABILITÉS SUR UN UNIVERS FINI Exercice - Lacer de dés O lace deux dés à 6 faces équilibrés. Calculer la probabilité d obteir : u double ; ue somme des deux dés égale à 8 ; ue

Plus en détail

[http://mp.cpgedupuydelome.fr] édité le 10 juillet 2014 Enoncés 1. Exercice 6 [ 02475 ] [correction] Si n est un entier 2, le rationnel H n =

[http://mp.cpgedupuydelome.fr] édité le 10 juillet 2014 Enoncés 1. Exercice 6 [ 02475 ] [correction] Si n est un entier 2, le rationnel H n = [http://mp.cpgedupuydelome.fr] édité le 1 juillet 14 Eocés 1 Nombres réels Ratioels et irratioels Exercice 1 [ 9 ] [correctio] Motrer que la somme d u ombre ratioel et d u ombre irratioel est u ombre irratioel.

Plus en détail

II LES PROPRIETES DES ESTIMATEURS MCO 1. Rappel : M1 LA REGRESSION : HYPOTHESES ET TESTS Avril 2009

II LES PROPRIETES DES ESTIMATEURS MCO 1. Rappel : M1 LA REGRESSION : HYPOTHESES ET TESTS Avril 2009 M LA REGRESSION : HYPOTHESES ET TESTS Avril 009 I LES HYPOTHESES DE LA MCO. Hypothèses sur la variable explicative a. est o stochastique. b. a des valeurs xes das les différets échatillos. c. Quad ted

Plus en détail

Statistiques appliquées à la gestion Cours d analyse de donnés Master 1

Statistiques appliquées à la gestion Cours d analyse de donnés Master 1 Aalyse des doées Statistiques appliquées à la gestio Cours d aalyse de doés Master F. SEYTE : Maître de coféreces HDR e scieces écoomiques Uiversité de Motpellier I M. TERRAZA : Professeur de scieces écoomiques

Plus en détail

Maîtrise de Mathématiques TER Le bandit manchot à deux bras

Maîtrise de Mathématiques TER Le bandit manchot à deux bras Maîtrise de Mathématiques TER Le badit machot à deux bras Deis Cousieau Sous la directio de Jea-Michel Loubes Septembre 2003 Table des matières 1 Présetatio du problème 2 1.1 Exemple de la machie à sous,

Plus en détail

Université de Bordeaux - Master MIMSE - 2ème année. Scoring. Marie Chavent http://www.math.u-bordeaux.fr/ machaven/ 2014-2015

Université de Bordeaux - Master MIMSE - 2ème année. Scoring. Marie Chavent http://www.math.u-bordeaux.fr/ machaven/ 2014-2015 Uiversité de Bordeaux - Master MIMSE - 2ème aée Scorig Marie Chavet http://www.math.u-bordeaux.fr/ machave/ 2014-2015 1 Itroductio L idée géérale est d affecter ue ote (u score) global à u idividu à partir

Plus en détail

Cours de Statistiques inférentielles

Cours de Statistiques inférentielles Licece 2-S4 SI-MASS Aée 2015 Cours de Statistiques iféretielles Pierre DUSART 2 Chapitre 1 Lois statistiques 1.1 Itroductio Nous allos voir que si ue variable aléatoire suit ue certaie loi, alors ses réalisatios

Plus en détail

Principes et Méthodes Statistiques

Principes et Méthodes Statistiques Esimag - 2ème aée 0 1 2 3 4 5 6 7 0 5 10 15 x y Pricipes et Méthodes Statistiques Notes de cours Olivier Gaudoi 2 Table des matières 1 Itroductio 7 1.1 Défiitio et domaies d applicatio de la statistique............

Plus en détail

14 Chapitre 14. Théorème du point fixe

14 Chapitre 14. Théorème du point fixe Chapitre 14 Chapitre 14. Théorème du poit fixe Si l o examie de plus près les méthodes de Lagrage et de Newto, étudiées au chapitre précédet, elles revieet das leur pricipe à remplacer la résolutio de

Plus en détail

Séries réelles ou complexes

Séries réelles ou complexes 6 Séries réelles ou complexes Comme pour le chapitre 3, les suites cosidérées sot a priori complexes et les résultats classiques sur les foctios cotiues ou dérivables d ue variable réelle sot supposés

Plus en détail

Groupe orthogonal d'un espace vectoriel euclidien de dimension 2, de dimension 3

Groupe orthogonal d'un espace vectoriel euclidien de dimension 2, de dimension 3 1 Groupe orthogoal d'u espace vectoriel euclidie de dimesio, de dimesio Voir le chapitre 19 pour l'étude des espaces euclidies et des isométries. État doé u espace euclidie E de dimesio 1, o rappelle que

Plus en détail

20. Algorithmique & Mathématiques

20. Algorithmique & Mathématiques L'éditeur L'éditeur permet à l'utilisateur de saisir les liges de codes d'u programme ou de défiir des foctios. Remarque : O peut saisir directemet des istructios das la cosole Scilab, mais il est plus

Plus en détail

Processus et martingales en temps continu

Processus et martingales en temps continu Chapitre 3 Processus et martigales e temps cotiu 1 Quelques rappels sur les martigales e temps discret (voir [4]) O cosidère u espace filtré (Ω, F, (F ) 0, IP). O ote F = 0 F. Défiitio 1.1 Ue suite de

Plus en détail

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable Exo7 Topologie Exercices de Jea-Louis Rouget Retrouver aussi cette fiche sur wwwmaths-fracefr * très facile ** facile *** difficulté moyee **** difficile ***** très difficile I : Icotourable Exercice **

Plus en détail

Exo7. Déterminants. = 4(b + c)(c + a)(a + b). c + a c + b 2c Correction. b + a 2b b + c. Exercice 2 ** X a b c a X c b b c X a c b a X

Exo7. Déterminants. = 4(b + c)(c + a)(a + b). c + a c + b 2c Correction. b + a 2b b + c. Exercice 2 ** X a b c a X c b b c X a c b a X Exo7 Détermiats Exercices de Jea-Louis Rouget Retrouver aussi cette fiche sur wwwmaths-fracefr * très facile ** facile *** difficulté moyee **** difficile ***** très difficile I : Icotourable T : pour

Plus en détail

LES PROBABILITÉS POUR LES OPTIONS B, C ET D

LES PROBABILITÉS POUR LES OPTIONS B, C ET D LES PROBABILITÉS POUR LES OPTIONS B, C ET D PRÉPARATION À L AGRÉGATION EXTERNE DE MATHÉMATIQUES DE L UNIVERSITÉ RENNES 1 1 ANNÉE 2009/2010 1. ESPACE PROBABILISÉ - VARIABLE ALÉATOIRE 1.1 ESPACE PROBABILISÉ

Plus en détail

CHAPITRE 2 SÉRIES ENTIÈRES

CHAPITRE 2 SÉRIES ENTIÈRES CHAPITRE 2 SÉRIES ENTIÈRES 2. Séries etières Défiitio 2.. O appelle série etière toute série de foctios ( ) f dot le terme gééral est de la forme f ()=a, où (a ) désige ue suite réelle ou complee et R.

Plus en détail

Université Victor Segalen Bordeaux 2 Institut de Santé Publique, d Épidémiologie et de Développement (ISPED) Campus Numérique SEME

Université Victor Segalen Bordeaux 2 Institut de Santé Publique, d Épidémiologie et de Développement (ISPED) Campus Numérique SEME Uiversité Victor Segale Bordeaux Istitut de Saté Publique, d Épidémiologie et de Développemet (ISPED) Campus Numérique SEME MODULE Pricipaux outils e statistique Versio du 8 août 008 Écrit par : Relu par

Plus en détail

4 Approximation des fonctions

4 Approximation des fonctions 4 Approximatio des foctios Ue foctio f arbitraire défiie sur u itervalle I et à valeur das IR peut être représetée par so graphe, ou de maière équivalete par la doée de l esemble de ses valeurs f(t) pour

Plus en détail

55 - EXEMPLES D UTILISATION DU TABLEUR.

55 - EXEMPLES D UTILISATION DU TABLEUR. 55 - EXEMPLES D UTILISATION DU TABLEUR. CHANTAL MENINI 1. U pla possible Les exemples qui vot suivre sot des pistes possibles et e aucu cas ue présetatio exhaustive. De même je ai pas fait ue étude systématique

Plus en détail

Etude de la fonction ζ de Riemann

Etude de la fonction ζ de Riemann Etude de la foctio ζ de Riema ) Défiitio Pour x réel doé, la série de terme gééral,, coverge si et seulemet si x >. x La foctio zeta de Riema est la foctio défiie sur ], [ par : ( x > ), = x. Remarque.

Plus en détail

Comportement d'une suite

Comportement d'une suite Comportemet d'ue suite I) Approche de "ses de variatio et de ite d'ue suite" : 7 Soit la suite ( ) telle que = 5 ( + ) 2 Représetos graphiquemet la suite das u pla mui d' u repère. Il suffit de placer

Plus en détail

LES ÉCLIPSES. Éclipser signifie «cacher». Vus depuis la Terre, deux corps célestes peuvent être éclipsés : la Lune et le Soleil.

LES ÉCLIPSES. Éclipser signifie «cacher». Vus depuis la Terre, deux corps célestes peuvent être éclipsés : la Lune et le Soleil. Qu appelle-t-o éclipse? Éclipser sigifie «cacher». Vus depuis la Terre, deu corps célestes peuvet être éclipsés : la Lue et le Soleil. LES ÉCLIPSES Pour qu il ait éclipse, les cetres de la Terre, de la

Plus en détail

Dénombrement. Introduction. 1 Cardinaux d'ensembles nis. ECE3 Lycée Carnot. 12 novembre 2010. 1.1 Quelques dénitions

Dénombrement. Introduction. 1 Cardinaux d'ensembles nis. ECE3 Lycée Carnot. 12 novembre 2010. 1.1 Quelques dénitions Déombremet ECE3 Lycée Carot 12 ovembre 2010 Itroductio La combiatoire, sciece du déombremet, sert comme so om l'idique à compter. Il e s'agit bie etedu pas de reveir au stade du CP et d'appredre à compter

Plus en détail

Dénombrement. Chapitre 1. 1.1 Enoncés des exercices

Dénombrement. Chapitre 1. 1.1 Enoncés des exercices Chapitre 1 Déombremet 1.1 Eocés des exercices Exercice 1 L acie système d immatriculatio fraçais était le suivat : chaque plaque avait 4 chiffres, suivis de 2 lettres, puis des 2 uméros du départemet.

Plus en détail

Chapitre 2 SONDAGE ALEATOIRE SIMPLE OU A PROBABILITES EGALES. 2.1 DEFINITIONS 2.2 SONDAGE ALEATOIRE SIMPLE SANS REMISE (PESR) 2.2.

Chapitre 2 SONDAGE ALEATOIRE SIMPLE OU A PROBABILITES EGALES. 2.1 DEFINITIONS 2.2 SONDAGE ALEATOIRE SIMPLE SANS REMISE (PESR) 2.2. Chapitre 2 SONDAGE ALEATOIRE SIMPLE OU A PROBABILITES EGALES PLAN DU CHAPITRE 2 2.1 DEFINITIONS 2.2 SONDAGE ALEATOIRE SIMPLE SANS REMISE (PESR) 2.2.1 Pla de sodage 2.2.2 Probabilités d iclusio 2.3 SONDAGE

Plus en détail

Chapitre 13. Statistiques et probabilités. Sommaire

Chapitre 13. Statistiques et probabilités. Sommaire 13 Chapitre Chapitre 13 Statistiques et probabilités Les statistiques et les probabilités occupet ue place importate das l eseigemet de certaies classes préparatoires Les pricipales foctios écessaires

Plus en détail

Chapitre 3 : Transistor bipolaire à jonction

Chapitre 3 : Transistor bipolaire à jonction Chapitre 3 : Trasistor bipolaire à joctio ELEN075 : Electroique Aalogique ELEN075 : Electroique Aalogique / Trasistor bipolaire U aperçu du chapitre 1. Itroductio 2. Trasistor p e mode actif ormal 3. Courats

Plus en détail

Initiation à l analyse factorielle des correspondances

Initiation à l analyse factorielle des correspondances Fiche TD avec le logiciel : tdr620b Iitiatio à l aalyse factorielle des correspodaces A.B. Dufour & M. Royer & J.R. Lobry Das cette fiche, o étudie l Aalyse Factorielle des Correspodaces. Cette techique

Plus en détail

Convergences 2/2 - le théorème du point fixe - Page 1 sur 9

Convergences 2/2 - le théorème du point fixe - Page 1 sur 9 Au sommaire : Suites extraites Le théorème de Bolzao-Weierstrass La preuve du théorème de Bolzao-Weierstrass3 Foctio K-cotractate4 Le théorème du poit fixe5 La preuve du théorème du poit fixe6 Utilisatios

Plus en détail

x +1 + ln. Donner la valeur exacte affichée par cet algorithme lorsque l utilisateur entre la valeur n =3.

x +1 + ln. Donner la valeur exacte affichée par cet algorithme lorsque l utilisateur entre la valeur n =3. EXERCICE 3 (6 poits ) (Commu à tous les cadidats) Il est possible de traiter la partie C sas avoir traité la partie B Partie A O désige par f la foctio défiie sur l itervalle [, + [ par Détermier la limite

Plus en détail

EXERCICES : DÉNOMBREMENT

EXERCICES : DÉNOMBREMENT Chapitre 7 ECE 1 - Grad Nouméa - 015 EXERCICES : DÉNOMBREMENT LISTES / ARRANGEMENTS Exercice 1 : Le code ativol Pour so vélo, Toto possède u ativol a code. Le code est ue successio de trois chiffres compris

Plus en détail

2 ième partie : MATHÉMATIQUES FINANCIÈRES

2 ième partie : MATHÉMATIQUES FINANCIÈRES 2 ième partie : MATHÉMATIQUES FINANCIÈRES 1. Défiitios L'itérêt est l'idemité que doe au propriétaire d'ue somme d'arget celui qui e a joui pedat u certai temps. Divers élémets itervieet das le calcul

Plus en détail

TRANSFERT DE CHARGE DANS UN RÉSEAU DE PROCESSEURS TOTALEMENT CONNECTÉS (*) par Maryse BÉGUIN ( 1 )

TRANSFERT DE CHARGE DANS UN RÉSEAU DE PROCESSEURS TOTALEMENT CONNECTÉS (*) par Maryse BÉGUIN ( 1 ) RAIRO Operatios Research RAIRO Oper. Res. 34 (2000) 99-129 TRANSFERT DE CHARGE DANS UN RÉSEAU DE PROCESSEURS TOTALEMENT CONNECTÉS (*) par Maryse BÉGUIN ( 1 ) Commuiqué par Berard LEMAIRE Résumé. L étude

Plus en détail

Chap. 5 : Les intérêts (Les calculs financiers)

Chap. 5 : Les intérêts (Les calculs financiers) Chap. 5 : Les itérêts (Les calculs fiaciers) Das u cotrat de prêt, le prêteur met à la dispositio de l empruteur, à u taux d itérêt doé, ue somme d arget (le capital) qu il devra rembourser à ue certaie

Plus en détail

Processus géométrique généralisé et applications en fiabilité

Processus géométrique généralisé et applications en fiabilité Processus géométrique gééralisé et applicatios e fiabilité Lauret Bordes 1 & Sophie Mercier 2 1,2 Uiversité de Pau et des Pays de l Adour Laboratoire de Mathématiques et de leurs Applicatios - Pau UMR

Plus en détail

UNIVERSITE MONTESQUIEU BORDEAUX IV. Année universitaire 2006-2007. Semestre 2. Prévisions Financières. Travaux Dirigés - Séances n 4

UNIVERSITE MONTESQUIEU BORDEAUX IV. Année universitaire 2006-2007. Semestre 2. Prévisions Financières. Travaux Dirigés - Séances n 4 UNVERSTE MONTESQUEU BORDEAUX V Licece 3 ère aée Ecoomie - Gestio Aée uiversitaire 2006-2007 Semestre 2 Prévisios Fiacières Travaux Dirigés - Séaces 4 «Les Critères Complémetaires des Choix d vestissemet»

Plus en détail

c. Calcul pour une évolution d une proportion entre deux années non consécutives

c. Calcul pour une évolution d une proportion entre deux années non consécutives Calcul des itervalles de cofiace our les EPCV 996-004 - Cas d u ourcetage ou d ue évolutio e oit das la oulatio totale des méages - Cas d u ourcetage ou d ue évolutio das ue sous oulatio das les méages

Plus en détail

Probabilités et statistique pour le CAPES

Probabilités et statistique pour le CAPES Probabilités et statistique pour le CAPES Béatrice de Tilière Frédérique Petit 2 3 jui 205. Uiversité Pierre et Marie Curie 2. Uiversité Pierre et Marie Curie 2 Table des matières Modélisatio de phéomèes

Plus en détail

Les Nombres Parfaits.

Les Nombres Parfaits. Les Nombres Parfaits. Agathe CAGE, Matthieu CABAUSSEL, David LABROUSSE (2 de Lycée MONTAIGNE BORDEAUX) et Alexadre DEVERT, Pierre Damie DESSARPS (TS Lycée SUD MEDOC LETAILLAN MEDOC) La première partie

Plus en détail

Chaînes de Markov. Arthur Charpentier

Chaînes de Markov. Arthur Charpentier Chaîes de Markov Arthur Charpetier École Natioale de la Statistique et d Aalyse de l Iformatio - otes de cours à usage exclusif des étudiats de l ENSAI - - e pas diffuser, e pas citer - Quelques motivatios.

Plus en détail

Intérêt simple CHAPITRE. Sommaire

Intérêt simple CHAPITRE. Sommaire HAPTRE térêt simple Sommaire A B D E F G H J K L Notio d itérêt Formule fodametale de l itérêt simple Durée de placemet exprimée e mois Durée de placemet exprimée e jours alculs sur la formule fodametale

Plus en détail

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable Eo7 Séries etières Eercices de Jea-Louis Rouget Retrouver aussi cette fiche sur wwwmaths-fracefr * très facile ** facile *** difficulté moyee **** difficile ***** très difficile I : Icotourable Eercice

Plus en détail

Bio-Statistique. 1 ère partie. Discipline : Bio-statistique, Bio-mathématique et Sciences de l Information

Bio-Statistique. 1 ère partie. Discipline : Bio-statistique, Bio-mathématique et Sciences de l Information Bio-Statistique 1 ère partie Disciplie : Bio-statistique, Bio-mathématique et Scieces de l Iformatio OBJECTIFS PEDAGOGIQUES Réaliser l importace du problème de la variabilité ihérete au doées médicales,

Plus en détail

PROMENADE ALÉATOIRE : Chaînes de Markov et martingales

PROMENADE ALÉATOIRE : Chaînes de Markov et martingales PROMENADE ALÉATOIRE : Chaîes de Markov et martigales Thierry Bodieau École Polytechique Paris Départemet de Mathématiques Appliquées thierry.bodieau@polytechique.edu Novembre 2013 2 Table des matières

Plus en détail

Suites et séries de fonctions

Suites et séries de fonctions [http://mp.cpgedupuydelome.fr] édité le 3 avril 5 Eocés Suites et séries de foctios Propriétés de la limite d ue suite de foctios Eercice [ 868 ] [correctio] Etablir que la limite simple d ue suite de

Plus en détail

Université Pierre et Marie Curie. Biostatistique PACES - UE4 2013-2014

Université Pierre et Marie Curie. Biostatistique PACES - UE4 2013-2014 Uiversité Pierre et Marie Curie Biostatistique PACES - UE4 2013-2014 Resposables : F. Carrat et A. Mallet Auteurs : F. Carrat, A. Mallet, V. Morice Mise à jour : 21 octobre 2013 Relecture : V. Morice,

Plus en détail

Module 3 : Inversion de matrices

Module 3 : Inversion de matrices Math Stat Module : Iversio de matrices M Module : Iversio de matrices Uité. Défiitio O e défiira l iverse d ue matrice que si est carrée. O appelle iverse de la matrice carrée toute matrice B telle que

Plus en détail

Probabilité 1 - L1 MMIA

Probabilité 1 - L1 MMIA Probabilité 1 - L1 MMIA Tra Viet Chi, vtra@u-paris10fr, Bureau E12(G) Exercice 1 (Pour démarrer) 1 Soiet A et B deux esembles Rappelez les défiitios de l itersectio A B, de l uio A B, de la différece A

Plus en détail

Consolidation. C r é e r un nouveau classeur. Créer un groupe de travail. Saisir des données dans un groupe

Consolidation. C r é e r un nouveau classeur. Créer un groupe de travail. Saisir des données dans un groupe Cosolidatio La société THEOS, qui commercialise des vis, exerce so activité das trois villes : Paris, Nacy et Nice. Le directeur de la société souhaite cosolider les résultats de ses vetes par ville das

Plus en détail

Exercices de mathématiques

Exercices de mathématiques MP MP* Thierry DugarDi Marc rezzouk Exercices de mathématiques Cetrale-Supélec, Mies-Pots, École Polytechique et ENS Coceptio et créatio de couverture : Atelier 3+ Duod, 205 5 rue Laromiguière, 75005 Paris

Plus en détail

Baccalauréat S Asie 19 juin 2014 Corrigé

Baccalauréat S Asie 19 juin 2014 Corrigé Bcclurét S Asie 9 jui 24 Corrigé A. P. M. E. P. Exercice Commu à tous les cdidts 4 poits Questio - c. O peut élimier rpidemet les réposes. et d. cr les vecteurs directeurs des droites proposées e sot ps

Plus en détail

UNIVERSITÉ DE SFAX École Supérieure de Commerce

UNIVERSITÉ DE SFAX École Supérieure de Commerce UNIVERSITÉ DE SFAX École Supérieure de Commerce Aée Uiversitaire 2003 / 2004 Auditoire : Troisième Aée Études Supérieures Commerciales & Scieces Comptables DÉCISIONS FINANCIÈRES Note de cours N 3 Première

Plus en détail

Polynésie Septembre 2002 - Exercice On peut traiter la question 4 sans avoir traité les questions précédentes.

Polynésie Septembre 2002 - Exercice On peut traiter la question 4 sans avoir traité les questions précédentes. Polyésie Septembre 2 - Exercice O peut traiter la questio 4 sas avoir traité les questios précédetes Pour u achat immobilier, lorsqu ue persoe emprute ue somme de 50 000 euros, remboursable par mesualités

Plus en détail

Deuxième partie : LES CONTRATS D ASSURANCE VIE CLASSIQUES

Deuxième partie : LES CONTRATS D ASSURANCE VIE CLASSIQUES DEUXIEME PARTIE Deuième partie : LES CONTRATS D ASSURANCE VIE CLASSIQUES Chapitre. L assurace de capital différé Chapitre 2. Les opératios de retes Chapitre 3. Les assuraces décès Chapitre 4. Les assuraces

Plus en détail

Initiation à l analyse factorielle des correspondances

Initiation à l analyse factorielle des correspondances Fiche TD avec le logiciel : tdr1105 Iitiatio à l aalyse factorielle des correspodaces A.B. Dufour & M. Royer & J.R. Lobry Das cette fiche, o étudie l Aalyse Factorielle des Correspodaces. Cette techique

Plus en détail

UV SQ 20. Automne 2006. Responsable d Rémy Garandel ( m.-el. remy.garandel@utbm.fr ) page 1

UV SQ 20. Automne 2006. Responsable d Rémy Garandel ( m.-el. remy.garandel@utbm.fr ) page 1 UV SQ 0 Probabilités Statistiques UV SQ 0 Autome 006 Resposable d Rémy Garadel ( m.-el. remy.garadel@utbm.fr ) page SQ-0 Probabilités - Statistiques Bibliographie: Titre Auteur(s) Editios Localisatio Niveau

Plus en détail

HEC. Gilles Mauffrey. METHODES QUANTITATIVES AVEC EXCEL Programmation linéaire, programmation dynamique, simulation, statistique élémentaire

HEC. Gilles Mauffrey. METHODES QUANTITATIVES AVEC EXCEL Programmation linéaire, programmation dynamique, simulation, statistique élémentaire HEC Gilles Mauffrey METHODES QUANTITATIVES AVEC EXCEL Programmatio liéaire, programmatio dyamique, simulatio, statistique élémetaire La Modélisatio LA MODELISATION Modèle et typologie des modèles. La otio

Plus en détail

trouve jamais dans les concepts généraux que ce qu on y met

trouve jamais dans les concepts généraux que ce qu on y met ,QIRUPDWLTXHQRUPHHWWHPSV,VDEHOOH%R\GHQV Présetatio par Marie-Ae Chabi Réuio PIN 15 javier 2004 /HVEDVHVGHGRQQpHVHPSLULTXHV Collectio fiie et structurée de doées codifiées, textuelles ou multimédia, destiées

Plus en détail

Formation d un ester à partir d un acide et d un alcool

Formation d un ester à partir d un acide et d un alcool CHAPITRE 10 RÉACTINS D ESTÉRIFICATIN ET D HYDRLYSE 1 Formatio d u ester à partir d u acide et d u alcool 1. Nomeclature Acide : R C H Alcool : R H Groupe caractéristique ester : C Formule géérale d u ester

Plus en détail

Approximation de la solution d une équation différentielle ordinaire avec impulsions qui dépendent de l état

Approximation de la solution d une équation différentielle ordinaire avec impulsions qui dépendent de l état Approximatio de la solutio d ue équatio différetielle ordiaire avec impulsios qui dépedet de l état F. Dubeau A. Ouasafi A. Sakat CRM-276 Jauary 21 Départemet de mathématiques et d iformatique, Uiversité

Plus en détail

Tempêtes : Etude des dépendances entre les branches Automobile et Incendie à l aide de la théorie des copulas Topic 1 Risk evaluation

Tempêtes : Etude des dépendances entre les branches Automobile et Incendie à l aide de la théorie des copulas Topic 1 Risk evaluation Tempêtes : Etude des dépedaces etre les braches Automobile et Icedie à l aide de la théorie des copulas Topic Risk evaluatio Belguise Olivier Charles Levi ACM Guy Carpeter 34 rue du Wacke 47/53 rue Raspail

Plus en détail

Le meilleur scénario pour votre investissement

Le meilleur scénario pour votre investissement ivestir Best Strategy 2012 Le meilleur scéario pour votre ivestissemet U ivestissemet diversifié U coupo uique de 0% à 50% brut* à l échéace Ue courte durée : 4 as et demi Votre capital garati à l échéace

Plus en détail

P : Dénombrements / Probabilités en univers fini

P : Dénombrements / Probabilités en univers fini P : Déombremets / Probabilités e uivers fii Déombremet & Combiatoire P.1 O tire les cartes! O tire 5 cartes das u jeu de 32 cartes usuel. Combie y a-t-il de tirages possibles vérifiat les coditios suivates

Plus en détail

Les algorithmes de tri

Les algorithmes de tri CONSERVATOIRE NATIONAL DES ARTS ET METIERS PARIS MEMOIRE POUR L'EXAMEN PROBATOIRE e INFORMATIQUE par Nicolas HERVE Les algorithmes de tri Souteu le mai JURY PRESIDENTE : Mme COSTA Sommaire Itroductio....

Plus en détail

Etude Spéciale SCORING : UN GRAND PAS EN AVANT POUR LE MICROCRÉDIT?

Etude Spéciale SCORING : UN GRAND PAS EN AVANT POUR LE MICROCRÉDIT? Etude Spéciale o. 7 Javier 2003 SCORING : UN GRAND PAS EN AVANT POUR LE MICROCRÉDIT? MARK SCHNEIDER Le CGAP vous ivite à lui faire part de vos commetaires, de vos rapports et de toute demade d evoid autres

Plus en détail

capital en fin d'année 1 C 0 + T C 0 = C 0 (1 + T) = C 0 r en posant r = 1 + T 2 C 0 r + C 0 r T = C 0 r (1 + T) = C 0 r 2 3 C 0 r 3...

capital en fin d'année 1 C 0 + T C 0 = C 0 (1 + T) = C 0 r en posant r = 1 + T 2 C 0 r + C 0 r T = C 0 r (1 + T) = C 0 r 2 3 C 0 r 3... Applicatios des maths Algèbre fiacière 1. Itérêts composés O place u capital C 0 à u taux auel T a pedat aées. Quelle est la valeur fiale C de ce capital? aée capital e fi d'aée 1 C 0 + T C 0 = C 0 (1

Plus en détail

La France, à l écoute des entreprises innovantes, propose le meilleur crédit d impôt recherche d Europe

La France, à l écoute des entreprises innovantes, propose le meilleur crédit d impôt recherche d Europe 1/5 Trois objectifs poursuivis par le gouveremet : > améliorer la compétitivité fiscale de la Frace > péreiser les activités de R&D > faire de la Frace u territoire attractif pour l iovatio Les icitatios

Plus en détail

Probabilités. Voir en bibliographie l ouvrage [1], pages 52 et 53.

Probabilités. Voir en bibliographie l ouvrage [1], pages 52 et 53. Probabilités «Pour compredre l actualité, ue formatio à la statistique est aujourd hui idispesable ; c est ue formatio qui développe des capacités d aalyse et de sythèse et exerce le regard critique. Le

Plus en détail

Comment utiliser ce que vous POSSÉDEZ pour réduire ce que vous DEVEZ

Comment utiliser ce que vous POSSÉDEZ pour réduire ce que vous DEVEZ Commet utiliser ce que vous POSSÉDEZ pour réduire ce que vous DEVEZ Survol du compte Mauvie U La majorité des Caadies gèret leurs fiaces comme suit : 1. Ils déposet leur reveu et autres actifs à court

Plus en détail

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation 1 / 9 Chap. 6 : Les pricipaux crédits de trésorerie et leur comptabilisatio Le cycle d exploitatio des etreprises (achats stockage productio stockage vetes) peut etraîer des décalages de trésorerie plus

Plus en détail

Échantillonnage et estimation

Échantillonnage et estimation Stage «Nouveaux programmes de Termiale S» - Ho Chi Mih-Ville Novembre 202 Échatilloage et estimatio Partie C - Frédéric Barôme page Échatilloage et estimatio Partie C : Capacités et exercices-types. Rappelos

Plus en détail

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation Chap. 6 : Les pricipaux crédits de trésorerie et leur comptabilisatio Les etreprises ot souvet besoi de moyes de fiacemet à court terme : elles ot alors recours aux crédits bacaires (découverts bacaires

Plus en détail

Introduction : Mesures et espaces de probabilités

Introduction : Mesures et espaces de probabilités Itroductio : Mesures et espaces de probabilités Référeces : Poly cédric Berardi et Jea Michel Morel. J.-F. Le Gall, Itégratio, Probabilités et Processus Aléatoire J.-Y. Ouvrard, Probabilités 2, maîtrise-agrégatio,

Plus en détail

Examen final pour Conseiller financier / conseillère financière avec brevet fédéral. Recueil de formules. Auteur: Iwan Brot

Examen final pour Conseiller financier / conseillère financière avec brevet fédéral. Recueil de formules. Auteur: Iwan Brot Exame fial pour Coseiller fiacier / coseillère fiacière avec brevet fédéral Recueil de formules Auteur: Iwa Brot Ce recueil de formules sera mis à dispositio des cadidats, si écessaire. Etat au 1er mars

Plus en détail

1. CALCUL DES CARACTÉRISTIQUES «R- L-C» D'UNE JONCTION TRIPHASÉE

1. CALCUL DES CARACTÉRISTIQUES «R- L-C» D'UNE JONCTION TRIPHASÉE . CALCUL DES CAACTÉISTIQUES «- L-C» DUNE JONCTION TIPHASÉE Trasport et Distributio de léergie Electrique Mauel de travaux pratiques. CALCUL DES CAACTÉISTIQUES «-L-C» DUNE JONCTION TIPHASÉE.. Itroductio....

Plus en détail

DETERMINANTS. a b et a'

DETERMINANTS. a b et a' 2003 - Gérard Lavau - http://perso.waadoo.fr/lavau/idex.htm Vous avez toute liberté pour télécharger, imprimer, photocopier ce cours et le diffuser gratuitemet. Toute diffusio à titre oéreux ou utilisatio

Plus en détail

La tarification hospitalière : de l enveloppe globale à la concurrence par comparaison

La tarification hospitalière : de l enveloppe globale à la concurrence par comparaison ANNALES D ÉCONOMIE ET DE STATISTIQUE. N 58 2000 La tarificatio hospitalière : de l eveloppe globale à la cocurrece par comparaiso Michel MOUGEOT * RÉSUMÉ. Cet article cosidère différetes politiques de

Plus en détail

Système constructif avec isolation par l extérieur

Système constructif avec isolation par l extérieur Système costructif avec isolatio par l extérieur Eco-costruire e Bloc Moomur Isolat HERMIBLOC Matériau durable par ature pour des Habitats Basse Cosommatio www.thermibloc.fr LE «BÉON DE BOIS» Le matériau

Plus en détail

Renseignements et monitoring. Renseignements commerciaux et de solvabilité sur les entreprises et les particuliers.

Renseignements et monitoring. Renseignements commerciaux et de solvabilité sur les entreprises et les particuliers. Reseigemets et moitorig. Reseigemets commerciaux et de solvabilité sur les etreprises et les particuliers. ENSEMBLE CONTRE LES PERTES. Reseigemets Creditreform. Pour plus de trasparece. Etreteir des rapports

Plus en détail

Réseaux d ondelettes et réseaux de neurones pour la modélisation statique et dynamique de processus

Réseaux d ondelettes et réseaux de neurones pour la modélisation statique et dynamique de processus Réseaux d odelettes et réseaux de euroes pour la modélisatio statique et dyamique de processus Yacie Oussar To cite this versio: Yacie Oussar. Réseaux d odelettes et réseaux de euroes pour la modélisatio

Plus en détail

MESURE DE L'INFORMATION

MESURE DE L'INFORMATION MESURE DE L'INFORMATION Marc URO TABLE DES MATIÈRES INTRODUCTION... 3 INCERTITUDE D'UN ÉVÉNEMENT (OU SELF-INFORMATION)... 7 INFORMATION MUTUELLE DE DEUX ÉVÉNEMENTS... 9 ENTROPIE D'UNE VARIABLE ALÉATOIRE

Plus en détail

Examen final pour Conseiller financier / conseillère financière avec brevet fédéral. Recueil de formules. Auteur: Iwan Brot

Examen final pour Conseiller financier / conseillère financière avec brevet fédéral. Recueil de formules. Auteur: Iwan Brot Exame fial pour Coseiller fiacier / coseillère fiacière avec brevet fédéral Recueil de formules Auteur: Iwa Brot Ce recueil de formules est à dispositio olie et sera doé aux cadidats lors des exames oraux

Plus en détail

Des résultats d irrationalité pour deux fonctions particulières

Des résultats d irrationalité pour deux fonctions particulières Collect. Math. 5, 00, 0 c 00 Uiversitat de Barceloa Des résultats d irratioalité pour deux foctios particulières Richard Choulet 7, Rue du 4 Août, 40 Aveay, Frace E-mail: richardchoulet@waadoo.fr Received

Plus en détail