Statistique Numérique et Analyse des Données

Dimension: px
Commencer à balayer dès la page:

Download "Statistique Numérique et Analyse des Données"

Transcription

1 Statistique Numérique et Aalyse des Doées Arak DALALYAN Septembre 2011

2

3 Table des matières 1 Élémets de statistique descriptive Répartitio d ue série umérique uidimesioelle Statistiques d ue série umérique uidimesioelle Statistiques et représetatios graphiques de deux séries umériques Résumé du Chapitre Aalyse des doées multivariées Itroductio Exemple : billets suisses La théorie de l Aalyse e Composates Pricipales Représetatios graphiques et iterprétatio Résumé du Chapitre Rappel des bases de la statistique paramétrique Itroductio Modèle statistique Estimatio Itervalle de cofiace Test d hypothèses Exercices Résumé du Chapitre Régressio liéaire multiple Gééralités Lois associées aux échatillos gaussies Le modèle gaussie Régressio liéaire multiple Exercices Résumé du Chapitre Tests d adéquatio Itroductio Tests du chi-deux Test de Kolmogorov Résumé du Chapitre

4 4 Table des matières Chapitre 0 6 Tables umériques Quatiles de la loi ormale cetrée réduite Table de la loi du khi-deux Table de la loi de Studet Quatiles pour le test de Kolmogorov

5 Table des figures 1.1 Histogrammes Foctio de répartitio empirique Répartitios asymétriques Boxplot Nuage de poits Nuage de poits pour les doées trasformées Nuage de poit et droite de régressio QQ-plots Fracs Suisses Billets suisses : boxplots Billets Suisses : matrice de scatter plots Billets suisses : projectio des idividus Billets suisses : scree-graph et cercle des corrélatios La log-vraisemblace du modèle de Beroulli La log-vraisemblace du modèle expoetielle La log-vraisemblace du modèle Uiforme Itervalles de cofiace pour le modèle de Beroulli Les quatiles de la loi N (0, 1) Doées de pluie La répartitio des doées du taux d alcool Doées de pluie : droite de régressio Le test de Kolmogorov s appuie sur la distace etre foctio de répartitio empirique et théorique Présetatio usuelle de la distace de Kolmogorov

6

7 Liste des tableaux 1.1 Doées PIB-Cosommatio d éergie par habitat Doées des billets suisses authetiques Doées des billets suisses cotrefaits Hauteurs d arbres das 3 forêts Jour et quatité de pluie par aées Quatiles de la statistique de Kolmogorov

8

9 1 Élémets de statistique descriptive Le but de ce chapitre est de préseter les outils graphiques les plus répadus de la statistique descriptive. O cosidérera les cas d ue série umérique uidimesioelle et bidimesioelle. Avat de retrer das le vif du sujet, apportos ue petite précisio à ue idée très largemet répadue, selo laquelle le but de la disciplie statistique est d aalyser des doées issues d ue expériece à caractère aléatoire. Cela sous-eted qu il est pas possible ou qu il est pas utile d appliquer la méthodologie statistique aux doées recueillies par u procédé détermiiste (o aléatoire). Cette ue déductio erroée. La boe défiitio de l objectif de la Statistique e tat que disciplie scietifique, à otre avis, serait d explorer les «propriétés fréquetielles» d u jeu de doées. Par «propriétés fréquetielles», o compred les propriétés qui restet ivariates par toute trasformatio des doées (comme, par exemple, la permutatio) qui e modifie pas la fréquece des résultats. Le but de ce chapitre est d itroduire les statistiques pricipales et de doer u aperçu des outils graphiques les plus utilisés. 1.1 Répartitio d ue série umérique uidimesioelle Supposos que les doées qu o a à otre dispositio représetet valeurs réelles otées x 1,..., x costituat les résultats d ue certaie expériece répétée fois. Des exemples de source de telles doées sot : les sodages, les expérieces scietifiques (physiques, chimiques, médicales,...), les eregistremets historiques (météorologiques, socioécoomiques,...). Das certais cas, ces doées sot volumieuses et difficiles à iterpréter. O a alors besoi de les résumer et de trouver des outils pertiets pour les visualiser. Afi que l aalyse statistique d ue série umérique ait u ses, il faut que les différets élémets de cette série représetet la même quatité mesurée sur des etités différetes. Par exemple, x 1,..., x peuvet être les hauteurs de immeubles choisis au hasard à Paris, ou les températures jouralières moyees à Paris eregistrées au cours de l aée 2009, etc. O dit alors que x 1,..., x sot les valeurs d ue variable (statistique) observées sur idividus.

10 10 Élémets de statistique descriptive Chapitre 1 O va différecier deux types de séries umériques : celles qui représetet ue variable discrète et celles qui représetet ue variable cotiue 1. O dit qu ue variable est discrète, si le ombre de valeurs différetes parmi x 1,..., x est petit devat. Cette défiitio est loi d être rigoureuse, mais cela est e gééral pas très gêat. Das les deux exemples doés au paragraphe précédet, les variables «hauteur d immeuble» et «température jouralière moyee» sot cotiues. Si au lieu de mesurer la hauteur d u immeuble, o comptait le ombre d étages, ce serait ue variable discrète Histogramme Pour les séries umériques représetates ue variable discrète, o défiit l histogramme comme la foctio h : R N qui à chaque x R associe le ombre d élémets das la série x 1,..., x égaux à x. Par exemple, l histogramme de la série umérique (1.1) est tracé das la Figure 1.1 (à gauche). Ue approche alterative cosiste à défiir h(x) comme la proportio des élémets das la série égaux à x. O utilise alors la forme aalytique h(x) = 1 1(x i = x). i=1 Das le cas où la série umérique qu o cherche à aalyser est cotiue, o commece par choisir ue partitio de R e u ombre fii d itervalles : I 0, I 1,..., I k. Ayat fixé la partitio, o défiit l histogramme de la série x 1,..., x comme la foctio h : R R + doée par la formule h(x) = j I j, si x I j, où j est le ombre d élémets de la série qui se trouvet das le jème itervalle I j de la partitio et I j est la logueur de l itervalle I j. Le choix de la partitio est ue questio délicate que l o approfodira pas ici. Das la plupart des cas, o choisit ue partitio uiforme (c est-à-dire, tous les I j sot de même logueur) d u itervalle coteat toutes les valeurs de la série umérique. De plus, o essaye de faire e sorte qu il y ait au mois 5 observatios das chaque itervalle o-vide. Par exemple, l histogramme de la série umérique (1.2) est tracé das la Figure 1.1 (à droite) Foctio de répartitio empirique Ue représetatio alterative des fréqueces des valeurs coteues das ue série umérique est la foctio de répartitio, appelée égalemet histogramme cumulé. Pour u x R, 1. Le terme variable cotiue est pas très bie choisi, mais cela e pose pas de problème majeur.

11 Sectio 1.2 Statistiques d ue série umérique uidimesioelle 11 FIGURE 1.1 Exemples d histogrammes. A gauche : l histogramme de la série discrète (1.1). A droite : l histogramme de la série (1.2). FIGURE 1.2 Foctio de répartitio empirique (FDRE). A gauche : la FDRE de la série discrète (1.1). A droite : la FDRE de la série (1.2). O voit bie que c est ue foctio e escalier croissate, qui vaut 0 sur l itervalle ], mi i x i [ et qui vaut 1 sur l itervalle ] max i x i, + [. la valeur e x de la foctio de répartitio d ue série umérique x 1,..., x est la proportio des élémets de la série iférieurs ou égaux à x, c est-à-dire : ˆF (x) = 1 1(x i x). i=1 L avatage de la foctio de répartitio, comparé à l histogramme, est que sa défiitio est idetique das le cas d ue variable discrète et das le cas d ue variable cotiue. 1.2 Statistiques d ue série umérique uidimesioelle O appelle ue statistique toute foctio qui associe aux doées x 1,..., x u vecteur S(x 1,..., x ) R p. O utilise les statistiques pour résumer les doées Statistiques de tedace cetrale et de dispersio Les trois statistiques de tedace cetrale les plus utilisées sot la moyee, la médiae et le mode. O les appelle égalemet les statistiques de positio.

12 12 Élémets de statistique descriptive Chapitre 1 La moyee, otée x, est défiie par : x = 1 x i. i=1 La médiae, otée Med x, est u ombre réel tel qu au mois la moitié des doées sot Med x et au mois la moitié des doées sot Med x. Le mode, oté Mode x, est la valeur la plus fréquete à l itérieur de l esemble des doées. Cotrairemet à la moyee, la médiae et le mode e sot pas toujours uiques. Les trois statistiques de dispersio les plus utilisées sot la variace, l écart-type et l écart iterquartile. La variace, otée v x, est la valeur moyee des carrés des écarts etre les doées et la moyee : v x = 1 i=1 (x i x) 2. L écart-type, otée s x, est la racie carré de la variace : s x = v x. L écart iterquartile est la différece etre le troisième et le premier quartile : Q 3 Q 1, où le premier quartile Q 1 (respectivemet, le troisième quartile Q 3 ) est la médiae des doées < Med x (resp. > Med x ) Statistiques d ordre et quatiles Etat doé ue série de doées uidimesioelles x 1,..., x, o s itéresse souvet à la plus petite valeur mi i x i ou à la plus grade valeur max i x i prise par les x i. E statistique, o utilise les otatios x (1) = mi 1 i x i, x () = max 1 i x i, et o les appelle première et derière statistiques d ordre. Plus gééralemet, o défiit la statistique d ordre de rag k, otée x (k), comme la k ème plus petite valeur parmi x 1,..., x. Plus précisémet, soit (i 1,..., i ) ue permutatio (il peut y e avoir plusieurs) des idices (1,..., ) qui classe les doées das l ordre croissat : x i1 x i2... x i. O appelle alors statistique d ordre k la valeur x (k) = x ik. Pour toute valeur α [0, 1], o appelle quatile d ordre α, oté q x α, de la série x 1,..., x, la statistique d ordre x (m) avec m = [α]. E utilisat la otio de quatile, o peut redéfiir les quartiles et la médiae comme suit : Q 1 = q x 0.25, Med x = q x 0.5, Q 3 = q x E pratique, ces défiitios de quartiles et médiae coduiset vers des résultats qui diffèret légèremet de ceux obteus par la première défiitio, mais gééralemet la différece est pas importate et décroît lorsque la taille de la série augmete.

13 Sectio 1.2 Statistiques d ue série umérique uidimesioelle Statistiques de forme Les deux statistiques de forme les plus utilisées sot le coefficiet d asymétrie et le coefficiet d aplatissemet. Le coefficiet d asymétrie (skewess), otée α x, et le coefficiet d aplatissemet (kurtosis), otée β x, sot défiis par : α x = 1 s 3 x i=1 (x i x) 3, β x = s 4 x i=1 (x i x) 4. O peut facilemet vérifier que le coefficiet d asymétrie de toute série umérique symé- FIGURE 1.3 Exemples de répartitios asymétriques : le coefficiet d asymétrie est positive pour la distributio à gauche et égative pour celle de droite. trique est ul. (O dit qu ue série umérique est symétrique par rapport à u ombre réel mu, si pour tout a > 0 la fréquece de la valeur µ + a das la série est égale à celle de µ a. O peut égalemet vérifier que le coefficiet d aplatissemet ted vers zéro lorsque si la série umérique représete des réalisatios idépedates de la loi gaussiee N (0, 1) Box plots (Boîtes à moustaches) U résumé simple et pratique de la répartitio d ue série x 1,..., x est doé par le quituplé (A, Q 1, Med x, Q 3, B), où A et B représetet les limites iférieure et supérieure de l itervalle e dehors duquel les doées sot cosidérées comme aberrates (o les appelle aussi atypiques ou des outliers). Q 1 et Q 3 sot respectivemet le premier et le troisième quartile. Med x est la médiae de l échatillo. Ce quituplé est utilisé pour costruire le diagramme e boîte ou à moustaches que ous appelleros désormais boxplot. La forme géérale d u boxplot est motrée das la Figure 1.4. Les valeurs A et B sot détermiées par les formules { } A = mi x i : x i Q 1 1.5(Q 3 Q 1 ), { } B = max x i : x i Q (Q 3 Q 1 ). Si la série umérique a ue répartitio ormale (Gaussiee), la probabilité qu ue valeur de la série se trouve e dehors de l itervalle [A, B] est de 0.7%.

14 14 Élémets de statistique descriptive Chapitre 1 FIGURE 1.4 La forme typique d ue boîte à moustaches (ou boxplot), le rectagle bleu état la boîte et les segmets [A, Q 1 ] et [Q 3, B] état les moustaches. Pour compléter le boxplot, o fait apparaître les valeurs aberrates. Toutes les valeurs qui se trouvet e dehors de l itervalle [A, B] sot désigées par u symbole (souvet par ue étoile). Das l exemple de la Fig. 1.4, il y a pas de valeur aberrate. Pour iterpréter u boxplot, il faut oter que la moitié des valeurs de la série se trouvet etre Q 1 et Q 3, c est-à-dire das la boîte du boxplot, la moitié des valeurs de la série se trouvet à gauche de la médiae, s il y a pas de valeurs aberrates, toutes les valeurs de la série se trouvet etre A et B. Les boxplots sot pratiques pour comparer deux séries statistiques. 1.3 Statistiques et représetatios graphiques de deux séries umériques Cosidéros maiteat le cas de deux séries umériques x 1,..., x et y 1,..., y correspodat aux valeurs de deux variables prélevées sur le même idividu. Par exemple, x i et y i peuvet costituer la taille et le poids d ue persoe, la température moyee et le iveau de pollutio à Paris u jour doé, Covariace et corrélatio La statistique la plus utilisée das le cotexte de deux séries umériques est la corrélatio. Pour la défiir, la otio de covariace doit être itroduite. O appelle covariace des séries umériques x 1,..., x et y 1,..., y la valeur s xy = 1 i=1 (x i x)(y i ȳ), où x et ȳ sot respectivemet la moyee des x i et celle des y i. O appelle coefficiet corrélatio ou coefficiet corrélatio liéaire des séries umériques x 1,..., x et y 1,..., y la valeur ρ xy = s xy s x s y, où s x et s y sot respectivemet l écart-type des x i et celui des y i. Par covetio, o pose ρ xy = 0 si au mois l u des deux écart-types s x, s y est ul. Propositio 1.1. Le coefficiet de corrélatio est toujours etre 1 et +1 : 1 ρ xy 1.

15 Sectio 1.3 Statistiques et représetatios graphiques de deux séries umériques 15 De plus, ρ xy = 1 si et seulemet si les séries x 1,..., x et y 1,..., y sot liées par ue relatio affie, c est-à-dire x i = ay i + b pour tout i = 1,...,. Démostratio. E utilisat l iégalité de Cauchy-Schwarz, o vérifie que s xy 1 (x i x)(y i ȳ) 1 ( i=1 i=1 (x i x) 2 i=1 (y i ȳ) 2) 1 2 = s x s y. Cela implique que le coefficiet de corrélatio ρ xy = s xy /(s x s y ) est toujours etre 1 et +1. De plus, l iégalité de Cauchy-Schwarz est ue égalité si et seulemet si x i x = a(y i ȳ), ce qui etraîe la secode assertio de la propositio Nuage de poits et droite de régressio Supposos que l o dispose de deux séries umériques x 1,..., x et y 1,..., y représetat les valeurs de deux variables prélevées sur idividus. Il est aturel et pratique de représeter ces doées sous forme d u uage de poits. Il s agit de représeter par u symbole (losage, das l exemple de la Fig. 4.1) les poits de coordoées (x i, y i ). A titre d exemple, cosidéros les doées présetées das la Table 1.1. Ces doées représetet deux variables dot les valeurs sot eregistrées pour = 38 idividus. Les idividus sot des pays, alors que les deux variables X et Y sot respectivemet le PIB (produit itérieur brut) par habitat et la cosommatio d éergie par habitat. Le uage de poit de ces doées est affiché das la partie haute de la Figure 4.1. Das ce cotexte, l idetité des idividus représete u itérêt (cela est pas toujours le cas). Il est alors pratique de marquer à côté de chaque poit du uage ue chaîe de caractère permettat l idetificatio de l idividu représeté par le poit. C est ce qui est fait das la partie basse de la Fig Cosommatio d éergie Cosommatio d éergie ArSa Kow Ca Aus 4 Rus CorS Alm Fr R UJap Sui Isr Esp It AfS Por Gr 2 Ir Ve Arg Nig Egy Ch Alg BréTur Vie Bé Id Par Mar Col 0 Sé Phi FIGURE 1.5 Le uage de poits représetat les doées de la Table 1.1. E haut : le uage simple. E bas : le uage aoté PIB E U Suè Nor Lu x 10 4

16 16 Élémets de statistique descriptive Chapitre 1 Pour redre le uage de poit plus lisible, o a souvet recours à ue trasformatio d ue ou des deux variables. Das l exemple de la Table 1.1, o obtiet u uage de poit plus iterprétable (voir la Fig. 4.3) e preat le logarithme des deux variables. log(cosommatio d éergie) Nig Vie Bé Id Sé Egy Par Phi Ch Mar Ir Col Alg Bré Arg Rus Ve Tur AfS log(pib) ArSa Kow Ca E U Aus Suè Nor Fr CorS Alm Jap Esp Sui Isr It R U Por Gr FIGURE 1.6 Le uage de poits représetat les logarithmes des doées de la Table 1.1. Lu Afi d obteir ue droite approximat le uage de poits, o calcule la droite de régressio de Y sur X, doée par l équatio y = ax + b où a = s xy s 2, b = ȳ a x. (1.3) x Pour les doées de la Table 1.1, la droite de régressio aisi que so équatio sot doées das la Fig O voit das la formule (1.3) que la droite de régressio de Y sur X e coïcide pas, e gééral, avec la droite de régressio de X sur Y. Si l o ote M i le poit qui a pour coordoées (x i, y i ) et par d i la distace etre M i et le poit M i = (x i, ax i + b), alors la droite de régressio est la droite pour laquelle la somme des d i au carré est miimale. C est la raiso pour laquelle o dit que la droite de régressio est obteue par la méthode des moidres carrés. O reparlera de cette propriété das u cadre plus gééral plus loi das ce documet. Cosommatio d éergie y = *x FIGURE 1.7 Le uage de poits représetat les doées de la Table 1.1 superposé de la droite de régressio. PIB d i M i x QQ-plot (graphiques quatile-quatile) U QQ-plot permet de voir rapidemet l adéquatio d ue série umérique à ue distributio, ou comparer les répartitios de deux séries umériques. 1er cas : Lorsque l o s itéresse à l adéquatio à ue distributio, l axe des ordoées porte les quatiles q j de la distributio observée, tadis que l axe des abscisses porte les quatiles q j correspodats de la loi théorique.

17 Sectio 1.3 Statistiques et représetatios graphiques de deux séries umériques 17 2ème cas : Lorsque l o s itéresse à la comparaiso de deux distributios, l axe des ordoées porte les quatiles q x j de la série x 1,..., x, tadis que l axe des abscisses porte les quatiles q y j de la série y 1,..., y. Le uage des poits (q j, q j) (respectivemet (q y j, qx j )) s alige sur la première bissectrice lorsque la distributio théorique proposée est ue boe représetatio des observatios (resp., lorsque les répartitios des x i et des y i sot égales). Si le uage des poits (q j, q j) s alige sur ue droite, alors il existe ue trasformatio affie des observatios telle que la distributio théorique proposée est ue boe représetatio des observatios trasformées. Quatiles of Iput Sample 8 x Y Quatiles Stadard Normal Quatiles X Quatiles x 10 4 FIGURE 1.8 QQ-plots pour les doées de la Table 1.1. Le graphe de gauche idique que la répartitio du PIB est sigificativemet différete d ue loi ormale. Le graphe de droite motre que les répartitios du PIB et de la cosommatio d éergie e sot pas liées par ue trasformatio affie. Exercice 1.1. Le tableau suivat présete les doées du PIB par habitat pour 15 pays dot la majeure partie se trouve e Asie. Ces doées ot été obteues sur le site http: //www.statistiques-modiales.com/. Le boxplot de ces doées a la forme suivate : 1. Selo ce diagramme, quelle est la valeur médiae du PIB/habitat e Asie? 2. Y a-t-il des doées atypiques? 3. La répartitio du PIB/habitat est-elle symétrique? Commet s iterprète cette asymétrie? 4. Répodre à la questio 3 e utilisat l iformatio que la moyee des 15 observatios qu o dispose est de Pays PIB / habitat (e $ US, 2004) Afghaista 174 Arabie Saoudite 9285 Arméie 1034 Chie 1258 Corée du Sud Ide 631 Ira 2350 Israël Japo Koweït Pakista 81 Philippies 948 Russie 4071 Turquie 4296 Vietam 520

18 18 Élémets de statistique descriptive Chapitre Résumé du Chapitre 1 Série umérique : Variable discrète : Variable cotiue : Histogramme : variable discrète : variable cotiue : Foctio de répartitio empirique : Statistiques de tedace cetrale : moyee : médiae : mode : Statistiques de dispersio : variace : écart-type : écart iterquartile : Statistiques d ordre : Quatiles : Boxplots : Covariace : Corrélatio : Nuage de poits : Droite de régressio : QQ-plot :

19 Sectio 1.4 Résumé du Chapitre 1 19 Pays PIB par habitat Cosommatio d éergie par habitat (e $ US, e 2004) (e Toes d équivalet pétrole, e 2002) Afrique du sud Algérie Béi Egypte Maroc Nigeria Séégal Allemage Espage Frace Grèce Italie Luxembourg Norvège Portugal Royaume-Ui Suède Suisse Arabie Saoudite Chie Corée du Sud Ide Ira Israël Japo Koweït Philippies Russie Turquie Vietam Argetie Brésil Caada Colombie Etats-Uis Paraguay Veezuela Australie TABLE 1.1 Ces doées sot obteues du site

20

21 2 Aalyse des doées multivariées 2.1 Itroductio Objectif Das toute étude appliquée, la démarche première du statisticie est de décrire et d explorer les doées dot il dispose, avat d e tirer de quelcoques lois ou modèles prédictifs. Or la statistique traite gééralemet du grad ombre et, les outils iformatiques aidat, les bases de doées devieet de plus e plus volumieuses, tat e largeur (quatité d iformatios recueillies) qu e hauteur (ombre d uités sur lesquelles ces iformatios sot recueillies). Cette phase d exploratio descriptive des doées est e coséquece pas aisée. Si le statisticie est déjà outillé pour aalyser la distributio d ue variable ou la relatio etre deux variables, ces outils basiques e permettet pas d appréheder ce vaste esemble iformatif das sa globalité. Il e s agit aturellemet pas d e doer alors ue visio exhaustive, mais bie de répodre à l ue des pricipales missios du statisticie : extraire d ue masse de doées ce qu il faut e reteir, e la sythétisat ou e simplifiat les structures. Les techiques d aalyse de doées répodet à ce besoi. O présetera ici l Aalyse e Composates Pricipales (ACP) qui s appuie sur la réductio de rag découlat des travaux de décompositio matricielle d Eckart et Youg (1936). Le but pricipal de l ACP est de détermier les pricipales relatios liéaires das u esemble de variables umériques. Il s agit bie de réduire u esemble complexe et de grade dimesio à ses pricipaux élémets, de faço à e mieux compredre les structures sous-jacetes Notatios O dispose de p variables X 1,..., X j,..., X p, que l o observe sur uités statistiques - ou idividus : o ote x j i la valeur de la variable Xj observée sur le i-ème idividu. Cet esemble de doées peut doc être mis sous la forme d u tableau X à liges et p coloes, et de terme courat x j i.

22 22 Aalyse des doées multivariées Chapitre 2 Das la suite - et c est très gééralemet le cas e aalyse des doées, cotrairemet aux autres domaies de la statistique - o cofodra la otio de variable avec le vecteur de dimesio qui la défiit sur otre échatillo, c est-à-dire X j = (x j 1,..., xj ). De même, chaque idividu sera assimilé au vecteur de dimesio p qui compile ses valeurs sur les variables : X i = (x 1 i,..., xp i ). x xp 1 X =..... x 1... x p } {{ } p variables idividu # 1, oté X 1 idividu #, oté X. 2.2 Exemple : billets suisses Nous choisiros ici u exemple décrivat 6 mesures, otée X 1,..., X 6, relevées sur 200 billets de 1000 Fracs Suisses. La Figure 2.1 présete la ature des mesures effectuées alors que l esemble des doées recueillies est doé das les Tables 2.1 et 2.2. Sur les 200 billets examiés, il y a eu 100 billets authetiques et 100 billets cotrefaits. Cet exemple comporte volotairemet u ombre réduit de variables, pour e faciliter la compréhesio. Pour compredre ce qu apportet les méthodes d aalyse de doées, meos au préalable ue brève aalyse descriptive de ces tableaux du poit de vue des variables. FIGURE 2.1 Cette figure motre ue coupure de 1000 Fracs Suisses (acies) avec les 6 mesures effectuées. Etude descriptive des variables Classiquemet, o peut se livrer à ue aalyse de la distributio de chaque variable. Cela peut se faire, par exemple, e visualisat les boxplots de chacue des 6 variables X i. La Fig. 2.2 motre ces boxplots, qui ous reseiget sur les caractéristiques idividuelles des variables X i. O y voit, etre autre, qu il y a 2 billets dot la logueur est aormalemet

23 Sectio 2.3 La théorie de l Aalyse e Composates Pricipales 23 grade et u billet dot la logueur est aormalemet petite. O remarque égalemet, e comparat les boxplots de X 2 et X 3, que la largeur à gauche est typiquemet légèremet plus grade que la largeur à droite. X 1 X 2 X 3 X 4 X 5 X 6 FIGURE 2.2 Les boxplots des doées de billets suisses Cette figure e dit cepedat rie sur la relatio etre les variables. Pour appréheder les distributios bivariées, des outils d aalyse vus à la fi du chapitre précédet peuvet être appliqués à tous les paires de variables. Exemples de tels outils sot la matrice de «scatter plots» (voir Fig. 2.3), ou la matrice des coefficiets de corrélatio liéaire. Ce derier représete u itérêt surtout lorsque les uages sot aplatis ou les répartitios bidimesioelles sot approximativemet gaussiees. Voici le tableau des corrélatios : X 1 X 2 X 3 X 4 X 5 X 6 X X X X X X Ce tableau motre que les variables X 2 et X 3 sot les plus corrélées, ce qui est tout à fait logique et cela se voyait déjà sur le scatter plot de la Fig O voit doc qu o dispose des outils qui ous permettet d aalyser les variables idividuellemet ou deux par deux. Il ous maque cepedat des outils de sythèse, qui permettraiet de dégager la structure globale de ces doées. Nous allos e développer u, parmi les plus utilisés. 2.3 La théorie de l Aalyse e Composates Pricipales Problématique O se place ici das la situatio où les p variables d itérêt X 1,..., X j,..., X p, sot umériques. Pour appréheder l iformatio coteue das le tableau umérique X, o peut teter de visualiser le uage de poits représetat les idividus das R p. Mais très souvet, le ombre de variables p peut atteidre quelques dizaies. Quoiqu il e soit, même

24 24 Aalyse des doées multivariées Chapitre 2 FIGURE 2.3 Scatter plots des différetes variables avec des outils de visualisatio performats, X e peut être appréhedé de faço simple das sa globalité, i les relatios etre les variables. La problématique est alors double : Commet visualiser la forme du uage des idividus? Commet sythétiser les relatios etre variables? L ACP permet justemet de répodre à ce type de besoi Choix de la métrique La méthode d Aalyse e Composates Pricipales requiert u espace vectoriel mui d u produit scalaire. Das ce chapitre, ous cosidéreros l espace euclidie R p mui de so produit scalaire caoique. La métrique associée est doée par X i X i 2 = p ( j x i ) 2. xj i j=1 Défiitio 2.1. Soiet x j = 1 i=1 xj i et s 2 j = 1 i=1 ( x j i xj) 2 la moyee et la variace de la variable d itérêt X j. La représetatio cetrée de l idividu i est doée par x j 1,..., xj p, où pour tout 1 j p, x j i = xj i xj.

25 Sectio 2.3 La théorie de l Aalyse e Composates Pricipales 25 La représetatio cetrée-réduite de l idividu i est doée par x j 1,..., xj p, où pour tout 1 j p, x j i = xj i xj s j. Ue ACP ormée est ue ACP meée sur la représetatio cetrée-réduite. L ACP opère toujours sur les représetatios cetrées. Pour simplifier la présetatio, o cosidérera das la suite que les variables ot été déjà cetrées, das le ses où i=1 X i = 0. Les différetes variables X j pouvat être hétérogèes, et correspodre à des échelles de mesure disparates, la représetatio cetrée-réduite est utilisée pour éviter que le choix de ces uités ait ue ifluece das le calcul des distaces. Cette représetatio red les variables cetrées et de variace Moidre déformatio du uage Pour visualiser le uage des idividus (et doc e coaître la forme, pour savoir commet sot liées os p variables), il est écessaire de réduire la dimesio de l espace qui le porte. L ACP réduit cette dimesio par projectio orthogoale sur des sous-espaces affies. Défiitio 2.2. Soit X 1,..., X u uage de poits dot le barycetre coïcide avec l origie (c est le cas pour des variables réduites). L iertie du uage X 1,..., X est doée par I = 1 X i 2. i=1 L iertie J H du uage autour du sous-espace liéaire H est doée par J H = 1 où P H X i le projeté orthogoal de X i sur H. X i P H X i 2, i=1 L iertie J H autour de H mesure la déformatio du uage lorsque celui-ci est projeté orthogoalemet sur H. Pour que la représetatio des doées par leur projectio sur u sous-espace affie ait u ses, il faut qu elle modifie peu la forme du uage de poits, doc qu elle miimise l iertie J H. Remarquos que d après le théorème de Pythagore, o a I = 1 ( Xi P H X i 2 + P H X i 2) déf = J H + I H. i=1 Par coséquet, la moidre déformatio d u uage de poits par projectio orthogoale sur u sous-espace liéaire est obteue, de maière équivalete, par miimisatio de l iertie par rapport au sous-espace liéaire ou par maximisatio de l iertie du uage projeté. Das le but de pouvoir visualiser le uage de poits des idividus, o aimerait trouver das R p u sous-espace liéaire de dimesio 2 (c est-à-dire, u pla) qui approche bie les doées. O est doc tout aturellemet itéressé par la résolutio du problème H 2 = arg mi J H = arg max I H H:dim(H)=2 H:dim(H)=2 } {{ } } {{ } miimisatio de la déformatio du uage maximisatio de l iértie du uage projeté

26 26 Aalyse des doées multivariées Chapitre 2 D ue faço plus géérale, o s itéresse aux sous-espaces liéaires H k, pour k {1,..., p 1}, défiis par H k = arg mi J H = arg max I H. (2.1) H:dim(H)=k H:dim(H)=k Par exemple, si le uage des idividus das R p est pas bie approximable par u pla, il pourrait être plus itéressat de cosidérer ue visualisatio 3 dimesioelle e projetat les doées sur H 3. Das certais cas, cela peut cosidérablemet augmeter l iertie du uage projeté. Motros maiteat que la recherche d u sous-espace affie de dimesio fixée maximisat l iertie du uage projeté peut être meée de maière séquetielle et que l iertie se décompose e la somme des ierties moyees du uage projeté sur des droites orthogoales, dites directios pricipales de l ACP. Soit Γ la matrice de variace-covariace associée au uage de poits (das la représetatio cetrée, les moyees X j sot ulles) : Γ = 1 (X)t X, autremet dit Γ j,j = i=1 xj i xj i est la covariace etre les variables d itérêt X j et X j. Notos au passage que lorsqu o cosidère des variables réduites, la matrice Γ est égalemet la matrice des corrélatios des variables X j. Théorème 2.1. Les assertios suivates caractériset la résolutio séquetielle du problème de réductio de dimesio par moidre déformatio. Soit u k u vecteur propre uitaire de Γ associée à la k-ième plus grade valeur propre. Alors H k = Vect(u 1,..., u k ) est l espace vectoriel egedré par les k premiers vecteurs propres de Γ. La k-ième plus grade valeur propre λ k de Γ vaut l iertie du uage projeté sur le k-ième axe propre u k : I uk = λ k. l iertie sur H k est la somme des ierties moyees sur les k axes propres pricipaux : I Hk = k λ l. l=1 Démostratio. Cherchos d abord le vecteur uitaire, i.e. de orme 1, u maximisat l iertie du uage projeté sur u. Cosidéros la projectio du uage sur la directio doée par le vecteur uitaire u. Le projeté X i de l idividu i s écrit X i = u, X i u et l iertie du uage projeté (ous ous plaços toujours das le cadre de la représetatio réduite) est I u = 1 i=1 u, X i u 2 = 1 i=1 u, X i 2 = 1 u t X i (X i ) t u = u t Γu. i=1 La matrice Γ est symétrique, semi-défiie positive ; elle est diagoalisable, a toutes ses valeurs propres réelles, et il existe ue base orthoormale de vecteurs propres de R p. Notos λ 1... λ p les valeurs propres triées par ordre décroissat, et u 1,..., u p les vecteurs propres uitaires associés. Alors I u = p p 2 2 λ j u, uj λ 1 u, uj = λ 1 u 2 = λ 1. j=1 j=1

27 Sectio 2.4 Représetatios graphiques et iterprétatio 27 Il suffit alors de choisir u = u 1 pour maximiser I u. Par coséquet, la meilleure droite de projectio du uage est celle de vecteur directeur u 1, associé à la plus grade valeur propre λ 1 de la matrice Γ. O admet sas démostratio que pour tout etier k < p, l espace H k+1 est obteu à partir de l espace H k par H k+1 = Vect(H k, v k+1 ) où v k+1 est u vecteur orthogoal à H k. Pour les H k suivats, o procède par récurrece. Asi, pour H 2 o cherche le vecteur directeur u 2 orthogoal à u 1 portat l iertie maximale. Pour tout vecteur u orthogoal à u 1, o a p 2 I u = λ j u, uj λ 2. j=2 Doc le maximum est atteit pour u = u 2, et aisi de suite. Au passage, o a égalemet prouvé la deuxième assertio du théorème : I uk = λ k. La troisième assertio découle alors du théorème de Pythagore. L iertie I du uage de poits est doc égale à la trace de matrice de variace-covariace, ce qui implique I = p, e ACP ormée. (E ACP o ormée, elle vaut la somme des variaces : I = p j=1 s2 j = p l=1 λ l.) O défiit la part d iertie expliquée sur le l-ième axe propre : τ l = λ l /I. L iertie portée par u sous-espace de dimesio k est doc au mieux k l=1 τ l pour cet de l iertie totale I. 2.4 Représetatios graphiques et iterprétatio Sur otre exemple cocerat les billets suisses, o peut chercher à visualiser les proximités (e termes de distace ormée sur les 6 caractéristiques) etre billets sur le premier pla factoriel (u 1 horizotalemet, u 2 verticalemet) (voir Fig.2.4 à gauche). Das cet exemple, FIGURE 2.4 A gauche : projectio des idividus sur le premier pla factoriel. A droite : la même projectio avec des symboles différets pour les billets authetiques et les billets cotrefaits. Les triagles correspodet aux billets cotrefaits, alors que les cercles représetet les billets authetiques. l iertie I = se décompose sur les premiers axes aisi : I 1 = 3 (doc τ 1 = 66.7%), I 2 = 0, 93 (doc τ 2 = 20.8%). O visualise doc de faço simplifiée, mais optimale (τ 1 2 = I u1 u 2 /I =87.5% de l iertie représetée sur ce pla), les proximités etre les billets. Les vecteurs directeurs de ces deux premiers axes s exprimet aisi, das l aciee base :

28 28 Aalyse des doées multivariées Chapitre 2 Vecteur propre X 1 X 2 X 3 X 4 X 5 X 6 u u Reste à iterpréter véritablemet ces axes, et à compredre quels sot les pricipales relatios liéaires etre les caractéristiques techiques Pricipales relatios etre variables Les composates pricipales La diagoalisatio vue précédemmet permet de défiir p ouvelles variables 1 appelées composates pricipales : p C α = uαx j j = Xu α R, j=1 ou ecore Ci α = X i, u α. Elles sot doc combiaisos liéaires des variables d itérêt X j iitiales. Elles sot cetrées puisque les X j le sot, et o a : ( Cov C α, C β) = p j=1 p j =1 u j αu j β Cov (X j, X j ) = u t αγu β = λ β u t αu β. Doc Cov ( { C α, C β) 0 si α = β, =, ce qui veut dire que les différetes composates pricipales sot λ α si α = β, o-corrélées. O peut calculer la covariace etre les composates pricipales et les variables iitiales : ( Cov C α, X j) = p ( uαcov j X j, X j) = j =1 p uα j Γ j,j = λ α uα. j j =1 Il s esuit que ( Corr C α, X j) = Cov ( C α, X j) Var(C α )Var(X j ) = λ α u j α/s j. Doc p j=1 s2 j Corr2 ( C α, X j) = λ α. Pour visualiser les corrélatios etre les composates pricipales et les X j, o établit des représetatios plaes où, e preat par exemple ( C 1, C 2) comme base orthogoale de ce pla, chaque X j est figuré par u vecteur de coordoées ( Corr ( C 1, X j), Corr ( C 2, X j)), à l itérieur du cercle uité 2, dit des corrélatios. 1. De même que précédemmet, o cofodra sous le vocable variable la forme liéaire, et sa réalisatio sur os idividus, soit ecore le vecteur de R associé. 2. Ce vecteur est das le cercle uité car, das R mui du produit scalaire x, y = i=1 x iy i, c est le vecteur projeté orthogoal du vecteur uitaire X j /s j sur le pla egedré par les vecteurs orthoormés C 1 / Var(C 1 ) et C 2 / Var(C 2 ).

29 Sectio 2.4 Représetatios graphiques et iterprétatio 29 Retour à l exemple O voit, das cet exemple (voir la partie droite de la Fig. 2.5), que les variables X 1, X 2 et X 3 sot mal expliquées par les deux premiers axes pricipaux, car les poits représetat ces variables sot éloigés du cercle. E revache, les 3 autres poits sot quasimet sur le cercle, ce qui veut dire que les variables X 4, X 5, X 6 sot très bie expliquées par C 1 et C 2. De plus, comme l agle formé par les vecteurs OX 4 et OX 5 est proche de 90, les variables X 4 et X 5 sot très faiblemet corrélées Nombre d axes (ou de composates) à aalyser Combie d axes aalyser? Il existe plusieurs critères de décisio. Le premier (Kaiser) veut qu o e s itéresse e gééral qu aux axes dot les valeurs propres sot supérieures à la moyee (qui vaut 1 e ACP ormée). U secod (dit du coude, ou de Cattell) utilise le résultat suivat : lorsque des variables sot peu corrélées, les valeurs propres de la matrice d iertie décroisset régulièremet - et l ACP présete alors peu d itérêt. A l iverse, lorsqu il existe ue structure sur les doées, o observe des ruptures das la décroissace des valeurs propres (cf. Fig.2.5). O cherchera doc à e reteir que les axes correspodat aux valeurs qui précèdet la décroissace régulière. Aalytiquemet, cela reviet à chercher u poit d iflexio das la décroissace des valeurs propres, et de e pas aller au-delà das l aalyse. Aisi, das otre exemple, o e s itéressera qu aux 2 premiers axes. FIGURE 2.5 Représetatio des valeurs propres et cercle des corrélatios pour le premier pla factoriel Aides à l iterprétatio Si, pour les variables umériques, la visualisatio des vecteurs à l itérieur du cercle des corrélatios doe toute l iformatio écessaire à l aalyse, il peut être utile de défiir, pour chaque idividu, les aides suivates : La cotributio à l iertie du uage, qui croît avec l excetricité de l idividu : CTR (X i ) = X i 2 I

30 30 Aalyse des doées multivariées Chapitre 2 La cotributio à l iertie portée par u axe (O, u α ) : CTR α (X i ) = ( C α i ) 2 λ α Par costructio : i=1 CTR (X i) = 1, et i=1 CTR α (X i ) = 1. La valeur de ces cotributios déped doc fortemet du ombre d idividus : ue cotributio de 5% sera cosidérée comme forte si l o maipule les doées de milliers d idividus, ettemet mois si l o e a qu ue vigtaie (de faço géérale, o cosidèrera que l idividu i a ue cotributio importate si elle dépasse so poids 1/). La qualité de projectio sur l axe (O, u α ) est doée par le carré du cosius de l agle : CO2 α (X i ) = ( C α i ) 2 X i 2. Par orthogoalité des u α, la qualité de projectio d u idividu sur u sous-espace pricipal est additive : CO2 α+β (X i ) = CO2 α (X i ) + CO2 β (X i ). D autre part, o remarque que p α=1 CO2 α (X i ) = 1 ; de même que précédemmet, cette qualité déped fortemet du ombre iitial de variables : o pourra être exigeat si l o e maipule qu ue poigée, o le sera mois s il y e a davatage. Pour u axe doé, l exame parallèle des CTR et des CO2 des idividus qui s y projettet peut doer lieu à quatre cas de figure, dot u pose problème (CO2 faible-ctr forte), qui apparaît lorsqu u idividu a u poids trop fort par rapport aux autres : CTR faible CTR forte CO2 faible Elémet peu cotributif Elémet très cotributif quasi idépedat de l axe mais peu illustratif de l axe CO2 forte Elémet peu cotributif Elémet particulièremet mais bie illustratif de l axe caractéristique de l axe 2.5 Résumé du Chapitre 2 Tableau de doées multivariées : variables : idividus : Matrice des corrélatios : Matrice de scatter-plots : Représetatio cetrée :

31 Sectio 2.5 Résumé du Chapitre 2 31 Représetatio cetrée-réduite : Aalyse e Composates Pricipales (ACP) : ACP ormée : Iertie du uage : Iertie autour d u sous-espace : Composates pricipales : Représetatio graphiques dérivées de l ACP : Projectio des idividus : Scree-graph : Projectio des variables :

32 32 Aalyse des doées multivariées Chapitre 2 X 1 X 2 X 3 X 4 X 5 X X 1 X 2 X 3 X 4 X 5 X TABLE 2.1 Les doées de billets suisses authetiques. Le tableau compred 100 liges (idividus) et 6 coloes (variables). Ces variables sot décrites das la Fig Toutes les valeurs sot e mm.

33 Sectio 2.5 Résumé du Chapitre 2 33 X 1 X 2 X 3 X 4 X 5 X X 1 X 2 X 3 X 4 X 5 X TABLE 2.2 Les doées de billets suisses cotrefaits. Le tableau compred 100 liges (idividus) et 6 coloes (variables). Ces variables sot décrites das la Fig Toutes les valeurs sot e mm.

34

35 3 Rappel des bases de la statistique paramétrique Das ce chapitre, ous survolos rapidemet les bases du calcul des probabilités et de la statistique. Toutes les otios et tous les résultats présetés ci-dessous costituet les prérequis pour ce cours de «Statistique umérique et aalyse des doées». Pour ue présetatio plus détaillée des sujets traités das ce chapitre voir le polycopié du cours de 1ère aée Itroductio Les problèmes statistiques que ous allos étudier das le cadre de ce module peuvet se résumer de la faço suivate : ous disposos d u jeu de doées qui sot supposées être géérées par u phéomèe aléatoire. (Rappelos que tout phéomèe aléatoire est etièremet caractérisé par sa loi de probabilité.) De plus, ous cosidéros qu u travail de modélisatio a été effectué à l issue duquel la loi de probabilité régissat les doées a été détermiée à u paramètre icou près. Das ce cotexte, les trois types de problèmes que ous allos étudier sot : estimatio : trouver ue valeur approchée du paramètre icou, régio de cofiace : détermier ue régio (aussi petite que possible) qui cotiet le paramètre icou avec ue probabilité prescrite (gééralemet 95%), test d hypothèse : pour u esemble Θ 0 de valeurs possibles du paramètre icou, décider au vu des doées si oui ou o le paramètre icou appartiet à Θ 0. Afi de faciliter la compréhesio, les différetes otios itroduites das ce chapitre serot illustrées das les deux exemples suivats. Exemple 1. (Qualité de l air) O cherche à évaluer la fréquece des jours où l idice ATMO (mesurat la qualité de l air) à Paris dépasse 2 le iveau 8. Pour avoir ue estimatio simple, o choisit au hasard jours das le passé et o regarde si oui ou o le iveau 8 a été dépassé ces jours-là. O obtiet aisi u échatillo x 1,..., x où chaque x i pred 1. B. Jourdai, Probabilités et statistique, 2. L idice ATMO varie sur ue échelle allat de 1 (très boe) à 10 (exécrable). Lorsque la valeur de cet idice dépasse le iveau 8, la qualité de l air est cosidérée comme mauvaise.

36 36 Rappel des bases de la statistique paramétrique Chapitre 3 deux valeurs : 0 ou 1. Par covetio, la valeur 0 correspod à u jour où le iveau 8 a pas été dépassé. Nous modélisos le dépassemet du iveau 8 par l idice ATMO par ue variable aléatoire X de loi de Beroulli ; Proba(X = 1) = ϑ, Proba(X = 0) = 1 ϑ pour ue valeur ϑ ]0, 1[ qui ous est icoue. Cette valeur représete la fréquece moyee des jours où la qualité de l air a été mauvaise à Paris. Exemple 2. (Vitesse du vet) Afi d étudier la possibilité de l istallatio d ue cetrale éoliee sur u site doé, o cherche à estimer la probabilité de l évéemet «la vitesse du vet sur le site e questio est iférieure à 10km/h». L itérêt à l égard de cet évéemet viet du fait que, lorsque la vitesse du vet est iférieure à 10km/h, ue cetrale éoliee s arrête e raiso des forces de frottemet sec qui s opposet à la rotatio de l hélice. L approche la plus simple cosiste à modéliser la vitesse du vet sur le site e questio à u istat doé par ue variable aléatoire de loi expoetielle. E d autres termes, si X représete la vitesse du vet, o suppose que Proba(X [a, b]) = b a p(ϑ ; x) dx, p(ϑ ; x) = 1 ϑ e x/ϑ 1l [0, [ (x), où ϑ > 0 est u paramètre icou. Si l o admet que cette modélisatio est correcte, o peut calculer la probabilité de l évéemet A = «la vitesse du vet est iférieure à 10km/h» par la formule Proba(A) = ϑ e x/ϑ dx = 1 e 10/ϑ. Par coséquet, ue valeur approchée de ϑ ous permettrait de calculer ue valeur approchée de la probabilité de l évéemet A. Pour pouvoir estimer ϑ, ous mesuros la vitesse du vet à istats suffisammet espacés das le temps, ce qui ous fourit les observatios x 1,..., x. Le but d u statisticie est, etre autre, d utiliser ces observatios pour estimer le paramètre ϑ. 3.2 Modèle statistique Nous commeços par doer la défiitio géérale d u modèle statistique, que ous illustros par la suite das les deux exemples présetés ci-dessus. Défiitio 3.1. O appelle modèle statistique la doée d u espace mesurable (X, F ) et d ue famille de mesures de probabilité P = {P,ϑ, ϑ Θ} défiies sur (X, F ). L espace X, appelé espace d états, est costitué de toutes les valeurs qu aurait pu predre le jeu de doées étudié. La famille P décrit l esemble des lois de probabilité pouvat avoir gééré le jeu de doées étudié. Pour u modèle statistique doé, la problématique géérale de la théorie statistique s éoce de la faço suivate : au vu d ue réalisatio x () X tiré au hasard selo ue loi P,ϑ P, étudier certaies propriétés de P,ϑ. Le plus souvet x () est u vecteur. O cherche doc à caractériser la loi d u vecteur aléatoire X () à partir d ue réalisatio x (). Bie-etedu, si l o autorise la famille P à être ue collectio quelcoque de lois sur (X, F ), la tâche de l extractio de l iformatio fiable sur la loi du vecteur aléatoire X () à partir d ue seule réalisatio est irréalisable. Afi de pouvoir élaborer ue théorie raisoable et utile pour les

37 Sectio 3.3 Estimatio 37 applicatios, o se restreit au cas où la famille P a ue certaie «structure». Exemples de telles structures sot le modèle à observatios i.i.d., le modèle de régressio liéaire, etc. Ce chapitre est etièremet dédié à l étude du modèle à observatios i.i.d. (idépedates et idetiquemet distribuées). Il s agit du cas où x () = (x 1,..., x ) est u vecteur das R dot les coordoées représetet copies idépedates d ue même variable aléatoire X. Cela reviet à postuler que x () est ue réalisatio du vecteur aléatoire X () = (X 1,..., X ) composé de variables aléatoires idépedates distribuées selo la même loi que X. Das ce cas, la loi de X () est etièremet caractérisée par celle de X, car Proba(X 1 A 1,..., X A ) = Proba(X 1 A 1 )... Proba(X A ) = Proba(X A 1 )... Proba(X A ) quels que soiet les itervalles A 1,..., A R. Si P désige la loi de X, o dit alors que X () est u échatillo i.i.d. de loi P. Par coséquet, pour défiir u modèle à observatios i.i.d., il suffit de décrire la famille P = {P ϑ } qui est sesée coteir la loi P de X. Les deux exemples présetés das l itroductio correspodet à des modèles à observatios i.i.d. : das le premier exemple P = {B(ϑ) : ϑ ]0, 1[} où B(ϑ) désige la loi de Beroulli de paramètre ϑ, tadis que das le deuxième exemple P = {E(ϑ 1 ) : ϑ > 0}, où E(λ) désige la loi expoetielle de paramètre λ > 0. E coséquece, das le premier exemple Θ = [0, 1] alors que das le deuxième exemple Θ =]0, [. Tout au log de ce chapitre, o appellera statistique toute foctio de l échatillo X (). 3.3 Estimatio Supposos maiteat qu o dispose d u échatillo i.i.d. X 1,..., X de loi P P = {P ϑ : ϑ Θ}. Cela veut dire que pour u ϑ Θ icou, o a X 1,..., X iid Pϑ. Par la suite, o appellera ϑ la vraie valeur du paramètre. La première questio qu o se pose est celle du calcul d ue valeur approchée de ϑ e utilisat uiquemet l échatillo observé. Défiitio 3.2. Soit X 1,..., X u échatillo i.i.d. de loi P P = {P ϑ : ϑ Θ} avec Θ R p pour u p N. O appelle estimateur de ϑ toute applicatio mesurable ϑ : R R p. Das la statistique théorique, o idetifie l applicatio ϑ au vecteur aléatoire ϑ(x 1,..., X ). U estimateur a pour objectif d approcher la vraie valeur ϑ. Cepedat, la défiitio cidessus e reflète absolumet pas cet objectif. E effet, même si ϑ(x 1,..., X ) est très éloigé de ϑ, ϑ sera appelé u estimateur si peu qu il soit mesurable. Afi de restreidre la classe de tous les estimateurs à ceux qui représetet u itérêt pratique, o spécifie des propriétés qu o aimerait voir satisfaites par u estimateur. Par la suite, pour souliger le fait que l estimateur ϑ déped de (la taille de l échatillo), o utilisera la otatio ϑ. Défiitio 3.3. O dit que l estimateur ϑ est sas biais, si E ϑ [ ϑ ] = ϑ, ϑ Θ,

38 38 Rappel des bases de la statistique paramétrique Chapitre 3 où l expressio E ϑ [ ϑ ] doit être lue comme «espérace du vecteur aléatoire ϑ (X 1,..., X ) sachat iid que X 1,..., X P ϑ». O dit que l estimateur ϑ est coverget (ou cosistat), s il coverge e probabilité vers la vraie valeur, c est-à-dire lim P ϑ ( ϑ ϑ > ε) = 0, ε > 0, ϑ Θ. La propriété de covergece est cetrale e statistique, car elle idique que la valeur estimée de ϑ calculée à l aide de l estimateur ϑ est proche de ϑ si la taille de l échatillo est suffisammet grade. Das beaucoup de situatios, il existe de ombreux estimateurs covergets. O s itéresse alors aux propriétés plus raffiées des estimateurs : la vitesse à laquelle ϑ ted vers ϑ et la loi asymptotique de la différece ϑ ϑ propremet ormalisée. Défiitio 3.4. O dit que l estimateur coverget ϑ est asymptotiquemet de loi P ϑ avec la vitesse γ, où γ > 0, si γ ( ϑ ϑ ) L P ϑ, ϑ Θ, où L désige la covergece e loi. Si P ϑ est la loi gaussiee N (0, σ2 ϑ ), o dit alors que ϑ est asymptotiquemet ormal avec la vitesse γ et la variace limite σ 2 ϑ. Pour démotrer la covergece et la ormalité asymptotique des estimateurs, o utilise le plus souvet les résultats probabilistes présetés das le paragraphe suivat Quelques résultats sur la covergece des variables aléatoires Soit ξ 1, ξ 2,..., ξ,... et ξ des variables aléatoires et soit F ξ (x) = P(ξ x) la foctio de répartitio de ξ, N { }. O distigue les quatre types de covergece (de {ξ } vers ξ ) suivats : 1. covergece e probabilité : pour tout ε > 0, o a lim P( ξ ξ > ε) = 0, 2. covergece presque sûr : P(lim sup ξ ξ = 0) = 1, 3. covergece e moyee quadratique : lim E[(ξ ξ ) 2 ] = 0, 4. covergece e loi : lim F ξ (x) = F ξ (x) pour tout x R tel que F ξ est cotiue e x. Rappelos que les covergeces presque sûr et e moyee quadratique etraîet la covergece e probabilité et cette derière etraîe à so tour la covergece e loi. Notos aussi que la défiitio de la covergece e loi, cotrairemet aux autres types de covergeces précitées, e sous-eted pas que les variables ξ soiet défiies sur le même espace probabilisé. Théorème 3.1 (Loi forte des grads ombres). Soit X 1,..., X des variables aléatoires i.i.d. itégrables : E[ X 1 ] <. Alors, X = 1 où p.s. désige la covergece presque-sûr. p.s. X i E[X 1 ], lorsque, i=1 Théorème 3.2 (Théorème de la limite cetrale). Soit X 1,..., X des variables aléatoires i.i.d. de carré itégrables : E[X 2 1 ] <. Alors, (X E[X 1 ]) L N (0, Var[X 1 ]), lorsque.

39 Sectio 3.3 Estimatio 39 Théorème 3.3 (Méthode delta). Soit X 1,..., X des variables aléatoires i.i.d. de carré itégrables et soit G ue foctio cotiûmet différetiable sur u esemble ouvert A tel que P(X 1 A) = 1. Alors, ( G(X ) G(E[X 1 ]) ) L N (0, σ 2 ), lorsque, avec la variace limite σ 2 = G (E[X 1 ]) 2 Var[X 1 ]. Ces résultats se gééraliset à ue suite de vecteurs aléatoires, auquel cas la variace est remplacée par la matrice de covariace Var[X 1 ] = E[X 1 X1 ] E[X 1]E[X1 ] et la variace limite das la méthode delta est doée par σ 2 = G(E[X 1 ]) Var[X 1 ] G(E[X 1 ]). Théorème 3.4 (Théorème de Slutsky). Soit {ξ } N {η } N deux suites de variables aléatoires défiies sur le même espace probabilisé. Si pour ue costate a R et pour ue variable aléatoire ξ o a L ξ ξ P, et η a alors ξ + η L ξ L + a, et ξ η aξ Estimateur du maximum de vraisemblace Après avoir vu ce que c est u estimateur et quelles sot les propriétés souhaitées d u estimateur, o s itéresse aturellemet à la mise e place d ue procédure géérique permettat la costructio d u estimateur pour ue large classe de modèles. O se focalise ici sur la méthode d estimatio la plus utilisée : le maximum de vraisemblace. De plus, pour éviter le rappel de otios abstraites (absolue cotiuité, théorème de Rado-Nykodim) de la théorie de la mesure, o e doera pas la défiitio de l estimateur du maximum de vraisemblace (EMV) das le cas le plus gééral des modèles domiés, mais seulemet das le cadre des modèles i.i.d. discrets et à desité. Défiitio 3.5. O dira que le modèle à observatios i.i.d. {P ϑ : ϑ Θ} est discret, s il existe u esemble A = {a 1, a 2,...} au plus déombrable tel que P ϑ (A) = 1 pour tout ϑ Θ. E d autres termes, l esemble A cotiet toutes les valeurs possibles prises par les variables de l échatillo. L exemple 1 cosidéré au début de ce chapitre porte sur u modèle discret, car les variables aléatoires costituat l échatillo sot des variables de Beroulli et, par coséquet, preet leurs valeurs das l esemble fii {0, 1}. O caractérise u modèle discret par les probabilités discrètes p(ϑ; a k ) = Proba(X i = a k ), a k A où X 1,..., X iid Pϑ. (3.1) Défiitio 3.6. O dira que le modèle à observatios i.i.d. {P ϑ : ϑ Θ} est à desité, si pour tout ϑ Θ il existe ue foctio (appelée desité) p(ϑ; ) : R R telle que pour tout a, b R. P ϑ ([a, b]) = Proba(X i [a, b]) = b a p(ϑ; x) dx, où X i P ϑ, (3.2)

40 40 Rappel des bases de la statistique paramétrique Chapitre 3 Défiitio 3.7. Soit P = {P ϑ : ϑ Θ} u modèle i.i.d. discret ou à desité et soit p(ϑ, x) la foctio défiie par (3.1) das le cas discret et par (3.2) das le cas à desité. O appelle foctio de vraisemblace l applicatio p : Θ R R +, p (ϑ; x 1,..., x ) = p(ϑ; x i ). (3.3) i=1 O appelle estimateur du maximum de vraisemblace (EMV), oté ˆϑ MV, le poit du maximum global (s il existe) de l applicatio ϑ p (ϑ, X 1,..., X ). O écrit alors ˆϑ MV L EMV das l exemple 1 = arg max ϑ Θ p (ϑ; X 1,..., X ). Das l exemple 1 portat sur la qualité de l air, o dispose d u échatillo i.i.d. X 1,..., X de loi de Beroulli B(ϑ ) avec ϑ Θ =]0, 1[. Il s agit d u modèle discret avec A = {0, 1} et { ϑ, si x = 1, p(ϑ; x) = 1 ϑ, si x = 0. O vérifie facilemet que cela équivaut à p(ϑ; x) = ϑ x (1 ϑ) 1 x, x {0, 1}. Par coséquet, la foctio de vraisemblace s écrit comme p (ϑ; x 1,..., x ) = i=1 ϑ x i (1 ϑ) 1 x i = ϑ i x i (1 ϑ) i x i. O remarque d abord que la foctio de vraisemblace est strictemet positive sur ]0, 1[. Il e résulte qu o peut remplacer le problème de maximisatio de p par celui de maximisatio de l = log p : ˆϑ MV = arg max ϑ ]0,1[ log p (ϑ; X 1,..., X ) = arg max ϑ ]0,1[ où X = 1 i X i. O vérifie aisémet que la foctio l (ϑ) = X log ϑ + (1 X) log(1 ϑ), { } X log ϑ + (1 X) log(1 ϑ), appelée foctio de log-vraisemblace est strictemet cocave sur ]0, 1[ et que X est le seul poit où la dérivée de l s aule. Or, si la dérivée d ue foctio cocave s aule e u poit alors c est le poit de maximum global. Il e découle que das le modèle de Beroulli ˆϑ MV = X. Par la liéarité de l espérace, o motre que cet estimateur est sas biais : E ϑ [X] = 1 E ϑ [X i ] = 1 ϑ = ϑ, ϑ [0, 1]. i=1 i=1 De plus, c est u estimateur cosistat et asymptotiquemet ormal de vitesse 1/ et de variace limite ϑ(1 ϑ). La courbe de la foctio de log-vraisemblace l pour trois échatillos i.i.d. de loi B(1/2) est représetée das la Figure 3.1. O y voit clairemet la ature aléatoire de l estimateur du maximum de vraisemblace, qui est dû au fait que l échatillo a été obteu par u tirage aléatoire.

41 Sectio 3.3 Estimatio 41 FIGURE 3.1 Modèle de Beroulli : la foctio de log-vraisemblace et so maximum global. Les trois courbes représetet la log-vraisemblace pour trois échatillos différets de taille 40. La vraie valeur du paramètre das les trois cas est ϑ = 1/2. Les valeurs estimées qu o obtiet pour ces échatillos sot ˆϑ MV = 0.5 ; 0.55 ; L EMV das l exemple 2 Das l exemple 2 portat sur la vitesse du vet, o dispose d u échatillo i.i.d. X 1,..., X de loi Expoetielle E(1/ϑ ) avec ϑ Θ =]0, + [. Il s agit d u modèle à desité avec : O e déduit la foctio de vraisemblace p (ϑ; x 1,..., x ) = p(ϑ; x) = ϑ 1 e x/ϑ 1l [0, [ (x). i=1 { ϑ 1 e xi/ϑ = ϑ exp 1 ϑ } x i i=1 pour tout x 1,..., x 0. Comme o sait que l échatillo X 1,..., X est gééré par ue loi expoetielle, P(X i 0; i = 1,..., ) = 1. O a doc la foctio de log-vraisemblace l (ϑ) = (log ϑ + ϑ 1 X), ϑ > 0. Cette foctio est pas cocave sur R +, mais o vérifie aisémet qu elle est croissate sur ]0, X] et décroissate sur [X, + [. Il e découle que X est le poit de maximum global de l, ce qui etraîe que ˆϑ MV = X. Comme das l exemple précédet, ici aussi l estimateur X est sas biais. De plus, e vertu de la loi forte des grads ombres et du théorème de la limite cetrale, X est cosistat et asymptotiquemet ormal de vitesse 1/2 et de variace limite ϑ 2, c est-à-dire (X ϑ ) L N (0, ϑ 2 ). Remarque 3.1. Das les deux exemples précédets la méthode du maximum de vraisemblace ous a coduit à des estimateurs sas biais, cosistats et asymptotiquemet ormaux de vitesse 1/2. O peut aturellemet se demader si ces propriétés sot caractéristiques aux deux modèles cosidérés ou si elles restet valables das u cadre plus gééral. Nous e doeros pas ici ue répose exhaustive à cette questio, mais seulemet quelques élémets de répose : - l EMV est e gééral pas sas biais (o dit qu il est biaisé), mais so biais ted vers zéro lorsque sous certaies coditios de régularité ; - il existe des coditios de régularité assez faibles sur l applicatio (ϑ, x) p(ϑ; x) garatissat la cosistace de l EMV aisi que sa ormalité asymptotique avec la vitesse 1/2.

42 42 Rappel des bases de la statistique paramétrique Chapitre 3 FIGURE 3.2 Modèle expoetiel : la foctio de log-vraisemblace et so maximum global. Les trois courbes représetet la log-vraisemblace pour trois échatillos différets de taille 40. La vraie valeur du paramètre das les trois cas est ϑ = 20. Les valeurs estimées qu o obtiet pour ces échatillos sot ˆϑ MV = ; ; U exemple de modèle irrégulier : modèle uiforme Pour se covaicre que l EMV est pas toujours sas biais et qu il peut coverger à ue vitesse différete de 1/2, cosidéros le modèle suivat. O dispose d u échatillo i.i.d. X 1,..., X de loi uiforme sur l itervalle [0, ϑ ], otée U([0, ϑ ]). Le paramètre icou ϑ est supposé apparteir à l esemble R +. C est u modèle à desité avec p(ϑ; x) = 1 ϑ 1l [0,ϑ](x). Par coséquet, la foctio de vraisemblace a la forme p (ϑ; x 1,..., x ) = 1 ϑ { 1, si x i [0, ϑ] i, 0, sio où x () = max i=1,..., x i. L EMV est doc défii par = ϑ 1l [x(),+ [(ϑ), ˆϑ MV = arg max ϑ>0 ϑ 1l [X(),+ [(ϑ) = X () (= max 1 i X i). Vérifios d abord que X () est biaisé. Pour cela, o itroduit l évéemet A = {X 1 ϑ /2;... X ϑ /2} qui vérifie P ϑ (A) = (1/2) > 0. Comme sur cet évéemet X () ϑ /2, o a Il e résulte que ˆϑ MV E ϑ [X () ] = E ϑ [X () 1l A ] + E ϑ [X () 1l A c] 1 2 ϑ P ϑ (A) + ϑ P ϑ (A c ) = ϑ 1 2 ϑ P ϑ (A) < ϑ. = X () est u estimateur biaisé. Exercice 3.1. Soit X 1,..., X iid U([0, ϑ ]) avec ϑ ]0, + [ et soit ˆϑ MV = X ().

43 Sectio 3.4 Itervalle de cofiace 43 FIGURE 3.3 Modèle uiforme : la foctio de vraisemblace et so maximum global. Les trois courbes représetet la vraisemblace pour trois échatillos différets de taille 10. La vraie valeur du paramètre das les trois cas est ϑ = 1. Les valeurs estimées qu o obtiet pour ces échatillos sot ˆϑ MV = 0.98 ; 0.95 ; Vérifier que la foctio de répartitio F de X () est doée par 0, si x ], 0], F (ϑ, x) = (x/ϑ ), si x ]0, ϑ ], 1, si x ]ϑ, + ]. E déduire la desité de ˆϑ MV. 2. Vérifier que la quatité B (ϑ ) = E ϑ [ ˆϑ MV ] ϑ, appelée le biais de ˆϑ MV, est égale à ϑ /( + 1). 3. E utilisat la défiitio de la covergece e loi, prouver que ˆϑ MV loi expoetielle E(1/ϑ ) avec la vitesse 1/, c est-à-dire 3.4 Itervalle de cofiace (ϑ ˆϑ MV L ) E(1/ϑ ). est asymptotiquemet de La méthode du maximum de vraisemblace ous permet de calculer ue estimatio de la vraie valeur du paramètre. Cepedat, ayat calculé cette estimatio, o peut aturellemet s iterroger sur sa qualité. Ue faço largemet répadue pour décrire la qualité de l estimatio cosiste à fourir u itervalle de cofiace ou, plus gééralemet, ue régio de cofiace. Défiitio 3.8. Soit X 1,..., X u échatillo i.i.d. de loi P ϑ avec ϑ Θ R p. O appelle régio de cofiace de iveau prescrit 1 α, avec α [0, 1], tout sous-esemble I = I(X 1,..., X ) de R p tel que P ϑ ( I cotiet ϑ ) 1 α, ϑ Θ. (3.4) Si p = 1 et I est u itervalle, o l appelle itervalle de cofiace. Si au lieu d avoir (3.4) pour fixé, o l a de faço asymptotique, c est-à-dire lim P ϑ ( I cotiet ϑ ) 1 α, ϑ Θ, (3.5) alors o dit que I est ue régio de cofiace de iveau asymptotique 1 α.

44 44 Rappel des bases de la statistique paramétrique Chapitre 3 La démarche géérale pour costruire u itervalle de cofiace peut se résumer de la maière suivate. 1. O détermie u estimateur cosistat ϑ ; das la plupart des cas, la loi de ϑ est cocetrée autour de la vraie valeur ϑ. 2. O cherche u δ = δ(x 1,..., X ) > 0 tel que et l o défiit I = [ ϑ δ, ϑ + δ ]. P ϑ ( ϑ ϑ > δ ) α, ϑ Θ, Remarque 3.2. Si la loi de ϑ ϑ est fortemet asymétrique, o remplace la secode étape par la recherche de deux variables aléatoires δ = δ(x 1,..., X ) > 0 et δ = δ (X 1,..., X ) > 0 telles que ( P ϑ ϑ ϑ ) α < δ 2, et P ( ϑ ϑ ϑ > δ ) α 2, pour tout ϑ Θ, et l o défiit I = [ ϑ δ, ϑ + δ ]. Afi de clarifier le schéma préseté ci-dessus, cosidéros deux exemples Modèle de Beroulli : itervalle de cofiace par excès Rappelos que das l exemple 1 portat sur la qualité de l air, o dispose de variables i.i.d. de loi B(ϑ ) avec ϑ ]0, 1[. Nous avos déjà vu que l EMV ˆϑ MV = X est cosistat das ce modèle. O cherche doc u δ tel que D après l iégalité de Tchebychev, o a P ϑ ( X ϑ > δ ) α, ϑ ]0, 1[. (3.6) P ϑ ( X ϑ ) E > δ ϑ [(X ϑ ) 2 ] δ 2. Or, comme X est sas biais, il viet E ϑ [(X ϑ ) 2 ] = Var ϑ (X ) = [ ] Var ϑ i=1 X i 2 = ϑ (1 ϑ ). E combiat les deux iégalités précédetes avec l iégalité élémetaire ab (a + b) 2 /4, o obtiet ( P ϑ X ϑ ) ϑ > (1 ϑ ) δ δ 2 1 4δ 2. Il e résulte qu e choisissat δ 2 = 1/(4α), l iégalité (3.6) sera satisfaite. Par coséquet, I = [ X 1 2 α ; X + 1 ] 2 α est u itervalle de cofiace (IC) de iveau 1 α pour ϑ. O remarque que le δ qu o a trouvé est pas aléatoire. E d autres termes, la logueur de l IC e déped pas de l échatillo qu au travers de sa taille.

45 Sectio 3.4 Itervalle de cofiace 45 FIGURE 3.4 A gauche : les itervalles de cofiace de iveau 90% pour ϑ = 0.25 das le modèle de Beroulli. O a tiré au hasard 40 échatillos de taille 400. E particulier, o remarque sur le graphe ci-dessus que tous les 40 itervalles cotieet la valeur 0.25 et sot tous de même taille. A droite : les itervalles de cofiace de iveau 90% pour ϑ = 5 das le modèle expoetiel. O remarque que sur 40 échatillos de taille 400 tirés au hasard, 4 fois l itervalle de cofiace calculé e cotiet pas la vraie valeur Modèle expoetiel : itervalle de cofiace asymptotique Cosidéros maiteat l exemple de modèle expoetielle : X 1,..., X iid E(1/ϑ ), ϑ ]0, [. Nous avos vu que das cet exemple l EMV de ϑ est la moyee empirique X. De plus, e vertu de la loi des grads ombres X est u estimateur cosistat. O cherche doc u itervalle de cofiace sous la forme [X δ, X + δ ]. Das ce cas, il est impossible d appliquer la stratégie utilisée das l exemple précédet, car la variace de X égale à ϑ 2 / est pas borée sur Θ =]0, + [. Supposos que la taille de l échatillo est suffisammet grade. O peut alors utiliser ue approximatio de la loi de X par ue loi ormale, car e vertu du théorème de la limite cetrale (TLC), (X ϑ L ) N (0, ϑ 2 ). (L utilisatio du TLC est justifiée puisque E ϑ [X2 1 ] = Var ϑ [X 1] + (E ϑ [X 1 ]) 2 = 2ϑ 2 <.) Cela implique que ( ) X ϑ 1 L N (0, 1) et, par coséquet, ( ( ) ) lim P X ϑ ϑ 1 A = P(ξ A), A B R, où ξ N (0, 1). O peut démotrer que le plus petit esemble A tel que P(ξ A) = 1 α pour ξ N (0, 1) est A = [ q1 α/2 N, qn 1 α/2 ] où qn 1 α/2 désige le quatile d ordre 1 α/2 de

46 46 Rappel des bases de la statistique paramétrique Chapitre 3 FIGURE 3.5 La courbe de la desité de la loi ormale cetrée réduite et les quatiles d ordre 1 α/2. la loi ormale cetrée réduite (voir la Figure 3.5). E choisissat A de cette faço, o obtiet ( ( ) ) lim P X ϑ ϑ 1 [ q N1 α/2, qn1 α/2 ] = 1 α. Pour coclure, il suffit de remarquer que ( ) X ϑ 1 [ q1 α/2 N, qn 1 α/2 ] X [ ϑ 1 qn 1 α/2 [ ϑ O e déduit que [ ] X I = 1 + (q1 α/2 N / ), X 1 (q1 α/2 N / ) est u itervalle de cofiace de iveau asymptotique 1 α pour ϑ. ], 1 + qn 1 α/2 X 1 + (q N 1 α/2 / ), X 1 (q N 1 α/2 / ) Exercice 3.2. Soit X 1,..., X u échatillo i.i.d. de loi E(1/ϑ ) avec ϑ ]0, [. 1. Prouver que 2. E déduire que Ĩ = est i IC de iveau asymptotique α pour ϑ. (X ϑ L ) N (0, 1). X ( ) ( )] [X 1 qn 1 α/2, X 1 + qn 1 α/2 3. Démotrer que, pour les grades valeurs de, les itervalles I et Ĩ sot très proches. Plus précisémet, motrer que si qn 1 α/2 1/2 alors I \ Ĩ + Ĩ \ I Ĩ 2qN 1 α/2. Exercice 3.3. Vérifier que, das le modèle de Beroulli X 1,..., X iid B(ϑ ), [ Ĩ = X qn 1 α/2 ; X + qn ] 1 α/2 est u itervalle de cofiace de iveau asymptotique 1 α pour le paramètre ϑ ].

Estimations et intervalles de confiance

Estimations et intervalles de confiance Estimatios et itervalles de cofiace Estimatios et itervalles de cofiace Résumé Cette vigette itroduit la otio d estimateur et ses propriétés : covergece, biais, erreur quadratique, avat d aborder l estimatio

Plus en détail

La classification de données quantitatives avec SPAD

La classification de données quantitatives avec SPAD La classificatio de doées quatitatives avec SPAD SPAD effectue toujours ue ACP de la matrice des doées quatitatives X " p avat de faire la classificatio des idividus. Les méthodes de classificatio s appliquet

Plus en détail

SÉRIES STATISTIQUES À DEUX VARIABLES

SÉRIES STATISTIQUES À DEUX VARIABLES 1 ) POSITION DU PROBLÈME - VOCABULAIRE A ) DÉFINITION SÉRIES STATISTIQUES À DEUX VARIABLES O cosidère deux variables statistiques umériques x et y observées sur ue même populatio de idividus. O ote x 1

Plus en détail

STATISTIQUE : ESTIMATION

STATISTIQUE : ESTIMATION STATISTIQUE : ESTIMATION Préparatio à l Agrégatio Bordeaux Aée 202-203 Jea-Jacques Ruch Table des Matières Chapitre I. Estimatio poctuelle 5. Défiitios 5 2. Critères de comparaiso d estimateurs 6 3. Exemples

Plus en détail

Sciences Po Option Mathématiques

Sciences Po Option Mathématiques Scieces Po Optio Mathématiques Epreue 3 Vrai-Fau Questio FAUX La suite ( u ) état géométrique de raiso différete de, o a classiquemet, pour tout etier aturel : où q est la raiso de la suite ( u ) Ici,

Plus en détail

Loi binomiale. Niveau : Première S + SUP (Convergence) Prérequis : Variable aléatoire, espérance, variance, théorème limite central, loi de Poisson

Loi binomiale. Niveau : Première S + SUP (Convergence) Prérequis : Variable aléatoire, espérance, variance, théorème limite central, loi de Poisson 4 L E Ç O N Loi biomiale Niveau : Première S + SUP (Covergece) Prérequis : Variable aléatoire, espérace, variace, théorème limite cetral, loi de Poisso 1 Loi de Beroulli Défiitio 41 Loi de Beroulli Soit

Plus en détail

Entrée à Sciences Po ADMISSION AU COLLÈGE UNIVERSITAIRE 2014 MATHÉMATIQUES durée de l épreuve : 3 h

Entrée à Sciences Po ADMISSION AU COLLÈGE UNIVERSITAIRE 2014 MATHÉMATIQUES durée de l épreuve : 3 h Etrée à Scieces Po ADMISSION AU COLLÈGE UNIVERSITAIRE 2014 MATHÉMATIQUES durée de l épreuve : 3 h A P M E P Les calculatrices sot autorisées Exercice Vrai-Faux 8 poits Pour chacue des affirmatios suivates,

Plus en détail

Statistique descriptive bidimensionnelle

Statistique descriptive bidimensionnelle 1 Statistique descriptive bidimesioelle Statistique descriptive bidimesioelle Résumé Liaisos etre variables quatitatives (corrélatio et uages de poits), qualitatives (cotigece, mosaïque) et de types différets

Plus en détail

Correction HEC III 2007

Correction HEC III 2007 HEC III 7 Voie Écoomique Correctio Page Correctio HEC III 7 Voie écoomique La correctio comporte 9 pages. Eercice. Par dé itio est ue valeur propre de t si et seulemet si est ue valeur propre de T: Et

Plus en détail

Chapitre 4 Lois discrètes

Chapitre 4 Lois discrètes Chapitre 4 Lois discrètes 1. Loi de Beroulli Ue variable aléatoire X est ue variable de Beroulli si elle e pred que les valeurs 0 et 1 avec des probabilités o ulles. P(X = 1) = p, P(X = 0) = 1 p = q, avec

Plus en détail

Chapitre 3 : Fonctions d une variable réelle (1)

Chapitre 3 : Fonctions d une variable réelle (1) Uiversités Paris 6 et Paris 7 M1 MEEF Aalyse (UE 3) 2013-2014 Chapitre 3 : Foctios d ue variable réelle (1) 1 Lagage topologique das R Défiitio 1 Soit a u poit de R. U esemble V R est u voisiage de a s

Plus en détail

Dénombrement - Combinatoire Cours

Dénombrement - Combinatoire Cours Déombremet - Combiatoire Cours La combiatoire (ou aalyse combiatoire) étudie commet compter des objets. Elle fourit des méthodes de déombremet particulièremet utiles e probabilité. U des pricipaux exemples

Plus en détail

Méthodes basiques en statistiques sous R

Méthodes basiques en statistiques sous R Méthodes basiques e statistiques sous R Master II Modélisatio Aléatoire - Paris VII Eseigat : Mme Picard Sébastie Le Berre 12 mai 2011 R est u logiciel de calcul largemet utilisé par la commuauté scietifique

Plus en détail

1 Mesure et intégrale

1 Mesure et intégrale 1 Mesure et itégrale 1.1 Tribu boréliee et foctios mesurables Soit =[a, b] u itervalle (le cas où b = ou a = est pas exclu) et F ue famille de sous-esembles de. OditqueF est ue tribu sur si les coditios

Plus en détail

PROJET DE MONTE CARLO SUJET 1: LE PRICING

PROJET DE MONTE CARLO SUJET 1: LE PRICING LE Age KHOURI Nadie M MMD PROJE DE MONE ARLO SUJE : LE PRIING Selim ZOUGHLAMI QUESION : Supposos d abord que X est u mouvemet browie W t G([ 0, ]) Alors W0 G( 0 ) suit ue loi N(0,0) et doc W 0ps 0 Esuite,

Plus en détail

09 G 18bis AR Durée: 4 heures Séries : S1-S3 - Coeff. 8.. Epreuve du 1 er groupe

09 G 18bis AR Durée: 4 heures Séries : S1-S3 - Coeff. 8.. Epreuve du 1 er groupe UNIVERSITE CHEIKH ANTA DIOP DE DAKAR 1/ 9 OFFICE DU BACCALAUREAT BP 5005-DAKAR-Fa-Séégal Serveur Vocal: 68 05 59 Téléfax (1) 864 67 39 - Tél : 84 95 9-84 65 81 M A T H E M A T I Q U E S 09 G 18bis AR Durée:

Plus en détail

TP R : méthodes statistiques élémentaires

TP R : méthodes statistiques élémentaires M2 IFMA et MPE TP R : méthodes statistiques élémetaires À la fi de la séace vous déposerez vos scripts R das la boîte de dépôt de votre espace Sakai : http://australe.upmc.fr/portal. 1 Importatio des doées

Plus en détail

Baccalauréat S Nouvelle-Calédonie 7 mars 2014

Baccalauréat S Nouvelle-Calédonie 7 mars 2014 Durée : 4 heures Baccalauréat S Nouvelle-Calédoie 7 mars 2014 A. P. M. E. P. EXERCICE 1 Commu à tous les cadidats 4 poits Cet exercice est u QCM questioaire à choix multiple. Pour chaque questio, ue seule

Plus en détail

TS Intervalle de fluctuation et estimation Cours

TS Intervalle de fluctuation et estimation Cours Aée 2013/2014 TS Itervalle de fluctuatio et estimatio Cours est u etier aturel o ul et p est u réel de l itervalle 0 ; 1. I Itervalle de fluctuatio Cotexte : Das ue populatio, la proportio d idividus présetat

Plus en détail

Devoir de statistiques: CORRIGE

Devoir de statistiques: CORRIGE CPP - la prépa des INP ( ème aée). Bordeaux, 6/04/04. Devoir de statistiques: CORRIGE durée h Doées: O rappelle que si Z suit ue loi N (0, ), o a P(Z.96) 0, 975 et P(Z.65) 0, 95. Exercice. θ et O cosidère

Plus en détail

Limites des Suites numériques

Limites des Suites numériques Chapitre 2 Limites des Suites umériques Termiale S Ce que dit le programme : CONTENUS CAPACITÉS ATTENDUES COMMENTAIRES Limite fiie ou ifiie d ue suite. Limites et comparaiso. Opératios sur les ites. Comportemet

Plus en détail

1/ ETUDE ASYMPTOTIQUE D'UNE MARCHE ALEATOIRE ENTRE DEUX ETATS

1/ ETUDE ASYMPTOTIQUE D'UNE MARCHE ALEATOIRE ENTRE DEUX ETATS CHAPITRE 4 MATRICES ET SUITES 1/ ETUDE ASYMPTOTIQUE D'UNE MARCHE ALEATOIRE ENTRE DEUX ETATS 11/ Présetatio et modélisatio O cosidère u système ui peut se trouver soit das u état A, soit das u état, et

Plus en détail

. (b) Si (u n ) est une suite géométrique de raison q, q 1, on obtient : N N, S N = 1 qn+1. n+1 1 S N = 1 1

. (b) Si (u n ) est une suite géométrique de raison q, q 1, on obtient : N N, S N = 1 qn+1. n+1 1 S N = 1 1 Premières propriétés des ombres réels 2 Suites umériques 3 Suites mootoes : à faire 4 Séries umériques 4. Notio de série. Défiitio 4.. Soit (u ) ue suite de ombres réels ou complexes. Pour N N, o ote S

Plus en détail

STATISTIQUE : TESTS D HYPOTHESES

STATISTIQUE : TESTS D HYPOTHESES STATISTIQUE : TESTS D HYPOTHESES Préparatio à l Agrégatio Bordeaux Aée 203-204 Jea-Jacques Ruch Table des Matières Chapitre I. Gééralités sur les tests 5. Itroductio 5 2. Pricipe des tests 6 2.a. Méthodologie

Plus en détail

Correction des exercices sur la nature ondulatoire de la lumière

Correction des exercices sur la nature ondulatoire de la lumière CORRECTION EXERCICES TS /5 CHAPITRE 3 Correctio des exercices sur la ature odulatoire de la lumière Correctio exercice : idice d u verre et réfractio. La radiatio = 530 m est verte et la radiatio = 680

Plus en détail

Correction Bac ES France juin 2010

Correction Bac ES France juin 2010 Correctio Bac ES Frace jui 010 Exercice 1 (4 poits) (Commu à tous les cadidats) Pour ue meilleure compréhesio, les réposes serot justifiées das ce corrigé. Questio 1 Le ombre 3 est solutio de l équatio

Plus en détail

Exercice I ( non spé ) 1/ u 1 = 3 4. 2 3 u 2 4 + 3 9. 19 4 2/ Soit P la propriété : u n + 4. > 0 pour n 1. P est vraie au rang 1 car u 1

Exercice I ( non spé ) 1/ u 1 = 3 4. 2 3 u 2 4 + 3 9. 19 4 2/ Soit P la propriété : u n + 4. > 0 pour n 1. P est vraie au rang 1 car u 1 Bac blac TS Correctio Exercice I ( Spé ) / émotros par récurrece que 5x y = pour tout etier aturel 5x y = 5 8 = La propriété est doc vraie au rag = Supposos que la propriété est vraie jusqu au rag, o a

Plus en détail

ADMISSION AU COLLEGE UNIVERSITAIRE

ADMISSION AU COLLEGE UNIVERSITAIRE ADMISSION AU COLLEGE UNIVERSITAIRE Samedi mars 204 MATHEMATIQUES durée de l'épreuve : 3h - coefficiet 2 Le sujet est uméroté de à 5. L'aexe est à redre avec la copie. L'exercice Vrai-Faux est oté sur 8,

Plus en détail

École de technologie supérieure

École de technologie supérieure École de techologie supérieure Mat 165-04 Algèbre liéaire et aalyse vectorielle A-015 Michel Beaudi michel.beaudi@etsmtl.ca Liste d exercices à faire e T.P./Caledrier des évaluatios Itroductio au cours

Plus en détail

ECOLE DES HAUTES ETUDES COMMERCIALES E.S.C.P.-E.A.P. ECOLE SUPERIEURE DE COMMERCE DE LYON MATHEMATIQUES II

ECOLE DES HAUTES ETUDES COMMERCIALES E.S.C.P.-E.A.P. ECOLE SUPERIEURE DE COMMERCE DE LYON MATHEMATIQUES II CHAMBRE DE COMMERCE ET D INDUSTRIE DE PARIS DIRECTION DE L ENSEIGNEMENT Directio des Admissios et cocours ECOLE DES HAUTES ETUDES COMMERCIALES E.S.C.P.-E.A.P. ECOLE SUPERIEURE DE COMMERCE DE LYON CONCOURS

Plus en détail

B) CHAÎNES DE SOLIDES

B) CHAÎNES DE SOLIDES Chaîes de solides B) CHAÎNES DE SOLIDES Objectifs Cette théorie a pour but d'aalyser les comportemets statique et ciématique d'u mécaisme à partir d'u modèle défii par le schéma ciématique du mécaisme.

Plus en détail

STATISTIQUE MASTER 2 : MATHÉMATIQUES POUR L ENTREPRISE. Arnak S. DALALYAN

STATISTIQUE MASTER 2 : MATHÉMATIQUES POUR L ENTREPRISE. Arnak S. DALALYAN STATISTIQUE MASTER 2 : MATHÉMATIQUES POUR L ENTREPRISE Arak S. DALALYAN Table des matières 1 SAS et Statistique Descriptive 5 1.1 Itroductio au logiciel SAS........................... 5 1.2 Statistique

Plus en détail

I. Quitte ou double. Pour n = 1 : C 0 + (2p 1) E (M k ) = C 0 + (2p 1) E (M 1 ) = E (C 1 ) d après le 1. Soit n N tel que E (C n ) = C 0 + (2p 1)

I. Quitte ou double. Pour n = 1 : C 0 + (2p 1) E (M k ) = C 0 + (2p 1) E (M 1 ) = E (C 1 ) d après le 1. Soit n N tel que E (C n ) = C 0 + (2p 1) Corrigé ESSEC III 008 par Pierre Veuillez Das certaies situatios paris sportifs, ivestissemets fiaciers..., o est ameé à miser de l arget de faço répétée sur des paris à espérace favorable. O se propose

Plus en détail

Exercices - Variables aléatoires discrètes : corrigé. Variables discrètes finies - Exercices pratiques

Exercices - Variables aléatoires discrètes : corrigé. Variables discrètes finies - Exercices pratiques Variables discrètes fiies - Exercices pratiques Exercice - Loi d u dé truqué - L2/ECS -. X pred ses valeurs das {,..., 6}. Par hypothèse, il existe u réel a tel que P (X k) ka. Maiteat, puisque P X est

Plus en détail

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable T : pour travailler et mémoriser le cours

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable T : pour travailler et mémoriser le cours Exo7 Logique, esembles et applicatios Exercices de Jea-Louis Rouget Retrouver aussi cette fiche sur wwwmaths-fracefr * très facile ** facile *** difficulté moyee **** difficile ***** très difficile I :

Plus en détail

Apprentissage: cours 3a Méthodes par moyennage local

Apprentissage: cours 3a Méthodes par moyennage local Appretissage: cours 3a Méthodes par moyeage local Guillaume Oboziski 1 er mars 2012 Réferece : chap. 6 of [Hastie et al., 2009] ad chap. 6 of [Devroye et al., 1996]. Algorithmes par moyeage local O cosidère

Plus en détail

La calculatrice est autorisée. Le sujet comporte un total de 5 exercices. ( ) ( ) ( )

La calculatrice est autorisée. Le sujet comporte un total de 5 exercices. ( ) ( ) ( ) Aée 01-013 Mathématiques Décembre 01 Durée : 3 heures BAC blac N 1 La calculatrice est autorisée. Le sujet comporte u total de 5 exercices. Les élèves e suivat pas l eseigemet de spécialité traiterot les

Plus en détail

Inégalités souvent rencontrées

Inégalités souvent rencontrées Iégalités souvet recotrées Recotres Putam 004 Uiversité de Sherbrooke Jea-Philippe Mori Théorie Certaies iégalités sot deveues célèbres e raiso de leur grade utilité Elles sot aussi souvet au coeur de

Plus en détail

DIDIER AUROUX POLYTECH NICE-SOPHIA MAM5 - OPTION IMAFA 2010-2011

DIDIER AUROUX POLYTECH NICE-SOPHIA MAM5 - OPTION IMAFA 2010-2011 MÉTHODES NUMÉRIQUES POUR LE PRICING D OPTIONS DIDIER AUROUX POLYTECH NICE-SOPHIA MAM5 - OPTION IMAFA 2010-2011 Table des matières 1 Notatios et équatio de Black-Scholes 2 11 Notatios 2 12 Équatio de Black-Scholes

Plus en détail

Correction CCP maths 1 MP

Correction CCP maths 1 MP mai 4 Avertissemet : Il subsiste certaiemet quelques coquilles... Exercice : ue itégrale double Correctio CCP maths MP Pour calculer cette itégrale, o effectue le chagemet de variable e coordoées polaires

Plus en détail

AVRIL 2012 CONCOURS INGÉNIEURS DES TRAVAUX STATISTIQUES. ITS Voie B Option Économie. MATHÉMATIQUES (Durée de l épreuve : 4 heures)

AVRIL 2012 CONCOURS INGÉNIEURS DES TRAVAUX STATISTIQUES. ITS Voie B Option Économie. MATHÉMATIQUES (Durée de l épreuve : 4 heures) ÉCOLE NATIONALE SUPÉRIEURE DE STATISTIQUE ET D ÉCONOMIE APPLIQUÉE ENSEA ABIDJAN AVRIL 2012 CONCOURS INGÉNIEURS DES TRAVAUX STATISTIQUES ITS Voie B Optio Écoomie MATHÉMATIQUES (Durée de l épreuve : 4 heures)

Plus en détail

DEVOIR SURVEILLE DE MATHEMATIQUES 3 heures Probabilités conditionnelles - Suites géométriques - fonctions exponentielles Calculatrice autorisée

DEVOIR SURVEILLE DE MATHEMATIQUES 3 heures Probabilités conditionnelles - Suites géométriques - fonctions exponentielles Calculatrice autorisée DEVOIR SURVEILLE DE MATHEMATIQUES 3 heures Probabilités coditioelles - Suites géométriques - foctios epoetielles Calculatrice autorisée Termiale ES123 Eercice 1 : 5 poits Partie A : Ue agece de locatio

Plus en détail

Cours de méthodes de simulation

Cours de méthodes de simulation ECOLE SUPERIEURE DE STATISTIQUE ET D ANALYSE DE L INFORMATION ( ESSAIT) Cours de méthodes de simulatio Préparé par Hasse MATHLOUTHI Aée uiversitaire 2014-2015 AVANT PROPOS Ce documet propose u cours sur

Plus en détail

Cours 5 : ESTIMATION PONCTUELLE

Cours 5 : ESTIMATION PONCTUELLE Cours 5 : ESTIMATION PONCTUELLE A- Gééralités B- Précisio d u estimateur C- Exhaustivité D- iformatio E-estimateur sas biais de variace miimale, estimateur efficace F- Quelques méthode s d estimatio A-

Plus en détail

Intervalle de fluctuation des fréquences. Estimation CONTENUS CAPACITÉS ATTENDUES COMMENTAIRES. fréquence F n. fréquence obtenue f.

Intervalle de fluctuation des fréquences. Estimation CONTENUS CAPACITÉS ATTENDUES COMMENTAIRES. fréquence F n. fréquence obtenue f. Chapitre 14 Itervalle de fluctuatio des fréqueces. Estimatio Termiale S Ce que dit le programme : CONTENUS CAPACITÉS ATTENDUES COMMENTAIRES Itervalle de fluctuatio Estimatio Itervalle de cofiace (*). Niveau

Plus en détail

Fluctuation et estimation

Fluctuation et estimation Fluctuatio et estimatio Table des matières I Idetificatio de la situatio........................................ II Échatilloage, itervalle de fluctuatio asymptotique........................ II. Itervalle

Plus en détail

Séquence 5. La fonction logarithme népérien. Sommaire

Séquence 5. La fonction logarithme népérien. Sommaire Séquece 5 La foctio logarithme épérie Objectifs de la séquece Itroduire ue ouvelle foctio : la foctio logarithme épérie. Coaître les propriétés de cette foctio : sa dérivée, ses variatios, sa courbe, sa

Plus en détail

PROBABILITÉS. A cette expérience aléatoire, on associe l ensemble des résultats possibles appelé univers. Ses éléments sont appelés éventualités.

PROBABILITÉS. A cette expérience aléatoire, on associe l ensemble des résultats possibles appelé univers. Ses éléments sont appelés éventualités. PROBABILITÉS I. PROBABILITÉS ( RAPPELS) a. Expérieces aléatoires et modèles Le lacer d ue pièce de moaie, le lacer d u dé sot des expérieces aléatoires, car avat de les effectuer, o e peut pas prévoir

Plus en détail

Intégration et probabilités ENS Paris, 2012-2013. TD (20)13 Lois des grands nombres, théorème central limite. Corrigé :

Intégration et probabilités ENS Paris, 2012-2013. TD (20)13 Lois des grands nombres, théorème central limite. Corrigé : Itégratio et probabilités EN Paris, 202-203 TD 203 Lois des grads ombres, théorème cetral limite. Corrigé Lois des grads ombres Exercice. Calculer e cet leços Détermier les limites suivates : x +... +

Plus en détail

STATISTIQUE AVANCÉE : MÉTHODES

STATISTIQUE AVANCÉE : MÉTHODES STATISTIQUE AVANCÉE : MÉTHODES NON-PAAMÉTIQUES Ecole Cetrale de Paris Arak S. DALALYAN Table des matières 1 Itroductio 5 2 Modèle de desité 7 2.1 Estimatio par istogrammes............................

Plus en détail

Université Paris VII - Agrégation de Mathématiques (François Delarue) MÉTHODE DE MONTE-CARLO

Université Paris VII - Agrégation de Mathématiques (François Delarue) MÉTHODE DE MONTE-CARLO Uiversité Paris VII - Agrégatio de Mathématiques Fraçois Delarue) MÉTHODE DE MONTE-CARLO Ce texte vise à préseter l utilisatio de la méthode de Mote-Carlo das le calcul du prix d ue optio. 1. Positio du

Plus en détail

Lycée Fénelon Sainte-Marie Préparation Science-Po/Prépa HEC

Lycée Fénelon Sainte-Marie Préparation Science-Po/Prépa HEC Lycée Féelo aite-marie Préparatio ciece-po/prépa HEC Foctios Versio du juillet 05 Eercice d degré : racies et coefficiets O rappelle que si l équatio a + b + c = 0 ( a 0 ) adet deu racies α et β (évetuelleet

Plus en détail

Probabilités et Statistique

Probabilités et Statistique Probabilités et Statistique Jea-Michel JOLION Départemet Géie Idustriel 3ème Aée Versio électroique : http://rfv.isa-lyo.fr/ jolio/stat/poly.html May 26, 2006 INSA Lyo - Bât. J. Vere - 69621 Villeurbae

Plus en détail

BTS Mécanique et Automatismes Industriels. Statistiques inférentielles

BTS Mécanique et Automatismes Industriels. Statistiques inférentielles BTS Mécaique et Automatismes Idustriels Statistiques iféretielles, Aée scolaire 2005 2006 Statistiques iféretielles 1. Itroductio vocabulaire Pour étudier ue populatio statistique, o a recours à deux méthodes

Plus en détail

Remise à Niveau Mathématiques

Remise à Niveau Mathématiques Mathématiques RAN - Calcul et raisoemet Remise à Niveau Mathématiques Première partie : Calcul et raisoemet Exercices Page sur 9 RAN Calcul et raisoemet Ex - Rev 04 Mathématiques RAN - Calcul et raisoemet

Plus en détail

Bac Blanc Terminale L - Février 2015 Épreuve de Spécialité Mathématiques (durée 3 heures)

Bac Blanc Terminale L - Février 2015 Épreuve de Spécialité Mathématiques (durée 3 heures) Exercice 1 (5 poits) Bac Blac Termiale L - Février 015 Épreuve de Spécialité Mathématiques (durée 3 heures) Questio 1 : La populatio d'ue ville baisse de 1 % tous les as pedat 10 as. Elle est doc multipliée

Plus en détail

Questions Chapitre 2 L approche statistique de la réalité 1

Questions Chapitre 2 L approche statistique de la réalité 1 Questios Chapitre 2 L approche statistique de la réalité 1 Expliquer la otio de variable et défiir les différets types de variables Décrire les échelles de classificatio et trasformer les doées pour passer

Plus en détail

La Méthode de Monte Carlo

La Méthode de Monte Carlo La Méthode de Mote Carlo Etiee Pardoux UMR 6632 Laboratoire d Aalyse, Topologie, Probabilités et EA 3781 Evolutio Biologique Uiversité de Provece Etiee Pardoux (LATP) Marseille, 13/09/2006 1 / 33 Cotets

Plus en détail

FEUILLE D EXERCICES 17 - PROBABILITÉS SUR UN UNIVERS FINI

FEUILLE D EXERCICES 17 - PROBABILITÉS SUR UN UNIVERS FINI FEUILLE D EXERCICES 7 - PROBABILITÉS SUR UN UNIVERS FINI Exercice - Lacer de dés O lace deux dés à 6 faces équilibrés. Calculer la probabilité d obteir : u double ; ue somme des deux dés égale à 8 ; ue

Plus en détail

FONCTION EXPONENTIELLE

FONCTION EXPONENTIELLE FONCTION EXPONENTIELLE I. RAPPELS : METHODE D EULER Si f est ue foctio dérivable e x 0, o sait que f(x 0 + h) a pour approximatio affie f(x 0 ) + f '(x 0 )h O peut doc sur de "petits" itervalles, approcher

Plus en détail

Organisme de recherche et d information sur la logistique et le transport LES PREVISIONS DES CONSOMMATIONS

Organisme de recherche et d information sur la logistique et le transport LES PREVISIONS DES CONSOMMATIONS LES PREVISIONS DES CONSOMMATIONS Les logiciels utilisés pour la gestio des stocks itègret de ombreuses foctios de calcul. L ue des plus importates est l exécutio des prévisios des cosommatios futures d

Plus en détail

Séquence 8. Suites arithmétiques et géométriques. Sommaire

Séquence 8. Suites arithmétiques et géométriques. Sommaire Séquece 8 Suites arithmétiques et géométriques Sommaire Pré-requis Suites arithmétiques Suites géométriques Sythèse du cours Exercices d approfodissemet Séquece 8 MA Ced - Académie e lige Pré-requis A

Plus en détail

Application «Calculs» Application «Graphiques» Application «Tableur et listes» FR

Application «Calculs» Application «Graphiques» Application «Tableur et listes» FR TI Nspire Documet de Formatio T3 Walloie TI-Nspire Le tout e u des mathématiques Suites umériques La loi de Verhulst Applicatio «Calculs» Applicatio «Graphiques» Applicatio «Tableur et listes» FR Formatios

Plus en détail

[http://mp.cpgedupuydelome.fr] édité le 10 juillet 2014 Enoncés 1. Exercice 6 [ 02475 ] [correction] Si n est un entier 2, le rationnel H n =

[http://mp.cpgedupuydelome.fr] édité le 10 juillet 2014 Enoncés 1. Exercice 6 [ 02475 ] [correction] Si n est un entier 2, le rationnel H n = [http://mp.cpgedupuydelome.fr] édité le 1 juillet 14 Eocés 1 Nombres réels Ratioels et irratioels Exercice 1 [ 9 ] [correctio] Motrer que la somme d u ombre ratioel et d u ombre irratioel est u ombre irratioel.

Plus en détail

Séquence 1. Les suites numériques. Sommaire. 1. Pré-requis 2. Le raisonnement par récurrence 3. Notions de limites 4. Synthèse

Séquence 1. Les suites numériques. Sommaire. 1. Pré-requis 2. Le raisonnement par récurrence 3. Notions de limites 4. Synthèse Séquece Les suites umériques Sommaire Pré-requis Le raisoemet par récurrece 3 Notios de limites 4 Sythèse Das cette séquece, il s agit d ue part d approfodir la otio de suites umériques permettat la modélisatio

Plus en détail

CHAPITRE 22. Machines à sous

CHAPITRE 22. Machines à sous CHAPITRE 22 Machies à sous 22. Corrigé possible du texte 22.. Eocé du problème et défiitio du modèle statistique associé O étudie ici u modèle statistique avec observatios icomplètes : o dispose d observatios

Plus en détail

AVANT PROPOS. Cet ouvrage pourra intéresser également les enseignants de ce niveau.

AVANT PROPOS. Cet ouvrage pourra intéresser également les enseignants de ce niveau. AVANT PROPOS Cet ouvrage propose aux élèves de classes termiales (fraçais) S (spécialité math) des rappels et des complémets de cours assez complet, aisi que des problèmes et des exercices corrigés. Les

Plus en détail

Test de validité et d'hypothèse

Test de validité et d'hypothèse Test de validité et d'hypothèse 1 Vocabulaire Problème: Il s'agit à partir de l'étude d'u ou plusieurs échatillos de predre des décisios cocerat l'esemble de la populatio. O est alors ameé à émettre des

Plus en détail

Mathématiques. Terminale S Corrigés des exercices. Rédaction : Laurent Beroul Isabelle Tenaud Sébastien Cario. Coordination : Sébastien Cario

Mathématiques. Terminale S Corrigés des exercices. Rédaction : Laurent Beroul Isabelle Tenaud Sébastien Cario. Coordination : Sébastien Cario Mathématiques Termiale S Corrigés des eercices Rédactio : Lauret Beroul Isabelle Teaud Sébastie Cario Coordiatio : Sébastie Cario Ce cours est la propriété du Ced Les images et tetes itégrés à ce cours

Plus en détail

Mathématiques. Cours. BTS Informatique de gestion 2 e année. Denis Jaudon. Directrice de publication : Valérie Brard-Trigo

Mathématiques. Cours. BTS Informatique de gestion 2 e année. Denis Jaudon. Directrice de publication : Valérie Brard-Trigo BTS Iformatique de gestio e aée Deis Jaudo Mathématiques Cours Directrice de publicatio : Valérie Brard-Trigo Les cours du Ced sot strictemet réservés à l usage privé de leurs destiataires et e sot pas

Plus en détail

Maîtrise de Mathématiques TER Le bandit manchot à deux bras

Maîtrise de Mathématiques TER Le bandit manchot à deux bras Maîtrise de Mathématiques TER Le badit machot à deux bras Deis Cousieau Sous la directio de Jea-Michel Loubes Septembre 2003 Table des matières 1 Présetatio du problème 2 1.1 Exemple de la machie à sous,

Plus en détail

Estimation. Exemple Les statistiques des notes obtenues en mathématiques au BTS OL en France pour l année 2014 sont :

Estimation. Exemple Les statistiques des notes obtenues en mathématiques au BTS OL en France pour l année 2014 sont : Estimatio Objectifs Estimer poctuellemet ue proportio, ue moyee ou u écart type d ue populatio à l aide de la calculatrice ou d u logiciel, à partir d u échatillo Détermier u itervalle de cofiace à u iveau

Plus en détail

Statistique mathématique pour le Master 1 Cours de l ENS Cachan Bretagne. Benoît Cadre

Statistique mathématique pour le Master 1 Cours de l ENS Cachan Bretagne. Benoît Cadre Statistique mathématique pour le Master 1 Cours de l ENS Cacha Bretage Beoît Cadre 4 jui 2010 2 Table des matières 1 Modélisatio statistique 5 1.1 U exemple............................. 5 1.2 Pricipe fodametal

Plus en détail

Statistiques appliquées à la gestion Cours d analyse de donnés Master 1

Statistiques appliquées à la gestion Cours d analyse de donnés Master 1 Aalyse des doées Statistiques appliquées à la gestio Cours d aalyse de doés Master F. SEYTE : Maître de coféreces HDR e scieces écoomiques Uiversité de Motpellier I M. TERRAZA : Professeur de scieces écoomiques

Plus en détail

Séquence 9. Sommaire. 1. Pré-requis 2. Intervalles de fluctuation 3. Estimation 4. Synthèse de la séquence 5. Exercices de synthèse

Séquence 9. Sommaire. 1. Pré-requis 2. Intervalles de fluctuation 3. Estimation 4. Synthèse de la séquence 5. Exercices de synthèse Séquece 9 Itervalles de fluctuatio, estimatio Objectifs de la séquece Das le chapitre 2, o étudie des itervalles de fluctuatio des variables aléatoires X F =, fréqueces des variables aléatoires biomiales

Plus en détail

II LES PROPRIETES DES ESTIMATEURS MCO 1. Rappel : M1 LA REGRESSION : HYPOTHESES ET TESTS Avril 2009

II LES PROPRIETES DES ESTIMATEURS MCO 1. Rappel : M1 LA REGRESSION : HYPOTHESES ET TESTS Avril 2009 M LA REGRESSION : HYPOTHESES ET TESTS Avril 009 I LES HYPOTHESES DE LA MCO. Hypothèses sur la variable explicative a. est o stochastique. b. a des valeurs xes das les différets échatillos. c. Quad ted

Plus en détail

Promenades aléatoires : vers les chaînes de Markov

Promenades aléatoires : vers les chaînes de Markov AME Dossier : Matrices et suites 545 romeades aléatoires : vers les chaîes de Markov ierre Griho (*) Cet article propose ue mise e perspective de la otio de promeade ou de marche aléatoire itroduite das

Plus en détail

Université de Provence 2011 2012. Planche 6. Nombres réels. Suites réelles. Nombres réels.

Université de Provence 2011 2012. Planche 6. Nombres réels. Suites réelles. Nombres réels. Uiversité de Provece 011 01 Mathématiques Géérales I Plache 6 Nombres réels Suites réelles Nombres réels Exercice 1 Mettre sous forme irréductible p/q les ratioels suivats (les chiffres souligés se répètet

Plus en détail

I. (2 points) III. (2 points)

I. (2 points) III. (2 points) ère S Cotrôle du vedredi 7 mars 05 (0 mi) Préom : Nom : Note : / 0 II ( poits) Soit ABC u triagle isocèle e A tel que AB AC 8 cm et BC 5 cm O ote I le milieu de [AC] Calculer BI (valeur exacte) I ( poits)

Plus en détail

Notions de base pour l analyse d un tableau de contingence

Notions de base pour l analyse d un tableau de contingence Uiversité de Bordeaux - Master MIMSE - 2ème aée Notios de base pour l aalyse d u tableau de cotigece Marie Chavet http://wwwmathu-bordeauxfr/ machave/ 204-205 Notatios et défiitios U tableau de cotigece

Plus en détail

Cours de Statistiques inférentielles

Cours de Statistiques inférentielles Licece 2-S4 SI-MASS Aée 2015 Cours de Statistiques iféretielles Pierre DUSART 2 Chapitre 1 Lois statistiques 1.1 Itroductio Nous allos voir que si ue variable aléatoire suit ue certaie loi, alors ses réalisatios

Plus en détail

Université de Bordeaux - Master MIMSE - 2ème année. Scoring. Marie Chavent http://www.math.u-bordeaux.fr/ machaven/ 2014-2015

Université de Bordeaux - Master MIMSE - 2ème année. Scoring. Marie Chavent http://www.math.u-bordeaux.fr/ machaven/ 2014-2015 Uiversité de Bordeaux - Master MIMSE - 2ème aée Scorig Marie Chavet http://www.math.u-bordeaux.fr/ machave/ 2014-2015 1 Itroductio L idée géérale est d affecter ue ote (u score) global à u idividu à partir

Plus en détail

Introduction to Econometrics

Introduction to Econometrics MPRA Muich Persoal RePEc Archive Itroductio to Ecoometrics Moussa Keita September 015 Olie at https://mpra.ub.ui-mueche.de/66840/ MPRA Paper No. 66840, posted. September 015 04:1 UTC INTRODUCTION A L ECONOMETRIE

Plus en détail

On obtient la formule de Pascal en prenant le cardinal :

On obtient la formule de Pascal en prenant le cardinal : Colles du 3 ovembre 014 Solutio de la questio de cours 1. (i) Soit E u esemble de cardial. L esemble (E) peut alors être partitioé comme suit : (E) (E), où (E) est l esemble des parties de E de cardial.

Plus en détail

Séries réelles ou complexes

Séries réelles ou complexes 6 Séries réelles ou complexes Comme pour le chapitre 3, les suites cosidérées sot a priori complexes et les résultats classiques sur les foctios cotiues ou dérivables d ue variable réelle sot supposés

Plus en détail

Principes et Méthodes Statistiques

Principes et Méthodes Statistiques Esimag - 2ème aée 0 1 2 3 4 5 6 7 0 5 10 15 x y Pricipes et Méthodes Statistiques Notes de cours Olivier Gaudoi 2 Table des matières 1 Itroductio 7 1.1 Défiitio et domaies d applicatio de la statistique............

Plus en détail

Travaux dirigés G33 Dimensionnement 2 séances Enseignant : Anthony Busson.

Travaux dirigés G33 Dimensionnement 2 séances Enseignant : Anthony Busson. Travaux dirigés G33 Dimesioemet 2 séaces Eseigat : Athoy Busso. Exercice 1 : O cosidère u web switch et 3 serveurs web. Le web switch reçoit les requêtes http proveat des cliets et les répartit de maière

Plus en détail

II. Permutations sans répétitions et notation factorielle

II. Permutations sans répétitions et notation factorielle février 2012 ORRIGE II. Permutatios sas répétitios et otatio factorielle Aalyse combiatoire 4 ème - 1 I. Itroductio Les différets modèles mathématiques costruits pour étudier les phéomèes où iterviet le

Plus en détail

Soit E un ensemble. On appelle classe de parties de E un sous-ensemble non vide de P(E).

Soit E un ensemble. On appelle classe de parties de E un sous-ensemble non vide de P(E). Chapitre 1 Tribus 1.1 Défiitios Soit E u esemble. O appelle classe de parties de E u sous-esemble o vide de P(E). Défiitio 1.1.1. Ue tribu A sur E est u sous-esemble o vide de P(E) tel que : (i) la partie

Plus en détail

20. Algorithmique & Mathématiques

20. Algorithmique & Mathématiques L'éditeur L'éditeur permet à l'utilisateur de saisir les liges de codes d'u programme ou de défiir des foctios. Remarque : O peut saisir directemet des istructios das la cosole Scilab, mais il est plus

Plus en détail

14 Chapitre 14. Théorème du point fixe

14 Chapitre 14. Théorème du point fixe Chapitre 14 Chapitre 14. Théorème du poit fixe Si l o examie de plus près les méthodes de Lagrage et de Newto, étudiées au chapitre précédet, elles revieet das leur pricipe à remplacer la résolutio de

Plus en détail

Mathématiques. Statistiques. Stéphane Perret. Version 3.001

Mathématiques. Statistiques. Stéphane Perret. Version 3.001 Mathématiques Statistiques Stéphae Perret Versio 3.001 Table des matières Itroductio 1 1 Variables aléatoires 3 1.1 Variables aléatoires discrètes......................... 3 1.1.1 Jets d ue pièce bie

Plus en détail

ANNALES BACCALAURÉAT 2013 MATHÉMATIQUES TERMINALE S. 1. Suites

ANNALES BACCALAURÉAT 2013 MATHÉMATIQUES TERMINALE S. 1. Suites ANNALES BACCALAURÉAT 03 MATHÉMATIQUES TERMINALE S ANNALES 03 TERMINALE S Suites Foctios 9 3 Probabilités 4 Géométrie 9 8 5 Spécialité 34 6 Cocours 44 Suites - : Amérique du Nord 03, 5 poits, o spécialistes

Plus en détail

Groupe orthogonal d'un espace vectoriel euclidien de dimension 2, de dimension 3

Groupe orthogonal d'un espace vectoriel euclidien de dimension 2, de dimension 3 1 Groupe orthogoal d'u espace vectoriel euclidie de dimesio, de dimesio Voir le chapitre 19 pour l'étude des espaces euclidies et des isométries. État doé u espace euclidie E de dimesio 1, o rappelle que

Plus en détail

Corrigés TD Chapitre 2 : Variables aléatoires sur un univers fini 0 0 0 1/6 0 0 1 0 1/4 0 1/4 0 4 1/6 0 0 0 1/6

Corrigés TD Chapitre 2 : Variables aléatoires sur un univers fini 0 0 0 1/6 0 0 1 0 1/4 0 1/4 0 4 1/6 0 0 0 1/6 Corrigés TD Chapitre : Variables aléatoires sur u uivers fii Exercice : Soit X la VAR défiie par le tableau suivat : x i - - 0 p 6 4 6 4 6 i O ote Y = X ) Détermier la loi cooite de X et Y ) Détermier

Plus en détail

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable Exo7 Topologie Exercices de Jea-Louis Rouget Retrouver aussi cette fiche sur wwwmaths-fracefr * très facile ** facile *** difficulté moyee **** difficile ***** très difficile I : Icotourable Exercice **

Plus en détail

Comportement d'une suite

Comportement d'une suite Comportemet d'ue suite I) Approche de "ses de variatio et de ite d'ue suite" : 7 Soit la suite ( ) telle que = 5 ( + ) 2 Représetos graphiquemet la suite das u pla mui d' u repère. Il suffit de placer

Plus en détail

ANNALES BACCALAURÉAT 2014 MATHÉMATIQUES TERMINALE S 1

ANNALES BACCALAURÉAT 2014 MATHÉMATIQUES TERMINALE S 1 ANNALES BACCALAURÉAT 014 MATHÉMATIQUES TERMINALE S ANNALES BACCALAURÉAT 014 MATHÉMATIQUES TERMINALE S 1 1 Suites 1 Foctios 11 3 Probabilités 4 Géométrie 4 33 5 Spécialité 41 6 Cocours 53 1 Suites 1-1 :

Plus en détail

[http://mp.cpgedupuydelome.fr] édité le 10 juillet 2014 Enoncés 1

[http://mp.cpgedupuydelome.fr] édité le 10 juillet 2014 Enoncés 1 [htt://m.cgeduuydelome.fr] édité le 10 juillet 2014 Eocés 1 Déombremet Exercice 1 [ 01529 ] [correctio] Soiet E et F deux esembles fiis de cardiaux resectifs et. Combie y a-t-il d ijectios de E das F?

Plus en détail

Formulaire de statistiques

Formulaire de statistiques Formulaire de statistiques E. Depiereux G. Vicke B. De Hertogh Javier 009 Formulaire de statistiques I. Statistiques descriptives : Moyee arithmétique : (populatio: m x = µ) (échatillo = x = M x ) 1 i

Plus en détail