Notes de cours Statistique avec le logiciel R

Dimension: px
Commencer à balayer dès la page:

Download "Notes de cours Statistique avec le logiciel R"

Transcription

1 Notes de cours Statistique avec le logiciel R Shuyan LIU Shuyan.Liu@univ-paris.fr http ://samm.univ-paris.fr/shuyan-liu-enseignement Année

2

3 Chapitre Introduction L objectif de ce cours est de mettre en évidence les liens entre toutes les notions en statistique rencontrées dans les années antérieures par les étudiants : statistiques descriptives, variables aléatoires et statistique mathématique. Le logiciel R est utilisé pour illustrer les applications des outils de statistique.. Plan de cours Statistiquesdescriptives GraphiquessousR:personnalisationdesgraphes Modèle linéaire : régression simple et multiple, ANOVA sous R Estimations ponctuelles et par intervalles de confiance Testsparamétriques Testsnonparamétriques OutilsRpourlesvaleursextrêmes.2 Vocabulaire Une statistique -unnombrecalculéàpartirdesobservations -lerésultatdel applicationdeméthode La statistique / Les statistiques -undomaine -lacollectedesdonnées -letraitement(descriptive) -l interprétation(exploratoire) -laprévisionetladécision(décisionnelle).3 Statistique et probabilité Les probabilités sont l outil de base du statisticien, car le hasard intervient à plusieurs niveaux en statistique : la répartition des données, le bruit, etc..

4 2 Introduction.4 Les avantages de R S-PLUS méthodesrécentes multi-plateforme gratuit Installation : http ://

5 .5 Rappel aux lois de probabilités et les statistiques descriptives 3.5 Rappel aux lois de probabilités et les statistiques descriptives Nous prenons la loi uniforme comme exemple pour rappeler les notions des lois de probabilités et les statistiques descriptives. discrète continue Notation Unif(n) Unif[a, b] X 2 {,...,n} [a, b] Masse/Densité IP (X = i) = n 8 0, x <, >< [x] Fdr F (x) =, apple x apple n, >: n, x > n. f(x) = b 8 >< 0, x < a, x a F (x) =, a apple x<b, >: b a, x b. a IE (X) Var (X) Médiane/0.5-quantile.6 Statistique d ordre n + 2 n 2 2 n + 2 a + b 2 (b a) 2 2 a + b 2 La statistique d ordre de rank k d un échantillon est égal à la k-ème plus petite valeur. Étant donné un échantillon X,X 2,...,X n,lesstatistiquesd ordres,notéesx (),X (2),...,X (n), sont donc obtenues par tri croissant. Si on suppose l échantillon X,X 2,...,X n i.i.d. issu d une loi de densité f(x) et de fonction de répartition F,alorsladensitédelak-ème statistique d ordre est Exercice f X(k) (x) = n! (k )!(n k)! F (x)k ( F (x)) n k f(x).. Montrer que les fonctions de répartition de X () et X (n) sont F X() = ( F (x)) n et F X(n) =(F (x)) n. 2. Soit X,X 2,...,X n un n-échantillon i.i.d. de loi Unif[a, b]. Montrer que X () et X (n) sont respectivement les estimateurs du maximum de vraisemblance de a et b.

6 4 Introduction Dans la suite, on va présenter des applications de statistiques d ordre afin de rappeler quelques sujets de statistique inférentielle : les estimations paramétriques, les tests statistiques, les convergences des suites de v.a., etc.. Les statistiques d ordre peuvent être utilisées pour estimer les paramètres. Par exemple, soit X,X 2,...,X n une suite de v.a. i.i.d. de loi gaussienne d espérance µ et de variance 2 inconnus. On peut estimer µ et en utilisant les statistiques suivantes ˆµ = X (dn 0.5e) et ˆ =(X (dn 0.84e) X (dn 0.6e) )/2. () La figure. montre que la moyenne et la médiane convergent toutes deux vers l espérance réelle pour la loi gaussienne, tandis que seule la médiane converge pour la loi de Cauchy. Moyenne, Normale Moyenne, Cauchy m Moyenne empirique Espérance réelle Intervalle de confiance mc Moyenne empirique Médiane réelle Index Index Médiane, Normale Médiane, Cauchy med - 3 Médiane empirique Espérance réelle Intervalle de confiance med Médiane empirique Médiane réelle Intervalle de confiance Index Index Figure. Convergence de moyenne et médiane empiriques pour la loi gaussienne et la loi de Cauchy Les intervalles de confiance de médiane dans la figure. sont calculés avec le théorème central limite suivant p p( p) n(x(dn pe) q p )!N 0, (f(f (p))) 2 où q p est le quantile d ordre p réel, f(x) et F (x) sont la densité est la fonction de répartition de X. Code R

7 .6 Statistique d ordre 5 n = 00;x = rnorm(n);m = cumsum(x)/(:n);v = ;q = qnorm(0.975) ic = m+q*sqrt(v)/sqrt(:n);ic2 = m-q*sqrt(v)/sqrt(:n) plot(m,type="l");abline(h=0,col="red") lines(ic,col="blue",lty="dotted");lines(ic2,col="blue",lty="dotted") xc = rcauchy(n,0,);mc = cumsum(xc)/(:n) plot(mc,type="l");abline(h=0,col="red") med = rep(0,n);for (i in :n) med[i] = quantile(x[:i],probs=0.5) p = 0.5;v = p*(-p)/(dnorm(qnorm(p)))^2 ic = med+q*sqrt(v)/sqrt(:n);ic2 = med-q*sqrt(v)/sqrt(:n) plot(med,type="l");abline(h=0,col="red") lines(ic,col="blue",lty="dotted");lines(ic2,col="blue",lty="dotted") for (i in :n) med[i] = quantile(xc[:i],probs=0.5) v = p*(-p)/(dcauchy(qcauchy(p)))^2 # les calculs de ic et ic2 et le code de plot pour la loi de Cauchy # sont identiques que ceux dans le cas gaussien Exercice. Pourquoi la moyenne empirique de loi de Cauchy ne converge pas? 2. Pourquoi ˆ défini dans () estunestimateurde?peutonl utiliserpourestimer l écart-type d une loi uniforme? 3. Proposer un estimateur d écart-type d une loi uniforme en utilisant les statistiques d ordre et vérifier la convergence avec l étude de simulation. 4. Écrire un programme en R pour illustrer la convergence d estimateur ˆ défini dans (). Une deuxième utilisation de statistiques d ordre est le diagramme quantile-quantile. C est un outil graphique qui permet d évaluer la pertinence de l ajustement d une loi de probabilités. À l issue d une enquête statistique, on soupçonne celle-ci de suivre une distribution classique, parexemplelaloigaussienne.àpartirdelasériestatistiqueob- servée, on calcule alors un certain nombre de quantiles q i.silasériestatistiquesuit n+ bien la loi théorique choisie, on devrait avoir les quantiles observés X (dn i e) égaux aux quantile q i n+ = F ( i n+ ) associés au modèle théorique. On place alors le nuage de point (X (dn i e),f ( i )). En abscisse se trouvent donc les quantiles théoriques et en ordonnée les quantiles observés. Si la loi théorique choisie est pertinente, les points doivent se n+ n+ positionner suivant la première diagonale. Code R x = rnorm(00) n+

8 6 Introduction Norm~Norm T(2)~Norm Unif~Norm Sample Quantiles Sample Quantiles Sample Quantiles Theoretical Quantiles Theoretical Quantiles Theoretical Quantiles Figure.2 Diagramme quantile-quantile des données issues de loi gaussienne, loi de Student et loi uniforme qqnorm(x,main="norm~norm");qqline(x, col = 2) y = rt(00,df=2) qqnorm(y,main="t(2)~norm");qqline(y, col = 2) z = runif(00) qqnorm(z,main="unif~norm");qqline(z, col = 2) qqplot(x, rt(00,df=2));qqline(x, col = 2) La troisième application de statistiques d ordre est les tests d adéquation. Par exemple, le test de normalité, test de Shapiro-Wilk, peut être interprété avec un diagramme quantilequantile. Le test Shapiro-Wilk teste l hypothèse nulle selon la quelle un échantillon est issu d une loi normale. La statistique de test est W = (P n i= a ix (i) ) 2 P n i= (x i x) 2 où x (i) désigne la i-ème statistique d ordre, a i sont des constantes générées à partir de la moyenne et de la matrice de variance co-variance des quantiles d un échantillon de taille n suivant la loi normale. La statistique W peut être interprétée comme le coefficient de détermination entre la série des quantiles générés à partir de la loi normale et les quantiles empiriques obtenus à partir des données. Plus W est élevé, plus la compatibilité avec la loi normale est crédible. Pour tester l adéquation d un échantillon à une loi qui n est pas nécessairement normale, on peut utiliser le test de Kolmogorov-Smirnov (KS). Ce test repose sur les propriétés des fonctions de répartition empiriques. Soit X,X 2,...,X n une suite de n v.a. i.i.d.. La fonction de répartition empirique de cet échantillon est définie par ˆF n (x) = n 8 nx < I {Xi applex}(x) = : i= 0, x < X (), k n, X (k) apple x<x (k+), k =,...,n,, x X (n). (2)

9 .6 Statistique d ordre 7 La figure.3 présente la fonction de répartition empirique d un 0-échantillon de loi uniforme [0, ]. Onalaconvergencesuivante p n sup ˆF n (x) F (x)!k x où K est une v.a. de loi de Kolmogorov. Notons la statistique D n =sup x ˆF n (x) F (x). Si l échantillon provient bien de la loi donnée F (x), D n devrait être petite. La région critique, rejet de l adéquation, s écrit donc p ndn >K où IP ( p nd n <K )=. ecdf(x) Fn(x) x Figure.3 Fonction de répartition empirique d un 0-échantillon de loi uniforme [0, ] Code R x = runif(0);fn = ecdf(x);z = seq(0,,0.0) plot(fn,verticals = TRUE, do.points = FALSE) lines(z,punif(z),col="red",lwd=2) x = rnorm(50);y = runif(50);ks.test(x, y)

10 8 Introduction Exercice. Soit X,X 2,...,X n une suite de n v.a. i.i.d.. La fonction de répartition de X i est F (x). Soit ˆF n (x) la fonction de répartition empirique définie par (2). a) Calculer l espérance et la variance de ˆF n (x) en fonction de F (x). b) Démontrer que pour tout x 2 R, ˆFn (x) P! F (x). n! c) Montrer que pour tout x 2 R, ˆFn (x) vérifie un théorème de limite centrale que l on établira. d) À partir d un contre-exemple, montrer que la convergence précédente n a plus lieu en général. 2. Un vigneron veut savoir quelle est la contenance moyenne des bouteilles qu il produit. Il effectue pour cela une mesure sur un échantillon de 0 bouteilles et obtient, en centilitres, les volumes suivants Il déduit que la moyenne empirique est Supposonsquelacontenanced une bouteille prise au hasard dans le production est distribuée selon une loi normale de moyenne µ et de variance 2.Alorspeutoncroirequeµ =75? a) 2 =. b) 2 est inconnue..7 Rappel aux tests statistiques Un test statistique permet de décider entre deux hypothèses H 0 et H. Cette décision se fera à partir d une réalisation d un échantillon. On associe à un test un niveau, ou risque de première espèce (généralement entre % et 0%). Une fois que le niveau est fixé on peut en déduire la région de rejet..7. Construction d un test. Choix du niveau Un choix standard est =5%.Poursavoirplussurcettenormeofficieuse,voirla section 2.4 La canonisation du 5% dans[]. 2. Choix des hypothèses H 0 et H On veut tester l appartenance du paramètre àunensembledevaleurs 0.Onforme donc le test H 0 : 2 0 contre H : 2, où 0 \ = ;. Unehypothèseestditesimplesielleestassociéeàunsingleton,c est-àdire H 0 : = 0 ou H : =,sinonelleseraditemultiple,oubiencomposite.sih est

11 .7 Rappel aux tests statistiques 9 multiple de la forme > 0 ou < 0,onparleradetestunilatéral.SiH est multiple de la forme 6= 0 on parlera de test bilatéral. 3. Choix de la statistique de test La statistique est une quantité calculée à partir d un échantillon qui suit une loi connue sous l hypothèse H 0.OnnoteT la statistique théorique la variable aléatoire qui suit la loi de statistique choisie, ˆT la statistique empirique la statistique calculée à partir de la réalisation de l échantillon. 4. Détermination de la région de rejet La région de rejet, notée W,estl ensembledevaleurauquellastatistiquechoisie appartient sous l hypothèse H 0 avec la probabilité égale à, i.e. IP (T 2 W H 0 )=. Autrement dit si H 0 est vraie la statistique T apeudechanced êtredansw.doncsi la statistique calculée ˆT fait partie de W,onalaraisonsuffisantepourrejeterH 0,d où vient le nom la région de rejet. 5. Conclusion pour la réalisation de l échantillon On calcule la statistique ˆT et compare avec la région de rejet ; La décision est prise de façon suivante. rejet de H0 si ˆT 2 W, acceptation de H 0 si ˆT /2 W. Remarque. Un test a le plus souvent pour but de rejeter H 0 plutôt que de choisir entre deux hypothèses, puisque accepter H 0 ne veut pas dire que cette hypothèse est vraie mais qu il n y pas de raison suffisante pour la rejeter. Rejeter H 0 est donc beaucoup riche en information que l accepter. C est pour cela que dans le cas de rejet on dit que le test est significatif. Les deux hypothèses ne sont donc pas interchangeables. Un exemple simple est présenté ci dessous pour illustrer la construction d un test et en séduire l intérêt de la notion p-value..7.2 Exemple simple On dispose d un échantillon gaussien X,...,X n de loi N (µ, veut réaliser le test suivant, 2 ) avec µ inconnu et on H 0 : µ = m contre H : µ 6= m, pour une valeur m donnée. On choisit intuitivement la statistique de test X P = n n i= X i. On sait que sous H 0, X est distribuée suivant une loi gaussienne N (µ, 2 /n), ainsi pn ( X m) N(0, ). Soitunniveau =5%.Ontrouvedanslatabledeloigaussiennecentrée et réduite le quantile q 97.5% =.96, i.e. IP ( p n( X m) <.96 H0 )= On peut bien sûr choisir une autre statistique, par exemple X.Qu obtient-on?

12 0 Introduction Puisque le test est bilatéral, on déduit ainsi, IP ( p n X m.96 H0 )=0.05, IP ( X 2 (,m.96 / p n) [ (m +.96 / p n, ) H 0 )=0.05. La région de rejet est donc W =(,m.96 / p n) [ (m +.96 / p n, ). Notons ˆ X la moyenne empirique calculée à partir d une réalisation de l échantillon. La décision est la suivante. ( rejet de H 0 si ˆ X <m.96 / p n ou ˆ X >m+.96 / p n, acceptation de H 0 si m.96 / p n apple ˆ X apple m +.96 / p n. Cela veut dire qu on rejettera l hypothèse H 0 : µ = m si la moyenne observée est loin de m. Leniveau est la probabilité de commettre une erreur qu on rejette H 0 alors qu elle est vraie. Autrement dit le risque de rejeter à tort l hypothèse nulle est 5%. Remarquons que la région de rejet est liée au choix du niveau. Pourunniveau =0%on obtient la région de rejet suivante W =(,m.64 / p n) [ (m +.64 / p n, ), qui inclut celle de =5%.Ainsipourtous ˆ X 2 (m.96 / p n, m.64 / p n) [ (m +.64 / p n, m +.96 / p n), l hypothèse H 0 sera rejetée si =0%,maisacceptéesi =5%. C est-à-dire, la décision du test dépend non seulement des observations, mais aussi du niveau. Plus le niveau choisi est petit, plus il est difficile d obtenir le résultat significatif. Rappelons que le niveau est en fait le risque seuil, en dessous duquel on est prêt à rejeter H 0.Unrisquede5% veut dire que dans 5% des cas quand H 0 est vraie, l expérimentateur se trompera et la rejettera. Mais le choix du seuil à employer dépendra de la certitude désirée et de la vraisemblance des alternatives. On souhaite donc d obtenir le résultat qui est indépendant du risque seuil et permet de choisir le risque seuil a posteriori..7.3 La p-value La p-value ou niveau de signification est la valeur critique de qui fait basculer le résultat du test. Elle dépend uniquement de la réalisation de l échantillon et permet de faire la décision avec le niveau choisi arbitrairement. On a rejet de H0 si >p-value, acceptation de H 0 si <p-value. La p-value est en fait la valeur la plus petite de qui permet de rejeter H 0.Silap-value est plus grande que choisi a priori, le test est non concluant, ce qui revient à dire que

13 .7 Rappel aux tests statistiques l on ne peut rien affirmer. Prenons l exemple du test bilatéral présenté précédemment, la p-value peur être calculée, p p n n p-value =IP X m ˆ X m H0. C est la probabilité, en supposant que H 0 est vraie, d obtenir une valeur de la variable de décision X m au moins aussi grande que la valeur de la statistique que l on a obtenue avec notre échantillon ˆ X m. Puisque sous H0,ona pn ( X m) N(0, ). En notant N (0, ) une variable aléatoire gaussienne standard, on a p-value =IP N (0, ) p n ˆ X m.

14 2 Introduction

15 Chapitre 2 Modèle linéaire Notre but est d étudier la relation de détermination de Y par k variables explicatives X (),...,X (k), Y i = µ + X () i + 2 X (2) i + + k X (k) i + " i, i =,...,n. Il s en suit l écriture matricielle suivante Y X () X (2) X (k) B C B A A Y n X n () X n (2) X n (k) ou encore 0 Y = X + " avec = µ. k 0 C A et X = µ. k 0 C A + ". " n C A X () X (2) X (k)... X n () X n (2) X n (k) Le vecteur aléatoire " appelé erreur du modèle vérifie les 4 postulats suivants : pour tous i =,...,n,. IE (" i )=0 2. Var (" i )= 2 3. " i sont i.i.d. de loi gaussienne. 4. X i sont déterministes. 2. Régression linéaire simple Pour le modèle linéaire simple, i.e. k =,lesestimateurssontlessuivants P ˆ Cov (Y,X) n = Var (X), ˆµ = Ȳ ˆ i= X, ˆ2 = ˆ"2 i n 2 C A. P où Cov (Y,X) = n n i= (Y i et Ȳ = P n n i= Y i. Ȳ )(X i X), Var(X) = n P n i= (X i 3 X) 2, X = n P n i= X i

16 4 Modèle linéaire On a les propriétés P suivantes. 2 Xi 2. ˆµ N µ, n 2 Var (X) 2. ˆ 2 N, nvar (X) 3. Cov (ˆµ, ˆ) 2 X = ˆ2(n nvar (X) 2) 4. 2 (n 2) 2 5. (ˆµ, ˆ) et ˆ2 sont indépendantes Var (Ŷi) = + (X i X) 2 n Var X 7. Sous l hypothèse nulle : = 0, la statistique ˆt = ˆ ˆ ˆ suit la loi T (n ˆ2 ˆ2ˆ = nvar X. P n 8. Sous l hypothèse nulle : =0,lastatistique ˆF i= =(n 2) P (Ŷi n i= (Y i F (,n 2). 9. L intervalle de confiance au niveau pour IE (Y i ) est apple q Ŷ i t n 2 ( /2) dvar (Ŷi), Ŷi + t n q 2 ( /2) dvar (Ŷi). Ȳ ) 2 2), où suit la loi Ŷ i ) 2 0. Notons Yi 0 la nouvelle observation indépendante des premières observations. L intervalle de confiance au niveau pour Yi 0 est apple q Ŷ i t n 2 ( /2) dvar (Ŷi)+ˆ2, Ŷi + t n q 2 ( /2) dvar (Ŷi)+ˆ2 où Var d ˆ2 (Ŷi) = + (X i X) 2 n Var X à n 2 degrés de liberté. Exercice et t n 2 ( /2) est le /2-quantile d une loi de Student. Montrer que ˆ2(n 2) 2 suit la loi 2 (n 2). 2. Montrer que Ŷi IE (Y i ) q dvar (Ŷi) suit la loi T (n 2). 3. Montrer que Y 0 i Ŷ i q suit la loi T (n 2). dvar (Ŷi)+ˆ2

17 2.2 Un jeu de données Un jeu de données On considère un jeu de données (Y,X) où Y représente la tension artérielle et X représente l âge. Y X tension tension Y i Y^ i Y (Y i Y^ i) 2 = SCR (Y^ i Y) 2 = SCE age age Figure 2. Nuage de points des données Tension Age, droite de régression, SCE et SCR Commentaires du graphique : Latensionartérielleaugmenteavecl âge. Lespointsdugraphesontpresquealignés.

18 6 Modèle linéaire Sorties de l estimation des paramètres traitée par R Call: lm(formula = tension ~ age, data = Tens) Residuals: Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) ** age *** --- Signif. codes: 0 *** 0.00 ** 0.0 * Residual standard error: on 3 degrees of freedom Multiple R-squared: ,Adjusted R-squared: F-statistic: 80.8 on and 3 DF, p-value: Les sorties de l estimation des paramètres sont expliquées dans la table suivante. Estimate Std. Error t value Pr(> t ) (Intercept) ˆµ ˆˆµ ˆt µ =ˆµ/ˆˆµ IP ( t n 2 > ˆt µ ) très significative age ˆ ˆ ˆ ˆt = ˆ/ˆ ˆ IP ( t n 2 > ˆt ) hautement significative Residual standard error ˆ Multiple R-squared R 2 = SCT SCE Adjusted R-squared R ajusté 2 = SCR /n k SCT /n F-statistic ˆF =(n k ) SCE SCR p-value IP (F (k, n k ) > ˆF ) Sorties de l analyse de la variance traitée par R Analysis of Variance Table Response: tension Df Sum Sq Mean Sq F value Pr(>F) age *** Residuals Signif. codes: 0 *** 0.00 ** 0.0 * Les sorties de l analyse de la variance sont expliquées dans la table suivante. Df Sum Sq Mean Sq F value Pr(>F) age SCE SCE / ˆF IP (F (,n k ) > ˆF ) Residuals n k SCR SCR /(n k )

19 2.2 Un jeu de données 7 P n Pi= (Ŷi n Pi= (Y i n i= (Y i Ȳ ) 2 := SCE Ŷ i ) 2 := SCR Ȳ ) 2 := SCT Équation d analyse de variance : SCT = SCE + SCR Code R age=c(35,45,55,65,75);tension=c(4,24,43,58,66) reg=lm(tension~age);summary(reg);anova(reg) Dans les sorties d exemple traité par R les valeurs de Pr(> t ) et Pr(>F) donnent directement les résultats de test. C est un indicateur de plausibilité de l hypothèse H 0 qui prend une valeur comprise entre 0 et. Plus cette valeur est élevée, plus il sera raisonnable de retenir l hypothèse H 0. significativedèslorsque Pr(> t ) < 0.05 trèssignificativedèslorsque Pr(> t ) < 0.0 hautementsignificativedèslorsque Pr(> t ) < 0.00 Il peut être intéressant de tester la position des paramètres par rapport à des valeurs particulières, ce qu autorise le test de Student, comme l indique le tableau ci dessous. test unilatéral droit test unilatéral gauche test bilatéral H 0 : = 0 contre H : > o 0 W = nˆt = ˆ 0 >t ˆ ˆ avec =IP(t n k >t ) H 0 : = 0 contre H : < o 0 W = nˆt = ˆ 0 <t ˆ ˆ avec =IP(t n k <t ) H 0 : = 0 contre H : o 6= 0 W = nˆt = ˆ 0 >t ˆ ˆ avec =IP( t n k >t ) La notation désigne le coefficient j de la variable X (j) ou le terme constant µ du modèle linéaire estimé par la MMCO. Remarque 2. Par symétrie de la loi de Student, on a =IP(t n k >t )=IP(t n k < t ). Ainsi dans le test unilatéral gauche, la région de rejet peut s écrire W = nˆt = ˆ 0 ˆ ˆ avec =IP(t n k >t ). < t o Exercice. Comment calculer le coefficient de détermination à partir de la table d analyse de la variance? Vérifier R 2 en utilisant les sorties de l appel anova(reg). 2. Le coefficient est il significativement égal à?supérieurà?inférieurà.5?

20 8 Modèle linéaire Avant toute analyse des estimations, il faut examiner les résidus ˆ" i pour voir si les présupposés de la régression sont vérifiés. On examine ici deux graphiques : graphiquedesrésiduscontrelesvaleursajustées.ilspeuventmontrerdeserreurs dans la spécification de la moyenne ; Q-Qplotdenormalité. Residuals vs Fitted Normal Q-Q Residuals Standardized residuals Fitted values Theoretical Quantiles Figure 2.2 Graphique des résidus contre les valeurs ajustées et Q-Q plot de normalité Àpartirdesparamètresestimésˆµ, ˆ et ˆ, onsimule00 jeux de données selon le modèle Y i =ˆµ + ˆX i + " i où " i N(0, ˆ2). Lesdonnéessimuléessontconsidéréescomme les observations obtenues par les expériences différentes. La méthode des moindres carrés est appliquée à chaque jeu pour obtenir les estimations différentes de µ et.onobtient ainsi 00 droites de régression. On compare les intervalles de confiance obtenus à partir du jeu de données original et les résultats de simulation. La figure 2.3 présente les résultats de cette étude de simulation. Code R plot(age,tension,type="p");abline(reg,col="red") mu=reg$coef[];beta=reg$coef[2];sig=summary(reg)[[6]] # simuler 00 jeux de données for (i in :00){ y=mu+beta*age+rnorm(5,0,sig) reg2=lm(y~age) points(age,y,col="green") abline(reg2,col="cyan") } points(age,tension,type="p");abline(reg,col="red",lwd=2) # prediction x = as.data.frame(cbind(tension,age)) p=predict(reg,x,interval="confidence",level=0.8,se.fit=true)

21 2.2 Un jeu de données 9 p2=predict(reg,x,interval="prediction",level=0.8,se.fit=true) # intervalle de confiance points( p$fit[,2] ~ age, type= l, lty="dotted") points( p$fit[,3] ~ age, type= l, lty="dotted") # intervalle de prédiction points( p2$fit[,2] ~ age, type= l, lty="dashed" ) points( p2$fit[,3] ~ age, type= l, lty="dashed" ) legend("topleft", c("données observées","données simulées","régression avec les observées","régression avec les simulées","bande de confiance", "Bande de prédiction"), lwd=c(,,2,,,), lty=c(-,-,,,3,2),col=c("black", "green","red","cyan","black","black"),pch=c(,,na,na,na,na),cex=0.8) tension données observées données simulées régression avec les observées régression avec les simulées Bande de confiance Bande de prédiction age Figure 2.3 Nuage de points, droites de régression et intervalles de confiance

22 20 Modèle linéaire 2.3 Étude de cas : AirPassengers Notons Y i les nombres de passagers mensuels, t i la variable de temps. On commence par les trois modèles suivants.. Y i = µ + t i + " i 2. log Y i = µ + t i + " i 3. log Y i = µ + t i + 2 (t i t) 2 + " i Code R data(airpassengers); AP = AirPassengers; AP; plot(ap, ylab = "Passengers (000 s)") # mod temps = time(ap); mod=lm(ap~temps); summary(mod) shapiro.test(residuals(mod)) par(mfcol=c(3,3)) plot(mod,which=) plot(residuals(mod),type="l");abline(h=0,col="red") plot(mod,which=2) # mod2 mod2=lm(log(ap)~temps); summary(mod2); shapiro.test(residuals(mod2)) plot(mod2,which=) plot(residuals(mod2),type="l");abline(h=0,col="red") plot(mod2,which=2) # mod3 temps = time(ap); t=(temps-mean(temps))^2; mod3=lm(log(ap)~temps+t); summary(mod3) shapiro.test(residuals(mod3)) plot(mod3,which=) plot(residuals(mod3),type="l");abline(h=0,col="red") plot(mod3,which=2) Les résultats de l estimation et du test sont résumés dans le tableau suivant. mod mod2 mod3 Code en R AP temps log(ap) temps log(ap) temps+(temps-mean(temps))ˆ2 Modèle Y i = µ + t i + " i log Y i = µ + t i + " i log Y i = µ + t i + 2 (t i t) 2 + " i Estimation ˆµ = 62056, ˆ =3.89 ˆµ = 230, ˆ =0.2 ˆµ = 230, ˆ =0.2, ˆ2 = R (0.8535) (0.863) (Ŷi, ˆ" i ) non constante parabolique pas de remarque QQ-plot courbure évidente presque aligné presque aligné Shapiro Test

23 2 2.3 Étude de cas : AirPassengers Theoretical Quantiles Standardized residuals Theoretical Quantiles AP F M A M J J 2 Theoretical Quantiles Figure 2.4 Étude de résidus pour les trois modèles J 40 Normal Q-Q Standardized residuals Index Normal Q-Q Normal Q-Q - 00 Index Index residuals(mod3) Fitted values -0. residuals(mod2) Fitted values -00 residuals(mod) 0 Standardized residuals Residuals 4.8 Fitted values Residuals Residuals vs Fitted Residuals vs Fitted Residuals Residuals vs Fitted A S Figure 2.5 Month plot du trafic O N D

24 22 Modèle linéaire Pour comprendre la saisonnalité, nous examinons le month plot du trafic. La figure 2.5 montre un diagramme séquentiel pour chacune des saisons supposées de la série. S il n y avant pas d effet saisonnier, ces 2 chronogrammes se ressembleraient. On note que les chronogrammes sont presque droits et parallèles. Juillet montre la plus forte activité. Janvier, février et novembre sont les mois de plus faible activité. D après le month plot, on propose le modèle suivant, log Y i,j = µ j + t i,j + 2 (t i,j t) 2 + " i,j, i :année, j :mois. La forme matricielle du modèle est la suivante 0 0 Y, 0 0 Y, Y,2 0 0 log. = Y 2, 0 0 Y 2,2 0 0 B C C..... A 0 0 Y 2,2 µ. µ 2 C A + t +(t t) ". 2.4 Principales lois et propriété de vecteurs gaussiens utilisées en modèle linéaire Dans le cadre du modèle linéaire, nous allons essentiellement utiliser des lois de probabilités suivantes. Loi du 2 à n degrés de liberté Soient X,...,X n n v. a. indép. de loi N (0, ), alors S = X X 2 n suit une loi du 2 à n degrés de liberté, notée 2 (n). Loi de Student à n degrés de liberté La loi de Student à n degrés de liberté, notée T (n), estlaloiduquotient T = N p S/n où N suit une loi N (0, ) et S suit une loi 2 (n), N et S étant deux v. a. indép.. Loi de Fisher à n et n 2 degrés de liberté Soient S et S 2 deux v. a. indép. de loi respectives 2 (n ) et 2 (n 2 ).Alorslequotient F = S /n S 2 /n 2

25 2.4 Principales lois et propriété de vecteurs gaussiens utilisées en modèle linéaire 23 suit une loi de Fisher à n et n 2 degrés de liberté, notée F (n,n 2 ). Voici une propriété de vecteurs gaussiens que nous utilisons le plus. Théorème de Cochran Soient E et E 2 deux sous-espaces vectoriels orthogonaux de E =IR d de dimensions respectives k et k 2 et soit Y un vecteur aléatoire de IR d de loi normale centrée isotrope de variance 2.AlorsP E (Y ) et P E2 (Y ) sont deux v. a. gaussienne centrées indépendantes et kp E (Y )k 2 (resp. kp E2 (Y )k 2 2 )estuneloi 2 2 (k ) (resp. 2 (k 2 )).

26 24 Modèle linéaire

27 Chapitre 3 Méthodes pour générer des données aléatoires Rpeutgénérerdesdonnéesaléatoirespourungrandnombredefonctionsdedensité de probabilité. Les fonctions sont de la forme rfunc(n, p, p2,...) où func indique la loi de probabilité, n est le nombre de données générées et p, p2,... sont les valeurs des paramètres de la loi. Le tableau suivant donne la liste des lois de probabilité existantes en R. nom de loi nom en R paramètres beta beta shape shape2 ncp binomial binom size prob Cauchy cauchy location scale chi-squared chisq df ncp exponential exp rate F f df df2 ncp gamma gamma shape scale geometric geom prob hypergeometric hyper m n k log-normal lnorm meanlog sdlog logistic logis location scale negative binomial nbinom size prob normal norm mean sd Poisson pois lambda Student t df ncp uniform unif min max Weibull weibull shape scale Wicoxon wilcox m n Code R n = 0000; df = 0; r = rt(n, df) par(mfrow=c(,2)); hist(r, breaks=50, freq=f, main="df=0") x = seq(-4, 4, 0.0); y = dt(x, df); lines(x, y, col="red") 25

28 26 Méthodes pour générer des données aléatoires df = ; r = rt(n, df); h = hist(r[r>-4 & r<4], breaks=50, plot=f) h$density = h$density*(pt(4,df)-pt(-4,df)); plot(h, freq=f, main="df=") y = dt(x, df); lines(x, y, col="red") Pour simuler les échantillons des populations finies on peut utiliser la fonction sample. Code R sample(0:, size=0, replace=t); sample(0:00, size=6, replace=f); sample(letters) x = sample(:3, size=00, replace=t, prob=c(0.2,0.3,0.5)); table(x) 3. Méthode de la transformée inverse Soit F la fonction de répartition d une variable aléatoire continue. Si la variable U a une loi uniforme sur [0, ] alors la variable F (U) acommeloif où F est la fonction inverse de F,c.a.d.F (F (x)) = x. En utilisant ce résultat, pour générer une donnée aléatoire de loi F,ongénèred abordunedonnéedeloiunif[0, ], ensuiteonappliquela fonction F à la donnée simulée. Cette méthode est applicable seulement si la fonction inverse F est calculable. Exemple Loi exponentielle Code R n = 000; r = rexp(n,); x = seq(0,0,0.0); y = dexp(x,) par(mfrow=c(,2)) hist(r,freq=f,main="rexp"); lines(x,y,col="red") r = -log(runif(n)) hist(r,freq=f,main="inverse"); lines(x,y,col="red") Exercice En utilisant la méthode de la transformée inverse, générer les données aléatoires dont les densités de probabilité sont. f(x) =3x 2 I (0,) (x) ; 2. f(x) =x 2 I [,) (x). 3.2 Méthode de rejet La méthode de rejet est utilisée pour engendrer indirectement une variable aléatoire X, dedensitédeprobabilitéf, lorsqu onnesaitpassimulerdirectementlaloidedensité

29 3.2 Méthode de rejet 27 de probabilité f. Soit g(x) la densité d une variable aléatoire pour laquelle on connaît un algorithme de génération et qui, à une constante a près, majore f(x) partout, c est-à-dire 9a 2 R +, 8x, f(x) apple a g(x). Dans un premier temps, on tire un point (X, Y ) distribué selon la loi g(x) en abscisse et uniformément sur [0, ag(x)] en ordonnée. Si Y apple f(x), ongardex, sinonontireun autre point. On réitère jusqu à ce que la condition Y apple f(x) soit remplie. L algorithme consiste en trois étapes.. Boucler Tirer X de densité g(x) ; Tirer U selon la loi uniforme U[0, ag(x)], indépendammentdex ; 2. Tant que f(x) <U,reprendreen; 3. Accepter X comme un tirage aléatoire de densité de probabilité f. Exemple Loi de Cauchy On veut simuler les données de loi dont la densité est définie ci dessous f(x) = La densité de l enveloppe g(x) est la suivante. 8 >< g(x) = >: ( + x 2 ). x 2, x > 4, 6, x apple 4. Il est facile de vérifier que f(x) apple 6/ 2 g(x). Onendéduitlafonctionderépartition de la loi de densité g(x) est 8 x, x < 4, >< F g (x) = x, x apple 4, Code R >: x, x > 4. qg = function(x){if(x < /4){y = -/pi/x}else if ((x >= /4) & (x <= 3/4)){y = 6*(x-/2)/pi}else {y = /pi/(-x)} return(y)} dg = function(x){if(abs(x) <= 4/pi){y = pi/6}else{y = /pi/x/x} return(y)} n = 0000; r = rep(0,n); i =

30 28 Méthodes pour générer des données aléatoires while (i <= n){k = ; y = 2; z=; while (y > z & k < 0^6){u = runif(); u2 = runif(); r[i] = qg(u) y = 6/pi/pi*dg(r[i])*u2 z = /pi/(+r[i]*r[i]) k = k+} if (k < 0^6){i=i+}} probf = function(x){if(x < -4/pi){y = -/pi/x}else if (abs(x) <= 4/pi){y = /2+pi*x/6}else {y = -/pi/x} return(y)} x = seq(-4, 4, 0.0); y = /pi/(+x*x); h = hist(r[r>-4 & r<4], breaks=50, plot=f) h$density = h$density*(probf(4)-probf(-4)); plot(h, freq=f); lines(x, y, col="red") La figure 3. présente l histogramme de 0000 données simulées de loi de Cauchy et la densité réelle. Loi de Cauchy Density r[r > -4 & r < 4] Figure 3. Histogramme de données simulées et la densité réelle

31 3.2 Méthode de rejet 29 Exercice En utilisant la méthode de rejet, générer les données aléatoires dont la densité de probabilité est f(x) = C + x +, où C = et 2D Z D = dx. 0 +x + La densité de l enveloppe g(x) est la suivante. 8 < C, x >s g(x) = x + : K, x apples, où K = C + D +, s =. + 2C D + La constante de majoration a = C/K. Les variables de loi g(x) peuvent être simulées par la méthode de la transformée inverse. La figure 3.2 présente les fonctions de densité de la loi de Cauchy généralisée définie dans l exercice précédent avec différent. y a=.9 a=.5 a=. a=0.7 a= x Figure 3.2 Densité de la loi de Cauchy généralisée avec différent

32 30 Méthodes pour générer des données aléatoires

33 Bibliographie [] Jean-Marc Azaïs et Jean-Marc Bardet, Le modèle linéaire par l exemple : Régression, Analyse de la variance et Plans d expérience illustrés avec R, SAS et Splus. Dunod,

TABLE DES MATIERES. C Exercices complémentaires 42

TABLE DES MATIERES. C Exercices complémentaires 42 TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence

Plus en détail

Notes de cours Statistique avec le logiciel R

Notes de cours Statistique avec le logiciel R Notes de cours Statistique avec le logiciel R Shuyan LIU Shuyan.Liu@univ-paris1.fr http ://samm.univ-paris1.fr/shuyan-liu-enseignement Année 2013-2014 Chapitre 1 Introduction L objectif de ce cours est

Plus en détail

Introduction à la statistique non paramétrique

Introduction à la statistique non paramétrique Introduction à la statistique non paramétrique Catherine MATIAS CNRS, Laboratoire Statistique & Génome, Évry http://stat.genopole.cnrs.fr/ cmatias Atelier SFDS 27/28 septembre 2012 Partie 2 : Tests non

Plus en détail

Exercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015

Exercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015 Exercices M1 SES 214-215 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 215 Les exemples numériques présentés dans ce document d exercices ont été traités sur le logiciel R, téléchargeable par

Plus en détail

Simulation de variables aléatoires

Simulation de variables aléatoires Chapter 1 Simulation de variables aléatoires Références: [F] Fishman, A first course in Monte Carlo, chap 3. [B] Bouleau, Probabilités de l ingénieur, chap 4. [R] Rubinstein, Simulation and Monte Carlo

Plus en détail

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens Chapitre 7 Statistique des échantillons gaussiens Le théorème central limite met en évidence le rôle majeur tenu par la loi gaussienne en modélisation stochastique. De ce fait, les modèles statistiques

Plus en détail

Le Modèle Linéaire par l exemple :

Le Modèle Linéaire par l exemple : Publications du Laboratoire de Statistique et Probabilités Le Modèle Linéaire par l exemple : Régression, Analyse de la Variance,... Jean-Marc Azaïs et Jean-Marc Bardet Laboratoire de Statistique et Probabilités

Plus en détail

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures) CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un

Plus en détail

Analyse de la variance Comparaison de plusieurs moyennes

Analyse de la variance Comparaison de plusieurs moyennes Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction

Plus en détail

Programmes des classes préparatoires aux Grandes Ecoles

Programmes des classes préparatoires aux Grandes Ecoles Programmes des classes préparatoires aux Grandes Ecoles Filière : scientifique Voie : Biologie, chimie, physique et sciences de la Terre (BCPST) Discipline : Mathématiques Seconde année Préambule Programme

Plus en détail

Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques.

Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques. 14-3- 214 J.F.C. p. 1 I Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques. Exercice 1 Densité de probabilité. F { ln x si x ], 1] UN OVNI... On pose x R,

Plus en détail

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE UE4 : Biostatistiques Chapitre 3 : Principe des tests statistiques d hypothèse José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Introduction

Plus en détail

Introduction aux Statistiques et à l utilisation du logiciel R

Introduction aux Statistiques et à l utilisation du logiciel R Introduction aux Statistiques et à l utilisation du logiciel R Christophe Lalanne Christophe Pallier 1 Introduction 2 Comparaisons de deux moyennes 2.1 Objet de l étude On a mesuré le temps de sommeil

Plus en détail

3 Approximation de solutions d équations

3 Approximation de solutions d équations 3 Approximation de solutions d équations Une équation scalaire a la forme générale f(x) =0où f est une fonction de IR dans IR. Un système de n équations à n inconnues peut aussi se mettre sous une telle

Plus en détail

3. Conditionnement P (B)

3. Conditionnement P (B) Conditionnement 16 3. Conditionnement Dans cette section, nous allons rappeler un certain nombre de définitions et de propriétés liées au problème du conditionnement, c est à dire à la prise en compte

Plus en détail

Introduction à la Statistique Inférentielle

Introduction à la Statistique Inférentielle UNIVERSITE MOHAMMED V-AGDAL SCIENCES FACULTE DES DEPARTEMENT DE MATHEMATIQUES SMI semestre 4 : Probabilités - Statistique Introduction à la Statistique Inférentielle Prinemps 2013 0 INTRODUCTION La statistique

Plus en détail

1 Complément sur la projection du nuage des individus

1 Complément sur la projection du nuage des individus TP 0 : Analyse en composantes principales (II) Le but de ce TP est d approfondir nos connaissances concernant l analyse en composantes principales (ACP). Pour cela, on reprend les notations du précédent

Plus en détail

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour francour@unice.fr Une grande partie des illustrations viennent

Plus en détail

Statistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année 2010-2011

Statistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année 2010-2011 Master 1 Biologie et technologie du végétal Année 010-011 Statistiques Rappels de cours et travaux dirigés (Seul ce document sera autorisé en examen) auteur : Jean-Marc Labatte jean-marc.labatte@univ-angers.fr

Plus en détail

Cours de Tests paramétriques

Cours de Tests paramétriques Cours de Tests paramétriques F. Muri-Majoube et P. Cénac 2006-2007 Licence Ce document est sous licence ALC TYPE 2. Le texte de cette licence est également consultable en ligne à l adresse http://www.librecours.org/cgi-bin/main?callback=licencetype2.

Plus en détail

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3

Plus en détail

Exemples d application

Exemples d application AgroParisTech Exemples d application du modèle linéaire E Lebarbier, S Robin Table des matières 1 Introduction 4 11 Avertissement 4 12 Notations 4 2 Régression linéaire simple 7 21 Présentation 7 211 Objectif

Plus en détail

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers

Plus en détail

Annexe commune aux séries ES, L et S : boîtes et quantiles

Annexe commune aux séries ES, L et S : boîtes et quantiles Annexe commune aux séries ES, L et S : boîtes et quantiles Quantiles En statistique, pour toute série numérique de données à valeurs dans un intervalle I, on définit la fonction quantile Q, de [,1] dans

Plus en détail

Estimation et tests statistiques, TD 5. Solutions

Estimation et tests statistiques, TD 5. Solutions ISTIL, Tronc commun de première année Introduction aux méthodes probabilistes et statistiques, 2008 2009 Estimation et tests statistiques, TD 5. Solutions Exercice 1 Dans un centre avicole, des études

Plus en détail

UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES

UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES Université Paris 13 Cours de Statistiques et Econométrie I UFR de Sciences Economiques Année 2008-2009 Licence de Sciences Economiques L3 Premier semestre TESTS PARAMÉTRIQUES Remarque: les exercices 2,

Plus en détail

Tests du χ 2. on accepte H 0 bonne décision erreur de seconde espèce on rejette H 0 erreur de première espèce bonne décision

Tests du χ 2. on accepte H 0 bonne décision erreur de seconde espèce on rejette H 0 erreur de première espèce bonne décision Page n 1. Tests du χ 2 une des fonctions des statistiques est de proposer, à partir d observations d un phénomène aléatoire (ou modélisé comme tel) une estimation de la loi de ce phénomène. C est que nous

Plus en détail

Introduction à l approche bootstrap

Introduction à l approche bootstrap Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?

Plus en détail

Méthodes de Simulation

Méthodes de Simulation Méthodes de Simulation JEAN-YVES TOURNERET Institut de recherche en informatique de Toulouse (IRIT) ENSEEIHT, Toulouse, France Peyresq06 p. 1/41 Remerciements Christian Robert : pour ses excellents transparents

Plus en détail

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position Arbre de NESI distribution quelconque Signe 1 échantillon distribution symétrique non gaussienne Wilcoxon gaussienne Student position appariés 1 échantillon sur la différence avec référence=0 2 échantillons

Plus en détail

Texte Agrégation limitée par diffusion interne

Texte Agrégation limitée par diffusion interne Page n 1. Texte Agrégation limitée par diffusion interne 1 Le phénomène observé Un fût de déchets radioactifs est enterré secrètement dans le Cantal. Au bout de quelques années, il devient poreux et laisse

Plus en détail

PROBABILITES ET STATISTIQUE I&II

PROBABILITES ET STATISTIQUE I&II PROBABILITES ET STATISTIQUE I&II TABLE DES MATIERES CHAPITRE I - COMBINATOIRE ELEMENTAIRE I.1. Rappel des notations de la théorie des ensemble I.1.a. Ensembles et sous-ensembles I.1.b. Diagrammes (dits

Plus en détail

Principe d un test statistique

Principe d un test statistique Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre

Plus en détail

Introduction à R. Florence Yerly. Dept. de mathématiques, Université de Fribourg (CH) SP 2011

Introduction à R. Florence Yerly. Dept. de mathématiques, Université de Fribourg (CH) SP 2011 Dept. de mathématiques, Université de Fribourg (CH) SP 2011 Qu est ce que R? Un logiciel de statistiques libre et gratuit ; Un logiciel multi-plateforme (UNIX, Windows MacOS X) R permet de faire des calculs

Plus en détail

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Valentin Patilea 1 Cesar Sanchez-sellero 2 Matthieu Saumard 3 1 CREST-ENSAI et IRMAR 2 USC Espagne 3 IRMAR-INSA

Plus en détail

Amphi 3: Espaces complets - Applications linéaires continues

Amphi 3: Espaces complets - Applications linéaires continues Amphi 3: Espaces complets - Applications linéaires continues Département de Mathématiques École polytechnique Remise en forme mathématique 2013 Suite de Cauchy Soit (X, d) un espace métrique. Une suite

Plus en détail

Durée de L épreuve : 2 heures. Barème : Exercice n 4 : 1 ) 1 point 2 ) 2 points 3 ) 1 point

Durée de L épreuve : 2 heures. Barème : Exercice n 4 : 1 ) 1 point 2 ) 2 points 3 ) 1 point 03 Mai 2013 Collège Oasis Durée de L épreuve : 2 heures. apple Le sujet comporte 4 pages et est présenté en livret ; apple La calculatrice est autorisée ; apple 4 points sont attribués à la qualité de

Plus en détail

La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites

La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites La problématique des tests Cours V 7 mars 8 Test d hypothèses [Section 6.1] Soit un modèle statistique P θ ; θ Θ} et des hypothèses H : θ Θ H 1 : θ Θ 1 = Θ \ Θ Un test (pur) est une statistique à valeur

Plus en détail

Données longitudinales et modèles de survie

Données longitudinales et modèles de survie ANALYSE DU Données longitudinales et modèles de survie 5. Modèles de régression en temps discret André Berchtold Département des sciences économiques, Université de Genève Cours de Master ANALYSE DU Plan

Plus en détail

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES LES STATISTIQUES INFERENTIELLES (test de Student) L inférence statistique est la partie des statistiques qui, contrairement à la statistique descriptive, ne se contente pas de décrire des observations,

Plus en détail

Densité de population et ingestion de nourriture chez un insecte vecteur de la maladie de Chagas

Densité de population et ingestion de nourriture chez un insecte vecteur de la maladie de Chagas Fiche TD avec le logiciel : tdr335 Densité de population et ingestion de nourriture chez un insecte vecteur de la maladie de Chagas F. Menu, A.B. Dufour, E. Desouhant et I. Amat La fiche permet de se familiariser

Plus en détail

MÉTHODE DE MONTE CARLO.

MÉTHODE DE MONTE CARLO. MÉTHODE DE MONTE CARLO. Alexandre Popier Université du Maine, Le Mans A. Popier (Le Mans) Méthode de Monte Carlo. 1 / 95 PLAN DU COURS 1 MÉTHODE DE MONTE CARLO 2 PROBLÈME DE SIMULATION Théorème fondamental

Plus en détail

TSTI 2D CH X : Exemples de lois à densité 1

TSTI 2D CH X : Exemples de lois à densité 1 TSTI 2D CH X : Exemples de lois à densité I Loi uniforme sur ab ; ) Introduction Dans cette activité, on s intéresse à la modélisation du tirage au hasard d un nombre réel de l intervalle [0 ;], chacun

Plus en détail

Probabilités III Introduction à l évaluation d options

Probabilités III Introduction à l évaluation d options Probabilités III Introduction à l évaluation d options Jacques Printems Promotion 2012 2013 1 Modèle à temps discret 2 Introduction aux modèles en temps continu Limite du modèle binomial lorsque N + Un

Plus en détail

Principe de symétrisation pour la construction d un test adaptatif

Principe de symétrisation pour la construction d un test adaptatif Principe de symétrisation pour la construction d un test adaptatif Cécile Durot 1 & Yves Rozenholc 2 1 UFR SEGMI, Université Paris Ouest Nanterre La Défense, France, cecile.durot@gmail.com 2 Université

Plus en détail

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION Bruno Saussereau Laboratoire de Mathématiques de Besançon Université de Franche-Comté Travail en commun

Plus en détail

Première partie. Préliminaires : noyaux itérés. MPSI B 6 juin 2015

Première partie. Préliminaires : noyaux itérés. MPSI B 6 juin 2015 Énoncé Soit V un espace vectoriel réel. L espace vectoriel des endomorphismes de V est désigné par L(V ). Lorsque f L(V ) et k N, on désigne par f 0 = Id V, f k = f k f la composée de f avec lui même k

Plus en détail

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/ Recherche opérationnelle Les démonstrations et les exemples seront traités en cours Souad EL Bernoussi Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/ Table des matières 1 Programmation

Plus en détail

Statistiques descriptives

Statistiques descriptives Statistiques descriptives L3 Maths-Eco Université de Nantes Frédéric Lavancier F. Lavancier (Univ. Nantes) Statistiques descriptives 1 1 Vocabulaire de base F. Lavancier (Univ. Nantes) Statistiques descriptives

Plus en détail

Moments des variables aléatoires réelles

Moments des variables aléatoires réelles Chapter 6 Moments des variables aléatoires réelles Sommaire 6.1 Espérance des variables aléatoires réelles................................ 46 6.1.1 Définition et calcul........................................

Plus en détail

Filtrage stochastique non linéaire par la théorie de représentation des martingales

Filtrage stochastique non linéaire par la théorie de représentation des martingales Filtrage stochastique non linéaire par la théorie de représentation des martingales Adriana Climescu-Haulica Laboratoire de Modélisation et Calcul Institut d Informatique et Mathématiques Appliquées de

Plus en détail

Lire ; Compter ; Tester... avec R

Lire ; Compter ; Tester... avec R Lire ; Compter ; Tester... avec R Préparation des données / Analyse univariée / Analyse bivariée Christophe Genolini 2 Table des matières 1 Rappels théoriques 5 1.1 Vocabulaire....................................

Plus en détail

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé Baccalauréat S ntilles-guyane 11 septembre 14 Corrigé EXERCICE 1 6 points Commun à tous les candidats Une entreprise de jouets en peluche souhaite commercialiser un nouveau produit et à cette fin, effectue

Plus en détail

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1 La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1 La licence Mathématiques et Economie-MASS de l Université des Sciences Sociales de Toulouse propose sur les trois

Plus en détail

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

Biostatistiques : Petits effectifs

Biostatistiques : Petits effectifs Biostatistiques : Petits effectifs Master Recherche Biologie et Santé P. Devos DRCI CHRU de Lille EA2694 patrick.devos@univ-lille2.fr Plan Données Générales : Définition des statistiques Principe de l

Plus en détail

Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA

Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA Soutenance de doctorat, sous la direction de Pr. Bilodeau, M. et Pr. Ducharme, G. Université de Montréal et Université

Plus en détail

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre. Université de Nantes Année 2013-2014 L3 Maths-Eco Feuille 6 : Tests Exercice 1 On cherche à connaître la température d ébullition µ, en degrés Celsius, d un certain liquide. On effectue 16 expériences

Plus en détail

Chapitre 3. Les distributions à deux variables

Chapitre 3. Les distributions à deux variables Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles

Plus en détail

Loi binomiale Lois normales

Loi binomiale Lois normales Loi binomiale Lois normales Christophe ROSSIGNOL Année scolaire 204/205 Table des matières Rappels sur la loi binomiale 2. Loi de Bernoulli............................................ 2.2 Schéma de Bernoulli

Plus en détail

Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN

Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN Table des matières. Introduction....3 Mesures et incertitudes en sciences physiques

Plus en détail

Précision d un résultat et calculs d incertitudes

Précision d un résultat et calculs d incertitudes Précision d un résultat et calculs d incertitudes PSI* 2012-2013 Lycée Chaptal 3 Table des matières Table des matières 1. Présentation d un résultat numérique................................ 4 1.1 Notations.........................................................

Plus en détail

3. Caractéristiques et fonctions d une v.a.

3. Caractéristiques et fonctions d une v.a. 3. Caractéristiques et fonctions d une v.a. MTH2302D S. Le Digabel, École Polytechnique de Montréal H2015 (v2) MTH2302D: fonctions d une v.a. 1/32 Plan 1. Caractéristiques d une distribution 2. Fonctions

Plus en détail

BACCALAURÉAT GÉNÉRAL SESSION 2012 OBLIGATOIRE MATHÉMATIQUES. Série S. Durée de l épreuve : 4 heures Coefficient : 7 ENSEIGNEMENT OBLIGATOIRE

BACCALAURÉAT GÉNÉRAL SESSION 2012 OBLIGATOIRE MATHÉMATIQUES. Série S. Durée de l épreuve : 4 heures Coefficient : 7 ENSEIGNEMENT OBLIGATOIRE BACCALAURÉAT GÉNÉRAL SESSION 2012 MATHÉMATIQUES Série S Durée de l épreuve : 4 heures Coefficient : 7 ENSEIGNEMENT OBLIGATOIRE Les calculatrices électroniques de poche sont autorisées, conformément à la

Plus en détail

Le modèle de Black et Scholes

Le modèle de Black et Scholes Le modèle de Black et Scholes Alexandre Popier février 21 1 Introduction : exemple très simple de modèle financier On considère un marché avec une seule action cotée, sur une période donnée T. Dans un

Plus en détail

Relation entre deux variables : estimation de la corrélation linéaire

Relation entre deux variables : estimation de la corrélation linéaire CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence

Plus en détail

Capes 2002 - Première épreuve

Capes 2002 - Première épreuve Cette correction a été rédigée par Frédéric Bayart. Si vous avez des remarques à faire, ou pour signaler des erreurs, n hésitez pas à écrire à : mathweb@free.fr Mots-clés : équation fonctionnelle, série

Plus en détail

Couples de variables aléatoires discrètes

Couples de variables aléatoires discrètes Couples de variables aléatoires discrètes ECE Lycée Carnot mai Dans ce dernier chapitre de probabilités de l'année, nous allons introduire l'étude de couples de variables aléatoires, c'est-à-dire l'étude

Plus en détail

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications A. Optimisation sans contrainte.... Généralités.... Condition nécessaire et condition suffisante

Plus en détail

Méthodes de quadrature. Polytech Paris-UPMC. - p. 1/48

Méthodes de quadrature. Polytech Paris-UPMC. - p. 1/48 Méthodes de Polytech Paris-UPMC - p. 1/48 Polynôme d interpolation de Preuve et polynôme de Calcul de l erreur d interpolation Étude de la formule d erreur Autres méthodes - p. 2/48 Polynôme d interpolation

Plus en détail

Cours 7 : Utilisation de modules sous python

Cours 7 : Utilisation de modules sous python Cours 7 : Utilisation de modules sous python 2013/2014 Utilisation d un module Importer un module Exemple : le module random Importer un module Exemple : le module random Importer un module Un module est

Plus en détail

Exercices - Polynômes : corrigé. Opérations sur les polynômes

Exercices - Polynômes : corrigé. Opérations sur les polynômes Opérations sur les polynômes Exercice 1 - Carré - L1/Math Sup - Si P = Q est le carré d un polynôme, alors Q est nécessairement de degré, et son coefficient dominant est égal à 1. On peut donc écrire Q(X)

Plus en détail

1 Recherche en table par balayage

1 Recherche en table par balayage 1 Recherche en table par balayage 1.1 Problème de la recherche en table Une table désigne une liste ou un tableau d éléments. Le problème de la recherche en table est celui de la recherche d un élément

Plus en détail

LES GENERATEURS DE NOMBRES ALEATOIRES

LES GENERATEURS DE NOMBRES ALEATOIRES LES GENERATEURS DE NOMBRES ALEATOIRES 1 Ce travail a deux objectifs : ====================================================================== 1. Comprendre ce que font les générateurs de nombres aléatoires

Plus en détail

Régression linéaire. Nicolas Turenne INRA nicolas.turenne@jouy.inra.fr

Régression linéaire. Nicolas Turenne INRA nicolas.turenne@jouy.inra.fr Régression linéaire Nicolas Turenne INRA nicolas.turenne@jouy.inra.fr 2005 Plan Régression linéaire simple Régression multiple Compréhension de la sortie de la régression Coefficient de détermination R

Plus en détail

Une introduction. Lionel RIOU FRANÇA. Septembre 2008

Une introduction. Lionel RIOU FRANÇA. Septembre 2008 Une introduction INSERM U669 Septembre 2008 Sommaire 1 Effets Fixes Effets Aléatoires 2 Analyse Classique Effets aléatoires Efficacité homogène Efficacité hétérogène 3 Estimation du modèle Inférence 4

Plus en détail

Initiation au logiciel R

Initiation au logiciel R Université Paris Dauphine Année 2005 2006 U.F.R. Mathématiques de la Décision MAT-6-3 : Statistique exploratoire et numérique (NOISE) Initiation au logiciel R Jean-Michel MARIN Ce document a pour objectif

Plus en détail

Calcul matriciel. Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes.

Calcul matriciel. Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes. 1 Définitions, notations Calcul matriciel Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes. On utilise aussi la notation m n pour le

Plus en détail

STATISTIQUES. UE Modélisation pour la biologie

STATISTIQUES. UE Modélisation pour la biologie STATISTIQUES UE Modélisation pour la biologie 2011 Cadre Général n individus: 1, 2,..., n Y variable à expliquer : Y = (y 1, y 2,..., y n ), y i R Modèle: Y = Xθ + ε X matrice du plan d expériences θ paramètres

Plus en détail

Température corporelle d un castor (une petite introduction aux séries temporelles)

Température corporelle d un castor (une petite introduction aux séries temporelles) Température corporelle d un castor (une petite introduction aux séries temporelles) GMMA 106 GMMA 106 2014 2015 1 / 32 Cas d étude Temperature (C) 37.0 37.5 38.0 0 20 40 60 80 100 Figure 1: Temperature

Plus en détail

Évaluation de la régression bornée

Évaluation de la régression bornée Thierry Foucart UMR 6086, Université de Poitiers, S P 2 M I, bd 3 téléport 2 BP 179, 86960 Futuroscope, Cedex FRANCE Résumé. le modèle linéaire est très fréquemment utilisé en statistique et particulièrement

Plus en détail

Statistiques Descriptives à une dimension

Statistiques Descriptives à une dimension I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des

Plus en détail

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé Baccalauréat ES Pondichéry 7 avril 204 Corrigé EXERCICE 4 points Commun à tous les candidats. Proposition fausse. La tangente T, passant par les points A et B d abscisses distinctes, a pour coefficient

Plus en détail

MODELE A CORRECTION D ERREUR ET APPLICATIONS

MODELE A CORRECTION D ERREUR ET APPLICATIONS MODELE A CORRECTION D ERREUR ET APPLICATIONS Hélène HAMISULTANE Bibliographie : Bourbonnais R. (2000), Econométrie, DUNOD. Lardic S. et Mignon V. (2002), Econométrie des Séries Temporelles Macroéconomiques

Plus en détail

Espérance conditionnelle

Espérance conditionnelle Espérance conditionnelle Samy Tindel Nancy-Université Master 1 - Nancy Samy T. (IECN) M1 - Espérance conditionnelle Nancy-Université 1 / 58 Plan 1 Définition 2 Exemples 3 Propriétés de l espérance conditionnelle

Plus en détail

Commun à tous les candidats

Commun à tous les candidats EXERCICE 3 (9 points ) Commun à tous les candidats On s intéresse à des courbes servant de modèle à la distribution de la masse salariale d une entreprise. Les fonctions f associées définies sur l intervalle

Plus en détail

Table des matières. I Mise à niveau 11. Préface

Table des matières. I Mise à niveau 11. Préface Table des matières Préface v I Mise à niveau 11 1 Bases du calcul commercial 13 1.1 Alphabet grec...................................... 13 1.2 Symboles mathématiques............................... 14 1.3

Plus en détail

I. Polynômes de Tchebychev

I. Polynômes de Tchebychev Première épreuve CCP filière MP I. Polynômes de Tchebychev ( ) 1.a) Tout réel θ vérifie cos(nθ) = Re ((cos θ + i sin θ) n ) = Re Cn k (cos θ) n k i k (sin θ) k Or i k est réel quand k est pair et imaginaire

Plus en détail

Modélisation aléatoire en fiabilité des logiciels

Modélisation aléatoire en fiabilité des logiciels collection Méthodes stochastiques appliquées dirigée par Nikolaos Limnios et Jacques Janssen La sûreté de fonctionnement des systèmes informatiques est aujourd hui un enjeu économique et sociétal majeur.

Plus en détail

Exercices - Fonctions de plusieurs variables : corrigé. Pour commencer

Exercices - Fonctions de plusieurs variables : corrigé. Pour commencer Pour commencer Exercice 1 - Ensembles de définition - Première année - 1. Le logarithme est défini si x + y > 0. On trouve donc le demi-plan supérieur délimité par la droite d équation x + y = 0.. 1 xy

Plus en détail

Théorème du point fixe - Théorème de l inversion locale

Théorème du point fixe - Théorème de l inversion locale Chapitre 7 Théorème du point fixe - Théorème de l inversion locale Dans ce chapitre et le suivant, on montre deux applications importantes de la notion de différentiabilité : le théorème de l inversion

Plus en détail

Intégration et probabilités TD1 Espaces mesurés Corrigé

Intégration et probabilités TD1 Espaces mesurés Corrigé Intégration et probabilités TD1 Espaces mesurés Corrigé 2012-2013 1 Petites questions 1 Est-ce que l ensemble des ouverts de R est une tribu? Réponse : Non, car le complémentaire de ], 0[ n est pas ouvert.

Plus en détail

Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes

Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes Zohra Guessoum 1 & Farida Hamrani 2 1 Lab. MSTD, Faculté de mathématique, USTHB, BP n 32, El Alia, Alger, Algérie,zguessoum@usthb.dz

Plus en détail

Chapitre 5 : Flot maximal dans un graphe

Chapitre 5 : Flot maximal dans un graphe Graphes et RO TELECOM Nancy A Chapitre 5 : Flot maximal dans un graphe J.-F. Scheid 1 Plan du chapitre I. Définitions 1 Graphe Graphe valué 3 Représentation d un graphe (matrice d incidence, matrice d

Plus en détail

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée. ANALYSE 5 points Exercice 1 : Léonie souhaite acheter un lecteur MP3. Le prix affiché (49 ) dépasse largement la somme dont elle dispose. Elle décide donc d économiser régulièrement. Elle a relevé qu elle

Plus en détail

Économetrie non paramétrique I. Estimation d une densité

Économetrie non paramétrique I. Estimation d une densité Économetrie non paramétrique I. Estimation d une densité Stéphane Adjemian Université d Évry Janvier 2004 1 1 Introduction 1.1 Pourquoi estimer une densité? Étudier la distribution des richesses... Proposer

Plus en détail

Statistique inférentielle TD 1 : Estimation

Statistique inférentielle TD 1 : Estimation POLYTECH LILLE Statistique inférentielle TD : Estimation Exercice : Maîtrise Statistique des Procédés Une entreprise de construction mécanique fabrique de pièces demoteurdevoiturepourungrandconstructeur

Plus en détail

Correction de l examen de la première session

Correction de l examen de la première session de l examen de la première session Julian Tugaut, Franck Licini, Didier Vincent Si vous trouvez des erreurs de Français ou de mathématiques ou bien si vous avez des questions et/ou des suggestions, envoyez-moi

Plus en détail

4 Distributions particulières de probabilités

4 Distributions particulières de probabilités 4 Distributions particulières de probabilités 4.1 Distributions discrètes usuelles Les variables aléatoires discrètes sont réparties en catégories selon le type de leur loi. 4.1.1 Variable de Bernoulli

Plus en détail

I. Introduction. 1. Objectifs. 2. Les options. a. Présentation du problème.

I. Introduction. 1. Objectifs. 2. Les options. a. Présentation du problème. I. Introduction. 1. Objectifs. Le but de ces quelques séances est d introduire les outils mathématiques, plus précisément ceux de nature probabiliste, qui interviennent dans les modèles financiers ; nous

Plus en détail