Outils pour la statistique avancée Année 2015/2016 TD 1 : Bootstrap

Save this PDF as:
 WORD  PNG  TXT  JPG

Dimension: px
Commencer à balayer dès la page:

Download "geffray@math.unistra.fr Outils pour la statistique avancée Année 2015/2016 TD 1 : Bootstrap"

Transcription

1 Université de Strasbourg Ségolen Geffray M2 - Statistique Outils pour la statistique avancée Année 2015/2016 TD 1 : Bootstrap Ces exercices seront effectués au moyen du logiciel R. Pour tous les exercices, il est demandé de programmer à la main tous les calculs. Dans l exercice 2, on retrouvera les résultats avec la fonction boot implémentée dans R. Exercice 1. Estimation d un écart-type. Soit X une variable aléatoire d écart-type σ(x). 1. Dans un premier temps, on souhaite construire un estimateur débiaisé du paramètre θ = σ(x). Pour cela, on dispose d un échantillon i.i.d. distribué comme X noté (X 1,..., X n ). (a) Proposer un estimateur θ = T (X 1,..., X n ) de θ. (b) Donner la construction d un estimateur bootstrap du biais de θ et en déduire un estimateur débiaisé de θ noté θ b. (c) Ecrire un programme qui calcule cet estimateur débiaisé. 2. Dans un second temps, on souhaite construire un intervalle de confiance unilatéral qui borne supérieurement le paramètre θ = σ(x), ceci en utilisant la technique du bootstrap nonparamétrique. Pour cela, on dispose d un échantillon i.i.d. distribué comme X noté (X 1,..., X n ). (a) Donner la construction d un intervalle de confiance unilatéral bootstrap de base pour θ de niveau de confiance (1 α). (b) Ecrire un programme qui calcule les bornes de cet intervalle de confiance unilatéral bootstrap de base. (c) Donner la construction d un intervalle de confiance unilatéral bootstrap studentisé pour θ de niveau de confiance (1 α). (d) Ecrire un programme qui calcule les bornes de cet intervalle de confiance unilatéral bootstrap studentisé. Exercice 2. Bootstrap paramétrique et bootstrap non-paramétrique. Soit X une variable aléatoire d espérance E[X]. On souhaite construire un intervalle de confiance pour E[X] au niveau de confiance (1 α). Pour cela, on dispose d un échantillon i.i.d. distribué comme X noté (X 1,..., X n ). 1. Ecriture des procédures statistiques. (a) En utilisant l approximation normale, donner la construction d un intervalle de confiance bilatéral asymptotique pour E[X] au niveau de confiance (1 α). (b) Ecrire un programme qui calcule cet intervalle de confiance bilatéral asymptotique.

2 (c) En supposant que X suit une loi normale de paramètres m et σ 2 inconnus, donner la construction d un intervalle de confiance bilatéral bootstrap paramétrique studentisé pour E[X] au niveau de confiance (1 α). (d) Ecrire un programme qui calcule cet intervalle de confiance bilatéral paramétrique studentisé. (e) En supposant que X suit une loi de Poisson de paramètre λ inconnu, donner la construction d un intervalle de confiance bilatéral bootstrap paramétrique studentisé pour E[X] au niveau de confiance (1 α). (f) Ecrire un programme qui calcule cet intervalle de confiance bilatéral bootstrap paramétrique studentisé. (g) Sans effectuer d hypothèse sur la distribution de X, donner la construction d un intervalle de confiance bilatéral bootstrap non-paramétrique studentisé pour E[X] au niveau de confiance (1 α). (h) Ecrire un programme qui calcule cet intervalle de confiance bilatéral bootstrap nonparamétrique studentisé. 2. Comparaison par simulations. Ecrire un programme qui génère M=1000 échantillons (X 1,..., X 15 ) de loi de Poisson de paramètre λ = 1.2 et qui calcule sur chaque échantillon les bornes inférieures et supérieures des différents intervalles de confiance. Déterminer la largeur empirique moyenne de chaque type d intervalle de confiance ainsi que la probabilité de couverture empirique de chaque type d intervalle de confiance. Que constatez-vous? Recommencer avec une loi Gamma de paramètre de forme (shape) égal à 1.2 puis 0.8 pour un paramètre d échelle (scale) égal à chaque fois à Application sur des données. Mettre en oeuvre les résultats obtenus avec les différentes procédures sur les données suivantes : Exercice 3. Estimation d un ratio. On souhaite estimer le ratio de l espérance de vie moyenne des non-fumeurs par rapport à l espérance de vie moyenne des fumeurs : θ := E[X] E[Y ] en notant X la variable aléatoire représentant la durée de vie des non-fumeurs et Y la variable aléatoire représentant la durée de vie des fumeurs. Soit (X 1,..., X n1 ) un échantillon i.i.d. distribué comme X et soit (Y 1,..., Y n2 ) un échantillon i.i.d. distribué comme Y, indépendant de (X 1,..., X n1 ). 1. Construction d un estimateur débiaisé du ratio. (a) Proposer un estimateur θ = T (X 1,..., X n1, Y 1,..., Y n2 ) de θ. (b) Donner la construction d un estimateur bootstrap du biais de θ et en déduire un estimateur débiaisé de θ noté θ b.

3 (c) Ecrire un programme qui calcule cet estimateur débiaisé. 2. Evaluation de l estimateur débiaisé du ratio par simulations. Ecrire un programme qui génère M=1000 échantillons (X 1,..., X 20 ) de loi exponentielle de paramètre λ = 1/80 et M=1000 échantillons (Y 1,..., Y 20 ) de loi exponentielle de paramètre λ = 1/70 et qui calcule, sur chaque échantillon, la valeur de θ et de θ b. Que constatezvous? 3. Application de l estimateur débiaisé du ratio sur des données. On a relevé dans les registres la durée de vie de 20 fumeurs et de 20 non-fumeurs. Les données sont les suivantes : Non-fumeurs Fumeurs Calculer la valeur de θ et de θ b. 4. Construction d intervalles de confiance asymptotique et bootstrappés. On rappelle que la delta-méthode affirme que si D n ((Un, V n ) (u, v)) (U, V ) alors, pour toute fonction Ψ continûment différentiable, ( ) D U n (Ψ(Un, V n ) Ψ(u, v)) DΨ(u, v). V (a) Utiliser la delta-méthode et l approximation normale pour déterminer la loi asymptotique de θ lorsque n 1 = n 2 = n. (b) En déduire la construction d un intervalle de confiance bilatéral asymptotique pour θ de niveau de confiance (1 α). (c) Ecrire un programme qui calcule les bornes de cet intervalle de confiance bilatéral asymptotique. (d) Donner la construction d un intervalle de confiance bilatéral bootstrap de base pour θ de niveau de confiance (1 α). (e) Ecrire un programme qui calcule les bornes de cet intervalle de confiance bilatéral bootstrap de base. (f) Donner la construction d un intervalle de confiance bootstrap bilatéral percentile pour θ de niveau de confiance (1 α). (g) Ecrire un programme qui calcule les bornes de cet intervalle de confiance bilatéral bootstrap percentile. (h) Donner la construction d un intervalle de confiance bilatéral bootstrap studentisé pour θ de niveau de confiance (1 α). (i) Ecrire un programme qui calcule les bornes de cet intervalle de confiance bilatéral bootstrap studentisé. 5. Evaluation des différents intervalles de confiance pour le ratio par simulations. Ecrire un programme qui génère M=1000 échantillons (X 1,..., X 20 ) de loi exponentielle de paramètre λ = 1/80 et M=1000 échantillons (Y 1,..., Y 20 ) de loi exponentielle de paramètre λ = 1/70 et qui calcule, sur chaque échantillon, les bornes inférieures et supérieures des différents intervalles de confiance en utilisant le niveau de confiance de 95%. Déterminer la largeur empirique moyenne ainsi que la couverture empirique pour chaque type d intervalle de confiance en choisissant un niveau de confiance nominal de 95%. Que constatez-vous?

4 6. Application de l estimateur débiaisé du ratio sur des données. En reprenant les données précédentes, déterminer les différents intervalles de confiance pour θ, tous au niveau de confiance 95%. Exercice 4. Estimation d un coefficient d asymétrie. Soit X une variable aléatoire de coefficient d asymétrie γ(x) dont la définition est rappelée ci-dessous : γ(x) = E [(X E[X])3 ] (E [(X E[X]) 2 ]) 3/2. 1. Dans un premier temps, on souhaite construire un estimateur débiaisé du paramètre θ = γ(x). Pour cela, on dispose d un échantillon i.i.d. distribué comme X noté (X 1,..., X n ). (a) Proposer un estimateur θ = T (X 1,..., X n ) de θ. (b) Donner la construction d un estimateur bootstrap du biais de θ et en déduire un estimateur débiaisé de θ noté θ b. (c) Ecrire un programme qui calcule cet estimateur débiaisé. 2. Dans un second temps, on souhaite construire un intervalle de confiance bilatéral pour le paramètre θ = γ(x) en utilisant la technique du bootstrap nonparamétrique. Pour cela, on dispose d un échantillon i.i.d. distribué comme X noté (X 1,..., X n ). (a) Donner la construction d un intervalle de confiance bilatéral bootstrap de base pour θ de niveau de confiance (1 α). (b) Ecrire un programme qui calcule les bornes de cet intervalle de confiance bilatéral bootstrap de base. (c) Donner la construction d un intervalle de confiance bilatéral bootstrap studentisé pour θ de niveau de confiance (1 α). (d) Ecrire un programme qui calcule les bornes de cet intervalle de confiance bilatéral bootstrap studentisé. Exercice 5. Bootstrap et coefficient de corrélation. Soient X et Y deux variables aléatoires de coefficient de corrélation ρ(x, Y ). 1. Dans un premier temps, on souhaite construire un estimateur débiaisé du paramètre θ = ρ(x, Y ). Pour cela, on dispose d un échantillon i.i.d. distribué comme (X, Y ) noté ((X 1, Y 1 )..., (X n, Y n )). (a) Proposer un estimateur θ = T (X 1, Y 1..., X n, Y n ) de θ. (b) Donner la construction d un estimateur bootstrap du biais de θ et en déduire un estimateur débiaisé de θ noté θ b. (c) Ecrire un programme qui calcule cet estimateur débiaisé. 2. Dans un second temps, on souhaite construire un intervalle de confiance bilatéral pour le paramètre θ = ρ(x, Y ) en utilisant la technique du bootstrap nonparamétrique. Pour cela, on dispose d un échantillon i.i.d. distribué comme (X, Y ) noté ((X 1, Y 1 )..., (X n, Y n )).

5 (a) Donner la construction d un intervalle de confiance bilatéral bootstrap de base pour θ de niveau de confiance (1 α). (b) Ecrire un programme qui calcule les bornes de cet intervalle de confiance bilatéral bootstrap de base. (c) Donner la construction d un intervalle de confiance bilatéral bootstrap studentisé pour θ de niveau de confiance (1 α). (d) Ecrire un programme qui calcule les bornes de cet intervalle de confiance bilatéral bootstrap studentisé. Exercice 6. Soient X et Y deux variables aléatoires de coefficient de corrélation ρ(x, Y ). On cherche à calculer un intervalle de confiance bootstrap bilatéral nonparamétrique de base (de Hall) au niveau de confiance (1 α) pour ρ(x, Y ). Pour cela, on dispose d un échantillon i.i.d. distribué comme (X, Y ) noté ((X 1, Y 1 )..., (X n, Y n )). Le programme ci-dessous est censé calculer un intervalle de confiance bootstrap bilatéral nonparamétrique de base (de Hall) au niveau de confiance (1 α) pour ρ(x, Y ) au moyen du logiciel R. Mais, en réalité, ce programme contient des erreurs. IC.boot.base.nonpar<-function(x,y,conf,B) { n<-length(x) alpha<-1-conf theta.hat<-cor(x,y) x.boot<-replicate(b,sample(x,replace=true)) y.boot<-replicate(b,sample(y,replace=true)) theta.hat.boot<- rep(0,b) for (b in 1:B) { theta.hat.boot[b]<- cor(x.boot[,b],y.boot[,b]) } q.boot.hat<-quantile(theta.hat.boot,c(alpha/2,1-alpha/2),names=false) borneinf<-theta.hat+q.boot.hat[1] bornesup<-theta.hat+q.boot.hat[2] c(borneinf,bornesup) } 1. Trouver les erreurs du programme et justifier en donnant la construction correcte de l algorithme correspondant à ce problème. 2. Corriger ces erreurs. Exercice 7. Bootstrap et coefficient de corrélation partielle. Soient X, Y et Z trois variables aléatoires que l on suspecte être liées. On s intéresse au coefficient de corrélation partielle entre X et Y conditionnellement à Z noté ρ Z (X, Y ). Il est défini par : ρ(x, Y ) ρ(x, Z)ρ(Y, Z) ρ Z (X, Y ) = 1 ρ(x, Z)2 1 ρ(y, Z) 2 où ρ(x, Y ) est le coefficient de corrélation linéaire (simple) entre X et Y.

6 1. Dans un premier temps, on souhaite construire un estimateur débiaisé du paramètre θ = ρ Z (X, Y ). Pour cela, on dispose d un échantillon i.i.d. distribué comme (X, Y, Z) noté ((X 1, Y 1, Z 1 )..., (X n, Y n, Z n )). (a) Proposer un estimateur θ de θ = ρ Z (X, Y ). (b) Donner la construction d un estimateur bootstrap du biais de θ et en déduire un estimateur débiaisé de θ = ρ Z (X, Y ) noté θ b. (c) Ecrire un programme qui calcule cet estimateur débiaisé. 2. Dans un second temps, on souhaite construire un intervalle de confiance bilatéral pour le paramètre θ = ρ Z (X, Y ) en utilisant la technique du bootstrap nonparamétrique. Pour cela, on dispose d un échantillon i.i.d. distribué comme (X, Y, Z) noté ((X 1, Y 1, Z 1 )..., (X n, Y n, Z n )). (a) Donner la construction d un intervalle de confiance bilatéral bootstrap de base pour θ de niveau de confiance (1 α). (b) Ecrire un programme qui calcule les bornes de cet intervalle de confiance bilatéral bootstrap de base. (c) Donner la construction d un intervalle de confiance bilatéral bootstrap studentisé pour θ de niveau de confiance (1 α). (d) Ecrire un programme qui calcule les bornes de cet intervalle de confiance bilatéral bootstrap studentisé. Exercice 8. Bootstrap et régression linéaire. Considérons un couple de variables aléatoires (X, Y ) satisfaisant le modèle de régression linéaire simple gaussien défini par : Y = c + dx + ε de paramètres c et d à estimer et où ε est une variable aléatoire indépendante de X de loi N (0, σ 2 ). Soit (X i, Y i ) i=1,...,n un échantillon distribué comme (X, Y ) et satisfaisant donc pour i = 1,..., n le modèle suivant : Y i = c + dx i + ε i où ε i i.i.d. N (0, σ 2 ) et où ε i X i. 1. Quelle est la loi des Y i pour i = 1,..., n conditionnellement aux covariables X i pour i = 1,..., n? 2. Déterminer l estimateur du maximum de vraisemblance noté (ĉ, d, σ 2 ) de (c, d, σ 2 ). 3. En déduire l expression des erreurs prédites notées ε i pour i = 1,..., n. On nomme R la relation ainsi obtenue. 4. Calculer la variance de d conditionnellement aux covariables. En proposer ensuite un estimateur (toujours conditionnellement aux covariables). 5. Sur quels principes sont fondées la construction d un intervalle de confiance bootstrap nonparamétrique percentile ainsi que la construction d un intervalle de confiance bootstrap non-paramétrique studentizé pour d? 6. Donner la construction d un intervalle de confiance bilatéral bootstrap non-paramétrique percentile pour d de niveau de confiance (1 α). 7. Ecrire un programme qui calcule les bornes de cet intervalle de confiance bilatéral bootstrap non-paramétrique percentile en prenant α = 0.05.

7 8. Donner la construction d un intervalle de confiance bilatéral bootstrap non-paramétrique studentisé pour d de niveau de confiance (1 α). 9. Ecrire un programme qui calcule les bornes de cet intervalle de confiance bilatéral bootstrap non-paramétrique studentisé en prenant α = Exercice 9. Bootstrap et odds-ratio. On constitue deux groupes de personnes susceptibles de contracter une maladie M. Le premier groupe rassemble des personnes exposées à un facteur de risque F tandis que le second groupe rassemble des personnes non-exposées à ce facteur de risque. Les deux groupes sont indépendants. Soit X i pour i = 1,..., n 1 la variable aléatoire binaire qui vaut 1 si la ième personne du premier groupe a contracté la maladie et 0 sinon. Soit Y i pour i = 1,..., n 2 la variable aléatoire binaire qui vaut 1 si la ième personne du deuxième groupe a contracté la maladie et 0 sinon. On souhaite estimer la quantité suivante qu on appelle odds-ratio : θ := p 1 1 p 1 p 2 1 p 2 où p 1 représente la probabilité de contracter la maladie M dans le groupe des exposés et p 2 représente la probabilité de contracter la maladie M dans le groupe des non-exposés. Pour cela, soit (X 1,..., X n1 ) un échantillon i.i.d. distribué comme X et soit (Y 1,..., Y n2 ) un échantillon i.i.d. distribué comme Y, indépendant de (X 1,..., X n1 ). 1. Donner la construction d un intervalle de confiance bilatéral bootstrap de base pour θ de niveau de confiance (1 α). 2. Ecrire un programme qui calcule les bornes de cet intervalle de confiance bilatéral bootstrap de base. 3. Donner la construction d un intervalle de confiance bilatéral bootstrap studentisé pour θ de niveau de confiance (1 α). 4. Ecrire un programme qui calcule les bornes de cet intervalle de confiance bilatéral bootstrap studentisé. Exercice 10. Bootstrap et odds ratio conditionnel On souhaite comparer le risque d avoir une fonction respiratoire anormale chez les fumeurs par rapport au risque des non-fumeurs tout en prenant l âge des individus en compte. Pour cela, on fonde notre comparaison sur un odds-ratio conditionnel. Introduisons Y la variable aléatoire binaire représentant l issue d un test respiratoire (normal auquel cas Y = 0 / anormal auquel cas Y = 1) pour un fumeur et introduisons Ỹ la variable aléatoire binaire représentant l issue d un test respiratoire (normal auquel cas Y = 0 / anormal auquel cas Y = 1) pour un non-fumeur. Soit X la variable aléatoire représentant l âge de ce fumeur et soit X la variable

8 aléatoire représentant l âge de ce non-fumeur. L odds ratio conditionnel qui nous intéresse est alors donné pour un certain âge x par : θ(x) = P[Y = 1 X = x] P[Ỹ = 0 X = x] P[Y = 0 X = x] P[Ỹ = 1 X = x] ( ) On dispose de (Y 1, X 1 ),..., (Y n1, X n1 ) un échantillon i.i.d. distribué comme (Y, X) ainsi que ( de (Ỹ1, X 1 ),..., (Ỹn 2, X ) n2 ) un échantillon i.i.d. distribué comme (Ỹ, X) et indépendant de ( ) (Y 1, X 1 ),..., (Y n1, X n1 ). 1. (a) Proposer un estimateur θ(x) de θ(x) en supposant que (Y, X) et (Ỹ, X) satisfont chacun un modèle de régression logistique. (b) Donner la construction d un estimateur bootstrap du biais de θ(x) et en déduire un estimateur débiaisé de θ(x) noté θ d (x). (c) Ecrire un programme qui calcule cet estimateur débiaisé. 2. (a) Donner la construction d un intervalle de confiance bilatéral bootstrap de base pour θ(x) de niveau de confiance (1 α). (b) Ecrire un programme qui calcule les bornes de cet intervalle de confiance bilatéral bootstrap de base. Exercice 11. Bootstrap et régression linéaire généralisée. On souhaite évaluer l influence de la taille d une tumeur à la prostate ôtée par ablation chirurgicale sur le risque de présenter une atteinte des ganglions lymphatiques. Dans ce but, une étude clinique est réalisée chez des patients nouvellement opérés qui subissent un examen supplémentaire afin de déterminer s il y a atteinte des ganglions lymphatiques (Collet, 1991). Soit X la variable aléatoire représentant la taille de la tumeur et soit Y la variable aléatoire représentant l état des ganglions lymphatiques du patient (atteints ou non). 1. Déterminer une estimation de l odds-ratio. 2. Ecrire un programme qui calcule cet odds-ratio. 3. Donner la construction d un intervalle de confiance bilatéral bootstrap pour l odds-ratio au niveau de confiance (1 α). 4. Ecrire un programme qui calcule cet intervalle de confiance. Exercice 12. Bootstrap et analyse de la variance. 1. (a) Donner la construction d un intervalle de confiance bilatéral bootstrap studentisé de niveau de confiance (1 α) pour les paramètres d intérêt d un modèle d ANOVA équilibré à un facteur à partir d un échantillon indépendant de taille n. (b) Ecrire un programme qui calcule les bornes de ces intervalles de confiance. 2. (a) Donner la construction d une version bootstrappée de la p-valeur du test de Fisher de nécessité de l ANOVA dans le modèle précédent.

9 (b) Ecrire un programme qui calcule cette p-valeur. Exercice 13. Problème de test de moyenne à deux échantillons. On souhaite tester l efficacité d un nouveau traitement prescrit pour réduire les problèmes d hypertension artérielle. Pour cela, deux échantillons de patients sont constitués : l un auquel on administre le nouveau traitement, l autre auquel on administre un placebo. Soit X la variable aléatoire représentant la tension artérielle systolique d un patient traité avec le nouveau médicament et soit Y la variable aléatoire représentant la tension artérielle systolique d un patient traité avec le placebo. On souhaite tester au niveau de risque de première espèce α l hypothèse H 0 : E[X] = E[Y ] contre l hypothèse H 1 : E[X] E[Y ]. Soit (X 1,..., X n1 ) un échantillon i.i.d. de loi F distribué comme X et soit (Y 1,..., Y n2 ) un échantillon i.i.d. de loi G distribué comme Y, indépendant de (X 1,..., X n1 ). 1. Ecriture de la procédure statistique. (a) Donner l expression de la p-value obtenue en mettant en oeuvre un test fondé sur l approximation normale. (b) Ecrire un programme qui calcule cette p-value. (c) Donner la construction de l estimateur bootstrap de la p-value. (d) Ecrire un programme qui calcule cette p-value bootstrappée. 2. Comparaison des méthodes asymptotique et bootstrap par simulations. (a) Ecrire un programme qui génère M=1000 échantillons (X 1,..., X 11 ) de loi gamma de paramètre de forme (shape) égal à 2 et de paramètre d échelle (scale) égal à 0.5 et M=1000 échantillons (Y 1,..., Y 10 ) de loi gamma de paramètre de forme (shape) égal à 2 et de paramètre d échelle (scale) égal à 0.5 et qui calcule sur chaque échantillon la valeur de la p-value obtenue par l approximation normale ainsi que la valeur de la p-value bootstrappée. En déduire le risque empirique de première espèce observé avec le test fondé sur l approximation normale et avec le test bootstrappé en choisissant un risque de première espèce nominal de 5%. (b) Ecrire un programme qui génère M=1000 échantillons (X 1,..., X 11 ) de loi gamma de paramètre de forme (shape) égal à 1 et de paramètre d échelle (scale) égal à 0.5 et M=1000 échantillons (Y 1,..., Y 10 ) de loi gamma de paramètre de forme (shape) égal à 4 et de paramètre d échelle (scale) égal à 0.5 puis qui calcule, sur chaque échantillon, la valeur de la p-value obtenue par l approximation normale ainsi que la valeur de la p-value bootstrappée. En déduire la puissance empirique observée avec le test fondé sur l approximation normale et avec le test fondé sur le bootstrap en choisissant un risque de première espèce nominal de 5%. 3. Application sur des données. On a relevé la pression artérielle systolique au bout d un mois de traitement chez 11 patients traités avec le nouveau médicament et chez 10 patients traités avec le placebo. Les données exprimées en mmhg sont les suivantes : Médicament Placebo

10 Comparer les résultats obtenus avec la procédure de test asymptotique et avec la procédure de test bootstrap en choisissant un risque de première espèce nominal de 5%. Exercice 14. Problème de test de proportion à deux échantillons. On souhaite tester l efficacité d un nouvel antibiotique prescrit pour guérir les infections à staphylocoques. Dans ce but, deux échantillons de patients sont constitués : l un auquel on administre le nouveau traitement, l autre auquel on administre un antibiotique usuel. Soit X la variable aléatoire représentant l état de santé d un patient traité avec le nouveau médicament (guéri ou non) et soit Y la variable aléatoire représentant l état de santé d un patient traité avec l antibiotique usuel. On souhaite tester au niveau de risque de première espèce α l hypothèse H 0 : E[X] = E[Y ] contre l hypothèse H 1 : E[X] E[Y ], ce qui revient à mettre en oeuvre un test d égalité de deux proportions à partir de deux échantillons indépendants. Pour cela, soit (X 1,..., X n1 ) un échantillon i.i.d. distribué comme X et soit (Y 1,..., Y n2 ) un échantillon i.i.d. distribué comme Y, indépendant de (X 1,..., X n1 ). 1. Donner l expression de la p-value obtenue en mettant en oeuvre le test asymptotique usuel (fondé sur l approximation normale). 2. Ecrire un programme qui calcule cette p-value. 3. Donner la construction de l estimateur bootstrap de la p-value. 4. Ecrire un programme qui calcule cette p-value bootstrappée. Exercice 15. Bootstrap et séries temporelles stationnaires Soit (X t ) t une série satisfaisant pour tout t le modèle suivant : X t = ax t 1 + ε t où (ε t ) t est une suite de variables aléatoires indépendantes et identiquement distribuées de loi N (0, σ 2 ) et où a vérifie a < 1. On dispose d observations de (X t ) t réalisées aux instants t = 1,..., n. 1. Déterminer un estimateur de a noté â. 2. Donner la construction d un intervalle de confiance bilatéral bootstrap non-paramétrique de base (de Hall) pour a de niveau de confiance (1 α). 3. Ecrire un programme qui calcule les bornes de cet intervalle de confiance bilatéral bootstrap non-paramétrique de base (de Hall) en prenant α = Exercice 16. Problème de test à un échantillon. La concentration naturelle en nitrates (NO 3 ) des eaux souterraines en l absence de fertilisation des sols varie de 5 à 15 mg/l. Cependant, l apport d engrais azotés agricoles dans les sols contribue à fortement augmenter cette teneur. Le décret du 20 décembre 2001 limite à 50 milligrammes par litre la teneur maximale en nitrates de l eau destinée à la consommation humaine. Un chimiste chargé du contrôle de l eau de ville effectue des prélèvements en différents points du réseau.

11 1. Ecriture de la procédure statistique. Soit X la variable aléatoire représentant la teneur en nitrates dans l eau de ville exprimé en mg/l en un endroit du réseau aléatoirement sélectionné. Soit (X 1,..., X n ) un échantillon i.i.d. distribué comme X. On souhaite tester au niveau de risque de première espèce α l hypothèse H 0 : E[X] = m 0 contre H 1 : E[X] > m 0. (a) Ecrire l expression de la p-value du test lorsqu on fonde ce test sur une approximation normale. (b) Ecrire un programme qui calcule cette p-value. (c) Donner la construction de la p-value du test lorsqu on fonde ce test sur le bootstrap. (d) Ecrire un programme qui calcule cette p-value bootstrappée. 2. Comparaison des tests asymptotique et bootstrappé par simulations. (a) Ecrire un programme qui génère M=1000 échantillons (X 1,..., X 15 ) de loi gamma de paramètre de forme (shape) égal à 30 et de paramètre d échelle (scale) égal à 1 et qui calcule, sur chaque échantillon, la valeur de la p-value obtenue par l approximation normale ainsi que la valeur de la p-value bootstrappée. En déduire le risque de 1ère espèce empirique pour le test fondé sur l approximation normale et avec le test fondé sur le bootstrap en choisissant un risque de première espèce nominal de 5%. (b) Ecrire un programme qui génère M=1000 échantillons (X 1,..., X 15 ) de loi gamma de paramètre de forme (shape) égal à 60 et de paramètre d échelle (scale) égal à 1 et qui calcule, sur chaque échantillon, la valeur de la p-value obtenue par l approximation normale ainsi que la valeur de la p-value bootstrappée. En déduire la puissance empirique pour le test fondé sur l approximation normale et avec le test fondé sur le bootstrap en choisissant un risque de première espèce nominal de 5%. 3. Application sur des données. Un échantillon de 15 prélèvements est analysé ce qui fournit les valeurs suivantes (en mg/l) : Comparer les résultats obtenus avec la procédure de test asymptotique et avec la procédure de test bootstrap en choisissant un risque de première espèce nominal de 5%.

12 Quelques fonctions utiles et quelques recommandations Le logiciel R peut être très long lorsqu il lui est demandé d effectuer de nombreuses boucles. Il faut donc éviter de le lui demander dans la mesure du possible. Les fonctions suivantes permettent parfois d éviter d écrire une boucle : ifelse(test,yes,no) permet de coder les indicatrices, test est un test logique, yes est la valeur asociée à un test positif, no est la valeur associée à un test négatif apply(x,marge,foo) applique la fonction foo à la matrice x, en ligne si marge=1, en colonne si marge=2 Ces fonctions sont mises en oeuvre sur le petit exemple ci-dessous : x <- cbind(x1 = 3, x2 = c(4:1, 2:5)) x col.sums <- apply(x, 2, sum) col.sums row.sums <- apply(x, 1, sum) row.sums ind<-ifelse(x[1]<=x[2],1,0) ind renvoie 1 si x[1] est inférieur ou égal à x[2] et 0 sinon Pour programmer des estimateurs bootstrap à la main, deux fonctions sont utiles : sample(x,n,replace=true) tire un vecteur de n valeurs avec remise dans le vecteur x replicate(b,operation) répète B fois l opération demandée et renvoit un vecteur de longueur B ou une matrice à B colonnes Citons aussi à toutes fins utiles : quantile(x,c(val1,val2,etc..)) calcule les quantiles empiriques associés aux données stockées dans le vecteur x d ordre val1, val2, etc... shapiro.test(x) effectue le test de normalité de Shapiro-Wilk sur les données x Pour pouvoir utiliser la fonction boot, il est nécessaire de charger le package qui la contient par l instruction suivante : library(boot) Voici un exemple simple d utilisation de la fonction boot. La statistique d intérêt est θ = X n et le vecteur de données est appelé mydata : # préliminaire obligatoire : créer une fonction qui calcule la statistique d intérêt mystat<-function(x,idx) { boot.sample<-x[idx] theta.hat.star<-mean(boot.sample) theta.hat.star } # appeler la fonction boot: boot.results<-boot(data=mydata,statistic=mystat,r=5000)

13 A partir des résultats obtenus, on peut alors utiliser la fonction boot.ci pour obtenir des intervalles de confiance : boot.icperc<-boot.ci(boot.out=boot.results,type="perc") détermine l intervalle de confiance bootstrap percentile boot.icbasic<-boot.ci(boot.out=boot.results,type="basic") détermine l intervalle de confiance bootstrap de base boot.icbca<-boot.ci(boot.out=boot.results,type="bca") détermine l intervalle de confiance bootstrap biais corrigé accéléré Pour obtenir un intervalle de confiance studentisé, il faut modifier la fonction donnant la statistique à bootstrapper de façon à ce qu elle renvoit aussi la variance de la statistique en question. mystat2<-function(x,idx) { boot.sample<-x[idx] theta.hat.star<-mean(boot.sample) thevariance<-var(boot.sample)/length(x) theresults<-c(theta.hat.star,thevariance) theresults } boot.results2<-boot(data=mydata,statistic=mystat2,r=5000) boot.icstud<-boot.ci(boot.out=boot.results2,type="stud") La méthode de bootstrap utilisée par défaut dans R est le bootstrap non-paramétrique. Voyons maintenant un exemple simple de bootstrap paramétrique sous l hypothèse que les données sont normales : # 2ème préliminaire obligatoire pour faire du bootstrap parametrique : créer une fonction qui génère les échantillons bootstrap rg.norm<-function(x,mle) { boot.sample<-rnorm(length(x),mean=mle[1],sd=sqrt(mle[2])) boot.sample } # appeler la fonction boot boot.par.norm<-boot(data=mydata, statistic=mystat, R=5000, sim="parametric", ran.gen=rg.norm, mle=c(mean(mydata),var(mydata)) )

Statistique (MATH-F-315, Cours #3)

Statistique (MATH-F-315, Cours #3) Statistique (MATH-F-315, Cours #3) Thomas Verdebout Université Libre de Bruxelles 2015 Plan de la partie Statistique du cours 1. Introduction. 2. Théorie de l estimation. 3. Tests d hypothèses et intervalles

Plus en détail

1/4 2/4 3/4 4/4. 10. Estimation MTH2302D. S. Le Digabel, École Polytechnique de Montréal H2016. (v1) MTH2302D: estimation 1/50

1/4 2/4 3/4 4/4. 10. Estimation MTH2302D. S. Le Digabel, École Polytechnique de Montréal H2016. (v1) MTH2302D: estimation 1/50 10. Estimation MTH2302D S. Le Digabel, École Polytechnique de Montréal H2016 (v1) MTH2302D: estimation 1/50 Plan 1. Introduction 2. Estimation ponctuelle 3. Estimation par intervalles de confiance 4. Autres

Plus en détail

Statistiques Appliquées Rôle des femmes dans la société

Statistiques Appliquées Rôle des femmes dans la société Statistiques Appliquées Rôle des femmes dans la société Denis Schelling Semestre d automne 2012 Résumé A partir de données concernant le rôle des femmes dans la société, nous avons effectué une analyse

Plus en détail

MODELISATION DE DONNÉES QUALITATIVES PREMIÈRE PARTIE

MODELISATION DE DONNÉES QUALITATIVES PREMIÈRE PARTIE MODELISATION DE DONNÉES QUALITATIVES PREMIÈRE PARTIE Pierre-Louis Gonzalez 1 I INTRODUCTION 1 variable qualitative. Tri à plat. Représentations graphiques. Modélisation : loi binomiale loi multinomiale

Plus en détail

Université de Nantes UFR des Sciences et Techniques Département de Mathématiques. Master 1 Ingénierie mathématique Année 2012-2013

Université de Nantes UFR des Sciences et Techniques Département de Mathématiques. Master 1 Ingénierie mathématique Année 2012-2013 Université de Nantes UFR des Sciences et Techniques Département de Mathématiques Master 1 Ingénierie mathématique Année 2012-2013 TP 1: Statistique descriptive F. Lavancier, A. Philippe Le logiciel utilisé

Plus en détail

Statistique (MATH-F-315, Cours #1)

Statistique (MATH-F-315, Cours #1) Statistique (MATH-F-315, Cours #1) Thomas Verdebout Université Libre de Bruxelles 2015 Plan de la partie Statistique du cours 1. Introduction. 2. Théorie de l estimation. 3. Tests d hypothèses et intervalles

Plus en détail

Chapitre 8: Inférence, échantillonnage et estimation

Chapitre 8: Inférence, échantillonnage et estimation Chapitre 8: Inférence, échantillonnage et estimation 1. Echantillonnage aléatoire simple 2. Inférence statistique 3. Estimation 4. Evaluation graphique de l adéquation d un modèle de distribution 1 L inférence

Plus en détail

Techniques d estimation : Maximum de Vraisemblance et Méthode des Moments Généralisée

Techniques d estimation : Maximum de Vraisemblance et Méthode des Moments Généralisée Techniques d estimation : Maximum de Vraisemblance et Méthode des Moments Généralisée Philippe Gagnepain Université Paris 1 Ecole d Economie de Paris Centre d économie de la Sorbonne-UG 4-Bureau 405 philippe.gagnepain@univ-paris1.fr

Plus en détail

Statistique de base avec R Partie 2 : Test d hypothèses et régression linéaire

Statistique de base avec R Partie 2 : Test d hypothèses et régression linéaire Statistique de base avec R Partie 2 : Test d hypothèses et régression linéaire Julien JACQUES Polytech Lille - Université Lille 1 Julien JACQUES (Polytech Lille) Statistiques de base 1 / 48 Plan 1 Tests

Plus en détail

Chapitre 4 : RÉGRESSION

Chapitre 4 : RÉGRESSION Chapitre 4 : RÉGRESSION 4.3 Régression linéaire multiple 4.3.1 Equation et Estimation 4.3.2 Inférence 4.3.3 Coefficients de détermination 4.3.4 Spécifications Régression linéaire multiple 1 / 50 Chapitre

Plus en détail

Deuxième partie II. Cours 4 à 6 : Construction d estimateurs, Modèle linéaire, Tests et intervalles de confiance

Deuxième partie II. Cours 4 à 6 : Construction d estimateurs, Modèle linéaire, Tests et intervalles de confiance Deuxième partie II Cours 4 à 6 : Construction d estimateurs, Modèle linéaire, Tests et intervalles de confiance (version corrigée, 4 avril 27) Construction d estimateurs 4 Construction d estimateurs Estimateur

Plus en détail

Statistiques - Notes de cours - M1. Elisabeth Gassiat

Statistiques - Notes de cours - M1. Elisabeth Gassiat Statistiques - Notes de cours - M1 Elisabeth Gassiat Table des matières 1 Introduction 5 1.1 Estimation et régions de confiance...................... 5 1.2 Tests.......................................

Plus en détail

«Cours Statistique et logiciel R»

«Cours Statistique et logiciel R» «Cours Statistique et logiciel R» Rémy Drouilhet (1), Adeline Leclercq-Samson (1), Frédérique Letué (1), Laurence Viry (2) (1) Laboratoire Jean Kuntzmann, Dép. Probabilites et Statistique, (2) Laboratoire

Plus en détail

TP 3 : STATISTIQUE PARAMÉTRIQUE

TP 3 : STATISTIQUE PARAMÉTRIQUE Statistique Numérique et Analyse de Données Ecole des Ponts ParisTech, 2 ème année TP 3 : STATISTIQUE PARAMÉTRIQUE La séance de TP se fait sous environnement Windows, sauf si vous avez une nette préférence

Plus en détail

Tests statistiques Formation «Analyse de données RNA-seq/ChiP-seq»

Tests statistiques Formation «Analyse de données RNA-seq/ChiP-seq» Tests statistiques Formation «Analyse de données RNA-seq/ChiP-seq» Guy Perrière Pôle Rhône-Alpes de Bioinformatique 14 novembre 2012 Guy Perrière (PRABI) Tests statistiques 14 novembre 2012 1 / 40 Plan

Plus en détail

Statistique. Jean-Yves Tourneret (1) (1) Université of Toulouse, ENSEEIHT-IRIT-TéSA Thème 1 : Analyse et Synthèse de l Information jyt@n7.

Statistique. Jean-Yves Tourneret (1) (1) Université of Toulouse, ENSEEIHT-IRIT-TéSA Thème 1 : Analyse et Synthèse de l Information jyt@n7. Statistique Jean-Yves Tourneret (1) (1) Université of Toulouse, ENSEEIHT-IRIT-TéSA Thème 1 : Analyse et Synthèse de l Information jyt@n7.fr Cours Statistique, 2010 p. 1/52 Plan du cours Chapitre 1 : Estimation

Plus en détail

Rapport de Recherche. 1 Estimation fonctionnelle en temps continu. 1.1 Vitesses de convergence pour l estimateur à noyau. (D. Blanke - Mars 2008)

Rapport de Recherche. 1 Estimation fonctionnelle en temps continu. 1.1 Vitesses de convergence pour l estimateur à noyau. (D. Blanke - Mars 2008) Rapport de Recherche (D. Blanke - Mars 2008) L essentiel de mes activités de recherche porte sur l estimation fonctionnelle ou paramétrique pour des processus. L ensemble de ces travaux peut se diviser

Plus en détail

PREMIERE ANNEE COMMUNE DES ETUDES DE SANTE. Faculté de Médecine Lyon Est Année Universitaire 2010-2011 UE4. Epreuve du jeudi 16 décembre 2010

PREMIERE ANNEE COMMUNE DES ETUDES DE SANTE. Faculté de Médecine Lyon Est Année Universitaire 2010-2011 UE4. Epreuve du jeudi 16 décembre 2010 PREMIERE ANNEE COMMUNE DES ETUDES DE SANTE Faculté de Médecine Lyon Est Année Universitaire 2010-2011 UE4 Epreuve du jeudi 16 décembre 2010 Dr Claire BARDEL, Dr Marie-Aimée DRONNE, Dr Delphine MAUCORT-BOULCH

Plus en détail

CHAPITRE 1 La nature de l économétrie et la structure des données économiques... 25

CHAPITRE 1 La nature de l économétrie et la structure des données économiques... 25 TABLE DES MATIÈRES Sommaire... 5 Avant- propos... 9 Remerciements... 19 À propos de l auteur... 23 CHAPITRE 1 La nature de l économétrie et la structure des données économiques... 25 1.1 Qu est- ce que

Plus en détail

Séminaire d Epidémiologie Animale Analyse de données en présence de clusters

Séminaire d Epidémiologie Animale Analyse de données en présence de clusters Analyse de données en présence de clusters Notion de clusters Conséquences de la non prise en compte des clusters Un exemple, une structure hiérarchique Elevage > Animal Le facteur d inflation de la variance

Plus en détail

Chapitre I Théorie de la ruine

Chapitre I Théorie de la ruine Chapitre I Théorie de la ruine Olivier Wintenberger ISUP 2, Université Paris VI (slides Olivier Lopez) Année universitaire 2013-2014 1 Risque collectif 2 Modélisation des coûts de sinistres 3 Probabilité

Plus en détail

Probabilités et statistiques dans le traitement de données expérimentales

Probabilités et statistiques dans le traitement de données expérimentales Probabilités et statistiques dans le traitement de données expérimentales S. LESECQ, B. RAISON IUT1, GEII 1 Module MC-M1 2009-2010 1 V Estimation de paramètres, tests d hypothèse, statistiques Module MC-M1

Plus en détail

Bases du Modèle Linéaire

Bases du Modèle Linéaire AgroParisTech Bases du Modèle Linéaire J.J. Daudin, E. Lebarbier, C. Vuillet Table des matières 1 Introduction 3 2 Estimation des paramètres 5 2.1 Estimation des paramètres de l espérance......................

Plus en détail

partie a Introduction à la statistique 1

partie a Introduction à la statistique 1 table des matières F AVANT-PROPOS À L ÉDITION AMÉRICAINE Abréviations viii xiv partie a Introduction à la statistique 1 1. Statistique et probabilité ne sont pas intuitives 3 Nous avons tendance à passer

Plus en détail

Baccalauréat Série S Métropole, juin 2014

Baccalauréat Série S Métropole, juin 2014 Baccalauréat Série S Métropole, juin 4 Sujet et Corrigé Stéphane PASQUET Disponible sur http://www.mathweb.fr juin 4 Exercice (5 points) - Commun à tous les candidats Partie A Dans le plan muni d un repère

Plus en détail

Cours 2 6 octobre. 2.1 Maximum de vraisemblance pour une loi Gaussienne multivariée

Cours 2 6 octobre. 2.1 Maximum de vraisemblance pour une loi Gaussienne multivariée Introduction aux modèles graphiques 2010/2011 Cours 2 6 octobre Enseignant: Francis Bach Scribe: Nicolas Cheifetz, Issam El Alaoui 2.1 Maximum de vraisemblance pour une loi Gaussienne multivariée Soit

Plus en détail

HUITIEME PARTIE ANALYSE EN COMPSANTES PRINCIPALES

HUITIEME PARTIE ANALYSE EN COMPSANTES PRINCIPALES 105 HUITIEME PARTIE ANALYSE EN COMPSANTES PRINCIPALES 1. Introduction En statistiques il arrive fréquemment que les individus soient décrits par un grand nombre de caractères. : voitures décrites par leur

Plus en détail

Cours Statistiques L2 Université Nice Sophia-Antipolis. François Delarue

Cours Statistiques L2 Université Nice Sophia-Antipolis. François Delarue Cours Statistiques L2 Université Nice Sophia-Antipolis François Delarue Table des matières Chapitre 1. Rappels de Probabilités 5 1. Espaces de probabilité et Variables aléatoires 5 2. Espérances et variances

Plus en détail

Master 2 IMOI - Mathématiques Financières

Master 2 IMOI - Mathématiques Financières Master 2 IMOI - Mathématiques Financières Exercices - Liste 1 1 Comportement d un investisseur face au risque Exercice 1 Soit K la matrice définie par 1 2 [ 3 1 1 3 1.1 Montrer que K est la matrice de

Plus en détail

Modèles statistiques pour l analyse des séquences biologiques

Modèles statistiques pour l analyse des séquences biologiques Modèles statistiques pour l analyse des séquences biologiques Franck Picard UMR CNRS-5558, Laboratoire de Biométrie et Biologie Evolutive franck.picard@univ-lyon1.fr F. Picard (LBBE) 1 / 60 Outline Introduction

Plus en détail

Programmes des classes préparatoires aux Grandes Ecoles

Programmes des classes préparatoires aux Grandes Ecoles Programmes des classes préparatoires aux Grandes Ecoles Filière : économique et commerciale Option : Technologique (ECT) Discipline : Mathématiques- Informatique Seconde année Ministère de l enseignement

Plus en détail

Statistiques appliquées (L3 d'économie) - Cours de Patrick Sevestre - TD 2 - Corrigé

Statistiques appliquées (L3 d'économie) - Cours de Patrick Sevestre - TD 2 - Corrigé Statistiques appliquées (L3 d'économie) - Cours de Patrick Sevestre - TD 2 - Corrigé Marc Sangnier - marc.sangnier@ens-cachan.fr 29 octobre 2007 Exercice 1 - Lien entre salaire et formation Remarques préliminaires

Plus en détail

TUTORAT UE4 2010-2011 Biostatistiques Concours Blanc

TUTORAT UE4 2010-2011 Biostatistiques Concours Blanc TUTORAT UE4 2010-2011 Biostatistiques Concours Blanc Lorsque cela n est pas précisé (explicitement ou implicitement), les tests sont réalisés à 5% en bilatéral QCM n 1 : Généralités sur les probabilités

Plus en détail

Méthodes d analyse empirique

Méthodes d analyse empirique Méthodes d analyse empirique Partie Quantitative Michel Beine (suppl. S. Laurent) michel.beine@uni.lu Université du Luxembourg http://www.michelbeine.be Méthodes d analyse empirique p. 1/? Méthodes d analyse

Plus en détail

Estimateur et Estimation Prof Franck Bonnetain Unité de méthodologie & de qualité de vie en cancérologie (EA3181) CHRU Besançon

Estimateur et Estimation Prof Franck Bonnetain Unité de méthodologie & de qualité de vie en cancérologie (EA3181) CHRU Besançon PACES - APEMK UE 4 Evaluation des méthodes d analyses appliquées aux sciences de la vie et de la santé Estimateur et Estimation Prof Franck Bonnetain Unité de méthodologie & de qualité de vie en cancérologie

Plus en détail

Estimation. Anita Burgun

Estimation. Anita Burgun Estimation Anita Burgun Estimation Anita Burgun Contenu du cours Sondages Mesures statistiques sur un échantillon Estimateurs Problème posé Le problème posé en statistique: On s intéresse à une population

Plus en détail

Distance et classification. Cours 4: Traitement du signal et reconnaissance de forme

Distance et classification. Cours 4: Traitement du signal et reconnaissance de forme Distance et classification Cours 4: Traitement du signal et reconnaissance de forme Plan Introduction Pré-traitement Segmentation d images Morphologie mathématique Extraction de caractéristiques Classification

Plus en détail

Université des Sciences et Technologies de Lille U.F.R. de Mathématiques Pures et Appliquées Bât. M2, F-59655 Villeneuve d Ascq Cedex

Université des Sciences et Technologies de Lille U.F.R. de Mathématiques Pures et Appliquées Bât. M2, F-59655 Villeneuve d Ascq Cedex Université des Sciences et Technologies de Lille U.F.R. de Mathématiques Pures et Appliquées Bât. M2, F-59655 Villeneuve d Ascq Cedex Agrégation externe Année 2003-2004 Corrigé de l exercice sur le test

Plus en détail

Exercices de Statistique

Exercices de Statistique Université Joseph Fourier, Grenoble I Licence Sciences et Technologies e année STA30 : Méthodes Statistiques pour la Biologie Exercices de Statistique http ://ljk.imag.fr/membres/bernard.ycart/sta30/ Chaque

Plus en détail

Statistiques. IUT Biotechnologie 2ème année. Jean-Christophe Breton Université de La Rochelle Octobre-Novembre 2008

Statistiques. IUT Biotechnologie 2ème année. Jean-Christophe Breton Université de La Rochelle Octobre-Novembre 2008 Statistiques IUT Biotechnologie 2ème année Jean-Christophe Breton Université de La Rochelle Octobre-Novembre 2008 version du 04 octobre 2008 Table des matières 1 Lois de probabilité usuelles 1 1.1 Dénombrement................................

Plus en détail

Régression linéaire simple

Régression linéaire simple Résumé Ce chapitre introduit la notion de modèle linéaire par la version la plus élémentaire : epliquer Y par une fonction affine de X. Après avoir epliciter les hypothèses nécessaires et les termes du

Plus en détail

1. Calculer: P(Z<1.34); P(Z<-1.72); P(Z>2.41); P(Z>-1.53); P(1.12<Z<1.57); P(- 0.75<Z<0.36); P( Z >1.96)

1. Calculer: P(Z<1.34); P(Z<-1.72); P(Z>2.41); P(Z>-1.53); P(1.12<Z<1.57); P(- 0.75<Z<0.36); P( Z >1.96) EXERCICES SUR LA LOI NORMALE Exercice 1. Soit Z une V.A. de loi N(0,1). 1. Calculer: P(Z-1.53); P(1.12

Plus en détail

Validation numérique de l homogénéisation pour un modèle simplifié de stockage avec sources aléatoires

Validation numérique de l homogénéisation pour un modèle simplifié de stockage avec sources aléatoires Validation numérique de l homogénéisation pour un modèle simplifié de stockage avec sources aléatoires Introduction Modélisation de la migration de radionucléide Vers un modèle probabiliste Calcul des

Plus en détail

TD : Microéconomie de l incertain. Emmanuel Duguet

TD : Microéconomie de l incertain. Emmanuel Duguet TD : Microéconomie de l incertain Emmanuel Duguet 2013-2014 Sommaire 1 Les loteries 2 2 Production en univers incertain 4 3 Prime de risque 6 3.1 Prime de risque et utilité CRRA.................. 6 3.2

Plus en détail

BACCALAURÉAT GÉNÉRAL SESSION 2014 MATHÉMATIQUES. Série S ÉPREUVE DU JEUDI 19 JUIN 2014. Durée de l épreuve : 4 heures Coefficient : 7

BACCALAURÉAT GÉNÉRAL SESSION 2014 MATHÉMATIQUES. Série S ÉPREUVE DU JEUDI 19 JUIN 2014. Durée de l épreuve : 4 heures Coefficient : 7 BACCALAURÉAT GÉNÉRAL SESSION 2014 MATHÉMATIQUES Série S ÉPREUVE DU JEUDI 19 JUIN 2014 Durée de l épreuve : 4 heures Coefficient : 7 ENSEIGNEMENT OBLIGATOIRE Les calculatrices électroniques de poche sont

Plus en détail

Risques hydrologiques & aménagement du territoire Projet d évaluation

Risques hydrologiques & aménagement du territoire Projet d évaluation Risques hydrologiques & aménagement du territoire Professeur responsable : Christophe ANCEY Assistant responsable : Blaise DHONT Date de rendu : 8 janvier 2016 Conditions du projet : travail à rédiger

Plus en détail

Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Arts & Métiers Filière PSI

Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Arts & Métiers Filière PSI Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Arts & Métiers Filière PSI Ces exercices portent sur les items 2, 3 et 5 du programme d informatique des classes

Plus en détail

TD1, sur la Régression Logistique (STA 2211)

TD1, sur la Régression Logistique (STA 2211) TD, sur la Régression Logistique STA 22) Exercice : Un sondage international cité dans un article de presse le 4 décembre 2004) rapportait le faible taux d approbation de la politique du Président des

Plus en détail

Jackknife et bootstrap comparés

Jackknife et bootstrap comparés Jackknife et bootstrap comparés Statistique linéaire θ(x 1,...,X n ) = c + n 1 n 1 α(x i) c constante, α fonction Exemples : X, 1 + n 1 Xi /n Jackknife et bootstrap comparés Statistique linéaire θ(x 1,...,X

Plus en détail

ECGE 1224 - Statistiques en économie et gestion : TP 1

ECGE 1224 - Statistiques en économie et gestion : TP 1 ECGE 14 - Statistiques en économie et gestion : TP 1 Exercice 1 Un dé parfaitement équilibré est lancé. Soit X la variable aléatoire (v.a.) correspondant au résultat obtenu avec le dé. a) Justifer pourquoi

Plus en détail

R i = a 0 +b 0 B i +ε i, R = Xβ +ε,

R i = a 0 +b 0 B i +ε i, R = Xβ +ε, Statistiques 2010-2011 TP sur le Modèle linéaire gaussien avec R 1 Les exercices Vous traiterez les exercices suivants avec le logiciel R. Exercice 1 Des photographies aériennes de champs d orge sont analysées

Plus en détail

Modélisation de séries temporelles. V. Monbet - 2012-2013

Modélisation de séries temporelles. V. Monbet - 2012-2013 Modélisation de séries temporelles V. Monbet - 2012-2013 Table des matières 1 Introduction 3 1.1 Objectifs (et moyens).................................. 3 1.2 Qu est-ce qu une série temporelle?..........................

Plus en détail

L essentiel sur les tests statistiques

L essentiel sur les tests statistiques L essentiel sur les tests statistiques 21 septembre 2014 2 Chapitre 1 Tests statistiques Nous considérerons deux exemples au long de ce chapitre. Abondance en C, G : On considère une séquence d ADN et

Plus en détail

Mesures et analyses statistiques de données - Probabilités. Novembre 2012 - Contrôle Continu, Semestre 1 CORRECTION

Mesures et analyses statistiques de données - Probabilités. Novembre 2012 - Contrôle Continu, Semestre 1 CORRECTION MASTER 1 GSI- Mentions ACCIE et RIM La Citadelle - ULCO Mesures et analyses statistiques de données - Probabilités Novembre 2012 - Contrôle Continu, Semestre 1 CORRECTION Exercice 1 Partie I 12pts 1 Étude

Plus en détail

Tests Statistiques. Rejeter, ne pas rejeter... Se risquer? Magalie Fromont. Année universitaire 2015-2016

Tests Statistiques. Rejeter, ne pas rejeter... Se risquer? Magalie Fromont. Année universitaire 2015-2016 Tests Statistiques Rejeter, ne pas rejeter... Se risquer? Magalie Fromont Année universitaire 2015-2016 Table des matières 1 Introduction 5 1.1 Problèmes de tests.................................. 5 1.1.1

Plus en détail

MT18 A 2012 Variables aléatoires à valeurs réelles Aleth Chevalley Loi binomiale, loi de Poisson, loi normale

MT18 A 2012 Variables aléatoires à valeurs réelles Aleth Chevalley Loi binomiale, loi de Poisson, loi normale MT8 A 0 Variables aléatoires à valeurs réelles Aleth Chevalley Loi binomiale, loi de Poisson, loi normale. Fonction de répartition.. Variable aléatoire à valeurs réelles Définition : Soit un ensemble fondamental

Plus en détail

TUTORIEL DU LOGICIEL «PRESENCE»

TUTORIEL DU LOGICIEL «PRESENCE» Comment analyser des données STELI? TUTORIEL DU LOGICIEL «PRESENCE» Calcul des probabilités d occupation des sites et des probabilités de détection des espèces Décembre 2013 Anne-Laure Gourmand 1 MNHN/CESCO

Plus en détail

[http://mp.cpgedupuydelome.fr] édité le 29 décembre 2015 Enoncés 1. b) Soit (u n ) n N une suite d éléments de [0 ; 1]. Montrer

[http://mp.cpgedupuydelome.fr] édité le 29 décembre 2015 Enoncés 1. b) Soit (u n ) n N une suite d éléments de [0 ; 1]. Montrer [http://mp.cpgedupuydelome.fr] édité le 9 décembre 05 Enoncés Familles sommables Ensemble dénombrable a) Calculer n+ Exercice [ 03897 ] [Correction] Soit f : R R croissante. Montrer que l ensemble des

Plus en détail

Affectation d'une valeur à une variable

Affectation d'une valeur à une variable Affectation d'une valeur à une variable Fonctions calculs d'images Faire fonctionner l'algorithme ci contre avec a = 2 et b = 5. Quelle est la réponse affichée par l'algorithme? (question subsidiaire :

Plus en détail

Traitement de données

Traitement de données Traitement de données GLMA 512 I. Statistiques descriptives 2 Problématique.......................................................... 4 Histogramme...........................................................

Plus en détail

0.1 Espace de probabilité

0.1 Espace de probabilité 0.1. ESPACE DE PROBABILITÉ 1 0.1 Espace de probabilité Exercice 1 La population d une ville compte 48% d hommes et 52% de femmes. Le 1er Janvier 2002 5% des hommes et 1% des femmes avaient la grippe. a)

Plus en détail

Introduction à la statistique inférentielle

Introduction à la statistique inférentielle Introduction à la statistique inférentielle Didier Concordet Unité de Biométrie Ecole Vétérinaire de Toulouse Sommaire 1 Statistiques descriptives 7 1.1 Description numérique...................... 7 1.1.1

Plus en détail

Baccalauréat ES/L Amérique du Sud 21 novembre 2013 Corrigé

Baccalauréat ES/L Amérique du Sud 21 novembre 2013 Corrigé Baccalauréat ES/L Amérique du Sud 2 novembre 2 Corrigé A. P. M. E. P. EXERCICE Commun à tous les candidats 5 points. Diminuer le budget de 6 % sur un an revient à multiplier par 6 =,94. Diminuer le budget

Plus en détail

UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire 2013 2014 MATHS/STATS. Solution des exercices d algèbre linéaire

UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire 2013 2014 MATHS/STATS. Solution des exercices d algèbre linéaire UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire 3 4 Master d économie Cours de M. Desgraupes MATHS/STATS Document : Solution des exercices d algèbre linéaire Table des matières

Plus en détail

Les Meta-analyses. Sibilia Quilici. Université René Descartes Paris V Faculté de Pharmacie Master Science de la vie et de la santé 28/01/2014

Les Meta-analyses. Sibilia Quilici. Université René Descartes Paris V Faculté de Pharmacie Master Science de la vie et de la santé 28/01/2014 Les Meta-analyses Sibilia Quilici Université René Descartes Paris V Faculté de Pharmacie Master Science de la vie et de la santé 28/01/2014 Nombre de publication en méta-analyses 8000 7000 6000 5000 4000

Plus en détail

Estimation et calibration des paramètres

Estimation et calibration des paramètres et calibration des paramètres 6-601-09 Simulation Monte Carlo Geneviève Gauthier HEC Montréal 1 1. Nous allons discuter des diverses façons de déterminer les paramètres des modèles que nous employons lors

Plus en détail

MATH-F-306 - Optimisation. Prénom Nom Note

MATH-F-306 - Optimisation. Prénom Nom Note MATH-F-306 Optimisation examen de 1 e session année 2009 2010 Prénom Nom Note Répondre aux questions ci-dessous en justifiant rigoureusement chaque étape, affirmation, etc. AUCUNE NOTE N EST AUTORISÉE.

Plus en détail

Principe d un test statistique

Principe d un test statistique Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2008/2009 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre

Plus en détail

CODES CORRECTEURS D'ERREURS

CODES CORRECTEURS D'ERREURS CODES CORRECTEURS D'ERREURS Marc URO TABLE DES MATIÈRES DÉTECTION ET CORRECTION D'ERREURS... 6 CAS D'UN CANAL SANS SYMBOLE D'EFFACEMENT...6 CAS D'UN CANAL AVEC SYMBOLE D'EFFACEMENT...7 GÉNÉRATION ET DÉTECTION

Plus en détail

Support du cours de Probabilités et Statistiques. IUT d Orléans, Département Informatique

Support du cours de Probabilités et Statistiques. IUT d Orléans, Département Informatique Support du cours de Probabilités et Statistiques IUT d Orléans, Département informatique Pierre Andreoletti IUT d Orléans, Département Informatique Laboratoire MAPMO (Bât. de Mathématiques UFR Sciences)

Plus en détail

Introduction à l approche bootstrap

Introduction à l approche bootstrap Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?

Plus en détail

Analyse économétrique des prix d électricité

Analyse économétrique des prix d électricité Analyse économétrique des prix d électricité Modélisation de la moyenne des log-rendements Rapport de recherche Août 2006 Nom de l étudiant : Qingzhou YANG Directeur de recherche : Nour MEDDAHI Sommaire

Plus en détail

4.1 Planification d une expérience complètement randomisée

4.1 Planification d une expérience complètement randomisée Chapitre 4 La validation des hypothèses d ANOVA à un facteur Dans le modèle standard d ANOVA, on a fait quelques hypothèses. Pour que les résultats de l analyse effectuée soient fiables, il est nécessaire

Plus en détail

BACCALAURÉAT TECHNOLOGIQUE MATHÉMATIQUES. Spécialité : BIOTECHNOLOGIES

BACCALAURÉAT TECHNOLOGIQUE MATHÉMATIQUES. Spécialité : BIOTECHNOLOGIES BACCALAURÉAT TECHNOLOGIQUE Session 2015 Jeudi 18 juin 2015 MATHÉMATIQUES Série : SCIENCES ET TECHNOLOGIES DE LABORATOIRE Spécialité : BIOTECHNOLOGIES Durée de l épreuve : 4 heures Coefficient : 4 Calculatrice

Plus en détail

Régression logistique avec R

Régression logistique avec R Université Rennes 2, UFR Sciences Sociales Régression logistique avec R Université Rennes 2 Place du Recteur H. le Moal CS 24307-35043 Rennes Tel : 02 99 14 18 06 Mel : laurent.rouviere@univ-rennes2.fr

Plus en détail

Estimation indirecte en sciences humaines : une méthode bayésienne

Estimation indirecte en sciences humaines : une méthode bayésienne Estimation indirecte en sciences humaines : une méthode bayésienne Henri Caussinus, Institut de Mathématiques de Toulouse, en collaboration avec Daniel Courgeau, INED Isabelle Séguy, INED Luc Buchet, CNRS

Plus en détail

Econométrie des modèles de durée

Econométrie des modèles de durée Econométrie des modèles de durée Guillaume Horny Banque de France et UCLouvain Master 2 MOSEF Guillaume Horny (Banque de France) Econométrie des durées (chap 2) 2009 1 / 59 Chapitre 2 : Temps discret et

Plus en détail

ACCQ204 4 Jan. 2016. Cours 3. Définition 1 Pour tout entier r 2 un code de Hamming (binaire) a pour matrice de parité H r telle que : 1 0 1 0 1.

ACCQ204 4 Jan. 2016. Cours 3. Définition 1 Pour tout entier r 2 un code de Hamming (binaire) a pour matrice de parité H r telle que : 1 0 1 0 1. ACCQ4 4 Jan 6 Cours 3 Enseignant: Aslan Tchamkerten Crédit: Pierre de Sainte Agathe Code de Hamming Définition Pour tout entier r un code de Hamming (binaire) a pour matrice de parité H r telle que : H

Plus en détail

Tests statistiques élémentaires

Tests statistiques élémentaires Résumé Il serait vain de chercher à présenter l ensemble des tests statistiques, la littérature est très abondante sur le sujet. Cette vignette introduit les plus couramment calculés par les logiciels

Plus en détail

A. Popier (Le Mans) Copules. Septembre 2010 1 / 72

A. Popier (Le Mans) Copules. Septembre 2010 1 / 72 COPULES. Alexandre Popier Université du Maine, Le Mans Septembre 2010 A. Popier (Le Mans) Copules. Septembre 2010 1 / 72 PLAN DU COURS 1 RAPPELS SUR LES VECTEURS ALÉATOIRES 2 RAPPELS SUR LA MÉTHODE DE

Plus en détail

Arithmétique Algorithmique. http://www.math.univ-lyon1.fr/~roblot/ens.html

Arithmétique Algorithmique. http://www.math.univ-lyon1.fr/~roblot/ens.html Arithmétique Algorithmique http://www.math.univ-lyon1.fr/~roblot/ens.html Partie III Algorithmes classiques 1 Coût de la multiplication et de la division 2 Exponentiation rapide 3 Algorithme d Euclide

Plus en détail

2. Formalisation ... Or les variables sont indépendantes. Donc si

2. Formalisation ... Or les variables sont indépendantes. Donc si L'estimation 1. Concrètement... Dernièrement un quotidien affichait en première page : en 30 ans les françaises ont grandi de... je ne sais plus exactement, disons 7,1 cm. C'est peut-être un peu moins

Plus en détail

Ressources pour le lycée technologique

Ressources pour le lycée technologique éduscol Enseignement de mathématiques Classe de première STMG Ressources pour le lycée technologique Échantillonnage : couleur des yeux au Canada Contexte pédagogique Objectifs Obtenir un intervalle de

Plus en détail

2- La relation risque rentabilité attendue

2- La relation risque rentabilité attendue 2- La relation risque rentabilité attendue L'incertitude est au cœur de la logique financière. Par la composition de leur portefeuille, les investisseurs choisissent un profil de risque. Si on suppose

Plus en détail

Test de comparaison de deux modèles de régression non paramétriques basé sur les coefficients de Fourier

Test de comparaison de deux modèles de régression non paramétriques basé sur les coefficients de Fourier Test de comparaison de deux modèles de régression non paramétriques basé sur les coefficients de Fourier Zaher Mohdeb Université Mentouri Département de Mathématiques, Constantine, Algérie E-mail: zaher.mohdeb@umc.edu.dz

Plus en détail

Généralités sur les fonctions numériques

Généralités sur les fonctions numériques 7 Généralités sur les fonctions numériques Une fonction numérique est, de manière générale, une fonction d une variable réelle et à valeurs réelles. 7.1 Notions de base sur les fonctions Si I, J sont deux

Plus en détail

Université de Pau et des Pays de l Adour Département de Mathématiques Année 2006-2007. Introduction aux probabilités

Université de Pau et des Pays de l Adour Département de Mathématiques Année 2006-2007. Introduction aux probabilités Université de Pau et des Pays de l Adour Département de Mathématiques Année 2006-2007 Introduction aux probabilités Série n 3 Exercice 1 Une urne contient neuf boules. Quatre de ces boules portent le numéro

Plus en détail

L2 2011/2012 USTV. Analyse. numérique M43. Recueil d exercices corrigés et aide-mémoire G. FACCANONI. Dernière mise-à-jour

L2 2011/2012 USTV. Analyse. numérique M43. Recueil d exercices corrigés et aide-mémoire G. FACCANONI. Dernière mise-à-jour L / Recueil d exercices corrigés et aide-mémoire USTV M Analyse numérique G FACCANONI Dernière mise-à-jour Jeudi mai Avertissement : ces notes sont régulièrement mises à jour et corrigées, ne vous étonnez

Plus en détail

IUT d Orléans - Département d Informatique TD de Probabilités

IUT d Orléans - Département d Informatique TD de Probabilités IUT d Orléans - Département d Informatique TD de Probabilités Fiche 1 Dénombrement DENOMBREMENT : arrangements et combinaisons Le but de cette première partie est d introduire la fonction factorielle,

Plus en détail

1 Variable aléatoire discrète... 1. 1.1 Rappels... 1. 1.2 Exemple... 2 2 Couples de variables aléatoires... 3. 2.1 Définition... 3

1 Variable aléatoire discrète... 1. 1.1 Rappels... 1. 1.2 Exemple... 2 2 Couples de variables aléatoires... 3. 2.1 Définition... 3 CHAPITRE : LOIS DISCRÈTES Sommaire Variable aléatoire discrète................................... Rappels........................................... Exemple......................................... Couples

Plus en détail

EXAMEN PROBATOIRE D ADMISSION DANS LES ECOLES D OFFICIERS

EXAMEN PROBATOIRE D ADMISSION DANS LES ECOLES D OFFICIERS ANNÉE 2013 EXAMEN PROBATOIRE D ADMISSION DANS LES ECOLES D OFFICIERS CSEA 2013 ÉPREUVE DE PHYSIQUE Durée : 4 heures Coefficient : 1 - L usage de la calculatrice est autorisé ; - Les exercices sont indépendants

Plus en détail

Inde, avril 2014, exercice 1

Inde, avril 2014, exercice 1 Sujet 1 Inde, avril 2014, exercice 1 4 points Dans cet exercice, sauf indication contraire, les résultats seront arrondis au centième. 1 La durée de vie, exprimée en années, d un moteur pour automatiser

Plus en détail

L analyse des données statistiques

L analyse des données statistiques L analyse des données statistiques Public : Les cadres devant analyser des données quantitatives et qualitatives Objectif : Apprendre, en utilisant principalement Excel : - à traiter des données provenant

Plus en détail

Erik PERNOD Calcul Scientifique 3 ème Année RESEAUX DE NEURONES

Erik PERNOD Calcul Scientifique 3 ème Année RESEAUX DE NEURONES Erik PERNOD Calcul Scientifique 3 ème Année RESEAUX DE NEURONES 1 TABLE DES MATIERES TABLE DES MATIERES... 2 I PERCEPTRON SIMPLE... 3 I.1 Introduction... 3 I.2 Algorithme... 3 I.3 Résultats... 4 1er exemple

Plus en détail

Agrégation externe de mathématiques, session 2005 Épreuve de modélisation, option Probabilités et Statistiques

Agrégation externe de mathématiques, session 2005 Épreuve de modélisation, option Probabilités et Statistiques Agrégation externe de mathématiques, session 2005 Épreuve de modélisation, option Probabilités et Statistiques (605) GESTION DE STOCK À DEMANDE ALÉATOIRE Résumé : Chaque mois, le gérant d un magasin doit

Plus en détail

APPLICATIONS SUR LES ANALYSES ASSOCIÉES AUX CHAPITRES 12 ET 13 (TESTS DE COMPARAISON ET D INDÉPENDANCE)

APPLICATIONS SUR LES ANALYSES ASSOCIÉES AUX CHAPITRES 12 ET 13 (TESTS DE COMPARAISON ET D INDÉPENDANCE) 5 APPLICATIONS SUR LES ANALYSES ASSOCIÉES AUX CHAPITRES 12 ET 13 (TESTS DE COMPARAISON ET D INDÉPENDANCE) Exercice 1 : test de comparaison de proportions (voir chapitre 12) Une entreprise souhaite lancer

Plus en détail

Tests d homogénéité dans les modèles de mélange

Tests d homogénéité dans les modèles de mélange Tests d homogénéité dans les modèles de mélange A. Autin, C. Pouet Université de Provence Rennes, 29 Août 2008 Plan 1. 2. non-adaptatifs et adaptatifs 3. Idées des preuves 4. Modèle de mélange Modèle Cadre

Plus en détail

Chapitre 5 Fonctions affines et équations du 1 er degré. Table des matières

Chapitre 5 Fonctions affines et équations du 1 er degré. Table des matières Chapitre 4 Fonctions affines et équations du 1 er degré. TABLE DES MATIÈRES page -1 Chapitre 5 Fonctions affines et équations du 1 er degré. Table des matières I Exercices I-1 1................................................

Plus en détail