Outils pour la statistique avancée Année 2015/2016 TD 1 : Bootstrap

Dimension: px
Commencer à balayer dès la page:

Download "geffray@math.unistra.fr Outils pour la statistique avancée Année 2015/2016 TD 1 : Bootstrap"

Transcription

1 Université de Strasbourg Ségolen Geffray M2 - Statistique Outils pour la statistique avancée Année 2015/2016 TD 1 : Bootstrap Ces exercices seront effectués au moyen du logiciel R. Pour tous les exercices, il est demandé de programmer à la main tous les calculs. Dans l exercice 2, on retrouvera les résultats avec la fonction boot implémentée dans R. Exercice 1. Estimation d un écart-type. Soit X une variable aléatoire d écart-type σ(x). 1. Dans un premier temps, on souhaite construire un estimateur débiaisé du paramètre θ = σ(x). Pour cela, on dispose d un échantillon i.i.d. distribué comme X noté (X 1,..., X n ). (a) Proposer un estimateur θ = T (X 1,..., X n ) de θ. (b) Donner la construction d un estimateur bootstrap du biais de θ et en déduire un estimateur débiaisé de θ noté θ b. (c) Ecrire un programme qui calcule cet estimateur débiaisé. 2. Dans un second temps, on souhaite construire un intervalle de confiance unilatéral qui borne supérieurement le paramètre θ = σ(x), ceci en utilisant la technique du bootstrap nonparamétrique. Pour cela, on dispose d un échantillon i.i.d. distribué comme X noté (X 1,..., X n ). (a) Donner la construction d un intervalle de confiance unilatéral bootstrap de base pour θ de niveau de confiance (1 α). (b) Ecrire un programme qui calcule les bornes de cet intervalle de confiance unilatéral bootstrap de base. (c) Donner la construction d un intervalle de confiance unilatéral bootstrap studentisé pour θ de niveau de confiance (1 α). (d) Ecrire un programme qui calcule les bornes de cet intervalle de confiance unilatéral bootstrap studentisé. Exercice 2. Bootstrap paramétrique et bootstrap non-paramétrique. Soit X une variable aléatoire d espérance E[X]. On souhaite construire un intervalle de confiance pour E[X] au niveau de confiance (1 α). Pour cela, on dispose d un échantillon i.i.d. distribué comme X noté (X 1,..., X n ). 1. Ecriture des procédures statistiques. (a) En utilisant l approximation normale, donner la construction d un intervalle de confiance bilatéral asymptotique pour E[X] au niveau de confiance (1 α). (b) Ecrire un programme qui calcule cet intervalle de confiance bilatéral asymptotique.

2 (c) En supposant que X suit une loi normale de paramètres m et σ 2 inconnus, donner la construction d un intervalle de confiance bilatéral bootstrap paramétrique studentisé pour E[X] au niveau de confiance (1 α). (d) Ecrire un programme qui calcule cet intervalle de confiance bilatéral paramétrique studentisé. (e) En supposant que X suit une loi de Poisson de paramètre λ inconnu, donner la construction d un intervalle de confiance bilatéral bootstrap paramétrique studentisé pour E[X] au niveau de confiance (1 α). (f) Ecrire un programme qui calcule cet intervalle de confiance bilatéral bootstrap paramétrique studentisé. (g) Sans effectuer d hypothèse sur la distribution de X, donner la construction d un intervalle de confiance bilatéral bootstrap non-paramétrique studentisé pour E[X] au niveau de confiance (1 α). (h) Ecrire un programme qui calcule cet intervalle de confiance bilatéral bootstrap nonparamétrique studentisé. 2. Comparaison par simulations. Ecrire un programme qui génère M=1000 échantillons (X 1,..., X 15 ) de loi de Poisson de paramètre λ = 1.2 et qui calcule sur chaque échantillon les bornes inférieures et supérieures des différents intervalles de confiance. Déterminer la largeur empirique moyenne de chaque type d intervalle de confiance ainsi que la probabilité de couverture empirique de chaque type d intervalle de confiance. Que constatez-vous? Recommencer avec une loi Gamma de paramètre de forme (shape) égal à 1.2 puis 0.8 pour un paramètre d échelle (scale) égal à chaque fois à Application sur des données. Mettre en oeuvre les résultats obtenus avec les différentes procédures sur les données suivantes : Exercice 3. Estimation d un ratio. On souhaite estimer le ratio de l espérance de vie moyenne des non-fumeurs par rapport à l espérance de vie moyenne des fumeurs : θ := E[X] E[Y ] en notant X la variable aléatoire représentant la durée de vie des non-fumeurs et Y la variable aléatoire représentant la durée de vie des fumeurs. Soit (X 1,..., X n1 ) un échantillon i.i.d. distribué comme X et soit (Y 1,..., Y n2 ) un échantillon i.i.d. distribué comme Y, indépendant de (X 1,..., X n1 ). 1. Construction d un estimateur débiaisé du ratio. (a) Proposer un estimateur θ = T (X 1,..., X n1, Y 1,..., Y n2 ) de θ. (b) Donner la construction d un estimateur bootstrap du biais de θ et en déduire un estimateur débiaisé de θ noté θ b.

3 (c) Ecrire un programme qui calcule cet estimateur débiaisé. 2. Evaluation de l estimateur débiaisé du ratio par simulations. Ecrire un programme qui génère M=1000 échantillons (X 1,..., X 20 ) de loi exponentielle de paramètre λ = 1/80 et M=1000 échantillons (Y 1,..., Y 20 ) de loi exponentielle de paramètre λ = 1/70 et qui calcule, sur chaque échantillon, la valeur de θ et de θ b. Que constatezvous? 3. Application de l estimateur débiaisé du ratio sur des données. On a relevé dans les registres la durée de vie de 20 fumeurs et de 20 non-fumeurs. Les données sont les suivantes : Non-fumeurs Fumeurs Calculer la valeur de θ et de θ b. 4. Construction d intervalles de confiance asymptotique et bootstrappés. On rappelle que la delta-méthode affirme que si D n ((Un, V n ) (u, v)) (U, V ) alors, pour toute fonction Ψ continûment différentiable, ( ) D U n (Ψ(Un, V n ) Ψ(u, v)) DΨ(u, v). V (a) Utiliser la delta-méthode et l approximation normale pour déterminer la loi asymptotique de θ lorsque n 1 = n 2 = n. (b) En déduire la construction d un intervalle de confiance bilatéral asymptotique pour θ de niveau de confiance (1 α). (c) Ecrire un programme qui calcule les bornes de cet intervalle de confiance bilatéral asymptotique. (d) Donner la construction d un intervalle de confiance bilatéral bootstrap de base pour θ de niveau de confiance (1 α). (e) Ecrire un programme qui calcule les bornes de cet intervalle de confiance bilatéral bootstrap de base. (f) Donner la construction d un intervalle de confiance bootstrap bilatéral percentile pour θ de niveau de confiance (1 α). (g) Ecrire un programme qui calcule les bornes de cet intervalle de confiance bilatéral bootstrap percentile. (h) Donner la construction d un intervalle de confiance bilatéral bootstrap studentisé pour θ de niveau de confiance (1 α). (i) Ecrire un programme qui calcule les bornes de cet intervalle de confiance bilatéral bootstrap studentisé. 5. Evaluation des différents intervalles de confiance pour le ratio par simulations. Ecrire un programme qui génère M=1000 échantillons (X 1,..., X 20 ) de loi exponentielle de paramètre λ = 1/80 et M=1000 échantillons (Y 1,..., Y 20 ) de loi exponentielle de paramètre λ = 1/70 et qui calcule, sur chaque échantillon, les bornes inférieures et supérieures des différents intervalles de confiance en utilisant le niveau de confiance de 95%. Déterminer la largeur empirique moyenne ainsi que la couverture empirique pour chaque type d intervalle de confiance en choisissant un niveau de confiance nominal de 95%. Que constatez-vous?

4 6. Application de l estimateur débiaisé du ratio sur des données. En reprenant les données précédentes, déterminer les différents intervalles de confiance pour θ, tous au niveau de confiance 95%. Exercice 4. Estimation d un coefficient d asymétrie. Soit X une variable aléatoire de coefficient d asymétrie γ(x) dont la définition est rappelée ci-dessous : γ(x) = E [(X E[X])3 ] (E [(X E[X]) 2 ]) 3/2. 1. Dans un premier temps, on souhaite construire un estimateur débiaisé du paramètre θ = γ(x). Pour cela, on dispose d un échantillon i.i.d. distribué comme X noté (X 1,..., X n ). (a) Proposer un estimateur θ = T (X 1,..., X n ) de θ. (b) Donner la construction d un estimateur bootstrap du biais de θ et en déduire un estimateur débiaisé de θ noté θ b. (c) Ecrire un programme qui calcule cet estimateur débiaisé. 2. Dans un second temps, on souhaite construire un intervalle de confiance bilatéral pour le paramètre θ = γ(x) en utilisant la technique du bootstrap nonparamétrique. Pour cela, on dispose d un échantillon i.i.d. distribué comme X noté (X 1,..., X n ). (a) Donner la construction d un intervalle de confiance bilatéral bootstrap de base pour θ de niveau de confiance (1 α). (b) Ecrire un programme qui calcule les bornes de cet intervalle de confiance bilatéral bootstrap de base. (c) Donner la construction d un intervalle de confiance bilatéral bootstrap studentisé pour θ de niveau de confiance (1 α). (d) Ecrire un programme qui calcule les bornes de cet intervalle de confiance bilatéral bootstrap studentisé. Exercice 5. Bootstrap et coefficient de corrélation. Soient X et Y deux variables aléatoires de coefficient de corrélation ρ(x, Y ). 1. Dans un premier temps, on souhaite construire un estimateur débiaisé du paramètre θ = ρ(x, Y ). Pour cela, on dispose d un échantillon i.i.d. distribué comme (X, Y ) noté ((X 1, Y 1 )..., (X n, Y n )). (a) Proposer un estimateur θ = T (X 1, Y 1..., X n, Y n ) de θ. (b) Donner la construction d un estimateur bootstrap du biais de θ et en déduire un estimateur débiaisé de θ noté θ b. (c) Ecrire un programme qui calcule cet estimateur débiaisé. 2. Dans un second temps, on souhaite construire un intervalle de confiance bilatéral pour le paramètre θ = ρ(x, Y ) en utilisant la technique du bootstrap nonparamétrique. Pour cela, on dispose d un échantillon i.i.d. distribué comme (X, Y ) noté ((X 1, Y 1 )..., (X n, Y n )).

5 (a) Donner la construction d un intervalle de confiance bilatéral bootstrap de base pour θ de niveau de confiance (1 α). (b) Ecrire un programme qui calcule les bornes de cet intervalle de confiance bilatéral bootstrap de base. (c) Donner la construction d un intervalle de confiance bilatéral bootstrap studentisé pour θ de niveau de confiance (1 α). (d) Ecrire un programme qui calcule les bornes de cet intervalle de confiance bilatéral bootstrap studentisé. Exercice 6. Soient X et Y deux variables aléatoires de coefficient de corrélation ρ(x, Y ). On cherche à calculer un intervalle de confiance bootstrap bilatéral nonparamétrique de base (de Hall) au niveau de confiance (1 α) pour ρ(x, Y ). Pour cela, on dispose d un échantillon i.i.d. distribué comme (X, Y ) noté ((X 1, Y 1 )..., (X n, Y n )). Le programme ci-dessous est censé calculer un intervalle de confiance bootstrap bilatéral nonparamétrique de base (de Hall) au niveau de confiance (1 α) pour ρ(x, Y ) au moyen du logiciel R. Mais, en réalité, ce programme contient des erreurs. IC.boot.base.nonpar<-function(x,y,conf,B) { n<-length(x) alpha<-1-conf theta.hat<-cor(x,y) x.boot<-replicate(b,sample(x,replace=true)) y.boot<-replicate(b,sample(y,replace=true)) theta.hat.boot<- rep(0,b) for (b in 1:B) { theta.hat.boot[b]<- cor(x.boot[,b],y.boot[,b]) } q.boot.hat<-quantile(theta.hat.boot,c(alpha/2,1-alpha/2),names=false) borneinf<-theta.hat+q.boot.hat[1] bornesup<-theta.hat+q.boot.hat[2] c(borneinf,bornesup) } 1. Trouver les erreurs du programme et justifier en donnant la construction correcte de l algorithme correspondant à ce problème. 2. Corriger ces erreurs. Exercice 7. Bootstrap et coefficient de corrélation partielle. Soient X, Y et Z trois variables aléatoires que l on suspecte être liées. On s intéresse au coefficient de corrélation partielle entre X et Y conditionnellement à Z noté ρ Z (X, Y ). Il est défini par : ρ(x, Y ) ρ(x, Z)ρ(Y, Z) ρ Z (X, Y ) = 1 ρ(x, Z)2 1 ρ(y, Z) 2 où ρ(x, Y ) est le coefficient de corrélation linéaire (simple) entre X et Y.

6 1. Dans un premier temps, on souhaite construire un estimateur débiaisé du paramètre θ = ρ Z (X, Y ). Pour cela, on dispose d un échantillon i.i.d. distribué comme (X, Y, Z) noté ((X 1, Y 1, Z 1 )..., (X n, Y n, Z n )). (a) Proposer un estimateur θ de θ = ρ Z (X, Y ). (b) Donner la construction d un estimateur bootstrap du biais de θ et en déduire un estimateur débiaisé de θ = ρ Z (X, Y ) noté θ b. (c) Ecrire un programme qui calcule cet estimateur débiaisé. 2. Dans un second temps, on souhaite construire un intervalle de confiance bilatéral pour le paramètre θ = ρ Z (X, Y ) en utilisant la technique du bootstrap nonparamétrique. Pour cela, on dispose d un échantillon i.i.d. distribué comme (X, Y, Z) noté ((X 1, Y 1, Z 1 )..., (X n, Y n, Z n )). (a) Donner la construction d un intervalle de confiance bilatéral bootstrap de base pour θ de niveau de confiance (1 α). (b) Ecrire un programme qui calcule les bornes de cet intervalle de confiance bilatéral bootstrap de base. (c) Donner la construction d un intervalle de confiance bilatéral bootstrap studentisé pour θ de niveau de confiance (1 α). (d) Ecrire un programme qui calcule les bornes de cet intervalle de confiance bilatéral bootstrap studentisé. Exercice 8. Bootstrap et régression linéaire. Considérons un couple de variables aléatoires (X, Y ) satisfaisant le modèle de régression linéaire simple gaussien défini par : Y = c + dx + ε de paramètres c et d à estimer et où ε est une variable aléatoire indépendante de X de loi N (0, σ 2 ). Soit (X i, Y i ) i=1,...,n un échantillon distribué comme (X, Y ) et satisfaisant donc pour i = 1,..., n le modèle suivant : Y i = c + dx i + ε i où ε i i.i.d. N (0, σ 2 ) et où ε i X i. 1. Quelle est la loi des Y i pour i = 1,..., n conditionnellement aux covariables X i pour i = 1,..., n? 2. Déterminer l estimateur du maximum de vraisemblance noté (ĉ, d, σ 2 ) de (c, d, σ 2 ). 3. En déduire l expression des erreurs prédites notées ε i pour i = 1,..., n. On nomme R la relation ainsi obtenue. 4. Calculer la variance de d conditionnellement aux covariables. En proposer ensuite un estimateur (toujours conditionnellement aux covariables). 5. Sur quels principes sont fondées la construction d un intervalle de confiance bootstrap nonparamétrique percentile ainsi que la construction d un intervalle de confiance bootstrap non-paramétrique studentizé pour d? 6. Donner la construction d un intervalle de confiance bilatéral bootstrap non-paramétrique percentile pour d de niveau de confiance (1 α). 7. Ecrire un programme qui calcule les bornes de cet intervalle de confiance bilatéral bootstrap non-paramétrique percentile en prenant α = 0.05.

7 8. Donner la construction d un intervalle de confiance bilatéral bootstrap non-paramétrique studentisé pour d de niveau de confiance (1 α). 9. Ecrire un programme qui calcule les bornes de cet intervalle de confiance bilatéral bootstrap non-paramétrique studentisé en prenant α = Exercice 9. Bootstrap et odds-ratio. On constitue deux groupes de personnes susceptibles de contracter une maladie M. Le premier groupe rassemble des personnes exposées à un facteur de risque F tandis que le second groupe rassemble des personnes non-exposées à ce facteur de risque. Les deux groupes sont indépendants. Soit X i pour i = 1,..., n 1 la variable aléatoire binaire qui vaut 1 si la ième personne du premier groupe a contracté la maladie et 0 sinon. Soit Y i pour i = 1,..., n 2 la variable aléatoire binaire qui vaut 1 si la ième personne du deuxième groupe a contracté la maladie et 0 sinon. On souhaite estimer la quantité suivante qu on appelle odds-ratio : θ := p 1 1 p 1 p 2 1 p 2 où p 1 représente la probabilité de contracter la maladie M dans le groupe des exposés et p 2 représente la probabilité de contracter la maladie M dans le groupe des non-exposés. Pour cela, soit (X 1,..., X n1 ) un échantillon i.i.d. distribué comme X et soit (Y 1,..., Y n2 ) un échantillon i.i.d. distribué comme Y, indépendant de (X 1,..., X n1 ). 1. Donner la construction d un intervalle de confiance bilatéral bootstrap de base pour θ de niveau de confiance (1 α). 2. Ecrire un programme qui calcule les bornes de cet intervalle de confiance bilatéral bootstrap de base. 3. Donner la construction d un intervalle de confiance bilatéral bootstrap studentisé pour θ de niveau de confiance (1 α). 4. Ecrire un programme qui calcule les bornes de cet intervalle de confiance bilatéral bootstrap studentisé. Exercice 10. Bootstrap et odds ratio conditionnel On souhaite comparer le risque d avoir une fonction respiratoire anormale chez les fumeurs par rapport au risque des non-fumeurs tout en prenant l âge des individus en compte. Pour cela, on fonde notre comparaison sur un odds-ratio conditionnel. Introduisons Y la variable aléatoire binaire représentant l issue d un test respiratoire (normal auquel cas Y = 0 / anormal auquel cas Y = 1) pour un fumeur et introduisons Ỹ la variable aléatoire binaire représentant l issue d un test respiratoire (normal auquel cas Y = 0 / anormal auquel cas Y = 1) pour un non-fumeur. Soit X la variable aléatoire représentant l âge de ce fumeur et soit X la variable

8 aléatoire représentant l âge de ce non-fumeur. L odds ratio conditionnel qui nous intéresse est alors donné pour un certain âge x par : θ(x) = P[Y = 1 X = x] P[Ỹ = 0 X = x] P[Y = 0 X = x] P[Ỹ = 1 X = x] ( ) On dispose de (Y 1, X 1 ),..., (Y n1, X n1 ) un échantillon i.i.d. distribué comme (Y, X) ainsi que ( de (Ỹ1, X 1 ),..., (Ỹn 2, X ) n2 ) un échantillon i.i.d. distribué comme (Ỹ, X) et indépendant de ( ) (Y 1, X 1 ),..., (Y n1, X n1 ). 1. (a) Proposer un estimateur θ(x) de θ(x) en supposant que (Y, X) et (Ỹ, X) satisfont chacun un modèle de régression logistique. (b) Donner la construction d un estimateur bootstrap du biais de θ(x) et en déduire un estimateur débiaisé de θ(x) noté θ d (x). (c) Ecrire un programme qui calcule cet estimateur débiaisé. 2. (a) Donner la construction d un intervalle de confiance bilatéral bootstrap de base pour θ(x) de niveau de confiance (1 α). (b) Ecrire un programme qui calcule les bornes de cet intervalle de confiance bilatéral bootstrap de base. Exercice 11. Bootstrap et régression linéaire généralisée. On souhaite évaluer l influence de la taille d une tumeur à la prostate ôtée par ablation chirurgicale sur le risque de présenter une atteinte des ganglions lymphatiques. Dans ce but, une étude clinique est réalisée chez des patients nouvellement opérés qui subissent un examen supplémentaire afin de déterminer s il y a atteinte des ganglions lymphatiques (Collet, 1991). Soit X la variable aléatoire représentant la taille de la tumeur et soit Y la variable aléatoire représentant l état des ganglions lymphatiques du patient (atteints ou non). 1. Déterminer une estimation de l odds-ratio. 2. Ecrire un programme qui calcule cet odds-ratio. 3. Donner la construction d un intervalle de confiance bilatéral bootstrap pour l odds-ratio au niveau de confiance (1 α). 4. Ecrire un programme qui calcule cet intervalle de confiance. Exercice 12. Bootstrap et analyse de la variance. 1. (a) Donner la construction d un intervalle de confiance bilatéral bootstrap studentisé de niveau de confiance (1 α) pour les paramètres d intérêt d un modèle d ANOVA équilibré à un facteur à partir d un échantillon indépendant de taille n. (b) Ecrire un programme qui calcule les bornes de ces intervalles de confiance. 2. (a) Donner la construction d une version bootstrappée de la p-valeur du test de Fisher de nécessité de l ANOVA dans le modèle précédent.

9 (b) Ecrire un programme qui calcule cette p-valeur. Exercice 13. Problème de test de moyenne à deux échantillons. On souhaite tester l efficacité d un nouveau traitement prescrit pour réduire les problèmes d hypertension artérielle. Pour cela, deux échantillons de patients sont constitués : l un auquel on administre le nouveau traitement, l autre auquel on administre un placebo. Soit X la variable aléatoire représentant la tension artérielle systolique d un patient traité avec le nouveau médicament et soit Y la variable aléatoire représentant la tension artérielle systolique d un patient traité avec le placebo. On souhaite tester au niveau de risque de première espèce α l hypothèse H 0 : E[X] = E[Y ] contre l hypothèse H 1 : E[X] E[Y ]. Soit (X 1,..., X n1 ) un échantillon i.i.d. de loi F distribué comme X et soit (Y 1,..., Y n2 ) un échantillon i.i.d. de loi G distribué comme Y, indépendant de (X 1,..., X n1 ). 1. Ecriture de la procédure statistique. (a) Donner l expression de la p-value obtenue en mettant en oeuvre un test fondé sur l approximation normale. (b) Ecrire un programme qui calcule cette p-value. (c) Donner la construction de l estimateur bootstrap de la p-value. (d) Ecrire un programme qui calcule cette p-value bootstrappée. 2. Comparaison des méthodes asymptotique et bootstrap par simulations. (a) Ecrire un programme qui génère M=1000 échantillons (X 1,..., X 11 ) de loi gamma de paramètre de forme (shape) égal à 2 et de paramètre d échelle (scale) égal à 0.5 et M=1000 échantillons (Y 1,..., Y 10 ) de loi gamma de paramètre de forme (shape) égal à 2 et de paramètre d échelle (scale) égal à 0.5 et qui calcule sur chaque échantillon la valeur de la p-value obtenue par l approximation normale ainsi que la valeur de la p-value bootstrappée. En déduire le risque empirique de première espèce observé avec le test fondé sur l approximation normale et avec le test bootstrappé en choisissant un risque de première espèce nominal de 5%. (b) Ecrire un programme qui génère M=1000 échantillons (X 1,..., X 11 ) de loi gamma de paramètre de forme (shape) égal à 1 et de paramètre d échelle (scale) égal à 0.5 et M=1000 échantillons (Y 1,..., Y 10 ) de loi gamma de paramètre de forme (shape) égal à 4 et de paramètre d échelle (scale) égal à 0.5 puis qui calcule, sur chaque échantillon, la valeur de la p-value obtenue par l approximation normale ainsi que la valeur de la p-value bootstrappée. En déduire la puissance empirique observée avec le test fondé sur l approximation normale et avec le test fondé sur le bootstrap en choisissant un risque de première espèce nominal de 5%. 3. Application sur des données. On a relevé la pression artérielle systolique au bout d un mois de traitement chez 11 patients traités avec le nouveau médicament et chez 10 patients traités avec le placebo. Les données exprimées en mmhg sont les suivantes : Médicament Placebo

10 Comparer les résultats obtenus avec la procédure de test asymptotique et avec la procédure de test bootstrap en choisissant un risque de première espèce nominal de 5%. Exercice 14. Problème de test de proportion à deux échantillons. On souhaite tester l efficacité d un nouvel antibiotique prescrit pour guérir les infections à staphylocoques. Dans ce but, deux échantillons de patients sont constitués : l un auquel on administre le nouveau traitement, l autre auquel on administre un antibiotique usuel. Soit X la variable aléatoire représentant l état de santé d un patient traité avec le nouveau médicament (guéri ou non) et soit Y la variable aléatoire représentant l état de santé d un patient traité avec l antibiotique usuel. On souhaite tester au niveau de risque de première espèce α l hypothèse H 0 : E[X] = E[Y ] contre l hypothèse H 1 : E[X] E[Y ], ce qui revient à mettre en oeuvre un test d égalité de deux proportions à partir de deux échantillons indépendants. Pour cela, soit (X 1,..., X n1 ) un échantillon i.i.d. distribué comme X et soit (Y 1,..., Y n2 ) un échantillon i.i.d. distribué comme Y, indépendant de (X 1,..., X n1 ). 1. Donner l expression de la p-value obtenue en mettant en oeuvre le test asymptotique usuel (fondé sur l approximation normale). 2. Ecrire un programme qui calcule cette p-value. 3. Donner la construction de l estimateur bootstrap de la p-value. 4. Ecrire un programme qui calcule cette p-value bootstrappée. Exercice 15. Bootstrap et séries temporelles stationnaires Soit (X t ) t une série satisfaisant pour tout t le modèle suivant : X t = ax t 1 + ε t où (ε t ) t est une suite de variables aléatoires indépendantes et identiquement distribuées de loi N (0, σ 2 ) et où a vérifie a < 1. On dispose d observations de (X t ) t réalisées aux instants t = 1,..., n. 1. Déterminer un estimateur de a noté â. 2. Donner la construction d un intervalle de confiance bilatéral bootstrap non-paramétrique de base (de Hall) pour a de niveau de confiance (1 α). 3. Ecrire un programme qui calcule les bornes de cet intervalle de confiance bilatéral bootstrap non-paramétrique de base (de Hall) en prenant α = Exercice 16. Problème de test à un échantillon. La concentration naturelle en nitrates (NO 3 ) des eaux souterraines en l absence de fertilisation des sols varie de 5 à 15 mg/l. Cependant, l apport d engrais azotés agricoles dans les sols contribue à fortement augmenter cette teneur. Le décret du 20 décembre 2001 limite à 50 milligrammes par litre la teneur maximale en nitrates de l eau destinée à la consommation humaine. Un chimiste chargé du contrôle de l eau de ville effectue des prélèvements en différents points du réseau.

11 1. Ecriture de la procédure statistique. Soit X la variable aléatoire représentant la teneur en nitrates dans l eau de ville exprimé en mg/l en un endroit du réseau aléatoirement sélectionné. Soit (X 1,..., X n ) un échantillon i.i.d. distribué comme X. On souhaite tester au niveau de risque de première espèce α l hypothèse H 0 : E[X] = m 0 contre H 1 : E[X] > m 0. (a) Ecrire l expression de la p-value du test lorsqu on fonde ce test sur une approximation normale. (b) Ecrire un programme qui calcule cette p-value. (c) Donner la construction de la p-value du test lorsqu on fonde ce test sur le bootstrap. (d) Ecrire un programme qui calcule cette p-value bootstrappée. 2. Comparaison des tests asymptotique et bootstrappé par simulations. (a) Ecrire un programme qui génère M=1000 échantillons (X 1,..., X 15 ) de loi gamma de paramètre de forme (shape) égal à 30 et de paramètre d échelle (scale) égal à 1 et qui calcule, sur chaque échantillon, la valeur de la p-value obtenue par l approximation normale ainsi que la valeur de la p-value bootstrappée. En déduire le risque de 1ère espèce empirique pour le test fondé sur l approximation normale et avec le test fondé sur le bootstrap en choisissant un risque de première espèce nominal de 5%. (b) Ecrire un programme qui génère M=1000 échantillons (X 1,..., X 15 ) de loi gamma de paramètre de forme (shape) égal à 60 et de paramètre d échelle (scale) égal à 1 et qui calcule, sur chaque échantillon, la valeur de la p-value obtenue par l approximation normale ainsi que la valeur de la p-value bootstrappée. En déduire la puissance empirique pour le test fondé sur l approximation normale et avec le test fondé sur le bootstrap en choisissant un risque de première espèce nominal de 5%. 3. Application sur des données. Un échantillon de 15 prélèvements est analysé ce qui fournit les valeurs suivantes (en mg/l) : Comparer les résultats obtenus avec la procédure de test asymptotique et avec la procédure de test bootstrap en choisissant un risque de première espèce nominal de 5%.

12 Quelques fonctions utiles et quelques recommandations Le logiciel R peut être très long lorsqu il lui est demandé d effectuer de nombreuses boucles. Il faut donc éviter de le lui demander dans la mesure du possible. Les fonctions suivantes permettent parfois d éviter d écrire une boucle : ifelse(test,yes,no) permet de coder les indicatrices, test est un test logique, yes est la valeur asociée à un test positif, no est la valeur associée à un test négatif apply(x,marge,foo) applique la fonction foo à la matrice x, en ligne si marge=1, en colonne si marge=2 Ces fonctions sont mises en oeuvre sur le petit exemple ci-dessous : x <- cbind(x1 = 3, x2 = c(4:1, 2:5)) x col.sums <- apply(x, 2, sum) col.sums row.sums <- apply(x, 1, sum) row.sums ind<-ifelse(x[1]<=x[2],1,0) ind renvoie 1 si x[1] est inférieur ou égal à x[2] et 0 sinon Pour programmer des estimateurs bootstrap à la main, deux fonctions sont utiles : sample(x,n,replace=true) tire un vecteur de n valeurs avec remise dans le vecteur x replicate(b,operation) répète B fois l opération demandée et renvoit un vecteur de longueur B ou une matrice à B colonnes Citons aussi à toutes fins utiles : quantile(x,c(val1,val2,etc..)) calcule les quantiles empiriques associés aux données stockées dans le vecteur x d ordre val1, val2, etc... shapiro.test(x) effectue le test de normalité de Shapiro-Wilk sur les données x Pour pouvoir utiliser la fonction boot, il est nécessaire de charger le package qui la contient par l instruction suivante : library(boot) Voici un exemple simple d utilisation de la fonction boot. La statistique d intérêt est θ = X n et le vecteur de données est appelé mydata : # préliminaire obligatoire : créer une fonction qui calcule la statistique d intérêt mystat<-function(x,idx) { boot.sample<-x[idx] theta.hat.star<-mean(boot.sample) theta.hat.star } # appeler la fonction boot: boot.results<-boot(data=mydata,statistic=mystat,r=5000)

13 A partir des résultats obtenus, on peut alors utiliser la fonction boot.ci pour obtenir des intervalles de confiance : boot.icperc<-boot.ci(boot.out=boot.results,type="perc") détermine l intervalle de confiance bootstrap percentile boot.icbasic<-boot.ci(boot.out=boot.results,type="basic") détermine l intervalle de confiance bootstrap de base boot.icbca<-boot.ci(boot.out=boot.results,type="bca") détermine l intervalle de confiance bootstrap biais corrigé accéléré Pour obtenir un intervalle de confiance studentisé, il faut modifier la fonction donnant la statistique à bootstrapper de façon à ce qu elle renvoit aussi la variance de la statistique en question. mystat2<-function(x,idx) { boot.sample<-x[idx] theta.hat.star<-mean(boot.sample) thevariance<-var(boot.sample)/length(x) theresults<-c(theta.hat.star,thevariance) theresults } boot.results2<-boot(data=mydata,statistic=mystat2,r=5000) boot.icstud<-boot.ci(boot.out=boot.results2,type="stud") La méthode de bootstrap utilisée par défaut dans R est le bootstrap non-paramétrique. Voyons maintenant un exemple simple de bootstrap paramétrique sous l hypothèse que les données sont normales : # 2ème préliminaire obligatoire pour faire du bootstrap parametrique : créer une fonction qui génère les échantillons bootstrap rg.norm<-function(x,mle) { boot.sample<-rnorm(length(x),mean=mle[1],sd=sqrt(mle[2])) boot.sample } # appeler la fonction boot boot.par.norm<-boot(data=mydata, statistic=mystat, R=5000, sim="parametric", ran.gen=rg.norm, mle=c(mean(mydata),var(mydata)) )

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre. Université de Nantes Année 2013-2014 L3 Maths-Eco Feuille 6 : Tests Exercice 1 On cherche à connaître la température d ébullition µ, en degrés Celsius, d un certain liquide. On effectue 16 expériences

Plus en détail

Simulation de variables aléatoires

Simulation de variables aléatoires Chapter 1 Simulation de variables aléatoires Références: [F] Fishman, A first course in Monte Carlo, chap 3. [B] Bouleau, Probabilités de l ingénieur, chap 4. [R] Rubinstein, Simulation and Monte Carlo

Plus en détail

TABLE DES MATIERES. C Exercices complémentaires 42

TABLE DES MATIERES. C Exercices complémentaires 42 TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence

Plus en détail

Estimation et tests statistiques, TD 5. Solutions

Estimation et tests statistiques, TD 5. Solutions ISTIL, Tronc commun de première année Introduction aux méthodes probabilistes et statistiques, 2008 2009 Estimation et tests statistiques, TD 5. Solutions Exercice 1 Dans un centre avicole, des études

Plus en détail

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

La survie nette actuelle à long terme Qualités de sept méthodes d estimation La survie nette actuelle à long terme Qualités de sept méthodes d estimation PAR Alireza MOGHADDAM TUTEUR : Guy HÉDELIN Laboratoire d Épidémiologie et de Santé publique, EA 80 Faculté de Médecine de Strasbourg

Plus en détail

Introduction à l approche bootstrap

Introduction à l approche bootstrap Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?

Plus en détail

Principe d un test statistique

Principe d un test statistique Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre

Plus en détail

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures) CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un

Plus en détail

Programmes des classes préparatoires aux Grandes Ecoles

Programmes des classes préparatoires aux Grandes Ecoles Programmes des classes préparatoires aux Grandes Ecoles Filière : scientifique Voie : Biologie, chimie, physique et sciences de la Terre (BCPST) Discipline : Mathématiques Seconde année Préambule Programme

Plus en détail

Tests du χ 2. on accepte H 0 bonne décision erreur de seconde espèce on rejette H 0 erreur de première espèce bonne décision

Tests du χ 2. on accepte H 0 bonne décision erreur de seconde espèce on rejette H 0 erreur de première espèce bonne décision Page n 1. Tests du χ 2 une des fonctions des statistiques est de proposer, à partir d observations d un phénomène aléatoire (ou modélisé comme tel) une estimation de la loi de ce phénomène. C est que nous

Plus en détail

UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES

UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES Université Paris 13 Cours de Statistiques et Econométrie I UFR de Sciences Economiques Année 2008-2009 Licence de Sciences Economiques L3 Premier semestre TESTS PARAMÉTRIQUES Remarque: les exercices 2,

Plus en détail

23. Interprétation clinique des mesures de l effet traitement

23. Interprétation clinique des mesures de l effet traitement 23. Interprétation clinique des mesures de l effet traitement 23.1. Critères de jugement binaires Plusieurs mesures (indices) sont utilisables pour quantifier l effet traitement lors de l utilisation d

Plus en détail

Actuariat I ACT2121. septième séance. Arthur Charpentier. Automne 2012. charpentier.arthur@uqam.ca. http ://freakonometrics.blog.free.

Actuariat I ACT2121. septième séance. Arthur Charpentier. Automne 2012. charpentier.arthur@uqam.ca. http ://freakonometrics.blog.free. Actuariat I ACT2121 septième séance Arthur Charpentier charpentier.arthur@uqam.ca http ://freakonometrics.blog.free.fr/ Automne 2012 1 Exercice 1 En analysant le temps d attente X avant un certain événement

Plus en détail

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I Roxane Duroux 1 Cadre de l étude Cette étude s inscrit dans le cadre de recherche de doses pour des essais cliniques

Plus en détail

Statistique inférentielle TD 1 : Estimation

Statistique inférentielle TD 1 : Estimation POLYTECH LILLE Statistique inférentielle TD : Estimation Exercice : Maîtrise Statistique des Procédés Une entreprise de construction mécanique fabrique de pièces demoteurdevoiturepourungrandconstructeur

Plus en détail

PROBABILITES ET STATISTIQUE I&II

PROBABILITES ET STATISTIQUE I&II PROBABILITES ET STATISTIQUE I&II TABLE DES MATIERES CHAPITRE I - COMBINATOIRE ELEMENTAIRE I.1. Rappel des notations de la théorie des ensemble I.1.a. Ensembles et sous-ensembles I.1.b. Diagrammes (dits

Plus en détail

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Chapitre 5 UE4 : Biostatistiques Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés.

Plus en détail

Feuille TD n 1 Exercices d algorithmique éléments de correction

Feuille TD n 1 Exercices d algorithmique éléments de correction Master Sciences, Technologies, Santé Mention Mathématiques, spécialité Enseignement des mathématiques Algorithmique et graphes, thèmes du second degré Feuille TD n 1 Exercices d algorithmique éléments

Plus en détail

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers

Plus en détail

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION Bruno Saussereau Laboratoire de Mathématiques de Besançon Université de Franche-Comté Travail en commun

Plus en détail

Modélisation aléatoire en fiabilité des logiciels

Modélisation aléatoire en fiabilité des logiciels collection Méthodes stochastiques appliquées dirigée par Nikolaos Limnios et Jacques Janssen La sûreté de fonctionnement des systèmes informatiques est aujourd hui un enjeu économique et sociétal majeur.

Plus en détail

Transmission d informations sur le réseau électrique

Transmission d informations sur le réseau électrique Transmission d informations sur le réseau électrique Introduction Remarques Toutes les questions en italique devront être préparées par écrit avant la séance du TP. Les préparations seront ramassées en

Plus en détail

UNIVERSITÉ DU QUÉBEC À MONTRÉAL TESTS EN ÉCHANTILLONS FINIS DU MEDAF SANS LA NORMALITÉ ET SANS LA CONVERGENCE

UNIVERSITÉ DU QUÉBEC À MONTRÉAL TESTS EN ÉCHANTILLONS FINIS DU MEDAF SANS LA NORMALITÉ ET SANS LA CONVERGENCE UNIVERSITÉ DU QUÉBEC À MONTRÉAL TESTS EN ÉCHANTILLONS FINIS DU MEDAF SANS LA NORMALITÉ ET SANS LA CONVERGENCE MÉMOIRE PRÉSENTÉ COMME EXIGENCE PARTIELLE DE LA MAÎTRISE EN ÉCONOMIE PAR MATHIEU SISTO NOVEMBRE

Plus en détail

«Cours Statistique et logiciel R»

«Cours Statistique et logiciel R» «Cours Statistique et logiciel R» Rémy Drouilhet (1), Adeline Leclercq-Samson (1), Frédérique Letué (1), Laurence Viry (2) (1) Laboratoire Jean Kuntzmann, Dép. Probabilites et Statistique, (2) Laboratoire

Plus en détail

Contents. 1 Introduction Objectifs des systèmes bonus-malus Système bonus-malus à classes Système bonus-malus : Principes

Contents. 1 Introduction Objectifs des systèmes bonus-malus Système bonus-malus à classes Système bonus-malus : Principes Université Claude Bernard Lyon 1 Institut de Science Financière et d Assurances Système Bonus-Malus Introduction & Applications SCILAB Julien Tomas Institut de Science Financière et d Assurances Laboratoire

Plus en détail

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé Baccalauréat ES Pondichéry 7 avril 204 Corrigé EXERCICE 4 points Commun à tous les candidats. Proposition fausse. La tangente T, passant par les points A et B d abscisses distinctes, a pour coefficient

Plus en détail

Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels

Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels Etab=MK3, Timbre=G430, TimbreDansAdresse=Vrai, Version=W2000/Charte7, VersionTravail=W2000/Charte7 Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels

Plus en détail

Représentation des Nombres

Représentation des Nombres Chapitre 5 Représentation des Nombres 5. Representation des entiers 5.. Principe des représentations en base b Base L entier écrit 344 correspond a 3 mille + 4 cent + dix + 4. Plus généralement a n a n...

Plus en détail

Introduction à la statistique non paramétrique

Introduction à la statistique non paramétrique Introduction à la statistique non paramétrique Catherine MATIAS CNRS, Laboratoire Statistique & Génome, Évry http://stat.genopole.cnrs.fr/ cmatias Atelier SFDS 27/28 septembre 2012 Partie 2 : Tests non

Plus en détail

Exercice : la frontière des portefeuilles optimaux sans actif certain

Exercice : la frontière des portefeuilles optimaux sans actif certain Exercice : la frontière des portefeuilles optimaux sans actif certain Philippe Bernard Ingénierie Economique & Financière Université Paris-Dauphine Février 0 On considère un univers de titres constitué

Plus en détail

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Valentin Patilea 1 Cesar Sanchez-sellero 2 Matthieu Saumard 3 1 CREST-ENSAI et IRMAR 2 USC Espagne 3 IRMAR-INSA

Plus en détail

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens Chapitre 7 Statistique des échantillons gaussiens Le théorème central limite met en évidence le rôle majeur tenu par la loi gaussienne en modélisation stochastique. De ce fait, les modèles statistiques

Plus en détail

Que faire lorsqu on considère plusieurs variables en même temps?

Que faire lorsqu on considère plusieurs variables en même temps? Chapitre 3 Que faire lorsqu on considère plusieurs variables en même temps? On va la plupart du temps se limiter à l étude de couple de variables aléatoires, on peut bien sûr étendre les notions introduites

Plus en détail

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE UE4 : Biostatistiques Chapitre 6 Test de comparaison de pourcentages χ² José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Nature des variables

Plus en détail

Soutenance de stage Laboratoire des Signaux et Systèmes

Soutenance de stage Laboratoire des Signaux et Systèmes Soutenance de stage Laboratoire des Signaux et Systèmes Bornes inférieures bayésiennes de l'erreur quadratique moyenne. Application à la localisation de points de rupture. M2R ATSI Université Paris-Sud

Plus en détail

Cours de Tests paramétriques

Cours de Tests paramétriques Cours de Tests paramétriques F. Muri-Majoube et P. Cénac 2006-2007 Licence Ce document est sous licence ALC TYPE 2. Le texte de cette licence est également consultable en ligne à l adresse http://www.librecours.org/cgi-bin/main?callback=licencetype2.

Plus en détail

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé A. P. M. E. P. Exercice 1 5 points 1. Réponse d. : 1 e Le coefficient directeur de la tangente est négatif et n est manifestement pas 2e

Plus en détail

Etude des propriétés empiriques du lasso par simulations

Etude des propriétés empiriques du lasso par simulations Etude des propriétés empiriques du lasso par simulations L objectif de ce TP est d étudier les propriétés empiriques du LASSO et de ses variantes à partir de données simulées. Un deuxième objectif est

Plus en détail

Analyse des durées de vie avec le logiciel R

Analyse des durées de vie avec le logiciel R Analyse des durées de vie avec le logiciel R Ségolen Geffray Des outils ainsi que des données pour l analyse des durées de vie sont disponibles dans les packages survival MASS Il est nécessaire de charger

Plus en détail

BTS Groupement A. Mathématiques Session 2011. Spécialités CIRA, IRIS, Systèmes électroniques, TPIL

BTS Groupement A. Mathématiques Session 2011. Spécialités CIRA, IRIS, Systèmes électroniques, TPIL BTS Groupement A Mathématiques Session 11 Exercice 1 : 1 points Spécialités CIRA, IRIS, Systèmes électroniques, TPIL On considère un circuit composé d une résistance et d un condensateur représenté par

Plus en détail

TSTI 2D CH X : Exemples de lois à densité 1

TSTI 2D CH X : Exemples de lois à densité 1 TSTI 2D CH X : Exemples de lois à densité I Loi uniforme sur ab ; ) Introduction Dans cette activité, on s intéresse à la modélisation du tirage au hasard d un nombre réel de l intervalle [0 ;], chacun

Plus en détail

3. Caractéristiques et fonctions d une v.a.

3. Caractéristiques et fonctions d une v.a. 3. Caractéristiques et fonctions d une v.a. MTH2302D S. Le Digabel, École Polytechnique de Montréal H2015 (v2) MTH2302D: fonctions d une v.a. 1/32 Plan 1. Caractéristiques d une distribution 2. Fonctions

Plus en détail

Le modèle de régression linéaire

Le modèle de régression linéaire Chapitre 2 Le modèle de régression linéaire 2.1 Introduction L économétrie traite de la construction de modèles. Le premier point de l analyse consiste à se poser la question : «Quel est le modèle?». Le

Plus en détail

Analyse de la variance Comparaison de plusieurs moyennes

Analyse de la variance Comparaison de plusieurs moyennes Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction

Plus en détail

La fonction exponentielle

La fonction exponentielle DERNIÈRE IMPRESSION LE 2 novembre 204 à :07 La fonction exponentielle Table des matières La fonction exponentielle 2. Définition et théorèmes.......................... 2.2 Approche graphique de la fonction

Plus en détail

Capacité d un canal Second Théorème de Shannon. Théorie de l information 1/34

Capacité d un canal Second Théorème de Shannon. Théorie de l information 1/34 Capacité d un canal Second Théorème de Shannon Théorie de l information 1/34 Plan du cours 1. Canaux discrets sans mémoire, exemples ; 2. Capacité ; 3. Canaux symétriques ; 4. Codage de canal ; 5. Second

Plus en détail

4 Distributions particulières de probabilités

4 Distributions particulières de probabilités 4 Distributions particulières de probabilités 4.1 Distributions discrètes usuelles Les variables aléatoires discrètes sont réparties en catégories selon le type de leur loi. 4.1.1 Variable de Bernoulli

Plus en détail

Exercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015

Exercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015 Exercices M1 SES 214-215 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 215 Les exemples numériques présentés dans ce document d exercices ont été traités sur le logiciel R, téléchargeable par

Plus en détail

Le Modèle Linéaire par l exemple :

Le Modèle Linéaire par l exemple : Publications du Laboratoire de Statistique et Probabilités Le Modèle Linéaire par l exemple : Régression, Analyse de la Variance,... Jean-Marc Azaïs et Jean-Marc Bardet Laboratoire de Statistique et Probabilités

Plus en détail

Méthodes de Simulation

Méthodes de Simulation Méthodes de Simulation JEAN-YVES TOURNERET Institut de recherche en informatique de Toulouse (IRIT) ENSEEIHT, Toulouse, France Peyresq06 p. 1/41 Remerciements Christian Robert : pour ses excellents transparents

Plus en détail

Docteur José LABARERE

Docteur José LABARERE UE7 - Santé Société Humanité Risques sanitaires Chapitre 3 : Epidémiologie étiologique Docteur José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés.

Plus en détail

Température corporelle d un castor (une petite introduction aux séries temporelles)

Température corporelle d un castor (une petite introduction aux séries temporelles) Température corporelle d un castor (une petite introduction aux séries temporelles) GMMA 106 GMMA 106 2014 2015 1 / 32 Cas d étude Temperature (C) 37.0 37.5 38.0 0 20 40 60 80 100 Figure 1: Temperature

Plus en détail

NON-LINEARITE ET RESEAUX NEURONAUX

NON-LINEARITE ET RESEAUX NEURONAUX NON-LINEARITE ET RESEAUX NEURONAUX Vêlayoudom MARIMOUTOU Laboratoire d Analyse et de Recherche Economiques Université de Bordeaux IV Avenue. Leon Duguit, 33608 PESSAC, France tel. 05 56 84 85 77 e-mail

Plus en détail

Précision d un résultat et calculs d incertitudes

Précision d un résultat et calculs d incertitudes Précision d un résultat et calculs d incertitudes PSI* 2012-2013 Lycée Chaptal 3 Table des matières Table des matières 1. Présentation d un résultat numérique................................ 4 1.1 Notations.........................................................

Plus en détail

Annexe commune aux séries ES, L et S : boîtes et quantiles

Annexe commune aux séries ES, L et S : boîtes et quantiles Annexe commune aux séries ES, L et S : boîtes et quantiles Quantiles En statistique, pour toute série numérique de données à valeurs dans un intervalle I, on définit la fonction quantile Q, de [,1] dans

Plus en détail

Modèles pour données répétées

Modèles pour données répétées Résumé Les données répétées, ou données longitudinales, constituent un domaine à la fois important et assez particulier de la statistique. On entend par données répétées des données telles que, pour chaque

Plus en détail

Architecture des ordinateurs TD1 - Portes logiques et premiers circuits

Architecture des ordinateurs TD1 - Portes logiques et premiers circuits Architecture des ordinateurs TD1 - Portes logiques et premiers circuits 1 Rappel : un peu de logique Exercice 1.1 Remplir la table de vérité suivante : a b a + b ab a + b ab a b 0 0 0 1 1 0 1 1 Exercice

Plus en détail

Probabilités III Introduction à l évaluation d options

Probabilités III Introduction à l évaluation d options Probabilités III Introduction à l évaluation d options Jacques Printems Promotion 2012 2013 1 Modèle à temps discret 2 Introduction aux modèles en temps continu Limite du modèle binomial lorsque N + Un

Plus en détail

Une introduction. Lionel RIOU FRANÇA. Septembre 2008

Une introduction. Lionel RIOU FRANÇA. Septembre 2008 Une introduction INSERM U669 Septembre 2008 Sommaire 1 Effets Fixes Effets Aléatoires 2 Analyse Classique Effets aléatoires Efficacité homogène Efficacité hétérogène 3 Estimation du modèle Inférence 4

Plus en détail

ALGORITHMIQUE II NOTION DE COMPLEXITE. SMI AlgoII

ALGORITHMIQUE II NOTION DE COMPLEXITE. SMI AlgoII ALGORITHMIQUE II NOTION DE COMPLEXITE 1 2 Comment choisir entre différents algorithmes pour résoudre un même problème? Plusieurs critères de choix : Exactitude Simplicité Efficacité (but de ce chapitre)

Plus en détail

FORMULAIRE DE STATISTIQUES

FORMULAIRE DE STATISTIQUES FORMULAIRE DE STATISTIQUES I. STATISTIQUES DESCRIPTIVES Moyenne arithmétique Remarque: population: m xμ; échantillon: Mx 1 Somme des carrés des écarts "# FR MOYENNE(série) MOYENNE(série) NL GEMIDDELDE(série)

Plus en détail

Le risque Idiosyncrasique

Le risque Idiosyncrasique Le risque Idiosyncrasique -Pierre CADESTIN -Magali DRIGHES -Raphael MINATO -Mathieu SELLES 1 Introduction Risque idiosyncrasique : risque non pris en compte dans le risque de marché (indépendant des phénomènes

Plus en détail

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique»

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Tests de comparaison de moyennes Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Test de Z ou de l écart réduit Le test de Z : comparer des paramètres en testant leurs différences

Plus en détail

TD1 Signaux, énergie et puissance, signaux aléatoires

TD1 Signaux, énergie et puissance, signaux aléatoires TD1 Signaux, énergie et puissance, signaux aléatoires I ) Ecrire l'expression analytique des signaux représentés sur les figures suivantes à l'aide de signaux particuliers. Dans le cas du signal y(t) trouver

Plus en détail

Programmation linéaire

Programmation linéaire 1 Programmation linéaire 1. Le problème, un exemple. 2. Le cas b = 0 3. Théorème de dualité 4. L algorithme du simplexe 5. Problèmes équivalents 6. Complexité de l Algorithme 2 Position du problème Soit

Plus en détail

(51) Int Cl.: H04L 29/06 (2006.01) G06F 21/55 (2013.01)

(51) Int Cl.: H04L 29/06 (2006.01) G06F 21/55 (2013.01) (19) TEPZZ 8 8 4_A_T (11) EP 2 838 241 A1 (12) DEMANDE DE BREVET EUROPEEN (43) Date de publication: 18.02.1 Bulletin 1/08 (1) Int Cl.: H04L 29/06 (06.01) G06F 21/ (13.01) (21) Numéro de dépôt: 141781.4

Plus en détail

I3, Probabilités 2014 Travaux Dirigés F BM F BM F BM F BM F B M F B M F B M F B M 20 20 80 80 100 100 300 300

I3, Probabilités 2014 Travaux Dirigés F BM F BM F BM F BM F B M F B M F B M F B M 20 20 80 80 100 100 300 300 I3, Probabilités 2014 Travaux Dirigés TD 1 : rappels. Exercice 1 Poker simplié On tire 3 cartes d'un jeu de 52 cartes. Quelles sont les probabilités d'obtenir un brelan, une couleur, une paire, une suite,

Plus en détail

Statistique Descriptive Élémentaire

Statistique Descriptive Élémentaire Publications de l Institut de Mathématiques de Toulouse Statistique Descriptive Élémentaire (version de mai 2010) Alain Baccini Institut de Mathématiques de Toulouse UMR CNRS 5219 Université Paul Sabatier

Plus en détail

IFT3245. Simulation et modèles

IFT3245. Simulation et modèles IFT 3245 Simulation et modèles DIRO Université de Montréal Automne 2012 Tests statistiques L étude des propriétés théoriques d un générateur ne suffit; il estindispensable de recourir à des tests statistiques

Plus en détail

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé Baccalauréat S ntilles-guyane 11 septembre 14 Corrigé EXERCICE 1 6 points Commun à tous les candidats Une entreprise de jouets en peluche souhaite commercialiser un nouveau produit et à cette fin, effectue

Plus en détail

Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes

Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes Zohra Guessoum 1 & Farida Hamrani 2 1 Lab. MSTD, Faculté de mathématique, USTHB, BP n 32, El Alia, Alger, Algérie,zguessoum@usthb.dz

Plus en détail

Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN

Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN Table des matières. Introduction....3 Mesures et incertitudes en sciences physiques

Plus en détail

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI 1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage

Plus en détail

Complément d information concernant la fiche de concordance

Complément d information concernant la fiche de concordance Sommaire SAMEDI 0 DÉCEMBRE 20 Vous trouverez dans ce dossier les documents correspondants à ce que nous allons travailler aujourd hui : La fiche de concordance pour le DAEU ; Page 2 Un rappel de cours

Plus en détail

Correction TD algorithmique

Correction TD algorithmique Affectation Correction TD algorithmique Exercice 1 algo affect1b b 5 a b+1 b 2 Il vaut faire passer la notion de variable et la notion de stockage mémoire. Une variable n a donc pas d historique et à un

Plus en détail

Manuel d utilisation 26 juin 2011. 1 Tâche à effectuer : écrire un algorithme 2

Manuel d utilisation 26 juin 2011. 1 Tâche à effectuer : écrire un algorithme 2 éducalgo Manuel d utilisation 26 juin 2011 Table des matières 1 Tâche à effectuer : écrire un algorithme 2 2 Comment écrire un algorithme? 3 2.1 Avec quoi écrit-on? Avec les boutons d écriture........

Plus en détail

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3

Plus en détail

Introduction à MATLAB R

Introduction à MATLAB R Introduction à MATLAB R Romain Tavenard 10 septembre 2009 MATLAB R est un environnement de calcul numérique propriétaire orienté vers le calcul matriciel. Il se compose d un langage de programmation, d

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme

Plus en détail

Les équations différentielles

Les équations différentielles Les équations différentielles Equations différentielles du premier ordre avec second membre Ce cours porte exclusivement sur la résolution des équations différentielles du premier ordre avec second membre

Plus en détail

Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques.

Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques. 14-3- 214 J.F.C. p. 1 I Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques. Exercice 1 Densité de probabilité. F { ln x si x ], 1] UN OVNI... On pose x R,

Plus en détail

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications A. Optimisation sans contrainte.... Généralités.... Condition nécessaire et condition suffisante

Plus en détail

Introduction à la Statistique Inférentielle

Introduction à la Statistique Inférentielle UNIVERSITE MOHAMMED V-AGDAL SCIENCES FACULTE DES DEPARTEMENT DE MATHEMATIQUES SMI semestre 4 : Probabilités - Statistique Introduction à la Statistique Inférentielle Prinemps 2013 0 INTRODUCTION La statistique

Plus en détail

MÉTHODE DE MONTE CARLO.

MÉTHODE DE MONTE CARLO. MÉTHODE DE MONTE CARLO. Alexandre Popier Université du Maine, Le Mans A. Popier (Le Mans) Méthode de Monte Carlo. 1 / 95 PLAN DU COURS 1 MÉTHODE DE MONTE CARLO 2 PROBLÈME DE SIMULATION Théorème fondamental

Plus en détail

Relation entre deux variables : estimation de la corrélation linéaire

Relation entre deux variables : estimation de la corrélation linéaire CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence

Plus en détail

Définition 0,752 = 0,7 + 0,05 + 0,002 SYSTÈMES DE NUMÉRATION POSITIONNELS = 7 10 1 + 5 10 2 + 2 10 3

Définition 0,752 = 0,7 + 0,05 + 0,002 SYSTÈMES DE NUMÉRATION POSITIONNELS = 7 10 1 + 5 10 2 + 2 10 3 8 Systèmes de numération INTRODUCTION SYSTÈMES DE NUMÉRATION POSITIONNELS Dans un système positionnel, le nombre de symboles est fixe On représente par un symbole chaque chiffre inférieur à la base, incluant

Plus en détail

Complexité. Licence Informatique - Semestre 2 - Algorithmique et Programmation

Complexité. Licence Informatique - Semestre 2 - Algorithmique et Programmation Complexité Objectifs des calculs de complexité : - pouvoir prévoir le temps d'exécution d'un algorithme - pouvoir comparer deux algorithmes réalisant le même traitement Exemples : - si on lance le calcul

Plus en détail

3. Conditionnement P (B)

3. Conditionnement P (B) Conditionnement 16 3. Conditionnement Dans cette section, nous allons rappeler un certain nombre de définitions et de propriétés liées au problème du conditionnement, c est à dire à la prise en compte

Plus en détail

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

Baccalauréat ES/L Amérique du Sud 21 novembre 2013 Baccalauréat ES/L Amérique du Sud 21 novembre 2013 A. P. M. E. P. EXERCICE 1 Commun à tous les candidats 5 points Une entreprise informatique produit et vend des clés USB. La vente de ces clés est réalisée

Plus en détail

de calibration Master 2: Calibration de modèles: présentation et simulation d

de calibration Master 2: Calibration de modèles: présentation et simulation d Master 2: Calibration de modèles: présentation et simulation de quelques problèmes de calibration Plan de la présentation 1. Présentation de quelques modèles à calibrer 1a. Reconstruction d une courbe

Plus en détail

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1 La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1 La licence Mathématiques et Economie-MASS de l Université des Sciences Sociales de Toulouse propose sur les trois

Plus en détail

Introduction aux Statistiques et à l utilisation du logiciel R

Introduction aux Statistiques et à l utilisation du logiciel R Introduction aux Statistiques et à l utilisation du logiciel R Christophe Lalanne Christophe Pallier 1 Introduction 2 Comparaisons de deux moyennes 2.1 Objet de l étude On a mesuré le temps de sommeil

Plus en détail

Économetrie non paramétrique I. Estimation d une densité

Économetrie non paramétrique I. Estimation d une densité Économetrie non paramétrique I. Estimation d une densité Stéphane Adjemian Université d Évry Janvier 2004 1 1 Introduction 1.1 Pourquoi estimer une densité? Étudier la distribution des richesses... Proposer

Plus en détail

Chapitre 3. Mesures stationnaires. et théorèmes de convergence

Chapitre 3. Mesures stationnaires. et théorèmes de convergence Chapitre 3 Mesures stationnaires et théorèmes de convergence Christiane Cocozza-Thivent, Université de Marne-la-Vallée p.1 I. Mesures stationnaires Christiane Cocozza-Thivent, Université de Marne-la-Vallée

Plus en détail

Détection en environnement non-gaussien Cas du fouillis de mer et extension aux milieux

Détection en environnement non-gaussien Cas du fouillis de mer et extension aux milieux Détection en environnement non-gaussien Cas du fouillis de mer et extension aux milieux hétérogènes Laurent Déjean Thales Airborne Systems/ENST-Bretagne Le 20 novembre 2006 Laurent Déjean Détection en

Plus en détail

Baccalauréat ES/L Métropole La Réunion 13 septembre 2013 Corrigé

Baccalauréat ES/L Métropole La Réunion 13 septembre 2013 Corrigé Baccalauréat S/L Métropole La Réunion 13 septembre 2013 Corrigé A. P. M.. P. XRCIC 1 Commun à tous les candidats Partie A 1. L arbre de probabilité correspondant aux données du problème est : 0,3 0,6 H

Plus en détail

Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT

Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT Ces exercices portent sur les items 2, 3 et 5 du programme d informatique des classes préparatoires,

Plus en détail

Probabilités Loi binomiale Exercices corrigés

Probabilités Loi binomiale Exercices corrigés Probabilités Loi binomiale Exercices corrigés Sont abordés dans cette fiche : (cliquez sur l exercice pour un accès direct) Exercice 1 : épreuve de Bernoulli Exercice 2 : loi de Bernoulli de paramètre

Plus en détail

La conversion de données : Convertisseur Analogique Numérique (CAN) Convertisseur Numérique Analogique (CNA)

La conversion de données : Convertisseur Analogique Numérique (CAN) Convertisseur Numérique Analogique (CNA) La conversion de données : Convertisseur Analogique Numérique (CAN) Convertisseur Numérique Analogique (CNA) I. L'intérêt de la conversion de données, problèmes et définitions associés. I.1. Définitions:

Plus en détail

STATISTIQUES. UE Modélisation pour la biologie

STATISTIQUES. UE Modélisation pour la biologie STATISTIQUES UE Modélisation pour la biologie 2011 Cadre Général n individus: 1, 2,..., n Y variable à expliquer : Y = (y 1, y 2,..., y n ), y i R Modèle: Y = Xθ + ε X matrice du plan d expériences θ paramètres

Plus en détail