Jackknife et bootstrap comparés

Save this PDF as:
 WORD  PNG  TXT  JPG

Dimension: px
Commencer à balayer dès la page:

Download "Jackknife et bootstrap comparés"

Transcription

1 Jackknife et bootstrap comparés Statistique linéaire θ(x 1,...,X n ) = c + n 1 n 1 α(x i) c constante, α fonction Exemples : X, 1 + n 1 Xi /n

2 Jackknife et bootstrap comparés Statistique linéaire θ(x 1,...,X n ) = c + n 1 n 1 α(x i) c constante, α fonction Exemples : X, 1 + n 1 Xi /n Estimation de la variance d une statistique : pour toute statistique linéaire le jackknife et le bootstrap sont égaux à la constante multiplicative (n 1)/n près.

3 Jackknife et bootstrap comparés Statistique linéaire θ(x 1,...,X n ) = c + n 1 n 1 α(x i) c constante, α fonction Exemples : X, 1 + n 1 Xi /n Estimation de la variance d une statistique : pour toute statistique linéaire le jackknife et le bootstrap sont égaux à la constante multiplicative (n 1)/n près. Pour une statistique non linéaire: les deux estimateurs de la variance peuvent être très différents. Pour des statistiques très éloignées de la linéarité, le jackknife est en général plus imprécis que le bootstrap.

4 Jackknife et bootstrap comparés Statistique linéaire θ(x 1,...,X n ) = c + n 1 n 1 α(x i) c constante, α fonction Exemples : X, 1 + n 1 Xi /n Estimation de la variance d une statistique : pour toute statistique linéaire le jackknife et le bootstrap sont égaux à la constante multiplicative (n 1)/n près. Pour une statistique non linéaire: les deux estimateurs de la variance peuvent être très différents. Pour des statistiques très éloignées de la linéarité, le jackknife est en général plus imprécis que le bootstrap. Exemples : le coeff. de corrélation de Pearson r X,Y est une statistique non linéaire

5 Jackknife et bootstrap comparés Exemple: X et coefficient de corrélation r X,Y pour normale bivariée moyennes 0, variances 1, corr. 0.7

6 Jackknife et bootstrap comparés Exemple: X et coefficient de corrélation r X,Y pour normale bivariée moyennes 0, variances 1, corr. 0.7 > library(mass) #package pour simuler la normale bivariée > mu = c(0,0) # vecteur des moyennes > sigma = matrix(c(1,.7,.7,1),ncol=2) # matrice de covariance

7 Jackknife et bootstrap comparés Exemple: X et coefficient de corrélation r X,Y pour normale bivariée moyennes 0, variances 1, corr. 0.7 > library(mass) #package pour simuler la normale bivariée > mu = c(0,0) # vecteur des moyennes > sigma = matrix(c(1,.7,.7,1),ncol=2) # matrice de covariance Simulation de 2000 vecteurs normaux bivariés > set.seed(601) > a = mvrnorm(2000,mu,sigma) #matrice , lignes (X i,y i )

8 Estimation de σ(x) = 1/ n 200 estimations v Jack de X sur 200 échantillons de taille 10 (colonne X de la matrice a) > ja = numeric(200) #vecteur à 200 composantes 0 > for (i in 1:200) ja[i] = jackknife(a[(10*i-9):(10*i),1],mean)[[1]] #moyennes calculées sur la colonne X

9 Estimation de σ(x) = 1/ n 200 estimations v Jack de X sur 200 échantillons de taille 10 (colonne X de la matrice a) > ja = numeric(200) #vecteur à 200 composantes 0 > for (i in 1:200) ja[i] = jackknife(a[(10*i-9):(10*i),1],mean)[[1]] #moyennes calculées sur la colonne X Idem pour le bootstrap et v Boot > bo = numeric(200) > for (i in 1:200) + bo[i] = bootstrap(a[(10*i-9):(10*i),1],200,mean, func=sd)[[2]] #B = 200 réplications

10 Estimation de σ(x) (suite) 200 estimations selon le jackknife et le bootstrap. Echantillons de taille 10 d une normale N(0, 1).

11 Estimation de σ(x) (suite) 200 estimations selon le jackknife et le bootstrap. Echantillons de taille 10 d une normale N(0, 1). > boxplot(ja,bo,names=c( jackknife, bootstrap ), main= Ecart type de la moyenne ) > abline(h=1/sqrt(10)) # Var[X] = 1/ 10 = #Rappel: v Boot = 9v Jack /10

12 Estimation de σ(r X,Y ) Création de 2 vecteurs de 200 composantes > rja = numeric(200) > rbo = numeric(200)

13 Estimation de σ(r X,Y ) Création de 2 vecteurs de 200 composantes > rja = numeric(200) > rbo = numeric(200) Définition de la corrélation de Pearson > theta = function(x,donnees) cor(donnees[x,1],donnees[x,2]) # x: nos des obs.

14 Estimation de σ(r X,Y ) Création de 2 vecteurs de 200 composantes > rja = numeric(200) > rbo = numeric(200) Définition de la corrélation de Pearson > theta = function(x,donnees) cor(donnees[x,1],donnees[x,2]) # x: nos des obs. Jackknife et bootstrap bivariés > for (i in 1:200) rja[i] = jackknife(1:10,theta, a[(10*i-9):(10*i),])[[1]] > for (i in 1:200) rbo[i] = bootstrap(1:10,200,theta, a[(10*i-9):(10*i),],func=sd)[[2]]

15 Estimation de σ(r X,Y ) (suite) 200 estimations selon le jackknife et le bootstrap. Echantillons de taille 10 normale bivariée.

16 Estimation de σ(r X,Y ) (suite) 200 estimations selon le jackknife et le bootstrap. Echantillons de taille 10 normale bivariée. > boxplot(rja,rbo,names=c("jackknife","bootstrap"), main="ecart type de rxy",ylab="200 estimations") > abline(h=(1-0.7ˆ2)/sqrt(10-3)) # σ(r) théorique 0.19

17 LE BOOTSTRAP (suite) Estimation de la variance d une médiane

18 LE BOOTSTRAP (suite) Estimation de la variance d une médiane Selon la théorie de l estimation par le maximum de vraisemblance, la médiane θ est asymptotiquement N(m, 1/(4nf 2 (m))), où m = médiane théorique, f = densité.

19 LE BOOTSTRAP (suite) Estimation de la variance d une médiane Selon la théorie de l estimation par le maximum de vraisemblance, la médiane θ est asymptotiquement N(m, 1/(4nf 2 (m))), où m = médiane théorique, f = densité. Estimateur possible: Var( θ) = 1/(4n f 2 (m)).

20 LE BOOTSTRAP (suite) Estimation de la variance d une médiane Selon la théorie de l estimation par le maximum de vraisemblance, la médiane θ est asymptotiquement N(m, 1/(4nf 2 (m))), où m = médiane théorique, f = densité. Estimateur possible: Var( θ) = 1/(4n f 2 (m)). Problème : estimer la densité f en m (vu plus loin).

21 LE BOOTSTRAP (suite) Estimation de la variance d une médiane Selon la théorie de l estimation par le maximum de vraisemblance, la médiane θ est asymptotiquement N(m, 1/(4nf 2 (m))), où m = médiane théorique, f = densité. Estimateur possible: Var( θ) = 1/(4n f 2 (m)). Problème : estimer la densité f en m (vu plus loin). Package boot, contient la fonction boot plus sophistiquée que la fonction bootstrap. > library(boot)

22 LE BOOTSTRAP (suite) Estimation de la variance d une médiane Selon la théorie de l estimation par le maximum de vraisemblance, la médiane θ est asymptotiquement N(m, 1/(4nf 2 (m))), où m = médiane théorique, f = densité. Estimateur possible: Var( θ) = 1/(4n f 2 (m)). Problème : estimer la densité f en m (vu plus loin). Package boot, contient la fonction boot plus sophistiquée que la fonction bootstrap. > library(boot) Jeu de données galaxies > library(mass)

23 Jeu galaxies > galaxies #vitesses d éloignement en km/s [1] [13] [25] [37] [49]

24 Jeu galaxies > galaxies #vitesses d éloignement en km/s [1] [13] [25] [37] [49] > length(galaxies) # n [1] 82

25 Jeu galaxies (suite) Histogramme #données non normales > hist(galaxies/1000,xlab= Vitesse en 1000 km/s,ylab=,main= Histogramme,col= blue,nclass=14) Histogramme J.-C. Massé

26 Fonction boot Forme générale boot(data, statistic, R, sim="ordinary", stype="i", strata=rep(1,n), L=NULL, m=0, weights=null, ran.gen=function(d, p) d, mle=null,...)

27 Fonction boot Forme générale boot(data, statistic, R, sim="ordinary", stype="i", strata=rep(1,n), L=NULL, m=0, weights=null, ran.gen=function(d, p) d, mle=null,...) Arguments les plus importants: 4 premiers. data: données sous forme de vecteur, matrice ou tableau. Pour les deux derniers, une ligne est une observation multivariée. statistic: statistique exprimée comme fonction de 2 arguments: données data et le vecteur des indices des observations. R: n. échantillons bootstrap sim="ordinary": bootstrap non paramétrique (par défaut). Ce paramètre contrôle le type de simulation.

28 Fonction boot (suite) Résultats: liste de longueur 11

29 Fonction boot (suite) Résultats: liste de longueur 11 Noms des composantes: [1] "t0" "t" "R" "data" "seed" "statistic" [7] "sim" "call" "stype" "strata" "weights"

30 Fonction boot (suite) Résultats: liste de longueur 11 Noms des composantes: [1] "t0" "t" "R" "data" "seed" "statistic" [7] "sim" "call" "stype" "strata" "weights" Plus importantes en bootstrap non paramétrique: 2 premières. t0: valeur de la statistique sur les données t: vecteur (matrice) des réplications bootstrap de la statistique

31 Fonction boot (suite) Résultats: liste de longueur 11 Noms des composantes: [1] "t0" "t" "R" "data" "seed" "statistic" [7] "sim" "call" "stype" "strata" "weights" Plus importantes en bootstrap non paramétrique: 2 premières. t0: valeur de la statistique sur les données t: vecteur (matrice) des réplications bootstrap de la statistique La fonction boot estime automatiquement le biais et l écart type de la statistique

32 Fonction boot (suite) Résultats: liste de longueur 11 Noms des composantes: [1] "t0" "t" "R" "data" "seed" "statistic" [7] "sim" "call" "stype" "strata" "weights" Plus importantes en bootstrap non paramétrique: 2 premières. t0: valeur de la statistique sur les données t: vecteur (matrice) des réplications bootstrap de la statistique La fonction boot estime automatiquement le biais et l écart type de la statistique À la différence de la fonction bootstrap, boot a la même forme en univarié qu en multivarié.

33 Application de la fonction boot Avec boot, toute statistique doit être définie avec au moins 2 arguments.

34 Application de la fonction boot Avec boot, toute statistique doit être définie avec au moins 2 arguments. Exemple : θ = médiane échantillonnale > gal = galaxies/1000 #vitesse en milliers de km/s > set.seed(439) > gal.boot = boot(gal,function(x,i) {median(x[i])}, 1000) > gal.boot Bootstrap Statistics : original bias std. error t1* Dans l ordre: la médiane, le biais estimé, l écart type estimé de la médiane échantillonnale.

35 Application de la fonction boot J.-C. Massé Avec boot, toute statistique doit être définie avec au moins 2 arguments. Exemple : θ = médiane échantillonnale > gal = galaxies/1000 #vitesse en milliers de km/s > set.seed(439) > gal.boot = boot(gal,function(x,i) {median(x[i])}, 1000) > gal.boot Bootstrap Statistics : original bias std. error t1* Dans l ordre: la médiane, le biais estimé, l écart type estimé de la médiane échantillonnale. Histogramme + droite de Henry (= QQ-plot) sur les réplications bootstrap (composante $t) > plot(gal.boot)

36 Estimation de la loi par le bootstrap Non normalité de la médiane pour cette loi F Histogram of t Density t* J.-C. Massé t* Quantiles of Standard Normal

37 Influence de B sur v Boot Jeu de données law du package bootstrap > law # tableau LSAT GPA

38 Influence de B sur v Boot Jeu de données law du package bootstrap > law # tableau LSAT GPA > cor(law[,1],law[,2]) #corrélation de Pearson r 15 [1]

39 Influence de B sur v Boot Jeu de données law du package bootstrap > law # tableau LSAT GPA > cor(law[,1],law[,2]) #corrélation de Pearson r 15 [1] Estimation bootstrap de σ(r 15 ) = Var(r 15 )

40 Influence de B sur v Boot Jeu de données law du package bootstrap > law # tableau LSAT GPA > cor(law[,1],law[,2]) #corrélation de Pearson r 15 [1] Estimation bootstrap de σ(r 15 ) = Var(r 15 ) Echantillons bootstrap bivariés

41 Estimation non paramétrique de σ(r 15 ) > theta = function(x,donnees) cor(donnees[x,1],donnees[x,2]) #x: nos des obs.

42 Estimation non paramétrique de σ(r 15 ) > theta = function(x,donnees) cor(donnees[x,1],donnees[x,2]) #x: nos des obs. Estimation bootstrap de σ(r 15 ): v (B) Boot B = 20, 50, 100, 200, 1000, 2000, 5000

43 Estimation non paramétrique de σ(r 15 ) > theta = function(x,donnees) cor(donnees[x,1],donnees[x,2]) #x: nos des obs. Estimation bootstrap de σ(r 15 ): v (B) Boot B = 20, 50, 100, 200, 1000, 2000, 5000 > set.seed(4756) > for (i in c(20,50,100,200,1000,2000,5000)) {print(bootstrap(1:15,i,theta,law,func=sd)$func.thetastar)} [1] B = 20 [1] [1] B = 100 [1] [1] B = 1000 [1] [1] B = 5000

44 Estimation non paramétrique de σ(r 15 ) Estimation de la précision de v (B) Boot

45 Estimation non paramétrique de σ(r 15 ) Estimation de la précision de v (B) Boot > set.seed(4756) for (i in c(20,50,100,200,1000,2000,5000)) print(bootstrap(x = 1:15, nboot = i,theta, law, func = sd)$jack.boot.se) [1] B = 20 [1] [1] B = 100 [1] [1] B = 1000 [1] [1] B = 5000

46 La statistique r 15 est-elle normale? Estimation par 3200 réplications bootstrap de r 15 > x = bootstrap(1:15,3200,theta,law)[[1]]

47 La statistique r 15 est-elle normale? Estimation par 3200 réplications bootstrap de r 15 > x = bootstrap(1:15,3200,theta,law)[[1]] > hist(x) (estimation de densité par bootstrap non paramétrique)

48 Loi de r 15 : autre approche Le jeu law est un échantillon de taille 15 sans remise des var. 2 (LSAT) et 3 (GPA) du tableau 82 3 law82. Population de ( 82 15) échantillons possibles

49 Loi de r 15 : autre approche Le jeu law est un échantillon de taille 15 sans remise des var. 2 (LSAT) et 3 (GPA) du tableau 82 3 law82. Population de ( 82 15) échantillons possibles Simulation de la loi échantillonnale de r 15 : 3200 échant. de taille 15 sans remise 3200 valeurs de r 15.

50 Loi de r 15 : autre approche Le jeu law est un échantillon de taille 15 sans remise des var. 2 (LSAT) et 3 (GPA) du tableau 82 3 law82. Population de ( 82 15) échantillons possibles Simulation de la loi échantillonnale de r 15 : 3200 échant. de taille 15 sans remise 3200 valeurs de r choix de 15 numéros d observations > a = matrix(0,nrow=3200,ncol=15); set.seed(51) > for (i in 1:3200) {a[i,] = sample(82,15)}#sur chaque ligne 15 indices différents parmi 82.

51 Loi de r 15 : autre approche Le jeu law est un échantillon de taille 15 sans remise des var. 2 (LSAT) et 3 (GPA) du tableau 82 3 law82. Population de ( 82 15) échantillons possibles Simulation de la loi échantillonnale de r 15 : 3200 échant. de taille 15 sans remise 3200 valeurs de r choix de 15 numéros d observations > a = matrix(0,nrow=3200,ncol=15); set.seed(51) > for (i in 1:3200) {a[i,] = sample(82,15)}#sur chaque ligne 15 indices différents parmi 82. Calcul de 3200 valeurs indépendantes de r 15 > b = numeric(3200) > for (i in 1:3200) b[i] = cor(law82[a[i,],2],law82[a[i,],3]) # [a[i,],2]: extraction de 15 val. de la variable LSAT

52 Loi de r 15 : autre approche Histogramme des 3200 valeurs de r 15 > hist(b,xlab= r,ylab= Fréquence, main= Histogramme estimant la loi de r_15, col= orange )

53 Loi de r 15 : autre approche Histogramme des 3200 valeurs de r 15 > hist(b,xlab= r,ylab= Fréquence, main= Histogramme estimant la loi de r_15, col= orange )

54 Le bootstrap paramétrique X 1,...,X n iid Fψ, ψ paramètre inconnu

55 Le bootstrap paramétrique X 1,...,X n iid Fψ, ψ paramètre inconnu ψ : estimateur de ψ vraisemblance) (par exemple, max. de

56 Le bootstrap paramétrique X 1,...,X n iid Fψ, ψ paramètre inconnu ψ : estimateur de ψ vraisemblance) (par exemple, max. de F bψ estimateur de la loi inconnue F ψ

57 Le bootstrap paramétrique X 1,...,X n iid Fψ, ψ paramètre inconnu ψ : estimateur de ψ vraisemblance) (par exemple, max. de F bψ estimateur de la loi inconnue F ψ X 1,...,X n iid F bψ : échantillon bootstrap de F bψ

58 Le bootstrap paramétrique X 1,...,X n iid Fψ, ψ paramètre inconnu ψ : estimateur de ψ vraisemblance) (par exemple, max. de F bψ estimateur de la loi inconnue F ψ X 1,...,X n iid F bψ : échantillon bootstrap de F bψ Jeu de données law #échant. de taille 15 > mx = mean(law[,1]) > my = mean(law[,2]) > mx [1] # score moyen au test LSAT > my [1] # moyenne des moyennes cumulatives

59 Le bootstrap paramétrique (suite) > sx = sd(law[,1]) > sy = sd(law[,2]) > sx [1] > sy [1] > covxy = cov(law[,1],law[,2]) > covxy [1]

60 Le bootstrap paramétrique (suite) > sx = sd(law[,1]) > sy = sd(law[,2]) > sx [1] > sy [1] > covxy = cov(law[,1],law[,2]) > covxy [1] On veut estimer la loi de r 15 à partir du modèle normal bivarié et du bootstrap paramétrique. > library(mass) #package pour simuler la normale multivariée > mu = c(mx,my) > sigma = matrix(c(sxˆ2,covxy,covxy,syˆ2),ncol=2)

61 Le bootstrap paramétrique (suite) Simulation de 3200 échantillons normaux de taille 15 > a = mvrnorm(3200*15,mu,sigma) #matrice

62 Le bootstrap paramétrique (suite) Simulation de 3200 échantillons normaux de taille 15 > a = mvrnorm(3200*15,mu,sigma) #matrice réplications bootstrap de r 15 > r = numeric(3200) #vecteur à 3200 composantes > for (i in 1:3200) {r[i] = cor(a[(15*i-14):(15*i),1],a[(15*i-14):(15*i),2])} #calcul des 3200 valeurs de r 15 sur les 3200 échantillons bootstrap

63 Le bootstrap paramétrique (suite) Simulation de 3200 échantillons normaux de taille 15 > a = mvrnorm(3200*15,mu,sigma) #matrice réplications bootstrap de r 15 > r = numeric(3200) #vecteur à 3200 composantes > for (i in 1:3200) {r[i] = cor(a[(15*i-14):(15*i),1],a[(15*i-14):(15*i),2])} #calcul des 3200 valeurs de r 15 sur les 3200 échantillons bootstrap Les réplications bootstrap de r 15 sont les valeurs de r 15 calculées sur les 3200 échantillons simulés.

64 Le bootstrap paramétrique (suite) Simulation de 3200 échantillons normaux de taille 15 > a = mvrnorm(3200*15,mu,sigma) #matrice réplications bootstrap de r 15 > r = numeric(3200) #vecteur à 3200 composantes > for (i in 1:3200) {r[i] = cor(a[(15*i-14):(15*i),1],a[(15*i-14):(15*i),2])} #calcul des 3200 valeurs de r 15 sur les 3200 échantillons bootstrap Les réplications bootstrap de r 15 sont les valeurs de r 15 calculées sur les 3200 échantillons simulés. L histogramme permet de se faire une bonne idée de la loi de r 15 lorsque (X,Y ) est supposé normal bivarié.

65 Le bootstrap paramétrique (suite) Histogramme des 3200 réplications bootstrap de r 15

Introduction à l approche bootstrap

Introduction à l approche bootstrap Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?

Plus en détail

SEMIN- Rééchantillonnage sous R : bootstrap et jackknife. Loïc PONGER. MNHN USM 503 Régulation et Dynamique des Génomes ponger@mnhn.

SEMIN- Rééchantillonnage sous R : bootstrap et jackknife. Loïc PONGER. MNHN USM 503 Régulation et Dynamique des Génomes ponger@mnhn. SEMIN- Rééchantillonnage sous R : bootstrap et jackknife Loïc PONGER MNHN USM 503 Régulation et Dynamique des Génomes ponger@mnhn.fr SEMIN-R du MNHN 06 Mai 2008 Rééchantillonnage sous R bootstrap et jackknife

Plus en détail

geffray@math.unistra.fr Outils pour la statistique avancée Année 2015/2016 TD 1 : Bootstrap

geffray@math.unistra.fr Outils pour la statistique avancée Année 2015/2016 TD 1 : Bootstrap Université de Strasbourg Ségolen Geffray M2 - Statistique geffray@math.unistra.fr Outils pour la statistique avancée Année 2015/2016 TD 1 : Bootstrap Ces exercices seront effectués au moyen du logiciel

Plus en détail

Analyse Statistique pour Le Traitement d Enquêtes

Analyse Statistique pour Le Traitement d Enquêtes DAT 104, année 2004-2005 p. 1/90 Analyse Statistique pour Le Traitement d Enquêtes Mastère Développement Agricole Tropical Stéphanie Laffont & Vivien ROSSI UMR ENSAM-INRA Analyse des systèmes et Biométrie

Plus en détail

Analyse des données. Statistiques descriptives

Analyse des données. Statistiques descriptives 14 Analyse des données Ce chapitre décrit un certain nombre de techniques pour analyser les données avec R. La plupart des fonctions décrites ici permettent de préparer les données pour d autres analyses

Plus en détail

Espérance, variance, quantiles

Espérance, variance, quantiles Espérance, variance, quantiles Mathématiques Générales B Université de Genève Sylvain Sardy 22 mai 2008 0. Motivation Mesures de centralité (ex. espérance) et de dispersion (ex. variance) 1 f(x) 0.0 0.1

Plus en détail

Probabilités. I- Expérience aléatoire, espace probabilisé : ShotGun. 1- Définitions :

Probabilités. I- Expérience aléatoire, espace probabilisé : ShotGun. 1- Définitions : Probabilités I- Expérience aléatoire, espace probabilisé : 1- Définitions : Ω : Ensemble dont les points w sont les résultats possibles de l expérience Des évènements A parties de Ω appartiennent à A une

Plus en détail

Mémoire de n d'étude: Etudes statistiques. Mémoire de n d'étude: Etudes statistiques. Nicolas Sutton-Charani. Université Montpellier 1 1/31

Mémoire de n d'étude: Etudes statistiques. Mémoire de n d'étude: Etudes statistiques. Nicolas Sutton-Charani. Université Montpellier 1 1/31 1/31 Mémoire de n d'étude: Etudes statistiques Nicolas Sutton-Charani Université Montpellier 1 Plan Rappels de cours La base La Statistique Types des variables Outils mathématiques Statistiques descriptives

Plus en détail

Jackknife, bootstrap et cross-validation

Jackknife, bootstrap et cross-validation But de l inférence statistique On a X = (X 1,..., X n) un échantillon i.i.d. de fonction de répartition F θ(f ) une quantité d intérêt, qui dépend de F T (X ) une statistique, estimateur de θ(f ), on voudrait

Plus en détail

Analyse des données individuelles groupées

Analyse des données individuelles groupées Analyse des données individuelles groupées Analyse des Temps de Réponse Le modèle mixte linéaire (L2M) Y ij, j-ième observation continue de l individu i (i = 1,, N ; j =1,, n) et le vecteur des réponses

Plus en détail

Module 2 29 Décembre 2009 Intervenant: Dhuin STATISTIQUES

Module 2 29 Décembre 2009 Intervenant: Dhuin STATISTIQUES STATISTIQUES I. Séries statistiques simples... 1 A. Définitions... 1 1. Population... 1 2. Caractère statistique... 1 B. Séries classées / représentations graphiques.... 2 1. Séries classées... 2 2. Représentations

Plus en détail

9. Distributions d échantillonnage

9. Distributions d échantillonnage 9. Distributions d échantillonnage MTH2302D S. Le Digabel, École Polytechnique de Montréal H2015 (v3) MTH2302D: distributions d échantillonnage 1/46 Plan 1. Échantillons aléatoires 2. Statistiques et distributions

Plus en détail

Eléments de statistique Introduction - Analyse de données exploratoire

Eléments de statistique Introduction - Analyse de données exploratoire Eléments de statistique Introduction - Louis Wehenkel Département d Electricité, Electronique et Informatique - Université de Liège B24/II.93 - L.Wehenkel@ulg.ac.be MATH0487-2 : 3BacIng, 3BacInf - 16/9/2014

Plus en détail

Cours de Statistiques

Cours de Statistiques Cours de Statistiques Romain Raveaux 1 1 Laboratoire L3I Université de La Rochelle romain.raveaux01 at univ-lr.fr Octobre 24-11, 2008 1 / 35 Sommaire 1 Quelques Rappels 2 numériques Relations entre deux

Plus en détail

Le provisionnement en assurance non-vie prise en compte de la dépendance

Le provisionnement en assurance non-vie prise en compte de la dépendance Le provisionnement en assurance non-vie prise en compte de la dépendance Arthur Charpentier http://freaconometrics.blog.free.fr Séminaire interne Desjardins Assurances Générales, février 2011 Les provisions

Plus en détail

Master 1 Informatique Éléments de statistique inférentielle

Master 1 Informatique Éléments de statistique inférentielle Master 1 Informatique Éléments de statistique inférentielle Faicel Chamroukhi Maître de Conférences UTLN, LSIS UMR CNRS 7296 email: chamroukhi@univ-tln.fr web: chamroukhi.univ-tln.fr 2014/2015 Faicel Chamroukhi

Plus en détail

Fouille de Données et Media Sociaux Cours 2 Master DAC Data Science UPMC - LIP6

Fouille de Données et Media Sociaux Cours 2 Master DAC Data Science UPMC - LIP6 Fouille de Données et Media Sociaux Cours 2 Master DAC Data Science UPMC - LIP6 Ludovic Denoyer 21 septembre 2015 Ludovic Denoyer () FDMS 21 septembre 2015 1 / 1 Contexte Observation La plupart des bonnes

Plus en détail

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Valentin Patilea 1 Cesar Sanchez-sellero 2 Matthieu Saumard 3 1 CREST-ENSAI et IRMAR 2 USC Espagne 3 IRMAR-INSA

Plus en détail

PROBABILITES ET STATISTIQUE I&II

PROBABILITES ET STATISTIQUE I&II PROBABILITES ET STATISTIQUE I&II TABLE DES MATIERES CHAPITRE I - COMBINATOIRE ELEMENTAIRE I.1. Rappel des notations de la théorie des ensemble I.1.a. Ensembles et sous-ensembles I.1.b. Diagrammes (dits

Plus en détail

TABLE DES MATIERES. C Exercices complémentaires 42

TABLE DES MATIERES. C Exercices complémentaires 42 TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence

Plus en détail

MODELISATION DE DONNÉES QUALITATIVES PREMIÈRE PARTIE

MODELISATION DE DONNÉES QUALITATIVES PREMIÈRE PARTIE MODELISATION DE DONNÉES QUALITATIVES PREMIÈRE PARTIE Pierre-Louis Gonzalez 1 I INTRODUCTION 1 variable qualitative. Tri à plat. Représentations graphiques. Modélisation : loi binomiale loi multinomiale

Plus en détail

Révision. Oliver Sonnentag, PhD: GÉO1512 Géographie Quantitative I

Révision. Oliver Sonnentag, PhD: GÉO1512 Géographie Quantitative I 1 Révision 2 Table des matières Pondération Révision (11 decèmbre 2012 [moi] & 17 decèmbre 2012 [Margarita]) Structure de l'examen final! Examen final: première partie! questions théoriques (exemples)!

Plus en détail

Vision Par Ordinateur. Techniques Statistiques de la Reconnaissance de Forme. Segmentation...2. Variables Aléatoires...7

Vision Par Ordinateur. Techniques Statistiques de la Reconnaissance de Forme. Segmentation...2. Variables Aléatoires...7 Vision Par Ordinateur James L. Crowley DEA IVR Premier Bimestre 1999/00 Séance 4 26 octobre 1999 Plan de la séance : Techniques Statistiques de la Reconnaissance de Forme Segmentation...2 La Distribution

Plus en détail

Série statistique double à l aide d un exemple

Série statistique double à l aide d un exemple Série statistique double à l aide d un exemple Série statistique double: exemple... 2 Série statistique double: questions posées... 3 Calcul de la covariance sur la base de l'exemple... 4 Calcul du coefficient

Plus en détail

Université René Descartes Faculté de Pharmacie - Master Professionnel Dimension Économique des Produits de Santé 14 décembre 2005

Université René Descartes Faculté de Pharmacie - Master Professionnel Dimension Économique des Produits de Santé 14 décembre 2005 Université René Descartes Faculté de Pharmacie - Master Professionnel Dimension Économique des Produits de Santé 14 décembre 2005 Prise en Compte de l Incertitude dans l Évaluation des Technologies de

Plus en détail

Université de Nantes UFR des Sciences et Techniques Département de Mathématiques. Master 1 Ingénierie mathématique Année 2012-2013

Université de Nantes UFR des Sciences et Techniques Département de Mathématiques. Master 1 Ingénierie mathématique Année 2012-2013 Université de Nantes UFR des Sciences et Techniques Département de Mathématiques Master 1 Ingénierie mathématique Année 2012-2013 TP 1: Statistique descriptive F. Lavancier, A. Philippe Le logiciel utilisé

Plus en détail

COURS DE STATISTIQUES (24h)

COURS DE STATISTIQUES (24h) COURS DE STATISTIQUES (24h) Introduction Statistiques descriptives (4 h) Rappels de Probabilités (4 h) Echantillonnage(4 h) Estimation ponctuelle (6 h) Introduction aux tests (6 h) Qu est-ce que la statistique?

Plus en détail

Statistique (MATH-F-315, Cours #1)

Statistique (MATH-F-315, Cours #1) Statistique (MATH-F-315, Cours #1) Thomas Verdebout Université Libre de Bruxelles 2015 Plan de la partie Statistique du cours 1. Introduction. 2. Théorie de l estimation. 3. Tests d hypothèses et intervalles

Plus en détail

Probabilités et Statistiques. Chapitre 1 : Statistique descriptive

Probabilités et Statistiques. Chapitre 1 : Statistique descriptive U.P.S. I.U.T. A, Département d Informatique Année 2008-2009 Probabilités et Statistiques Emmanuel PAUL Chapitre 1 : Statistique descriptive 1 Objectifs des statistiques. Il s agit d étudier un ou plusieurs

Plus en détail

Analyse de la Variance pour Plans à Mesures Répétées

Analyse de la Variance pour Plans à Mesures Répétées Analyse de la Variance pour Plans à Mesures Répétées Pr Roch Giorgi roch.giorgi@univ-amu.fr SESSTIM, Faculté de Médecine, Aix-Marseille Université, Marseille, France http://sesstim-orspaca.org http://optim-sesstim.univ-amu.fr/

Plus en détail

Approche modèle pour l estimation en présence de non-réponse non-ignorable en sondage

Approche modèle pour l estimation en présence de non-réponse non-ignorable en sondage Approche modèle pour l estimation en présence de non-réponse non-ignorable en sondage Journées de Méthodologie Statistique Eric Lesage Crest-Ensai 25 janvier 2012 Introduction et contexte 2/27 1 Introduction

Plus en détail

INTRODUCTION : EDP ET FINANCE.

INTRODUCTION : EDP ET FINANCE. INTRODUCTION : EDP ET FINANCE. Alexandre Popier Université du Maine, Le Mans A. Popier (Le Mans) EDP et finance. 1 / 16 PLAN DU COURS 1 MODÈLE ET ÉQUATION DE BLACK SCHOLES 2 QUELQUES EXTENSIONS A. Popier

Plus en détail

Estimation et calibration des paramètres

Estimation et calibration des paramètres et calibration des paramètres 6-601-09 Simulation Monte Carlo Geneviève Gauthier HEC Montréal 1 1. Nous allons discuter des diverses façons de déterminer les paramètres des modèles que nous employons lors

Plus en détail

Chapitre 3 RÉGRESSION ET CORRÉLATION

Chapitre 3 RÉGRESSION ET CORRÉLATION Statistique appliquée à la gestion et au marketing http://foucart.thierry.free.fr/statpc Chapitre 3 RÉGRESSION ET CORRÉLATION La corrélation est une notion couramment utilisée dans toutes les applications

Plus en détail

Chronique R LAtent VAriables ANalysis - Le package lavaan pour les modèles d'équations structurelles

Chronique R LAtent VAriables ANalysis - Le package lavaan pour les modèles d'équations structurelles Chronique R LAtent VAriables ANalysis - Le package lavaan pour les modèles d'équations structurelles Les modèles d'équations structurelles sont des modèles statistiques initialement créés afin de combiner

Plus en détail

Mth2302B - Intra Été 2011

Mth2302B - Intra Été 2011 École Polytechnique de Montréal page 1 Contrôle périodique Été 2011--------------------------------Corrigé--------------------------------------T.Hammouche Question 1 (12 points) Mth2302B - Intra Été 2011

Plus en détail

Conditions d application des méthodes statistiques paramétriques :

Conditions d application des méthodes statistiques paramétriques : Conditions d application des méthodes statistiques paramétriques : applications sur ordinateur GLELE KAKAÏ R., SODJINOU E., FONTON N. Cotonou, Décembre 006 Conditions d application des méthodes statistiques

Plus en détail

Université Jinan Faculté de Gestion Tripoli - Liban. Statistiques. Examen Préparatoire. Version 1

Université Jinan Faculté de Gestion Tripoli - Liban. Statistiques. Examen Préparatoire. Version 1 Université Jinan Faculté de Gestion Tripoli - Liban Statistiques Examen Préparatoire Version 1 2011-2010 Statistiques Université de Jinan Faculté de Gestion Table des matières 1 Analyse statistique d'une

Plus en détail

«Cours Statistique et logiciel R»

«Cours Statistique et logiciel R» «Cours Statistique et logiciel R» Rémy Drouilhet (1), Adeline Leclercq-Samson (1), Frédérique Letué (1), Laurence Viry (2) (1) Laboratoire Jean Kuntzmann, Dép. Probabilites et Statistique, (2) Laboratoire

Plus en détail

Annexe commune aux séries ES, L et S : boîtes et quantiles

Annexe commune aux séries ES, L et S : boîtes et quantiles Annexe commune aux séries ES, L et S : boîtes et quantiles Quantiles En statistique, pour toute série numérique de données à valeurs dans un intervalle I, on définit la fonction quantile Q, de [,1] dans

Plus en détail

«Cours Statistique et logiciel R»

«Cours Statistique et logiciel R» «Cours Statistique et logiciel R» Rémy Drouilhet (1), Adeline Leclercq-Samson (1), Frédérique Letué (1), Laurence Viry (2) (1) Laboratoire Jean Kuntzmann, Dép. Probabilites et Statistique, (2) Laboratoire

Plus en détail

Deuxième partie II. Cours 4 à 6 : Construction d estimateurs, Modèle linéaire, Tests et intervalles de confiance

Deuxième partie II. Cours 4 à 6 : Construction d estimateurs, Modèle linéaire, Tests et intervalles de confiance Deuxième partie II Cours 4 à 6 : Construction d estimateurs, Modèle linéaire, Tests et intervalles de confiance (version corrigée, 4 avril 27) Construction d estimateurs 4 Construction d estimateurs Estimateur

Plus en détail

Introduction au cours STA 102 Analyse des données : Méthodes explicatives

Introduction au cours STA 102 Analyse des données : Méthodes explicatives Analyse des données - Méthodes explicatives (STA102) Introduction au cours STA 102 Analyse des données : Méthodes explicatives Giorgio Russolillo giorgio.russolillo@cnam.fr Infos et support du cours Slide

Plus en détail

Techniques d estimation : Maximum de Vraisemblance et Méthode des Moments Généralisée

Techniques d estimation : Maximum de Vraisemblance et Méthode des Moments Généralisée Techniques d estimation : Maximum de Vraisemblance et Méthode des Moments Généralisée Philippe Gagnepain Université Paris 1 Ecole d Economie de Paris Centre d économie de la Sorbonne-UG 4-Bureau 405 philippe.gagnepain@univ-paris1.fr

Plus en détail

Estimation et modélisation de dépendance dans des modèles de survie bivariés en présence de censure

Estimation et modélisation de dépendance dans des modèles de survie bivariés en présence de censure Estimation et modélisation de dépendance dans des modèles de survie bivariés en présence de censure Svetlana Gribkova, Olivier Lopez Laboratoire de Statistique Théorique et Appliquée, Paris 6 4 Mars 2014

Plus en détail

L essentiel sur les tests statistiques

L essentiel sur les tests statistiques L essentiel sur les tests statistiques 21 septembre 2014 2 Chapitre 1 Tests statistiques Nous considérerons deux exemples au long de ce chapitre. Abondance en C, G : On considère une séquence d ADN et

Plus en détail

Savoir Faire Excel Niveau 2. 5 novembre 2007 Naomi Yamaguchi naomi.yamaguchi@univ-paris3.fr

Savoir Faire Excel Niveau 2. 5 novembre 2007 Naomi Yamaguchi naomi.yamaguchi@univ-paris3.fr Savoir Faire Excel Niveau 2 5 novembre 2007 Naomi Yamaguchi naomi.yamaguchi@univ-paris3.fr Ce qu on sait faire Entrer et recopier des données numériques Les fonctions de base (somme, moyenne, nb, si) Faire

Plus en détail

C3 : Manipulations statistiques

C3 : Manipulations statistiques C3 : Manipulations statistiques Dorat Rémi 1- Génération de valeurs aléatoires p 2 2- Statistiques descriptives p 3 3- Tests statistiques p 8 4- Régression linéaire p 8 Manipulations statistiques 1 1-

Plus en détail

Econométrie Appliquée Séries Temporelles

Econométrie Appliquée Séries Temporelles Chapitre 1. UFR Economie Appliquée. Cours de C. Hurlin 1 U.F.R. Economie Appliquée Maîtrise d Economie Appliquée Cours de Tronc Commun Econométrie Appliquée Séries Temporelles Christophe HURLIN Chapitre

Plus en détail

A. Déterminant d une matrice carrée

A. Déterminant d une matrice carrée IUT ORSAY Mesures Physiques Déterminants Initiation à la diagonalisation de matrice Cours du ème Semestre A Déterminant d une matrice carrée A-I Définitions élémentaires Si A est la matrice ( a ) on appelle

Plus en détail

Cours STAT 2150. "Statistique non paramétrique: Méthodes de lissage"

Cours STAT 2150. Statistique non paramétrique: Méthodes de lissage Cours STAT 2150 "Statistique non paramétrique: Méthodes de lissage" Année académique 2008-2009 Séance 1 1 Table de matière du cours 1. Introduction (Fonction de répartition, histogramme, propriétés d un

Plus en détail

A. Popier (Le Mans) Copules. Septembre 2010 1 / 72

A. Popier (Le Mans) Copules. Septembre 2010 1 / 72 COPULES. Alexandre Popier Université du Maine, Le Mans Septembre 2010 A. Popier (Le Mans) Copules. Septembre 2010 1 / 72 PLAN DU COURS 1 RAPPELS SUR LES VECTEURS ALÉATOIRES 2 RAPPELS SUR LA MÉTHODE DE

Plus en détail

Les modèles d équations structurelles à variables latentes Applications et exercices

Les modèles d équations structurelles à variables latentes Applications et exercices Les modèles d équations structurelles à variables latentes Applications et eercices Emmanuel Jakobowicz Addinsoft XLSTAT 30 mars 2011 Cours de Statistique Multivariée Approfondie 1 Le modèle structurel

Plus en détail

Chapitre 3. Les distributions à deux variables

Chapitre 3. Les distributions à deux variables Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles

Plus en détail

Sommaire. Chapitre 1 Variables et vecteurs aléatoires... 5. Chapitre 2 Variables aléatoires à densité... 65

Sommaire. Chapitre 1 Variables et vecteurs aléatoires... 5. Chapitre 2 Variables aléatoires à densité... 65 Sommaire Chapitre 1 Variables et vecteurs aléatoires............... 5 A. Généralités sur les variables aléatoires réelles.................... 6 B. Séries doubles..................................... 9

Plus en détail

Filtre de Wiener. Analyse en Composantes Principales

Filtre de Wiener. Analyse en Composantes Principales Filtre de Wiener Analyse en Composantes Principales Guillaume Obozinski LIGM/Ecole des Ponts - ParisTech Traitement de l information et vision artificielle Ecole des Ponts Filtre de Wiener Norbert Wiener

Plus en détail

Simulations et Estimations de la volatilité

Simulations et Estimations de la volatilité Simulations et Estimations de la volatilité Daniel Herlemont 5 novembre 2012 Table des matières 1 Introduction 1 2 A faire... 3 3 Rappels 10 3.1 Propriétés des estimateurs............................ 10

Plus en détail

Transformations d histogramme / Opérations sur les images

Transformations d histogramme / Opérations sur les images s Traitement s / les images Plan s Les histogrammes Bibliographie s Cours de traitement Elise Arnaud - Edmond Boyer Université Joseph Fourier Cours de traitement Alain Boucher Cours de traitement T Guyer

Plus en détail

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens Chapitre 7 Statistique des échantillons gaussiens Le théorème central limite met en évidence le rôle majeur tenu par la loi gaussienne en modélisation stochastique. De ce fait, les modèles statistiques

Plus en détail

Analyse de données et méthodes numériques

Analyse de données et méthodes numériques Analyse de données et méthodes numériques Analyse de données: Que faire avec un résultat? Comment le décrire? Comment l analyser? Quels sont les «modèles» mathématiques associés? Analyse de données et

Plus en détail

FORMULAIRE DE STATISTIQUES

FORMULAIRE DE STATISTIQUES FORMULAIRE DE STATISTIQUES I. STATISTIQUES DESCRIPTIVES Moyenne arithmétique Remarque: population: m xμ; échantillon: Mx 1 Somme des carrés des écarts "# FR MOYENNE(série) MOYENNE(série) NL GEMIDDELDE(série)

Plus en détail

Tests statistiques Formation «Analyse de données RNA-seq/ChiP-seq»

Tests statistiques Formation «Analyse de données RNA-seq/ChiP-seq» Tests statistiques Formation «Analyse de données RNA-seq/ChiP-seq» Guy Perrière Pôle Rhône-Alpes de Bioinformatique 14 novembre 2012 Guy Perrière (PRABI) Tests statistiques 14 novembre 2012 1 / 40 Plan

Plus en détail

l École nationale des ponts et chaussées http://cermics.enpc.fr/scilab

l École nationale des ponts et chaussées http://cermics.enpc.fr/scilab scilab à l École nationale des ponts et chaussées http://cermics.enpc.fr/scilab Tests de comparaison pour l augmentation du volume de précipitation 13 février 2007 (dernière date de mise à jour) Table

Plus en détail

Normalité des rendements?

Normalité des rendements? Normalité des rendements? Daniel Herlemont 31 mars 2011 Table des matières 1 Introduction 1 2 Test de Normalité des rendements 2 3 Graphiques quantile-quantile 2 4 Estimation par maximum de vraisemblance

Plus en détail

DEFINITION et PROPRIETES des PRINCIPALES LOIS de PROBABILITES

DEFINITION et PROPRIETES des PRINCIPALES LOIS de PROBABILITES Université Paris1, Licence 00-003, Mme Pradel : Principales lois de Probabilité 1 DEFINITION et PROPRIETES des PRINCIPALES LOIS de PROBABILITES Notations Si la variable aléatoire X suit la loi L, onnoterax

Plus en détail

Simulation d un système d assurance automobile

Simulation d un système d assurance automobile Simulation d un système d assurance automobile DESSOUT / PLESEL / DACHI Plan 1 Introduction... 2 Méthodes et outils utilisés... 2.1 Chaines de Markov... 2.2 Méthode de Monte Carlo... 2.3 Méthode de rejet...

Plus en détail

Plan de la présentation. La simulation de Monte Carlo des processus de diffusion. La simulation de Monte Carlo. La simulation de Monte Carlo

Plan de la présentation. La simulation de Monte Carlo des processus de diffusion. La simulation de Monte Carlo. La simulation de Monte Carlo La simulation de Monte Carlo des processus de diffusion Les méthodes stochastiques dans les sciences de la gestion 6-640-93 Geneviève Gauthier Plan de la présentation La simulation de Monte Carlo La simulation

Plus en détail

R i = a 0 +b 0 B i +ε i, R = Xβ +ε,

R i = a 0 +b 0 B i +ε i, R = Xβ +ε, Statistiques 2010-2011 TP sur le Modèle linéaire gaussien avec R 1 Les exercices Vous traiterez les exercices suivants avec le logiciel R. Exercice 1 Des photographies aériennes de champs d orge sont analysées

Plus en détail

Simulations des Grecques : Malliavin vs Différences finies

Simulations des Grecques : Malliavin vs Différences finies 0.1. LES GRECQUES 1 Simulations des Grecques : iavin vs Différences finies Christophe Chorro Ce petit document vise à illustrer de manière numérique les techniques présentées lors du mini cours sur le

Plus en détail

Mclust : Déceler des groupes dans un jeu de données grâce aux mélanges gaussiens.

Mclust : Déceler des groupes dans un jeu de données grâce aux mélanges gaussiens. Adrien Perrard. UMR 7205, MNHN Mclust : Déceler des groupes dans un jeu de données grâce aux mélanges gaussiens. Partition et mélanges gaussiens Partition et mélanges gaussiens Partition et mélanges gaussiens

Plus en détail

Le suivi de la qualité. Méthode MSP : généralités

Le suivi de la qualité. Méthode MSP : généralités Le suivi de la qualité La politique qualité d une entreprise impose que celle maîtrise sa fabrication. Pour cela, elle doit être capable d évaluer la «qualité» de son processus de production et ceci parfois

Plus en détail

Etude des propriétés empiriques du lasso par simulations

Etude des propriétés empiriques du lasso par simulations Etude des propriétés empiriques du lasso par simulations L objectif de ce TP est d étudier les propriétés empiriques du LASSO et de ses variantes à partir de données simulées. Un deuxième objectif est

Plus en détail

Statistiques Descriptives à une dimension

Statistiques Descriptives à une dimension I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des

Plus en détail

Travaux Dirigés de Probabilités - Statistiques, TD 4. Lois limites ; estimation.

Travaux Dirigés de Probabilités - Statistiques, TD 4. Lois limites ; estimation. Travaux Dirigés de Probabilités - Statistiques, TD 4 Lois limites ; estimation. Exercice 1. Trois machines, A, B, C fournissent respectivement 50%, 30%, 20% de la production d une usine. Les pourcentages

Plus en détail

Cours 2-3 Analyse des données multivariées

Cours 2-3 Analyse des données multivariées Cours 2-3 des données s Ismaël Castillo École des Ponts, 13 Novembre 2012 Plan 1 2 3 4 1. On s intéresse à un jeu de données multi-dimensionel, avec n individus observés et p variables d intérêt ( variables

Plus en détail

HUITIEME PARTIE ANALYSE EN COMPSANTES PRINCIPALES

HUITIEME PARTIE ANALYSE EN COMPSANTES PRINCIPALES 105 HUITIEME PARTIE ANALYSE EN COMPSANTES PRINCIPALES 1. Introduction En statistiques il arrive fréquemment que les individus soient décrits par un grand nombre de caractères. : voitures décrites par leur

Plus en détail

Modèles ARIMA et SARIMA Estimation dans R 1 et SAS 2 Novembre 2007 Yves Aragon aragon@cict.fr

Modèles ARIMA et SARIMA Estimation dans R 1 et SAS 2 Novembre 2007 Yves Aragon aragon@cict.fr Modèles ARIMA et SARIMA Estimation dans R 1 et SAS 2 Novembre 2007 Yves Aragon aragon@cict.fr Cette note examine les différences entre R et SAS dans l estimation des modèles ARIMA et SARIMA. Elle illustre

Plus en détail

STATISTIQUES. UE Modélisation pour la biologie

STATISTIQUES. UE Modélisation pour la biologie STATISTIQUES UE Modélisation pour la biologie 2011 Cadre Général n individus: 1, 2,..., n Y variable à expliquer : Y = (y 1, y 2,..., y n ), y i R Modèle: Y = Xθ + ε X matrice du plan d expériences θ paramètres

Plus en détail

Analyse en Composantes Principales

Analyse en Composantes Principales Plan du cours Analyse en Composantes Principales Introduction Les données Leurs représentations La méthode Modèle Interprétation statistique Espace principal Composantes Principales Représentations Graphiques

Plus en détail

AK-MCS : une méthode d apprentissage alliant krigeage et simulation Monte Carlo pour évaluer efficacement P f

AK-MCS : une méthode d apprentissage alliant krigeage et simulation Monte Carlo pour évaluer efficacement P f JFMS Toulouse 24, 25, 26 mars 2010 AK-MCS : une méthode d apprentissage alliant krigeage et simulation Monte Carlo pour évaluer efficacement P f Benjamin Echard Nicolas Gayton Maurice Lemaire LaMI Laboratoire

Plus en détail

1/4 2/4 3/4 4/4. 10. Estimation MTH2302D. S. Le Digabel, École Polytechnique de Montréal H2016. (v1) MTH2302D: estimation 1/50

1/4 2/4 3/4 4/4. 10. Estimation MTH2302D. S. Le Digabel, École Polytechnique de Montréal H2016. (v1) MTH2302D: estimation 1/50 10. Estimation MTH2302D S. Le Digabel, École Polytechnique de Montréal H2016 (v1) MTH2302D: estimation 1/50 Plan 1. Introduction 2. Estimation ponctuelle 3. Estimation par intervalles de confiance 4. Autres

Plus en détail

Correction du TP4. column 1 to 17. column 18 to 34. column 35 to 51. column 52 to 68. column 69 to 85. column 86 to 100. U i ]. i=1.

Correction du TP4. column 1 to 17. column 18 to 34. column 35 to 51. column 52 to 68. column 69 to 85. column 86 to 100. U i ]. i=1. Exercice 1. 1. U=grand(1,10000,'uin',-2,5) disp(u(1:100), "U=") On obtient par exemple : U= column 1 to 17-1. 2. 3. 0. 5. 3. - 1. 0. 4. - 2. 5. 3. - 1. 2. 0. - 1. 3. column 18 to 34-2. - 1. 3. 1. 5. 5.

Plus en détail

Probabilités et statistiques dans le traitement de données expérimentales

Probabilités et statistiques dans le traitement de données expérimentales Probabilités et statistiques dans le traitement de données expérimentales S. LESECQ, B. RAISON IUT1, GEII 1 Module MC-M1 2009-2010 1 V Estimation de paramètres, tests d hypothèse, statistiques Module MC-M1

Plus en détail

Chapitre 8: Inférence, échantillonnage et estimation

Chapitre 8: Inférence, échantillonnage et estimation Chapitre 8: Inférence, échantillonnage et estimation 1. Echantillonnage aléatoire simple 2. Inférence statistique 3. Estimation 4. Evaluation graphique de l adéquation d un modèle de distribution 1 L inférence

Plus en détail

Aide - mémoire de statistique appliquée à la biologie

Aide - mémoire de statistique appliquée à la biologie Aide - mémoire de statistique appliquée à la biologie Construire son étude et analyser les résultats à l aide du logiciel R Maxime HERVE 3 ème version 2011 (1 ère version 2010) Avant-propos Lors de mon

Plus en détail

Table des matières. PREMIÈRE PARTIE Étapes initiales des études marketing 7

Table des matières. PREMIÈRE PARTIE Étapes initiales des études marketing 7 Table des matières Préface Public 1 Structure de l ouvrage 1 Caractéristiques de l ouvrage 3 Contenu 3 Pédagogie 4 Remarques sur l adaptation française 4 Ressources numériques 5 Biographie 6 PREMIÈRE PARTIE

Plus en détail

Analyse des données «Hamburgers» à l aide de SPSS (v2, janvier 2011) Auteur : André Berchtold

Analyse des données «Hamburgers» à l aide de SPSS (v2, janvier 2011) Auteur : André Berchtold Analyse des données «Hamburgers» à l aide de SPSS (v2, janvier 2011) Auteur : André Berchtold Le site web «The Fast Food Explorer» (www.fatcalories.com) propose des données relatives à la composition des

Plus en détail

TP 3 : STATISTIQUE PARAMÉTRIQUE

TP 3 : STATISTIQUE PARAMÉTRIQUE Statistique Numérique et Analyse de Données Ecole des Ponts ParisTech, 2 ème année TP 3 : STATISTIQUE PARAMÉTRIQUE La séance de TP se fait sous environnement Windows, sauf si vous avez une nette préférence

Plus en détail

Données qualitatives, modèles probit et logit

Données qualitatives, modèles probit et logit Données qualitatives, modèles probit et logit I Un modèle pour données qualitatives Cette section est fortement inspirée du cours de Christophe Hurlin. On est confronté à des données qualitatives en micro-économie

Plus en détail

Économétrie 2 : données qualitatives, probit et logit

Économétrie 2 : données qualitatives, probit et logit URCA Hugo Harari-Kermadec 2008-2009 harari@ecogest.ens-cachan.fr Économétrie 2 : données qualitatives, probit et logit I Un modèle pour données qualitatives Cette section est fortement inspirée du cours

Plus en détail

Les données manquantes en statistique

Les données manquantes en statistique Les données manquantes en statistique N. MEYER Laboratoire de Biostatistique -Faculté de Médecine Dép. Santé Publique CHU - STRASBOURG Séminaire de Statistique - 7 novembre 2006 Les données manquantes

Plus en détail

Chapitre 3 : INFERENCE

Chapitre 3 : INFERENCE Chapitre 3 : INFERENCE 3.1 L ÉCHANTILLONNAGE 3.1.1 Introduction 3.1.2 L échantillonnage aléatoire 3.1.3 Estimation ponctuelle 3.1.4 Distributions d échantillonnage 3.1.5 Intervalles de probabilité L échantillonnage

Plus en détail

Statistiques des lois à queue régulière avec l application sur les perturbations des comètes

Statistiques des lois à queue régulière avec l application sur les perturbations des comètes Statistiques des lois à queue régulière avec l application sur les perturbations des comètes Shuyan LIU Université Paris - SAMM Youri DAVYDOV et Radu STOICA Université Lille - Laboratoire Paul Painlevé

Plus en détail

Mathématiques appliquées à la finance J. Printems Année 2008 09

Mathématiques appliquées à la finance J. Printems Année 2008 09 IAE Gustave Eiffel Master 2 Gestion de Portefeuille Université Paris xii Val de Marne Mathématiques appliquées à la finance J. Printems Année 2008 09 Épreuve du 15 juillet 2009 Durée : 1 heure 30 Calculatrices

Plus en détail

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures) CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un

Plus en détail

Master Modélisation Statistique M2 Finance - chapitre 4 Mouvement Brownien et modèle de Black-Scholes

Master Modélisation Statistique M2 Finance - chapitre 4 Mouvement Brownien et modèle de Black-Scholes Master Modélisation Statistique M2 Finance - chapitre 4 Mouvement Brownien et modèle de Black-Scholes Clément Dombry, Laboratoire de Mathématiques de Besançon, Université de Franche-Comté. C.Dombry (Université

Plus en détail

Statistique. Jean-Yves Tourneret (1) (1) Université of Toulouse, ENSEEIHT-IRIT-TéSA Thème 1 : Analyse et Synthèse de l Information jyt@n7.

Statistique. Jean-Yves Tourneret (1) (1) Université of Toulouse, ENSEEIHT-IRIT-TéSA Thème 1 : Analyse et Synthèse de l Information jyt@n7. Statistique Jean-Yves Tourneret (1) (1) Université of Toulouse, ENSEEIHT-IRIT-TéSA Thème 1 : Analyse et Synthèse de l Information jyt@n7.fr Cours Statistique, 2010 p. 1/52 Plan du cours Chapitre 1 : Estimation

Plus en détail

Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes

Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes Zohra Guessoum 1 & Farida Hamrani 2 1 Lab. MSTD, Faculté de mathématique, USTHB, BP n 32, El Alia, Alger, Algérie,zguessoum@usthb.dz

Plus en détail

M1 IMAT, Année 2009-2010 MODELES LINEAIRES. C.Chouquet Laboratoire de Statistique et Probabilités - Université Paul Sabatier - Toulouse

M1 IMAT, Année 2009-2010 MODELES LINEAIRES. C.Chouquet Laboratoire de Statistique et Probabilités - Université Paul Sabatier - Toulouse M1 IMAT, Année 2009-2010 MODELES LINEAIRES C.Chouquet Laboratoire de Statistique et Probabilités - Université Paul Sabatier - Toulouse Table des matières 1 Préambule 1 1.1 Démarche statistique...................................

Plus en détail

Master Modélisation Statistique M2 Finance - chapitre 1. Gestion optimale de portefeuille, l approche de Markowitz

Master Modélisation Statistique M2 Finance - chapitre 1. Gestion optimale de portefeuille, l approche de Markowitz Master Modélisation Statistique M2 Finance - chapitre 1 Gestion optimale de portefeuille, l approche de Markowitz Clément Dombry, Laboratoire de Mathématiques de Besançon, Université de Franche-Comté.

Plus en détail