Cours 7 : Rappels de cours et exemples sous R. I- Régression linéaire simple II- Analyse de variance à 1 facteur III- Tests statistiques

Dimension: px
Commencer à balayer dès la page:

Download "Cours 7 : Rappels de cours et exemples sous R. I- Régression linéaire simple II- Analyse de variance à 1 facteur III- Tests statistiques"

Transcription

1 Cours 7 : Rappels de cours et exemples sous R I- Régression linéaire simple II- Analyse de variance à 1 facteur III- Tests statistiques

2 I- Le modèle de régression linéaire simple: théorie Rappels On cherche à expliquer ou à prévoir les variations d une variable Y (variable dépendante) par celles d une fonction linéaire de X (variable explicative), i.e., à valider le modèle de RLS ε Y = ax + b + ε où est une variable aléatoire gaussienne de moyenne nulle et de variance σ ² Pour cela on observe un n-échantillon de réalisations de X et de Y, sur lesquelles on va chercher à voir si le lien est plausible, i.e. si il existe a, b et ² σ y = ax + b + ε, i = 1,..., n. (validation) i i i Avec ε i.i.d. Gaussiennes et pas trop grand, i σ ² et à approcher les valeurs des paramètres a, b, et ² (estimation) σ

3 I- Le modèle de régression linéaire simple: théorie Estimation des paramètres : Estimation de a et b : On commence par chercher le «meilleur» ajustement linéaire sur nos données, au sens des moindres carrés : ŷy ˆ ax b=i valeur estimée i = i + ei = yi yˆ i = i résidu n n 2 et sont tels que ˆ ˆb e ˆ i = ( yi axi b)² est minimal. Ce sont les i= 1 i= 1 coefficients de la régression (ou estimateurs des moindres carrés). â

4 I- Le modèle de régression linéaire simple: théorie On montre que : n ( x x)( y y) i i i= 1 aˆ =, bˆ = y ax ˆ n i= 1 ( x x)² i y = ax ˆ + b ˆ La droite d ajustement s appelle droite de régression ou des moindres carrés. ŷ i La valeur estime la valeur moyenne de Y lorsque X=xi (E(Y/X=xi)). C est aussi la prévision de Y pour une observation telle que X=xi. σ Estimation de ² : La variance de l erreur s estime par s² n 2 ei = i= 1 = SSR n 2 n 2

5 I- Le modèle de régression linéaire simple: théorie Validation du modèle sur les données : il faut que le modèle soit de bonne qualité (bon pouvoir explicatif et prédictif) Analyse de la qualité du modèle : Décomposition de la variabilité SST = ( y y)² = ns SSM = ( yˆ y)² = s SSR = e = ( n 2) s i i 2 2 i 2 Y 2 Yˆ =somme des carrés des variations de y =somme des carrés des variations expliquées par le modèle =somme des carrés des variations résiduelles On montre que : SST=SSR+SSM Au plus SSM est grand (ou SSR faible), au meilleur est l ajustement.

6 I- Le modèle de régression linéaire simple: théorie Les indicateurs de variabilité sont résumés dans le tableau d analyse de la variance ci-dessous : source Degrés de Somme des carrés Somme des carrés moyens Stat de Fisher liberté modèle 1 SSM SSM F=SSM/s² erreur n-2 SSR s²=ssr/(n-2) total n-1 SST s²(y)=sst/(n-1)

7 I- Le modèle de régression linéaire simple: théorie Indicateur principal de qualité du modèle: le coefficient de détermination (% de variation expliqué par le modèle, carré du coefficient de corrélation linéaire): R² SSM 1 SSR = = SST SST doit être proche de 1. Autres indicateurs : SSM - Le F de Fisher F = doit être le plus grand possible s² - Le s² doit être le plus faible possible pour garantir de bonnes prévisions. - Les coefficients doivent être stables pour garantir de bonnes prévisions, i.e. leurs écarts type s( aˆ ) et s( bˆ ) doivent être faibles. On montre que 2 avec ˆ s ˆ 1 x² s²( a) = n ; s²( b) = s² + ci = xi x n c ² n c ² i 1 i i 1 i = =

8 I- Le modèle de régression linéaire simple: théorie Vérification des hypothèses sur les aléas : il faut que les aléas soient i.i.d. et gaussiens ε i Tests graphiques : Le graphe des résidus versus les valeurs prédites ne doit pas présenter de structure (indépendance, homoscedasticité, normalité). Le corrélogramme (ACF) ne doit pas présenter de structure (indépendance) Le QQ-plot suit la première bissectrice

9 I- Le modèle de régression linéaire simple: théorie

10 I- Le modèle de régression linéaire simple: théorie Conséquences de la non-normalité : Les estimateurs ne sont pas optimaux Les tests et intervalles de confiances sont invalides. En réalité seulement les distribution à queue très longue posent problème et une légère non-normalité peut être ignorée, d autant plus que l échantillon est grand. d une variance non constante : Les estimations ne sont pas bonnes il faut utiliser les moindres carrés pondérés.

11 I- Le modèle de régression linéaire simple: théorie Solutions Essayer de transformer les données en se rappelant que - quoiqu on fasse, certaines données ne peuvent être analysées par régression - la bonne transformation est parfois difficile à trouver. Utiliser une régression non-linéaire.

12 I- Le modèle de régression linéaire simple: théorie Repérage des points aberrants: Résidu réduit ou studentisé : re i ei = s ( e i ) 1 c ² i s²( ei ) = s² 1 = s²(1 hii )² n n ci ² i= 1 Tests graphiques Le graphe des résidus réduits versus les valeurs prédites doit normalement être compris entre 2 et 2 pour au moins 95% des observations dès lors que la normalité est vérifiée.

13 I- Le modèle de régression linéaire simple: théorie Des observations dont le résidu réduit est >2 en v.a. sont des points contribuant fortement à la valeur de s². Ils peuvent constituer des points aberrants. Il faut les analyser plus avant. - Analyse du «leverage» de ces points (hii) : Le leverage mesure l influence potentielle d un point sur la valeur des coefficients de la régression. Une valeur hii>4/n traduit un point trop influent sur la détermination des coefficients. - Analyse de la distance de Cook : La distance de Cook mesure le leverage et la contribution au s², c est-à-dire l influence réelle d un point. Une valeur >1 traduit un point aberrant.

14 I- Le modèle de régression linéaire simple: théorie Solutions Enlever les observations aberrantes et recalculer la régression. Comparer les résultats. Y-a-t-il des différences significatives entre les coefficients?

15 I- Le modèle de régression linéaire simple: théorie Validation du modèle sur la population Une fois la gaussianité vérifiée, on peut effectuer des tests afin d asseoir la pertinence du modèle sur la population étudiée. Ces tests testent l hypothèse : H : a = 0 contre H : a (a=0 signifie absence de lien linéaire entre X et Y) Test de student. Basé sur la statistique aˆ T = T s( aˆ ) T(n-2) sous H 0 Test de Fisher. Basé sur la statistique : F SSM = F F(1,n-2) sous H 0 s²

16 I- Le modèle de régression linéaire simple: exemple Exemple 1 : On cherche à expliquer les variations de y par celles d une fonction linéaire de x à partir de 30 observations de chacune des variables, i.e. à ajuster le modèle ε i y = ax + b + ε, i = 1,...,30. i i i où est une suite de variables aléatoires i.i.d.gaussiennes de moyenne nulle et de variance >x=1:100; X=sample(x,30,replace=TRUE) >Y=3+7*X+rnorm(30,0,100) >regression=lm(y~x); regression Call: lm(formula = Y ~ X) σ ² Coefficients: (Intercept) X

17 Le modèle de régression linéaire simple: exemple Dessin du nuage de points : > plot(x,y) >text(40,600, substitute(y==a*x+b, list(a=regression$coef[2], b=regression$coef[1]))) > lines(x,regression$fitted.values) #ou abline(regression) > M=locator(); v=locator() > segments(0,m$y,m$x,m$y) > arrows(m$x,m$y,m$x,v$y,angle=30, code=3) > segments(m$x,v$y,0,v$y,lty=2) > text(0,350, "yi",col="red") > text(0,200, "^yi",col="red") > text(25,250, "ei",col="red") > title("nuage de points et droite de regression")

18 Le modèle de régression linéaire simple: exemple

19 Le modèle de régression linéaire simple: exemple Explication des sorties R > names(regression) [1] "coefficients" "residuals" "effects" "rank" [5] "fitted.values" "assign" "qr" "df.residual" [9] "xlevels" "call" "terms" "model«coefficients (ou coef) : estimations des paramètres fitted.values (ou fitted): valeurs estimées Residuals (ou res) : résidus e = y yˆ i i i df.residual : nombre de ddl des résidus (n-2) y ˆi ˆ et a bˆ

20 Le modèle de régression linéaire simple: exemple > anova(regression) Analysis of Variance Table Response: Y SSM SSR Df Sum Sq Mean Sq F value Pr(>F) F=MSM/MSR X e-13 *** Residuals n-2 Signif. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 MSM=SSM/dl=SSM MSR=SSR/dl=SSR/n-2

21 Le modèle de régression linéaire simple: exemple >summary(regression) Call: lm(formula = Y ~ X) Residuals: Min 1Q Median 3Q Max s(^b) s(â) Coefficients: tb=^b/s(^b) Estimate Std. Error t value Pr(> t ) (Intercept) X e-13 *** ta=â/s(â) --- Signif. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 S=sqrt(MSR) â ^b Residual standard error: on 28 degrees of freedom Multiple R-Squared: , Adjusted R-squared: F-statistic: on 1 and 28 DF, p-value: 4.312e-13 R²=SSM/(SSM +SSR)

22 Le modèle de régression linéaire simple: exemple Pertinence du modèle sur les données : >summary(regression) Call: lm(formula = Y ~ X) De petites valeurs sont un gage de stabilité du modèle donc du pouvoir prédictif: valeur de b pas très stable ici Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) X e-13 *** --- Signif. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: on 28 degrees of freedom Multiple R-Squared: , Adjusted R-squared: F-statistic: on 1 and 28 DF, p-value: 4.312e-13 % de variations expliquées par le modèle R² doit être proche de 1 pour bon pouvoir explicatif: ok ici Écart-type résiduel doit être faible pour bon pouvoir prédictif

23 Le modèle de régression linéaire simple: exemple Conclusion 1 : le modèle a un bon pouvoir explicatif sur les données, mais le pouvoir prédictif risque d être entaché par l instabilité du coefficient b et une variance résiduelle importante.

24 Le modèle de régression linéaire simple: exemple Analyse des résidus Fonctions R utiles: - influence(): étude des points contribuant à l instabilité du modèle (prédiction). - residuals() - rstudent() : résidus réduits - acf() : graphe d autocorrelation des résidus - plot() - qqnorm()

25 Le modèle de régression linéaire simple: exemple - Repérage des points aberrants et des points contribuant fortement à la détermination du modèle : Est suspect un point tel que le résidu réduit est supérieur à 2 en valeur absolue : si sa distance de Cook s est >1, le point suspect contribue trop fortement à la détermination du modèle - Vérifier les hypothèse sur les aléas : iid et normalité (préalable à l interprétation des tests) Le graphe des résidus (ou des résidus réduits) ne doit pas présenter de structure (variance constante sur la verticale et symetrie par rapport aux abscisses).. Le graphe des résidus réduits doit être compris entre 2 et 2 et ne doit pas présenter de structure. D autres graphiques tels que le qqnorm() ou acf() peuvent aider.

26 Le modèle de régression linéaire simple: exemple

27 Le modèle de régression linéaire simple: exemple > regression$res

28 Le modèle de régression linéaire simple: exemple > rstudent(regression)

29 Le modèle de régression linéaire simple: exemple >par(mfrow=c(2,2)); plot(regression) Graphe1 : doit être sans structure réparti de part et d autre de l axe des x Graphe 2 : doit suivre la bissectrice Graphe 3 : doit être sans structure Graphe 4 : distances de Cook ou courbe de niveaux de leverage de distances de Cook s égales

30 Le modèle de régression linéaire simple: exemple >plot(regression$fitted,rstudent(regression),xlabel="fitted values", ylabel="standardized residuals"); >abline(h=2,col="red");abline(h=-2,col="red")

31 Le modèle de régression linéaire simple: exemple > par(mfrow=c(1,2)) > plot(regression$residuals) > acf(regression$res)

32 Le modèle de régression linéaire simple: exemple Conclusion 2 : Les résidus semblent approximativement gaussiens (qqnorm) et i.i.d. (pas de structure, de part et d autre de 0 sur les plots et le corrélogramme).deux points devraient être éventuellement enlevés du modèle : les points 2 et 3.

33 Le modèle de régression linéaire simple: exemple

34 Le modèle de régression linéaire simple: exemple Validité du modèle sur la population >summary(regression) Call: lm(formula = Y ~ X) Residuals: Min 1Q Median 3Q Max La variable X a une influence significative sur Y à 5%: le coefficient est significativement différent de zero: le modèle est pertinent par student Coefficients: Estimate Std. Error t value Pr(> t ) Le terme constant n est pas significativement (Intercept) different de zero: on peut X e-13 *** decider de refaire tourner --- le modèle sans lui Signif. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: on 28 degrees of freedom Multiple R-Squared: , Adjusted R-squared: F-statistic: on 1 and 28 DF, p-value: 4.312e-13 Le modèle est pertinent à 5% par Fisher

35 Le modèle de régression linéaire simple: exemple Conclusion 3: le modèle linéaire est pertinent pour expliquer variations de Y sur la population. Conclusion : L ajustement linéaire est pertinent ici. Pour obtenir un meilleur pouvoir prédictif, il faudrait éventuellement retirer les points 2 et 3 de l analyse et utiliser un modèle sans terme constant.

36 II- Analyse de variance : théorie Soit X une variable qualitative (facteur) à p modalités (niveaux) et Y une variable quantitative. On veut mettre en évidence une différence de valeur moyenne de la variable Y selon le niveau du facteur. On suppose alors que X discrimine bien Y: E(Y/X=x j) Y µ α j ε = µ + α j ou de façon équivalente = + +, = 1 j j j,...p. avec ε j de moyenne nulle. On veut pouvoir rejeter l hypothèse : H0 : α1=...= α j=...= αp Pour cela, on observe ces deux variables sur un ensemble de n individus, on suppose p y = µ + α i 1... n, j 1,...p. ij j + ε = = ij j avec n j = n j= 1 et on veut valider l hypothèse précédente. On fait généralement l hypothèse implicite que les sont iid gaussiens. ε ij

37 1 p y = n y n j= 1 j j II- Analyse de variance : théorie E ( ). 1 X = x1 j E ( X = x j ) E p ( X = x p ) y11,... y y,... n 1 1 j yn j j y,... 1 p y p 1 n p y 1 y j n j = i = 1 y ij y p

38 II- Analyse de variance : théorie Un moyen simple pour se rendre compte :

39 II- Analyse de variance : théorie Lorsque n =... = n 1 p on dit qu on a un plan équilibré.

40 II- Analyse de variance : théorie Estimation des paramètres Moyennes On a p+1 inconnues du modèle ( µ, α,..., α 1 p ) et uniquement p groupes donc on doit imposer une contrainte. On impose : p n 0 j 1 j α j = = (ce qu un groupe perd l autre le gagne) On cherche les valeurs des paramètres minimisant la fontion des moindres carrés: ( y ) 2 i j ij α j µ

41 II- Analyse de variance : théorie On trouve : ˆ µ = y et ˆ j α = y j y yˆ j = ˆ α ˆ j µ e ˆ ij = y y j ij = est la moyenne estimée ou prédite dans le niveau j du facteur est le i résidu du niveau j du facteur Estimation de la variance des erreurs : s² = i j e n p ij ²

42 II- Analyse de variance : théorie Validation du modèle : on doit d abord vérifier que le facteur X discrimine bien Y, c est à dire que la majeure partie de la variabilité est bien expliquée par le modèle. Décomposition de la variabilité D j = ( y ij y j ) 2 i E j SSint ra = D j = ( n p) s² j SS = 2 int er n j ( y j y) j SST = ( y ij y) 2 j i Ej = Somme des carrés des variations dans le niveau j = Somme des carrés des variations intra-niveaux = Somme des carrés des variations inter-niveaux = somme des carrés des variations totales On a : SST = SS + SS int er int ra Le modèle est d autant meilleur que SSinter est grand (que SSintra est faible)

43 II- Analyse de variance : théorie Indice de qualité du modèle : le rapport de corrélation (% de variations expliquée par X) 2 η = SS SST INTER = 1 SS SST INTRA Autre indice : le F de Fisher : F V = V INTER INTRA V INTER = SS p 1 INTER V INTER = SS n p INTRA

44 II- Analyse de variance : théorie Les indicateurs de variabilité sont résumés dans le tableau d analyse de la variance ci-dessous : source Intergroupes Intragroupes Degrés de liberté Somme des carrés Somme des carrés moyens Stat de Fisher p-1 SSinter Vinter=SSinter/p-1 F=Vinter/ s² n-p SSintra Vintra=s² =SSintra/(n-p) total n-1 SST s²(y)=sst/(n-1)

45 II- Analyse de variance : théorie Validation des hypothèses sur les aléas Voir régression

46 II- Analyse de variance : théorie Test d égalité des moyennes Dès lors qu on a vérifié que les erreurs sont i.i.d. gaussiennes, on peut tester H0 : α1=...= α j=...= αp En utilisant le test de Fisher. On utilise la statistique de test VINTER F = sous H 0, F F( p 1, n p) V INTRA

47 II- Analyse de variance :exemple Six (k) insecticides (spray) ont été testés chacun sur 12 cultures. La réponse observée (count) est le nombre d'insectes. Les données sont contenues dans le data.frame «InsectSprays». On veut savoir si il existe un effet significatif du facteur insecticide, i.e. on veut valider le modèle d analyse de variance : ε i Count ij = µ + α j + ε ij, i = 1, ; j = 1,... 6 où est une suite de variables aléatoires i.i.d. de moyenne nulle et de variance σ ². >anov=aov(sqrt(count) ~ spray, data = InsectSprays)

48 II- Analyse de variance > summary(anov) Df Sum Sq Mean Sq F value Pr(>F) spray < 2.2e-16 *** Residuals SSInter SSIntra V Inter P(F>Fvalue) F suit F(k-1,n-k) Signif. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 k-1 n-k V intra V inter/v intra

49 II- Analyse de variance > names(anov) [1] "coefficients" "residuals" "effects" "rank" [5] "fitted.values" "assign" "qr" "df.residual" [9] "contrasts" "xlevels" "call" "terms" [13] "model" coefficients : moyennes dans les niveaux residuals : résidus estimes du modèle fitted.values : valeurs estimées y ˆ = ˆ µ + ˆ α ij α e = y yˆ ij ij ij j ˆ j

50 >boxplot(sqrt(insectspray$count))~insectspray$spray

51 II- Analyse de variance Le Boxplot montre : - les points aberrants - l asymétrie de la distribution - une inégalité dans les variances. Cependant, comme souvent il y a peu de données dans chaque niveau du facteur on peu s attendre à une grande variabilité même si les variances des souspopulations sont en réalité égales.

52 II- Analyse de variance Analyse des résidus (cf régression) >par(mfrow=c(2,2)); plot(anov)

53 >plot(rstudent(anov)) II- Analyse de variance

54 II- Analyse de variance >par(mfrow=c(2,1)) > acf(anov$res) >plot(anov$res)

55 II- Analyse de variance La distribution des résidus semble gaussienne Les résidus sont i.i.d. Il existe des points aberrants 39, 27, 25 dont les distances de Cook s montrent qu ils influencent trop les coefficients.

56 II- Analyse de variance >summary(anov) Df Sum Sq Mean Sq F value Pr(>F) spray < 2.2e-16 *** Residuals Signif. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Le test de Fisher montre que l on rejette fortement l hypothèse nulle (avec un risque de se tromper presque nul): le modèle est significatif :il existe un fort effet du facteur spray sur le nombre d insectes : les moyennes sont differentes

57 >boxplot(sqrt(insectspray$count))~insectspray$spray

58 II- Analyse de variance >anov$coeff (Intercept) sprayb sprayc sprayd spraye sprayf Le groupe A est le groupe de référence avec une moyenne de Le groupe B a une moyenne de ,. Les écarts les plus significatifs sont entre les groupes A B et F et les groupes C D et E, qui sont plus efficaces que les premiers.

59 III- Test de comparaison de moyenne Soient (X1,..., Xn) un echantillon issu d une population iid N(1, 1) et (Y1,..., Ym) un échantillon issu d une population iid E(1). On veut tester: H : E( X ) = E( Y ) contre H : E( X ) E( Y ) 0 1 Lorsque les variances théoriques des deux variables sont égales : Test de student X Y 2 2 ( n1 1) s1 + ( n2 1) s2 t = ; s² = t T ( n1 + n2 2) sous H0 1 1 n1 + n2 2 s + n1 n2 Lorsque les variances théoriques des deux variables sont inégales : Correction de Welch

60 III- Test de comparaison de moyenne Test de student à la main (à α=5%) : >x = rnorm(100,1,1); y = rexp(200,1) >p=abs(mean(x)-mean(y)) > s=sqrt((99*var(x)+199*var(y))/298) >t=p/(s*sqrt(1/100+1/200)) >t [1] On compare t le fractile d ordre 1-α/2 de la loi de student à 298 ddl. Si t supérieur, on rejette H0, sinon en accepte.

61 III- Test de comparaison de moyenne Avec la fonction t-test : Cas où on suppose les variances égales : >x = rnorm(100,1,1); y = rexp(200,1) >t.test(x,y, var.equal=t) Two Sample t-test data: x and y t = , df = 298, p-value = alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: sample estimates: mean of x mean of y X Valeur de t P( T >t) Où T suit T(298) Rejet de H0 si <5% Nombre de ddl = 298

62 III- Test de comparaison de moyenne Avec la fonction t-test : Cas où on suppose les variances inégales >x = rnorm(100,1,2); y = rexp(200,1) >st=t.test(x,y) Welch Two Sample t-test Généralisation du test de Student au cas de variances inégales data: x and y t = , df = , p-value = alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: Rejet de H0 si <5% sample estimates: mean of x mean of y Nombre de ddl corrigé=178,46 X Y Valeur de la Statistique de Welch

63 III- Test de comparaison de moyenne > names(st) [1] "statistic" "parameter" "p.value" "conf.int" "estimate" [6] "null.value" "alternative" "method" "data.name" statistic : valeur de t alternative : type d alternative two-sided, one-sided. estimate : moyennes empiriques des echantillons null.value : hypothese nulle conf.int: intervalles de confiances parameter :ddl Conclusion : pour les deux exemples, on ne peut pas rejeter l hypothèse nulle au seuil 5% : les moyennes ne sont pas significativement différentes.

64 IV Test du chi2 On veut tester à partir d un tableau de contingence de n individus s il y a une relation entre deux caractères X et Y H : les deux critères sont indépendants contre H =! H Statistique de test : χn ² χ²(( l 1)( c 1)) sous H 1 0 Où Oi sont les éléments du tableau de contingence, Ei sont les éléments du tableau attendu sous l hypothèse d indépendance (voir un cours et l exemple ci-après)

65 IV Test du chi2 Test du chi2 à la main >O=matrix(c(442,514,38,6),nrow=2,byrow=TRUE) >colnames(o)=c("homme","femme"); rownames(o)=c("voyant","aveugle") >O #tableau observé Oi #tableau théorique Ei homme femme homme femme voyant voyant aveugle 38 6 aveugle #Création du tableau théorique : >ni=apply(o,1,sum); nj= apply(o,2,sum) voyant aveugle homme femme >E=matrix(c(ni[1]*nj[1]/1000,ni[2]*nj[1]/1000,ni[1]*nj[2]/1000, ni[2]*nj[2]/1000),2,2) >chi2=sum((o-e)^2/e) [1]

66 IV Test du chi2 > X2=chisq.test(O, correct=f) Pearson's Chi-squared test data: tab Valeur de la statistique de test du chi2 X-squared = , df = 1, p-value = 1.894e-07 P(X>X-squared ) X v.a. de loi X²(1) On rejette H0 si la p-value est <5%. Ici, c est le cas, les caractères sexe et cecite ne sont pas indépendants.

Analyse de la variance Comparaison de plusieurs moyennes

Analyse de la variance Comparaison de plusieurs moyennes Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction

Plus en détail

Introduction aux Statistiques et à l utilisation du logiciel R

Introduction aux Statistiques et à l utilisation du logiciel R Introduction aux Statistiques et à l utilisation du logiciel R Christophe Lalanne Christophe Pallier 1 Introduction 2 Comparaisons de deux moyennes 2.1 Objet de l étude On a mesuré le temps de sommeil

Plus en détail

Lire ; Compter ; Tester... avec R

Lire ; Compter ; Tester... avec R Lire ; Compter ; Tester... avec R Préparation des données / Analyse univariée / Analyse bivariée Christophe Genolini 2 Table des matières 1 Rappels théoriques 5 1.1 Vocabulaire....................................

Plus en détail

Une introduction. Lionel RIOU FRANÇA. Septembre 2008

Une introduction. Lionel RIOU FRANÇA. Septembre 2008 Une introduction INSERM U669 Septembre 2008 Sommaire 1 Effets Fixes Effets Aléatoires 2 Analyse Classique Effets aléatoires Efficacité homogène Efficacité hétérogène 3 Estimation du modèle Inférence 4

Plus en détail

MODELE A CORRECTION D ERREUR ET APPLICATIONS

MODELE A CORRECTION D ERREUR ET APPLICATIONS MODELE A CORRECTION D ERREUR ET APPLICATIONS Hélène HAMISULTANE Bibliographie : Bourbonnais R. (2000), Econométrie, DUNOD. Lardic S. et Mignon V. (2002), Econométrie des Séries Temporelles Macroéconomiques

Plus en détail

Exercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015

Exercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015 Exercices M1 SES 214-215 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 215 Les exemples numériques présentés dans ce document d exercices ont été traités sur le logiciel R, téléchargeable par

Plus en détail

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour francour@unice.fr Une grande partie des illustrations viennent

Plus en détail

Statistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année 2010-2011

Statistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année 2010-2011 Master 1 Biologie et technologie du végétal Année 010-011 Statistiques Rappels de cours et travaux dirigés (Seul ce document sera autorisé en examen) auteur : Jean-Marc Labatte jean-marc.labatte@univ-angers.fr

Plus en détail

Introduction à la statistique non paramétrique

Introduction à la statistique non paramétrique Introduction à la statistique non paramétrique Catherine MATIAS CNRS, Laboratoire Statistique & Génome, Évry http://stat.genopole.cnrs.fr/ cmatias Atelier SFDS 27/28 septembre 2012 Partie 2 : Tests non

Plus en détail

Exemples d application

Exemples d application AgroParisTech Exemples d application du modèle linéaire E Lebarbier, S Robin Table des matières 1 Introduction 4 11 Avertissement 4 12 Notations 4 2 Régression linéaire simple 7 21 Présentation 7 211 Objectif

Plus en détail

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position Arbre de NESI distribution quelconque Signe 1 échantillon distribution symétrique non gaussienne Wilcoxon gaussienne Student position appariés 1 échantillon sur la différence avec référence=0 2 échantillons

Plus en détail

Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9

Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9 Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9 L analyse de variance à un facteur permet de vérifier, moyennant certaines hypothèses, si un facteur (un critère de classification,

Plus en détail

Biostatistiques : Petits effectifs

Biostatistiques : Petits effectifs Biostatistiques : Petits effectifs Master Recherche Biologie et Santé P. Devos DRCI CHRU de Lille EA2694 patrick.devos@univ-lille2.fr Plan Données Générales : Définition des statistiques Principe de l

Plus en détail

Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS

Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence

Plus en détail

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens Chapitre 7 Statistique des échantillons gaussiens Le théorème central limite met en évidence le rôle majeur tenu par la loi gaussienne en modélisation stochastique. De ce fait, les modèles statistiques

Plus en détail

Chapitre 3. Les distributions à deux variables

Chapitre 3. Les distributions à deux variables Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles

Plus en détail

Un exemple de régression logistique sous

Un exemple de régression logistique sous Fiche TD avec le logiciel : tdr341 Un exemple de régression logistique sous A.B. Dufour & A. Viallefont Etude de l apparition ou non d une maladie cardiaque des coronaires 1 Présentation des données Les

Plus en détail

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3

Plus en détail

Densité de population et ingestion de nourriture chez un insecte vecteur de la maladie de Chagas

Densité de population et ingestion de nourriture chez un insecte vecteur de la maladie de Chagas Fiche TD avec le logiciel : tdr335 Densité de population et ingestion de nourriture chez un insecte vecteur de la maladie de Chagas F. Menu, A.B. Dufour, E. Desouhant et I. Amat La fiche permet de se familiariser

Plus en détail

Données longitudinales et modèles de survie

Données longitudinales et modèles de survie ANALYSE DU Données longitudinales et modèles de survie 5. Modèles de régression en temps discret André Berchtold Département des sciences économiques, Université de Genève Cours de Master ANALYSE DU Plan

Plus en détail

Étude des flux d individus et des modalités de recrutement chez Formica rufa

Étude des flux d individus et des modalités de recrutement chez Formica rufa Étude des flux d individus et des modalités de recrutement chez Formica rufa Bruno Labelle Théophile Olivier Karl Lesiourd Charles Thevenin 07 Avril 2012 1 Sommaire Remerciements I) Introduction p3 Intérêt

Plus en détail

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE UE4 : Biostatistiques Chapitre 3 : Principe des tests statistiques d hypothèse José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Introduction

Plus en détail

La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites

La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites La problématique des tests Cours V 7 mars 8 Test d hypothèses [Section 6.1] Soit un modèle statistique P θ ; θ Θ} et des hypothèses H : θ Θ H 1 : θ Θ 1 = Θ \ Θ Un test (pur) est une statistique à valeur

Plus en détail

Didacticiel - Études de cas. Description de quelques fonctions du logiciel PSPP, comparaison des résultats avec ceux de Tanagra, R et OpenStat.

Didacticiel - Études de cas. Description de quelques fonctions du logiciel PSPP, comparaison des résultats avec ceux de Tanagra, R et OpenStat. 1 Objectif Description de quelques fonctions du logiciel PSPP, comparaison des résultats avec ceux de Tanagra, R et OpenStat. Tout le monde l aura compris, je passe énormément de temps à analyser les logiciels

Plus en détail

Relation entre deux variables : estimation de la corrélation linéaire

Relation entre deux variables : estimation de la corrélation linéaire CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence

Plus en détail

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES LES STATISTIQUES INFERENTIELLES (test de Student) L inférence statistique est la partie des statistiques qui, contrairement à la statistique descriptive, ne se contente pas de décrire des observations,

Plus en détail

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE UE4 : Biostatistiques Chapitre 6 Test de comparaison de pourcentages χ² José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Nature des variables

Plus en détail

Principe d un test statistique

Principe d un test statistique Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre

Plus en détail

Exemple PLS avec SAS

Exemple PLS avec SAS Exemple PLS avec SAS This example, from Umetrics (1995), demonstrates different ways to examine a PLS model. The data come from the field of drug discovery. New drugs are developed from chemicals that

Plus en détail

STATISTIQUES. UE Modélisation pour la biologie

STATISTIQUES. UE Modélisation pour la biologie STATISTIQUES UE Modélisation pour la biologie 2011 Cadre Général n individus: 1, 2,..., n Y variable à expliquer : Y = (y 1, y 2,..., y n ), y i R Modèle: Y = Xθ + ε X matrice du plan d expériences θ paramètres

Plus en détail

Cours de méthodes de scoring

Cours de méthodes de scoring UNIVERSITE DE CARTHAGE ECOLE SUPERIEURE DE STATISTIQUE ET D ANALYSE DE L INFORMATION Cours de méthodes de scoring Préparé par Hassen MATHLOUTHI Année universitaire 2013-2014 Cours de méthodes de scoring-

Plus en détail

FORMULAIRE DE STATISTIQUES

FORMULAIRE DE STATISTIQUES FORMULAIRE DE STATISTIQUES I. STATISTIQUES DESCRIPTIVES Moyenne arithmétique Remarque: population: m xμ; échantillon: Mx 1 Somme des carrés des écarts "# FR MOYENNE(série) MOYENNE(série) NL GEMIDDELDE(série)

Plus en détail

Modèles pour données répétées

Modèles pour données répétées Résumé Les données répétées, ou données longitudinales, constituent un domaine à la fois important et assez particulier de la statistique. On entend par données répétées des données telles que, pour chaque

Plus en détail

Régression linéaire. Nicolas Turenne INRA nicolas.turenne@jouy.inra.fr

Régression linéaire. Nicolas Turenne INRA nicolas.turenne@jouy.inra.fr Régression linéaire Nicolas Turenne INRA nicolas.turenne@jouy.inra.fr 2005 Plan Régression linéaire simple Régression multiple Compréhension de la sortie de la régression Coefficient de détermination R

Plus en détail

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

Théorie des sondages : cours 5

Théorie des sondages : cours 5 Théorie des sondages : cours 5 Camelia Goga IMB, Université de Bourgogne e-mail : camelia.goga@u-bourgogne.fr Master Besançon-2010 Chapitre 5 : Techniques de redressement 1. poststratification 2. l estimateur

Plus en détail

Statistiques descriptives

Statistiques descriptives Statistiques descriptives L3 Maths-Eco Université de Nantes Frédéric Lavancier F. Lavancier (Univ. Nantes) Statistiques descriptives 1 1 Vocabulaire de base F. Lavancier (Univ. Nantes) Statistiques descriptives

Plus en détail

Cours 9 : Plans à plusieurs facteurs

Cours 9 : Plans à plusieurs facteurs Cours 9 : Plans à plusieurs facteurs Table des matières Section 1. Diviser pour regner, rassembler pour saisir... 3 Section 2. Définitions et notations... 3 2.1. Définitions... 3 2.2. Notations... 4 Section

Plus en détail

Aide-mémoire de statistique appliquée à la biologie

Aide-mémoire de statistique appliquée à la biologie Maxime HERVÉ Aide-mémoire de statistique appliquée à la biologie Construire son étude et analyser les résultats à l aide du logiciel R Version 5(2) (2014) AVANT-PROPOS Les phénomènes biologiques ont cela

Plus en détail

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique»

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Tests de comparaison de moyennes Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Test de Z ou de l écart réduit Le test de Z : comparer des paramètres en testant leurs différences

Plus en détail

Évaluation de la régression bornée

Évaluation de la régression bornée Thierry Foucart UMR 6086, Université de Poitiers, S P 2 M I, bd 3 téléport 2 BP 179, 86960 Futuroscope, Cedex FRANCE Résumé. le modèle linéaire est très fréquemment utilisé en statistique et particulièrement

Plus en détail

Analyse discriminante et régression logistique: application au cas de l innovation pour les entreprises du Canton du Tessin

Analyse discriminante et régression logistique: application au cas de l innovation pour les entreprises du Canton du Tessin Analyse discriminante et régression logistique: application au cas de l innovation pour les entreprises du Canton du Tessin Sandro Petrillo Université de Neuchâtel - Diplôme Postgrade en Statistique Projet

Plus en détail

Imputation du salaire d ego dans TeO

Imputation du salaire d ego dans TeO Imputation du salaire d ego dans TeO Objet de la note : linéariser la réponse en tranche du salaire, et imputer le salaire en cas de non réponse Champ et principe de la méthode Les individus qui se sont

Plus en détail

Introduction à l approche bootstrap

Introduction à l approche bootstrap Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?

Plus en détail

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Chapitre 5 UE4 : Biostatistiques Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés.

Plus en détail

Probabilités III Introduction à l évaluation d options

Probabilités III Introduction à l évaluation d options Probabilités III Introduction à l évaluation d options Jacques Printems Promotion 2012 2013 1 Modèle à temps discret 2 Introduction aux modèles en temps continu Limite du modèle binomial lorsque N + Un

Plus en détail

TABLE DES MATIERES. C Exercices complémentaires 42

TABLE DES MATIERES. C Exercices complémentaires 42 TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence

Plus en détail

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/ Recherche opérationnelle Les démonstrations et les exemples seront traités en cours Souad EL Bernoussi Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/ Table des matières 1 Programmation

Plus en détail

Bureau : 238 Tel : 04 76 82 58 90 Email : dominique.muller@upmf-grenoble.fr

Bureau : 238 Tel : 04 76 82 58 90 Email : dominique.muller@upmf-grenoble.fr Dominique Muller Laboratoire Inter-universitaire de Psychologie Bureau : 238 Tel : 04 76 82 58 90 Email : dominique.muller@upmf-grenoble.fr Supports de cours : webcom.upmf-grenoble.fr/lip/perso/dmuller/m2r/acm/

Plus en détail

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

NOTE SUR LA MODELISATION DU RISQUE D INFLATION NOTE SUR LA MODELISATION DU RISQUE D INFLATION 1/ RESUME DE L ANALYSE Cette étude a pour objectif de modéliser l écart entre deux indices d inflation afin d appréhender le risque à très long terme qui

Plus en détail

TESTS D HYPOTHÈSE FONDÉS SUR LE χ². http://fr.wikipedia.org/wiki/eugénisme

TESTS D HYPOTHÈSE FONDÉS SUR LE χ². http://fr.wikipedia.org/wiki/eugénisme TESTS D HYPOTHÈSE FONDÉS SUR LE χ² http://fr.wikipedia.org/wiki/eugénisme Logo du Second International Congress of Eugenics 1921. «Comme un arbre, l eugénisme tire ses constituants de nombreuses sources

Plus en détail

1 Définition de la non stationnarité

1 Définition de la non stationnarité Chapitre 2: La non stationnarité -Testsdedétection Quelques notes de cours (non exhaustives) 1 Définition de la non stationnarité La plupart des séries économiques sont non stationnaires, c est-à-direqueleprocessusquiles

Plus en détail

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p. STATISTIQUE THÉORIQUE ET APPLIQUÉE Tome 2 Inférence statistique à une et à deux dimensions Pierre Dagnelie TABLE DES MATIÈRES Bruxelles, De Boeck, 2011, 736 p. ISBN 978-2-8041-6336-5 De Boeck Services,

Plus en détail

PRIME D UNE OPTION D ACHAT OU DE VENTE

PRIME D UNE OPTION D ACHAT OU DE VENTE Université Paris VII - Agrégation de Mathématiques François Delarue) PRIME D UNE OPTION D ACHAT OU DE VENTE Ce texte vise à modéliser de façon simple l évolution d un actif financier à risque, et à introduire,

Plus en détail

données en connaissance et en actions?

données en connaissance et en actions? 1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)

Plus en détail

L Econométrie des Données de Panel

L Econométrie des Données de Panel Ecole Doctorale Edocif Séminaire Méthodologique L Econométrie des Données de Panel Modèles Linéaires Simples Christophe HURLIN L Econométrie des Données de Panel 2 Figure.: Présentation Le but de ce séminaire

Plus en détail

Le risque Idiosyncrasique

Le risque Idiosyncrasique Le risque Idiosyncrasique -Pierre CADESTIN -Magali DRIGHES -Raphael MINATO -Mathieu SELLES 1 Introduction Risque idiosyncrasique : risque non pris en compte dans le risque de marché (indépendant des phénomènes

Plus en détail

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers

Plus en détail

Chapitre 5 : Flot maximal dans un graphe

Chapitre 5 : Flot maximal dans un graphe Graphes et RO TELECOM Nancy A Chapitre 5 : Flot maximal dans un graphe J.-F. Scheid 1 Plan du chapitre I. Définitions 1 Graphe Graphe valué 3 Représentation d un graphe (matrice d incidence, matrice d

Plus en détail

VI. Tests non paramétriques sur un échantillon

VI. Tests non paramétriques sur un échantillon VI. Tests non paramétriques sur un échantillon Le modèle n est pas un modèle paramétrique «TESTS du CHI-DEUX» : VI.1. Test d ajustement à une loi donnée VI.. Test d indépendance de deux facteurs 96 Différentes

Plus en détail

Cours de Tests paramétriques

Cours de Tests paramétriques Cours de Tests paramétriques F. Muri-Majoube et P. Cénac 2006-2007 Licence Ce document est sous licence ALC TYPE 2. Le texte de cette licence est également consultable en ligne à l adresse http://www.librecours.org/cgi-bin/main?callback=licencetype2.

Plus en détail

23. Interprétation clinique des mesures de l effet traitement

23. Interprétation clinique des mesures de l effet traitement 23. Interprétation clinique des mesures de l effet traitement 23.1. Critères de jugement binaires Plusieurs mesures (indices) sont utilisables pour quantifier l effet traitement lors de l utilisation d

Plus en détail

Econométrie et applications

Econométrie et applications Econométrie et applications Ecole des Ponts ParisTech Département Sciences Economiques Gestion Finance Nicolas Jacquemet (nicolas.jacquemet@univ-paris1.fr) Université Paris 1 & Ecole d Economie de Paris

Plus en détail

Leçon N 4 : Statistiques à deux variables

Leçon N 4 : Statistiques à deux variables Leçon N 4 : Statistiques à deux variables En premier lieu, il te faut relire les cours de première sur les statistiques à une variable, il y a tout un langage à se remémorer : étude d un échantillon d

Plus en détail

TRACER LE GRAPHE D'UNE FONCTION

TRACER LE GRAPHE D'UNE FONCTION TRACER LE GRAPHE D'UNE FONCTION Sommaire 1. Méthodologie : comment tracer le graphe d'une fonction... 1 En combinant les concepts de dérivée première et seconde, il est maintenant possible de tracer le

Plus en détail

INTRODUCTION À L'ENVIRONNEMENT DE PROGRAMMATION STATISTIQUE R

INTRODUCTION À L'ENVIRONNEMENT DE PROGRAMMATION STATISTIQUE R INTRODUCTION À L'ENVIRONNEMENT DE PROGRAMMATION STATISTIQUE R Y. BROSTAUX (1) RÉSUMÉ Cette note constitue une introduction au langage et à l'environnement de programmation 5 dans sa version 1.4.1 pour

Plus en détail

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Valentin Patilea 1 Cesar Sanchez-sellero 2 Matthieu Saumard 3 1 CREST-ENSAI et IRMAR 2 USC Espagne 3 IRMAR-INSA

Plus en détail

Introduction à R. Florence Yerly. Dept. de mathématiques, Université de Fribourg (CH) SP 2011

Introduction à R. Florence Yerly. Dept. de mathématiques, Université de Fribourg (CH) SP 2011 Dept. de mathématiques, Université de Fribourg (CH) SP 2011 Qu est ce que R? Un logiciel de statistiques libre et gratuit ; Un logiciel multi-plateforme (UNIX, Windows MacOS X) R permet de faire des calculs

Plus en détail

Température corporelle d un castor (une petite introduction aux séries temporelles)

Température corporelle d un castor (une petite introduction aux séries temporelles) Température corporelle d un castor (une petite introduction aux séries temporelles) GMMA 106 GMMA 106 2014 2015 1 / 32 Cas d étude Temperature (C) 37.0 37.5 38.0 0 20 40 60 80 100 Figure 1: Temperature

Plus en détail

Exemples d Analyses de Variance avec R

Exemples d Analyses de Variance avec R Exemples d Analyses de Variance avec R Christophe Pallier 5 août 00 Résumé R est un logiciel d analyse statistique qui fournit toutes les procédures usuelles (t-tests, anova, tests non paramétriques...)

Plus en détail

Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels

Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels Etab=MK3, Timbre=G430, TimbreDansAdresse=Vrai, Version=W2000/Charte7, VersionTravail=W2000/Charte7 Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels

Plus en détail

Lecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888

Lecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888 Lecture critique d article Rappels Bio statistiques Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888 Plan du cours Rappels fondamentaux Statistiques descriptives Notions de tests statistiques

Plus en détail

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION Bruno Saussereau Laboratoire de Mathématiques de Besançon Université de Franche-Comté Travail en commun

Plus en détail

Application sur le Dispositif en Blocs Complètement Randomisés

Application sur le Dispositif en Blocs Complètement Randomisés Roger Vumilia. KIZUNGU Directeur de l Expérimentation Agricole à l INERA Professeur Associé Faculté des Sciences Agronomiques Université de Kinshasa Utilisation des Logiciels de base dans la Recherche

Plus en détail

Programmation linéaire

Programmation linéaire Programmation linéaire DIDIER MAQUIN Ecole Nationale Supérieure d Electricité et de Mécanique Institut National Polytechnique de Lorraine Mathématiques discrètes cours de 2ème année Programmation linéaire

Plus en détail

FIMA, 7 juillet 2005

FIMA, 7 juillet 2005 F. Corset 1 S. 2 1 LabSAD Université Pierre Mendes France 2 Département de Mathématiques Université de Franche-Comté FIMA, 7 juillet 2005 Plan de l exposé plus court chemin Origine du problème Modélisation

Plus en détail

Cours 7 : Utilisation de modules sous python

Cours 7 : Utilisation de modules sous python Cours 7 : Utilisation de modules sous python 2013/2014 Utilisation d un module Importer un module Exemple : le module random Importer un module Exemple : le module random Importer un module Un module est

Plus en détail

Chapitre 4 : Régression linéaire

Chapitre 4 : Régression linéaire Exercice 1 Méthodes statistiques appliquées aux sciences sociales (STAT-D-203) Titulaire : Catherine Vermandele Chapitre 4 : Régression linéaire Le diplôme de Master of Business Administration ou MBA est

Plus en détail

Etude des propriétés empiriques du lasso par simulations

Etude des propriétés empiriques du lasso par simulations Etude des propriétés empiriques du lasso par simulations L objectif de ce TP est d étudier les propriétés empiriques du LASSO et de ses variantes à partir de données simulées. Un deuxième objectif est

Plus en détail

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et

Plus en détail

MATHS FINANCIERES. Mireille.Bossy@sophia.inria.fr. Projet OMEGA

MATHS FINANCIERES. Mireille.Bossy@sophia.inria.fr. Projet OMEGA MATHS FINANCIERES Mireille.Bossy@sophia.inria.fr Projet OMEGA Sophia Antipolis, septembre 2004 1. Introduction : la valorisation de contrats optionnels Options d achat et de vente : Call et Put Une option

Plus en détail

Exercices du Cours de la programmation linéaire donné par le Dr. Ali DERBALA

Exercices du Cours de la programmation linéaire donné par le Dr. Ali DERBALA 75. Un plombier connaît la disposition de trois tuyaux sous des dalles ( voir figure ci dessous ) et il lui suffit de découvrir une partie de chacun d eux pour pouvoir y poser les robinets. Il cherche

Plus en détail

Value at Risk. CNAM GFN 206 Gestion d actifs et des risques. Grégory Taillard. 27 février & 13 mars 20061

Value at Risk. CNAM GFN 206 Gestion d actifs et des risques. Grégory Taillard. 27 février & 13 mars 20061 Value at Risk 27 février & 13 mars 20061 CNAM Gréory Taillard CNAM Master Finance de marché et estion de capitaux 2 Value at Risk Biblioraphie Jorion, Philippe, «Value at Risk: The New Benchmark for Manain

Plus en détail

Annexe commune aux séries ES, L et S : boîtes et quantiles

Annexe commune aux séries ES, L et S : boîtes et quantiles Annexe commune aux séries ES, L et S : boîtes et quantiles Quantiles En statistique, pour toute série numérique de données à valeurs dans un intervalle I, on définit la fonction quantile Q, de [,1] dans

Plus en détail

Faire un semi variograme et une carte krigée avec surfer

Faire un semi variograme et une carte krigée avec surfer Faire un semi variograme et une carte krigée avec surfer Jérôme Mathieu http://www.jerome.mathieu.freesurf.fr avril 2004 Fichier de données Faire un fichier excel avec les données organisée en colonnes:

Plus en détail

De la mesure à l analyse des risques

De la mesure à l analyse des risques De la mesure à l analyse des risques Séminaire ISFA - B&W Deloitte Jean-Paul LAURENT Professeur à l'isfa, Université Claude Bernard Lyon 1 laurent.jeanpaul@free.fr http://laurent.jeanpaul.free.fr/ 0 De

Plus en détail

Utilisation du Logiciel de statistique SPSS 8.0

Utilisation du Logiciel de statistique SPSS 8.0 Utilisation du Logiciel de statistique SPSS 8.0 1 Introduction Etude épidémiologique transversale en population générale dans 4 pays d Afrique pour comprendre les différences de prévalence du VIH. 2000

Plus en détail

Principe de symétrisation pour la construction d un test adaptatif

Principe de symétrisation pour la construction d un test adaptatif Principe de symétrisation pour la construction d un test adaptatif Cécile Durot 1 & Yves Rozenholc 2 1 UFR SEGMI, Université Paris Ouest Nanterre La Défense, France, cecile.durot@gmail.com 2 Université

Plus en détail

INTRODUCTION AU LOGICIEL R

INTRODUCTION AU LOGICIEL R INTRODUCTION AU LOGICIEL R Variables et mise en jambe Anne Dubois, Julie Bertrand, Emmanuelle Comets emmanuelle.comets@inserm.fr INSERM UMR738 (UMR738) 1 / 68 Sur le site www.cran.r-project.org : Ou trouver

Plus en détail

UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES

UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES Université Paris 13 Cours de Statistiques et Econométrie I UFR de Sciences Economiques Année 2008-2009 Licence de Sciences Economiques L3 Premier semestre TESTS PARAMÉTRIQUES Remarque: les exercices 2,

Plus en détail

Validation probabiliste d un Système de Prévision d Ensemble

Validation probabiliste d un Système de Prévision d Ensemble Validation probabiliste d un Système de Prévision d Ensemble Guillem Candille, janvier 2006 Système de Prévision d Ensemble (EPS) (ECMWF Newsletter 90, 2001) Plan 1 Critères de validation probabiliste

Plus en détail

Chapitre 2/ La fonction de consommation et la fonction d épargne

Chapitre 2/ La fonction de consommation et la fonction d épargne hapitre 2/ La fonction de consommation et la fonction d épargne I : La fonction de consommation keynésienne II : Validations et limites de la fonction de consommation keynésienne III : Le choix de consommation

Plus en détail

Le Modèle Linéaire par l exemple :

Le Modèle Linéaire par l exemple : Publications du Laboratoire de Statistique et Probabilités Le Modèle Linéaire par l exemple : Régression, Analyse de la Variance,... Jean-Marc Azaïs et Jean-Marc Bardet Laboratoire de Statistique et Probabilités

Plus en détail

L IMPACT DE LA MUTUALISATION SUR LES RESSOURCES HUMAINES

L IMPACT DE LA MUTUALISATION SUR LES RESSOURCES HUMAINES ANNEXES L ISTE DES ANNEXES ANNEXE I : ANNEXE II : ANNEXE III : ANNEXE IV : ÉVOLUTION DES DEPENSES DES COMMUNES ET DES EPCI DE 2006 A 2013 OUTILS JURIDIQUES DE MUTUALISATION A DISPOSITION DES ACTEURS LOCAUX

Plus en détail

Analyse des durées de vie avec le logiciel R

Analyse des durées de vie avec le logiciel R Analyse des durées de vie avec le logiciel R Ségolen Geffray Des outils ainsi que des données pour l analyse des durées de vie sont disponibles dans les packages survival MASS Il est nécessaire de charger

Plus en détail

COMPARAISON DE LOGICIELS TESTANT L INDEPENDANCE DE VARIABLES BINAIRES

COMPARAISON DE LOGICIELS TESTANT L INDEPENDANCE DE VARIABLES BINAIRES J. sci. pharm. biol., Vol.9, n - 00, pp. 9-0 EDUCI 00 9 VALLEE POLNEAU S.* DIAINE C. COMPARAISON DE LOGICIELS TESTANT L INDEPENDANCE DE VARIABLES BINAIRES Notre étude visait à comparer les résultats obtenus

Plus en détail

Étude de cas Assurance (d après une étude de Philippe Périé, CISIA)

Étude de cas Assurance (d après une étude de Philippe Périé, CISIA) Étude de cas Assurance (d après une étude de Philippe Périé, CISIA) I.1.Les données L échantillon est constitué de 1106 assurés Belges observés en 1992 et répartis en 2 groupes. - les assurés qui n ont

Plus en détail

Analyse de données linguistiques

Analyse de données linguistiques 2011-2012 Slides inspirés des cours de S. Evert et M. Baroni Linguistique expérimentale? Traditionnellement en linguistique formelle, refus de l usage de données comme source d information unique: Méthode

Plus en détail

La représentativité d un échantillon et son test par le Khi-deux Testing the representativeness of a sample

La représentativité d un échantillon et son test par le Khi-deux Testing the representativeness of a sample Tutorials in Quantitative Methods for Psychology 212, Vol. 8(3), p. 173-181. La représentativité d un échantillon et son test par le Khi-deux Testing the representativeness of a sample Louis Laurencelle

Plus en détail

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc) 87 FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc) Dans le cadre de la réforme pédagogique et de l intérêt que porte le Ministère de l Éducation

Plus en détail