Régression linéaire. M-A Dronne / 65

Dimension: px
Commencer à balayer dès la page:

Download "Régression linéaire. M-A Dronne / 65"

Transcription

1 1 / 65 Régression linéaire M-A Dronne

2 2 / 65 Introduction Plan du cours (et sans pondération) Autres types de régression Régression linéaire pondérée Régression multiple Régression non linéaire Régression logistique

3 Généralités Objectif L objectif est d étudier l influence d une variable quantitative X sur une autre variable quantitative Y. Si ces deux variables semblent liées par une relation linéaire utilisation d un modèle linéaire Vocabulaire Variable X : variable explicative = exogène = indépendante = contrôlée = prédictive Variable Y : variable à expliquer (expliquée) = endogène = dépendante = observée = prédite Remarque Contrairement à la corrélation, les deux variables n ont pas un rôle symétrique 3 / 65

4 4 / 65 Généralités Remarques Il peut exister une relation entre deux variables mais qui ne soit pas linéaire : modèle logarithmique, inverse, quadratique, cubique, puissance,logistique, exponentiel,... Dans la nature, on trouve souvent des phénomènes de saturation ou de seuil (à prendre en compte dans le modèle) Il faut définir les "bornes" entre lesquelles la relation entre les 2 variables est quantitative Il faut toujours commencer par visualiser le nuage de points des données

5 Exemple Enoncé Un modèle rongeur de tumeur solide est utilisé et on souhaite étudier si la dose d anticancéreux A administrée à un groupe de 15 souris influence la durée de vie de ces souris. On administre donc 15 doses différentes d anticancéreux à ces souris et le nombre de jours de survie de ces souris est ensuite recensé. Question La survie est-elle liée linéairement à la dose d anticancéreux administrée au risque 5%? 5 / 65

6 6 / 65 Modèle linéaire Modèle linéaire Y = α + βx + ɛ α : ordonnée à l origine β : pente de la droite ɛ : résidu (= erreur = aléa de mesure) : variable aléatoire σ 2 ɛ : variance résiduelle Remarque ɛ N (0, σ ɛ ) 3 paramètres inconnus : α, β et σ ɛ Estimations de ces paramètres à calculer : a, b et s ɛ

7 Modèle linéaire Conditions à respecter Conditions sur les Y i ou sur les ɛ i : Conditions sur les Y i Y i : v.a. indépendantes, normales, d espérance sur la droite de régression et de variance constante Y i N (βx i + α, σ ɛ ) et Cov(Y i, Y j ) = 0 i j Conditions sur les ɛ i ɛ i : v.a. indépendantes, normales, d espérance nulle et de variance constante (variance résiduelle) ɛ i N (0, σ ɛ ) et Cov(ɛ i, ɛ j ) = 0 i j Vocabulaire On dit que les ɛ i doivent être identiquement et indépendamment distribuées (iid) selon une loi normale 7 / 65

8 8 / 65 Démarche générale Etapes Pour étudier la liaison linéaire entre X et Y : Estimation des paramètres obtention et étude de la droite de régression Etude de validité du modèle linéaire étude des résidus (la relation entre X et Y est-elle réellement linéaire?) Etude de la liaison linéaire Test de la pente nulle (la relation linéaire entre X et Y est-elle statistiquement significative?)

9 9 / 65 Estimation des paramètres Droite de régression a : estimation de α b : estimation de β Y = a + bx Remarque La droite de régression passe par le point (m x, m y ) avec m x = x n et m y = y n Estimation des paramètres Méthode des moindres carrés minimisation de la somme des carrés des écarts Méthode du maximum de vraisemblance

10 10 / 65 Estimation des paramètres Méthode 1 : méthode des moindres carrés Somme des carrés des écarts SCE = i e 2 i avec e i = Y i (a + bx i ) = Y i Ŷi Y i : valeur mesurée Ŷ i : valeur calculée de Y pour X = X i Minimisation de la SCE annulation des dérivées partielles de la SCE : SCE(a, b) a = 0 et SCE(a, b) b = 0

11 11 / 65 Estimation des paramètres Méthode des moindres carrés (suite) Valeurs estimées de α et β : b = n xy x y n x 2 ( x) 2 = cov(x, Y ) s 2 x a = m y bm x x avec m x = et m y = n y n Remarque Intervalles de confiance sur α et sur β : ic (1 α) (β) = ] b t (α,ν) s B ; b + t (α,ν) s B [ ic (1 α) (α) = ] a t (α,ν) s A ; a + t (α,ν) s A [

12 12 / 65 Estimation des paramètres Méthode 2 : maximum de vraisemblance : généralités Soit X une variable aléatoire de loi continue (ou discrète) dont on veut estimer un paramètre θ Soit f (x i ; θ) la fonction densité de probabilité de X La vraisemblance vaut : L(x 1,..., x n ; θ) = i f (x i ; θ) On veut trouver le maximum de cette fonction calcul de dérivées partielles : L(x 1,..., x n ; θ) θ = 0

13 Maximiser cette quantité par rapport à α et β revient à minimiser le dernier terme minimisation de la SCE (méthode des moindres carrés) estimations a et b de α et β 13 / 65 Estimation des paramètres Maximum de vraisemblance : application à la loi normale On cherche à maximiser la quantité suivante par rapport aux paramètres α, β et σ 2 ɛ : ( ) n [ L(α, β, σɛ 2 1 ) = exp 1 2πσ 2 ɛ 2σɛ 2 On passe à la log-vraisemblance : ln L(α, β, σ 2 ɛ ) = n 2 ln(2πσ2 ɛ ) 1 2σ 2 ɛ ] (Y i α βx i ) 2 i (Y i α βx i ) 2 i

14 14 / 65 Estimation des paramètres Estimation de la variance résiduelle σ 2 ɛ sɛ 2 = SCE y b 2 SCE x n 2 sɛ 2 i = e2 i n 2

15 15 / 65 Formule de décomposition Décomposition (Y i m y ) 2 = i i (Ŷi m y ) 2 + i (Y i Ŷi) 2 Signification des termes i (Y i m y ) 2 : somme des carrés totale ((n-1) ddl) i (Ŷi m y ) 2 : somme des carrés expliquée (partie de la variation de Y expliquée par la variable X) (1 ddl) i (Y i Ŷi) 2 : somme des carrés résiduelle (partie de la variation de Y non expliquée par la variable X) ((n-2) ddl)

16 16 / 65 Formule de décomposition Formule sur les SCE SCE T = SCE e + SCE r Tableau d analyse de variance (ANOVA) Il est possible de faire un test pour savoir si la variable X a un effet sur la variable Y : Hypothèses H 0 : pas d effet de X sur Y H 1 : effet de X sur Y Statistique de test et loi suivie sous H 0 : Les SCE suivent des lois du χ 2 sous H 0 SCE e /1 La variable F = suit une loi de Fisher à SCE r /(n 2) (1, n 2) ddl cf. cours ANOVA

17 17 / 65 Coefficient de détermination Définition i r 2 = (Ŷi m y ) 2 i (Y i m y ) 2 = SCE e SCE T ( ) cov(x, Y ) 2 r 2 = s x s y Remarques r 2 rend compte de la qualité de l ajustement (= % de variation expliquée) Il s agit du carré du coefficient de corrélation (cf. cours corrélation) On a toujours : 0 r 2 1

18 18 / 65 Coefficient de détermination Interprétation 0 r 2 1 r 2 = 1 : liaison linéaire parfaite entre X et Y r 2 = 0 : pas de liaison linéaire entre X et Y (= droite horizontale) Remarque Si on ne met pas évidence de liaison linéaire entre X et Y, cela ne veut pas dire qu il n y a pas de liaison du tout liaison non linéaire possible r 2 augmente avec le nombre de données (pertinentes)

19 19 / 65 Coefficient de détermination Utilisation du r 2 dans l ANOVA La statistique de test F utilisée dans l ANOVA précédente peut s exprimer en fonction de r 2 : F = (n 2) r 2 1 r 2 Coefficient de détermination ajusté Comme r 2 dépend du nombre de données, pour comparer des modèles qui ont un nombre différent de données coefficient de détermination ajusté (corrigé par les ddl) : r 2 a = 1 n 1 n 2 (1 r 2 )

20 20 / 65 Etude de validité du modèle linéaire Tests à effectuer sur les résidus ɛ i Normalité des résidus Visualisation des résidus (histogramme + qqplot) Test de normalité (Shapiro, Lilliefors) Espérance nulle des résidus Visualisation des résidus Homoscédasticité des résidus Visualisation des résidus Test de comparaison de variances Indépendance des résidus Visualisation des résidus Test pour tester l auto-corrélation (test de Wald, test de Durbin-Watson,...)

21 Test de la pente nulle Caractéristiques des variables 2 variables Y : variable aléatoire X : variable contrôlée (ou connue sans erreur) Variables quantitatives Hypothèses statistiques Hypothèse nulle : H 0 : β = 0 Y = α + βx + ɛ = α + ɛ pas de liaison linéaire entre X et Y Hypothèse alternative : H 1 : β 0 test bilatéral Y = α + βx + ɛ liaison linéaire entre X et Y Remarque : possibilité de faire un test unilatéral (β > 0 ou β < 0) 21 / 65

22 22 / 65 Test de la pente nulle Propriétés des données 2 échantillons "appariés" (couples (x i, y i )) cas petit échantillon (valable aussi pour grand échantillon) Calculs Estimation ponctuelle de β : b = n xy x y n x 2 ( x) 2 Estimation ponctuelle de σ B : sɛ s B = 2 = SCE x 1 (n 2) ( ) SCEy b SCE 2 x

23 23 / 65 Test de la pente nulle Conditions à respecter Conditions sur les Y i Y i : v.a. indépendantes, normales, d espérance sur la droite de régression et de variance constante Y i N (βx + α, σ ɛ ) et Cov(Y i, Y j ) = 0 i j Conditions sur les ɛ i ɛ i : v.a. indépendantes, normales, d espérance nulle et de variance constante (variance résiduelle) ɛ i N (0, σ ɛ ) et Cov(ɛ i, ɛ j ) = 0 i j Tests préliminaires cf. étude de validité du modèle linéaire

24 24 / 65 Test de la pente nulle Formule et calcul de la statistique de test Variable d intérêt : B : estimateur de β Statistique de test sous H 0 : Z = T = B S B Loi suivie par la statistique de test : T Student à ν = n 2 ddl Valeur de la statistique de test z = t = b s B

25 25 / 65 Test de la pente nulle Confrontation et conclusion (cf. cours précédents) Confrontation Comparaison de la valeur de la statistique de test t avec la valeur seuil t s lue dans la table de Student Position de t par rapport à l intervalle d acceptation I a Comparaison de la p-value avec la valeur α Conclusion Conclusion en langage statistique et en langage courant (au risque α)

26 26 / 65 Test de la pente nulle Régression / corrélation On a la relation suivante : r = b s x s y Le test de la pente nulle est donc équivalent au test du coefficient de corrélation de Pearson.

27 Autres tests statistiques Test de conformité de β à une valeur de référence β 0 Hypothèses : H 0 : β = β 0 H 1 : β β 0 Statistique de test : Z = T = B β 0 S B Student à ν = n 2 ddl Valeur de la statistique de test : z = t = b β 0 s B 27 / 65

28 28 / 65 Test de conformité de l ordonnée à l origine Caractéristiques des variables 2 variables Y : variable aléatoire X : variable contrôlée (ou connue sans erreur) Variables quantitatives Hypothèses statistiques Hypothèse nulle : H 0 : α = α 0 Hypothèse alternative : H 1 : α α 0 test bilatéral

29 29 / 65 Test de conformité de l ordonnée à l origine Propriétés des données 2 échantillons "appariés" cas petit échantillon (valable aussi pour grand échantillon) Calculs Estimation ponctuelle de α : a = m y bm x Estimation ponctuelle de σ A : s A = s ɛ 1 n + m2 x SCE x

30 30 / 65 Test de conformité de l ordonnée à l origine Conditions à respecter Conditions sur les Y i Y i : v.a. indépendantes, normales, d espérance sur la droite de régression et de variance constante Y i N (βx + α, σ ɛ ) et Cov(Y i, Y j ) = 0 i j Conditions sur les ɛ i ɛ i : v.a. indépendantes, normales, d espérance nulle et de variance constante (variance résiduelle) ɛ i N (0, σ ɛ ) et Cov(ɛ i, ɛ j ) = 0 i j Tests préliminaires cf. étude de validité du modèle linéaire

31 31 / 65 Test de conformité de l ordonnée à l origine Formule et calcul de la statistique de test Variable d intérêt : A : estimateur de α Statistique de test sous H 0 : Z = T = A α 0 S A Loi suivie par la statistique de test : T Student à ν = n 2 ddl Valeur de la statistique de test z = t = a α 0 s A

32 32 / 65 Test de conformité de l ordonnée à l origine Confrontation et conclusion (cf. cours précédents) Confrontation Comparaison de la valeur de la statistique de test t avec la valeur seuil t s lue dans la table de Student Position de t par rapport à l intervalle d acceptation I a Comparaison de la p-value avec la valeur α Conclusion Conclusion en langage statistique et en langage courant (au risque α)

33 33 / 65 Prédiction avec une droite de régression Objectif proposer la prédiction de valeurs de Y en fonction de valeurs de X à partir de la relation : Y = a + bx Remarques La valeur calculée à l aide des paramètres de la droite de régression donne une prédiction de l espérance de Y pour une valeur particulière de X. Il faut faire attention lorsque l on fait des prévisions en dehors de l étendue des valeurs observées.

34 34 / 65 Intervalles Objectif Intervalle de confiance de µ x IC sur la moyenne prédite Intervalle de prévision de y x IC sur une valeur individuelle prédite

35 35 / 65 Intervalle de confiance de µ x Espérance de Y sachant X Estimation ponctuelle de µ 0 = E(Y /X = x 0 ) pour Y = α + βx + ɛ : µ 0 = a + bx 0 Intervalle de confiance de l espérance IC de µ 0 = E(Y /X = x 0 ) : Remarque ic (1 α) (µ 0 ) = a + bx 0 ± t (α,ν) s ɛ 1 n + (x 0 m x ) 2 SCE x Plus la valeur de x 0 est éloignée de la moyenne m x, plus l intervalle de confiance est "large"

36 36 / 65 Intervalle de prévision de y x Valeur prédite Valeur prédite ponctuelle de Y 0 pour X = x 0 : Intervalle de prévision y 0 = a + bx 0 Intervalle de prévision de Y 0 pour X = x 0 : ip (1 α) (Y 0 ) = a + bx 0 ± t (α,ν) s ɛ Remarque L ip (1 α) (Y 0 ) est plus "large" que l ic (1 α) (µ 0 ) n + (x 0 m x ) 2 SCE x

37 Utilisation de R Exemple Un modèle rongeur de tumeur solide est utilisé et on souhaite étudier si la dose d anticancéreux A administrée à un groupe de 15 souris influence la durée de vie de ces souris. On administre donc 15 doses différentes d anticancéreux à ces souris et le nombre de jours de survie de ces souris est ensuite recensé. La survie est-elle liée linéairement à la dose d anticancéreux administrée au risque 5%? Commandes R Soit "dose" le vecteur contenant les 15 valeurs de doses et "survie" le vecteur contenant les 15 valeurs de survie correspondantes. Il faut commencer par visualiser les données (la survie en fonction de la dose) 37 / 65

38 Utilisation de R Visualisation des données : plot(dose,survie) survie dose Interprétation Possibilité d envisager un modèle linéaire du type : Y = α + βx + ɛ avec ɛ N (0, σ ɛ ) Y : survie (variable quantitative) X : dose (variable quantitative) 38 / 65

39 39 / 65 Utilisation de R Régression : commandes R Commande reg<-lm(survie~dose) Commande reg : Call: lm(formula = survie Coefficients: (Intercept) dose dose) Interprétation La droite de régression a pour équation : Y = X

40 40 / 65 Utilisation de R Options de la fonction lm formula : quand il y a plusieurs variables explicatives, cette option permet de prendre en compte les interactions weights : permet de prendre en compte des poids si on souhaite faire une régression pondérée na.action : indique ce qu il faut faire s il manque une donnée dans la liste method : permet de préciser la méthode à utiliser pour faire la régression (par défaut méthode "qr") model, x, y, qr : paramètres logiques : si = TRUE, le logiciel donne les détails demandés autres options

41 41 / 65 Utilisation de R Résultat de la commande summary(reg) Call: lm(formula = survie ~dose) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) e-16 *** dose e-12 *** -- Signif. codes: 0 *** ** 0.01 * Residual standard error: on 13 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 1 and 13 DF, p-value: 7.563e-12

42 Utilisation de R Interprétation Distribution des résidus min-max 1 er, 2 nd et 3 ème quartile Ordonnée à l origine (intercept) : Valeur estimée a et écart-type estimé s A Test de comparaison de l ordonnée à l origine α à la valeur nulle (test t) : p value < (rejet de H 0 ) ordonnée à l origine significativement différente de zéro au risque 1 pour mille (10 3 ) Pente (dose) : Valeur estimée b et écart-type estimé sb Test de comparaison de la pente β à la valeur nulle (test t) : p value < (rejet de H 0 ) pente significativement différente de zéro au risque 1 pour mille (10 3 ) 42 / 65

43 43 / 65 Utilisation de R Interprétation (suite) Valeurs de r 2 et r 2 a : r 2 = r 2 a = valeurs très proches de 1 Test de Fisher (ANOVA) : p value < (rejet de H 0 ) influence significative de X sur Y (= de la dose sur la survie) au risque 1 pour mille (10 3 ) Remarque Détails du test de Fisher obtenus avec les commandes aov(reg) et anova(reg)

44 Utilisation de R Résultat de la commande anova(reg) Analysis of Variance Table Response: survie Df Sum Sq Mean Sq F value Pr(>F) dose e-12 *** Residuals Signif. codes: 0 *** ** 0.01 * Résultat de la commande aov(reg) Call: aov(formula = reg) Terms: dose Residuals Sum of Squares Deg. of Freedom 1 13 Residual standard error: Estimated effects may be unbalanced 44 / 65

45 45 / 65 Utilisation de R Validation du modèle Visualisation des résidus qqnorm(residuals(reg)) qqline(residuals(reg)) fitted(reg),residuals(reg) plotresid(reg) du package RVAideMemoire Graphe 1 : résidus en fonction des valeurs prédites Graphe 2 : qq-plot des résidus Test de Shapiro-Wilk sur les résidus

46 46 / 65 Utilisation de R Visualisation des résidus Residuals vs fitted Normal Q Q Plot Residuals Sample Quantiles Fitted values Theoretical Quantiles

47 47 / 65 Utilisation de R Interprétation Graphe 1 : Homoscédasticité et indépendance : Equivariance acceptée quand la dispersion verticale des points est à peu près constante sur toute la longueur de l axe des abscisses Indépendance acceptée lorsque l orientation du nuage de points est horizontale Graphe 2 : Normalité des résidus : Normalité acceptée lorsque les points sont à peu près alignés sur une droite Test de Shapiro-Wilk : Normalité des résidus Exemple Normalité, espérance nulle, homoscédasticité et indépendance des résidus modèle linéaire accepté

48 Utilisation de R Validation du modèle Visualisation des résidus Fonctions par(mfrow = c(2, 2)) puis plot(reg, 1:4) 4 graphiques Graphe 1 : résidus en fonction des valeurs prédites Graphe 2 : qq-plot des résidus Graphe 3 : résidus standardisés en fonction des valeurs prédites Graphe 4 : distances de Cook Graphe des distances de Cook Il donne pour chacun des points de mesure la distance entre les paramètres estimées par la régression avec et sans ce point. Si l importance du rôle de chaque point est concentrée sur quelques valeurs, la régression n est pas bonne (prise en compte de points aberrants). 48 / 65

49 Utilisation de R Autres commandes residuals(reg) : permet de visualiser les valeurs des résidus coefficients(reg) : permet de visualiser les valeurs des paramètres estimés a et b fitted.values(reg) ou predict(reg) : permet de visualiser les valeurs des Ŷi (Y i estimés) confint(reg) : donne les intervalles de confiance des paramètres estimés a et b 49 / 65

50 50 / 65 Utilisation de R Autres commandes (suite) ind.contrib(regression) du package RAIdeMemoire : permet de détecter la présence d individus extrême auxquels la régression est très sensible (calcul de la valeur des paramètres de la droite de régression en enlevant à tour de rôle chaque individu) predict(reg,...) : permet de calculer la valeur d une prédiction Ŷi en fonction d une valeur de X

51 51 / 65 Autres types de régressions Exemples Régression linéaire pondérée Régression multiple Régression non linéaire Régression logistique

52 Régression pondérée Définition La régression pondérée est utilisée quand les variances résiduelles σ 2 ɛi diffèrent selon la mesure Y i. Méthode Selon la méthode de l estimation du maximum de vraisemblance, les paramètres estimés a et b vont être déterminés en minimisant la fonction suivante : i 1 (Y i (a + bx i )) 2 = i σ 2 ɛi w i (Y i (a + bx i )) 2 σ 2 ɛi : variance résiduelle affectant la mesure Y i w i : poids de la mesure Y i 52 / 65

53 53 / 65 Régression multiple Définition (cf. cours statistiques multivariées) Etude de la liaison entre une variable quantitative Y et un ensemble de variables quantitatives X 1,...X k. Modèle β j : paramètres fixes Y = α + β 1 X β k X k + ɛ ɛ N (0, σ ɛ )

54 54 / 65 Régression multiple Remarques Si variables explicatives qualitatives : utilisation d indicatrices pour les modalités de ces variables Possibilité de prendre en compte des interactions entre les variables explicatives Objectif Détermination de la (ou des) variable(s) explicative(s) (et/ou de leurs interactions) qui ont de l influence sur la variable à expliquer.

55 Régression non linéaire Définition Etude de la liaison non linéaire entre une variable quantitative Y et une ou plusieurs variables quantitatives X 1,...X k. Modèle θ vecteur de paramètres Y = f (θ, X) + ɛ ɛ N (0, σ ɛ ) 55 / 65

56 56 / 65 Régression non linéaire Méthode On cherche à se ramener à une fonction affine (linéaire) pour faire l étude. changement de variable Changement de variable sur X et/ou sur Y Famille Fonctions Transformation Forme affine Exonentielle y = ae bx y = ln(y) y = ln(a) + bx Puissance y = ax b y = ln(y) et x = ln(x) y = ln(a) + bx Inverse y = a + b x x = 1 x y = a + bx Logistique y = 1 1+e (ax+b) y = ln ( y 1 y ) y = ax + b

57 57 / 65 Régression logistique Définition Etude de la liaison entre une variable qualitative Y et une ou plusieurs variables quantitatives X 1,...X k. Remarque Quand variables explicatives qualitatives : utilisation d indicatrices pour les modalités de ces variables Régression logistique binaire Etude de la liaison entre une variable binaire Y et une ou plusieurs variables X i quantitatives ou qualitatives

58 58 / 65 Régression logistique binaire Exemple On souhaite étudier s il existe une relation entre la prévalence du cancer du poumon et le fait de fumer ainsi que l âge. Y : "avoir le cancer du poumon" variable qualitative binaire X 1 : "être fumeur" variable qualitative binaire X 2 : "age" variable quantitative continue modèle logistique

59 Régression logistique binaire Notations Y : absence/présence d une maladie M + : malade, M : non malade p(x) = P(M + /X = x) : probabilité d être malade (prévalence de la maladie) sachant que X = x X i : facteurs de risque de la maladie Modèle avec une variable explicative X p x = P(M + /X = x) = e (α+βx) fonction logistique p x = P(M + /X = x) = e(α+βx) 1 + e (α+βx) 59 / 65

60 60 / 65 Régression logistique binaire Transformation : fonction Logit ( ) px logit(p x ) = ln = α + βx 1 p x fonction linéaire Estimation des paramètres Utilisation de la méthode du maximum de vraisemblance

61 61 / 65 Régression logistique binaire Cas d une variable explicative binaire Probabilité d avoir la maladie sachant que l on a le facteur de risque : p 1 = P(M + /X = 1) = e (α+β) Probabilité d avoir la maladie sachant que l on n a pas le facteur de risque Remarque p 0 = P(M + /X = 0) = e α Le modèle logistique va permettre d exprimer l association entre la maladie et l exposition au facteur étudié au moyen de l odd ratio (OR), indicateur très fréquemment employé en épidémiologie.

62 Régression logistique binaire Définition de l OR OR = rapport des chances (RC) Formule OR = p 1 1 p 1 1 p 0 p 0 Relation avec le modèle logistique OR = e β β = ln(or) 62 / 65

63 63 / 65 Régression logistique binaire Test sur β Tester l hypothèse H 0 : β = 0 revient à tester l hypothèse H 0 : OR = 1 Interprétation du OR Si on effectue une étude pour savoir si le fait d être fumeur a une influence sur le fait d avoir un cancer des poumons et que l on obtient OR = 2.4, on en déduit qu un fumeur a 2.4 fois plus de "chance" (risque) d avoir un cancer du poumon

64 Régression logistique binaire Commandes R Utilisation de la fonction glm pour Modèle Linéaire Généralisé Commande R : logis<-glm(y X,family = binomial(link="logit")) Remarque : la loi de distribution des erreurs est une loi binomiale (car variable à expliquer est binaire) Tableau des résultats avec la commande summary(logis) 64 / 65

65 65 / 65 Conclusion Différents types de régressions Régression linéaire / non linéaire Régression pondérée / non pondérée Régression simple (univariée) /multiple (multivariée)

Analyse de la variance Comparaison de plusieurs moyennes

Analyse de la variance Comparaison de plusieurs moyennes Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction

Plus en détail

Données longitudinales et modèles de survie

Données longitudinales et modèles de survie ANALYSE DU Données longitudinales et modèles de survie 5. Modèles de régression en temps discret André Berchtold Département des sciences économiques, Université de Genève Cours de Master ANALYSE DU Plan

Plus en détail

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour francour@unice.fr Une grande partie des illustrations viennent

Plus en détail

Exercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015

Exercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015 Exercices M1 SES 214-215 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 215 Les exemples numériques présentés dans ce document d exercices ont été traités sur le logiciel R, téléchargeable par

Plus en détail

Exemples d application

Exemples d application AgroParisTech Exemples d application du modèle linéaire E Lebarbier, S Robin Table des matières 1 Introduction 4 11 Avertissement 4 12 Notations 4 2 Régression linéaire simple 7 21 Présentation 7 211 Objectif

Plus en détail

Une introduction. Lionel RIOU FRANÇA. Septembre 2008

Une introduction. Lionel RIOU FRANÇA. Septembre 2008 Une introduction INSERM U669 Septembre 2008 Sommaire 1 Effets Fixes Effets Aléatoires 2 Analyse Classique Effets aléatoires Efficacité homogène Efficacité hétérogène 3 Estimation du modèle Inférence 4

Plus en détail

Lire ; Compter ; Tester... avec R

Lire ; Compter ; Tester... avec R Lire ; Compter ; Tester... avec R Préparation des données / Analyse univariée / Analyse bivariée Christophe Genolini 2 Table des matières 1 Rappels théoriques 5 1.1 Vocabulaire....................................

Plus en détail

Introduction aux Statistiques et à l utilisation du logiciel R

Introduction aux Statistiques et à l utilisation du logiciel R Introduction aux Statistiques et à l utilisation du logiciel R Christophe Lalanne Christophe Pallier 1 Introduction 2 Comparaisons de deux moyennes 2.1 Objet de l étude On a mesuré le temps de sommeil

Plus en détail

MODELE A CORRECTION D ERREUR ET APPLICATIONS

MODELE A CORRECTION D ERREUR ET APPLICATIONS MODELE A CORRECTION D ERREUR ET APPLICATIONS Hélène HAMISULTANE Bibliographie : Bourbonnais R. (2000), Econométrie, DUNOD. Lardic S. et Mignon V. (2002), Econométrie des Séries Temporelles Macroéconomiques

Plus en détail

TABLE DES MATIERES. C Exercices complémentaires 42

TABLE DES MATIERES. C Exercices complémentaires 42 TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence

Plus en détail

Chapitre 3. Quelques fonctions usuelles. 1 Fonctions logarithme et exponentielle. 1.1 La fonction logarithme

Chapitre 3. Quelques fonctions usuelles. 1 Fonctions logarithme et exponentielle. 1.1 La fonction logarithme Chapitre 3 Quelques fonctions usuelles 1 Fonctions logarithme et eponentielle 1.1 La fonction logarithme Définition 1.1 La fonction 7! 1/ est continue sur ]0, +1[. Elle admet donc des primitives sur cet

Plus en détail

Un exemple de régression logistique sous

Un exemple de régression logistique sous Fiche TD avec le logiciel : tdr341 Un exemple de régression logistique sous A.B. Dufour & A. Viallefont Etude de l apparition ou non d une maladie cardiaque des coronaires 1 Présentation des données Les

Plus en détail

STATISTIQUES. UE Modélisation pour la biologie

STATISTIQUES. UE Modélisation pour la biologie STATISTIQUES UE Modélisation pour la biologie 2011 Cadre Général n individus: 1, 2,..., n Y variable à expliquer : Y = (y 1, y 2,..., y n ), y i R Modèle: Y = Xθ + ε X matrice du plan d expériences θ paramètres

Plus en détail

Relation entre deux variables : estimation de la corrélation linéaire

Relation entre deux variables : estimation de la corrélation linéaire CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence

Plus en détail

Statistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année 2010-2011

Statistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année 2010-2011 Master 1 Biologie et technologie du végétal Année 010-011 Statistiques Rappels de cours et travaux dirigés (Seul ce document sera autorisé en examen) auteur : Jean-Marc Labatte jean-marc.labatte@univ-angers.fr

Plus en détail

Chapitre 3. Les distributions à deux variables

Chapitre 3. Les distributions à deux variables Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles

Plus en détail

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures) CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un

Plus en détail

«Cours Statistique et logiciel R»

«Cours Statistique et logiciel R» «Cours Statistique et logiciel R» Rémy Drouilhet (1), Adeline Leclercq-Samson (1), Frédérique Letué (1), Laurence Viry (2) (1) Laboratoire Jean Kuntzmann, Dép. Probabilites et Statistique, (2) Laboratoire

Plus en détail

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers

Plus en détail

Représentation d une distribution

Représentation d une distribution 5 Représentation d une distribution VARIABLE DISCRÈTE : FRÉQUENCES RELATIVES DES CLASSES Si dans un graphique représentant une distribution, on place en ordonnées le rapport des effectifs n i de chaque

Plus en détail

Leçon N 4 : Statistiques à deux variables

Leçon N 4 : Statistiques à deux variables Leçon N 4 : Statistiques à deux variables En premier lieu, il te faut relire les cours de première sur les statistiques à une variable, il y a tout un langage à se remémorer : étude d un échantillon d

Plus en détail

Biostatistiques : Petits effectifs

Biostatistiques : Petits effectifs Biostatistiques : Petits effectifs Master Recherche Biologie et Santé P. Devos DRCI CHRU de Lille EA2694 patrick.devos@univ-lille2.fr Plan Données Générales : Définition des statistiques Principe de l

Plus en détail

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre : Terminale STSS 2 012 2 013 Pourcentages Synthèse 1) Définition : Calculer t % d'un nombre, c'est multiplier ce nombre par t 100. 2) Exemples de calcul : a) Calcul d un pourcentage : Un article coûtant

Plus en détail

La nouvelle planification de l échantillonnage

La nouvelle planification de l échantillonnage La nouvelle planification de l échantillonnage Pierre-Arnaud Pendoli Division Sondages Plan de la présentation Rappel sur le Recensement de la population (RP) en continu Description de la base de sondage

Plus en détail

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE UE4 : Biostatistiques Chapitre 6 Test de comparaison de pourcentages χ² José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Nature des variables

Plus en détail

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Chapitre 5 UE4 : Biostatistiques Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés.

Plus en détail

Une variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants)

Une variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants) CIVILITE-SES.doc - 1 - Une variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants) 1 PRÉSENTATION DU DOSSIER CIVILITE On s intéresse

Plus en détail

Méthodes de Simulation

Méthodes de Simulation Méthodes de Simulation JEAN-YVES TOURNERET Institut de recherche en informatique de Toulouse (IRIT) ENSEEIHT, Toulouse, France Peyresq06 p. 1/41 Remerciements Christian Robert : pour ses excellents transparents

Plus en détail

M2 IAD UE MODE Notes de cours (3)

M2 IAD UE MODE Notes de cours (3) M2 IAD UE MODE Notes de cours (3) Jean-Yves Jaffray Patrice Perny 16 mars 2006 ATTITUDE PAR RAPPORT AU RISQUE 1 Attitude par rapport au risque Nousn avons pas encore fait d hypothèse sur la structure de

Plus en détail

Introduction à la statistique non paramétrique

Introduction à la statistique non paramétrique Introduction à la statistique non paramétrique Catherine MATIAS CNRS, Laboratoire Statistique & Génome, Évry http://stat.genopole.cnrs.fr/ cmatias Atelier SFDS 27/28 septembre 2012 Partie 2 : Tests non

Plus en détail

Principe d un test statistique

Principe d un test statistique Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre

Plus en détail

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position Arbre de NESI distribution quelconque Signe 1 échantillon distribution symétrique non gaussienne Wilcoxon gaussienne Student position appariés 1 échantillon sur la différence avec référence=0 2 échantillons

Plus en détail

Probabilités III Introduction à l évaluation d options

Probabilités III Introduction à l évaluation d options Probabilités III Introduction à l évaluation d options Jacques Printems Promotion 2012 2013 1 Modèle à temps discret 2 Introduction aux modèles en temps continu Limite du modèle binomial lorsque N + Un

Plus en détail

Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS

Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence

Plus en détail

CAPTEURS - CHAINES DE MESURES

CAPTEURS - CHAINES DE MESURES CAPTEURS - CHAINES DE MESURES Pierre BONNET Pierre Bonnet Master GSI - Capteurs Chaînes de Mesures 1 Plan du Cours Propriétés générales des capteurs Notion de mesure Notion de capteur: principes, classes,

Plus en détail

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et

Plus en détail

Introduction à la Statistique Inférentielle

Introduction à la Statistique Inférentielle UNIVERSITE MOHAMMED V-AGDAL SCIENCES FACULTE DES DEPARTEMENT DE MATHEMATIQUES SMI semestre 4 : Probabilités - Statistique Introduction à la Statistique Inférentielle Prinemps 2013 0 INTRODUCTION La statistique

Plus en détail

Annexe commune aux séries ES, L et S : boîtes et quantiles

Annexe commune aux séries ES, L et S : boîtes et quantiles Annexe commune aux séries ES, L et S : boîtes et quantiles Quantiles En statistique, pour toute série numérique de données à valeurs dans un intervalle I, on définit la fonction quantile Q, de [,1] dans

Plus en détail

Coup de Projecteur sur les Réseaux de Neurones

Coup de Projecteur sur les Réseaux de Neurones Coup de Projecteur sur les Réseaux de Neurones Les réseaux de neurones peuvent être utilisés pour des problèmes de prévision ou de classification. La représentation la plus populaire est le réseau multicouche

Plus en détail

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Valentin Patilea 1 Cesar Sanchez-sellero 2 Matthieu Saumard 3 1 CREST-ENSAI et IRMAR 2 USC Espagne 3 IRMAR-INSA

Plus en détail

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE UE4 : Biostatistiques Chapitre 3 : Principe des tests statistiques d hypothèse José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Introduction

Plus en détail

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique»

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Tests de comparaison de moyennes Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Test de Z ou de l écart réduit Le test de Z : comparer des paramètres en testant leurs différences

Plus en détail

1 Définition de la non stationnarité

1 Définition de la non stationnarité Chapitre 2: La non stationnarité -Testsdedétection Quelques notes de cours (non exhaustives) 1 Définition de la non stationnarité La plupart des séries économiques sont non stationnaires, c est-à-direqueleprocessusquiles

Plus en détail

Analyse en Composantes Principales

Analyse en Composantes Principales Analyse en Composantes Principales Anne B Dufour Octobre 2013 Anne B Dufour () Analyse en Composantes Principales Octobre 2013 1 / 36 Introduction Introduction Soit X un tableau contenant p variables mesurées

Plus en détail

DUT Techniques de commercialisation Mathématiques et statistiques appliquées

DUT Techniques de commercialisation Mathématiques et statistiques appliquées DUT Techniques de commercialisation Mathématiques et statistiques appliquées Francois.Kauffmann@unicaen.fr Université de Caen Basse-Normandie 3 novembre 2014 Francois.Kauffmann@unicaen.fr UCBN MathStat

Plus en détail

VI. Tests non paramétriques sur un échantillon

VI. Tests non paramétriques sur un échantillon VI. Tests non paramétriques sur un échantillon Le modèle n est pas un modèle paramétrique «TESTS du CHI-DEUX» : VI.1. Test d ajustement à une loi donnée VI.. Test d indépendance de deux facteurs 96 Différentes

Plus en détail

Aide-mémoire de statistique appliquée à la biologie

Aide-mémoire de statistique appliquée à la biologie Maxime HERVÉ Aide-mémoire de statistique appliquée à la biologie Construire son étude et analyser les résultats à l aide du logiciel R Version 5(2) (2014) AVANT-PROPOS Les phénomènes biologiques ont cela

Plus en détail

Probabilités sur un univers fini

Probabilités sur un univers fini [http://mp.cpgedupuydelome.fr] édité le 7 août 204 Enoncés Probabilités sur un univers fini Evènements et langage ensembliste A quelle condition sur (a, b, c, d) ]0, [ 4 existe-t-il une probabilité P sur

Plus en détail

FORMULAIRE DE STATISTIQUES

FORMULAIRE DE STATISTIQUES FORMULAIRE DE STATISTIQUES I. STATISTIQUES DESCRIPTIVES Moyenne arithmétique Remarque: population: m xμ; échantillon: Mx 1 Somme des carrés des écarts "# FR MOYENNE(série) MOYENNE(série) NL GEMIDDELDE(série)

Plus en détail

3. Caractéristiques et fonctions d une v.a.

3. Caractéristiques et fonctions d une v.a. 3. Caractéristiques et fonctions d une v.a. MTH2302D S. Le Digabel, École Polytechnique de Montréal H2015 (v2) MTH2302D: fonctions d une v.a. 1/32 Plan 1. Caractéristiques d une distribution 2. Fonctions

Plus en détail

Simulation de variables aléatoires

Simulation de variables aléatoires Chapter 1 Simulation de variables aléatoires Références: [F] Fishman, A first course in Monte Carlo, chap 3. [B] Bouleau, Probabilités de l ingénieur, chap 4. [R] Rubinstein, Simulation and Monte Carlo

Plus en détail

Projet Etienne Marceau Méthodes statistiques en assurance non vie

Projet Etienne Marceau Méthodes statistiques en assurance non vie Trinôme : Carine Sauser, Mélanie Groisne, Xavier Milhaud Projet Etienne Marceau Méthodes statistiques en assurance non vie Méthodes statistiques pour la finance et l assurance ISFA - Décembre 2007 Table

Plus en détail

Econométrie et applications

Econométrie et applications Econométrie et applications Ecole des Ponts ParisTech Département Sciences Economiques Gestion Finance Nicolas Jacquemet (nicolas.jacquemet@univ-paris1.fr) Université Paris 1 & Ecole d Economie de Paris

Plus en détail

Résumé du Cours de Statistique Descriptive. Yves Tillé

Résumé du Cours de Statistique Descriptive. Yves Tillé Résumé du Cours de Statistique Descriptive Yves Tillé 15 décembre 2010 2 Objectif et moyens Objectifs du cours Apprendre les principales techniques de statistique descriptive univariée et bivariée. Être

Plus en détail

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé Baccalauréat ES Pondichéry 7 avril 204 Corrigé EXERCICE 4 points Commun à tous les candidats. Proposition fausse. La tangente T, passant par les points A et B d abscisses distinctes, a pour coefficient

Plus en détail

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier Statistiques Appliquées à l Expérimentation en Sciences Humaines Christophe Lalanne, Sébastien Georges, Christophe Pallier Table des matières 1 Méthodologie expérimentale et recueil des données 6 1.1 Introduction.......................................

Plus en détail

Statistiques à deux variables

Statistiques à deux variables Statistiques à deux variables Table des matières I Position du problème. Vocabulaire 2 I.1 Nuage de points........................................... 2 I.2 Le problème de l ajustement.....................................

Plus en détail

Correction du bac blanc CFE Mercatique

Correction du bac blanc CFE Mercatique Correction du bac blanc CFE Mercatique Exercice 1 (4,5 points) Le tableau suivant donne l évolution du nombre de bénéficiaires de minima sociaux en milliers : Année 2002 2003 2004 2005 2006 2007 2008 2009

Plus en détail

Cours de méthodes de scoring

Cours de méthodes de scoring UNIVERSITE DE CARTHAGE ECOLE SUPERIEURE DE STATISTIQUE ET D ANALYSE DE L INFORMATION Cours de méthodes de scoring Préparé par Hassen MATHLOUTHI Année universitaire 2013-2014 Cours de méthodes de scoring-

Plus en détail

Régression linéaire. Nicolas Turenne INRA nicolas.turenne@jouy.inra.fr

Régression linéaire. Nicolas Turenne INRA nicolas.turenne@jouy.inra.fr Régression linéaire Nicolas Turenne INRA nicolas.turenne@jouy.inra.fr 2005 Plan Régression linéaire simple Régression multiple Compréhension de la sortie de la régression Coefficient de détermination R

Plus en détail

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES LES STATISTIQUES INFERENTIELLES (test de Student) L inférence statistique est la partie des statistiques qui, contrairement à la statistique descriptive, ne se contente pas de décrire des observations,

Plus en détail

Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques.

Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques. 14-3- 214 J.F.C. p. 1 I Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques. Exercice 1 Densité de probabilité. F { ln x si x ], 1] UN OVNI... On pose x R,

Plus en détail

Chapitre 2/ La fonction de consommation et la fonction d épargne

Chapitre 2/ La fonction de consommation et la fonction d épargne hapitre 2/ La fonction de consommation et la fonction d épargne I : La fonction de consommation keynésienne II : Validations et limites de la fonction de consommation keynésienne III : Le choix de consommation

Plus en détail

Tests statistiques et régressions logistiques sous R, avec prise en compte des plans d échantillonnage complexes

Tests statistiques et régressions logistiques sous R, avec prise en compte des plans d échantillonnage complexes , avec prise en compte des plans d échantillonnage complexes par Joseph LARMARANGE version du 29 mars 2007 Ce cours a été développé pour une formation niveau M2 et Doctorat des étudiants du laboratoire

Plus en détail

Cours de Tests paramétriques

Cours de Tests paramétriques Cours de Tests paramétriques F. Muri-Majoube et P. Cénac 2006-2007 Licence Ce document est sous licence ALC TYPE 2. Le texte de cette licence est également consultable en ligne à l adresse http://www.librecours.org/cgi-bin/main?callback=licencetype2.

Plus en détail

Statistique Descriptive Élémentaire

Statistique Descriptive Élémentaire Publications de l Institut de Mathématiques de Toulouse Statistique Descriptive Élémentaire (version de mai 2010) Alain Baccini Institut de Mathématiques de Toulouse UMR CNRS 5219 Université Paul Sabatier

Plus en détail

Calculs de probabilités avec la loi normale

Calculs de probabilités avec la loi normale Calculs de probabilités avec la loi normale Olivier Torrès 20 janvier 2012 Rappels pour la licence EMO/IIES Ce document au format PDF est conçu pour être visualisé en mode présentation. Sélectionnez ce

Plus en détail

Que faire lorsqu on considère plusieurs variables en même temps?

Que faire lorsqu on considère plusieurs variables en même temps? Chapitre 3 Que faire lorsqu on considère plusieurs variables en même temps? On va la plupart du temps se limiter à l étude de couple de variables aléatoires, on peut bien sûr étendre les notions introduites

Plus en détail

Estimation et tests statistiques, TD 5. Solutions

Estimation et tests statistiques, TD 5. Solutions ISTIL, Tronc commun de première année Introduction aux méthodes probabilistes et statistiques, 2008 2009 Estimation et tests statistiques, TD 5. Solutions Exercice 1 Dans un centre avicole, des études

Plus en détail

Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 06/12/2009 Stéphane Tufféry - Data Mining - http://data.mining.free.fr

Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 06/12/2009 Stéphane Tufféry - Data Mining - http://data.mining.free.fr Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE 1 Plan du cours Qu est-ce que le data mining? A quoi sert le data mining? Les 2 grandes familles de techniques Le déroulement d un projet de data

Plus en détail

La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites

La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites La problématique des tests Cours V 7 mars 8 Test d hypothèses [Section 6.1] Soit un modèle statistique P θ ; θ Θ} et des hypothèses H : θ Θ H 1 : θ Θ 1 = Θ \ Θ Un test (pur) est une statistique à valeur

Plus en détail

Projet de Traitement du Signal Segmentation d images SAR

Projet de Traitement du Signal Segmentation d images SAR Projet de Traitement du Signal Segmentation d images SAR Introduction En analyse d images, la segmentation est une étape essentielle, préliminaire à des traitements de haut niveau tels que la classification,

Plus en détail

Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels

Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels Etab=MK3, Timbre=G430, TimbreDansAdresse=Vrai, Version=W2000/Charte7, VersionTravail=W2000/Charte7 Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels

Plus en détail

Précision d un résultat et calculs d incertitudes

Précision d un résultat et calculs d incertitudes Précision d un résultat et calculs d incertitudes PSI* 2012-2013 Lycée Chaptal 3 Table des matières Table des matières 1. Présentation d un résultat numérique................................ 4 1.1 Notations.........................................................

Plus en détail

Les indices à surplus constant

Les indices à surplus constant Les indices à surplus constant Une tentative de généralisation des indices à utilité constante On cherche ici en s inspirant des indices à utilité constante à définir un indice de prix de référence adapté

Plus en détail

Table des matières. I Mise à niveau 11. Préface

Table des matières. I Mise à niveau 11. Préface Table des matières Préface v I Mise à niveau 11 1 Bases du calcul commercial 13 1.1 Alphabet grec...................................... 13 1.2 Symboles mathématiques............................... 14 1.3

Plus en détail

DETERMINATION DE L INCERTITUDE DE MESURE POUR LES ANALYSES CHIMIQUES QUANTITATIVES

DETERMINATION DE L INCERTITUDE DE MESURE POUR LES ANALYSES CHIMIQUES QUANTITATIVES Agence fédérale pour la Sécurité de la Chaîne alimentaire Administration des Laboratoires Procédure DETERMINATION DE L INCERTITUDE DE MESURE POUR LES ANALYSES CHIMIQUES QUANTITATIVES Date de mise en application

Plus en détail

Analyse statistique de données qualitatives et quantitatives en sciences sociales : TP RÉGRESSION LOGISTIQUE (MODÈLES CHAPITRE 1)

Analyse statistique de données qualitatives et quantitatives en sciences sociales : TP RÉGRESSION LOGISTIQUE (MODÈLES CHAPITRE 1) Analyse statistique de données qualitatives et quantitatives en sciences sociales : TP RÉGRESSION LOGISTIQUE (MODÈLES CHAPITRE 1) Modèles de régression logistique à réaliser Une explicative catégorielle

Plus en détail

Economie de l incertain et de l information Partie 1 : Décision en incertain probabilisé Chapitre 1 : Introduction à l incertitude et théorie de

Economie de l incertain et de l information Partie 1 : Décision en incertain probabilisé Chapitre 1 : Introduction à l incertitude et théorie de Economie de l incertain et de l information Partie 1 : Décision en incertain probabilisé Chapitre 1 : Introduction à l incertitude et théorie de l espérance d utilité Olivier Bos olivier.bos@u-paris2.fr

Plus en détail

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3

Plus en détail

Chapitre 6. Fonction réelle d une variable réelle

Chapitre 6. Fonction réelle d une variable réelle Chapitre 6 Fonction réelle d une variable réelle 6. Généralités et plan d étude Une application de I dans R est une correspondance entre les éléments de I et ceu de R telle que tout élément de I admette

Plus en détail

MODELES DE DUREE DE VIE

MODELES DE DUREE DE VIE MODELES DE DUREE DE VIE Cours 1 : Introduction I- Contexte et définitions II- Les données III- Caractéristiques d intérêt IV- Evènements non renouvelables/renouvelables (unique/répété) I- Contexte et définitions

Plus en détail

SINE QUA NON. Découverte et Prise en main du logiciel Utilisation de bases

SINE QUA NON. Découverte et Prise en main du logiciel Utilisation de bases SINE QUA NON Découverte et Prise en main du logiciel Utilisation de bases Sine qua non est un logiciel «traceur de courbes planes» mais il possède aussi bien d autres fonctionnalités que nous verrons tout

Plus en détail

Lecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888

Lecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888 Lecture critique d article Rappels Bio statistiques Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888 Plan du cours Rappels fondamentaux Statistiques descriptives Notions de tests statistiques

Plus en détail

Bureau : 238 Tel : 04 76 82 58 90 Email : dominique.muller@upmf-grenoble.fr

Bureau : 238 Tel : 04 76 82 58 90 Email : dominique.muller@upmf-grenoble.fr Dominique Muller Laboratoire Inter-universitaire de Psychologie Bureau : 238 Tel : 04 76 82 58 90 Email : dominique.muller@upmf-grenoble.fr Supports de cours : webcom.upmf-grenoble.fr/lip/perso/dmuller/m2r/acm/

Plus en détail

données en connaissance et en actions?

données en connaissance et en actions? 1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)

Plus en détail

Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux 4 2013-2014

Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux 4 2013-2014 Tests du χ 2 Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux 4 2013-2014 A. Lourme http://alexandrelourme.free.fr Outline

Plus en détail

Moments des variables aléatoires réelles

Moments des variables aléatoires réelles Chapter 6 Moments des variables aléatoires réelles Sommaire 6.1 Espérance des variables aléatoires réelles................................ 46 6.1.1 Définition et calcul........................................

Plus en détail

PROBABILITES ET STATISTIQUE I&II

PROBABILITES ET STATISTIQUE I&II PROBABILITES ET STATISTIQUE I&II TABLE DES MATIERES CHAPITRE I - COMBINATOIRE ELEMENTAIRE I.1. Rappel des notations de la théorie des ensemble I.1.a. Ensembles et sous-ensembles I.1.b. Diagrammes (dits

Plus en détail

Modèle GARCH Application à la prévision de la volatilité

Modèle GARCH Application à la prévision de la volatilité Modèle GARCH Application à la prévision de la volatilité Olivier Roustant Ecole des Mines de St-Etienne 3A - Finance Quantitative Décembre 2007 1 Objectifs Améliorer la modélisation de Black et Scholes

Plus en détail

Évaluation de la régression bornée

Évaluation de la régression bornée Thierry Foucart UMR 6086, Université de Poitiers, S P 2 M I, bd 3 téléport 2 BP 179, 86960 Futuroscope, Cedex FRANCE Résumé. le modèle linéaire est très fréquemment utilisé en statistique et particulièrement

Plus en détail

CHAPITRE IV Oscillations libres des systèmes à plusieurs degrés de liberté

CHAPITRE IV Oscillations libres des systèmes à plusieurs degrés de liberté CHAPITE IV Oscillations ibres des Systèmes à plusieurs derés de liberté 010-011 CHAPITE IV Oscillations libres des systèmes à plusieurs derés de liberté Introduction : Dans ce chapitre, nous examinons

Plus en détail

Statistique : Résumé de cours et méthodes

Statistique : Résumé de cours et méthodes Statistique : Résumé de cours et méthodes 1 Vocabulaire : Population : c est l ensemble étudié. Individu : c est un élément de la population. Effectif total : c est le nombre total d individus. Caractère

Plus en détail

Fonctions de deux variables. Mai 2011

Fonctions de deux variables. Mai 2011 Fonctions de deux variables Dédou Mai 2011 D une à deux variables Les fonctions modèlisent de l information dépendant d un paramètre. On a aussi besoin de modéliser de l information dépendant de plusieurs

Plus en détail

Fonctions de plusieurs variables

Fonctions de plusieurs variables Module : Analyse 03 Chapitre 00 : Fonctions de plusieurs variables Généralités et Rappels des notions topologiques dans : Qu est- ce que?: Mathématiquement, n étant un entier non nul, on définit comme

Plus en détail

1. Vocabulaire : Introduction au tableau élémentaire

1. Vocabulaire : Introduction au tableau élémentaire L1-S1 Lire et caractériser l'information géographique - Le traitement statistique univarié Statistique : le terme statistique désigne à la fois : 1) l'ensemble des données numériques concernant une catégorie

Plus en détail

Introduction à l approche bootstrap

Introduction à l approche bootstrap Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?

Plus en détail

Programmes des classes préparatoires aux Grandes Ecoles

Programmes des classes préparatoires aux Grandes Ecoles Programmes des classes préparatoires aux Grandes Ecoles Filière : scientifique Voie : Biologie, chimie, physique et sciences de la Terre (BCPST) Discipline : Mathématiques Seconde année Préambule Programme

Plus en détail

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

La survie nette actuelle à long terme Qualités de sept méthodes d estimation La survie nette actuelle à long terme Qualités de sept méthodes d estimation PAR Alireza MOGHADDAM TUTEUR : Guy HÉDELIN Laboratoire d Épidémiologie et de Santé publique, EA 80 Faculté de Médecine de Strasbourg

Plus en détail