Régression logistique

Dimension: px
Commencer à balayer dès la page:

Download "Régression logistique"

Transcription

1 Régression logistique Erik-André Sauleau - Nicolas Meyer erik-andre.sauleau@medecine.u-strasbg.fr - nmeyer@unistra.fr Laboratoire de Biostatistiques - Faculté de Médecine Pôle de Santé Publique CHU - STRASBOURG Mars 2009

2 Plan 1 Introduction 2 Rappels sur risques relatifs et odds-ratios 3 Fonction et modèle logistiques 4 Codage des variables 5 Estimations et adéquation 6 Modélisation 7 Exemple - TP

3 Où en sommes nous? 1 Introduction Le programme Le cadre général Intérêts de la régression logistique 2 Rappels sur risques relatifs et odds-ratios 3 Fonction et modèle logistiques 4 Codage des variables 5 Estimations et adéquation 6 Modélisation

4 Le programme Compétence 4 : régression logistique 1 Savoir écrire les modèles théoriques et expérimental, comprendre le lien avec la régression linéaire multiple et la relation entre coefficient de régression et odds-ratio 2 Connaître l importance du codage des variables explicatives et la nécessité de recodage pour certaines variables (problème de log-linéarité) 3 Savoir identifier les colinéarités entres deux variables, en connaître les conséquences et vérifier les conditions d application du modèle 4 Maîtriser les techniques de sélection des variables du modèle, en particulier les techniques pas à pas dans le cas des modèles à visée prédictive 5 Savoir interpréter les résultats de l analyse en termes d odds-ratio

5 Le cadre général Définition de la régression logistique Modèle statistique permettant d étudier les relations entre 1 Un ensemble de variables qualitatives X i 2 Une variable qualitative Y Modèle linéaire généralisé utilisant une fonction logistique comme fonction de lien Extensions Variable Y multinomiale (régression polychotomique ordonnée ou non) Des X i quantitatives Outil majeur en épidémiologie

6 Le cadre général Un exemple de problème... La rechute d un cancer est-elle liée au taux d expression d un gène? 1 une variable qualitative Y : rechute oui / non 2 une variable quantitative X : dosage 3 n-échantillon Prédire Y connaissant X Régression linéaire simple : y i = α + βx i + ε i

7 Le cadre général... et sa résolution Les données

8 Le cadre général... et sa résolution La régression linéaire Y = 0,22 + 0,44X

9 Le cadre général... et sa résolution La variable X en 10 classes

10 Le cadre général... et sa résolution Les proportions de rechute par classe de X

11 Le cadre général... et sa résolution L estimation des proportions par régression logistique

12 Intérêts de la régression logistique Une interprétation cohérente... Modéliser les liens entre plusieurs variables explicatives X i qualitatives (ou quantitatives) et une variable résultat qualitative Expression des probabilités sur une échelle entre 0 et 1 Quantification du risque : odds-ratio

13 Où en sommes nous? 1 Introduction 2 Rappels sur risques relatifs et odds-ratios Les cohortes Les cas-témoins 3 Fonction et modèle logistiques 4 Codage des variables 5 Estimations et adéquation 6 Modélisation

14 Les cohortes Les données disponibles Malades Non malades Total Exposés a b a + b Non exposés c d c + d Total a + c b + d N = a + b + c + d

15 Les cohortes Les risques Malades Non malades Exposés a b Non exposés c d Risque d être malade quand on est exposé : P 1 = P r(m + E + ) = a a+b Risque d être malade quand on n est pas exposé : P 0 = P r(m + E ) = c c+d Risque relatif : RR = P 1 P 0 = a(c+d) c(a+b)

16 Les cohortes L intervalle de confiance du risque relatif Malades Non malades Exposés a b Non exposés c d Pour une meilleure convergence asymptotique vers la loi normale, on transforme le RR en son logarithme Variance de l estimation : V[ln (ˆRR)] = 1 P 1 (a+b)p P 0 (c+d)p 0 = b a(a+b) + d c(c+d) Intervalle de confiance : exp Test du RR à 1 [ln (ˆRR) ± z α/2 V[ln (ˆRR)] ]

17 Les cohortes L odds-ratio La cote de z : Malades Non malades Exposés a b Non exposés c d z 1 z Un rapport de cotes : z 1 z u 1 u P Odds-ratio : 1 1 P 1 / P 0 1 P 0 1 P 1 = b a+b et P 1 1 P 1 1 P 0 = d c+d et P 0 1 P 0 Odds-ratio : OR = ad bc = a b = c d

18 Les cohortes L intervalle de confiance de l odds ratio Malades Non malades Exposés a b Non exposés c d Pour une meilleure convergence asymptotique vers la loi normale, on transforme l OR en son logarithme Deux méthodes ] 1 Woolf : exp [ln (ˆOR) ± z α/2 a + 1 b + 1 c + 1 d [ { }] Miettinen : exp ln (ˆOR) 1 ± z α/2 χ 2 Test de l OR à 1

19 Les cas-témoins L odds-ratio dans les cas-témoins Malades Non malades Exposés a b Non exposés c d Risque d être exposé quand on est malade : R 1 = P r(e + M + ) = a a+c Risque d être exposé quand on n est pas malade : R 0 = P r(e + M ) = b b+d R Odds-ratio : 1 1 R 1 / R 0 1 R 0 1 R 1 = c a+c et R 1 1 R 1 1 R 0 = d b+d et P 0 1 R 0 Odds-ratio : OR = ad bc = a c = b d

20 Les cas-témoins Une même expression de l odds-ratio Même estimation et même intervalle de confiance pour l odds-ratio dans les cohortes et les cas-témoins L odds-ratio est plus employé que le risque relatif Quand la maladie est rare, OR RR

21 Où en sommes nous? 1 Introduction 2 Rappels sur risques relatifs et odds-ratios 3 Fonction et modèle logistiques Un préalable : la fonction logistique Le modèle logistique 4 Codage des variables 5 Estimations et adéquation 6 Modélisation

22 Un préalable : la fonction logistique Définition Fonction logistique Description Strictement croissante, monotone Varie de 0 à 1 pour x allant de à + Courbe sigmoïde, point d inflexion correspondant à f(x) = 1/2 Symétrique autour du point d inflexion Formalisation 1 f(x) = 1+e (α+βx) α est un paramètre de position β est un paramètre de forme

23 Un préalable : la fonction logistique Des exemples de fonctions logistiques

24 Un préalable : la fonction logistique Des exemples de fonctions logistiques

25 Un préalable : la fonction logistique Des exemples de fonctions logistiques

26 Un préalable : la fonction logistique Des exemples de fonctions logistiques

27 Le modèle logistique Définition Modèle logistique = régression logistique Pour un sujet j, Y j suit une loi de Bernoulli P r(y = 1 X) = f(x) = 1 1+e (α+βx) = eα+βx 1+e α+βx Le miracle du logit... Le miracle de l odds-ratio...

28 Le modèle logistique Retour à une cohorte Malades (y = 1) Non malades (y = 0) Exposés (x = 1) a b Non exposés (x = 0) c d Probabilité d être malade quand on est exposé : P r(m + E + 1 ) = P 1 = P r(y = 1 x = 1) = 1+e (α+β) Probabilité d être malade quand on n est pas exposé : P r(m + E ) = P 0 = P r(y = 1 x = 0) = 1 1+e α Probabilité de ne pas être malade quand on est exposé : P r(m E + ) = 1 P 1 = e (α+β) 1+e (α+β) Probabilité de ne pas être malade quand on n est pas exposé : P r(m E ) = 1 P 0 = e α 1+e α

29 Le modèle logistique Retour à une cohorte Malades (y = 1) Non malades (y = 0) Exposés (x = 1) a b Non exposés (x = 0) c d OR = P 1 1 P 1 / P 0 1 P 0 OR = P r(m + E + ) P r(m E ) P r(m + E ) P r(m E + ) OR = 1 e α 1+e (α+β) 1+e α = e α 1 e (α+β) 1+e α e (α+β) 1+e (α+β) Le miracle de l odds-ratio = e α+α+β = e β OR = e β ou ln (OR) = β

30 Le modèle logistique Le passage au logit ( ) Définition : logit(z) = ln z 1 z Appliqué à la fonction logistique 1 1 z = 1+e (α+βx) 2 1 z = e (α+βx) 1+e (α+βx) 3 1 z/(1 z) = ( ) e (α+βx) 4 z ln 1 z = ln (1) ln ( e (α+βx)) = α + βx Le deuxième miracle logit(p r(y = 1 X)) = α + βx

31 Le modèle logistique Le passage au logit Lien avec la régression linéaire simple logit(p r(y = 1 X)) = α + βx vs E(Y X) = α + βx Modéliser E(Y) ou Pr(Y=1) c est pareil! E(Y ) = 1 P r(y = 1) + 0 P r(y = 0) = P r(y = 1) Fonction linéaire des variables avec le logit Les erreurs sont binomiales

32 Où en sommes nous? 1 Introduction 2 Rappels sur risques relatifs et odds-ratios 3 Fonction et modèle logistiques 4 Codage des variables 5 Estimations et adéquation 6 Modélisation 7 Exemple - TP

33 Notre cohorte Malades (y = 1) Non malades (y = 0) Exposés (x = x 1 ) a b Non exposés (x = x 0 ) c d Probabilité d être malade quand on est exposé : P r(m + E + 1 ) = P 1 = P r(y = 1 x = x 1 ) = 1+e (α+βx 1 ) Probabilité d être malade quand on n est pas exposé : P r(m + E 1 ) = P 0 = P r(y = 1 x = x 0 ) = 1+e (α+βx 0 ) Probabilité de ne pas être malade quand on est exposé : P r(m E + ) = 1 P 1 = e (α+βx 1 ) 1+e (α+βx 1 ) Probabilité de ne pas être malade quand on n est pas exposé : P r(m E ) = 1 P 0 = e (α+βx 0 ) 1+e (α+βx 0 )

34 Notre cohorte Malades (y = 1) Non malades (y = 0) Exposés (x = x 1 ) a b Non exposés (x = x 0 ) c d OR = P 1 1 P 1 / P 0 1 P 0 OR = P r(m + E + ) P r(m E ) P r(m + E ) P r(m E + ) OR = 1 1+e (α+βx 1 ) e (α+βx 0 ) 1+e (α+βx 0 ) 1 1+e (α+βx 0 ) e (α+βx 1 ) 1+e (α+βx 1 ) = e (α+βx0) e (α+βx 1 ) = e α βx 0+α+βx 1 OR = e β(x 1 x 0 ) Si x 0 = 0 et x 1 = 1, on retrouve bien OR = e β

35 Notre cohorte Malades (y = 1) Non malades (y = 0) Exposés (x = x 1 ) a b Non exposés (x = x 0 ) c d OR = P 1 1 P 1 / P 0 1 P 0 OR = e β(x 1 x 0 ) logit(p 1 ) logit(p 0 ) = β(x 1 x 0 )

36 Rôle majeur du codage OR = e β(x 1 x 0 ) { x0 = 0 Si alors OR x 1 = 1 1 = e β { x0 = 1 Si alors OR x 1 = 0 2 = e β { x0 = 1 Si alors OR x 1 = 1 3 = e 2β { x0 = 0 Si alors OR x 1 = 2 4 = e 2β OR 4 = OR 3 = (1/OR 2 ) 2 = (OR 1 ) 2

37 Exposition multinomiale Modèle logistique logit(p r(y = 1 X)) = α + βx Exposition Malades (y = 1) Non malades (y = 0) Forte (x = 2) a b Moyenne (x = 1) c d Faible (x = 0) e f Probabilité d être malade quand on est fortement exposé : P r(m + x = 2) = P 2 = 1 1+e (α+2β) Probabilité d être malade quand on est moyennement exposé : P r(m + x = 1) = P 1 = 1 1+e (α+β) Probabilité d être malade quand on est faiblement exposé : P r(m + x = 0) = P 0 = 1 1+e α

38 Exposition multinomiale Exposition Malades (y = 1) Non malades (y = 0) Forte (x = 2) a b Moyenne (x = 1) c d Faible (x = 0) e f OR 2 = P 2 1 P 2 / P 0 1 P 0 = e 2β OR 1 = P 1 1 P 1 / P 0 1 P 0 = e β = (OR 1 ) 2 ( ) OR = P 2 1 P 2 / P 1 1 P 1 = e β Choix d une catégorie de référence Hypothèse de progression de l effet de l exposition

39 Un a parte sur l exposition Typologie de variables Quantitative = mesurable sur une échelle 1 Continue = valeurs réelles (Ex : Age) 2 Discrète = valeurs isolées (Ex : Nombre d enfants) Notion de continuité relative à l échelle 10, 13, 13, 15 vs 10, 10, 10, 15 Qualitative = non mesurable sur une échelle 1 Sans ordre, catégorielle (Ex : Sexe) 2 Ordonnée, semi-quantitative (Ex : Stade clinique) Transformation : quantitatif en semi-quantitatif <10, 10-14, >15

40 Un a parte sur l exposition Les mesures d exposition Quantitative Dosimétrie, mesures au poste de travail Durée d exposition Qualitative Exposé - non exposé Catégorie socioprofessionnelle Semi-quantitative Exposition forte - moyenne - faible Exposition <10 ans, 10-19, >20 ans

41 Un a parte sur l exposition Finalement trois cas Variables Exposition Qualitative Semiqualitative Quantitative Catégorielle Cas 1 Ordonnée Cas 2 Continue Cas 3 Discrète Cas 3

42 Retour sur le codage des variables Cas 1 : Variable catégorielle (Ex : CSP) 1 Hypothèse 0, 1,..., trop forte 2 Variables indicatrices et codage dit partiel X X 1 X 2 X 3 c c c c On a remplacé 1 variable à k modalités par k 1 variables un nouvel a parte sur le multivarié

43 Une première extension du modèle Le cas multivarié Modèle logistique : modéliser les liens entre plusieurs variables explicatives X i qualitatives (ou quantitatives) et une variable résultat qualitative 1 P r(y = 1 (X 1,..., X I )) = ou logit(p r(y = 1 X) = α + βx 1+e (α+ I i β i x i ) β i est le logarithme de l odds-ratio associé à une augmentation d une unité de la variable X i, toutes les autres variables étant fixées OR ajusté

44 Retour sur le codage des variables catégorielles (Cas 1) X X 1 X 2 X 3 c c c c logit(p r(y = 1 X) = α + β 1 x 1 + β 2 x 2 + β 3 x 3 logit(p r(y = 1 x = c 0 ) = α logit(p r(y = 1 x = c 1 ) = α + β 1 logit(p r(y = 1 x = c 2 ) = α + β 2 logit(p r(y = 1 x = c 3 ) = α + β 3 Les β i sont les logarithmes des odds-ratios associés aux différentes catégories par rapport à la catégorie de référence logit(p r(y = 1 x = c i ) logit(p r(y = 1 x = c 0 ) = β i

45 Un codage alternatif : le codage marginal X X 1 X 2 X 3 c c c c

46 Un codage alternatif : le codage marginal X X 1 X 2 X 3 c c c c logit(p r(y = 1 X) = α + β 1 x 1 + β 2 x 2 + β 3 x 3 logit(p r(y = 1 x = c 0 ) = α β 1 β 2 β 3 = α + β 0 logit(p r(y = 1 x = c 1 ) = α + β 1 logit(p r(y = 1 x = c 2 ) = α + β 2 logit(p r(y = 1 x = c 3 ) = α + β 3 Les β i sont les logarithmes des odds-ratios associés aux différentes catégories par rapport à une référence moyenne représentée par β 0 logit(p r(y = 1 x = c i )) logit(p r(y = 1 x = c 0 )) = β i β 0 Quel sens?

47 La prise en compte d interaction Interaction entre X 1 et X 2 mesurée par X 1 X 2 logit(p r(y = 1 (X 1,X 2 )) = α + β 1 x 1 + β 2 x 2 + β 3 x 1 x 2 X 1 X 2 OR e β e β 2+β 3 OR e β 1 e β 1+β 3 Absence d interaction si β 3 = 0

48 Le codage des variables ordonnées (Cas 2) Différentes possibilités Perte de la notion d ordre Variables indicatrices et codage partiel Codage marginal Codage Helmert ou codage orthogonal Attribuer des scores 1, 2, 3,... et traiter comme une variable quantitative cas 3 A discuter au cas par cas (Ex : stades cliniques I, II et III)

49 Le codage des variables ordonnées (Cas 2) Contraste de Helmert X X 1 X 2 X 3 c c c c β 1 est l odds-ratio de c 1 par rapport à c 0 β 2 est l odds-ratio de c 2 par rapport à la moyenne de c 0 et c 1 β 3 est l odds-ratio de c 3 par rapport à la moyenne de c 0, c 1 et c 2

50 Le codage des variables ordonnées (Cas 2) Codage orthogonal ou contraste polynomial X X 1 X 2 X 3 c 0 = c 1 = c 2 = c 3 = Valeurs différentes selon les valeurs de X et leur espacement Permet de tester des tendances : le logit augmente-t-il proportionnellement aux valeurs de X? X 1 teste une tendance linéaire, X 2 une tendance quadratique,... A manipuler avec précautions

51 Les variables quantitatives (Cas 3) Que signifie le β dans OR = e β(x 1 x 0 )? 1 β est le logarithme de l odds-ratio associé à une augmentation d une unité de la variable d exposition Une autre valeur peut avoir plus de sens : par exemple 10 β pour une augmentation de 10 mmol d un dosage et non d 1 mmol

52 Résumé du codage sur des exemples Age Trois formes... 1 Quantitative continue : 10, 12, 15, 15, 18, 21 2 Qualitative ordonnée : <15, <15, 15-19, 15-19, 15-19, >20 3 Qualitative catégorielle : c 0, c 0, c 1, c 1, c 1, c 2... et trois cas... 1 Quantitative continue : cas 3 2 Qualitative ordonnée : cas 2 ou cas 3 3 Qualitative catégorielle : cas 1

53 Résumé du codage sur des exemples Age Trois formes et trois cas mais quatre situations 1 Quantitative continue : e β est l OR associé à un vieillissement de 1 an, e 5β de 5 ans 2 Qualitative ordonnée et codage orthogonal ou Helmert : interprétation particulière 3 Qualitative ordonnée et choix de score (1, 2, 3) : e β est l OR associé à un vieillissement de 1 classe 4 Qualitative catégorielle et codage partiel ou marginal : e βi est l OR associé à la classe c i par rapport à une référence (une classe ou une moyenne)

54 Résumé du codage sur des exemples Nombre d enfants Une forme... 1 Quantitative discrète : 0, 1, 2, 3,..., >7... mais deux situations... 1 Quantitative discrète mais comme une continue : e β est l OR associé à un enfant de plus, e 2β est l OR associé à deux enfants de plus 2 Quantitative discrète mais codage orthogonal ou Helmert : interprétation particulière 3 Qualitative catégorielle et codage partiel ou marginal : pas beaucoup de sens

55 Résumé du codage sur des exemples Sexe Une forme, un cas et une situation 1 Qualitative catégorielle : s 0 ou s 1 e β est l OR associé au sexe 1 par rapport au sexe 0 Même situation que pour une variable quantitative discrète ou une qualitative ordonnée à deux valeurs (0 ou 1)

56 Résumé du codage sur des exemples Catégorie socioprofessionnelle Une forme, un cas et une situation éthiquement acceptables 1 Qualitative catégorielle : c 0, c 1, c 2,... Qualitative catégorielle et codage partiel : e β i est l OR associé à la classe c i par rapport à la classe de référence Qualitative catégorielle et codage marginal

57 Où en sommes nous? 1 Introduction 2 Rappels sur risques relatifs et odds-ratios 3 Fonction et modèle logistiques 4 Codage des variables 5 Estimations et adéquation Rappel sur la vraisemblance Estimations et tests Adéquation des modèles 6 Modélisation

58 Rappel sur la vraisemblance Rappel sur le maximum de vraisemblance Si on observe un échantillon, c est que c est celui qui avait la plus grande chance d être observé. C est donc celui qui a la plus grande vraisemblance. On cherche alors les valeurs des paramètres qui maximisent cette vraisemblance et on en déduit que les valeurs obtenues pour les paramètres sont les bonnes valeurs.

59 Estimations et tests Ce qu on a à estimer logit(p r(y = 1 X) = α + I 1 β ix i Les Y et X sont observés On cherche les valeurs de chaque β i On ne peut pas utiliser les moindres carrés estimateurs du maximum de vraisemblance

60 Estimations et tests Les estimateurs du maximum de vraisemblance Vraisemblance d une observation 1 Pour un sujet j malade, V j = P r(y = 1 X) = 1 1+e (α+ βx) 2 Pour un sujet j sain, V j = P r(y = 0 X) = e (α+ βx) Vraisemblance de l échantillon V = N 1 V j = 1 N sujets 2 N 1 sujets non malades Logvraisemblance de l échantillon Annulation des dérivées premières EMV Méthodes itératives 1+e (α+ βx) Estimation d une matrice de variance-covariance des paramètres intervalles de confiance N1 e (α+ βx) N 1+e (α+ βx)

61 Estimations et tests Exemple de calcul d estimateurs Malades Non malades Exposés a b Non exposés c d

62 Estimations et tests Exemple de calcul d estimateurs Exposés Non exposés ( Malades ) a 1 1+e (α+β) ( 1 1+e α ) c Non malades ( ) e (α+β) b 1+e (α+β) ( e α 1+e α ) d V = e b(α+β) e dα (1+e (α+β) ) a+b (1+e α ) c+d L = b(α+β) dα (a+b) ln ( 1 + e (α+β)) (c+d) ln (1 + e α )

63 Estimations et tests Exemple de calcul d estimateurs EMV L α = L β = 0 L = b(α+β) dα (a+b) ln ( 1 + e (α+β)) (c+d) ln (1 + e α ) { L β = b + (a + b) e (α+β) = 0 1+e (α+β) L α = b d + (a + b) e (α+β) + (c + d) e α = 0 1+e (α+β) 1+e α { e α = d 1+e α c+d e (α+β) = b 1+e (α+β) a+b { α = ln c d α + β = ln a b { α = ln c d β = ln ad bc

64 Estimations et tests Tests des paramètres Cas univarié Intérêt : OR = 1 β = 0 On a ˆβ et ˆσ β et donc un intervalle de confiance 1 β : ˆβ ± z α/2ˆσ β 2 OR : e ˆβ±z α/2 ˆσ β ˆβ Test de Wald : rejet de H 0 si ˆσ β > z α/2 Test du rapport des vraisemblances (modèles emboîtés) : 2(L 1 L 0 ) χ 2 1ddl 1 L 1 : logvraisemblance du modèle logit(p r(y = 1 X)) = α + β 2 L 0 : logvraisemblance du modèle logit(p r(y = 1 X)) = α Vraisemblances pénalisées (AIC)

65 Estimations et tests Tests des paramètres Premier cas multivarié Intérêt : OR i = 1 β i = 0 Test du rapport des vraisemblances : 2(L 1 L 0 ) χ 2 1ddl 1 L 1 : logvraisemblance d un modèle logit(p r(y = 1 X) = α + j =i β jx j + β i 2 L 0 : logvraisemblance du modèle logit(p r(y = 1 X) = α + j =i β jx j

66 Estimations et tests Tests des paramètres Second cas multivarié Intérêt : OR k = = OR k+p = 1 β k = = β k+p = 0 Test du rapport des vraisemblances : 2(L 1 L 0 ) χ 2 pddl 1 L 1 : logvraisemblance d un modèle logit(p r(y = 1 X) = α + j / (k,,k+p) β jx j + l=k+p 2 L 0 : logvraisemblance du modèle logit(p r(y = 1 X) = α + j / (k,,k+p) β jx j Utile pour une variable catégorielle transformée en plusieurs variables indicatrices l=k β l x l

67 Estimations et tests Exemple de tests Les données On étudie la relation entre l âge et le risque d infection par un virus sur 356 sujets Age N Séropositifs Fréquence

68 Estimations et tests Exemple de tests Codage de l âge Age Score Codage partiel Score

69 Estimations et tests Exemple de tests Les tests de vraisemblance Modèle sans âge logit(p r(y = 1 age) = α : L 0 = 172,2 Modèle avec âge 0,..., 5 logit(p r(y = 1 age) = α + β age : L 1 = 168,7 Modèle avec âge en variables indicatrices logit(p r(y = 1 age) = α + β 1 x 1 + β 5 x 5 : L 2 = 166,9 Comparaisons 2(L 2 L 0 ) = 10,4 χ 2 5ddl, p = 0,64 2(L 1 L 0 ) = 6,9 χ 2 1ddl, p < 0,01 2(L 2 L 1 ) = 3,5 χ 2 4ddl, p = 0,30 Quelle conclusion? Quel modèle est adéquat?

70 Estimations et tests Les problèmes numériques Une cellule vide peut créer un odds-ratio infini Des variables peuvent complètement séparer malades et non malades Variable combinaison linéaire des autres Problèmes de non-convergence ou de colinéarité Signalés par les logiciels Estimations ponctuelles des β aberrantes Variances des estimations immenses

71 Adéquation des modèles Adéquation des modèles R 2 comme en régression linéaire mais Valeur maximum = 0,36 Interprétation différente et délicate χ 2 d adéquation Test de la déviance χ 2 d Hosmer-Lemeshow Test de C.C. Brown Teste la transformation logistique contre d autres transformations Interprétation délicate en multivarié Analyse des résidus : très délicat

72 Adéquation des modèles Les χ 2 d adéquation Test de la déviance 1 Modèle saturé logvraisemblance maximale L max Les prédictions correspondent aux fréquences observées Un paramètre par observation 2 Le modèle dont on veut tester l adéquation a un logvraisemblance L 1 3 La déviance est D = 2(L max L 1 ) 4 On peut écrire la déviance sous une forme D = 2 O ln ( ) O O sont les événements observés E sont les événements attendus par le modèle à tester 5 La déviance suit une loi du χ 2 mais les conditions d applications sont rarement remplies E

73 Adéquation des modèles Les χ 2 d adéquation Test d Hosmer-Lemeshow 1 Regrouper les observations en 10 classes d effectif à peu près égal 2 χ 2 d adéquation (O E) 2 E O sont les événements observés par classe E sont les événements attendus par classe 3 La statistique suit une loi du χ 2 à 8 degrés de liberté

74 Où en sommes nous? 1 Introduction 2 Rappels sur risques relatifs et odds-ratios 3 Fonction et modèle logistiques 4 Codage des variables 5 Estimations et adéquation 6 Modélisation 7 Exemple - TP

75 Ajustement et facteurs indépendants Le cas multivarié logit(p r(y = 1 X)) = α + βx β i est le logarithme de l odds-ratio associé à une augmentation d une unité de la variable X i, toutes les autres variables étant fixées OR ajusté

76 Ajustement et facteurs indépendants Cas de deux variables explicatives En univarié 1 OR (1) 1 associé à la variable X 1 2 OR (1) 2 associé à la variable X 2 En multivarié : on tient compte simultanément des deux variables 1 Nouvel OR (2) 1 associé à la variable X 1, ajusté sur X 2 2 Nouvel OR (2) 2 associé à la variable X 2, ajusté sur X 1

77 Ajustement et facteurs indépendants Pourquoi OR (2) est différent de OR (1)? Facteur de confusion (différence majeure) Informations redondantes corrélation Colinéarité (plus de deux facteurs)

78 Ajustement et facteurs indépendants Pourquoi OR (2) est différent de OR (1)? Facteur de confusion (différence majeure) Informations redondantes corrélation Colinéarité (plus de deux facteurs) Pourquoi OR (2) n est pas différent de OR (1)? X 1 et X 2 sont des facteurs indépendants et tenir compte de l effet de X 2 ou pas ne change rien sur l effet de X 1

79 Objectifs de la modélisation Explicatif : chercher la meilleure association de variables explicatives pour expliquer Y notion de parcimonie Prédictif : chercher la meilleure association de variables explicatives pour prédire Y pas toujours parcimonieux

80 Choix des variables Grand nombre de variables d exposition Première sélection par des tests univariés (au risque de 0.10 ou 0.20) Tester les interactions entre variables Ne retenir que les variables significatives simultanément Retenir les effets principaux quand on retient une interaction Procédures pas à pas De nombreuses autres méthodes

81 Choix des variables Pas à pas ascendant Partir du modèle plus simple Modèle avec uniquement la constante Modèle avec les variables forcées Ajouter une à une les variables significatives Tests du rapport des vraisemblances La plus significative en premier Variable transformées par des variables indicatrices en bloc On s arrête quand il n y a plus de variables significatives

82 Choix des variables Pas à pas descendant Partir du modèle le plus complexe Retirer une à une les variables non significatives Tests du rapport des vraisemblances La moins significative en premier Variable transformées par des variables indicatrices en bloc On s arrête quand il n y a plus de variable non significative dans le modèle

83 Choix des variables Procédure stepwise En pas à pas ascendant ou descendant On peut revenir en arrière à chaque étape Pour tenir compte des corrélations entre variables Une variable peut s effondrer sur une autre variable très corrélée la rejoint

84 Où en sommes nous? 1 Introduction 2 Rappels sur risques relatifs et odds-ratios 3 Fonction et modèle logistiques 4 Codage des variables 5 Estimations et adéquation 6 Modélisation 7 Exemple - TP

STATISTIQUES. UE Modélisation pour la biologie

STATISTIQUES. UE Modélisation pour la biologie STATISTIQUES UE Modélisation pour la biologie 2011 Cadre Général n individus: 1, 2,..., n Y variable à expliquer : Y = (y 1, y 2,..., y n ), y i R Modèle: Y = Xθ + ε X matrice du plan d expériences θ paramètres

Plus en détail

IBM SPSS Regression 21

IBM SPSS Regression 21 IBM SPSS Regression 21 Remarque : Avant d utiliser ces informations et le produit qu elles concernent, lisez les informations générales sous Remarques sur p. 46. Cette version s applique à IBM SPSS Statistics

Plus en détail

«Cours Statistique et logiciel R»

«Cours Statistique et logiciel R» «Cours Statistique et logiciel R» Rémy Drouilhet (1), Adeline Leclercq-Samson (1), Frédérique Letué (1), Laurence Viry (2) (1) Laboratoire Jean Kuntzmann, Dép. Probabilites et Statistique, (2) Laboratoire

Plus en détail

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE UE4 : Biostatistiques Chapitre 6 Test de comparaison de pourcentages χ² José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Nature des variables

Plus en détail

Docteur José LABARERE

Docteur José LABARERE UE7 - Santé Société Humanité Risques sanitaires Chapitre 3 : Epidémiologie étiologique Docteur José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés.

Plus en détail

Données longitudinales et modèles de survie

Données longitudinales et modèles de survie ANALYSE DU Données longitudinales et modèles de survie 5. Modèles de régression en temps discret André Berchtold Département des sciences économiques, Université de Genève Cours de Master ANALYSE DU Plan

Plus en détail

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures) Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures) Eercice 1 (5 points) pour les candidats n ayant pas choisi la spécialité MATH Le tableau suivant donne l évolution du chiffre

Plus en détail

Analyse statistique de données qualitatives et quantitatives en sciences sociales : TP RÉGRESSION LOGISTIQUE (MODÈLES CHAPITRE 1)

Analyse statistique de données qualitatives et quantitatives en sciences sociales : TP RÉGRESSION LOGISTIQUE (MODÈLES CHAPITRE 1) Analyse statistique de données qualitatives et quantitatives en sciences sociales : TP RÉGRESSION LOGISTIQUE (MODÈLES CHAPITRE 1) Modèles de régression logistique à réaliser Une explicative catégorielle

Plus en détail

Corrigé des TD 1 à 5

Corrigé des TD 1 à 5 Corrigé des TD 1 à 5 1 Premier Contact 1.1 Somme des n premiers entiers 1 (* Somme des n premiers entiers *) 2 program somme_entiers; n, i, somme: integer; 8 (* saisie du nombre n *) write( Saisissez un

Plus en détail

Cours de méthodes de scoring

Cours de méthodes de scoring UNIVERSITE DE CARTHAGE ECOLE SUPERIEURE DE STATISTIQUE ET D ANALYSE DE L INFORMATION Cours de méthodes de scoring Préparé par Hassen MATHLOUTHI Année universitaire 2013-2014 Cours de méthodes de scoring-

Plus en détail

Bureau : 238 Tel : 04 76 82 58 90 Email : dominique.muller@upmf-grenoble.fr

Bureau : 238 Tel : 04 76 82 58 90 Email : dominique.muller@upmf-grenoble.fr Dominique Muller Laboratoire Inter-universitaire de Psychologie Bureau : 238 Tel : 04 76 82 58 90 Email : dominique.muller@upmf-grenoble.fr Supports de cours : webcom.upmf-grenoble.fr/lip/perso/dmuller/m2r/acm/

Plus en détail

Chapitre 3. Quelques fonctions usuelles. 1 Fonctions logarithme et exponentielle. 1.1 La fonction logarithme

Chapitre 3. Quelques fonctions usuelles. 1 Fonctions logarithme et exponentielle. 1.1 La fonction logarithme Chapitre 3 Quelques fonctions usuelles 1 Fonctions logarithme et eponentielle 1.1 La fonction logarithme Définition 1.1 La fonction 7! 1/ est continue sur ]0, +1[. Elle admet donc des primitives sur cet

Plus en détail

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers

Plus en détail

Probabilités III Introduction à l évaluation d options

Probabilités III Introduction à l évaluation d options Probabilités III Introduction à l évaluation d options Jacques Printems Promotion 2012 2013 1 Modèle à temps discret 2 Introduction aux modèles en temps continu Limite du modèle binomial lorsque N + Un

Plus en détail

Chapitre 2 Le problème de l unicité des solutions

Chapitre 2 Le problème de l unicité des solutions Université Joseph Fourier UE MAT 127 Mathématiques année 2011-2012 Chapitre 2 Le problème de l unicité des solutions Ce que nous verrons dans ce chapitre : un exemple d équation différentielle y = f(y)

Plus en détail

Analyse de la variance Comparaison de plusieurs moyennes

Analyse de la variance Comparaison de plusieurs moyennes Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction

Plus en détail

Filtrage stochastique non linéaire par la théorie de représentation des martingales

Filtrage stochastique non linéaire par la théorie de représentation des martingales Filtrage stochastique non linéaire par la théorie de représentation des martingales Adriana Climescu-Haulica Laboratoire de Modélisation et Calcul Institut d Informatique et Mathématiques Appliquées de

Plus en détail

ESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring

ESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring ESSEC Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring Les méthodes d évaluation du risque de crédit pour les PME et les ménages Caractéristiques Comme les montants des crédits et des

Plus en détail

EXERCICE 4 (7 points ) (Commun à tous les candidats)

EXERCICE 4 (7 points ) (Commun à tous les candidats) EXERCICE 4 (7 points ) (Commun à tous les candidats) On cherche à modéliser de deux façons différentes l évolution du nombre, exprimé en millions, de foyers français possédant un téléviseur à écran plat

Plus en détail

Chapitre 3. Les distributions à deux variables

Chapitre 3. Les distributions à deux variables Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles

Plus en détail

Modèles et Méthodes de Réservation

Modèles et Méthodes de Réservation Modèles et Méthodes de Réservation Petit Cours donné à l Université de Strasbourg en Mai 2003 par Klaus D Schmidt Lehrstuhl für Versicherungsmathematik Technische Universität Dresden D 01062 Dresden E

Plus en détail

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Valentin Patilea 1 Cesar Sanchez-sellero 2 Matthieu Saumard 3 1 CREST-ENSAI et IRMAR 2 USC Espagne 3 IRMAR-INSA

Plus en détail

Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 06/12/2009 Stéphane Tufféry - Data Mining - http://data.mining.free.fr

Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 06/12/2009 Stéphane Tufféry - Data Mining - http://data.mining.free.fr Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE 1 Plan du cours Qu est-ce que le data mining? A quoi sert le data mining? Les 2 grandes familles de techniques Le déroulement d un projet de data

Plus en détail

Introduction à la statistique non paramétrique

Introduction à la statistique non paramétrique Introduction à la statistique non paramétrique Catherine MATIAS CNRS, Laboratoire Statistique & Génome, Évry http://stat.genopole.cnrs.fr/ cmatias Atelier SFDS 27/28 septembre 2012 Partie 2 : Tests non

Plus en détail

Etude de fonctions: procédure et exemple

Etude de fonctions: procédure et exemple Etude de fonctions: procédure et exemple Yves Delhaye 8 juillet 2007 Résumé Dans ce court travail, nous présentons les différentes étapes d une étude de fonction à travers un exemple. Nous nous limitons

Plus en détail

TABLE DES MATIERES. C Exercices complémentaires 42

TABLE DES MATIERES. C Exercices complémentaires 42 TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence

Plus en détail

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Chapitre 5 UE4 : Biostatistiques Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés.

Plus en détail

Coup de Projecteur sur les Réseaux de Neurones

Coup de Projecteur sur les Réseaux de Neurones Coup de Projecteur sur les Réseaux de Neurones Les réseaux de neurones peuvent être utilisés pour des problèmes de prévision ou de classification. La représentation la plus populaire est le réseau multicouche

Plus en détail

Principe d un test statistique

Principe d un test statistique Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre

Plus en détail

Arbres binaires de décision

Arbres binaires de décision 1 Arbres binaires de décision Résumé Arbres binaires de décision Méthodes de construction d arbres binaires de décision, modélisant une discrimination (classification trees) ou une régression (regression

Plus en détail

Méthodes de Simulation

Méthodes de Simulation Méthodes de Simulation JEAN-YVES TOURNERET Institut de recherche en informatique de Toulouse (IRIT) ENSEEIHT, Toulouse, France Peyresq06 p. 1/41 Remerciements Christian Robert : pour ses excellents transparents

Plus en détail

Cours d Analyse. Fonctions de plusieurs variables

Cours d Analyse. Fonctions de plusieurs variables Cours d Analyse Fonctions de plusieurs variables Licence 1ère année 2007/2008 Nicolas Prioux Université de Marne-la-Vallée Table des matières 1 Notions de géométrie dans l espace et fonctions à deux variables........

Plus en détail

Température corporelle d un castor (une petite introduction aux séries temporelles)

Température corporelle d un castor (une petite introduction aux séries temporelles) Température corporelle d un castor (une petite introduction aux séries temporelles) GMMA 106 GMMA 106 2014 2015 1 / 32 Cas d étude Temperature (C) 37.0 37.5 38.0 0 20 40 60 80 100 Figure 1: Temperature

Plus en détail

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures) CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un

Plus en détail

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p. STATISTIQUE THÉORIQUE ET APPLIQUÉE Tome 2 Inférence statistique à une et à deux dimensions Pierre Dagnelie TABLE DES MATIÈRES Bruxelles, De Boeck, 2011, 736 p. ISBN 978-2-8041-6336-5 De Boeck Services,

Plus en détail

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI 1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage

Plus en détail

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats Pierre Dagnelie TABLE DES MATIÈRES 2012 Presses agronomiques de Gembloux pressesagro.gembloux@ulg.ac.be www.pressesagro.be

Plus en détail

3 Approximation de solutions d équations

3 Approximation de solutions d équations 3 Approximation de solutions d équations Une équation scalaire a la forme générale f(x) =0où f est une fonction de IR dans IR. Un système de n équations à n inconnues peut aussi se mettre sous une telle

Plus en détail

MODELES DE DUREE DE VIE

MODELES DE DUREE DE VIE MODELES DE DUREE DE VIE Cours 1 : Introduction I- Contexte et définitions II- Les données III- Caractéristiques d intérêt IV- Evènements non renouvelables/renouvelables (unique/répété) I- Contexte et définitions

Plus en détail

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier Statistiques Appliquées à l Expérimentation en Sciences Humaines Christophe Lalanne, Sébastien Georges, Christophe Pallier Table des matières 1 Méthodologie expérimentale et recueil des données 6 1.1 Introduction.......................................

Plus en détail

4.2 Unités d enseignement du M1

4.2 Unités d enseignement du M1 88 CHAPITRE 4. DESCRIPTION DES UNITÉS D ENSEIGNEMENT 4.2 Unités d enseignement du M1 Tous les cours sont de 6 ECTS. Modélisation, optimisation et complexité des algorithmes (code RCP106) Objectif : Présenter

Plus en détail

Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux 4 2013-2014

Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux 4 2013-2014 Tests du χ 2 Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux 4 2013-2014 A. Lourme http://alexandrelourme.free.fr Outline

Plus en détail

Développement de lois et de structures de réglages destinées à la téléopération avec retour d effort

Développement de lois et de structures de réglages destinées à la téléopération avec retour d effort Développement de lois et de structures de réglages destinées à la téléopération avec retour d effort Thomas Delwiche, Laurent Catoire et Michel Kinnaert Faculté des Sciences Appliquées Service d Automatique

Plus en détail

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE UE4 : Biostatistiques Chapitre 3 : Principe des tests statistiques d hypothèse José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Introduction

Plus en détail

TSTI 2D CH X : Exemples de lois à densité 1

TSTI 2D CH X : Exemples de lois à densité 1 TSTI 2D CH X : Exemples de lois à densité I Loi uniforme sur ab ; ) Introduction Dans cette activité, on s intéresse à la modélisation du tirage au hasard d un nombre réel de l intervalle [0 ;], chacun

Plus en détail

Exercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015

Exercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015 Exercices M1 SES 214-215 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 215 Les exemples numériques présentés dans ce document d exercices ont été traités sur le logiciel R, téléchargeable par

Plus en détail

Développements limités, équivalents et calculs de limites

Développements limités, équivalents et calculs de limites Développements ités, équivalents et calculs de ites Eercice. Déterminer le développement ité en 0 à l ordre n des fonctions suivantes :. f() e (+) 3 n. g() sin() +ln(+) n 3 3. h() e sh() n 4. i() sin(

Plus en détail

FORMULAIRE DE STATISTIQUES

FORMULAIRE DE STATISTIQUES FORMULAIRE DE STATISTIQUES I. STATISTIQUES DESCRIPTIVES Moyenne arithmétique Remarque: population: m xμ; échantillon: Mx 1 Somme des carrés des écarts "# FR MOYENNE(série) MOYENNE(série) NL GEMIDDELDE(série)

Plus en détail

données en connaissance et en actions?

données en connaissance et en actions? 1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)

Plus en détail

Résolution de systèmes linéaires par des méthodes directes

Résolution de systèmes linéaires par des méthodes directes Résolution de systèmes linéaires par des méthodes directes J. Erhel Janvier 2014 1 Inverse d une matrice carrée et systèmes linéaires Ce paragraphe a pour objet les matrices carrées et les systèmes linéaires.

Plus en détail

Limitations of the Playstation 3 for High Performance Cluster Computing

Limitations of the Playstation 3 for High Performance Cluster Computing Introduction Plan Limitations of the Playstation 3 for High Performance Cluster Computing July 2007 Introduction Plan Introduction Intérêts de la PS3 : rapide et puissante bon marché L utiliser pour faire

Plus en détail

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications A. Optimisation sans contrainte.... Généralités.... Condition nécessaire et condition suffisante

Plus en détail

Le théorème de Thalès et sa réciproque

Le théorème de Thalès et sa réciproque Le théorème de Thalès et sa réciproque I) Agrandissement et Réduction d une figure 1) Définition : Lorsque toutes les longueurs d une figure F sont multipliées par un même nombre k on obtient une autre

Plus en détail

Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques.

Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques. 14-3- 214 J.F.C. p. 1 I Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques. Exercice 1 Densité de probabilité. F { ln x si x ], 1] UN OVNI... On pose x R,

Plus en détail

Une introduction. Lionel RIOU FRANÇA. Septembre 2008

Une introduction. Lionel RIOU FRANÇA. Septembre 2008 Une introduction INSERM U669 Septembre 2008 Sommaire 1 Effets Fixes Effets Aléatoires 2 Analyse Classique Effets aléatoires Efficacité homogène Efficacité hétérogène 3 Estimation du modèle Inférence 4

Plus en détail

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour francour@unice.fr Une grande partie des illustrations viennent

Plus en détail

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé A. P. M. E. P. Exercice 1 5 points 1. Réponse d. : 1 e Le coefficient directeur de la tangente est négatif et n est manifestement pas 2e

Plus en détail

Correction du bac blanc CFE Mercatique

Correction du bac blanc CFE Mercatique Correction du bac blanc CFE Mercatique Exercice 1 (4,5 points) Le tableau suivant donne l évolution du nombre de bénéficiaires de minima sociaux en milliers : Année 2002 2003 2004 2005 2006 2007 2008 2009

Plus en détail

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

La survie nette actuelle à long terme Qualités de sept méthodes d estimation La survie nette actuelle à long terme Qualités de sept méthodes d estimation PAR Alireza MOGHADDAM TUTEUR : Guy HÉDELIN Laboratoire d Épidémiologie et de Santé publique, EA 80 Faculté de Médecine de Strasbourg

Plus en détail

Limites finies en un point

Limites finies en un point 8 Limites finies en un point Pour ce chapitre, sauf précision contraire, I désigne une partie non vide de R et f une fonction définie sur I et à valeurs réelles ou complees. Là encore, les fonctions usuelles,

Plus en détail

NON-LINEARITE ET RESEAUX NEURONAUX

NON-LINEARITE ET RESEAUX NEURONAUX NON-LINEARITE ET RESEAUX NEURONAUX Vêlayoudom MARIMOUTOU Laboratoire d Analyse et de Recherche Economiques Université de Bordeaux IV Avenue. Leon Duguit, 33608 PESSAC, France tel. 05 56 84 85 77 e-mail

Plus en détail

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique»

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Tests de comparaison de moyennes Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Test de Z ou de l écart réduit Le test de Z : comparer des paramètres en testant leurs différences

Plus en détail

Statistiques Descriptives à une dimension

Statistiques Descriptives à une dimension I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des

Plus en détail

PROBABILITES ET STATISTIQUE I&II

PROBABILITES ET STATISTIQUE I&II PROBABILITES ET STATISTIQUE I&II TABLE DES MATIERES CHAPITRE I - COMBINATOIRE ELEMENTAIRE I.1. Rappel des notations de la théorie des ensemble I.1.a. Ensembles et sous-ensembles I.1.b. Diagrammes (dits

Plus en détail

Incertitudes expérimentales

Incertitudes expérimentales Incertitudes expérimentales F.-X. Bally et J.-M. Berroir Février 2013 Table des matières Introduction 4 1 Erreur et incertitude 4 1.1 Erreurs............................................. 4 1.1.1 Définition

Plus en détail

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre : Terminale STSS 2 012 2 013 Pourcentages Synthèse 1) Définition : Calculer t % d'un nombre, c'est multiplier ce nombre par t 100. 2) Exemples de calcul : a) Calcul d un pourcentage : Un article coûtant

Plus en détail

3 ème 2 DÉVELOPPEMENT FACTORISATIONS ET IDENTITÉS REMARQUABLES 1/5 1 - Développements

3 ème 2 DÉVELOPPEMENT FACTORISATIONS ET IDENTITÉS REMARQUABLES 1/5 1 - Développements 3 ème 2 DÉVELOPPEMENT FACTORISATIONS ET IDENTITÉS REMARQUABLES 1/5 1 - Développements Développer une expression consiste à transformer un produit en une somme Qu est-ce qu une somme? Qu est-ce qu un produit?

Plus en détail

SAS ENTERPRISE MINER POUR L'ACTUAIRE

SAS ENTERPRISE MINER POUR L'ACTUAIRE SAS ENTERPRISE MINER POUR L'ACTUAIRE Conférence de l Association des Actuaires I.A.R.D. 07 JUIN 2013 Sylvain Tremblay Spécialiste en formation statistique SAS Canada AGENDA Survol d Enterprise Miner de

Plus en détail

Simulation de variables aléatoires

Simulation de variables aléatoires Chapter 1 Simulation de variables aléatoires Références: [F] Fishman, A first course in Monte Carlo, chap 3. [B] Bouleau, Probabilités de l ingénieur, chap 4. [R] Rubinstein, Simulation and Monte Carlo

Plus en détail

Table des matières. I Mise à niveau 11. Préface

Table des matières. I Mise à niveau 11. Préface Table des matières Préface v I Mise à niveau 11 1 Bases du calcul commercial 13 1.1 Alphabet grec...................................... 13 1.2 Symboles mathématiques............................... 14 1.3

Plus en détail

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3

Plus en détail

ABS 2RM : quels effets observés sur la fréquence accident?

ABS 2RM : quels effets observés sur la fréquence accident? ABS 2RM : quels effets observés sur la fréquence accident? Bertrand Nelva-Pasqual, Mutuelle des Motards Journées Scientifiques "Deux-roues motorisés" 15 et 16 octobre 2013, Lyon-Bron Groupe d Échanges

Plus en détail

PROGRAMME (Susceptible de modifications)

PROGRAMME (Susceptible de modifications) Page 1 sur 8 PROGRAMME (Susceptible de modifications) Partie 1 : Méthodes des revues systématiques Mercredi 29 mai 2013 Introduction, présentation du cours et des participants Rappel des principes et des

Plus en détail

Construction d un cercle tangent à deux cercles donnés.

Construction d un cercle tangent à deux cercles donnés. Préparation au CAPES Strasbourg, octobre 2008 Construction d un cercle tangent à deux cercles donnés. Le problème posé : On se donne deux cercles C et C de centres O et O distincts et de rayons R et R

Plus en détail

Mémoire d Actuariat Tarification de la branche d assurance des accidents du travail Aymeric Souleau aymeric.souleau@axa.com 3 Septembre 2010 Plan 1 Introduction Les accidents du travail L assurance des

Plus en détail

Chap 4. La fonction exponentielle Terminale S. Lemme : Si est une fonction dérivable sur R telle que : = et 0! = 1 alors ne s annule pas sur R.

Chap 4. La fonction exponentielle Terminale S. Lemme : Si est une fonction dérivable sur R telle que : = et 0! = 1 alors ne s annule pas sur R. Lemme : Si est une fonction dérivable sur R telle que : = et 0! = 1 alors ne s annule pas sur R. Démonstration : Soit la fonction %:& %&!= &!, elle est dérivable sur R et & R, %. &!= &! = &! = %&! gaelle.buffet@ac-montpellier.fr

Plus en détail

La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites

La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites La problématique des tests Cours V 7 mars 8 Test d hypothèses [Section 6.1] Soit un modèle statistique P θ ; θ Θ} et des hypothèses H : θ Θ H 1 : θ Θ 1 = Θ \ Θ Un test (pur) est une statistique à valeur

Plus en détail

Complément d information concernant la fiche de concordance

Complément d information concernant la fiche de concordance Sommaire SAMEDI 0 DÉCEMBRE 20 Vous trouverez dans ce dossier les documents correspondants à ce que nous allons travailler aujourd hui : La fiche de concordance pour le DAEU ; Page 2 Un rappel de cours

Plus en détail

Liste des notes techniques... xxi Liste des encadrés... xxiii Préface à l édition internationale... xxv Préface à l édition francophone...

Liste des notes techniques... xxi Liste des encadrés... xxiii Préface à l édition internationale... xxv Préface à l édition francophone... Liste des notes techniques.................... xxi Liste des encadrés....................... xxiii Préface à l édition internationale.................. xxv Préface à l édition francophone..................

Plus en détail

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1 La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1 La licence Mathématiques et Economie-MASS de l Université des Sciences Sociales de Toulouse propose sur les trois

Plus en détail

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

Baccalauréat ES/L Amérique du Sud 21 novembre 2013 Baccalauréat ES/L Amérique du Sud 21 novembre 2013 A. P. M. E. P. EXERCICE 1 Commun à tous les candidats 5 points Une entreprise informatique produit et vend des clés USB. La vente de ces clés est réalisée

Plus en détail

Probabilités sur un univers fini

Probabilités sur un univers fini [http://mp.cpgedupuydelome.fr] édité le 7 août 204 Enoncés Probabilités sur un univers fini Evènements et langage ensembliste A quelle condition sur (a, b, c, d) ]0, [ 4 existe-t-il une probabilité P sur

Plus en détail

Le modèle de régression linéaire

Le modèle de régression linéaire Chapitre 2 Le modèle de régression linéaire 2.1 Introduction L économétrie traite de la construction de modèles. Le premier point de l analyse consiste à se poser la question : «Quel est le modèle?». Le

Plus en détail

TP 7 : oscillateur de torsion

TP 7 : oscillateur de torsion TP 7 : oscillateur de torsion Objectif : étude des oscillations libres et forcées d un pendule de torsion 1 Principe général 1.1 Définition Un pendule de torsion est constitué par un fil large (métallique)

Plus en détail

Étude des Corrélations entre Paramètres Statiques et Dynamiques des Convertisseurs Analogique-Numérique en vue d optimiser leur Flot de Test

Étude des Corrélations entre Paramètres Statiques et Dynamiques des Convertisseurs Analogique-Numérique en vue d optimiser leur Flot de Test 11 juillet 2003 Étude des Corrélations entre Paramètres Statiques et Dynamiques des Convertisseurs Analogique-Numérique en vue d optimiser leur Flot de Test Mariane Comte Plan 2 Introduction et objectif

Plus en détail

Fonctions de deux variables. Mai 2011

Fonctions de deux variables. Mai 2011 Fonctions de deux variables Dédou Mai 2011 D une à deux variables Les fonctions modèlisent de l information dépendant d un paramètre. On a aussi besoin de modéliser de l information dépendant de plusieurs

Plus en détail

Étude de cas Assurance (d après une étude de Philippe Périé, CISIA)

Étude de cas Assurance (d après une étude de Philippe Périé, CISIA) Étude de cas Assurance (d après une étude de Philippe Périé, CISIA) I.1.Les données L échantillon est constitué de 1106 assurés Belges observés en 1992 et répartis en 2 groupes. - les assurés qui n ont

Plus en détail

Quantification Scalaire et Prédictive

Quantification Scalaire et Prédictive Quantification Scalaire et Prédictive Marco Cagnazzo Département Traitement du Signal et des Images TELECOM ParisTech 7 Décembre 2012 M. Cagnazzo Quantification Scalaire et Prédictive 1/64 Plan Introduction

Plus en détail

Variables Aléatoires. Chapitre 2

Variables Aléatoires. Chapitre 2 Chapitre 2 Variables Aléatoires Après avoir réalisé une expérience, on ne s intéresse bien souvent à une certaine fonction du résultat et non au résultat en lui-même. Lorsqu on regarde une portion d ADN,

Plus en détail

Calcul élémentaire des probabilités

Calcul élémentaire des probabilités Myriam Maumy-Bertrand 1 et Thomas Delzant 1 1 IRMA, Université Louis Pasteur Strasbourg, France Licence 1ère Année 16-02-2006 Sommaire La loi de Poisson. Définition. Exemple. 1 La loi de Poisson. 2 3 4

Plus en détail

Projet Etienne Marceau Méthodes statistiques en assurance non vie

Projet Etienne Marceau Méthodes statistiques en assurance non vie Trinôme : Carine Sauser, Mélanie Groisne, Xavier Milhaud Projet Etienne Marceau Méthodes statistiques en assurance non vie Méthodes statistiques pour la finance et l assurance ISFA - Décembre 2007 Table

Plus en détail

Essais précoces non comparatifs : principes et calcul du nombre de sujets nécessaire

Essais précoces non comparatifs : principes et calcul du nombre de sujets nécessaire Essais précoces non comparatifs : principes et calcul du nombre de sujets nécessaire Sylvie CHABAUD Direction de la Recherche Clinique et de l Innovation : Centre Léon Bérard - Lyon Unité de Biostatistique

Plus en détail

Exercice 3 (5 points) A(x) = 1-e -0039' -0 156e- 0,039x A '() -'-,..--,-,--,------:-- X = (l_e-0,039x)2

Exercice 3 (5 points) A(x) = 1-e -0039' -0 156e- 0,039x A '() -'-,..--,-,--,------:-- X = (l_e-0,039x)2 Les parties A et B sont indépendantes. Partie A Exercice 3 (5 points) Commun à tous les candidats On considère la fonction A définie sur l'intervalle [1 ; + 00 [ par A(x) = 1-e -0039' ' x 1. Calculer la

Plus en détail

Quelques contrôle de Première S

Quelques contrôle de Première S Quelques contrôle de Première S Gilles Auriol auriolg@free.fr http ://auriolg.free.fr Voici l énoncé de 7 devoirs de Première S, intégralement corrigés. Malgré tout les devoirs et 5 nécessitent l usage

Plus en détail

Economie de l incertain et de l information Partie 1 : Décision en incertain probabilisé Chapitre 1 : Introduction à l incertitude et théorie de

Economie de l incertain et de l information Partie 1 : Décision en incertain probabilisé Chapitre 1 : Introduction à l incertitude et théorie de Economie de l incertain et de l information Partie 1 : Décision en incertain probabilisé Chapitre 1 : Introduction à l incertitude et théorie de l espérance d utilité Olivier Bos olivier.bos@u-paris2.fr

Plus en détail

2.4 Représentation graphique, tableau de Karnaugh

2.4 Représentation graphique, tableau de Karnaugh 2 Fonctions binaires 45 2.4 Représentation graphique, tableau de Karnaugh On peut définir complètement une fonction binaire en dressant son tableau de Karnaugh, table de vérité à 2 n cases pour n variables

Plus en détail

LA PHYSIQUE DES MATERIAUX. Chapitre 1 LES RESEAUX DIRECT ET RECIPROQUE

LA PHYSIQUE DES MATERIAUX. Chapitre 1 LES RESEAUX DIRECT ET RECIPROQUE LA PHYSIQUE DES MATERIAUX Chapitre 1 LES RESEAUX DIRECT ET RECIPROQUE Pr. A. Belayachi Université Mohammed V Agdal Faculté des Sciences Rabat Département de Physique - L.P.M belayach@fsr.ac.ma 1 1.Le réseau

Plus en détail

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre. Université de Nantes Année 2013-2014 L3 Maths-Eco Feuille 6 : Tests Exercice 1 On cherche à connaître la température d ébullition µ, en degrés Celsius, d un certain liquide. On effectue 16 expériences

Plus en détail

Apprentissage non paramétrique en régression

Apprentissage non paramétrique en régression 1 Apprentissage non paramétrique en régression Apprentissage non paramétrique en régression Résumé Différentes méthodes d estimation non paramétriques en régression sont présentées. Tout d abord les plus

Plus en détail