Régression logistique
|
|
- Antoinette Desmarais
- il y a 7 ans
- Total affichages :
Transcription
1 Régression logistique Erik-André Sauleau - Nicolas Meyer erik-andre.sauleau@medecine.u-strasbg.fr - nmeyer@unistra.fr Laboratoire de Biostatistiques - Faculté de Médecine Pôle de Santé Publique CHU - STRASBOURG Mars 2009
2 Plan 1 Introduction 2 Rappels sur risques relatifs et odds-ratios 3 Fonction et modèle logistiques 4 Codage des variables 5 Estimations et adéquation 6 Modélisation 7 Exemple - TP
3 Où en sommes nous? 1 Introduction Le programme Le cadre général Intérêts de la régression logistique 2 Rappels sur risques relatifs et odds-ratios 3 Fonction et modèle logistiques 4 Codage des variables 5 Estimations et adéquation 6 Modélisation
4 Le programme Compétence 4 : régression logistique 1 Savoir écrire les modèles théoriques et expérimental, comprendre le lien avec la régression linéaire multiple et la relation entre coefficient de régression et odds-ratio 2 Connaître l importance du codage des variables explicatives et la nécessité de recodage pour certaines variables (problème de log-linéarité) 3 Savoir identifier les colinéarités entres deux variables, en connaître les conséquences et vérifier les conditions d application du modèle 4 Maîtriser les techniques de sélection des variables du modèle, en particulier les techniques pas à pas dans le cas des modèles à visée prédictive 5 Savoir interpréter les résultats de l analyse en termes d odds-ratio
5 Le cadre général Définition de la régression logistique Modèle statistique permettant d étudier les relations entre 1 Un ensemble de variables qualitatives X i 2 Une variable qualitative Y Modèle linéaire généralisé utilisant une fonction logistique comme fonction de lien Extensions Variable Y multinomiale (régression polychotomique ordonnée ou non) Des X i quantitatives Outil majeur en épidémiologie
6 Le cadre général Un exemple de problème... La rechute d un cancer est-elle liée au taux d expression d un gène? 1 une variable qualitative Y : rechute oui / non 2 une variable quantitative X : dosage 3 n-échantillon Prédire Y connaissant X Régression linéaire simple : y i = α + βx i + ε i
7 Le cadre général... et sa résolution Les données
8 Le cadre général... et sa résolution La régression linéaire Y = 0,22 + 0,44X
9 Le cadre général... et sa résolution La variable X en 10 classes
10 Le cadre général... et sa résolution Les proportions de rechute par classe de X
11 Le cadre général... et sa résolution L estimation des proportions par régression logistique
12 Intérêts de la régression logistique Une interprétation cohérente... Modéliser les liens entre plusieurs variables explicatives X i qualitatives (ou quantitatives) et une variable résultat qualitative Expression des probabilités sur une échelle entre 0 et 1 Quantification du risque : odds-ratio
13 Où en sommes nous? 1 Introduction 2 Rappels sur risques relatifs et odds-ratios Les cohortes Les cas-témoins 3 Fonction et modèle logistiques 4 Codage des variables 5 Estimations et adéquation 6 Modélisation
14 Les cohortes Les données disponibles Malades Non malades Total Exposés a b a + b Non exposés c d c + d Total a + c b + d N = a + b + c + d
15 Les cohortes Les risques Malades Non malades Exposés a b Non exposés c d Risque d être malade quand on est exposé : P 1 = P r(m + E + ) = a a+b Risque d être malade quand on n est pas exposé : P 0 = P r(m + E ) = c c+d Risque relatif : RR = P 1 P 0 = a(c+d) c(a+b)
16 Les cohortes L intervalle de confiance du risque relatif Malades Non malades Exposés a b Non exposés c d Pour une meilleure convergence asymptotique vers la loi normale, on transforme le RR en son logarithme Variance de l estimation : V[ln (ˆRR)] = 1 P 1 (a+b)p P 0 (c+d)p 0 = b a(a+b) + d c(c+d) Intervalle de confiance : exp Test du RR à 1 [ln (ˆRR) ± z α/2 V[ln (ˆRR)] ]
17 Les cohortes L odds-ratio La cote de z : Malades Non malades Exposés a b Non exposés c d z 1 z Un rapport de cotes : z 1 z u 1 u P Odds-ratio : 1 1 P 1 / P 0 1 P 0 1 P 1 = b a+b et P 1 1 P 1 1 P 0 = d c+d et P 0 1 P 0 Odds-ratio : OR = ad bc = a b = c d
18 Les cohortes L intervalle de confiance de l odds ratio Malades Non malades Exposés a b Non exposés c d Pour une meilleure convergence asymptotique vers la loi normale, on transforme l OR en son logarithme Deux méthodes ] 1 Woolf : exp [ln (ˆOR) ± z α/2 a + 1 b + 1 c + 1 d [ { }] Miettinen : exp ln (ˆOR) 1 ± z α/2 χ 2 Test de l OR à 1
19 Les cas-témoins L odds-ratio dans les cas-témoins Malades Non malades Exposés a b Non exposés c d Risque d être exposé quand on est malade : R 1 = P r(e + M + ) = a a+c Risque d être exposé quand on n est pas malade : R 0 = P r(e + M ) = b b+d R Odds-ratio : 1 1 R 1 / R 0 1 R 0 1 R 1 = c a+c et R 1 1 R 1 1 R 0 = d b+d et P 0 1 R 0 Odds-ratio : OR = ad bc = a c = b d
20 Les cas-témoins Une même expression de l odds-ratio Même estimation et même intervalle de confiance pour l odds-ratio dans les cohortes et les cas-témoins L odds-ratio est plus employé que le risque relatif Quand la maladie est rare, OR RR
21 Où en sommes nous? 1 Introduction 2 Rappels sur risques relatifs et odds-ratios 3 Fonction et modèle logistiques Un préalable : la fonction logistique Le modèle logistique 4 Codage des variables 5 Estimations et adéquation 6 Modélisation
22 Un préalable : la fonction logistique Définition Fonction logistique Description Strictement croissante, monotone Varie de 0 à 1 pour x allant de à + Courbe sigmoïde, point d inflexion correspondant à f(x) = 1/2 Symétrique autour du point d inflexion Formalisation 1 f(x) = 1+e (α+βx) α est un paramètre de position β est un paramètre de forme
23 Un préalable : la fonction logistique Des exemples de fonctions logistiques
24 Un préalable : la fonction logistique Des exemples de fonctions logistiques
25 Un préalable : la fonction logistique Des exemples de fonctions logistiques
26 Un préalable : la fonction logistique Des exemples de fonctions logistiques
27 Le modèle logistique Définition Modèle logistique = régression logistique Pour un sujet j, Y j suit une loi de Bernoulli P r(y = 1 X) = f(x) = 1 1+e (α+βx) = eα+βx 1+e α+βx Le miracle du logit... Le miracle de l odds-ratio...
28 Le modèle logistique Retour à une cohorte Malades (y = 1) Non malades (y = 0) Exposés (x = 1) a b Non exposés (x = 0) c d Probabilité d être malade quand on est exposé : P r(m + E + 1 ) = P 1 = P r(y = 1 x = 1) = 1+e (α+β) Probabilité d être malade quand on n est pas exposé : P r(m + E ) = P 0 = P r(y = 1 x = 0) = 1 1+e α Probabilité de ne pas être malade quand on est exposé : P r(m E + ) = 1 P 1 = e (α+β) 1+e (α+β) Probabilité de ne pas être malade quand on n est pas exposé : P r(m E ) = 1 P 0 = e α 1+e α
29 Le modèle logistique Retour à une cohorte Malades (y = 1) Non malades (y = 0) Exposés (x = 1) a b Non exposés (x = 0) c d OR = P 1 1 P 1 / P 0 1 P 0 OR = P r(m + E + ) P r(m E ) P r(m + E ) P r(m E + ) OR = 1 e α 1+e (α+β) 1+e α = e α 1 e (α+β) 1+e α e (α+β) 1+e (α+β) Le miracle de l odds-ratio = e α+α+β = e β OR = e β ou ln (OR) = β
30 Le modèle logistique Le passage au logit ( ) Définition : logit(z) = ln z 1 z Appliqué à la fonction logistique 1 1 z = 1+e (α+βx) 2 1 z = e (α+βx) 1+e (α+βx) 3 1 z/(1 z) = ( ) e (α+βx) 4 z ln 1 z = ln (1) ln ( e (α+βx)) = α + βx Le deuxième miracle logit(p r(y = 1 X)) = α + βx
31 Le modèle logistique Le passage au logit Lien avec la régression linéaire simple logit(p r(y = 1 X)) = α + βx vs E(Y X) = α + βx Modéliser E(Y) ou Pr(Y=1) c est pareil! E(Y ) = 1 P r(y = 1) + 0 P r(y = 0) = P r(y = 1) Fonction linéaire des variables avec le logit Les erreurs sont binomiales
32 Où en sommes nous? 1 Introduction 2 Rappels sur risques relatifs et odds-ratios 3 Fonction et modèle logistiques 4 Codage des variables 5 Estimations et adéquation 6 Modélisation 7 Exemple - TP
33 Notre cohorte Malades (y = 1) Non malades (y = 0) Exposés (x = x 1 ) a b Non exposés (x = x 0 ) c d Probabilité d être malade quand on est exposé : P r(m + E + 1 ) = P 1 = P r(y = 1 x = x 1 ) = 1+e (α+βx 1 ) Probabilité d être malade quand on n est pas exposé : P r(m + E 1 ) = P 0 = P r(y = 1 x = x 0 ) = 1+e (α+βx 0 ) Probabilité de ne pas être malade quand on est exposé : P r(m E + ) = 1 P 1 = e (α+βx 1 ) 1+e (α+βx 1 ) Probabilité de ne pas être malade quand on n est pas exposé : P r(m E ) = 1 P 0 = e (α+βx 0 ) 1+e (α+βx 0 )
34 Notre cohorte Malades (y = 1) Non malades (y = 0) Exposés (x = x 1 ) a b Non exposés (x = x 0 ) c d OR = P 1 1 P 1 / P 0 1 P 0 OR = P r(m + E + ) P r(m E ) P r(m + E ) P r(m E + ) OR = 1 1+e (α+βx 1 ) e (α+βx 0 ) 1+e (α+βx 0 ) 1 1+e (α+βx 0 ) e (α+βx 1 ) 1+e (α+βx 1 ) = e (α+βx0) e (α+βx 1 ) = e α βx 0+α+βx 1 OR = e β(x 1 x 0 ) Si x 0 = 0 et x 1 = 1, on retrouve bien OR = e β
35 Notre cohorte Malades (y = 1) Non malades (y = 0) Exposés (x = x 1 ) a b Non exposés (x = x 0 ) c d OR = P 1 1 P 1 / P 0 1 P 0 OR = e β(x 1 x 0 ) logit(p 1 ) logit(p 0 ) = β(x 1 x 0 )
36 Rôle majeur du codage OR = e β(x 1 x 0 ) { x0 = 0 Si alors OR x 1 = 1 1 = e β { x0 = 1 Si alors OR x 1 = 0 2 = e β { x0 = 1 Si alors OR x 1 = 1 3 = e 2β { x0 = 0 Si alors OR x 1 = 2 4 = e 2β OR 4 = OR 3 = (1/OR 2 ) 2 = (OR 1 ) 2
37 Exposition multinomiale Modèle logistique logit(p r(y = 1 X)) = α + βx Exposition Malades (y = 1) Non malades (y = 0) Forte (x = 2) a b Moyenne (x = 1) c d Faible (x = 0) e f Probabilité d être malade quand on est fortement exposé : P r(m + x = 2) = P 2 = 1 1+e (α+2β) Probabilité d être malade quand on est moyennement exposé : P r(m + x = 1) = P 1 = 1 1+e (α+β) Probabilité d être malade quand on est faiblement exposé : P r(m + x = 0) = P 0 = 1 1+e α
38 Exposition multinomiale Exposition Malades (y = 1) Non malades (y = 0) Forte (x = 2) a b Moyenne (x = 1) c d Faible (x = 0) e f OR 2 = P 2 1 P 2 / P 0 1 P 0 = e 2β OR 1 = P 1 1 P 1 / P 0 1 P 0 = e β = (OR 1 ) 2 ( ) OR = P 2 1 P 2 / P 1 1 P 1 = e β Choix d une catégorie de référence Hypothèse de progression de l effet de l exposition
39 Un a parte sur l exposition Typologie de variables Quantitative = mesurable sur une échelle 1 Continue = valeurs réelles (Ex : Age) 2 Discrète = valeurs isolées (Ex : Nombre d enfants) Notion de continuité relative à l échelle 10, 13, 13, 15 vs 10, 10, 10, 15 Qualitative = non mesurable sur une échelle 1 Sans ordre, catégorielle (Ex : Sexe) 2 Ordonnée, semi-quantitative (Ex : Stade clinique) Transformation : quantitatif en semi-quantitatif <10, 10-14, >15
40 Un a parte sur l exposition Les mesures d exposition Quantitative Dosimétrie, mesures au poste de travail Durée d exposition Qualitative Exposé - non exposé Catégorie socioprofessionnelle Semi-quantitative Exposition forte - moyenne - faible Exposition <10 ans, 10-19, >20 ans
41 Un a parte sur l exposition Finalement trois cas Variables Exposition Qualitative Semiqualitative Quantitative Catégorielle Cas 1 Ordonnée Cas 2 Continue Cas 3 Discrète Cas 3
42 Retour sur le codage des variables Cas 1 : Variable catégorielle (Ex : CSP) 1 Hypothèse 0, 1,..., trop forte 2 Variables indicatrices et codage dit partiel X X 1 X 2 X 3 c c c c On a remplacé 1 variable à k modalités par k 1 variables un nouvel a parte sur le multivarié
43 Une première extension du modèle Le cas multivarié Modèle logistique : modéliser les liens entre plusieurs variables explicatives X i qualitatives (ou quantitatives) et une variable résultat qualitative 1 P r(y = 1 (X 1,..., X I )) = ou logit(p r(y = 1 X) = α + βx 1+e (α+ I i β i x i ) β i est le logarithme de l odds-ratio associé à une augmentation d une unité de la variable X i, toutes les autres variables étant fixées OR ajusté
44 Retour sur le codage des variables catégorielles (Cas 1) X X 1 X 2 X 3 c c c c logit(p r(y = 1 X) = α + β 1 x 1 + β 2 x 2 + β 3 x 3 logit(p r(y = 1 x = c 0 ) = α logit(p r(y = 1 x = c 1 ) = α + β 1 logit(p r(y = 1 x = c 2 ) = α + β 2 logit(p r(y = 1 x = c 3 ) = α + β 3 Les β i sont les logarithmes des odds-ratios associés aux différentes catégories par rapport à la catégorie de référence logit(p r(y = 1 x = c i ) logit(p r(y = 1 x = c 0 ) = β i
45 Un codage alternatif : le codage marginal X X 1 X 2 X 3 c c c c
46 Un codage alternatif : le codage marginal X X 1 X 2 X 3 c c c c logit(p r(y = 1 X) = α + β 1 x 1 + β 2 x 2 + β 3 x 3 logit(p r(y = 1 x = c 0 ) = α β 1 β 2 β 3 = α + β 0 logit(p r(y = 1 x = c 1 ) = α + β 1 logit(p r(y = 1 x = c 2 ) = α + β 2 logit(p r(y = 1 x = c 3 ) = α + β 3 Les β i sont les logarithmes des odds-ratios associés aux différentes catégories par rapport à une référence moyenne représentée par β 0 logit(p r(y = 1 x = c i )) logit(p r(y = 1 x = c 0 )) = β i β 0 Quel sens?
47 La prise en compte d interaction Interaction entre X 1 et X 2 mesurée par X 1 X 2 logit(p r(y = 1 (X 1,X 2 )) = α + β 1 x 1 + β 2 x 2 + β 3 x 1 x 2 X 1 X 2 OR e β e β 2+β 3 OR e β 1 e β 1+β 3 Absence d interaction si β 3 = 0
48 Le codage des variables ordonnées (Cas 2) Différentes possibilités Perte de la notion d ordre Variables indicatrices et codage partiel Codage marginal Codage Helmert ou codage orthogonal Attribuer des scores 1, 2, 3,... et traiter comme une variable quantitative cas 3 A discuter au cas par cas (Ex : stades cliniques I, II et III)
49 Le codage des variables ordonnées (Cas 2) Contraste de Helmert X X 1 X 2 X 3 c c c c β 1 est l odds-ratio de c 1 par rapport à c 0 β 2 est l odds-ratio de c 2 par rapport à la moyenne de c 0 et c 1 β 3 est l odds-ratio de c 3 par rapport à la moyenne de c 0, c 1 et c 2
50 Le codage des variables ordonnées (Cas 2) Codage orthogonal ou contraste polynomial X X 1 X 2 X 3 c 0 = c 1 = c 2 = c 3 = Valeurs différentes selon les valeurs de X et leur espacement Permet de tester des tendances : le logit augmente-t-il proportionnellement aux valeurs de X? X 1 teste une tendance linéaire, X 2 une tendance quadratique,... A manipuler avec précautions
51 Les variables quantitatives (Cas 3) Que signifie le β dans OR = e β(x 1 x 0 )? 1 β est le logarithme de l odds-ratio associé à une augmentation d une unité de la variable d exposition Une autre valeur peut avoir plus de sens : par exemple 10 β pour une augmentation de 10 mmol d un dosage et non d 1 mmol
52 Résumé du codage sur des exemples Age Trois formes... 1 Quantitative continue : 10, 12, 15, 15, 18, 21 2 Qualitative ordonnée : <15, <15, 15-19, 15-19, 15-19, >20 3 Qualitative catégorielle : c 0, c 0, c 1, c 1, c 1, c 2... et trois cas... 1 Quantitative continue : cas 3 2 Qualitative ordonnée : cas 2 ou cas 3 3 Qualitative catégorielle : cas 1
53 Résumé du codage sur des exemples Age Trois formes et trois cas mais quatre situations 1 Quantitative continue : e β est l OR associé à un vieillissement de 1 an, e 5β de 5 ans 2 Qualitative ordonnée et codage orthogonal ou Helmert : interprétation particulière 3 Qualitative ordonnée et choix de score (1, 2, 3) : e β est l OR associé à un vieillissement de 1 classe 4 Qualitative catégorielle et codage partiel ou marginal : e βi est l OR associé à la classe c i par rapport à une référence (une classe ou une moyenne)
54 Résumé du codage sur des exemples Nombre d enfants Une forme... 1 Quantitative discrète : 0, 1, 2, 3,..., >7... mais deux situations... 1 Quantitative discrète mais comme une continue : e β est l OR associé à un enfant de plus, e 2β est l OR associé à deux enfants de plus 2 Quantitative discrète mais codage orthogonal ou Helmert : interprétation particulière 3 Qualitative catégorielle et codage partiel ou marginal : pas beaucoup de sens
55 Résumé du codage sur des exemples Sexe Une forme, un cas et une situation 1 Qualitative catégorielle : s 0 ou s 1 e β est l OR associé au sexe 1 par rapport au sexe 0 Même situation que pour une variable quantitative discrète ou une qualitative ordonnée à deux valeurs (0 ou 1)
56 Résumé du codage sur des exemples Catégorie socioprofessionnelle Une forme, un cas et une situation éthiquement acceptables 1 Qualitative catégorielle : c 0, c 1, c 2,... Qualitative catégorielle et codage partiel : e β i est l OR associé à la classe c i par rapport à la classe de référence Qualitative catégorielle et codage marginal
57 Où en sommes nous? 1 Introduction 2 Rappels sur risques relatifs et odds-ratios 3 Fonction et modèle logistiques 4 Codage des variables 5 Estimations et adéquation Rappel sur la vraisemblance Estimations et tests Adéquation des modèles 6 Modélisation
58 Rappel sur la vraisemblance Rappel sur le maximum de vraisemblance Si on observe un échantillon, c est que c est celui qui avait la plus grande chance d être observé. C est donc celui qui a la plus grande vraisemblance. On cherche alors les valeurs des paramètres qui maximisent cette vraisemblance et on en déduit que les valeurs obtenues pour les paramètres sont les bonnes valeurs.
59 Estimations et tests Ce qu on a à estimer logit(p r(y = 1 X) = α + I 1 β ix i Les Y et X sont observés On cherche les valeurs de chaque β i On ne peut pas utiliser les moindres carrés estimateurs du maximum de vraisemblance
60 Estimations et tests Les estimateurs du maximum de vraisemblance Vraisemblance d une observation 1 Pour un sujet j malade, V j = P r(y = 1 X) = 1 1+e (α+ βx) 2 Pour un sujet j sain, V j = P r(y = 0 X) = e (α+ βx) Vraisemblance de l échantillon V = N 1 V j = 1 N sujets 2 N 1 sujets non malades Logvraisemblance de l échantillon Annulation des dérivées premières EMV Méthodes itératives 1+e (α+ βx) Estimation d une matrice de variance-covariance des paramètres intervalles de confiance N1 e (α+ βx) N 1+e (α+ βx)
61 Estimations et tests Exemple de calcul d estimateurs Malades Non malades Exposés a b Non exposés c d
62 Estimations et tests Exemple de calcul d estimateurs Exposés Non exposés ( Malades ) a 1 1+e (α+β) ( 1 1+e α ) c Non malades ( ) e (α+β) b 1+e (α+β) ( e α 1+e α ) d V = e b(α+β) e dα (1+e (α+β) ) a+b (1+e α ) c+d L = b(α+β) dα (a+b) ln ( 1 + e (α+β)) (c+d) ln (1 + e α )
63 Estimations et tests Exemple de calcul d estimateurs EMV L α = L β = 0 L = b(α+β) dα (a+b) ln ( 1 + e (α+β)) (c+d) ln (1 + e α ) { L β = b + (a + b) e (α+β) = 0 1+e (α+β) L α = b d + (a + b) e (α+β) + (c + d) e α = 0 1+e (α+β) 1+e α { e α = d 1+e α c+d e (α+β) = b 1+e (α+β) a+b { α = ln c d α + β = ln a b { α = ln c d β = ln ad bc
64 Estimations et tests Tests des paramètres Cas univarié Intérêt : OR = 1 β = 0 On a ˆβ et ˆσ β et donc un intervalle de confiance 1 β : ˆβ ± z α/2ˆσ β 2 OR : e ˆβ±z α/2 ˆσ β ˆβ Test de Wald : rejet de H 0 si ˆσ β > z α/2 Test du rapport des vraisemblances (modèles emboîtés) : 2(L 1 L 0 ) χ 2 1ddl 1 L 1 : logvraisemblance du modèle logit(p r(y = 1 X)) = α + β 2 L 0 : logvraisemblance du modèle logit(p r(y = 1 X)) = α Vraisemblances pénalisées (AIC)
65 Estimations et tests Tests des paramètres Premier cas multivarié Intérêt : OR i = 1 β i = 0 Test du rapport des vraisemblances : 2(L 1 L 0 ) χ 2 1ddl 1 L 1 : logvraisemblance d un modèle logit(p r(y = 1 X) = α + j =i β jx j + β i 2 L 0 : logvraisemblance du modèle logit(p r(y = 1 X) = α + j =i β jx j
66 Estimations et tests Tests des paramètres Second cas multivarié Intérêt : OR k = = OR k+p = 1 β k = = β k+p = 0 Test du rapport des vraisemblances : 2(L 1 L 0 ) χ 2 pddl 1 L 1 : logvraisemblance d un modèle logit(p r(y = 1 X) = α + j / (k,,k+p) β jx j + l=k+p 2 L 0 : logvraisemblance du modèle logit(p r(y = 1 X) = α + j / (k,,k+p) β jx j Utile pour une variable catégorielle transformée en plusieurs variables indicatrices l=k β l x l
67 Estimations et tests Exemple de tests Les données On étudie la relation entre l âge et le risque d infection par un virus sur 356 sujets Age N Séropositifs Fréquence
68 Estimations et tests Exemple de tests Codage de l âge Age Score Codage partiel Score
69 Estimations et tests Exemple de tests Les tests de vraisemblance Modèle sans âge logit(p r(y = 1 age) = α : L 0 = 172,2 Modèle avec âge 0,..., 5 logit(p r(y = 1 age) = α + β age : L 1 = 168,7 Modèle avec âge en variables indicatrices logit(p r(y = 1 age) = α + β 1 x 1 + β 5 x 5 : L 2 = 166,9 Comparaisons 2(L 2 L 0 ) = 10,4 χ 2 5ddl, p = 0,64 2(L 1 L 0 ) = 6,9 χ 2 1ddl, p < 0,01 2(L 2 L 1 ) = 3,5 χ 2 4ddl, p = 0,30 Quelle conclusion? Quel modèle est adéquat?
70 Estimations et tests Les problèmes numériques Une cellule vide peut créer un odds-ratio infini Des variables peuvent complètement séparer malades et non malades Variable combinaison linéaire des autres Problèmes de non-convergence ou de colinéarité Signalés par les logiciels Estimations ponctuelles des β aberrantes Variances des estimations immenses
71 Adéquation des modèles Adéquation des modèles R 2 comme en régression linéaire mais Valeur maximum = 0,36 Interprétation différente et délicate χ 2 d adéquation Test de la déviance χ 2 d Hosmer-Lemeshow Test de C.C. Brown Teste la transformation logistique contre d autres transformations Interprétation délicate en multivarié Analyse des résidus : très délicat
72 Adéquation des modèles Les χ 2 d adéquation Test de la déviance 1 Modèle saturé logvraisemblance maximale L max Les prédictions correspondent aux fréquences observées Un paramètre par observation 2 Le modèle dont on veut tester l adéquation a un logvraisemblance L 1 3 La déviance est D = 2(L max L 1 ) 4 On peut écrire la déviance sous une forme D = 2 O ln ( ) O O sont les événements observés E sont les événements attendus par le modèle à tester 5 La déviance suit une loi du χ 2 mais les conditions d applications sont rarement remplies E
73 Adéquation des modèles Les χ 2 d adéquation Test d Hosmer-Lemeshow 1 Regrouper les observations en 10 classes d effectif à peu près égal 2 χ 2 d adéquation (O E) 2 E O sont les événements observés par classe E sont les événements attendus par classe 3 La statistique suit une loi du χ 2 à 8 degrés de liberté
74 Où en sommes nous? 1 Introduction 2 Rappels sur risques relatifs et odds-ratios 3 Fonction et modèle logistiques 4 Codage des variables 5 Estimations et adéquation 6 Modélisation 7 Exemple - TP
75 Ajustement et facteurs indépendants Le cas multivarié logit(p r(y = 1 X)) = α + βx β i est le logarithme de l odds-ratio associé à une augmentation d une unité de la variable X i, toutes les autres variables étant fixées OR ajusté
76 Ajustement et facteurs indépendants Cas de deux variables explicatives En univarié 1 OR (1) 1 associé à la variable X 1 2 OR (1) 2 associé à la variable X 2 En multivarié : on tient compte simultanément des deux variables 1 Nouvel OR (2) 1 associé à la variable X 1, ajusté sur X 2 2 Nouvel OR (2) 2 associé à la variable X 2, ajusté sur X 1
77 Ajustement et facteurs indépendants Pourquoi OR (2) est différent de OR (1)? Facteur de confusion (différence majeure) Informations redondantes corrélation Colinéarité (plus de deux facteurs)
78 Ajustement et facteurs indépendants Pourquoi OR (2) est différent de OR (1)? Facteur de confusion (différence majeure) Informations redondantes corrélation Colinéarité (plus de deux facteurs) Pourquoi OR (2) n est pas différent de OR (1)? X 1 et X 2 sont des facteurs indépendants et tenir compte de l effet de X 2 ou pas ne change rien sur l effet de X 1
79 Objectifs de la modélisation Explicatif : chercher la meilleure association de variables explicatives pour expliquer Y notion de parcimonie Prédictif : chercher la meilleure association de variables explicatives pour prédire Y pas toujours parcimonieux
80 Choix des variables Grand nombre de variables d exposition Première sélection par des tests univariés (au risque de 0.10 ou 0.20) Tester les interactions entre variables Ne retenir que les variables significatives simultanément Retenir les effets principaux quand on retient une interaction Procédures pas à pas De nombreuses autres méthodes
81 Choix des variables Pas à pas ascendant Partir du modèle plus simple Modèle avec uniquement la constante Modèle avec les variables forcées Ajouter une à une les variables significatives Tests du rapport des vraisemblances La plus significative en premier Variable transformées par des variables indicatrices en bloc On s arrête quand il n y a plus de variables significatives
82 Choix des variables Pas à pas descendant Partir du modèle le plus complexe Retirer une à une les variables non significatives Tests du rapport des vraisemblances La moins significative en premier Variable transformées par des variables indicatrices en bloc On s arrête quand il n y a plus de variable non significative dans le modèle
83 Choix des variables Procédure stepwise En pas à pas ascendant ou descendant On peut revenir en arrière à chaque étape Pour tenir compte des corrélations entre variables Une variable peut s effondrer sur une autre variable très corrélée la rejoint
84 Où en sommes nous? 1 Introduction 2 Rappels sur risques relatifs et odds-ratios 3 Fonction et modèle logistiques 4 Codage des variables 5 Estimations et adéquation 6 Modélisation 7 Exemple - TP
STATISTIQUES. UE Modélisation pour la biologie
STATISTIQUES UE Modélisation pour la biologie 2011 Cadre Général n individus: 1, 2,..., n Y variable à expliquer : Y = (y 1, y 2,..., y n ), y i R Modèle: Y = Xθ + ε X matrice du plan d expériences θ paramètres
Plus en détailIBM SPSS Regression 21
IBM SPSS Regression 21 Remarque : Avant d utiliser ces informations et le produit qu elles concernent, lisez les informations générales sous Remarques sur p. 46. Cette version s applique à IBM SPSS Statistics
Plus en détail«Cours Statistique et logiciel R»
«Cours Statistique et logiciel R» Rémy Drouilhet (1), Adeline Leclercq-Samson (1), Frédérique Letué (1), Laurence Viry (2) (1) Laboratoire Jean Kuntzmann, Dép. Probabilites et Statistique, (2) Laboratoire
Plus en détailChapitre 6 Test de comparaison de pourcentages χ². José LABARERE
UE4 : Biostatistiques Chapitre 6 Test de comparaison de pourcentages χ² José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Nature des variables
Plus en détailDocteur José LABARERE
UE7 - Santé Société Humanité Risques sanitaires Chapitre 3 : Epidémiologie étiologique Docteur José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés.
Plus en détailDonnées longitudinales et modèles de survie
ANALYSE DU Données longitudinales et modèles de survie 5. Modèles de régression en temps discret André Berchtold Département des sciences économiques, Université de Genève Cours de Master ANALYSE DU Plan
Plus en détailBac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)
Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures) Eercice 1 (5 points) pour les candidats n ayant pas choisi la spécialité MATH Le tableau suivant donne l évolution du chiffre
Plus en détailAnalyse statistique de données qualitatives et quantitatives en sciences sociales : TP RÉGRESSION LOGISTIQUE (MODÈLES CHAPITRE 1)
Analyse statistique de données qualitatives et quantitatives en sciences sociales : TP RÉGRESSION LOGISTIQUE (MODÈLES CHAPITRE 1) Modèles de régression logistique à réaliser Une explicative catégorielle
Plus en détailCorrigé des TD 1 à 5
Corrigé des TD 1 à 5 1 Premier Contact 1.1 Somme des n premiers entiers 1 (* Somme des n premiers entiers *) 2 program somme_entiers; n, i, somme: integer; 8 (* saisie du nombre n *) write( Saisissez un
Plus en détailCours de méthodes de scoring
UNIVERSITE DE CARTHAGE ECOLE SUPERIEURE DE STATISTIQUE ET D ANALYSE DE L INFORMATION Cours de méthodes de scoring Préparé par Hassen MATHLOUTHI Année universitaire 2013-2014 Cours de méthodes de scoring-
Plus en détailBureau : 238 Tel : 04 76 82 58 90 Email : dominique.muller@upmf-grenoble.fr
Dominique Muller Laboratoire Inter-universitaire de Psychologie Bureau : 238 Tel : 04 76 82 58 90 Email : dominique.muller@upmf-grenoble.fr Supports de cours : webcom.upmf-grenoble.fr/lip/perso/dmuller/m2r/acm/
Plus en détailChapitre 3. Quelques fonctions usuelles. 1 Fonctions logarithme et exponentielle. 1.1 La fonction logarithme
Chapitre 3 Quelques fonctions usuelles 1 Fonctions logarithme et eponentielle 1.1 La fonction logarithme Définition 1.1 La fonction 7! 1/ est continue sur ]0, +1[. Elle admet donc des primitives sur cet
Plus en détailLA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers
Plus en détailProbabilités III Introduction à l évaluation d options
Probabilités III Introduction à l évaluation d options Jacques Printems Promotion 2012 2013 1 Modèle à temps discret 2 Introduction aux modèles en temps continu Limite du modèle binomial lorsque N + Un
Plus en détailChapitre 2 Le problème de l unicité des solutions
Université Joseph Fourier UE MAT 127 Mathématiques année 2011-2012 Chapitre 2 Le problème de l unicité des solutions Ce que nous verrons dans ce chapitre : un exemple d équation différentielle y = f(y)
Plus en détailAnalyse de la variance Comparaison de plusieurs moyennes
Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction
Plus en détailFiltrage stochastique non linéaire par la théorie de représentation des martingales
Filtrage stochastique non linéaire par la théorie de représentation des martingales Adriana Climescu-Haulica Laboratoire de Modélisation et Calcul Institut d Informatique et Mathématiques Appliquées de
Plus en détailESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring
ESSEC Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring Les méthodes d évaluation du risque de crédit pour les PME et les ménages Caractéristiques Comme les montants des crédits et des
Plus en détailEXERCICE 4 (7 points ) (Commun à tous les candidats)
EXERCICE 4 (7 points ) (Commun à tous les candidats) On cherche à modéliser de deux façons différentes l évolution du nombre, exprimé en millions, de foyers français possédant un téléviseur à écran plat
Plus en détailChapitre 3. Les distributions à deux variables
Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles
Plus en détailModèles et Méthodes de Réservation
Modèles et Méthodes de Réservation Petit Cours donné à l Université de Strasbourg en Mai 2003 par Klaus D Schmidt Lehrstuhl für Versicherungsmathematik Technische Universität Dresden D 01062 Dresden E
Plus en détailTests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles
Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Valentin Patilea 1 Cesar Sanchez-sellero 2 Matthieu Saumard 3 1 CREST-ENSAI et IRMAR 2 USC Espagne 3 IRMAR-INSA
Plus en détailStéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 06/12/2009 Stéphane Tufféry - Data Mining - http://data.mining.free.fr
Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE 1 Plan du cours Qu est-ce que le data mining? A quoi sert le data mining? Les 2 grandes familles de techniques Le déroulement d un projet de data
Plus en détailIntroduction à la statistique non paramétrique
Introduction à la statistique non paramétrique Catherine MATIAS CNRS, Laboratoire Statistique & Génome, Évry http://stat.genopole.cnrs.fr/ cmatias Atelier SFDS 27/28 septembre 2012 Partie 2 : Tests non
Plus en détailEtude de fonctions: procédure et exemple
Etude de fonctions: procédure et exemple Yves Delhaye 8 juillet 2007 Résumé Dans ce court travail, nous présentons les différentes étapes d une étude de fonction à travers un exemple. Nous nous limitons
Plus en détailTABLE DES MATIERES. C Exercices complémentaires 42
TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence
Plus en détailTests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE
Chapitre 5 UE4 : Biostatistiques Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés.
Plus en détailCoup de Projecteur sur les Réseaux de Neurones
Coup de Projecteur sur les Réseaux de Neurones Les réseaux de neurones peuvent être utilisés pour des problèmes de prévision ou de classification. La représentation la plus populaire est le réseau multicouche
Plus en détailPrincipe d un test statistique
Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre
Plus en détailArbres binaires de décision
1 Arbres binaires de décision Résumé Arbres binaires de décision Méthodes de construction d arbres binaires de décision, modélisant une discrimination (classification trees) ou une régression (regression
Plus en détailMéthodes de Simulation
Méthodes de Simulation JEAN-YVES TOURNERET Institut de recherche en informatique de Toulouse (IRIT) ENSEEIHT, Toulouse, France Peyresq06 p. 1/41 Remerciements Christian Robert : pour ses excellents transparents
Plus en détailCours d Analyse. Fonctions de plusieurs variables
Cours d Analyse Fonctions de plusieurs variables Licence 1ère année 2007/2008 Nicolas Prioux Université de Marne-la-Vallée Table des matières 1 Notions de géométrie dans l espace et fonctions à deux variables........
Plus en détailTempérature corporelle d un castor (une petite introduction aux séries temporelles)
Température corporelle d un castor (une petite introduction aux séries temporelles) GMMA 106 GMMA 106 2014 2015 1 / 32 Cas d étude Temperature (C) 37.0 37.5 38.0 0 20 40 60 80 100 Figure 1: Temperature
Plus en détailCONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)
CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un
Plus en détailTABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.
STATISTIQUE THÉORIQUE ET APPLIQUÉE Tome 2 Inférence statistique à une et à deux dimensions Pierre Dagnelie TABLE DES MATIÈRES Bruxelles, De Boeck, 2011, 736 p. ISBN 978-2-8041-6336-5 De Boeck Services,
Plus en détailDéroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI
1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage
Plus en détailTABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie
PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats Pierre Dagnelie TABLE DES MATIÈRES 2012 Presses agronomiques de Gembloux pressesagro.gembloux@ulg.ac.be www.pressesagro.be
Plus en détail3 Approximation de solutions d équations
3 Approximation de solutions d équations Une équation scalaire a la forme générale f(x) =0où f est une fonction de IR dans IR. Un système de n équations à n inconnues peut aussi se mettre sous une telle
Plus en détailMODELES DE DUREE DE VIE
MODELES DE DUREE DE VIE Cours 1 : Introduction I- Contexte et définitions II- Les données III- Caractéristiques d intérêt IV- Evènements non renouvelables/renouvelables (unique/répété) I- Contexte et définitions
Plus en détailStatistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier
Statistiques Appliquées à l Expérimentation en Sciences Humaines Christophe Lalanne, Sébastien Georges, Christophe Pallier Table des matières 1 Méthodologie expérimentale et recueil des données 6 1.1 Introduction.......................................
Plus en détail4.2 Unités d enseignement du M1
88 CHAPITRE 4. DESCRIPTION DES UNITÉS D ENSEIGNEMENT 4.2 Unités d enseignement du M1 Tous les cours sont de 6 ECTS. Modélisation, optimisation et complexité des algorithmes (code RCP106) Objectif : Présenter
Plus en détailStatistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux 4 2013-2014
Tests du χ 2 Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux 4 2013-2014 A. Lourme http://alexandrelourme.free.fr Outline
Plus en détailDéveloppement de lois et de structures de réglages destinées à la téléopération avec retour d effort
Développement de lois et de structures de réglages destinées à la téléopération avec retour d effort Thomas Delwiche, Laurent Catoire et Michel Kinnaert Faculté des Sciences Appliquées Service d Automatique
Plus en détailChapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE
UE4 : Biostatistiques Chapitre 3 : Principe des tests statistiques d hypothèse José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Introduction
Plus en détailTSTI 2D CH X : Exemples de lois à densité 1
TSTI 2D CH X : Exemples de lois à densité I Loi uniforme sur ab ; ) Introduction Dans cette activité, on s intéresse à la modélisation du tirage au hasard d un nombre réel de l intervalle [0 ;], chacun
Plus en détailExercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015
Exercices M1 SES 214-215 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 215 Les exemples numériques présentés dans ce document d exercices ont été traités sur le logiciel R, téléchargeable par
Plus en détailDéveloppements limités, équivalents et calculs de limites
Développements ités, équivalents et calculs de ites Eercice. Déterminer le développement ité en 0 à l ordre n des fonctions suivantes :. f() e (+) 3 n. g() sin() +ln(+) n 3 3. h() e sh() n 4. i() sin(
Plus en détailFORMULAIRE DE STATISTIQUES
FORMULAIRE DE STATISTIQUES I. STATISTIQUES DESCRIPTIVES Moyenne arithmétique Remarque: population: m xμ; échantillon: Mx 1 Somme des carrés des écarts "# FR MOYENNE(série) MOYENNE(série) NL GEMIDDELDE(série)
Plus en détaildonnées en connaissance et en actions?
1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)
Plus en détailRésolution de systèmes linéaires par des méthodes directes
Résolution de systèmes linéaires par des méthodes directes J. Erhel Janvier 2014 1 Inverse d une matrice carrée et systèmes linéaires Ce paragraphe a pour objet les matrices carrées et les systèmes linéaires.
Plus en détailLimitations of the Playstation 3 for High Performance Cluster Computing
Introduction Plan Limitations of the Playstation 3 for High Performance Cluster Computing July 2007 Introduction Plan Introduction Intérêts de la PS3 : rapide et puissante bon marché L utiliser pour faire
Plus en détailOptimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications
Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications A. Optimisation sans contrainte.... Généralités.... Condition nécessaire et condition suffisante
Plus en détailLe théorème de Thalès et sa réciproque
Le théorème de Thalès et sa réciproque I) Agrandissement et Réduction d une figure 1) Définition : Lorsque toutes les longueurs d une figure F sont multipliées par un même nombre k on obtient une autre
Plus en détailExercice autour de densité, fonction de répatition, espérance et variance de variables quelconques.
14-3- 214 J.F.C. p. 1 I Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques. Exercice 1 Densité de probabilité. F { ln x si x ], 1] UN OVNI... On pose x R,
Plus en détailUne introduction. Lionel RIOU FRANÇA. Septembre 2008
Une introduction INSERM U669 Septembre 2008 Sommaire 1 Effets Fixes Effets Aléatoires 2 Analyse Classique Effets aléatoires Efficacité homogène Efficacité hétérogène 3 Estimation du modèle Inférence 4
Plus en détailAnalyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés
Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour francour@unice.fr Une grande partie des illustrations viennent
Plus en détailBaccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé
Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé A. P. M. E. P. Exercice 1 5 points 1. Réponse d. : 1 e Le coefficient directeur de la tangente est négatif et n est manifestement pas 2e
Plus en détailCorrection du bac blanc CFE Mercatique
Correction du bac blanc CFE Mercatique Exercice 1 (4,5 points) Le tableau suivant donne l évolution du nombre de bénéficiaires de minima sociaux en milliers : Année 2002 2003 2004 2005 2006 2007 2008 2009
Plus en détailLa survie nette actuelle à long terme Qualités de sept méthodes d estimation
La survie nette actuelle à long terme Qualités de sept méthodes d estimation PAR Alireza MOGHADDAM TUTEUR : Guy HÉDELIN Laboratoire d Épidémiologie et de Santé publique, EA 80 Faculté de Médecine de Strasbourg
Plus en détailLimites finies en un point
8 Limites finies en un point Pour ce chapitre, sauf précision contraire, I désigne une partie non vide de R et f une fonction définie sur I et à valeurs réelles ou complees. Là encore, les fonctions usuelles,
Plus en détailNON-LINEARITE ET RESEAUX NEURONAUX
NON-LINEARITE ET RESEAUX NEURONAUX Vêlayoudom MARIMOUTOU Laboratoire d Analyse et de Recherche Economiques Université de Bordeaux IV Avenue. Leon Duguit, 33608 PESSAC, France tel. 05 56 84 85 77 e-mail
Plus en détailTests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique»
Tests de comparaison de moyennes Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Test de Z ou de l écart réduit Le test de Z : comparer des paramètres en testant leurs différences
Plus en détailStatistiques Descriptives à une dimension
I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des
Plus en détailPROBABILITES ET STATISTIQUE I&II
PROBABILITES ET STATISTIQUE I&II TABLE DES MATIERES CHAPITRE I - COMBINATOIRE ELEMENTAIRE I.1. Rappel des notations de la théorie des ensemble I.1.a. Ensembles et sous-ensembles I.1.b. Diagrammes (dits
Plus en détailIncertitudes expérimentales
Incertitudes expérimentales F.-X. Bally et J.-M. Berroir Février 2013 Table des matières Introduction 4 1 Erreur et incertitude 4 1.1 Erreurs............................................. 4 1.1.1 Définition
Plus en détailt 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :
Terminale STSS 2 012 2 013 Pourcentages Synthèse 1) Définition : Calculer t % d'un nombre, c'est multiplier ce nombre par t 100. 2) Exemples de calcul : a) Calcul d un pourcentage : Un article coûtant
Plus en détail3 ème 2 DÉVELOPPEMENT FACTORISATIONS ET IDENTITÉS REMARQUABLES 1/5 1 - Développements
3 ème 2 DÉVELOPPEMENT FACTORISATIONS ET IDENTITÉS REMARQUABLES 1/5 1 - Développements Développer une expression consiste à transformer un produit en une somme Qu est-ce qu une somme? Qu est-ce qu un produit?
Plus en détailSAS ENTERPRISE MINER POUR L'ACTUAIRE
SAS ENTERPRISE MINER POUR L'ACTUAIRE Conférence de l Association des Actuaires I.A.R.D. 07 JUIN 2013 Sylvain Tremblay Spécialiste en formation statistique SAS Canada AGENDA Survol d Enterprise Miner de
Plus en détailSimulation de variables aléatoires
Chapter 1 Simulation de variables aléatoires Références: [F] Fishman, A first course in Monte Carlo, chap 3. [B] Bouleau, Probabilités de l ingénieur, chap 4. [R] Rubinstein, Simulation and Monte Carlo
Plus en détailTable des matières. I Mise à niveau 11. Préface
Table des matières Préface v I Mise à niveau 11 1 Bases du calcul commercial 13 1.1 Alphabet grec...................................... 13 1.2 Symboles mathématiques............................... 14 1.3
Plus en détailBiostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke
www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3
Plus en détailABS 2RM : quels effets observés sur la fréquence accident?
ABS 2RM : quels effets observés sur la fréquence accident? Bertrand Nelva-Pasqual, Mutuelle des Motards Journées Scientifiques "Deux-roues motorisés" 15 et 16 octobre 2013, Lyon-Bron Groupe d Échanges
Plus en détailPROGRAMME (Susceptible de modifications)
Page 1 sur 8 PROGRAMME (Susceptible de modifications) Partie 1 : Méthodes des revues systématiques Mercredi 29 mai 2013 Introduction, présentation du cours et des participants Rappel des principes et des
Plus en détailConstruction d un cercle tangent à deux cercles donnés.
Préparation au CAPES Strasbourg, octobre 2008 Construction d un cercle tangent à deux cercles donnés. Le problème posé : On se donne deux cercles C et C de centres O et O distincts et de rayons R et R
Plus en détailMémoire d Actuariat Tarification de la branche d assurance des accidents du travail Aymeric Souleau aymeric.souleau@axa.com 3 Septembre 2010 Plan 1 Introduction Les accidents du travail L assurance des
Plus en détailChap 4. La fonction exponentielle Terminale S. Lemme : Si est une fonction dérivable sur R telle que : = et 0! = 1 alors ne s annule pas sur R.
Lemme : Si est une fonction dérivable sur R telle que : = et 0! = 1 alors ne s annule pas sur R. Démonstration : Soit la fonction %:& %&!= &!, elle est dérivable sur R et & R, %. &!= &! = &! = %&! gaelle.buffet@ac-montpellier.fr
Plus en détailLa problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites
La problématique des tests Cours V 7 mars 8 Test d hypothèses [Section 6.1] Soit un modèle statistique P θ ; θ Θ} et des hypothèses H : θ Θ H 1 : θ Θ 1 = Θ \ Θ Un test (pur) est une statistique à valeur
Plus en détailComplément d information concernant la fiche de concordance
Sommaire SAMEDI 0 DÉCEMBRE 20 Vous trouverez dans ce dossier les documents correspondants à ce que nous allons travailler aujourd hui : La fiche de concordance pour le DAEU ; Page 2 Un rappel de cours
Plus en détailListe des notes techniques... xxi Liste des encadrés... xxiii Préface à l édition internationale... xxv Préface à l édition francophone...
Liste des notes techniques.................... xxi Liste des encadrés....................... xxiii Préface à l édition internationale.................. xxv Préface à l édition francophone..................
Plus en détailLa Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1
La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1 La licence Mathématiques et Economie-MASS de l Université des Sciences Sociales de Toulouse propose sur les trois
Plus en détailBaccalauréat ES/L Amérique du Sud 21 novembre 2013
Baccalauréat ES/L Amérique du Sud 21 novembre 2013 A. P. M. E. P. EXERCICE 1 Commun à tous les candidats 5 points Une entreprise informatique produit et vend des clés USB. La vente de ces clés est réalisée
Plus en détailProbabilités sur un univers fini
[http://mp.cpgedupuydelome.fr] édité le 7 août 204 Enoncés Probabilités sur un univers fini Evènements et langage ensembliste A quelle condition sur (a, b, c, d) ]0, [ 4 existe-t-il une probabilité P sur
Plus en détailLe modèle de régression linéaire
Chapitre 2 Le modèle de régression linéaire 2.1 Introduction L économétrie traite de la construction de modèles. Le premier point de l analyse consiste à se poser la question : «Quel est le modèle?». Le
Plus en détailTP 7 : oscillateur de torsion
TP 7 : oscillateur de torsion Objectif : étude des oscillations libres et forcées d un pendule de torsion 1 Principe général 1.1 Définition Un pendule de torsion est constitué par un fil large (métallique)
Plus en détailÉtude des Corrélations entre Paramètres Statiques et Dynamiques des Convertisseurs Analogique-Numérique en vue d optimiser leur Flot de Test
11 juillet 2003 Étude des Corrélations entre Paramètres Statiques et Dynamiques des Convertisseurs Analogique-Numérique en vue d optimiser leur Flot de Test Mariane Comte Plan 2 Introduction et objectif
Plus en détailFonctions de deux variables. Mai 2011
Fonctions de deux variables Dédou Mai 2011 D une à deux variables Les fonctions modèlisent de l information dépendant d un paramètre. On a aussi besoin de modéliser de l information dépendant de plusieurs
Plus en détailÉtude de cas Assurance (d après une étude de Philippe Périé, CISIA)
Étude de cas Assurance (d après une étude de Philippe Périé, CISIA) I.1.Les données L échantillon est constitué de 1106 assurés Belges observés en 1992 et répartis en 2 groupes. - les assurés qui n ont
Plus en détailQuantification Scalaire et Prédictive
Quantification Scalaire et Prédictive Marco Cagnazzo Département Traitement du Signal et des Images TELECOM ParisTech 7 Décembre 2012 M. Cagnazzo Quantification Scalaire et Prédictive 1/64 Plan Introduction
Plus en détailVariables Aléatoires. Chapitre 2
Chapitre 2 Variables Aléatoires Après avoir réalisé une expérience, on ne s intéresse bien souvent à une certaine fonction du résultat et non au résultat en lui-même. Lorsqu on regarde une portion d ADN,
Plus en détailCalcul élémentaire des probabilités
Myriam Maumy-Bertrand 1 et Thomas Delzant 1 1 IRMA, Université Louis Pasteur Strasbourg, France Licence 1ère Année 16-02-2006 Sommaire La loi de Poisson. Définition. Exemple. 1 La loi de Poisson. 2 3 4
Plus en détailProjet Etienne Marceau Méthodes statistiques en assurance non vie
Trinôme : Carine Sauser, Mélanie Groisne, Xavier Milhaud Projet Etienne Marceau Méthodes statistiques en assurance non vie Méthodes statistiques pour la finance et l assurance ISFA - Décembre 2007 Table
Plus en détailEssais précoces non comparatifs : principes et calcul du nombre de sujets nécessaire
Essais précoces non comparatifs : principes et calcul du nombre de sujets nécessaire Sylvie CHABAUD Direction de la Recherche Clinique et de l Innovation : Centre Léon Bérard - Lyon Unité de Biostatistique
Plus en détailExercice 3 (5 points) A(x) = 1-e -0039' -0 156e- 0,039x A '() -'-,..--,-,--,------:-- X = (l_e-0,039x)2
Les parties A et B sont indépendantes. Partie A Exercice 3 (5 points) Commun à tous les candidats On considère la fonction A définie sur l'intervalle [1 ; + 00 [ par A(x) = 1-e -0039' ' x 1. Calculer la
Plus en détailQuelques contrôle de Première S
Quelques contrôle de Première S Gilles Auriol auriolg@free.fr http ://auriolg.free.fr Voici l énoncé de 7 devoirs de Première S, intégralement corrigés. Malgré tout les devoirs et 5 nécessitent l usage
Plus en détailEconomie de l incertain et de l information Partie 1 : Décision en incertain probabilisé Chapitre 1 : Introduction à l incertitude et théorie de
Economie de l incertain et de l information Partie 1 : Décision en incertain probabilisé Chapitre 1 : Introduction à l incertitude et théorie de l espérance d utilité Olivier Bos olivier.bos@u-paris2.fr
Plus en détail2.4 Représentation graphique, tableau de Karnaugh
2 Fonctions binaires 45 2.4 Représentation graphique, tableau de Karnaugh On peut définir complètement une fonction binaire en dressant son tableau de Karnaugh, table de vérité à 2 n cases pour n variables
Plus en détailLA PHYSIQUE DES MATERIAUX. Chapitre 1 LES RESEAUX DIRECT ET RECIPROQUE
LA PHYSIQUE DES MATERIAUX Chapitre 1 LES RESEAUX DIRECT ET RECIPROQUE Pr. A. Belayachi Université Mohammed V Agdal Faculté des Sciences Rabat Département de Physique - L.P.M belayach@fsr.ac.ma 1 1.Le réseau
Plus en détailFeuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.
Université de Nantes Année 2013-2014 L3 Maths-Eco Feuille 6 : Tests Exercice 1 On cherche à connaître la température d ébullition µ, en degrés Celsius, d un certain liquide. On effectue 16 expériences
Plus en détailApprentissage non paramétrique en régression
1 Apprentissage non paramétrique en régression Apprentissage non paramétrique en régression Résumé Différentes méthodes d estimation non paramétriques en régression sont présentées. Tout d abord les plus
Plus en détail