Analyse de données longitudinales continues avec applications
|
|
- Judith Lebrun
- il y a 8 ans
- Total affichages :
Transcription
1 Université de Liège Département de Mathématique 29 Octobre 2002 Analyse de données longitudinales continues avec applications David MAGIS 1
2 Programme 1. Introduction 2. Exemples 3. Méthodes simples 4. Modèle de régression multivariée 5. Application financière 6. Modèle linéaire en 2 étapes 7. Modèle linéaire à effets mixtes 8. Modèle pour la covariance résiduelle 9. Estimation et inférence pour le modèle mixte 10. Recommendations pour la construction de modèles 11. Le problème des données manquantes 12. Application médicale 1
3 Introduction Mesures répétées : Mesures obtenues lorsqu une réponse est mesurée de façon répétitive sur un ensemble d unités (sujets, machines,...) Ex : Mesure de la PAS sur un patient, sous différentes conditions (assis, couché, après un effort,...). Cas particulier : données longitudinales mesures répétées dans le temps sur un ensemble d unités. Ex : Mesure de la PAS sur un groupe de patients, toutes les semaines. Données balancées : Mesures prises à intervalles réguliers Même nombre de mesures par sujet recherché dans le design d expériences 2
4 En général : données non balancées (données manquantes, données observationnelles, mauvaise compliance, problèmes techniques,...) nécessité de développer des méthodes tenant compte de ce déséquilibre Dans la suite : réponse continue, unités sujets. 3
5 Exemples Problème financier Données récoltées dans un guide BBL Info Sicav Sicav, évaluées chaque année (de 1997 à 2001) Réponse d intérêt : performance (return) Covariables : type de Sicav (trésorerie, obligation, action, mixte) 4
6 Problème médical (L. Erpicum) Données récoltées par un médecin généraliste Patients souffrant d hypertension Réponses d intérêt : pressions artérielles systolique (PAS), diastolique (PAD) et fréquence cardiaque (FREQ) Covariables : age, sexe, intervalles de temps entre deux visites, médicaments antihypertenseurs prescrits 5
7 6
8 Méthodes simples Méthodes simples de résumé de l information Ne prennent pas en compte la structure de corrélation entre les observations 7
9 8
10 Analyse à chaque temps d observation Données analysées à chaque occasion séparément simple à interpréter utilise toute l info ne considère pas les différences globales ne permet d étudier les différences d évolution nécessite des données balancées Analyse de l aire sous la courbe (AUC) Comparaison des aires sous la courbe des profils des sujets ne nécessite pas des données balancées comparaison de différences globales n utilise que de l info partielle problèmes de comparaisons 9
11 Analyse des dernières observations Comparaison des mesures prises à la dernière occasion ne nécessite pas des données balancées n utilise que de l info partielle valide uniquement pour de grands ensembles de données ne compare pas les profils 10
12 Modèle de régression multivariée Modèle utilisé principalement lorsque les données sont balancées Y i = vecteur des n mesures répétées pour sujet i : Y i1 Y i =. Y in Modèle multivarié général : Y i satisfait où Y i = X i β + ε i X i : matrice des covariables β : vecteur des paramètres de régression ε i : vecteur des erreurs, ε i N(0, Σ) En général, Σ est une matrice n n sans structure spécifique. Cependant, différentes structures simples existent (ex : Σ = σ 2 I n ). 11
13 Estimation : Si on suppose l indépendance entre sujets, β et les paramètres dans Σ peuvent être estimés en maximisant L ML = n i=1 exp { (2 π) n 2 Σ 1 2 ( 1 )} 2 (Y i X i β) Σ 1 (Y i X i β) par rapport à β et à Σ. Inférence : tests sur les valeurs des paramètres de β : test de Wald test du rapport de vraisemblance (likelihood ratio, LR) 12
14 Application financière Données 22 Sicav BBL, évaluées annuellement de 1997 à 2001 Covariable : type de Sicav (trésorerie, obligation, action, mixte) Réponse : return (performance), fonction du ratio de valeurs des Sicav Données balancées Modèle Création de la variable time, codant les années de 1 à 5 Inclusion d un terme time 2 Type de Sicav codé par type Toutes les paires d interactions incluses Matrice de covariance unstructured : Σ = (σ ij ) 1 i 5 1 j 5 13
15 Modèle final : P erf t β 0 + β 1 time 2 t + β 2j type j +β 3j time t type j + β 4 time t time 2 t Param. Est. Param. Est. Param. Est. β β β β β 24 0 β β β β β β
16 Modèle linéaire en 2 étapes En général, les données sont non balancées techniques de régression multivariée inappliquables Souvent, les profils longitudinaux peuvent être bien approximés par des fonctions de régression linéaire Formulation d un modèle en 2 étapes : Etape 1 : modèle de régression linéaire pour chaque sujet séparément Etape 2 : expliquer la variabilité dans les coefficients de régression (spécifiques aux sujets) à l aide de covariables connues Y ij : réponse du sujet i (i = 1,...,N) mesurée au temps j (j = 1,..., n i ) Y i = (Y i1, Y i2,..., Y ini ) vecteur de réponse pour sujet i 15
17 Etape 1 : Y i = Z i β i + ε i Z i : matrice n i q de covariables β i : vecteur de dimension q de coef. de régression (spécifiques au sujet i) ε i N(0, Σ i )(souvent, Σ i = σ 2 I ni ) Ces modèles décrivent la variabilité dans chaque série d observations Etape 2 : β i = K i β + b i K i : matrice q p de covariables β : vecteur de dimension p de coef. de régression b i N(0, D) Ces modèles décrivent la variabilité entre les sujets 16
18 Modèle linéaire à effets mixtes Introduction Modèle en 2 étapes : Y i résumé par ˆβ i ˆβ i analysés ensuite procédure utilisant des mesures résumées de l info problème Solution : combiner les deux modèles en un seul : } Y i = Z i β i + ε i Y β i = K i β + b i = Z i K i β + Z i b i + ε i i Y i = X i β + Z i b i + ε i b i N(0, D) ε i N(0, Σ i ) b 1,..., b N, ε 1,..., ε N indép. β : effets fixes b i : effets aléatoires Composantes de la variance : éléments de D et Σ i 17
19 Modèle hiérarchique vs Modèle marginal Y i = X i β + Z i b i + ε i a deux interprétations : modèle hiérarchique : 1 modèle pour Y i, étant donné b i 1 modèle pour b i Y i b i N(X i β + Z i b i, Σ i ) b i N(0, D) Interprétation en termes d effets aléatoires modèle marginal : Y i N(X i β, Z i D Z i + Σ i ) Pas d effets aléatoires 18
20 Modèle pour la covariance résiduelle Souvent, Σ i = σ 2 I ni indépendance conditionnelle : aux b i, les Y i sont indépendants conditionnellement En présence de peu ou pas d effets aléatoires, l indépendance conditionnelle est irréaliste adapter Σ i Modèle souvent utilisé : Y i = X i β + Z i b i + ε (1)i + ε (2)i } {{ } ε i b i : variabilité entre sujets ε (1)i : erreur de mesure ε (2)i : composante de la corrélation de série ε (2)i représente la conviction qu une partie du profil du sujet i est dû à un processus stochastique variable au cours du temps et opérant sur chaque individu résulte en une corrélation entre les mesures de la série, généralement décroissante avec l intervalle de temps entre les mesures 19
21 Estimation et inférence pour le modèle mixte Estimation Y i = X i β + Z i b i + ε i β : vecteur des effets fixes α : vecteur des composantes de la variance de D et Σ i Fonction de vraisemblance (marginale) : L ML = n i=1 { (2 π) n i 2 V i (α) 1 2 exp ( 1 )} 2 (Y i X i β) V i (α) 1 (Y i X i β) Si α est connu, ( N ) 1 ˆβ(α) = X i W i X i où W i = V 1 i i=1 = (Z i D Z i + Σ i) 1 N X i W i Y i, i=1 En général, α est inconnu ˆα Estimation par ML Estimation par REML (plus efficace mais...) 20
22 Inférence 1. Effets fixes et composantes de la variance : LR test Wald test 2. Effets aléatoires : Effets sont aléatoires on utilise une approche bayésienne Estimation des effets aléatoires possible ; tests de Wald peuvent être dérivés tests pour la nécessité d effets aléatoires : LR tests avec mixture de distributions χ 2 3. Critère d information (Akaike Information Criterion, AIC) : Comparaison de deux modèles avec des structures (moyenne et covariance) différentes Modèle A est préféré à Modèle B si l accroissement en vraisemblance (de A à B) est faible comparé à l accroissement de complexité 21
23 Recommendations pour la construction de modèles Y i = X i β + Z i b i + ε i Structure moyenne préliminaire X i β Compromis entre structure riche, mais inefficace, et structure simple mais irréaliste Choisir la structure la plus élaborée, basée sur des outils observationels (ex : lissage des données pour obtenir une tendance au cours du temps) Structure préliminaire des effets aléatoires Z i b i Même principe qu avec la structure moyenne Utilisation d outils d observation des données Respecter des règles de consistence (ex : ne pas incorporer des termes d ordre p sans avoir inclus des termes d ordre q < p) 22
24 Structure de covariance résiduelle Σ i En général, Σ i = σ 2 I ni Si corrélation de série : ε (2)i N(0, τ 2 H i ) En général : (H i ) j,k = g( t ij t ik ) pour une fonction g(.) décroissante, avec g(0) = 1 Choix possibles : corrélation de série exponentielle : g(u) = exp( φ u) corrélation de série gaussienne : g(u) = exp( φ u 2 ) Réduction de la structure des effets aléatoires Utilisation des outils inférentiels pour les effets aléatoires Utilisation des outils inférentiels pour les composantes de la variance réduction de la structure moyenne Utilisation des outils inférentiels pour la réduction de la structure moyenne 23
25 Le problème des données manquantes Notations Mesures : Y ij Indicateur de disparition : R ij = Y o i : vecteur des Y ij tels que R ij = 1 Y m i : vecteur des Y ij tels que R ij = 0 Y i = (Y o i, Y m i ) Patterns : { 1 si Yij observé 0 sinon disparition (dropout) : monotone non-monotone Si dropout, D i : moment du dropout f(y i, D i θ, ψ) avec θ les paramètres du processus de mesure, et ψ ceux du processus de disparition 24
26 Processus de données manquantes f(d i Y o i, Y m i, ψ) MCAR (Missing Completely At Random) : processus de données manquantes indépendant des mesures : f(d i ψ) MAR (Missing At Random) : processus de données manquantes indépendant des données manquantes, peut-être dépendant des mesures observées : f(d i ψ, Y o i ) MNAR (Missing Non At Random) : processus de données manquantes dépend des données manquantes : f(d i ψ, Y o i, Y m i ) 25
27 Que faire? Analyse des profils complets Ne considérer que les profils complets (sans données manquantes) méthode simple logiciels courants utilisables perte d information considérable non valide sous MAR Imputation (méthodes simples) 1. Reporter la dernière observation méthode d imputation simple analyse facile hypothèse que la mesure reste la même lorsque non observée information estimée imprécision sous-estimée, biais créé 26
28 2. Remplacer la mesure Y ij manquante par Y j, moyenne de la variable au temps j algorithmes existent (p.ex. EM) hypothèse moins forte que la précédente nécessite MCAR Analyse des cas disponibles Utiliser toute l information disponible Inférence basée sur la fonction de vraisemblance correcte, si 1. le mécanisme est MAR 2. les paramètres décrivant le processus de données manquantes sont différents de ceux du processus de mesure l analyse à effectuer!! 27
29 Application médicale Données 227 patients (100 hommes et 127 femmes) examinés entre le 1/1/2000 et le 15/5/ à 32 visites par patient 1 à 4 classes de médicaments prescrits (classification ATC) Covariables : âge au moment de la visite, intervalles de temps entre deux visites, combinaisons de classes de médicaments, réponse précédente observée Réponses d intérêt : PAS, PAD, FREQ Modèle Modèle linéaire mixte Structure moyenne : toutes les covariables Effets aléatoires : intercept et âge pour PAS, age 2 en plus pour PAD et FREQ Structure de covariance : structure simple, à la fois pour D et pour Σ i : σ 2 I ni 28
30 Résultats Structure moyenne uniquement considérée ici 1. PAS : P AS t β 0 + β 1 age t + β 2 P AS t 1 + β 3 drug 789 Param. Est. Param. Est. β β β β Evolution linéaire, légèrement croissante Pas d effet du sexe, ni des intervalles de temps entre 2 visites 29
31 2. PAD : P AD t β 0 + β 1 age t + β 2 age 2 t + β 3 P AD t 1 Param. Est. Param. Est. β β β β Evolution quadratique au cours du temps Pas d effet du sexe, ni des intervalles de temps entre 2 visites Pas d effet des classes de médicaments 30
32 3. FREQ : F REQ t β 0 + β 1 F REQ t 1 + β 2 drug 9 Paramètre Estimation β β β Pas d évolution précise au cours du temps Pas d effet du sexe, ni des intervalles de temps entre 2 visites Conclusions Résultats en accord avec la littérature internationale Structures de covariance limitées (problèmes informatiques) Pas d interaction entre covariables (problèmes informatiques) Suggestion : développer une expérience avec un protocole bien défini données balancées, précision assurée,... 31
33 En guise de conclusion... Données longitudinales : large champ d investigation Modèles mixtes : permettent l analyse de plusieurs profils en même temps permettent de modéliser la variation spécifique aux sujets Implémentation courante dans le logiciel SAS Problèmes de convergence informatique apparaissent souvent Fonctionnement optimal : moins de 10 observations successives dans le temps ; nombre de sujets illimité (le plus possible...) 32
34 29 Octobre 2002 Analyse de données longitudinales continues avec applications David MAGIS Résumé Données longitudinales est un terme générique pour désigner des mesures répétées dans le temps, effectuées sur un ensemble de sujets ou d objets. Nous considérons ici des réponses continues. Diverses méthodes simples d analyse de telles données existent : étude des dernières observations (endpoints), l aire sous la courbe (AUC),... Malheureusement, ces méthodes ne prennent pas en compte la structure de corrélation sous-jacente aux données. Lorsque les données sont balancées, les modèles de régression multivariée peuvent être utilisés. L estimation des paramètres et l inférence statistique se font généralement sur base du maximum de vraisemblance. Néanmoins, la plupart des données longitudinales réelles ne sont pas balancées. Dans ce cas, l utilisation de modèles linéaires mixtes est recommandée. La variabilité entre sujets est dès lors décrite par des effets aléatoires, et à nouveau, des méthodes basées sur la fonction de vraisemblance existent pour procéder à l estimation et à l inférence, liées au modèle mixte. La problématique des données manquantes sera abordée de façon générale. Diverses méthodes de résolution sont présentées et commentées. Finalement, deux applications, l une ayant trait au domaine médical, l autre au secteur financier, permettront d illustrer nos propos. 1
Approche modèle pour l estimation en présence de non-réponse non-ignorable en sondage
Approche modèle pour l estimation en présence de non-réponse non-ignorable en sondage Journées de Méthodologie Statistique Eric Lesage Crest-Ensai 25 janvier 2012 Introduction et contexte 2/27 1 Introduction
Plus en détailTABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.
STATISTIQUE THÉORIQUE ET APPLIQUÉE Tome 2 Inférence statistique à une et à deux dimensions Pierre Dagnelie TABLE DES MATIÈRES Bruxelles, De Boeck, 2011, 736 p. ISBN 978-2-8041-6336-5 De Boeck Services,
Plus en détailTABLE DES MATIERES. C Exercices complémentaires 42
TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence
Plus en détailLA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers
Plus en détailIntroduction à l approche bootstrap
Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?
Plus en détailPROBABILITES ET STATISTIQUE I&II
PROBABILITES ET STATISTIQUE I&II TABLE DES MATIERES CHAPITRE I - COMBINATOIRE ELEMENTAIRE I.1. Rappel des notations de la théorie des ensemble I.1.a. Ensembles et sous-ensembles I.1.b. Diagrammes (dits
Plus en détailModélisation aléatoire en fiabilité des logiciels
collection Méthodes stochastiques appliquées dirigée par Nikolaos Limnios et Jacques Janssen La sûreté de fonctionnement des systèmes informatiques est aujourd hui un enjeu économique et sociétal majeur.
Plus en détailCONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)
CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un
Plus en détailLa survie nette actuelle à long terme Qualités de sept méthodes d estimation
La survie nette actuelle à long terme Qualités de sept méthodes d estimation PAR Alireza MOGHADDAM TUTEUR : Guy HÉDELIN Laboratoire d Épidémiologie et de Santé publique, EA 80 Faculté de Médecine de Strasbourg
Plus en détailTable des matières. I Mise à niveau 11. Préface
Table des matières Préface v I Mise à niveau 11 1 Bases du calcul commercial 13 1.1 Alphabet grec...................................... 13 1.2 Symboles mathématiques............................... 14 1.3
Plus en détailChapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens
Chapitre 7 Statistique des échantillons gaussiens Le théorème central limite met en évidence le rôle majeur tenu par la loi gaussienne en modélisation stochastique. De ce fait, les modèles statistiques
Plus en détailUne introduction. Lionel RIOU FRANÇA. Septembre 2008
Une introduction INSERM U669 Septembre 2008 Sommaire 1 Effets Fixes Effets Aléatoires 2 Analyse Classique Effets aléatoires Efficacité homogène Efficacité hétérogène 3 Estimation du modèle Inférence 4
Plus en détail(51) Int Cl.: H04L 29/06 (2006.01) G06F 21/55 (2013.01)
(19) TEPZZ 8 8 4_A_T (11) EP 2 838 241 A1 (12) DEMANDE DE BREVET EUROPEEN (43) Date de publication: 18.02.1 Bulletin 1/08 (1) Int Cl.: H04L 29/06 (06.01) G06F 21/ (13.01) (21) Numéro de dépôt: 141781.4
Plus en détailExercice : la frontière des portefeuilles optimaux sans actif certain
Exercice : la frontière des portefeuilles optimaux sans actif certain Philippe Bernard Ingénierie Economique & Financière Université Paris-Dauphine Février 0 On considère un univers de titres constitué
Plus en détailSTATISTIQUES. UE Modélisation pour la biologie
STATISTIQUES UE Modélisation pour la biologie 2011 Cadre Général n individus: 1, 2,..., n Y variable à expliquer : Y = (y 1, y 2,..., y n ), y i R Modèle: Y = Xθ + ε X matrice du plan d expériences θ paramètres
Plus en détailTP1 Méthodes de Monte Carlo et techniques de réduction de variance, application au pricing d options
Université de Lorraine Modélisation Stochastique Master 2 IMOI 2014-2015 TP1 Méthodes de Monte Carlo et techniques de réduction de variance, application au pricing d options 1 Les options Le but de ce
Plus en détailModèles pour données répétées
Résumé Les données répétées, ou données longitudinales, constituent un domaine à la fois important et assez particulier de la statistique. On entend par données répétées des données telles que, pour chaque
Plus en détailNON-LINEARITE ET RESEAUX NEURONAUX
NON-LINEARITE ET RESEAUX NEURONAUX Vêlayoudom MARIMOUTOU Laboratoire d Analyse et de Recherche Economiques Université de Bordeaux IV Avenue. Leon Duguit, 33608 PESSAC, France tel. 05 56 84 85 77 e-mail
Plus en détailLe modèle de régression linéaire
Chapitre 2 Le modèle de régression linéaire 2.1 Introduction L économétrie traite de la construction de modèles. Le premier point de l analyse consiste à se poser la question : «Quel est le modèle?». Le
Plus en détailChapitre 3. Les distributions à deux variables
Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles
Plus en détailIBM SPSS Regression 21
IBM SPSS Regression 21 Remarque : Avant d utiliser ces informations et le produit qu elles concernent, lisez les informations générales sous Remarques sur p. 46. Cette version s applique à IBM SPSS Statistics
Plus en détailTABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie
PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats Pierre Dagnelie TABLE DES MATIÈRES 2012 Presses agronomiques de Gembloux pressesagro.gembloux@ulg.ac.be www.pressesagro.be
Plus en détailBiostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke
www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3
Plus en détailFiltrage stochastique non linéaire par la théorie de représentation des martingales
Filtrage stochastique non linéaire par la théorie de représentation des martingales Adriana Climescu-Haulica Laboratoire de Modélisation et Calcul Institut d Informatique et Mathématiques Appliquées de
Plus en détailLa problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites
La problématique des tests Cours V 7 mars 8 Test d hypothèses [Section 6.1] Soit un modèle statistique P θ ; θ Θ} et des hypothèses H : θ Θ H 1 : θ Θ 1 = Θ \ Θ Un test (pur) est une statistique à valeur
Plus en détailLa classification automatique de données quantitatives
La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations
Plus en détailPrécision d un résultat et calculs d incertitudes
Précision d un résultat et calculs d incertitudes PSI* 2012-2013 Lycée Chaptal 3 Table des matières Table des matières 1. Présentation d un résultat numérique................................ 4 1.1 Notations.........................................................
Plus en détailTechniques du Data Mining pour la prédiction de faillite des entreprises et la gestion du risque de crédit
Techniques du Data Mining pour la prédiction de faillite des entreprises et la gestion du risque de crédit Adil Belhouari HEC - Montréal - Journées de l Optimisation 2005-09 Mai 2005 PLAN DE LA PRÉSENTATION
Plus en détailAnalyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés
Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour francour@unice.fr Une grande partie des illustrations viennent
Plus en détailTests du χ 2. on accepte H 0 bonne décision erreur de seconde espèce on rejette H 0 erreur de première espèce bonne décision
Page n 1. Tests du χ 2 une des fonctions des statistiques est de proposer, à partir d observations d un phénomène aléatoire (ou modélisé comme tel) une estimation de la loi de ce phénomène. C est que nous
Plus en détailINF6304 Interfaces Intelligentes
INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie
Plus en détailÉvaluation de la régression bornée
Thierry Foucart UMR 6086, Université de Poitiers, S P 2 M I, bd 3 téléport 2 BP 179, 86960 Futuroscope, Cedex FRANCE Résumé. le modèle linéaire est très fréquemment utilisé en statistique et particulièrement
Plus en détailThéorie des sondages : cours 5
Théorie des sondages : cours 5 Camelia Goga IMB, Université de Bourgogne e-mail : camelia.goga@u-bourgogne.fr Master Besançon-2010 Chapitre 5 : Techniques de redressement 1. poststratification 2. l estimateur
Plus en détailModèles et Méthodes de Réservation
Modèles et Méthodes de Réservation Petit Cours donné à l Université de Strasbourg en Mai 2003 par Klaus D Schmidt Lehrstuhl für Versicherungsmathematik Technische Universität Dresden D 01062 Dresden E
Plus en détailAICp. Vincent Vandewalle. To cite this version: HAL Id: inria-00386678 https://hal.inria.fr/inria-00386678
Sélection prédictive d un modèle génératif par le critère AICp Vincent Vandewalle To cite this version: Vincent Vandewalle. Sélection prédictive d un modèle génératif par le critère AICp. 41èmes Journées
Plus en détail1 Complément sur la projection du nuage des individus
TP 0 : Analyse en composantes principales (II) Le but de ce TP est d approfondir nos connaissances concernant l analyse en composantes principales (ACP). Pour cela, on reprend les notations du précédent
Plus en détailEnjeux mathématiques et Statistiques du Big Data
Enjeux mathématiques et Statistiques du Big Data Mathilde Mougeot LPMA/Université Paris Diderot, mathilde.mougeot@univ-paris-diderot.fr Mathématique en Mouvements, Paris, IHP, 6 Juin 2015 M. Mougeot (Paris
Plus en détailClasse de première L
Classe de première L Orientations générales Pour bon nombre d élèves qui s orientent en série L, la classe de première sera une fin d étude en mathématiques au lycée. On a donc voulu ici assurer à tous
Plus en détailBaccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé
Baccalauréat S ntilles-guyane 11 septembre 14 Corrigé EXERCICE 1 6 points Commun à tous les candidats Une entreprise de jouets en peluche souhaite commercialiser un nouveau produit et à cette fin, effectue
Plus en détailAgrégation des portefeuilles de contrats d assurance vie
Agrégation des portefeuilles de contrats d assurance vie Est-il optimal de regrouper les contrats en fonction de l âge, du genre, et de l ancienneté des assurés? Pierre-O. Goffard Université d été de l
Plus en détailCatalogue des connaissances de base en mathématiques dispensées dans les gymnases, lycées et collèges romands.
Catalogue des connaissances de base en mathématiques dispensées dans les gymnases, lycées et collèges romands. Pourquoi un autre catalogue en Suisse romande Historique En 1990, la CRUS (Conférences des
Plus en détailOptimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications
Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications A. Optimisation sans contrainte.... Généralités.... Condition nécessaire et condition suffisante
Plus en détailRésolution d équations non linéaires
Analyse Numérique Résolution d équations non linéaires Said EL HAJJI et Touria GHEMIRES Université Mohammed V - Agdal. Faculté des Sciences Département de Mathématiques. Laboratoire de Mathématiques, Informatique
Plus en détailPROGRAMME (Susceptible de modifications)
Page 1 sur 8 PROGRAMME (Susceptible de modifications) Partie 1 : Méthodes des revues systématiques Mercredi 29 mai 2013 Introduction, présentation du cours et des participants Rappel des principes et des
Plus en détail«Cours Statistique et logiciel R»
«Cours Statistique et logiciel R» Rémy Drouilhet (1), Adeline Leclercq-Samson (1), Frédérique Letué (1), Laurence Viry (2) (1) Laboratoire Jean Kuntzmann, Dép. Probabilites et Statistique, (2) Laboratoire
Plus en détailSujet 1 : Diagnostique du Syndrome de l apnée du sommeil par des techniques d analyse discriminante.
Sujet 1 : Diagnostique du Syndrome de l apnée du sommeil par des techniques d analyse discriminante. Objectifs et formulation du sujet Le syndrome de l apnée du sommeil (SAS) est un problème de santé publique
Plus en détailCoup de Projecteur sur les Réseaux de Neurones
Coup de Projecteur sur les Réseaux de Neurones Les réseaux de neurones peuvent être utilisés pour des problèmes de prévision ou de classification. La représentation la plus populaire est le réseau multicouche
Plus en détailAnalyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I
Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I Roxane Duroux 1 Cadre de l étude Cette étude s inscrit dans le cadre de recherche de doses pour des essais cliniques
Plus en détail4. Résultats et discussion
17 4. Résultats et discussion La signification statistique des gains et des pertes bruts annualisés pondérés de superficie forestière et du changement net de superficie forestière a été testée pour les
Plus en détaildonnées en connaissance et en actions?
1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)
Plus en détailSoutenance de stage Laboratoire des Signaux et Systèmes
Soutenance de stage Laboratoire des Signaux et Systèmes Bornes inférieures bayésiennes de l'erreur quadratique moyenne. Application à la localisation de points de rupture. M2R ATSI Université Paris-Sud
Plus en détailEXCEL et base de données
EXCEL et base de données 1. Variables et données 2. Saisie de données: quelques règles 3. EXCEL et saisie des données 4. Exemple de tableau EXCEL 5. Éviter d éventuels problèmes 1 1.1 Variables et données
Plus en détailChapitre 2 Le problème de l unicité des solutions
Université Joseph Fourier UE MAT 127 Mathématiques année 2011-2012 Chapitre 2 Le problème de l unicité des solutions Ce que nous verrons dans ce chapitre : un exemple d équation différentielle y = f(y)
Plus en détailTests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles
Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Valentin Patilea 1 Cesar Sanchez-sellero 2 Matthieu Saumard 3 1 CREST-ENSAI et IRMAR 2 USC Espagne 3 IRMAR-INSA
Plus en détailAnalyse statistique de données qualitatives et quantitatives en sciences sociales : TP RÉGRESSION LOGISTIQUE (MODÈLES CHAPITRE 1)
Analyse statistique de données qualitatives et quantitatives en sciences sociales : TP RÉGRESSION LOGISTIQUE (MODÈLES CHAPITRE 1) Modèles de régression logistique à réaliser Une explicative catégorielle
Plus en détailLe théorème des deux fonds et la gestion indicielle
Le théorème des deux fonds et la gestion indicielle Philippe Bernard Ingénierie Economique& Financière Université Paris-Dauphine mars 2013 Les premiers fonds indiciels futent lancés aux Etats-Unis par
Plus en détailRappels sur les suites - Algorithme
DERNIÈRE IMPRESSION LE 14 septembre 2015 à 12:36 Rappels sur les suites - Algorithme Table des matières 1 Suite : généralités 2 1.1 Déition................................. 2 1.2 Exemples de suites............................
Plus en détailCorrection du baccalauréat ES/L Métropole 20 juin 2014
Correction du baccalauréat ES/L Métropole 0 juin 014 Exercice 1 1. c.. c. 3. c. 4. d. 5. a. P A (B)=1 P A (B)=1 0,3=0,7 D après la formule des probabilités totales : P(B)=P(A B)+P(A B)=0,6 0,3+(1 0,6)
Plus en détailValue at Risk. CNAM GFN 206 Gestion d actifs et des risques. Grégory Taillard. 27 février & 13 mars 20061
Value at Risk 27 février & 13 mars 20061 CNAM Gréory Taillard CNAM Master Finance de marché et estion de capitaux 2 Value at Risk Biblioraphie Jorion, Philippe, «Value at Risk: The New Benchmark for Manain
Plus en détailCours de méthodes de scoring
UNIVERSITE DE CARTHAGE ECOLE SUPERIEURE DE STATISTIQUE ET D ANALYSE DE L INFORMATION Cours de méthodes de scoring Préparé par Hassen MATHLOUTHI Année universitaire 2013-2014 Cours de méthodes de scoring-
Plus en détailLa Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1
La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1 La licence Mathématiques et Economie-MASS de l Université des Sciences Sociales de Toulouse propose sur les trois
Plus en détailLe Data Mining au service du Scoring ou notation statistique des emprunteurs!
France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative
Plus en détailFORMULAIRE DE STATISTIQUES
FORMULAIRE DE STATISTIQUES I. STATISTIQUES DESCRIPTIVES Moyenne arithmétique Remarque: population: m xμ; échantillon: Mx 1 Somme des carrés des écarts "# FR MOYENNE(série) MOYENNE(série) NL GEMIDDELDE(série)
Plus en détailEvaluation des modèles non-linéaires à effets mixtes
Evaluation des effets mixtes INSERM UMR738 GDR Statistiques et Santé, 20 octobre 2009 Pharmacométrie Définition modélisation des données obtenues lors d essais cliniques sur des médicaments développement
Plus en détailIntroduction au datamining
Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des
Plus en détailSouad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/
Recherche opérationnelle Les démonstrations et les exemples seront traités en cours Souad EL Bernoussi Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/ Table des matières 1 Programmation
Plus en détailHEC Montréal MODÈLE DE PROBABILITÉ DE DÉFAUT DES PRÊTS D UNE BANQUE CANADIENNE
HEC Montréal MODÈLE DE PROBABILITÉ DE DÉFAUT DES PRÊTS D UNE BANQUE CANADIENNE Par Fatoumata A dite Woybi Touré 11135079 Science de la gestion (Ingénierie financière) Projet supervisé présenté en vue de
Plus en détailLes simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R
Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R Yves Aragon, David Haziza & Anne Ruiz-Gazen GREMAQ, UMR CNRS 5604, Université des Sciences
Plus en détailUne comparaison de méthodes de discrimination des masses de véhicules automobiles
p.1/34 Une comparaison de méthodes de discrimination des masses de véhicules automobiles A. Rakotomamonjy, R. Le Riche et D. Gualandris INSA de Rouen / CNRS 1884 et SMS / PSA Enquêtes en clientèle dans
Plus en détailArbres binaires de décision
1 Arbres binaires de décision Résumé Arbres binaires de décision Méthodes de construction d arbres binaires de décision, modélisant une discrimination (classification trees) ou une régression (regression
Plus en détailProgrammes des classes préparatoires aux Grandes Ecoles
Programmes des classes préparatoires aux Grandes Ecoles Filière : scientifique Voie : Biologie, chimie, physique et sciences de la Terre (BCPST) Discipline : Mathématiques Seconde année Préambule Programme
Plus en détailLa programmation linéaire : une introduction. Qu est-ce qu un programme linéaire? Terminologie. Écriture mathématique
La programmation linéaire : une introduction Qu est-ce qu un programme linéaire? Qu est-ce qu un programme linéaire? Exemples : allocation de ressources problème de recouvrement Hypothèses de la programmation
Plus en détail4.2 Unités d enseignement du M1
88 CHAPITRE 4. DESCRIPTION DES UNITÉS D ENSEIGNEMENT 4.2 Unités d enseignement du M1 Tous les cours sont de 6 ECTS. Modélisation, optimisation et complexité des algorithmes (code RCP106) Objectif : Présenter
Plus en détailProbabilités III Introduction à l évaluation d options
Probabilités III Introduction à l évaluation d options Jacques Printems Promotion 2012 2013 1 Modèle à temps discret 2 Introduction aux modèles en temps continu Limite du modèle binomial lorsque N + Un
Plus en détailSAS ENTERPRISE MINER POUR L'ACTUAIRE
SAS ENTERPRISE MINER POUR L'ACTUAIRE Conférence de l Association des Actuaires I.A.R.D. 07 JUIN 2013 Sylvain Tremblay Spécialiste en formation statistique SAS Canada AGENDA Survol d Enterprise Miner de
Plus en détailProgrammation linéaire
Programmation linéaire DIDIER MAQUIN Ecole Nationale Supérieure d Electricité et de Mécanique Institut National Polytechnique de Lorraine Mathématiques discrètes cours de 2ème année Programmation linéaire
Plus en détailRaisonnement probabiliste
Plan Raisonnement probabiliste IFT-17587 Concepts avancés pour systèmes intelligents Luc Lamontagne Réseaux bayésiens Inférence dans les réseaux bayésiens Inférence exacte Inférence approximative 1 2 Contexte
Plus en détailThéorie de l estimation et de la décision statistique
Théorie de l estimation et de la décision statistique Paul Honeine en collaboration avec Régis Lengellé Université de technologie de Troyes 2013-2014 Quelques références Decision and estimation theory
Plus en détailMéthodes de Simulation
Méthodes de Simulation JEAN-YVES TOURNERET Institut de recherche en informatique de Toulouse (IRIT) ENSEEIHT, Toulouse, France Peyresq06 p. 1/41 Remerciements Christian Robert : pour ses excellents transparents
Plus en détailMODELE A CORRECTION D ERREUR ET APPLICATIONS
MODELE A CORRECTION D ERREUR ET APPLICATIONS Hélène HAMISULTANE Bibliographie : Bourbonnais R. (2000), Econométrie, DUNOD. Lardic S. et Mignon V. (2002), Econométrie des Séries Temporelles Macroéconomiques
Plus en détailStatistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier
Statistiques Appliquées à l Expérimentation en Sciences Humaines Christophe Lalanne, Sébastien Georges, Christophe Pallier Table des matières 1 Méthodologie expérimentale et recueil des données 6 1.1 Introduction.......................................
Plus en détailCAPTEURS - CHAINES DE MESURES
CAPTEURS - CHAINES DE MESURES Pierre BONNET Pierre Bonnet Master GSI - Capteurs Chaînes de Mesures 1 Plan du Cours Propriétés générales des capteurs Notion de mesure Notion de capteur: principes, classes,
Plus en détailChapitre 7. Récurrences
Chapitre 7 Récurrences 333 Plan 1. Introduction 2. Applications 3. Classification des récurrences 4. Résolution de récurrences 5. Résumé et comparaisons Lectures conseillées : I MCS, chapitre 20. I Rosen,
Plus en détailL analyse d images regroupe plusieurs disciplines que l on classe en deux catégories :
La vision nous permet de percevoir et d interpreter le monde qui nous entoure. La vision artificielle a pour but de reproduire certaines fonctionnalités de la vision humaine au travers de l analyse d images.
Plus en détailApprentissage Automatique
Apprentissage Automatique Introduction-I jean-francois.bonastre@univ-avignon.fr www.lia.univ-avignon.fr Définition? (Wikipedia) L'apprentissage automatique (machine-learning en anglais) est un des champs
Plus en détailTests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA
Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA Soutenance de doctorat, sous la direction de Pr. Bilodeau, M. et Pr. Ducharme, G. Université de Montréal et Université
Plus en détailFeuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.
Université de Nantes Année 2013-2014 L3 Maths-Eco Feuille 6 : Tests Exercice 1 On cherche à connaître la température d ébullition µ, en degrés Celsius, d un certain liquide. On effectue 16 expériences
Plus en détailPROJET MODELE DE TAUX
MASTER 272 INGENIERIE ECONOMIQUE ET FINANCIERE PROJET MODELE DE TAUX Pricing du taux d intérêt des caplets avec le modèle de taux G2++ Professeur : Christophe LUNVEN 29 Fevrier 2012 Taylan KUNAL - Dinh
Plus en détailMCMC et approximations en champ moyen pour les modèles de Markov
MCMC et approximations en champ moyen pour les modèles de Markov Gersende FORT LTCI CNRS - TELECOM ParisTech En collaboration avec Florence FORBES (Projet MISTIS, INRIA Rhône-Alpes). Basé sur l article:
Plus en détailEconomie de l incertain et de l information Partie 1 : Décision en incertain probabilisé Chapitre 1 : Introduction à l incertitude et théorie de
Economie de l incertain et de l information Partie 1 : Décision en incertain probabilisé Chapitre 1 : Introduction à l incertitude et théorie de l espérance d utilité Olivier Bos olivier.bos@u-paris2.fr
Plus en détailIntroduction au Data-Mining
Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme
Plus en détail(Customer Relationship Management, «Gestion de la Relation Client»)
(Customer Relationship Management, «Gestion de la Relation Client») Les Banques et sociétés d assurance sont aujourd'hui confrontées à une concurrence de plus en plus vive et leur stratégie " clientèle
Plus en détailListe des notes techniques... xxi Liste des encadrés... xxiii Préface à l édition internationale... xxv Préface à l édition francophone...
Liste des notes techniques.................... xxi Liste des encadrés....................... xxiii Préface à l édition internationale.................. xxv Préface à l édition francophone..................
Plus en détailThéorèmes de Point Fixe et Applications 1
Théorèmes de Point Fixe et Applications 1 Victor Ginsburgh Université Libre de Bruxelles et CORE, Louvain-la-Neuve Janvier 1999 Published in C. Jessua, C. Labrousse et D. Vitry, eds., Dictionnaire des
Plus en détailLogiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS
Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence
Plus en détailTempérature corporelle d un castor (une petite introduction aux séries temporelles)
Température corporelle d un castor (une petite introduction aux séries temporelles) GMMA 106 GMMA 106 2014 2015 1 / 32 Cas d étude Temperature (C) 37.0 37.5 38.0 0 20 40 60 80 100 Figure 1: Temperature
Plus en détailPremière partie. Préliminaires : noyaux itérés. MPSI B 6 juin 2015
Énoncé Soit V un espace vectoriel réel. L espace vectoriel des endomorphismes de V est désigné par L(V ). Lorsque f L(V ) et k N, on désigne par f 0 = Id V, f k = f k f la composée de f avec lui même k
Plus en détailDETERMINATION DE L INCERTITUDE DE MESURE POUR LES ANALYSES CHIMIQUES QUANTITATIVES
Agence fédérale pour la Sécurité de la Chaîne alimentaire Administration des Laboratoires Procédure DETERMINATION DE L INCERTITUDE DE MESURE POUR LES ANALYSES CHIMIQUES QUANTITATIVES Date de mise en application
Plus en détailSOMMAIRE OPÉRATIONS COURANTES OPÉRATIONS D INVENTAIRE
SOMMAIRE OPÉRATIONS COURANTES OPÉRATIONS D INVENTAIRE 1 Factures de doit p. 9 Processus 1 2 Réductions sur factures de doit p. 11 Processus 1 3 Frais accessoires sur factures p. 13 Processus 1 4 Comptabilisation
Plus en détailPREPROCESSING PAR LISSAGE LOESS POUR ACP LISSEE
PREPROCESSING PAR LISSAGE LOESS POUR ACP LISSEE Jean-Paul Valois, Claude Mouret & Nicolas Pariset Total, 64018 Pau Cédex MOTS CLEFS : Analyse spatiale, ACP, Lissage, Loess PROBLEMATIQUE En analyse multivariée,
Plus en détail