Régression en composantes principales en sondages
|
|
- Jean-Baptiste Cantin
- il y a 7 ans
- Total affichages :
Transcription
1 Régression en composantes principales en sondages (en collaboration avec H. Cardot, M.-A.Shehzad et A. Vanheuverzwyn) IMB, Université de Bourgogne-Dijon et Médiamétrie 7ème Colloque sur les Sondages 5-7 Novembre ENSAI 1/30
2 Plan de l exposé 1 Motivation : exemple des enquêtes sur l audience (Médiamétrie) 2 Calage sur composantes principales : information auxiliaire complète 3 Calage sur composantes principales estimées 4 Application sur les données Médiamétrie 2/30
3 Motivation : enquête sur l audience à Médiamétrie 3/30
4 L enquête sur l audience à Médiamétrie Information auxiliaire : information externe (recensement ou une autre enquête) en lien avec les objectifs de l enquête en cours ; Objectif : améliorer la précision des estimations en l utilisant au niveau de l échantillonnage ou de l estimation ; Enquêtes à Médiamétrie : mesurent l audience de la télévision en France passage au numérique et l apparition de la TNT : les données sont de plus en plus nombreuses ; développement des offres numériques avec voie de retour permet de savoir à chaque instant, le nombre de boîtiers allumés sur chaque chaîne. Comment utiliser autant d information auxiliaire? 4/30
5 Cadre et notations Soit la population U = {1,..., k,..., N} On sélectionne un échantillon s U de taille n selon p(s) ; les probabilités d inclusion π k et π kl Soit Y la variable d intérêt et on veut estimer t y = U y k X 1,..., X p variables auxiliaires : âge, CSP, région Insee... x k = (X 1k,..., X pk ) pour k = 1,..., N X = (x 1,..., x N ) L estimateur d Horvitz-Thompson (HT) sans information auxiliaire : ˆt yd = y k = d k y k π s k s 5/30
6 Estimation en présence du sur-calage Difficultés possibles On suppose que le nombre de variables auxiliaires (ou de calage) est très grand. 1 des poids w k négatifs ou trop grands. 2 utiliser trop de variables de calage peut augmenter la variance (Silva and Skinner, 1997) Solutions : 1 choisir les variables les plus pertinentes ; 2 utiliser une inverse généralisée (solution proposée dans CAL- MAR2) ; 3 relâcher les équations de calage. 6/30
7 Motivation : enquête sur l audience à Médiamétrie 7/30
8 Construction des composantes principales (CP) Soient λ 1 λ 2... λ p > 0 les valeurs propres de N 1 X X et v 1,..., v p les vecteurs propres associés : ( ) N 1 X X v j = λ j v j, j = 1,..., p. Les composantes principales de X, notées Z 1,..., Z p, sont les combinaisons linéaires de variables de départ, X 1,..., X p et qui contiennent le maximum d information. Z j = Xv j, j = 1,..., p. On ne garde que les r premières CP correspondant aux r plus grandes valeurs propres, avec r << p. 8/30
9 Utilisation de l Soient les nouvelles variables Z 1,..., Z r où Z j = (z kj ) k U, et les z kj, k U s appellent les scores de Z j. La matrice d information auxiliaire est maintenant donnée par avec z k = (z k1,..., z kr ). Z = (Z 1,..., Z r ) = (z k ) k U On réduit le problème de p variables de départ X 1,..., X p à r nouvelles variables, Z 1,..., Z r conservant le maximum de variabilité. 9/30
10 Calage sur composantes principales On utilise comme variables de calage les r composantes principales, Z 1,..., Z r Objectif (avec la distance de chi-deux) : trouver des poids de calage w = (w k ) k s qui vérifient (w k d k ) 2 w = argmin w k s d k ˆt w,zj = t Zj pour j = 1,..., r. Les équations de calage peuvent être écrites sous la forme k s w k z k = k U z k 10/30
11 L estimateur dépend d un paramètre r à choisir : r = 0 : on obtient l estimateur d Horvitz-Thompson ˆt yd qui n utilise pas d information auxiliaire. r = p : on obtient l estimateur calé sur les p variables de départ. Il faut trouver le bon compromis. L estimateur par calage du total, ˆt w,p C = k s w ky k, est un estimateur par la régression généralisée : ˆt w,p C = ˆt yd (ˆt zd t z ) ˆβZ où ( ) 1 ˆβ Z = d k z k z T k d k z k y k. k s k s 11/30
12 Lien avec l approche model-assisted Soit le modèle linéaire On peut montrer que ξ : y k = x k β + ε k, k U ˆt w,p C = ˆt yd (ˆt xd t x ) ˆβP C, ˆβ P C = (v 1,..., v r ) ˆβZ. L estimateur ˆt w,p C est un estimateur de type model-assisted linéaire quand le coefficient de régression β est estimé par ˆβ P C. L estimateur ˆt w,p C est biaisé sous le plan p( ) ainsi que sous le modèle ξ, mais il est sans biais sous le plan et le modèle, Bias p,ξ (ˆt w,p C t y ) = 0. 12/30
13 Calage sur le moment d ordre deux Pour des variables X j standardisées, les CPs ont la propriété suivante : 1 N Z jz j = 1 zkj 2 = λ j, j = 1,..., p N k U On peut considérer un calage sur le moment d ordre deux des CPs (Ren, 2000) avec Z 2 j = (z2 jk ) k U. w c (w k d k ) 2 = argmin w d k q k ˆt w,zj = t Zj, j = 1,..., r ˆt w,z 2 j = t Z 2 j, j = 1,..., r s et 13/30
14 Motivation : enquête sur l audience à Médiamétrie 14/30
15 Estimation des composantes principales On a besoin de connaître x k pour tous les k U pour pouvoir déterminer les valeurs et vecteurs propres de la matrice de variance-covariance 1 N X X = 1 N U x kx k. Il est possible d étendre cette approche pour le cas où on ne connaît x k que sur l échantillon mais avec des totaux k U x k connus ; On centre les variables dans la population (on connaît leur moyennes) et on les réduit dans l échantillon ; 15/30
16 On estime la matrice de variance-covariance par ˆΓ = 1ˆN d k (x k ˆX)(x k ˆX) s Soient ˆλ j, ˆv j les valeurs, resp. les vecteurs propres de ˆΓ, ˆΓˆv j = ˆλ j ˆv j, j = 1,..., p On estime les composantes Z j par Ẑ j = Xˆv j. On prend comme variables de calage Ẑj, j = 1,..., r de totaux connus. 16/30
17 L estimateur par calage sur les composantes principales estimées Ẑj, est donné par ˆt w,p C = ˆt yd (ˆtẑd ) tẑ ˆβẐ = ˆt yd (ˆt xd t x ) ˆβ P C où ( ) 1 ˆβẐ = d k ẑ k ẑ T k d k ẑ k y k. k s k s ˆβ P C = (ˆv 1,..., ˆv r )ˆβẐ. 17/30
18 Hypothèses On suppose que : (A1) π k > λ > 0 pour tous k U; (A2) lim N n max k l π kl π k π l <. 1 (A3) lim N N U y2 k <. n (A4) lim N N = π (0, 1). (A5) x k < pour tous k U. Alors, ˆβẐ β Z = o p (1) avec β Z = ( k U z kz T k ) 1 k U z ky k et N 1 (ˆt w,p C t y ) = N 1 (ˆt diff t y ) + o p (n 1/2 ) où ˆt diff = ˆt yd (ˆt zd t z ) βz. 18/30
19 Motivation : enquête sur l audience à Médiamétrie 19/30
20 Données Médiamétrie (1) Population d étude U composée de N = individus qui regardent une chaîne de TV sur deux semaines consécutives de septembre 2010 ; Le paramètre d intérêt : la durée totale d écoute sur lundi de la deuxième semaine ; La variable Y contient beaucoup de zéros (plus de 30%). On considère un échantillon s de taille n = 500 tiré par sondage aléatoire simple sans remise dans U. 20/30
21 Données Médiamétrie : Information auxiliaire 19 variables qualitatives de type socio-démographique (région, sexe, CSP, internet... ) avec 52 modalités en tout ; age : en continu ; On considère de plus comme variable auxiliaire la durée totale d écoute pour la première semaine de septembre 2010 : avec cette variable, on a R 2 = 0.50, sans cette variable, on a R 2 = Matrice d information auxiliaire X de dimension ; La matrice X contient l intercept ; on calcule les CP de X sans l intercept (et après avoir centré et réduit) et la matrice des CP est [1 Z 1... Z p 1 ]. 21/30
22 Estimation On sélectionne un échantillon s de taille n = 500 selon un plan aléatoire simple sans remise dans U. On considère n.sim = 1000 simulations. L estimateur GREG ne marche pas toujours car la matrice X sπ s X s a beaucoup de fois λ min égale à zéro). On utilise l inverse généralisée. 22/30
23 Comparaison entre ˆt ridge, ˆt P C et ˆt HT biais relatif : plus petit que 0.2%. B b=1 RB = ˆθ (j) /B t y le rapport de variances (sur les B échantillons), par rapport à l estimateur de Horvitz-Thompson ˆt (b) yd, var θ var HT = 1 B 1 B t y B b=1 (ˆθ (b) t y ) 2 B (b) b=1 (ˆt yd t y). 2 23/30
24 Gain par rapport a l'estimateur de Horvitz-Thompson rapport var(pc)/var(ht) nombre de cp en bleu : le rapport entre la variance de l estimateur obtenu par calage exact (calculé avec l inverse généralisée) et l estimateur d Horvitz-Thompson ; 24/30
25 Coefficient de variation des poids en fonction de r et de n Coefficient de variation des poids pour n=500 et simulations CV moyen sur 1000 simulations GREG Le coefficient de variation des poids cv(w) = 1000 simulations. var(w) w nombre de CP est calculé pour 25/30
26 Etude avec calage pénalisé On calcule les poids ridge pour 150 valeurs de λ : λ = 4 2 h, h [ 25, 25] On calcule l estimateur par calage pénalisé ou ridge ˆt w,λ pour chaque λ et pour B = 500 simulations. On compare la variance de ˆt w,λ lors de 500 simulations avec la variance de ˆt yd On remarque (dans le graphique log 2 (λ) [ 23, 27]) 1 pour λ grand, ˆt w,λ est aussi efficace que l estimateur d Horvitz- Thompson 2 pour λ très proche de zéro, on a un gain très important. 26/30
27 Gain par rapport à l'estimateur HT Rapport de variances var(ridge)/var(ht) Log(K) 27/30
28 Nous avons répété 10 fois la simulation. pour K petit, le gain est important ; pour K grand, l estimator ˆt ridge s approche de ˆt HT. 28/30
29 Conclusion et perspectives On propose une nouvelle méthode pour réduire le grand nombre de variables auxiliaires en sondages ; Cette méthode est facilement mise en oeuvre ; Elle a l avantage par rapport à la régression ridge de pouvoir faire un calage sur le moment d ordre deux ; Elle permet d obtenir de gains importants en termes de variance ; 29/30
30 Courte bibliographie Chambers, R. (1996), Robust case-weighting for multi-purpose establishments surveys, Journal of official statistics, vol.12, 1996, 3-32 ; Deville, J.-C., Variance estimation for complex statistics and estimators : linearization and residual techniques. Survey Methodology 25, Deville, J.-C., Särndal, C.-E., Calibration estimators in survey sampling. Journal of the American Statistical Association 87, Rao, J.N.K. and Singh, A.C. (2009), Range restricted weight calibration for survey data using ridge regression, Pakistan Journal of Statistics, 25, Ren, R. (2000), Utilisation d information auxiliaire par calage sur fonction de répartition, thèse de l Université Paris Dauphine. Silva, P.L.N. and Skinner, C. (1997). Variable selection for regression estimation in finite population, Survey Methodology, 23, Tillé, Y. and Guggemos, F., (2010) Penalized calibration in survey sampling : Design-based estimation assisted by mixed models. Journal of Statistical Planning and Inference 140 (2010) /30
Approche modèle pour l estimation en présence de non-réponse non-ignorable en sondage
Approche modèle pour l estimation en présence de non-réponse non-ignorable en sondage Journées de Méthodologie Statistique Eric Lesage Crest-Ensai 25 janvier 2012 Introduction et contexte 2/27 1 Introduction
Plus en détailThéorie des sondages : cours 5
Théorie des sondages : cours 5 Camelia Goga IMB, Université de Bourgogne e-mail : camelia.goga@u-bourgogne.fr Master Besançon-2010 Chapitre 5 : Techniques de redressement 1. poststratification 2. l estimateur
Plus en détailCritère du choix des variables auxiliaires à utiliser dans l'estimateur par calage
des variables auxiliaires à utiliser dans l'estimateur par calage Mohammed El Haj Tirari Institut National de Statistique et d'economie Appliquée - roc Laboratoire de Statistique d'enquêtes, CREST - Ensai
Plus en détailLes simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R
Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R Yves Aragon, David Haziza & Anne Ruiz-Gazen GREMAQ, UMR CNRS 5604, Université des Sciences
Plus en détailTests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles
Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Valentin Patilea 1 Cesar Sanchez-sellero 2 Matthieu Saumard 3 1 CREST-ENSAI et IRMAR 2 USC Espagne 3 IRMAR-INSA
Plus en détailAnalyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés
Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour francour@unice.fr Une grande partie des illustrations viennent
Plus en détailLa nouvelle planification de l échantillonnage
La nouvelle planification de l échantillonnage Pierre-Arnaud Pendoli Division Sondages Plan de la présentation Rappel sur le Recensement de la population (RP) en continu Description de la base de sondage
Plus en détailCONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)
CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un
Plus en détailTP1 Méthodes de Monte Carlo et techniques de réduction de variance, application au pricing d options
Université de Lorraine Modélisation Stochastique Master 2 IMOI 2014-2015 TP1 Méthodes de Monte Carlo et techniques de réduction de variance, application au pricing d options 1 Les options Le but de ce
Plus en détailSouad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/
Recherche opérationnelle Les démonstrations et les exemples seront traités en cours Souad EL Bernoussi Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/ Table des matières 1 Programmation
Plus en détailTESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION
TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION Bruno Saussereau Laboratoire de Mathématiques de Besançon Université de Franche-Comté Travail en commun
Plus en détailTABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie
PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats Pierre Dagnelie TABLE DES MATIÈRES 2012 Presses agronomiques de Gembloux pressesagro.gembloux@ulg.ac.be www.pressesagro.be
Plus en détail23. Interprétation clinique des mesures de l effet traitement
23. Interprétation clinique des mesures de l effet traitement 23.1. Critères de jugement binaires Plusieurs mesures (indices) sont utilisables pour quantifier l effet traitement lors de l utilisation d
Plus en détailCours d Analyse. Fonctions de plusieurs variables
Cours d Analyse Fonctions de plusieurs variables Licence 1ère année 2007/2008 Nicolas Prioux Université de Marne-la-Vallée Table des matières 1 Notions de géométrie dans l espace et fonctions à deux variables........
Plus en détailLa problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites
La problématique des tests Cours V 7 mars 8 Test d hypothèses [Section 6.1] Soit un modèle statistique P θ ; θ Θ} et des hypothèses H : θ Θ H 1 : θ Θ 1 = Θ \ Θ Un test (pur) est une statistique à valeur
Plus en détailIntroduction à l approche bootstrap
Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?
Plus en détailSéminaire TEST. 1 Présentation du sujet. October 18th, 2013
Séminaire ES Andrés SÁNCHEZ PÉREZ October 8th, 03 Présentation du sujet Le problème de régression non-paramétrique se pose de la façon suivante : Supposons que l on dispose de n couples indépendantes de
Plus en détailDéroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI
1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage
Plus en détailFiltrage stochastique non linéaire par la théorie de représentation des martingales
Filtrage stochastique non linéaire par la théorie de représentation des martingales Adriana Climescu-Haulica Laboratoire de Modélisation et Calcul Institut d Informatique et Mathématiques Appliquées de
Plus en détailAnalyse empirique et modélisation de la dynamique de la topologie de l Internet
Analyse empirique et modélisation de la dynamique de la topologie de l Internet Sergey Kirgizov Directrice de thèse: Clémence Magnien Complex Networks, LIP6, (UPMC, CNRS) Paris, 12 décembre 2014 Plan 1
Plus en détailEnjeux mathématiques et Statistiques du Big Data
Enjeux mathématiques et Statistiques du Big Data Mathilde Mougeot LPMA/Université Paris Diderot, mathilde.mougeot@univ-paris-diderot.fr Mathématique en Mouvements, Paris, IHP, 6 Juin 2015 M. Mougeot (Paris
Plus en détailApprentissage non paramétrique en régression
1 Apprentissage non paramétrique en régression Apprentissage non paramétrique en régression Résumé Différentes méthodes d estimation non paramétriques en régression sont présentées. Tout d abord les plus
Plus en détailÉvaluation de la régression bornée
Thierry Foucart UMR 6086, Université de Poitiers, S P 2 M I, bd 3 téléport 2 BP 179, 86960 Futuroscope, Cedex FRANCE Résumé. le modèle linéaire est très fréquemment utilisé en statistique et particulièrement
Plus en détailTABLE DES MATIERES. C Exercices complémentaires 42
TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence
Plus en détailAICp. Vincent Vandewalle. To cite this version: HAL Id: inria-00386678 https://hal.inria.fr/inria-00386678
Sélection prédictive d un modèle génératif par le critère AICp Vincent Vandewalle To cite this version: Vincent Vandewalle. Sélection prédictive d un modèle génératif par le critère AICp. 41èmes Journées
Plus en détailL exclusion mutuelle distribuée
L exclusion mutuelle distribuée L algorithme de L Amport L algorithme est basé sur 2 concepts : L estampillage des messages La distribution d une file d attente sur l ensemble des sites du système distribué
Plus en détailModélisation aléatoire en fiabilité des logiciels
collection Méthodes stochastiques appliquées dirigée par Nikolaos Limnios et Jacques Janssen La sûreté de fonctionnement des systèmes informatiques est aujourd hui un enjeu économique et sociétal majeur.
Plus en détailSAS ENTERPRISE MINER POUR L'ACTUAIRE
SAS ENTERPRISE MINER POUR L'ACTUAIRE Conférence de l Association des Actuaires I.A.R.D. 07 JUIN 2013 Sylvain Tremblay Spécialiste en formation statistique SAS Canada AGENDA Survol d Enterprise Miner de
Plus en détailModèles et Méthodes de Réservation
Modèles et Méthodes de Réservation Petit Cours donné à l Université de Strasbourg en Mai 2003 par Klaus D Schmidt Lehrstuhl für Versicherungsmathematik Technische Universität Dresden D 01062 Dresden E
Plus en détailFONCTION DE DEMANDE : REVENU ET PRIX
FONCTION DE DEMANDE : REVENU ET PRIX 1. L effet d une variation du revenu. Les lois d Engel a. Conditions du raisonnement : prix et goûts inchangés, variation du revenu (statique comparative) b. Partie
Plus en détailOscillations libres des systèmes à deux degrés de liberté
Chapitre 4 Oscillations libres des systèmes à deux degrés de liberté 4.1 Introduction Les systèmes qui nécessitent deux coordonnées indépendantes pour spécifier leurs positions sont appelés systèmes à
Plus en détailEtude des propriétés empiriques du lasso par simulations
Etude des propriétés empiriques du lasso par simulations L objectif de ce TP est d étudier les propriétés empiriques du LASSO et de ses variantes à partir de données simulées. Un deuxième objectif est
Plus en détailUne introduction. Lionel RIOU FRANÇA. Septembre 2008
Une introduction INSERM U669 Septembre 2008 Sommaire 1 Effets Fixes Effets Aléatoires 2 Analyse Classique Effets aléatoires Efficacité homogène Efficacité hétérogène 3 Estimation du modèle Inférence 4
Plus en détailFaut-il pondérer? ...Ou l'éternelle question de l'économètre confronté à un problème de sondage. Laurent Davezies et Xavier D'Haultf uille.
Faut-il pondérer?...ou l'éternelle question de l'économètre confronté à un problème de sondage Laurent Davezies et Xavier D'Haultf uille Juin 2009 Résumé Ce papier précise dans quels cas les estimations
Plus en détailThéorie de l estimation et de la décision statistique
Théorie de l estimation et de la décision statistique Paul Honeine en collaboration avec Régis Lengellé Université de technologie de Troyes 2013-2014 Quelques références Decision and estimation theory
Plus en détailLA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers
Plus en détailNOTE SUR LA MODELISATION DU RISQUE D INFLATION
NOTE SUR LA MODELISATION DU RISQUE D INFLATION 1/ RESUME DE L ANALYSE Cette étude a pour objectif de modéliser l écart entre deux indices d inflation afin d appréhender le risque à très long terme qui
Plus en détailModèle de calcul des paramètres économiques
Modèle de calcul des paramètres économiques selon norme SIA 480 Calcul de rentabilité pour les investissements dans le bâtiment Version 3.2 1. Introduction 1.1 Version Excel Le modèle de calcul a été développé
Plus en détailAnalyse de la variance Comparaison de plusieurs moyennes
Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction
Plus en détailExercice : la frontière des portefeuilles optimaux sans actif certain
Exercice : la frontière des portefeuilles optimaux sans actif certain Philippe Bernard Ingénierie Economique & Financière Université Paris-Dauphine Février 0 On considère un univers de titres constitué
Plus en détailStatistiques à une variable
Statistiques à une variable Calcul des paramètres statistiques TI-82stats.fr? Déterminer les paramètres de la série statistique : Valeurs 0 2 3 5 8 Effectifs 16 12 28 32 21? Accès au mode statistique Touche
Plus en détailEconomie de l incertain et de l information Partie 1 : Décision en incertain probabilisé Chapitre 1 : Introduction à l incertitude et théorie de
Economie de l incertain et de l information Partie 1 : Décision en incertain probabilisé Chapitre 1 : Introduction à l incertitude et théorie de l espérance d utilité Olivier Bos olivier.bos@u-paris2.fr
Plus en détailChristophe CANDILLIER Cours de DataMining mars 2004 Page 1
Christophe CANDILLIER Cours de DataMining mars 2004 age 1 1. Introduction 2. rocessus du DataMining 3. Analyse des données en DataMining 4. Analyse en Ligne OLA 5. Logiciels 6. Bibliographie Christophe
Plus en détailFORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)
87 FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc) Dans le cadre de la réforme pédagogique et de l intérêt que porte le Ministère de l Éducation
Plus en détailCentre d'etudes Nucléaires de Fontenay-aux-Roses Direction des Piles Atomiques Département des Etudes de Piles
CEA-N-1195 Note CEA-N-1195 Centre d'etudes Nucléaires de Fontenay-aux-Roses Direction des Piles Atomiques Département des Etudes de Piles Service d'etudes de Protections de Piles PROPAGATION DES NEUTRONS
Plus en détailProbabilités sur un univers fini
[http://mp.cpgedupuydelome.fr] édité le 7 août 204 Enoncés Probabilités sur un univers fini Evènements et langage ensembliste A quelle condition sur (a, b, c, d) ]0, [ 4 existe-t-il une probabilité P sur
Plus en détailArticle. Mesure du fardeau de réponse à l Office for National Statistics du Royaume-Uni. par Denise Williams, Sarah Green et Jacqui Jones
Composante du produit n o 11-522-X au catalogue de Statistique Canada La série des symposiums internationaux de Statistique Canada : recueil Article Symposium 2008 : Collecte des données : défis, réalisations
Plus en détailTABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.
STATISTIQUE THÉORIQUE ET APPLIQUÉE Tome 2 Inférence statistique à une et à deux dimensions Pierre Dagnelie TABLE DES MATIÈRES Bruxelles, De Boeck, 2011, 736 p. ISBN 978-2-8041-6336-5 De Boeck Services,
Plus en détailÉconométrie, causalité et analyse des politiques
Économétrie, causalité et analyse des politiques Jean-Marie Dufour Université de Montréal October 2006 This work was supported by the Canada Research Chair Program (Chair in Econometrics, Université de
Plus en détailFORMULAIRE DE STATISTIQUES
FORMULAIRE DE STATISTIQUES I. STATISTIQUES DESCRIPTIVES Moyenne arithmétique Remarque: population: m xμ; échantillon: Mx 1 Somme des carrés des écarts "# FR MOYENNE(série) MOYENNE(série) NL GEMIDDELDE(série)
Plus en détailCodage d information. Codage d information : -Définition-
Introduction Plan Systèmes de numération et Représentation des nombres Systèmes de numération Système de numération décimale Représentation dans une base b Représentation binaire, Octale et Hexadécimale
Plus en détailResolution limit in community detection
Introduction Plan 2006 Introduction Plan Introduction Introduction Plan Introduction Point de départ : un graphe et des sous-graphes. But : quantifier le fait que les sous-graphes choisis sont des modules.
Plus en détailTests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA
Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA Soutenance de doctorat, sous la direction de Pr. Bilodeau, M. et Pr. Ducharme, G. Université de Montréal et Université
Plus en détailNon-réponse et données manquantes. Sylvie Rousseau & Gilbert Saporta décembre 2011
Non-réponse et données manquantes Sylvie Rousseau & Gilbert Saporta décembre 2011 1 EXEMPLES DE TAUX DE RÉPONSE À CERTAINES ENQUÊTES Pour les enquêtes auprès des entreprises, le taux de non-réponse est
Plus en détailLa Recherche du Point Optimum de Fonctionnement d un Générateur Photovoltaïque en Utilisant les Réseaux NEURO-FLOUS
Rev. Energ. Ren. : Chemss 2000 39-44 La Recherche du Point Optimum de Fonctionnement d un Générateur Photovoltaïque en Utilisant les Réseaux NEURO-FLOUS D.K. Mohamed, A. Midoun et F. Safia Département
Plus en détailProbabilités. I Petits rappels sur le vocabulaire des ensembles 2 I.1 Définitions... 2 I.2 Propriétés... 2
Probabilités Table des matières I Petits rappels sur le vocabulaire des ensembles 2 I.1 s................................................... 2 I.2 Propriétés...................................................
Plus en détailMini_guide_Isis.pdf le 23/09/2001 Page 1/14
1 Démarrer...2 1.1 L écran Isis...2 1.2 La boite à outils...2 1.2.1 Mode principal...3 1.2.2 Mode gadgets...3 1.2.3 Mode graphique...3 2 Quelques actions...4 2.1 Ouvrir un document existant...4 2.2 Sélectionner
Plus en détailChapitre 3. Quelques fonctions usuelles. 1 Fonctions logarithme et exponentielle. 1.1 La fonction logarithme
Chapitre 3 Quelques fonctions usuelles 1 Fonctions logarithme et eponentielle 1.1 La fonction logarithme Définition 1.1 La fonction 7! 1/ est continue sur ]0, +1[. Elle admet donc des primitives sur cet
Plus en détailModélisation géostatistique des débits le long des cours d eau.
Modélisation géostatistique des débits le long des cours d eau. C. Bernard-Michel (actuellement à ) & C. de Fouquet MISTIS, INRIA Rhône-Alpes. 655 avenue de l Europe, 38334 SAINT ISMIER Cedex. Ecole des
Plus en détailCCP PSI - 2010 Mathématiques 1 : un corrigé
CCP PSI - 00 Mathématiques : un corrigé Première partie. Définition d une structure euclidienne sur R n [X]... B est clairement symétrique et linéaire par rapport à sa seconde variable. De plus B(P, P
Plus en détailCHAPITRE IV Oscillations libres des systèmes à plusieurs degrés de liberté
CHAPITE IV Oscillations ibres des Systèmes à plusieurs derés de liberté 010-011 CHAPITE IV Oscillations libres des systèmes à plusieurs derés de liberté Introduction : Dans ce chapitre, nous examinons
Plus en détailPacte de responsabilité et de solidarité. Réunion du 6 juin 2014 AGEN
Pacte de responsabilité et de solidarité Réunion du 6 juin 2014 AGEN 5 années de croissance perdues 1 850 Volume de la production nationale en milliard d'euros constants (valeur 2005) 1 800 1 750 1 700
Plus en détailIntégration de la dimension sémantique dans les réseaux sociaux
Intégration de la dimension sémantique dans les réseaux sociaux Application : systèmes de recommandation Maria Malek LARIS-EISTI maria.malek@eisti.fr 1 Contexte : Recommandation dans les réseaux sociaux
Plus en détailChapitre 3. Les distributions à deux variables
Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles
Plus en détailLes débats sur l évolution des
D o c u m e n t d e t r a v a i l d e l a B r a n c h e R e t r a i t e s d e l a C a i s s e d e s d é p ô t s e t c o n s i g n a t i o n s n 9 8-0 7 C o n t a c t : La u re nt V e r n i è r e 0 1 4
Plus en détailArticle. Peut-on établir des statistiques officielles à partir d enquêtes en ligne reposant sur le principe de l autosélection? par Jelke Bethlehem
Composante du produit n o -5-X au catalogue de Statistique Canada La série des symposiums internationaux de Statistique Canada : recueil Article Symposium 008 : Collecte des données : défis, réalisations
Plus en détailEVALUATION DE LA QUALITE DES SONDAGES EN LIGNE : CAS D UN SONDAGE D OPINION AU BURKINA FASO
EVALUATION DE LA QUALITE DES SONDAGES EN LIGNE : CAS D UN SONDAGE D OPINION AU BURKINA FASO Auteur Baguinébié Bazongo 1 Ingénieur Statisticien Economiste Chef de l Unité de recherche à l Institut national
Plus en détailMODELES DE DUREE DE VIE
MODELES DE DUREE DE VIE Cours 1 : Introduction I- Contexte et définitions II- Les données III- Caractéristiques d intérêt IV- Evènements non renouvelables/renouvelables (unique/répété) I- Contexte et définitions
Plus en détailProbabilités III Introduction à l évaluation d options
Probabilités III Introduction à l évaluation d options Jacques Printems Promotion 2012 2013 1 Modèle à temps discret 2 Introduction aux modèles en temps continu Limite du modèle binomial lorsque N + Un
Plus en détailFeuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.
Université de Nantes Année 2013-2014 L3 Maths-Eco Feuille 6 : Tests Exercice 1 On cherche à connaître la température d ébullition µ, en degrés Celsius, d un certain liquide. On effectue 16 expériences
Plus en détail1 Complément sur la projection du nuage des individus
TP 0 : Analyse en composantes principales (II) Le but de ce TP est d approfondir nos connaissances concernant l analyse en composantes principales (ACP). Pour cela, on reprend les notations du précédent
Plus en détailOptimisation Combinatoire et Colonies de Fourmis Nicolas Monmarche April 21, 1999 Sommaire Inspiration biologiques Ant Colony Optimization Applications TSP QAP Flow Shop Problemes dynamiques 1 Historique
Plus en détailMémoire d actuariat - promotion 2010. complexité et limites du modèle actuariel, le rôle majeur des comportements humains.
Mémoire d actuariat - promotion 2010 La modélisation des avantages au personnel: complexité et limites du modèle actuariel, le rôle majeur des comportements humains. 14 décembre 2010 Stéphane MARQUETTY
Plus en détailFiltres passe-bas. On utilise les filtres passe-bas pour réduire l amplitude des composantes de fréquences supérieures à la celle de la coupure.
Filtres passe-bas Ce court document expose les principes des filtres passe-bas, leurs caractéristiques en fréquence et leurs principales topologies. Les éléments de contenu sont : Définition du filtre
Plus en détailContents. 1 Introduction Objectifs des systèmes bonus-malus Système bonus-malus à classes Système bonus-malus : Principes
Université Claude Bernard Lyon 1 Institut de Science Financière et d Assurances Système Bonus-Malus Introduction & Applications SCILAB Julien Tomas Institut de Science Financière et d Assurances Laboratoire
Plus en détailProbabilités sur un univers fini
[http://mp.cpgedupuydelome.fr] édité le 10 août 2015 Enoncés 1 Proailités sur un univers fini Evènements et langage ensemliste A quelle condition sur (a,, c, d) ]0, 1[ 4 existe-t-il une proailité P sur
Plus en détailFeuille d exercices 2 : Espaces probabilisés
Feuille d exercices 2 : Espaces probabilisés Cours de Licence 2 Année 07/08 1 Espaces de probabilité Exercice 1.1 (Une inégalité). Montrer que P (A B) min(p (A), P (B)) Exercice 1.2 (Alphabet). On a un
Plus en détailLe modèle de Black et Scholes
Le modèle de Black et Scholes Alexandre Popier février 21 1 Introduction : exemple très simple de modèle financier On considère un marché avec une seule action cotée, sur une période donnée T. Dans un
Plus en détailLa diffusion des technologies de l information et de la communication dans la société française
La diffusion des technologies de l information et de la communication dans la société française Étude réalisée par le Centre de Recherche pour l'étude et l'observation des Conditions de Vie (CREDOC) pour
Plus en détailSystèmes de transmission
Systèmes de transmission Conception d une transmission série FABRE Maxime 2012 Introduction La transmission de données désigne le transport de quelque sorte d'information que ce soit, d'un endroit à un
Plus en détailCHAPITRE V SYSTEMES DIFFERENTIELS LINEAIRES A COEFFICIENTS CONSTANTS DU PREMIER ORDRE. EQUATIONS DIFFERENTIELLES.
CHAPITRE V SYSTEMES DIFFERENTIELS LINEAIRES A COEFFICIENTS CONSTANTS DU PREMIER ORDRE EQUATIONS DIFFERENTIELLES Le but de ce chapitre est la résolution des deux types de systèmes différentiels linéaires
Plus en détailBiostatistiques : Petits effectifs
Biostatistiques : Petits effectifs Master Recherche Biologie et Santé P. Devos DRCI CHRU de Lille EA2694 patrick.devos@univ-lille2.fr Plan Données Générales : Définition des statistiques Principe de l
Plus en détailCOORDINATION NON COOPÉRATIVE: MÉTHODES D ENCHÈRES
COORDINATION NON COOPÉRATIVE: MÉTHODES D ENCHÈRES Cours 6c Principe Protocole centralisé, un commissaire-priseur/vendeur (auctioneer) et plusieurs enchérisseurs/acheteurs (bidders) Le commissaire-priseur
Plus en détailOrdonnancement robuste et décision dans l'incertain
Ordonnancement robuste et décision dans l'incertain 4 ème Conférence Annuelle d Ingénierie Système «Efficacité des entreprises et satisfaction des clients» Centre de Congrès Pierre Baudis,TOULOUSE, 2-4
Plus en détailIntroduction aux sondages
Introduction aux sondages Fiche technique Introduction Les sondages d'opinion publique sont très répandus. La plupart du temps, les rapports publiés par les enquêteurs ne fournissent pas suffisamment d'informations
Plus en détailLes mesures de performance ajustée au risque
Chapitre chapitre 1 6 Les mesures de performance ajustée au risque Les mesures de performance traditionnelles développées au chapitre 5 offrent l avantage d être simples d utilisation et d interprétation
Plus en détailACTUARIAT 1, ACT 2121, AUTOMNE 2013 #12
ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #12 ARTHUR CHARPENTIER 1 Une compagnie d assurance modélise le montant de la perte lors d un accident par la variable aléatoire continue X uniforme sur l intervalle
Plus en détailMini_guide_Isis_v6.doc le 10/02/2005 Page 1/15
1 Démarrer... 2 1.1 L écran Isis... 2 1.2 Les barres d outils... 3 1.2.1 Les outils d édition... 3 1.2.2 Les outils de sélection de mode... 4 1.2.3 Les outils d orientation... 4 2 Quelques actions... 5
Plus en détailModélisation et simulation
Modélisation et simulation p. 1/36 Modélisation et simulation INFO-F-305 Gianluca Bontempi Département d Informatique Boulevard de Triomphe - CP 212 http://www.ulb.ac.be/di Modélisation et simulation p.
Plus en détailLoi binomiale Lois normales
Loi binomiale Lois normales Christophe ROSSIGNOL Année scolaire 204/205 Table des matières Rappels sur la loi binomiale 2. Loi de Bernoulli............................................ 2.2 Schéma de Bernoulli
Plus en détailDETERMINATION DE L INCERTITUDE DE MESURE POUR LES ANALYSES CHIMIQUES QUANTITATIVES
Agence fédérale pour la Sécurité de la Chaîne alimentaire Administration des Laboratoires Procédure DETERMINATION DE L INCERTITUDE DE MESURE POUR LES ANALYSES CHIMIQUES QUANTITATIVES Date de mise en application
Plus en détail1 Démarrer... 3 1.1 L écran Isis...3 1.2 La boite à outils...3 1.2.1 Mode principal... 4 1.2.2 Mode gadget...4 1.2.3 Mode graphique...
1 Démarrer... 3 1.1 L écran Isis...3 1.2 La boite à outils...3 1.2.1 Mode principal... 4 1.2.2 Mode gadget...4 1.2.3 Mode graphique... 4 2 Quelques actions... 5 2.1 Ouvrir un document existant...5 2.2
Plus en détailPackage TestsFaciles
Package TestsFaciles March 26, 2007 Type Package Title Facilite le calcul d intervalles de confiance et de tests de comparaison avec prise en compte du plan d échantillonnage. Version 1.0 Date 2007-03-26
Plus en détailL ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ
L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et
Plus en détailPlus courts chemins, programmation dynamique
1 Plus courts chemins, programmation dynamique 1. Plus courts chemins à partir d un sommet 2. Plus courts chemins entre tous les sommets 3. Semi-anneau 4. Programmation dynamique 5. Applications à la bio-informatique
Plus en détailRO04/TI07 - Optimisation non-linéaire
RO04/TI07 - Optimisation non-linéaire Stéphane Mottelet Université de Technologie de Compiègne Printemps 2003 I Motivations et notions fondamentales 4 I1 Motivations 5 I2 Formes quadratiques 13 I3 Rappels
Plus en détailApprendre en pratique - dès le début.
Apprendre en pratique - dès le début. Les unités de simulation de la gamme KaVo permettent une formation optimale grâce à un agencement flexible des composants de l équipement, une ergonomie excellente
Plus en détailCircuits RL et RC. Chapitre 5. 5.1 Inductance
Chapitre 5 Circuits RL et RC Ce chapitre présente les deux autres éléments linéaires des circuits électriques : l inductance et la capacitance. On verra le comportement de ces deux éléments, et ensuite
Plus en détail(Customer Relationship Management, «Gestion de la Relation Client»)
(Customer Relationship Management, «Gestion de la Relation Client») Les Banques et sociétés d assurance sont aujourd'hui confrontées à une concurrence de plus en plus vive et leur stratégie " clientèle
Plus en détailObservatoire de l équipement audiovisuel des foyers
Observatoire de l équipement audiovisuel des foyers 1 er semestre 2013 Réalisé par 1 Édito L Observatoire de l équipement audiovisuel des foyers succède à l Observatoire de l équipement des foyers pour
Plus en détail