Théorie des sondages : cours 5
|
|
|
- Arlette Pellerin
- il y a 10 ans
- Total affichages :
Transcription
1 Théorie des sondages : cours 5 Camelia Goga IMB, Université de Bourgogne [email protected] Master Besançon-2010
2 Chapitre 5 : Techniques de redressement 1. poststratification 2. l estimateur par le ratio 3. l estimateur par la régression
3 Question : comment peut-on faire pour améliorer l estimateur de Horvitz-Thompson ˆt π = y k? π s k L estimateur d HT ne contient pas d information auxiliaire à part les probabilités d inclusion π k. Réponse : en prenant en compte l information auxiliaire. Information auxiliaire : des variables X 1,..., X J prenant les valeurs x 1k,..., x Jk pour le k-ème individu et connues avant la mise en place d une enquête. Deux situations : 1. une variable X j est connue pour chaque individus de la population ou 2. le total de X j, U x jk est connu sans avoir accès aux valeurs individuelles x jk. On note x k = (x 1k,..., x Jk ) pour tous k U.
4 Prise en compte de l information auxiliaire : estimateur par le ratio et poststratifié Information auxiliaire : une caractéristique de la théorie des sondages. Ce sont des variables disponibles dans la base de sondage Ces variables peuvent servir de deux façons pour améliorer la qualité des estimations : lors de la conception du plan de sondage : la plan stratifié, à probabilités inégales, par grappes ou à plusieurs degrés ; le plan équilibré (pas dans ce cours) lors de la conception d un nouvel estimateur : poststratifié, l estimateur par le ratio, par la régression, par le calage (pas dans ce cours).
5 L estimateur par le ratio Laplace (1802) a été le premier a avoir proposé faire un sondage au lieu d une énumération exhaustive ; Objectif : estimer la population de la France. Méthode : l estimateur par ratio (une règle de trois ) : il prend un échantillon de taille 30 de communes de toute la France et il obtient un total de ˆt habitants,30com = habitants ; il connaît également le nombre de naissances dans ces 30 communes : ˆt naissances,30com = ce qui implique que il y a une naissance pour = personnes il connaît le nombre total de naissances par an en 1802 et il fait le raisonnement que les communes avec beaucoup d habitants vont avoir plus de naissances, il estime le nombre total d habitants comme t habitants = t naissances ˆt habitants,30com ˆt naissances,30com
6 Dans l exemple de Laplace : le nombre de naissances est l information auxiliaire qui est bien corrélée avec la variable nombre d habitants. (Il doit connaître que t x et x k pour k s.) L estimateur proposé par Laplace est beaucoup utilisé pour estimer des totaux : et il s appelle l estimateur par ratio : ˆt y,ratio = t x ˆt y ˆt x = t x ˆR Propriétés : en général, cet estimateur est biaisé mais pour des échantillons de grande taille, ce biais est très proche de zéro. Si l information auxiliaire est très corrélée avec la variable d intérêt alors, l erreur quadratique moyenne de ˆt y,ratio est plus petite que si on n avait pas utilisé d information auxiliaire.
7 Exemple (Lohr, 1999) Supposons que nous voulons estimer le nombre de poissons péchés au long d un lac. On considère un plan aléatoire simple sans remise de taille n = 2 dans une population de taille N = 4 : nous avons N = 4 endroits pour pécher ; on connaît le nombre x i de filets qui se trouvent à chaque endroit pour pécher. Les valeurs pour toute la population se trouvent dans le tableau suivant : endroit, i total filet, x i t x = 22 nombre poissons, y i t y = 1400
8 P L estimateur par le ratio est ˆt yrat = t x Ps y i s x où s est un des 6 i échantillons possibles de taille 2. Par exemple, si s = (1, 2) ˆt yrat = = échantillon ˆt yrat (ˆt yrat t y ) 2 (1, 2) (1, 3) (1, 4) (2, 3) (2, 4) (3, 4) L espérance de ˆt yrat est la moyenne arithmétique des valeurs possibles de ˆt yrat pour chaque échantillon, E(ˆt yrat ) = et le biais est = 1.83
9 L erreur quadratique moyenne est donnée par EQR(ˆt yrat ) = E(ˆt yrat t y ) 2 = 1 (ˆt yrat t y ) 2 = 14451, 2 6 Considérons maintenant l estimateur par les valeurs dilatées qui ne prend pas en compte l information auxiliaire : ˆt y = N n s y i : échantillon ˆt y (ˆt y t y ) 2 (1, 2) 2 ( ) = (1, 3) (1, 4) (2, 3) (2, 4) (3, 4) Le biais de cet estimateur est 0 mais sa variance est Alors, l estimateur par le ratio est légèrement biaisé mais son EQR est nettement inférieure à celle de l estimateur par les valeurs dilatées qui est sans biais. s
10 Précision de l estimateur par le ratio L estimateur par le ratio ˆt rat = t x ˆR est un estimateur non-linéaire et il est linéarisé par : ˆt rat t y + s u k π k, avec u k la variable linéarisée de ˆt rat donnée par u k = y k Rx k Le biais est donné par E(ˆt rat ) t y = Cov(ˆR, ˆt x ) ( ) u k Pour n grand, Var(ˆt rat ) Var π k s
11 Comparaison entre l estimateur de HT et l estimateur par le ratio pour un plan SRS Nous voulons estimer le total t y = k U y k; On considère un échantillon SRS de taille n; sans inf. aux. et en utilisant l estimateur par les valeurs dilatées : ˆt y = N s y k n avec une variance estimée égale à N 2 1 f n S ys 2 = N 2 1 f 1 (y k ȳ s ) 2 ; n N 1 avec l inf.aux. et l estimateur par le ratio : ˆt yrat = t x ˆt y = t x ˆt s y k x avec une variance estimée égale à N 2 1 f n car ȳ s ˆR x s = 0. S 2 y ˆRx,s = N2 1 f n 1 N 1 s s x k (y k ˆRx k ) 2 s
12 Si on compare les deux formules, dans la première situation nous avons la somme des carrés des écarts de y k à la moyenne ȳ s et dans la deuxième situation, nous avons la somme des carrés des écarts de y k à la droite de régression y = ˆRx Superficie dediée aux fermes en Superficie dediée aux fermes en Superficie dediée aux fermes en Superficie dediée aux fermes en 1987
13 En conclusion 1. L estimateur par le ratio est conseillé lorsque la relation entre Y et X est proche d une droite passante par l origine et la variance de Y est proportionnelle avec X, var(y k ) = σ 2 x k ; 2. Dans ces conditions, le ratio ˆR est la pente de la droite de régression obtenue par des moindres carrées pondérés : (y k Rx k ) ˆR 2 = argmin R s x k
14 Application de l estimateur par le ratio : estimation dans un domaine quand la taille du domaine est connue Soit U d U un domaine et nous voulons estimer le total d une variable Y dans le domaine U d, t d = U d y k Soit s U un échantillon SRS de taille n et s d = s U d. L estimateur de HT de t d (voir TD 1) est ˆt π = N n s d y k. Si on connaît la taille du domaine, N d = U 1 k U d on peut utiliser l estimateur par le ratio qui est plus efficace : s ˆt d,rat = N d d y k = N d y s d 1 sd k Ud
15 Poststratification Considérons l exemple suivant (Lohr, 1999) : on veut estimer le nombre total d étudiants qui veulent être professeurs après leurs études dans une population de 4000 étudiants ; on prend un échantillon aléatoire simple sans remise de taille n = 400; on sait par ailleurs que dans la population totale on a 2700 femmes et 1300 hommes ; dans notre échantillon, il y a 240 femmes dont 84 veulent être des professeurs et 160 hommes dont 40 veulent être des professeurs On utilise cette information et on obtient l estimation suivante : = Il s agît d une règle de trois à l intérieur de chaque groupe!
16 Propriétés La méthode d estimation utilisée est appelée poststratification car utilise l information auxiliaire (le fait d appartenir à un certain groupe) après le tirage de l échantillon. Dans la plupart des cas, l estimateur poststratifié est meilleur que l estimateur par les valeurs dilatées et il est équivalent au plan stratifié avec l allocation proportionnelle. variation totale=variation inter-groupes+variation intra-groupes La poststratification réduit la variance si la variation entre groupes est grande. Dans l exemple donné, l information auxiliaire est le fait que la population est plus homogène à l intérieur de chaque groupe que dans la population totale.
17 Notations et résultats Considérons les notations utilisées lors du plan stratifié : Un échantillon s de taille n est sélectionné dans U selon un plan SAS (le plus utilisé mais un autre type de plan de sondage peut être envisagé). Soit s g = s U g de taille aléatoire n sg dans la sous-population U g, la partie de s se trouvant G G s = s g, n = n sg. g=1 g=1 L estimateur post-stratifié du total est la somme des g estimateurs par le ratio : G ˆt ypost = N g y sg g=1 avec y sg = s g y k /n sg pour n sg 0.
18 L estimateur post-stratifié : variance et estimateur de la variance La variance approximative est donnée par AV (ˆt ypost ) = N 2 1 f n G g=1 W g S 2 yu g + N 2 1 f n 2 pour W g = Ng N et S yu 2 g = 1 N g 1 U g (y k y Ug ) 2. G (1 W g )SyU 2 g g=1 Remarque : Supposons que les sous-populations U g sont des strates et on utilise l allocation proportionnelle, alors la variance du π-estimateur est le premier terme de l expression de AV (ˆt ypost ). L estimateur de la variance est ˆV (ˆt ypost ) = (1 f ) pour Sys 2 g = 1 n sg 1 s g (y k y sg ) 2. G N 2 Sys 2 g g n g=1 sg
19 Quand utiliser la poststratification? 1. dans le cas des sondages à plusieurs items : on peut utiliser différentes variables auxiliaires pour différentes variables d intérêt. 2. dans le traitement de la nonréponse ; 3. l appartenance d un individu à un certain groupe n est pas connue au moment de la mise en place de l enquête.
20 Exemple : On veut estimer la somme moyenne dédiée à la nourriture/mois dans les ménages américaines. Nous avons la distribution de la taille des ménages comme suit : taille du ménage pourcentage Malheureusement, la base de sondage ne contient pas l information concernant la taille de chaque ménage, par conséquent on ne peut pas faire une stratification. Mais on peut faire une poststratification.
21 L estimateur par la régression du total Si la relation entre Y et X est proche d une droite avec intercept, alors y k = β 0 + β 1 x k = X k β où β = (β 0, β 1 ) et X k = (1, x k ) peut donner une bonne approximation du nuage des points. L estimateur par la regression pour le total t y = U y k est ˆt yr = s y k ŷ k π k + U ŷ k = s y k x k B π k + U x k B ŷ k = x k B et B = ( B 0, B 1 ) l estimateur de β dans l échantillon s.
22 L estimateur par la regression pour un plan SRS Le coefficient de regression β est estimé par moindres carrés dans la population par ( ) ( B0 P = y ) U B 1 x U B 1 U (x k x U )(y k y U ) P U (x k x U ) 2 qui est ensuite estimé dans l échantillon par ( ) ( ˆB0 P = y s ˆB 1 x s ˆB 1 s (x k x s)(y k y s ) P s (x k x s) 2 ) et ˆB 1 = Sxy,s. Sx 2 L estimateur par regression est ( ) ˆt yr = N y s + ˆB 1 (x U x s )
23 Variance et estimateur de la variance pour un plan général L estimateur par régression ˆt yr = ˆt yπ + (t x t xπ ) B est approximativement sans biais pour le total t y = U y k est sa variance approximative est donné par AV (ˆt yr ) = U U kl E k π k E l π l pour E k = y k x kb et l estimateur de la variance est pour e ks = y k x k B. V (ˆt yr ) = s s kl π kl e ks π k e ls π l.
24 Variance pour un plan SRS AV (ˆt yr ) = N 2 1 f n S 2 E,U = N2 1 f n = N 2 1 f n S 2 y,u (1 R2 ) 1 N 1 (E k E U ) 2 où R 2 est le coefficient de corrélation entre X et Y dans la population. Donc, cette variance est petite si : n est grand n/n grand S y petit R = ±1 ou proche. U
STA108 Enquêtes et sondages. Sondages àplusieurs degrés et par grappes
STA108 Enquêtes et sondages Sondages àplusieurs degrés et par grappes Philippe Périé, novembre 2011 Sondages àplusieurs degrés et par grappes Introduction Sondages à plusieurs degrés Tirage des unités
Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R
Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R Yves Aragon, David Haziza & Anne Ruiz-Gazen GREMAQ, UMR CNRS 5604, Université des Sciences
Chapitre 3 : INFERENCE
Chapitre 3 : INFERENCE 3.1 L ÉCHANTILLONNAGE 3.1.1 Introduction 3.1.2 L échantillonnage aléatoire 3.1.3 Estimation ponctuelle 3.1.4 Distributions d échantillonnage 3.1.5 Intervalles de probabilité L échantillonnage
Chapitre 3. Les distributions à deux variables
Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles
Approche modèle pour l estimation en présence de non-réponse non-ignorable en sondage
Approche modèle pour l estimation en présence de non-réponse non-ignorable en sondage Journées de Méthodologie Statistique Eric Lesage Crest-Ensai 25 janvier 2012 Introduction et contexte 2/27 1 Introduction
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers
Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles
Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Valentin Patilea 1 Cesar Sanchez-sellero 2 Matthieu Saumard 3 1 CREST-ENSAI et IRMAR 2 USC Espagne 3 IRMAR-INSA
Critère du choix des variables auxiliaires à utiliser dans l'estimateur par calage
des variables auxiliaires à utiliser dans l'estimateur par calage Mohammed El Haj Tirari Institut National de Statistique et d'economie Appliquée - roc Laboratoire de Statistique d'enquêtes, CREST - Ensai
TABLE DES MATIERES. C Exercices complémentaires 42
TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence
Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés
Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour [email protected] Une grande partie des illustrations viennent
Fiche qualité relative à l enquête Santé et Itinéraire Professionnel 2010 (SIP) Carte d identité de l enquête
Fiche qualité relative à Santé et Itinéraire Professionnel 2010 (SIP) Nom Années de Périodicité Panel (suivi d échantillon) Services concepteurs Service réalisant Sujets principaux traités dans Carte d
CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)
CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un
Le théorème des deux fonds et la gestion indicielle
Le théorème des deux fonds et la gestion indicielle Philippe Bernard Ingénierie Economique& Financière Université Paris-Dauphine mars 2013 Les premiers fonds indiciels futent lancés aux Etats-Unis par
La nouvelle planification de l échantillonnage
La nouvelle planification de l échantillonnage Pierre-Arnaud Pendoli Division Sondages Plan de la présentation Rappel sur le Recensement de la population (RP) en continu Description de la base de sondage
CONCEPTION ET TIRAGE DE L ÉCHANTILLON
CHAPITRE 4 CONCEPTION ET TIRAGE DE L ÉCHANTILLON Ce chapitre technique 1 s adresse principalement aux spécialistes de sondage, mais aussi au coordinateur et aux autres responsables techniques de l enquête.
Introduction à l approche bootstrap
Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?
Estimation: intervalle de fluctuation et de confiance. Mars 2012. IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison
Estimation: intervalle de fluctuation et de confiance Mars 2012 IREM: groupe Proba-Stat Estimation Term.1 Intervalle de fluctuation connu : probabilité p, taille de l échantillon n but : estimer une fréquence
Séries Statistiques Simples
1. Collecte et Représentation de l Information 1.1 Définitions 1.2 Tableaux statistiques 1.3 Graphiques 2. Séries statistiques simples 2.1 Moyenne arithmétique 2.2 Mode & Classe modale 2.3 Effectifs &
Exercices supplémentaires sur l introduction générale à la notion de probabilité 2009-2010
Exercices supplémentaires sur l introduction générale à la notion de probabilité 2009-2010 Exercices fortement conseillés : 6, 10 et 14 1) Un groupe d étudiants est formé de 20 étudiants de première année
FORMULAIRE DE STATISTIQUES
FORMULAIRE DE STATISTIQUES I. STATISTIQUES DESCRIPTIVES Moyenne arithmétique Remarque: population: m xμ; échantillon: Mx 1 Somme des carrés des écarts "# FR MOYENNE(série) MOYENNE(série) NL GEMIDDELDE(série)
Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction.
Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction. Etudes et traitements statistiques des données : le cas illustratif de la démarche par sondage INTRODUCTION
La classification automatique de données quantitatives
La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations
TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.
STATISTIQUE THÉORIQUE ET APPLIQUÉE Tome 2 Inférence statistique à une et à deux dimensions Pierre Dagnelie TABLE DES MATIÈRES Bruxelles, De Boeck, 2011, 736 p. ISBN 978-2-8041-6336-5 De Boeck Services,
Terminale STMG Lycée Jean Vilar 2014/2015. Terminale STMG. O. Lader
Terminale STMG O. Lader Table des matières Interrogation 1 : Indice et taux d évolution........................... 2 Devoir maison 1 : Taux d évolution................................ 4 Devoir maison 1
UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES
Université Paris 13 Cours de Statistiques et Econométrie I UFR de Sciences Economiques Année 2008-2009 Licence de Sciences Economiques L3 Premier semestre TESTS PARAMÉTRIQUES Remarque: les exercices 2,
Le niveau de revenus des ménages est associé à la couverture vaccinale par le vaccin pneumocoque conjugué chez les enfants d'ile-de-france
Le niveau de revenus des ménages est associé à la couverture vaccinale par le vaccin pneumocoque conjugué chez les enfants d'ile-de-france Jean-Paul Guthmann, Pierre Chauvin, Yann Le Strat, Marion Soler,
Modèles et Méthodes de Réservation
Modèles et Méthodes de Réservation Petit Cours donné à l Université de Strasbourg en Mai 2003 par Klaus D Schmidt Lehrstuhl für Versicherungsmathematik Technische Universität Dresden D 01062 Dresden E
Évaluations aléatoires : Comment tirer au sort?
Évaluations aléatoires : Comment tirer au sort? William Parienté Université Catholique de Louvain J-PAL Europe povertyactionlab.org Plan de la semaine 1. Pourquoi évaluer? 2. Comment mesurer l impact?
CNAM 2002-2003 2léments de cours Bonus-malus et Crédibilité
1 CNAM 2002-2003 2léments de cours Bonus-malus et Crédibilité Une situation fréquente en pratique est de disposer non pas d un résultat mais de plusieurs. Le cas se présente en assurance, par exemple :
INF6304 Interfaces Intelligentes
INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie
La survie nette actuelle à long terme Qualités de sept méthodes d estimation
La survie nette actuelle à long terme Qualités de sept méthodes d estimation PAR Alireza MOGHADDAM TUTEUR : Guy HÉDELIN Laboratoire d Épidémiologie et de Santé publique, EA 80 Faculté de Médecine de Strasbourg
Précision d un résultat et calculs d incertitudes
Précision d un résultat et calculs d incertitudes PSI* 2012-2013 Lycée Chaptal 3 Table des matières Table des matières 1. Présentation d un résultat numérique................................ 4 1.1 Notations.........................................................
Santé environnement. Description du budget espace-temps et estimation de l exposition de la population française dans son logement
Santé environnement Description du budget espace-temps et estimation de l exposition de la population française dans son logement Sommaire Abréviations 2 1. Introduction 3 2. Données recueillies 4 2.1
PROBABILITES ET STATISTIQUE I&II
PROBABILITES ET STATISTIQUE I&II TABLE DES MATIERES CHAPITRE I - COMBINATOIRE ELEMENTAIRE I.1. Rappel des notations de la théorie des ensemble I.1.a. Ensembles et sous-ensembles I.1.b. Diagrammes (dits
Table des matières. I Mise à niveau 11. Préface
Table des matières Préface v I Mise à niveau 11 1 Bases du calcul commercial 13 1.1 Alphabet grec...................................... 13 1.2 Symboles mathématiques............................... 14 1.3
4. Résultats et discussion
17 4. Résultats et discussion La signification statistique des gains et des pertes bruts annualisés pondérés de superficie forestière et du changement net de superficie forestière a été testée pour les
INITIATION AUX METHODES DE SONDAGE
Annie FOURRIER-REGLAT Marthe-Aline JUTAND avec la participation d Anne-Marie DUSSAIX INITIATION AUX METHODES DE SONDAGE APPLICATION A LA PHARMACO-EPIDEMIOLOGIE ARME-Pharmacovigilance Editions - Bordeaux
Le Data Mining au service du Scoring ou notation statistique des emprunteurs!
France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative
Le modèle de régression linéaire
Chapitre 2 Le modèle de régression linéaire 2.1 Introduction L économétrie traite de la construction de modèles. Le premier point de l analyse consiste à se poser la question : «Quel est le modèle?». Le
La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1
La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1 La licence Mathématiques et Economie-MASS de l Université des Sciences Sociales de Toulouse propose sur les trois
L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ
L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et
Gestion obligataire passive
Finance 1 Université d Evry Séance 7 Gestion obligataire passive Philippe Priaulet L efficience des marchés Stratégies passives Qu est-ce qu un bon benchmark? Réplication simple Réplication par échantillonnage
TSTT ACC OUTILS DE GESTION COMMERCIALE FICHE 1 : LES MARGES
TSTT ACC OUTILS DE GESTION COMMERCIALE FICHE 1 : LES MARGES Coût de revient du produit + Marge du fabricant = Prix de vente HT au distributeur Prix d'achat HT du distributeur + Marge du distributeur =
3. Caractéristiques et fonctions d une v.a.
3. Caractéristiques et fonctions d une v.a. MTH2302D S. Le Digabel, École Polytechnique de Montréal H2015 (v2) MTH2302D: fonctions d une v.a. 1/32 Plan 1. Caractéristiques d une distribution 2. Fonctions
Bulletin de service Bureaux d agents, de courtiers en immeubles et d évaluateurs de biens immobiliersetdes autres activités liées à l immobilier
N o 63-238-X au catalogue. Bulletin de service Bureaux d agents, de courtiers en immeubles et d évaluateurs de biens immobiliersetdes autres activités liées à l immobilier 2012. Faits saillants Le revenu
Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke
www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3
Relation entre deux variables : estimation de la corrélation linéaire
CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence
NON-LINEARITE ET RESEAUX NEURONAUX
NON-LINEARITE ET RESEAUX NEURONAUX Vêlayoudom MARIMOUTOU Laboratoire d Analyse et de Recherche Economiques Université de Bordeaux IV Avenue. Leon Duguit, 33608 PESSAC, France tel. 05 56 84 85 77 e-mail
Que faire lorsqu on considère plusieurs variables en même temps?
Chapitre 3 Que faire lorsqu on considère plusieurs variables en même temps? On va la plupart du temps se limiter à l étude de couple de variables aléatoires, on peut bien sûr étendre les notions introduites
Un outil pour l étude des dépenses de santé et des «restes à charge» des ménages : le modèle Omar
SANTÉ Un outil pour l étude des dépenses de santé et des «restes à charge» des ménages : le modèle Omar Rémi Lardellier, Renaud Legal, Denis Raynaud et Guillaume Vidal* Les «restes à charge» des ménages
Chapitre 2/ La fonction de consommation et la fonction d épargne
hapitre 2/ La fonction de consommation et la fonction d épargne I : La fonction de consommation keynésienne II : Validations et limites de la fonction de consommation keynésienne III : Le choix de consommation
Statistiques descriptives
Statistiques descriptives L3 Maths-Eco Université de Nantes Frédéric Lavancier F. Lavancier (Univ. Nantes) Statistiques descriptives 1 1 Vocabulaire de base F. Lavancier (Univ. Nantes) Statistiques descriptives
Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS
Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence
Régression linéaire. Nicolas Turenne INRA [email protected]
Régression linéaire Nicolas Turenne INRA [email protected] 2005 Plan Régression linéaire simple Régression multiple Compréhension de la sortie de la régression Coefficient de détermination R
Value at Risk. CNAM GFN 206 Gestion d actifs et des risques. Grégory Taillard. 27 février & 13 mars 20061
Value at Risk 27 février & 13 mars 20061 CNAM Gréory Taillard CNAM Master Finance de marché et estion de capitaux 2 Value at Risk Biblioraphie Jorion, Philippe, «Value at Risk: The New Benchmark for Manain
CALCUL D UN SCORE ( SCORING) Application de techniques de discrimination LES OBJECTIFS DU SCORING
CALCUL D UN SCORE ( SCORING) Application de techniques de discrimination LES OBJECTIFS DU SCORING SÉLECTION DES RISQUES PRÉVISION DES DÉFAUTS SUIVI ET CONTRÔLE Pierre-Louis GONZALEZ Différents types de
23. Interprétation clinique des mesures de l effet traitement
23. Interprétation clinique des mesures de l effet traitement 23.1. Critères de jugement binaires Plusieurs mesures (indices) sont utilisables pour quantifier l effet traitement lors de l utilisation d
Aide-mémoire de statistique appliquée à la biologie
Maxime HERVÉ Aide-mémoire de statistique appliquée à la biologie Construire son étude et analyser les résultats à l aide du logiciel R Version 5(2) (2014) AVANT-PROPOS Les phénomènes biologiques ont cela
Tests statistiques et régressions logistiques sous R, avec prise en compte des plans d échantillonnage complexes
, avec prise en compte des plans d échantillonnage complexes par Joseph LARMARANGE version du 29 mars 2007 Ce cours a été développé pour une formation niveau M2 et Doctorat des étudiants du laboratoire
t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :
Terminale STSS 2 012 2 013 Pourcentages Synthèse 1) Définition : Calculer t % d'un nombre, c'est multiplier ce nombre par t 100. 2) Exemples de calcul : a) Calcul d un pourcentage : Un article coûtant
Chapitre 11 METHODOLOGIE D ENQUÊTES
Chapitre 11 METHODOLOGIE D ENQUÊTES PLAN DU CHAPITRE 11 11.1 LE QUESTIONNAIRE 11.1.1 Qu est-ce qu un questionnaire? 11.1.2 Etapes de la construction d un questionnaire 11.1.3 Règles de base pour l élaboration
Non-réponse et données manquantes. Sylvie Rousseau & Gilbert Saporta décembre 2011
Non-réponse et données manquantes Sylvie Rousseau & Gilbert Saporta décembre 2011 1 EXEMPLES DE TAUX DE RÉPONSE À CERTAINES ENQUÊTES Pour les enquêtes auprès des entreprises, le taux de non-réponse est
EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG
Exploitations pédagogiques du tableur en STG Académie de Créteil 2006 1 EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG Commission inter-irem lycées techniques contact : [email protected] La maquette
Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI
1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage
Données longitudinales et modèles de survie
ANALYSE DU Données longitudinales et modèles de survie 5. Modèles de régression en temps discret André Berchtold Département des sciences économiques, Université de Genève Cours de Master ANALYSE DU Plan
1 Complément sur la projection du nuage des individus
TP 0 : Analyse en composantes principales (II) Le but de ce TP est d approfondir nos connaissances concernant l analyse en composantes principales (ACP). Pour cela, on reprend les notations du précédent
Leçon N 4 : Statistiques à deux variables
Leçon N 4 : Statistiques à deux variables En premier lieu, il te faut relire les cours de première sur les statistiques à une variable, il y a tout un langage à se remémorer : étude d un échantillon d
Statistiques Descriptives à une dimension
I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des
Classe de première L
Classe de première L Orientations générales Pour bon nombre d élèves qui s orientent en série L, la classe de première sera une fin d étude en mathématiques au lycée. On a donc voulu ici assurer à tous
LES MODES D ADAPTATION ET DE COMPENSATION DU HANDICAP : Les personnes handicapées motrices à domicile (enquête HID 1999)
Délégation ANCREAI Ile-de-France CEDIAS - 5 rue Las-Cases 75007 PARIS Tél : 01 45 51 66 10 Fax : 01 44 18 01 81 E-mail : [email protected] Contact : Carole PEINTRE LES MODES D ADAPTATION ET DE COMPENSATION
Imputation du salaire d ego dans TeO
Imputation du salaire d ego dans TeO Objet de la note : linéariser la réponse en tranche du salaire, et imputer le salaire en cas de non réponse Champ et principe de la méthode Les individus qui se sont
SPHINX Logiciel de dépouillement d enquêtes
SPHINX Logiciel de dépouillement d enquêtes sphinx50frversion4.doc 1 Les trois stades du SPHINX sont ceux que comporte habituellement toute enquête d opinion: Elaboration du questionnaire (fiche outil
Calcul élémentaire des probabilités
Myriam Maumy-Bertrand 1 et Thomas Delzant 1 1 IRMA, Université Louis Pasteur Strasbourg, France Licence 1ère Année 16-02-2006 Sommaire La loi de Poisson. Définition. Exemple. 1 La loi de Poisson. 2 3 4
Loi binomiale Lois normales
Loi binomiale Lois normales Christophe ROSSIGNOL Année scolaire 204/205 Table des matières Rappels sur la loi binomiale 2. Loi de Bernoulli............................................ 2.2 Schéma de Bernoulli
NOTE SUR LA MODELISATION DU RISQUE D INFLATION
NOTE SUR LA MODELISATION DU RISQUE D INFLATION 1/ RESUME DE L ANALYSE Cette étude a pour objectif de modéliser l écart entre deux indices d inflation afin d appréhender le risque à très long terme qui
«Suivi d un projet Livelihoods» Medan, Indonésie 7 au 11 octobre 2013
«Suivi d un projet Livelihoods» Medan, Indonésie 7 au 11 octobre 2013 Mangroves, Sénégal Hellio-Vaningen En octobre 2013, dans le cadre d un partenariat entre la Convention de Ramsar et le Groupe Danone,
Résumé du Cours de Statistique Descriptive. Yves Tillé
Résumé du Cours de Statistique Descriptive Yves Tillé 15 décembre 2010 2 Objectif et moyens Objectifs du cours Apprendre les principales techniques de statistique descriptive univariée et bivariée. Être
La fumée de tabac secondaire (FTS) en Mauricie et au Centre-du- Québec, indicateurs du plan commun tirés de l ESCC de 2007-2008
La fumée de tabac secondaire (FTS) en Mauricie et au Centre-du- Québec, indicateurs du plan commun tirés de l ESCC de 2007-2008 Ce document se veut une analyse succincte des indicateurs se rapportant à
EVALUATION DE LA QUALITE DES SONDAGES EN LIGNE : CAS D UN SONDAGE D OPINION AU BURKINA FASO
EVALUATION DE LA QUALITE DES SONDAGES EN LIGNE : CAS D UN SONDAGE D OPINION AU BURKINA FASO Auteur Baguinébié Bazongo 1 Ingénieur Statisticien Economiste Chef de l Unité de recherche à l Institut national
Actuariat I ACT2121. septième séance. Arthur Charpentier. Automne 2012. [email protected]. http ://freakonometrics.blog.free.
Actuariat I ACT2121 septième séance Arthur Charpentier [email protected] http ://freakonometrics.blog.free.fr/ Automne 2012 1 Exercice 1 En analysant le temps d attente X avant un certain événement
Car Insurance Survey. L assurance automobile RC chez les jeunes. Statistics Belgium. Rapport final
L assurance automobile RC chez les jeunes Car Insurance Survey Rapport final Statistics Belgium Direction générale Statistique et Information économique 2 0 1 3 Table des matières 1 But et objet de l'étude...
Statistique Descriptive Élémentaire
Publications de l Institut de Mathématiques de Toulouse Statistique Descriptive Élémentaire (version de mai 2010) Alain Baccini Institut de Mathématiques de Toulouse UMR CNRS 5219 Université Paul Sabatier
Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens
Chapitre 7 Statistique des échantillons gaussiens Le théorème central limite met en évidence le rôle majeur tenu par la loi gaussienne en modélisation stochastique. De ce fait, les modèles statistiques
FOTO - L OMNIBUS MENSUEL DE CROP LE NOUVEAU CROP-EXPRESS
FOTO - L OMNIBUS MENSUEL DE CROP LE NOUVEAU CROP-EXPRESS 550, RUE SHERBROOKE OUEST MONTRÉAL (QUÉBEC) H3A 1B9 BUREAU 900 TOUR EST T 514 849-8086, POSTE 3064 Réflexions méthodologiques Depuis des années,
DCG 6. Finance d entreprise. L essentiel en fiches
DCG 6 Finance d entreprise L essentiel en fiches DCG DSCG Collection «Express Expertise comptable» J.-F. Bocquillon, M. Mariage, Introduction au droit DCG 1 L. Siné, Droit des sociétés DCG 2 V. Roy, Droit
TD1 Signaux, énergie et puissance, signaux aléatoires
TD1 Signaux, énergie et puissance, signaux aléatoires I ) Ecrire l'expression analytique des signaux représentés sur les figures suivantes à l'aide de signaux particuliers. Dans le cas du signal y(t) trouver
Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.
ANALYSE 5 points Exercice 1 : Léonie souhaite acheter un lecteur MP3. Le prix affiché (49 ) dépasse largement la somme dont elle dispose. Elle décide donc d économiser régulièrement. Elle a relevé qu elle
Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier
Statistiques Appliquées à l Expérimentation en Sciences Humaines Christophe Lalanne, Sébastien Georges, Christophe Pallier Table des matières 1 Méthodologie expérimentale et recueil des données 6 1.1 Introduction.......................................
Observation statistique
2. APERÇU DES RÉSULTATS DU RENDEMENT Observation statistique s. Les résultats présentés dans ce rapport sont fondés sur des échantillons. Des échantillons distincts ont été sélectionnés pour chaque instance
Probabilité et Statistique pour le DEA de Biosciences. Avner Bar-Hen
Probabilité et Statistique pour le DEA de Biosciences Avner Bar-Hen Université Aix-Marseille III 2000 2001 Table des matières 1 Introduction 3 2 Introduction à l analyse statistique 5 1 Introduction.................................
Article. Peut-on établir des statistiques officielles à partir d enquêtes en ligne reposant sur le principe de l autosélection? par Jelke Bethlehem
Composante du produit n o -5-X au catalogue de Statistique Canada La série des symposiums internationaux de Statistique Canada : recueil Article Symposium 008 : Collecte des données : défis, réalisations
Modélisation aléatoire en fiabilité des logiciels
collection Méthodes stochastiques appliquées dirigée par Nikolaos Limnios et Jacques Janssen La sûreté de fonctionnement des systèmes informatiques est aujourd hui un enjeu économique et sociétal majeur.
Compte rendu de LA37 B, TP numéro 1. Evolution de la température et du degrée d'hydratation
4 6 8 2 4 8 22 26 3 34 38 42 46 5 54 58 62 66 7 74 78 83 89 96 8 44 Bertin Morgan Compte rendu de LA37 B, TP numéro. Les essais effectués par le laboratoire des ponts et chaussés nous ont fournis la température
MODÈLE CROP DE CALIBRATION DES PANELS WEB
MODÈLE CROP DE CALIBRATION DES PANELS WEB 550, RUE SHERBROOKE OUEST MONTRÉAL (QUÉBEC) H3A 1B9 BUREAU 900 TOUR EST T 514 849-8086, POSTE 3064 WWW.CROP.CA Le Protocole CROP de calibration des panels en ligne
CAPTEURS - CHAINES DE MESURES
CAPTEURS - CHAINES DE MESURES Pierre BONNET Pierre Bonnet Master GSI - Capteurs Chaînes de Mesures 1 Plan du Cours Propriétés générales des capteurs Notion de mesure Notion de capteur: principes, classes,
Valeur verte des logements d après les bases Notariales BIEN et PERVAL Synthèse
Valeur verte des logements d après les bases Notariales BIEN et PERVAL Synthèse La valeur verte correspond à l augmentation de valeur 1 engendrée par la meilleure performance énergétique et environnementale
IFT3245. Simulation et modèles
IFT 3245 Simulation et modèles DIRO Université de Montréal Automne 2012 Tests statistiques L étude des propriétés théoriques d un générateur ne suffit; il estindispensable de recourir à des tests statistiques
ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #16
ACTUARIAT 1, ACT 2121, AUTOMNE 201 #16 ARTHUR CHARPENTIER 1 Dans une petite compagnie d assurance le nombre N de réclamations durant une année suit une loi de Poisson de moyenne λ = 100. On estime que
Licence MASS 2000-2001. (Re-)Mise à niveau en Probabilités. Feuilles de 1 à 7
Feuilles de 1 à 7 Ces feuilles avec 25 exercices et quelques rappels historiques furent distribuées à des étudiants de troisième année, dans le cadre d un cours intensif sur deux semaines, en début d année,
MAP 553 Apprentissage statistique
MAP 553 Apprentissage statistique Université Paris Sud et Ecole Polytechnique http://www.cmap.polytechnique.fr/~giraud/map553/map553.html PC1 1/39 Apprentissage? 2/39 Apprentissage? L apprentissage au
