Exercices corrigés de l Ethème 2 - Techniques de Sondages
|
|
- Edith Rancourt
- il y a 8 ans
- Total affichages :
Transcription
1 Exercices corrigés de l Ethème 2 - Techniques de Sondages Exercice 1 : On considère une population de N = 5 individus, pour lesquels on connaît les valeurs de la variable y : y 1 = 3, y 2 = 1, y 3 = 0, y 4 = 1, y 5 = 5. On choisit un plan SI avec une taille d échantillon n = Donner les valeurs de la moyenne, de la médiane et de la variance de la variable y dans la population. Lister tous les échantillons possibles de taille n = 3. Quelle est la probabilité de sélection de chaque échantillon? 2. Pour un échantillon donné, on estime la moyenne (respectivement la médiane) de la population. Calculer les valeurs de ces estimateurs pour chaque échantillon et en déduire que l estimateur de la moyenne est sans biais alors que l estimateur de la médiane est biaisé. 3. Pour chaque échantillon, calculer l estimateur Sys 2 de SyU 2 et en déduire que cet estimateur est sans biais. Corrigé : 1. La valeur de la moyenne dans la population est et la médiane est : y U = ( )/5 = 2 med U (y) = 1. Les échantillons possibles de taille 3 sont les 10 échantillons suivants : Puisque les échantillons sont équiprobables, la probabilité de chaque échantillon s est p(s) = 1/ On calcule la moyenne et la médiane de chaque échantillon i = 1,..., 10 qui estiment respectivement la moyenne et la médiane de la population et on obtient les résultats suivants : i y s med s (y)
2 Si on calcule la moyenne arithmétique des y s, on obtient : E(y s ) = ( )/10 = 20/10 = 2 E(y s ) = y U donc l estimateur est sans biais. Si on calcule la moyenne arithmétique des med s (y), on obtient : E(med s (y)) = ( )/10 = 16/10 = 1.6 E(med s (y)) med U (y) et donc l estimateur est biaisé. 3. Pour chaque échantillon, on calcule Sys. 2 Par exemple, pour le premier échantillon {1,2,3}, on a : Sy1 2 = 3 ( ) ( ) Les résultats sont récapitulés dans le tableau suivant : i Sys Si on calcule la moyenne arithmétique des S 2 ys, on obtient : E(S 2 ys) = ( )/10 = 40/10 = 4 Or, S 2 yu = 5 4 ( 1 5 ( ) 2 2 ) = 4 donc l estimateur S 2 ys est sans biais. 2
3 Exercices 2 et 3 : Utiliser le logiciel SAS ou R pour tirer dans le fichier Rec99htegne un échantillon de 50 communes 1. (a) selon le plan SI (b) selon le plan PEAR 2. On considère le fichier de l enquête emploi (et pas le fichier du Recensement comme cela a été indiqué par erreur dans l ennoncé!) et dans ce fichier, uniquement les individus ayant une activité (on enlève les individus pour lesquels la variable nomenclature d activité française est sans objet ou non renseignée). Pour un échantillon de taille n = 100 tiré selon un plan SI. (a) Estimer la proportion d agriculteurs. (b) Comparer à la vraie valeur de cette proportion. (c) Estimer la variance de cet estimateur sans tenir compte de la correction de population finie et en tenant compte. Corrigé : Avec le logiciel SAS : on utilise les proc surveyselect et surveymeans. Le fichier docsas.pdf contient une présentation succinte de ces 2 procédures. Mais l aide détaillée se trouve sans difficulté sur Internet (chercher proc surveyselect ou proc surveymeans avec le moteur de recherche Google par exemple). 1. Pour tirer un échantillon, on utilise la proc surveyselect. (a) Pour le plan SI, taper le programme suivant. /* Tirage de 50 communes dans la base Rec99htegne */ /* selon un plan SI */ title1 Fichier Rec99htegne : tirage selon un plan simple ; proc surveyselect data=sondages.htegne method=srs n=50 stats seed=47279 out=sondages.logsi; run; L option data= précise le fichier de données sur lequel on applique la proc surveyselect. method= definit le plan de sondages. Par défaut, il s agit du plan SI (méthode srs pour simple random sampling). n= fixe la taille de l échantillon. On peut, au lieu de fixer n, préciser le taux de sondages f par l option samprate= (ou l abréviation rate=). L option sampsize= est équivalente à l option n=. stats précise que l on souhaite que le fichier résultat contienne la variable probabilité d inclusion et la variable poids de sondage (inverse de la probabilité d inclusion). Si les probabilités d inclusion différent selon les individus (voir E-thème 3), ces deux variables sont données par défaut mais dans le cas du plan SI, ces variables étant des constantes, il faut préciser l option stats pour les récupérer. Remarquons que si l objectif est d estimer une moyenne, ces variables ne sont pas utiles mais que l on en a besoin pour estimer un total. seed= fixe la graine du générateur de nombres aléatoires. Cela signifie que le tirage de l échantillon se fait à l identique à chaque fois que l on lance la procédure. Au contraire, si la graine n est pas précisée, SAS utilise une graine aléatoire basée sur l horloge interne de l ordinateur et les tirages sont différents à chaque lancement. 3
4 out= permet de définir un fichier résultat qui contient, pour les communes échantillonnées, les variables du fichier de données initial et éventuellement des variables supplémentaires comme la probabilité d inclusion (variable SelectionProb avec le label Probability selection) et le poids de sondage (variable SamplingWeight avec le label Sampling Weight) dans le cas du plan SI Exécuter le programme ci-dessus. L output contient les informations suivantes rappelant les différentes options utilisées (tirage de n = 50 communes selon un plan SI avec la graine dans la base Rec99htegne avec sauvegarde des résultats dans la base Logsi) et précisant la probabilité d inclusion π k = n/n = 50/554 = et le poids de sondage 1/π k = The SURVEYSELECT Procedure Selection Method Simple Random Sampling Input Data Set REC99HTEGNE Random Number Seed Sample Size 50 Selection Probability Sampling Weight Output Data Set LOGSI Ouvrir la base Logsi pour vérifier qu elle contient bien, pour 50 communes, les variables initiales ainsi que la probabilité d inclusion et le poids de sondages. Relancer plusieurs fois le programme pour vérifier que le tirage est toujours le même. Relancer plusieurs fois le programme en enlevant l option seed= et vérifier que les tirages diffèrent à chaque fois. Relancer le programme en enlevant l option stats et vérifier que le fichier Logsi ne contient plus les deux dernières variables. Relancer le programme en enlevant l option n= et en ajoutant l option rate=.1 qui correspond à un taux de sondage de 10% (samprate=.1 et rate=10 sont des options équivalentes). Vérifier que le nombre de communes tirées est alors n = 56 ce qui correspond à 10% N = 10% 554 = 55.4 arrondi à l entier supérieur. Relancer le programme avec les options de départ. (b) Pour le plan PEAR, taper le programme suivant title1 Fichier Rec99htegne : tirage selon un plan PEAR ; proc surveyselect data=sondages.htegne method=urs n=50 stats seed=47279 out=sondages.logpear; run; Remarquer que seule l option method= a été modifiée. Visualiser le fichier résultat logpear. On remarque que l on a toujours le poids de sondage (Sampling weight) qui permet de faire les estimations de totaux ou de moyennes dans la population. On a aussi la variable Number of Hits qui donne le nombre de fois qu un individu a été tiré (puisque le tirage est avec remise) et la variable Expected Number of Hits qui correspond à n/n. Dans l exemple précédent, on voit que toutes les communes ont été tirée une seule fois sauf une (31123 à la 2ème ligne) qui a été tirée 2 fois (le fichier résultat contient 49 lignes). Toutefois, même si la commune a été tirée 2 fois, elle n apparaît qu une fois dans le fichier résultat ce qui va compliquer les procédures d estimation. L option 4
5 OutHits permet de dupliquer les individus dans le fichier résultat autant de fois qu ils ont été tirés. Essayer cette option et vérifier que le fichier résultat contient bien 50 lignes avec duplication de la commune (a) Taper et exécuter le programme suivant. /* Tirage de 100 individus dans la base agri */ /* selon un plan SI */ title1 Fichier agri : tirage selon un plan simple SI ; proc surveyselect data=sondages.agri n=100 seed=5667 out=sondages.agrisi; run; Taper et exécuter le programme suivant. title1 Agriculteurs ; title2 Estimation proportion pour plan SI ; proc surveymeans data=sondages.agrisi total=7104; var agri; run; (b) La proportion est estimée par 1%. On a donc une sous-estimation de la vraie proportion. Mais on ne peut tirer aucune clonclusion générale car nous n avons qu un seul échantillon. (c) L écart-type de l estimateur de la proportion est (1 f)syu 2 /n = et l estimation de cet écart-type à partir de l échantillon tiré est On a sur-estimation de l écart-type sur cet exemple. Mais aucune conclusion générale ne peut être tirée car nous n avons qu un seul échantillon. Pour avoir une estimation de la variance sans tenir compte de la taille de population finie, il suffit d enlever l option total=7104 et d exécuter le même programme. Avec le logiciel R : On charge le Workspace pour les sondages constitué au TP précédent (utiliser le nom que vous avez choisi précédemment), ici c est : sondages.rdata. Le chargement se fait par le menu File/Load workspace... ou par une commande [frame=lines, fontsize=\scriptsize] > load("d:/yves/sondages/dess_texte/foad/tp_r/sondages.rdata") On vérifie le contenu du workspace chargé, le nom des variables de et si nécessaire le type de, comme ci-dessous : [frame=lines, fontsize=\small] > ls() [1] "a" "fpempl01" "last.warning" "q" "" [6] "vin" > dimnames()[[2]] [1] "CODE.N" "COMMUNE" "BVQ.N" "POPSDC99" "LOG" "LOGVAC" "STRATLOG" > is.data.frame() [1] TRUE 5
6 Le package sondages ayant quelques erreurs, on ne le charge pas mais on utilise le code R corrigé, libsondy.r (à télécharger) qu il faut d abord sourcer. Menu File/ Source R code... et on indique le répertoire où on a stocké ce code. 1. (a) Pour tirer les échantillons on utilise la fonction surveyselect. Tirage d un echantillon de taille 50, plan SI (=SRS= Simple Random Sampling) [ fontsize=\small] logsi <- surveyselect(,50,rep=1,methode="srs",nomstrat=null, nompps=null)" ou en donnant une graine ( ici, un nombre entier) pour pouvoir recommencer des simulations suivant le même mécanisme : [ fontsize=\small] logsi2 <-surveyselect(,n=50,rep=5,methode="srs",magraine=255)" On obtient [ fontsize=\small] ECHANTILLONNAGE DE LA TABLE : Données Méthode de sélection SRS Taille de l échantillon 50 Nombre de réplication 1 Taille de la table en sortie 50 Remarque. Si on lance plusieurs fois : [ fontsize=\small] surveyselect(,50,rep=1,methode="srs",nomstrat=null,nompps=null) on n obtient jamais le même résultat, alors qu avec [ fontsize=\small] surveyselect(,n=70,rep=5,methode="srs",magraine=255) où on donne à magraine une valeur entière on obtient la même série de simulations tant qu on donne à magraine une même valeur. La composition de logsi2 est obtenue par la fonction : summary(logsi2). On obtient : [frame=lines, fontsize=\small] Length Class Mode echantillon 8 data.frame list Donnees 1 -none- character N 1 -none- numeric Selection 1 -none- character Replic 1 -none- numeric 6
7 Pi 50 -none- numeric Poids 50 -none- numeric Taille.Ech 1 -none- numeric Taille.Output 1 -none- numeric PPS 1 -none- character VarAux 0 -none- NULL Stratification 1 -none- character VarStrat 0 -none- NULL Pour lister à l écran l échantillon on tape : logsi2\$echantillon Fabrication d un échantillon de taux de sondage donné : [frame=lines, fontsize=\small] srs2 <- surveyselect(,taux=10,rep=1,methode="srs", nomstrat=null,nompps=null,magraine=918742) ECHANTILLONNAGE DE LA TABLE : Données Méthode de sélection SRS Taille de l échantillon 56 Nombre de réplication 1 Taille de la table en sortie 56 (b) Tirage d un échantillon de taille 50 par un plan à probabilités égales avec remise : [frame=lines, fontsize=\small] logpear <- surveyselect(,n=50,rep=1,methode="urs", nomstrat=null,nompps=null,magraine=18174) ECHANTILLONNAGE DE LA TABLE : Données Méthode de sélection URS Taille de l échantillon 50 Nombre de réplication 1 Taille de la table en sortie 50 Contrairement à ce qui se passe dans SAS, on ne dispose pas du nombre d apparitions d une même unité statistique, mais on peut visualiser les répétitions : 7
8 ech <- logpear$echantillon > code <- ech$code.n > un <- unique(code) un contient les codes différents et sa longueur est < 50, le plus souvent. 2. Fabrication de la data frame agri. Elle contient uniquement les individus dont la variable NAFG16 est renseignée. On définit agri1 qui vaut 1 si un individu est agriculteur, 0 sinon. [fontsize=\small] a <- fpempl01$nafg16 anm <- a[a!= ""] nbnm <- NROW(anm) nbnm # agriculteur agri <- a[a == "EA"] agri1 <- matrix(0,ncol=1,nrow=nbnm) agri1[(anm == "EA"),] <- 1 nbagri <- NROW(agri) fp.agri <- cbind(fpempl01[anm,],agri1) nbagri = 299 et la base contient NROW(fp.agri), 7104 personnes. La proportion d agriculteurs dans la base est : nbagri/nbnm soit Tirage d un échantillon et estimation de la proportion d agriculteurs. La proportion à estimer est la moyenne de agri1. [fontsize=\small] > sagri <- surveyselect(fp.agri,n=100,rep=1,methode="srs", nomstrat=null,nompps=null,magraine=92315) ECHANTILLONNAGE DE LA TABLE : fp.agri Données fp.agri Méthode de sélection SRS Taille de l échantillon 100 Nombre de réplication 1 Taille de la table en sortie 100 > # estimation de la proportion dans l agriculture > # > propagri <- surveymeans(objet=sagri,var="agri1",est="moyenne",methode="srs ESTIMATIONS - SYNTHESE 8
9 Echantillon sagri Variable estimée agri1 Type d estimation moyenne Nombre d estimations 1 Moyenne des estimations 0.07 C.V. moyen des estimations > propagri num.ech estim.moyenne SDEV.estim.moyenne ICinf ICsup CV > Vérification du calcul de variance. [fontsize=\small] > varverif <- (1/sagri$Taille.Ech - 1/sagri$N)* var(sagri$echantillon$agri1 > varverif [1] > etypverif <- varverif^(.5) > etypverif [1] Ecart-type exact de l estimateur. [fontsize=\small] > # ecart type exact de l estimateur > etypex <- ((1/sagri$Taille.Ech - 1/sagri$N) * var(agri1))^(.5) > etypex [,1] [1,] Marges d erreur et intervalle de confiance. [fontsize=\small] > ic <- c((propagri$estim.moyenne-1.96*propagri$sdev.estim.moyenne), (propagri$estim.moyenne+1.96*propagri$sdev.estim.moyenne)) > ic [1] > # coefficient de variation > cv <- propagri$sdev.estim.moyenne/propagri$estim.moyenne > cv [1] > # marge d erreur absolue : > 1.96*propagri$SDEV.estim.moyenne [1] > # marge d erreur relative > 1.96*cv 9
10 [1] Exercice 4 : Un club de photographes amateurs a 1800 membres. On veut estimer le nombre moyen de pellicules utilisées par an par membre. On sait que par le passé, la moyenne et l écart-type du nombre de pellicules étaient respectivement 6 et 4. On choisit un niveau de confiance de 95%. Quelle taille d échantillon fautil prendre pour estimer (1) le nombre moyen de pellicules avec une marge d erreur relative de 7%? (2) le nombre total de pellicules avec une erreur absolue de 400. Corrigé : Pour (1), on applique la formule du cours et on a : n (4/6) 2 = arrondi à 349. Pour.07 2 (2), on a n ( /400) 2 = En prenant un échantillon de 78 membres on estimera le nombre total de pellicules utilisées avec une marge d erreur de moins de 400 pellicules, à 95%. Exercice 5 : Un quartier dans une certaine ville est formé de 3000 ménages rassemblant personnes. Pour étudier l intérêt d installer un dispensaire médical dans le quartier, on veut estimer le nombre total de consultations qu ont eu les personnes de ce quartier l an dernier. On veut un résultat à 10% maximum, de la vraie valeur, avec un niveau de confiance de 95%. Un sondage préliminaire portant sur 10 ménages donne les résultats rassemblés dans le tableau ci-dessous. Déterminer la taille d échantillon nécessaire pour faire l étude avec la précision requise. Ménage Nombre de personnes dans le ménage Nombre de consultations par personne durant l année précédente Indications. Le sondage porte sur des ménages et non sur des personnes. Exprimer d abord le total qu on doit estimer en fonction des données qu on peut collecter. On peut introduire : z k et v k, nombre de personnes et nombre de consultations par personnes, dans le ménage k et y k = z k v k le nombre de consultations dans le ménage k, U désigne la population des ménages et s l échantillon. Corrigé : On doit estimer t y = U y k. Les données permettent d estimer R = U y k/ U z k. C est un ratio qu on estime par R = y s /z s = 19.4/3.7 = , d où, S 2 = De plus y Rz var( R) (1/n 1/3000)(1/3.7 2 )S 2 = (1/n 1/3000) y Rz Notons M le nombre total de personnes : M = z k, t y = n kz k = MR, et t y = M R. La U U marge d erreur relative est z var( t y )/t y = z var( R)/R, où z = 1.96 est le quantile d ordre
11 d une N(0,1). On doit prendre n tel que 1.96 (1/n 1/3000) / On trouve n On prendra donc une taille n = 78. Compléments. Observons qu on n a pas utilisé le nombre total de personnes car on s est intéressé à une marge d erreur relative. On peut aussi estimer directement t y, sans envisager qu il y a une relation entre le nombre de consultations et la taille d un ménage. On trouve n Ne pas prendre en compte la variable nombre de personnes dans le ménage entraîne une perte de précision. 11
Théorie des sondages : cours 5
Théorie des sondages : cours 5 Camelia Goga IMB, Université de Bourgogne e-mail : camelia.goga@u-bourgogne.fr Master Besançon-2010 Chapitre 5 : Techniques de redressement 1. poststratification 2. l estimateur
Plus en détailLes simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R
Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R Yves Aragon, David Haziza & Anne Ruiz-Gazen GREMAQ, UMR CNRS 5604, Université des Sciences
Plus en détailPackage TestsFaciles
Package TestsFaciles March 26, 2007 Type Package Title Facilite le calcul d intervalles de confiance et de tests de comparaison avec prise en compte du plan d échantillonnage. Version 1.0 Date 2007-03-26
Plus en détailSéries Statistiques Simples
1. Collecte et Représentation de l Information 1.1 Définitions 1.2 Tableaux statistiques 1.3 Graphiques 2. Séries statistiques simples 2.1 Moyenne arithmétique 2.2 Mode & Classe modale 2.3 Effectifs &
Plus en détailIntroduction à l approche bootstrap
Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?
Plus en détailStatistiques Descriptives à une dimension
I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des
Plus en détailLa survie nette actuelle à long terme Qualités de sept méthodes d estimation
La survie nette actuelle à long terme Qualités de sept méthodes d estimation PAR Alireza MOGHADDAM TUTEUR : Guy HÉDELIN Laboratoire d Épidémiologie et de Santé publique, EA 80 Faculté de Médecine de Strasbourg
Plus en détailEstimation et tests statistiques, TD 5. Solutions
ISTIL, Tronc commun de première année Introduction aux méthodes probabilistes et statistiques, 2008 2009 Estimation et tests statistiques, TD 5. Solutions Exercice 1 Dans un centre avicole, des études
Plus en détailObservatoire Economique et Statistique d Afrique Subsaharienne
Observatoire Economique et Statistique d Afrique Subsaharienne Termes de référence pour le recrutement de quatre (4) consultants dans le cadre du Projet «Modules d initiation à la statistique à l attention
Plus en détailAnnexe commune aux séries ES, L et S : boîtes et quantiles
Annexe commune aux séries ES, L et S : boîtes et quantiles Quantiles En statistique, pour toute série numérique de données à valeurs dans un intervalle I, on définit la fonction quantile Q, de [,1] dans
Plus en détailProbabilités conditionnelles Loi binomiale
Exercices 23 juillet 2014 Probabilités conditionnelles Loi binomiale Équiprobabilité et variable aléatoire Exercice 1 Une urne contient 5 boules indiscernables, 3 rouges et 2 vertes. On tire au hasard
Plus en détailFeuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.
Université de Nantes Année 2013-2014 L3 Maths-Eco Feuille 6 : Tests Exercice 1 On cherche à connaître la température d ébullition µ, en degrés Celsius, d un certain liquide. On effectue 16 expériences
Plus en détailStatistiques à une variable
Statistiques à une variable Calcul des paramètres statistiques TI-82stats.fr? Déterminer les paramètres de la série statistique : Valeurs 0 2 3 5 8 Effectifs 16 12 28 32 21? Accès au mode statistique Touche
Plus en détaildistribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position
Arbre de NESI distribution quelconque Signe 1 échantillon distribution symétrique non gaussienne Wilcoxon gaussienne Student position appariés 1 échantillon sur la différence avec référence=0 2 échantillons
Plus en détailCONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)
CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un
Plus en détailLA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers
Plus en détailPrécision d un résultat et calculs d incertitudes
Précision d un résultat et calculs d incertitudes PSI* 2012-2013 Lycée Chaptal 3 Table des matières Table des matières 1. Présentation d un résultat numérique................................ 4 1.1 Notations.........................................................
Plus en détailTests statistiques et régressions logistiques sous R, avec prise en compte des plans d échantillonnage complexes
, avec prise en compte des plans d échantillonnage complexes par Joseph LARMARANGE version du 29 mars 2007 Ce cours a été développé pour une formation niveau M2 et Doctorat des étudiants du laboratoire
Plus en détailLa nouvelle planification de l échantillonnage
La nouvelle planification de l échantillonnage Pierre-Arnaud Pendoli Division Sondages Plan de la présentation Rappel sur le Recensement de la population (RP) en continu Description de la base de sondage
Plus en détailTSTI 2D CH X : Exemples de lois à densité 1
TSTI 2D CH X : Exemples de lois à densité I Loi uniforme sur ab ; ) Introduction Dans cette activité, on s intéresse à la modélisation du tirage au hasard d un nombre réel de l intervalle [0 ;], chacun
Plus en détailNOTE SUR LA MODELISATION DU RISQUE D INFLATION
NOTE SUR LA MODELISATION DU RISQUE D INFLATION 1/ RESUME DE L ANALYSE Cette étude a pour objectif de modéliser l écart entre deux indices d inflation afin d appréhender le risque à très long terme qui
Plus en détailSoit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.
ANALYSE 5 points Exercice 1 : Léonie souhaite acheter un lecteur MP3. Le prix affiché (49 ) dépasse largement la somme dont elle dispose. Elle décide donc d économiser régulièrement. Elle a relevé qu elle
Plus en détailActuariat I ACT2121. septième séance. Arthur Charpentier. Automne 2012. charpentier.arthur@uqam.ca. http ://freakonometrics.blog.free.
Actuariat I ACT2121 septième séance Arthur Charpentier charpentier.arthur@uqam.ca http ://freakonometrics.blog.free.fr/ Automne 2012 1 Exercice 1 En analysant le temps d attente X avant un certain événement
Plus en détailt 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :
Terminale STSS 2 012 2 013 Pourcentages Synthèse 1) Définition : Calculer t % d'un nombre, c'est multiplier ce nombre par t 100. 2) Exemples de calcul : a) Calcul d un pourcentage : Un article coûtant
Plus en détailChapitre 3 : INFERENCE
Chapitre 3 : INFERENCE 3.1 L ÉCHANTILLONNAGE 3.1.1 Introduction 3.1.2 L échantillonnage aléatoire 3.1.3 Estimation ponctuelle 3.1.4 Distributions d échantillonnage 3.1.5 Intervalles de probabilité L échantillonnage
Plus en détailDETERMINATION DE L INCERTITUDE DE MESURE POUR LES ANALYSES CHIMIQUES QUANTITATIVES
Agence fédérale pour la Sécurité de la Chaîne alimentaire Administration des Laboratoires Procédure DETERMINATION DE L INCERTITUDE DE MESURE POUR LES ANALYSES CHIMIQUES QUANTITATIVES Date de mise en application
Plus en détailCours 1. I- Généralités sur R II- Les fonctions de R et autres objets III-Les vecteurs
Cours 1 I- Généralités sur R II- Les fonctions de R et autres objets III-Les vecteurs IV-Les facteurs I-1 Généralités sur R R (1995, AT&T Bell Laboratories) est un logiciel d analyse statistique et graphique,
Plus en détailSTA108 Enquêtes et sondages. Sondages àplusieurs degrés et par grappes
STA108 Enquêtes et sondages Sondages àplusieurs degrés et par grappes Philippe Périé, novembre 2011 Sondages àplusieurs degrés et par grappes Introduction Sondages à plusieurs degrés Tirage des unités
Plus en détailEVALUATION DE LA QUALITE DES SONDAGES EN LIGNE : CAS D UN SONDAGE D OPINION AU BURKINA FASO
EVALUATION DE LA QUALITE DES SONDAGES EN LIGNE : CAS D UN SONDAGE D OPINION AU BURKINA FASO Auteur Baguinébié Bazongo 1 Ingénieur Statisticien Economiste Chef de l Unité de recherche à l Institut national
Plus en détailFiche qualité relative à l enquête Santé et Itinéraire Professionnel 2010 (SIP) Carte d identité de l enquête
Fiche qualité relative à Santé et Itinéraire Professionnel 2010 (SIP) Nom Années de Périodicité Panel (suivi d échantillon) Services concepteurs Service réalisant Sujets principaux traités dans Carte d
Plus en détailReprésentation des Nombres
Chapitre 5 Représentation des Nombres 5. Representation des entiers 5.. Principe des représentations en base b Base L entier écrit 344 correspond a 3 mille + 4 cent + dix + 4. Plus généralement a n a n...
Plus en détailCONCEPTION ET TIRAGE DE L ÉCHANTILLON
CHAPITRE 4 CONCEPTION ET TIRAGE DE L ÉCHANTILLON Ce chapitre technique 1 s adresse principalement aux spécialistes de sondage, mais aussi au coordinateur et aux autres responsables techniques de l enquête.
Plus en détailCREATION D UNE EVALUATION AVEC JADE par Patrick RUER (www.mathenvideo.comuv.com)
TABLE DES MATIERES I) Le logiciel JADE 2 II) Etablissements 3 1) Configuation de l établissement 3 2) Importation des classes avec SCONET 4 3) Les groupes d élèves 6 4) Les variables supplémentaires 6
Plus en détailTP: Représentation des signaux binaires. 1 Simulation d un message binaire - Codage en ligne
Objectifs : Ce TP est relatif aux différentes méthodes de codage d une information binaire, et à la transmission en bande de base de cette information. Les grandes lignes de ce TP sont l étude des méthodes
Plus en détailLire ; Compter ; Tester... avec R
Lire ; Compter ; Tester... avec R Préparation des données / Analyse univariée / Analyse bivariée Christophe Genolini 2 Table des matières 1 Rappels théoriques 5 1.1 Vocabulaire....................................
Plus en détailFOTO - L OMNIBUS MENSUEL DE CROP LE NOUVEAU CROP-EXPRESS
FOTO - L OMNIBUS MENSUEL DE CROP LE NOUVEAU CROP-EXPRESS 550, RUE SHERBROOKE OUEST MONTRÉAL (QUÉBEC) H3A 1B9 BUREAU 900 TOUR EST T 514 849-8086, POSTE 3064 Réflexions méthodologiques Depuis des années,
Plus en détaildonnées en connaissance et en actions?
1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)
Plus en détailDirection des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels
Etab=MK3, Timbre=G430, TimbreDansAdresse=Vrai, Version=W2000/Charte7, VersionTravail=W2000/Charte7 Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels
Plus en détailSanté environnement. Description du budget espace-temps et estimation de l exposition de la population française dans son logement
Santé environnement Description du budget espace-temps et estimation de l exposition de la population française dans son logement Sommaire Abréviations 2 1. Introduction 3 2. Données recueillies 4 2.1
Plus en détail23. Interprétation clinique des mesures de l effet traitement
23. Interprétation clinique des mesures de l effet traitement 23.1. Critères de jugement binaires Plusieurs mesures (indices) sont utilisables pour quantifier l effet traitement lors de l utilisation d
Plus en détail3. Caractéristiques et fonctions d une v.a.
3. Caractéristiques et fonctions d une v.a. MTH2302D S. Le Digabel, École Polytechnique de Montréal H2015 (v2) MTH2302D: fonctions d une v.a. 1/32 Plan 1. Caractéristiques d une distribution 2. Fonctions
Plus en détailUFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES
Université Paris 13 Cours de Statistiques et Econométrie I UFR de Sciences Economiques Année 2008-2009 Licence de Sciences Economiques L3 Premier semestre TESTS PARAMÉTRIQUES Remarque: les exercices 2,
Plus en détailFeuille d exercices 2 : Espaces probabilisés
Feuille d exercices 2 : Espaces probabilisés Cours de Licence 2 Année 07/08 1 Espaces de probabilité Exercice 1.1 (Une inégalité). Montrer que P (A B) min(p (A), P (B)) Exercice 1.2 (Alphabet). On a un
Plus en détailBaccalauréat ES Pondichéry 7 avril 2014 Corrigé
Baccalauréat ES Pondichéry 7 avril 204 Corrigé EXERCICE 4 points Commun à tous les candidats. Proposition fausse. La tangente T, passant par les points A et B d abscisses distinctes, a pour coefficient
Plus en détailCours 7 : Utilisation de modules sous python
Cours 7 : Utilisation de modules sous python 2013/2014 Utilisation d un module Importer un module Exemple : le module random Importer un module Exemple : le module random Importer un module Un module est
Plus en détailManipulation de données avec SAS Enterprise Guide et modélisation prédictive avec SAS Enterprise Miner
Le cas Orion Star Manipulation de données avec SAS Enterprise Guide et modélisation prédictive avec SAS Enterprise Miner Le cas Orion Star... 1 Manipulation de données avec SAS Enterprise Guide et modélisation
Plus en détailProbabilités III Introduction à l évaluation d options
Probabilités III Introduction à l évaluation d options Jacques Printems Promotion 2012 2013 1 Modèle à temps discret 2 Introduction aux modèles en temps continu Limite du modèle binomial lorsque N + Un
Plus en détailProbabilités Loi binomiale Exercices corrigés
Probabilités Loi binomiale Exercices corrigés Sont abordés dans cette fiche : (cliquez sur l exercice pour un accès direct) Exercice 1 : épreuve de Bernoulli Exercice 2 : loi de Bernoulli de paramètre
Plus en détailExercices supplémentaires sur l introduction générale à la notion de probabilité 2009-2010
Exercices supplémentaires sur l introduction générale à la notion de probabilité 2009-2010 Exercices fortement conseillés : 6, 10 et 14 1) Un groupe d étudiants est formé de 20 étudiants de première année
Plus en détailMoments des variables aléatoires réelles
Chapter 6 Moments des variables aléatoires réelles Sommaire 6.1 Espérance des variables aléatoires réelles................................ 46 6.1.1 Définition et calcul........................................
Plus en détailIntroduction aux Statistiques et à l utilisation du logiciel R
Introduction aux Statistiques et à l utilisation du logiciel R Christophe Lalanne Christophe Pallier 1 Introduction 2 Comparaisons de deux moyennes 2.1 Objet de l étude On a mesuré le temps de sommeil
Plus en détail1 Importer et modifier des données avec R Commander
Université de Nantes 2015/2016 UFR des Sciences et Techniques Département de Mathématiques TP1 STATISTIQUE DESCRIPTIVE Frédéric Lavancier Avant propos Ouvrir l application R Saisir dans la console library(rcmdr)
Plus en détailProbabilités sur un univers fini
[http://mp.cpgedupuydelome.fr] édité le 7 août 204 Enoncés Probabilités sur un univers fini Evènements et langage ensembliste A quelle condition sur (a, b, c, d) ]0, [ 4 existe-t-il une probabilité P sur
Plus en détailDéroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI
1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage
Plus en détailNombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN
Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN Table des matières. Introduction....3 Mesures et incertitudes en sciences physiques
Plus en détailStatistique Descriptive Élémentaire
Publications de l Institut de Mathématiques de Toulouse Statistique Descriptive Élémentaire (version de mai 2010) Alain Baccini Institut de Mathématiques de Toulouse UMR CNRS 5219 Université Paul Sabatier
Plus en détailTable des matières L INTEGRATION DE SAS AVEC JMP. Les échanges de données entre SAS et JMP, en mode déconnecté. Dans JMP
L INTEGRATION DE SAS AVEC JMP Quelles sont les techniques possibles pour intégrer SAS avec JMP? Comment échanger des données entre SAS et JMP? Comment connecter JMP à SAS? Quels sont les apports d une
Plus en détailStatistiques avec la graph 35+
Statistiques avec la graph 35+ Enoncé : Dans une entreprise, on a dénombré 59 femmes et 130 hommes fumeurs. L entreprise souhaite proposer à ses employés plusieurs méthodes pour diminuer, voire arrêter,
Plus en détailModélisation et simulation
Modélisation et simulation p. 1/36 Modélisation et simulation INFO-F-305 Gianluca Bontempi Département d Informatique Boulevard de Triomphe - CP 212 http://www.ulb.ac.be/di Modélisation et simulation p.
Plus en détailLicence Economie-Gestion, 1ère Année Polycopié de Statistique Descriptive. Année universitaire : 2014-2015.
Licence Economie-Gestion, 1ère Année Polycopié de Statistique Descriptive. Année universitaire : 2014-2015. Thèmes des séances de TD Thème n.1: Tableaux statistiques et représentations graphiques. Thème
Plus en détailTABLE DES MATIERES. C Exercices complémentaires 42
TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence
Plus en détailBaccalauréat ES/L Amérique du Sud 21 novembre 2013
Baccalauréat ES/L Amérique du Sud 21 novembre 2013 A. P. M. E. P. EXERCICE 1 Commun à tous les candidats 5 points Une entreprise informatique produit et vend des clés USB. La vente de ces clés est réalisée
Plus en détailApproche Contract First
Exemple HelpDesk Approche Contract First Développement d un premier web service en utilisant l approche contract first (ou WSDL First) Écriture du wsdl avant d écrire le code java Autre possibilité implementation
Plus en détail1 Introduction - Qu est-ce que le logiciel R?
Master 1 GSI - Mentions ACCIE et RIM - ULCO, La Citadelle, 2012/2013 Mesures et Analyses Statistiques de Données - Probabilités TP 1 - Initiation au logiciel R 1 Introduction - Qu est-ce que le logiciel
Plus en détailLes devoirs en Première STMG
Les devoirs en Première STMG O. Lader Table des matières Devoir sur table 1 : Proportions et inclusions....................... 2 Devoir sur table 1 : Proportions et inclusions (corrigé)..................
Plus en détailLE RÔLE DE LA STATISTIQUE DANS UN PROCESSUS DE PRISE DE DÉCISION
LE RÔLE DE LA STATISTIQUE DANS UN PROCESSUS DE PRISE DE DÉCISION Sylvie Gervais Service des enseignements généraux École de technologie supérieure (sylvie.gervais@etsmtl.ca) Le laboratoire des condensateurs
Plus en détailPrincipe d un test statistique
Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre
Plus en détailLicence MASS 2000-2001. (Re-)Mise à niveau en Probabilités. Feuilles de 1 à 7
Feuilles de 1 à 7 Ces feuilles avec 25 exercices et quelques rappels historiques furent distribuées à des étudiants de troisième année, dans le cadre d un cours intensif sur deux semaines, en début d année,
Plus en détailMESURE ET PRECISION. Il est clair que si le voltmètre mesure bien la tension U aux bornes de R, l ampèremètre, lui, mesure. R mes. mes. .
MESURE ET PRECISIO La détermination de la valeur d une grandeur G à partir des mesures expérimentales de grandeurs a et b dont elle dépend n a vraiment de sens que si elle est accompagnée de la précision
Plus en détailNombre dérivé et tangente
Nombre dérivé et tangente I) Interprétation graphique 1) Taux de variation d une fonction en un point. Soit une fonction définie sur un intervalle I contenant le nombre réel a, soit (C) sa courbe représentative
Plus en détailManuel d utilisation du module Liste de cadeaux PRO par Alize Web
Manuel d utilisation du module Liste de cadeaux PRO par Alize Web INSTALLER ET CONFIGURER LE MODULE (BACK OFFICE) 2 Réglages des performances 2 Télécharger le module 3 Installer le module 4 Configurer
Plus en détailBaccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé
Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé A. P. M. E. P. Exercice 1 5 points 1. Réponse d. : 1 e Le coefficient directeur de la tangente est négatif et n est manifestement pas 2e
Plus en détailÉvaluations aléatoires : Comment tirer au sort?
Évaluations aléatoires : Comment tirer au sort? William Parienté Université Catholique de Louvain J-PAL Europe povertyactionlab.org Plan de la semaine 1. Pourquoi évaluer? 2. Comment mesurer l impact?
Plus en détailTableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1
UN GROUPE D INDIVIDUS Un groupe d individus décrit par une variable qualitative binaire DÉCRIT PAR UNE VARIABLE QUALITATIVE BINAIRE ANALYSER UN SOUS-GROUPE COMPARER UN SOUS-GROUPE À UNE RÉFÉRENCE Mots-clés
Plus en détailTests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles
Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Valentin Patilea 1 Cesar Sanchez-sellero 2 Matthieu Saumard 3 1 CREST-ENSAI et IRMAR 2 USC Espagne 3 IRMAR-INSA
Plus en détailLES REGLEMENTS AVEC SOCIEL.NET DERNIERE MISE A JOUR : le 14 juin 2010
LES REGLEMENTS AVEC SOCIEL.NET DERNIERE MISE A JOUR : le 14 juin 2010 Guillaume Informatique 10 rue Jean-Pierre Blachier 42150 La Ricamarie Tél. : 04 77 36 20 60 - Fax : 04 77 36 20 69 - Email : info@guillaume-informatique.com
Plus en détailEXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG
Exploitations pédagogiques du tableur en STG Académie de Créteil 2006 1 EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG Commission inter-irem lycées techniques contact : dutarte@club-internet.fr La maquette
Plus en détailGESTION DE STOCKS AVEC CIEL GESTION COMMERCIALE
GESTION DE STOCKS AVEC CIEL GESTION COMMERCIALE La gestion de stocks est complexe. Deux questions illustrent cette complexité : Première question : en supposant que le stock d un article comprenne 2 unités
Plus en détailGestion des données avec R
Gestion des données avec R Christophe Lalanne & Bruno Falissard Table des matières 1 Introduction 1 2 Importation de fichiers CSV 1 2.1 Structure du fichier de données...................................
Plus en détailGestion obligataire passive
Finance 1 Université d Evry Séance 7 Gestion obligataire passive Philippe Priaulet L efficience des marchés Stratégies passives Qu est-ce qu un bon benchmark? Réplication simple Réplication par échantillonnage
Plus en détailAide - mémoire gnuplot 4.0
Aide - mémoire gnuplot 4.0 Nicolas Kielbasiewicz 20 juin 2008 L objet de cet aide-mémoire est de présenter les commandes de base pour faire rapidement de très jolis graphiques et courbes à l aide du logiciel
Plus en détailLogiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS
Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence
Plus en détailTD d économétrie appliquée : Introduction à STATA
Ecole normale supérieure (ENS) Département d économie TD d économétrie appliquée : Introduction à STATA Marianne Tenand marianne.tenand@ens.fr OBJECTIFS DU TD Découvrir le logiciel d économétrie STATA,
Plus en détailProbabilités et Statistiques. Feuille 2 : variables aléatoires discrètes
IUT HSE Probabilités et Statistiques Feuille : variables aléatoires discrètes 1 Exercices Dénombrements Exercice 1. On souhaite ranger sur une étagère 4 livres de mathématiques (distincts), 6 livres de
Plus en détailConversion d un entier. Méthode par soustraction
Conversion entre bases Pour passer d un nombre en base b à un nombre en base 10, on utilise l écriture polynomiale décrite précédemment. Pour passer d un nombre en base 10 à un nombre en base b, on peut
Plus en détailExercice autour de densité, fonction de répatition, espérance et variance de variables quelconques.
14-3- 214 J.F.C. p. 1 I Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques. Exercice 1 Densité de probabilité. F { ln x si x ], 1] UN OVNI... On pose x R,
Plus en détailChapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE
UE4 : Biostatistiques Chapitre 3 : Principe des tests statistiques d hypothèse José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Introduction
Plus en détailTraitement des données avec Microsoft EXCEL 2010
Traitement des données avec Microsoft EXCEL 2010 Vincent Jalby Septembre 2012 1 Saisie des données Les données collectées sont saisies dans une feuille Excel. Chaque ligne correspond à une observation
Plus en détailINF6304 Interfaces Intelligentes
INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie
Plus en détailI. Cas de l équiprobabilité
I. Cas de l équiprobabilité Enoncé : On lance deux dés. L un est noir et l autre est blanc. Calculer les probabilités suivantes : A «Obtenir exactement un as» «Obtenir au moins un as» C «Obtenir au plus
Plus en détailSOFI Gestion+ Version 5.4. Echanges de données informatiques Spicers Sofi gestion+ Groupements. SOFI Informatique. Actualisé le 10.09.
SOFI Gestion+ SOFI Informatique Version 5.4 Echanges de données informatiques Spicers Sofi gestion+ Groupements Actualisé le 10.09.2004 Table des matières 1. Catalogue et tarifs... 4 1.1 Définition EDI...
Plus en détailLoi binomiale Lois normales
Loi binomiale Lois normales Christophe ROSSIGNOL Année scolaire 204/205 Table des matières Rappels sur la loi binomiale 2. Loi de Bernoulli............................................ 2.2 Schéma de Bernoulli
Plus en détail1 Imputation par la moyenne
Introduction au data mining L3 MIS - STA 1616-2010 V. Monbet Données manquantes L'objectif de ce TD est de manipuler et de comparer plusieurs méthodes d'imputation de données manquantes. La première partie
Plus en détailEstimation: intervalle de fluctuation et de confiance. Mars 2012. IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison
Estimation: intervalle de fluctuation et de confiance Mars 2012 IREM: groupe Proba-Stat Estimation Term.1 Intervalle de fluctuation connu : probabilité p, taille de l échantillon n but : estimer une fréquence
Plus en détailTable des matières. I Mise à niveau 11. Préface
Table des matières Préface v I Mise à niveau 11 1 Bases du calcul commercial 13 1.1 Alphabet grec...................................... 13 1.2 Symboles mathématiques............................... 14 1.3
Plus en détailLe patrimoine des ménages retraités : résultats actualisés. Secrétariat général du Conseil d orientation des retraites
CONSEIL D ORIENTATION DES RETRAITES Séance plénière du 08 juillet 2015 à 9 h 30 «Le patrimoine des retraités et l épargne retraite» Document N 2 bis Document de travail, n engage pas le Conseil Le patrimoine
Plus en détailFaut-il pondérer? ...Ou l'éternelle question de l'économètre confronté à un problème de sondage. Laurent Davezies et Xavier D'Haultf uille.
Faut-il pondérer?...ou l'éternelle question de l'économètre confronté à un problème de sondage Laurent Davezies et Xavier D'Haultf uille Juin 2009 Résumé Ce papier précise dans quels cas les estimations
Plus en détailRéseau SCEREN. Ce document a été numérisé par le CRDP de Bordeaux pour la. Base Nationale des Sujets d Examens de l enseignement professionnel.
Ce document a été numérisé par le CRDP de Bordeaux pour la Base Nationale des Sujets d Examens de l enseignement professionnel. Campagne 2013 Ce fichier numérique ne peut être reproduit, représenté, adapté
Plus en détailManuel. Administration P.CONSEIL. 12 avril 2011. Statut :
Manuel Administration P.CONSEIL 12 avril 2011 Statut : SOMMAIRE 1 Accès au site...4 1.1 comment?...4 1.2 Qui?...4 2 Menu...4 3 Gestion des évenements (EVENEMENTS)...4 4 Gestion des articles et des commentaires
Plus en détail