Package TestsFaciles



Documents pareils
Tests statistiques et régressions logistiques sous R, avec prise en compte des plans d échantillonnage complexes

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

Principe d un test statistique

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Introduction aux Statistiques et à l utilisation du logiciel R

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

données en connaissance et en actions?

Gestion des données avec R

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

Analyse de la variance Comparaison de plusieurs moyennes

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

Cours 1. I- Généralités sur R II- Les fonctions de R et autres objets III-Les vecteurs

Examen de Logiciels Statistiques

Estimation et tests statistiques, TD 5. Solutions

Document d orientation sur les allégations issues d essais de non-infériorité

R01 Import de données

Sondage de référence 2005 sur la satisfaction des clients du CRSH

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

EVALUATION DE LA QUALITE DES SONDAGES EN LIGNE : CAS D UN SONDAGE D OPINION AU BURKINA FASO

Cours de Tests paramétriques

Le risque Idiosyncrasique

VI. Tests non paramétriques sur un échantillon

La problématique des tests. Cours V. 7 mars Comment quantifier la performance d un test? Hypothèses simples et composites

TP1 Méthodes de Monte Carlo et techniques de réduction de variance, application au pricing d options

CONCEPTION ET TIRAGE DE L ÉCHANTILLON

Aide-mémoire de statistique appliquée à la biologie

DETERMINATION DE L INCERTITUDE DE MESURE POUR LES ANALYSES CHIMIQUES QUANTITATIVES

MANIPULATION ET VISUALISATION DE GROSSES BASES DE DONNÉES AVEC R

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

1. Les comptes de dépôt et d épargne

TABLE DES MATIERES. C Exercices complémentaires 42

Statistiques Descriptives à une dimension

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

2010 Minitab, Inc. Tous droits réservés. Version Minitab, le logo Minitab, Quality Companion by Minitab et Quality Trainer by Minitab sont des

Chapitre 3 : INFERENCE

Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux

Les concepts de base, l organisation des données

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

Évaluation de la régression bornée

TD3: tableaux avancées, première classe et chaînes

Introduction à l approche bootstrap

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Probabilité et Statistique pour le DEA de Biosciences. Avner Bar-Hen

Introduction à JDBC. Accès aux bases de données en Java

Régler les paramètres de mesure en choisissant un intervalle de mesure 10µs et 200 mesures.

Initiation à l analyse en composantes principales

LE RÔLE DE LA STATISTIQUE DANS UN PROCESSUS DE PRISE DE DÉCISION

COMMANDES SQL... 2 COMMANDES DE DEFINITION DE DONNEES... 2

1 Objectifs. Traitement statistique des données d enquête avec introduction à SPSS. Plan

Fonds d investissement Tangerine

Introduction à R. Florence Yerly. Dept. de mathématiques, Université de Fribourg (CH) SP 2011

Optimisation, traitement d image et éclipse de Soleil

3.2. Matlab/Simulink Généralités

Biostatistiques : Petits effectifs

IBM SPSS Direct Marketing 21

Une variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants)

Modèle de calcul des paramètres économiques

Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position

Valeur verte des logements d après les bases Notariales BIEN et PERVAL Synthèse

Introduction à la Statistique Inférentielle

Guide de formation EndNote Web Interface EndNote Web

MINISTERE DE L'ECONOMIE ET DU DEVELOPPEMENT SECRETARIAT GENERAL INSTITUT NATIONAL DE LA STATISTIQUE ET DE LA DEMOGRAPHIE

Lire ; Compter ; Tester... avec R

Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction.

La nouvelle planification de l échantillonnage

Brock. Rapport supérieur

Initiation au logiciel R

Table des matières. I Mise à niveau 11. Préface

SOMMAIRE. 01_Installation ESXi Serveur HP.doc. Chapitre 1 Installation ESXi 5.1 2

INF6304 Interfaces Intelligentes

23. Interprétation clinique des mesures de l effet traitement

Article. L influence de la méthode d échantillonnage et des intervieweurs sur la réalisation de l échantillon dans l Enquête sociale européenne

Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels

Sommaire. Rentabilité du retour d une franchise de baseball de la Ligue majeure de baseball à Montréal (les «Expos»)

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1

Evaluation de la variabilité d'un système de mesure

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé

LES DIFFÉRENTS FORMATS AUDIO NUMÉRIQUES

Santé environnement. Description du budget espace-temps et estimation de l exposition de la population française dans son logement

Optimisation du rééchantillonnage dans un logiciel d Amélioration des Plantes

Généralités. javadoc. Format des commentaires. Format des commentaires. Caractères spéciaux. Insérer du code

Séance 0 : Linux + Octave : le compromis idéal

1. Qu'est-ce que SQL? La maintenance des bases de données Les manipulations des bases de données... 5

Sommaire. BilanStat manuel de présentation et d utilisation Page 2

Examen Etude de marché

Classe ClInfoCGI. Fonctions membres principales. Gestion des erreurs

Équivalence et Non-infériorité

Guide de recherche documentaire à l usage des doctorants. Partie 1 : Exploiter les bases de données académiques

Partie 1. Fonctions plus complexes dans Excel. Fonctions Si(), Et(), Ou() et fonctions imbriquées. Opérateurs logiques. I.1.

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Echantillonnage INTRODUCTION. Module 1

Logiciel XLSTAT version rue Damrémont PARIS

Transmission d informations sur le réseau électrique

Leçon 5. Systèmes de gestion à recomplétement périodique et stock de sécurité

Séminaire TEST. 1 Présentation du sujet. October 18th, 2013

SQL Server dans

Épreuve collaborative

Mémoire d actuariat - promotion complexité et limites du modèle actuariel, le rôle majeur des comportements humains.

Transcription:

Package TestsFaciles March 26, 2007 Type Package Title Facilite le calcul d intervalles de confiance et de tests de comparaison avec prise en compte du plan d échantillonnage. Version 1.0 Date 2007-03-26 Author Joseph LARMARANGE Maintainer Joseph LARMARANGE <joseph@larmarange.net> Depends survey Ce mini-package fournit deux fonctions (int.conf et compare) pour faciliter le calcul d intervalles de confiance et de tests statistiques à l aide du package survey afin de prendre en compte un plan d échantillonange complexe. De plus, il fournit une fonction importer.spss, proche de read.spss, mais permettant de renvoyer un type factor lorsqu une étiquette de données est définie dans le fichier.sav mais non présente dans les données. License CeCILL-C - http://www.cecill.info/ URL http://joseph.larmarange.net/tests-statistiques-avec-prise-en.html R topics documented: TestsFaciles-package.................................... 1 compare........................................... 3 importer.spss........................................ 4 int.conf........................................... 5 Index 7 1

2 TestsFaciles-package TestsFaciles-package Facilite le calcul d intervalles de confiance et de tests de comparaison avec prise en compte du plan d échantillonnage. Ce mini-package fournit deux fonctions (int.conf et compare) pour faciliter le calcul d intervalles de confiance et de tests statistiques à l aide du package survey afin de prendre en compte un plan d échantillonange complexe. De plus, il fournit une fonction importer.spss, proche de read.spss, mais permettant de renvoyer un type factor lorsqu une étiquette de données est définie dans le fichier.sav mais non présente dans les données. Package: TestsFaciles Type: Package Version: 1.0 Date: 2007-03-26 License: CeCILL-C - http://www.cecill.info/ Author(s) Joseph LARMARANGE <joseph@larmarange.net> http://joseph.larmarange.net/tests-statistiques-avec-prise-en.html Package survey data(api) # Spécification du plan d'échantillonnage donnees <- svydesign(id=~dnum, weights=~pw, data=apiclus1) # Intervalles de confiance int.conf(~api99+yr.rnd, donnees) # pour mieux visualiser les résultats t(int.conf(~api99+yr.rnd, donnees)) # résultats par sous-groupes t(int.conf(~api99+yr.rnd, donnees, by=~stype)) # Comparaison de 2 moyennes ou de 2 proportions compare(~api99, donnees, by=~stype)

compare 3 # on peut effectuer plusieurs comparaisons en même temps compare(~api99+yr.rnd, donnees, by=~stype) # facilite l'affichage des résultats t(compare(~api99+yr.rnd, donnees, by=~stype)) compare Test de comparaison de deux moyennes ou deux proportions. Compare des moyennes ou des proportions deux à deux selon leur valeur dans différents sousgroupes. Usage compare(x, design, by, loi = "student") Arguments x design by loi formule. Liste des variables que l on souhaite tester. objet de la classe svydesign ou tableau de données. Données. formule. Liste des variables de type facteur définissant les groupes à comparer. texte. student ou normale. Spécifie la loi utilisée pour le calcul des intervalles. Voir les détails. Les tests de comparaison effectués par cette fonction considèrent que, sous l hypthèse nulle, x 1 x 2 SE 2 1 + SE 2 2 Value suit une loi normale centrée réduite (si loi= normale ) ou une loi t de Student à n 1 + n 2 2 degrés de liberté si loi= student. Les moyennes, proportions, écarts-types et effectifs sont calculés avec int.conf. Le test bilatéral teste si x 1 x 2 (hypothèse nulle : x 1 = x 2 ). Le test unilatéral teste si x 1 > x 2 (hypothèse nulle : x 1 x 2 ). Un tableau de données avec une ligne par combinaison de groupes et les colonnes suivantes pour chaque variable x testée. valeur1.x Valeur de x dans le groupe 1. valeur2.x Valeur de x dans le groupe 2. difference.x valeur1.x - valeur2.x p.unilateral.x Valeur de p au test unilatéral. p.bilateral.x valeur de p au test bilatéral. type.x Type de grandeur : moyenne ou proportion.

4 importer.spss int.conf data(api) # Spécification du plan d'échantillonnage donnees <- svydesign(id=~dnum, weights=~pw, data=apiclus1) # Comparaison de 2 moyennes ou de 2 proportions compare(~api99, donnees, by=~stype) # on peut effectuer plusieurs comparaisons en même temps compare(~api99+yr.rnd, donnees, by=~stype) # facilite l'affichage des résultats t(compare(~api99+yr.rnd, donnees, by=~stype)) importer.spss Lire un fichier SPSS au format.sav. Usage Cette fonction est identique à read.spss exceptée sur un point. En effet, si dans le fichier SPSS, une variable comporte des étiquettes de valeurs non présentes dans les données, read.spss renvoie une colonne de type atomic tandis que importer.spss renvoie une colonne de type factor. Les options par défaut diffèrent également. importer.spss( file, use.value.labels = TRUE, to.data.frame = TRUE, max.value.labels = Inf, trim.factor.names = TRUE) Arguments file character. Nom du fichier sav à lire et transformer en data.frame. use.value.labels logical. Convertir les variables avec des étiquettes de valeurs en colonnes de type factor? to.data.frame logical. Renvoyer un data.frame? Renvoie une liste sinon. max.value.labels logical. Seules les variables ayant au maximum ce nombre de modalités seront converties en factor. trim.factor.names logical. Supprimer les espaces des noms des facteurs?

int.conf 5 Cette fonction est identique à read.spss exceptée sur un point. En effet, si dans le fichier SPSS, une variable comporte des étiquettes de valeurs non présentes dans les données, read.spss renvoie une colonne de type atomic tandis que importer.spss renvoie une colonne de type factor. Les options par défaut diffèrent légèrement. par défaut, importer.spss renvoie un tableau de données et supprime les espaces inutiles des noms de facteur. read.spss pour plus de détails sur cette fonction. ## Not run: donnees <- importer.spss('file.sav') ## End(Not run) int.conf Calcule des intervalles de confiance d une moyenne ou d une proportion calcule en série des intervalles de confiance d une moyenne (varibale numérique) ou d une proportion (variables de type facteurs) en tenant compte du plan d échantillonage complexe des données. Il est possible de calculer les intervalles de confiance pour des sous-groupes. Usage int.conf(x, design, by = NULL, confiance = 0.95, loi = "student") Arguments x design by confiance loi formule. Liste des variables pour lesquelles on souhaite calculer un intervalle de confiance. objet de la classe svydesign ou tableau de données. Données à partir desquelles les intervalles de confiance seront calculés. valeur nulle ou formule. liste des variables de type facteurs définissant des souséchantillons. Si NULL, les intervalles de confiance sont calculés sur l ensemble de l échantillon. numérique. Probabilité de l intervalle de confiance. texte. student ou normale. Spécifie la loi utilisée pour le calcul des intervalles. Voir les détails.

6 int.conf Value Si on a passé un tableau de données au paramètre design, les données seront considérées comme résultant d un tirage aléatoire simple. Pour les variables de type numérique, c est la moyenne qui est calculé. Pour les variables de type facteurs, c est la proportion de chaque facteur. La fonction int.conf utilise la fonction svymean pour calculer les moyennes et/ou proportions ainsi que l écart-type de l échantillon noté SE. Les intervalles de confiance avec une probabilité α, notés IC α sont calculés selon la formule suivante : IC α = x ± SE l α 2 où x représente la moyenne ou la proportion pour laquelle l intervalle est calculé, SE l écrt-type de cette variable dans l échnatillon et l α la valeur de la loi utilisée. 2 Si loi= normale, l α correspondra à la valeur z α de la loi normale centrée réduite. Si loi= student, 2 2 l α correspondra à la valeur de t α de la loi t de student avec n 1 degrés de liberté. 2 2 La fonctin renvoie un tableau de données (data.frame) avec une ligne par groupe et pour chaque variable de x les colonnes suivantes moyenne.x ou proportion.x Valeur de la moyenne ou de la proportion de la variable considérée. se.x ic.bas.x ic.haut.x n.x svymean, svyby. data(api) Écart-type sur l échantillon de la variable. Minimum de l intervalle de confiance. Maximum de l intervalle de confiance. Nombres d observations dans l échantillon (les valeurs manquantes sont ignorées). # Spécification du plan d'échantillonnage donnees <- svydesign(id=~dnum, weights=~pw, data=apiclus1) # Intervalles de confiance int.conf(~api99+yr.rnd, donnees) # pour mieux visualiser les résultats t(int.conf(~api99+yr.rnd, donnees)) # résultats par sous-groupes t(int.conf(~api99+yr.rnd, donnees, by=~stype))

Index Topic file importer.spss, 4 Topic htest compare, 2 Topic package TestsFaciles-package, 1 Topic survey compare, 2 int.conf, 5 Topic univar int.conf, 5 compare, 1, 2 importer.spss, 1, 4 int.conf, 1, 3, 5 read.spss, 1, 4 survey, 1, 2 svyby, 6 svydesign, 3, 5 svymean, 5, 6 TestsFaciles (TestsFaciles-package), 1 TestsFaciles-package, 1 7