INTRODUCTION A LA RECHERCHE QUANTITATIVE



Documents pareils
Traitement des données avec Microsoft EXCEL 2010

Logiciel XLSTAT version rue Damrémont PARIS

Statistiques Descriptives à une dimension

Principe d un test statistique

Travailler et organiser votre vie professionnelle

FEN FICHE EMPLOIS NUISANCES

Représentation d une distribution

Localisation des fonctions

données en connaissance et en actions?

TS 35 Numériser. Activité introductive - Exercice et démarche expérimentale en fin d activité Notions et contenus du programme de Terminale S

# let rec concat l1 l2 = match l1 with [] -> l2 x::l 1 -> x::(concat l 1 l2);; val concat : a list -> a list -> a list = <fun>

Lire ; Compter ; Tester... avec R

Lois de probabilité. Anita Burgun

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1

Gestion des bases de données

Les ateliers du Resclin. Préparation des données issues d Epi-Info en utilisant le tableur Excel

Déclaration des postes SIP 67xxi

EXCEL et base de données

Document d orientation sur les allégations issues d essais de non-infériorité

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

MATHÉMATIQUES ET SCIENCES HUMAINES

Manuel utilisateur. Version 1.6b

Objectif. Cette formation doit permettre au client d être autonome dans la création de ses rapports avancés en utilisant la fonctionnalité Excel +.

METHODOLOGIE GENERALE DE LA RECHERCHE EPIDEMIOLOGIQUE : LES ENQUETES EPIDEMIOLOGIQUES

Évaluation des compétences. Identification du contenu des évaluations. Septembre 2014

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

WinBooks Logistics 5.0

HighPush. document /06/2009 Révision pour version /11/2008 Revision pour la /10/2008 Documentation initiale.

Comment bien débuter sa consolidation?

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

COMMENT TROUVER VOS FUTURS CLIENTS À L INTERNATIONAL? 05/03/2015 Creditsafe France

Préconisations Portail clients SIGMA

Cegid - Business Suite Comptabilité

CRM. Gérez efficacement vos contacts et clients ACT! by Sage. Simple. Pratique. Efficace

POKER ET PROBABILITÉ

Guide informatique AUDIT EVALUATION DE LA PRATIQUE DE L ANTIBIOPROPHYLAXIE EN MATERNITE

1 Recherche en table par balayage

Virtual PBX Quick User Guide

GENERALITES Sélection du fichier... 7 TRANSFERT DES ECRITURES... 8

UNE FORMATION POUR APPRENDRE À PRÉSENTER DES DONNÉES CHIFFRÉES : POUR QUI ET POURQUOI? Bénédicte Garnier & Elisabeth Morand

Statistique : Résumé de cours et méthodes

Formation tableur niveau 1 (Excel 2013)

Dématérialisation des factures du Secteur Public

Etudier l influence de différents paramètres sur un phénomène physique Communiquer et argumenter en utilisant un vocabulaire scientifique adapté

UEO11 COURS/TD 1. nombres entiers et réels codés en mémoire centrale. Caractères alphabétiques et caractères spéciaux.

Item 169 : Évaluation thérapeutique et niveau de preuve

Codage d information. Codage d information : -Définition-

Parcours FOAD Formation EXCEL 2010

3. Caractéristiques et fonctions d une v.a.

Guide Utilisateur ACQUIT : Anomalies issues du Guichet XML

Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie

Bases de programmation. Cours 5. Structurer les données

Lecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888

FORMULAIRE DE STATISTIQUES

SERVICE CERTIFICATION DES ÉTABLISSEMENTS DE SANTÉ. Guide utilisateur Compte Qualité dans SARA

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

LES DIFFERENTS TYPES DE MESURE

Terminale STMG Lycée Jean Vilar 2014/2015. Terminale STMG. O. Lader

CEGID - Business Suite Gestion commerciale

FICHE N 8 Photodiversité, d une banque d images à un portail d activités en ligne Anne-Marie Michaud, académie de Versailles

Alania CRM. Une gestion d entreprise efficace, rapide, adaptée et rentable!

DOSSIER DE SPECIFICATIONS FONCTIONNELLES (SFD) CSD

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Maîtriser l'utilisation des outils bureautiques. Maîtriser le logiciel de traitement de texte - Word. Maitriser le logiciel tableur - Excel

DATALOGGERS SEFRAM LOG1601 et LOG1620

Instrumentation de la recherche en Education : analyse épistémologique de quelques logiciels d aide à l analyse d enregistrements vidéos

1 DHCP sur Windows 2008 Server Introduction Installation du composant DHCP Autorisation d'un serveur DHCP...

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique

Atelier Transversal AT11. Activité «Fourmis» Pierre Chauvet.

Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé

SPHINX Logiciel de dépouillement d enquêtes

Vous avez besoin d une vision en temps réel et sécurisée de vos flux financiers.

Utiliser SQL Server 2008 R2 Reporting Services comme source de donne es pour Microsoft Excel

Définition d un Template

INTRODUCTION A L ELECTRONIQUE NUMERIQUE ECHANTILLONNAGE ET QUANTIFICATION I. ARCHITECTURE DE L ELECRONIQUE NUMERIQUE

Annexe commune aux séries ES, L et S : boîtes et quantiles

Gestion des données avec R

Best.-Nr Manuel d utilisation logiciel Lindab Analysis. Logiciel pour la gestion des appareils de mesures Lindab PC 410 et LT600

DE LA CAMÉRA SOMMAIRE

BTS Groupement A. Mathématiques Session Spécialités CIRA, IRIS, Systèmes électroniques, TPIL

Comment créer et administrer une campagne?

Module 1 : Tableau de bord Excel * 2010 incl.*

Logiciel Le Sphinx Plus 2 version 5. Le Sphinx Développement Chavanod

Mesurer et analyser le trafic d un site internet Comment analyser l audience de son site et connaître les centres d intérêts des visiteurs?

Introduction : présentation de la Business Intelligence

Fonctionnalités détaillées

Définir la gestion de projets 11. Exploiter les techniques de gestion de projets 11. Planifier un projet 12. Lister les tâches et les jalons 13

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

L authentification de NTX Research au service des Banques

DECOUVERTE DU LOGICIEL CIEL GESTION COMMERCIALE

Cours Informatique 1. Monsieur SADOUNI Salheddine

Manuel d utilisation. Anne RACINE. A. Racine Référence: Manuel MS Project.doc 03/03/2003 Page 1

ODH. Mon Espace. Manuel d utilisation. MON ESPACE ODH Manuel d utilisation. Une question? Contactez le service client au

Utilisation de l'outil «Open Office TEXTE»

Mode d Emploi. Résult Arc Logiciel de Gestion de Compétitions. Droits d utilisation Informations Générales. 1/. Présentation de Résult Arc

Utilisation des méthodes de paiements

GUIDE D UTILISATION DU BROWSER DE BEYOND 20/20

Transcription:

INTRODUCTION A LA RECHERCHE QUANTITATIVE Première partie : du questionnaire à la base de données Juin 2010 Julien Gelly, Caroline Huas, Josselin Le Bel

Plan 2 1. Introduction 2. Saisie des données : Epi Data Constitution du masque de saisie Saisie des données Exportation des données 3. Analyse des données : Epi Info Représentations graphiques Description des données Tests statistiques

Epi Data : saisie des données 3 Téléchargement http://www.epidata.dk/php/downloadc.php?file=setup_ epidata_fr.exe Aide http://www.epidata.dk/downloads/epdintro_fr.pdf Site de Bruno Falissard http://h0.web.u-psud.fr/biostatistiques/#livre&id=01

4 Introduction Les différents types d études Le hasard et les probabilités Les variables aléatoires La loi normale Comment présenter les résultats?

Types d étude (1) 5 Classification chronologique Prospective Maladie Temps Rétrospective Transversale

Types d étude (2) 6 Selon les caractéristiques de la population Cohorte : enquête idéale, individus d une population (d un échantillon représentatif), avant l exposition au(x) facteur(s) Cas-témoins : comparaison de malades et de non malades «identiques» Transversale : échantillon représentatif de la population, indépendant de l exposition et de l état de santé

Le hasard et les probabilités 7 Hasard Traduction de notre ignorance Donc relatif Probabilités Physico-probabilités : fréquence limite Psycho-probabilités : plausibilité Comment conclure à une différence entre deux chiffres? «Hasard» (variabilité de la mesure) tests statistiques On s autorise une marge d erreur connue (5%)

Les variables aléatoires 8 Variables quantitatives Ordre de grandeur et possibilité d interpréter un écart Discrète (TA) ou continue (CRP) et variable continue discrétisée (classes d âge) Variables qualitatives Pas d ordre de grandeur ni de notion d écart Ordonnée (ACR) ou non-ordonnée (couleur des yeux) Binaire = dichotomique : si 2 classes (pile ou face)

La loi normale 9 Mesure d un phénomène dans une population (numération des hématies) Loi normale associée Même moyenne Même écart type (même variabilité de la mesure)

Comment présenter les résultats? (1) 10 Représenter la population d intérêt par un flowchart XXX personnes sélectionnées Non inclus XX personnes incluses Inclus à tort Perdus de vue Déviations au protocole Données manquantes X personnes ayant suivi le protocole jusqu au bout

Comment présenter les résultats? (2) 11 Présenter la population de l étude (tableau) Sexe, âge, variables d intérêts Variables qualitatives : effectifs et pourcentages Variables quantitatives Grands effectifs : moyenne, intervalle de confiance à 95% Petits effectifs : médiane, minimum-maximum Population totale (n = XXX) Sexe Age (années) Moyenne / Médiane IC à 95% / Min-Max Effectif Pourcentage Homme XX XX% Femme XX XX% XX / XX [ XX ; XX] / XX-XX

Comment présenter les résultats? (3) 12 Sexe Age (années) Groupe 1 (n = XXX) Groupe 2 (n = XXX) Test statistique correspondant Effectif Pourcentage Effectif Pourcentage (t Student, χ², etc) Homme XX XX% XX XX% Femme XX XX% XX XX% Moyenne XX XX Variable qualitative IC à 95% [ XX ; XX] [ XX ; XX] Modalité A XX XX% XX XX% Modalité B XX XX% XX XX% Modalité C XX XX% XX XX% Variable quantitative (unité) Moyenne XX XX IC à 95% [ XX ; XX] [ XX ; XX] p < 0,05? p < 0,05? p < 0,05? p < 0,05?

13 Epi Data : objectifs 1. Constitution du masque de saisie Construction du questionnaire (.qes) Création du fichier de données (.rec) Appliquer des contrôles (.chk) Vérification de la structure du fichier 2. Saisie des données 3. Exportation des données

Construction du questionnaire (1) 14 Créer un nouveau questionnaire Puis «Enregistrer sous» : TP.qes

Construction du questionnaire (2) 15 VARIABLES SIGNIFICATION CODAGE id Numéro de fiche Entier (4 chiffres) age Age de l'étudiant(e) Entier (ans) sexe tabact Sexe de l'étudiant(e) Actuellement, fumezvous du tabac? 1 = homme 2 = femme 1 = oui 0 = non tabactfq Fréquence 1 = je fume tous les jours 2 = je fume occasionnellement 3 = j ai été fumeur(se) mais j ai arrêté 4 = j ai essayé mais je ne suis jamais devenu fumeur(se) 5 = je n ai jamais fumé poids Poids de l'étudiant(e) Entier (kg) taille Taille de l'étudiant(e) Deux décimales (m)

Construction du questionnaire (3) 16 Syntaxe sous Epi Data id Numéro de fiche <IDNUM> age Age ### sexe Sexe # tabact Tabac actuellement # tabactfq Tabac actuellement fréquence # poids Poids ### taille Taille #.##

Construction du questionnaire (4) 17 «Nom de la variable» Le plus explicite possible Maximum 8 caractères alphanumériques Jamais de chiffre en premier, ni d accents, ni de signes de ponctuation «Intitulé de la variable» Le plus complet possible (format libre) Au moins 8 espaces entre le nom de la variable et son intitulé (pour éviter de fusionner «nom» et «intitulé»)

Construction du questionnaire (5) 18 «Champ de saisie» = format de la variable <idnum> : numérotation automatiquement les sujets <dd/mm/yyyy> : date au format 24/12/2009 ## ou #.## : un chiffre pour chaque # : une lettre pour chaque _ <Y> : pour une question booléenne (oui ou non) NE PAS UTILISER LE FORMAT BOOLEEN!!! (problème de la gestion des données manquantes)

Construction du questionnaire (6) 19 Pour la variable «id» 4 onglets : Numérique Texte Date Autres

Construction du questionnaire (7) 20 Pour la variable «age»

Construction du questionnaire (8) 21 Pour la variable «tabact»

Construction du questionnaire (9) 22 Pour la variable «taille»

23 Création du fichier de données

Appliquer des contrôles (1) 24 Ouvrir le fichier «TP.rec»

Appliquer des contrôles (2) 25 Pour chaque variable Range : détermine l étendue (ex : 1-130) Legal : pour attribuer une valeur aux données manquantes (ex: 1-130,999) Must Enter : rend la saisie obligatoire Editer : pour les contrôles avec saut de question Permet de limiter les erreurs de saisie

Appliquer des contrôles (3) 26 Pour les variables «age» et «sexe»

Appliquer des contrôles (4) 27 Pour la variable «tabact»

Vérification de la structure 28 Avant de saisir les données Variables : nom, libellé, codage Contrôles

Saisie des données (1) 29 Ouvrir le fichier «TP.rec»

Saisie des données (2) 30 A vous de jouer!

Données à rentrer 31 id age sexe tabact tabactfq poids taille 1 20 2 1 1 59 1,74 2 2 55 1,7 3 21 2 1 1 70 1,75 4 19 2 0 57 1,72

Après la saisie des données 32 Table des données Mise à plat : caractéristiques générales

Exportation des données 33 Exportation du fichier «TP.rec» Au format «Excel» (compatibles avec Epi Info )

A la semaine prochaine! 34 1. Introduction 2. Saisie des données : Epi Data Constitution du masque de saisie Saisie des données Exportation des données 3. Analyse des données : Epi Info Représentations graphiques Description des données Tests statistiques