Outils méthodologiques et astuces pour la thèse de médecine Les statistiques, comment faire?



Documents pareils
TABLE DES MATIERES. C Exercices complémentaires 42

Traitement des données avec Microsoft EXCEL 2010

Logiciel XLSTAT version rue Damrémont PARIS

Lire ; Compter ; Tester... avec R

Statistique Descriptive Élémentaire

Statistique : Résumé de cours et méthodes

Lecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888

EXCEL et base de données

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier

Localisation des fonctions

Séries Statistiques Simples

Statistiques Descriptives à une dimension

Biostatistiques : Petits effectifs

MANUEL GANTT PROJECT

Premiers pas avec SES-Pegase (version 7.0) SES : Un Système Expert pour l analyse Statistique des données. Premiers pas avec SES-Pegase 1

Licence Economie-Gestion, 1ère Année Polycopié de Statistique Descriptive. Année universitaire :

FORMULAIRE DE STATISTIQUES

1. Vocabulaire : Introduction au tableau élémentaire

Annexe commune aux séries ES, L et S : boîtes et quantiles

TABLEAU CROISE DYNAMIQUE

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

IBM SPSS Statistics Base 20

Extraction d informations stratégiques par Analyse en Composantes Principales

Pratique de l analyse de données SPSS appliqué à l enquête «Identités et Capital social en Wallonie»

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

Représentation d une distribution

données en connaissance et en actions?

Introduction aux Statistiques et à l utilisation du logiciel R

SPHINX Logiciel de dépouillement d enquêtes

Introduction à la statistique descriptive

Observatoire Economique et Statistique d Afrique Subsaharienne

La place de SAS dans l'informatique décisionnelle

Principe d un test statistique

Statistiques descriptives

Aide-mémoire de statistique appliquée à la biologie

1 Presentation du bandeau. 2 Principe de création d un projet : C2 industrialisation Apprendre Gantt project Ver 2.6 planifier

Cycle de formation certifiante Sphinx

Gestion des données avec R

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1

FPSTAT 2 í La dçecision statistique. 1. Introduction ça l'infçerence. 1

Leçon N 4 : Statistiques à deux variables

: seul le dossier dossier sera cherché, tous les sousdomaines

UNE FORMATION POUR APPRENDRE À PRÉSENTER DES DONNÉES CHIFFRÉES : POUR QUI ET POURQUOI? Bénédicte Garnier & Elisabeth Morand

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

LES DIFFERENTS TYPES DE MESURE

Créer son questionnaire en ligne avec Google Documents

LE RÔLE DE LA STATISTIQUE DANS UN PROCESSUS DE PRISE DE DÉCISION

EXCEL TUTORIEL 2012/2013

Relation entre deux variables : estimation de la corrélation linéaire

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

IBM SPSS Direct Marketing 21

INSERER DES OBJETS - LE RUBAN INSERTION... 3 TABLEAUX

Loi binomiale Lois normales

Guide abrégé d IBM SPSS Statistics 21

RÉALISATION DE GRAPHIQUES AVEC OPENOFFICE.ORG 2.3

Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie

Excel 2007 Utilisation Avancée

EXCEL PERFECTIONNEMENT SERVICE INFORMATIQUE. Version /11/05

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

SVP j ai besoin d aide!

12 Tableaux croisés dynamiques

Logiciel Le Sphinx Plus 2 version 5. Le Sphinx Développement Chavanod

Pour plus d informations sur les logiciels SPSS, visitez notre site Web à l adresse suivante : ou contactez

Chap17 - CORRECTİON DES EXERCİCES

Collecter des informations statistiques

TSTI 2D CH X : Exemples de lois à densité 1

EVALUATIONS MI-PARCOURS CM2

INTRODUCTION AU DATA MINING

Manuel d utilisation de la base de données nationale sur la situation de l enfance en Tunisie CHILDINFO 6.0

Les ateliers du Resclin. Préparation des données issues d Epi-Info en utilisant le tableur Excel

1. Les types d enquêtes

COURS BARDON - EXCEL 2010

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position

Les tableaux croisés dynamiques

Chapitre 3. Les distributions à deux variables

STATISTIQUES DESCRIPTIVES

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Technologie Esthétique Services. Logiciel pour avocats sensibles aussi à... l esthétique. SECIB Le choix de l excellence

Gestion des bases de données

Tests statistiques et régressions logistiques sous R, avec prise en compte des plans d échantillonnage complexes

SAS de base : gestion des données et procédures élémentaires

4. Personnalisation du site web de la conférence

La définition La méthode. Les échelles de mesure L ENQUETE PAR SONDAGE : LA METHODE

- Ressources pour les classes

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Utilisation avancée de SugarCRM Version Professional 6.5

Terminale STMG Lycée Jean Vilar 2014/2015. Terminale STMG. O. Lader

Evaluation de la variabilité d'un système de mesure

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données

Créer un sondage en ligne

Saisie de la déclaration de cotisations FSPOEIE

Conversion d un entier. Méthode par soustraction

Transcription:

Outils méthodologiques et astuces pour la thèse de médecine Les statistiques, comment faire? Cyril Ferdynus, USM, CHU

RECUEIL DE DONNEES

Recueil hors ligne Epidata (http://www.epiconcept.fr/html/epidata.html) Avantages: gratuit, simple d utilisation, contrôle à la saisie Inconvénients: Temps de prise en main pour la réalisation du masque de saisie Tableur (Excel, ) Avantages: simple d utilisation, relecture et correction facile Inconvénients: Pas de contrôle à la saisie, inadapté aux questionnaires longs, respecter certaines règles Bases de données (Access, ) Avantages: Adapté aux grands questionnaires, contrôle à la saisie Inconvénients: Complexe, payant Dans tous les cas => Fiche de recueil papier!

Recueil en ligne Google Docs Avantages: Gratuit, aucune limite au nombre de questionnaires, possibilité d export dans Excel Inconvénients: Type de réponses limitées, possibilité de répondre plusieurs fois, Survey Monkey Avantages: 15 types de questions, outils statistiques intégrés, gestion des relances, Inconvénients: Payant si > 10 questions et/ou > 100 réponses Lime Survey Avantages: Gratuit, 20 types de questions, nombre de questionnaires illimités, export sous Excel, Inconvénients: Nécessité de disposer d un hébergeur

Recueil avec un tableur La première ligne contient les noms de colonnes Noms explicites (pas trop longs) Uniques Sujets en ligne avec un numéro de ligne : chaque sujet doit avoir un numéro Permet de retourner au questionnaire papier en cas d erreur de saisie Variables en colonnes: une colonne doit contenir une seule information Pas d unités

Codage des variables Evitez le texte libre Sinon, standardisez la saisie (majuscules, minuscules, ) Variables qualitatives = codage numérique Ex: 1 = Oui; 0 = Non Dates et Heures JJ/MM/AAAA et HH:MM Valeurs manquantes = cases vides Ne pas mélanger les types dans une même colonne

A ne pas faire au recueil Utiliser une couleur pour identifier les groupes Une variable définissant le(s) groupe(s)! Transformation des variables Ex: Mise en classe d âge Calcul sur les variables Ex: IMC, durées de séjour, âges => Perte d information Les calculs sont réalisés à l exploitation des données

Recueil exploitable NUM TERME DEPT SEXE POIDS DECES MULT. 313 36 88 F 1220 3 0 203 34 54 F 1470 0 1 492 34 57 F 1430 0 215 34 54 F 1420 0 0

Recueil inexploitable NUM infection germe POIDS DECES Cause DC 313 0 0??? oui Pas de renseignement 203 1 E.Coli,staph 1470 non non 492 1 Escherichia C. 1430 NON 0 215 0 Pas de germe 1420 Non 0

FAIRE LES ANALYSES

Qui fait les analyses? Vous Avantages: Vous gérez votre planning Inconvénients: Vous faites les analyses et vous en êtes responsables, vous devez utiliser les tests appropriés, L USM Avantages: Vous ne faites pas les analyses Inconvénients: Il y a des délais, le fichier de recueil doit être correctement formaté Le CIC-EC En fonction de la thématique

Différents type de variables Caractéristiques mesurées chez les sujets Efficacité d un traitement Sexe Taille Nombre de germes Score d une douleur binaire nominale continue discrète ordinale Qualitatives Quantitatives La nature de la variable conditionne l outil statistique utilisé

Variables continues Comparaison de deux moyennes Séries non appariées grand effectif (n > 30) Test t de Student test non paramétrique Test W de Wilcoxon Test U de Mann-Whitney Séries appariées grand effectif (n > 30) Test t pour séries appariées (Student pour séries appariées) test non paramétrique Test T de Wilcoxon pour séries appariées

Variables continues Comparaison de plusieurs moyennes Séries non appariées Distribution normale Analyse de Variance à 1 facteur (ANOVA) test non paramétrique Test de Kruskall Wallis Séries appariées Distribution normale Analyse de Variance sur mesures répétées Test non paramétrique Test de Friedman

Variables qualitatives Comparaison de 2 proportions Séries non appariées Grand effectif (Effectifs attendus >= 5) Chi 2 Test non paramétrique Test exact de Fisher Séries appariées Test de Mac Nemar

Variables qualitatives Comparaison de k proportions (k >2) Séries non appariées Grand effectif (Effectifs attendus >= 1) Chi 2 Test non paramétrique Test exact de Fisher Séries appariées Test de Cochran

Quel logiciel utiliser? Epi Info Avantages: gratuit, permet de faire les tests de comparaisons classiques Inconvénients: Limités aux tests simples Excel Avantages: Facilité de calcul des moyennes, écart type, Inconvénients: Difficulté+++ pour effectuer des tests de comparaisons R (avec interface graphique R Commander) Avantages: gratuit, complet, évolutif Inconvénients: difficulté de prise en main+++ Autres logiciels payants: SAS, SPSS, Stata, Statview, Medcalc,

PRESENTATION DES DONNEES

Faire un bon graphique Le graphique dépend du type de données Un titre pour indiquer la nature des informations Sous le graphique Attention aux échelles! Indiquer les unités de mesure en abscisses et en ordonnées Eviter de mettre des fonds colorés ou hachurés Ne pas déformer l information Attention aux représentations 3D Choix des intensités de couleur des modalités+++ Attention au noir et blanc!

Variable qualitative Représentation graphique (secteurs) 24,40% Tranches d'âge 3,50% 8,10% 17,50% 46,50% Ouvrier Cadre Employé Sans profession Autre Ne s applique pas aux variables ordinales

Variable qualitative Représentation graphique (bâtons) 50,00% 45,00% 40,00% 35,00% 30,00% 25,00% 20,00% 15,00% 10,00% 5,00% 0,00% 3,50% 8,10% 17,50% 46,50% Ouvrier Cadre Employé Sans profession 24,40% Autre S applique aussi aux variables ordinales ou quantitatives discrètes

Variable quantitative Représentation graphique (histogramme) Deux règles à respecter Axe des abscisses identique pour tous les intervalles La surface de chacun des rectangles est proportionnelle au nombre d individus de la classe

Variable quantitative La boîte à moustaches

Le point de vue 24

Faire un bon tableau Un titre explicite indépendant du texte Au dessus Un bandeau de titre indiquant la nature des informations des colonnes Un trait horizontal au dessus et au dessous Un trait horizontal sous la dernière ligne Toujours utiliser le même nombre de décimales Séparées par une virgule en français, un point en anglais Les unités de mesure doivent être indiquées pour les variables quantitatives A coté du nom de la variable Un tableau doit pouvoir se lire seul!

Variable qualitative Présentation synthétique Tableau 1: Caractéristiques sociodémographiques des patients diabétiques Caractéristiques Effectif Proportion Sexe Hommes 48 55,8% Femmes 38 44,2% CSP Ouvrier 3 3,5% Cadre 7 8,1% Employé 15 17,5% Sans profession 40 46,5% Autre 21 24,4%

Deux variables qualitatives Le tableau «croisé» (contingence) Tableau 2: Comparaison des caractéristiques sociodémographiques des patients diabétiques, selon le sexe Caractéristiques Hommes Femmes N % N % CSP Ouvrier 2 4,2 1 2,6 Cadre 5 10,4 2 5,2 Employé 9 18,8 6 15,8 Sans profession 16 33,3 24 63,2 Autre 16 33,3 5 13,2

Variables qualitatives et quantitatives, dans un même tableau? Tableau 3: Comparaison des caractéristiques des patients diabétiques à l inclusion, selon le groupe de traitement Caractéristiques Traitement 1 (n = 86) Traitement 2 (n = 67) Age (Années), moyenne (ET) 28,4 (5,2) 27,2 (5,1) 0,08 Poids (Kg), moyenne (ET) 61,2 (6,4) 58,3 (6,8) 0,004 p Sexe, n(%) Hommes 48 (55,8%) 41 (61,2%) Femmes 38 (44,2%) 26 (38,8%) 0,50 CSP, n(%) Ouvrier 3 (3,5%) 5 (7,4%) Cadre 7 (8,1%) 10 (14,9%) Employé 15 (17,5%) 30 (44,8%) Sans profession 40 (46,5%) 20 (29,8%) < 0,0001 Autre 21 (24,4%) 2 (3,1%)

Synthèse Représentation des données Type de données Présentation des données Représentation graphique Données à deux dimensions Qualitatif Effectif Proportions Camembert Diagramme en bâtons Tableau de contingence Ordinal Effectifs Proportions Diagramme en bâtons Tableau de contingence Quantitatif Moyenne, Médiane Ecart type, IQR Histogramme Nuage de Points Coefficient de corrélation

Au final Appeler un statisticien après que l expérience soit terminée c est comme lui demander de faire une autopsie; il pourra seulement déterminer la cause de l échec de l expérience. Sir Ronald Fisher (1890-1962)

DES QUESTIONS? cyril.ferdynus@chu-reunion.fr usm@chu-reunion.fr