Les examens de statistique sous la loupe de l analyse exploratoire des données



Documents pareils
MRK A : Méthodes d Analyse de Données en Marketing Automne 2010

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

The UNITECH Advantage. Copyright UNITECH International Society All rights reserved. Page 1

Mises en relief. Information supplémentaire relative au sujet traité. Souligne un point important à ne pas négliger.

UNIVERSITÉ DE MONTRÉAL DÉPARTEMENT DE SOCIOLOGIE ************* Cours de niveau gradué en méthodes quantitatives *************

Application Form/ Formulaire de demande

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

Formulaire de candidature pour les bourses de mobilité internationale niveau Master/ Application Form for International Master Scholarship Program

THÈSE. présentée à TÉLÉCOM PARISTECH. pour obtenir le grade de. DOCTEUR de TÉLÉCOM PARISTECH. Mention Informatique et Réseaux. par.

RAPID Prenez le contrôle sur vos données

Plan de cours ADM 992C Page 1. École des sciences de la gestion Département de management et technologie Université du Québec à Montréal

Formulaire de candidature pour les bourses de mobilité internationale niveau Master/ Application Form for International Master Scholarship Programme

MSO MASTER SCIENCES DES ORGANISATIONS GRADUATE SCHOOL OF PARIS- DAUPHINE. Département Master Sciences des Organisations de l'université Paris-Dauphine

Public and European Business Law - Droit public et européen des affaires. Master I Law Level

Programme Bachelor Semestre d automne 2015

COUNCIL OF THE EUROPEAN UNION. Brussels, 18 September 2008 (19.09) (OR. fr) 13156/08 LIMITE PI 53

Master ès Sciences en sciences infirmières

Gauthier, Benoît (dir.) Recherche sociale : de la problématique à la collecte des données. Québec : Presses de l Université du Québec.

HIVER 2004 MÉTHODOLOGIE DE LA RECHERCHE EN MARKETING MRK

POL 1100 (Méthodes de recherche en politique) Hiver 2012 Local B-0305 Lundi de 13h00-14h30

INSTITUT MARITIME DE PREVENTION. For improvement in health and security at work. Created in 1992 Under the aegis of State and the ENIM

UNIVERSITY OF MALTA FACULTY OF ARTS. French as Main Area in an ordinary Bachelor s Degree

France SMS+ MT Premium Description

Lois de probabilité. Anita Burgun

Facultés: les Facultés, l Ecole des Sciences Humaines et Sociales, l Ecole de Droit, l Institut de Recherche en Sciences et Technologies du Langage.

Économétrie, causalité et analyse des politiques

Université de XY University of XY. Faculté XY Faculty of XY

TABLE DES MATIERES. C Exercices complémentaires 42

Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction.

Notre modèle d engagement

Programming Server-Side Web Applications with Object-Oriented PHP NC Group Syllabus. Duration: 75 hours 1-2-2

MELTING POTES, LA SECTION INTERNATIONALE DU BELLASSO (Association étudiante de lʼensaparis-belleville) PRESENTE :

Classification Automatique de messages : une approche hybride

Technical Assistance for Sustainable National Greenhouse Gas Inventory Management Systems in West Africa (West Africa GHG Project)

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie

Visualizing Start-up Firm Trajectories on Kohonen Maps

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)

REGLEMENT DU PROGRAMME INTERNATIONAL DE LA SOLVAY BRUSSELS SCHOOL OF ECONOMICS & MANAGEMENT

Expérimentation de l usage du smartphone dans l enseignement technologique S.T.M.G.

Introduction à la méthodologie de la recherche

UNIVERSITE DE YAOUNDE II

INSCRIPTION MASTER / MASTER S APPLICATION

DECLARATION DE BRUXELLES

PROGRAMME DES COURS DE FRANÇAIS JURIDIQUE. Année 2012

Evaluation du cursus «Marketing»

SCHOLARSHIP ANSTO FRENCH EMBASSY (SAFE) PROGRAM APPLICATION FORM

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Provide supervision and mentorship, on an ongoing basis, to staff and student interns.

Spécificités, Applications et Outils

Informatique / Computer Science

Guide du mémoire de fin d études

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1

Forthcoming Database

Modélisation géostatistique des débits le long des cours d eau.

Analyse de la variance Comparaison de plusieurs moyennes

Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux

Enseignement au cycle primaire (première partie)

Cycle de formation certifiante Sphinx

CHARGÉE DE COURS : Catherine Pelletier, MBA, chargée de communication, Service des communications et des relations avec le milieu, FSA

Get your ticket to innovation!

IDENTITÉ DE L ÉTUDIANT / APPLICANT INFORMATION

«Rénovation des curricula de l enseignement supérieur - Kazakhstan»

PLAN DE COURS. Reconnaître le rôle des mathématiques ou de l informatique dans la société contemporaine (0011)

Evaluation du cursus «Information et communication»

Chapitre 4 : Régression linéaire

Entreposage de données complexes pour la médecine d anticipation personnalisée

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Lecture critique et pratique de la médecine

I. COORDONNÉES PERSONNELLES / PERSONAL DATA

Evaluation du cursus «Information et communication»

Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining.

Catalogue de formations

iqtool - Outil e-learning innovateur pour enseigner la Gestion de Qualité au niveau BAC+2

SCIENCES DE L ÉDUCATION

ENSEIGNEMENT DES SCIENCES ET DE LA TECHNOLOGIE A L ECOLE PRIMAIRE : QUELLE DEMARCHE?

Le French Cohort Program : au service des étudiants, de la recherche, de la communauté

FOURTH SESSION : "MRP & CRP"

PeTEX Plateforme pour e-learning et expérimentation télémétrique

SOCLE COMMUN: LA CULTURE SCIENTIFIQUE ET TECHNOLOGIQUE. alain salvadori IA IPR Sciences de la vie et de la Terre ALAIN SALVADORI IA-IPR SVT

Analyse discriminante et régression logistique: application au cas de l innovation pour les entreprises du Canton du Tessin

Principe d un test statistique

Section des Formations et des diplômes

Formation consultants juniors en recrutement Formation consultants juniors en recrutement

Etude Benchmarking 2010 sur les formations existantes apparentées au métier de Business Developer en Innovation

EXAMEN CRITIQUE D UN DOSSIER TECHNIQUE

Cheque Holding Policy Disclosure (Banks) Regulations. Règlement sur la communication de la politique de retenue de chèques (banques) CONSOLIDATION

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

8. Cours virtuel Enjeux nordiques / Online Class Northern Issues Formulaire de demande de bourse / Fellowship Application Form

Archived Content. Contenu archivé

Eric BARGET, MCF à la Faculté des sports de Poitiers CEREGE (Centre de Recherche en Gestion), IAE de Poitiers

The Exploration of HIV Fitness Landscapes

Syllabus Dossiers d études

A quels élèves profite l approche par les compétences de base? Etude de cas à Djibouti

master Principes de Finance d Entreprise Corporate Finance Création de valeur Philippe Thomas Collection BANQUE FINANCE ASSURANCE

COMPARAISON DE LOGICIELS TESTANT L INDEPENDANCE DE VARIABLES BINAIRES

Le montant des garanties constituées aux fins du STPGV est-il excessif?

RÉSUMÉ DE THÈSE. L implantation des systèmes d'information (SI) organisationnels demeure une tâche difficile

Filière «Économie et Entreprise» 2015/2016

Transcription:

Les examens de statistique sous la loupe de l analyse exploratoire des données Pierre Cullus Service de Biostatistique et Informatique Médicale, Faculté de Médecine, Université Libre de Bruxelles, CP 623 Route de Lennik, 808 ; 1070 Bruxelles Adresse Courriel : pcullus@ulb.ac.be Résumé. Le cours de base de Biostatistique dans le Pôle Santé de l Université propose aux étudiants une introduction aux éléments fondamentaux de la statistique médicale à partir d exemples concrets. Ces derniers sont destinés à favoriser l appréhension, la compréhension, l application et l interprétation des principales techniques utilisées dans les premières investigations des études biomédicales. L évaluation du cours est constituée par un examen écrit s appuyant sur des «Questions à choix multiples» pour la partie «théorie» et sur des «Questions à réponses ouvertes» justifiées pour ce qui concerne les exercices. Cette formule expérimentée permet d engranger aisément les réponses des étudiants, d analyser celles ci ( par le truchement des techniques de l Analyse des Données ) et de dégager de précieux renseignements d ordre pédagogique. Le dépouillement exhaustif des résultats des copies d examens révèle clairement les erreurs systématiques commises (au niveau de la compréhension des énoncés, du choix des tests, de l utilisation des «formules», de la lecture des tables, ). Ce relevé permet de cibler les lacunes et d adapter en conséquence notre enseignement. Des disparités importantes dans la réussite invitent à la réflexion quant aux stratégies d apprentissage des étudiants et à l appréhension de l examen (report de session, gestion du temps d examen, ciblage sur une partie ). Nous examinons également le positionnement spécifique des notes du cours de Biostatistique parmi les autres matières dans les différentes sections du Pôle Santé. Le propos de cet exposé n est certes pas de fournir une interprétation globale et définitive mais plutôt de souligner l intérêt d une analyse docimologique.

Mots clés. Analyse exploratoire des Données ; Composantes principales ; Correspondances multiples ; Classifications ; Analyse conjointe de tableaux ; Biostatistique ; Examens ; Docimologie ; Evaluation ; Enseignement ; Logiciels SPAD et SPSS Abstract. Exploratory Data Analysis of test scores of Biostatistics : contributions to pedagogy This paper proposes two readings, based on exploratory multivariate analyzes, of test results of Biostatistics. This course is followed by the students of Bachelor of Faculties of Medicine and Movement Science at the Free University of Brussels. The first reading concerns the positioning of the course among other courses during the last academic years. The syntheses are made available through conventional methods of Data Analysis (Factor Analyses and joint tables, classifications). The connections between the results are identified, enriched by the addition of criteria "illustrative" (section, academic delay, gender,...). Typologies of students are made to develop opportunities for differentiated instruction. We examine, in a second reading, the information provided by the responses to examinations of Biostatistics, involving simultaneous theoretical questions multiple choice and exercises with short answers. The counting of the results reveals systematic errors committed by students (understanding statements, choice of tests, use of "formulas", reading tables,...) and can target the gaps in order to adjust our course accordingly. Disparities in the success invite reflection on strategies for student learning, apprehension of examination and adequacy of the evaluation. This approach to test evaluation by Exploratory Data Analysis provides valuable indicators for the proper monitoring of our teaching. Keywords. Exploratory Data Analysis ; Principal Component Analysis ; Multiple Correspondence Analysis ; Classifications ; Joint Analysis of tables ; Biostatistics ; Examinations ; Docimology ; Evaluation teaching ; SPAD software and SPSS Nous proposons dans cet exposé deux lectures complémentaires d analyses statistiques de notes obtenues par des étudiants à des examens classiques de «Biostatistique». Les deux approches ont été obtenues chacune par la mise en œuvre de différentes techniques de l Analyse exploratoire classique des Données. Nous montrerons l intérêt des méthodes de traitements multivariés, non

seulement dans le cadre de l évaluation et du positionnement d un cours mais également dans l optique de dégager des perspectives pédagogiques. Au sein du Pôle Santé de l ULB, dans les différentes sections des Facultés de Médecine et de Sciences de la Motricité, le cours ex cathedra de Biostatistique de base de Bachelier (huit séances de deux heures) propose aux étudiants une introduction aux éléments fondamentaux de la statistique médicale à partir d exemples concrets. Ces derniers sont destinés à favoriser l appréhension, la compréhension, l application et l interprétation des principales techniques utilisées dans les premières investigations des études biomédicales. L acquisition des notions est renforcée par des séances d exercices pratiques (huit séances de deux heures assorties de séances complémentaires de révision, de guidances et de permanences ). Les chapitres traités portent successivement sur les statistiques descriptives de base, les distributions de probabilité, les intervalles de confiance classiques sur une moyenne et une probabilité, les tests d hypothèse classiques sur une ou deux moyennes et sur une ou plusieurs probabilités. Sont abordés ensuite les régression et corrélation linéaires, les tableaux de contingence et le test du chi carré. Les tests non paramétriques de base sont présentés. Le cours se termine par une introduction aux techniques de l Analyse de variance ( ANOVA ) à un et deux facteurs. Les étudiants disposent de supports d enseignements détaillés, revus et complétés annuellement : fascicule de diapositives projetées au cours, syllabus du cours théorique, syllabus d exercices pratiques, recueil de tables statistiques et formulaire. Le site de l enseignement sur l Université Virtuelle leur permet d être confrontés à de nombreux exercices supplémentaires, portant aussi bien sur la matière théorique que sur l aspect «exercices pratiques» du cours. L étudiant curieux pourra également y découvrir quelques notions complémentaires ainsi que l une ou l autre démonstration occultée au cours, souvent pour cause de volume horaire réduit. A l issue de cet enseignement, les étudiants «devraient» être capables, face à des données biomédicales, de procéder au choix correct des premiers traitements statistiques à effectuer et de dégager l information fournie par ceux ci. Une compréhension et une lecture critique des traitements statistiques «élémentaires» des publications scientifiques sont également espérées de leur part. Le temps limité réservé à ce cours ne permet naturellement pas d envisager l utilisation de l ensemble des méthodes statistiques que pourraient rencontrer les étudiants lors de leurs travaux de fin d études. A cet effet, un cours complémentaire est dispensé en Master dans certaines sections, comportant des notions additionnelles sur l ANOVA et une introduction à la régression multiple. Cet enseignement donne aussi l opportunité à l étudiant de se familiariser à l utilisation du logiciel statistique SPSS et de le rendre ainsi plus autonome. L évaluation du cours de base est constituée par un examen écrit s appuyant sur des Questions à choix multiples (QCM) pour la partie «théorie» et sur des Questions à réponses ouvertes et courtes mais cependant justifiées ( QROC) pour ce qui concerne les exercices. Cette formule expérimentée depuis plusieurs années et affinée graduellement, tant en première qu en deuxième session d examens, permet d engranger aisément les réponses des étudiants,

d analyser celles ci et de dégager de précieux renseignements d ordre pédagogique. La constitution systématique de bases de données nous suggère de tenir compte du caractère évolutif et permet de pérenniser la fonction de mémoire du cours que les examens remplissent. Dans une première lecture, nous analysons le positionnement du cours très spécifique de Biostatistique parmi les autres matières dans les différentes sections du Pôle Santé. Nous nous limitons volontairement aux cinq dernières années académiques, afin d écarter les risques d anachronismes. Les synthèses sont acquises grâce aux méthodes classiques d Analyse des Données (Analyses factorielles, analyses conjointes des tableaux et analyses de classification, toutes réalisées essentiellement à l aide du logiciel SPAD). Les liaisons entre les résultats des différentes matières ( et l influence de ces dernières dans l évaluation finale de l étudiant ) sont mises en exergue, enrichies par l adjonction de différents critères «illustratifs» associés à l étude ( section de l étudiant, retard académique, première année d inscription, sexe, ). Une comparaison des analyses multivariées est effectuée entre les sections ; à l intérieur de cellesci, la stabilité temporelle des résultats est étudiée par l analyse conjointe de la succession des tableaux de résultats. Des typologies des étudiants sont construites afin d envisager des possibilités de pédagogie différenciée au sein de groupes homogènes (organisation de séances de révisions et de guidances ). Nous examinons, dans une seconde lecture, l information apportée par les réponses fournies par les étudiants aux questions posées lors des examens de Biostatistique. Nous utilisons également ici les techniques classiques d Analyse des Données. Le dépouillement exhaustif des résultats des copies d examens révèle clairement les erreurs systématiques commises par les étudiants (au niveau de la compréhension des énoncés, du choix des tests, de l utilisation des «formules», de la lecture des tables, ). Ce relevé permet de cibler les lacunes et d adapter en conséquence notre enseignement. Des disparités importantes dans la réussite invitent à la réflexion quant aux stratégies d apprentissage des étudiants et à l appréhension de l examen (report de session, gestion du temps d examen, ciblage sur la partie pratique ou théorique ). De même se pose la question de la pertinence de l évaluation (choix des QCM, élaboration des questions pratiques orientées sur la compréhension de la matière et évitant la complication des calculs, établissement d une grille de correction, ). L approche de la docimologie par les différentes techniques d Analyse des Données fournit ainsi régulièrement des instruments précieux aussi bien pour assurer la qualité pédagogique des séances de cours et d exercices que pour élaborer et traiter les évaluations (dont l objectivité se doit de répondre aux soucis de rigueur et de justice) des étudiants.

Le propos de cet exposé n est certes pas de fournir une interprétation globale et définitive mais plutôt de souligner la volonté de poursuivre la recherche dans ce domaine, en particulier par l examen de diverses considérations générales non abordées ici et la formulation de nouvelles hypothèses. L histoire de la docimologie des examens de statistique ne s arrête d ailleurs pas à ce stade, elle se fera avec des acteurs toujours nouveaux, des enseignements remodelés et des évaluations peut être différenciées! A partir de ce constat, tout reste donc sujet à interrogations à traiter par l Analyse exploratoire des Données! Bibliographie [1] Gilbert Saporta, Probabilités, Analyse des données et Statistiques, 3 ème édition révisée, Paris, Editions Technip, 2011, 622 p. (ISBN 978 2 7108 0980 7). [2] Stéphane Tufféry, Data Mining et statistique décisionnelle, Paris, Editions Technip, 2010, 705 p. (ISBN 978 2 7108 0946 3) [3] Brigitte Escofier, Jérôme Pagès, Analyses factorielles simples et multiples, 4 ème édition, Paris, Dunod, 2008, 318 p. (ISBN 978 2 10 051932 3) [4] Ludovic Lebart, Marie Piron et Alain Morineau, Statistique Exploratoire Multidimensionnelle, 4 ème édition, Paris, Dunod, 2006, 464 p. (ISBN 978 2 10 049616 7) [5] Christine Lavit, Analyse conjointe de tableaux quantitatifs, Paris, Masson, 1988, 254 p. (ISBN 978 2 225 81476 3)