Méthodes Quantitatives : niveau I Semestre d automne 2017 Antoine Jardin, Ingénieur de Recherche (CNRS) : antoine.jardin@sciencespo.fr Anja Durovic, doctorante (CEE/LIEPP, Sciences Po) : anja.durovic@sciencespo.fr Objectifs du cours Ce cours vise essentiellement à remplir trois objectifs : 1) Familiariser les étudiant.e.s avec les démarches de recherche quantitative en sciences sociales, pour les appliquer, notamment, à la comparaison internationale : les étudiant.e.s seront initié.e.s à la démarche «d empiricisation» des hypothèses de recherche et des modèles d analyse sociale et politique. On les familiarisera aux différentes étapes d une recherche, de l élaboration des questionnements à leur validation empirique à travers l utilisation de données existantes. Pour cela le cours fera référence régulièrement à certaines des problématiques qui animent le débat en sciences politique, sociologie et relations internationales. 2) Les doter des outils d analyses statistiques courants en sciences sociales : il s agira ici d initier aux méthodes statistiques les plus couramment utilisées d un point de vue de théorie statistique mais également pratique. A cette fin, le cours alternera découverte de la «boîte noire» des méthodes statistiques et mise en application de ces méthodes à un contexte de recherche et des données réelles à travers l initiation au logiciel STATA. 3) Développer leur sens critique à l égard des travaux universitaires existants : forts des connaissances ainsi acquises les étudiant.e.s devront être à même de déterminer les défauts et qualités des méthodes de recueil des données employées, de la pertinence des hypothèses, méthodes d analyse et résultats avancés et être à même de suggérer des méthodes et designs empiriques alternatifs. En cela, ils acquerront l esprit critique et le recul nécessaires au traitement approprié des 1
données, documents et autres rapports d étude auxquels ils/elles pourront être confrontés dans l avenir. Déroulement du cours : Le cours abordera les statistiques sociales d un point de vue théorique et empirique. Les concepts couverts seront appliqués à des données et des questions de recherche réelles à partir d enquêtes internationales et par l utilisation du logiciel STATA. L assiduité aux cours est obligatoire, en manquer un rendra difficile la compréhension des séances suivantes. Il est fortement recommandé aux étudiant.e.s de fournir un travail régulier notamment en s exerçant à l usage du logiciel et de rattraper systématiquement en cas d absence. Charge de travail et évaluation Les étudiant.e.s seront donc jugé.e.s sur les exercices suivants : 1. Rédaction d un mini-mémoire de recherche quantitative (60%) La remise des mini-mémoires de recherche aura lieu mi-décembre. Le choix du sujet est libre mais devra être validé par les enseignants. La recherche proposée utilisera l European Social Survey (si possible), enquête support du cours. Le mini-mémoire peut être écrit en duo ou par un groupe de trois étudiant.e.s (20 pages max.). Le mini-mémoire doit répondre à une question de recherche précise, développer des hypothèses de recherche à partir des explications théoriques (pour cela les étudiant.e.s doivent consulter la littérature sur leur sujet, le minimémoire doit contenir au moins 2 références pertinents par rapport au sujet), opérationnaliser les concepts utilisés ainsi que mettre en application un grand éventail des méthodes quantitatives acquis en cours. 2. Exercices d application (2*20%) Les exercices d application (devoir maison) consistent en plusieurs problèmes d analyse quantitative mettant en application les connaissances et savoir-faire acquis en classe. Les étudiant.e.s doivent les réaliser seul.e.s et les rendre pour la séance pratiques suivante. 2
Plan du cours Séance 1 : Le monde des enquêtes quantitatives Savoir-faire : comprendre les notions d échantillon et de représentativité, de méthode aléatoire ou par quotas, déterminer la qualité de représentativité d une enquête, connaître les avantages et inconvénients des types d interview ; comprendre les notions de biais et de marge d erreur. Séance 2 : Les données (ESS) et le logiciel (STATA) Savoir-faire : connaître l ampleur et les objectifs de l enquête «European Social Survey» ainsi que le vocabulaire des enquêtes statistiques, les types de variables, savoir se repérer dans un questionnaire ainsi que dans Stata, ouvrir et se repérer dans un fichier, sélectionner des observations. Séance 3: Les statistiques univariées Savoir-faire : savoir déterminer la nature d une variable, prendre en compte les biais de mesure, comprendre les notions de moyenne, médiane, variance et écart-type, savoir utiliser les tris à plat et les représentations graphiques (histogrammes, «boîte à moustache»). Séance 4 : Les statistiques bivariées I : la corrélation Savoir-faire : distinguer variables indépendantes et dépendantes, comprendre la relation entre corrélation, covariation et causalité, comprendre la notion de significativité substantielle et statistique, interpréter un nuage point, lire un indice de significativité et déterminer la force des relations. Exercice 1 Séance 5 : Les statistiques bivariées II : le tableau croisé Savoir-faire : effectuer des tableaux croisés, lire et construire un tableau croisé (% lignes, % colonnes, % totaux), savoir les interpréter, sélectionner des populations selon une condition simple et multiple, utiliser les graphiques adéquats ; connaître les mesures d associations bivariées et maîtriser les tests d association. Séance 6 : Le recodage et la création des variables Savoir faire : créer des variables conditionnelles (si / ou) des indicateurs (count) et des échelles d attitudes, savoir arbitrer entre contraintes d effectifs et informations, comprendre la mise en questions de concepts et l utilité des échelles d attitudes. 3
Séance 7 : La comparaison des moyennes (simples) Savoir-faire : comprendre les usages substantiels d un test-t (comparaison entre groupes sociopolitiques et échantillons), comprendre les notions de variances inter et intragroupe, comprendre le F de Fisher. Séance 8 : Les analyses multivariées Savoir-faire : comprendre la causalité multiple, utiliser les fonctions ONEWAY, ANOVA et REGRESS, lire et interpréter les coefficients. Exercice 2 & (à préparer) état d avancement du mini-mémoire Séance 9 : La régression linéaire simple Savoir-faire : comprendre les notions de prédiction et de modèle, comprendre un nuage de point et la droite des moindres carrés, lire un tableau de régression, maîtriser et appliquer les notions de points aberrants, de scores prédits et d erreur de prédiction. Séance 10 : Astuces pour l analyse avec STATA, correction de l exercice 2 et point sur les mémoires (discussions des projets de mini-mémoire), pratique de la régression linéaire. Séance 11 : La régression linéaire multiple Savoir-faire : réfléchir aux modélisations et aux effets postulés des variables indépendantes, application à des jeux de données réelles, comprendre les effets additifs, les interactions entre variables indépendantes, ainsi que les coefficients. Séance 12 : La régression logistique Savoir-faire : déterminer quelle méthode pour quelle variable dépendante, comprendre les modèles de probabilité d un fait social, savoir lire un tableau de régression logistique, comprendre et interpréter un rapport de chance ; utiliser les fonctions LOGIT et LOGISTIC, les appliquer à des données réelles, utiliser des probabilités prédites. 4
Pour accompagner, aller plus loin ou progresser Agresti, Alan/Barbara Finlay. 2009. Statistical Methods for the Social Sciences. 4ème édition. New-York: Prentice-Hall. Chanvril-Ligneel, Flora/ Viviane Le Hay. 2014. Méthodes statistiques pour les sciences sociales. Paris: Ellipses. Fox, William. 1999. Statistiques sociales. Louvain-la-Neuve : De Boeck. Novis, Michel. 1998. Pourcentages et tableaux statistiques. Paris : PUF, 1998. Olivier, Martin. 2005. L enquête et ses méthodes : l analyse de données quantitatives. Paris: Armand Colin. de Vaus, David. 2013. Surveys in Social Research. 6 ème édition. Londres: Routledge. Ouvrages ou tutoriels pour le logiciel STATA Kohler, Ulrich/Frauke Kreuter. 2012. Data Analysis Using Stata. 3 rd édition. Stata Press. Cahuzac, Eric/ Christophe Bontemps. 2008. Stata par la pratique: statistiques, graphiques et éléments de programmation. Stata Press. University of California Los Angeles: Statistical Computing with Stata: http://www.ats.ucla.edu/stat/ Princeton University: Stata Guide : http://www.princeton.edu/wwac/academic-review/stata/ Antoine Bozio: Introduction à Stata: http://www.parisschoolofeconomics.com/bozio-antoine/fr/documents/stata.pdf 5