Pratique de recherche 2 : Analyse statistique UE n 4665.268 des données sociales Master Module : Méthodologie appliquée 3009.095 Enseignant Jean-François Bickel Semestre de printemps 2009 Mardi 17h15 19h00 Salle STA 1.106 Présentation Ce cours porte sur la manière dont les méthodes statistiques (ou plutôt certaines d entre elles) peuvent être appliquées pour l analyse d une problématique sociologique particulière. La problématique générale retenue est celle de l articulation (conciliation? tension? conflit?...) entre vie familiale et vie professionnelle et la question du care. Nous nous attacherons donc à la manière de mettre en oeuvre divers outils de l analyse statistique (univariée, bivariée et principalement multivariée) pour répondre à différentes questions ou hypothèses en lien avec la problématique choisie. Ceci impliquera à la fois (i) une reprise d outils étudiés antérieurement dans la formation, (ii) certaines extensions ou variantes de sorte à ce que ceux-ci puissent être correctement et validement appliqués aux cas de figure rencontrés, et (iii) l introduction de nouvelles techniques. Les analyses porteront en majorité sur des données transversales, mais le cas des données longitudinales sera également abordé. Tout au long du cours, on s efforcera de traiter aussi bien (a) des interrogations et problèmes proprement statistiques quelles variables utiliser? quelles sont les conditions qui rendent valides le recours à telle ou telle technique? comment "lire" les résultats de l analyse en question? etc. que (b) des questions d ordre plus sociologique : par exemple, quels phénomènes sociaux sont-ils mis en évidence par les analyses menées? quelles hypothèses cela inspire-til, etc. Le cours est conçu dans une perspective appliquée. Nous ne nous intéresserons donc pas aux démonstrations ou procédures mathématiques qui sous-tendent les techniques abordées, et le recours au langage formel sera minimal. Ce sur quoi nous insisterons par contre, c est sur l examen de l adéquation des techniques aux questions de recherche et aux types de données à disposition, la mise en pratique de ces techniques au moyen de logiciels statistiques (voir ci-dessous) et l interprétation (statistique et sociologique) des résultats des analyses ainsi mises en pratique. Pour cela, les étudiants seront amenés à construire, réaliser et interpréter des analyses signifiantes sur la base de données réelles au travers d exercices à effectuer entre les séances. Ce cours se focalise sur l analyse secondaire de données d enquête de population. C est dire que l on ne traitera pas de manière extensive des questions liées à la collecte des données : dessin d enquête, plans Pratique de recherche 2 : Analyse statistique des données sociales / SP 09 1
d échantillonnage, construction puis passation du questionnaire, etc. Mais, nous en ferons néanmoins mention, dans la mesure où ce que les données en main permettent de faire et d inférer de manière valide dépend étroitement de la manière dont elles ont été collectées et de leur "qualité". Ce qui est en définitive visé est de permettre aux étudiants (a) d acquérir un certain nombre d outils statistiques, ainsi que la manière et les conditions de leurs mises en oeuvre ; (b) de mieux cerner leurs apports (et leurs limites!) à l intelligibilité sociologique. Un double objectif qui vaut au demeurant autant pour les étudiant-e-s qui seront des utilisateurs de ces outils lors leurs études ou dans la vie professionnelle, que pour ceux et celles qui s y trouveront simplement confrontés, au travers de leurs lectures par exemple. Un dernier objectif est d offrir des bases suffisamment solides à des étudiant-e-s qui seraient amenés, par envie, circonstances et/ou opportunités, à étendre et approfondir ultérieurement leurs connaissances en matière d analyse statistique en sciences sociales. Atelier pratique (optionnel) Les étudiant-e-s qui le souhaitent et /ou qui en ressentent le besoin peuvent bénéficier, en plus du cours proprement dit, d un atelier pratique. Celui-ci sera donné en salle d informatique (salle STA 2.106), le mardi de 10h15 à 12h00. Le premier de ces ateliers est fixé au mardi 24 février, puis chaque semaine (sauf durant les vacances de Pâques) jusqu au mardi 19 mai. Je me tiendrai à disposition pour répondre aux questions liées à la méthodologie statistique et à l utilisation de SPSS (ou de R). La participation à cet atelier est strictement optionnelle. Crédits attribués 1 ECTS. Acquis pédagogiques Assimiler de manière critique la matière du cours. Modalités de validation Les exigences pour valider le cours sont une participation active. Par participation active, on entend la réalisation des exercices demandés et la participation en classe à la révision des exercices et aux discussions d ordre thématique (par exemple sur la base de textes distribués à l avance). Présentation des documents Cf. directives pour travaux écrits ("Conventions académiques", "Le travail d écriture", "Les notes en bas de page ") sur le site Web de la Chaire. http://www.unifr.ch/travsoc/franco/index.htm. Dates des sessions d'examen 1 ère session : du 25 au 29 mai 2009; date butoir pour le dépôt du travail écrit : jeudi 28 mai 09. 2 ème session : du 31 août au 04 septembre 2009; dépôt butoir pour le dépôt du travail écrit : jeudi 3 septembre 09. Pratique de recherche 2 : Analyse statistique des données sociales / SP 09 2
3 ème session : du 14 au 18 décembre 2009; dépôt butoir pour le dépôt du travail écrit : jeudi 17 décembre 09. Planification des séances Dans la mesure où il s agit bien d un cours de méthodologie statistique appliquée, la planification des séances est volontairement organisée selon une série de questions dont traite la statistique et auxquelles celle-ci permet de répondre ; et non pas en fonction des questions d ordre plus sociologique et théorique que nous rencontrerons. Cette planification doit par ailleurs être considérée avec une certaine dose de flexibilité, dans la mesure où certaines adaptations sont possibles en fonction des besoins et des intérêts. 17 février 2009 Séance 1 : Introduction 24 février 2009 Séance 2 : Vie familiale, vie professionnelle et care : problématique et questions pour l analyse 03 mars 2009 Séance 3 : Quelles données et quels indicateurs? 10 mars 2009 Séance 4 : Comment caractériser la relation entre deux variables de même type? comment comparer deux ou plusieurs groupes entre du point d une attitude, d une ressource, de l adhésion à une norme...? 17 mars 2009 Séance 5 : Comment caractériser la structure des relations existant entre une série de variables ayant le même statut (un ensemble d activités, de croyances...) et mettre en évidence ces points saillants? 24 mars 2009 Séance 6 : Suite de la séance précédente 31 mars 2009 Séance 7 : Comment une situation, une pratique, une pratique, etc. varie-t-elle en fonction d une série d autres conditions (telles que sexe, âge, présence ou non d un type dispositif de politique sociale...) combinées entre elles? 21 avril 2009 Séance 8 : suite de la séance précédente 28 avril 2009 Séance 9 : suite de la séance précédente 05 mai 2009 Séance 10 : Comment et en fonction de quoi situations, pratiques ou opinions évoulent-elles au cours du temps (Introduction à l analyse de données longitudinales) 12 mai 2009 Séance 11 : Suite de la séance précédente 19 mai 2009 Séance 12 : Suite de la séance précédente Du 25 au 29 mai 2009 : semaine d'examen Sous réserve de changements de dates indiqués sur GESTENS Pratique de recherche 2 : Analyse statistique des données sociales / SP 09 3
Références bibliographiques Ces références ne portent que sur l aspect méthodologique et statistique. Elles seront complétées par d autres qui abordent plus directement la problématique sociologique choisie pour ce cours (les étudiant-e-s sont cordialement invité-e-s à faire part et à partager leurs propres références en la matière). Réflexions sur les méthodes statistiques en sociologie : apports, possibilités, limites : BERK R.A., Regression analysis. A constructive critique, Thousand Oaks, Sage, 2004. BOUDON R. & FILLIEULE R., Les Méthodes en sociologie (12 ème éd.), Paris, Presses universitaires de France, 2002. BRADY H.E. & COLLIER D. (eds.), Rethinking social inquiry. Diverse tools, shared standards, Lanham, Rowman & Littlefield, 2004. GOLDTHORPE J.H., "Causation, statistics, and sociology" in European Sociological Review, 17 (1), 2001. GOLDTHORPE J.H., "Sociology as social science and cameral sociology: Some further thoughts" in European Sociological Review, vol.20, n 2, 2004. LIEBERSON S., Making it count. The improvement of social research and theory, Berkeley, University of California Press, 1985. RESKIN B.F., "Including mechanisms in our models of ascriptive inequality" in American Sociological Review, vol.68, n 1, 2003. WHEATON B., "Quand les méthodes font toutes la différence" in Sociologie et Sociétés, vol.35, n 1, 2003. Collecter et utiliser des données d enquête : KISH L., Statistical design for research, New York, Wiley, 1987. Ouvrages généraux sur l analyse statistique : AGRESTI A. & FINLAY B., Statistical methods for the social sciences (3rd edition), Upper Saddle River, Prentice-Hall, 1997. AGRESTI A., An introduction to categorical data analysis (2nd edition), Hoboken, Wiley, 2007. FREEDMAN D., PISANI R. & PURVES R., Statistics (4th edition), New York, Norton, 2007. MARTIN O., L'Analyse de données quantitatives, Paris, Éditions Armand Colin, 2005. PAGÈS J., Statistiques générales pour utilisateurs. 1 - Méthodologie, Rennes, Presses universitaires de Rennes, 2005; complété par HUSSON F. & PAGÈS J., Statistiques générales pour utilisateurs. 2 - Exercices et corrigés, Rennes, Presses universitaires de Rennes, 2005. L analyse dimensionnelle : ALDENDERFER M.S. & BLASHFIELD R.K., Cluster analysis, Newbury Park, Sage, 1984. Pratique de recherche 2 : Analyse statistique des données sociales / SP 09 4
BARTHOLOMEW D.J., STEELE F., MOUSTAKI I. & GALBRAITH J.L., The analysis and interpretation of multivariate data for social scientists, Boca Raton, Chapman & Hall/CRC, 2002. CARMINES E.G. & ZELLER R.A., Reliability and validity assessment, Beverly Hills, Sage, 1979. KIM J.-O. & MUELLER C.W., Introduction to factor analysis. What it is and how to do it, Newbury Park, Sage, 1978. KIM J.-O. & MUELLER C.W., Factor analysis: Statistical methods and practical issues, Newbury Park, Sage, 1978. LEBART L., PIRON M. & MORINEAU A., Statistique exploratoire multidimentionnelle. Visualisation et inférence en fouilles de données (4 ème édition), Paris, Éditions Dunod, 2006. TABACHNICK B.G. & FIDELL L. S., Using multivariate statistics (4th edition), Boston, Allyn and Bacon, 2001. La régression : ACHEN C.H., Interpreting and using regression, Newburry Park, Sage, 1982. ALLISON P.D., Multiple regression. A primer, Thousand Oaks, Pine Forge, 1999. BRESSOUX P., Modélisation statistique appliquée aux sciences sociales, Bruxelles, Éditions de Boeck Université, 2008. FOX J., Applied regression analysis, linear models, and related methods, Thousand Oaks, Sage, 1997. JACCARD J., Interaction effects in logistic regression, Thousands Oaks, Sage, 2001. JACCARD J. & TURRISI R., Interaction effects in multiple regression (2nd edition), Thousand Oaks, Sage, 2003. Lewis-Beck M.S., Applied regression: An introduction, Newbury Park, Sage, 1980. Liao T.F., Interpreting probability models. Logit, probit, and other generalized linear models, Thousand Oaks, Sage, 1994. LONG J.S., Regression models for categorical and limited dependant variables, Thousand Oaks, Sage, 1997. PAMPEL F.C., Logistic regression. A primer, Thousands Oaks, Sage, 2000. Ouvrages d introduction à l analyse des données longitudinales : ABBOTT A., Time matters. On theory and method, Chicago, University of Chicago Press, 2001. FIREBAUGH G., Analyzing repeated surveys, Thousands Oaks, Sage, 1997. Glenn N.D., Cohort analysis, Thousand Oaks, Sage, 2005. Menard S., Longitudinal research, Thousand Oaks, Sage, 2002. ROSE D. (ed.), Researching social and economic change. The uses of household panel studies, London, Routledge, 2000. TARIS T.W., A primer in longitudinal data analysis, London, Sage, 2000. Ouvrages centrés sur l utilisation de logiciels statistiques (limités ici à SPSS et R) : Pratique de recherche 2 : Analyse statistique des données sociales / SP 09 5
CORNILLON P.-A., GUYADER A., HUSSON F., JEGOU N., JOSSE J., KLOAREG M., MATZNER- LOEBER E. & ROUVIÈRE L., Statistiques avec R, Rennes, Presses universitaires de Rennes, 2008. EVERITT B.S., An R and S-Plus companion to multivariate analysis, London, Springer, 2005. HO D., Handbook of univariate and multivariate data analysis and interpretation with SPSS, Boca Raton, Chapman & Hall / CRC, 2006. FOX J., An R and S-Plus companion to applied regression, Thousand Oaks, Sage, 2002. LANDAU S. & EVERITT B.S., A handbook of statistical analysis using SPSS, Boca Raton, Chapman & Hall/CRC, 2004. Pratique de recherche 2 : Analyse statistique des données sociales / SP 09 6