Heidi WECHTLER Le support aux analyses de données Séminaire GREGOR Octobre 2005
Support aux analyse de données du GREGOR Le poste Chargée d étude statistiques au GREGOR, bureau B126 (wechtler.iae@univ-paris1.fr) Les missions Support aux analyses de données pour les doctorants et enseignants du GREGOR, pour la partie empirique des thèses ou des articles. Conseils d initiation aux logiciels statistiques, Conseils pour le choix des méthodes, Conseils pour la mise en œuvre, Conseils pour l interprétation.
Support aux analyse de données : A quelle étape? Avant Possibilité d initiation aux logiciels Statistiques disponibles au GREGOR : SPAD : spécialisé pour les analyses de données approfondies (analyses factorielles, classification ) et pour l analyse textuelle SPSS : spécialisé pour les tests, facile d accès pour les analyses factorielles et régression SAS : fait tout, pratique pour la gestion et transformation de données, les statistiques en général et l automatisation de tâches. Garde trace des manipulations de données et options choisies. Il est plus facile de collecter des données adéquates lorsqu on connaît les différentes possibilités des logiciels Exemples : Attention au format des variables (continues, échelles, nominales ) Pour l analyse textuelle, penser à des variables nominales pertinentes pour comparer les discours
Support aux analyse de données : A quelle étape? Avant Se poser les bonnes questions : A propos des données : le format des variables A propos des méthodes : la nature des données et la taille de l échantillon déterminent les d analyses Exemples : Ma variable est-elle vraiment une échelle? On ne peut pas faire de régression simple sur une variable dépendante qualitative On ne peut pas utiliser de méthodes paramétriques sur de très petits échantillons Comment mélanger les variables quali et quanti? Difficile de caractériser des profils de réponses avec des questionnaires à étapes (si vous avez répondu «bien» ou «assez bien» passez à la question 11 sinon passez à la question 19 etc.)
Support aux analyse de données : A quelle étape? Pendant Conseils pour : Les différentes méthodes possibles en fonction des données Vérifier si les hypothèses statistiques sont respectées pour utiliser une méthode en particulier La mise en œuvre des méthodes choisies Exemples : Est-ce que l échantillon est assez conséquent pour faire tel test, telle méthode? Méthodes paramétriques ou non paramétriques? Est-ce que mes variables sont bien indépendantes (corrélation faible) dans ma régression?
Support aux analyse de données : A quelle étape? Après Pour les analyses déjà bien avancées, aide à l interprétation et tri des output Exemples : Pour arriver au résultat final, est-il nécessaire de présenter toutes les étapes, tous les essais, faut-il garder plusieurs méthodes qui montrent le même résultat? Dans une régression simple, faut-il présenter dans la sorties les variables non significatives? Est-ce que mon test est bien significatif, qu en conclure?
Support aux analyse de données : FAQ Les besoins les plus souvent formulés Principe de l analyse textuelle et apprentissage du logiciel SPADT Apprentissage du logiciel SPAD pour l analyse des correspondances multiples Aide à l interprétation des analyses factorielles (les différences entre SPSS et SPAD) Aide pour mettre en œuvre et interpréter facilement les classifications (l avantage de SPAD) Aide à l interprétation des tests non paramétriques (sous SPSS) Relecture de la partie statistique pour vérifier le déroulement des étapes statistiques et l interprétation générale Aide pour la mise en œuvre et interprétation de modèles de régression dont la variable dépendante est nominale (logit) Points méthodologiques et définitions de méthodes statistiques
Quelques astuces Bon à savoir, il est très courant d utiliser plusieurs logiciels en statistiques (on utilise la spécialité de chacun pour le maximum de lisibilité) Exemple : SAS pour mettre en forme les données SPSS pour faire les différents tests SPAD pour les analyses factorielles et classification SPSS pour les régressions Ne pas hésiter à tester plusieurs méthodes, plusieurs découpages de variables Exemple : Tester avec la variable sous forme continue Tester la variable transformer en quartile Tester la variable avec un découpage à seuils théoriques Tester la variable sous forme binaire (médiane)
Support aux analyse de données du GREGOR Propositions : Possibilité de prendre rendez-vous TD d initiation aux logiciels Stat en petits groupes ou individuellement TD de statistiques sur un point précis (paramétrique/non paramétrique ; analyse factorielle ; régression linéaire ; modèle logit) Projets : Des licences SPAD 6 sur tous les postes de la salle B129 + DEA avec possibilités d avoir des licences étudiants (environ 20 ) Avoir des licences étudiants SPSS (environ 20 )