Traitement informatisé des données M1 Psychologie de la santé et Psychologie du travail M. Muller Département de Psychologie Création d'une bible de codification : - Nommer les variables étudiées (les caractères spéciaux sont à éviter - accents ou espaces par exemple) - Déterminer des valeurs pour chaque modalité des variables dichotomiques ou ordinales - Vous pouvez laisser une case vide pour les valeurs manquantes ou déterminer une valeur spécifique à ces données manquantes (même valeur en général pour toutes les variables par exemple : -9) Saisie des données dans Excel : En général, la première ligne permettra la saisie des noms de variables De la même façon, la première colonne sera souvent réservée à la saisie du numéro de participant Enregistrer fréquemment son travail dans un dossier réservé à l'étude. SI VOUS UTILISER UNE ANCIENNE VERSION SPSS (< 11) : Quand la saisie est intégralement faite, il faut enregistrer le fichier en tant que feuille de calcul Excel 4 pour la lecture dans SPSS. [FICHIER ENREGISTRER SOUS TYPE DE FICHIER : feuille de calcul Excel 4.0] Importation des données dans SPSS avec lecture des noms de variables : Ouvrir le logiciel SPSS pour Windows [DEMARRER PROGRAMMES SPSS pour Windows] Une fois dans SPSS, demandez à ouvrir un fichier : [FICHIER OUVRIR ] Rendez-vous dans le dossier que vous avez réservé à votre étude, et sélectionnez le type de fichier Excel : [TYPE : Excel (*.xls)] Le fichier Excel dans lequel vous avez saisi vos données apparaît. Il ne vous reste plus qu'à le sélectionner et à l'ouvrir. Une fenêtre des propriétés de l'ouverture des fichiers apparaît. Si vous avez pensé à saisir le nom des variables sur la première ligne de votre fichier Excel pour devez alors cocher la case : [LIRE LE NOM DES VARIABLES OK] Définition des variables : SPSS possède deux onglets en bas à gauche de l'écran : le premier est réservé à l'affichage des données alors que le second permet d'afficher les variables et de les éditer. Une autre façon de jongler entre les deux fenêtres est de double-cliquer sur le nom de la variable dans la fenêtre réservée à l'affichage des données ou sur le numéro de la variable en début de ligne dans la fenêtre d'affichage des variables. Dans la fenêtre d'affichage des variables, déterminez l'échelle de mesure de votre variable (nominale, ordinale ou échelle). Rem. : les catégories socioprofessionnelles constituent un exemple type de variable nominale ; Une échelle d'attitude (5 choix de réponses possibles allant de "pas du tout d'accord" à "tout à fait d'accord" par exemple) constitue une variable ordinale ; l'âge ou la taille d'une personne constituent des variables d'intervalle (échelle dans SPSS). Vous pouvez également renommer votre variable le cas échéant. Vous pouvez maintenant définir quatre paramètres liés à votre variable : le type, les valeurs manquantes, les étiquettes, et le format de la colonne.
TYPE : le type de variable est le plus souvent numérique. LES VALEURS MANQUANTES : elles ont déjà été rentrées lors de la saisie des données dans Excel (ou dans SPSS). Cette étape consiste simplement à définir pour le logiciel SPSS quelles valeurs devront être traitées en tant que données manquantes. Dans la majorité des cas, on définit une(des) valeur(s) manquante(s) discrète(s). Dans notre cas (voir Création d'une bible de codification), il suffit de rentrer la valeur -9 dans valeurs manquantes discrètes. LES ETIQUETTES : elles sont essentielles car elles permettent de se repérer lors des traitements des données. L'étiquette de variable constitue une description utile de la variable. En général, on saisira dans cette case la question ou l'item correspondant à la variable. Les étiquettes de valeur sont à définir à partir de la bible de codification. Pour chaque valeur saisie dans Excel faites correspondre l'étiquette définie : par exemple, pour une variable "sexe" la valeur 1 correspondra l'étiquette "homme" et la valeur 2 correspondra à l'étiquette "femme". LE FORMAT DE LA COLONNE : sa définition est accessoire puisqu'il ne s'agit ici que d'une question de présentation. Il est laissé à la libre appréciation du chercheur. Il en va de même de la longueur et du nombre de décimales qui sont à adapter en fonction de la variable et des préférences visuelles du chercheur. Remarque : Si plusieurs variables comportent des propriétés communes (par exemple des valeurs d'étiquettes identiques dans le cadre des items à une échelle), il est possible de copier [sélection puis CTRL + C] les caractéristiques identiques puis de les coller [CTRL + V] autant de fois que nécessaire dans les variables aux propriétés redondantes. Remarque 2 : Toutes les variables peuvent être déplacées en sélectionnant la ligne dans la fenêtre affichage des variables ou la colonne dans la fenêtre affichage des données puis en la glissant à l'endroit souhaité.
Quelques opérations courantes dans SPSS : - Insérer une variable [DONNEES INSERER UNE VARIABLE] - Insérer une observation [DONNEES INSERER UNE OBSERVATION]
- Afficher les étiquettes de valeurs [AFFICHAGE ETIQUETTES DE VALEURS] De nombreux étudiants chaque année sont perdus parce qu'ils ne connaissent pas cette possibilité. Essayez ce menu dès que vous aurez une base de données enregistrée pour vous représenter à quoi il sert
- Recoder une variable (par exemple, recoder les valeurs 1 et 2 en -1 et 1) [TRANSFORMER RECODER CREATION DE VARIABLE]. Désignez un nom et une étiquette pour la nouvelle variable (variable destination) puis validez par [REMPLACER], puis [ANCIENNES ET NOUVELLES VALEURS], désignez les anciennes et nouvelles valeurs correspondantes puis cliquez [AJOUTER]. Quand cette tâche est achevée cliquez sur [POURSUIVRE] puis sur [OK].
- Calculer une nouvelle variable (par exemple, inverser une variable, calculer la racine carrée d'une variable, créer une nouvelle variable qui correspond à la moyenne de trois anciennes variables dans le cas d'un score factoriel par exemple) [TRANSFORMER CALCULER] puis nommer la nouvelle variable (variable destination) et utiliser le listing des anciennes variables et les fonctions arithmétiques (par exemple MEAN pour calculer la moyenne) pour déterminer les valeurs de la nouvelle variable ainsi créée. Validez par [OK] pour créer cette nouvelle variable.
- Calculer des moyennes, des écarts-types, des variances, des médianes, [ANALYSE STATISTIQUES DESCRIPTIVES FREQUENCES puis cliquez que le bouton STATISTIQUES], cochez les indices que vous souhaitez obtenir, validez par [POURSUIVRE]. N'oubliez pas de sélectionner les variables pour lesquelles vous souhaitez obtenir ces indices.
- Produire des moyennes pour chaque condition expérimentale séparément [ANALYSE COMPARER LES MOYENNES MOYENNES]. Les variables dépendantes sont celles qui pour lesquelles vous souhaitez obtenir des indices statistiques. Les variables explicatives sont celles qui constituent les conditions expérimentales. Utilisez le menu [OPTIONS] pour sélectionner les indices statistiques choisis, puis [POURSUIVRE] et [OK].
- Faire un graphique de type "bâtons" [GRAPHES BATONS ], de types courbes [GRAPHES COURBES ], - Editer un graphique (par exemple, titre, légende, axes ) : double-cliquez sur le graphique choisi puis éditez le graphique selon votre convenance en utilisant menu, icones ou clic droit.
- Faire une analyse de corrélation [ANALYSE CORRELATION BIVARIEE]. Sélectionnez les variables que vous souhaitez corréler puis le coefficient de corrélation attendu. Validez par [OK].
- Faire un Khi-deux [ANALYSE STATISTIQUES DESCRIPTIVES TABLEAUX CROISES]. Sélectionnez la variable que vous souhaitez en ligne dans votre tableau et la variable que vous souhaitez en colonne dans votre tableau. Cliquez sur [STATISTIQUES] et cochez la case [KHI-DEUX]. Si vous souhaitez obtenir les effectifs théoriques et/ou les pourcentages en ligne ou en colonne, cliquez sur [CELLULES] et cochez la case [THEORIQUE] et/ou [POURCENTAGES:ligne/colonne]. Pour terminer l opération : [POURSUIVRE], puis [OK]
- Faire un test t pour échantillon unique [ANALYSE COMPARER LES MOYENNES TEST T POUR ECHANTILLON UNIQUE]. Sélectionnez la(les) variable(s) à tester et déterminer la valeur de test. Utilisez le menu option pour choisir le seuil de significativité (par défaut : 95%)
- Faire un test t pour échantillons indépendants [ANALYSE COMPARER LES MOYENNES TEST T POUR ECHANTILLONS INDEPENDANTS]. Sélectionnez la(les) variable(s) à tester et le critère de regroupement (la variable qui va constituer les deux groupes d'observations). Définissez le critère de regroupement [DEFINIR GROUPES] c'est-à-dire indiquez au programme les valeurs de la variable de regroupement qui vont constituer les deux groupes. Utilisez le menu option pour choisir le seuil de significativité (par défaut : 95%)
- Faire un test t pour échantillons appariés [ANALYSE COMPARER LES MOYENNES TEST T POUR ECHANTILLONS APPARIES]. Sélectionnez les deux variables qui doivent être testées (créer un couple de variable en les sélectionnant toutes les deux puis faites les basculer dans la fenêtre centrale) puis validez par [OK]. Utilisez le menu option pour choisir le seuil de significativité (par défaut : 95%)
- Faire une ANOVA à un facteur [ANALYSE COMPARER LES MOYENNES ANOVA 1 FACTEUR]. Sélectionner votre(vos) variable(s) dépendante(s) et votre variable qui permet de regrouper les sujets (critère). Allez dans [OPTIONS] et cochez [CARACTÉRISTIQUES] puis [POURSUIVRE]. Puis [OK]. Si vous souhaitez connaître les différences entre des couples de modalités de votre variable critère [CONTRASTES]. Pour chaque couple à tester, rentrer un contraste à l aide des coefficients que vous associerez à vos modalités, puis [POURSUIVRE]. Dans ce cas, pour savoir qu elle hypothèse retenir lors des tests de Student, demander un test de Levene sur l égalité des variances [OPTIONS], cochez la case [TEST D EGALITE DES VARIANCES] puis validez et [OK].
- Faire une ANOVA à mesures répétées [ANALYSE MODELE LINEAIRE GENERAL MESURES REPETEES]. Déterminez un nom du critère intra-sujet et le nombre de mesures répétées (nombre de niveaux). Cliquez sur [AJOUTEZ], puis [DEFINIR]. Sélectionnez les variables qui constituent vos mesures répétées en les faisant basculer dans l espace prévu à cet effet [VARIABLES INTRA-SUJETS] et cliquez sur [OPTIONS] afin de sélectionner [STATISTIQUES DESCRIPTIVES]. Validez en cliquant sur [POURSUIVRE]. Puis [OK].
- Etudier l interaction de deux facteurs [ANALYSE MODELE LINEAIRE GENERAL UNIVARIE]. Sélectionnez votre variable dépendante puis vos variables en interaction dans [FACTEURS FIXES]. Cliquez sur [MODELE] pour vérifier que la case [FACTORIEL COMPLET] est cochée, puis [POURSUIVRE] et [OK].
- Faire une régression simple ou multiple [ANALYSE REGRESSION LINEAIRE]. Sélectionnez votre variable dépendante et votre(vos) variable(s) explicative(s), [OK]. Si vous ne testez pas un modèle, mais si vous cherchez à connaître les variables qui expliquent le mieux les variations de votre VD, respectez les étapes précédentes et utilisez la méthode [ASCENDANTE]. -
- Faire une analyse factorielle [ANALYSE FACTORISATION ANALYSE FACTORIELLE]. Sélectionnez les variables dont vous voulez extraire des composantes. [EXTRACTION] demander le [GRAPHIQUE DES VALEURS PROPRES]. Choisissez selon votre recherche une extraction par [VALEURS PROPRES SUPERIEURES A 1] ou déterminez le [NOMBRE DE FACTEURS]. Puis, [ROTATION VARIMAX POURSUIVRE OK]. Remarque : vous pouvez demander à ne garder que les saturations inférieures à une valeur (par exemple, 0,40) que vous choisissez dans le menu [OPTIONS], de la même façon que vous pouvez demander dans ce même menu de trier les variables lors de la présentation des résultats. Ceci permet une meilleure lisibilité des matrices. Suite page suivante
- Examiner la fiabilité d'une échelle [ANALYSE POSITIONNEMENT ANALYSE DE FIABILITE]. Sélectionnez les variables qui constituent le facteur à tester. Vérifier que le modèle utilisé est celui de l Alpha de Cronbach (par défaut dans le logiciel). Puis de préférence [STATISTIQUES], et cochez les cases qui vous intéressent par exemple [ITEMS, ECHELLE et ECHELLE SANS L ITEM], puis [POURSUIVRE OK]