Table des matières AVANT-PROPOS L analyse des données... 15 INTRODUCTION CHAPITRE 1 Le vocabulaire de l analyse des données... 23 Godelieve Masuy-Stroobant 1. Variables et unités d observations... 23 1.1. Différents types de variables... 24 1.2. Les unités d observation... 25 2. Où il est question de «relations»... 27 2.1. Qu est-ce qu une cause?... 27 2.2. L effet d interaction... 29 2.3. Qu est-ce qu une variable de confusion?... 35 3. Échantillon et population... 37 4. La logique des tests statistiques et leur usage... 40 4.1. Pourquoi recourir à un test?... 40 4.2. L «Hypothèse nulle» (H0) du statisticien... 42 4.3. Les tests sont-ils infaillibles?... 44 5. Que conclure de tout cela?... 45 6. Pour aller plus loin... 46 ANALYSE UNIVARIÉE CHAPITRE 2 L exploration : évaluer, préparer et décrire... 49 Amandine J. Masuy L aide des proches aux plus âgés... 49 1. Évaluer la qualité des données... 50 2. Préparer les données... 54 2.1. Vérifier et éventuellement modifier le codage des variables... 57 2.2. Identifier et résoudre les problèmes posés par les valeurs extrêmes... 58 2.3. Les variables qualitatives très (trop) détaillées... 59 7
2.4. Les données manquantes... 60 2.5. Le niveau de mesure de la variable ne convient pas... 63 2.6. Les variables disponibles ne correspondent pas aux concepts.. 64 3. Décrire les données... 67 3.1. Fréquences, mesures de position et de dispersion... 69 3.2. Représentations graphiques... 72 4. Pour aller plus loin... 74 ANALYSE BIVARIÉE CHAPITRE 3 Deux variables qualitatives... 77 Godelieve Masuy-Stroobant Le naufrage du Titanic (reprise)... 77 1. Le tableau de contingence... 78 2. Le test du Khi-deux... 81 3. Risques relatifs (RR) et odds ratios (OR)... 86 3.1. Le risque relatif... 86 3.2. Le rapport de cotes ou odds ratio... 89 3.3. Pour interpréter correctement les RR et les OR... 91 3.4. Comparer les RR pour repérer les effets d interaction et de confusion... 91 4. Pour aller plus loin... 93 CHAPITRE 4 Une variable qualitative et une variable quantitative... 95 Lorise Moreau Chômage et sentiment de dévalorisation... 95 1. Le test t de Student... 98 1.1. Sélectionner la sous-population d intérêt et la décrire... 98 1.2. Le test t... 102 1.3. Application du test t... 103 1.4. Conditions d application du test t... 105 2. Le test F de Fisher et l analyse de variance (ANOVA)... 108 2.1. Sélectionner la population d intérêt et la décrire... 108 2.2. Le test F et l analyse de variance ANOVA... 110 2.3. Application du test F... 112 2.4. Conditions d application du test F... 115 3. Pour aller plus loin... 115 8
CHAPITRE 5 Deux variables quantitatives... 117 Rafael Costa Précarité, mortalité et santé des communes belges... 117 1. Le diagramme de dispersion... 120 2. Deux mesures de la relation bivariée entre variables quantitatives... 124 2.1. Le coefficient de corrélation de Bravais-Pearson r... 124 2.2. Le coefficient de détermination R²... 127 2.3. Tester le niveau de signification de r et de R²... 128 3. Résumer l association entre deux variables quantitatives... 129 3.1. La régression simple... 129 3.2. Estimer les coefficients de régression a et b... 130 3.3. Tester le niveau de signification de a et de b... 134 3.4. Un tableau synthétise les résultats d une régression... 134 3.5. Les hypothèses de la régression linéaire... 135 4. À quoi faire attention... 140 4.1. Variables qualitatives... 140 4.2. Que faire en cas d hétéroscédasticité et de non linéarité?... 140 4.3. Association et causalité... 140 5. Pour aller plus loin... 141 ANALYSE MULTIVARIÉE DES INTERDÉPENDANCES CHAPITRE 6 L analyse en composantes principales... 145 Godelieve Masuy-Stroobant Inégalités régionales de mortalité infantile en 1900... 145 Hypothèses et indicateurs... 146 Les composantes principales de la mortalité infantile... 149 1. L analyse en composantes principales ACP... 155 1.1. Le domaine d application d une ACP... 155 1.2. Qu est-ce qu une composante principale?... 157 1.3. Les relations entre variables initiales et composantes... 159 1.4. Le vocabulaire de l ACP... 160 1.5. Le nombre de composantes... 161 1.6. La rotation des axes ou composantes... 163 9
2. Comment réaliser une analyse en composantes principales?... 164 2.1. Les variables initiales... 164 2.2. Combien de composantes retenir?... 165 2.3. Faut-il procéder à une rotation?... 165 2.4. La présentation des résultats... 166 2.5. L interprétation des résultats... 167 3. À quoi faire attention... 167 4. Pour aller plus loin... 168 CHAPITRE 7 L analyse factorielle des correspondances (multiples)... 171 Pierre Baudewyns Les élections de juin 2007 en Wallonie... 171 1. L analyse factorielle des correspondances AFC... 174 1.1. Le domaine d application d une AFC... 175 1.2. Comment sont construits les facteurs d une AFC... 176 1.3. Les résultats d une AFC... 184 1.4. Variables actives et variables illustratives... 191 2. L analyse factorielle des correspondances multiples AFCM... 191 2.1. Le tableau disjonctif et le tableau de contingence de Burt... 191 2.2. Le fonctionnement d une AFCM... 193 2.3. Les résultats d une AFCM... 194 2.4. Variables actives, variables illustratives... 198 3. À quoi faire attention... 198 4. Pour aller plus loin... 199 CHAPITRE 8 L analyse de classification... 201 Rafael Costa La frontière linguistique : une réalité démographique?... 201 1. L analyse de classification... 207 1.1. Qu est-ce qu une analyse de classification?... 207 1.2. Comment réaliser une analyse de classification?... 209 2. En pratique, comment procéder?... 211 2.1. Comment fonctionne la méthode de Ward?... 212 2.2. Le dendrogramme pour représenter la classification hiérarchique... 216 2.3. Combien de groupes retenir?... 217 2.4. Comment tester l homogénéité interne des groupes et leurs différences?... 219 10
2.5. Comment présenter les résultats d une classification?... 220 3. À quoi faire attention... 221 3.1. Vérifier au préalable l existence possible de groupes... 221 3.2. Le choix des variables de l espace de référence est crucial... 222 3.3. La préparation des variables pour la classification... 222 3.4. Limites des méthodes... 223 4. Pour aller plus loin... 224 ANALYSE MULTIVARIÉE DES DÉPENDANCES CHAPITRE 9 La régression linéaire multiple... 227 Bruno Schoumaker L immigration en Europe... 227 Conditions de vie et attitudes face à l immigration en Europe... 228 La région exerce-t-elle un «effet de confusion»?... 231 Les conditions de vie comme «variable intermédiaire»... 235 Que conclure de tout cela?... 237 1. La régression linéaire multiple... 239 1.1. Qu est-ce qu une régression linéaire multiple?... 239 1.2. Objectifs... 240 1.3. Comment réaliser une régression multiple?... 241 2. En pratique, comment procéder?... 243 2.1. Quelles variables indépendantes et comment en interpréter les coefficients?... 243 2.2. Comment tester la signification statistique des variables explicatives?... 244 2.3. Quelles variables retenir dans le modèle?... 245 2.4. Comment comparer les coefficients de régression?... 246 2.5. Que signifie R²? Quelle importance lui donner?... 247 2.6. Comment présenter les résultats de la régression?... 248 3. À quoi faire attention... 248 3.1. La multicolinéarité... 249 3.2. L additivité des effets des variables... 250 3.3. Le principe de parcimonie... 251 4. Pour aller plus loin... 252 CHAPITRE 10 La régression logistique... 253 Ester Rizzi Religion et attitudes envers la sexualité en Italie... 253 11
L importance accordée à la religion influence-t-elle l adhésion aux valeurs traditionnelles?... 254 Le niveau social d origine et la région exercent-ils un «effet de confusion»?... 257 1. Qu est-ce qu une régression logistique?... 261 1.1. La transformation logit... 261 1.2. Les coefficients de régression β et OR... 262 1.3. La signification statistique des coefficients β et des OR... 263 1.4. Et pour évaluer la qualité globale du modèle... 266 1.5. Régression logistique et régression linéaire multiple... 267 2. En pratique, comment procéder?... 269 2.1. La variable dépendante d un modèle logistique... 269 2.2. Les variables indépendantes... 269 2.3. L interprétation des résultats d une régression logistique... 270 2.4. L estimation de la probabilité p et de l odds de p... 273 2.5. La stratégie d analyse... 274 2.6. La présentation des résultats... 274 3. À quoi faire attention... 275 4. Pour aller plus loin... 277 CONCLUSION CHAPITRE 11 Interpréter les résultats... 281 Godelieve Masuy- Stroobant 1. Le contexte théorique de la recherche... 281 2. Tenir compte du déroulement de la recherche... 283 3. La confrontation à la littérature sur le sujet... 285 4. La généralisation des résultats... 286 5. La part de créativité du chercheur... 287 Encadrés 1. Les «degrés de liberté»... 84 2. Échantillon et distribution d échantillonnage... 97 3. La loi Normale... 100 4. Analyses agrégées, analyses individuelles, et inférence écologique fallacieuse... 118 5. Le vocabulaire de l analyse factorielle des correspondances... 176 6. Codage binaire de variables nominales... 233 7. La standardisation ou comment calculer une z-variable... 247 12
Bibliographie... 289 Les auteurs... 295 Index... 297 13