Table des matières. AVANT-PROPOS L analyse des données... 15

Documents pareils
Pratique de l analyse de données SPSS appliqué à l enquête «Identités et Capital social en Wallonie»

TRANSPORT ET LOGISTIQUE :

PROGRAMME (Susceptible de modifications)

Cycle de formation certifiante Sphinx

Principe d un test statistique

Logiciel XLSTAT version rue Damrémont PARIS

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1

Lire ; Compter ; Tester... avec R

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données

Scénario: Données bancaires et segmentation de clientèle

Mémo d utilisation de ADE-4

La place de SAS dans l'informatique décisionnelle

Une variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants)

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1

La classification automatique de données quantitatives

Analyse de la variance Comparaison de plusieurs moyennes

(Customer Relationship Management, «Gestion de la Relation Client»)

ACP Voitures 1- Méthode

Biostatistiques : Petits effectifs

REALISATION D UNE CALCULATRICE GRACE AU LOGICIEL CROCODILE CLIPS 3.

I- Définitions des signaux.

TS 35 Numériser. Activité introductive - Exercice et démarche expérimentale en fin d activité Notions et contenus du programme de Terminale S

ETUDE DE PERCEPTION PRODUIT

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES

Solutions Décisionnelles SPAD. La maîtrise des données, l'art de la décision

IBM SPSS Regression 21

ESIEA PARIS

SPHINX Logiciel de dépouillement d enquêtes

SOMMAIRE. PREMIÈRE PARTIE Origines et principes du Trade Finance. DEUXIÈME PARTIE Les instruments de paiement traditionnels du Trade Finance

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Localisation des fonctions

TABLE DES MATIERES. C Exercices complémentaires 42

DESCRIPTIF DE MODULE S4 ADG : Mathématique pour la Gestion

MASTER 2 SCIENCES HUMAINES ET SOCIALES Mention Psychologie. Spécialité : Recherches en psychologie

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie

Exemples d utilisation de G2D à l oral de Centrale

La simulation probabiliste avec Excel

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

Vu la demande de la Banque Nationale de Belgique du 5 octobre 2005;

Données longitudinales et modèles de survie

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

Arbres binaires de décision

Transmission d informations sur le réseau électrique

Le risque Idiosyncrasique

Étude de cas Assurance (d après une étude de Philippe Périé, CISIA)

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

Coheris est agréé organisme de formation, n d agrément

Panorama des problématiques de traitement de l information. Larbi Aït Hennani, Fatma Bouali, Vincent Vandewalle

Peut-on supprimer le travail des enfants?

SUIVI MÉDICAL DU DIABÈTE CHEZ LES ASSURÉS DE LA MGEN

Les petis signes de T21 : comment ça marche et à quoi ça sert? Christophe Vayssière (Toulouse) DIU d echographie 2011

Historique. Architecture. Contribution. Conclusion. Définitions et buts La veille stratégique Le multidimensionnel Les classifications

Scénario: Score d appétence de la carte visa premier

ENSEIGNEMENT ET MONDE PROFESSIONNEL. Illustration d un lien fort au travers d un cours de scoring. Jean-Philippe KIENNER 7 novembre 2013

Statistique descriptive. Fabrice MAZEROLLE Professeur de sciences économiques Université Paul Cézanne. Notes de cours

Premiers pas avec SES-Pegase (version 7.0) SES : Un Système Expert pour l analyse Statistique des données. Premiers pas avec SES-Pegase 1

Analyses multivariées avec R Commander (via le package FactoMineR) Qu est ce que R? Introduction à R Qu est ce que R?

Chapitre 1. La démarche statistique appliquée au management. Minicas. Questions :

COMPARAISON DE LOGICIELS TESTANT L INDEPENDANCE DE VARIABLES BINAIRES

Statistique Descriptive Multidimensionnelle. (pour les nuls)

Cours 9 : Plans à plusieurs facteurs

L ANALYSE DU «PARC SOCIAL DE FAIT» PARISIEN EN 2003 : UNE ANALYSE TERRITORIALISÉE DES PROFILS D OCCUPATION DES PARCS ET DES QUARTIERS

BIG DATA : PASSER D UNE ANALYSE DE CORRÉLATION

Aide-mémoire de statistique appliquée à la biologie

Stock-options comparaison et questions pratiques

Analyse en Composantes Principales

Table des matières. L assurance de la copropriété Avant-propos Remerciements Introduction chapitre I

S LICENCE INFORMATIQUE Non Alt S Alt S S1 S2 S3 S4 SS5 S6 Parcours : S IL (Ingénierie Logicielle) SRI (Systèmes et Réseaux Informatiques)

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

CH.6 Propriétés des langages non contextuels

Master Marketing et Pratiques Commerciales parcours Management de la marque et communication Apprentissage Master 2

SYNTHÈSE DOSSIER 1 Introduction à la prospection

Docteur José LABARERE

Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9

Guide d implémentation des ISBN à 13 chiffres

DEVENEZ UN POKER-KILLER AU TEXAS HOLD EM!

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

Options, Futures, Parité call put

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

Analyse des correspondances avec colonne de référence

Stages à l étranger Erasmus

Objets Combinatoires élementaires

Processus aléatoires avec application en finance

ASSURANCE RESPONSABILITE CIVILE MEDICALE QUESTIONNAIRE GENERAL

1 Modélisation d être mauvais payeur

DIOGENE. Un logiciel de Génétique & Amélioration des Plantes

ASR1 TD7 : Un microprocesseur RISC 16 bits

Adopter une attitude adaptée à la situation : Langage et paralangage (notions étudiées dans le chap 1)

Algorithmique I. Algorithmique I p.1/??

Prévoyance des expertsexperts-comptables

COMPTES CONSOLIDES IFRS DU GROUPE CNP ASSURANCES au 31 Décembre 2007

Introduction à la méthodologie de la recherche

I) Le contexte HIGH HOSPITALITY ACADEMY. II) Le programme HIGH HOSPITALITY ACADEMY

L analyse des données par les graphes de similitude

FORMULAIRE DE STATISTIQUES

Relation entre deux variables : estimation de la corrélation linéaire

SAS ENTERPRISE MINER POUR L'ACTUAIRE

Transcription:

Table des matières AVANT-PROPOS L analyse des données... 15 INTRODUCTION CHAPITRE 1 Le vocabulaire de l analyse des données... 23 Godelieve Masuy-Stroobant 1. Variables et unités d observations... 23 1.1. Différents types de variables... 24 1.2. Les unités d observation... 25 2. Où il est question de «relations»... 27 2.1. Qu est-ce qu une cause?... 27 2.2. L effet d interaction... 29 2.3. Qu est-ce qu une variable de confusion?... 35 3. Échantillon et population... 37 4. La logique des tests statistiques et leur usage... 40 4.1. Pourquoi recourir à un test?... 40 4.2. L «Hypothèse nulle» (H0) du statisticien... 42 4.3. Les tests sont-ils infaillibles?... 44 5. Que conclure de tout cela?... 45 6. Pour aller plus loin... 46 ANALYSE UNIVARIÉE CHAPITRE 2 L exploration : évaluer, préparer et décrire... 49 Amandine J. Masuy L aide des proches aux plus âgés... 49 1. Évaluer la qualité des données... 50 2. Préparer les données... 54 2.1. Vérifier et éventuellement modifier le codage des variables... 57 2.2. Identifier et résoudre les problèmes posés par les valeurs extrêmes... 58 2.3. Les variables qualitatives très (trop) détaillées... 59 7

2.4. Les données manquantes... 60 2.5. Le niveau de mesure de la variable ne convient pas... 63 2.6. Les variables disponibles ne correspondent pas aux concepts.. 64 3. Décrire les données... 67 3.1. Fréquences, mesures de position et de dispersion... 69 3.2. Représentations graphiques... 72 4. Pour aller plus loin... 74 ANALYSE BIVARIÉE CHAPITRE 3 Deux variables qualitatives... 77 Godelieve Masuy-Stroobant Le naufrage du Titanic (reprise)... 77 1. Le tableau de contingence... 78 2. Le test du Khi-deux... 81 3. Risques relatifs (RR) et odds ratios (OR)... 86 3.1. Le risque relatif... 86 3.2. Le rapport de cotes ou odds ratio... 89 3.3. Pour interpréter correctement les RR et les OR... 91 3.4. Comparer les RR pour repérer les effets d interaction et de confusion... 91 4. Pour aller plus loin... 93 CHAPITRE 4 Une variable qualitative et une variable quantitative... 95 Lorise Moreau Chômage et sentiment de dévalorisation... 95 1. Le test t de Student... 98 1.1. Sélectionner la sous-population d intérêt et la décrire... 98 1.2. Le test t... 102 1.3. Application du test t... 103 1.4. Conditions d application du test t... 105 2. Le test F de Fisher et l analyse de variance (ANOVA)... 108 2.1. Sélectionner la population d intérêt et la décrire... 108 2.2. Le test F et l analyse de variance ANOVA... 110 2.3. Application du test F... 112 2.4. Conditions d application du test F... 115 3. Pour aller plus loin... 115 8

CHAPITRE 5 Deux variables quantitatives... 117 Rafael Costa Précarité, mortalité et santé des communes belges... 117 1. Le diagramme de dispersion... 120 2. Deux mesures de la relation bivariée entre variables quantitatives... 124 2.1. Le coefficient de corrélation de Bravais-Pearson r... 124 2.2. Le coefficient de détermination R²... 127 2.3. Tester le niveau de signification de r et de R²... 128 3. Résumer l association entre deux variables quantitatives... 129 3.1. La régression simple... 129 3.2. Estimer les coefficients de régression a et b... 130 3.3. Tester le niveau de signification de a et de b... 134 3.4. Un tableau synthétise les résultats d une régression... 134 3.5. Les hypothèses de la régression linéaire... 135 4. À quoi faire attention... 140 4.1. Variables qualitatives... 140 4.2. Que faire en cas d hétéroscédasticité et de non linéarité?... 140 4.3. Association et causalité... 140 5. Pour aller plus loin... 141 ANALYSE MULTIVARIÉE DES INTERDÉPENDANCES CHAPITRE 6 L analyse en composantes principales... 145 Godelieve Masuy-Stroobant Inégalités régionales de mortalité infantile en 1900... 145 Hypothèses et indicateurs... 146 Les composantes principales de la mortalité infantile... 149 1. L analyse en composantes principales ACP... 155 1.1. Le domaine d application d une ACP... 155 1.2. Qu est-ce qu une composante principale?... 157 1.3. Les relations entre variables initiales et composantes... 159 1.4. Le vocabulaire de l ACP... 160 1.5. Le nombre de composantes... 161 1.6. La rotation des axes ou composantes... 163 9

2. Comment réaliser une analyse en composantes principales?... 164 2.1. Les variables initiales... 164 2.2. Combien de composantes retenir?... 165 2.3. Faut-il procéder à une rotation?... 165 2.4. La présentation des résultats... 166 2.5. L interprétation des résultats... 167 3. À quoi faire attention... 167 4. Pour aller plus loin... 168 CHAPITRE 7 L analyse factorielle des correspondances (multiples)... 171 Pierre Baudewyns Les élections de juin 2007 en Wallonie... 171 1. L analyse factorielle des correspondances AFC... 174 1.1. Le domaine d application d une AFC... 175 1.2. Comment sont construits les facteurs d une AFC... 176 1.3. Les résultats d une AFC... 184 1.4. Variables actives et variables illustratives... 191 2. L analyse factorielle des correspondances multiples AFCM... 191 2.1. Le tableau disjonctif et le tableau de contingence de Burt... 191 2.2. Le fonctionnement d une AFCM... 193 2.3. Les résultats d une AFCM... 194 2.4. Variables actives, variables illustratives... 198 3. À quoi faire attention... 198 4. Pour aller plus loin... 199 CHAPITRE 8 L analyse de classification... 201 Rafael Costa La frontière linguistique : une réalité démographique?... 201 1. L analyse de classification... 207 1.1. Qu est-ce qu une analyse de classification?... 207 1.2. Comment réaliser une analyse de classification?... 209 2. En pratique, comment procéder?... 211 2.1. Comment fonctionne la méthode de Ward?... 212 2.2. Le dendrogramme pour représenter la classification hiérarchique... 216 2.3. Combien de groupes retenir?... 217 2.4. Comment tester l homogénéité interne des groupes et leurs différences?... 219 10

2.5. Comment présenter les résultats d une classification?... 220 3. À quoi faire attention... 221 3.1. Vérifier au préalable l existence possible de groupes... 221 3.2. Le choix des variables de l espace de référence est crucial... 222 3.3. La préparation des variables pour la classification... 222 3.4. Limites des méthodes... 223 4. Pour aller plus loin... 224 ANALYSE MULTIVARIÉE DES DÉPENDANCES CHAPITRE 9 La régression linéaire multiple... 227 Bruno Schoumaker L immigration en Europe... 227 Conditions de vie et attitudes face à l immigration en Europe... 228 La région exerce-t-elle un «effet de confusion»?... 231 Les conditions de vie comme «variable intermédiaire»... 235 Que conclure de tout cela?... 237 1. La régression linéaire multiple... 239 1.1. Qu est-ce qu une régression linéaire multiple?... 239 1.2. Objectifs... 240 1.3. Comment réaliser une régression multiple?... 241 2. En pratique, comment procéder?... 243 2.1. Quelles variables indépendantes et comment en interpréter les coefficients?... 243 2.2. Comment tester la signification statistique des variables explicatives?... 244 2.3. Quelles variables retenir dans le modèle?... 245 2.4. Comment comparer les coefficients de régression?... 246 2.5. Que signifie R²? Quelle importance lui donner?... 247 2.6. Comment présenter les résultats de la régression?... 248 3. À quoi faire attention... 248 3.1. La multicolinéarité... 249 3.2. L additivité des effets des variables... 250 3.3. Le principe de parcimonie... 251 4. Pour aller plus loin... 252 CHAPITRE 10 La régression logistique... 253 Ester Rizzi Religion et attitudes envers la sexualité en Italie... 253 11

L importance accordée à la religion influence-t-elle l adhésion aux valeurs traditionnelles?... 254 Le niveau social d origine et la région exercent-ils un «effet de confusion»?... 257 1. Qu est-ce qu une régression logistique?... 261 1.1. La transformation logit... 261 1.2. Les coefficients de régression β et OR... 262 1.3. La signification statistique des coefficients β et des OR... 263 1.4. Et pour évaluer la qualité globale du modèle... 266 1.5. Régression logistique et régression linéaire multiple... 267 2. En pratique, comment procéder?... 269 2.1. La variable dépendante d un modèle logistique... 269 2.2. Les variables indépendantes... 269 2.3. L interprétation des résultats d une régression logistique... 270 2.4. L estimation de la probabilité p et de l odds de p... 273 2.5. La stratégie d analyse... 274 2.6. La présentation des résultats... 274 3. À quoi faire attention... 275 4. Pour aller plus loin... 277 CONCLUSION CHAPITRE 11 Interpréter les résultats... 281 Godelieve Masuy- Stroobant 1. Le contexte théorique de la recherche... 281 2. Tenir compte du déroulement de la recherche... 283 3. La confrontation à la littérature sur le sujet... 285 4. La généralisation des résultats... 286 5. La part de créativité du chercheur... 287 Encadrés 1. Les «degrés de liberté»... 84 2. Échantillon et distribution d échantillonnage... 97 3. La loi Normale... 100 4. Analyses agrégées, analyses individuelles, et inférence écologique fallacieuse... 118 5. Le vocabulaire de l analyse factorielle des correspondances... 176 6. Codage binaire de variables nominales... 233 7. La standardisation ou comment calculer une z-variable... 247 12

Bibliographie... 289 Les auteurs... 295 Index... 297 13