Corrigé de l exercice 8

Documents pareils
Analyse statistique de données qualitatives et quantitatives en sciences sociales : TP RÉGRESSION LOGISTIQUE (MODÈLES CHAPITRE 1)

Données longitudinales et modèles de survie

TRANSPORT ET LOGISTIQUE :

Une variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants)

IBM SPSS Regression 21

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1

Pratique de l analyse de données SPSS appliqué à l enquête «Identités et Capital social en Wallonie»

Introduction à la Statistique Inférentielle

«Cours Statistique et logiciel R»

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

Principe d un test statistique

LE ROLE DES INCITATIONS MONETAIRES DANS LA DEMANDE DE SOINS : UNE EVALUATION EMPIRIQUE.

Étude de cas Assurance (d après une étude de Philippe Périé, CISIA)

Relation entre deux variables : estimation de la corrélation linéaire

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

LES OUTILS D ALIMENTATION DU REFERENTIEL DE DB-MAIN

Localisation des fonctions

Annexe commune aux séries ES, L et S : boîtes et quantiles

Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 06/12/2009 Stéphane Tufféry - Data Mining -

TP1 Méthodes de Monte Carlo et techniques de réduction de variance, application au pricing d options

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Résultats d Etude. L étude de marché. Résultats d Etude N 1889 : Conciergerie privée. Testez la fiabilité de votre projet.

Statistique : Résumé de cours et méthodes

Simulation de variables aléatoires

Grammaires d unification

Fiche d utilisation du logiciel. 1 - Installation. J. Thioulouse & D. Chessel

PROBABILITES ET STATISTIQUE I&II

SUIVI MÉDICAL DU DIABÈTE CHEZ LES ASSURÉS DE LA MGEN

L olivier Assurances Licence 3 Econométrie Lyon II

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

1 Objectifs. Traitement statistique des données d enquête avec introduction à SPSS. Plan

Exo7. Probabilité conditionnelle. Exercices : Martine Quinio

Chapitre 0 Introduction à la cinématique

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #16

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Chapitre 1 : Évolution COURS

évaluations avec date de calcul à compter du 31 décembre 2014 (mais au plus tard le 30 décembre 2015).

LISTE D EXERCICES 2 (à la maison)

Logiciel XLSTAT version rue Damrémont PARIS

COMMISSION DES NORMES COMPTABLES. Avis CNC Calcul des critères de l article 15 C.Soc.

Chapitre 6. Fonction réelle d une variable réelle

Estimation et tests statistiques, TD 5. Solutions

enquête pour les fautes sur le fond, ce qui est graves pour une encyclopédie.

Les indices à surplus constant

Fiche d animation n 1 : Pêle-mêle

Utilisation des tableaux sémantiques dans les logiques de description

Exercices M1 SES Ana Fermin ( fermin.perso.math.cnrs.fr/ ) 14 Avril 2015

Processus aléatoires avec application en finance

Aide - mémoire gnuplot 4.0

I- Définitions des signaux.

MODELES DE DUREE DE VIE

1 Modélisation d être mauvais payeur

Gestion mémoire et Représentation intermédiaire

MEMOIRES MAGNETIQUES A DISQUES RIGIDES

ANTISELECTION ET CHOIX D'ASSURANCE : LE CAS DU VOL EN HABITATION UNE APPROCHE DE LA MESURE DU PHENOMENE

La Lettre de l IMSEPP

L allocataire dans un couple : l homme ou la femme?

QUELS ÉCRANS UTILISENT LES ANS ET POUR QUELS USAGES?

Analyse des correspondances avec colonne de référence

Gestion de Portefeuille. Mesures de Performance Ajustées du Risque

Examen optimisation Centrale Marseille (2008) et SupGalilee (2008)

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

données en connaissance et en actions?

FORMULAIRE DE STATISTIQUES

Les Français et l assurance

CAC, DAX ou DJ : lequel choisir?

CCP PSI Mathématiques 1 : un corrigé

Chapitre 3 : Le budget des ventes. Marie Gies - Contrôle de gestion et gestion prévisionnelle - Chapitre 3

PRINCIPES DE LA CONSOLIDATION. CHAPITRE 4 : Méthodes de consolidation. Maître de conférences en Sciences de Gestion Diplômé d expertise comptable

Feuille d exercices 2 : Espaces probabilisés

Emploi et Formation Secteur Publicité

Guide abrégé d IBM SPSS Statistics 21

Chapitre 5. Le ressort. F ext. F ressort

BAROMÈTRE DE L ÉCONOMIE NUMÉRIQUE

Rapport de Russell sur la gestion active

Analyses approfondies

L EQUIPE ÉTUDES ENQUÊTES: Georgeta BOARESCU psychologue coordonateur études enquêtes Florin CIOTEA sociologue

COMMISSION DE L ÉQUITÉ SALARIALE

Monitoring d un Datacenter du concept à la réalisation

Introduction à la programmation orientée objet, illustrée par le langage C++ Patrick Cégielski

FONCTION DE DEMANDE : REVENU ET PRIX

Développements limités, équivalents et calculs de limites

Fluctuation d une fréquence selon les échantillons - Probabilités

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

Fonctions homographiques

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

Niveau d assurance de stérilité (NAS) Hôpital Neuchâtelois Sylvie Schneider Novembre 2007

CONSTRUCTION DE COTE :


Transcription:

Corrigé de l exercice 8 Statistique II SP08 Enseignant: Jean-François Bickel 1

Contenu de l exercice Sur la base du fichier de données SHP_Ex8.sav, l exercice consiste en l analyse, au moyen d une régression logistique, de la variable nommée assoc «est membre d une association» en fonction des deux variables indépendantes sexe et éducation La variable assoc est codée avec 1=oui (est membre) et 0 =non (n est pas membre) Comme toujours, l accent est mis sur l interprétation des résultats produits par SPSS et les conclusions substantielles que l on peut en déduire 2

La variable sexe étant catégorielle, on la recode en variable dummy 1) Procédure via l interface graphique de SPSS 3

4

5

6

7

8

9

2) Procédure via la syntaxe recode sex (1=0) (2=1) into femmes. exe. 10

Puis on procède à l analyse de régression 1) Procédure via l interface graphique de SPSS 11

12

13

14

15

2) Procédure via la syntaxe logistic regression assoc /method=enter age05 /method=enter femmes /print=ci(95). 16

Etape 1 Sexe Etape 1 Récapitulatif du modèle -2log-vrais R-deux de R-deux de emblance Cox & Snell Nagelkerke 8851.217 a.007.010 a. L'estimation a été interrompue au numéro d'itération 3 parce que les estimations de paramètres ont changé de moins de.001. Tests de spécification du modèle Différence d avec le modèle vide Etape 1 Etape Bloc Modèle Khi-deux ddl Signif. 46.702 1.000 46.702 1.000 46.702 1.000 17

Interprétation La valeur dite du «moins 2 log vraisemblance» (en anglais -2 log likelihood, parfois abrégé -2LL) peut être conçue comme une mesure de l écart entre les valeurs de Y calculées à partir du modèle et les valeurs de Y telles qu observées Ce qui importe n est pas la valeur en soi de cette mesure mais la différence de valeurs entre deux modèles 18

Pour savoir si cette différence est significative, on procède à un test du khi2, avec un degré de liberté égale à la différence du nombre de paramètres entre les deux modèles ainsi comparés 19

Ici, le modèle de l étape 1 avec le sexe comme unique variable indépendante est comparé au modèle vide (=sans variable indépendante) La valeur du «moins 2 log vraisemblance» pour le modèle de l étape 1 est de 8851.217 La différence de cette valeur avec celle calculée pour le modèle vide est de 46.702 20

La significativité de cette différence fait l objet d un test du khi2, avec un degré de liberté correspondant à l unique paramètre supplémentaire (la variable indépendante sexe ou plus précisément son coefficient) que comprend le modèle de l étape 1 par rapport au modèle vide Le résultat du test indique une différence significative (p<.001) 21

On en conclut que le modèle comprenant la variable indépendante sexe permet de mieux se rapprocher des valeurs de Y observées que le modèle vide Traduction: le fait d être membre ou non d une association varie en fonction du sexe de l individu 22

Etape 1 a femmes Constante a. Variable(s) entrées à l'étape 1 : femmes. Variables dans l'équation B E.S. Wald ddl Signif. Exp(B) Inférieur Supérieur -.344.051 46.479 1.000.709.642.782.334.038 78.106 1.000 1.397 IC pour Exp(B) 95.0% 23

Interprétation Les femmes ont un odds d être membre d une association 0.71 fois plus petit que le odds des hommes (=catégorie de référence), ce dernier odds ayant par définition une valeur de 1 De manière équivalente, on peut dire que les femmes ont une probabilité relative ou une propension 0.71 fois inférieure à celle des hommes d être membre d une association 24

On peut également exprimer cet écart en %: dans ce cas on dira que la propension des femmes d être membre d une association est (0.71-1) x 100 = 29% plus faible que celle des hommes Cet écart est très significatif: p<.001; l intervalle de confiance pour l exponentielle du coefficient du sexe ne comprend pas la valeur 1 On peut donc conclure que l adhésion aux associations est plus faible chez les femmes 25

Etape 1 Age Etape 1 Récapitulatif du modèle -2log-vrais R-deux de R-deux de emblance Cox & Snell Nagelkerke 8851.217 a.007.010 a. L'estimation a été interrompue au numéro d'itération 3 parce que les estimations de paramètres ont changé de moins de.001. Etape 2 Sexe+Education Etape 1 Récapitulatif du modèle -2log-vrais R-deux de R-deux de emblance Cox & Snell Nagelkerke 8835.121 a.010.013 a. L'estimation a été interrompue au numéro d'itération 3 parce que les estimations de paramètres ont changé de moins de.001. Différence Etape2 Etape1 (8851.217-8835.121=16.095) Etape 1 Tests de spécification du modèle Khi-deux ddl Signif. Etape 16.095 1.000 Bloc 16.095 1.000 Modèle 62.798 2.000 26

Interprétation La valeur du «moins 2 log vraisemblance» pour le modèle de l étape 2 (avec éducation) est de 8835.121 Pour rappel, cette valeur pour le modèle de l étape 1 (sans éducation) était de 8851.217 La différence entre ces deux valeurs est donc de 16.095 27

Pour déterminer si cette différence est significative, il est procédé à un test du khi2, avec 1 degré de liberté correspondant à l unique variable indépendante introduite entre les 2 étapes, qui est l éducation (ou plus précisément son paramètre, estimé par le coefficient de régression) Le résultat du test est positif (p<.001) 28

On en conclut que le modèle comprenant les variables sexe et éducation permet de mieux se rapprocher des valeurs de Y observées que le modèle comprenant uniquement le sexe comme variable indépendante Traduction: le fait d être membre ou non d une association varie (également) en fonction du niveau d éducation de l individu 29

Etape 1 a femmes EDUCAT05 Constante a. Variable(s) entrées à l'étape 1 : EDUCAT05. Variables dans l'équation B E.S. Wald ddl Signif. Exp(B) Inférieur Supérieur -.312.051 37.009 1.000.732.662.810.035.009 16.053 1.000 1.035 1.018 1.053.140.061 5.183 1.023 1.150 IC pour Exp(B) 95.0% 30

Interprétation Pour chaque niveau d éducation supplémentaire, le odds d être membre d une association est 1.04 fois plus grand (ou augmente de 1.04) De manière équivalente, on peut dire que la probabilité relative (ou propension) d être membre une association est 1.04 fois plus forte quand le niveau d éducation croît d une unité 31

On peut également exprimer cet écart en %: pour chaque niveau d éducation additionnel, le odds (ou probabilité relative ou propension) d être membre d une association s accroît de (1.04-1) x 100 = 4% Cet écart est significatif: p<.001; l intervalle de confiance pour l exponentielle du coefficient de l éducation ne comprend pas le 1 On peut donc conclure que l adhésion aux associations augmente avec l éducation 32

Nota Bene Dans le cas d une variable indépendante de type quantitatif (comme ici l éducation), il peut être intéressant de ne pas (seulement) considérer les écarts de la variable dépendante en fonction de la variation d une unité de la variable indépendante (ce que l on a fait ici) On peut ainsi considérer les écarts de Y en fonction d une variation de 5, 10, etc. unités de la variable indépendante 33

Pour cela, il faut multiplier la valeur du coefficient de régression par le nombre d unité que l on souhaite considérer, puis élever le résultat à l exponentielle Ainsi par exemple, l odds (ou probabilité relative ou propension) d être membre d une association est exp[.035 x 5] = 1.19 fois plus fort lorsque le niveau d éducation augmente de 5 unités Ou encore, cette fois exprimé en %, est (1.19-1) x 100 = 19% plus élevé 34