Université d Orléans - Maitrise Econométrie Econométrie des Variables Qualitatives

Documents pareils
Étude de cas Assurance (d après une étude de Philippe Périé, CISIA)

Un exemple de régression logistique sous

Exemple PLS avec SAS

Données longitudinales et modèles de survie

Lire ; Compter ; Tester... avec R

Modèles pour données répétées

Une introduction. Lionel RIOU FRANÇA. Septembre 2008

Exercices M1 SES Ana Fermin ( fermin.perso.math.cnrs.fr/ ) 14 Avril 2015

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Imputation du salaire d ego dans TeO

Surveillance et maintenance prédictive : évaluation de la latence de fautes. Zineb SIMEU-ABAZI Univ. Joseph Fourier, LAG)

TRANSPORT ET LOGISTIQUE :

MODELE A CORRECTION D ERREUR ET APPLICATIONS

Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH

«Cours Statistique et logiciel R»

Mulford C. (1992). The Mother-Baby Assessment(MBA): An Apgar Score for breastfeeding. Journal of Human Lactation, 8(2),

Analyse statistique de données qualitatives et quantitatives en sciences sociales : TP RÉGRESSION LOGISTIQUE (MODÈLES CHAPITRE 1)

Analyse de la variance Comparaison de plusieurs moyennes

(Customer Relationship Management, «Gestion de la Relation Client»)

ESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring

EFFICACITÉ ET INNOCUITÉ D UN MÉDICAMENT CONTRE LA MPOC COMPARATIVEMENT À UN CONTRÔLE

De la mesure à l analyse des risques

Exemples d application

TABLE DES MATIERES. C Exercices complémentaires 42

Introduction à la statistique non paramétrique

AICp. Vincent Vandewalle. To cite this version: HAL Id: inria

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Pratique de l analyse de données SPSS appliqué à l enquête «Identités et Capital social en Wallonie»

Utilisation du Logiciel de statistique SPSS 8.0

Nouveau Barème W.B.F. de points de victoire 4 à 48 donnes

L Econométrie des Données de Panel

Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9

Validation probabiliste d un Système de Prévision d Ensemble

STATISTIQUES. UE Modélisation pour la biologie

1 Modélisation d être mauvais payeur

Analyse discriminante et régression logistique: application au cas de l innovation pour les entreprises du Canton du Tessin

Grégoire de Lassence. Copyright 2006, SAS Institute Inc. All rights reserved.

L olivier Assurances Licence 3 Econométrie Lyon II

Introduction aux Statistiques et à l utilisation du logiciel R

Instructions pour mettre à jour un HFFv2 v1.x.yy v2.0.00

Génération de code binaire pour application multimedia : une approche au vol

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Probabilités III Introduction à l évaluation d options

Analyse de la réinsertion des personnes arrivées en fin de droit de l assurance chômage

Statistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année

DOSSIER DE CANDIDATURE APPLICATION FORM

4 Exemples de problèmes MapReduce incrémentaux

ENSEIGNEMENT ET MONDE PROFESSIONNEL. Illustration d un lien fort au travers d un cours de scoring. Jean-Philippe KIENNER 7 novembre 2013

IBM SPSS Regression 21

1 Définition de la non stationnarité

FIMA, 7 juillet 2005

Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA

Coup de Projecteur sur les Réseaux de Neurones

NON-LINEARITE ET RESEAUX NEURONAUX

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

Modèle GARCH Application à la prévision de la volatilité

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Predictive Analytics For Operational Decisions. Dr. Rado Kotorov

Algebra & Trigonometry High School Level Glossary English / French

Bureau : 238 Tel : dominique.muller@upmf-grenoble.fr

Medication management ability assessment: results from a performance based measure in older outpatients with schizophrenia.

SAS ENTERPRISE MINER POUR L'ACTUAIRE

Cours de méthodes de scoring

Keywords: Probability of catastrophic events, Bivariate extreme value theory, Heavy tailed distributions, ALS methods.

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Solvabilité II Les impacts sur la tarification et l offre produit

DMP1 DSFT des Interfaces DMP des LPS Annexe : complément de spécification sur l impression des documents à remettre au patient

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

Exercices sur SQL server 2000

Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes

Les transactions 1/46. I même en cas de panne logicielle ou matérielle. I Concept de transaction. I Gestion de la concurrence : les solutions

Econométrie et applications

BIG Data et R: opportunités et perspectives

FINANCEMENT DU DEFICIT BUDGETAIRE AU MAROC

A l Aise Web - Liens sponsorisés

Économétrie, causalité et analyse des politiques

Conférence Bales II - Mauritanie. Patrick Le Nôtre. Directeur de la Stratégie - Secteur Finance Solutions risques et Réglementations

Didacticiel - Études de cas. Description de quelques fonctions du logiciel PSPP, comparaison des résultats avec ceux de Tanagra, R et OpenStat.

1.The pronouns me, te, nous, and vous are object pronouns.

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

Modélisation du risque opérationnel Approche Bâle avancée

Lamia Oukid, Ounas Asfari, Fadila Bentayeb, Nadjia Benblidia, Omar Boussaid. 14 Juin 2013

COMPARAISON DE LOGICIELS TESTANT L INDEPENDANCE DE VARIABLES BINAIRES

Proposition commerciale étude de référencement

Tableau récapitulatif de l analyse fréquentielle

CHAMPIONNAT DU MONDE SENIOR EPREUVES DE COUPE DU MONDE ARC A POULIES

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

Assurance maladie en Suisse : les assurances supplémentaires nuisent-elles à la concurrence sur l assurance de base?

Introduction à l économétrie : Spécifications, formes fonctionnelles, hétéroscédasticité et variables instrumentales

Classification non supervisée

Expertis. Étude Stress. Stress. sur le Éléments statistiques. Dr Brigitte Lanusse-Cazalé. Production : Le Laussat.

Actuariat I ACT2121. septième séance. Arthur Charpentier. Automne charpentier.arthur@uqam.ca. http ://freakonometrics.blog.free.

Arbres binaires de décision

L exclusion mutuelle distribuée

Statistique Bayésienne

ENQUETE SUR LA SITUATION DES GRANDES VILLES ET AGGLOMERATIONS EN MATIERE D ASSURANCES DOMMAGES

données en connaissance et en actions?

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

Transcription:

Université d Orléans - Maitrise Econométrie Econométrie des Variables Qualitatives Contrôle Continu Avril 2008 Exercice 1 (13 points) On s intéresse à l e cacité d un type de traitement analgésique employé dans le traitement de patients âgés atteints de névralgie faciale. Pour cela, on dispose d un échantillon de 60 patients pour lesquels les variables suivantes sont renseignées : la variable d intérêt notée y est codée 1 si la douleur persiste suite au traitement (traitement ine cace) et 0 en cas de disparition (traitement e cace), la variable x 1 renseigne sur le type de traitement reçu et a trois modalités (A et B pour deux dosages de traitement di érents et P s il s agit d un placebo). En n les variables x 2, x 3 et x 4 désignent respectivement le sexe (M=masculin, F=féminin), l âge du patient et la durée (en mois) de la présence de la maladie avant le début du traitement. L objectif bien évidemment est de mesurer l impact de la variable x 1 (type de traitement) sur la variable y, les autres variables étant des variables de contrôle. Question 1 (2 points) : On décide de modéliser la probabilité de rémission de la névralgie (y = 0) en fonction des variables explicatives avec la procédure "logistic" de SAS. (i) La variable x 1 étant qualitative, quel choix vous semble le plus adéquat (au vu de l objectif de l étude) pour la modalité de référence en ce qui concerne cette variable. Justi ez votre réponse. (ii) Ecrivez alors le modèle de régression logistique correspondant en fonction des variables explicatives et des paramètres à estimer. Question 2 (2 points) : Ecrivez la log-vraisemblance du modèle associé à un échantillon de T observations. Soit b l estimateur du MV du vecteur de paramètres. Quelles sont les propriétés asympotiques de cet estimateur? Question 3 (5points) : Les résultats de l estimation par maximum de vraisemblance sont présentés en Annexe. Retrouvez les valeurs non reportées marquées xxxx. Question 4 (3 points): Interprétez les résultats obtenus. Quel type de traitement (A, B ou P) vous semble le plus e cace? Question 5 (1 point): Ecrivez le programme SAS utlisé pour générer les résultats de l Annexe. Exercice 2 (7.5 points) Soit z 1 un vecteur de variables explicatives, z 2 une variable continue et d 1 une variable dichotomique. Question 1 (1.5 points): Dans le modèle suivant P (y = 1 jz 1 ; z 2 ) = z 1 1 + 1 z 2 + 2 z2 2 (1) quel est l e et marginal de z 2 sur la probabilité que y = 1? Question 2 (3 points): Dans le modèle suivant P (y = 1 jz 1 ; z 2 ) = (z 1 1 + 1 z 2 + 2 d 1 + 3 z 2 d 1 ) (2) (i) trouvez l e et marginal de z 2 sur la probabilité que y = 1? (ii) trouvez l e et marginal de d 1 sur la probabilité que y = 1?

Contrôle Continu Avril 2008 page 2 On considère une modélisation pour une variable qualitative dichotomique y i : La spéci cation du modèle est la suivante: 1 y i = 0 si y i > 0 sinon (3) y i est une variable latente fonction de deux variables exogènes x 1i et x 2i : La spéci cation retenue est: y i = 1 x 1i + 2 x 2i + " i (4) Les pertubations du modèle sont supposées i:i:d: et suivent une distribution logistique de moyenne nulle et de variance égale à 1. Question 3 (1point) : Donnez l expression du vecteur gradient (G Li ()) pour un individu i, en fonction des exogènes et des paramètres = ( 1 2 ) 0 : Question 4 (2point) : Vous ne disposez que de façon partielle des résultats de l estimation, à savoir b 1 = 3: Mais vous savez néanmoins que pour un individu de l échantillon d étude, x 1i ; x 2i et la première composante de G Li () sont respectivement égales à 1:5; 2 et 1:4938: On suppose que pour cet individu y i = 0. Donnez la valeur estimée du paramètre 2. 2

The LOGISTIC Procedure Model Information Data Set Response Variable WORK.NEURALGIA y Number of Response Levels 2 Model Optimization Technique binary logit Fisher's scoring Number of Observations Read 60 Number of Observations Used 60 Response Profile Ordered Value y Total Frequency 1 0 35 2 1 25 Probability modeled is y='0'. Class Level Information Class Value Design Variables X1 A 1 0 X2 F 1 B 0 1 P -1-1 M -1

Model Convergence Status Convergence criterion (GCONV=1E-8) satisfied. Model Fit Statistics Criterion Intercept Only Intercept and Covariates AIC 83.503 60.736 SC 85.598 73.302-2 Log L 81.503 48.736 Testing Global Null Hypothesis: BETA=0 Test Chi-Square DF Pr > ChiSq Likelihood Ratio 32.7675 5 <.0001 Score 25.6666 5 0.0001 Wald 14.4512 5 xxxx (1) Type 3 Analysis of Effects Effect DF Wald Chi-Square Pr > ChiSq x1 2 12.5310 0.0019 x2 1 5.2946 0.0214 x3 1 7.2977 0.0069 x4 1 0.0315 0.8591

Analysis of Maximum Likelihood Estimates Parameter DF Estimate Standard Error Wald Chi-Square Pr > ChiSq Intercept 1 18.7872 6.9653 7.2752 0.0070 x1 A 1 0.8849 0.5291 2.7969 0.0944 x1 B 1 1.4118 0.6079 5.3933 0.0202 x2 F 1 0.9161 0.3981 5.2946 0.0214 x3 1 xxxx (3) 0.0970 xxxx (2) 0.0069 x4 1 0.00586 0.0330 0.0315 0.8591 Odds Ratio Estimates Effect Point Estimate 95% Wald Confidence Limits x1 A vs P 24.087 3.288 176.481 x1 B vs P 40.794 4.362 381.552 x2 F vs M xxxx (4) 1.312 29.750 x3 0.769 0.636 0.931 x4 1.006 0.943 1.073 Association of Predicted Probabilities and Observed Responses Percent Concordant 90.5 Somers' D 0.810 Percent Discordant 9.5 Gamma 0.810 Percent Tied 0.0 Tau-a 0.401 Pairs 875 c 0.905