Analyse des données: Conformité imparfaite



Documents pareils
Chapitre 3 : INFERENCE

Etude sur l équipement des TPE / PME. en complémentaire santé

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

Évaluations aléatoires : Comment tirer au sort?

La présente note a pour but de présenter aux praticiens un aperçu des différents outils. NOTE 6 : Choisir une méthode d évaluation d impact appropriée

PROGRAMME (Susceptible de modifications)

Assurance maladie publique et «Opting out» - Réflexions théoriques

A quels élèves profite l approche par les compétences de base? Etude de cas à Djibouti

Veuillez noter que les questions des sondages en ligne s inspirent des questions posées aux groupes de discussion.

L ANALYSE COUT-EFFICACITE

MODÈLE CROP DE CALIBRATION DES PANELS WEB

Études épidémiologiques analytiques et biais

LIVRE BLANC AMÉLIOREZ VOS PERFORMANCES MARKETING ET COMMERCIALES GRÂCE À UNE GESTION DE LEADS OPTIMISÉE

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie

Réussir l ouverture d un commerce de restauration rapide

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

Représentation des Nombres

CONFIANCE DANS L INDUSTRIE AGRO-

L interchange. Ce que c est. Comment ça fonctionne. Et pourquoi c est fondamental pour le système des paiements Visa.

Théorie des sondages : cours 5

d évaluation Objectifs Processus d élaboration

FOTO - L OMNIBUS MENSUEL DE CROP LE NOUVEAU CROP-EXPRESS

Retraite. Date de la retraite

ballester~consulting Etude MD Expo 2007 L'utilisation du marketing direct multicanal État des lieux et tendances

Données de catalogage avant publication (Éducation, Citoyenneté et Jeunesse Manitoba) ISBN

Impact du mobile banking sur les comportements d épargne et de transferts à Madagascar. Florence Arestoff Baptiste Venet

Déclaration de sinistre

Identifier et comprendre vos clients

Probabilités. Rappel : trois exemples. Exemple 2 : On dispose d un dé truqué. On sait que : p(1) = p(2) =1/6 ; p(3) = 1/3 p(4) = p(5) =1/12

Carte Rémunération FAQ (Foire Aux Questions)

Item 169 : Évaluation thérapeutique et niveau de preuve

Estimation et tests statistiques, TD 5. Solutions

CONCEPTION ET TIRAGE DE L ÉCHANTILLON

Centre d Analyse Stratégique

Collecter des informations statistiques

Chapitre 2/ La fonction de consommation et la fonction d épargne

LA SÉCURITÉ DE VOTRE ÉDIFICE S APPUIE DÉSORMAIS SUR UNE DORSALE RENFORCÉE

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

POINTS DE VUE DES CANADIENS SUR LA COUVERTURE DES MÉDICAMENTS D ORDONNANCE

Sondage Politique provinciale Campagne électorale Rapport étude quantitative. 15 mars 2014

Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction.

Carte Activity FAQ (Foire aux Questions)

Une nouvelle enquête montre un lien entre l utilisation du Cloud Computing et une agilité accrue de l entreprise ainsi qu un avantage concurentiel.

Les devoirs en Première STMG

MATHÉMATIQUES. Mat-4104

TROPHEE RSE DE LA PROFESSION COMPTABLE 2014 CATEGORIE MEILLEURE DEMARCHE RSE

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

Un régime d assurance? Si oui, lequel?

QU EST-CE QUE LE SAAS?

Questionnaire de vérification pour l implantation de la norme ISO dans une entreprise

Recrutement d enseignants du second degré. Que vaut-il mieux présenter : CAFEP (Privé) ou CAPES (Public)?

Réponse de la Fédération Française des Télécoms au questionnaire de la DGCCRF «Tranches de Numéros»

Enquête 2014 «Digital et R.O.I» «Digital et R.O.I» Enquête FNIM - Doctors 2.0 & You

QU EST-CE QUE LE SAAS?

Chapitre 1 : Notions. Partie 9 - Rente viagère. Qu est-ce q u u n e «r e n t e v i a g è r e»?

TD1 Signaux, énergie et puissance, signaux aléatoires

Questionnaire à destination des élèves 4 e -2 de à remplir avant ou après la visite aux Archives

Calcul élémentaire des probabilités

Sommaire. Rentabilité du retour d une franchise de baseball de la Ligue majeure de baseball à Montréal (les «Expos»)

RENCONTRE TRIPARTITE DU 18 FEVRIER 2009 : 30 MESURES URGENTES POUR FAIRE FACE A LA CRISE

La méthode de régression par discontinuité et l évaluation des politiques de l emploi

Questions générales sur le stationnement

Un moyen simple d'être plus favorable aux familles Les points les plus importants du Family Score en un coup d'œil

9.1- Sur les réseaux sociaux, j ai toujours le choix!

LA MONDIALISATION EST-ELLE UN FACTEUR DE PAIX?

Sondage Politique provinciale Campagne électorale Grand sondage régional. Étude quantitative. 25 mars 2014

Chapitre 1. La démarche statistique appliquée au management. Minicas. Questions :

VI. Tests non paramétriques sur un échantillon

FORMULAIRE DE STATISTIQUES

CREER UNE ENTREPRISE A JERSEY

Cour. des droits QUESTIONS FRA?

Rapport d évaluation de la licence professionnelle

VoIP, Mobile Office & M2M Equipements et projets d équipements

Bien comprendre et bien choisir votre complémentaire santé

Enquête CTIP/CREDOC. 22 février 2008 L OPINION DES SALARIÉS ET DES EMPLOYEURS SUR LA COMPLÉMENTAIRE SANTÉ ET LES RÉFORMES DE L ASSURANCE MALADIE

Le niveau de revenus des ménages est associé à la couverture vaccinale par le vaccin pneumocoque conjugué chez les enfants d'ile-de-france

ENQUETE ACCES AUX SOINS

Le Programme international pour le suivi des acquis des élèves (PISA)

Complément d information concernant la fiche de concordance

ETUDE FUSACQ / Octobre 2011 LE PROFIL DES REPRENEURS D ENTREPRISE

LES FRANÇAIS ET LA COMPLEMENTAIRE SANTE

Document de Consultation des Entreprises Préfecture de Corse

Evaluer l ampleur des économies d agglomération

FD/YMC N Contacts IFOP : Frédéric Dabi / Yves-Marie Cann POUR

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

L AUTO-ÉVALUATION HAP : KIT METHODOLOGIQUE PARTIE 2 : OUTILS D AUTO-ÉVALUATION

Construire un tableau de bord par Marc Maisonneuve

SONDAGES RELATIFS AUX SERVICES D INFORMATION ET DE RÉFÉRENCE OFFERTS PAR LA DIRECTION GÉNÉRALE DE LA DIFFUSION DE BANQ

En direct de la salle de presse du Journal virtuel

Programme d assurance de la qualité

Ministère de la Santé et des Soins de longue durée

«ad4max FAQ» 2014 Page 1. FAQ ad4max GEO. publicitas.ch. publicitas.ch/ad4maxgeo

Étude sur la compétitivité des administrations cantonales

Ry Moran Directeur de la consignation des déclarations de la CVR, responsable du Centre national de recherches

SOCIAL CRM: DE LA PAROLE À L ACTION

Exercices supplémentaires sur l introduction générale à la notion de probabilité

Gestion obligataire passive

Concept totale. parfaitement compatibles permettant de jeter un «nouveau regard sur le marketing & les ventes».

Transcription:

Analyse des données: Conformité imparfaite Marc Gurgand Paris School of Economics gurgand@pse.ens.fr

Jusqu ici tout va bien Vous avez affecté aléatoirement votre population dans 2 groupes, test et contrôle Au groupe test, vous proposez la vaccination l accompagnement dans la recherche d emploi etc. Au groupe de contrôle, vous ne proposez rien (de particulier)

Que se faire si des individus ne se conforment pas à leur affectation aléatoire? «Conformité imparfaite»

Problème 1 Certains individus dans le groupe test ne reçoivent pas de traitement Campagne de vaccination : certains écoliers du groupe test, n ont pas reçu le traitement : pourquoi? Accompagnement : certains chômeurs n ont pas souhaité bénéficier d un accompagnement : pourquoi?

Problème 2 Certains individus dans le groupe de contrôle bénéficient quand même du traitement Campagne de vaccination : certains enfants du groupe test sont vaccinés quand même: pourquoi? Taille des classes : certains enfants destinés à une grande classe rejoignent une petite classe: pourquoi?

Idée? Tant pis: Comparons les traités du groupe test et les non-traités du groupe témoin Bonne idée?

Quelles sont les populations comparables? Groupe test: vaccination proposée Groupe de contrôle Acceptent : TRAITES Refusent : NON-TRAITES NON-TRAITES

Différence de résultat entre les deux groupes aléatoires? Groupe test Groupe de contrôle 1: traité pas malade 2: traité pas malade 3: traité malade 5: non-traité malade 6: non-traité pas malade 7: non-traité malade 8: non-traité malade 4: non-traité malade

Intention de traiter (intention to treat - ITT) Groupe test: Groupe de contrôle: 50% malades 75% malades Y(T)= résultat moyen dans la population test Y(C)= résultat moyen dans la population de contrôle ITT = Y(T) - Y(C) Différence entre les enfants qu on voulait traiter et ceux qu on ne voulait pas traiter

Intention de traiter (intention to treat - ITT) ITT = 50% - 75% = -25 points Cette différence est-elle l effet causal de l intervention?

Accompagnement Groupe test 100 personnes Groupe de contrôle 50 personnes 75 traités: 50 non-traités: 50 trouvent un emploi 25 ne trouvent pas d emploi 30 trouvent un emploi 20 ne trouvent pas d emploi 25 non-traités: 19 trouvent un emploi 6 ne trouvent pas d emploi

ITT dans l exemple de l accompagnement 100 personnes dans le test 50+19=69 trouvent un emploi Y(T)= taux d emploi dans le test = 69% 50 personnes dans le témoin 30 retrouvent un emploi Y(C)= taux d emploi dans le témoin = 60% ITT = Y(T) - Y(C) = 69% - 60% = 9 points

ITT: vaccination, accompagnement ITT répond à la question: on a mis en place le programme, qu est-il arrivé à la population cible dans son ensemble? Question intéressante pour le décideur public? Quels sont les deux sources d efficacité du programme? ITT permet-il de les distinguer?

Comment interpréter ITT dans ce cas là? Groupe test: vaccination proposée Acceptent : TRAITES Groupe de contrôle Obtiennent quand même le traitement: TRAITES Refusent : NON-TRAITES NON-TRAITES

Intérêt de ITT pour: Politique d accompagnement des chômeurs? Taille des classes? Contact téléphonique pour inciter à voter? Distribution de manuels scolaires?

En cas de conformité imparfaite, peut-on quand même estimer l effet du traitement sur les traités? (l effet du vaccin sur les enfants vaccinés)

La vaccination a-t-elle changé quelque chose? Groupe test 1: traité pas malade 2: traité pas malade 3: traité malade Groupe de contrôle 5: non-traité malade 6: non-traité malade 7: non-traité pas malade 8: non-traité pas malade 4: non-traité malade

La vaccination a-t-elle changé quelque chose? Groupe test: Groupe témoin: Groupe test: Groupe témoin: 50% malades 50% malades ¾ vaccinés 0 vaccinés Que peut-on penser de l efficacité du vaccin?

Le bénéfice du vaccin a-t-il changé quelque chose? Groupe test 1: traité pas malade 2: traité pas malade Groupe de contrôle 5: non-traité malade 6: non-traité pas malade 7: non-traité malade 8: non-traité malade 3: non-traité malade 4: non-traité malade

Le traitement a-t-il changé quelque chose? Groupe test: Groupe témoin: Groupe test: Groupe témoin: 50% malades 75% malades 1/2 vaccinés 0 vaccinés On fait passer la proba de maladie de 25 points en vaccinant seulement une personne sur deux De combien faut-il que la proba de maladie ait baissé pour chaque personne vaccinée?

Traitement sur les traités (TT) Effet global, ITT = Y(T) - Y(C) divisé par la proportion de ceux qui ont pris le traitement: TT = [Y(T)-Y(C)]/proportion(traités) TT = -0.25 / 0.5 = -0.50 L effet moyen du vaccin est de faire baisser la proba de maladie de 0.75 à 0.75-0.5=0.25

A l envers: on sait que l accompagnement multiplie par 2 la proba d emploi Groupe test 100 personnes Groupe de contrôle 50 personnes 50 traités: 50 non-traités:? trouvent un emploi? ne trouvent pas d emploi 10 trouvent un emploi 40 ne trouvent pas d emploi 50 non-traités: 10 trouvent un emploi 40 ne trouvent pas d emploi

Calculer l effet du traitement sur les traités (TT) Groupe test 100 personnes Groupe de contrôle 50 personnes 50 traités: 50 non-traités: 20 trouvent un emploi 30 ne trouvent pas d emploi 10 trouvent un emploi 50 ne trouvent pas d emploi 50 non-traités: 10 trouvent un emploi 50 ne trouvent pas d emploi

Traitement sur les traités (TT) ITT = Y(T) - Y(C) = 0.3 0.2 = 0.1 Proportion de traités = 0.5 TT = [Y(T)-Y(C)]/proportion(traités) = 0.1/0.5 = 0.2 L effet moyen de l accompagnement est de faire passer la proba d emploi de 0.2 à 0.2+0.2=0.4, soit doubler On augmente de 50% le taux d emploi en traitant 1 personne sur 2: il faut donc que le traitement augmente la proba d emploi de 100% (=x2)

Calculer l effet du traitement sur les traités (TT) Groupe test 100 personnes Groupe de contrôle 50 personnes 20 traités: 50 non-traités: 14 trouvent un emploi 6 ne trouvent pas d emploi 10 trouvent un emploi 50 ne trouvent pas d emploi 80 non-traités: 16 trouvent un emploi 64 ne trouvent pas d emploi

Traitement sur les traités (TT) ITT = Y(T) - Y(C) = 0.3 0.2 = 0.1 Proportion de traités = 0.2 TT = [Y(T)-Y(C)]/proportion(traités) = 0.1/0.2 = 0.5 On a le même ITT qu avant (+0.1) Mais avec 20% de traités au lieu de 50% dans l exemple précédent Donc l effet du traitement doit être beaucoup plus fort

Un peu d algèbre t0 : taux d emploi de référence (sans traitement) t1 : taux d emploi grâce au traitement t1 t0 : effet du traitement (TT) Y(C) Y(T) = t0 = prop(non-traités) x t0 + prop(traités) x t1 = [1 - prop(traités)] x t0 + prop(traités) x t1 ITT = Y(T) - Y(C) = [1 - prop(traités)] x t0 + prop(traités) x t1 - t0 = prop(traités) x [t1 t0] TT = t1 t0 =[Y(T)-Y(C)]/prop(traités)

Plus compliqué Groupe test: vaccination proposée 1: traité pas malade 2: traité pas malade 3: traité malade Groupe de contrôle 5: traité pas malade 4: non-traité malade 6: non-traité malade 7: non-traité malade 8: non-traité malade

D où vient la différence d ITT? Groupe test: Groupe témoin: 50% malades 75% malades ITT = -0.25 Groupe test: Groupe témoin: 3/4 vaccinés 1/4 vaccinés ITT est vient de ce qu on a vacciné plus de gens dans le test. La différence de proportion vaccinée est ¾ - ¼ = ½

D où vient la différence d ITT? ITT = -0.25 Différence de proportion vaccinée = ½ ITT est obtenue en vaccinant 50% des gens en plus (¾ - ¼ ) L effet sur chaque vacciné doit être -0.50 (= -0.25 x 2)

Traitement sur les traités (TT) quand la non-conformité est partout ITT = Y(T) - Y(C) divisé par la différence de proportion de ceux qui ont pris le traitement: TT = [Y(T)-Y(C)] prop(traités dans T) - prop(traités dans C)

Un peu d algèbre?

Remarque [Y(T)-Y(C)] prop(traités dans T) - prop(traités dans C) On peut se passer des données individuelles: il suffit de savoir estimer ITT et la différence des proportions, séparément s il le faut Evidemment, il faut observer la proportion de traités effectifs dans chaque population

Calculer l effet du traitement sur les traités (TT) Groupe test 100 personnes Groupe de contrôle 50 personnes 50 traités: 5 traités: 20 trouvent un emploi 30 ne trouvent pas d emploi 2 trouvent un emploi 3 ne trouvent pas d emploi 50 non-traités: 45 non-traités: 10 trouvent un emploi 50 ne trouvent pas d emploi 8 trouvent un emploi 37 ne trouvent pas d emploi

Complément: que pensez-vous des non-traités du groupe test? Groupe test 100 personnes Groupe de contrôle 50 personnes 70 traités: 50 non-traités: 20 trouvent un emploi 30 ne trouvent pas d emploi 10 trouvent un emploi 50 ne trouvent pas d emploi 30 non-traités: 15 trouvent un emploi 15 ne trouvent pas d emploi

Comment présenter les résultats pour qu ils soient instructifs pour les lecteurs?

Plusieurs résultats La probabilité de trouver un résultat significatif augmente lorsqu on s intéresse à plusieurs résultats. Présenter les résultats sur tous les estimateurs mesurés, même les non significatifs.

Effets hétérogènes du traitement Data mining vs. Implications de politique publique Présenter les résultats de tous les groupes

Données Groupées Un choc autre que le traitement peut affecter le groupe Besoin d ajuster les écarts-type pour les groupes Ce n est pas optimal si le nombre de groupes est petit. Méthode lorsque le nombre de groupes est petit : conduire des tests de falsification. On peut générer un placebo et vérifier si un effet de magnitude similaire est présent avec une probabilité de 5% ou 10 %.

Variables de Contrôle Que contrôler? Si l échantillonnage aléatoire est stratifié : rajouter des effets fixes par strates. D autres Covariances: Peut améliorer la précision Il faut faire attention à exclure toute variable qui pourrait être affectée par le traitement Règle: Présenter les résultats originaux et les résultats des régressions ajustées (pondérées).