Internet est-il l avenir des enquêtes Génération?

Documents pareils
Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

Mémoire d actuariat - promotion complexité et limites du modèle actuariel, le rôle majeur des comportements humains.

EVALUATION DE LA QUALITE DES SONDAGES EN LIGNE : CAS D UN SONDAGE D OPINION AU BURKINA FASO

Lois de probabilité. Anita Burgun

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

Impact du mobile banking sur les comportements d épargne et de transferts à Madagascar. Florence Arestoff Baptiste Venet

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

Marketing comportemental. Guide méthodologique de mise en œuvre

En 2014, comment mener à bien une enquête aléatoire en population générale par téléphone?

Audit du CESP Etude ONE 2011 (Echantillon principal)

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Voulez-vous mieux connaître vos clients et savoir ce qu ils pensent de vous?

ENQUÊTE DE SATISFACTION

Notoriété et perception de l IAE

L évaluation de la performance de la communication media

Regards de Français sur les objets connectés dans le domaine de l assurance

Regards croisés sur l auto-entrepreunariat

METHODOLOGIE GENERALE DE LA RECHERCHE EPIDEMIOLOGIQUE : LES ENQUETES EPIDEMIOLOGIQUES

Pilotage de la masse salariale Déploiement de l outil de budgétisation

23. Interprétation clinique des mesures de l effet traitement

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

ENSEIGNEMENT DES SCIENCES ET DE LA TECHNOLOGIE A L ECOLE PRIMAIRE : QUELLE DEMARCHE?

LES EUROPEENS ET LA QUALITE DE VIE

A LA RENCONTRE DES EVERYNAUTES

catégorie - développement rh

Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION

Principe d un test statistique

Exercices supplémentaires sur l introduction générale à la notion de probabilité

SYMPOSIA 11. Thursday, September 12 th. Room : Salle des conférences à 15h00

LimeSurvey. Pour obtenir un compte sur le LimeSurvey de l Université de Genève, remplissez le formulaire de demande en ligne.

CONCEPTION ET TIRAGE DE L ÉCHANTILLON

FOTO - L OMNIBUS MENSUEL DE CROP LE NOUVEAU CROP-EXPRESS

La nouvelle planification de l échantillonnage

Demande d admission au Centre pédagogique Lucien-Guilbault Secteur primaire

L évolution des modes de communication, comment adapter les enquêtes en population générale? L expérience de l enquête KABP VIH/sida 2010

L image de la presse professionnelle auprès des actifs de catégories moyennes et supérieures

Approche modèle pour l estimation en présence de non-réponse non-ignorable en sondage

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

Théorie des sondages : cours 5

Chapitre IV. La certification des comptes

Évaluations aléatoires : Comment tirer au sort?

Surabondance d information

Introduction à la méthodologie de la recherche

L Enseignement religieux au Luxembourg. Sondage TNS-ILRES Juillet 08 N 11

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

Associations Dossiers pratiques

Santé des TPE face à la crise

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

CONFÉRENCE DE PRESSE

Annexe commune aux séries ES, L et S : boîtes et quantiles

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

STA108 Enquêtes et sondages. Sondages àplusieurs degrés et par grappes

Baromètre ANAé de la communication événementielle. OpinionWay, 15 place de la République, Paris. Tél :

Audit du CESP Etude ONE Juillet juin 2014

Observatoire Gleeden de l infidélité

Les projets d investissement en PME

Agrégation de liens xdsl sur un réseau radio


Convergence Grand public professionnelle

Thématique : Insertion Professionnelle LES DIFFERENTS PARCOURS OFFERTS PAR L EDUCATION NATIONALE PROCURENT-ILS LES MEMES CHANCES D ACCEDER A L EMPLOI?

Guide Représentante.

7. LA VIE DU CONTRAT, LE TRAITEMENT DES INCIDENTS ET LE SURENDETTEMENT

Why Software Projects Escalate: The Importance of Project Management Constructs

L3 Psychologie «Ergonomie : travail, innovations et formation» Les enjeux et éléments historiques. Principaux concepts et théories sous-jacentes

Norme comptable internationale 19 Avantages du personnel

L analyse de la gestion de la clientèle

Activités. Boîte à idées pour remplir la fiche de poste * Direction. Animation d équipe et organisation du travail. Conduite de projets

RHesilience. Découvrez comment mieux piloter le changement par la résilience

Les Français et les soins palliatifs. Janvier 2011

repères pour agir et mettre en place un projet de consolidation des compétences de Base des Apprentis

pour Une étude LES DÉFIS DES DSI Avril 2013

Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux

L ORSA : quelles conséquences sur le pilotage stratégique de l entreprise?

Les Français, le Made in France et le fait main

Les Français ais et l assurance l

La mise en commun. (D après Michel Barlow, Le travail en groupes des élèves, Paris, A. Colin, 1993, pp )

Norme internationale d information financière 1 Première application des Normes internationales d information financière

Comment optimiser l utilisation des ressources Cloud et de virtualisation, aujourd hui et demain?

Probabilités conditionnelles Exercices corrigés

Chapitre 3. Les distributions à deux variables

Travail collaboratif. Glossaire

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

Les méthodes économétriques d évaluation

Le 360 T&I Evaluations

"La santé des étudiants en 2015"

Chapitre 3 : INFERENCE

NON-LINEARITE ET RESEAUX NEURONAUX

Chapitre 1 : Notions. Partie 9 - Rente viagère. Qu est-ce q u u n e «r e n t e v i a g è r e»?

ANNEXE I RÉFÉRENTIELS DU DIPLÔME. Mention complémentaire Maintenance des systèmes embarqués de l automobile 5

Relatif aux règles comptables applicables au Fonds de réserve des retraites

République Démocratique du Congo

Enquête sur les investissements dans l industrie

Les Français et l assurance santé

Créer un site internet participatif avec Yeswiki

«L utilisation d un intranet permet-il la mise en place d un travail collaboratif et/ou coopératifs? Pour quelles compétences?»

MODÈLE CROP DE CALIBRATION DES PANELS WEB

Groupe de travail 3 : Emploi, formation, compétences

données en connaissance et en actions?

Comment évaluer une banque?

Estimation des coûts d un crédit d impôt pour la condition physique des adultes. Ottawa, Canada Le 25 septembre

Transcription:

Établissement public sous double tutelle des ministères de l'éducation nationale, de l'enseignement supérieur et de la Recherche du Travail, de l Emploi, de la Formation professionnelle et du Dialogue social Internet est-il l avenir des enquêtes Génération? Journées de Méthodologie Statistique 2 avril 2015 Christophe Dzikowski (Céreq) Christophe Barret (Céreq) 1

Introduction Les enquêtes Génération Enquête sur l insertion professionnelle des jeunes à l issue du système éducatif Constitution d une base de sondage de jeunes présumés sortants auprès des établissements de formation initiale Enquête téléphonique (CATI) à 3, 5 et 7 ans après la sortie Entre 20000 et 60000 questionnaires selon les Générations Nécessité de rénover le dispositif après 2017 une des pistes basculement sur une collecte multimode internet (Cawi) et téléphone (Cati) 2

Introduction Protocole de l expérimentation internet Enquête 2013 auprès de la Génération 2010 Deux échantillons disjoints Deux collectes monomodes distinctes en parallèle Questionnaires quasiment identiques «copie miroir» Quelques reformulations pour internet Ajout de consignes pour certaines questions complexes et pour respecter certaines conventions Pour internet, envoi d un mail-avis suivi de 10 relances mails 3

Bilan de collecte De nombreuses difficultés de collecte Base de sondage peu adaptée à la collecte par internet Notamment pas de mail pour les bases d élèves issues du rectorat Au final, seulement ¼ d email disponible Tentative d enrichissement des emails via un prestataire non concluante Un envoi de mail en masse et un taux de connexion décevants Des abandons en cours d enquête plus nombreux 15% de répondants parmi ceux qui disposaient d un mail 4

Comparaison CATI CAWI Traitement préalable des données CAWI Structure des répondants selon le niveau de sortie et le mode de collecte, poids initiaux Restriction sur une sous population du supérieur (4 096 observations) Protocole de modélisation de la non réponse et de calage quasi identique entre CATI et CAWI 5

Comparaison CATI CAWI Exemple avec la variable situation à la date d enquête Total des écarts de points= 76,5-75,9 + 11,9-12,5 + 3,8-2,7 + 1,2-1,7 + 6,4-7,2 =3,6 Moyenne des écarts de points par modalité=0,72 6

% Comparaison CATI CAWI Structure des différences 30 25 20 15 10 5 0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 16 17 18 20 21 22 23 24 25 27 28 39 40 Moyenne des écarts de points par modalité 7

% Comparaison CATI CAWI Structure des différences 30 25 42% moins d 1 point en moyenne 20 15 10 28 % plus de 5 points d écarts en moyenne 5 0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 16 17 18 20 21 22 23 24 25 27 28 39 40 Moyenne des écarts de points par modalité 8

Comparaison CATI CAWI Après la prise en compte de la variance Estimation de la variance des proportions par calcul direct En prenant en compte : La variance du tirage équilibré La variance due à la non réponse En prenant en compte le calage Appliquée à la linéarisée d une proportion Un peu plus de 40% des variables présentent une égalité statistique pour chacune des modalités 30 % des variables présentent aucune égalité sur aucune des modalités Égalité statistique partielle pour le reste des variables Les différences significatives s expliquent par des effets de mesure et/ou de sélection importants 9

Comparaison CATI CAWI Exemples d effet de mesure a priori Raisons d arrêt des études (QCM à 8 modalités) %CAWI (IC 95%) %CATI (IC 95%) Parce que vous aviez atteint le niveau de formation que vous souhaitiez (ATNIVO) 43(+-1,1) 60(+-0,7) Perception différente d une QCM à l oral et à l écrit? Un effet de désirabilité sociale plus important par téléphone? 10

Méthode de matching Le matching pour évaluer les politiques publiques Objectif : distinguer les effets de sélection des effets de mesure Méthode habituellement utilisée dans le cadre d évaluation de politiques publiques (D. Fougère) Pour mesurer l effet d une politique publique, l idéal est de procéder à une expérimentation avec une affectation aléatoire des bénéficiaires du dispositif pour éviter les problèmes de sélection. Sans expérimentation aléatoire préalable, le matching propose de contrôler l effet de sélection entre les bénéficiaires et les non-bénéficiaires 11

Méthode de matching Le matching pour distinguer les effets Dans notre cas, le traitement T est le fait de répondre par internet 1 pour les répondants au Cawi T = 0 pour les répondants au Cati La variable d intérêt Y peut s écrire avec 2 variables latentes (observées partiellement) Y = T Y 1 + 1 T Y 0 La méthode repose sur l hypothèse que conditionnellement aux variables qui expliquent la sélection, les variables latentes sont indépendantes du traitement Dans ce cas, il y a également indépendance par rapport à la probabilité de bénéficier du traitement (le score de propension) Y 0 T X Y 0 T P(X) (avec P X = Pr T = 1 X ) 12

Méthode de matching Le matching en pratique 2 groupes : groupe répondant par CAWI, et le groupe de contrôle CATI Pool de données CATI et CAWI avec partage des poids Modéliser les effets de sélection à partir de la modélisation du fait de répondre par internet (vs répondre par téléphone) Pour chaque répondant CAWI, on cherche des contrefactuels parmi les répondants CATI qui leur «ressemblent» (A l aide des probabilités estimées de répondre au CAWI) L effet de mesure est donné par la différence observée entre les statistiques observées sur le groupe des répondants CAWI et le groupe de leur contrefactuel du CATI (noté Cati *). 13

Méthode de matching Le matching application Exemple sur ATNIVO Raisons d arrêt des études (QCM à 8 modalités) CAWI CATI Écart brut (Cawi-Cati) Ecart avec prise en compte de l effet de sélection (Cawi-Cati*) Parce que vous aviez atteint le niveau de formation que vous souhaitiez (ATNIVO) 43% 60% -17 points -20 points La prise en compte de la sélection aggrave l écart observé Mais le phénomène majeur reste un problème de mesure Test du balancing score confirme l hypothèse d indépendance 14

Méthode de matching Les limites de la méthode La distinction des effets de sélection et de mesure est délicate Elle dépend de la manière dont est spécifiée le modèle de sélection Si le modèle est trop ajusté on n arrive plus à définir le groupe de contrefactuel 15

Expérimentation 2015 Une nouvelle expérimentation multimode Objectifs Améliorer le protocole de contact augmenter les taux de réponse Améliorer l ergonomie du questionnaire réduire les abandons en cours de collecte réduire l effet de mesure (generalized design) Améliorer la distinction des effets de mesure et de sélection Méthode A : ajout des questions pour mieux définir la propension à répondre à internet Méthode B : mise en place d un échantillon embarqué avec affectation aléatoire du mode de collecte 16

Expérimentation 2015 L échantillon embarqué En reprenant l analogie avec l évaluation des PP, l idée est de mettre en place une expérimentation aléatoire Un échantillon multimode «classique» (Cawi en majeur et Cati en rattrapage) (4444 individus) Un échantillon embarqué avec affectation aléatoire des modes de collecte (1000 individus) L idée est de multiplier les moyens de contacts Une fois le contact établi (qu il soit actif ou passif), on demande à l enquêté s il accepte de répondre à l enquête. S il accepte on lui attribue aléatoirement un mode de collecte En théorie, protocole «idéal» pour gommer les effets de sélection. En pratique, difficulté à terminer l enquête (malgré l acceptation de répondre) notamment lorsque l on imposera de changer de mode. 17

Réflexions sur l agrégation L agrégation en présence d effet de mesure Dans un contexte multimode L effet de sélection est une chance augmentation de la couverture L effet de mesure est un problème comment agréger les 2 modes? Hypothèse préalable : on a réussi à identifier les variables qui posent un problème de mesure Et, dans la plupart des cas, on parvient à quantifier l effet de mesure (et l effet de sélection) Nécessite de définir un mode référence Comment le choisir? Majoritaire, historique, «qualité», Globalement ou variable par variable 18

Réflexions sur l agrégation L agrégation en présence d effet de mesure En ne faisant rien! Calage Omission d un mode de collecte puis imputation Transformation de réponse 19

Conclusion Conclusion : Internet est-il l avenir des enquêtes Génération? - De nombreuses difficultés dans la collecte web mais qui paraissent surmontables - L enjeu des années à venir - Définir un Cawi et un Cati qui limitent les effets de mesure (problème du calendrier, des consignes et conventions ) - Malgré nos efforts des biais de mesure subsisteront - Soit on l anticipe et on abandonne ces questions - Soit on trouve une méthode satisfaisante pour contourner cette difficulté (matching, échantillon embarqué puis agrégation des données) - Un gage de modernité notamment pour la cible : les jeunes!... Quitte à accepter de repenser en partie notre dispositif 20

Établissement public sous double tutelle des ministères de l'éducation nationale, de l'enseignement supérieur et de la Recherche du Travail, de l Emploi, de la Formation professionnelle et du Dialogue social Internet est-il l avenir des enquêtes Génération? Journées de Méthodologie Statistique 2 avril 2015 Christophe Dzikowski (Céreq) Christophe Barret (Céreq) 21