La Qualité des données de Jérôme NERAUDAU Directeur Etudes & Méthodes Scientifiques
Sommaire La qualité des données de I Les données INSEE a) Les différentes sources utilisables b) La mise au point d une base socio-démographique II Etudes utilisées comme source de a) La Référence des Equipements Multimedia b) La 126.000 c) L Observatoire des Usages Internet 2
Introduction La qualité des données de Pourquoi des données de en amont : construction des échantillons en aval : redressement et extrapolation Contexte diversité croissante des modes de recueil populations inégalement joignables 3
Introduction La qualité des données de La maîtrise des échantillons d enquête (élaboration, redressement) passe par l utilisation d un dispositif de robuste. 4
I - Les données INSEE 5
I Les Données INSEE Les différentes sources utilisables Les données du recensement : Dernier recensement exhaustif : 1999 Depuis 2004, changement de méthodologie : - Communes de 10.000 hab. : recensement annuel auprès d un cinquième des communes (recensement exhaustif au bout des 5 années) - Communes de +10.000 hab. : recensement annuel de 8% des logements de chaque commune Résultats disponibles : - Depuis 2005 : résultats provisoires pour les communes de moins de 10.000 hab. ayant fait l objet d un recensement, et estimations de la population pour chaque commune de plus de 10.000 hab. - Fin 2008 : population dans chaque commune (statistiques complètes sur les habitants et logements) 6
I Les Données INSEE Les différentes sources utilisables Les données des enquêtes emploi : Jusqu en 2002, enquête annuelle en Mars Depuis 2002, changement de méthodologie : - collecte en continu tout au long de l année (échantillons trimestriels de 35.000 logements répondants) - renouvellement par 1/6 de l échantillon par trimestre (logement interrogé six trimestres consécutifs) - environ 150.000 logements répondants par an. Résultats disponibles : - résultats sur l activité professionnelle et les caractéristiques du foyer (nombre de personnes) en 2003, 2004, 2005 7
I Les Données INSEE Les différentes sources utilisables Le tableau annuel de la population : Publié dans le numéro de janvier du Bulletin Mensuel de la Statistique : - estimations de la population totale par sexe et âge au 1 er janvier - à partir des bulletins d état civil, d une estimation du solde migratoire, et des estimations des derniers recensements (2004, 2005, 2006) Résultats disponibles : - estimation de la population totale par sexe et âge au 1 er janvier de chaque année 8
I Les Données INSEE Les différentes sources utilisables Les projections de population de l INSEE : - Projections de la population par sexe, âge et région INSEE à partir du Recensement 1999 - Résultats disponibles : projections de la population par sexe, âge, région INSEE en 2007 à partir du recensement 1999 9
I Les Données INSEE La construction d une base socio-démographique annuelle : Méthode utilisée : - Estimation de la population totale sur les critères sexe X âge, à partir du BMS et du taux d appartenance aux ménages - Application de ces effectifs de population aux projections INSEE, pour déterminer la répartition de la population par région INSEE et par département. - Estimation de la population active des individus et des personnes de référence, de la taille du foyer, à partir des données de l Enquête Emploi Utilisation des données INSEE les plus récentes 10
I Les Données INSEE Validation annuelle avec le CESP : Sources utilisées Méthode d élaboration Résultats obtenus Collaboration avec le CESP permettant : La cohérence des chiffres de population avec autres études médias Des démarches communes vis-à-vis de l INSEE en cas de questions sur les données du recensement ou des Enquêtes Emploi 11
II Etudes utilisées comme source de A) La Référence des Equipements Multimedia (R.E.M) 12
II Etudes utilisées comme source de A) La Référence des Equipements Multimedia Un partenariat GFK-ISL-Médiamétrie - objectifs de l étude : Etablir des taux d équipements de référence chaque trimestre dans les domaines suivants : - audio-visuel : télévision, magnétoscope, lecteur DVD, modes de réception TV, abonnements bouquets TV, - informatique : ordinateurs, imprimantes, périphériques - internet : accès domicile, haut/bas débit, fournisseur, - téléphonie fixe et mobile : équipement, utilisation, - autres équipements : appareils photo numériques, baladeurs, 13
II Etudes utilisées comme source de A) La Référence des Equipements Multimedia - dispositif d étude : - Enquête face à face : 22.000 interviews annuelles (2.000 interviews mensuelles, sauf en août, cumuls trimestriels pour les résultats) - Entretiens réalisés au domicile des personnes interrogées : - enquêteurs munis de documents pour aider l interviewé à répondre - possibilité de vérifier sur place les caractéristiques des équipements - utilisation du système CAPI, permettant d assurer la fluidité logique de l entretien, et la saisie directe des réponses - Questionnaire évolutif, mis à jour chaque trimestre, en fonction des nouveaux équipements 14
II Etudes utilisées comme source de La Référence des Equipements Multimedia - dispositif d étude : Représentativité assurée en amont : - Plan de sondage construit sur une matrice Région ZEAT X habitat (5 catégories) - Interviews réalisées au prorata de la population dans chaque strate, y compris pour la répartition ville / banlieue - 210 communes touchées à chaque vague trimestrielle - Quotas sur les variables Sexe / Age / Csp de l individu / Activité de la femme 15
II Etudes utilisées comme source de La Référence des Equipements Multimedia - dispositif d étude : Représentativité assurée en aval : - Les résultats INSEE livrent les effectifs et les structures de population - Les panels distributeurs de GFK procurent les chiffres de vente des produits, ainsi qu un taux d obsolescence pour chaque équipement - Les résultats de l enquête donnent des taux de multi-équipement et des taux de renouvellement pour chaque équipement L utilisation conjointe de ces sources permet de définir un taux de possession faisant référence pour chaque bien d équipement, ainsi que le profil des possesseurs 16
II Etudes utilisées comme source de A) La Référence des Equipements Multimedia (REM) - données de produites : Taux d équipements audio-visuels - télévision - magnétoscope / DVD - réception TV (câble, satellite, TNT, ADSL, + abonnements) Taux d équipements informatiques & internet - micro-ordinateur - accès internet domicile Taux d équipement en téléphonie - lignes fixes - mobiles dont «exclusifs mobiles» 17
II Etudes utilisées comme source de B) La «126.000» 18
II Etudes utilisées comme source de B) La «126.000» Objectifs de l étude : mesure de l audience de la radio auprès de la population 13 ans ou plus France Métropolitaine 4 résultats par an au niveau national et IDF (hors étude «grilles d été»)) 2 résultats par an pour huit grandes agglomérations 1 résultat par an pour autres zones locales 19
II Etudes utilisées comme source de B) La «126.000» Dispositif d étude : 126.000 interviews annuelles par téléphone (fixe & mobile) Equi-répartition quotidienne des interviews Quotas quotidiens, sur 5 régions de recueil Recueil de l audience «dernières 24 heures» de la radio Recueil de l audience veille TV et de l audience cinéma (lors d un 2 ème appel) 20
II Etudes utilisées comme source de B) La «126.000» Dispositif d étude : - Un plan de sondage stratifié : - sur-échantillons locaux (agglomérations) - sous-représentation des 65 ans & + - interrogation des «exclusifs mobiles» à la moitié de leur poids réel - Des quotas sur les variables : - sexe X âge - sexe X activité (4 catégories) - type d appel (fixe / mobile) 21
II Etudes utilisées comme source de B) La «126.000» Dispositif d étude : - Représentativité assurée a posteriori par le redressement : - remise à leur poids des zones géographiques - remise à leur poids des «65 ans & +» - remise à leur poids des «exclusifs mobiles» - ajustement sur autres critères socio-démographiques : sexe, âge, profession (individu & chef), habitat, taille du foyer - Utilisation des données de : - Socio-démographiques (cf partie I-) - Données issues de la REM (taux d exclusifs mobiles) 22
II Etudes utilisées comme source de B) La «126.000» Données de produites : - Répartition et structure de la population selon sa fréquentation cinéma - fréquentation cinéma 12 Derniers Mois - fréquentation cinéma 7 Derniers Jours - Assidus / Réguliers / Occasionnels - Utilisation de ces données : - Pour les études sur le public du cinéma, dont beaucoup sont réalisées en mode CAWI (questionnaires auto-administrés sur internet) - En particulier, Cin hebdo : étude sur la notoriété et l intention de voir des films, évaluées avant leur sortie en salles 23
II Etudes utilisées comme source de B) La «126.000» Données de produites : - Volet télévision : - mesure de l audience veille de la télévision : - protocole de recueil d audience similaire à celui utilisé pour la radio - périmètre : audience déclarée quel que soit le lieu - comparaison avec les résultats du Médiamat : - s assurer que les résultats du Médiamat ne sont pas impactés par un «effet panel» 24
II Etudes utilisées comme source de C) L Observatoire des Usages Internet (O.U.I.) 25
II Etudes utilisées comme source de C) L Observatoire des Usages Internet («O.U.I.») Objectifs de l étude : mesure des usages en terme d internet et téléphonie mobile population 11 ans et plus France Métropolitaine Résultats trimestriels 26
II Etudes utilisées comme source de C) L Observatoire des Usages Internet («O.U.I.») Dispositif d étude : Enquête téléphonique (fixe & mobile) 11.000 interviews annuelles (1.000 par mois, sauf août) Quotas socio-démographiques 27
II Etudes utilisées comme source de C) L Observatoire des Usages Internet («O.U.I.») Dispositif d étude : - Représentativité assurée : - a priori par la méthode des quotas - a posteriori par le redressement sur des critères sociodémographiques et d équipement informatique - Utilisation des données de : - Socio-démographiques (cf partie I-) - Données issues de la REM (taux d exclusifs mobiles, taux de possession microordinateur et accès internet) 28
II Etudes utilisées comme source de C) L Observatoire des Usages Internet («O.U.I.») Données de produites : - Répartition et structure de la population selon : - accès internet à domicile - accès internet sur lieu de travail - Utilisation de ces données : - Redressement des résultats du Panel Internet 29
Conclusion La qualité des données de Les données INSEE constituent le socle essentiel pour l élaboration des échantillons Les études construites sur ce référentiel INSEE permettent à leur tour d élaborer d autres données de. Ce principe de permet d assurer la pertinence et la cohérence des résultats des études 30
Merci pour votre attention 31