Calcul des probabilités d inclusion dans les enquêtes par sondage probabiliste issues de bases de numéro de téléphone fixe et mobile Retour d expérience de l enquête KABP VIH/SIDA 2010 C Sommen, J Warszawski, N Beltzer AFS RT 20, 6 Juillet 2011
Contexte KABP Connaissances, attitudes, comportements et perceptions à l égard du SIDA Enquêtes KABP répétées en 1992, 1994, 1998, 2001, 2004 et 2010 Enquêtes nationales avec sur-échantillon IdF Tirage au sort des ménages Choix d un individu au sein du ménage
Contexte KABP : évolution des enquêtes 1992-1998 : utilisation de la liste blanche de l annuaire FT En 2001 : prise en compte des numéros non disponibles sur l annuaire (Liste rouge) En 2004 : Petit sur-échantillon de détenteurs de mobiles exclusifs (questionnaire court)
Contexte 2010 18% ne sont pas joignables par téléphone mobile 13% des adultes ne sont pas joignables par téléphone fixe Nouveaux opérateurs 39% des abonnés en téléphonie fixe ne sont pas inscrits sur annuaire opérateur public (France Télécom) Absence d un annuaire universel Méthode alternative de tirage au sort des numéros de téléphone
Choix méthodologiques 2010 Échantillon filaire Génération aléatoire de numéros préfixe filaire (01 à 05) Nettoyage G NUM de l ARCEP Passage annuaire inversé Ni fixe, ni mobile ou uniquement en 09 1% Échantillon mobile Génération aléatoire de numéros préfixe mobile (06) Adresse non connue Numéros avec adresse connue Filaire exclusif Mobiles + filaires Mobiles exclusifs
et redressement Tenir compte de la probabilité d être interrogé Tenir compte de la représentation de la région IdF dans l échantillon national (suréchantillon) Tenir compte de la représentation des variables socio-démographiques dans l échantillon national
Difficultés enquête 2010 Enquêtes précédentes : poids inversement proportionnel au nombre de personnes dans le ménage 2010 : plan de sondage plus complexe 2 échantillons (F+P), 3 strates (F,FP,P) Génération aléatoire de numéros (pas d annuaire)
Questions fondamentales Quelle est la répartition F/P/FP? Quelle est la probabilité d être interrogé sur fixe, sur mobile? Ou qu un tel fixe/mobile soit appelé? La population des FP est-elle la même selon le support téléphonique? Les taux de réponses sont-ils indépendants du support tel possédé par les individus?
Méthode 1 : Pondération proposition de 2 méthodes Calcul de la probabilité qu un individu soit interrogé en fonction du type de tel possédé Hypothèse : calcul du nombre de lignes éligibles à partir des taux de réponses Méthode 2 : Redresser la répartition F/FP/P observée Hypothèse : population FP identiques selon support tel
Méthode 1
Méthode 1 (1)
Méthode 1 (2)
Passage annuaire inversé Lettre annonce 9 348 numéros avec adresse 288 500 numéros générés aléatoirement 29% 84 696 numéros 32% 3% 75 348 numéros sans adresse 2951 inters réalisées 2051 inters réalisées Passage ARCEP Après composition et contact Taux de réponse : 1/58
Passage ARCEP Après composition et contact 43 200 numéros générés aléatoirement 61% 26 268 numéros 19% 5007 inters réalisées Taux de réponse : 1/9
Méthode 2
Méthode 2 Deux échantillons : 1 (filaire) 2 (portable) Trois strates : FP / P / F Idée : Estimer ratios F/FP (dans ech 1) et P/FP (dans ech 2) après pondération par nb utilisateurs En déduire la répartition estimée F / FP / P Redresser la répartition observée par la répartition estimée
Méthode 2 Population générale : répartition non observée F Ech 1 : filaire FP Ech 2 : portable P Estimation de la répartition à partir des données Echantillon redressé
Comparaisons des 2 méthodes M2 s affranchit de la connaissance de la probabilité qu une ligne soit tirée au sort utilisée dans M1 M2 part du principe que les sous-éch FP sont identiques M1 plus classique (calcul de la proba d inclusion) est assimilable à la méthode des partages des poids
Comparaisons des 2 méthodes : Téléphones 90 85 80 75 70 Données brutes Pondération ORS Pondération JW Redress ORS Redress JW Fixe et Mobiles 20 15 10 5 0 Données brutes Pondération ORS Pondération JW Redress ORS Redress JW Exclusifs mobiles Exclusifs fixes
Comparaisons des 2 méthodes : Sexe 57 56 55 54 53 52 51 50 49 48 47 Sexe femme Données brutes Pondération ORS Pondération JW Redress ORS Redress JW
Comparaisons des 2 méthodes : Sexe 65 Sexe féminin 60 55 50 Téléphonie mobile Téléphonie fixe 45 40 Données brutes Pondération ORS Pondération JW Redress ORS Redress JW
Comparaisons des 2 méthodes : Age 26 Age < 30 ans 25 24 23 22 21 20 19 Données brutes Pondération ORS Pondération JW Redress ORS Redress JW
Comparaisons des 2 méthodes : Age Age < 30 ans 30 28 26 24 22 20 18 16 14 12 10 Données brutes Pondération ORS Pondération JW Redress ORS Redress JW Téléphonie mobile Téléphonie fixe
Comparaisons méthodes : Utilisation du préservatif Utilisation du préservatif dans les 12 mois Données brutes Pondération ORS Pondération JW Redress ORS Redress JW Distance entre 2 traits : 0,5 (%)
Comparaisons méthodes : Utilisation du préservatif Utilisation du préservatif dans les 12 mois Téléphonie mobile Téléphonie fixe Données brutes Pondération ORS Pondération JW Redress ORS Redress JW Distance entre 2 traits : 2 (%)
Conclusion Principales différences sur la répartition F/P/FP Différences selon le support téléphonique Intervalles de confiance de taille similaire selon les 2 méthodes Pas de différences sur les indicateurs épidémiologiques