La qualité des données sur les revenus : enquête versus fichier administratif L exemple de l enquête SRCV 2005 Laurence DAUPHIN INSEE
PLAN Le dispositif SRCV Pourquoi une «refonte»? L appariement Sources Méthodologie qualité Impacts Sur les données transversales Sur les données longitudinales Sur le questionnaire Bilan suite à la collecte 2008 Conclusion Page 2
Le dispositif SRCV Page 3
Le dispositif SRCV SRCV = déclinaison française du système de statistiques communautaires EU-SILC Page 3
Le dispositif SRCV SRCV = déclinaison française du système de statistiques communautaires EU-SILC Obtenir des indicateurs structurels dans les domaines de la répartition des revenus, du nombre de pauvres et d exclus, et de la composition de ce groupe social dans les Etats membres Page 3
Le dispositif SRCV SRCV = déclinaison française du système de statistiques communautaires EU-SILC Obtenir des indicateurs structurels dans les domaines de la répartition des revenus, du nombre de pauvres et d exclus, et de la composition de ce groupe social dans les Etats membres Disposer de statistiques sur le revenu et les conditions de vie comparables entre Etats membres (en particulier, indicateurs de Laeken) Page 3
Le dispositif SRCV SRCV = déclinaison française du système de statistiques communautaires EU-SILC Obtenir des indicateurs structurels dans les domaines de la répartition des revenus, du nombre de pauvres et d exclus, et de la composition de ce groupe social dans les Etats membres Disposer de statistiques sur le revenu et les conditions de vie comparables entre Etats membres (en particulier, indicateurs de Laeken) Mettre une base de micro-données à disposition des chercheurs (études comparatives sur les inégalités et le rôle des politiques sociales et fiscales dans la redistribution) Page 3
Le dispositif SRCV 2004 2005 Ech 11 Ech 12 Ech 12 2006 Ech 13 Ech 14 Ech 15 Ech 16 Ech 17 Ech 18 Ech 19 Ech 13 Ech 14 Ech 15 Ech 16 Ech 17 Ech 18 Ech 19 Ech 13 Ech 14 Ech 15 Ech 16 Ech 17 Ech 18 Ech 19 Ech 20 Ech 20 Ech 21 Page 4 2007 Ech 14 Ech 15 Ech 16 Ech 17 Ech 18 Ech 19 Ech 20 Ech 21 Ech 22 Ré interrogation jusqu en 2008 Ech 15 2008 Ech 16 2009 Ech 17 2010 Ech 18 2011 Ech 19 2012 Ech 20 2013 Ech 21 2014 Ech 22 2015 Ech 23 2016
Collecte des revenus 2004 2007 La stratégie de «balayage» Page 5
Collecte des revenus 2004 2007 La stratégie de «balayage» Recensement des différents types de revenus perçus par le ménage au cours de l année de référence par grandes composantes, et immédiatement collecte des montants correspondants. Page 5
Collecte des revenus 2004 2007 La stratégie de «balayage» Recensement des différents types de revenus perçus par le ménage au cours de l année de référence par grandes composantes, et immédiatement collecte des montants correspondants. Vérification si nécessaire de la non-inclusion antérieure dans le montant d une autre composante. Page 5
Collecte des revenus 2004 2007 La stratégie de «balayage» Recensement des différents types de revenus perçus par le ménage au cours de l année de référence par grandes composantes, et immédiatement collecte des montants correspondants. Vérification si nécessaire de la non-inclusion antérieure dans le montant d une autre composante. Si montant non obtenu, collecte d une information par tranches, et reconstitution par méthode des résidus simulés Page 5
Collecte des revenus 2004 2007 L appel aux documents Page 6
Collecte des revenus 2004 2007 L appel aux documents Innovation dans l appel explicite à la consultation de documents : plutôt bien accepté par les enquêtés Page 6
Collecte des revenus 2004 2007 L appel aux documents Innovation dans l appel explicite à la consultation de documents : plutôt bien accepté par les enquêtés Pour les revenus d activité et de remplacement, recours privilégié àla ou les déclarations des revenus de l année précédente : Page 6
Collecte des revenus 2004 2007 L appel aux documents Innovation dans l appel explicite à la consultation de documents : plutôt bien accepté par les enquêtés Pour les revenus d activité et de remplacement, recours privilégié àla ou les déclarations des revenus de l année précédente : Des récapitulatifs annuels déjà faits, Page 6
Collecte des revenus 2004 2007 L appel aux documents Innovation dans l appel explicite à la consultation de documents : plutôt bien accepté par les enquêtés Pour les revenus d activité et de remplacement, recours privilégié àla ou les déclarations des revenus de l année précédente : Des récapitulatifs annuels déjà faits, Et un mode de recueil des revenus annuels, a priori, plus facile et plus fiable Page 6
2008 : UNE REFONTE Pourquoi? Page 7
2008 : UNE REFONTE Pourquoi? Gagner en qualité sur la mesure des revenus Page 7
2008 : UNE REFONTE Pourquoi? Gagner en qualité sur la mesure des revenus Réduire le temps d enquête Page 7
2008 : UNE REFONTE Pourquoi? Gagner en qualité sur la mesure des revenus Réduire le temps d enquête Rendre l enquête SRCV moins fastidieuse Page 7
2008 : UNE REFONTE Pourquoi? Gagner en qualité sur la mesure des revenus Réduire le temps d enquête Rendre l enquête SRCV moins fastidieuse Développer les mesures de l exclusion dans SRCV Page 7
2008 : UNE REFONTE Pourquoi? Gagner en qualité sur la mesure des revenus Réduire le temps d enquête Rendre l enquête SRCV moins fastidieuse Développer les mesures de l exclusion dans SRCV Etudier des corrélations et intersections entre pauvreté en revenus et pauvreté en conditions de vie Page 7
2008 : UNE REFONTE Pourquoi? Gagner en qualité sur la mesure des revenus Réduire le temps d enquête Rendre l enquête SRCV moins fastidieuse Développer les mesures de l exclusion dans SRCV Etudier des corrélations et intersections entre pauvreté en revenus et pauvreté en conditions de vie Collecter l ensemble des Indicateurs Sociaux sur un même échantillon panélisé Page 7
LE TEST METHODOLOGIQUE Qualité de l appariement Page 8
LE TEST METHODOLOGIQUE Qualité de l appariement Objectifs Page 8
LE TEST METHODOLOGIQUE Qualité de l appariement Objectifs Les ménages concernés Page 8
L APPARIEMENT La méthodologie Fichier d identification INSEE N identifiant SRCV + Nom crypté, prénom, sexe, adresse Jour, mois, année et département de naissance Création de la table de passage Table de passage N FIP + Identifiant SRCV Taux de déchets estimé entre 5 et 10% Récupération des données fiscales et suppression du FIP Données des déclarations fiscales N identifiant SRCV + Données de la déclaration d impôts Fusion avec les données de l enquête SRCV Fichier d identification DGI N FIP + Nom crypté, prénom, sexe, adresse Jour, mois, année et département de naissance Fichier des déclarations fiscales N FIP + Données de la déclaration d impôts (sans nom crypté, prénom, sexe, adresse, jour, mois et lieu de naissance) Supprimés au bout de 5 ans Données de collecte SRCV N identifiant SRCV + Données SRCV Fichier final SRCV N identifiant SRCV + Données des déclarations de revenus + Données SRCV Anonymisation des données Page 9 Fichier anonymisé SRCV Identifiant non signifiant différent de celui de SRCV Données des déclarations d impôts et données enquête (sans prénom, adresse, mois et département de naissance, commune, département, PCS à quatre chiffres)
LES NON-APPARIES Page 10
LES NON-APPARIES Taux d appariement Page 10
LES NON-APPARIES Taux d appariement Les difficultés d appariement Page 10
LES NON-APPARIES Taux d appariement Les difficultés d appariement Le non appariement au niveau ménage Page 10
LES NON-APPARIES Taux d appariement Les difficultés d appariement Le non appariement au niveau ménage Le non appariement au niveau individu Page 10
LES NON-APPARIES SO / NR 0 1 2 Total men app 1 20 60 1 82 Salariés men non app 2 32 99 0 133 Ensemble 3 52 159 1 215 men app 0 3 0 0 3 Indépendants men non app 0 14 0 0 14 Ensemble 0 17 0 0 17 men app 0 7 9 0 16 Chômeurs men non app 0 6 13 0 19 Ensemble 0 13 22 0 35 men app 0 1 11 0 12 Retraités men non app 0 2 38 0 40 Ensemble 0 3 49 0 52 men app 1 72 21 0 94 16-25 ans men non app 0 44 11 1 56 Ensemble 1 116 32 1 150 men app 130 0 0 0 130 enfants men non app 99 0 0 0 99 Ensemble 229 0 0 0 229 Total 233 201 262 2 698 Page 11
LES NON-APPARIES SO / NR 0 1 2 Total men app 1 20 60 1 82 Salariés men non app 2 32 99 0 133 Ensemble 3 52 159 1 215 men app 0 3 0 0 3 Indépendants men non app 0 14 0 0 14 Ensemble 0 17 0 0 17 men app 0 7 9 0 16 Chômeurs men non app 0 6 13 0 19 Ensemble 0 13 22 0 35 men app 0 1 11 0 12 Retraités men non app 0 2 38 0 40 Ensemble 0 3 49 0 52 men app 1 72 21 0 94 16-25 ans men non app 0 44 11 1 56 Ensemble 1 116 32 1 150 men app 130 0 0 0 130 enfants men non app 99 0 0 0 99 Ensemble 229 0 0 0 229 Total 233 201 262 2 698 Page 12
LES NON-APPARIES SO / NR 0 1 2 Total men app 1 20 60 1 82 Salariés men non app 2 32 99 0 133 Ensemble 3 52 159 1 215 men app 0 3 0 0 3 Indépendants men non app 0 14 0 0 14 Ensemble 0 17 0 0 17 men app 0 7 9 0 16 Chômeurs men non app 0 6 13 0 19 Ensemble 0 13 22 0 35 men app 0 1 11 0 12 Retraités men non app 0 2 38 0 40 Ensemble 0 3 49 0 52 men app 1 72 21 0 94 16-25 ans men non app 0 44 11 1 56 Ensemble 1 116 32 1 150 men app 130 0 0 0 130 enfants men non app 99 0 0 0 99 Ensemble 229 0 0 0 229 Total 233 201 262 2 698 6 % 2,5 % Page 13
IMPACT SUR LE NIVEAU DE VIE Pauvreté Page 14
IMPACT SUR LES SALAIRES Millions d'individus 2 1 salaire avant imputation salaire après imputation DGI 0 mo ins 2000 4000 à 6000 8000 à 10000 12 0 0 0 à 14 0 0 0 16000 à 18000 20000 à 22000 24000 à 26000 28000 à 30000 32000 à 34000 36000 à 38000 40000 à 42000 44000 à 46000 48000 à 50000 52000 à 54000 56000 à 58000 plus de 60000 euros Page 15
AU NIVEAU INDIVIDUEL? Salaires Page 16 Salaires annuels en milliers d euros. On a supprimé le point correspondant à la personne gagnant 900 000 euros corrigées à tort.
ERREURS DANS LES TYPES DE REVENUS Page 17
ERREURS DANS LES TYPES DE REVENUS Pour 83 % des individus les types de revenus déclarés dans l enquête et les types de revenus retrouvés dans les fichiers fiscaux coïncident. Page 17
ERREURS DANS LES TYPES DE REVENUS Pour 83 % des individus les types de revenus déclarés dans l enquête et les types de revenus retrouvés dans les fichiers fiscaux coïncident. 39 % des individus ont uniquement des salaires dans les 2 sources. Page 17
ERREURS DANS LES TYPES DE REVENUS Pour 83 % des individus les types de revenus déclarés dans l enquête et les types de revenus retrouvés dans les fichiers fiscaux coïncident. 39 % des individus ont uniquement des salaires dans les 2 sources. 14 % des individus n ont aucun revenu, ni dans le fichier d enquête, ni dans le fichier fiscal. Page 17
ERREURS DANS LES TYPES DE REVENUS Pour 83 % des individus les types de revenus déclarés dans l enquête et les types de revenus retrouvés dans les fichiers fiscaux coïncident. 39 % des individus ont uniquement des salaires dans les 2 sources. 14 % des individus n ont aucun revenu, ni dans le fichier d enquête, ni dans le fichier fiscal. 7 % ont des revenus dans les 2 sources mais leur nature diffère Page 17
ERREURS DANS LES TYPES DE REVENUS Pour 83 % des individus les types de revenus déclarés dans l enquête et les types de revenus retrouvés dans les fichiers fiscaux coïncident. 39 % des individus ont uniquement des salaires dans les 2 sources. 14 % des individus n ont aucun revenu, ni dans le fichier d enquête, ni dans le fichier fiscal. 7 % ont des revenus dans les 2 sources mais leur nature diffère 7 % ont des revenus dans les fichiers fiscaux mais pas dans l enquête. Page 17
ERREURS DANS LES TYPES DE REVENUS Pour 83 % des individus les types de revenus déclarés dans l enquête et les types de revenus retrouvés dans les fichiers fiscaux coïncident. 39 % des individus ont uniquement des salaires dans les 2 sources. 14 % des individus n ont aucun revenu, ni dans le fichier d enquête, ni dans le fichier fiscal. 7 % ont des revenus dans les 2 sources mais leur nature diffère 7 % ont des revenus dans les fichiers fiscaux mais pas dans l enquête. 3 % ont des revenus dans l enquête mais pas dans les fichiers fiscaux. Page 17
IMPACT LONGITUDINAL Page 18
IMPACT LONGITUDINAL Les changements de niveau de vie Page 18
IMPACT LONGITUDINAL Les changements de niveau de vie Le passage du seuil de pauvreté Page 18
IMPACTS SUR LE QUESTIONNAIRE SRCV Page 19
IMPACTS SUR LE QUESTIONNAIRE SRCV Une architecture quasi-identique Page 19
IMPACTS SUR LE QUESTIONNAIRE SRCV Une architecture quasi-identique Plus de recours à la déclaration fiscale, aux relevés de retraite Page 19
IMPACTS SUR LE QUESTIONNAIRE SRCV Une architecture quasi-identique Plus de recours à la déclaration fiscale, aux relevés de retraite Certains montants plus demandés (DGI, CAF, MSA) Page 19
IMPACTS SUR LE QUESTIONNAIRE SRCV Une architecture quasi-identique Plus de recours à la déclaration fiscale, aux relevés de retraite Certains montants plus demandés (DGI, CAF, MSA) Mais toujours la nature des revenus perçus Page 19
IMPACTS SUR LE QUESTIONNAIRE SRCV Une architecture quasi-identique Plus de recours à la déclaration fiscale, aux relevés de retraite Certains montants plus demandés (DGI, CAF, MSA) Mais toujours la nature des revenus perçus D autres montants toujours demandés Page 19 Les revenus immobiliers et financiers Les salaires non imposables Les retraites exonérées Le minimum vieillesse.
IMPACTS SUR LE QUESTIONNAIRE SRCV Les jeunes entre 18 et 25 peuvent choisir de déclarer leurs revenus seuls ou avec leurs parents Déclaration avec les parents? OUI NON Réside avec ses parents LEGER Réside ailleurs (déclaration impossible à retrouver) COMPLET Déclaration à l adresse de l enquête LEGER Déclaration à autre adresse (déclaration impossible à retrouver) COMPLET Page 20
1er BILAN Page 21
1er BILAN Bonne acceptation par les enquêtés Page 21
1er BILAN Bonne acceptation par les enquêtés De bons taux de réponse Page 21
1er BILAN Bonne acceptation par les enquêtés De bons taux de réponse Un questionnaire plus agréable Page 21
1er BILAN Bonne acceptation par les enquêtés De bons taux de réponse Un questionnaire plus agréable qui pourra être encore allégé Page 21
CONCLUSION Page 22
CONCLUSION Peu d impact au niveau macro Page 22
CONCLUSION Peu d impact au niveau macro Meilleure qualité en cas de proxy ou de non recours aux documents Page 22
CONCLUSION Peu d impact au niveau macro Meilleure qualité en cas de proxy ou de non recours aux documents Un impact individuel qui peut être fort Page 22
CONCLUSION Peu d impact au niveau macro Meilleure qualité en cas de proxy ou de non recours aux documents Un impact individuel qui peut être fort Contrôles systématiques lors de la constitution du fichier longitudinal, passe du seuil de pauvreté en particulier Page 22