Pondéraons longudnales e ransversales dans les échanllons roafs * * * Applcaon à l'enquêe SILC Pascal ARDILLY, INSEE
PLAN / Vson longudnale e vson ransversale 2/ Un oul : le parage des pods 3/ La pondéraon longudnale dans le cas de SILC 4/ La pondéraon ransversale dans le cas de SILC 2
Vson longudnale e vson ransversale Enquêe répéée dans le emps collece de Y Ω = populaon du champ de l enquêe l année Quels son les paramères néressans? Vson ransversale : = Ω Y T (+ ous les "saelles") *, + = T + T = Ω + + Y Ω Y Vson longudnale :, + = Ω+ Ω Y + Ω + Ω élmne la par d'évoluon explquée par la démographe (nerpréaon complexe) Y 3
Deux noons de populaon d'nférence Ω Ω + - - + + LONGITUDINAL TRANSVERSAL Les "mors" : décès, émgraon, passage de l ndvdu en communaué, sore de champ, Les "nassances" : nouveau-nés, mmgraon, enrée dans le champ par le franchssemen d un seul d âge, 4
Sraéges d'échanllonnage envsageables Obecf : produre à la fos des esmaons longudnales e des esmaons ransversales.. Un échanllonnage «ndépendan» chaque année : largemen perfecble en erme de précson des évoluons. 2. Un échanllonnage négralemen panélsé : problème de charge, rréalse en praque. 3. Un échanllon roaf : bon comproms précson / charge d'enquêe. 5
TYPE d'échanllon «Indépendan» chaque année Panel Approche TRANSVERSALE NATUREL IMPOSSIBLE sans rage complémenare Approche LONGITUDINALE POSSIBLE mas mons effcace NATUREL Roaf POSSIBLE POSSIBLE 6
Avanages de l'échanllonnage roaf. rédu l erreur d échanllonnage assocée à la mesure des évoluons (ben que mons effcace en héore que le panel «pur»).. lme la charge des enquêés par rappor au panel «pur».. perme de prendre en compe d une manère rès «naurelle» l évoluon de la populaon avec le emps. v. plus accessoremen, perme de rédure les erreurs d observaon (comme les panels). 7
Défaus de l'échanllonnage roaf. nécesse un suv des ndvdus dans le emps, ce qu occasonne des coûs de dépsage e des nonréponses du fa des personnes non rerouvées (déménagemens ).. par naure, la longueur des séres ndvduelles es lmée, donc évdemmen mons rche qu un pur panel.. la echnque de pondéraon longudnale / ransversale n es pas smple 8
Un oul : le parage des pods Esmaon en conexe "smple" : - populaon Ω (base de sondage) - échanllon s (ré dans Ω) On connaî P = Pr oba ( s) Y T = esmé par Tˆ = (Horvz-Thompson) P Y Ω s a) E Tˆ = T (esmaeur sans bas) b) V Tˆ ( P. P P ) = 2 2 (, ) Ω,. Y P Y P 2 9
Esmaon dans le cadre de l'échanllonnage ndrec Deux populaons Ω A e Ω B, plus un sysème de LIENS permean un passage de Ω vers Ω ; A B Des GRAPPES "naurelles" dans ménages, des enreprses) ; Ω B (ex : des Grappe, ndvdu k varable Y k Ω A Ω B 0
Prncpe d'échanllonnage en 2 emps : a) échanllonnage s A dans Ω A (unés d échanllonnage ) e prse en compe des lens k échanllon nermédare dans Ω B. b) on décde d'enquêer l négralé des grappes recoupan ce échanllon échanllon fnal de grappes s B Ω A Ω B
Quel esmaeur sans bas du oal des Y, dans k Ω B? Soluon : esmaeur classque de Horvz-Thompson. 2 problèmes : ) proba s ) rès complquée ( B 2) nécessé de connaîre p ( sa) pour des ndvdus non rés (ex : rage en 2 phases) 2
Soluon 2 : Méhode généralsée de parage des pods (MGPP) ' ) Calculer s, k : w = 2) Calculer sb lens L B k s P A k, le nombre TOTAL de k L = Ω A k 3) Former w = L k w ' k 4) Arbuer à chaque k de le pods w k = w 3
Résumé opéraonnel T = k Ω Y k = Y B Ω B Tˆ = s B k w k Y k = s B w Y S on pose L, = k, on a le pods fnal k w k = s A L, L. P 4
AVANTAGES (déermnans!) Pondéraon facle Ulsaon des P pour sa seulemen. INCONVENIENTS Rsque d'erreur de mesure sur L S L SOUS-ESTIMÉ w devra SUR ESTIMER la réalé! B une pseudo soluon : un calage sur un oal C'es "le" rsque de la MGPP 5
PROPRIÉTÉS fondamenales ) E Tˆ = T dès que L > 0 ΩB Aenon : L = 0 défau de couverure 2) Dualé : On pose Z L, =. Y L, = k Ω L k B Alors Tˆ =. Z = P s A Zˆ V ( Tˆ) = V ( Zˆ ) Pas de dffculé pour le calcul de précson. A noer : la dualé perme auss de raer la non-réponse e de praquer des redressemens de façon "propre". 6
Applcaon numérque s A s B = = {,2} {,2,2,22,23 } L = 2 L 2 = 3 ' w = ' w 2 = P 0 ' w 2 = P 2 ' ' w 22 = 23 0 P w = 2 w = + 2 P P e 2 w = 2 3. P 2 ( Y + Y ) + w ( Y + Y Y ) T ˆ = w + 2 2 2 22 23 7
Exemples concres d'ulsaon de la MGPP ) Absence de base de sondage : Enquêe "Sans domcle fxe" INSEE-INED Ω A = { cenres d accuel presaons } Ω B = { personnes sans domcle fxe } L = Nombre de presaons dans les cenres fréquenés par au cours de la collece (collecé sur une semane glssane + modèle pour passer au mos). 8
2) Bases de sondage mulples L = Nombre de bases conenan (Aenon : adaper le quesonnare! ) Exemple : enquêe "Logemen 2006" 9
3) Approche par réseau : éude d une populaon rare. "Cer un consommaeur de drogue" Ω B Ω A : Talle de Ω B ( Y = )? L = Nombre de personnes qu ceron (problème de mesure!) 4) Sondage adapaf : éude d une populaon rare Ω A = { Logemens } Ω B = { Ménages de 6 personnes e plus } On consue des grappes "naurelles" sur le erran, de proche en proche. L = Talle de la grappe (connue) 5) Mesure d un phénomène défn sur une pérode à parr d un échanllonnage de ours. Ex : sasfacon d une clenèle d hôel Trage d our dans le mos (probablé p ()), pus n clens parm N. La moyenne smple nsananée va suresmer la sasfacon Y 20
La pondéraon longudnale dans le cas de SILC SILC : échanllon roaf consué de 9 panels d'ndvdus nerrogés 9 années de sue; Les ndvdus son suvs au cours du emps; Trage annuel de logemens dans l'échanllon-mare Insee, ous les ndvdus du ménage son ndvdus-panel ( 2000 logemens par an); Pour esmer l'évoluon / + la populaon d'nférence es Ω ; Les "mors" son smplemen gnorés (pas de bas); On suppose c qu l n y a pas de non-réponse. 2
+ TEMPS Enran a,9 a, 8 a, 7 a, 6 a, 5 a, 4 a, 3 a, 2 a, soran Enran a,8 a, 7 a, 6 a, 5 a, 4 a, 3 a, 2 a, a +, soran a, = sous-échanllon panel à enquêer l année en k k ème nerrogaon ( a = a (, 9) +, k+, k k ) Pare grsée = éch. longudnal = 8 s, + = U a, k k = 22
Cas du panel "pur" : on conserve les pods d'orgne - sans ren oucher. Ic, l fau représener Ω à parr de hu panels rés à des daes dfférenes, donc représenan des populaons d'ndvdus dfférenes. Inuvemen, un ndvdu a n fne une probablé de sélecon à foncon du nombre de panels dans lesquels l es suscepble d êre ré. 23
Pondéraon à l'ade de la MGPP Ω 7 Ω 3 Ω Ω ndvdu de Ω = grappe L = nombre d années parm { } Ω, 7,...,, duran lesquelles se rouva dans le champ de l enquêe ( rable dans un panel «enran» ) on a {,2,3, K,8} L. On suppose que chaque année exacemen Ω. k 24 k, la base de sondage couvre
Formalsaon du pods longudnal So { k,2,3,...8 } K a, k = = numéros des panels dans lesquels on rerouve (sauf excepon, S a, k, ( k) K a un seul élémen). W, = pods du logemen dans lequel se rouve à la dae de son rage en an qu ndvdu-panel, ( rage annuel dans Ω k + ). a, k Noa : on a (, ) 60 W mllons. k Le pods longudnal de s, + es, + W = W, L k K ( k) Le quesonnare do permere d'obenr L (l es réalse de supposer Ω 7 Ω 6 K Ω Ω ). 25
Smplfcaons évenuelles S on néglge les cas où un ndvdu-panel peu êre ré deux fos ou plus (cas rès rare), on a, + W W = L où W es le pods de relaf à l unque sous-échanllon panel dans lequel l fgure à la dae. S en plus (fcf) : - la populaon n'évolue pas dans le emps, - les panels son rés à proba égales ( W = W ), alors, W W + = 8 Résula nuf : ou se passe «comme s» n mpore quel ndvdu de s, + ava une probablé de sélecon égale à hu fos celle qu caracérse chaque souséchanllon panel composan s, +. 26
Esmaon fnale L'esmaeur longudnal de l'évoluon es ˆ, + = s, + W, + +.( Y Y ), + NB : a pror, les pods W ne son ulsés que dans le cadre d une esmaon d évoluon. Pour des esmaons poncuelles, ls apparassen sans nérê parce que la populaon d nférence n a pas grande sgnfcaon à dae donnée. En praque, la pondéraon sera soumse à des ausemens pour non-réponse e redressemen. 27
La pondéraon ransversale dans le cas de SILC Rappel : nférence sur Ω, à la dae courane. Consdérons un sous-échanllon panel donné, ré à 0. Dffculé prncpale : ce panel ne couvre correcemen la populaon Ω que l année de son rage, so 0. commen représener la populaon des «nassances» au-delà de 0? On ne peu pas échapper à un échanllon complémenare au panel. Pas de souc de bas avec les "mors" (problème dssymérque). 28
Soluon reenue : On décde, pour chaque ndvdu-panel enquêé lors du processus de suv longudnal, d nerroger l ensemble des ndvdus du ménage dans lequel se rouve l ndvdu-panel. Ménage enquêé = ndvdu(s) panel + cohabans sondage par grappes 29
Défau : méhodologe ne permean pas d aendre les ménages consués seulemen de «nassances» (ex : ménages 00% mmgrans) au-delà de la dae de rage du panel. Soluon à ce ulme problème : l'échanllon roaf car cerans panels enran au-delà de 0 (au mons celu ré à ) permeen d'aendre ces ménages. L 30
Pondéraon à l'ade de la MGPP L approche la plus rgoureuse consse à reler l ensemble des neuf sous-échanllons panel l échanllon ransversal u ~ de l année. a, k (so a, k k= 9 U ) à Défnon du len : un ndvdu-panel quelconque de l un des neuf sous-échanllons a, pone sur lu-même en an qu ndvdu de l échanllon ransversal à. k 3
32
W = pods ransversal d un ndvdu de u ~ m = ménage auquel apparen. En régme saonnare, W 9 k= m a, = 9 k= W k m Ω (, k) k+ où W (, k) = pods de assocé à l échanllonnage a, k. Le numéraeur : somme de ous les pods «brus» de ous les ndvdus-panels du ménage, Le dénomnaeur : pour chacune des neuf années 8 à consdérées, nombre d'ndvdus du ménage (ndvduspanels ou cohabans) présens dans la base de sondage ulsée pour le rage du panel enran l année en queson. Ce calcul nécesse évdemmen la dsponblé de l nformaon va le quesonnare!!! 33
Propréés, mses en garde Tous les ndvdus d un même ménage on le même pods. La roaon assure que le nombre oal de lens (dénomnaeur) es non nul pour chaque ménage exsan à les pods ransversaux son "sans bas" ou à peu près : la (probable) sous-esmaon du nombre de lens es (en pare?) corrgée par l ulsaon d'un redressemen. Un ndvdu-panel n apparaî généralemen que dans un seul sous-échanllon (mas ce peu êre davanage). S un ndvdu n a pas changé de logemen, l ne peu pas apparare dans deux panels dsncs. Comme dans le cas longudnal, le sysème nformaque do raacher chaque ndvdu-panel de u ~ à l ensemble des échanllons panels a, dans lesquels l se rouve. k Penser au quesonnare : l fau la dae de nassance des nouveau-nés, la dae d enrée des mmgrans, ec. 34
35 Phase d'nalsaon La phase d nalsaon (2004 à 20 comprs) nécesse des adapaons. 2004 : pas de parage des pods ( er rage) 2005 : ( ) + = Ω Ω = 2004 2005, 8, 9 m m k a m k k W W 2006 : ( ) + + = Ω Ω Ω = 2004 2005 2006, 7, 9 m m m k a m k k W W
Esmaon fnale Fnalemen, pour l esmaon de la dfférence on pourra calculer *, + = Y + Y, ˆ * + +, + = W Y ~ ~ u + u W Y 36
Bblographe : P. Ardlly, «Les echnques de sondage», 2 nde édon, Technp, 2006. P. Ardlly e P. Lavallée, Pondéraon dans les échanllons roafs : le cas de l'enquêe SILC en France, Technques d'enquêe, déc 2007, Vol. 33, N 2. P. Lavallée, «Le sondage ndrec, ou la méhode généralsée du parage des pods», Edons de l Unversé de Bruxelles e Edons Ellpses, 2002. * * * * 37