EQUETES et SODAGES STA 108 011-01 Iterveats : G.Saporta (CAM), P.Périé (IPSOS), S.Rousseau (ISEE) Pla du cours: 1
Ouvrages recommadés: J.ATOIE Histoire des sodages (Odile Jacob, 005) P.ARDILLY Les techiques de sodage, ème éditio (Techip, 006) P.ARDILLY, Y.TILLE Exercices corrigés de méthodes de sodage (Ellipses, 003) A.M. DUSSAIX, J.M. GROSBRAS Exercices de sodages (Ecoomica, 199) SYTEC Etudes Marketig et Opiio - Fiabilité des méthodes et boes pratiques (Duod, 007) Y.TILLÉ Théorie des sodages (Duod, 001) Sites iteret: Cours de statistique : http://www.agro-motpellier.fr/cam-lr/statet/ Autorité de la statistique publique http://www.autorite-statistiquepublique.fr CIS http://www.cis.fr/ ISEE : http://www.isee.fr IPSOS: http://www.ipsos.fr/ Assoc. Iter. Statisticies d equête: http://isi.cbs.l/iass/allfr.htm SYTEC Etudes http://www.sytec-etudes.com/ 3
Itroductio: aperçu du secteur La statistique publique: 8000 employés dot 5800 à l ISEE Ue orgaisatio teraire: Le Coseil atioal de l'iformatio statistique (Cis) assure e amot la cocertatio etre ses producteurs et ses utilisateurs. Le service statistique public (Isee et services statistiques miistériels ) est le moteur das sa coceptio, sa productio et sa diffusio. L'Autorité de la statistique publique veille au respect des pricipes d'idépedace professioelle, d'impartialité, d'objectivité, de pertiece et de qualité das so élaboratio et sa diffusio. 4
u secteur privé qui e coait pas la crise Près de 400 istituts d étude de marché et d opiio idetifiés e Frace Marché estimé de milliards d'euros e 010 Eviro 1 000 persoes, hors equêteurs 5
6
L opiio: ue faible part de l activité des istituts Source: rapport Portelli-Sueur, Séat 7
8
Ue histoire récete 1895 Kiaer, déombremets représetatifs 195 Jese, 1934 eyma: la théorie 1936 Electio de Roosevelt 1938 Fodatio de l IFOP 195 Horvitz et Thompso, Sodages à probabilités iégales 1965 Ballottage De Gaulle 9
LES TECHIQUES DE SODAGE Problèmes essetiels: Sélectio de l échatillo; Agrégatio des réposes estimateur; précisio; 10
Les pricipales étapes source: P.Ardilly 11
LES TECHIQUES DE SODAGE Méthodes aléatoires: Plas de sodage Simples: - à probabilités égales - à probabilités iégales Complexes: - stratifié - e grappe - plusieurs degrés 1
LES TECHIQUES DE SODAGE Méthodes par choix raisoé ou judicieux: Quotas; Itiéraires; Uités types; Volotariat; Échatilloage sur place; 13
14
Représetativité 15
Représetativité otio peu scietifique Souvet cofodue avec le respect de certaies proportios (modèle réduit) U sodage à probabilités iégales, u sodage stratifié ou à plusieurs degrés peuvet être représetatifs e u autre ses: Sodage extrapolable : probabilités d iclusio coues et o ulles 16
Fluctuatios et biais Fluctuatios d échatilloage : avec les mêmes probabilités d iclusio, répéter q fois u sodage doera q résultats différets Y y1, y,..., yq Sas biais: si la moyee des moyees de tous les échatillos possibles est égale à la moyee de la populatio (pas d écart systématique) 17
SODAGE ALEATOIRE SIMPLE otatios: Populatio ou base de sodage: Idetifiat: i Variable d itérêt: Y (Y1, Y Y) 1 Y= Y i ; i=1 T = Y i= 1 i σ 1 = Yi Y i= 1 ( ) ; S 1 = ( Y Y) = i 1 1 i= 1 σ 18
SODAGE ALÉATOIRE SIMPLE Défiitio: tirage équiprobable sas remise de uités; Taux de sodage: = τ échatillos possibles; π i C probabilité d iclusio (pla de taille fixe): Équiprobabilité: Remarque: π i πi = = τ = s ( i s) p() s i= 1 π = i 19
SODAGE ALÉATOIRE SIMPLE Estimatio du total et de la moyee: y - estimateur de Y y - estimateur de T Ey () = Y ; E( y) = T Démostratio avec les variables de Corfield δ i 1 = 0 si i si i y y i i= T = = π s s E( δ ) = π i i V( δ ) = π ( 1 π ) cov( δ ; δ ) = π ππ Yiδ i π is is i i= 1 i Yi = δi = i = i= 1πi i= 1 ET ( ) E( ) Y T i i i i j ij i j y i =variable aléatoire; Y i = variable o aléatoire 0
SODAGE ALEATOIRE SIMPLE Covariace etre variables de Corfield cov( δ ; δ ) = π ππ = π τ π ij i j ij i j ij C ( 1) 1 = ps () = = = τ C ( 1) 1 {, } sij s τ(1 τ) cov( δi; δ j) = 1 Variace de la moyee 1 1 V( y) = V Yiδ i Y ( ) cov( ; ) i V δi YY i j δi δ j = + i= 1 i= 1 i j τ(1 τ) YY i j τ(1 τ) S = Y (1 ) i = S = τ i= 1 i j 1 1
SODAGE ALÉATOIRE SIMPLE Variaces: V ( y) = (1 τ ) V Tˆ S ( ) = (1 τ ) Estimatio de S : 1 s = ( y y) i 1 i s Es ( ) = S S s V( y) = (1 τ ) ˆ s VT ( ) = (1 τ )
SODAGE ALÉATOIRE SIMPLE Itervalles de cofiace pour u paramètre d itérêt («fourchette») Itervalle ayat ue probabilité 1-α (iveau de cofiace) de coteir la vraie valeur du paramètre. α risque d erreur, gééralemet partagé de faço symétrique α/ et α/ écessite de coaitre au mois approximativemet la distributio de probabilité de l estimateur La logueur de l itervalle dimiue avec et augmete avec le iveau de cofiace et avec la variace de l estimateur (elle-même foctio de la variace de la populatio) 3
Le théorème «cetral limite» La moyee d u échatillo de observatios idépedates issues d ue populatio de moyee μ et d écart-type σ coverge si augmete vers ue loi ormale: σ ( μ; ) Illustratio aimée: http://www.vias.org/simulatios/simusoft_celiit.html >30 est souvet suffisat Celimit.exe 4
Itervalle de cofiace théorique pour ue moyee Tirages idépedats (avec remise) et >30 σ y u < Y < y+ u pour α = 5% u α/ α/ Tirages sas remise O pourra admettre que: α / Si le taux de sodage est faible la précisio e déped pas de σ S S y uα/ 1 τ < Y < y + uα/ 1 τ 5
Itervalles de cofiace estimés à 95% Pour ue moyee: 1 τ 1 τ y s < Y< y+ s Pour u pourcetage: y = pˆ fréquece observée p(1 p) Vp () ˆ = (1 τ) 1 Y i 1 = 0 pˆ(1 pˆ) pˆ(1 pˆ) Vp () ˆ = (1 τ) si τ faible 1 Y = p ˆ(1 ˆ) ˆ(1 ˆ) ˆ p p p p pˆ p < < + p 6
Calculs de taille d échatillo Pour ue précisio fixée 1 τ 1 Δ= S d'où = Δ 1+ 4S écessite de coaitre S! 7
Pour ue proportio Si grad et τ faible Δ= p(1 p) 4 p(1 p) d'où = Δ Utile si o coait approximativemet p a priori Ardilly, 006 Ardilly, 006 8
Solutio prudete (ou pessimiste) Se placer das le cas p=0.50 avec α=0.05 1 Δ 9
Pour τ fort, das le cas p=0.50 avec u iveau de cofiace de 95%: 1+ Δ 30
Précisio absolue ou précisio relative? Pour ue populatio rare, o aboutit à ue taille d échatillo souvet excessive Viser u Δ/p chage tout Compromis à faire quad il y a plusieurs variables d itérêt Attetio aux o-réposes: la précisio déped du ombre de répodats 31