Sondage stratifié. Myriam Maumy. Master 1ère Année Strasbourg, France

Documents pareils
STA108 Enquêtes et sondages. Sondages àplusieurs degrés et par grappes

Théorie des sondages : cours 5

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

Exercices supplémentaires sur l introduction générale à la notion de probabilité

Calcul élémentaire des probabilités

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

Probabilité. Table des matières. 1 Loi de probabilité Conditions préalables Définitions Loi équirépartie...

La nouvelle planification de l échantillonnage

Chapitre 3 : INFERENCE

CONCEPTION ET TIRAGE DE L ÉCHANTILLON

Moments des variables aléatoires réelles

Annexe commune aux séries ES, L et S : boîtes et quantiles

Probabilités conditionnelles Loi binomiale

Les devoirs en Première STMG

Probabilités conditionnelles Exercices corrigés

C R É D I T A G R I C O L E A S S U R A N C E S. Des attitudes des Européens face aux risques

Bulletin de service Bureaux d agents, de courtiers en immeubles et d évaluateurs de biens immobiliersetdes autres activités liées à l immobilier

Probabilités. Rappel : trois exemples. Exemple 2 : On dispose d un dé truqué. On sait que : p(1) = p(2) =1/6 ; p(3) = 1/3 p(4) = p(5) =1/12

Probabilités. Une urne contient 3 billes vertes et 5 billes rouges toutes indiscernables au toucher.

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #16

Journal officiel de l Union européenne L 297/51

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

AC AB. A B C x 1. x + 1. d où. Avec un calcul vu au lycée, on démontre que cette solution admet deux solutions dont une seule nous intéresse : x =

I. Cas de l équiprobabilité

NOTIONS DE PROBABILITÉS

21 mars Simulations et Méthodes de Monte Carlo. DADI Charles-Abner. Objectifs et intérêt de ce T.E.R. Générer l'aléatoire.

Quelle est l influence d une réduction des prestations d 1/5, via le crédit-temps et l interruption de carrière, sur le revenu du ménage?

Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction.

Probabilités (méthodes et objectifs)

Echantillonnage INTRODUCTION. Module 1

Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie

CALCUL D UN SCORE ( SCORING) Application de techniques de discrimination LES OBJECTIFS DU SCORING

MARCHE PUBLIC EN PROCEDURE ADAPTEE POUR LA REALISATION D UN SONDAGE TELEPHONIQUE AUPRES DES HABITANTS DE L AGGLOMERATIONGRENOBLOISE

données en connaissance et en actions?

POKER ET PROBABILITÉ

LISTE D EXERCICES 2 (à la maison)

LA CONDUITE D UNE MISSION D AUDIT INTERNE

Séance 4. Gestion de la capacité. Gestion des opérations et de la logistique

Avis n sur la méthodologie relative aux comptes combinés METHODOLOGIE RELATIVE AUX COMPTES COMBINES

TP1 Méthodes de Monte Carlo et techniques de réduction de variance, application au pricing d options

Le modèle de Black et Scholes

Calcul du versement périodique 2015 GUIDE.

Les Français et les nuisances sonores. Ifop pour Ministère de l Ecologie, du Développement Durable et de l Energie

Les Français et le pouvoir d achat

Statistique Descriptive Élémentaire

Calcul du versement périodique 2014 Guide détaillé

TSTI 2D CH X : Exemples de lois à densité 1

Chapitre 3. Les distributions à deux variables

STRICTEMENT CONFIDENTIEL

L'amélioration des performances économiques des territoires : méthodologie des cartes de performance. Application à la liaison Grenoble Sisteron

La classification automatique de données quantitatives

INITIATION AUX METHODES DE SONDAGE

Probabilités. I Petits rappels sur le vocabulaire des ensembles 2 I.1 Définitions... 2 I.2 Propriétés... 2

Probabilités. C. Charignon. I Cours 3

Centre d'etudes Nucléaires de Fontenay-aux-Roses Direction des Piles Atomiques Département des Etudes de Piles

Observatoire Economique et Statistique d Afrique Subsaharienne

Évaluations aléatoires : Comment tirer au sort?

Car Insurance Survey. L assurance automobile RC chez les jeunes. Statistics Belgium. Rapport final

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Les principales méthodes d évaluation

TURBOS JOUR : DES EFFETS DE LEVIER DE x20, x50, x100 jusqu à x300!

LES FRANÇAIS, L ÉPARGNE & LA RETRAITE

COURS CALCULS FINANCIERS STATISTIQUE

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

Initiative socialiste pour des impôts équitables Commentaires Bernard Dafflon 1

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

La représentativité d un échantillon et son test par le Khi-deux Testing the representativeness of a sample

P1 : Corrigés des exercices

Gestion électronique des procurations

23. Interprétation clinique des mesures de l effet traitement

Que faire lorsqu on considère plusieurs variables en même temps?

Probabilités sur un univers fini

Probabilités Loi binomiale Exercices corrigés

Suites numériques. Exercice 1 Pour chacune des suites suivantes, calculer u 1, u 2, u 3, u 10 et u 100 : Introduction : Intérêts simpleset composés.

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

DOCUMENT POUR REMPLIR LA DÉCLARATION DES REVENUS DE 2013

Base de données PEGASE

Observatoire des politiques publiques :

Mesure du surendettement en Europe

MegaStore Manager ... Simulation de gestion d un hypermarché. Manuel du Participant

Probabilités sur un univers fini

FORMULAIRE DE STATISTIQUES

Prestations de soins et d assistance dispensées par les proches : temps investi et évaluation monétaire

Statistiques Descriptives à une dimension

Probabilités conditionnelles Loi binomiale

Fluctuation d une fréquence selon les échantillons - Probabilités

Chapitre 1 Régime transitoire dans les systèmes physiques

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

L ATTITUDE DES FRANÇAIS A L EGARD DE

REFERENTIEL PROFESSIONNEL DES ASSISTANTS DE SERVICE SOCIAL

I. Introduction. 1. Objectifs. 2. Les options. a. Présentation du problème.

Base de données individuelles pharmacies. Rencontre IMS Health Infostat

Calculs de probabilités conditionelles

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

DIRECTIVE 1999/2/CE DU PARLEMENT EUROPÉEN ET DU CONSEIL

Séries Statistiques Simples

PRIME D UNE OPTION D ACHAT OU DE VENTE

Transcription:

proportionnel 1 1 IRMA, Université Louis Pasteur Strasbourg, France Master 1ère Année 13-03-2006

proportionnel Ce chapitre s appuie essentiellement sur 2 ouvrages : 1 Les sondages : Principes et méthodes de Anne-Marie Dussaix et Jean-Marie Grosbras, aux éditions Que sais-je?. 2 Manuel de Sondages de Rémy Clairin et Philippe Brion, téléchargeable sur http ://ceped.cirad.fr/activite/publi/integral/html/manuels/pdf/ puis "manuels cpd 03.pdf"

proportionnel Exemple Notations Sommaire 1 Principe et objectifs 2 3 proportionnel 4 5

proportionnel Exemple Notations Dans un sondage aléatoire simple toutes les combinaisons de n unités de l échantillon parmi N éléments de la population U ont la même probabilité. Mais certaines d entre elles peuvent être indésirables.

proportionnel Exemple Notations Exemple Soit une population de 5 éléments. On relève sur ces 5 individus la variable d intérêt salaire annuel (en milliers d euros) : 13, 15, 17, 25, 30. Parmi les échantillons à 2 unités, on a 2 cas extrêmes (13, 15) et (25, 30) qui se révèlent mauvais s il s agit d estimer la moyenne µ = 13 + 15 + 17 + 25 + 30 5 = 20.

proportionnel Exemple Notations Il y a plusieurs types de classes dans cette population : des classes d individus à salaires modestes des classes d individus à salaires élevés. Il serait malencontreux que : les hasards de l échantillonnage conduisent à n interroger que des individus appartenant à une seule de ces catégories ou l échantillon soit trop déséquilibré en faveur de l une d elles.

proportionnel Exemple Notations Le but du jeu : Exclure les échantillons extrêmes et améliorer la précision des estimateurs du chapitre précédent. On a constaté qu à taille égale un échantillon est plus efficace dans une population homogène que dans une population hétérogène. Plus précisément, l erreur type d estimation est liée à la variance du caractère étudié dans la population.

proportionnel Exemple Notations Le but du jeu : Découper la population en sous-ensembles, appelés des strates, les plus homogènes possibles. Chaque sondage partiel s effectue de façon efficace et l assemblage des sondages partiels précis donnera des résultats plus fiables qu un sondage de même taille effectué en vrac.

proportionnel Exemple Notations Quelques exemples : Les échantillons de ménages ou d invidus, dans les enquêtes usuelles, sont stratifiés par région croisée par type d habitat (taille des communes). Les échantillons d entreprises sont stratifiés par secteur et par taille, exprimée en effectifs salariés ou chiffre d affaires. Les échantillons d exploitations agricoles sont stratifiés par tranches de surface. Les échantillons de jeunes sortis de l enseignement supérieur sont stratifiés par discipline, etc...

proportionnel Exemple Notations Retour à l exemple : Pour une étude sur le salaire annuel, il sera pertinent d utiliser des critères liés : à l âge, au niveau d études, éventuellement au sexe, c est-à-dire à des facteurs susceptibles d expliquer les différences de comportement au niveau des salaires.

proportionnel Exemple Notations Définition Stratifier correspond souvent à un objectif de réduction des coûts d enquête ou d optimisation de sa gestion. C est en particulier le cas : lorsque l on utilise un critère de découpage géographique comme la région, ou, dans les échantillons d entreprises, un critère sectoriel, ce qui permet alors, de spécialiser les enquêteurs.

proportionnel Exemple Notations Retour à l exemple : Supposons que l on sache, a priori, que les 3 premiers individus forment une catégorie de petits salaires et que les 2 derniers soient catalogués gros salaires. On décide alors que l échantillon de 2 individus doit être constitué d un représentant de chaque strate. Les échantillons possibles sont dans ce cas au nombre de 6. Chacun des 3 individus de la première strate pouvant être associé à l un des 2 autres de la seconde strate.

proportionnel Exemple Notations Notons x 1 et x 2 les valeurs obtenues dans l échantillon. On ne peut plus, comme dans le chapitre précédent, en faire la moyenne arithmétique simple. En effet, l unité échantillonnée dans la première strate est désignée pour en représenter 3, celle de la deuxième strate vaut pour 2. Il convient alors de pondérer chaque valeur x i par le poids de la strate dont la valeur x i est issue. Si µ st désigne le résultat, on a alors : µ st = 3 5 x 1 + 2 5 x 2.

proportionnel Exemple Notations Le tableau ci-dessous représente l ensemble de tous les cas possibles. Échantillons avec stratification x 1 13 13 15 15 17 17 x 2 25 30 25 30 25 30 µ st 17, 8 19, 8 19 21 20, 2 22, 2 D autre part, on vérifie que la moyenne des 6 valeurs pour µ st est µ = 20. Cela signifie que la variable aléatoire µ st a µ pour espérance mathématique. Donc µ st est un estimateur sans biais pour µ.

proportionnel Exemple Notations On remarque surtout que la plage des estimations est beaucoup plus resserée autour de la cible que dans le cas du sondage aléatoire simple. En effet : les valeurs extrêmes sont moins éloignées, l écart-type vaut 1, 40 au lieu de 3, 95.

proportionnel Exemple Notations On peut maintenant décrire la méthode générale. Pour cela, on va avoir besoin d introduire quelques notations. Par la suite, on se placera dans le cas d un tirage aléatoire simple sans remise, à l intérieur de chaque strate.

proportionnel Exemple Notations Pour la strate h de la population U : L effectif de la strate h est égal à N h. La moyenne d une variable d intérêt X est égale à µ h = 1 N h X k. N h k=1 La variance corrigée d une variable d intérêt X est égale à S 2 h,c = 1 N h 1 N h (X k µ h ) 2. k=1

proportionnel Exemple Notations Pour la strate h de l échantillon S : L effectif de l échantillon propre à la strate h est égal à n h. Un estimateur de la moyenne dans la strate h est égal à µ h = 1 n h x k. n h k=1 La variance corrigée dans la strate h est égale à s 2 h,c = 1 n h 1 n h (x k µ h ) 2. k=1

Sommaire Principe et objectifs proportionnel Estimation de la moyenne à partir du sondage stratifié Estimation du total à partir du sondage stratifié Estimation d une proportion à partir du sondage stratifié Variance de l estimateur de la moyenne Variance de l estimateur du total Estimation de la variance de l estimateur de la moyenne Estimation de la variance de l estimateur du total Application numérique 1 Principe et objectifs 2 3 proportionnel 4 5

proportionnel Estimation de la moyenne à partir du sondage stratifié Estimation du total à partir du sondage stratifié Estimation d une proportion à partir du sondage stratifié Variance de l estimateur de la moyenne Variance de l estimateur du total Estimation de la variance de l estimateur de la moyenne Estimation de la variance de l estimateur du total Application numérique Définition L estimateur de la moyenne µ d une population U par sondage stratifié se définit par : Propriété µ st = H h=1 N h N µ h. On montre, par calcul, que cet estimateur est sans biais, i.e. E [ µ st ] = µ.

proportionnel Estimation de la moyenne à partir du sondage stratifié Estimation du total à partir du sondage stratifié Estimation d une proportion à partir du sondage stratifié Variance de l estimateur de la moyenne Variance de l estimateur du total Estimation de la variance de l estimateur de la moyenne Estimation de la variance de l estimateur du total Application numérique Définition L estimateur du total T d une population U par un sondage stratifié se définit par : T st = H N h µ h. h=1 Propriété On montre, par calcul, que cet estimateur est sans biais, i.e. ] E [ Tst = T.

proportionnel Estimation de la moyenne à partir du sondage stratifié Estimation du total à partir du sondage stratifié Estimation d une proportion à partir du sondage stratifié Variance de l estimateur de la moyenne Variance de l estimateur du total Estimation de la variance de l estimateur de la moyenne Estimation de la variance de l estimateur du total Application numérique Cette formule peut aussi s écrire sous la forme : T st = ( ) H 1 n h N h x k = h=1 n h k=1 ( H nh ) N h x k. n h h=1 k=1 On remarque, dans la formule précédente, que x k est pondérée par le coefficient N h n h, appelé coefficient d extrapolation (dont la valeur dépend de la strate h), afin d extrapoler (ou d étendre ) les résultats à la population U.

proportionnel Estimation de la moyenne à partir du sondage stratifié Estimation du total à partir du sondage stratifié Estimation d une proportion à partir du sondage stratifié Variance de l estimateur de la moyenne Variance de l estimateur du total Estimation de la variance de l estimateur de la moyenne Estimation de la variance de l estimateur du total Application numérique Définition L estimateur d une proportion π A d une population ayant la caractéristique A se fait, comme présenté au chapitre 1 bis, par l estimateur de la moyenne d une variable d intérêt qui vaut 1 si l unité a la caractéristique étudiée 0 si l unité n a pas la caractéristique étudiée.

proportionnel Estimation de la moyenne à partir du sondage stratifié Estimation du total à partir du sondage stratifié Estimation d une proportion à partir du sondage stratifié Variance de l estimateur de la moyenne Variance de l estimateur du total Estimation de la variance de l estimateur de la moyenne Estimation de la variance de l estimateur du total Application numérique Propriété On montre, par calcul, que Var [ µ st ] = H h=1 ( ) 2 Nh (1 f h ) S2 h,c N n h où f h = n h est le taux de sondage correspondant et Sh,c 2 est la N h variance corrigée définie auparavant.

proportionnel Estimation de la moyenne à partir du sondage stratifié Estimation du total à partir du sondage stratifié Estimation d une proportion à partir du sondage stratifié Variance de l estimateur de la moyenne Variance de l estimateur du total Estimation de la variance de l estimateur de la moyenne Estimation de la variance de l estimateur du total Application numérique Propriété On montre, par calcul, que ] Var [ Tst = H h=1 N 2 h (1 f h) S2 h,c n h. Comment démontrez-vous ces formules? Ces formules posent un problème. Lequel?

proportionnel Estimation de la moyenne à partir du sondage stratifié Estimation du total à partir du sondage stratifié Estimation d une proportion à partir du sondage stratifié Variance de l estimateur de la moyenne Variance de l estimateur du total Estimation de la variance de l estimateur de la moyenne Estimation de la variance de l estimateur du total Application numérique Pour répondre à la dernière question posée, on définit les deux quantités suivantes : Définition Un estimateur de la variance de µ st se définit par Var [ µ st ] = H h=1 ( ) 2 Nh (1 f h ) s2 h,c N n h où f h est le taux de sondage correspondant et sh,c 2 est la variance corrigée définie auparavant.

proportionnel Estimation de la moyenne à partir du sondage stratifié Estimation du total à partir du sondage stratifié Estimation d une proportion à partir du sondage stratifié Variance de l estimateur de la moyenne Variance de l estimateur du total Estimation de la variance de l estimateur de la moyenne Estimation de la variance de l estimateur du total Application numérique Définition Un estimateur de la variance de µ st se définit par ] Var [ Tst = H h=1 N 2 h (1 f h) s2 h,c n h Ces deux estimations de la variance permettent de calculer l écart-type de chaque estimateur. Par conséquent, comme au chapitre 1 bis, on peut construire des intervalles de confiance pour ces estimateurs.

proportionnel Estimation de la moyenne à partir du sondage stratifié Estimation du total à partir du sondage stratifié Estimation d une proportion à partir du sondage stratifié Variance de l estimateur de la moyenne Variance de l estimateur du total Estimation de la variance de l estimateur de la moyenne Estimation de la variance de l estimateur du total Application numérique Exemple Une société bancaire compte 50 000 clients répartis en : 40 000 «petits»clients 10 000 «gros»clients. Soit un sondage portant sur 200 clients répartis en : 160 «petits» 40 «gros». On s intéresse au montant moyen µ des comptes au moment de l enquête et à la proportion π des clients prêts à souscrire au nouveau produit financier.

proportionnel Estimation de la moyenne à partir du sondage stratifié Estimation du total à partir du sondage stratifié Estimation d une proportion à partir du sondage stratifié Variance de l estimateur de la moyenne Variance de l estimateur du total Estimation de la variance de l estimateur de la moyenne Estimation de la variance de l estimateur du total Application numérique Exemple Le dépouillement du sondage donne les résultats suivants : Statistiques Strate 1 Strate 2 Effectif population N 1 = 40 000 N 2 = 10 000 Effectif échantillon n 1 = 160 n 2 = 40 Montant moyen µ 1 = 12 µ 2 = 58 Variance observée s1 2 = 85 s2 2 = 930 Écart-type s 1 = 9, 22 s 2 = 30, 50 Clients favorables x 1 = 8 x 2 = 22 Proportion π 1 = 5% π 2 = 55%

proportionnel Estimation de la moyenne à partir du sondage stratifié Estimation du total à partir du sondage stratifié Estimation d une proportion à partir du sondage stratifié Variance de l estimateur de la moyenne Variance de l estimateur du total Estimation de la variance de l estimateur de la moyenne Estimation de la variance de l estimateur du total Application numérique Estimation de µ : µ st = 40 000 50 000 000 12+10 58 = 0, 8 12+0, 2 58 = 21, 2 50 000 Var[ µ st ] = 0, 64 0, 996 85 159 Écart-type 1, 29 1, 14 Intervalle de confiance à 95% pour µ : +0, 04 0, 996 930 39 µ [21, 2 ± 1, 96 1, 14], 1, 29 c est-à-dire : µ [18, 97; 23, 43].

proportionnel Estimation de la moyenne à partir du sondage stratifié Estimation du total à partir du sondage stratifié Estimation d une proportion à partir du sondage stratifié Variance de l estimateur de la moyenne Variance de l estimateur du total Estimation de la variance de l estimateur de la moyenne Estimation de la variance de l estimateur du total Application numérique Estimation de π : π st = 0, 8 0, 05 + 0, 2 0, 55 = 15% Var[ 0, 05 0, 95 π st ] = 0, 64 0, 996 + 0, 04 0, 996 159 0, 55 0, 45 4, 433 10 4 39 Écart-type 4, 433 10 2 2, 11% Intervalle de confiance à 95% pour π : π [10, 87%; 19, 13%].

proportionnel Sommaire 1 Principe et objectifs 2 3 proportionnel 4 5

proportionnel Les formules ci-dessus sont valables quels que soient les nombres d unités statistiques tirées par strate. Le taux de sondage f h peut donc être variable d une strate h à une autre. Définition Quand on impose un taux de sondage f = n N = n h N h = f h identique pour toutes les strates, alors le sondage est appelé sondage stratifié proportionnel.

proportionnel C est ainsi que, dans un échantillon d individus stratifié par sexe, les hommes et les femmes figurent au prorata de leur effectif dans la population étudiée. Dans l application numérique du paragraphe précédent, on a considéré un échantillon représentatif de la population des petits clients et des gros clients.

proportionnel Là encore, il faut prendre garde à la définition exacte des termes utilisés. Définition Le terme représentatif signifie que l échantillon a été dosé pour représenter une répartition d effectifs dans la population. Il ne signifie pas que le sondage soit parfait, sans erreurs, ni même que la répartition soit la meilleure possible! Il est donc préférable, pour éviter les ambiguïtés, de parler d échantillon proportionnel.

proportionnel Propriétés Les propriétés de l échantillon proportionnel sont importantes : Les probabilités de sélection sont égales pour tous les éléments de la base de sondage. Elles valent le taux de sondage unique f = n/n. L estimation de la moyenne µ vaut alors : µ st = 1 H ( nh n h=1 k=1 x k), où n est la taille de l échantillon. C est donc la moyenne simple calculée sur l échantillon qui permet d estimer la moyenne sur la population. On a un sondage autopondéré.

proportionnel Propriété La variance de l estimateur µ st est égale à : Var [ µ st ] = (1 f ) n ( H h=1 N h N S2 h,c Cette formule montre bien que plus les strates sont homogènes (variance intra-strates faible), plus la stratification est efficace. ).

proportionnel On montre que cette variance est liée à la variance de l estimateur µ issu du SAS obtenu à partir du même nombre d unités tirées. En effet, on a : Var [ µ ] = Var [ µ st ] + (1 f ) n H h=1 N h N ( X h µ ) 2. Que pouvez vous déduire de la dernière égalité qui porte sur les variances?

proportionnel On en déduit que le sondage stratifié représentatif a une variance d estimateur toujours plus petite ou égale à la variance de l estimateur du sondage aléatoire simple. La variance de l estimateur sera d autant plus petite que les strates ont des moyennes différentes de µ.

proportionnel On explique ce résultat en se rappelant que Définition Le sondage stratifié est basé sur le principe de : forcer le hasard imposer à l échantillon de représenter la population strate par strate.

proportionnel Retour à l estimation du montant moyen des comptes des clients de la société bancaire. On a : µ st = µ = 21, 2 s 2 intra = 0, 8 85 + 0, 2 930 = 254.

proportionnel Si les mêmes données étaient issues d un sondage aléatoire simple, on aurait : Var[ µ st ] 338, 56 + 254 200 = 2, 96 mais elles sont issues d un sondage stratifié proportionnel, donc : Var[ µ st ] 254 = 1, 27. 200 La variance d échantillonage a donc diminué de 57%.

proportionnel Peut-on encore améliorer les résultats? Oui, on peut améliorer les résultats en faisant du sondage stratifié proportionnel, comme nous venons de le voir.

proportionnel Sommaire 1 Principe et objectifs 2 3 proportionnel 4 5

proportionnel L idée : Déterminer des strates les plus homogènes possibles, par rapport au sujet étudié. Deux types de considérations vont conduire au choix des critères de stratification : 1. disponibilité des critères dans la base de sondage ; 2. pertinence des différents critères pour créer des strates homogènes. Ceci nécessite une connaissance soit intuitive, soit venant d études réalisées antérieurement.

proportionnel On prendra généralement comme critères : des critères relevant d une typologie (par exemple la catégorie sociale) ; des critères de taille (prenant par exemple en compte le nombre de personnes du ménage) ; souvent en les croisant ensemble.

proportionnel Au niveau des unités de sondage géographiques : Exemple : Pour les villes stratification selon la région, l activité dominante des localités. On sépare souvent milieu rural et milieu urbain. Au niveau des ménages ou des individus : Utilsation des critères qui peuvent être en corrélation avec le sujet d étude. Exemple : la CSP, le niveau d étude, la taille du ménage, le type d habitation, etc...

proportionnel Une stratification peut être : très efficace pour l étude d un phénomène, par exemple la mortalité, très peu efficace pour l étude d autres phénomènes, par exemple l activité économique. Cette situation se présente avec une acuité particulière lorsqu un échantillon est destiné à des études à objectifs multiples.

proportionnel Attention : Plus on multiplie les strates, plus le gain d efficacité devient faible. De plus, les résultats calculés au niveau de chaque strate ne sont plus significatifs en raison de la petite taille de l échantillon.

proportionnel Répartition représentative Répartition de Neyman Retour à l exemple Sommaire 1 Principe et objectifs 2 3 proportionnel 4 5

proportionnel Répartition représentative Répartition de Neyman Retour à l exemple La répartition représentative ou encore appelée allocation proportionnelle a déjà été présentée au paragraphe 3 de ce chapitre. Définition La répartition représentative consiste à utiliser le même taux de sondage f pour toutes les strates.

proportionnel Répartition représentative Répartition de Neyman Retour à l exemple Définition La répartition de Neyman ou encore appelée allocation optimale consiste à respecter l égalité : n h N h S h,c = constante = n. H N h S h,c h=1

proportionnel Répartition représentative Répartition de Neyman Retour à l exemple Cette répartiton utilise un taux de sondage f proportionnel à la dispersion S h,c de X étudiée dans chaque strate. Plus une strate est hétérogène vis-à-vis de X, plus on utilise un taux de sondage f important. La théorie montre que cette répartition est celle qui fournit la variance la plus faible une fois les strates déterminées.

proportionnel Répartition représentative Répartition de Neyman Retour à l exemple L application de la formule pour calculer la répartition de Neyman suppose connues a priori les valeurs S h,c. Ce peut être le cas à partir d études antérieures au sondage, mais en général il n en est pas ainsi. Lorsque le critère de stratification est la taille des unités, on constate que l écart-type est sensiblement proportionnel à la taille moyenne des unités de la strate. C est un ordre de grandeur de cette taille moyenne qu on utilise pour calculer la répartition des individus entre les strates.

proportionnel Répartition représentative Répartition de Neyman Retour à l exemple En pratique, on utilise la répartition de Neyman quand le phénomène étudié a une distribution très dissymétrique. Par contre, si ce phénomène a une distribution symétrique par rapport à sa moyenne, un sondage stratifié proportionnel fournit des résultats d une qualité suffisante.

proportionnel Répartition représentative Répartition de Neyman Retour à l exemple Exemple On tire un échantillon de 200 clients de la société bancaire. On a le choix entre : une répartition proportionnelle (les calculs ont déjà été faits) et la répartition de Neyman.

proportionnel Répartition représentative Répartition de Neyman Retour à l exemple Remarquons que l échantillon de Neyman dépend du caractère que l on veut estimer en priorité. C est pour ce caractère que l on prendra la variance en considération. En général, celle-ci ne sera pas connue a priori. Elle pourra être estimée à partir d une enquête antérieure ou d études limitées.

proportionnel Répartition représentative Répartition de Neyman Retour à l exemple Retour à l exemple L échantillon de Neyman est composé de : 110 «petits»clients contre 160 et de 90 «gros»clients contre 40, 90 pour tenir compte de la plus grande variance de ces derniers. Le calcul montre que la variance d échantillonnage aurait été égale à 0, 91 au lieu de 1, 27, soit un gain de 28% par rapport à la répartition proportionnelle.

proportionnel Répartition représentative Répartition de Neyman Retour à l exemple Ainsi, on perd en simplicité des calculs du cas «proportionnel»puisque l échantillon n est plus autopondéré, mais on gagne en précision. C est en vertu de considérations de cet ordre que, par exemple, les échantillons d entreprises stratifiées par tranches de taille (moins de 10 salariés, de 10 à 50 salariés, etc.) sont répartis, non pas au prorata du nombre d entreprises des tranches, mais au prorata du nombre total de salariés ou du chiffre d affaires total.