SONDAGE (ECHANTILLONNAGE) POPULATION STATISTIQUE N idividus possédat ue modalité yi de la (ou des) variable(s) y ( i N) PARAMETRES valeur cetrale dispersio corrélatio µ σ² ρ moyee variace coef. corr. ECHANTILLON idividus possédat ue modalité yi de la (ou des) variables(s) y ( i ) ESTIMATEURS valeur cetrale dispersio corrélatio σe²! r moyee variace coef. corr. STAT. PROBABILISTES ESTIMATION (INDUCTION STAT.) STAT. DESCRIPTIVES LOIS DE DISTRIBUTIONS DE PROBABILITES CARACTERISTIQUES D'UNE SERIE STATISTIQUE Echatillo : Collectio d'idividus prélevés das la populatio statistique. Sodage (tirage aléatoire) : Procédure de sélectio des élémets d'ue populatio pour costituer u échatillo représetatif de cette populatio. Estimatio (iférece) : calcul d'u paramètre de la populatio à partir de sa valeur prise das l'échatillo (estimateur). Dimesio : c est le couplage etre le ombre de paramètre (poids, taille ) et le ombre de méthode (ou techique) utilisé Loi de probabilités : modèle mathématique permettat de redre compte de phéomèes aléatoires.
THEORIE DE L ECHANTILLONNAGE Itroductio : Loi des grads ombres Quad o répète N fois ue expériece aléatoire et que l'o ote par f le ombre de fois que l'évéemet A s'est produit (f= fréquece de A) la probabilité p(a) est la limite, quad N ted vers l'ifii, de f/n (fréquece relative de A). De même que l'o parle de distributio de fréqueces o peut parler de distributio de probabilités. POPULATION INFINIE ECHANTILLON PROBABILITE p FREQUENCE RELATIVE f = F / P DISTRIBUTION DE PROBABILITES EX. : Variable qualitative : jeu de dé F DISTRIBUTION DE FREQUENCES ABSOLUES POUR = 000 TIRAGES / 6 67 50 90 45 75 60 80 3 4 5 6 3 4 5 6 P 0.0 0.8 0.6 0.4 0. 0.0 0.08 0.06 0.04 0.0 EX. : Variable quatitative F 00 80 60 40 0 00 80 60 40 0 = 000 0 3 4 5 6 7 8 9 0 0 3 4 5 6 7 8 90
De même pour u échatillo extrait d'ue populatio supposée ifiie : la fréquece relative d'ue classe est ue réalisatio de sa fréquece relative das la populatio, c'est-à-dire de la probabilité associée à cette classe. Gééralités - Objectifs Cosidéros ue populatio P composée de N idividus. Supposos qu il existe ue variable X associée à chaque idividu (exp. SAU pour ue exploitatio). Nous e coaissos pas la répartitio de X das la populatio cosidérée. La moyee µ et la variace σ (ou la proportio p) das la populatio P sot respectivemet : N N µ = x i = i= N σ ² (x i µ )² N i= Par sodage, o prélève u échatillo aléatoire de idividus das la populatio P. Soit x, x, x,, x les valeurs de X das l échatillo. La moyee x et la variace σ e (ou la proportio f) de X das l échatillo sot respectivemet : x = i= x i σ e = i= (x i x)² x et σ e costituet-elles des estimatios de µ et de σ? Si oui, quelle est leur précisio? Coaissat x et σ e, que peut-o dire de la moyee µ et la variace σ de la populatio totale P? 3
Les distributios d'échatilloage O prélève u échatillo de élémets das ue populatio de moyee µ et de variace σ². O obtiet ue moyee x et ue variace σ e. Si l'o répétait cette opératio u grad ombre de fois, o costaterait que les moyees obteues à partir de ce grad ombre d'échatillos de uités se distribueraiet suivat ue loi ormale de moyee " = µ et de variace σ² M = σ²/. Cela se vérifie : quelque soit la distributio de la variable étudiée si est suffisammet grad (>30 e pratique) quelque soit la taille de l'échatillo si celui-ci est tiré d'ue populatio ormale D'après le Théorème Cetral Limite, l'esemble de toutes les moyees qu'o pourrait obteir par des échatillos de uités est lui-même ue variable aléatoire M de distributio ormale N(µ,σ/ ). La distributio de M s'appelle distributio d'échatilloage de la moyee. O costate que la dispersio (σ²/) de cette variable est beaucoup plus faible que celle de la variable étudiée (σ²). 4
Distributio d'échatilloage d'u paramètre DISTRIBUTION (QUELCONQUE) DE LA VARIABLE f(x) σ N ELEMENTS (POPULATION D'ORIGINE) µ ON EXTRAIT INDEPENDAMMENT K ECHANTILLONS DE MEME TAILLE K ECHANTILLONS élémets élémets... élémets σe σe σe k x x xk K ESTIMATIONS DU PARAMETRE µ DISTRIBUTION D' ECHANTILLONNAGE DE LA MOYENNE f(x) K ESTIMATIONS Paramètre de la distributio : " = µ σ = σ / M σ M " M 5
Estimatio poctuelle de la moyee et de la variace! Théorème Soit X ue variable aléatoire défiie sur la populatio avec E(X) = µ et V(X) = σ². d après le théorème cetral limite : - E(M) = µ ; V(M) = σ²/ ; E( σe ) = σ²! Utilisatio E pratique, o dispose d'u seul échatillo de taille. Alors, la meilleure estimatio poctuelle (par u seul ombre) : de la moyee µ de la populatio est la moyee x de l'échatillo ( x est u estimateur sas biais de µ). de la variace σ² de la populatio est le ombre s² (dit variace estimée) s² - σ = e ( σ est u estimateur biaisé de σ²). e (s² est u estimateur o biaisé de σ²). 6
Estimatio poctuelle d u pourcetage La populatio est formée d'idividus ayat ou o u caractère doé A. Soit p la probabilité pour qu'u idividu pris au hasard das la populatio présete le caractère A.! Théorème F est ue variable aléatoire appelée la distributio d échatilloage des proportios. Elle suit ue loi ormale de moyee $ et de variace σ² F d après le théorème cetral limite : p(- p) E(F) = p ; V(F) =! Utilisatio Quad o dispose d'u seul échatillo de taille, la meilleure estimatio poctuelle de p est la fréquece f observée sur l'échatillo. f est u estimateur sas biais de p. 7
Erreur-type de la moyee et estimatio d ue moyee par u itervalle de cofiace! Théorème Quelle que soit la loi suivie par X de moyee µ et de variace σ², la distributio d'échatilloage de la moyee suit ue loi ormale de moyee µ et de variace σ²/. La variable Z = M µ σ suit ue loi ormale cetrée réduite.! Utilisatio avec u seul échatillo Variace de la populatio coue Nous voulos costruire u itervalle de cofiace autour de la moyee de l échatillo de maière à ce qu il cotiee µ das 95% des cas. D'après la table de la loi ormale réduite o peut écrire, pour u risque α=0.05 x - µ P (-.96 < σ < +.96) = 0.95 Plus gééralemet : σ σ P x - z < µ <x + z = -α α/ α/ 8
Variace de la populatio icoue Si l'o remplace le paramètre σ² par so estimateur das otre échatillo s², o peut calculer ue estimatio de la variace de la distributio de la moyee : var(m)=s²/ dot la racie carrée est appelée erreur-type (de la moyee). Lorsque σ est icou l'expressio x - µ σ est remplacée par x - µ s 'est pas distribuée ormalemet, mais comme u t de Studet. L'expressio deviet alors : qui P x - t α[ ν ] s < µ < x + t α[ ν ] s =- α!! µ! i α = risque d erreur t α[ν] : variable de studet au seuil α pour ν ddl (ν = - ) Ex. : t 0.05[9] =.045 t α[ν] z α/ quad ν Si l o répète idéfiimet l échatilloage de taille das la populatio de moyee µ, o sait que ( - α) itervalles de cofiace costruits de cette maière cotiedrot µ. 9
Estimatio d u pourcetage par u itervalle de cofiace f ombre d'idividu ayat le caractère A das u échatillo de taille, suit la loi biomiale B(, p). Si est grad et p, i voisi de 0 i voisi de, o peut approximer la loi biomiale B(, p) par la loi ormale N (p, pq).! Théorème La distributio d'échatilloage des proportios suit ue loi ormale de moyee p et de variace p(-p)/. La variable F p Z = suit ue loi ormale cetrée réduite. p( p)! Utilisatio avec u seul échatillo Nous voulos costruire u itervalle de cofiace autour de la proportio f de l échatillo de maière à ce qu il cotiee p das 95% des cas. D'après la table de la loi ormale réduite o peut écrire, pour u risque α=0.05 P (-.96 < f - p f( - f) < +.96) = 0.95 Plus gééralemet : f(- f) f(- f) P f - z p f z < < + -α α/ α/ = 0