Méthodes quantitatives en Sociologie (Rappels) types de variables moyennes, écarts types, quantiles effectifs, fréquences histogramme table de fréquences cumulées densité loi des grands nombres 21/01/00 1/36
Plusieurs types de variabless 1.type de valeur 1. qualitatif (nominal) 2. quantitatif discret (qualitatif ordinal) 3. quantitatif continu 2.ensemble de valeurs 1. ouvert 2. fermé 3.multiplicité 1. unique 2. multiple 21/01/00 2/36
Université P ul Valéry Variable qualitative type de valeur qualitatif (nominal) quantitatif discret (qualitatif ordinal) quantitatif continu couleur des yeux, sexe, cheveux, catégorie socio-professionnelle,... ensemble de valeurs fermé 21/01/00 3/36
Variable quantitative continue type de valeur: qualitatif (nominal) quantitatif discret (qualitatif ordinal) quantitatif continu longueur, poids, taille, âge,... ensemble de valeurs ouvert 21/01/00 4/36
Variable quantitative discrète type de valeur: qualitatif (nominal) quantitatif discret (qualitatif ordinal) quantitatif continu nombre d enfants, années d études,... ensemble de valeurs fermé 21/01/00 5/36
Variable qualitative ouverte type de valeur: qualitatif (nominal) quantitatif discret (qualitatif ordinal) quantitatif continu sport préféré, profession,... ensemble de valeurs ouvert 21/01/00 6/36
Université P ul Valéry Variable à valeurs multiples type de valeur: qualitatif (nominal) quantitatif discret (qualitatif ordinal) quantitatif continu sports pratiqués, âges des enfants, CSP des frères et soeurs,... ensemble de valeurs ouvert ou fermé 21/01/00 7/36
Résumer une mesure Mode Médiane (et quantiles) Moyenne Variance Ecart type 21/01/00 8/36
Variable qualitative Mode Médiane (et quantiles) Moyenne Variance Ecart type type d'achat # prêts véhicule 262 mobilier 61 divers 46 trésorerie 41 Valeur dont l effectif est le plus élevé 21/01/00 9/36
Variable quantitative Mode Médiane (et quantiles) Moyenne Variance Ecart type x = 1 n i=n x i i=1 nom note Alain 3 Bernard 6 Catherine 8 Danièle 4 Eric 2 Françoise 1 somme 24 moyenne 4 Somme des valeurs/effectif total 21/01/00 10/36
Variable quantitative Mode Médiane (et quantiles) Moyenne Variance (empirique) Ecart type v = σ 2 (x) = x 2 x 2 A B C D nom note écart^2 note^2 Alain 3 1 9 Bernard 6 4 36 Catherine 8 16 64 Danièle 4 0 16 Eric 2 4 4 Françoise 1 9 1 moyennes 4,00 5,67 21,67 Variance 5,67 Moyenne des carrés des écarts à la moyenne 21/01/00 11/36
La variance v = σ 2 (x) = (x x ) 2 = x 2 2 x x + x 2 v = σ 2 (x) = x 2 2 x x + x 2 = x 2 x 2 21/01/00 12/36
Variable quantitative Mode Médiane (et quantiles) Moyenne Variance Ecart type (empirique) σ(x) = σ 2 (x) = x 2 x 2 nom note Alain 3 Bernard 6 Catherine 8 Danièle 4 Eric 2 Françoise 1 Variance 5,67 Ecart type 2,38 Moyenne quadratique des écarts à la moyenne 21/01/00 13/36
Université P ul Valéry La variance sans biais (non empirique) Demimoyenne des carrés des écarts v = σ 2 (x) = sb 21/01/00 14/36 nom note A B C D E F Alain 3 0 9 25 1 1 4 Bernard 6 9 0 4 4 16 25 Catherine 8 25 4 0 16 36 49 Danièle 4 1 4 16 0 4 9 Eric 2 1 16 36 4 0 1 Françoise 1 4 25 49 9 1 0 Variance 5,67 6,67 9,67 21,7 5,67 9,67 14,7 V. sans biais 6,8 8 11,6 26 6,8 11,6 17,6 1 2n(n 1) i=n, j=n i=1, j=1, j i (x i x j ) 2
Variable quantitative Mode Médiane (et quantiles) Moyenne Variance Ecart type nom note Françoise 1 Eric 2 Alain 3 Danièle 4 Bernard 6 Catherine 8 Médiane 3,5 Valeur partageant la population en 2 moitiés 21/01/00 15/36
Représentation graphique Camembert Histogramme Histogramme de Pareto Fonction de répartition 21/01/00 16/36
Variable qualitative Camembert Histogramme Histogramme de Pareto Fonction de répartition type d'achat # prêts divers 46 mobilier 61 trésorerie 41 véhicule 262 # prêts type d'achat divers mobilier trésorerie véhicule 21/01/00 17/36
Université P ul Valéry Variable qualitative Camembert Histogramme Histogramme de Pareto Fonction de répartition type d'achat # prêts véhicule 262 mobilier 61 divers 46 trésorerie 41 type d'achat 300 # prêts 200 100 0 véhicule mobilier divers trésorerie 21/01/00 18/36
Université P ul Valéry Variable quantitative Camembert Histogramme Histogramme de Pareto Fonction de répartition 3 2,5 tranche effectif nom note tranche effectif Françoise 1 1 à 3 3 Eric 2 4 à 6 2 Alain 3 7 à 9 1 Danièle 4 Bernard 6 Catherine 8 2 1,5 1 0,5 0 1 à 3 4 à 6 7 à 9 21/01/00 19/36
Variable quantitative Camembert Histogramme Histogramme de Pareto Fonction de répartition 6 5 4 3 A B C D tranche effectif 0 0 1 à 3 3 3 3 2 1 4 à 6 2 6 5 7 à 9 1 9 6 0 0 5 10 21/01/00 20/36 peut aussi être calculée sur les données
Des effectifs à la densité nom note tranche effectif Françoise 1 1 à 3 3 Eric 2 4 à 6 2 Alain 3 7 à 9 1 Danièle 4 1 à 2 2 Bernard 6 3 à 4 2 Catherine 8 5 à 6 1 7 à 8 1 3 2 1 0 3 2 1 1 à 3 4 à 6 7 à 9 0 1 à 2 3 à 4 5 à 6 7 à 8 21/01/00 21/36
Des effectifs à la densité effectif tranche densité 3 1 à 3 1,00 2 4 à 6 0,67 1 7 à 9 0,33 2 1 à 2 1,00 2 3 à 4 1,00 1 5 à 6 0,50 1 7 à 8 0,50 1,00 0,90 0,80 0,70 0,60 0,50 0,40 0,30 0,20 0,10 1,00 0,90 0,80 0,70 0,60 0,50 0,40 0,30 0,20 0,10 0,00 1 à 3 4 à 6 7 à 9 0,00 1 à 23 à 45 à 67 à 8 21/01/00 22/36
Université P ul Valéry Calcul des quantiles: interpolation linéaire Données en tranches avec, pour chaque tranche: m, la valeur minimum de la tranche f(m), la fréquence cumulée en m d, la densité dans la tranche d = f (q) f (m) q m q = m + f (q) f (m) d 21/01/00 23/36
Université P ul Valéry q = m + Calcul des quantiles: interpolation linéaire f (q) f (m) d tranche fréquence densité m f(m) 1 à 2 3,333e-1 0,17 0,5 0,00% 3 à 4 33,33% 0,17 2,5 33,33% 5 à 6 1,667e-1 0,08 4,5 66,67% 7 à 8 1,667e-1 0,08 6,5 83,33% 8,5 100,00% Médiane: f(q)=50% (1/2) m = 3, f(m) = 33,33% (1/3), d=0,17 (1/6) q = 2,5 + (50%-33,33%)/0,17= 3,5 21/01/00 24/36
Boite à pattes (ou à moustaches) minimum 1er quartile médiane 3ème quartile maximum 21/01/00 25/36
Notion d espérance mathématique Exemple 1: lancer de pièce on lance la pièce (non pipée) un grand nombre de fois (n) on note le nombre de face l espérance mathématique est n/2 la moyenne est proche de n/2, et ce d autant plus que n est grand 21/01/00 26/36
Université P ul Valéry Notion d espérance mathématique Exemple 2: lancer de dé on lance le dé (non pipé) un grand nombre de fois (n) on note la moyenne des chiffres tirés l espérance mathématique est 7/2 la moyenne est proche de 7/2, et ce d autant plus que n est grand 21/01/00 27/36
Université P ul Valéry Notion d espérance mathématique La loi des grands nombres n variables aléatoires de même loi, d espérance mathématique a la moyenne tend, quand n augmente, vers l espérance mathématique x = 1 ( n X 1 +... + X n ) tend vers a certain 21/01/00 28/36
Loi de Laplace Gauss (normale) densité donnée par (moyenne α et écart-type σ): d(x) = 1 σ 2π e ( x α) 2 2σ 2 21/01/00 29/36
Loi normale la probabilité que la variable soit entre α 2σ et α+2σ est 95% σ 95% 2σ 21/01/00 30/36
Théorème central limite Soient n variables aléatoires d espérance 0 et de moment d ordre 2 (espérance du carré, variance) égal à σ 2 On s intéresse à la variable: x = 1 ( n X 1 +... + X n ) 21/01/00 31/36
Théorème central limite La densité de probabilité de la variable x tend vers une loi normale: d(x) = 1 σ 2π e x 2 2σ 2 21/01/00 32/36
Théorème central limite Applications dans la loi des grands nombres, l écart type de la moyenne est racine(n) la courbe des fréquences cumulées tend vers la fonction de répartition 21/01/00 33/36
Exemple de loi normale vous avancez en suivant toujours la même direction, en file indienne vous traversez une forêt: vous passez aléatoirement à droite ou à gauche des arbres qui sont sur votre chemin 21/01/00 34/36
Exemple de loi normale La probabilité de passer à droite est de 50% (donc également 50% à gauche) 21/01/00 35/36
Exemple de loi normale (2) La probabilité de passer à droite (dans le sens de la marche) est de 25% (donc 75% à gauche) 21/01/00 36/36