Chap. Statistique descriptive et graphiques Terminologie anglais - français Représentations graphiques : - histogramme de Tukey - histogramme Indicateurs de centralité et position Indicateurs de variabilité Autres diagrammes : - diagramme de Tukey - diagramme quantile - quantile variables : - diagramme de dispersion conjointe - droite de moindres carrés - coefficient de corrélation linéaire TERMINOLOGIE anglais français Steam-and-leaf display.. histogramme de Tukey diagramme tige feuilles Box-Plot.. diagramme de Tukey Q-Q plot.. diagramme quantile - quantile Tally décompte Frequency effectif Relative frequency. fréquence ( fréquence relative ) Cumulative frequency.. effectif cumulé Relative cumulative frequency fréquence cumulée Standardized value valeur centrée réduite Frequency distribution. tableau d effectifs / distribution d effectifs / tableau de fréquences Histogramme de Tukey : histogramme avec le détail des valeurs numériques aperçu de la forme distribution, centre, données suspectes, Exemple: données observées de la variable X tige feuille effectif effectif cumulé total Histogramme pour une variable X continue valeurs de X : x, x,., x n n au moins Procédure. Déterminer valeur minimale et la valeur maximale des X. Choisir entre et intervalles contigus. Recenser les effectifs n i de chaque classe. Calculer les fréquences relatives : n i / n. Calculer la somme progressive des n i : effectifs cumulés. Calculer la somme progressive des n i / n
Exemple : écart = longueur sur machines observations toutes les heures: échantillon de pièces MACH_ tableau d'effectifs de à effectif cumul % % cumul -.<x<=-... -.<x<=-... -.<x<=-... -.<x<=-. 9. 9. -.<x<=....e-<x<=....<x<=....<x<=. 9 9. 9..<x<=.. 9..<x<=.. 9..<x<=.. 9..<x<=. 9. 99..<x<=... Histogrammes : exemples Exemple : données d écarts de longueurs p. r. à valeur nominale de unités Exemple : données = d écarts de longueurs p. r. à valeur nominale de - production sur machines Histogram ( v*c) ecart = *.*normal(x; -.9;.) Histogram (_KolarikMeterStick() [Hist & QQ].sta v*c) = *.*normal(x;.9;.) MACH_ = *.*normal(x; -.9;.9) = *.*normal(x; -.;.) -. -. -...... ecart -. -. -...... MACH_
Machine machine Indicateurs de centralité et de position -. -. -. -...9.. -.9 -. -. -.9 -. -. -..9 MACH_ 9 Machine toutes les données -. -. -..9.... -. -. -..9.... ecart remarque Il y a plusieurs façons de calculer les quantiles 9 Indicateurs de variabilité indicateurs de centralité et position : mesures d écarts sur la machine Étendue échantillonnale R = max { x i } - min { x i } Étendue interquartile IQR = x. - x. Écart type échantillonnal s = [ ( x i - x ) / (n ) ]. n moy Xbar médiane mode min max er quartile = ième percentile ième quartile = ième percentile Règle empirique % obs. dans x s et x + s 9% obs. dans x - s et x + s 99,9% obs. dans x - s et x + s,, pas unique -,, -,, Valeur centrée réduite z i = ( x i - x ) / s Propriétés z = s z =
Indicateurs de variabilité : MACH_ Règle empirique? n x min max R IQR s Machine x- s à x+s x- s à x + s x- s à x+ s -, à, -, à,, -,,,,9, sur MACH_ -,9 -,9,9,,,9 -, à,9 -, à, sur -, -,,,,,9 -,9 à, -, à,9 sur 9 Diagramme de Tukey ou boîte à moustaches ( «Box Plot» ) Diagramme de Tukey : exemple longueurs sur machines rectangle avec quartiles Q Q Q + segments droites longueurs L = min ( Q -. * IQR, x ( ) ) L = min ( Q +. * IQR, x ( n ) ) L = min (Q - * IQR, x ( ) ) L = min ( Q + * IQR, x ( n ) )..... Box Plot (Machines.sta v*c) suspectes L L.... L Q Q Q L. -. -. utilité - variabilité - symétrie - données suspectes - comparaison de plusieurs groupes -. -. -. MACH_ Median %-% Non-Outlier Range Outliers
Diagramme quantile quantile Exemple : diagramme quantile quantile - distributions des machines. M_ORD vs M_ORD Méthode graphique pour comparer séries de données :. -.. droite Y = X même forme? mêmes moyennes? mêmes écart types? mêmes quantiles? x x x x m et y y y y n M_ORD -. -. -. -. M_ORD vs M_ORD M_ORD... -. cas : m = n graphique des points ( x ( i ), y ( i ) ) des valeurs ordonnées -. -. -. -. cas : m < n graphique des points ( x ( i ), y ( pi ) ) p i = i / ( m + ) i =,,, m échantillons provenant de populations ayant la même forme : alignement le long d une droite M_ORD -.9 -.9 -. -. -. -. -. -. -. -... M_ORD.......... -. M_ORD -. -. -. -....... M_ORD Scatterplot (MachinesV.sta v*c).......... -. -. -. -. -. -. -. -. -.9 -. -. -. -. -. -. -. -... M_ORD -. -. -. -. -....... M_ORD VARIABLES : diagramme de dispersion droite de moindres carrés coefficient de corrélation linéaire modèle poids ( lbs) MPG (ville) prix camry grand Am intrepid mazda saturn talon paseo prelude probe sable 9 9 9 9 99 9 VARIABLES : diagramme de dispersion droite de moindres carrés coefficient de corrélation linéaire POIDS Matrix Plot (ch-v.sta v*c) MPG PRIX
VARIABLES : diagramme de dispersion droite de moindres carrés coefficient de corrélation linéaire VARIABLES : diagramme de dispersion droite de moindres carrés coefficient de corrélation linéaire VARIABLES : diagramme de dispersion droite de moindres carrés coefficient de corrélation linéaire VARIABLES : diagramme de dispersion droite de moindres carrés coefficient de corrélation linéaire Scatterplot (ch.sta v*c) mpg =.-.9*x;.9 Conf.Int. mpg poids:mpg: r =.; r = -.99, p =.; y poids =.9 -.99*x