FICHE METHODE sur les STATISTIQUES I) A quoi servent les statistiques? a) Exemples : 1. Ses moyennes générales trimestrielles sont 13, 9 et 8! Que vaut sa moyenne générale annuelle? x = 10.. Leurs temps en secondes au 100m sont 1, 14, 19, 1, 8, 30! Que vaut le temps médian? m é = 0. Que vaut l étendue des temps? e = 18. 3. Les valeurs sont : 1,,,,,,,, 8, 17! Quelle est la fréquence de valeur la plus fréquente? f = 60% b) Remarques : Le monde dans lequel nous vivons est en constante évolution. Pour certains phénomènes observables dans la nature, il est parfois possible, à partir de l observation et de l expérimentation de proposer une loi qui semble régir le phénomène auquel on s intéresse. ( par exemple, Galilée à proposé une loi satisfaisante pour la chute des objets dans le vide). Mais, souvent, pour trouver une loi, ou ce que l on appelle aussi un «modèle» il faut, à partir d observations, recueillir des données qui sont des nombres le plus souvent, puis à partir de ces nombres, il faut essayer de trouver une «tendance». Comment sont-ils répartis? sont-ils regroupés? dispersés? y a t-il une valeur qui revient fréquemment? Essayer de mettre en évidence certaines choses à partir de données, faire «parler» les nombres! est l objectif principal d une étude statistique. II) Qu est ce qu une étude statistique? Faire une étude statistique sur une population c est : 0) POPULATION En 4 étapes 1) Recueillir des informations, des données. ( Sondage, Mesures, ) ) Organiser et traiter les données. ( Tableaux, Calculs, ) 3) Représenter les résultats. ( Diagrammes, Courbes, ) 4) Commenter les résultats. ( Remarques, ) 1) RECUEILLIR INFORMATIONS ) ORGANISER TRAITER 3) REPRESENTER 4) COMMENTER
Définition 1 : ( POPULATION ET INDIVIDU ) La population d une étude statistique est un ensemble d éléments duquel on extrait des informations ( ensemble des élèves d une classe, ensemble des voitures vertes, ) Un individu est un des éléments appartenant à la population. ( Un des élèves de la classe, une des voitures vertes ) Définition : ( EFFECTIF ) L effectif noté «N» d une population est le nombre d éléments que contient la population ( c est un nombre entier : N IN ). ( Si une classe est de 30 élèves, N = 30). Définition 3 : ( VARIABLE, NATURE ET VALEURS DE LA VARIABLE ) Une variable X ( ou un caractère ) est le type d information que l on extrait de chaque individu ( poids, nationalité, ) Les valeurs ( x 1 ; x ; x 3 ; ; x i ; x N.) prises par la variable X peuvent être des nombres ou autre chose que des nombres et sont aussi appelées modalités de la variable. ( nb de frères et sœurs, couleur des yeux, ). La variable est de nature QUALITATIVE si les valeurs possibles de la variable (modalités) ne sont pas des nombres. ( Nationalité, couleur des yeux, ) La variable est de nature QUANTITATIVE si les valeurs possibles la variable sont des nombres. ( Taille, poids, ) La variable est de nature QUANTITATIVE DISCRETE si les valeurs possibles la variable sont des nombres isolés. ( NB de frères, NB d enfants, de diplômes, ) La variable est de nature QUANTITATIVE CONTINUE si les valeurs possibles de la variables forment un intervalle de IR ( poids, taille, ) On procède généralement à une séparation de l ensemble des valeurs possibles en intervalles disjoints. ( [0 ; 10 [ ; [10 ;0 [ ; ). VARIABLE Exemple : 1 Si QUALITATIVE : Valeurs Variable Nombre Réel ( x i IR ) DISCRETE : Valeurs possible = { nbs «isolés»} QUANTITATIVE CONTINUE : Valeurs variable = [ intervalle ] On demande à chaque élève d une classe de 30 élèves son poids en kg. Alors : Population = ensemble des élèves de la classe. Individu = élève. Effectif total = N = 30. Variable = poids. Nature de la variable = quantitative continue. (on peut procéder à un regroupement par intervalles)
Pour mener à bien une étude statistique, il est nécessaire de connaître certaines propriétés III) Propriétés relatives aux statistiques 1) REPRESENTATIONS GRAPHIQUES A ) DIAGRAMME CIRCULAIRE Définition 4 : L angle α i associé à une valeur x i est proportionnel à l effectif n i de cette valeur. ( l effectif n i de x i est le nombre de fois ou apparaît x i parmi les N valeurs ) Exemple : Dans un groupe, il y a filles et 3 garçons ( 40 personnes ). Soit α f l angle correspondant aux filles, on a : 40 = α f 360 donc 360 = 40α f donc α f = ( α g = 360 4 = 31 ) B) DIAGRAMME en BATONS 360 40 = 4 G ( 360 4 = 31 ) n i N = α i 360 4 F Définition : La hauteur du bâton associé à une valeur est égale à l effectif de la valeur. ( avec une unité de longueur par unité d effectif ) Exemple : On demande à 18 femmes combien elles ont d enfants. ( femmes ont 0 enfants, ) Valeur ( nb enfants ) 0 1 3 4 6 Total Effectif 3 4 3 0 1 18 on a donc le diagramme en bâtons ci contre. C ) HISTOGRAMME 1 1 3 6 VALEURS ( Nombre d enfants ) Définition 6 : L aire du rectangle associé à un intervalle est égale a l effectif de cet intervalle. Exemple : On demande à 100 enfants le nombre d heures passées devant la TV quotidiennement en moyenne. Valeur (heure) [ 0 ; 1 [ [ 1 ; 4 [ [ 4 ; 14 ] Total Effectif 0 30 0 100 on a donc l histogramme ci contre «Attention : ce n est pas le rectangle le plus haut qui correspond nécessairement au plus grand effectif, mais le rectangle de plus grande aire. 0 1 10 0 1 carreau pour % 1 0 = 0 3 10 = 30 10 = 0 1 4 Nb heures 14
) INDICATEURS STATISTIQUES Un certain indicateur ( nombre ) permet de savoir si une valeur d une série est «fréquente» ou non. Il permet d indiquer si la valeur en question revient beaucoup de fois ou pas, cet indicateur est la fréquence ( ou le pourcentage d apparition de la valeur dans la série ). A ) FREQUENCE Définition 7 : Soit S une série statistique d effectif N ( une série de N valeurs ) et x i une des valeurs de S ( x i S ). La fréquence notée f i de la valeur x i est le nombre égal au quotient de l effectif n i de la valeur par N, l effectif total de la population. f i = n i N f artie Total ( on multiplie par 100 pour obtenir en pourcentage ) Exemple : Pour une population de 40 personnes, on s intéresse aux valeurs «garçon»,«fille». VALEURS x i Garçon Fille TOTAL EFFECTIF n i 3 40 FREQUENCE f i 0,1 0,87 1 FREQUENCE (f i %) 1, 87, 100 Fréquence de «garçon» = 40 3 = 0,1 ; Fréquence de «fille» = 100 = 87, 40 Un certain indicateur donne la ou les valeurs les plus fréquentes, c est le «mode» B ) MODE ou CLASSE MODALE Définition 8 : Exemples : Le mode d une série de valeurs est la valeur ayant le plus grand effectif ou la plus grande fréquence ( il peut y en avoir plusieurs) Dans le cas d un regroupement par intervalles, la classe modale est l intervalle de plus grand effectif. 1 Dans l exemple du 1)A) ci dessus ( diagramme circulaire) le mode est Garçon. Dans l exemple du 1)B) ci dessus ( diagramme en bâtons ) le mode est 3. 3 Dans l exemple du 1)C) ci dessus la classe modale est l intervalle [4 ; 14]. Un certain indicateur permet dans une certaine mesure de préciser si des valeurs quantitatives sont dispersées ou regroupées. C ) ETENDUE ( indicateur de dispersion ) Définition 9 : L étendue notée «e» d une série est égale à la différence entre la plus grande et la plus petite valeur : e = x max x min Dans le cas d intervalles on prend les bornes extrêmes du 1 er et dernier intervalle. Exemple : 1 Dans l exemple 1) B) l étendue vaut e = 6 0 soit e = 6. Dans l exemple 1) C) l étendue vaut e = 14 0 soit e = 14.
Un certain indicateur ( bien connu ) permet de fixer un «niveau moyen», une «position moyenne» de l ensemble des valeurs d une série quantitative, c est la moyenne. D ) MOYENNE ( indicateur de position ) Définition 10 : Calcul de la moyenne notée x d une série de S : x 1, x,, x p sont les p valeurs de la série. ( N = n 1 + n + + n p = n i x i ) n 1, n,, n p sont les p effectifs des valeurs. f 1, f,, f p sont les p fréquences des valeurs. n i x i Avec les effectifs : x = n i 1x 1 + n x + + n p x p 1 x = ; x = n 1 + n + + n p N = p n i x i n i Avec les fréquences : x = f 1 x 1 + f x + + f p x p x = f i x i ( n i = n 1 + n + + n p se lit : «la somme des n i pour i allant de 1 à p» ) Dans le cas d intervalles : On calcule la moyenne avec les centres des intervalles. Le centre de l intervalle [a ; b] est c = a + b ( de même pour un intervalle ouvert ) Exemples : 1 On demande à 10 personnes les notes qu ils ont obtenu en E.P.S, on veut la moyenne. TOTAL VALEUR : x i 8 10 14 EFFECTIF : n i 3 10 Fréquence : f i 0,3 0, 0, 1 x = 3 8 + 10 + 14 3 + + = 10 10 = 10,. ou x = 0,3 8 + 0, 10 + 0, 14 = 10,. La moyenne vaut 10, On a demandé à 300 personnes le nombre d heures passées à écouter de la musique par jour. Valeur [ 0 ; 1 [ [ 1 ; [ [ ; 13 ] Total Centre: x i 0, 3 9 Effectif : n i 40 60 00 300 Fréquence : f i 40 60 00 300 300 300 1 x = ou 40 0, + 60 3 +00 9 40 + 60 + 00 = 000 300 x = 40 60 0, + 300 300 3 + 00 300 9 6,6 6,6 La moyenne vaut à peu près 6,6 heures.
Propriété 1 : ( LINEARITE DE LA MOYENNE ) Soit S une série statistique dont la moyenne est x. 1) Si on multiplie toutes les valeurs de la série S par un nombre réel a alors la moyenne de la nouvelle série S est a x. (la moyenne est multipliée par a) ) Si on additionne à toutes les valeurs de la série S un nombre réel b alors la moyenne de la nouvelle série S est x + b. ( la moyenne varie de b ) Preuve : Soient x 1,x et x 3 les valeurs de la série S ( preuve semblable pour plus de 3 valeurs ). n 1,n et n 3 les effectifs correspondant. 1) On a : x = n 1 x 1 + n x + n 3 x 3 n 1 + n + n 3 Les valeurs de la nouvelle série S sont ax 1, ax et ax 3 et la moyenne de S est : n 1 ax 1 + n ax + n 3 ax 3 = a (n 1x 1 + n x + n 3 x 3 ) = a n 1 x 1 + n x + n 3 x 3 = a x. n 1 + n + n 3 n 1 + n + n 3 n 1 + n + n 3 ) Admis. Exemples : Un élève à x = 8 de moyenne. 1 Que devient sa moyenne si on multiplie chacune de ses notes par 1,0? (+%). Sa nouvelle moyenne est 1,0 x = 1,0 8 = 8,4. Que devient sa moyenne si on ajoute 1,0 à chacune de ses notes?. Sa nouvelle moyenne est x + 1,0 = 8 + 1,0= 9,0. Propriété : ( MOYENNES PARTIELLES ) Soient S et S deux séries statistiques dont les moyennes sont x et x et dont les effectifs sont respectivement N et N. Soit S la série d effectif N + N obtenue en regroupant les valeurs de S et S. La moyenne de la nouvelle série S est : x = N x + N x N + N Admis. Exemple : Dans une classe, pour un contrôle, la moyenne des 1 filles est de 13 et la moyenne des 8 garçons est de 11! Que vaut le moyenne de la classe? La moyenne de la classe est x = 1 13 + 8 11 1 + 8 = 44 0 = 1,.
Définition 11 : ( VALEUR ABERRANTE ) Soit S une série statistique. Une valeur de la série est dite «aberrante» si cette valeur est relativement éloignée de l ensemble des valeurs de la série ( elle est par exemple beaucoup plus grande ou beaucoup plus petite que l ensemble des valeurs de la série). ( la définition laisse chacun interpréter le sens du «relativement éloigné» ) Définition 1 : ( MOYENNE ELAGUEE ) Soit S une série statistique. La «moyenne élaguée» de la série S est la moyenne de la série S où S est la série obtenue en enlevant de la série S les valeurs aberrantes. Exemple : On demande sa taille en centimètres à chacun des élèves d un groupe et on obtient la série S suivante : 10 ; 180 ; ; 140 ; 480.. Il y a manifestement deux valeurs aberrantes qui sont et 480.. La série S sans les valeurs aberrantes est : 10 ; 180 ; 140.. la moyenne élaguée de la série est : x = E ) La MEDIANE Soit S une série statistique d effectif N. Soit S 0 la série ordonnée obtenue en rangeant les valeurs de la série S dans l ordre croissant On distingue cas : Si N est IMPAIR : la médiane de la série notée q est la 10 + 180 + 140 3 N + 1 ième = 470 3 Un certain indicateur est tel qu il coupe la série de valeurs en deux parties Définition 13 : ( MEDIANE ) 16,6 cm. valeur de la série S 0. Si N est PAIR : médiane = ( N ) ième valeur S 0 + ( N + 1)ième valeur de S 0 ( la moyenne des ( N )ième et ( N + 1) ième valeurs de S 0 ) Exemples : 1 Soit la série de valeurs : 1 ; 1 ; ; 6 ; ; 4 ; ; 7 ; 8 ; 9 ; 10 ; 16 ; 1 ( 13 valeurs ).Pour S 0 on ordonne les valeurs : 1 ; 1 ; 1 ; ; 4 ; ; ; 6 ; 7 ; 8 ; 9 ; 10 ; 16. 13 est IMPAIR donc la médiane est la 13 +1 = 7 ème valeur de la série ordonnée S 0 donc. Soit la série de valeurs : 1 ; 1 ; ; 6 ; ; 4 ; ; 7 ; 8 ; 9 ; 10 ; 16 ( 1 valeurs ).Pour S 0 on ordonne les valeurs : 1 ; 1 ; ; 4 ; ; ; 6 ; 7 ; 8 ; 9 ; 10 ; 16. 1 est pair donc la médiane est la moyenne des 6 èmes et 7 èmes valeurs de S 0 donc : + 6 Remarque : Il y a au moins N valeurs en dessous et au moins N =, valeurs au-dessus de la médiane.