Math-F-5 Séance & Exercice. Corrigé Séance : Statistique descriptive L ensemble A possède la moyenne la plus grande, D et E ont la médiane la plus grande, C possède le plus grand mode et B a l écart-type maximal. Les moyennes sont, respectivement, 4, 3.75, 3.75, 3.75, 3.75. Les médianes sont, respectivement,,,, 4, 4. Les modes (valeur observée la plus représentée) sont, dans l ordre,,, 7, 4, 5. Les variances sont, respectivement, 3, 4.675,.6675, 3.675,.6675. Exercice. Réponse 3. Si C est le capital de départ, l augmentation après un an amène la somme totale à, C. Ce capital sera encore multiplié par, 3 lors de la seconde année, conduisant le capital à,, 3 C =, 56 C. L augmentation est donc de 56%. Exercice.3 Réponse. Si l on note d la distance jusqu à son travail ; t et t les temps mis respectivement à l aller et au retour, alors v aller = 3 = d t et v retour = = d t. Ainsi, v moy = d t + t. En isolant t et t dans la première équation et en injectant dans la seconde, on trouve v moy =.4 km/h. Exercice.4 Il est impossible pour Yvik d avoir une moyenne de km/h. On peut baser la résolution de cet exercice sur les mêmes idées que la question 3, ou se rendre compte qu il lui faut déjà une heure pour grimper en haut de la montagne. La moyenne de km/h signifie qu il monte et descend dans le même temps. Exercice.5 Dessiner deux allures de distributions telles que la moyenne de A soit inférieure à celle de B et la dispersion de A soit inférieure à celle de B. En outre, la distribution de B doit pouvoir prendre des valeurs négatives, A quant à lui restant positif. Un tel exemple de distributions est donné dans la figure suivante (les valeurs sont fictives...et la notion de densité/probabilité ne vous est que vague pour l instant :-))
Math-F-5 Séance & Exercice.6 (a) Distribution observée (il est d usage de la mettre verticalement...) : x i 39.5 39.5 39.75 4. 4.5 4.5 n i 4 4 (b) Diagramme en bâtons des fréquences absolues. 5 4 3 (c) Tableau des fréquences : x i n i f i N i F i 39.5 /5 /5 39.5 4 4/5 6 /5 39.75 /5 8 8/5 4. 4 4/5 4/5 4.5 /5 4 4/5 4.5 /5 5 5 Ceci répond à la question. Toutefois, afin de se faciliter la tâche ultérieure de calcul de la moyenneéchantillon et de la variance-échantillon, on rajoute souvent une colonne où on calcule x i f i et une deuxième colonne contenant les calculs de x i f i ; à titre d illustration, ceci sera fait dans l exercice.7. Les solutions de (e) à (g) seront ainsi calculées aisément. (d) Fonction de répartition :.5 (e) Moyenne-échantillon : 39.8. Variance-échantillon :.35.
Math-F-5 Séance & (f) Il y a modes : 39.5 et 4.. (g) La médiane correspond à 39.75. Exercice.7 (a) Distribution observée : x i 8. 8.5 9. 9.5.5. 3. 5. n i 5 4 3 3 (b) Diagramme en bâtons des fréquences absolues. 5 4 3 (c) Tableau des fréquences : x i n i f i N i F i x i f i x i f i 8. 5 /4 5 /4 9/ 8 8.5 / 7 7/ 37/ 369/4 9. 4 /5 / 9/5 36/5 9.5 / 3/5 39/4 5/8.5 / 3 3/ 43/4 849/8. 3 3/ 6 4/5 33/ 363/5 3. 3 3/ 9 9/ 69/ 587/ 5. / 5/4 5/4 x =. Σ i= x i f i = 4.75 (d) Fonction de répartition :.5 (e) Moyenne-échantillon :.. Elle se lit aisément à l aide du tableau construit en (c), puisque x n = p i= x if i. Variance-échantillon : 4.7. A nouveau, il suffit d utiliser la formule s x = ( p i= x i f i) x n. (f) Le seul mode se situe en 8.
Math-F-5 Séance & (g) La médiane correspond à 9. Exercice.8 Sans perte de généralité nous pouvons supposer que la valeur erronée correspond à x. Notons la moyenne exacte x. Dès lors, (Σ9 i= x i + 8.5) = 5.9 Σ 9 i= x i = 5.5 Σ 9 i= x i + 6.5 = 57 x = 5.7. La variance exacte, notée s x est donnée ci-dessous. Pour ce calcul, nous allons utiliser la formule suivante pour la variance (facile à démontrer (faites-le!) : s x = n Σn i= x i x n. Nous obtenons alors (Σ9 i= x i + 8.5 ) 5.9 = 4.83 (Σ9 i= x i + 8.5 ) = 39.64 Σ 9 i= x i = 34.5 Σ 9 i= x i + 6.5 = 366.4 (Σ9 i= x i + 6.5 ) = 36.64 (Σ9 i= x i + 6.5 ) 5.7 = 4.5 s x = 4.5. Exercice.9 () L histogramme est direct. () Afin de répondre à la question (4) plus rapidement, on ajoutera les colonnes x ci n i et x ci n i.
Math-F-5 Séance & C i x ci n i f i N i F i x ci n i x ci n i [.5,.5[ 8.3 8.3 6 3 [.5, 3.5[ 3 47.76 55.89 4 43 [3.5, 4.5[ 4.96 76.85 484 936 [4.5, 5.5[ 5 9.356 395.64 95 5475 [5.5, 6.5[ 6 49.47 544.888 894 5364 [6.5, 7.5[ 7 6.97 64.985 4 94 [7.5, 8.5[ 8.5 66 96 768 66 p i= x cin i = 346 7 i= x ci n i = 6938 (3) Un histogramme des fréquences relatives cumulées doit être tracé. La fonction de répartition se trouve en reliant les coins supérieurs droits de chacun des rectangles. (4) La moyenne-échantillon se toruve immédiatement à l aide de la formule x n = n p x ci n i = 5.7. i= La variance-échantillon est quant à elle calculée via s x = n 7 x cin i x n =.45. i= (5) La classe modale est [4.5, 5.5[. Exercice. (a) Un calcul direct montre que x n = x n + c et que s x = s x. (b) Un calcul tout aussi immédiat permet de voir que x n = ax n et que s x = a s x. Exercice. Pour rappel, pour une fonction de régression de Y sur X donnée par y = f(x), le principe des moindres carrés cherche à minimiser n I = (y i f(x i )). Dans le cadre de la régression linéaire, il faut donc minimiser la quantité i= I(a, b) = n (y i (ax i + b)), i= en a et b. Il suffit dès lors de trouver les points critiques de I(a, b) (qui sera unique) et de vérifier que c est un maximum. Un point critique de I(a, b) est tel que I I (a, b) = et (a, b) =, a b c est-à-dire, résoudre le système d équation suivant (en a et b) : i= (y i (ax i + b))( x i ) = n i= (y i (ax i + b))( ) = Des calculs simples permettent de trouver les conditions de l énoncé. On vérifiera que c est bien un maximum. Dans le cadre de la régression parabolique, la quantité à minimiser est
Math-F-5 Séance & I(c, d) = n (y i (cx i + d)) i= Il suffit donc de résoudre le système i= (y i (cx i + d))( x i ) = n i= (y i (cx i + d))( ) = i= (y i (cx i + d))(x i ) = n i= (y i cx i ) = nd i= (y i (cx i + d))(x i ) = d = ȳ c n i= (y i (cx i + d))(x i ) = n i= x i d = ȳ c n n i= x i En injectant la seconde équation dans la première, on trouve comme valeur de c. c = n i= (y i ȳ)x ( i ( n ) i= x4 i ( n ) ). n i= x i Exercice. (a) Moyennes marginales : x n = 5 et y n = 5. Variances marginales : s x = 4 et s y = 64. (b) Covariance : s xy =. Coefficient de corrélation : r = 3 4. (c) Equation de la droite de régression de y en x : y = 3x + 3. Exercice.3 (a) Moyennes marginales : x n = 77 9 78.555 et y n = 658 9 73.. Variances marginales : s x = 864 8 4.47 et s y = 34856 8 43.3. (remarque : tous ces résultats ont été obtenus sur base de l expression s x = n Σn i= x i x n) Covariance : s xy = 46 8 74.7. Coefficient de corrélation : r.56. Equation de la droite de régression de y en x : y = 359 454 x +.777x +.6. 54775 454 (b) Etant donné que la droite de régression permet de prédire ce qui va arriver dans le futur sur base des données existantes, et que la cote finale correspond à y et la cote de Nol à x, il suffit de calculer la valeur de y qui correspond à x = 85 dans la droite de régression. Ceci révèle que la cote de fin d année estimée équivaut à 78. Exercice.4 Prix moyen attendu (aux arrondis près) : en 996 : 7.7 et en 997 : 7.455. Remarquons qu ici on n a pas besoin de calculer la variance marginale de y étant donné que cette quantité ne joue aucun rôle dans l expression de la droite de régression.