STATISTIQUES A DEUX VARIABLES (CORRIGE) EXEMPLE SUPPORT DE COURS N 3 : LES TETRAS-LYRES Dans un Parc National, le dénombrement des tétras-lyres (lyrurus tetrix) a été effectué à la création du Parc en 1965 alors que les populations existantes avaient été considérablement décimées par la pression de la chasse. Depuis, de nouveaux dénombrements ont été effectués tous les dix ans. Les résultats sont donnés dans le tableau suivant : 1965 1975 1985 1995 2005 1800 2700 8700 1. Tracer le nuage de points représentatif de cette série statistique : en considérant que l'année 1 correspond à l'année 1965, origine de l'axe des abscisses et 3 cm représentant 10 ans. On prendra 1500 comme origine sur l'axe vertical et 1 cm pour 1000 unités sur ce même axe. 9000 8000 7000 5000 3000 2000 1000 0 1 11 21 31 1/8 41 51
2. On décide dans un premier temps d'analyser l'évolution de la population de tétras-lyres avec une méthode de régression affine par la méthode des moindres carrés, les coefficients seront donnés avec une précision à 7 décimales. On déterminera avec la même précision le coefficient de corrélation r Y =171 X +1049 r 1 =0,97798948 3. Avec ce modèle, déterminer la prédiction de la population de tétras-lyres en 2015, 2025? 2015 : 2015 correspond à X = 51, Y 51 = 171 51 +1049 Y 51 = 9770 Nombre de tétras-lyres en 2015 : 9770 2025 : 2025 correspond à X = 61 Y 61 = 171 61 +1049 Y 61 = 11480 Nombre de tétras-lyres en 2025 : 11480 4. Dans un deuxième temps, on décide de modéliser cette série statistique par une régression EXPONENTIELLE sous la forme Y = ke ax où k et a sont des nombres réels. Déterminer l'équation de cette régression affine à l'aide de la calculatrice ainsi que le coefficient de corrélation correspondant. Y =1742,06496 e 0,0394958 r 2 =0,99989181 5. Avec ce nouveau modèle, faites une prédiction de la population de tétras-lyres en 2015, en 2025. 2015 : 2015 correspond à X = 51 0,0394958 51 Y 51 = 1742,06496 e Y 51 13057 Nombre de tétras-lyres en 2015 : 13057 2/8
2025 : 2025 correspond à X = 61 0,0394958 61 Y 61 = 1742,06496 e Y 61 19381 Nombre de tétras-lyres en 2025 : 19381 6. Enfin, afin d'épuiser les modélisations qui doivent être connues de tout BTS GPN, on décide de modéliser cette série statistique par une régression PUISSANCE, c'est à dire d'écrire la régression de Y en X sous la forme Y = k X a où a et k sont deux nombres réels. Il s'agit en fait de trouver la régression affine de la variable ln (Y ) par la variable ln (X ) sous la forme ln (Y )= a ln ( X )+ b puis d'utiliser les propriétés de calcul des fonctions «exponentielle» et «logarithme népérien» pour écrire : e ln (Y) = e aln ( X )+ b soit Y =(e ln ( X ) ) a e b ou Y = e b X a donc le coefficient k = e b. A l'aide de la calculatrice déterminer directement la forme de régression PUISSANCE de Y en X ainsi que le coefficient de corrélation r Y =1544,04996 X 0,37731373 r 3 =0,90117562 7. Avec ce nouveau modèle, prédire la population de tétras-lyres en 2015, en 2025. 2015 : 2015 correspond à X = 51 Y 51 = 1544,04996 51 0,37731373 Y 51 6806 Nombre de tétras-lyres en 2015 : 6806 2025 : 2025 correspond à X = 61 Y 61 = 1544,04996 61 0,37731373 Y 61 7283 Nombre de tétras-lyres en 2025 : 7283 3/8
8. CONCLUSION : nous devons choisir le modèle d analyse le plus pertinent pour cette série statistique. Pour le faire, nous allons comparer les 3 coefficients de corrélation respectifs de chacun des modèles obtenus et observer celui dont la valeur absolue r est la plus proche de 1. C'est ce qui sera notre référence pour notre choix. Coefficient de corrélation par régression affine r 1 =0,97798948 Coefficient de corrélation par régression exponentielle r 2 =0,99989181 Coefficient de corrélation par régression puissance r 3 =0,90117562 Quel sera notre modèle le plus pertinent? : le coefficient de corrélation dont la valeur absolue est la plus proche de 1 est le coefficient r 2 qui correspond au modèle de régression exponentielle. C'est ce modèle qui sera retenu et donc, pour effectuer nos prédictions, on prendra la formule Y =1742,06496 e 0,0394958 X On peut donc prévoir la population de tétras-lyres pour n'importe quelle date (année)... Mais ce serait sans prendre en compte l'adaptation au milieu de cette population. Celle-ci est toujours contrôlée par un ou plusieurs facteurs du milieu. Sa croissance est donc exponentielle au début puis évolue d'une autre manière pour atteindre une «population seuil» dépendant par exemple de facteurs tels que la superficie du territoire, les ressources disponibles, la population des prédateurs, etc... Le modèle mathématique mis en place est donc valable au début de l'évolution de la population qui suit une «loi normale», c'est à dire que les facteurs identifiés plus haut sont tous influents mais aucun d'entre eux n'est prépondérant. Nous étudierons cette «normalité» dans le chapitre PROBABILITES. 4/8
DEMONSTRATIONS DE COURS A CONNAITRE 1. La régression EXPONENTIELLE est une forme de régression affine La régression exponentielle de Y en X s écrit sous la forme : Y = ae bx avec a, b R Y = ae bx ln (Y )= ln (a)+ ln (e bx ) ln (Y )= ln (ae bx ) ln (Y )= ln (a)+ b ln (e X ) ln (Y )= ln (a)+ bx ln (Y )= bx + ln (a) On observe ici une régression affine de la variable ln (Y ) par la variable X 2. La régression PUISSANCE est une forme de régression affine La régression puissance de Y en X s'écrit sous la forme : Y = ax b avec a, b R Y = ax b ln (Y )= ln (ax b ) ln (Y )= ln (a)+ ln ( X b ) ln (Y )= ln (a)+ b ln ( X ) ln (Y )= b ln ( X )+ ln (a) On observe ici une régression affine de la variable ln (Y ) par la variable ln ( X ) 5/8
LES DIFFERENTS MODELES SOUS FORME GRAPHIQUE MODELE DE REGRESSION AFFINE 9000 8000 7000 Régression affine Y=171 X + 1049 r = 0.97798948 5000 3000 2000 1000 0 1 11 21 31 6/8 41 51
MODELE DE REGRESSION EXPONENTIELLE 9000 8000 7000 Régression exponentielle r = 0,99989181 5000 3000 2000 1000 0 10 20 30 7/8 40 50
MODELE DE REGRESSION PUISSANCE 9000 8000 7000 Régression puissance r = 0,90117562 5000 3000 2000 1000 0 1 11 21 31 8/8 41 51