Chapitre 4. Séries chronologiques nicolas.chenavier@lmpa.univ-littoral.fr
Exemple introductif 1 On considère la consommation mensuelle, exprimée en kwh, d un particulier, relevée durant trois années consécutives. Janv Fév Mars Avr Mai Juin Juil Août Sept Oct Nov Déc 2012 312 315 291 307 305 303 320 328 298 309 310 334 2013 315 319 299 314 306 304 325 331 304 310 317 332 2014 320 324 302 318 309 308 330 333 309 315 319 339 Figure: Consommation d électricité de janvier 2012 à décembre 2014 2 / 29
Exemple introductif 2 On considère les chiffres d affaires trimestriel, en milliers d euros, d une entreprise au cours de quatre années consécutives : Trimestres 1 2 3 4 2011 55 63 169 324 2012 231 175 378 627 2013 406 287 587 933 2014 585 399 795 1231 Figure: Chiffres d affaire du 1 er trimestre de 2011 au 4 ème trimestre de 2014 3 / 29
Présentation Définition On appelle série chronologique toute suite y d observations numériques d une grandeur effectuées à intervalles réguliers (appelés saisons) au cours de plusieurs années. On note : p : le nombre de saisons c est-à-dire la période ; n : le nombre d années ; y t : la valeur de la série à l instant t. Exemple 1 : la série y est la consommation d électricité, le nombre d années est n = 3, la période est p = 12 et y 1 = 312, y 12 = 334, y 13 = 315 et y 25 = 320. Exemple 2 : la série y est le chiffre d affaires, le nombre d années est n = 4, la période est p = 4 et y 1 = 55, y 4 = 324, y 5 = 231 et y 11 = 587. 4 / 29
Problématique Pour toute série chronologique, deux questions se posent : Comment peut-on comparer des données de la série issues de deux saisons différentes? Peut-on prévoir des valeurs futures de la série? Pour répondre à ces deux questions, nous écrirons la série comme une combinaison de trois composantes. L objectif est de fournir des méthodes permettant : d estimer ces trois composantes ; de comparer les données de la série ; de prévoir des données futures. 5 / 29
Sommaire 1 Analyse des séries chronologiques Composantes d une série chronologique Modèles considérés 2 Estimation des composantes d une série Estimation de la tendance Estimation des composantes saisonnières 3 Correction des variations saisonnières et prédiction Correction des variations saisonnières Prédiction 6 / 29
Composantes d une série chronologique Décomposition d une série chronologique Toute valeur y t de la série met en évidence trois composantes : la tendance générale g t (appelée également trend), qui correspond à l évolution à long terme de la série ; la composante saisonnière s t, qui correspond à des fluctuations périodiques se reproduisant de façon plus ou moins identique d une période à l autre ; la composante aléatoire a t, qui correspond à des fluctuations irrégulières et imprévisibles. Dans ce qui suit : on présentera les trois composantes de la série ; on fournira une méthode permettant d avoir des estimations de la tendance générale et de la composante saisonnière. 7 / 29
Composantes d une série chronologique Tendance générale Exemple : reprenons la consommation d électricité. Graphiquement, on constate que la consommation d électricité a tendance a augmenté. On peut justifier rigoureusement un tel phénomène en faisant une régression linéaire par la méthode des moindres carrés. Pour rendre légitimes les calculs que nous ferons ultérieurement, on supposera que la tendance présente une faible courbure. 8 / 29
Composantes d une série chronologique Composante saisonnière Exemple : reprenons la consommation d électricité. Graphiquement, on constate que la consommation d électricité admet des pics "positifs" en août et décembre et "négatifs" en mars et juin. On fournira une méthode permettant d étudier l impact que peut avoir une saison (ici un mois) sur la série chronologique. Pour rendre légitimes les calculs que nous ferons ultérieurement, on supposera que les composantes st sont périodiques (de période p) et ont une influence nulle sur l année. 9 / 29
Composantes d une série chronologique Composante aléatoire Exemple : reprenons la consommation d électricité. Graphiquement, on constate que les pics "positifs" et "négatifs" observés pour certaines saisons ne sont pas exactement réguliers. Un tel phénomène est dû, en particulier, au fait que la composante aléatoire "casse" la monotonie des cycles. Pour rendre légitimes les calculs que nous ferons ultérieurement, on supposera que les composantes a t sont négligeables. 10 / 29
Modèles considérés Présentation des modèles Une série temporelle consiste à supposer qu elle est régie par une certaine fonction. Dans ce qui suit, on se limitera à deux types de modèles : les modèles additifs ; les modèles multiplicatifs. 11 / 29
Modèles considérés Modèle additif On parle de modèle additif, lorsqu on cherche y sous la forme : y t = g t + s t + a t. Rappelons que : la participation de la composante saisonnière est nulle sur l année : s 1 + + s p p = 0; la composante aléatoire est négligeable, c est-à-dire a t 0. Remarque : pour savoir si l on peut prendre un modèle additif pour une série y, on procède comme suit : on trace les bornes supérieure et inférieure associées aux pics "positif" et "négatif" du graphe de la série ; on prend le modèle additif uniquement lorsque la largeur de la bande associée est presque constante. Exemple : pour la consommation d électricité, le modèle additif est approprié. 12 / 29
Modèles considérés Modèle multiplicatif On parle de modèle multiplicatif, lorsqu on cherche y sous la forme y t = g t s t a t. Rappelons que : la participation de la composante saisonnière est nulle sur l année : ( ) s 1 sp 1/p = 1; la composante aléatoire est négligeable, c est-à-dire a t 1. Remarque : pour savoir si l on peut prendre un modèle multiplicatif pour une série y, on procède comme suit : on trace les bornes supérieure et inférieure associées aux pics "positif" et "négatif" du graphe de la série ; on prend le modèle multiplicatif lorsque la largeur de la bande associée est significativement croissante ou décroissante. Exemple : pour les chiffres d affaire, le modèle multiplicatif est approprié. 13 / 29
1 Analyse des séries chronologiques 2 Estimation des composantes d une série Estimation de la tendance Estimation des composantes saisonnières 3 Correction des variations saisonnières et prédiction 14 / 29
Estimation de la tendance Méthodes générales pour estimer la tendance But : estimer la tendance générale g t. Méthodes : il existe deux façons classiques pour estimer la tendance générale : la régression (linéaire ou plus complexe) de y t en fonction de t ; avantage : les calculs sont simples ; inconvénient : à cause des effets saisonniers, la régression (linéaire ou plus complexe) n est pas toujours appropriée ; la méthode des moyennes mobiles (présentée à la page suivante). Remarques : On désigne par g t une estimation de g t obtenue soit par régression soit par la méthode des moyennes mobiles. Les méthodes permettant d estimer la tendance générale sont indépendantes des modèles (additif ou multiplicatif) choisis. 15 / 29
Estimation de la tendance Moyennes mobiles Définition Considérons une série chronologique y et un instant t. On appelle moyennes mobiles d ordre 2,3,4 et 5 les quantités définies par : Ordre k 2 M (2) t = 1 2 3 M (3) 4 M (4) t = 1 4 Moyenne mobile d ordre M (k) t ( yt 1 ) 2 + y t + yt+1 2 t = 1 3 (y t 1 + y t + y t+1 ) ( yt 2 2 + y t 1 + y t + y t+1 + yt+2 2 5 M (5) t = 1 5 (y t 2 + y t 1 + y t + y t+1 + y t+2 ) ) Dans le même esprit, on peut définir des moyennes mobiles d ordre k. Lorsque k est pair, les valeurs des indices extrêmes sont pondérés par 1 2 et les autres par 1. Lorsque k est impair, toutes les valeurs sont pondérées par 1. 16 / 29
Estimation de la tendance Exemple 1 de moyennes mobiles Exemple 1 : reprenons la consommation d électricité avec des moyennes mobiles d ordre k = 3. Ici, on a donc g t = M (3) t g t. Janv Fév Mars Avr Mai Juin Juil Août Sept Oct Nov Déc 2012 306 304 301 305 309 317 315 312 306 318 320 2013 323 311 310 306 308 312 320 320 315 310 320 323 2014 325 315 315 310 312 316 324 324 319 314 324 Figure: Consommation réelle (bleu) et moyennes mobiles (vert) 17 / 29
Estimation de la tendance Exemple 2 de moyennes mobiles Exemple 2 : reprenons les chiffres d affaire avec des moyennes mobiles d ordre k = 4. Ici, on a donc g t = M (4) t g t. Trimestres 1 2 3 4 2011 175 211 2012 251 315 375 411 2013 451 515 576 612 2014 652 715 Figure: Consommation réelle (bleu) et moyennes mobiles (vert) 18 / 29
Estimation de la tendance Remarques En pratique, l ordre des moyennes mobiles doit être choisi comme le nombre de saisons considérés dans l année c est-à-dire k = p (pour l exemple 1, nous avons pris k = 3 et p = 12 pour des raisons pédagogiques ; pour l exemple 2, nous avons k = p = 4). La méthode des moyennes mobiles permet : de lisser la courbe (du fait que l on considère des moyennes) ; d "éliminer" la composante aléatoire ; de mieux visualiser la tendance. L inconvénient des moyennes mobiles par rapport à la régression linéaire est que l on perd des informations sur les premières et les dernières données. 19 / 29
Estimation des composantes saisonnières Méthode générale pour estimer les composantes saisonnières But : estimer la composante saisonnière s t. Méthode : on procède en 4 étapes comme suit : Etapes Modèle additif y t = g t + s t Modèle multiplicatif y t = g t s t 1 Calculer S t = y t g t Calculer S t = yt g t 2 Calculer s t = St +S t+1+ +S t+np Calculer (S n 1 S 2 S t+np) 1/n 3 Calculer s = s 1+s 2 + +s p p Calculer s = (s 1 s 2 s p) 1/p 4 Calculer s t = s t s Calculer s t = st s Remarque : les calculs des coefficients dépendent du modèle (additif ou multiplicatif) choisi. 20 / 29
Estimation des composantes saisonnières Exemple 1 Exemple 1 : reprenons la consommation d électricité avec g t = M (3) t. 1 On calcule les S t M (3) t. 2 On calcule la moyenne arithmétique s t de chaque mois. 3 On calcule la moyenne arithmétique s de tous les mois (ici s = 2). 4 On calcule les coefficients saisonniers normalisés s t = s t s. Janv Fév Mars Avr Mai Juin Juil Août Sept Oct Nov Déc 2012 9-13 6 0-6 3 13-14 3-8 14 2013-8 8-12 8-2 -8 5 11-11 0-3 9 2014-5 9-13 8-3 -8 6 9-10 1-5 s t -6.5 8.7-12.7 7.3-1.7-7.3 4.7 11-11.7 1.3-5.3 11.5 s t -4.5 10.7-10.7 5.3 0.3-5.3 2.7 9-9.7 3.3-3.3 9.5 21 / 29
Estimation des composantes saisonnières Exemple 2 Exemple 2 : reprenons les chiffres d affaire avec g t = M (4) 1 On calcule les S t M (4) t. 2 On calcule la moyenne géométrique s t de chaque mois. 3 On calcule la moyenne géométrique s de tous les mois (ici s = 0.94). t. 4 On calcule les coefficients saisonniers normalisés s t = st s. Trimestres 1 2 3 4 2011 0.97 1.54 2012 0.92 0.56 1.01 1.53 2013 0.90 0.56 1.02 1.53 2014 0.90 0.56 s t 0.91 0.56 1.00 1.53 s t 0.97 0.60 1.06 1.63 22 / 29
1 Analyse des séries chronologiques 2 Estimation des composantes d une série 3 Correction des variations saisonnières et prédiction Correction des variations saisonnières Prédiction 23 / 29
Correction des variations saisonnières Série corrigée des variations saisonnières Définition Considérons une série chronologique y. Dans le cas du modèle additif, c est-à-dire y t = g t + s t + a t, on appelle série corrigée des variations saisonnières (CVS) la série y t = y t s t. Dans le cas du modèle multiplicatif, c est-à-dire y t = g t st a t, on appelle série corrigée des variations saisonnières (CVS) la série y t = yt s. t Remarques : L intérêt de la série CVS est qu elle permet de comparer deux valeurs issues de deux saisons différentes. La définition de la série CVS dépend du modèle choisi. 24 / 29
Correction des variations saisonnières Exemple 1 Exemple 1 : reprenons la consommation d électricité. Les valeurs de la série CVS sont données dans le tableau suivant : Janv Fév Mars Avr Mai Juin Juil Août Sept Oct Nov Déc 2012 317 304 302 302 305 308 317 309 308 306 313 325 2013 320 308 310 309 306 309 322 322 314 307 320 323 2014 325 313 313 313 309 313 327 324 319 312 322 330 Figure: Consommation réelle (bleu) et corrigée (vert) 25 / 29
Correction des variations saisonnières Exemple 2 Exemple 2 : reprenons les chiffres d affaire. Les valeurs de la série CVS sont données dans le tableau suivant : Trimestres 1 2 3 4 2011 57 106 159 198 2012 239 295 355 384 2013 420 483 552 571 2014 605 672 747 754 Figure: Consommation réelle (bleu) et corrigée (vert) 26 / 29
Prédiction Principe But : prédire la valeur de y t, où t est un temps futur. Méthode 1 : 1 estimer la tendance par moyennes mobiles M (k) t ; 2 calculer les coefficients saisonniers st ; 3 effectuer une régression linéaire T t des moyennes mobiles M (k) t ; 4 en déduire une valeur approchée de y t en remarquant que : y t T t + st pour le modèle additif ; y t T t st pour le modèle multiplicatif. Méthode 2 : 1 estimer la tendance par régression linéaire T t de la série initiale T 2 calculer les coefficients saisonniers s t ; 3 en déduire une valeur approchée de y t en remarquant que : y t T t + s t pour le modèle additif ; y t T t s t pour le modèle multiplicatif. t ; Remarque : la méthode 1 est plus longue que la méthode 2 mais elle donne une approximation plus précise. 27 / 29
Prédiction Exemple Exemple : on reprend la consommation d électricité. On s intéresse à une valeur approchée de la consommation en avril 2015 c est-à-dire à y t avec t = 40. Pour cela, on applique la méthode 1 : 1 on a déjà déterminé les moyennes mobiles d ordre 3 (page 17) ; 2 on a également calculé les coefficients saisonniers et en particulier celui d avril donné par : s40 = s 4 = 5.3 (page 21) ; 3 on obtient, par la méthode des moindres carrés, qu une régression linéaire des moyennes mobiles est T t = 0.414t + 307.2 ; 4 on en déduit qu une prévision de la consommation en avril 2015 est : y 40 (0.414 40 + 307.2) + 5.3 = 329.06. 28 / 29
Prédiction L essentiel Comparaison de données issues de saisons différentes : 1 déterminer le modèle ; 2 calculer la tendance par régression ou moyennes mobiles ; 3 calculer les coefficients saisonniers ; 4 déterminer la série corrigée des variations saisonnières. Prédiction : 1 déterminer le modèle ; 2 calculer la tendance par régression ; 3 calculer les coefficients saisonniers ; 4 prédire des données futures. 29 / 29