Modélisation et prévision de la consommation horaire d électricité au Québec Comparaison de méthodes de séries temporelles



Documents pareils
Le mode de fonctionnement des régimes en annuités. Secrétariat général du Conseil d orientation des retraites

Les circuits électriques en régime transitoire

VA(1+r) = C 1. VA = C 1 v 1

2. Quelle est la valeur de la prime de l option américaine correspondante? Utilisez pour cela la technique dite de remontée de l arbre.

Texte Ruine d une compagnie d assurance

La rentabilité des investissements

MATHEMATIQUES FINANCIERES

Les deux déficits, budgétaire et du compte courant, sont-ils jumeaux? Une étude empirique dans le cas d une petite économie en développement

Chapitre 2 L investissement. . Les principales caractéristiques de l investissement

Séminaire d Économie Publique

F 2 = - T p K F T = - T p K 0 - K 0

Caractéristiques des signaux électriques

SYSTÈME HYBRIDE SOLAIRE THERMODYNAMIQUE POUR L EAU CHAUDE SANITAIRE

Oscillations forcées en régime sinusoïdal.

EFFICIENCE INFORMATIONNELLE DES UNE VERIFICATION ECONOMETRIQUE MARCHES DE L OR A PARIS ET A LONDRES, DE LA FORME FAIBLE

Estimation des matrices de trafics

TD/TP : Taux d un emprunt (méthode de Newton)

Relation entre la Volatilité Implicite et la Volatilité Réalisée.

Impact du vieillissement démographique sur l impôt prélevé sur les retraits des régimes privés de retraite

Rappels théoriques. -TP- Modulations digitales ASK - FSK. Première partie 1 INTRODUCTION

THÈSE. Pour l obtention du grade de Docteur de l Université de Paris I Panthéon-Sorbonne Discipline : Sciences Économiques

Mémoire présenté et soutenu en vue de l obtention

GUIDE DES INDICES BOURSIERS

Pouvoir de marché et transmission asymétrique des prix sur les marchés de produits vivriers au Bénin

Documentation Technique de Référence Chapitre 8 Trames types Article

Finance 1 Université d Evry Val d Essonne. Séance 2. Philippe PRIAULET

Exemples de résolutions d équations différentielles

GESTION DU RÉSULTAT : MESURE ET DÉMESURE 1 2 ème version révisée, août 2003

Essai surlefficience informationnelle du march boursier marocain

Copules et dépendances : application pratique à la détermination du besoin en fonds propres d un assureur non vie

Sciences Industrielles pour l Ingénieur

Sommaire de la séquence 12

Les Comptes Nationaux Trimestriels

Le mécanisme du multiplicateur (dit "multiplicateur keynésien") revisité

Filtrage optimal. par Mohamed NAJIM Professeur à l École nationale supérieure d électronique et de radioélectricité de Bordeaux (ENSERB)

Programmation, organisation et optimisation de son processus Achat (Ref : M64) Découvrez le programme

Document de travail FRANCE ET ALLEMAGNE : UNE HISTOIRE DU DÉSAJUSTEMENT EUROPEEN. Mathilde Le Moigne OFCE et ENS ULM

Evaluation des Options avec Prime de Risque Variable

Sélection de portefeuilles et prédictibilité des rendements via la durée de l avantage concurrentiel 1

Pour 2014, le rythme de la reprise économique qui semble s annoncer,

EVALUATION DE LA FPL PAR LES APPRENANTS: CAS DU MASTER IDS

Risque associé au contrat d assurance-vie pour la compagnie d assurance. par Christophe BERTHELOT, Mireille BOSSY et Nathalie PISTRE

CHAPITRE I : Cinématique du point matériel

Ned s Expat L assurance des Néerlandais en France

CHAPITRE 4 RÉPONSES AUX CHOCS D INFLATION : LES PAYS DU G7 DIFFÈRENT-ILS LES UNS DES AUTRES?

Ecole des HEC Université de Lausanne FINANCE EMPIRIQUE. Eric Jondeau

Un modèle de projection pour des contrats de retraite dans le cadre de l ORSA

CARACTERISTIQUES STATIQUES D'UN SYSTEME

Annuités. I Définition : II Capitalisation : ( Valeur acquise par une suite d annuités constantes ) V n = a t

Intégration de Net2 avec un système d alarme intrusion

Coaching - accompagnement personnalisé (Ref : MEF29) Accompagner les agents et les cadres dans le développement de leur potentiel OBJECTIFS

Recueil d'exercices de logique séquentielle

COURS GESTION FINANCIERE A COURT TERME SEANCE 3 PLANS DE TRESORERIE. François LONGIN

MODÈLE BAYÉSIEN DE TARIFICATION DE L ASSURANCE DES FLOTTES DE VÉHICULES

CAHIER ANALYSE DES CHOCS D'OFFRE ET DE DEMANDE DANS LA ZONE CFA : UNE MÉTHODE STRUCTURELLE D'AUTORÉGRESSION VECTORIELLE

Article. «Les effets à long terme des fonds de pension» Pascal Belan, Philippe Michel et Bertrand Wigniolle

N d ordre Année 2008 THESE. présentée. devant l UNIVERSITE CLAUDE BERNARD - LYON 1. pour l obtention. du DIPLOME DE DOCTORAT. (arrêté du 7 août 2006)

Files d attente (1) F. Sur - ENSMN. Introduction. 1 Introduction. Vocabulaire Caractéristiques Notations de Kendall Loi de Little.

NUMERISATION ET TRANSMISSION DE L INFORMATION

Estimation d une fonction de demande de monnaie pour la zone euro : une synthèse des résultats

Séquence 2. Pourcentages. Sommaire

Froid industriel : production et application (Ref : 3494) Procédés thermodynamiques, systèmes et applications OBJECTIFS LES PLUS DE LA FORMATION

CHELEM Commerce International

CHAPITRE 13. EXERCICES a) 20,32 ± 0,055 b) 97,75 ± 0,4535 c) 1953,125 ± 23, ±0,36π cm 3

Les solutions solides et les diagrammes d équilibre binaires. sssp1. sssp1 ssss1 ssss2 ssss3 sssp2

Le développement de l assurance des catastrophes naturelles: facteur de développement économique

L impact de l activisme des fonds de pension américains : l exemple du Conseil des Investisseurs Institutionnels.

3 POLITIQUE D'ÉPARGNE

No Décembre. La coordination interne et externe des politiques économiques : une analyse dynamique. Fabrice Capoën Pierre Villa

Mathématiques financières. Peter Tankov

UNIVERSITÉ D ORLÉANS. THÈSE présentée par :

SURVOL DE LA LITTÉRATURE SUR LES MODÈLES DE TAUX DE CHANGE D ÉQUILIBRE: ASPECTS THÉORIQUES ET DISCUSSIONS COMPARATIVES

Université Technique de Sofia, Filière Francophone d Informatique Notes de cours de Réseaux Informatiques, G. Naydenov Maitre de conférence, PhD

TRAVAUX PRATIQUES N 5 INSTALLATION ELECTRIQUE DE LA CAGE D'ESCALIER DU BATIMENT A

Calcul Stochastique 2 Annie Millet

EPARGNE RETRAITE ET REDISTRIBUTION *

CONTRIBUTION A L ANALYSE DE LA GESTION DU RESULTAT DES SOCIETES COTEES

Cours d électrocinétique :

N Juin. Base de données CHELEM commerce international du CEPII. Alix de SAINT VAULRY

NOTE SUR LES METHODES UNIVARIEES

Thème : Electricité Fiche 5 : Dipôle RC et dipôle RL

MIDI F-35. Canal MIDI 1 Mélodie Canal MIDI 2 Basse Canal MIDI 10 Batterie MIDI IN. Réception du canal MIDI = 1 Reproduit la mélodie.

TRANSMISSION DE LA POLITIQUE MONETAIRE AU SECTEUR REEL AU SENEGAL

PREMIÈRE PARTIE LIQUIDITÉ ET MICROSTRUCTURE. La Liquidité - De la Microstructure à la Gestion du Risque de Liquidité

CANAUX DE TRANSMISSION BRUITES

OBJECTIFS LES PLUS DE LA FORMATION

MINISTERE DE L ECONOMIE ET DES FINANCES

DE L'ÉVALUATION DU RISQUE DE CRÉDIT

Cahier technique n 114

TB 352 TB 352. Entrée 1. Entrée 2

Cahier technique n 141

Impact des futures normes IFRS sur la tarification et le provisionnement des contrats d assurance vie : mise en oeuvre de méthodes par simulation

Une assurance chômage pour la zone euro

Une analyse historique du comportement d épargne des ménages américains

Une union pour les employeurs de l' conomie sociale. - grande Conférence sociale - les positionnements et propositions de l usgeres

Thème : Essai de Modélisation du comportement du taux de change du dinar algérien par la méthode ARFIMA

Surface de Volatilité et Introduction au Risque de Crédit

Chapitre 9. Contrôle des risques immobiliers et marchés financiers

DOCUMENT TECHNIQUE N O 2 GUIDE DE MESURE POUR L INTÉGRATION DES TECHNOLOGIES DE L INFORMATION ET DE LA COMMUNICATION (TIC) EN ÉDUCATION

Vous vous installez en france? Société Générale vous accompagne (1)

Transcription:

Modélisaion e prévision de la consommaion horaire d élecricié au Québec Comparaison de méhodes de séries emporelles Mémoire Sylvesre Tasa Mairise en Économique Maîre ès ars (M.A.) Québec, Canada Sylvesre Tasa, 2013

Résumé Ce ravail explore la dynamique de consommaion résidenielle d élecricié au Québec à l aide de données horaires fournies par Hydro-Québec pour la période de janvier 2006 à décembre 2010. Nous considérons rois modèles auorégressifs sandards en analyse des séries emporelles : le lissage exponeniel Hol-Winers, le modèle ARIMA saisonnier (SARIMA) e le modèle ARIMA saisonnier avec variables exogènes (SARIMAX). Pour ce dernier modèle, nous nous concenrons sur l effe des variables climaiques (la empéraure, l humidié relaive e le poin de rosé e la nébulosié). Les faceurs climaiques on un impac imporan sur la consommaion d élecricié à rès cour erme. La performance prédicive inra e hors échanillon de chaque modèle es évaluée avec différens indicaeurs d ajusemen. Trois horizons emporels hors-échanillon son esés : 24 heures (un jour), 72 heures (rois jours) e 168 heures (1 semaine). Le modèle SARIMA offre la meilleure performance prédicive hors-échanillon sur 24 heures. Le modèle SARIMAX se révèle le plus performan hors-échanillon sur les horizons emporels de 72 e 168 heures. Des recherches supplémenaires seraien nécessaires pour obenir des modèles de prévision pleinemen saisfaisan du poin de vue méhodologique. Mos clés : modèles de séries emporelles, élecricié, lissage exponeniel, SARIMA, SARIMAX. III

Absrac This work explores he dynamics of residenial elecriciy consumpion in Quebec using hourly daa from January 2006 o December 2010. We esimae hree sandard auoregressive models in ime series analysis: he Hol-Winers exponenial smoohing, he seasonal ARIMA model (SARIMA) and he seasonal ARIMA model wih exogenous variables (SARIMAX). For he laer model, we focus on he effec of climae variables (emperaure, relaive humidiy and dew poin and cloud cover). Climaic facors have a significan impac on he shor-erm elecriciy consumpion. The inra-sample and ou-of-sample predicive performance of each model is evaluaed wih various adjusmen indicaors. Three ou-of-sample ime horizons are esed: 24 hours (one day), 72 hours (hree days) and 168 hours (1 week). The SARIMA model provides he bes ou-of-sample predicive performance of 24 hours. The SARIMAX model reveals he mos powerful ou-of-sample ime horizons of 72 and 168 hours. Addiional research is needed o obain predicive models fully saisfacory from a mehodological poin of view. Keywords: modeling, elecriciy, Hol-Winers, SARIMA, SARIMAX V

Table des maières Résumé... III Absrac...V Lise des figures...ix Lise des ableaux.xi Lise des abréviaions.xiii Dédicace...XV Remerciemens..XVII Avan-propos...XIX Inroducion... 1 1. Revue de la liéraure... 3 1.1 Revue de liéraure méhodologique... 3 1.1.1 Modèles dynamiques univariés... 3 1.1.2 Modèle de lissage exponeniel Hol-Winers... 6 1.1.3 Les modèles avec variables explicaives exogènes... 7 1.1.4 L approche basée sur l inelligence arificielle... 8 1.2 Revue des recherches e des résulas... 8 2. Méhodologie... Erreur! Signe non défini. 2.1 Le lissage exponeniel de Hol-Winers... 12 2.2 Le modèle ARIMA saisonnier (SARIMA)... 15 2.3 Le modèle ARIMA saisonnier avec variable exogènes... 16 2.4 Procédure d esimaion des modèles SARIMA... 17 2.4.1 Tes de racine uniaire... 17 2.4.2 Saisonnalié e idenificaion des modèles ARIMA saisonnier... 18 2.4.3 Prévisions e mesures de performance prédicives... 19 3. Données... 20 3.1 Saisiques descripives agrégées... 20 3.2 Profils chronologiques... 23 4. Résulas... 28 4.1 Modèles de lissage exponeniel... 29 4.2 Modèles SARIMA... 35 4.2.1 Tess de racine uniaire... 35 4.2.2 Esimaions SARIMA... 36 4.3 Diagnosic des modèles... 43 5. Conclusion... 44 Références bibliographiques... 47 ANNEXE I... 51 VII

Lise des figures Figure 1 : Relaion enre les variables climaiques e la consommaion horaire d élecricié.... 21 Figure 2 : profil de consommaion d élecricié au Québec de 2006 à 2010 (43824heures).... 23 Figure 3 : Profil de consommaion d une semaine ype de chaque saison en 2006 e 2010... 24 Figure 4 : Profil annuel de la consommaion d élecricié à des heures spécifiques... 25 Figure 5 : Profil annuel de consommaion d élecricié en moyenne mobile 30 jours à des heures spécifiques......26 Figure 6 : Périodogramme de la consommaion d élecricié au Québec en fréquence horaire... 27 Figure 7 : ACF e PACF de la consommaion horaire d élecricié... 28 Figure 8 : Profil de prévision de la consommaion d élecricié avec le modèle ETS(MAdA) pour 24h... 31 Figure 9 : Profil de prévision de la consommaion d élecricié avec le modèle ETS(MAdA) pour 72h.... 31 Figure 10: Profil de prévision de la consommaion d élecricié avec le modèle ETS(MAdA) pour 168h... 32 Figure 11 : Profil de prévision de la consommaion d élecricié avec le modèle ETS(AAdA) pour 24h.... 34 Figure 12 : Profil de prévision de la consommaion d élecricié avec le modèle ETS(AAdA) pour 72h.... 34 Figure 13 : Profil de prévision de la consommaion d élecricié avec le modèle ETS(AAdA) pour 168h.... 35 Figure 14 : Profil de prévision de la consommaion d élecricié avec le modèle SARIMA pour 24h.... 38 Figure 15 : Profil de prévision de la consommaion d élecricié avec le modèle SARIMA pour 72h.... 39 Figure 16 : Profil de prévision de la consommaion d élecricié avec le modèle SARIMA pour 168h.... 39 Figure 17 : Profil de prévision de la consommaion d élecricié avec le modèle SARIMAx pour 24h.... 41 Figure 18 : Profil de prévision de la consommaion d élecricié avec le modèle SARIMAX pour 72h.... 42 Figure 19 : Profil de prévision de la consommaion d élecricié avec le modèle SARIMAX pour 168h.... 42 IX

Lise des ableaux Tableau 1 : Saisiques récapiulaives de la consommaion d élecricié sur cinq (5) années au Québec.... 22 Tableau 2 : Saisiques récapiulaives de la empéraure sur cinq (5) années au Québec.... 22 Tableau 3 : Comparaison du crière d informaion d Akaïke (AIC).... 29 Tableau 4 : Comparaison des mesures de l erreur inra échanillon... 29 Tableau 5 : Mesure de l erreur de prévision hors échanillon sur 24h, 72h e 168h avec le modèle MAdA.... 30 Tableau 6 : Mesure de l erreur de prévision hors échanillon sur 24h, 72h e 168h avec le modèle AAdA.... 33 Tableau 7: Résula du es de racine uniaire avec un reard maximum k=168... 35 Tableau 8: Coefficiens e saisiques (SARIMA)... 37 Tableau 9: Mesure de l erreur de prévision hors échanillon sur 24h, 72h e 168h avec le modèle SARIMA.. 38 Tableau 10: Coefficiens e saisiques(sarimax)... 40 Tableau 11: Mesure de l erreur de prévision hors échanillon sur 24h, 72h e 168h avec le modèle SARIMAX... 41 XI

Lise des Abréviaions ACF AIC AR ARX ARIMA ARIMAX ARMA ARMAX ETS NARX MA MAE MAPE MASE ME MPE PACF RMSE Auocorelaion Foncion Akaike informaion crieria Auoregressive Auoregressive wih exogenous variables Auoregressive inegraed moving average Auoregressive inegraed moving average wih exogenous variables Auoregressive moving average Auoregressive moving average wih exogenous variables Exponenial smoohing Non-linear auoregressive wih exogenous variables Moving Average Mean Absolue Error (Erreur absolue moyenne) Mean Absolue Percen Error (Écar absolu moyen en pourcenage) Mean Absolue Squared Error (Erreur quadraique absolue moyenne) Mean Error (Erreur moyenne) Mean Percen Error (Écar moyen en pourcenage) Parial Auocorelaion Foncion Roo Mean Squared Error (Racine carré de l erreur moyenne) XIII

A Suzy Ken e Adeline XV

Remerciemens Mes remerciemens von à oues les personnes du déparemen d Économique de l Universié Laval qui on conribué chacune à leur manière à la réalisaion de ce ravail. Je les adresse ou pariculièremen : Au Pr. Carlos Ordás Criado, qui a fai preuve de beaucoup d engagemen pour la réalisaion de ce ravail malgré sa lourde charge de ravail; Au Pr. Sylvain Dessy pour ses encouragemens lors de mon engagemen dans le programme de maîrise; À ous mes professeurs du déparemen qui on conribué à élargir mes connaissances dans différens domaines de l économie; À ous mes camarades du programme avec qui j ai eu des échanges oujours consrucifs; À Hydro-Québec qui a genimen mis nore disposiion les données nécessaires à cee éude. Ils von aussi à ma fille pour sa paience e à ma rès chère conjoine, Adeline, qui m on encouragé jour après jour lors de la réalisaion de ce ravail. XVII

Avan-propos Ce mémoire es un ravail de recherche en économérie appliquée aux séries chronologiques. L économérie des séries chronologiques es d une imporance cruciale dans la recherche empirique. Ses domaines d applicaions von de l idenificaion des propriéés saisiques fondamenales des séries économiques dans leur dimension emporelle, à la modélisaion à des fins de simulaion e de prévision. C es dans cee logique que nous conduisons cee recherche. Je remercie le Pr. Carlos Ordás Criado du déparemen d Économique de l Universié Laval qui a su suscier en moi l inérê pour comprendre e uiliser ces méhodes. Ce mémoire m a permis de compléer ma formaion d économise en méhodes quaniaives. L objecif de ce mémoire es d explorer les performances de rois modèles de base en séries emporelles pour analyser la consommaion horaire d élecricié au Québec. La modélisaion permean d effecuer des prévisions, nous nous sommes concenrés sur la prévision à cour erme, en prenan en compe an l inerie de la consommaion que l effe de variables climaiques fondamenales. Cee recherche es un premier pas dans le développemen d ouils rigoureux d aide à la décision, qui pourraien êre uiles aux opéraeurs du seceur, principalemen Hydro-Québec. Toue l analyse s es faie à l aide du logiciel saisique R. À ce égard, je remercie ici oue la communaué des chercheurs qui ravaillen coninuellemen à améliorer ce ouil de ravail de qualié, accessible grauiemen e d une grande puissance. Éan conscien que la science es basée sur la criique, je suis oujours inéressé à recevoir oues les remarques ou suggesions de correcion ou d amélioraion de ce qui a éé présené dans ce mémoire. XIX

Inroducion La producion d élecricié revê dans chaque pays des enjeux économiques, de sécurié e de bienêre social : l élecricié es un faceur de producion fondamenal dans l acivié économique moderne. La régularié de son offre pose des défis pariculiers puisque ce flux coninu es difficilemen sockable. La prévision à cour erme de la consommaion d élecricié joue un rôle esseniel dans la gesion efficace des ressources allouées à la producion d élecricié. Les erreurs de prévisions peuven, en effe, occasionner des coûs opéraionnels imporans (Haida e Muo, 1994). D après Hobbs e al. (1999), une réducion de l erreur moyenne de prévision de 1% peu épargner des milliers, voire même des millions de dollars dans une unié de producion d élecricié. Soares e Medeiros (2008) cien l esimaion effecuée en 1984 dans une insallaion élecrique au Royaume- Uni, où un accroissemen de 1% de l erreur de prévision avai causé un accroissemen annuel des coûs opéraionnels de 10 millions de livres serling. Lorsque le seceur de l élecricié es foremen régulé 1, les opéraeurs en siuaion de monopole uilisen la prévision à cour erme pour assurer la fiabilié de l offre (Weron, 2006). Ainsi selon ce aueur, du poin de vue de l opéraeur, prévoir la consommaion d élecricié es nécessaire pour la consiuion d ouils d aide à la décision e pour minimiser les coûs de sur/sous-producion qui ne son pas facilemen ransférables dans les prix. Du poin de vue de la héorie économique, les modèles de prévision à cour e moyen erme se concenren sur une modélisaion des poins d équilibre, où l offre e la demande s égalisen à un insan. A l équilibre, l opéraeur offre la quanié demandée à laquelle s ajoue les peres de charge. À cour erme, la demande d élecricié es rès dépendane des variables liées aux condiions climaiques, à l organisaion sociale e au cycle économique (Weron e Misiorek, 2008). Elle es donc sujee à d imporanes flucuaions. Du poin de vue de l offre, Taylor (1975) précise que la producion d élecricié dépend de la capacié producive des insallaions élecriques. Elle es fixe à cour erme e elle se mesure en général en wa. Dans ce ravail, nous nous concenrons sur la consommaion domesique (résidenielle e agricole) d élecricié de la province du Québec de la période du 1 er Janvier 2006 au 31 décembre 2010. Ce marché es foremen régulé e Hydro-Québec y es l opéraeur unique, vericalemen inégré (producion, ranspor, disribuion d élecricié). Cee enreprise exploie esseniellemen l énergie 1 Ce qui es le cas au Québec. 1

d origine l hydraulique (95%), le rese éan composé d énergie d origine nucléaire, gazière e éolienne, généralemen acheée auprès de produceurs privés. Selon le Minisère des Ressources naurelles e de la Faune du Québec e Saisique Canada, en ermes de consommaion finale par seceur d acivié au cours de ces dix dernières années 2, le seceur indusriel arrive en êe pour 44.8% approximaivemen, suivi du seceur résideniel, 34.4%. Le seceur du ranspor es celui don la consommaion es la plus faible (0.2%) andis que le seceur commercial consomme 20.06%. La consommaion oale éai en baisse en 2009 de 2.14% par rappor à 2008. Dans ce ravail, nous nous inéressons à la consommaion élecrique domesique de l ensemble de la province de Québec. Duran la période d analyse, cee consommaion a éé légèremen croissane de 2006 à 2009 e en léger repli en 2010. Par conséquen, la série ne présene pas de endance haussière prononcée. Le pic de consommaion a éé observé le 16 janvier 2009 à 7h du main. Les 18120 Mwa 3 consommés ce jour-là représenen un écar de 40% par rappor à la moyenne de ce même mois de janvier qui éai de 12 725 Mwa. Un el écar es emblémaique de la pression qui peu êre imposé au réseau élecrique à rès cour erme, d où l imporance d esimer des modèles capables de prédire la consommaion horaire avec fiabilié. Dans nore recherche, nous nous inéressons à la modélisaion de la consommaion d élecricié à cour erme avec des echniques de séries chronologiques qui prennen en compe plusieurs ypes de saisonnaliés liées aux condiions climaiques e à l organisaion de l acivié économique. La empéraure, l humidié, les poins de rosé, la nébulosié son les principales variables climaiques exogène qui influencen direcemen la demande horaire d élecricié. Les événemens pariculiers liés aux jours fériés affecen l organisaion économique e agissen aussi direcemen sur la consommaion d élecricié. Noons que rès peu d éudes récenes on éé consacrées à la modélisaion de la consommaion de l élecricié pour la région du Québec, en pariculier sur des données à haue fréquence. À nore connaissance, celles qui se son inéressées à la consommaion d élecricié se son limiées aux approches microéconomériques e microéconomiques 4. Plusieurs méhodologies son à disposiion pour modéliser la consommaion d élecricié à cour erme. On peu les classer en deux grandes caégories : i) les modèles basés sur les echniques économériques radiionnelles (lissage exponeniel simple, méhode Hol-Winers, régression linéaire ou robuse, 2 Minisère des Ressources naurelles e de la Faune du Québec. «Consommaion d'élecricié [archive]». hp://www.mrn.gouv.qc.ca/. Sie inerne consulé le 2012-08-14. 3 D après nore base de données sur la consommaion d élecricié au Québec. 4 Voir Bernard, J. T., D. Bolduc, e al. (1996) ; Bernard, J. T., D. Bolduc, e al. (2011). 2

modèles auorégressifs e de moyennes mobiles) e ii) les echniques basées sur l inelligence arificielle (le réseau de neurones, sysème de réseau flou, sysème exper e machine à veceur suppor). Nous nous concenrons ici sur rois méhodes économériques de séries emporelles. Ce ravail es divisé en cinq secions. La première propose une revue de liéraure sur nos modèles d inérê e les ravaux les plus récens sur le suje. La seconde secion décri avec plus de déails la méhodologie empirique reenue. La descripion des données es faie en secion rois. Nos résulas figuren en secion quare e nous exposons nos conclusions dans la secion 5. 1. Revue de la liéraure Au fil des années, différens echniques on éé développés pour modéliser la charge d élecricié an avec les ouils classiques de l économérie des séries emporelles 5, qu avec les méhodes de l inelligence arificielle 6. Ceraines éudes se concenren sur la comparaison de modèles spécifiques à l une de ses approches, alors que d aures comparen ces deux classes de modèles. Dans la secion suivane, nous âchons dans un premier emps de donner une vision globale de l ensemble des modèles à disposiion pour éudier la consommaion d élecricié dans un bu de prévision. En secion 1.2, nous proposons une revue de liéraure de ravaux récens dans le domaine. 1.1 Revue de liéraure méhodologique Ces approches se subdivisen en deux caégories : l une se concenre exclusivemen sur les propriéés emporelles de la variable éudiée (méhodes univariées) andis que l aure considère la relaion enre la variable éudiée, son passé e d aures variables explicaives exogènes. La première approche uilise exclusivemen l inerie de la série pour prédire ses réalisaions fuures, la seconde approche inrodui dans la dynamique de la chronique l influence d aures variables explicaives. 1.1.1 Modèles dynamiques univariés 5 Voir Bunn e Farmer, 1985a 6 Voir Hipper e al.( 2001); Mohandes (2002); Chen e Chang (2004) ; Meaxiois e al.(2003) ; Weron (2006, 75-78); 3

La modélisaion univariée d une série emporelle se fai en général à l aide d une régression linéaire qui inclu deux composans : un erme auorégressif (AR) qui éabli un lien (généralemen linéaire) enre les réalisaions présenes e passées de la variable d inérê e une composane de moyenne mobile (MA), qui éabli un lien (généralemen linéaire) enre les déviaions aléaoires présenes e passées enre les réalisaions de la série en ous emps e les valeurs inra-échanillon prédies par le modèle. Dans nore conexe, lorsqu un modèle puremen AR(p) es uilisé pour modéliser le profil emporel de consommaion d élecricié, la réalisaion présene de cee variable es une combinaison linéaire des consommaions observées aux p périodes précédenes auquel on ajoue une erreur de mesure aléaoire pour la période présene. L avanage du modèle auorégressif es sa simplicié. Son inconvénien es que les méhodes auorégressives présupposen la saionnarié des séries. Une série es die faiblemen 7 saionnaire si sa moyenne, E ( ) = µ ne dépend pas l indice de emps e si la covariance enre z e k z z z dépend seulemen du décalage k. Si une série es saionnaire e 2 normalemen disribuée alors, la moyenne ( µ z ) e la variance ( σ z ) suffisen pour caracériser la série. Cependan, la covariance es imporane pour l idenificaion des foncions d auocorrélaion (Aragon, 2011 ; 57). L économérie disingue en général deux ypes de non saionnarié : déerminise e sochasique. Un processus non saionnaire déerminise à la forme générale y = f() + ε, où f() es une foncion déerminise du emps () e ε es un erme d erreur aléaoire de moyenne nulle, de variance finie e en général indépendan e ideniquemen disribué. Un processus non saionnaire sochasique es un processus explosif vis-à-vis de ses réalisaions passées. Le plus connu d enre eux es la marche aléaoire (ou processus avec une racine uniaire sans dérive), qui a la forme foncionnelle y = y 1 + ε. Il es facile de monrer que la variance de ce processus croî avec. Une simple ransformaion des données perme en général de sabiliser les séries non saionnaires. Dans le cas de la endance déerminise, il faudra idenifier la forme paramérique de f() e la sousraire à y pour obenir une ransformaion saionnaire de la série. Dans le cas de la endance sochasique, la différenciaion des données perme de rendre le processus sable. Noons qu un processus peu posséder une endance à la fois déerminise e sochasique. 7 Dans l éude de la saionnarié, on disingue la saionnarié srice e la saionnarié faible. La saionnarié srice implique que f(x 1,, x ) e f(x 1+k,, x +k ) son de même loi. 4

Les séries chronologiques de consommaion d élecricié son généralemen non saionnaires car, soi elles croissen dans le emps (la moyenne croî avec ), soi la variance croî dans le emps, soi les deux. Cee non saionnarié en moyenne e/ou variance n es pas problémaique car elle se raie comme indiqué ci-dessus. Une aure approche de modélisaion des séries chronologiques es la echnique des moyennes mobiles (MA) sur les erreurs. Cee echnique considère qu une chronique peu s exprimer comme une combinaison linéaire de bruis blancs 8 à l horizon -q. Lorsqu un processus MA(q) es inversible 9, il peu êre alors combiné à un processus auorégressif AR(p) pour consruire un modèle à composans AR(p) e MA(q), appelé ARMA (p,q) (Aragon, 2011;70-71). Selon Weron (2006;83), la méhode des moyennes mobiles n es pas efficace pour la modélisaion de la consommaion d élecricié e n es généralemen uile que pour le lissage des séries chronologiques. Pour Aragon (2011;67), l uilisaion des deux composanes perme de mieux capurer la dynamique sous-jacene, qui es le frui de l auocorrélaion, des variaions saisonnières e d aspecs aléaoires. La combinaison des deux modèles pose parfois des problèmes d inversibilié du modèle MA(q). Il convien alors de vérifier que les racines du polynôme caracérisique 10 du processus MA(q) son sricemen supérieures à 1. Lorsque cee condiion es vérifiée, on di que le modèle MA(q) es inversible. Il exise une version saisonnière du modèle ARMA(p,q), qui perme aux composans AR e MA de s adaper aux cycles observés (semaine, mois, saison). On dénoe ses modèles par SARMA(p,q)(P,Q)s ou encore ARMA(p + sp, q + sq),où s es la cyclicié du processus (ex : s=12 pour un cycle mensuel), p e q son les paramères habiuels de nore ARMA non saisonnier e P, Q e s son des paramères spécifiques à la composane saisonnière. En effe, un processus ARMA qui présene des cycles ne pourra pas êre caracérisé par une srucure d erreurs aléaoires sans auocorrélaion e les ermes aléaoires du modèle ne respeceron pas l hypohèse de «bruis blancs». Il es alors indiqué de résoudre le problème en modélisan le résidu lui-même par un ARMA 8 En l occurrence, il s agi d un brui blanc, c es-à-dire une variable aléaoire ε qui a les caracérisiques suivanes : E(ε ) = μ, E(ε 2 ) = σ 2, E(ε ε s ) = 0 s. 9 Un processus MA(q) es inversible s il peu êre représené comme un processus auorégressif infini, voir Aragon (2011 :67). q 10 1+ 1 +... + = 0 θ z θ q z 5

ayan pour unié de emps la période de la saisonnalié. On obien alors un modèle ARMA saisonnier sous l hypohèse de la saionnarié (Aragon, 2011;83). Des modèles dynamiques équivalens à ceux présenés ci-dessus exisen pour les séries non saionnaires, pour lesquelles la non saionnarié es d origine sochasique. Il s agi des modèles ARIMA(p,d,q) e SARIMA(p,d, q)(p, D,Q)s, qui son des modèles adapés aux séries qui deviennen saionnaires par différenciaion d ordre d pour la parie non saisonnière e d ordre D pour la parie saisonnière. 1.1.2 Modèle de lissage exponeniel Hol-Winers Le lissage exponeniel englobe une série de méhodes inuiives de lissage e de prévision apparues dans les années 50. Au fil des années, ces méhodes on laissé place à des spécificaions rigoureuses. Ces echniques permeen de mere à jour les prédicions en +1 sur la base de moyennes pondérées des valeurs passées. Dans sa version la plus simple, le lissage exponeniel s exprime par l équaion : μ = c 0 y + c 1 y 1 + c 2 y 2 +, où les poids c 0 peuven êre définis de nombreuses manières, voir Aragon (2011;121) pour une présenaion concise. Si μ consiue nore prévision de y en +1, il es inuiif d aribuer plus de poids aux valeurs y récenes. Le modèle de base sous cee hypohèse aribu des poids qui décroissen exponeniellemen, selon la formule c i = α(1 α) i, i = 0,1, e 0 α 1, d où l appellaion de lissage exponeniel. Plus le paramère α es proche de 1, plus le passé immédia influence la prévision μ. Ce schéma de pondéraion condui à l expression équivalene μ = αy + (1 α)μ 1, dans laquelle la mise à jour de la prévision en +1 s effecue facilemen dès qu une informaion en es connue, en séparan la conribuion du passé loinain e du présen immédia. Dans ce ravail, nous nous concenrons sur des méhodes de lissage exponeniel de ype Hol-Winers, qui permeen d ajouer à la composane auorégressive du modèle, une endance e une saisonnalié. Noons égalemen que le lissage exponeniel peu s exprimer sous la forme de modèles ARIMA spécifiques, voir à ce suje Hyndman e al (2011, Ch.11). Jusqu à présen, nous avons laissé de côé les élémens de naure exogène qui influencen l évoluion d une chronique. Il es donc imporan de s inéresser à l inclusion de variables exogènes dans le processus de généraion de données emporelles. 6

1.1.3 Les modèles avec variables explicaives exogènes Ceraines méhodes saisiques de prévision de la consommaion d élecricié basées sur les séries chronologiques uilisen la consommaion passée e les valeurs couranes ou passées des variables explicaives exogènes pour prévoir la consommaion courane d élecricié. La régression muliple basée sur l esimaeur des moindres carrées es la plus uilisée. Il s agi ici de rechercher le meilleur ajusemen de la variable expliqués aux variables explicaives elle que la somme des carrées de résidus soi minimisée (Weron, op. ci.;81). Ainsi, lorsqu un processus AR(p), ARMA (p,q) ou ARIMA(p,d,q) es idenifié pour modéliser une série chronologique, on peu lui ajouer des variables explicaives exogènes don on soupçonne l influence direce. On obien alors des modèles appelés ARX, ARMAX ou ARIMAX. La composane X du modèle indique que le processus dépend de variables explicaives exogènes. Les méhodes de modélisaion de la consommaion d élecricié uilisen par exemple les variables liées aux condiions climaiques elles que la empéraure, l humidié, ec. Lorsque l effe de ces variables explicaives sur la consommaion es non linéaire 11, cerains aueurs fon appel à une foncion (non-linéaire) de ransfer, qui spécifie l incidence des processus, els que le chauffage e la climaisaion, sur la relaion enre les variaions des variables climaiques e de consommaion d élecricié. Bisgaard e Kulahci (2011;203-261) on présené une méhodologie d idenificaion des foncions de ransfer dynamique, basée sur la héorie développée par Box e Jenkins (1969), qui perme de mieux caper les mécanismes de la relaion non linéaire («avec reard») enre les variables explicaives e la variable expliquée. Selon ces deux aueurs, elle es défini par opposiion à la régression linéaire simple qui spécifie un effe immédia d une variable explicaive sur une variable dépendane. Plusieurs aures echniques de régression permeen de enir compe de la sélecion des variables, de la corrélaion enre les variables e de l exisence des valeurs exrêmes dans les variables e les résidus : ce son les echniques de régression robuse 12. L analyse en composane principale (ACP) es adapée à la siuaion où il exise un grand nombre de variables explicaives dans un modèle de régression, don l effe individuel es difficilemen idenifiable. L ACP a pour bu de réduire la dimension d un ensemble de variables explicaives 11 Les ménages uilisen les disposiifs de chauffage ou de climaisaion seulemen à parir de cerains niveaux de empéraure exérieure. 12 Voir Tibshirani (1996); Wang e Jiang (2007); Wang e Tsai (2007). 7

corrélées. Il s agi de décrire les variaions d un ensemble de variable corrélée par un sous ensemble de variables non corrélées dérivé par combinaison linéaire des variables iniiales. Éan donné le grand nombre de variables qui peuven influencer la consommaion d élecricié à cour erme, cerains aueurs on recours à ces méhodes (voir-ci-dessous). 1.1.4 L approche basée sur l inelligence arificielle Hahn, Meyer-Nieberg e Pickl (2009) on recensé plusieurs éudes sur la prévision de la consommaion de l élecricié basée sur l inelligence machine : Les réseaux neuronaux arificiels, sysème de réseau flou, sysème exper e machine à veceur suppor. La paricularié de ces méhodes es qu elles uilisen les echniques de l inelligence arificielle (i.e. la programmaion sur ordinaeur) e iennen compe de relaions complexes e non linéaires enre les variables endogènes e exogènes e la consommaion courane d élecricié que les méhodes de régression peinen à appréhender. Selon Weron (op.ci.;75-78), ces méhodes son une «boie noire» e leur performance prédicive n es pas enièremen convaincane. Nous ne faisons pas une présenaion déaillée de cee liéraure car nore bu es d uiliser les méhodes de séries chronologiques. 1.2 Revue des recherches e des résulas Taylor, Menezes e McSharry (2006) comparen la précision prédicive à cour erme (jusqu à un jour) de six méhodes univariées d esimaion de la demande d'élecricié. Les approches analysées incluen le modèle ARIMA à double saisonnalié muliple, le lissage exponeniel pour double saisonnalié e une nouvelle méhodologie basée sur l'analyse en composanes principales. Les méhodes son appliquées à la demande d élecricié horaire de Rio de Janeiro enre le 5 mai 1996 e le 30 novembre 1996 e à la demande pour chaque demi-heure en Angleerre e au Pays de Galles couvran la période du 27 mars 2000 au 22 ocobre 2000. La méhode de lissage exponenielle par double saisonnalié performe bien avec les deux séries puisqu elle fourni le pourcenage de l erreur absolue moyenne de prévision le plus faible. Il ressor égalemen de l éude que les approches les plus simples e robuses, qui exigen peu de connaissances spécifiques à l indusrie élecrique, peuven surpasser des modèles plus complexes. 8

En appliquan une méhodologie similaire à celle de Taylor e al. (2006), Taylor e McSharry (2007) on uilisé les données inra journalière de consommaion d'élecricié de dix pays européens pour effecuer de la prévision à cour erme. Ils définissen un modèle ARIMA, un modèle AR périodique, une exension pour double saisonnalié par lissage exponeniel de Hol-Winers e une méhode basée sur l'analyse en composanes principales. Leurs modèles qui iennen compe de la présence d un cycle journalier e hebdomadaire dans les données son appliqués aux données journalières de consommaion d élecricié des dix pays sur une période de rene semaines (3 avril 2005 au 29 ocobre 2005). La comparaison de la performance prédicive de ces méhodes aboui à peu de différences enre modèles. Les méhodes ARIMA e de l'analyse en composanes principales se monren les plus performanes en erme d erreurs absolues. Amjadi (2001) propose une méhodologie basée sur seize modèles ARIMA modifiés pour modéliser la consommaion d élecricié en Iran. Ces modèles son issus du modèle ARIMA régulier (Box- Jenkins, 1976). Pour modifier les modèles, une variable qui es la prévision iniiale de la variable dépendane effecuée par l opéraeur du sysème e une variable de empéraure calculée son inclus dans le modèle. La variable de empéraure es calculée à parir de rois secions isohermiques définies sur la base des différens ypes de clima observé en Iran. La empéraure horaire uilisée dans chaque secion es finalemen obenue en pondéran la empéraure observée par la proporion de la consommaion d élecricié de chaque secion. Les modèles ARIMA modifiés son subdivisés en deux caégories comprenan chacune hui modèles : la première caégorie modélise la consommaion horaire des jours de semaine e de weekend e la deuxième caégorie es uilisée pour modéliser les pics journaliers de consommaion. Une variable supplémenaire associé à des inervalles horaires pendan lesquelles les pics son observés duran chaque saison es ajouée aux modèles de la deuxième caégorie. Les modèles son esimés en régression linéaire muliple e esés avec les données horaires de consommaion d élecricié, des prévisions de l opéraeur e de empéraures observées en Iran dans la période de 1991 à 1997. Deux crières d appréciaion son reenus pour évaluer l efficacié des modèles : l erreur absolue moyenne en pourcenage e l erreur absolue maximum en pourcenage. En comparan les modèles esimés au modèle ARIMA régulier, il ressor que les modèles ARIMA modifiés produisen une meilleure prévision que le modèle ARIMA régulier à cause de la variable, «prévision de l opéraeur», incluse dans les modèles modifiés qui es foremen corrélée avec la variable dépendane esimée. 9

Kagan, Gokas e Hepsag (2009) on comparé rois modèles : le modèle ARIMA ajusé de la saisonnalié, le modèle SARIMA e un modèle de régression avec variables binaires séquenielles pour la prévision de la consommaion horaires d élecricié en Turquie. Pour définir le modèle ARIMA, ils on évalué les effes saisonniers en faisan une régression de la demande d élecricié sur des variables binaires associées à la périodicié des effes saisonniers. Ils on ensuie exrai la saisonnalié par la méhode des moyennes mobiles muliplicaives e la série obenue a éé rendue saionnaire en appliquan une différenciaion régulière d ordre un. Les foncions d auocorrélaion e d auocorrélaion parielle on servi à idenifier respecivemen l ordre des processus MA e AR. Le modèle SARIMA es uilisé pour enir compe de la saisonnalié qu ils on idenifiée par régression linéaire. Le modèle de régression avec variables binaires séquenielles es proposé comme une méhode alernaive à la méhode Box-Jenkins. Les chocs srucurels son idenifiés dans ce modèle par les ess CUSUM e CUSUM-SQ sur les résidus de la régression e définis par les variables binaires dans le modèle de régression. Les rois modèles son esés sur les données horaires de la Turquie sur la période de janvier 1997 à décembre 2005. Les résulas de cee éude monren que la méhode de régression avec variables saisonnières laenes (binaires) es une méhode alernaive à la méhode Box-Jenkins (ARIMA ou SARIMA) en cas de fore saisonnalié e de rupure srucurelle dans la variable éudiée. Elle fourni une meilleure prédicion avec l erreur absolue moyenne en pourcenage la plus faible. Soares e Medeiros (2008) éenden les ravaux de Coe e Smih (2003) e Soarez e Souza (2006) e s inéressen à la prévision de la consommaion d élecricié des régions du Sud du Brésil duran la période allan du 1 er Janvier 1990 au 31 décembre 2000. Leur modèle auorégressif, appelé «modèle auorégressif saisonnier à deux éapes», décompose les séries en (i) une parie déerminise qui capure les effes de long erme, les saisonnaliés annuelles e les évènemens pariculiers à l aide de endances (linéaires e non linéaires) e de variables muees e (ii) une composane sochasique dans laquelle le erme d erreur sui un processus auorégressif. En appliquan leur modèle sur les données par ranche horaire (la charge horaire, pour chaque ranche horaire éan raiée comme une série chronologique séparée), ils comparen sa performance prédicive à celle d'un modèle ARIMA saisonnier. Leurs résulas indiquen que la subdivision des données en plages horaires améliore significaivemen la performance prédicive. 10

Yang, Huang e Huang (1995) uilisen comme seule variable explicaive exogène, la empéraure, pour esimer un modèle ARMAX. Leur méhodologie es basée sur ce qu ils on qualifié d approche de «programmaion évoluionnaire 13 de prévision de charge à cour erme». Dans cee approche ils définissen des ensembles «parens» e «fils» don les élémens son différens ordres du modèle ARMA ou les paramères esimés de ce modèle. Ils on sélecionné les élémens de chaque ensemble par un processus de compéiion aléaoire en foncion des valeurs qui procuren un meilleur modèle. Ils on esé leur modèle avec les données horaires d élecricié e de empéraure à Taiwan, regroupées en deux caégories : données de jour de semaine e données de Weekend. Le crière d erreur de prédicion finale d Akaike es adopé pour idenifier la valeur appropriée de l ordre du modèle e une foncion de pere es uilisée pour idenifier les paramères appropriés. La capacié prédicive de leur modèle ARMAX s es avérée supérieure à celle proposée par le logiciel commercial SAS pour la prévision d un jour à une semaine, jusifian la possibilié d améliorer les capaciés des modèles ARMAX par l algorihme de «programmaion évoluionnaire». La paricularié de leur éude es que leur algorihme es principalemen basé sur un jeu d opimisaion permean de sélecionner le meilleur ordre du modèle ARMA e les meilleurs coefficiens des variables du modèle ARMAX. Espinoza e al. (2007) consruisen un modèle pour idenifier la relaion non linéaire enre la charge d élecricié e les variables exogènes suscepibles en Belgique. Leur modèle non linéaire auorégressif avec variables exogènes (NARX) es consiué de rois ensembles de variables explicaives : le premier ensemble es la parie auorégressive conenan les données de consommaion horaire d élecricié de deux jours précédens; le second es consiué des variables liées à la empéraure mesuran les effes de l uilisaion des équipemens de chauffage e de refroidissemen e le roisième ensemble regroupe les variables d informaion calendaire sous forme de variables binaires sur le mois de l année, le jour de la semaine e l heure de la journée. Ces variables exogènes influencen la variable dépendane à ravers une foncion inconnue qu ils définissen à l aide d une echnique de moindres carrés 14 sous l hypohèse de non linéarié. Le modèle es esé sur les données horaires de consommaion d élecricié e de empéraure. L erreur absolue moyenne, s es siuée en dessus de 3% dans les différens échanillons. Ce qui a permis de 13 Pour une meilleure compréhension de cee méhodologie, voir, Fogel D.B (1994). 14 Voir Espinoza, M., J. A. K. Suykens, e al. (2006). 11

conclure que cee méhodologie perme d obenir de meilleurs résulas de prévision en comparaison à la méhode des moindres carrées ordinaires. 2. Méhodologie Dans cee parie, nous présenons de manière plus déaillée les modèles reenus dans nore éude ainsi que la démarche adopée pour les esimer. Le premier modèle es un modèle de lissage exponeniel avec erreurs muliplicaive/addiive, endance addiive e saisonnalié addiive, ETS (M,A, A)/ETS(A,A,A) 15. Le deuxième modèle es un modèle ARIMA saisonnier (SARIMA) sans variables exogènes. Le dernier modèle reenu es un ARIMA saisonnier avec variables exogènes (climaiques). Ces modèles son les plus courammen uilisés dans la liéraure sur le suje. 2.1 Le lissage exponeniel de Hol-Winers Le lissage exponeniel de Hol-Winers, aussi appelé lissage exponeniel riple, décompose la variable d inérê en deux composans, une endance (T) e une saisonnalié (S), auxquels on peu ajouer un erme d erreur (E). Il exise deux grandes versions de ce modèle : une version addiive qui es indiquée lorsque la variance es sable dans le emps, e une version muliplicaive plus adéquae lorsque la variance croî/décroî dans le emps. Dans ce ravail, nous privilégierons la version addiive, car nos données corroboren pluô l hypohèse d une variance de la consommaion horaire d élecricié relaivemen sable dans le emps (voir la secion 3). Néanmoins, nous éudions égalemen différenes versions de ces modèles de lissage, selon la méhodologie proposée par Hyndman, Koehler, Ord e Snyder (2008,11 :27) 16. Nous comparons ces modèles en ermes de crière d informaion e de performance prédicive. Hyndman, Koehler, Ord e Snyder (2008) proposen une méhodologie d esimaion des modèles de lissage exponeniel basé sur l approche espace-éa, qu ils meen en praique dans la foncion es() de la librairie forecas du logiciel R. Les paramères son esimés par maximum de vraisemblance. Ces aueurs précisen que, dans le cas des modèles addiifs de ype Hol-Winers avec une endance à deux composanes (le niveau (level) e la pene (growh)), l esimaion pour h périodes fuures es donnée par l équaion suivane : 15 ETS(MAA) siginifie ExponenTial Smoohing wih Muliplicaive errors, Addiive rend and Addiive seasonaliy 16 Forecasing wih Exponenial Smoohing: The Sae Space Approach 12

Où l es le niveau eb es la pene. T = l bh [1] h + Cee endance addiive es dans cerain cas amorie (noée Ad pour «Addiive damped rend». Gardner e McKenzie (1985) 17 on proposé une modificaion de la méhode linéaire de Hol pour permere de prendre en compe cee version amorie. Les équaions de la endance deviennen alors : Niveau : l α y + 1 α)( l φb ) [2.a] = ( 1 + 1 * * Pene : b = β ( l l 1) + (1 β ) φb 1 [2.b] Prévision : = + h / y 2 l + ( ( φ + φ +... + φ h ) b [2.c] 0 < φ 1 monre bien l aspec amori de l esimaion : plus la prévision es éloignée, plus l effe de la pene décroi. Par exemple, la pene pour la prévision en +1, +2, ec., son b, (φ + φ 2 )b,.,ec. Une valeur de φ proche de 1 donne plus de poid au présen immédia. D après Hyndman e al.(op.ci), la saisonnalié peu êre incluse dans l expression anérieur e s exprimer en ermes de niveau e de pene de manière addiive : Niveau : l α z s ) + (1 α)( l b ) [3.a] = ( m 1 + 1 Pene : b β ( l l 1 ) + (1 β ) b 1 [3.b] Saisonnalié : = s = ( z l b ) 1 + (1 ) s γ [3.c] 1 γ m La prévision : z + h = l + b h + s m+ h [3.d] m avec = [( h 1) mod m] + 1 h m Les équaions [3.a] à [3.d] peuven êre réécries en foncion de l erreur de prévision, selon que cee erreur, noée ε, es muliplicaive ou addiive. On obien alors les formulaions suivanes: 1. Modèle avec erreurs addiive, endance addiive e saisonnalié addiive (AAA) : 17 Gardner, E. S.,e McKenzie, E. D. (1985). Forecasing rends in ime series. Managemen Science, 31(10), 1237-1246. 13

[4.a] µ l b s = l 1 + b 1 + s m = l 1 + b 1 + αε [4.b] = 1 + βε [4.c] b = s m + γε [4.d] 2. Modèle avec erreurs addiive, endance addiive amorie e saisonnalié addiive (AAdA) : µ l = l 1 + φb 1 + l b αε s m [5.a] = 1 + φ 1 + [5.b] b s = φ b 1 + βε [5.c] = s m + γε [5.d] 3. Modèle avec erreurs muliplicaive, endance addiive e saisonnalié addiive (MAA) : µ l b s = l 1 + b 1 + = l s m 1 + b 1 + ( l 1 + b 1 + s m = b = s α ) ε 1 + ( l 1 + b 1 + s m β ) ε m + ( l 1 + b 1 + s m γ ) ε [6.a] [6.b] [6.c] [6.d] 4. Modèle avec erreurs muliplicaive, endance addiive amorie e saisonnalié addiive (MAdA) : µ l b = l 1 + φb 1 + = l s m 1 + b 1 + α( l 1 + φb 1 + s m φ ) ε = φ b ) ε 1 + β ( l 1 + φb 1 + s m [7.a] [7.b] [7.c] 14

s = s m + ( l 1 + φb 1 + s m γ ) ε [7.d] Le erme ε es supposé indépendan e ideniquemen disribué e sui une disribuion gaussienne de moyenne 0 e de variance consane. 2.2 Le modèle ARIMA saisonnier (SARIMA) Le deuxième modèle esimé dans ce ravail es le modèle ARIMA saisonnier. Rappelons les hypohèses implicies à ce modèle, énoncées en secion 1.1.1 : (i) exisence d une corrélaion linéaire enre les observaions présenes e passées de la variable d inérê; (ii) exisence d un effe linéaire aléaoire présen e passé sur la variable d inérê e (iii) absence d effe significaif d aures variables exogènes. Dans sa forme la plus sandard, voir Aragon (2011;103), ce modèle s écri : Z = 1 1 2 2 p p β + φ Z + φ Z +... + φ Z + ε, φ p 0, 2 ε BB(0, ) σ υ [8] Z es la consommaion d élecricié à l insan φ i es un paramère d auorégression correspondan au reard i el que i= 1,..,p ε es un choc aléaoire de la série chronologique e es un Brui blanc de moyenne nulle e de variance consane. En inégran l opéraeur de reard l équaion [8] devien : Θ ( B) = β + υ [9] Z el que 2 p Θ ( B) = 1 φ1 B φ2b... φ pb [10] i B es l opéraeur de reard pour le reard i. Z es un processus AR(p) saionnaire ; les racines du polynôme Θ( B ) = 0 n appariennen pas à l inervalle [-1,1]. Sous l hypohèse (ii), nous considérons que une fracion de la consommaion d élecricié sui une marche aléaoire e qu une observaion peu aussi êre es définie par : Z = µ + ε + θ1 ε... θ ε [11] 1 + + θ i es un paramère de la composane en moyenne mobile du reard i el que i= 1,,q, q q 15

En inroduisan l opéraeur de moyenne mobile, nous obenons : Θ ( B) = 1+ θ... + 2 q 1 B + θ 2B + θ q B, [12] Tel que l équaion, Z = µ + Θ( B) ε [13] n es pas un brui blanc (voir la noe de bas de page, numéro 8). Les racines de l équaion [12] son sricemen supérieures à 1 en valeur absolue. En incorporan les effes saisonniers aux équaions [8] e [13] à ravers les paramères associés à la saisonnalié (P, D, Q), nous obenons le modèle SARIMA défini par : Θ ( B B B B Z Φ B B [14] P s s D d S ) φ p ( )(1 ) (1 ) = Q ( ) θ q ( ) ε Sous l hypohèse (iii), nous ignorons l effe de faceurs exogènes sur la consommaion d élecricié. Le modèle es ainsi basé sur les hypohèses de non saionnarié, d auocorrélaion des valeurs de la série, de l exisence d une composane aléaoire e de la saisonnalié. Les valeurs de p, d, q, P, D, Q e s que nous obiendrons du modèle esimé nous permerons de rejeer ou de ne pas rejeer ces hypohèses pour la série chronologique de consommaion d élecricié dans la région de Québec. Ce modèle es idenifié selon la méhodologie proposé par Hyndman e Khandakar (2008). Cee procédure es implémenée dans la foncion auo. arima() du packages forecas du logiciel R. 2.3 Le modèle ARIMA saisonnier avec variable exogènes Le modèle ARIMA saisonnier précéden ignorai l impac des variables exogènes, comme les variables climaiques. Or, l influence de ces variables peu permere de capurer les spécificiés climaiques ignorées par le passé de la consommaion d élecricié. L esimaion de ce modèle sui une procédure de minimisaion du crière AIC pour déerminer les ordres p, q e P, Q. Nous imposons d=d=0 e une forme foncionnelle linéaire pour f X ) : ( Θ s s D d S B ) φ ( B)(1 B ) (1 B) Z =Φ ( B ) θ ( B) ε + f ( X ) [15] P ( p Q q X es la marice des variables climaiques (empéraure, humidié relaive, poin de rosée). La foncion f es esimée par maximum de vraisemblance dans la foncion auo.arima(). 16

2.4 Procédure d esimaion des modèles SARIMA L esimaion des modèles SARIMA requier dans un premier emps de eser la saionnarié de la série e de procéder au besoin à la ransformaion des séries pour obenir une série ransformée saionnaire. On adope ensuie une méhodologie d idenificaion des ordres auorégressifs des processus AR e MA. Le modèle esimé es ensuie esé pour vérifier qu il obéi à oues les hypohèses saisiques fondamenales de la modélisaion dynamique présenée dans la revue méhodologique 1.1 e en secion 2.2. Finalemen, la qualié des prévisions hors échanillon es analysée. Cee procédure globale es souven appelée «procédure Box-Jenkins (1976)». 2.4.1 Tes de racine uniaire Les ess de saionnarié des séries son des classiques de l économérie des séries emporelles. Dans les années 90, plusieurs ess de saionnarié saisonnière on éé inroduis 18. Ici, nous nous conenons d appliquer le es saisique le plus populaire pour eser la saionnarié de la série, sans nous préoccuper des cycles dans un premier emps. Le es de saionnarié de la série de consommaion d élecricié que nous adopons es la version «augmenée» de Dickey e Fuller (1981), don la sraégie d implémenaion es décrie de manière rès praique par Pfaff (2008 :61). Cee sraégie se base sur les équaions [16] à [18], selon que l on considère la présence ou l absence d une endance déerminise (appelée «rend» en anglais) e d un erme de dérive (la consane aussi appelée «drif» en anglais) : Z = π Z + γ Z + µ k 1 j j [16] j= 1 Z = β + πz + γ Z + µ k 1 1 j j [17] j= 1 Z = β + β + πz + γ Z + µ 1 2 1 k j= 1 j j [18] 18 Voir noammen Osborn-Chui-Smih-Birchenhall (1988), Franses (1990), Hylleberg e al. (1990) e Canova-Hansen (1995). 17

Nous avons effecué les ess de saionnarié sur la base des équaions [16], [17] e [18], appelées respecivemen «None», «Drif» e «Trend» dans nore ableau de résulas, pour un nombre maximum de reards de k = 168 (1 semaine). Le paramère k es choisi par minimisaion du AIC. Noons que le erme qui englobe la somme à droie des équaions [16] à [18] n inervien pas direcemen dans l inerpréaion des ess de racine uniaire. Il n es là que pour «blanchir» l erreur, en déerminan k par minimisaion du crière d informaion AIC par exemple. L esimaion e le calcul des différenes saisiques de es son disponibles dans la foncion ur.df ( ) du package urca du logiciel R. L équaion [16] perme de eser la présence d une racine uniaire sans dérive sous l hypohèse nulle (saisique τ 1 ). L équaion [17] perme de eser la présence d une racine uniaire sous l hypohèse nulle (saisique τ 2 ), e l hypohèse joine de présence de racine uniaire e d une consane nulle (saisique φ 1 ). L équaion [18] ese l hypohèse nulle de présence de la racine uniaire (saisique τ 3 ), l hypohèse joine de «endance déerminise nulle e de présence de racine uniaire» (saisique φ 3 ) ainsi que l hypohèse joine de «consane nulle, endance déerminise nulle e de présence de racine uniaire» (saisique φ 2 ). Les valeurs criiques son fournies auomaiquemen par le logiciel, conformémen aux ables saisiques de Fuller (1996). Finalemen, sans enrer dans rop de déails, la saionnarié de la composane saisonnière es égalemen vérifiée avec le es de Canova e Hansen (1995). La procédure es implémenée dans la foncion nsdiffs() de la librairie forecas. Si ni la série, ni la saisonnalié de la série ne possèden de racines uniaires alors les paramères d = D = 0. En cas de présence de racines uniaires, la série e/ou sa composane saisonnière son différenciées le nombre de fois requis. 2.4.2 Saisonnalié e idenificaion des modèles ARIMA saisonnier Une fois la saionnarié des séries esée e les ordres d e D déerminés, la consrucion des modèles SARIMA e SARIMAX nécessie l idenificaion des ordres (p,q) e (P,Q). Nous adopons l approche d opimisaion des coefficiens de la régression par maximum de vraisemblance, e cherchons à minimiser le crière d informaion d Akaike (1973), AIC, pour déerminer les ordres opimaux. Ce crière es défini par : 2 AIC T ln( ) + 2k = ε σ [19] 18

où 1 σ = ε ε 2 T es l esimaion maximum de vraisemblance (MV) de σ 2 ; k es le nombre de ε paramères esimés e T es le nombre d observaions (Aragon, 2011 :44). Cee procédure es implémenée dans la foncion auo.arima() du logiciel R. Noons que dans nore cas, le grand nombre d observaions à disposiion rend le modèle pariculièremen lourd à esimer, e cela d auan plus que la fréquence horaire d observaion nous incie à auoriser un nombre de lag maximum p, q e P, Q d une semaine, soi 168 heures. C es la raison pour laquelle une procédure d esimaion rapide es appliquée (voir les argumens sepwise e approximaion de la foncion auo.arima()). Ceci requier néanmoins une demi-journée de calcul sur un ordinaeur de bureau acuel. Une fois esimés les paramères des modèles, nous esons l hypohèse que les résidus son des bruis blancs (voir la noe de bas de page, numéro 8) issus d une même disribuion gaussienne. Nous uilisons le es de Jarque e Bera 19 (1980) pour eser la normalié des résidus e la saisique de Ljung-Box (1978) définie par l équaion suivane : * Q ( h) = n( n + 2) h 2 k k = 1 n ρ. [20] k La saisique [20] sui une disribuion de probabilié Khi-deux (χ 2 ) don le nombre de degré de liberé es égale à h, où h es le nombre de coefficien d auocorrélaion esé. 2.4.3 Prévisions e mesures de performance prédicives Finalemen, pour mesurer e comparer les erreurs de prévision de chaque modèle, nous avons reenu le crière de l erreur moyen absolue (MAPE), exprimé en pourcenage : où Z es l observaion acuelle e = 1 N 1 Z Z MAPE = 100 * * [21] N Z Z, l observaion de la prévision. Nous reenons le modèle pour lequel ce crière es minimum. Mais d aures indicaeurs usuels son égalemen fournis par le logiciel. 19 Jarque, C. M., & Bera, A. K. (1980). Efficien ess for normaliy, homoscedasiciy and serial independence of regression residuals. Economics Leers, 6(3), 255-259. 19