Travaux pratiques de Séries Temporelles F. Lavancier, A. Philippe



Documents pareils
Température corporelle d un castor (une petite introduction aux séries temporelles)

1 Importer et modifier des données avec R Commander

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION

Statistiques descriptives

2 TABLE DES MATIÈRES. I.8.2 Exemple... 38

1 Définition de la non stationnarité

Modèle GARCH Application à la prévision de la volatilité

Formations EViews FORMATIONS GENERALES INTRODUCTIVES INTRO : INTRODUCTION A LA PRATIQUE DE L ECONOMETRIE AVEC EVIEWS

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

Intérêt du découpage en sous-bandes pour l analyse spectrale

TP Blender n 2 : Importation d un modèle SketchUp et animation

données en connaissance et en actions?

Projet de Traitement du Signal Segmentation d images SAR

Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels

Chapitre 3 : Le budget des ventes. Marie Gies - Contrôle de gestion et gestion prévisionnelle - Chapitre 3

Transmission d informations sur le réseau électrique

Chapitre 3. Les distributions à deux variables

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

Etude des propriétés empiriques du lasso par simulations

STATISTIQUES. UE Modélisation pour la biologie

NON-LINEARITE ET RESEAUX NEURONAUX

SOMMAIRE. 1. Préambule Le calendrier Trajectoire d un objet lancé Régression linéaire...9

MODELE A CORRECTION D ERREUR ET APPLICATIONS

Introduction au Data-Mining

chargement d amplitude variable à partir de mesures Application à l approche fiabiliste de la tolérance aux dommages Modélisation stochastique d un d

Annexe commune aux séries ES, L et S : boîtes et quantiles

Exercice : la frontière des portefeuilles optimaux sans actif certain

Chapitre 2 Le problème de l unicité des solutions

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Relation entre deux variables : estimation de la corrélation linéaire

Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA

Retour table des matières

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

Filtrage stochastique non linéaire par la théorie de représentation des martingales

(Customer Relationship Management, «Gestion de la Relation Client»)

Estimation et tests statistiques, TD 5. Solutions

Introduction à l approche bootstrap

IBM SPSS Forecasting. Créez des prévisions d'expert en un clin d'œil. Points clés. IBM Software Business Analytics

Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes

Mémoire d actuariat - promotion complexité et limites du modèle actuariel, le rôle majeur des comportements humains.

Création d un petit livre Avec le logiciel «Didapages» Version Didapages 1.1 PC

Une application de méthodes inverses en astrophysique : l'analyse de l'histoire de la formation d'étoiles dans les galaxies

Manipulation de données avec SAS Enterprise Guide et modélisation prédictive avec SAS Enterprise Miner

Modèles à Événements Discrets. Réseaux de Petri Stochastiques

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Exemple d application en CFD : Coefficient de traînée d un cylindre

Utilisation de la plateforme VIA ecollaboration

Séries temporelles : régression, et modélisation ARIMA(p,d,q)

Découverte du logiciel ordinateur TI-n spire / TI-n spire CAS

Initiation à LabView : Les exemples d applications :

Création d un petit livre Avec le logiciel «Didapages 1.1»

But du papier : Paramétrer WSUS pour récupérer les mises à jour et administrer le serveur WSUS

Analyse de la vidéo. Chapitre La modélisation pour le suivi d objet. 10 mars Chapitre La modélisation d objet 1 / 57

Régression linéaire. Nicolas Turenne INRA

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007

Des outils numériques simples et conviviaux!

Logiciel XLSTAT version rue Damrémont PARIS

GUIDE D UTILISATION DU BROWSER DE BEYOND 20/20

FONCTIONS DE PLUSIEURS VARIABLES (Outils Mathématiques 4)

TABLE DES MATIERES. C Exercices complémentaires 42

Contents. 1 Introduction Objectifs des systèmes bonus-malus Système bonus-malus à classes Système bonus-malus : Principes

INITIATION AU LOGICIEL SAS

Évaluation de la régression bornée

Mortalité observée et mortalité attendue au cours de la vague de chaleur de juillet 2006 en France métropolitaine

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Outils pour les réseaux de neurones et contenu du CD-Rom

Fonctions de deux variables. Mai 2011

Quantification Scalaire et Prédictive

Exemples d application

Choisir entre le détourage plume et le détourage par les couches.

Réalisation de cartes vectorielles avec Word

Cahier n o 6. Mon ordinateur. Fichiers et dossiers Sauvegarde et classement

Procédure de sauvegarde pour AB Magique

UTILISATION D'UN RADIOCHRONOMETRE POUR DATER DES GRANITES

Chapitre 4 : Guide de Mouvement et Masque

MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Econométrie pour la Finance

$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU

CRÉATION MODIFICATION

TD1 Signaux, énergie et puissance, signaux aléatoires

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

EXCEL TUTORIEL 2012/2013

Guide de l utilisateur Mikogo Version Windows

Probabilités III Introduction à l évaluation d options

Introduction au datamining

Celestia. 1. Introduction à Celestia (2/7) 1. Introduction à Celestia (1/7) Université du Temps Libre - 08 avril 2008

Extraction d informations stratégiques par Analyse en Composantes Principales

LES TOUT PREMIERS PAS

TSTI 2D CH X : Exemples de lois à densité 1

Capital économique en assurance vie : utilisation des «replicating portfolios»

CAPTEURS - CHAINES DE MESURES

Le modèle de régression linéaire

Une comparaison de méthodes de discrimination des masses de véhicules automobiles

Guide de démarrage rapide. (pour la version 5.0.)

Adobe Illustrator Logiciel de dessin vectoriel et de Cartographie Assistée par Ordinateur

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie

Initiation au logiciel imovie HD

Oscillations libres des systèmes à deux degrés de liberté

SOMMAIRE OPÉRATIONS COURANTES OPÉRATIONS D INVENTAIRE

BUSINESS FORECASTING SYSTEM

Transcription:

Université de Nantes UFR des Sciences et Techniques Département de Mathématiques Master 2 Ingénierie mathématique 2012-2013 Travaux pratiques de Séries Temporelles F. Lavancier, A. Philippe Étude préliminaire d une série temporelle Quelques fonctions utiles : ts [objet R pour représenter une série temporelle], acf [auto corrélations/covariances], diff [calcul des différences x t x t h où h est le lag], filter [par exemple pour la simulation des modèles AR étudiés dans l exercice 1 ] Ex 1. Quelques simulations de séries Soit (ɛ n ) une suite de variables i.i.d. gaussiennes centrées réduites. 1) Pour a = 0,.5,.9, simuler des trajectoires du processus défini par ainsi que leur suite des auto-corrélations. X n = ɛ n + aɛ n 1 2) Pour a = 0,.5,.9, simuler des trajectoires du processus défini par ainsi que leur suite des auto-corrélations. X n + ax n 1 = ɛ n Ex 2. On considère une série chronologique (x 1,, x n ) de longueur n et on note ˆρ x n(h) la suite des auto-corrélations empiriques 1) Soit (ɛ n ) un bruit blanc gaussien centré et de variance 1. Calculer et représenter les covariances empiriques ˆσ n (h) pour les séries z j = j + ɛ j pour j {1,, n} (modèle additif) et w j = jɛ j pour j {1,, n} (modèle multiplicatif). 2) Commentez les résultats obtenus dans cet exercice. Ex 3. 1) Écrire une fonction qui retourne une série de la forme y j = a cos(ωj) + bj + ɛ j 2) Pour a = 0 et b R, simuler une trajectoire, puis représenter 2-1) la série et sa suite d auto-corrélations empiriques 2-2) la série X n X n 1 2-3) la suite des auto-corrélations empiriques associée à la série X n X n 1

3) Pour b = 0 et ω = π/6 simuler une trajectoire, puis représenter 3-1) la série et sa suite des auto-corrélations empiriques 3-2) la série X n X n 12 3-3) la suite des auto-corrélations empiriques associée à la série X n X n 12 4) Pour a 0 et b 0, simuler une trajectoire puis représenter 4-1) la série et sa suite des auto-corrélations empiriques 4-2) les séries X n X n 1 et X n X n 12 4-3) la suite des auto-corrélations empiriques associée à la série X n X n 12 et X n X n 1 Ex 4. Réchauffement climatique Télecharger les séries : globtemp.dat : températures annuelles depuis 1856 (plus exactement : différences avec la moyenne constatée entre 1961 et 1990) varve.dat : épaisseurs de 634 varves de la période glacière. Les varves sont des dépôts sédimentaires issus de la fonte des glaciers. Leur épaisseur est directement liée à la température moyenne de l année. On se pose la question d un réchauffement climatique significatif au 20ème siècle. 1) Mettre ces séries au format ts sous R. Les représenter. 2) Zoomer globtemp sur la période 1900-. Effectuer une régression linéaire : une tendance positive significative apparait-elle? 3) Représenter les résidus de la regression précédente. Effectuer un test d autocorrélation des résidus (par exemple le test de Durbin Watson avec durbinwatsontest de la librarie car ou le test de Breusch Godfrey avec bgtest de la librairie lmtest). 4) Représenter le nuage de points des résidus à l instant n par rapport aux résidus à l instant n 1. Représenter les auto-corrélations empirique des résidus. Faire le lien avec le résultat du test précédent. 5) En quoi le résultat du test remet en cause la significativité de la pente constatée à la question 2? 6) On admet que les résidus du modèle suivent un modèle autorégressif d ordre 1 (AR1), comme en 2) de l exercice 1. Mettre en oeuvre une estimation de la régression linéaire précédente à l aide de la méthode des moindres carrés généralisés. On pourra utiliser la fonction gls de la librairie nlme en précisant la structure AR1 des résidus grâce à l option correlation=corar1(). 7) Une tendance positive apparait-elle suite à cette nouvelle estimation? 8) Récupérer les résidus normalisés de la régression précédente grâce à la fonction residuals en précisant l option type="normalized". Le test de significativité précédent vous parait-il valide? Note : le vecteur des résidus normalisés est le vecteur des résidus de la régression multiplié par l inverse de sa matrice de covariance estimée. 9) Peut-on extraire de la série varve une periode de 100 ans ayant une tendance similaire à celle observée sur globtemp? 2

Ex 5. Stationarité de la série varve 1) Calculer les moyennes et variances glissantes par tranches de 50 ans de la série varve, notée X n par la suite (utiliser la fonction rollapply de la libraire zoo ). La série semble-t-elle stationnaire? 2) On désire transformer X n pour stabiliser la variance. Montrer que la transformation ln est raisonnable. La série Y n = ln(x n ) semble-t-elle stationnaire? 3) Représenter la série Z n = Y n Y n 1. Vous parait-elle stationnaire? (Procéder comme à la première question) 4) Calculer la corrélation entre Z n et Z n 1. La série Z n est elle un bruit blanc? Calculer la corrélation entre Z n et Z n 2. Commenter. 5) En vous inspirant des exemples traités exercice 1, Comment pourrait-on modéliser la série Z n? Comment estimer les paramètres inconnus de ce modèle, en s appuyant notamment sur l autocorrélogramme (ˆρ(h)) h. 6) Comment pourrait-on prédire la valeur de X 635? Indication : Si X n est un MA(1) i.e. X n = ɛ n + aɛ n 1 avec a < 1 et ɛ un bruit blanc faible de variance σ 2, alors la meilleure prévision linéaire de X n+1 sachant le passé est ˆX n+1 = a j 0( a) j X n j. 3

Université de Nantes UFR des Sciences et Techniques Département de Mathématiques Master 2 Ingénierie mathématique 2012-2013 Travaux pratiques de Séries Temporelles F. Lavancier, A. Philippe Ex 6. Données des ventes de champagne Télécharger le fichier champagne.asc. La série des ventes de champagne est notée v t 1) Tracer la série et sa suite des auto-corrélations empiriques. 2) Peut-on détecter la présence d une fonction périodique ou d une tendance dans cette série? 3) Quels filtres peut on appliquer pour éliminer la tendance et la composante saisonnière. 4) Tracer la série obtenues après élimination de la tendance et de la saisonnalité et sa suite des auto-corrélations empiriques. 5) La série obtenue peut elle être modélisée par un bruit blanc? 6) Donner une estimation de la tendance ( ˆm t ) et de la composante saisonnière (ŝ t ). 7) Tracer la série des résidus c est à dire v t ŝ t ˆm t et ses auto-corrélations empiriques. 8) La série des résidus peut elle être modélisée par un bruit blanc? 9) Proposer une prévision à l horizon 12 des ventes de champagne. Ex 7. Tendance et saisonnalité :étude de la série de vente de voitures Télécharger la série voiture. On conserve uniquement le début de la série avant la rupture. 1) A l aide de la suite des covariances empiriques, mettre en évidence la présence d une tendance et d une composante saisonnière dans cette série. Approche 1 2) Estimer la tendance et la composante saisonnière de cette série. 3) Éliminer la tendance et la composante saisonnière à partir de vos estimations. On note (R j ) j la série obtenue. 4) La série (R j ) j peut elle être modélisée par un bruit blanc? Discuter le résultat. Approche 2 5) Éliminer la tendance et la composante saisonnière en appliquant un ou plusieurs filtres linéaires de la forme (I L s ) d. On note (R j) j la série obtenue. 6) La série (R j) j peut elle être modélisée par un bruit blanc? Discuter le résultat. Conclusion

Université de Nantes UFR des Sciences et Techniques Département de Mathématiques Master 2 Ingénierie mathématique 2012-2013 Ex 8. Travaux pratiques de Séries Temporelles F. Lavancier, A. Philippe Simulations sous SAS Processus ARMA. Processus L 2 1) Créer sous SAS les séries suivantes, pour n = 1... 200 : T n une tendance linéaire : T n = 100 + 3n Sn 1 une série périodique de période 3 : Sn 1 = 50cos ( 2π n) 3 Sn 2 une série périodique de période 4 : Sn 2 = 50sin ( π + πn) 4 2 S n une série périodique de période 12 : S n = Sn 1 + Sn 2 ɛ n, un bruit blanc i.i.d. suivant une N (0, 15 2 ) Le processus X n = T n + S n + ɛ n 2) A l aide de la procédure EXPAND, appliquer les moyennes mobiles suivantes centrées d ordre 3, 4 et 12 sur les six séries précédentes. M 3 = 1F (I + B + 3 B2 ) M 4 = 1F 2 ( 1I + B + 4 2 B2 + B 3 + 1 2 B4 ) M 12 = 1 12 F 6 ( 1 2 I + B + B2 + + B 10 + B 11 + 1 2 B12 ). Quelles conclusions pouvez vous en tirer? Ex 9. Identification de modèles Le graphique suivant, représente les autocorrélations et autocorrélations partielles empiriques de processus ARMA simulés (les trajectoires sont de longueur 500). A partir de ces graphes et de simulations que vous effectuerez sous R, identifier les processus AR, MA et ARMA (préciser les ordres). Indication pour les simus sous R : ARMAacf pour le calcul des et des P théoriques d un ARMA arima.sim pour simuler des trajectoires de processus ARMA arima ou ar pour estimer les paramètres d un modèle ARMA ou AR

serie 1 serie 1 0.5 0.0 0.5 1.0 0.4 0.1 0.1 serie 2 serie 2 0.5 0.5 0.6 0.2 serie 3 serie 3 0.5 0.5 0.8 0.2 0.2 serie 4 serie 4 0.5 0.5 1.0 0.6 0.2 0.2 serie 5 serie 5 0.0 0.4 0.8 0.2 0.2 Ex 10. Modéliser à l aide de modèles ARMA les séries simul1, simul2, simul3 et simul4 contenues dans les fichiers du même nom. On pourra éventuellement les stationariser au préalable en les différenciant. Ex 11. Modéliser à l aide d un modèle SARIMA la série elec austr (contenue dans le fichier elec austr.txt ) qui correspond à la production mensuelle australienne d électricité (en millions de kwh) de 1956 à avril 1990. Ex 12. Importer le fichier de données SNCF dans SAS. Il s agit du trafic voyageur mensuel. 1) Tracer la série. L adéquation à un modèle pour la totalité de la série vous semblet-elle possible? 2) On choisit de tronquer la série et de ne modéliser que sa partie la plus récente. Déterminer le point de rupture de la série (à la main). 3) Effectuer une modélisation SARIMA de cette sous-série sans la dernière année (utilisée ultérieurement comme année de validation) à l aide d une PROC ARIMA ou de l outil Application de Prévision de Séries Temporelles. 6

4) Proposer une prévision avec un intervalle de confiance à 95% pour l année future et comparer avec les valeurs réelles (i.e. l année mise de côté à la question précédente). 5) Proposer une prévision de type Holt-Winters pour la même semaine. Comparer les erreurs quadratiques moyennes. 6) Refaire la même étude sour R. Effectuer une prévision non-paramétrique et comparer l erreurs quadratique moyenne avec celles des méthodes précédentes (sous R, on pourra utiliser la fonction HoltWinters(), ainsi que les fonctions (fournies) demo.np et np pour le non-paramétrique.) Utilisation de l outil Application de Prévision de Séries Temporelles On le lance depuis Solutions\Analyse puis on choisit Develop Models. On sélectionne les caractéristiques demandées (librairie, table, variable à modéliser).il convient notamment de choisir la variable Time ID. Cette variable correspond à l indice temporel de la série étudiée. La nature de cette variable (mensuelle, quotidienne ou autres) est spécifiée dans INTERVAL, sous le choix TIME ID, et peut-être modifiée en cliquant sur SPECIFY. Elle peut même être créée en cliquant sur CREATE. Si Time ID est composée des mois de l année, SAS prendra naturellement s = 12 comme période, si Time ID est les jours ouvrés, SAS prendra s = 6, etc. Par contre, si Time ID=_N_ (le numéro des observations), SAS ne pourra pas choisir de saisonnalité et leur modélisation sera impossible. Une fois la série choisie, l environnement est composé de boutons poussoirs. Au milieu de la fenêtre à droite, se trouve celui permettant de tracer la série (un dessin de série temporelle y est dessiné en bleu). La visualisation de la série nous permet d analyser les autocorrelogrammes simple et partiel, de la différencier éventuellement une fois (par le bouton pressoir Delta en haut) ou de la désaisonnaliser une fois (par le bouton pressoir Delta s ). Attention, la valeur de la période ne peut pas être choisie : elle est automatiquement proposée par le logiciel d après la variable Time ID choisie au moment de la selection de la table et des variables d étude. Une fois la visualisation de la série faite et les paramètres a priori choisis grâce aux correlogrammes, on peut lancer un modèle SARIMA à partir de la fenêtre Develop Models en cliquant sur le bouton poussoir en haut en forme de triangle bleu ( Fit Arima Models en glissant dessus avec la souris). On remplit les champs : p, d, q, P, D, Q et on a accès aux estimations et tests pour le modèle soit en cliquant droit sur son intitulé dans la fenêtre, soit en pressant les boutons poussoirs en haut à droite (corrélogrammes, estimations, résidus, prévisions, test de bruit blanc, etc). Pour n effectuer la modélisation que sur une partie de la série (c est le cas ici car le début de la série SNCF a visiblement un comportement différent du reste), il faut selectionner dans la fenetre Develop Models l intervalle correspondant en cliquant sur Set Ranges et en modifiant la Period of Fit. La démarche d identification des ordres de la partie ARIMA est la même que d habitude (sauf qu il n y a pas de méthode du coin proposé par cet outil). Pour la partie saisonnière, la saison est automatiquement choisie par la variable Time ID. Les ordres de la partie saisonnière (ordres de la partie SMA et de la partie SAR) sont à choisir à partir du comportement des auto-correlogrammes simple et partiel aux lags multiples de s en suivant les mêmes règles que dans le cas des ARIMA. Si par exemple l autocorrélogramme simple présente une valeur non nulle en h = 12, on pourra proposer un ordre SMA égal à 1, etc. Des ajustements dans les sorties du modèle sont possibles via les boutons de la barre du haut : nombre de lags pour les autocorrélogrammes, statistiques affichées (AIC, BIC, 7

etc.), niveau des ICs, etc. Ex 13. Reprendre la série champagne et comparer sous R les prévisions obtenues sur la dernière année à l aide 1) d un filtrage simple (1 B 12 ), 2) d un lissage de type Holt-Winters, 3) d un modèle SARIMA(0,1,13)(0,1,0) censé inclure Holt-Winters, 4) d une prévision non-paramétrique. Dans le cas de la prévision non-paramétrique, faire varier la taille de la fenêtre pour en analyser l impact. Ex 14. Faire le même type de comparaisons que ci-dessus sur la série elec austr en ajoutant la prévision issue du SARIMA ajusté lors d un exercice précédent. Ex 15. Regréssion linéaire avec bruit AR Reprendre les données globtemp de températures au 20ème siècle. Le but est d estimer la tendance linéaire en tenant compte de la dépendance des résidus (sous R) : 1) Analyser dans un premier temps la dépendance des résidus issus d une régression simple et en proposer un modèle. 2) Effectuer une régression linéaire généralisée à l aide de la fonction gls() de la librairie nlme (on peut spécifier un modèle de dépendance des résidus à l aide de l option correlation). 3) Effectuer la même estimation à l aide de la fonction arima() (on peut préciser les variables sur lesquelles régresser à l aide de l option xreg). Ex 16. Une modélisation ARMAX Télécharger les données LApollution.dat qui regroupent les valeurs hebdomadaires, relevées à Los Angeles, de mort : mortalité due à un accident cardiovasculaire ; temp : températures ; part : pollution (poussières). L objectif est de tenter d expliquer au mieux la mortalité. On se place dans une optique de prévision : on choisit de n expliquer la mortalité à un instant t qu à l aide des informations disponibles jusqu à l instant t 1. 1) Représenter les trois séries et représenter leurs nuages de points croisés. Une dépendance apparait-elle? 2) Modéliser à l aide d une régression la mortalité à l instant t en fonction de la température et de la pollution à l instant t 1. Que penser des résidus? 3) Modéliser la dépendance de la série mort à l aide d un modèle ARIMA. 4) Analyser le lien temporel des résidus du modèle précédent avec la température et la pollution (fonction ccf() sous R ; option crosscor de la commande identify dans la proc arima sous SAS). 5) Introduire des régresseurs (éventuellement avec une dynamique propre de type ARMA) dans le modèle ARIMA initial, afin d obtenir le meilleur modèle possible (=bruit blanc non corrélé avec les variables exogènes, variables significatives, etc.). Pour cela sous R : option xreg de la fonction arima() (la dynamique des régresseurs ne peut être que de type AR en ajoutant les variables décalées dans le temps) ; sous SAS : option crosscor de la commande identify et option input de la commande estimate dans la proc arima (cf l aide pour spécifier la dynamique des régresseurs). 8