Construction bayésienne de prévisions probabilistes à partir des sorties d'un modèle déterministe pluie-débit



Documents pareils
Modélisation géostatistique des débits le long des cours d eau.

Post-processing of multimodel hydrological forecasts for the Baskatong catchment

Principe de symétrisation pour la construction d un test adaptatif

Modélisation intégrée des écoulements pour la gestion en temps réel d'un bassin versant anthropisé

Modélisation aléatoire en fiabilité des logiciels

Détection de têtes dans un nuage de points 3D à l aide d un modèle de mélange sphérique

APPORT DES RESEAUX BAYESIENS DANS LA PREVENTION DE LA DELINQUANCE

Raisonnement probabiliste

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes

Flood risk assessment in the Hydrographic Ebro Basin. Spain

Économétrie, causalité et analyse des politiques

Résumé des communications des Intervenants

chargement d amplitude variable à partir de mesures Application à l approche fiabiliste de la tolérance aux dommages Modélisation stochastique d un d

NON-LINEARITE ET RESEAUX NEURONAUX

(VM(t i ),Q(t i+j ),VM(t i+j ))

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

ASSURER LA QUALITE DES RESULTATS D ESSAI ET D ETALONNAGE Assuring the quality of test and calibration results

Incertitude et variabilité : la nécessité de les intégrer dans les modèles

Une méthode de classification supervisée sans paramètre pour l apprentissage sur les grandes bases de données

La gestion opérationnelle de la météosensibilité. La prévision météorologique et hydrologique au cœur de l Économie et de la Société

L'intelligence d'affaires: la statistique dans nos vies de consommateurs

Application de l'analyse multifractale à l'estimation des crues extrêmes en Tunisie

Filtrage stochastique non linéaire par la théorie de représentation des martingales

De la mesure à l analyse des risques

Comment quantifier l incertitude prédictive en modélisation hydrologique?

Une approche non paramétrique Bayesienne pour l estimation de densité conditionnelle sur les rangs

physicien diplômé EPFZ originaire de France présentée acceptée sur proposition Thèse no. 7178

Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services

Forthcoming Database

RÉSUMÉ DE THÈSE. L implantation des systèmes d'information (SI) organisationnels demeure une tâche difficile

Modèle GARCH Application à la prévision de la volatilité

LA SURVEILLANCE ET LE SUIVI DE L'ENVIRONNEMENT. Pierre Guimont Conseiller en environnement Unité Environnement Division Équipement, Hydro-Québec

ÉVALUATION PRIMAIRE D UN SYSTÈME D AIDE AU CONTRÔLE AÉRIEN EN ROUTE

LA SURVEILLANCE DES PHÉNOMÈNES MÉTÉOROLOGIQUES POUR PRODUIRE DE L ÉLECTRICITÉ EN TOUTE SÉCURITÉ

I. Programmation I. 1 Ecrire un programme en Scilab traduisant l organigramme montré ci-après (on pourra utiliser les annexes):

Introduction à la Statistique Inférentielle

K. Ammar, F. Bachoc, JM. Martinez. Séminaire ARISTOTE - 23 octobre Palaiseau

Température corporelle d un castor (une petite introduction aux séries temporelles)

LA GESTION DES EVENEMENTS PLUVIEUX

ALI CHAOUCHE a & ERIC PARENT a a ENGREF/GRESE, 19 Avenue du Maine, F-75732, Paris, Cedex. 15, France Published online: 25 Dec 2009.

Le projet DRIAS : premières études et documents

Scénarios économiques en assurance

Les technologies IT au service de la. Application àl ORBE. Présentation: Dr Philippe Heller

Programmes des classes préparatoires aux Grandes Ecoles

Intérêt du découpage en sous-bandes pour l analyse spectrale

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

Exemple PLS avec SAS

ANALYSE QUANTITATIVE DE RISQUE MICROBIOLOGIQUE EN ALIMENTATION

Vers l'ordinateur quantique

Consultants en coûts - Cost Consultants

Rapport annuel de monitoring automatisé de la qualité de l eau

Algorithmes d'apprentissage

De la mesure à l analyse des risques

Définition et diffusion de signatures sémantiques dans les systèmes pair-à-pair

Sub-Saharan African G-WADI

Introduction à l'actuariat

Innovations Majeures de la Version 4

M. F. PITA Departamento de Geografía Física. Universidad de Sevilla. C/ María de Padilla s.n SEVILLA (Espagne).

Méthodes de Simulation

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION

ÉTUDE DE L EFFICACITÉ DE GÉOGRILLES POUR PRÉVENIR L EFFONDREMENT LOCAL D UNE CHAUSSÉE

Apprentissage Automatique

THÈSE. présentée à TÉLÉCOM PARISTECH. pour obtenir le grade de. DOCTEUR de TÉLÉCOM PARISTECH. Mention Informatique et Réseaux. par.

Introduction. I Étude rapide du réseau - Apprentissage. II Application à la reconnaissance des notes.

Master Modélisation Aléatoire Paris VII, Cours Méthodes de Monte Carlo en nance et C++, TP n 2.

Introduction au datamining

PROBLEMES D'ORDONNANCEMENT AVEC RESSOURCES

Les variables financières sont-elles utiles pour anticiper la croissance économique?

Estimation & amélioration du DCiE d un datacenter

CarrotAge, un logiciel pour la fouille de données agricoles

3615 SELFIE. HOW-TO / GUIDE D'UTILISATION

Etude d un cas industriel : Optimisation de la modélisation de paramètre de production

Modélisation couplée des processus de surface et souterrains pour prédire la distribution spatiale de l'évapotranspiration.

Mesure de l'impact de la marque de provenance Aliments du Québec sur la valeur des produits

Mesure et gestion des risques d assurance

Soutenance de stage Laboratoire des Signaux et Systèmes

MCMC et approximations en champ moyen pour les modèles de Markov

Mesures de Risque Multipériodes Cohérentes Appliquées au Compte à Terme

Health Monitoring pour la Maintenance Prévisionnelle, Modélisation de la Dégradation

Instructions Mozilla Thunderbird Page 1

COMMENT MAITRISER LA GESTION DES APPROVISIONNEMENTS ET DES STOCKS DE MEDICAMENTS

Relever les défis des véhicules autonomes

Value at Risk. CNAM GFN 206 Gestion d actifs et des risques. Grégory Taillard. 27 février & 13 mars 20061

Ingénierie et gestion des connaissances

$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU

REMOTE DATA ACQUISITION OF EMBEDDED SYSTEMS USING INTERNET TECHNOLOGIES: A ROLE-BASED GENERIC SYSTEM SPECIFICATION

LE FORMAT DES RAPPORTS DU PERSONNEL DES COMMISSIONS DE DISTRICT D AMENAGEMENT FORMAT OF DISTRICT PLANNING COMMISSION STAFF REPORTS

Face Recognition Performance: Man vs. Machine

Projet Institutional Support to African Climate Initiative (ISACIP) ATELIER DE RENFORCEMENT DE CAPACITÉS Niamey, 17 au 25 mars 2014

RETHINKING JACQUES ELLUL AND THE TECHNOLOGICAL SOCIETY IN THE 21ST CENTURY REPENSER JACQUES ELLUL ET LA SOCIETE TECHNICIENNE AU 21EME SIECLE

MINISTERE DE L ENSEIGNEMENT SUPERIEUR ET DE LA RECHERCHE SCIENTIFIQUE UNIVERSITE ABDELHAMID IBN BADIS MOSTAGANEM TUNISIE MAROC ALGERIE

Exemple de prévision et de simulation opérationnelle des débits d'étiage pour les besoins d'edf

Recherche dans un tableau

Empowering small farmers and their organizations through economic intelligence

APPROCHE SEMI-MARKOVIENNE POUR LA MODÉLISATION DE STRATÉGIES DE MAINTENANCE : APPLICATION À LA PRÉVENTION DE RUPTURE DU RAIL

Population responses to environmental forcing : approaches to model and monitor habitat characteristics

Validation probabiliste d un Système de Prévision d Ensemble

Modélisation prédictive et incertitudes. P. Pernot. Laboratoire de Chimie Physique, CNRS/U-PSUD, Orsay

Transcription:

Construction bayésienne de prévisions probabilistes à partir des sorties d'un modèle déterministe pluie-débit Marie Courbariaux, Éric Parent & Pierre Barbillon INRA/AgroParisTech, UMR518 MIA, 75231 Paris, France {marie.courbariaux,eric.parent,pierre.barbillon}@agroparistech.fr Résumé. Les techniques de prévisions probabilistes visent à produire une distribution prédictive de la quantité d'intérêt au lieu d'une seule "meilleure" estimation ponctuelle. Pour les prévisions de débits en rivière qui intéressent les producteurs d'hydroélectricité tels EDF ou Hydro-Québec, les principales sources d'incertitude sont dues (a) à la méconnaissance des pluies et températures futures (incertitude météorologique), (b) aux erreurs de représentation de la transformation pluie-débit (incertitude hydrologique). Il faut d'abord modéliser séparément ces sources d'incertitudes avant de les intégrer pour obtenir une fonction prédictive de densité de probabilité. Cette communication focalise sur la modélisation de l'incertitude hydrologique ( l' incertitude météorologique est décrite dans une autre communication des mêmes auteurs à ces journées ). Pour quantier l'incertitude hydrologique, un modèle conjoint de la série des débits modélisés à partir de la pluie et des débits observés est développé. Nous nous appuyons sur une construction bayésienne : après modélisation (normale sur variables transformées) du comportement a priori du régime naturel des débits, la prévision est mise à jour en tenant compte de l'information véhiculée par les sorties de la transformation pluiedébit. On cherche ensuite à améliorer la modélisation autorégressive des erreurs de la transformation pluie-débit en introduisant deux régimes de fonctionnement commandés par des variables explicatives selon un modèle Probit, estimé par l'algorithme EM. Notre travail porte sur des séries de prévisions de ux de la rivière régulièrement émises par deux producteurs d'hydroélectricité en France et au Québec. Nous comparons les résultats de nos constructions statistiques à leurs systèmes actuels empiriques de prévision opérationnelle. Mots-clés. algorithme EM, erreur de modèle, hydrologie, modélisation bayésienne, prévisions probabilistes, modèle pluie-débit. Abstract. Probabilistic forecasting aims at producing a predictive distribution of the quantity of interest instead of a single best guess point-wise estimate. With regard to river ow forecasts, the main sources of uncertainty are due (a) to the unknown future rainfalls and temperatures (input uncertainty), (b) to the inadequacy of the deterministic model mimicking the rainfall-runo transformation (hydrological uncertainty). We model them separately and then integrate the input uncertainty with the 1

hydrologic uncertainty into the total uncertainty, which is quantied in terms of a predictive density function. This communication will focus on hydrological uncertainty. (A companion paper deals with meteorological uncertainty.) To quantify hydrological uncertainty, a joint model for the time series of rainfallruno errors along the whole trajectory has to be developped. We rely on a Bayesian approach, rst considering the prior behavior of the natural regime of river ows and then updating their predictions by taking into account the likelihood of the information conveyed through the outputs of the rainfall-runo transformation. We then try to improve the autoregressive model of errors for the rainfall-runo transformation by introducing two regimes controlled by explanatory variables through a Probit model to be estimated by the EM algorithm. Our work focuses on series of river ow forecasts routinely issued by two hydroelectricity producers in France and in Québec. We nally compare the results of our statistical elaborations to their present operational forecasting systems. Keywords. Bayesian modelling, EM algorithm, hydrology, model uncertainty, probabilistic forecasts, rainfall-runo model. 1 La prévision probabiliste des débits Structure du problème Pour mettre en place un système de prévisions probabiliste de débits en rivière, l'analyste dispose d'une base de données sur les divers bassins-versants qui intéressent les producteurs d'hydroélectricité tels EDF ou Hydro-Québec. Pour un bassin-versant donné, ces données sont typiquement les enregistrements de la réalisation de trois grandeurs aléatoires Q, P, A : Q désigne le débit de la rivière au site d'intérêt, pour une période de temps xée. P représente les grandeurs météorologiques (pluie, température, évapotranspiration, etc) correspondantes, à un éventuel décalage temporel près (temps de concentration du bassin versant). Elles sont "génératrices" du débit de la rivière. Les services de recherche-développement de ces sociétés utilisent une transformation (pluie-débit) déterministe M(.) permettant de passer de la météorologie P à l'hydrologie Q ; ne remettant pas en cause la pertinence de la transformation pluiedébit M adoptée, on admet que cette transformation est ecace, c'est-à-dire que Q P = Q M(P ) A représente les anticipations météorologiques. Elles sont en général données sous la forme d'un ensemble de scénarios météorologiques (membres de prévisions) : on peut obtenir cet ensemble de membres avant que P, et donc Q, ne soient connus. 2

Deux sources principales d'incertitudes à intégrer En situation opérationnelle, on ne dispose que des anticipations météorologiques A pour prévoir le débit Q sur un horizon xé. Construire une prévision probabiliste, c'est donc fournir la loi prédictive [Q A], la notation crochets [..] de Gelfand & Smith (1990) désignant ici la distribution conditionnelle de probabilité. En suivant les règles du calcul des probabilités pour associer les principales sources d'incertitudes : [Q A] = [Q, P A]dP P [Q A] = P [Q P, A] [P A]dP On fait l'hypothèse additionnelle assez réaliste que [Q P, A] = [Q P ], c'est à dire que P (la météo réelle) est susante pour prévoir Q. Il s'agit alors d'eectuer la composition des incertitudes hydrologique Q M(P ) et météorologique P A, déjà décrite par Krzysztofowicz : [Q A] = [Q M(P )] [P A]dP (1) P Cette communication focalise sur la modélisation de l'incertitude hydrologique. L'incertitude météorologique est traitée dans l'autre communication des auteurs à ces journées. 2 Expression de l'incertitude hydrologique Comme dans le Bayesian system for probabilistic river stage forecasting de Krzysztofowicz (2002), nous nous appuyons sur une construction bayésienne. Celle-ci consiste à modéliser dans un premier temps le comportement a priori du régime naturel de la rivière puis à mettre à jour la prévision résultante avec les informations véhiculées par les sorties du modèle pluie-débit. Concrètement, on obtient la loi recherchée, [Q M (P )], en mettant à jour la loi a priori des débits futurs,[q], par la vraisemblance des sorties du modèle pluie-débit, [M (P ) Q], via la formule de Bayes : [Q M (P )] [Q] [M (P ) Q] Cette approche en deux temps (par rapport à une approche donnant directement [Q M (P )]) nous donne une plus grande exibilité de modélisation. Nous exploitons de plus la totalité de l'historique climatologique des débits, et non uniquement la période pour laquelle on dispose d'observations conjointes de M (P ) et de Q. Enn, en partant de la loi marginale de Q, nous orons une garantie de calibration de par la façon même dont elle se mesure. 3

Normalisation et stationnarisation des séries temporelles Les modèles pour lesquels on dispose du plus d'outils d'analyse et d'inférence reposent sur des hypothèses de normalité non valables dans notre cas. An de nous y ramener, nous avons recours à une transformation Box-Cox de paramètre λ. Une analyse préliminaire montre que la valeur optimale de λ n'est pas signicativement diérente de zéro. Nous choisissons donc λ 0, ce qui revient à simplement eectuer un passage au logarithme. An de stationnariser et de désaisonnaliser nos séries temporelles, nous estimons ensuite moyenne et variance des variables transformées pour chaque jour calendaire puis centrons et réduisons. Dans la suite de ce document, Y t et X t désignent respectivement le débit normalisécentré-réduit au jour t et la sortie du modèle pluie-débit transformée correspondante. Soit H l'horizon de prévision. Au temps t, nous cherchons la loi de Y au cours des H jours qui suivent conditionnellement à la connaissance de X pour ces H jours et à la connaissance du passé : [Y t+1:h X t+1:h, X t, Y t ] [X t+1:h Y t+1:h, X t, Y t ] [Y t+1:h X t, Y t ]. Des modèles auto-régressifs pour la climatologie des débits et pour l'erreur de transformation pluie-débit Une analyse préliminaire de notre jeu de données montre qu'un modèle markovien d'ordre 3 pourrait convenir dans le cas de la loi marginale des débits. On considère donc le modèle suivant : Y t = ρ 1 Y t 1 + ρ 2 Y t 2 + ρ 3 Y t 3 + ε t, ε t N (0, σ 2 ), ε t ε t t, t Dans le cas de l'erreur de transformation, nous considérons un modèle linéaire avec persistance de l'erreur : X t = ax t 1 + a 1 Y t + a 2 Y t 1 + η t, η t N (0, v 2 ), η t ε t et η t η t t, t 4

Inférence et prévisions Les paramètres de nos modèles sont estimés par maximum de vraisemblance pour chaque jour calendaire. On obtient facilement une expression analytique de [Y t+1:h X t, Y t ] en fonction de Y t et de [X t+1:h Y t+1:h, X t, Y t ] en fonction de Y t+1:h, X t et de Y t. À l'aide des formules de conjugaison normale (ou, de façon équivalente, du ltre de Kalman), on en déduit une expression analytique de [Y t+1:h X t+1:h, X t, Y t ]. La gure 1 montre un exemple d'application de la méthode décrite ci-dessus sur des débits, à l'exutoire du bassin versant français de l'ain à Vouglans. Il s'agit des prévisions émises le 1er avril 2008 pour les 30 jours qui suivent, dont 14 pour lesquels on dispose de prévisions issues du modèles conceptuel. La surface orangée correspond à l'intervalle prédictif à 90%. Les trois trajectoires en traits ns et oranges sont des exemples de trajectoires conduisant aux quantiles 0.05, 0.5 et 0.95 des volumes prédictifs à horizon 30 jours. La surface grisée correspond à l'intervalle de conance à 90% dans le cas où les prévisions seraient émises à partir d'un simple modèle auto-régressif (sans utiliser les sorties du modèle conceptuel pluie-débit). Figure 1 Résultat des prévisions par ltre de Kalman - 1er avril 2008, Ain à Vouglans 5

3 Perspectives Une façon de raner le modèle d'erreur consiste à identier des régimes de fonctionnement du modèle pluie-débit pour lesquels la nature de l'erreur dière. En nous inspirant de Furrer et al. (2006), Perreault et al. (2007) et de Lu & Berliner (1999), nous proposons un modèle de mélange de type Probit dont la classication repose sur les variables d'état internes du modèle conceptuel pluie-débit (taux de remplissage des réservoirs internes et taux d'apport en eau provenant de la fonte par exemple) : (X t S t = s) = a s X t 1 + a 1,s Y t + a 2,s Y t 1 + η s,t, η s,t N (0, v 2 s ) S t = 1 Zt<0 Z t N ( β T E t, 1 ) Où η s,t ε t et η s,t η s,t t, t, s, s et E t est un vecteur de variables d'état. L'inférence du modèle se fait avec l'algorithme Expectation Maximization. Un échantillonneur de Gibbs nous donne des simulations selon la loi prédictive. Remerciements Ce travail fait l'objet d'un contrat de recherche Adeprina/AgroParisTech 694R nancé par EDF et Hydro-Quebec. Les réexions méthodologiques de cette communication ont été alimentées par les échanges soutenus avec les cadres de leurs services de recherchedéveloppement : Rémy Garçon, Luc Perreault et Joël Gailhard. Références Furrer, E. M., Jacques, C. & Favre, A.-C. (2006), Short term discharge prediction using a markovian regime switching model, technical report, INRS-ETE. Gelfand, A. E. & Smith, A. F. (1990), `Sampling-based approaches to calculating marginal densities', Journal of the American statistical association 85(410), 398409. Krzysztofowicz, R. (2002), `Bayesian system for probabilistic river stage forecasting', Journal of Hydrology 268(1), 1640. Lu, Z.-Q. & Berliner, L. M. (1999), `Markov switching time series models with application to a daily runo series', Water Resources Research 35(2), 523534. Perreault, L., Garçon, R. & Gaudet, J. (2007), `Analyse de séquences de variables aléatoires hydrologiques à l aide de modèles de changement de régime exploitant des variables atmosphériques', La Houille Blanche (6), 111123. 6