LOAD PROFILING : ESTIMATION D UNE COURBE DE CONSOMMATION ET PRECISION D ESTIMATION



Documents pareils
Introduction à l approche bootstrap

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

Principe de symétrisation pour la construction d un test adaptatif

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

Validation probabiliste d un Système de Prévision d Ensemble

ÉTUDE DE L EFFICACITÉ DE GÉOGRILLES POUR PRÉVENIR L EFFONDREMENT LOCAL D UNE CHAUSSÉE

Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes

FOTO - L OMNIBUS MENSUEL DE CROP LE NOUVEAU CROP-EXPRESS

La nouvelle planification de l échantillonnage

Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données

Projet de Traitement du Signal Segmentation d images SAR

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007

Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction.

Introduction au datamining

MESURER LA VALEUR ET LE ROI D UN PROJET DE RÉSEAU SOCIAL D ENTREPRISE

Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie

ASSURER LA QUALITE DES RESULTATS D ESSAI ET D ETALONNAGE Assuring the quality of test and calibration results

Chapitre 3 : INFERENCE

LES CONTRATS D ENTRETIEN ET D EXPLOITATION DE CHAUFFAGE J-M R. D-BTP

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE


CAISSE REGIONALE DU CREDIT AGRICOLE MUTUEL D AQUITAINE

Taux global d actualisation - Comment analyser une transaction immobilière?

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Stage Ingénieur en développement logiciel/modélisation 3D

Transmission d informations sur le réseau électrique

Principe d un test statistique

CAC, DAX ou DJ : lequel choisir?

COMPTE RENDU. Atelier-débat avec les futurs clients éligibles. 25 septembre 2002

$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU

CALCUL D UN SCORE ( SCORING) Application de techniques de discrimination LES OBJECTIFS DU SCORING

INTRODUCTION A L ELECTRONIQUE NUMERIQUE ECHANTILLONNAGE ET QUANTIFICATION I. ARCHITECTURE DE L ELECRONIQUE NUMERIQUE

Item 169 : Évaluation thérapeutique et niveau de preuve

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

Le suivi de la qualité. Méthode MSP : généralités

Prototype de canal caché dans le DNS

Build Your Island 2014 Annexe TFR 1

INF6304 Interfaces Intelligentes

L évolution en niveau des tarifs réglementés s accompagne d évolutions de la structure des tarifs, sur l ensemble des couleurs tarifaires.

1 - Salaires nets tous secteurs confondus

L utilisation d un réseau de neurones pour optimiser la gestion d un firewall

mission. Le premier poste du programme de travail du DREV vise la qualification, la quantification et le suivi

Chapitre 2 Le problème de l unicité des solutions

Livre Blanc Oracle Novembre Le Bureau des Projets (PMO) : un levier stratégique de création de valeur pour l industrie

PRIX DE VENTE À L EXPORTATION GESTION ET STRATÉGIES

Mémo technique MODELES GENERIQUES DE SCORE DE CREDIT ou Le scoring de crédit «prêt à l emploi»

Dossier Financier. La première partie décrit les hypothèses de fonctionnement retenues que ce soit d un point de vue organisationnel ou financier.

LES RÉSULTATS DE L'ENQUÊTE DE SATISFACTION

Emploi du temps prévisionnel

L équilibre offre-demande d électricité en France pour l été 2015

Capacité Métal-Isolant-Semiconducteur (MIS)

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Christophe SANNIER

OBSERVATOIRE de la qualité du service

INTRODUCTION. Cadre d évaluation de la qualité des données (CEQD) (juillet 2003)

MODÈLE CROP DE CALIBRATION DES PANELS WEB

Développements récents de la méthode des scores de la Banque de France

Bulletin de service Bureaux d agents, de courtiers en immeubles et d évaluateurs de biens immobiliersetdes autres activités liées à l immobilier

HIVER 2004 MÉTHODOLOGIE DE LA RECHERCHE EN MARKETING MRK

ANNEXE 1 LA BASE DE DONNEES 1

Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels

F7n COUP DE BOURSE, NOMBRE DÉRIVÉ

MATHÉMATIQUES. Les préalables pour l algèbre MAT-P020-1 DÉFINITION DU DOMAINE D EXAMEN

Établissement des taux d actualisation fondés sur la meilleure estimation aux fins des évaluations de provisionnement sur base de continuité

PLAN DE COURS CEGEP DU VIEUX-MONTRÉAL

Mesures et incertitudes

Introduction aux Statistiques et à l utilisation du logiciel R

«Le nouveau marché de l électricité, quel impact pour les collectivités?» International - Independent - Innovative

SOMMAIRE INTRODUCTION... 3

Prenez part au changement. Opérateur d électricité et de gaz

Classification Automatique de messages : une approche hybride

L IMPACT DE LA MUTUALISATION SUR LES RESSOURCES HUMAINES

Intérêt du découpage en sous-bandes pour l analyse spectrale

DOSSIER. Fund Research. Pour une sélection de fonds de qualité

Stratégies gagnantes pour les prestataires de services : le cloud computing vu par les dirigeants Dossier à l attention des dirigeants

Présentation du projet Smart Electric Lyon

Évaluation de la régression bornée

EXAMEN CRITIQUE D UN DOSSIER TECHNIQUE

Rapport d évaluation du master

Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé

BACCALAURÉAT GÉNÉRAL SÉRIE SCIENTIFIQUE

Réseau SCEREN. Ce document a été numérisé par le CRDP de Bordeaux pour la. Base Nationale des Sujets d Examens de l enseignement professionnel.

Copropriété: 31, rue des Abondances Boulogne-Billancourt

TRANSPORT ET LOGISTIQUE :

Répartition des coûts du compte de pass-on par catégorie de consommateurs

METHODOLOGIE GENERALE DE LA RECHERCHE EPIDEMIOLOGIQUE : LES ENQUETES EPIDEMIOLOGIQUES

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

Projet audio. Analyse des Signaux ELE2700

Séance du Conseil Municipal du 11/12/2012

février 2014 Parc Chanot Hall 2 Marseille GUIDE DE L EXPOSANT 2014

BTS Groupement A. Mathématiques Session Spécialités CIRA, IRIS, Systèmes électroniques, TPIL

Résumé des communications des Intervenants

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

TABLE DES MATIERES. C Exercices complémentaires 42

WEB ENERGY ARCHIVE (WEA)

Ressources pour le lycée général et technologique

Les Ontariens rejettent catégoriquement le projet de création d une école afrocentriste

Classification des actions d efficacité énergétique

APPORT DES RESEAUX BAYESIENS DANS LA PREVENTION DE LA DELINQUANCE

Transcription:

LOAD PROFILING : ESTIMATION D UNE COURBE DE CONSOMMATION ET PRECISION D ESTIMATION Olivier Chaouy EDF R&D 1, avenue du Général de Gaulle - 92141 Clamart Cedex - France olivier.chaouy@edf.fr Résumé : Le Load Profiling est un ensemble de méthodes statistiques visant à estimer la courbe de charge d un ou de plusieurs clients, sachant qu on ne dispose a priori pas d historique de courbe pour cet ensemble. Ce papier présente une trame méthodologique répondant à cette problématique, et, en particulier, permettant d évaluer la précision d estimation d une courbe de charge issue d un Load Profiling. Soucieux d adopter aussi une approche pragmatique, nous illustrons l application de cette méthode sur le marché des Collectivités Locales. Mots-clés : Load Profiling, courbe de consommation, bootstrap. Abstract : The Load Profiling is a set of statistical methods to estimate load curve of one or several customers not equipped with remotely readable meters. This paper provides an methodological approach answering to this problem, especially, allowing to evaluate estimate accuracy for a load curve build by Load Profiling. Finally, we apply this method on the municipality market. Keywords : Load Profiling, consumption curve, bootstrap. 1 Contexte du Load Profiling Dans le monde de l électricité, la courbe de charge traduit l évolution de la puissance appelée par un ou plusieurs clients au cours du temps. Dans tout ce qui suit, on fait la distinction entre les termes suivants : client et site. Le terme site fait référence à une localisation géographique. Le terme client est quant à lui plus générique et commercial : un client possède n sites, avec éventuellement n=1. Pour relever le défi de l ouverture du marché, EDF doit plus que jamais être à l écoute de ses clients et de leur attentes. Dans cette optique, une connaissance fine du comportement de consommation des clients et, de facto, de leurs courbes de charge s avère pertinente. Cette connaissance constitue un support judicieux à l élaboration d offres commerciales. Elle peut aussi être mise à profit pour optimiser la gestion des réseaux électriques. Or, il est à ce jour impossible de connaître la courbe de charge de chaque site, pris individuellement, en raison du coût des compteurs mais aussi et surtout du coût logistique qui résulterait d une telle installation. Il est donc nécessaire de trouver d autres solutions pour avoir une connaissance précise de la courbe de charge des différentes clientèles d EDF. Le Load Profiling est l une d elles. Le Load Profiling [1] est un ensemble de méthodes et de techniques statistiques visant à estimer la courbe de charge d un ou de plusieurs clients, sachant qu on ne dispose a priori pas d historique de courbe pour cet ensemble. L estimation est dans ce contexte réalisée à partir d échantillons de courbes de clients dits "semblables". Par exemple, on estimera la courbe de charge de clients "commerce" à partir des courbes de ce secteur disponibles dans nos bases de données.

2 Démarche du Load Profiling Cette démarche vise à estimer la courbe d un client X et comporte schématiquement quatre étapes. 2.1 Echantillonnage : construction de l échantillon de courbes Connaissant la "nature" du client, on définit tout d abord un échantillon de courbes support à l analyse. Il correspond à l ensemble des courbes disponibles pour le périmètre (ou marché) du client étudié. Cet échantillon doit être le plus riche possible : de taille suffisante et traduisant la diversité du marché étudié en terme de courbe de charge. L échantillon de courbes doit en outre subir un "nettoyage" afin de disposer de données propres, c est-à-dire sans trop de valeurs manquantes et avec des historiques de courbes suffisants (au moins une année). 2.2 Construction d une bibliothèque de courbes-types à partir de l échantillon Cette bibliothèque correspond idéalement à la meilleure réduction de l espace des courbes du marché, c est-à-dire à un condensé de celui-ci au prix d une perte d information la plus faible possible. Autrement dit, sur un marché donné, on cherche un ensemble de courbes résumant le mieux l ensemble des courbes du marché considéré. Les résultats de cette étape (issus de travaux de classification et de discrimination) aboutissent à la définition de classes de comportements. In fine, une classe de la bibliothèque est définie par une courbe-type normalisée 1 et par des variables caractérisant la classe. La caractérisation des classes est une autre manière de définir les éléments de la bibliothèque. Il s agit d une définition ne faisant pas appel à la courbe de charge. La construction de la bibliothèque repose exclusivement sur l analyse de courbes mais on cherche à caractériser celle-ci autrement, à l aide de variables disponibles pour tout site du marché. Cette caractérisation est cruciale car elle permet d affecter un site à une classe de la bibliothèque à partir d informations externes à la courbe de charge. 2.3 Précision d estimation des courbes-types et intervalle de confiance L erreur d estimation peut être rigoureusement estimée au niveau des courbes-types avec une caution probabiliste, moyennant une hypothèse de représentativité des données en terme de courbe de charge. Une courbe-type est en effet toujours un vecteur de K composantes 2. Chacune d elles est le fruit d un calcul sur les données disponibles 3. Chaque composante C i est donc le résultat d un calcul sur un échantillon e i. La précision de ce calcul peut être estimée par bootstrap [2]. Le bootstrap est une technique de rééchantillonnage consistant à définir B échantillons e i,1, e i,b de même taille que e i, et construits par une procédure de tirage avec remise à partir de ce dernier. Les B calculs sur ces échantillons et l analyse de la distribution des valeurs fournissent, moyennant le choix d un seuil de risque, un intervalle de confiance pour la composante C i, rigoureux sur le plan mathématique. En 1 C est-à-dire que la moyenne des points de la courbe vaut 1 2 Pour une courbe type annuelle définie à pas horaire, K = 8 760 ou 8 784 3 Par exemple, chaque composante est une moyenne sur les données disponibles

répétant la démarche à chaque composante, nous sommes donc en mesure d estimer un intervalle de confiance pour une courbe type. 2.4 Reconstitution de la courbe de charge d un client La courbe de charge du client est estimée par la somme des courbes-types par classe, pondérée par le poids en énergie de ces classes. La caractérisation des classes par des variables externes à la courbe de charge et la connaissance de ces mêmes variables pour le client à profiler permet de calculer les poids en énergie. 2.5 Exemple On souhaite reconstituer la courbe de charge d un client X ayant une activité hôtelière et des bureaux (ce client possède donc plusieurs sites). Les travaux des trois 1 ères étapes aboutissent, par exemple, aux résultats suivants : Echantillon de Load Profiling Courbes de charge disponibles et "propres" d hôtels et de bureaux Eléments de la bibliothèque de profils types Caractérisation Valeur Hôtels sans restaurant Courbe type C 1 - tunnel de confiance t 1 Hôtels avec restaurant Courbe type C 2 - tunnel de confiance t 2 Bureaux avec chauffage électrique Courbe type C 3 - tunnel de confiance t 3 Bureaux sans chauffage électrique Courbe type C 4 - tunnel de confiance t 4 Les tunnels de confiance sont calculés pour un seuil de risque α choisi. On dispose par ailleurs pour le client X des informations suivantes : Eléments de la bibliothèque Poids en énergie Courbe type Caractérisation du client (en MWh) C 1 Hôtels sans restaurant 100 C 2 Hôtels avec restaurant 300 C 3 Bureaux avec chauffage électrique 200 C 4 Bureaux sans chauffage électrique 400 La courbe de charge C de ce client sera donnée par : C = 100 C 1 + 200 C 2 + 300 C 3 + 400 C 4, alors que le tunnel de confiance au risque α est fourni par T = 100 T 1 + 200 T 2 + 300 T 3 + 400 T 4. 2.6 Remarques importantes Pour estimer rigoureusement la précision d estimation de la courbe d un client X, il faut disposer au préalable d un échantillon représentatif pour ce client. Autrement, le tunnel estimé n a pas de caution théorique. Il constitue cependant un indicateur de la variabilité de la courbe du client. Par ailleurs, la solution qui consiste à sommer les intervalles de confiance par classe pour en déduire l erreur du client surestime vraisemblablement l erreur réelle. En effet, de manière générale, l erreur sur une somme de variables est toujours, pour des raisons d indépendance statistique, inférieure à la somme des erreurs.

3 Application du Load Profiling 3.1 Le marché des collectivités locales La courbe de charge d un client collectivité locale est la courbe d un ensemble de sites gérés financièrement par une ou plusieurs municipalités. L application de la démarche présentée ci-dessus permet d estimer la courbe de charge de l ensemble du marché collectivité locale 1. Le maillage du périmètre des collectivités locales, à la fois en terme de courbe de charge et de variables descriptives, est donnée ci-dessous : Eléments de la bibliothèque de courbes-types Caractérisation Valeur Administration Courbe type C 1 tunnel t 1 Enseignement Courbe type C 2 tunnel t 2 Equipements sportifs Courbe type C 3 tunnel t 3 Equipements socioculturels Courbe type C 4 tunnel t 4 Sanitaire et social Courbe type C 5 tunnel t 5 Activités de Pompage Refoulement Courbe type C 6 tunnel t 6 Activité d irrigation Courbe type C 7 tunnel t 7 Traitements des eaux Courbe type C 8 tunnel t 8 Ski Courbe type C 9 tunnel t 9 Divers Courbe type C 10 tunnel t 10 Non classé Courbe type C 11 tunnel t 11 Eclairage Public Courbe type C 12 tunnel t 12 L échantillon support à la construction de la bibliothèque provient de la collecte des courbes disponibles pour ce marché. La bibliothèque est donc (au mieux) représentative du marché France. Nous ne pouvons par conséquent reconstituer avec rigueur que la courbe de l ensemble du périmètre, et pas celle d un client quelconque. On donne ci-dessous un extrait de résultat de reconstitution pour l ensemble du marché. 2100 1900 1700 Courbe de charge estimée pour le périmètre France (lundi type du mois de mars) Puissance (MWh) 1500 1300 1100 900 700 500 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 tunnel courbe estimée tunnel heure Le tunnel, calculé ici au risque de 5 %, doit s interpréter de la manière suivante. Pour un lundi de mars, la courbe de charge réelle (mais inconnue) du marché collectivité locale a une probabilité de 95 % d appartenir au tunnel 1 c est-à-dire de l ensemble des clients de ce marché.

3.2 Application à un client quelconque du marché Même si la méthode n est rigoureusement pas juste pour un client quelconque, nous souhaitions adopter une approche pragmatique en mesurant l écart entre des courbes estimées de clients (par Load Profiling) et les courbes réelles de ces clients. Les résultats de trois simulations sont présentés dans le tableau ci-dessous : Simulation 1 (300 clients) Simulation 2 (300 clients) Simulation 3 (300 clients) Nombre moyen de sites 369 155 87 Consommation moyenne (GWh) 632 243 137 Erreur moyenne (en %) 7,4% 9,9% 11,9% Ecart moyen à la baisse (en %) 2,7% 3,7% 4,4% Ecart moyen à la hausse (en %) 3,3% 4,3% 5,1% Largeur moyenne du tunnel (en %) 5,0% 6,3% 7,1% Le tableau se lit de la manière suivante. Par exemple, pour la simulation 1, on simule les courbes de 300 clients. Un client possède en moyenne 369 sites et consomme en moyenne 632 GWh 1. L erreur moyenne de reconstitution est de 7,4 %. La largeur moyenne du tunnel bootstrap est égale à 5 %. Par ailleurs, la courbe réelle sort (logiquement) du tunnel de 2,7 % en moyenne par rapport à la courbe haute, et de 3,3 % en moyenne par rapport à la courbe basse définissant le tunnel. La taille du client influence les résultats : plus le client possède de sites et plus la méthode de Load Profiling donne de bons résultats. Les indicateurs d erreurs sont en effet d autant plus petits. 4 Conclusion Ces 1 ers travaux de Load Profiling se révèlent assez instructifs et offrent des perspectives assez intéressantes. Tout d abord, la trame méthodologique semble aujourd hui validée dans ses grandes lignes, ce qui donne un cadre générique de travail. Au sein d EDF, le Load Profiling est déjà mis à profit pour élaborer certaines offres de prix. Demain, avec l ouverture du marché, le périmètre client d EDF sera variable, en raison de l arrivée et du départ de certains clients à la concurrence. Dans ce contexte, la mise en place d un Load Profiling permettra de suivre l évolution des comportements de consommation des clients du portefeuille EDF, ainsi et de mieux répondre à certaines de leurs attentes. Cela étant, la réflexion est toujours en cours sur les points suivants : Le calcul de précision des courbes-types peut être amélioré, notamment en étudiant d autres moyens d estimer des intervalles de confiance par bootstrap. Nous sommes également à la recherche de méthodes complètement différentes pour évaluer les erreurs L erreur associée à la courbe d un client n est aujourd hui pas satisfaisante d un point de vue théorique puisque nous nous contentons d empiler les intervalles de confiance, faute de mieux. Nous allons étudier de plus près cette question dans les mois futurs. 1 Ce niveau de consommation est équivalent à celui du SIPPEREC, l un des principaux syndicats de communes de France.

Bibliographie [1] Association of Edison Illuminating Companies. Load Research Committee, (2001), Load Research Manual [2] Efron B. & Tibshirani R.J., (1993), An Introduction to the Bootstrap, Monographs on Statistics and Applied Probability 57, Chapman & Hall.