Un modèle à risques proportionnels avec détection de ruptures pour l estimation de la demande initiale de tgv



Documents pareils
Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

Exemple PLS avec SAS

Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes

Afin de valider votre inscription merci de bien veiller à :

Scénarios économiques en assurance

Principe de symétrisation pour la construction d un test adaptatif

THÈSE. présentée à TÉLÉCOM PARISTECH. pour obtenir le grade de. DOCTEUR de TÉLÉCOM PARISTECH. Mention Informatique et Réseaux. par.

SCHOLARSHIP ANSTO FRENCH EMBASSY (SAFE) PROGRAM APPLICATION FORM

Exercices sur SQL server 2000

The impacts of m-payment on financial services Novembre 2011

APPENDIX 6 BONUS RING FORMAT

2013 IIHF WORLD WOMEN S HOCKEY CHAMPIONSHIP

La solution idéale de personnalisation interactive sur internet

CALCUL DE LA CONTRIBUTION - FONDS VERT Budget 2008/2009

WEB page builder and server for SCADA applications usable from a WEB navigator

Forthcoming Database

IDENTITÉ DE L ÉTUDIANT / APPLICANT INFORMATION

Industrial Phd Progam

Agathe Guilloux LSTA - Université Pierre et Marie Curie (UPMC) Boîte courrier place Jussieu, Paris cedex 05

CLIM/GTP/27/8 ANNEX III/ANNEXE III. Category 1 New indications/ 1 re catégorie Nouvelles indications

Application Form/ Formulaire de demande

PIB : Définition : mesure de l activité économique réalisée à l échelle d une nation sur une période donnée.

that the child(ren) was/were in need of protection under Part III of the Child and Family Services Act, and the court made an order on

0 h(s)ds et h [t = 1 [t, [ h, t IR +. Φ L 2 (IR + ) Φ sur U par

UNIVERSITY OF MALTA FACULTY OF ARTS. French as Main Area in an ordinary Bachelor s Degree

Improving the breakdown of the Central Credit Register data by category of enterprises

Master Développement Durable et Organisations Master s degree in Sustainable Development and Organizations Dossier de candidature Application Form

Grégoire de Lassence. Copyright 2006, SAS Institute Inc. All rights reserved.

UNIVERSITE LYON 3 (JEAN MOULIN) Référence GALAXIE : 4140

Détection de têtes dans un nuage de points 3D à l aide d un modèle de mélange sphérique

Présentation par François Keller Fondateur et président de l Institut suisse de brainworking et M. Enga Luye, CEO Belair Biotech

Networking Solutions. Worldwide VSAT Maintenance VSAT dans le Monde Entretien. Satellite Communications Les Communications par Satellite

Panorama des bonnes pratiques de reporting «corruption»

Visualizing Start-up Firm Trajectories on Kohonen Maps

Cheque Holding Policy Disclosure (Banks) Regulations. Règlement sur la communication de la politique de retenue de chèques (banques) CONSOLIDATION

THE EVOLUTION OF CONTENT CONSUMPTION ON MOBILE AND TABLETS

Monitor LRD. Table des matières

PREPROCESSING PAR LISSAGE LOESS POUR ACP LISSEE

Grandes tendances et leurs impacts sur l acquisition de produits et services TI.

INSTRUMENTS DE MESURE SOFTWARE. Management software for remote and/or local monitoring networks

FaceBook aime les Maths!

$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU

Archived Content. Contenu archivé

Practice Direction. Class Proceedings

Quick Start Guide This guide is intended to get you started with Rational ClearCase or Rational ClearCase MultiSite.

ASSURER LA QUALITE DES RESULTATS D ESSAI ET D ETALONNAGE Assuring the quality of test and calibration results

AGROBASE : un système de gestion de données expérimentales

FCM 2015 ANNUAL CONFERENCE AND TRADE SHOW Terms and Conditions for Delegates and Companions Shaw Convention Centre, Edmonton, AB June 5 8, 2015

Relions les hommes à l entreprise Linking people to companies

LE BONUS-MALUS FRANÇAIS

MEMORANDUM POUR UNE DEMANDE DE BOURSE DE RECHERCHE DOCTORALE DE LA FONDATION MARTINE AUBLET

Filtrage stochastique non linéaire par la théorie de représentation des martingales

Bourses d excellence pour les masters orientés vers la recherche

L'Offre sera ouverte pendant 18 jours de bourse, à un prix par action de 152,30 EUR. BPCE International et Outre-Mer

Application des courbes ROC à l analyse des facteurs pronostiques binaires

Discours du Ministre Tassarajen Pillay Chedumbrum. Ministre des Technologies de l'information et de la Communication (TIC) Worshop on Dot.

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

MEMORANDUM POUR UNE DEMANDE DE BOURSE DE RECHERCHE DOCTORALE DE LA FONDATION MARTINE AUBLET

AIDE FINANCIÈRE POUR ATHLÈTES FINANCIAL ASSISTANCE FOR ATHLETES

Once the installation is complete, you can delete the temporary Zip files..

Institut français des sciences et technologies des transports, de l aménagement

RULE 5 - SERVICE OF DOCUMENTS RÈGLE 5 SIGNIFICATION DE DOCUMENTS. Rule 5 / Règle 5

SparkInData. Place de Marché des applications Spatiales

ONTARIO Court File Number. Form 17E: Trial Management Conference Brief. Date of trial management conference. Name of party filing this brief

Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services

Les contraintes de financement des PME en Afrique : le rôle des registres de crédit

ETABLISSEMENT D ENSEIGNEMENT OU ORGANISME DE FORMATION / UNIVERSITY OR COLLEGE:

Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH

physicien diplômé EPFZ originaire de France présentée acceptée sur proposition Thèse no. 7178

RÉSUMÉ DE THÈSE. L implantation des systèmes d'information (SI) organisationnels demeure une tâche difficile

FOURTH SESSION : "MRP & CRP"

Cours de didactique du français langue étrangère (*) French as a foreign language (*)

Must Today s Risk Be Tomorrow s Disaster? The Use of Knowledge in Disaster Risk Reduction

Instructions Mozilla Thunderbird Page 1

Modélisation 3D par le modèle de turbulence k-ε standard de la position de la tête sur la force de résistance rencontrée par les nageurs.

Gestion du niveau de la franchise d un contrat avec bonus-malus. Pierre THEROND & Stéphane BONCHE

An Ontology-Based Approach for Closed-Loop Product Lifecycle Management

Bill 69 Projet de loi 69

Agile&:&de&quoi&s agit0il&?&

Projet du service «ON DEMAND BUS» à Kashiwa (Japon)

MONTRÉAL LA CONFORTABLE MC

Services internationaux en géodésie spatiale

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

BIG Data et R: opportunités et perspectives

Soutenance de stage Laboratoire des Signaux et Systèmes

The new consumables catalogue from Medisoft is now updated. Please discover this full overview of all our consumables available to you.

PRACTICE DIRECTION ON THE LENGTH OF BRIEFS AND MOTIONS ON APPEAL

accidents and repairs:

RETHINKING JACQUES ELLUL AND THE TECHNOLOGICAL SOCIETY IN THE 21ST CENTURY REPENSER JACQUES ELLUL ET LA SOCIETE TECHNICIENNE AU 21EME SIECLE

Caroline Hurault-Delarue 1, Cécile Chouquet 2, Nicolas Savy 2, Isabelle Lacroix 1, Christine Damase- Michel 1

Railway Operating Certificate Regulations. Règlement sur les certificats d exploitation de chemin de fer CODIFICATION CONSOLIDATION

Mise en place d un système de cabotage maritime au sud ouest de l Ocean Indien. 10 Septembre 2012

REVISION DE LA DIRECTIVE ABUS DE MARCHE

Post-processing of multimodel hydrological forecasts for the Baskatong catchment

RAPID Prenez le contrôle sur vos données

BNP Paribas Personal Finance

If the corporation is or intends to become a registered charity as defined in the Income Tax Act, a copy of these documents must be sent to:

staff worldwide years 36b. revenues countries

Vers le 7 ème ciel du Revenue Management

Thèmes de recherche. Projets en cours

Transcription:

Un modèle à risques proportionnels avec détection de ruptures pour l estimation de la demande initiale de tgv Abdullah Oueslati Université Pierre et Marie Curie - Paris VI SNCF, Innovation & Recherche Laboratoire de Statistique Théorique 40, avenue des Terroirs de France et Appliquée (LSTA, 4 place Jussieu 75611 Paris Cedex 12 75005 PARIS Résumé. Pour fixer au mieux les quotas de billets ouverts à la réservation, la SNCF doit connaître la demande des clients pour chaque produit tarifaire. Or, les données de réservation récoltées sont contraintes par les quotas imposés et intègrent les reports des clients d une classe tarifaire à une autre. Pour répondre à cette double problématique, nous définissons un modèle bicéphale pour l intensité du processus des réservations dans une classe tarifaire considérée : une partie détection de ruptures multiples représente la dynamique intrinsèque à la classe tarifaire et une partie régression paramétrique mesure l effet de la fermeture des classes environnantes. Un algorithme itératif incluant une phase de programmation dynamique permet l estimation simultanée des paramètres par maximum de vraisemblance. Validée par simulations, la procédure d estimation développée montre une bonne qualité d estimation, en particulier en présence d égalités. Une application sur jeu de données réelles de réservation est aussi présentée. Mots-clés. modèle de régression à risques proportionnels, modèle de durées, détection de ruptures, procédures itératives, revenue-management, évènements récurrents Abstract. In order to determinate the number of tickets open for booking in each fare class, the SNCF company must reckon the prior demand of customers for the different types of tickets. However, the registered booking data that allow to perform the estimation do not fully represent this demand since they are constrained by the booking limits. They also include reports from customers of other fare classes. A two-tier proportional hazard regression model for counting process is developed to modelize the booking process: a change-points detection part for the baseline stands for booking behaviour in the proper class while the regression parameter measures the influence of reports from the rival tariff classes. An iterative procedure including a dynamic programming phase allows to perform the estimation of the different parameters by likelihood maximization. Different simulations show the validity of the estimations, especially in the presence of tied event times. An application to real data of booking process will also be presented. Keywords. proportional hazards regression, lifetime data analysis, change-point detection, iterative procedures, dynamic programming, revenue-management, recurrent events 1

1 Revenue-Management et demande initiale Dans les entreprises fournissant des services périssables (transport ferroviaire et aérien, hôtellerie, spots publicitaires, la gestion des réservations, effectuée par le Yield-Management, consiste à imposer un tarif sur le billet (pricing ou un quota de nombre de places offertes à la réservations pour chaque type de billet (contingentement. Le Revenue-Management consiste à optimiser ces allocations sur l ensemble des produits proposés. Dans le cycle du Revenue-Management (cf. schéma ci-dessous, la question de l estimation de la demande initiale est cruciale. Elle permet de connaitre le souhait initial des clients et les volumes de réservation qui en découleraient si aucune contrainte n était imposée aux clients. La connaissance de ce potentiel de réservation permet par la suite d optimiser le taux de remplissage des trains (avions, chambres,... ou le revenu de l entreprise. 1. Prévision de la demande future 2. Optimisation : établissement des prix et/ou quotas 3. Commercialisation et réservations 5. Dé-contraindre la demande 4. Collecte des données historiques de la demande Figure 1: Cycle du Revenue Management Exposés par Zeni (2001, Talluri et Van Ryzin (2004, Lee (1990, les travaux effectués dans le domaine du Revenue-Management pour estimer la demande initiale se divisent en deux catégories Les méthodes s appuyant uniquement le niveau de réservation final atteint ainsi que l information d ouverture ou non de la classe tarifaire considérée : méthodes d imputation, modèles de durées, algorithmes de type EM. Les modèles considérant l ensemble des courbes de réservation et de contingentement entre le jour d ouverture à la réservation et le jour de départ du train (ou vol : lissage exponentiel, processus de naissances et de morts. 2

2 Un modèle de régression à risques proportionnels avec détection de ruptures S inscrivant dans la deuxième catégorie citée ci-dessus, le modèle présenté (cf. Oueslati et Lopez 2012 s appuie sur l approche d Andersen et Gill (1982 du modèle de Cox (1972 ( pour processus de comptage. Dans ce contexte, on observe m processus indépendants Nj (t d intensité de la forme suivante 1 j m λ j (t = Y j (tλ 0 (te βx j(t, (1 où Y j (t est le processus à risque correspondant valant 1 si le processus j peut potentiellement connaître un saut à la date t et 0 sinon, X j (t est une variable dépendant du temps et β est le paramètre de régression à estimer. Dans le contexte de notre étude en Revenue-Management, la variable X représente l ouverture ou la fermeture d une classe tarifaire environnante et le paramètre β mesure l influence de la fermeture à la réservation de cette classe sur l intensité de réservation dans la classe considérée. La fonction de risque de base λ 0 (t modélise le comportement de réservation des clients souhaitant initialement réserver dans la classe tarifaire visée. Il semble réaliste de supposer que la période de réservation des clients se décompose en plusieurs phases de comportement de réservation homogène. Cela se matérialise par une fonction de risque de base constante par morceaux, c est-à-dire : l λ 0 (t = µ s 1{t ks t < t ks+1 }, (2 s=0 où l + 1 est le nombre de périodes de comportement de réservation homogène, (µ s 0 s s sont les intensités de réservation dans chacune de ces périodes. Comme l expliquent Aalen et al. (2008, si les dates (t ks 1 s l où les ruptures interviennent sont connues, la maximisation de vraisemblance se réduit à un problème de maximum de vraisemblance dans le modèle de régression de Poisson. Nous supposons ici que ces dates sont inconnues parmi l ensemble des dates d observation (t i 1 i n. 3 Procédure d estimation, simulation et application Pour estimer le paramètre θ = ( β, (k, µ, nous développons une procédure itérative en deux phases pour maximiser la vraisemblance de l échantillon observé. L algorithme fait intervenir une phase de programmation dynamique (cf Bellman 1961 afin de détecter les ruptures au sein de la fonction de risque de base. De multiples tests ont été mis en œuvre pour mesurer la validité de la procédure et la qualité d estimation obtenue. Le graphique ci-dessous présente un exemple de résultats d estimation obtenus pour un échantillon de processus de Poisson non homogènes 3

simulés selon une intensité de la forme (1-(2 de paramètres connus θ = ( β, (k, µ = ( 2, (5, 7, 17, 22, (1, 4, 2, 0.2, 1. Les paramètres estimés dans ce cas sont : ( ˆβ, (ˆk, ˆµ = ( 2.045, (5, 7, 17, 22, (0.917, 4.11, 1.89, 0.199, 0.99. Processus cumulés 0 20 40 60 80 100 120 0 5 10 15 20 25 Temps Figure 2: Processus de Poisson simulé (cercles noirs, fonction de risque cumulée estimée (en vert et fonction de risque de base cumulée estimée (en rouge. Les performances d estimation validant la procédure, la méthode a été appliquée pour la problématique de l étude du processus des réservations et l estimation de la demande initiale de TGV. Un cas d application sur jeu de données réel SNCF sera présenté. Bibliographie [1] Aalen, O. O., Borgan, O. et Gjessing, H. K. (2008, Survival and Event History Analysis, Springer. [2] Andersen, P. K. et Gill, R. D. (1982, Cox s regression model for counting processes: a large sample study, The Annals of Statistics, 10, 1100 1120. [3] Bellman, R. (1961, On the approximation of curves by line segments using dynamic programming, Communications of the ACM, 4, 284. [4] Cox, D. R. (1972, Regression models and life-tables, Journal of the Royal Statistical Society, Series B, 34, 187 220. 4

[5] Lee, A. O. (1990, Airline reservations forecasting : probabilistic and statistical models of the booking process, PhD thesis, Massachusetts Institute of Technology. [6] Oueslati, A. et Lopez, O. (2012, A two-tier proportional hazards regression model with change-points in the baseline function, preprint : http://hal.archives-ouvertes.fr/hal- 00655891 [7] Talluri, K. T. et Van Ryzin, G. J. (2004, The theory and practice of revenue management, Kluwer Academic Publishers. [8] Zeni, R. H. (2001, Improved forecast accuracy in airline Revenue Management by unconstraining demand estimates from censored data, Dissertation. 5