Données de Validation en Ile de France : architecture, chaîne de traitement, et exemples d exploitations T. Siméon 10/10/2014
Le STIF q Le STIF imagine, organise et finance les transports publics pour tous les Franciliens. Au cœur du réseau de transports d Ile-de-France, le STIF fédère tous les acteurs (voyageurs, élus, constructeurs, transporteurs, gestionnaires d infrastructures, ). Il investit et innove pour améliorer le service rendu aux voyageurs. q Le STIF, composé de la Région Ile-de-France, de la Ville de Paris et des sept autres départements franciliens, porte la vision de l ensemble des transports franciliens (train, RER, métro, tramway, T Zen et bus). q Ainsi, il décide et pilote les projets de développement et de modernisation de tous les transports, dont il confie l exploitation à des transporteurs. 2
La région Ile de France 12 millions d habitants (18% de la pop française) 6 millions d emplois 1 750 km de lignes ferrées (métro + RER + trains) desservant environ 450 gares ou stations 6 lignes de tramway 25 000 km de lignes de bus, 30 000 arrêts desservis par environ 1 500 lignes 2.6 milliards de voyages annuels sur les réseaux ferrés 1.3 milliards de voyages annuels sur les réseaux de bus soit environ 4 milliards de voyages par an en transports en commun 3
Le projet SIDV L historique, les données et le système mis en œuvre Type d exploitations et de représentation 4
La généralisa3on de la télébille6que Forfait intégral distribué sur passe Navigo (Navigo annuel) Forfait Imagine R étudiant Début Projet SIDV Forfait Navigo Mensuel + Hebdo toutes zones Remontée des données Op3le Remontée des données RATP bus Déploiement forfait Améthyste sur Navigo 1999 2001 2002 2003 2005 2006 2007 2008 2009 2013 Décision de généraliser la télébille6que Forfait Imagine R scolaire Dispari3on de la Carte Orange sur coupon magné3que Le STIF se dote d un SI décisionnel : le SIDV Remontée des données pour le ferré 5
2 types d informa3ons remontées Données du passe Navigo - Un contrat (3tre) - Un numéro unique (anonyme) - Un profil - Une validité (date, zone) Données issues des valideurs - Une date et une heure de valida3on - Une nature (entrée, sor3e, corresp.) - Un lieu 6
Intégra3on des fichiers de valida3ons et référen3els transporteurs Les fichiers récep>onnés sont contrôlés : Contrôles sur les fichiers Normes de nommage Nombre de lignes dans les fichiers En-tête des fichiers Longueur et le format des champs Les dates entrant dans la plage temporelle autorisée (les données trop anciennes et les données du futur sont rejetées) La non satisfaction de ces conditions engendre le rejet définitif du fichier ou de l enregistrement Dédoublonnage Contrôles d intégrité référentielle Les données de validations et de référentiels sont dédoublonnées pour ne conserver qu une version de l enregistrement (les doublons ne sont pas intégrés dans le système) Les validations doivent être intègres sur les référentiels structurant du système (nature de validation, profil du client, type de contrat, zones du titre, réseau, transporteur, arrêt, ligne, sous-ligne, etc.) Recyclage pendant 30 jours des validations non intègres afin de prendre en compte les éventuelles mises à jour des référentiels Les doublons sont rejetés définitivement et ne sont pas pris en compte dans le système En cas de non intégrité de la validation au bout des 30 jours, la validation est insérée dans le système avec des valeurs par défaut
Le système mis en œuvre Validation Jour J A1 entre J+2 et J +5 Réception jusqu à J+30 Vérification, Nettoyage, Optimisation Vérification des contraintes d'intégrité référentielle. à J+30 Historiser et au-delà analyser, exploiter, comprendre A1 A2 Collecte des données Zone tampon Entrepôt Reporting Extraction A1 Données de Référentiel Données de Validation Passé un certain nombre de jours, on considère que les données qui sont systématiquement rejetées le seront toujours. On purge alors ces données et elles ne pourront plus être recyclées. Référentiel STIF 8
Les données remontées q Quelques chiffres: o Plus de 10 millions de validations remontées par jour ouvrable (6 millions un samedi, 4 millions un dimanche) à près de 2,5 milliards de validations par an 03/03/2014 04/03/2014 05/03/2014 06/03/2014 07/03/2014 08/03/2014 09/03/2014 BUS 2 883 102 3 106 756 3 073 746 3 153 502 3 151 400 1 737 854 913 063 FERRE 3 674 136 3 884 338 3 832 549 3 956 603 3 865 654 2 021 798 1 265 818 METRO 3 606 512 3 878 642 3 878 640 3 972 979 4 004 191 2 492 674 1 535 632 TRAMWAY 344 152 367 210 357 417 367 677 368 741 221 193 163 525 TOTAL 10507902 11236946 11142352 11450761 11389986 6473519 3878038 o Des données conservées de 2 à 5 ans à 6 To de données stockés sur nos serveurs! 9
Les biais Les biais liés aux remontées de données Biais de type gare ouvertes (15% du trafic SNCF) Qualité de la données/fiabilité des référen3els (non remontée de certaines informa3ons (environ 10% des valida:ons bus n ont pas d arrêt iden:fiable) Les biais liés aux règles mé>ers ou au comportement des usagers Biais ayant trait aux habitudes des usagers (non valida3on dans les bus et tramways) (de 0 à 10% du trafic bus selon les lignes et les horaires) Indisponibilité ponctuelle des remontées dues à la maintenance ou aux travaux dans certaines gares Jours excep3onnels (mouvements sociaux, jours fériés, ponts, etc.) Titres en magné3ques 10
Le projet SIDV L historique, les données et le système mis en œuvre Type d exploitations et de représentation 11
Les opportunités q Aujourd hui, une semaine donnée, environ 1 million de personnes utilisent un forfait Navigo, 850 000 une carte intégrale, 700 000 une I R. Les remontées de validation sont fiables et le système est rodé. On peut donc: q Disposer d une information homogène : o Grâce à l intégration tarifaire o Par l acquisition de données issues de l ensemble des opérateurs de transport de la Région q Apporter des mesures précises et «indépendantes» aux différents stades des prises de décisions du STIF : o Connaître plus précisément les usages des titres et de la mobilité pour évaluer les manques et carences o Evaluer et simuler l impact de mesures nouvelles o Mesurer l incidence des décisions du STIF sur l usage des transports collectifs (consommation des titres, fréquentation des nouveaux services ) 12
Type d exploitations et de représentation Connaissance d un pôle de transport, usage des différents modes et des interactions multi modales Interaction entre offre et demande, impact d un renfort d offre Un nouveau type d exploitation: la restructuration d un secteur 13
Zoom : Connaissance des pôles La meilleure connaissance de l utilisation d un pôle de transport a pour objectif de connaître l utilisation de ce pôle, mais aussi la structure géographique et temporelle du bassin de rabattement sur ce pôle de façon à mieux analyser : q L usage du pôle de transport q L usage des lignes en rabattement q L'aménagement (organisation des arrêts de bus, parking, ) autour de la gare. Cela est obtenu en analysant la succession des validations d un carte télébillettique Gare Gare Gare Gare Rabattement bus, avec itinéraire (ligne empruntée) connu Rabattement ferré, avec origine connue mais itinéraire inconnu Autre rabattement (non transport en commun), avec origine et itinéraire inconnus
Zoom : Connaissance des pôles Répar>>on horaire des entrants en gare Comprendre le fonc3onnement de la gare Nombre moyen de validations par jour en gare de Cergy Préfecture par tranche horaire Analyse sur 6 jours du mois de mars 2012 (mardi et jeudi exclusivement) 5 000 4 500 4 000 3 500 3 000 2 500 2 000 1 500 1 000 500-37 380 1 376 3 719 4 815 2 009 1 390 1 502 1 279 1 1301 085 1 163 2 496 4 008 3 803 2 474 1 390 1 177 241 154 73 23 Source : SIDV et des correspondances bus- bus au pôle Visualisa3on des lignes qui ont le plus de correspondances entre elles. 15
Zoom : Connaissance des pôles Etablir des diagnos3cs sur les correspondances entre bus et gare Permelre la défini3on des aménagements per3nents à réaliser pour améliorer la voca3on mul3modale du pôle (quel mode de rabalement, quelles lignes empruntées..) NOMBRE DE RABATTEMENTS/CORRESPONDANCES TC EN GARE NOMBRE DE RABATTEMENTS BUS EN GARE CERGY-PREFECTURE 60 50 40 30 20 10 0 05H15-05H30 05H45-06H00 06H15-06H30 06H45-07H00 07H15-07H30 07H45-08H00 08H15-08H30 08H45-09H00 09H15-09H30 09H45-10H00 10H15-10H30 10H45-11H00 11H15-11H30 11H45-12H00 12H15-12H30 12H45-13H00 13H15-13H30 13H45-14H00 14H15-14H30 14H45-15H00 15H15-15H30 15H45-16H00 16H15-16H30 16H45-17H00 17H15-17H30 17H45-18H00 18H15-18H30 18H45-19H00 19H15-19H30 19H45-20H00 20H15-20H30 20H45-21H00 21H15-21H30 21H45-22H00 22H15-22H30 059-440 - 449 059-440 - 430 025-195 - 007 059-440 - 444 059-440 - 442 212-195 - 018 059-440 - 445 059-440 - 457 059-440 - 456 16
IPDU Réaménagement des pôles Représenta>on cartographique Visualisa3on agrégée des rabalements sur un pôle. Percevoir les niveaux d alrac3vité, les dépendances entre les modes et l organisa3on spa3ale des trafics. 17
Type d exploitations et de représentation Connaissance d un pôle de transport, usage des différents modes et des interactions multi modales Suivre l usage d une ligne de bus, impact d un renfort d offre Un nouveau type d exploitation: la restructuration d un secteur 18
Zoom : Connaissance des lignes de bus La meilleure connaissance de l utilisation de lignes de bus doit permettre de mieux cibler les renforts à mettre en place, de suivre leur impact et plus globalement de lieux connaitre la mobilité q Usage de lignes de bus par titre, par jour, par heure, q Les besoins en renfort et l impact de ces renforts
Suivre l usage des lignes de bus: par TITRE OR BASSIN Analyse sur la diffusion 20
Suivre l usage des lignes de bus: par Heure et par jour OR BASSIN Analyse sur la diffusion 21
Impact d un renfort d offre Evaluer les ressources à mobiliser (offre de transport) en fonc3on des besoins mesurés. Suivre les modifica3ons du trafic Suivre l usage des lignes de bus: Impact d un renfort d offre 22
Type d exploitations et de représentation Connaissance d un pôle de transport, usage des différents modes et des interactions multi modales Suivre l usage d une ligne de bus, impact d un renfort d offre Un nouveau type d exploitation: la restructuration d un secteur 23
La restructura3on Pointe du Lac q La Ligne 8 qui relie la sta>on Balard à Créteil Préfecture a été prolongée au sud- est, depuis Créteil Préfecture d une sta>on (1,8 km ) pour accompagner la dernière étape de développement de la ville de Créteil dans sa par>e sud.
La restructura3on Pointe du Lac L ouverture de cette nouvelle station modifie l usage des lignes de bus du secteur, en apportant un nouveau rabattement A) vision d une ligne
B) vision multi-lignes La restructura3on Pointe du Lac
La restructura3on Pointe du Lac Part du rabattement vers gares au niveau des arrêts bus
Le SIDV q En résumé. o Le système peut être considéré comme rodé. Les validations remontent correctement et exhaustivement, mais : Ø les données sont sensibles et nécessite un traitement important Ø les informations remontées sont nombreuses, parfois complexes et dépendent fortement de paramètres «exogènes» au système (taux de validation, qualité des référentiels, ) Ø les risques de mauvaises interprétation aussi (journée particulière, valideurs en panne,..) Et encore: Ø Seul le STIF peut réaliser certains types d analyse car il dispose de données multiopérateurs Ø Nécessite une expertise et une organisation importante pour faire connaitre les potentialités de l outil et ses limites, cibler les besoins de chacun, apporter un éclairage nouveau. Ø Nécessite de faire le travail à la main (pas de cartographie des pôles et de la position de chaque ligne de contrôle accessible facilement) q Nécessite de travailler encore plus sur les référentiels, sur la connaissance des biais éventuels, et sur l exhaustivité des données (contrat STIF/transporteurs), d améliorer la qualité des données,.. 28
MERCI Des questions: thierry.simeon@stif.info