Quelle gouvernance de l Open Data les transporteurs doiventils mettre en place? Paris, le 02 Juillet 2013
Sommaire INTRODUCTION... 0 I/LA DEMARCHE D OUVERTURE DES DONNEES N EST PAS SANS CONTRAINTES 0 II/ L OPEN DATA SUSCITE DES RALLIEMENTS PROGRESSIFS... 2 III/ LE VERITABLE ENJEU : GOUVERNER LA MISE A DISPOSITION DE L INFORMATION... 3 IV/ LES PRIORITES DE GOUVERNANCE SONT DIFFERENTES EN FONCTION DU CHOIX D OUVERTURE RETENU... 5 CONCLUSION : L OPEN DATA EST UN PARI D'APPORT DE VALEUR... 6 02/10
INTRODUCTION En décembre 2011, la Commission Européenne estimait que l absence de mise à disposition gratuite d informations de la part des pouvoirs et services publics provoquait un manque à gagner de quarante milliards d euros par an pour l Union Européenne. Ce chiffre important illustre l enjeu financier du ralliement à la donnée ouverte, plus connue sous le nom d «open data». On considère que la donnée est ouverte dans la mesure où elle est accessible par tous, gratuitement et pouvant être réutilisée librement. Dans le domaine du transport, l open data est un sujet brûlant, car la donnée transport constitue une donnée à forte valeur ajoutée. Les manières de traiter, d articuler et de combiner cette donnée sont multiples et offrent des potentiels d innovations énormes. C est justement pour cette raison que les transporteurs ou les propriétaires des données sont peu enclins à mettre à disposition gratuitement des données qui peuvent représenter de véritables poules aux œufs d or. D un autre côté, les associations et les instances européennes poussent à la fourniture gratuite des données. Dès lors, pour les transporteurs et les autorités organisatrices du Transport (AOT), la marge de manœuvre est étroite. Comment doiventils envisager la libéralisation des données? Quelle gouvernance doivent-ils mettre en place? Autant de questions auxquelles les décideurs doivent aujourd hui trouver une réponse sous peine soit de rater le train de l open innovation, soit de laisser dans les tiroirs des données qui peuvent générer des profits supplémentaires. I/ LA DEMARCHE D OUVERTURE DES DONNEES N EST PAS SANS CONTRAINTES En France, la donnée de transport est la propriété du transporteur sauf dans le cas d une Délégation de Service Public (DSP), où elle est alors la propriété des Autorités Organisatrices du Transport (AOT). Les transporteurs français, que ce soient par exemple la RATP ou le groupe SNCF, ont entrepris récemment une politique d open data. Dans le cas d une DSP, ce sont les AOT qui décident de mettre ou non à disposition libre les données du réseau. Or, en novembre 2012, le Groupement des Autorités Responsables de Transport (GART), auquel adhérent les AOT, a rendu un avis défavorable sur la fourniture gratuite des données de transport. Le GART défend la mise en place d une redevance pour les entreprises utilisant les données à des fins commerciales. Au-delà du GART, certains transporteurs ne sont pas convaincus des bénéfices à tirer d une démarche open data et plusieurs arguments leurs donnent raison: Premièrement, la mise en œuvre d une démarche «open data» est coûteuse et consommatrice de ressources. La mise à disposition au grand public d un jeu de données nécessite un investissement tant sur le plan des infrastructures des systèmes d informations, que sur le plan des ressources humaines. La mise à disposition gratuite n ayant pas de retour sur investissement financier direct, elle peut apparaître superflue. Cette question se pose d autant plus que les coûts peuvent augmenter avec la demande de consommation croissante des données. 03/10
Figure 1 : L accroissement des besoins en données est un phénomène autoalimenté Par ailleurs, certains transporteurs ne souhaitent pas voir d autres entreprises utiliser leurs données gratuites à des fins commerciales. Les données transport peuvent être sources de profit en étant monétisées de plusieurs manières : la plus simple est de faire payer l accès à l information voyageur (via par exemple une application smartphone payante). Néanmoins, aujourd hui, on constate qu aucune application avec accès payant à l information voyageur n est arrivée à s imposer. Une autre manière est de générer des revenus publicitaires en couplant des annonces commerciales aux informations voyageur. C est cette pratique que le GART met en cause pour récuser l open data en ciblant en particulier le géant américain Google qui est le spécialiste en la matière. Là encore, l atteinte du seuil de rentabilité par la publicité contextualisée est souvent aléatoire : de nombreuses startups ont dû renoncer à en vivre, mais à l inverse, du fait de leurs tailles critiques, des acteurs comme Facebook ou Google y sont parvenus. D une façon plus complexe, cette information voyageur peut également être enrichie et être couplée avec une prestation commerciale. On peut très bien imaginer une application mobile qui, en fonction des prochains horaires et du taux d occupation des bus fournis par le transporteur, propose à ses adhérents une réduction immédiate dans les magasins alentours tout en les tenant informés des bus à l occupation modérée. Le possesseur de la donnée, en constatant la valorisation et la monétisation de telles données, peut donc être tenté soit d en demander une quotepart, soit de créer lui-même ses applications et de ne pas ouvrir la donnée. D un point de vue stratégique, la mise à disposition d une information au grand public signifie que le possesseur perd la maîtrise de cette donnée. Une fois publiée, la donnée peut revêtir un caractère indispensable pour certaines applications et les business models associés. Le fournisseur de la donnée se retrouve alors responsable de facto de tout un écosystème qui s est bâti autour d une donnée ouverte. Bien malgré lui, le transporteur, propriétaire initial, se retrouve prisonnier de sa donnée. On comprend dès lors que le risque d une potentielle perte d autonomie peut réfréner certains à franchir le pas de l ouverture de données. 04/10
Enfin d un point de vue métier, laisser à des tiers la possibilité d utiliser des données relatives à l information voyageur fait peser un risque de dégradation qualitative de l information transmise. Cette dégradation peut, par exemple, être provoquée par une mauvaise interprétation des données par les services d enrichissement et de diffusion du consommateur de données. L usager final, pénalisé par une information dégradée, attribuera les incohérences au transporteur et déplorera une qualité de service dégradée. Par ailleurs, des applications "non neutres" peuvent donner une image tronquée de l'offre de transport à leur avantage, ou risquent de perdre l'utilisateur dans de nombreuses offres hétérogènes. Le fournisseur de données, alors qu il était indépendant du comportement des tiers, se retrouve impacté par des décisions extérieures sur la diffusion de sa propre donnée. C est toutes ces raisons qui avaient poussé la RATP à refuser dans un premier temps l open data. En plus de les protéger en restreignant l accès, le transporteur francilien avait réussi à monétiser ses données transport via l application iphone et Android longtemps vendue 1,29 euros. Néanmoins, en mai dernier, la RATP ouvrait son site data.ratp.fr avec un premier jeu de données transport gratuitement disponible. Quelles sont les raisons d un tel revirement? II/ L OPEN DATA SUSCITE DES RALLIEMENTS PROGRESSIFS L ouverture des données transport en Europe et plus largement en France est surtout due aux préconisations européennes et gouvernementales. En décembre 2011, la Commission Européenne dans un communiqué ouvrait la voie vers l open data. Ce communiqué réaffirme le principe de gratuité des données publiques mises à disposition, sans contrepartie, et incite l ensemble des états-membres à s engager vers l ouverture des données publics. L objectif est d améliorer la transparence des administrations, les services aux citoyens et développer par ce biais l activité économique. Dans le même moment, anticipant les recommandations européennes, l état français créait Etalab, service en charge de la promotion de l ouverture des données publiques françaises. Cette entité a donc pour mission d apporter son soutien à l ensemble des organismes en charge d une mission de service public qui sont désireux d ouvrir leurs données. Fort de ces incitations, le groupe SNCF a lancé en 2012 data.sncf.fr avec un premier jeu de données en accès libre. Dans la même logique, la RATP a lancé son site en octobre 2012 d open data : on peut alors y trouver les indices et couleurs de lignes du réseau métro et bus, les positions géographiques des stations, des plans schématiques du réseau, ou encore les correspondances des stations et des lignes Suite à cette première libéralisation, la RATP a mis un nouveau jeu de donnée à disposition fin mai 2013. En plus des éléments précédents, les développeurs bénéficient désormais de l offre de transport RATP (horaires prévisionnels), de l accessibilité des lignes et des différents arrêts des bus. Ce nouvel élan est le signe que la RATP y perçoit un avantage. Mais lequel? La raison principale est qu il est possible avec la donnée ouverte de s inscrire dans une démarche d open innovation, qui est aujourd hui économiquement plus intéressante que de rester dans une logique d internalisation. A l image des laboratoires pharmaceutiques, qui se sont tournés depuis quelques années vers l open innovation, les transporteurs cherchent à décupler les potentiels d innovation. Or, celle-ci est maximisée dans la mesure où la créativité est libérée et n est pas circonscrite à quelques développeurs. Au-delà, l objectif d une démarche d open innovation est de s inscrire dans une démarche partenariale: le fournisseur de la donnée n est plus simple pourvoyeur mais est co-créateur. Il oriente les 05/10
choix faits par les développeurs, les conseille et les assiste. L avantage pour le fournisseur est de taille : en accompagnant les développeurs, il peut orienter la créativité vers la réponse à ces besoins propres. Il s assure ainsi que les développements effectués lui conviennent et correspondent à ses exigences. Par ailleurs, un des avantages pour le transporteur est que l investissement nécessaire requis pour entreprendre une démarche d open innovation est minime comparé à la structure à mettre en place afin de porter soi-même un projet de développement interne. En effet, pour l entreprise, l investissement se cantonne à la production et à la publication de la donnée. L ensemble des autres coûts engendrés par le développement d une interface innovante, puis par la maintenabilité et l évolutivité de l application n est pas supportée par elle. C est dans cette logique que la RATP a organisé en mai dernier l OpenDataLab. Durant deux jours, le transporteur a permis à dix équipes de développeurs de travailler sur des nouveaux jeux en proposant des services innovants. Afin d orienter et assister les équipes, des designers, des analystes ou encore des ingénieurs de la RATP sont intervenus en soutien. Pour les équipes, l enjeu était de remporter une dotation de cinq milles euros Pour la RATP, l objectif était de mettre au point en un temps record de nouveaux projets innovants à un moindre coût. Mais, au-delà de cette logique d Open Innovation, une démarche d Open data est également porteuse de nombreux autres avantages pour le transporteur. Par exemple, l ouverture de la donnée est perçue par les utilisateurs finaux comme un signe de transparence et d engagement sociétal, contribuant à améliorer l image de marque du transporteur. Autre avantage : en échangeant avec les consommateurs de données, le transporteur contribue à améliorer en continue la qualité des données et rétroactivement améliore ses propres données de production. La donnée ouverte, si elle s inscrit dans une logique d open innovation, peut donc s avérer être génératrice de profits. Néanmoins, ce n est pas forcément le cas. Or, nous l avons vu, il peut être également rentable de monétiser ses données. Dès lors quelle décision prendre? III/ LE VERITABLE ENJEU : GOUVERNER LA MISE A DISPOSITION DE L INFORMATION Le choix à faire pour les transporteurs n apparaît plus aussi binaire qu auparavant. Aujourd hui, entre la rétention totale des informations et la mise à disposition gratuite, plusieurs options s offrent aux transporteurs : monétisation partielle ou totale, diffusion gratuite globale ou restreinte à quelques acteurs 06/10
Figure 2 : Les cas d articulation entre fourniture gratuite et monétisation des données Pour effectuer ce premier arbitrage, il ne s agit pas simplement d évaluer si le consommateur des données souhaite monétiser des données à l insu du transporteur fournisseur et le faire payer en conséquence : en effet, certains consommateurs de données peuvent très bien payer des jeux de donnée et ouvrir gratuitement des services aux utilisateurs Ainsi, avant de retenir une articulation et choisir un arbitrage sur le degré d ouverture de la donnée que l on souhaite mettre en place, il faut étudier les avantages et les inconvénients de chaque option au regard de la situation du transporteur. Cette évaluation peut être menée à l aune de la réponse trouvée à plusieurs interrogations : Quelle est la valeur de ma donnée? Le fournisseur de la donnée doit d abord s interroger sur l intérêt que suscite sa donnée tant d un point de vue quantitatif (nombre de consommateurs) que d un point de vue qualitatif (disposition des consommateurs à payer). L analyse peut donc dans un premier temps recenser l ensemble des acheteurs potentiels. Ensuite, le fournisseur peut essayer de quantifier son «surplus du producteur» économique, i.e. à quel point l utilisateur est prêt à payer pour obtenir la donnée. Par exemple, il est clair que l ensemble des grilles d horaires est susceptible d intéresser plus de développeurs que l emplacement des défibrillateurs installés en gare. Néanmoins, il est alors très bien possible que l emplacement des défibrillateurs intéresse moins de développeurs mais que ces derniers soient eux prêts à payer fortement pour accéder à la donnée Il faut également que la valeur marchande que le fournisseur peut tirer de ces données soit supérieure aux retombées positives qu il espère tirer en cas de mise à disposition gratuite. La difficulté d une telle quantification réside dans le fait qu il est complexe de pouvoir cerner ces retombées dans la mesure où celles-ci sont aléatoires et imprécises. Une manière d essayer d anticiper l importance de ces externalités consiste à considérer le nombre de développeurs intéressés par cette donnée. Par exemple, la majeure partie des petits réseaux de transport ne disposent pas des réseaux de développeurs nécessaires à susciter une masse critique d innovations capables d avoir des retombées positives pour le transporteur. 07/10
D un point de vue des coûts, il faut savoir si la valeur de ma donnée, et son prix associé, me permettent de couvrir les coûts d infrastructure SI et les coûts fonctionnels induits par la mise en place d une relation commerciale. Il est clair que les exigences des clients consommateurs de ma donnée seront plus fortes en cas de données payantes. A l inverse, même si des coûts d infrastructure SI sont à envisager en cas de données ouvertes, les exigences des consommateurs dans ce cas seront à la baisse : les interfaces de mise à disposition peuvent être simples et sommaires, et le processus d ouverture des données peut se faire en plusieurs étapes, sans que des niveaux critiques en terme qualitatifs ne soient exigés. Avec la donnée ouverte, la mise à disposition est un processus qui peut se mettre en place étape par étape, en dialoguant avec les développeurs Les exigences sont moins fortes, et la priorisation possible sur les données les moins onéreuses à fournir entraîne des coûts moins importants. Quelle est la criticité de la donnée et à quel point celle-ci est sensible? Quel niveau de contrôle doit avoir le transporteur sur la donnée? Ensuite, le transporteur doit évaluer la criticité de sa donnée : celle-ci revête-elle un caractère stratégique et structurant de son activité? Pour certains transporteurs, il est important de garder la main sur les données (production et contextuelle) dans la mesure où celles-ci sont parties prenantes dans le processus d organisation de l offre transport. Si tel est le cas, il est préférable pour le transporteur de garder un contrôle sur la donnée et d opter alors pour un accès payant ou restreint à la donnée. Avec une donnée ouverte, le transporteur à l inverse peut se retrouve dépossédé de toute marge de manœuvre, notamment parce qu il devient responsable de tout un écosystème. De plus, dans tous les cas, l ouverture expose le transporteur dans l utilisation faite de la donnée, mais en rendant la donnée payante ou en restreignant l accès, il peut néanmoins sélectionner à qui il fournit la donnée et d une certaine manière contrôler la diffusion. Au-delà, la sélection des diffuseurs permet également de restreindre la prolifération d une multiplicité d applications, dont certaines contribueraient à la dégradation de la perception de la qualité de service. IV/ LES PRIORITES DE GOUVERNANCE SONT DIFFERENTES EN FONCTION DU CHOIX D OUVERTURE RETENU Le choix de recourir à la mise à disposition payante ou gratuite doit donc faire l objet d une analyse approfondie. Cette analyse est d autant plus structurante qu elle définit les priorités de gouvernance : 08/10
Figure 3 : Les modèles de revenues liés à l ouverture des données Dans le cas d une mise à disposition payante, l objectif sera de maximiser les revenus directs issus des redevances tout en maîtrisant les coûts plus importants. L objectif sera également de mieux contrôler l utilisation de la donnée. Il faudra s atteler à définir le «prix à payer» pour la donnée, investir dans une structure SI et fonctionnelle capable de fournir une qualité de donnée en adéquation avec l exigence des clients, qualité qui sera facteur de coûts plus importants. Il faudra également s assurer de la perpétuelle valorisation des données en enrichissant au fur et à mesure l exhaustivité et la pertinence des jeux, afin de justifier les prix pratiqués. Dans le cas d une mise à disposition gratuite, l objectif sera de minimiser les coûts liés à la mise à disposition gratuite tout en cherchant à maximiser les retombées indirectes, engendrées par une qualité de service améliorée. Il faudra donc s attacher à orienter les développeurs afin que leurs innovations répondent aux enjeux et aux priorités du transporteur. Cela peut passer par exemple par l organisation de séminaires ou de jeu-concours. Il faudra s atteler également à maîtriser les coûts de l ouverture : en premier lieu, il faudra identifier les données puis les analyser selon des critères de fiabilité, d exhaustivité, d évolutivité, de sécurité, de volumétrie en gardant à l esprit que celles-ci ne doivent pas engendrer de surcoût trop important au niveau de l architecture des systèmes d informations. Par exemple, il faudra plutôt s orienter sur des données déjà stockées dans des bases de données, dont le niveau de retraitement nécessaire est minime et dont la publication est facile. CONCLUSION : L OPEN DATA EST UN PARI D'APPORT DE VALEUR Aujourd hui, il faut cependant garder à l esprit que la donnée relative à l information voyageur demeure un centre de coût pour les transporteurs. A date, que ça soit via la monétisation des données ou que ça soit au travers de l ouverture, aucun modèle n est arrivé à trouver un point d équilibre financier. La mise à disposition des données demeure un sujet sensible chez les transporteurs dans la mesure où l information voyageur est au centre de la stratégie globale de l optimisation du réseau et de la relation client. A termes, l Open Data peut représenter une source d innovation formidable. Pour cela, l ouverture doit faire l objet d une réelle gouvernance et ne doit pas être mise en place à n importe quel prix. Une démarche d Open Data n est fructueuse que si les données diffusées sont traitées de manière neutre par les développeurs. Ces derniers doivent, en réutilisant les données, apporter une valeur ajoutée en 09/10
enrichissant la donnée brute, enrichissement qui, in fine, permet d'améliorer les offres de service du transporteur et développer de nouvelles solutions. 10/10