OPEN DATA L OUVERTURE DES DONNEES H YUKCHAN KWON G UILLAUME ROY O ANA-ALINA SUCIU M AXIME THEBAULT. 3 ème année Département INFO



Documents pareils
Open data : les données libérées doivent-elles être gratuites?

La feuille de route du Gouvernement en matière d ouverture et de partage des données publiques

La géomatique en Nouvelle-Calédonie usages professionnels et potentiels économiques

Les obstacles : Solutions envisageables :

Participation des habitants et contrats de ville Quels enjeux? Quelle mise en oeuvre?

Passage du marketing par à l automatisation du marketing

Question 1: Informations sur la personne ou entité interrogée

#BigData Dossier de presse Mai 2014

À PROPOS DE TALEND...

Modernisation et gestion de portefeuilles d applications bancaires

La gestion des performances en Europe. Panel d expériences européennes et possibles synergies

3. Un crédit à la consommation responsable

Réduire la pauvreté : comment les collectivités territoriales peuvent-elles être des catalyseurs du développement économique pro-pauvre?

Open Data & informations publiques : les principaux aspects juridiques

Regards Citoyens L'Open Data par et pour les citoyens

Consultation de la CNIL. Relative au droit à l oubli numérique. Contribution du MEDEF

Mesurer et analyser le trafic d un site internet Comment analyser l audience de son site et connaître les centres d intérêts des visiteurs?

Portail d informations et de données de marchés publics ou la commande publique augmentée

Cahier des charges - Refonte du site internet rennes.fr

Conseil économique et social

Stratégies gagnantes pour les prestataires de services : le cloud computing vu par les dirigeants Dossier à l attention des dirigeants

Conseil de développement durable (C2D) Plénière d ouverture 17 décembre 2014

QUELLES PERSPECTIVES POUR LES RETRAITES EN France?

Inviter au plus vite tous les acteurs de la création, de l'édition, de la diffusion et de la lecture à des «États généraux du livre et de la lecture».

CHARTE BUDGET PARTICIPATIF

Introduction : pour une refonte générale de notre système de retraite

Analyse en temps réel du trafic des Internautes

Vision prospective et obstacles à surmonter pour les assureurs

Recommandations pour une diffusion du livre numérique par les bibliothèques publiques

Avenir de la Fonction publique «parcours professionnels, carrières, rémunérations»

FICHE N 2 LA GESTION COMMERCIALE DES CLIENTS ET PROSPECTS POUR LE SECTEUR DES ASSURANCES (NS 56)

Mettre en place une infrastructure Web nouvelle génération avec Drupal et Acquia

Logiciel Libre Cours 9 Modèles Économiques

Guide Juridique. > Les données publiques, guide juridique & pratique. Aquitaine Europe Communication

ISTEX, vers des services innovants d accès à la connaissance

Nouvelle stratégie européenne d action pour la jeunesse «Investir en faveur de la jeunesse et la mobiliser»

Impartition réussie du soutien d entrepôts de données

Les documents primaires / Les documents secondaires

FACE AUX DÉFIS ÉCOLOGIQUES

Position de l ASTEE sur l innovation en matière de services d eau et de déchets

Xi Ingénierie. La performance technologique au service de votre e-commerce. Comment exploiter les cookies sur vos applications web en toute légalité?

LE DECRET STATUTAIRE RELATIF AUX ENSEIGNANTS-CHERCHEURS (par le bureau du Collectif pour la Défense de l Université)

Logiciels libres: Des applications métiers mutualisées pour les collectivités. Les Rencontres LandesPublic

TABAC : PREMIER BILAN SUR L APPLICATION DE LA LOI EVIN EN MILIEU SCOLAIRE. Dossier de Presse

CREATION INNOVATION EDUCATION

La simplification du dossier de candidature

Or, la prévention des risques psychosociaux relève de l obligation générale de l employeur de protéger la santé physique et mentale des salariés.

Marketing comportemental. Guide méthodologique de mise en œuvre

Intervention de M. de Lamotte, président de la section sur l école et son interdépendance avec le marché

CHARTE D ÉTHIQUE PROFESSIONNELLE DU GROUPE AFD

Modélisation de la réforme des pensions

Rencontres. La Mutuelle Européenne, un moyen de diversification géographique Etat des lieux

Déclaration des droits sur Internet

UNE MEILLEURE CROISSANCE, UN MEILLEUR CLIMAT

La traduction des sites internet touristiques en langues étrangères comme outil de valorisation et de promotion des territoires aquitains

QUELLE REFORME DE L ASSURANCE-MALADIE AUX ETATS-UNIS? 1

Crédits photos Philippe Montigny, Christophe Lepetit, Pascal Bourguignon, Julien-René Jacque, Cédric Hesly.

LA FINANCIÈRE AGRICOLE DU QUÉBEC PLAN D ACTION DE DÉVELOPPEMENT DURABLE

Le Big Data est-il polluant? BILLET. Big Data, la déferlante des octets VIVANT MATIÈRE SOCIÉTÉS UNIVERS TERRE NUMÉRIQUE TERRE (/TERRE)

PRIORITÉS POUR LE BUDGET FÉDÉRAL DE 2012

Le droit d auteur dans un environnement numérique : les positions de l IFLA et de l UNESCO 1

L Organisation mondiale du commerce...

Ressources. APIE Agence du patrimoine immatériel de l état. Les paiements sur Internet. l immatériel. Pour agir. En bref

Votre guide 2013 pour la gestion des déplacements et frais professionnels

CONDITIONS DE REUSSITE, DISPENSES, REPORTS ET CREDITS DANS L ENSEIGNEMENT SUPERIEUR

Considérations sur la crise et le marché intérieur 1

BREVET DE TECHNICIEN SUPÉRIEUR ÉPREUVE DE MANAGEMENT DES ENTREPRISES BOITIER PHARMA

64% des actifs font confiance aux mutuelles : La France Mutualiste se mobilise pour répondre à leurs attentes

DOCUMENT DE CONSULTATION

Dossier de presse. Umalis Group : l innovation au service de l emploi

Sommaire. A la une Témoignage client...4. Prochain rendez-vous...6. Syselcom : l actu...7. Contact Us

Veolia Transdev Pour une mobilité innovante, sûre et durable et des territoires plus harmonieux

Qui fait quoi sur internet?

CONFERENCE TECHNOM AIDE IBM

Une école adaptée à tous ses élèves

Formation à la recherche documentaire sur le web

CHARTE DES UNIVERSITÉS EUROPÉENNES POUR L APPRENTISSAGE TOUT AU LONG DE LA VIE

Barack Obama a gagné la bataille... sur les médias sociaux aussi!

Business Intelligence Les 15 tendances clefs pour 2015

Bien architecturer une application REST

LES MUSEES & LES APPLICATIONS CULTURELLES SUR SMARTPHONES ETUDE DE MARCHE

Les rendez-vous Risk Advisory La lettre des professionnels du risque et de la finance

Enquête APM sur le Gouvernement d entreprise dans les PME-PMI : quelques résultats et commentaires

C ) Détail volets A, B, C, D et E. Hypothèses (facteurs externes au projet) Sources de vérification. Actions Objectifs Méthode, résultats

Code à l intention des partenaires commerciaux

Guide pratique des réseaux sociaux professionnels virtuels. Des conseils pour tirer le meilleur parti de ces communautés en ligne

Novembre Regard sur service desk

Le tableau comparatif suivant reprend les principaux articles concernant le monde de l édition.

Rapport technique n 8 :

POLITIQUE DE COHÉSION

OSGOODE HALL LAW SCHOOL Université York MÉMOIRE PRIVILÉGIÉ ET CONFIDENTIEL

Contributions françaises à la problématique internationale de la protection sociale des travailleurs informels et de leurs familles.

The Arab Cloud Computing Study Days Tunis- Tunisia 4-5 December M elle Rafia BARKAT. Chargée d Etudes Experte

CENTRE DE RECHERCHE GRENOBLE RHÔNE-ALPES

Le passage à l open source, une nouvelle priorité

Etude sur les Maisons des Services Publics en Europe (hors la France)

DEMANDE DE SOUTIEN - RAVIV. Fonds de Soutien à l Initiative et à la Recherche

La situation financière des Canadiens

Transcription:

OPEN DATA L OUVERTURE DES DONNEES H YUKCHAN KWON G UILLAUME ROY O ANA-ALINA SUCIU M AXIME THEBAULT 3 ème année Département INFO

REMERCIEMENTS Nous aimerions tout d abord remercier Mme Hélène Prigent et M. Simon Le Bayon pour nous avoir encadrés pendant ce semestre. Nous tenons aussi à remercier tout particulièrement M. Christophe Millot, responsable de l innovation numérique au service de l information voyageur de l entreprise privée de transport Keolis. M. Millot nous a accordé un entretien le 3 décembre 2013 qui nous a permis d approfondir nos connaissances sur l Open Data et de mieux appréhender notre sujet. Enfin, nous tenons à remercier Mme Bernadette Kessler, responsable du service innovation numérique de Rennes Métropole pour l interview qu elle a accepté de nous accorder le 9 janvier 2014. 2 OPEN DATA

SOMMAIRE Remerciements... 2 Sommaire... 3 Introduction... 5 1. Open data, de quoi parle- t- on?... 6 1.1. Présentation et rappels historiques... 6 1.1.1. Historique... 6 1.1.2. La révolution des données... 7 1.1.3. De la donnée publique vers la donnée ouverte... 9 1.2. Le développement de l Open Data... 11 1.2.1. Une politique de développement mondial... 11 1.2.2. La France et l Open Data... 12 1.2.3. L exploitation des données : la Data visualisation... 13 1.3. Des contraintes à surmonter... 15 1.3.1. Des barrières techniques... 15 1.3.2. Des limites économiques... 17 1.3.3. Des oppositions politiques... 18 2. Les acteurs de l Open Data... 20 2.1. La production : qui produit et quoi?... 20 2.1.1. Les organismes publics... 20 2.1.2. Les collectivités territoriales... 21 2.1.3. Les entreprises privées... 21 2.2. Utilisation et réutilisation : de l utilité des données ouvertes... 22 2.2.1. Secteur public... 22 2.2.2. Secteur privé... 23 2.2.3. Développeurs... 24 2.3. Etude des collectifs et associations... 24 2.3.1. Ouvrir ses données, un devoir moral... 25 2.3.2. L Open Data au service de l innovation... 26 2.3.3. Open Data et libertés individuelles... 27 3. Innover en connectant les données publiques... 29 3.1. Quels types de données connecter?... 29 3.1.1. Typologie des données ouvertes... 29 3.1.2. Big Data, l abondance des données... 29 3.1.3. Vers la donnée prédictive... 30 3.2. Exemples de projets... 31 3.2.1. Accessibilité et transport... 31 3.2.2. Secteur culturel... 31 3.2.3. Regards citoyens... 33 3.3. Etude prospective : vers une culture de la donnée... 33 3.3.1. Stimuler l Open Data... 33 3.3.2. Interconnexions entre organismes... 35 3.3.3. Open Data et secteur privé... 36 Conclusion... 38 Bibliographie... 39 Billets de blog... 39 Pages Web... 39 Articles d'encyclopédie... 42 OPEN DATA 3

Actes Juridiques... 42 Livres... 42 Présentations... 42 Rapports de conférences et d'ateliers... 43 Annexes... 44 4 OPEN DATA

INTRODUCTION Sensibles aux enjeux de l Open Data, que nous voyons comme un formidable outil d informations et de services à la population, il nous a tout de suite paru intéressant de dresser un état des lieux du processus d ouverture des données publiques. Le développement rapide de ce phénomène encore jeune nous semble particulièrement propice à l innovation pour peu que les moyens d apporter de la valeur aux données soient explicités. Depuis 2008 et l arrivée de Barack Obama à la tête des Etats-Unis, les initiatives Open Data se multiplient : l ouverture des données est désormais un enjeu politique. La diversité de ces données ainsi que le développement des smartphones en font aussi un enjeu économique grâce à l innovation et aux emplois générés. Ces deux derniers points sont particulièrement mis en avant par les défenseurs du mouvement : de leur point de vue, il représente l avenir et devrait donc être une préoccupation majeure des gouvernements. Nous nous sommes ainsi questionné sur les problèmes posés par l Open Data, tout en tentant d apporter des éléments de réponse. La problématique à laquelle nous répondrons tout au long de cette monographie peut être formulée ainsi : comment surmonter les limites de l Open Data pour innover? Pour répondre à cette problématique, nous allons tout d abord expliquer ce que signifient les notions de données publiques et de données ouvertes. Ces deux termes sont souvent confondus, mais ne veulent pas dire la même chose. Nous allons par ailleurs nous intéresser aux sources du mouvement. Ensuite, nous porterons notre attention sur le développement des données ouvertes afin de comprendre qui produit ces données, qui les utilise et comment les nouvelles pratiques liées à l Open Data se développent. Afin de pouvoir répondre à notre problématique, nous allons aussi définir les limites majeures de l Open Data à l heure actuelle. Elles peuvent prendre différentes formes : techniques, politiques et économiques. Après avoir introduit le sujet, nous allons nous intéresser à l avis des acteurs de l Open Data. On peut les regrouper en trois grandes catégories : on peut distinguer les producteurs de données (organismes publics, collectivités territoriales et entreprises privées), les réutilisateurs (les entités qui utilisent directement les données ouvertes), et les collectifs ou associations qui ont une position prédominante sur le sujet. Enfin, nous allons voir comment innover grâce à l Open Data. Après avoir vu quels types de données peuvent être connectés, nous allons donner des exemples de projets existants issus de l Open Data et s en inspirer pour donner différentes propositions sur la manière d innover avec l Open Data. OPEN DATA 5

1. OPEN DATA, DE QUOI PARLE-T-ON? Nous allons dans un premier temps introduire l Open Data, pour plus tard étudier les acteurs et les enjeux du mouvement en France 1.1. PRESENTATION ET RAPPELS HISTORIQUES Avant d étudier le développement et les limites de l Open Data en France, attachons-nous à définir le phénomène aussi formellement que possible. Nous étudierons ainsi l histoire du mouvement, son support et les formes qu il peut prendre. 1.1.1. Historique Étudions tout d abord la naissance du mouvement : ses racines, ses précurseurs et son évolution au cours des dernières années. Une première définition des données publiques en France La première définition des données publiques est donnée par la loi n 78-753 : CADA (Commission d Accès aux Documents Administratifs) du 17 juillet 1978 en France, loi qui permet, dès lors, le droit d accès pour n importe quel citoyen, aux données produites par le service public ou pour son compte. L accès aux données est néanmoins soumis à certaines conditions : les données pouvant porter atteinte à la vie privée ne peuvent être obtenues que par l intéressé, et les nouvelles dispositions introduites par cette loi ne concernent pas les données les plus sensibles (enquêtes de police en cours, données militaires, etc.). Lors de la promulgation de cette loi, Internet est peu développé et l ouverture en masse des données publiques pour en permettre une consultation libre (i.e. l Open Data) n est pas une préoccupation majeure. Des racines dans le milieu scientifique Les prémices de l Open Data viennent du monde scientifique. Dès 1942, Robert King Merton propose aux scientifiques de mettre de côté les droits de propriété intellectuelle associés à leurs expériences et publications pour permettre un essor plus important du domaine. En effet, sans ces droits, la vérification des théories scientifiques et leurs diffusions deviendraient, selon lui, plus aisées. C est cette idée que reprend en 1995 une publication du Conseil national de la Recherche aux États-Unis, intitulée De l échange complet et ouvert des données scientifiques. Dans un contexte de crise environnementale au niveau mondial, la collaboration entre les scientifiques de tous les pays est vitale pour que chacun ait à sa disposition de vastes jeux de données, afin d obtenir des résultats précis aussi rapidement que possible. L idée alors mise en avant est le partage complet et ouvert des données, et c est dans ce contexte que l on retrouve pour la première fois le terme Open Data. Plus tard, en 2001, l Open Access Initiative (la déclaration internationale sur le libre accès) vient conforter l ouverture des données scientifiques, notamment en utilisant Internet. Les premiers dépôts d archives ouvertes font leur apparition et rencontrent un vif succès. Les institutions scientifiques remarquent alors les bienfaits de l ouverture de ces données et vont aller jusqu à exiger de leurs chercheurs la publication dans des archives ouvertes. En France, c est notamment le cas pour les chercheurs du CNRS, de l INSERM, du CERN ou de l INRIA. 6 OPEN DATA

Les débuts de l Open Data Les idées développées par les scientifiques ne tardent pas à se transmettre aux développeurs et pionniers de la culture Open Source, avec la création en 2004 de l Open Knowledge Foundation, qui fournit notamment des logiciels pour faciliter la mise à disposition de données de natures variées. L Open Data commence ainsi à prendre son sens moderne, mais il lui manque un aspect très important : la mise à disposition proactive des données par le secteur public, qui est de loin le plus grand producteur potentiel de données. L aspect politique de l Open Data Le dernier obstacle est donc politique : comment encourager les collectivités locales et les gouvernements à ouvrir leurs données? C est pour répondre à cette question qu une trentaine de personnes se réunissent en décembre 2007 à Sebastopol, au nord de San Francisco. On retrouve parmi ces personnes Tim O Reilly, fondateur de la maison d édition éponyme, spécialisée dans les ouvrages sur le numérique - il a par ailleurs défini le terme Web 2.0, largement démocratisé aujourd hui. Lawrence Lessig est lui aussi présent : professeur de droit à l université de Stanford, il a créé les licences Creative Commons, qui sont destinées à faciliter la diffusion libre des œuvres. Pour assurer son retentissement politique, la rencontre sera sponsorisée par les 2 géants du Web de l époque : Google et Yahoo. Au terme de la rencontre, une liste de 8 critères est établie. Elle définit ce qu est une donnée publique ouverte, et le but affiché au terme de la rencontre est de faire adopter cette liste aux candidats à la présidentielle américaine. Mais le nouveau président américain, Barack Obama, fera bien plus. Le jour de son investiture, il signera trois mémorandums, dont deux sur l ouverture des données gouvernementales et la transparence. Il envoie ainsi un signe politique extrêmement fort au niveau mondial. Aujourd hui, l ouverture des données est une des priorités des gouvernements et est évoquée lors des rencontres internationales, telles que le G8. On voit au travers de cet historique que l évolution du mouvement Open Data est très rapide. En moins de 10 ans, il a su s imposer jusqu au niveau politique, et suscite l intérêt d un nombre croissant de gouvernements. 1.1.2. La révolution des données La naissance de l Open Data ne doit rien au hasard, et est complètement liée à Internet et ses mutations. La naissance d Internet et ses évolutions Dès 1990, le monde numérique se développe avec l émergence du Web et l ouverture commerciale du réseau, qui commence petit à petit à révolutionner les usages. L espace virtuel nouvellement formé est considéré par un grand nombre comme un espace de liberté et d ouverture, ce qui permet un essor incroyable. La communauté Open Source se forme alors et promeut entre autres la mise à disposition gratuite des codes sources des logiciels pour en modifier le plus simplement possible le fonctionnement. Dès 2005, une autre révolution se met en marche avec l apparition puis la démocratisation des smartphones : ils marquent l avènement de l Internet mobile. Avec les smartphones naît le concept d application, une nouvelle forme de logiciels qui manipule plus que jamais les données : météo, horaire de bus, e-mails, etc. Les données deviennent les pièces maîtresses de cette nouvelle révolution d Internet, et la simplicité de leur accès devient un besoin majeur. Auparavant couplées à l interface, il devient nécessaire de dissocier les données et d en OPEN DATA 7

permettre un accès standard, simple et stable. La scission entre les interfaces et les données Concrètement, récupérer des données telles que des températures fournies par Météo France, couplées avec une interface aussi simple qu une page web, se ferait en plusieurs étapes pour une application mobile : Tel que le ferait un humain, chargement de la page d accueil de Météo France par l application Compréhension de la structure de la page pour en extraire les données utiles (les températures) Affichage dans l application Cette approche révèle les points faibles des données couplées à une interface : En plus des données utiles (les températures), la page contient un nombre important de données uniquement utiles à l affichage de la page dans un navigateur (ce qui n est pas le but ici), et donc d aucune utilité à l application. Cette grande quantité de données indésirables est d autant plus gênante que le moindre chargement supplémentaire impacte significativement la latence sur l Internet mobile. L accès aux données n est pas simple : les données sont en effet organisées pour faciliter leur affichage, et non leur extraction. Les données renvoyées ne sont absolument pas stables : si Météo France changeait la présentation de son site, la structure de la page pourrait changer et l application serait incapable de trouver les températures recherchées. De nouveaux moyens d accéder aux données Cet exemple plaide en faveur de la dissociation entre données et interface, qui résoudra ces différents problèmes (souvent au travers d A.P.I., portails web où l entité mettant à disposition des données en décrit le contenu, les adresses web d accès, le formalisme, etc.) : Les données sont complètement indépendantes de l interface sur laquelle elles sont affichées : cela permet de construire plusieurs interfaces (application, site web, logiciel sur PC, etc ) à partir des mêmes données. Les données sont mises à disposition dans un format standard et uniformisé (dans la plupart des cas), ce qui facilite à la fois la compréhension de l organisation des données et leur utilisation. L accès aux données est stable : il n y a pas de changements brusques d organisation des données qui rendraient une interface en dépendant inutilisable du jour au lendemain. Cet accès simplifié aux données résulte non seulement de l avènement de l Internet mobile, mais aussi de l interaction entre les différents services. Ainsi, les A.P.I. permettent à un développeur d intégrer des fonctions de partages sur les réseaux sociaux directement dans son application. Ce nouveau moyen d interaction, plus simple pour les utilisateurs, est une des clefs du développement du Web (le Web 2.0 se base sur les principes de l interactivité et de la simplicité) et est donc en pleine effervescence. Tous ces bouleversements conduisent à la fois à l explosion du nombre d A.P.I. mais aussi à un besoin accru en données de plus en plus variées, ce qui explique l intérêt croissant pour les données ouvertes. On voit donc qu Internet est toujours en pleine mutation, et que ses évolutions ont permis la naissance d un besoin en données de plus en plus important. La place occupée par les données est telle qu on utilise maintenant des espaces dédiés (comme les A.P.I.) pour leurs mises à disposition. 8 OPEN DATA

1.1.3. De la donnée publique vers la donnée ouverte Nous allons maintenant nous intéresser à la différence entre les données publiques et les données ouvertes, et nous allons donner une définition beaucoup plus formelle de ces dernières. Différence entre les données publiques et les données ouvertes Bien que les deux termes données publiques et données ouvertes soient souvent confondus, ils ne désignent pas la même chose. Alors que le premier terme désigne toutes les données produites par ou pour l État dans le cadre de l activité du service public ; les données ouvertes, quant à elles, désignent des données issues du secteur public ou privé mises en forme de sorte à en permettre une diffusion et une utilisation massive. De plus, elles doivent être mises à disposition sous une licence libre. Dans une moindre mesure, les données issues du secteur privé peuvent elles aussi devenir des données ouvertes si elles respectent toutes les contraintes inhérentes aux données ouvertes. Concrètement, alors qu il était auparavant nécessaire de faire une demande pour obtenir des données publiques, les données ouvertes sont mises à disposition de tous, sans avoir à en faire la demande, dans un format numérique pouvant permettre un traitement automatisé. En revanche, aucune contrainte n est imposée sur le format, si ce n est qu il doit être ouvert. Par exemple, le format XLS n est pas ouvert : c est un format propriétaire appartenant à Microsoft. En théorie, les données fournies dans un tel format ne peuvent donc pas être considérées comme des données ouvertes, malgré leur utilisation massive par les portails gouvernementaux mettant à disposition des données ouvertes. Définition précise des données ouvertes Le concept de données ouvertes étant récent, il n en existe pas de définition fixe, mais la plupart des acteurs partagent les mêmes idées de base, décrites précédemment. Les définitions varient ensuite en terme de libertés et d ouvertures. La liste des 8 critères établie lors de la rencontre de Sebastopol en 2007 (évoquée précédemment) définit des données ouvertes comme des données : 1. complètes ; 2. primaires (c'est à dire brutes) ; 3. fraîches ; 4. accessibles ; 5. électroniquement lisibles par une machine ; 6. accessibles sans discrimination ; 7. disponibles sous des formats ouverts (dont les spécifications techniques sont publiques et sans restriction d accès); 8. disponibles sous une licence libre ; Pour mieux comprendre cette liste de critères, prenons l exemple d un jeu de données décrivant les rues d une ville, et expliquons les critères dans le même ordre : 1. Le jeu de données doit décrire toutes les rues de la ville, aucune ne doit manquer. Il existe néanmoins des exceptions à ce critère, telles que les données portant atteinte à la vie privée, à la sécurité nationale, etc. 2. La collectivité mettant à disposition ces données ne doit pas présumer de l usage OPEN DATA 9

qui en sera fait et ne doit donc pas les modifier. Par exemple, si les données contiennent un champ qui liste tous les numéros utilisés dans cette rue, il serait inopportun de le modifier en un champ qui contient le nombre total de numéros : on perdrait ainsi l information Est-ce qu il y a discontinuité dans les numéros de cette rue?, ou encore l information Est-ce que cette adresse existe? qui a une utilité évidente dans les applications GPS. 3. Lors de la création d une nouvelle rue par exemple, le jeu de données doit être mis à jour aussi vite que possible. 4. Les données sont accessibles au plus grand nombre, sans restriction d usage. 5. Les données peuvent subir un traitement automatisé par machine. 6. Les données sont accessibles pour n importe qui, du développeur indépendant aux entreprises privées. 7. Les données sont disponibles dans un format libre, sur lequel aucune entité n a le contrôle exclusif. 8. Les données ne sont pas soumises à des licences restreignant leur accessibilité et leurs utilisations, exception faite une fois encore aux données pouvant porter atteinte à la vie privée, à la sécurité nationale, etc. Figure 1 : Ile de France numéro 48 publié en octobre 2013 Plus tard, la Sunlight Foundation, qui avait participé à la rencontre de Sebastopol, rajoutera deux critères : Les données doivent être accessibles de façon pérenne en ligne : une fois la publication d un jeu de données effectuée, il ne doit jamais changer d adresse d accès. De plus, il ne doit pas y avoir de restrictions de temps sur l accessibilité des données. L utilisation des données est gratuite. En revanche, le coût de mise à disposition et de production des données peut être reporté équitablement sur l ensemble de ses utilisateurs. Nous avons désormais pleinement défini le concept de données ouvertes, et nous allons maintenant pouvoir évoquer ses évolutions les plus récentes. 10 OPEN DATA

1.2. LE DEVELOPPEMENT DE L OPEN DATA Depuis la fin de la dernière décennie, on assiste à une multiplication des initiatives Open Data en France et à travers le monde, positionnant maintenant la donnée ouverte comme un nouveau moyen d information. Aussi, intéressons-nous aux contextes politiques et législatifs à l origine de cette impulsion ainsi qu aux collectivités pionnières dont les travaux servent désormais de modèles. 1.2.1. Une politique de développement mondial L ouverture des données représente un mouvement planétaire. Aussi, étudions le cas de quelques pays ayant adopté l Open Data. Les États-Unis, précurseurs En 1966, les États-Unis adoptent une loi sur le libre accès à l information : la Freedom of Information Act. Bien évidemment, il n est pas encore question de publications des données sur le Web à l époque. Il faut ainsi attendre 2007 et la loi OPEN Government Act pour que l Internet devienne le support de l ouverture des données. Cette initiative fait suite à la mise en ligne des données de la ville de Washington, faisant de la capitale américaine la première ville au monde à partager ses données. En mars 2009, le projet data.gov voit le jour, à l initiative du gouvernement Obama, et permet aux citoyens d avoir accès à l ensemble de la base générée par la Maison-Blanche. Ayant positionné l Open Data comme l un des ses grands thèmes de campagne, Barack Obama a su créer une dynamique d ouverture, notamment par la directive du gouvernement ouvert. Dans sa lettre Transparency and Open Government parue en 2009, il définit ce qu il voit comme les 3 piliers de la coopération entre l État et les citoyens : La transparence : rendre l information accessible au public. La participation : donner au citoyen la possibilité de contribuer à l élaboration des politiques. La collaboration : coopérer avec des ONG, des entreprises, des institutions, etc. Aujourd hui l Open Data du gouvernement américain représente plusieurs centaines de milliers de jeux de données et 800 applications (développées conjointement par le gouvernement et les citoyens). Le Royaume-Uni Le principe d ouverture des données publiques rencontre un succès particulier en Grande Bretagne. En juin 2009, le premier ministre Gordon Brown lance un projet similaire à l Open Government américain, sous l impulsion de Tim Berners-Lee, fraîchement nommé conseiller du gouvernement pour les questions d ouverture de données. Le portail data.gov.uk est créé, et publie par exemple toutes les dépenses gouvernementales supérieures à 25 000. Rapidement les premières retombées économiques se font sentir : grâce à l ouverture et le croisement des données publiques, le 10 Downing Street s est ainsi félicité d avoir diminué de 30% la facture de consommation d énergie dans les bâtiments publics en seulement deux mois, simplement par l'analyse de données qui existaient déjà mais qui n'étaient pas utilisées. Cependant, certaines applications du portail gouvernemental font actuellement débat. C est par exemple le cas du site polémique BeenVerified.com indiquant les adresses de délinquants sexuels, et relançant le débat sur l Open Data et la vie privée. Le Canada Le ministre Stockwell Day annonce le 17 mars 2011 le lancement d un projet de portail gouvernemental : data.gc.ca. Suite à cette ouverture, le nombre de données disponibles est OPEN DATA 11

enrichi et le portail réorganisé de façon à améliorer la standardisation des données. En parallèle, deux sites publics voient le jour : GeoGratis, concentrant des données géospatiales, et Data Collections du ministère de l environnement. Autres pays D autres initiatives sont à signaler. Citons par exemple le Kenya qui a mis en ligne sa Kenya Open Data Initiative le 8 juillet 2011, data.gov.it, le portail du gouvernement italien, la plate-forme indienne d accès à des jeux de données publiques lancée en octobre 2012, et bien d autres G8 et Open Data Les 17 et 18 juin 2013, les chefs d États du G8 se sont retrouvés au sommet de Lough Erne en Irlande du Nord afin de signer une charte pour l ouverture des données publiques. Cela marque l ambition de promouvoir une gouvernance plus transparente, en confortant l idée d une donnée publique, gratuite et réutilisable. Selon le communiqué des chefs d État, cette charte contribuera à accroître la quantité de données publiques ouvertes dans les secteurs essentiels de l'action publique, comme la santé, l'environnement ou les transports ; à soutenir le débat démocratique ; et à faire en sorte de faciliter la réutilisation des données publiées.» Ensemble d initiatives isolées il y a quelques années encore, l Open Data tend ainsi désormais à s inscrire dans une démarche globale et transnationale, dont la France compte bien faire partie. 1.2.2. La France et l Open Data L année 1978 correspond, on l a vu avec la loi CADA (Commission d Accès aux Documents Administratifs), aux prémices de l Open Data en France. La même année, la Commission Nationale de l Informatique et des Libertés est créée. On voit dès cette époque la volonté de l État français de poser un cadre juridique sur les questions d accès aux données publiques. Aujourd hui, l action de l État en matière d ouverture des données va de pair avec les démarches d autres collectivités locales qui se sont déjà lancées dans l aventure. Les limites de la loi CADA Vis-à-vis de la définition actuelle de l Open Data, la loi CADA de 1978 présente plusieurs contraintes. Premièrement, toutes les données ne sont pas soumises aux mêmes conditions d accès et de réutilisation. Les données du service public à caractère industriel et commercial (SNCF, RATP, etc.) sont par exemple exclues de droits de réutilisation, même si celles-ci présentent un caractère administratif. Le choix revient alors directement au service concerné. Enfin, l accès aux données en format papier demeure contraignant, notamment pour des populations contadines ou éloignées des centres (préfecture, Hôtel de Région...). La législation doit changer! Les pionniers de l Open Data française C est en 2002, que l ouverture en ligne des données débute (dans le domaine du droit). Le 8 juin 2010, le Conseil municipal de Rennes vote l ouverture du portail data.rennesmetropole.fr, faisant de la capitale bretonne la première ville à ouvrir ses données. La plateforme Rennes Métropole répertorie et propose en accès libre des fichiers de transport, d environnement ainsi que de différents acteurs culturels de la ville. Rennes est suivie de près par Paris qui entre dans la course le 27 janvier 2011 avec son portail Paris Data diffusant 12 OPEN DATA

notamment des données cartographiques. En 2012, les portails Open Data de Versailles (78) et d Issy-les-Moulineaux (92) sont créés. En 2013, c est enfin la Région Île-de-France qui met ses données à disposition (264 jeux de données disponibles en octobre 2013). Le portail data.gouv.fr Le portail national data.gouv.fr est mis en ligne le 5 décembre 2011, faisant ainsi suite à la création du service ministériel Etalab et au décret éponyme du 21 février 2011 qui détaille les conditions de mise en place d une solution Open Data - dans le but de créer un portail unique interministériel des données publiques. Le premier ministre de l époque François Fillon indique alors que cette initiative contribuera donc à renforcer la transparence de l action de l État. Elle ouvrira le champ à une discussion avec les citoyens à qui les institutions - celles de l État, mais aussi celles des collectivités locales - doivent rendre des comptes. Le portail data.gouv.fr comprend 352 285 jeux de données lors de son ouverture en 2011, dont de nombreuses données de recensement de l INSEE, des données ministérielles et des données de développement (indicateurs environnementaux : dureté de l'eau, diversité biologique, sources de pollution). Les licences de réutilisation des données publiques françaises Il n y a aujourd hui pas de standards pour les licences des données. Le ministère de la Justice français a opté pour une licence LIP : Licence Information Publique librement réutilisable, d origine française. Le portail data.gouv.fr utilise majoritairement la Licence Ouverte créée par Etalab. De nombreuses collectivités locales (Paris, Toulouse, Nantes), protègent leurs données par la licence ODbL, ou Open Database License issue de l Open Knowledge Foundation. L ouverture des données aujourd hui Actuellement, près de 50 villes en France partagent leurs données en ligne. La tendance couvre toutes les collectivités territoriales : villes, régions, départements, etc. Mais d une collectivité à l autre, le partage de données, notamment culturelles, reste encore assez faible. 1.2.3. L exploitation des données : la Data visualisation Le terme Open Data fait référence à des données et des chiffres bruts, non interprétés. Au vu de l aspect réutilisation d un jeu de données, et de la dimension grand public de la notion d ouverture des données, n importe quelle personne est censée pouvoir consulter un jeu de données de manière claire et simple. Les collectivités et organismes publics auraient donc un devoir de mise en forme de la donnée. Valoriser la donnée Comment rendre compréhensibles les données publiques ouvertes? Valoriser la donnée, en conservant la dimension pas ou peu d interprétation reste difficile. Il faut mettre en ligne des jeux de données bien documentés, sous des formats ouverts, avec des licences libres et surtout propices à la réutilisation. Ce processus est souvent délégué à une entreprise tierce. Rennes a par exemple choisi de faire confiance à l entreprise Dataveyes pour la réalisation d une application de visualisation des habitants de Rennes Métropole : dataviz.rennesmetropole.fr qui permet à un internaute de prendre connaissance du nombre d habitants de l agglomération ayant son âge, des types de logements par ville, des informations sur l état civil de ses concitoyens (évidemment de manière anonyme). OPEN DATA 13

Pallier l interprétation, est-ce vraiment possible? La Data visualization est nécessairement une interprétation. On peut s en offusquer, mais le même problème persiste dans l information classique (exemple : articles de presse). En outre, si par exemple de nombreux possesseurs de smartphones vont utiliser une application dérivant de l Open Data, peu vont chercher à obtenir directement les données brutes sur le portail de l organisme correspondant. La Data visualization serait donc le cheminement logique de l ouverture des données publiques. L enjeu est donc de trouver un équilibre entre le fond et la forme. Exploiter des données de manière pertinente, un exemple. Figure 2: Atelier sur la démographie rennaise Cantine Numérique Cet exemple est le fruit d un travail réalisé à la Cantine Numérique, aux Champs Libres de Rennes le mardi 17 décembre 2013, et supervisé par Simon Chignard son vice-président. Contexte : On cherchait à exploiter pertinemment des données correspondant aux prénoms et effectifs des garçons nés à Rennes en 2012. Cette étude représente plus de 1400 prénoms, en séparant systématiquement deux prénoms semblables à l orthographe différente. Problématique : Quand il s agit de prénoms de bébés, les résultats d enquêtes mettent généralement en avant les prénoms les plus donnés. Des tops peuvent être réalisés, dans lesquels les prénoms Arthur, Louis ou Lucas vont apparaître à coup sûr! Cependant une étude plus poussée des données a amené aux constats suivants : Les garçons dont les prénoms font partie des 100 prénoms les plus donnés en 2012 à Rennes ne représentent que 50% des garçons nouveau-nés. En prenant les 1000 prénoms les plus donnés, on arrive à 92% Et surtout : 1000 des 1400 prénoms ne sont donnés qu à un unique nouveau-né! 14 OPEN DATA

Comment ainsi représenter les prénoms uniques qui comptent pour 70% du total des prénoms donnés? Solution : Après délibération, il a été décidé d utiliser une fresque longue de 13 mètres et d y tracer un graphique avec en abscisse les 1400 prénoms donnés en 2012 à Rennes et en ordonnée les effectifs par prénom, puis de représenter chaque nouveau-né par une gommette sur la fresque. Une personne, même non avertie, verra d emblée la popularité des prénoms les plus donnés d une part, mais aussi la diversité des prénoms donnés d autre part, et se rendra compte ainsi qu il est plus rare de donner un prénom commun à ses enfants que de leur donner un prénom rare (proposition évidemment fausse si l on parle en effectif). 1.3. DES CONTRAINTES A SURMONTER Alors que l Open Data est en pleine effervescence à travers le monde, le mouvement montre ses limites, qui peuvent prendre plusieurs formes : techniques, économiques et politiques. Dans ces prochaines parties, nous allons recenser aussi exhaustivement que possible les freins à l ouverture des données. 1.3.1. Des barrières techniques Au fur et à mesure de l ouverture des données, certaines barrières techniques deviennent de plus en plus criantes. Quelles sont-elles et quelles réponses peuvent être apportées? La mise en évidence des limites techniques De plus en plus d États et de collectivités locales sont en train de publier leurs données de manière ouverte. Les motivations sont variées : volonté de transparence, volonté démocratique, stratégie économique, et même obligation réglementaire. En effet, les communes de plus de 3.500 habitants vont prochainement être contraintes, par la loi, à l ouverture des jeux de données à fort potentiel de réutilisation. C est ainsi que les données qui portent sur des services tels que les transports publics, la gestion des déchets, le service des eaux et le budget vont être libérées. Du fait de cette ouverture de données à grande échelle, certaines limites techniques ont été mises au jour. Les barrières techniques et les réponses possibles En reprenant le contexte de l ouverture des données dans les communes de plus de 3.500 habitants, on peut citer : Environ 2.800 communes comptent plus de 3.500 habitants, soit autant de points d accès différents pour les données publiées. Concrètement, si un développeur a besoin de croiser des données mises à jour en temps réel au niveau national, il devra interroger l ensemble de ces 2.800 communes et donc simultanément l ensemble de leurs portails de données. Devoir interroger autant de points d accès différents est, en plus d être fastidieux à mettre en place, une limite technique : les smartphones, y compris les modèles les plus récents, ne sont pas suffisamment puissants pour gérer autant d interrogations en parallèle. Si la puissance n était plus une limite, il resterait néanmoins un autre obstacle : les réseaux mobiles ne peuvent pas supporter une charge aussi importante. Il existe néanmoins des solutions pour contourner cette limite : le développeur pourrait mettre en place un serveur relais entre son application et les 2.800 points d accès, qui effectuerait les interrogations à la place du smartphone. Le défaut OPEN DATA 15

rédhibitoire d une telle solution serait son coût, insoutenable pour un développeur indépendant et donc incompatible avec la philosophie des données ouvertes. Une autre solution, plus favorable, pourrait être la mutualisation des portails de données. Au lieu d avoir un portail par commune, elles pourraient toutes alimenter un seul et même portail. Les formats des données de chacun des producteurs peuvent être différents pour un même jeu de données (on retrouve indifféremment sur les portails de données les formats XML, JSON, XLS, XLSX, CSV, etc.), et certaines conversions sont impossibles à mener de manière automatique (passage de JSON vers XLS, par exemple). Une conséquence de ce manque d uniformisation des formats est l impossibilité de faire des croisements entre les jeux de données : par exemple, il serait impossible de fusionner simplement les données de transport de deux villes ayant adopté deux formats différents. Il serait possible de résoudre ce problème, au moins au niveau national, en forçant au niveau législatif la publication des données dans un certain format. Mais cela ne résoudrait pas le problème au niveau international et cette solution ne serait sans doute pas acceptée par les partisans des données ouvertes, car elle serait restrictive (imposer un format serait en effet une contrainte non prévue dans la définition des données ouvertes). Pour un même jeu de données, deux producteurs différents choisiront de les modéliser différemment. Ainsi, pour un jeu de données recensant les habitations d une commune, l un choisira de regrouper le numéro et le nom de la rue dans un même champ, tandis que l autre créera deux champs distincts. Il existe une solution répandue à ce problème : de plus en plus de standards et spécifications pour la modélisation des données apparaissent, tels que ceux utilisés en informatique pour les formats de fichier (MP4 par exemple), les technologies Web (CSS, HTML), etc. Bien que la solution semble idéale, elle a ses propres limites : refus d utiliser le standard par certaines entités (pour des raisons économiques ou politiques, dans le cas où l entité ayant rédigé le standard est un concurrent par exemple), mauvaise utilisation de la spécification et d autres encore. Mais elle a aussi le mérite de répondre à la limite technique précédente, puisque le format serait lui aussi imposé par le standard. Difficulté de publication pour les plus petites communes, du fait du manque de compétences techniques et/ou de main d œuvre. Piètre qualité de certains jeux de données (par exemple, erreurs dans les données fournies) Coordonner les acteurs pour répondre à ces limites Certaines villes précurseurs du mouvement Open Data en France ont travaillé sur ces problèmes, et se sont regroupées pour créer une association. Ainsi, l association Open Data France accompagnera les communes dans la transition vers les données ouvertes, travaillera à la normalisation des formats, de la modélisation des données et réfléchira au meilleur moyen d accéder à l ensemble des données mises à disposition de manière centralisée (sans interroger 2.800 points d accès différents) ainsi qu à leurs réutilisations. L association travaillera main dans la main avec le secrétariat général pour la modernisation de l'action publique, la Commission Nationale de l'informatique et des Libertés, le Centre national de la recherche scientifique ou encore l'adullact (Association des Développeurs et Utilisateurs de Logiciels Libres pour les Administrations et les Collectivités Territoriales) pour mettre en œuvre le fruit de ses réflexions. On peut donc constater qu il existe d ores et déjà des solutions pour la plupart des limites techniques. En revanche, pour qu elles puissent fonctionner, elles doivent être adoptées 16 OPEN DATA

par l ensemble des acteurs : il faudra donc une action politique forte pour arriver à un tel consensus. 1.3.2. Des limites économiques Aujourd hui, l un des facteurs les plus limitants de l'ouverture des données est l aspect économique. Cette crainte est-elle bien justifiée? Les données, une source de revenus pour l'état Jusqu'alors, l'état pouvait vendre certaines données, ce qui deviendrait impossible avec l Open Data. C est par exemple le cas des données géographiques (IGN), des données météorologiques (Météo-France), des données sur les cartes grises - même si ces dernières ne sont pas en lien direct avec l Open Data (puisque ces données sont nominatives, et par conséquent trop personnelles pour être éligibles à la démarche Open Data). La vente de telles données risque d être réformée. En effet, l ouverture des données fera tôt ou tard l objet d une loi pour être encadrée, et les principes tels que la mise à disposition gratuite des données devront y être inscrits, ce qui pourrait toucher, dans un effort d harmonisation des démarches, la revente de données sur les cartes grises. On retrouve un autre exemple concret de ce risque pour les sociétés privées de transport urbain. En France, Keolis, filiale de la SNCF, produit et valorise des données de transport pour les revendre entre autres aux agglomérations. Ouvrir ses données : une démarche citoyenne plutôt que lucrative pour le producteur Le modèle économique de Keolis est très stable, mais la division de Rennes a pourtant décidé d ouvrir ses données dès 2010 : toutes les données de transport ont dès lors été mises en ligne, sans que l entreprise puisse en contrôler l utilisation ; ce qui aurait potentiellement pu être un risque économique. Au final, pour Keolis Rennes, la démarche n aura pas été bénéfique économiquement, mais elle profite largement aux usagers des transports en commun de la ville : les nombreuses applications développées ont permis d améliorer significativement le confort du voyageur, et plus particulièrement celui des personnes à mobilité réduite, qui ne bénéficient pas toujours d informations très détaillées, du fait des maigres moyens alloués à ces problématiques. L ouverture des données a permis le développement d applications mobiles beaucoup plus adaptées à ces personnes, sans que Keolis Rennes n ait à dépenser d argent. Des conséquences économiques encore très floues La question de la profitabilité de l Open Data fait l objet d un vaste débat. Comme toute question économique, il n existe aucune réponse simple et claire, mais beaucoup d études, souvent contradictoires, nous donnent quelques pistes de réflexion : L ouverture de données ne profite pas à l entité qui les produit, du moins, pas directement. C est une conséquence évidente de la mise à disposition gratuite de ces données. En revanche, elle peut profiter aux réutilisateurs des données : vente d applications, vente d espaces publicitaires sur ces applications, revente de données après valorisation, etc. Malgré tout, ces retombées économiques positives sont à nuancer : la grande majorité des applications sont très peu voire pas du tout utilisées, rendant dans ce cas les retombées anecdotiques pour le ou les développeurs. Dans d autres cas, plus rares, l application peut au contraire être très utilisée : c est une opportunité pour la création d entreprises, souvent sous forme de start-up, et donc d emplois. L Open Data peut être profitable d une manière beaucoup plus indirecte, ce qui rend ses retombées économiques extrêmement difficiles à calculer. Par exemple, OPEN DATA 17

une application de transport améliore le quotidien d un voyageur : les horaires et alertes en temps réel permettent des gains de temps et moins de stress (et donc moins de maladies), ce qui peut générer des retombées économiques intéressantes à grande échelle. De la même manière, un jeu de données sur des adresses postales croisé avec un jeu de données sur le trafic automobile permet la création d applications GPS intelligentes, qui peuvent avoir des bénéfices sur les temps de trajets de l utilisateur ou sur sa consommation de carburant, qui peuvent eux-mêmes avoir un effet économique positif pour l État. En bref, les effets économiques de l Open Data sont pour le moment assez méconnus. Il semble que peu d applications pratiques issues de l Open Data se soient aujourd hui frayées un chemin parmi le grand public, en comparaison avec le nombre de jeux de données déjà libérées. On pourrait donc penser que les perspectives économiques de l Open Data sont pour l instant moroses, mais le secteur espère un boom économique du fait de l intérêt croissant de la part des gouvernements. Les limites économiques de l Open Data peuvent aussi prendre une autre forme : les données sont, par définition, mises à disposition de tous, sans discrimination. Elles sont donc également accessibles par les entreprises étrangères, et on pourrait craindre une mainmise de ces dernières sur les données de la France. Cela serait bien entendu néfaste au niveau économique, et nous amène à des problématiques politiques : ira-t-on vers un protectionnisme des données? Il est donc pour le moment difficile d estimer les conséquences économiques de l Open Data. Il semble pourtant que les efforts déployés pour étoffer les jeux de données sont beaucoup plus importants que le nombre d applications pratiques issues de la libération des données, ce qui pourrait être un signe décourageant. Mais le mouvement n en est qu à ses débuts, et la donne pourrait très vite changer. 1.3.3. Des oppositions politiques Outre les limites techniques et économiques de l Open Data, le mouvement souffre aussi de craintes d'ordre politique et juridique, comme les problèmes concernant la vie privée. L Open Data à l ère de la mondialisation Premièrement, il existe des problèmes liés à la concurrence : bien que l Open Data vise à être accessible par tous, et cultive la philosophie que n importe qui, doté d un ordinateur, puisse créer une application pratique innovante, le traitement des données nécessite parfois du matériel coûteux et non accessible. Pour croiser un nombre important de données ou en traiter un volume considérable, un développeur indépendant sera pénalisé par rapport à une entreprise, et l aspect inventif pourrait s en trouver bridé. On remarque donc un déséquilibre entre les deux entités. Ces moyens importants dont les entreprises disposent sont à l origine d autres inquiétudes : celles liées à une mainmise des entreprises étrangères sur les données et l utilisation qui en est faite. Ces entreprises étrangères profiteraient alors à moindre coût des données, sans que les retombées économiques ne soient en faveur du pays les produisant. Cette mainmise pourrait aussi conduire à un monopole dangereux : la maîtrise des données peut mener à des abus, liés à une utilisation malveillante. Il n est d ailleurs pas forcément nécessaire de disposer de beaucoup de moyens pour rencontrer cette problématique. Par exemple, sur des données démographiques mises à disposition par Rennes Métropole, et en sélectionnant méticuleusement certains critères (familles nombreuses, chômage, aides à l accès au logement), il est possible de détecter des zones défavorisées : une utilisation peu scrupuleuse de ces informations serait alors possible 18 OPEN DATA

(par exemple, par les agences immobilières, les banques ou les assurances), mais c est aussi un moyen efficace pour cibler les aides pour l État. Open Data et respect de la vie privée La volonté d ouvrir ses données est motivée par plusieurs raisons, dont la transparence. D un côté, la transparence est très positive : le citoyen peut avoir un droit de regard sur les décisions qui sont prises en son nom, sur l utilisation qui est faite de l argent public, et ainsi lui permet de participer plus activement à l action publique. D un autre côté, un excès de transparence peut avoir des désavantages : par exemple, l ouverture des données concernant le patrimoine des personnalités politiques violerait délibérément leur vie privée. Les risques concernant la vie privée sont d ailleurs une des préoccupations majeures liées à l ouverture des données. La frontière entre ce qui appartient à la vie privée et ce qui n y appartient pas est parfois floue : ainsi, il est impossible d ouvrir des données concernant des trajets en transports en commun ; mais il est possible d ouvrir des données démographiques accompagnées de nombreux critères sociaux, économiques, etc. Grâce à une liste réduite de critères, il serait possible de retrouver le lieu d habitation d une personne et d en déduire d autres critères, ce qui représente un danger pour la vie privée. Le croisement de jeux de données, qui, pris à part, paraissent inoffensifs, peut lui aussi constituer une atteinte à la vie privée. La question des données personnelles est donc complexe, car ce sont à la fois les données les plus sensibles, celles dont une utilisation malveillante serait la plus dommageable, mais aussi les plus prometteuses en terme d innovation. Par exemple, la libération des données de santé nominatives permettrait de prédire les risques de maladies et mieux cibler les dépistages, ce qui serait bénéfique tant à l État qu au patient, mais permettrait aussi à notre voisin de tout savoir sur notre état de santé, ce qui est inacceptable. Il faut donc trouver un compromis entre ces deux extrêmes, en s écartant probablement de la première définition des données ouvertes, en imposant par exemple un contrôle sur l accès aux données. L Open Data suscite donc des oppositions politiques : le sujet des données devient de plus en plus sensible, et l ouverture des données de l État pourrait enrichir les jeux de données des entreprises étrangères. Ces différentes oppositions engendrent des réflexions: doit-on s écarter de la définition stricte des données ouvertes, en restreignant par exemple leurs accès? OPEN DATA 19

2. LES ACTEURS DE L OPEN DATA 2.1. LA PRODUCTION : QUI PRODUIT ET QUOI? Nous allons maintenant nous intéresser aux différents producteurs de données publiques ouvertes et aux types de données concernées. Les principaux acteurs de l Open Data sont les organismes publics et les collectivités territoriales, mais aussi les entreprises privées. Le cas de ces dernières est légèrement différent (car elles ne sont pas soumises à la législation) : quand une entreprise décide d ouvrir des données, il faut d abord qu elle choisisse le type de données qui pourra être intéressant pour le réutilisateur. Transversalement à ces différents organismes, une règle d or perdure : une donnée publique ne peut remettre en cause la vie privée. 2.1.1. Les organismes publics L Open Data concerne les musées et la culture en général. Sur le site du gouvernement (data.gouv.fr), nous pouvons par exemple accéder aux expositions du musée d Orsay. Rennes est aussi prête à ouvrir les données de différents musées, bibliothèques et même festivals. En effet, sur le site de Rennes Métropole (www.data.rennes-metropole.fr), nous avons désormais accès à toutes les données des Champs Libres, du musée des Beaux-Arts, de l Antipode et des Transmusicales. L Open Data révolutionne aussi le milieu bibliothécaire, en permettant l apparition de nouveaux services, et un accès simplifié aux catalogues d ouvrages. Par exemple, l application Book it permet de trouver un livre dans une bibliothèque avec la disponibilité en temps réel. Le processus d ouverture des données publiques est en marche. De nouvelles initiatives voient le jour au quotidien, même dans les plus hautes institutions. L Elysée voudrait ainsi ouvrir de nouvelles données (comme les activités du président, le nombre de visites du site Elysée.fr) pour soutenir l effort d ouverture des données. Mais avant de pouvoir ouvrir ce type de données, il faut faire attention à la dimension juridique. Même si les institutions semblent soutenir le mouvement, le Ministère de la santé est réticent quant à l idée d ouvrir les données de la Caisse Nationale d Assurance Maladie Travailleurs Salariés au grand public. Les données qui intéressent le plus les clients sont celles concernant les feuilles de soins électroniques. Ne pas ouvrir ce type de données a des impacts autant sur le plan financier que sur le plan humain. Le coût financier s élève à quelques milliards d euros et environ 6000 décès par an sont dus aux prescriptions injustifiées. Cela fait quinze ans que les données de santé sont utilisées uniquement par l administration. Le ministère commence à envisager une éventuelle ouverture d une partie de ses données tout en respectant le secret médical et l anonymat. Cela ne concerne qu une minorité des données, et ce ne sont pas forcément des données qui pourront être utilisées par la suite. On pourrait se demander pourquoi la CNAMTS refuse l accès à ces données. L organisme de santé essaie d avancer des arguments comme la violation de l anonymat et le mauvais usage de ces données, mais ces raisons ne semblent pas valables aux yeux des 20 OPEN DATA