Ouverture des données (Open Data) François Bancilhon Data Publica twitter.com/fbancilhon www.data-publica.com



Documents pareils
Open Data. François Bancilhon twitter.com/fbancilhon Printemps de la recherche EDF R&D 28/9/12

Regards Citoyens L'Open Data par et pour les citoyens

Open data : les données libérées doivent-elles être gratuites?

Open Data. Enjeux et perspectives dans les télécommunications

Diffusion AFRISTAT. Quels droits accorder aux utilisateurs? - sur les données - sur les documents numériques

Royaume-Uni data.gov.uk, l ouverture des données publiques au Royaume-Uni

La géomatique en Nouvelle-Calédonie usages professionnels et potentiels économiques

Open Data & informations publiques : les principaux aspects juridiques

La feuille de route du Gouvernement en matière d ouverture et de partage des données publiques

De l OpenData aux citoyens : potentiel et limites des plateformes collaboratives

Conseil de développement durable (C2D) Plénière d ouverture 17 décembre 2014

Du web de documents au web de données : la révolution juridique inachevée de l Open Data

Le Cloud Computing : un «Open Source killer»?

Technologies de la Recherche et standards du Web: Quel impact sur l Innovation?

SERDALAB - INFORMATION NUMERIQUE B2B - SOMMAIRE

De l'open source à l'open cloud

Portail d informations et de données de marchés publics ou la commande publique augmentée

MINISTERE DE LA CULTURE ET DE LA COMMUNICATION SECRETARIAT GENERAL

[Open] [Big] Data [as a Service] [Re]définir les services publics digitaux

L importance des choix juridiques pour la médiation dans l environnement numérique

RESULTATS ANNUELS 2011

Big Data: les enjeux juridiques

Cloud Computing. Veille Technologique

Sommaire. -1-Computer en bref. Web en bref. Le web 3.0,...la mobilité. Evolution du Web web1.0, web2.0, web2.b, web3.0...

OPEN DATA L OUVERTURE DES DONNEES H YUKCHAN KWON G UILLAUME ROY O ANA-ALINA SUCIU M AXIME THEBAULT. 3 ème année Département INFO

La propriété des données dans les programmes de science participative : état des lieux des pratiques et du droit

GIP E BOURGOGNE CONSULTATION LICENCES DE REUTILISATION OPEN DATA

Données numériques, données ouvertes

GUIDE PRATIQUE DE L'OUVERTURE DES DONNEES PUBLIQUES TERRITORIALES

Système d Information Géographique (SIG) : quels apports dans les métiers de l assurance?

BUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise

Open Data : quels enjeux et opportunités pour l entreprise?

Constituer des profils d'experts scientifiques, de centres de recherche et d entreprises innovantes

OBSERVATOIRE DE L OPEN DATA ET DE LA CONCERTATION SYNTHÈSE DES TRAVAUX

Annales des sujets proposés aux candidats lors des examens organisés par le Centre de Gestion du Bas-Rhin

Cartographie libre du monde OpenStreetMap

Open-cloud, où en est-on?

Quand l'open Data profite à OpenStreetMap, quand OpenStreetMap profite aux citoyens et entreprises. Julien Fastré

Que faire des data? 04/06/2015

Les enjeux de l internationalisation e-commerce. Table ronde d expert

Rapport de résultats : Consultation Open data et données personnelles

FORUM CETO 2012 SOCIAL MEDIA & TOUR-OPERATING. Anne-Servane LASSERRE Marketing Director contact@milky.fr

Guide d Intégration PPM et ERP:

Dynamiser l innovation tout en réduisant son coût

Contrats et immatériel

SpringerLink La Connaissance est importante. Choisissez SpringerLink.

Les datas = le fuel du 21ième sicècle

Business Intelligence, Etat de l art et perspectives. ICAM JP Gouigoux 10/2012

Innovative BI with SAP Jean-Michel JURBERT D. de Marché BI, HANA, BIG DATA _ SAP France

Indexmed : Le big data en écologie? Pas encore disent certains. Pas si sûr! Avec IndexMed. Relevons ce challenge!

Internet of big data things

Formats de fichiers adaptés à l'archivage électronique à moyen et long terme

Gestion Mobile avec Afaria 7. Jérôme Lorido blue-infinity Mai 2013

Cloud Computing. 19 Octobre 2010 JC TAGGER

WEBSPHERE & RATIONAL. Jacques Rage

Comment valoriser votre patrimoine de données?

La démarche SOA et l interopérabilité applicative

«Le Web participatif et les contenus créés par les utilisateurs : Web 2.0, wikis et réseaux sociaux»

Stratégies opérationnelles d APPS-CRM pour smartphones et tablettes

OPEN DATA : CHALLENGES ET PERSPECTIVES D ENTREPOSAGE

La carte d'achat dans les organisations françaises

FRANCE SITSI Etude des TJM de prestations de services informatiques 2014

Smart Cities :! concept marketing, produit technologique ou enjeu citoyen?

David BEDOUET, WebSchool Orleans. Cosmina TRIFAN, WebSchool Orleans

Thales Services, des systèmes d information plus sûrs, plus intelligents

Open Access By IOP Publishing. Sarah QUIN Senior Publisher

Le logiciel libre. Jeudi 19 janvier Rémi Boulle Sébastien Dinot

Un business model d éditeur open source

«Innovation Intelligence» La valorisation des données massives au service des partenariats R&D. Expernova Université d été GFII

OPENSTREETMAP CRÉE DES DONNÉES LIBRES

Une organisation internationale au cœur des enjeux de contenus et d accès à l information scientifique: L IFLA

Cloud computing Architectures, services et risques

Lignes directrices relatives à l instauration de redevances de réutilisation des informations publiques dans des circonstances particulières

Licence ODbL (Open Database Licence) - IdéesLibres.org

Evolution des SI à l heure du Cloud

L expertise développée par Market-IP et ses solutions télématiques vous permettront d atteindre

La sécurité des données

Conseil opérationnel en organisation, processus & système d Information. «Valorisation, Protection et Innovation de votre Patrimoine Numérique»

Le nouveau marketing urbain à l heure du numérique

Cloud Compting et Pays en Développement (PeD)

COMMUNIQUÉ DE PRESSE. Sèvres, le 28 avril 2015

Les creative commons. Journée d information organisée par l ADBS le 17 décembre Julie TOMAS, Juriste TIC AEC, agence des initiatives numériques

Estimated SMB instances PC (Physical and Virtual) 125,000 Total instances: SMB 1-24 PC. 392,000 Total instances: SMB PC

Mercredi 05/10/2011. Forges logicielles. Olivier Berger, Telecom SudParis. Introduction Avant-propos À propos de COCLICO. Panorama des forges

Veille Marketing. Le radar de votre entreprise

Présentation du programme Open Law Europa

Méthode d Évaluation des Coûts liés à l Open Source (ECOS)

Pour un web accessible Convaincre tous les acteurs du web Jean-Marc Bassin Paris Web 14 novembre 2008

CREATION INNOVATION EDUCATION

Les données massives de Copernicus : vers un nouveau paradigme. Hervé Jeanjean Cnes

Linked Open Data. Le Web de données Réseau, usages, perspectives. Eric Charton. Eric Charton

CMS et logiciels libres : initiation 01 CONTENT MANAGEMENT SYSTEM / SYSTÈME DE GESTION DE CONTENU

données à caractère personnel (ci-après LVP), en particulier l'article 29 ;

Document d accompagnement pour le référentiel national du C2i niveau 2 Métiers de l environnement et de l aménagement durables

Système de gestion de contenu

Ad-exchanges & RTB (avec la participation de Fabien Magalon, La place

Quels progrès dans le développement des composants icargo?

«TRANSITIONS» PRENDRE LE TEMPS D ANTICIPER ENSEMBLE UN CYCLE CONTINU DE PROSPECTIVE CRÉATIVE

Transcription:

Ouverture des données (Open Data) François Bancilhon Data Publica twitter.com/fbancilhon www.data-publica.com

Plan Principes et périmètre Histoire et géographie Légal et financier Acteurs & marché Data Publica Applis et journalisme des données

PRINCIPES ET PÉRIMETRE

Ouverture des données, «open data» Mise à disposition des données publiques pour accès et réutilisation par les citoyens et les entreprises Type Transport, cartographie, entreprises, statistiques, géographie, sociologie, écologie, environnement, économie, juridique, etc. Format Chiffres et lettres (données structurées ou non) xls, csv, xml, pdf, etc. 6

Restrictions Secret d'état ou défense Protection de la vie privée CNIL, anonymisation de fichiers Droit d'auteur Données culturelles (photos, œuvre d'art, copyright, etc.) Exception culturelle laquelle s'applique notamment aux données d'archives 7

Ouverture des données : Motivations Produites avec l'argent des contribuables, elles appartiennent au contribuable Accessibles au citoyen pour des raisons de transparence (egov) De grande valeur, l'état devrait les monétiser Carburant de la création d'applications innovantes et du développement d'un écosystème Peuvent servir à simplifier/améliorer la vie des citoyens 8

Les 10 principes de la Sunlight Foundation Complètes Sans discrimination Primaires Standards ouverts Fraiches Licence Accès physique et électronique Lisible par une machine Permanentes Sans coût

Caveat : le mieux est l'ennemi du bien Les raisons de ne pas ouvrir ses données sont nombreuses L'une est «le travail nécessaire à faire sur les données avant de les ouvrir» C'est un mauvais argument : Ouvrez ce que vous avez Si c'est bon pour vous, c'est bon pour moi

Sérendipité L'ouverture des données permet dans de nombreux cas d'externaliser des travaux de l'éditeur public vers l'écosystème Qualité des données, intégration des données, notation des données, formatage des données Exemple : les arrêts de bus britanniques Un nouvel argument pour faire de la donnée brute

Les 1001 raisons de ne pas ouvrir ses données Elles contiennent des données personnelles C'est nouveau, je ne l'ai jamais fait Je suis légalement responsable Les problèmes légaux sont peu clairs On peut en faire mauvais usage On peut en faire mauvaise interprétation C'est cher C'est du travail Je ne suis pas prêt La DSI est déjà surchargée Mes données sont en mauvais état Je suis en train de réfléchir Je veux traiter le problème dans son ensemble

HISTOIRE/GÉOGRAPHIE

L'ouverture des données 2009 2010

Ouverture des données : un mouvement mondial États Unis : initiative data.gov de l'administration Obama (2009) Royaume Uni : initiative data.gov.uk (2010) Union Européenne : directive européenne sur la réutilisation des données publiques (2003) Nombreux pays : France, Finlande, Australie, Nouvelle Zélande, Irlande du Nord, etc. 15

US : data.gov 5 mars 2009, Vivek Kundra, DSI fédéral, met en place le programme data.gov 8 décembre 2009 publie la «directive de gouvernement ouvert» Établit les principes du gouvernement ouvert et de l'initiative data.gov Transparence, participation, collaboration Fournit un agenda agressif Chaque ministère à 45 jours pour publier au moins 3 jeux de données de «grand intérêt» qui n'était pas disponible auparavant 3 décembre 2009 publie le concept opérationnel de data.gov

Royaume Uni : data.gov.uk Mis en place sous Gordon Brown Rattaché au Cabinet Office Mis sous le parrainage de Tim Berners-Lee Forte tendance «Web Sémantique» Repris par David Cameron De la transparence à l'efficacité Force chaque administration à publier toute dépense >25K (et les contrats associés)

Europe Directive 2003/98/EC, 17 novembre 2003 sur la réutilisation des informations publiques Directive INSPIRE, 14 mars 2007 EPSI Platform, information sur PSI (Public Sector Infomation) Projet LOD2 (Linked Open Data), projet FP7, Septembre 2010, 4 ans Share-PSI (ETSI & W3C) Digital Agenda (juin 2011)

France 1978 : loi CADA 2003 : directive européenne 2005 : loi CADA révisée, complétée et mise en conformité avec la directive européenne 2007 : APIE 2010 : LIP 2011 : Etalab

LÉGAL ET FINANCIER

Licences Un domaine contrôlé par les anglo-saxons Problème de complexité Perplexité des collectivités locales Problème d'interopérabilité entre les licences

Licences Conditions par défaut de l'apie Licence d'information Publique (LIP) Creative Commons (CC), eg Wikipedia CC-by-sa, eg New Zealand, CC-by Future licence d'etalab Open Database Licence (ODbL), eg OpenStreetMap Tout droit de réutilisation, gratuit Licence virale (des travaux dérivés doivent avoir la même licence, impossible de construire une base de données avec des licences incompatibles) Notion de Base de données dérivée ou de base de données collective 22

Gratuit ou payant? APIE pousse au paiement e.g. base de données de prix des carburants Le paiement est une spécificité française Les administrations ont du payant (cher) et du gratuit e.g. IGN, DILA, INSEE, etc. Les industriels (établis) ne sont pas très fanas du gratuit

Payant à quel prix? Le «coût de mise à disposition» Une fonction du chiffre d'affaires généré par le ré-utilisateur Une fonction de la valeur Évolution e.g. IGN et DILA

La circulaire Fillon Circulaire du 27 mai 2011 Le principe de base est la gratuité Le paiement doit être justifié, une liste des jeux de données payantes sera constituée, date limite juillet 2012. La liste sera agréée par le COEPIA Ce qui ne sera pas sur la liste sera gratuit

ACTEURS

Acteurs en France État Éditeurs, APIE, Etalab Collectivités territoriales Rennes, Paris, Nantes, Marseille, Montpellier, etc. Industriels GFII (Groupement Français des Industries de l'information) Presse Militants

Éditeurs publics INSEE (Institut National de la Statistique et des Etudes Economiques), budget 418 M DILA (Direction des Informations Légales et Administratives), budget 200M JO, BOAMP, BODAC, Legifrance, BALO, etc. IGN (Institut Géographique National), budget 220M Ministère Écologie INRIA

APIE Agence pour le Patrimoine Immatériel de l'etat Patrimoine immatériel Brevets, Marques, Œuvres d'art, Données, etc. «Optimiser l impact de la gestion du patrimoine immatériel sur l économie ; Tirer parti d une meilleure valorisation des actifs pour moderniser les services publics, soutenir la conduite des politiques publiques au profit des usagers et contribuer au désendettement ; Prémunir l État et les usagers contre d éventuels risques de détournement.»

Etalab Recommandation du rapport Riester Mission créée auprès du premier ministre en février 2011 En charge de mettre en place data.gouv.fr Appel d'offre émis en mai 2011, sous administration de la DILA Objectif de mettre en place un annuaire des données publiques avant la fin 2011

Collectivités territoriales 31

Militants FING Fondation Internet Nouvelle Génération LiberTIC Nantes Fondapol Regards Citoyens NosDéputés.fr, NosDonnees.fr

Acteurs internationaux Organization Type Location # DS Business model Started Investors Aggdata DataMarket Company Company US Iceland 600 1 300 sells marketing data subscription to a platform with tools and data 2006 2010 Infochimps Company US 5 000 resells data (50% commission) 2010 DataMarketPlace Company US 30 market place for data buyers and sellers 2009 Y combinator Factual Company US subscription to a platform with tools and data 2007 Andreesen-Horowitz etc. Pachube Company US Subscription connects apps to censors around the world 2008 StrikeIron Company US web services to provide access to data and implement apps 2003 Vcs Swivel Company US platform to share and work on data (visualization) 2006 Timetric Company UK 12 tools and data for statistics 2007 CKAN Foundation World 1 369 crowdsourcing community Data.gov Data.gov.uk Amazon WS-PDS Gov site Gov site Project US UK US 275 000 3 900 34 official US Federal Govt site official UK govt site work place Google Public Data Explorer Project US 22 provides good graphical visualization tools ManyEyes Microsoft Datamarket Project Project US US 4 400 10 IBM visualization r&d project data integration tools from the Azure platform

MARCHÉ

Marché des données électroniques en France 1,6 Milliard d'euros annuel Environ 60% vient des données publiques 170 acteurs 9 verticaux 2 horizontaux (veille et traitement de contenu)

Les 9 verticaux Vertical Exemple Taille (M ) Financier Reuters 300 Presse Press Index 250 Juridique Francis Lefebvre 240 Solvabilité Altarès 160 STM Meteo France 160 Image Sipa 60 Economique Société.com 55 Marketing Acxiom 55 Brevets Reuters 25

Les trois étages RECUEIL DES DONNEES TRAITEMENT DES DONNEES ANALYSE DES DONNEES

Data Publica CATALOGUE DES DONNEES ET MOTEUR DE RECHERCHE SUPERMARCHE DES DONNEES JEU DE DONNEES SUR MESURE L'ACTU DES DONNEES

CHERCHER Data Publica ACHETER CATALOGUE DES DONNEES ET MOTEUR DE RECHERCHE SUPERMARCHE DES DONNEES COMMANDER JEU DE DONNEES SUR MESURE L'ACTU DES DONNEES S'INFORMER

LES APPLICATIONS BASÉES SUR LES DONNÉES OUVERTES

Applications mobiles Transport (collectif et individuel) Tourisme Culture et événements Commerce Au concours Mobilife 2011, sur les 12 finalistes, 7 avaient besoin de données publiques et des difficultés pour les trouver

La vue à plus long terme Observer Les bouchons de décembre 2010 sur la A86 La hausse de mortalité pendant la canicule de 2003 Mesurer La taille des Françaises Prévoir Les ventes par point de vente Le nombre de médecins L'influence de la météo sur les ventes

JOURNALISME DES DONNÉES

Journalisme des données (Data Journalism) Publier des articles à partir de données publiques Identification des données, croisement, extraction d'information, visualisation (graphiques) Un sujet très tendance L'avenir de la presse? Tim Berners-Lee : «The Press will have to become Data savvy»

Journalisme des données (Data Journalism) La presse comme intermédiaire entre les éditeurs de données et l grand public France OWNI, Dataveyes, Le Monde Magazine, Streetpress, DataNews, Monde Freakonomics The Guardian (Simon Rogers)

Conclusion Un mouvement général, mondial et puissant De nombreux acteurs concernés : entreprises, organismes publics, citoyens, presse, chercheurs, etc. Plusieurs dimensions Technique, sociale & politique, économique Nous ne sommes qu'au début

Ouverture des données (Open Data) François Bancilhon Data Publica twitter.com/fbancilhon www.data-publica.com