Open Data. François Bancilhon twitter.com/fbancilhon www.data-publica.com. Printemps de la recherche EDF R&D 28/9/12



Documents pareils
Conseil de développement durable (C2D) Plénière d ouverture 17 décembre 2014

Open Data. Enjeux et perspectives dans les télécommunications

OFFRE MDB Service & Architecture Technique. MyDataBall Saas (Software as a Service) MyDataBall On Premise

20 ans du Master SIAD de Toulouse - BigData par l exemple - Julien DULOUT - 22 mars ans du SIAD -"Big Data par l'exemple" -Julien DULOUT

BIG DATA : comment étendre et gérer la connaissance client? François Nguyen SFR Directeur SI décisionnel & Mkt relationnel GP

«Innovation Intelligence» La valorisation des données massives au service des partenariats R&D. Expernova Université d été GFII

BIG DATA et DONNéES SEO

BIGDATA AN 3 : UNE NOUVELLE ERE DE B.I.

SERDALAB - INFORMATION NUMERIQUE B2B - SOMMAIRE

Pentaho Business Analytics Intégrer > Explorer > Prévoir

ISTEX, vers des services innovants d accès à la connaissance

1 Actuate Corporation de données. + d analyses. + d utilisateurs.

Marc SALLIERES CEO ALTIC

Guide de référence pour l achat de Business Analytics

Constituer des profils d'experts scientifiques, de centres de recherche et d entreprises innovantes

Pilot4IT Tableaux de Bord Agréger et consolider l ensemble de vos indicateurs dans un même portail.

VENDRE EN LIGNE SUR UNE PLACE DE MARCHE

Guide de référence pour l achat de Business Analytics

Exploration des technologies web pour créer une interaction entre Mahara et les plateformes professionnelles et sociales

Fouillez facilement dans votre système Big Data. Olivier TAVARD

FORUM NTIC BIG DATA, OPEN DATA Big Data: les challenges, les défis

SpagoBI: la seule suite décisionnelle 100% open source, complète et flexible

RESULTATS ANNUELS 2011

Vos experts Big Data. Le Big Data dans la pratique

Business Intelligence avec Excel, Power BI et Office 365

QU EST-CE QUE LE DECISIONNEL?

JASPERSOFT : Répondre à la demande croissante face à un reporting de plus en plus complexe.

X2BIRT : Mettez de l interactivité dans vos archives

ArcGIS for INSPIRE SIG RAIL 2011

Gestion de données avec TALEND

Mercredi 15 Janvier 2014

Big Data: comment passer de la stratégie à la mise en œuvre? Big Data Paris Mars 2015

Utiliser SQL Server 2008 R2 Reporting Services comme source de donne es pour Microsoft Excel

Présentation générale du projet data.bnf.fr

QUI SOMMES-NOUS? Cette solution s adresse aussi bien aux PME/PMI qu aux grands groupes, disposant ou non d une structure de veille dédiée.

DÉPLOIEMENT DE QLIKVIEW POUR DES ANALYSES BIG DATA CHEZ KING.COM

Analyse comparative entre différents outils de BI (Business Intelligence) :

Business Intelligence

Business Intelligence simple et efficace avec Excel et PowerPivot

Datalift. + + Architecture Modularité Déploiements. d j = 09/04/2015 Laurent BIHANIC

Référencez simplement et rapidement vos catalogues produits grâce à Lengow!

Big data et données géospatiales : Enjeux et défis pour la géomatique. Thierry Badard, PhD, ing. jr Centre de Recherche en Géomatique

Les technologies du Big Data

OPEN DATA : CHALLENGES ET PERSPECTIVES D ENTREPOSAGE

Big Data et Graphes : Quelques pistes de recherche

IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21

Les attentes du marché

... Catalogue des solutions. Rechercher. Indexer. Partager. Sommaire

La Business Intelligence en toute simplicité :

Perspectives en matière de portails géographiques et de 3D

Introduction. M2206 Intégration web. Introduction. Introduction 20/01/2014

L expertise développée par Market-IP et ses solutions télématiques vous permettront d atteindre

Veille stratégique sur Internet Comprendre les enjeux, maîtriser les outils et partager l'information

La Business Intelligence pour les Institutions Financières. Jean-Michel JURBERT Resp Marketing Produit

Le terme «ERP» provient du nom de la méthode MRP (Manufacturing Ressource Planning) utilisée dans les années 70 pour la gestion et la planification

LIVRE BLANC. Les données sociales : De nouvelles perspectives pour les systèmes d information décisionnels?

QlikView et Google Big Query : Une réponse simple, rapide et peu coûteuse aux analyses Big Data

AVRIL Au delà de Hadoop. Panorama des solutions NoSQL

ASTER et ses modules

Filière Data Mining (Fouille de données) Pierre Morizet-Mahoudeaux

ABILIAN SICS-PC. Abilian SYSTÈME D INFORMATION COLLABORATIF ET SÉCURISÉ POUR LES PÔLES DE COMPÉTITIVITÉ

SQL SERVER 2008, BUSINESS INTELLIGENCE

Présentation du programme Open Law Europa

Le Social CRM comme levier de développement pour les entreprises

Sécurité des entrepôts de données dans le Cloud Un SaaS pour le cryptage des données issues d un ETL

ArcGIS. for Server. Sénégal. Comprendre notre monde

Portail collaboratif Intranet documentaire Dématérialisation de processus

LIVRE BLANC Décembre 2014

MyReport, LE REPORTING SOUS EXCEL

LE BACCALAUREAT PROFESSIONNEL GESTION ADMINISTRATION Janvier 2012 Page 1

Filière Fouille de Données et Décisionnel FDD (Data Mining) Pierre Morizet-Mahoudeaux

La feuille de route du Gouvernement en matière d ouverture et de partage des données publiques

Le potentiel et les défis du Big Data. Mardi 2 et Mercredi 3 Juillet 2013

Ne cherchez plus, soyez informés! Robert van Kommer

Solution d intelligence marketing et CRM

Gérez et diffusez vos contenus médias

Solocal Group Solocal Group pilote ses audiences via un ensemble de tableaux de bord complètement automatisés grâce à l API AT Internet.

We make your. Data Smart. Data Smart

Microsoft Office SharePoint Server Guide d évaluation

Cette solution s adresse aussi bien aux PME/PMI qu aux grands groupes, qu ils disposent ou non d une structure de veille dédiée.

Imaginez un Intranet

THE GLOBAL EVENT MANAGER

Adaptabilité d un MOOC aux styles d apprentissage. Hubert Kadima Directeur de Recherche LARIS/EISTI hubert.kadima@eisti.fr

Vérifier la qualité de vos applications logicielle de manière continue

choix technologiques et stratégiques

FINI LA RÉCRÉ PASSONS AUX MÉGADONNÉES

Catalogue Formation «Vanilla»

Ici, le titre de la. Tableaux de bords de conférence

Introduction à ORACLE WAREHOUSE BUILDER Cédric du Mouza

PRESENTATION. MaPS SYSTEM Luxembourg Allemagne France - Suisse 08/01/13

La Geo-Business Intelligence selon GALIGEO avec 26/10/2005 1

Résultats annuels 2014 & perspectives. «Du mobile au Big Data»

Migration et import de données

Progiciel de gestion documentaire juridique & d édition Web et papier

Les données massives de Copernicus : vers un nouveau paradigme. Hervé Jeanjean Cnes

Didier MOUNIEN Samantha MOINEAUX

La biblio vient à vous : la veille avec les fils RSS

Easy to. report. Connexion. Transformation. Stockage. Construction. Exploitation. Diffusion

Le Data Risk Center. Plateforme de pilotage et de gestion des risques Pilier I de la directive Solvabilité II

Transcription:

Open Data François Bancilhon twitter.com/fbancilhon www.data-publica.com Printemps de la recherche EDF R&D 28/9/12

Plan Open data Que faire des données de l open data? Eco-système de la données Data Publica Technologies de l open data

Open Data Big Data Data Viz Data Journal.

Schema Ouverture de Données Application Site de publication Jeu de données brut ouvrir Jeu de données brut SI Acteur Public Visualisatio n API ou téléchargement Visualisation Journalisme de données Application Développeur Grand Public Entreprises

Que faire avec toutes ces données?

Journalisme des données

Applications Internet / Mobile

Marché traditionnel des données électroniques en France 1,6 Milliard d'euros annuel Environ 60% vient des données publiques 170 acteurs 9 verticaux 2 horizontaux (veille et traitement de contenu)

Les 9 verticaux Vertical Exemple Taille (M ) Financier Reuters 300 Presse Press Index 250 Juridique Francis Lefebvre 240 Solvabilité Altarès 160 STM Meteo France 160 Image Sipa 60 Economique Société.com 55 Marketing Acxiom 55 Brevets Reuters 25

Entreprise Utilise Collecte Produit

Entreprise Utilise Collecte Produit

Entreprise Utilise Collecte Produit

Entreprise Utilise Collecte Produit

Nouvel éco-système de la donnée Fournisseur d outils plateforme open data plateforme big data plateforme BI Analyse de données Dataviz (outils ou services) Place de marché de données Editeur de données Acteurs verticaux

Data Publica : «Elevator pitch» Développement (sourcing, transformation, livraison) de jeux de données (JDD) livrés par abonnement sur mesure sur étagère Connaissance du contenu (données sources), technologie de transformation (pour la production de données) et dataviz

Data Publica : production de jeux de données Web Open Data Données Internes Crawl Scraping ETL, etc. Text Mining Formatage Enrichissement, etc. Livraison Visualisation Editeurs Réseaux Sociaux

Data Publica Expertise Open Data Web Réseaux sociaux Données privées Données internes Contenu Transformation Données Crawl Scraping ETL Data cleansing Text & Web mining Bases de données Dataviz générique DSPL Rapport Présentation

Data Publica : Annuaire des Jeux de Données

Annuaire de jeux données Le plus complet et le plus riche sur les données françaises 14 500 jeux de données Moteur de recherche plein texte Contenu et méta-données Facettes 3 000 jeux de données structurés Visualisateur générique API

Visualisation : sur mesure ou générique

Tableaux de bord des territoires Pour une unité géographique déterminée Région, commune, zone d emploi, Pour un thème défini Emploi, activité économique, santé, etc. Recueillir des données pertinentes Complètes (multitude de sources) Fraîches (mises à jour en temps réel) Les présenter de façon compréhensible Visualisation interactive Tableau de bord adapté aux données

De l artisanat à l industrie Processus manuel Web Processus industriel Extraction manuelle de données Extraction automatique et actualisée de données Mise à jour automatisée Production de rapport Génériqu e Data Publica Visualisation Votre rapport Rapport sur mesure

TBT communes INSEE Développement Durable Banque de France Eurostat Statistiques base «Marchés» (800 sources différentes) Geonames

TBT Emploi INSEE Pole emploi Banque de France Geonames

Architecture Data Publica met en œuvre un grand nombre de transformateurs de sources open data vers ses différentes bases de données liées. Ces processus sont exécutés quotidiennement, téléchargent les nouvelles versions, structurent les sources et mettent à jour des bases. Bases Data Publica Tableaux de bord Le Tableau de bord permet de visualiser le flux de données API Communes Crawl, Scraping, Extraction & Structuration Géo Info structurées Indicateurs open data Autres bases L API Data Publica consolide quotidiennement les informations des bases et constitue un flux XML synthétique Open Data Autres sources Les autres tableaux de bord mettent en œuvre d autres API similaires (indicateurs ) INSEE, Développement Durable, Banque de France, Eurostat. Statistiques base «Marchés», Geonames

Les trois étages RECUEIL DES DONNEES TRAITEMENT DES DONNEES UTILISATION DES DONNEES

Technologies Extraction ETL, crawling, scraping, text mining, data cleansing Stockage NoSQL, mise à jour, annuaires Manipulation et mise en forme Web sémantique, data cleasing, text mining, formats DSPL & SDMX Mise à disposition API spécifiques et génériques Visualisation Analyse

DSPL Data Set Publishing Language Un format ouvert défini par Google et utilisé dans son outil Google Public Data Explorer Un Zip contenant Des données CSV Un fichier XML décrivant la structure des données Bien adapté aux fichiers spatio-temporels

François Bancilhon twitter.com/fbancilhon www.data-publica.com

Nouvel éco-système Conclusion Disruption de l éco-système traditionnel Nouvelles technologies Nouveaux usages Impact majeur sur le fonctionnement des grandes organisations (publiques et privées)