Livrable D1.2a. Anticipation du prototype Waves

Documents pareils
Knowledge Enabled Real-Time Recommendation System

Graphes d attaques Une exemple d usage des graphes d attaques pour l évaluation dynamique des risques en Cyber Sécurité

UC² : Le poste de travail du futur (disponible aujourd hui)

Catalogue des formations Edition 2015

Présentation par François Keller Fondateur et président de l Institut suisse de brainworking et M. Enga Luye, CEO Belair Biotech

L offre IBM Software autour de la valeur métier

Acquisition des données - Big Data. Dario VEGA Senior Sales Consultant

SparkInData. Place de Marché des applications Spatiales

COMPUTING. Jeudi 23 juin CLOUD COMPUTING I PRESENTATION

L offre décisionnel IBM. Patrick COOLS Spécialiste Business Intelligence

Gouvernance et nouvelles règles d organisation

SEMINAIRE SAS VISUAL ANALYTICS LAUSANNE, MARCH 18 : JÉRÔME BERTHIER VALERIE AMEEL

Libérer le pouvoir des médias sociaux Passer du Like au Love

Intelligence Economique - Business Intelligence

Le No.1 de l économie d énergie pour patinoires.

Introduction au Génie Logiciel

Business Process Management

LA GESTION DES EVENEMENTS PLUVIEUX

Les participants repartiront de cette formation en ayant une vision claire de la stratégie et de l éventuelle mise en œuvre d un Big Data.

JDev Atelier Datalift

FOURNIR UN SERVICE DE BASE DE DONNÉES FLEXIBLE. Database as a Service (DBaaS)

Big Data -Comment exploiter les données et les transformer en prise de décisions?

Evolution et architecture des systèmes d'information, de l'internet. Impact sur les IDS. IDS2014, Nailloux 26-28/05/2014

Les Enjeux du Smart Water. Eau. Novembre 2013 Fabrice Renault Directeur commercial France. Schneider Electric Fabrice Renault 1

THÈSE. présentée à TÉLÉCOM PARISTECH. pour obtenir le grade de. DOCTEUR de TÉLÉCOM PARISTECH. Mention Informatique et Réseaux. par.

Évaluation d une architecture de stockage RDF distribuée

Bigdata et Web sémantique. les données + l intelligence= la solution

SCC / QUANTUM Kickoff 2015 Data Protection Best Practices

Mise en place d un système de cabotage maritime au sud ouest de l Ocean Indien. 10 Septembre 2012

Accélérateur de votre RÉUSSITE

Communication Unifiée UC² IBM Corporation

Big Data et Graphes : Quelques pistes de recherche

Mise en place de la composante technique d un SMSI Le Package RSSI Tools BOX

THE GLOBAL EVENT MANAGER

Containers : Outils magiques pour les Devops? OpenNebula et son écosystème pour une infrastructure cloud agile

L'agilité appliquée à nous-mêmes. Philippe Krief, PhD Development Manager IBM France Lab

Les attentes du marché

APX et VCE, Modèle d industrialisation de l intégration et du déploiement. Olivier BERNARD, VCE

DATASET / NETREPORT, propose une offre complète de solutions dans les domaines suivants:

Communications unifiées?

Institut français des sciences et technologies des transports, de l aménagement

Le traitement du Big Data inclue la collecte, la curation, le stockage, l enrichissement, le croisement, la partage, l analyse et la visualisation.

CONTEC CO., LTD. Novembre 2010

Introduction aux bases de données

Préparer un état de l art

M2M. «Le nouveau paradigme des applications M2M: de l usage technique à l usage CRM»

ADMINISTRATION EXADATA

FICHE TECHNIQUE Suite AdminStudio

Jean-Nicolas Piotrowski, Dirigeant Fondateur d ITrust

Mesures de performances Perspectives, prospective

BUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise

Datalift. + + Architecture Modularité Déploiements. d j = 09/04/2015 Laurent BIHANIC

SpagoBI: la seule suite décisionnelle 100% open source, complète et flexible

Exemple PLS avec SAS

Comment valoriser votre patrimoine de données?

La Business Intelligence pour les Institutions Financières. Jean-Michel JURBERT Resp Marketing Produit

TRAVAUX DE RECHERCHE DANS LE

CONSTRUISEZ VOTRE INFRASTRUCTURE BIG DATA

Forthcoming Database

L impact des délais de paiement et des solutions appropriées. Dominique Geenens Intrum Justitia

Gestion de la relation Client (CRM)

Compte-rendu re union Campus AAR 3 mars 2015

D Expert en Finance et Investissements

The new consumables catalogue from Medisoft is now updated. Please discover this full overview of all our consumables available to you.

Glossaire : définitions des termes utilisés dans les fiches sur les indicateurs de performance

IODE Consulting I Intelligence on Demand Slide 1

Cheque Holding Policy Disclosure (Banks) Regulations. Règlement sur la communication de la politique de retenue de chèques (banques) CONSOLIDATION

JSIam Introduction talk. Philippe Gradt. Grenoble, March 6th 2015

Anticiper et prédire les sinistres avec une approche Big Data

Performance Management Systems

Catalogue Formation «Vanilla»

The impacts of m-payment on financial services Novembre 2011

Entreprise et Big Data

QlikView et Google Big Query : Une réponse simple, rapide et peu coûteuse aux analyses Big Data

Paris Airports - Web API Airports Path finding

Wonderware Mobile reporting

Marie Curie Individual Fellowships. Jean Provost Marie Curie Postdoctoral Fellow, Institut Langevin, ESCPI, INSERM, France

DU RÉSEAU AU BIG DATA UNE OFFRE GLOBALE DE GESTION DE LA DONNÉE. Bruno Fleisch - Responsable Produits Tarik Hakkou Responsable du pôle «Data»

ORACLE OPEN WORLD /10/ EASYTEAM - Tous droits réservés 1

iqtool - Outil e-learning innovateur pour enseigner la Gestion de Qualité au niveau BAC+2

LADIES IN MOBILITY. LIVE TWEET Innovative City

ANGULAR JS AVEC GDE GOOGLE

REMOTE DATA ACQUISITION OF EMBEDDED SYSTEMS USING INTERNET TECHNOLOGIES: A ROLE-BASED GENERIC SYSTEM SPECIFICATION

Cedric Dumoulin (C) The Java EE 7 Tutorial

ATELIER. QUASAR OBILOG BI (Décisionnel) ATELIER > PROJET BI

IPSAS 32 «Service concession arrangements» (SCA) Marie-Pierre Cordier Baudouin Griton, IPSAS Board

Big Data et Graphes : Quelques pistes de recherche

Ingénierie et gestion des connaissances

RFID et visibilité des processus: ajouter de la valeur au système d information

Optimisation et Processus métier

Hadoop, les clés du succès

Bill 69 Projet de loi 69

Open Data. François Bancilhon twitter.com/fbancilhon Printemps de la recherche EDF R&D 28/9/12

POLICY: FREE MILK PROGRAM CODE: CS-4

L ABC de l acquisition de petites entreprises

ADHEFILM : tronçonnage. ADHEFILM : cutting off. ADHECAL : fabrication. ADHECAL : manufacturing.

DATA QUERY : MODÉLISATION AVANCÉE DE VOS DONNÉES

3 minutes. relation client. avec Orange Consulting. pour tout savoir sur la. construisez et pilotez votre relation client

AVOB sélectionné par Ovum

Transcription:

Projet : Des flux de données brutes et hétérogènes à l information qualifiée N du contrat F1411006 Q Date de début 2 juin 2014 Durée 36 mois Livrable D1.2a Anticipation du prototype Waves

Statut Niveau dissémination Publique Date d échéance Mois 12, 31/07/2015 Date de soumission 20/03/2016 Work Package 1 Tâche T 1.2 statut d'approbation Final Version 1 Nombre de Pages 25 Nom du fichier D1.2-waves-tutoriel-usecase 2

Historique Version Date Revu par 1 23/03/2016 Zakia KAZI-AOUL 2 24/03/2016 Houda KHROUF 3 25/03/2016 Francis CAMPAN 3

Auteurs Organisation Nom Contact ISEP Zakia KAZI-AOUL zakia.kazi@isep.fr ISEP Yousra CHABCHOUB yousra.chabchoub@isep.fr ATOS Houda KHROUF houda.khrouf@atos.net Ondeo Systems Francis CAMPAN francis.campan@suezenv.com 4

Plan Contexte Problématiques et défis Objectif du projet Introduction du cas d usage Les données à traiter L architecture de Les possibilités de la plateforme 5

Contexte (1) De plus en plus de données sont produites: Capteurs Réseaux sociaux E-commerce Logs Web Données météorologiques Trafic routier Consommation électrique Etc. 6

Contexte (2) Nous souhaitons avoir à tout instant la bonne information afin de: Satisfaire des clients Gagner et/ou économiser de l argent Être plus compétitif Générer de nouveaux revenus Rassurer les investisseurs Protéger l environnement Etc. 7

Problématique Les données peuvent être : Trop volumineuses Hétérogènes Brutes Volatiles Pas liées Ces données peuvent avoir plus de valeur ajoutée en cas de: Sémantisation Interconnexions avec d autres sources Raisonnement Archivage Résumé intelligent 8

Nos défis Gérer efficacement ces flux massifs de données en temps réel Interconnecter différentes sources de données Données de capteurs Données statiques géographiques Données ouvertes liées ou pas Statiques / Dynamiques Sémantiques ou pas Enrichir les données Raisonner sur les données Filtrer ces données en cas d afflux massifs Distribuer les traitements afin de monter en charge 9

Objectifs du projet Concevoir et développer une plateforme générique qui gère en temps réel et d une façon intelligente des flux de données massifs provenant de sources hétérogènes 10

Notre cas d usage La supervision des réseaux de transport et de distribution de l eau potable Détecter rapidement des anomalies, par exemple: Les fuites d eau La défaillance des capteurs Une dégradation de la qualité de l eau 11

Motivations -12 - : Eau non facturée à l échelle mondiale Combien de perte? Value proposition Eau potable livrée Eau facturée aux consommateurs = Eau non facturée Eau facturée $ Eau non facturée 35% 48.6 milliards m 3 /an = Perte de 14 milliards $/an 2x la consommation annuelle domestique aux USA 12

Motivations -13 - : Eau non facturée à l échelle mondiale Quels sont les facteurs? Pertes physiques 32 milliards m 3 /an Eau livrée Pertes commerciales 16 milliards m 3 /an Value proposition Fuite 90%des pertes sont invisibles Fraude Erreur de facturation Mesures incorrectes Erreurs de manipulation de données Enjeu environnemental Eau facturée Enjeu économique 13

-14 - Motivations: Eau non facturée Challenge La demande en eau devrait augmenter de 55% à l'échelle mondiale entre 2000 et 2050 La demande viendra principalement de : Value proposition o Industrie: +400% o Electricité: +140% o Utilisation domestique: +130% Une meilleure gestion globale des réseaux de distribution d eau doit être mise en place Source: The OECD Environmental Outlook to 2050 (OECD, 2012) 14

Réseaux de capteurs Ondeo Systems Des réseaux de capteurs sont déployés sur les systèmes d'approvisionnement en eau potable et mesurent en temps réel certaines métriques relatives à l eau telles que : le débit la pression le taux de concentration en chlore Le ph Ondeo Systems a développé Aquadvanced: Fournir une aide au diagnostic, des outils d'analyse, des rapports et des tableaux de bord Faciliter la prise de décision en temps réel et le contrôle du réseau 15

-16 - Gestion du réseau AQUADVANCED REAL-TIME DATA MANAGEMENT Value proposition Monitors and manages sectors equipped with sensors - leakage early detection and localization -water quality monitoring Collects and centralizes data Manages and optimizes water network performance in real time Integrates Customer Relationship Management and workforce management systems Optimizes energy consumption - pumping strategy - consumption forecasts 16

Surveillance en temps réel et gestion des réseaux de distribution d'eau Source: http://www.ondeosystems.com/en/smart-water-2/real-time-monitoring-and-management-ofwater-distribution-networks/ 17

Quel est l apport de pour le monitoring de réseaux? Aller au-delà de la solution Aquadvanced en: intégrant les réseaux sociaux utilisant des données contextuelles telles que la météo ou des données géographiques Comme conséquence, nous devons : Qualifier la donnée Traiter de grandes quantités de données hétérogènes 18

Flux de données hétérogènes Quelle solution? XML TTL JSON CSV DAT Traduction RDF RDF N3 Hétérogénéité Différents formats et modèles de données! Homogénéité Plus de connaissance 19

Architecture générale de Enrichissement de la données / statistiques Analyse et visualisation de la données Supervision, alertes, prise de décision Base de données /Triplestores Filtrage et raisonnement des flux sémantique Flux RDF Conversion sémantique Flux de données sémantiques Flux de données hétérogènes Données hétérogènes statiques Capteurs 20

Pourquoi distribuer le traitement? Dans le contexte des flux de données sémantiques, centraliser tous les traitements peut faire cracher la machine => Nécessité de distribuer Cloud Computing 21

Architecture logicielle de 22

Architecture logicielle de Data Cleansing: It is the role of Native Filter which should detect and remove corrupt and inaccurate data. Data Semantization: The heterogeneous incoming data are converted into RDF-based unified model. KAFKA: It is a distributed publish-subscribe messaging system which serves a set of brokers to store data. Data are produced in Kafka by RDF converter, and consumer by the distributed system nodes. STORM-based Smart OP:It consists of Storm topology composed of a set of spouts and bolts. At least, there are a Kafka spout, a windowing bolt, a step bolt and a query bolt. This topology should consume data from Kafka et execute continuous SPARQL queries. Data Storage Redis: in-memory key/value data storage used to hold the intermediate processing data (compression patterns, events, etc.) Triple Store: an external RDF storage to hold the static data and background knowledge (descriptions of sensors, water network, etc.) 23

Domaine d application de Solution générique Logs de sites Web Supervision des réseaux Services financiers Prévisions météorologiques Économie circulaire ecommerce Supervision du trafic Consommation électrique 24

Merci Questions?