Intégration de données complexes pour une vision 360 du client. Chloé Clavel EDF R&D Département ICAME



Documents pareils
LabCom SMILK. Social Media Intelligence and Linked Knowledge. ISTE 2013 Keynote thumb wrestling

Pass / 28 Novembre By Philippe Coudol

Présentation générale du projet data.bnf.fr

Catalogue des formations Edition 2015

OPEN DATA : CHALLENGES ET PERSPECTIVES D ENTREPOSAGE

Mercredi 05/10/2011. Forges logicielles. Olivier Berger, Telecom SudParis. Introduction Avant-propos À propos de COCLICO. Panorama des forges

Point 3.7. Publier des contenus dans un portail e-sidoc. Janvier 2013 Documentation détaillée V 2.2

Exploiter les fonctionnalités de son compte Google

Perspectives en matière de portails géographiques et de 3D

Animation numérique. de territoire. Créer son site Internet avec un outil gratuit. Mardi 4 novembre Cédric ARNAULT OT Lourdes

Linked Open Data. Le Web de données Réseau, usages, perspectives. Eric Charton. Eric Charton

Open Data. Enjeux et perspectives dans les télécommunications

Les nouvelles technologies * et les réseaux sociaux au service des DRH enjeux et perspectives autour du web 2.0

Direction de la formation continue. 30, boulevard du Séminaire Nord local H-004, Saint-Jean-sur-Richelieu , poste

Les Réunions Info Tonic. Améliorer la visibilité de son site internet Mardi 10 décembre 2013

Déployer une Stratégie Web Globale

Petite définition : Présentation :

REACHTHEFIRST DIGITAL BRANDING LA GUERRE DES «TERRITOIRES» APPORTEUR DE SOLUTIONS DIGITALES. Laurent BEAUREPAIRE CEO

Pratiques et usages du web, la «culture internet» moderne

Les réseaux sociaux au service de l emploi

Travail collaboratif et à distance. DFGSM 2 Pr. F. Kohler 2012/2013

Les Ateliers Numériques avril Alboussière

AVEC LES. de votre. Pour vous. pitché. ENGIE, Hugues. Philippe. e, ORANGE, Nathalie. Fréderic GENERALE. SOCIETE. Aymeril PHILIPPE PALAT

Content Management System V.3.0. BlackOffice CMS V3.0 by ultranoir 1

Un outil de communication et de Formation Agricole au service des jeunes ruraux

Quel outil numériques pour répondre à un besoin de communication dans un projet collectif?

DIAPASON : DIAgnostic PArtagé Sur lés Outils Numé riqués

De l OpenData aux citoyens : potentiel et limites des plateformes collaboratives

Webinar. Découvrez Rubedo, la première solution CMS open-source tirant profit des atouts de Zend Framework et du NoSQL. avec la participation de

JDev Atelier Datalift

Je catalogue, tu FRBRises, il/elle googlise. L évolution des catalogues et les bibliothécaires Vendredi 29 mars 2013 Manufacture des tabacs

Les médias sociaux. Vers un Web citoyen et solidaire?

Concilier la stratégie avec les outils TIC pour l observation des élections et le plaidoyer

Défi n 3 : Développer l attractivité de la destination

INTERNET, C'EST QUOI?

Investir les réseaux sociaux

Madame, Monsieur, PJ. 1 - Programme de formation 2 - Fiche d'inscription 3 - Présentation de Olivier GOBET

Big data et données géospatiales : Enjeux et défis pour la géomatique. Thierry Badard, PhD, ing. jr Centre de Recherche en Géomatique

Programme du Millionnaireship seminar

Ligne 34. Château-Landon / Egreville Melun

Business Intelligence, Etat de l art et perspectives. ICAM JP Gouigoux 10/2012

En 2010, on compte environ 1,65 milliard d utilisateurs d internet, Introduction

Lundi de l Economie l Mardi 19 novembre. Foix. CCI Ariège

Netvibes : optimiser sa veille d'informations

Comment utiliser les Réseaux Sociaux à des fins de conservation

Le cloud computing au service des applications cartographiques à haute disponibilité

Formulaire d abonnement au service e-bdl

LE NUMÉRIQUE Dans ce numéro, vous trouverez :

LES ENJEUX DU BIG DATA

Online Intelligence Solutions. Reed Expositions

Frédéric PERES - CCI Bayonne Pays Basque

Objectifs. Synthétiser. Moyens

Open Data et services de données à ERDF

PROMOUVOIR SON ASSOCIATION GRACE AUX RESEAUX SOCIAUX

La plateforme technique d informations des professionnels des ZNA


Formations Web. Catalogue 2014 Internet Référencement Newsletter Réseaux sociaux Smartphone

MIEUX APPREHENDER LE VOCABULAIRE DU WEB ET DE L E-TOURISME

Cette solution s adresse aussi bien aux PME/PMI qu aux grands groupes, qu ils disposent ou non d une structure de veille dédiée.

Mai Médiathèque «Les Trésors de Tolente»

Quelle mise en œuvre opérationnelle?

Avis d expert. Quels choix technologiques pour une meilleure productivité?

Ambassadeur etwinning. Ateliers de développement professionnel (PDW)

CaDeVousAMoi. Cas d école e-réputation. Votre interlocuteur : CHRISTOPHE THIL

QUI SOMMES-NOUS? Cette solution s adresse aussi bien aux PME/PMI qu aux grands groupes, disposant ou non d une structure de veille dédiée.

Assemblée générale Aristote

Nom Prénom :... Baby-sitters

Titre. SAP BusinessObjects. - 1 er semestre CONSEIL, SOLUTIONS DE TRANSFORMATION ET SERVICES IT

Organisation Gestion du temps. Participation Notes et résumés Etudes et examens

Rencontre E-tourisme 25 Novembre Réseaux sociaux et avis de consommateurs Comment valoriser votre présence?

Principales Evolutions Version

Le CMS Content Manager

Le Web de A à Z. 1re partie : Naviguer sur le Web

QUE PEUT-ON FAIRE DANS UNE CYBER-BASE? SOMMAIRE. Cyber-base mobile, à la demande. Pourquoi aller dans une Cyber-base?

D5 Travailler en réseau, communiquer et collaborer. D5 Travailler en réseau, communiquer et collaborer

Formation Marketing et communication web

Les internautes français et la confiance numérique. Lundi 7 avril 2014

Comment monétiser son contenu en trois étapes?

Manuel d utilisation de Form@Greta

Créer et animer une boutique en ligne avec Wordpress (environnement PC et MAC)

UTILISER LE CLOUD COMPUTING : EDITION EN LIGNE ET TRAVAIL COLLABORATIF AVEC GOOGLE DRIVE

AGENCE WEB 360 acteur du web depuis 8 ans en collaboration avec ses partenaires, déploie son. offre SEO

Guide utilisateur des services WASATIS (Manuel Version 1.1)

Le Web de Données Dan VODISLAV Université de Cergy-Pontoise Master Informatique M2 Plan

DÉCOUVREZ L INTRANET NATIONAL PLÉIADE

Rédiger : le numérique dans la préparation de la thèse

ArcGIS 10 Christophe Tourret Gaëtan Lavenu

Cloud computing Votre informatique à la demande

Intégration de systèmes

Google Apps for Business

Avanquest Software présente la nouvelle gamme WebEasy 8

Le contrôle parental. Premier partenaire de votre réussite

Programme et calendrier niveau 1 :

Transcription:

Intégration de données complexes pour une vision 360 du client Chloé Clavel EDF R&D Département ICAME

Contexte : projet R&D sur l intégration de données complexes pour la connaissance client Objectif : Développer des méthodes automatiques d analyse de données complexes pour la connaissance du client et de son contexte

Positionnement de notre projet par rapport à la communauté Open Data «Nos OPEN DATA»= données collectées sur le web : -données collaboratives de type forum, réseaux sociaux - site de presse - bases de connaissance Stimulation et animation (ex: SNCF) Notre problématique : Comment exploiter les données ouvertes externes pour enrichir les données internes pour la connaissance client? Les données Open Data: Fournisseurs de données (ex: portails gouvernementaux et organismes publics) Aggrégateurs de données (ex : Data Publica et Generability) Données collaboratives Nos données internes: Données client stockées dans les SI : contact, profil de consommation Les traitements : développement de service et d outils d analyse (laboratoires académiques, entreprises, développeur indépendant) Données complémentaires /données internes Les sorties : Information et services Notre sortie : plateforme d intégration de données complexes

Objectifs et plan de la présentation Les données open Data: Quelles données pour la connaissance client? Données externes, données internes Les méthodes de collecte de données Les traitements développés: analyse des données textuelles, analyse des courbes de charge, intégration de données. Perspectives pour l open Data

«Nos OPEN DATA»= données collectées sur le web : -données collaboratives de type forum, réseaux sociaux - site de presse - bases de connaissance Notre problématique : Comment exploiter les données ouvertes externes pour enrichir les données internes pour la connaissance client? LES DONNÉES WEB POUR LA CONNAISSANCE CLIENT 5 - Weblab juin 2012

Deux types de données web Les données non structurées: Les textes, les vidéos et les images publiées sur le web Les données structurées: Les bases de connaissance

Données non structurées pour la connaissance client - Texte, audio et image du web Opinions des clients/citoyens et des médias autour d EDF (ex: réclamation) Informations sur le contexte sociétal (ex: tendances énergie renouvelable) forums, plateforme de microblogging (twitter), YouTube, médias en ligne et les blogs etc. texte Vidéo/audio Image

Données non structurées pour la connaissance client - Texte, audio et image du web Information sur la concurrence sur les sites corporate (texte) : les tarifs, l image, la stratégie de communication

Données non structurées pour la connaissance client - Texte, audio et image du web Données externes/données internes Sources/Modalités Texte Audio Image Vidéo Enquêtes de satisfaction Écrites téléphoniques Centres d appels Données SI conversations Médias traditionnels Écrite Radio et télé Écrite Télé Web Forums, blogs, sites, réseaux sociaux, chat, twitter, Flickr Site radio, radio internet, YouTube, Daily Motion, site télé Données internes Flickr, google maps YouTube, DailyMotion, site télé (France 24) Données externes

Les données structurées du web- LinkedOpenData L initiative Linked Open Data Recenser et rendre accessibles les données ouvertes disponibles sur le web au travers un format commun Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/

Les données structurées du web - LinkedOpenData Linked Open Data pour la connaissance client Ex 1: linkedgeodata (données cartographiques collectées dans le cadre du projet openstreetmap) Ex 2 : DBPedia (données de wikipedia)

Les données structurées du web - Données externes/données internes ontologie ontologie nom client entreprise requête affichage portlet DBpedia enrichissement ontologie

«Nos OPEN DATA»= données collectées sur le web : -données collaboratives de type forum, réseaux sociaux - site de presse, ontologies Notre problématique : Comment exploiter les données ouvertes externes pour enrichir les données internes pour la connaissance client? MÉTHODE DE COLLECTE DE DONNÉES ISSUES DU WEB 13 - Weblab juin 2012

Collecte des données web non structurées Outils existants : plutôt sur le texte Les Sociétés qui vendent des données web: Aggrégateurs de données web: Linkfluence, AMI Software, mesagraph etc. Enjeux techniques de la collecte de données Collecte régulière ou ponctuelle => gestion des dates (date de publication vs. date de collecte), actualisation des données (en cas d absence de flux rss) Sources prédéfinies ou non => détourage (structure html très différente d un site à l autre) Traitement des données de forum => détourage (structure très complexe différente d un forum à l autre) Détourage : extraire d une page web son contenu pertinent

Exemple de forums Les blocs de texte sont éparpillés sur la page La page contient aussi du bruit: menus, pubs etc.

Les blocs de texte sont éparpillés sur la page Collecte et analyse données Web

Collecte/requêtage de données structurées Représentation des données pour faciliter le requêtage par les moteurs de recherche Protocoles Web sémantiques Ensemble de technologies visant à rendre accessible le contenu des ressources du World Wide Web données non structurées structuration des données données structurées texte images audio videos OWL RDF RDFS stockage dans un Triplestore Instances RDF Agent A responsable compte X Agent B responsable compte Y Agent A appartient Unité Est Agent B appartient Unité Centre Concepts RDFS Agent EDF responsable compte Agent EDF appartient unité requête/inférence SPARQL synthèse

Les traitements : développement de service et d outils d analyse (laboratoires académiques, entreprises, développeur indépendant) Les sorties : Information et services Notre sortie : plateforme d intégration de données complexes Données non structurées = > données structurées TRAITEMENT DES DONNÉES ET INTEGRATION

Puissance appelée (MW) Notre outil la plateforme d intégration de données hétérogènes Technologie utilisée : WebLab conçue il y a 5 ans pour des projets collaboratifs et industrialisé par EADS/Cassidian - plateforme open-source destinée à : Rendre intelligent le traitement de données hétérogènes Gérer l interopérabilité entre les différents traitements (données internes et données externes) Nos traitements Analyse de données : de la donnée non structurée à la donnée structurée Analyse de données textuelles Analyse des courbes de charges 60 50 40 30 20 10 0 Profil hebdomadaire au pas jour marché VERT / GUADELOUPE lundi mardi mercredi jeudi vendredi samedi dimanche Intégration de données Représentation des données non structurées en donnée structurée (ontologie) Alignement d ontologie

PERSPECTIVES

Le cycle de vie des données OpenData Comment stocker les données externes collectées pour venir enrichir les données internes du SI? Pour l instant : stockage classique des données collectées sur le web pour des analyses R&D A terme : réflexion à mener sur le mode de stockage des données collectées Mise en place d un entrepôt de données pour pouvoir suivre les évolutions Quelles sont les données qu il faut choisir de stocker? Comment gérer leur mise à jour (notamment dans le cas des données web)? Ou requête à la demande en fonction de l étude Inconvénient historique restreint Avantage : pas de problème de mise à jour

Quelles sont les autres données de l opendata pour enrichir notre connaissance client? Élargir à d autres données qui pourraient être mises à disposition par les fournisseurs et aggrégateurs de données Données collaboratives Pour l instant: collecte effectuée sur twitter et sur quelques forums Quelles sont les plateformes d échanges entre les citoyens sur leur consommation d énergie? Autres types de données Données cartographiques mises à disposition par les collectivités Ex : Carte de la thermographie à Paris http://www.paris.fr/pratique/environnement/energie-plan-climat/carte-de-la-thermographie-aparis/rub_8411_stand_91543_port_19606

Mise à disposition de données EDF? Pour encourager le développement de services autour de nos données Limites : confidentialité des données client Stimulation et animation (ex: SNCF) Les traitements : développement de service et d outils d analyse (laboratoires académiques, entreprises, développeur indépendant)

Merci Contributeurs Vision Open Data : Alzennyr Gomes Da Silva, Benoît Grossin, Philippe Suignard Collecte de données web: Alina Stoica Plateforme weblab et web sémantique : Alexis Bondu, Christallan Briend, Laurent Pierre Contact : chloe.clavel@edf.fr