Nouvelles opportunités pour les données fortement interconnectées : La base de graphe Neo4j



Documents pareils
ORACLE 10g Découvrez les nouveautés. Jeudi 17 Mars Séminaire DELL/INTEL/ORACLE

Telavada. Spécialiste Oracle Fusion Middleware

ORACLE DATA INTEGRATOR ENTERPRISE EDITION - ODI EE

Infrastructure Management

GPC Computer Science

AVRIL Au delà de Hadoop. Panorama des solutions NoSQL

Labs Hadoop Février 2013

Du 08 au 11 septembre 2015 Au Lycée Hôtelier de Punaauia

LES SOLUTIONS OPEN SOURCE RED HAT

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

THÉMATIQUES. Comprendre les frameworks productifs. Découvrir leurs usages. Synthèse

BIG DATA. Veille technologique. Malek Hamouda Nina Lachia Léo Valette. Commanditaire : Thomas Milon. Encadré: Philippe Vismara

CA 2011 M. +40% de croissance 7. agences en France. Paris Lyon Nantes Bordeaux Montpellier Aix en Provence

Intégrer le CRM : quelle utilité, quels profits pour ma PME?

<Insert Picture Here> Exadata Storage Server et DB Machine V2

Visual Paradigm Contraintes inter-associations

Entreprise et Big Data

Spécialité Compétence complémentaire en informatique

20 ans du Master SIAD de Toulouse - BigData par l exemple - Julien DULOUT - 22 mars ans du SIAD -"Big Data par l'exemple" -Julien DULOUT

SQL Server 2012 et SQL Server 2014

Assises Métallerie ERP GPAO en métallerie: quelle offres, comment bien choisir son outil de gestion?

Technologie data distribution Cas d usage.

Extension fonctionnelle d un CRM. CRM étendu >> Conférence-débat 15 April Club Management des Systèmes d Information de l'iae de Paris Alumni

Présentation du module Base de données spatio-temporelles

HADOOP ET SON ÉCOSYSTÈME

Hibernate vs. le Cloud Computing

Construire un réseau social avec Symfony Xavier Lacot Clever Age. Symfony Live 11 et 12 juin 2009 Clever Age Xavier Lacot

Ne cherchez plus, soyez informés! Robert van Kommer

Les technologies du Big Data

réussir la transition vers le Cloud Computing: équilibre entre rentabilité, fonctionnalité et fiabilité

PostgreSQL. Formations. Catalogue Calendrier... 8

L'automatisation open source pour SI complexes

TRANSFORM IT + BUSINESS + YOURSELF

FINI LA RÉCRÉ PASSONS AUX MÉGADONNÉES

VMware Infrastructure The New Computing Platform. Stéphane CROIX Systems Engineer

Big Data. Concept et perspectives : la réalité derrière le "buzz"

Performances. Gestion des serveurs (2/2) Clustering. Grid Computing

SAP Business Suite Powered by SAP HANA Transactionnel et Analytique réunis

Augmenter la disponibilité des applications JEE grâce au clustering : Le projet open source JShaft

Hébergement MMI SEMESTRE 4

Cassandra chez Chronopost pour traiter en temps réel 1,5 milliard d événements par an

Technologies du Web. Ludovic DENOYER - ludovic.denoyer@lip6.fr. Février 2014 UPMC

X2BIRT : Mettez de l interactivité dans vos archives

<Insert Picture Here> Solaris pour la base de donnés Oracle

La surveillance réseau des Clouds privés

Cloud Computing & PHP

Six compétences essentielles pour maîtriser l'internet des objets connectés. Sponsorisé par

«Nos valeurs à votre service» Genève. Business Intelligence Data Management Développement Web. Présentation Société

ArcGIS. for Server. Comprendre notre monde

BIG DATA Comment exploiter les données pour maximiser vos investissements en ligne

Les bases de données relationnelles

14 rue Roger Salengro Le Kremlin Bicetre France Né le 11 Février 1974

Ex Nihilo Denis Ensminger

Le traitement du Big Data inclue la collecte, la curation, le stockage, l enrichissement, le croisement, la partage, l analyse et la visualisation.

La place de SAS dans l'informatique décisionnelle

Catalogue de formations. Centre de formations IDYAL. Gagnez une longueur d avance en compétitivité!

DOSSIER DE PRESSE. La société Neotys teste les applications web de grands comptes français et internationaux

Catherine Chochoy. Alain Maneville. I/T Specialist, IBM Information Management on System z, Software Group

M Études et développement informatique

Enseignant: Lamouchi Bassem Cours : Système à large échelle et Cloud Computing

Qui sommes-nous? Expertises. Chiffres clé. Premier intégrateur mondial des technologies Microsoft. Références Avanade Inc. All Rights Reserved.

EFIDEM easy messaging systems

Consultant fonctionnel et technique/ingénieur d'étude/cp/amoa/formateur

L offre décisionnel IBM. Patrick COOLS Spécialiste Business Intelligence

Formations qualifiantes pour demandeurs d emploi

Michael Benayoun Worldwide ECM Go To Market, IBM

NoSQL. Introduction 1/23. I NoSQL : Not Only SQL, ce n est pas du relationnel, et le contexte. I table d associations - Map - de couples (clef,valeur)

FAMILLE EMC RECOVERPOINT

PostgreSQL, le cœur d un système critique

C-JDBC. Emmanuel Cecchet INRIA, Projet Sardes.

FAMILLE EMC VPLEX. Disponibilité continue et mobilité des données dans et entre les datacenters AVANTAGES

Fusion : l interopérabilité chez Oracle

Hébergement de sites Web

Notre Catalogue des Formations IT / 2015

HÉBERGEMENT CLOUD & SERVICES MANAGÉS

Technique en informatique (Diplôme d études collégiales) Collège de Sherbrooke

Drive your success. «Un écosystème complexe implique une capacité de gestion temps réel des aléas»

impacts du Cloud sur les métiers IT: quelles mutations pour la DSI?

M Études et développement informatique

ArcGIS. for Server. Sénégal. Comprendre notre monde

Mercredi 15 Janvier 2014

Organiser vos données - Big Data. Patrick Millart Senior Sales Consultant

<Insert Picture Here> Maintenir le cap avec Oracle WebLogic Server

EFIDEM easy messaging systems. EFIDEM SAS 3 rue de Téhéran Paris T : F : info@efidem.

Fiche Technique Windows Azure

Hadoop, les clés du succès

Morning du Web du 24/06/14

PHP et le Cloud. All rights reserved. Zend Technologies, Inc.

Pré-requis en termes législatifs et réglementaires Présentation de cas. Alger décembre 2002

LDAP & Unified User Management Suite

Session Business Objects. Thierry Nicault Directeur Régional EEMEA Business Objects

L art d ordonnancer. avec JobScheduler. François BAYART

SysFera. Benjamin Depardon

e need L un des premiers intégrateurs opérateurs Cloud Computing indépendants en France

Pascale Borla-Salamet Consultante Avant Vente Oracle France. Oracle Exadata Performance et Optimisation de votre Datawarehouse

Constat ERP 20% ECM 80% ERP (Enterprise Resource Planning) = PGI (Progiciel de Gestion Intégré)

Hadoop dans l entreprise: du concept à la réalité. Pourquoi et comment?

Système d Information Géographique (SIG) : quels apports dans les métiers de l assurance?

Le NoSQL - Cassandra

Transcription:

Nouvelles opportunités pour les données fortement interconnectées : La base de graphe Neo4j Cédric Fauvet Votre contact en France Cedric.fauvet@neotechnology.com Twi<er : @Neo4jFr ConfidenCal - Neo Technology, Inc. 1

La base de graphe Neo4j A propos des graphes PrésentaCon de Neo Technology Cas d uclisacon clients et génériques Vision du marché Technologie Neo4j Cypher le «SQL» de Neo4j

A propos des graphes : La théorie des graphes An 840 : Le problème du cavalier Le joueur et théoricien d'échecs arabe al- Adli ar- Rumi en donne déjà une solucon.

A propos des graphes : La théorie des graphes An 1735 : Le problème des sept ponts du Königsberg Passer une seule fois par le même pont. Leonhard Euler MathémaCcien Suisse

A propos des graphes : La théorie des graphes 2013: Les problèmes d aujourd hui CollaboraCon GesCon de configuracon Géo- SpaCal InteracCons moléculaires (Biologie) Analyse d impact Master Data Management GesCon de ligne produit RecommendaCon Social

Agenda A propos des graphes PrésentaCon de Neo Technology Cas d uclisacon clients et génériques Vision du marché Technologie Neo4j Cypher le «SQL» de Neo4j

Neo Technology (Neo4j) Editeur de la base de données graphe Neo4j depuis 2000 QG à Palo Alto (CA) aux USA, ingénierie à Malmö en Suède Présence en France, Allemagne, Angleterre, Suède, USA, Grèce et Malaisie 100,000+ uclisateurs Top 500 clients tels que Adobe, Cisco, Deutsche Telecom, Telenor, SFR, Lockheed MarCn, Support global 24/7 Partenaires locaux ou globaux tels que Accenture Partenaires technologiques tels que VMware, InformaCca et Microsok Leader mondial des bases de données Graph

Agenda A propos des graphes PrésentaCon de Neo Technology Cas d uclisacon clients et génériques Vision du marché Technologie Neo4j Cypher le «SQL» de Neo4j

Clients France

Etude de cas: Moteur de recommandacon Problème - RecommandaCons temps- réel afin de fidéliser les uclisateurs et amrer de nouveaux membres. - A l origine réalisé par un traitement batch de 1h. Suite au succès du projet la durée d exécucon est passée à un jour puis deux - Cluster MySQL non scalable et trop lent pour le temps réel. SoluAon - Expérience temps réel pour les uclisateurs de Viadeo. - SoluCon scalable. - Faible coût de maintenance et architecture fiable. Société - Présence mondiale. - 45 millions d uclisateurs, + 30 000 chaque jour. - Propriétaire des réseaux sociaux ApnaCircle (Inde) et Tianji (Chine)

Etude de cas: Moteur de recommandacon Problème - RecommandaCons temps- réel afin de fidéliser les uclisateurs et amrer de nouveaux membres. - Isoler et traiter les cas des super- dragueurs et super- dragués. - A l origine réalisé par un traitement batch écrit en PHP SoluAon - Expérience temps réel pour les uclisateurs de MeeCc. - SoluCon scalable. - Faible coût de maintenance et architecture fiable. Société - Leader Européen des sites de rencontre. - 126,1 million euro/y (+ 2,7 % Comparé avec 2012) - 840 801 membres

Etude de cas: Routage de colis Problème - Système cricque en ligne 24x7. - Capacité du système historique dépassée d ici peu. - Nombreux logiciels en interaccon complexe. - Performance a<endue : Linéaire et scalable. - Changements quocdiens des routes possibles. SoluAon : - Nouveau système de routage = Graphe = Neo4j. - Plus simple : Cypher Vs SQL - Plus Flexible : Reflet du monde réel. - Plus rapide et hautement disponible : Cluster Neo4j - Une seule «source de vérité» pour tout le réseau. Société - Opérateur historique de logiscque d un grand pays EU. - +2500 colis par seconde dans les pics. - Routage temps- réel : 5 Millions par jour! - Suivi des colis pour les clients B2C & B2B.

Etude de cas: Analyse d impact Problème - Une semaine encère pour planifier une maintenance. - Analyste d impact sur de mulcples systèmes (>30). - Changements quocdiens dans l infrastructure. - IdenCfier les clients impactés par une maintenance. - IdenCfier les faiblesses du réseau (Deuxième projet). SoluAon - IdenCficaCon temps réel des clients liées à une panne. - GesCon d inventaire réseaux très flexible. - Une seule source de vérité (Neo4j) représentant le réseau encer. - Système dynamique de chargement (ETL) des données issues de +30 sources variées. - Mise en applicacon rapide des changements mécers. Société - Deuxième opérateur Télécom Français. - 12 Milliard de CA en 2012. - 5 000 clients haut débit. - 20 000 Clients mobile. - 165 000 Clients entreprise. - 250 Clients opérateurs. (Chiffres 2012)

Etude de cas: CollaboraCon sociale DéfiniAon du problème - Volume de données important lié aux membres, groupes d uclisateurs, contenu des membres - le tout massivement interconnecté - Besoin d en déduire les relacons de collaboracon basé sur les contenu uclisateurs. Bénéfices & Ame frame - Analyse des données hautement flexible - Sub- second results for large, densely- connected datasets - Expérience de l uclisateur Avantage compéccf - Durée du projet : 12 mois SoluAon - Cluster de Neo4j Enterprise - Composant d une plus grande infrastructure - Déploiement MulC- régions AWS - Neo4j sélecconné sur une solucon custom et Oracle Le client Adobe est le leader mondial des solucons mulcmédias et de markecng numérique. 14

Etude de cas: GesCon des droits DéfiniAon du problème - Besoin d un contrôle d accès fiable pour 5 millions de clients, souscripcons et accords. - Dépendances complexes entre les groupes, sociétés, individus, comptes, produits, souscripcons, services et accords - Graphs globaux et profonds (Client principaux avec 1000 fils, souscripcons et accords) Bénéfices & Ame frame - Architecture flexible et dynamique. - Performance excepconnelle. - Bas coût comparé aux autres alternacves. - Modèle de données extensible supportant l ajout de nouvelles applicacons et foncconnalités. SoluAon - Neo4j solucon entreprise. - Embarqué et haute disponibilité. - En remplacement de bases de données Oracles. vieilles de 10 ans, Berkeley DB et un environnement La société - Opérateur téléphonique leader dans les pays nordiques mainframe. 15

Etude de cas: GesCon commerciale de comptes DéfiniAon du problème - Règles complexes régissant la propriété des comptes. - Règles complexes de calcul des commissions - Requêtes complexes dues à la structure des RDBMS - Performances de la base de données Oracle insuffisante pour une gescon temps réel des comptes Bénéfices & Ame frame - Vue temps réel sur les comptes et leurs propriétaires - Capacité de modéliser des règles complexes pour la gescon de la propriété des comptes - Calcul des commissions automacque pour toute l organisacon commerciale - Environ 12 moins de développement SoluAon - 2 clusters Neo4J hautement disponibles - Un cluster en produccon un second en sauvegarde Société - Leader mondial de l infrastructure réseau - Vaste organisacon commerciale dans des Datacenter différents - Au total: 6 bases de données Neo4J Enterprise embarquées 16

Agenda A propos des graphes PrésentaCon de Neo Technology Cas d uclisacon clients et génériques Vision du marché Technologie Neo4j Cypher le «SQL» de Neo4j

Trend Tendance 1: Exponential n 1 : Croissance exponencelle du volume de données growth of data 1000 Exa- octets Exabytes of de new nouvelles unique données digital information uniques 750 500 250 0 2007 2008 2009 2010

Tendance n 2 : Explosion de la conneccvité des données

Volume x ConnecCvité = Complexité

Performance Couverture foncconnelle de SQL The Zone of SQL Adequacy Geo Social SQL database Requirement of application Salary List Network / Cloud Management ERP CRM MDM Data complexity

Agenda A propos des graphes PrésentaCon de Neo Technology Cas d uclisacon clients et génériques Vision du marché Technologie Neo4j Cypher le «SQL» de Neo4j

Neo4j Adapté aux données complexes: Volumineuses Fortement connectées Semi- structurées

CaractérisCques de Neo4j TransacCons Full ACID XA- compliant distributed two- phase commits Haute disponibilité / Scalabilité* master- slave réplicacon avec master Fail- over * Lecture Hautes performances en mémoire Caches évolués full ACID Langage des requêtes Cypher Java APIs JDBC Rest API Ruby

Agenda A propos des graphes PrésentaCon de Neo Technology Cas d uclisacon clients et génériques Vision du marché Technologie Neo4j Cypher le «SQL» de Neo4j

Cypher le langage SQL d interrogacon de Neo4j Basé sur du ACSII- Art A B (A) --> (B)

Cypher le langage SQL d interrogacon de Neo4j RelaAons A AIME B A -[:AIME]-> B

Cypher le langage SQL d interrogacon de Neo4j Les traversées de graphe A B C A --> B --> C

Cypher le langage SQL d interrogacon de Neo4j Les traversées Dynamiques de graphes A B A B A B A -[*]-> B

Cypher le langage SQL d interrogacon de Neo4j Exemple de recherche des amis d amis MATCH (john {name: 'John'})- [:friend]- >()- [:friend]- >(fof) RETURN john, fof

Merci Pour aller plus loin : Cédric Fauvet Votre contact en France E- mail : Cedric.fauvet@neotechnology.com TwiSer : @Neo4jFr Rencontrer la communauté Neo4j : www.meetup.com/graphdb- france www.meetup.com/graphdb- lyon www.meetup.com/graphdb- montpellier