Organiser vos données - Big Data. Patrick Millart Senior Sales Consultant



Documents pareils
Acquisition des données - Big Data. Dario VEGA Senior Sales Consultant

Copyright 2013, Oracle and/or its affiliates. All rights reserved.

Sécurité de bout en bout Une solution complète pour protéger les données et prévenir les risques

Engineered for Business: Oracle Hardware for Oracle Database

EXALOGIC ELASTIC CLOUD MANAGEMENT

ADMINISTRATION EXADATA

FOURNIR UN SERVICE DE BASE DE DONNÉES FLEXIBLE. Database as a Service (DBaaS)

Copyright 2013, Oracle and/or its affiliates. All rights reserved.

GESTION DU CYCLE DE VIE. Albert Amar Avant-vente Middleware

Cartographie des solutions BigData

Déployer et sécuriser des applica1ons mobiles dans votre SI / Cloud

Copyright 2014, Oracle and/or its affiliates. All rights reserved.

ORACLE PAAS CLOUD MANAGEMENT

La famille Symphony. Click to add text. Vincent Perrin IBM Collaboration Solutions Architect IBM Corporation

GESTION DE LA PERFORMANCE. Albert Amar Avant-vente Middleware

Formation Cloudera Data Analyst Utiliser Pig, Hive et Impala avec Hadoop

Big Data. Cyril Amsellem Consultant avant-vente. 16 juin Talend

Hadoop, les clés du succès

PERFORMANCE BASE DE DONNÉES

Copyright 2014, Oracle and/or its affiliates. All rights reserved.

Les participants repartiront de cette formation en ayant une vision claire de la stratégie et de l éventuelle mise en œuvre d un Big Data.

Safe Harbor Statement

Programmation parallèle et distribuée

Programmation parallèle et distribuée

Big Data : utilisation d un cluster Hadoop HDFS Map/Reduce HBase

VirtualScale L expert infrastructure de l environnement Open source HADOOP Sofiane Ammar sofiane.ammar@virtualscale.fr

Webcast user group: 9.0 Distribution / Production

<Insert Picture Here> Exadata Storage Server et DB Machine V2

Panorama des solutions analytiques existantes

Gestion de clusters de calcul avec Rocks

Les technologies du Big Data

Le projet Gaïa, le Big Data au service du traitement de données satellitaires CRIP - 16/10/2013 Pierre-Marie Brunet

API04 Contribution. Apache Hadoop: Présentation et application dans le domaine des Data Warehouses. Introduction. Architecture

Introduction aux algorithmes MapReduce. Mathieu Dumoulin (GRAAL), 14 Février 2014

Les enjeux du Big Data Innovation et opportunités de l'internet industriel. Datasio 2013

Programmation parallèle et distribuée (Master 1 Info )

Cassandra et Spark pour gérer la musique On-line

Retour d Oracle OpenWorld 2012

BIG DATA en Sciences et Industries de l Environnement

20 ans du Master SIAD de Toulouse - BigData par l exemple - Julien DULOUT - 22 mars ans du SIAD -"Big Data par l'exemple" -Julien DULOUT

en SCÈNE RATIONAL Rational Démonstration SDP : automatisation de la chaîne de développement Samira BATAOUCHE sbataouche@fr.ibm.com

Offre formation Big Data Analytics

MapReduce. Malo Jaffré, Pablo Rauzy. 16 avril 2010 ENS. Malo Jaffré, Pablo Rauzy (ENS) MapReduce 16 avril / 15

HADOOP ET SON ÉCOSYSTÈME

Change the game with smart innovation

Quick Start Guide This guide is intended to get you started with Rational ClearCase or Rational ClearCase MultiSite.

Business Intelligence, Etat de l art et perspectives. ICAM JP Gouigoux 10/2012

BIG Data et R: opportunités et perspectives

Introduction à MapReduce/Hadoop et Spark

Technologies du Web. Ludovic DENOYER - ludovic.denoyer@lip6.fr. Février 2014 UPMC

Anticiper et prédire les sinistres avec une approche Big Data

Ricco Rakotomalala R.R. Université Lyon 2

Pascale Borla-Salamet Consultante Avant Vente Oracle France. Oracle Exadata Performance et Optimisation de votre Datawarehouse

Thomas Loubrieu (Ifremer) Small to Big Data Novembre 2013, Ifremer, Brest

Surmonter les 5 défis opérationnels du Big Data

Fouillez facilement dans votre système Big Data. Olivier TAVARD

Fouille de données massives avec Hadoop

Comment valoriser votre patrimoine de données?

Le nouveau visage de la Dataviz dans MicroStrategy 10

Plug into the Cloud with Oracle Database 12

M2 GL UE DOC «In memory analytics»

ACCOMPAGNER L EXPLOSION DES VOLUMES DE DONNEES : LES NOUVEAUX ENJEUX DU STOCKAGE

Augmenter la disponibilité des applications JEE grâce au clustering : Le projet open source JShaft

R+Hadoop = Rhadoop* Des logiciels libres complémentaires, une implémentation, une réponse au nouveau paradigme du bigdata!

Groupe de Discussion Big Data Aperçu des technologies et applications. Stéphane MOUTON

PACKZ System Requirements. Version: Version: Copyright 2015, PACKZ Software GmbH. 1

Programme New BI. Décember Thierry Milhé, Directeur des Systèmes d Information Sagem Défense Sécurité (groupe Safran)

Kick Off SCC EMC l offre EXTREMIO. fmarti@fr.scc.com Philippe.rolland@emc.com. Vers de nouveaux horizons

Accélérez vos tests et développements avec le Cloud, découvrez SoftLayer, la dernière acquisition Cloud d'ibm

Big Data, un nouveau paradigme et de nouveaux challenges

W4 - Workflow La base des applications agiles

Prototypage et évaluation de performances d un service de traçabilité avec une architecture distribuée basée sur Hadoop

AVRIL Au delà de Hadoop. Panorama des solutions NoSQL

Les quatre piliers d une solution de gestion des Big Data

Déploiement d une architecture Hadoop pour analyse de flux. françois-xavier.andreu@renater.fr

Consolidation. Grid Infrastructure avec la 11gR2

Hadoop dans l entreprise: du concept à la réalité. Pourquoi et comment?

<Insert Picture Here> Solaris pour la base de donnés Oracle

Le BigData, aussi par et pour les PMEs

Big Data Jean-Michel Franco

KIT DE DÉMARRAGE SHAREPOINT DANS MICROSOFT AZURE

Labs Hadoop Février 2013

Cloud Computing : Utiliser Stratos comme PaaS privé sur un cloud Eucalyptus

EMC Forum EMC ViPR et ECS : présentation des services software-defined

NoSQL. Introduction 1/30. I NoSQL : Not Only SQL, ce n est pas du relationnel, et le contexte. I table d associations - Map - de couples (clef,valeur)

Big Data On Line Analytics

Big Data. Les problématiques liées au stockage des données et aux capacités de calcul

Forward! 3.0. Antony Vo, Architecte Infrastructure SI, Unisys

Hadoop, Spark & Big Data 2.0. Exploiter une grappe de calcul pour des problème des données massives

CENTAI : Big Data & Big Analytics Réunion DGPN / Thales Octobre 2013

Systèmes Répartis. Pr. Slimane Bah, ing. PhD. Ecole Mohammadia d Ingénieurs. G. Informatique. Semaine Slimane.bah@emi.ac.ma

Architecture distribuée

Un système intégré totalement redondant

LE BIG DATA. TRANSFORME LE BUSINESS Solution EMC Big Data

Bases de données documentaires et distribuées Cours NFE04

Stéphane DERACO, DSI CNRS l Argos Devops : de l hyperviseur aux conteneurs l 11/12/2014 DOCKER

Transcription:

Organiser vos données - Big Data Patrick Millart Senior Sales Consultant

The following is intended to outline our general product direction. It is intended for information purposes only, and may not be incorporated into any contract. It is not a commitment to deliver any material, code, or functionality, and should not be relied upon in making purchasing decisions. The development, release, and timing of any features or functionality described for Oracle s products remains at the sole discretion of Oracle.

Big Data en Action DECISION ANALYSE ACQUISITION ORGANISATION Prendre de Meilleures Décisions en Utilisant Big Data

Big Data en Action DECISION ANALYSE ACQUISITION ORGANISATION Organiser et Répartir vos Big Data en utilisant une architecture massivement parallèle

Nouvelles sources de données

Utilisation des données Challenge Nouvelles sources Transformation Comprendre l activité en ligne d un site web Logs Web «Sessionization» Comprendre les causes de défaillance Prioriser les réponses aux clients Mesures de capteurs Medias Sociaux Identifier les exceptions, les tendances Analyse des sentiments

Architecture Hadoop Management/Monitoring Système de fichiers distribué MapReduce Paradigme de programmation Map/Reduce Traitement des données hautement scalable Hadoop Distributed File System (HDFS)

Exemple de traitement MapReduce SHUFFLE /SORT

Utilisation de Map/Reduce pour lire les données INPUT 1 OUTPUT 1 SHUFFLE /SORT SHUFFLE /SORT INPUT 2 SHUFFLE /SORT SHUFFLE /SORT SHUFFLE /SORT OUTPUT 2

Analyse des sentiments Conversion d un fichier Sentiment Semaine Fréquence Positif 17 3 Positif 18 5 Négatif 18 8

Analyse de la tendance hebdomadaire des sentiments Parcourir tous les fichiers Pour chaque fichier, une liste de sentiments ainsi que leur fréquence sont exprimés par semaine Parcourir la liste des mots avec leur occurrence Pour chaque nœud, une liste de sentiments ainsi que le nombre d occurrences exprimés par semaine Parcourir tous les noeuds Une liste des sentiments et leur fréquence sont exprimés par semaine pour l'ensemble du cluster

Oracle Loader pour Hadoop Utilise les ressources du cluster Big Data ORACLE LOADER POUR HADOOP SHUFFLE /SORT Dernière étape dans le workflow MapReduce Tables standards et partitionnées SHUFFLE /SORT Chargement direct ou en mode déconnecté

Oracle Direct Connector pour HDFS Accès direct depuis la base de données Oracle HDFS Oracle Database Table Externe Requête SQL SQL accès pour HDFS Table externe Oracle Requête SQL ou import Infini Band DCH DCH DCH HDFS Client

Compétences requises pour développer des traitements MapReduce Java Environnement Hadoop Algorithmes parallèles

Oracle Data Integrator - ODI Simplifier MapReduce Oracle Data Integrator Oracle Loader pour Hadoop Génère automatiquement le code MapReduce Gère le processus Charge les données dans votre Data Warehouse

Oracle Data Integrator - ODI Interface graphique Modélisation graphique des flux de bout en bout Utilisation de modules de connaissance (templates fournis) pour générer automatiquement le code MapReduce

Plate-forme Oracle Big Data Big Data Appliance Exadata Exalytics Oracle Big Data Connectors ACQUISITION ORGANISATION ANALYSE DECISION

Oracle Big Data Appliance Hardware: 216 intel cores, 864 GB RAM, 648 TB disk 40 Gb/s InfiniBand, inter-rack, node connectivity 10 Gb/s Ethernet, data center connectivity System Software: Oracle Linux, Oracle Java Hotspot VM Oracle NoSQL Database Community Edition Cloudera s Distribution including Apache Hadoop Oracle Big Data Connectors and ODI * Open-source R distribution

Organiser Big Data Organiser les données Big Data avec Hadoop Simplifier le développement Simplifier le déploiement Découvrir de la valeur par l analyse