DEMARRER UN PROJET BIGDATA EN QUELQUES MINUTES GRACE AU CLOUD



Documents pareils
BIG DATA et DONNéES SEO

HADOOP ET SON ÉCOSYSTÈME

Cartographie des solutions BigData

Anticiper et prédire les sinistres avec une approche Big Data

Panorama des solutions analytiques existantes

20 ans du Master SIAD de Toulouse - BigData par l exemple - Julien DULOUT - 22 mars ans du SIAD -"Big Data par l'exemple" -Julien DULOUT

Le BigData, aussi par et pour les PMEs

Entreprise et Big Data

L écosystème Hadoop Nicolas Thiébaud Tuesday, July 2, 13

Cassandra et Spark pour gérer la musique On-line

Fouillez facilement dans votre système Big Data. Olivier TAVARD

Labs Hadoop Février 2013

Les enjeux du Big Data Innovation et opportunités de l'internet industriel. Datasio 2013

Hadoop dans l entreprise: du concept à la réalité. Pourquoi et comment?

Hadoop, les clés du succès

Big data et données géospatiales : Enjeux et défis pour la géomatique. Thierry Badard, PhD, ing. jr Centre de Recherche en Géomatique

QlikView et Google Big Query : Une réponse simple, rapide et peu coûteuse aux analyses Big Data

Le traitement du Big Data inclue la collecte, la curation, le stockage, l enrichissement, le croisement, la partage, l analyse et la visualisation.

Les participants repartiront de cette formation en ayant une vision claire de la stratégie et de l éventuelle mise en œuvre d un Big Data.

1 Actuate Corporation de données. + d analyses. + d utilisateurs.

accompagner la transformation digitale grâce au Big & Fast Data Orange Business Services Confidentiel 02/10/2014

Offre formation Big Data Analytics

Big Data Concepts et mise en oeuvre de Hadoop

Big Data. Cyril Amsellem Consultant avant-vente. 16 juin Talend

Innovative BI with SAP Jean-Michel JURBERT D. de Marché BI, HANA, BIG DATA _ SAP France

AVRIL Au delà de Hadoop. Panorama des solutions NoSQL

LEVER L ANONYMAT AUDIENCE ANALYTICS. Online Intelligence Solutions

ATELIER. QUASAR OBILOG BI (Décisionnel) ATELIER > PROJET BI

Les technologies du Big Data

Surmonter les 5 défis opérationnels du Big Data

BIG DATA : une vraie révolution industrielle (1) Les fortes évolutions liées à la digitalisation

Déploiement d une architecture Hadoop pour analyse de flux. françois-xavier.andreu@renater.fr

DocForum 18 Juin Réussites d un projet Big Data Les incontournables

Vos experts Big Data. Le Big Data dans la pratique

Online Intelligence Solutions! AUDIENCE ANALYTICS

BI SWISS FORUM (ecom / SITB)

Catherine Chochoy. Alain Maneville. I/T Specialist, IBM Information Management on System z, Software Group

L Art d être Numérique. Thierry Pierre Directeur Business Development SAP France

LES ENJEUX DU BIG DATA

Ne cherchez plus, soyez informés! Robert van Kommer

SEMINAIRE SAS VISUAL ANALYTICS LAUSANNE, MARCH 18 : JÉRÔME BERTHIER VALERIE AMEEL


Stephan Hadinger, Sr. Mgr Solutions Architecture, AWS. Salon du Big Data 11 mars 2015

Big Data : Quel usage au sein des projetsinternet?

Cloud et SOA La présence du Cloud révolutionne-t-elle l approche SOA?

Big Graph Data Forum Teratec 2013

Le nouveau visage de la Dataviz dans MicroStrategy 10

Cookies de session ils vous permettent de sauvegarder vos préférences d utilisation et optimiser l expérience de navigation de l Utilisateur ;

DÉPLOIEMENT DE QLIKVIEW POUR DES ANALYSES BIG DATA CHEZ KING.COM

M2 GL UE DOC «In memory analytics»


Introduction à MapReduce/Hadoop et Spark

SAP HANA : BIEN PLUS QU UNE BASE DE DONNÉES EN MÉMOIRE. Jean-Michel JURBERT Chef de Marché SAP France

Introduction Big Data

Pilot4IT Tableaux de Bord Agréger et consolider l ensemble de vos indicateurs dans un même portail.

Acquisition des données - Big Data. Dario VEGA Senior Sales Consultant

tech days AMBIENT INTELLIGENCE

Big Data et l avenir du décisionnel

Hébergement MMI SEMESTRE 4

SAP Runs SAP Reporting Opérationnel & BI avec HANA et SAP Analytics. Pierre Combe, Enterprise Analytics Juin, 2015

MANAGEMENT DES SERVICES INFORMATIQUES

Monétisation des données : comment identifier de nouvelles sources de revenus au sein des Big data?

Tests de SlipStream sur les plateformes et : vers la. Vers la fédération du Cloud computing

Séminaire Partenaires Esri France 7-8 juin Paris Cloud Computing Stratégie Esri

Data 2 Business : La démarche de valorisation de la Data pour améliorer la performance de ses clients

Les datas = le fuel du 21ième sicècle

Objectif et contexte business : piliers du traitement efficace des données -l exemple de RANK- Khalid MEHL Jean-François WASSONG 10 mars 2015

Analytics Platform. MicroStrategy. Business Intelligence d entreprise. Self-service analytics. Big Data analytics.

BI dans les nuages. Olivier Bendavid, UM2 Prof. A. April, ÉTS

Stratégie et Vision de SAP pour le secteur Banque- Assurance: Data-Management, BI, Mobilité

QLIKVIEW ET LE BIG DATA

Opportunités et enjeux à l heure du Cloud, du Big Data, de la mobilité et du Social Business

Les journées SQL Server 2013

DU RÉSEAU AU BIG DATA UNE OFFRE GLOBALE DE GESTION DE LA DONNÉE. Bruno Fleisch - Responsable Produits Tarik Hakkou Responsable du pôle «Data»

Cloud Computing Stratégie IBM France

Big Data et Marketing : les competences attendues

Suite Jedox La Business-Driven Intelligence avec Jedox

Big Data -Comment exploiter les données et les transformer en prise de décisions?

Pentaho Business Analytics Intégrer > Explorer > Prévoir

BIG DATA en Sciences et Industries de l Environnement

Big Data : utilisation d un cluster Hadoop HDFS Map/Reduce HBase

BIGDATA AN 3 : UNE NOUVELLE ERE DE B.I.

Safe Harbor Statement

FORUM NTIC BIG DATA, OPEN DATA Big Data: les challenges, les défis

Atelier WEB20 : IBM WebSphere CAST IRON

Bigdata et Web sémantique. les données + l intelligence= la solution

DEMARREZ RAPIDEMENT VOTRE EVALUATION

Le Tag Management à l ère du Smart Data

LE BIG DATA. TRANSFORME LE BUSINESS Solution EMC Big Data

Programme TechDay Romandie

Séminaire Partenaires Esri France 6 et 7 juin 2012 Paris. ArcGIS et le Cloud. Gaëtan LAVENU

CAST IRON. Une plateforme d intégration complète pour connecter l Entreprise avec le Cloud. Magali Boulet IT Specialist magali.boulet@fr.ibm.

La rencontre du Big Data et du Cloud

Le cloud computing au service des applications cartographiques à haute disponibilité

Change the game with smart innovation

Cloud Computing : Utiliser Stratos comme PaaS privé sur un cloud Eucalyptus

Internet des Objets : le point de vue de Microsoft

Surabondance d information

Quel logiciel DE CRM choisir pour votre force de vente terrain?

PERFORMANCE BASE DE DONNÉES

Transcription:

DEMARRER UN PROJET BIGDATA EN QUELQUES MINUTES GRACE AU CLOUD BIGDATA PARIS LE 1/4/2014 VINCENT HEUSCHLING @VHE74! 1

NOUS 100% Bigdata Infrastructure IT + Data Trouver vos opportunités Implémenter les infrastructures 2

COMPÉTENCES 1 Business 2 Data 3 Infrastructures Comprendre le métier des clients Imaginer de nouveaux leviers de compétitivité Transformer les business models Analyser les données Corrélations Algos prédictifs Machine Learning Mixer les sources de données Intégrations des technologies Bigdata Mise en oeuvre d infrastructures complètes Développement d applications spécifiques Expertise Cloud & Devops Projet, Accompagnement, Transfert de compétences 3

DÉMARRER UN PROJET BIGDATA Comment? Combien de temps? Quels investissements? 4

OPTIONS D INFRASTRUCTURE Infrastructure on-premise Infrastructure dans le Cloud Plateforme Cloud 5

OPTIONS D INFRASTRUCTURE Infrastructure on-premise Infrastructure dans le Cloud Plateforme Cloud 6

OPTIONS D INFRASTRUCTURE Infrastructure on-premise Infrastructure dans le Cloud Plateforme Cloud 7

CONSTRUIRE UN DATA-PIPELINE Collecter Open-data Data-Visualisation Exploration Agrégation Croisement Machine Learning 2014 2013 Affini-Tech -- Diffusion restreinte 8

COLLECTER Aspirer des cookies API Rest Recevoir des fichiers S abonner à un Stream Requêter une base de données / une API 9

EXPLORER, TRANSFORMER Console Rstudio Hadoop Machine Learning Mahout, Python, R, Spark 10

PARTAGER, VISUALISER Base de données Analytiques Data-Applications Data-Visualisations 11

2014 2013 Affini-Tech -- Diffusion restreinte 12 +

USE CASE : SMART METERING GCS? BigQuery 13

USE CASE : SMART METERING GCS BigQuery 14

DEMO Logs Processing Datasets Visualisation Storage Compute Bigquery 15

UTILISATION DE GHADOOP paramètres du cluster hadoop : - Ou sont stockées les données? - Combien de noeuds? - Quel type de VM? - Choix des composants hadoop? paramètres du connecteur Biqquery en 3 minutes 30, le cluster Hadoop est prêt à l emploi avec Pig, Mahout,etc installé. 16

CONNECTION ET UTILISATION DE PIG 17

CONTRÔLE DU JOB SUR LE JOBTRACKER 18

VÉRIFICATION DES RÉSULTATS ET EXPORT DANS BIGQUERY 19

EXPLOITATION DES DONNEES DANS TABLEAU 20

EXPLOITATION DES DONNEES DANS TABLEAU 21

POUR RESUMER en 15 minutes on a :! - Instancié des VM et déployé un cluster Hadoop - Vérifié les données qui avaient été chargées dans Google Cloud Storage - Exécuté un script Pig - Chargé une table dans Bigquery - Connecté Tableau pour visualiser les données! Le tout pour moins de 1 euro!!! 22

UNE PLATEFORME DE DATA MANAGEMENT AUTOUR D HADOOP 23

Realtime complex event processing Trackers & Connectors Google Appengine (autoscale) Google Storage Google Compute Batch & Machine Learning jobs http:// spark.incubato r.apache.org/ Bigquery 2014 2013 Affini-Tech -- Diffusion restreinte

Web Apps Logs Analytics Transactions / CRM Opendata Réseaux sociaux Personnalisation Recommandation Datavisualisation Dashboards Google Cloud Storage Elasticsearch Graph Google Bigquery Outils statistiques R Machine Learning Hadoop Spark in memory 25

POINTS ESSENTIELS Peu couteux en termes de plateforme ( à partir de 1000 /mois) Des projets de taille raisonnables (de 15 à 30 jours) La rupture technologique et le cout permettent d envisager de nouveaux projets Améliorez une BI traditionnelle, en complétant celle-ci. 26

MERCI! Vincent Heuschling Gsm : 06 61 88 76 71 Email : vhe@affini-tech.com Web : http://www.affini-tech.com Twitter : @affinitech & @vhe74 2014 Affini-Tech - Diffusion 2013 restreinte Affini-Tech - Diffusion restreinte 27