Les participants repartiront de cette formation en ayant une vision claire de la stratégie et de l éventuelle mise en œuvre d un Big Data.



Documents pareils
AVRIL Au delà de Hadoop. Panorama des solutions NoSQL

Hadoop, les clés du succès

HADOOP ET SON ÉCOSYSTÈME

Offre formation Big Data Analytics

Labs Hadoop Février 2013

Anticiper et prédire les sinistres avec une approche Big Data

Groupe de Discussion Big Data Aperçu des technologies et applications. Stéphane MOUTON

Panorama des solutions analytiques existantes

L écosystème Hadoop Nicolas Thiébaud Tuesday, July 2, 13

Introduction Big Data

Bases de données documentaires et distribuées Cours NFE04

20 ans du Master SIAD de Toulouse - BigData par l exemple - Julien DULOUT - 22 mars ans du SIAD -"Big Data par l'exemple" -Julien DULOUT

Cartographie des solutions BigData

NoSQL. Introduction 1/23. I NoSQL : Not Only SQL, ce n est pas du relationnel, et le contexte. I table d associations - Map - de couples (clef,valeur)


NoSQL. Introduction 1/30. I NoSQL : Not Only SQL, ce n est pas du relationnel, et le contexte. I table d associations - Map - de couples (clef,valeur)

BIG DATA. Veille technologique. Malek Hamouda Nina Lachia Léo Valette. Commanditaire : Thomas Milon. Encadré: Philippe Vismara

Big Graph Data Forum Teratec 2013

Organiser vos données - Big Data. Patrick Millart Senior Sales Consultant

Hadoop dans l entreprise: du concept à la réalité. Pourquoi et comment?

Big data et données géospatiales : Enjeux et défis pour la géomatique. Thierry Badard, PhD, ing. jr Centre de Recherche en Géomatique

Ricco Rakotomalala R.R. Université Lyon 2

Big Data Concepts et mise en oeuvre de Hadoop

Programmation parallèle et distribuée

Les technologies du Big Data

Programmation parallèle et distribuée

Big Data On Line Analytics

Formation Cloudera Data Analyst Utiliser Pig, Hive et Impala avec Hadoop

Les quatre piliers d une solution de gestion des Big Data

Pentaho Business Analytics Intégrer > Explorer > Prévoir

Acquisition des données - Big Data. Dario VEGA Senior Sales Consultant

Qu est ce qu une offre de Cloud?

Big Data. Cyril Amsellem Consultant avant-vente. 16 juin Talend

11/01/2014. Le Big Data Mining enjeux et approches techniques. Plan. Introduction. Introduction. Quelques exemples d applications

Les bases de données relationnelles

Vos experts Big Data. Le Big Data dans la pratique

Titre : La BI vue par l intégrateur Orange

NoSQL : hype ou innovation? Grégory Ogonowski / Recherches Octobre 2011

Change the game with smart innovation

Document réalisé par Khadidjatou BAMBA

Ecole des Hautes Etudes Commerciales HEC Alger. par Amina GACEM. Module Informatique 1ière Année Master Sciences Commerciales

Fouillez facilement dans votre système Big Data. Olivier TAVARD

Déploiement d une architecture Hadoop pour analyse de flux. françois-xavier.andreu@renater.fr

VirtualScale L expert infrastructure de l environnement Open source HADOOP Sofiane Ammar sofiane.ammar@virtualscale.fr

Ne cherchez plus, soyez informés! Robert van Kommer

SpagoBI: la seule suite décisionnelle 100% open source, complète et flexible

FINI LA RÉCRÉ PASSONS AUX MÉGADONNÉES

accompagner la transformation digitale grâce au Big & Fast Data Orange Business Services Confidentiel 02/10/2014

FORUM NTIC BIG DATA, OPEN DATA Big Data: les challenges, les défis

Formation continue. Ensae-Ensai Formation Continue (Cepe)

Big Data -Comment exploiter les données et les transformer en prise de décisions?

Les enjeux du Big Data Innovation et opportunités de l'internet industriel. Datasio 2013

Masses de données. 1. Introduction 2. Problématiques 3. Socle de formation (non présenté) 4. Liens avec Formation INSA

DEMARRER UN PROJET BIGDATA EN QUELQUES MINUTES GRACE AU CLOUD

Big Data: comment passer de la stratégie à la mise en œuvre? Big Data Paris Mars 2015

Analytics & Big Data. Focus techniques & nouvelles perspectives pour les actuaires. Université d Eté de l Institut des Actuaires Mardi 8 juillet 2014

Les Rencontres TIC de La Mêlée Numérique. Big Data & Cloud Computing : les nouveaux enjeux

WD et le logo WD sont des marques déposées de Western Digital Technologies, Inc, aux États-Unis et dans d'autres pays ; absolutely WD Re, WD Se, WD

Programmation parallèle et distribuée (Master 1 Info )

Entreprise et Big Data

AXIAD Conseil pour décider en toute intelligence

Stratégie et Vision de SAP pour le secteur Banque- Assurance: Data-Management, BI, Mobilité

BIG DATA en Sciences et Industries de l Environnement

Quels choix de base de données pour vos projets Big Data?

Introduction au Data-Mining

Performances Veille. Système d Information. Semaine 25 du 18 au 24 juin Numéro 228

Transformation IT de l entreprise BIG DATA, MÉTIERS ET ÉVOLUTION DES BASES DE DONNÉES

BIG DATA et DONNéES SEO

Bases de données documentaires et distribuées Cours NFE04

Big Data et Graphes : Quelques pistes de recherche

SÉRIE NOUVELLES ARCHITECTURES


Le nouveau visage de la Dataviz dans MicroStrategy 10

La rencontre du Big Data et du Cloud

Le BIG DATA????? Big Buzz? Big Bang? Big Opportunity? Big hype? Big Business? Big Challenge? Big Hacking? Gérard Peliks planche 2

armez-vous La digitalisation est une guerre mondiale LIVRE BLANC Le Big Data, sans tabou ni fausse promesse Ingénieur, Docteur en STIC

Le potentiel et les défis du Big Data. Mardi 2 et Mercredi 3 Juillet 2013


1 er Avril 2015 Data Science & Big Data Etat de l art Donner plus d intelligence aux données

Surmonter les 5 défis opérationnels du Big Data

Big Data. Concept et perspectives : la réalité derrière le "buzz"

Big Data Jean-Michel Franco

LES ENJEUX DU BIG DATA

Le BigData, aussi par et pour les PMEs

Livre. blanc. Solution Hadoop d entreprise d EMC. Stockage NAS scale-out Isilon et Greenplum HD. Février 2012

Les journées SQL Server 2013

Cassandra chez Chronopost pour traiter en temps réel 1,5 milliard d événements par an

Big Data : utilisation d un cluster Hadoop HDFS Map/Reduce HBase

1 Actuate Corporation de données. + d analyses. + d utilisateurs.

M2 GL UE DOC «In memory analytics»

Le traitement du Big Data inclue la collecte, la curation, le stockage, l enrichissement, le croisement, la partage, l analyse et la visualisation.

Webinar EBG Nouvelles perspectives d'exploitation des données clients avec le big data

Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours

Big Data. SRS Day Ali FAWAZ Etienne CAPGRAS. Membres du groupe : Coaché par :

SQL Server 2012 et SQL Server 2014


Introduction à MapReduce/Hadoop et Spark

Technologies du Web. Ludovic DENOYER - ludovic.denoyer@lip6.fr. Février 2014 UPMC

Prototypage et évaluation de performances d un service de traçabilité avec une architecture distribuée basée sur Hadoop

Machine Learning 9:HSMBKA=\WU\YX: Big Data et machine learning. Manuel du data scientist. InfoPro

Transcription:

Big Data De la stratégie à la mise en oeuvre Description : La formation a pour objet de brosser sans concession le tableau du Big Data. Les participants repartiront de cette formation en ayant une vision claire de la stratégie et de l éventuelle mise en œuvre d un Big Data. Objectifs Présentation du Big Data Stockage du Big Data Techniques et outils d'analyse et de traitement du Big Data Le traitement des Big Data L accès des données en temps réel La protection des données Mise en œuvre d'une stratégie dédiée au Big Data Publics Architectes, Chefs de Projet, Directeur informatique, DSI Formez-vous autrement Tél : 02-40-85-19-32 projet@nimbus-training.fr NIMBUS TRAINING Durée 3 jours Pré-requis Un niveau technique minimal et de management des SI sont requis pour tirer pleinement parti de cette formation.

Programme de cette formation Définition Les quatre dimensions du Big Data : volume, vélocité, variété, véracité Présentation de l'ensemble MapReduce, stockage et requêtes Améliorer les résultats de l'entreprise grâce au Big Data Mesurer l'importance du Big Data au sein d'une entreprise Big Data et la performance de l entreprise Clients, produits, processus, infrastructures : les nouveaux enjeux de performance des entreprises. L analyse des données au service de la performance : comment identifier les nouveaux leviers de performance? En quoi Big Data est un enjeu de performance pour les entreprises et les organisations? Réussir à extraire des données utiles Intégrer le Big Data aux données traditionnelles Sources de données publiques et privées Panorama des données publiques disponibles (Open Data) : données économiques, données individuelles, données produits. Comment exploiter les données des réseaux sociaux? La perception des tendances de marché : l analyse des sentiments du marché et des influences. Comment croiser données publiques et privées? Traitements des données non structurées Les types de données non structurées : message, document, semi-structuré. Les principes de l analyse sémantique : sentiment, univers, corrélation. Les outils d analyse sémantique et de recherche de corrélations. Machine Learning pour les données Les principales méthodes descriptives et prédictives. Le Machine Learning : arbre de décision, règle d association, Support Vector Machines. Les spécificités du Machine Learning pour le Big Data : haute dimension, occurrences élevées. Les meilleures pratiques pour le Machine Learning : cross-validation, grid search, semi-supervision. Domaines d application privilégiés : marketing, finance, e-commerce. Visualisation des données à valeur ajoutée Les limites des outils traditionnels d analyse de données : Excel, BO, etc. Comment représenter efficacement des données analytiques? Les outils et composants de visualisation des données Big Data.Analyser les Analyser les caractéristiques de vos données Sélectionner les sources de données à analyser Supprimer les doublons Définir le rôle de NoSQL Partitionnement des données NoSQL : répartition sur les nœuds, redondance, élasticité. La granularité de cohérence des données : les différents niveaux de cohérence. 2

Présentation des entrepôts de Big Data Modèles de données : valeur clé, graphique, document, famille de colonnes Système de fichiers distribué Hadoop (HDFS) La technologie HDFS : principes et fonctionnement. Manipulation des données : Hive, Pig, Streaming, SQL/Hadoop Choisir un entrepôt de Big Data Choisir un entrepôt de données en fonction des caractéristiques de vos données Injecter du code dans les données, mettre en œuvre des solutions de stockage des données multilingues Choisir un entrepôt de données capable de s'aligner avec les objectifs de l'entreprise Archivage et sécurité L évolution de l archivage pour les Big Data. Comment maintenir la compatibilité dans le temps? La réplication sur plusieurs datacenters et le filtrage intelligent. Infrastructure de stockage Anatomie d un datacenter de stockage Big Data : enjeux de coûts et de capacité. Quelles sont les contraintes hardware? Système, stockage, réseau, place. Commodity hardware ou hardware spécialisé? Les critères du choix. Technologies Big Data et Cloud Computing : comment utiliser les offres de Cloud publiques et privées? Introduction à NoSQL Le paradigme NoSql NoSql et la scalabilité «no SQL» vs «Not Only SQL» Les types de bases de données NoSql (stockage clé-valeur, graphe, Map-Reduce,...) Introduction à Hadoop Qu est ce qu Hadoop? L écosystème Hadoop : Pig, Hive, HBase, Zookeeper... Comprendre MapReduce et HDFS (Hadoop Distributed File System) S assurer de l intégrité des données (checksum...) Gagner de la place : compression des données d entrée/sortie dans Hadoop L'Openstack (Ceph) Le Complex Event Processing Programmation parallèle Les limites de la programmation séquentielle traditionnelle. Les objectifs et les contraintes de la programmation parallèle. Les différents types de système de traitements parallèles : Grid, GPU et multi-core. Architecture Grid Computing Architecture d une grille de calculs. 3

Comment accéder aux données dans une grille de calculs? Les avantages et les limites du Grid Computing. Architecture GPU et multi-core Comprendre les évolutions CPU et GPU : panorama des évolutions. Les architectures GPU et leurs limites. Les architectures multi-core et leurs limites. Machine Learning en environnement parallèle Les contraintes de parallélisme des algorithmes de Machine Learning. Les librairies de Machine Learning : Mahout, Hama, Scikit Learn, R. Bases de données distribuées, NoSQL et InMemory Quelles bases de données choisir : InMemory, Verticale, NoSQL? Les bases de données Clé/Valeur : SimpleDB, Riak, Redis. Les bases de données Document : MongoDB, CouchDB. Les bases de données Colonne : HBase, Cassandra, XVelocity. Les bases de données Graphe : Neo4j, HyperGraphDB. Le transactionnel Big Data Comment faire converger système opérationnel et Machine Learning? Comment gérer l apprentissage permanent? Temps reel avec Hadoop : Stinger, Impala, Drill. Convergence Hadoop. MPP : MS Polybase, Asterdata. Le streaming en grille : Storm Les techniques de streaming. Les outils du marché CEP pour Big Data : Storm. Concevoir des applications pour la prise de décision en temps réel avec Storm. Le streaming pour le Big Data Comment collecter et contrôler les données au fil de l eau, avec un grand débit? Comment gérer les chargements en masse? Les technologies low latency messaging : Kafka. Les caractéristiques du streaming dans un environnement Big Data. Le streaming en grille : Storm Les techniques de streaming. Les outils du marché CEP pour Big Data : StreamInsight, Storm. Comment concevoir des applications pour la prise de décision en temps réel? Relations entre Cloud et Big Data Motivations des Clouds publics et privés. Les services XaaS. 4

Les objectifs et avantages des architectures Clouds. les infrastructures. Les égalités et les différences entre Clouds et Big Data. Les Clouds de stockage. Élaborer une stratégie dédiée au Big Data Définir les besoins en matière de Big Data Atteindre les objectifs grâce à la pertinence des données Évaluer les différents outils du marché dédiés au Big Data Répondre aux attentes du personnel de l'entreprise Une méthode analytique innovante Identifier l'importance des traitements métier Cerner le problème Choisir les bons outils Obtenir des résultats exploitables Analyse statistique du Big Data Exploiter la fonctionnalité RHadoop Générer des états statistiques avec RHadoop Utiliser la visualisation RHadoop Exploiter les résultats des analyses L efficacité des diverses technologies La conservation dans le temps face aux accroissements de volumétrie. La sauvegarde, en ligne ou locale? L'archive traditionnelle et l'archive active. Les liens avec la gestion de hiérarchie de stockage : avenir des bandes magnétiques. La réplication multisites. La dégradation des supports de stockage Classification, sécurité et confidentialité des données La structure comme critère de classification : non structurées, structurées, semi structurées. Selon le cycle de vie : temporaires, permanentes, archives actives. Difficultés supplémentaires liées aux augmentations de volumétries. Les solutions potentielles. Mettre en œuvre une solution Big Data Bien choisir les fournisseurs et options d'hébergement Trouver le juste équilibre entre les coûts engendrés et la valeur apportée à l'entreprise Garder une longueur d'avance Rôle de la DSI dans Big Data La DSI comme fournisseur de services IT ou fournisseur de données à valeur ajoutée? Comment, concrètement, le DSI peut-il saisir l opportunité Big Data? Quels sont les nouveaux challenges pour la DSI? Les acteurs métier et leurs rôles. 5

La gouvernance et les indicateurs de pilotage du projet. Création de valeur à partir des données Comment identifier les données à valeur ajoutée? Comment tirer profit des données clients, produits ou de suivi? L'anticipation, la sécurité et les recommandations. Analyses marketing et analyses d'impact. Distribution de la donnée. PRA. Recours aux Clouds publics Quel avenir pour les données? Gouvernance du stockage dans l'entreprise? Grille d analyse de la valeur des données et des objectifs d analyse. 6