Cassandra et Spark pour gérer la musique On-line
|
|
- Marie-Thérèse Sergerie
- il y a 8 ans
- Total affichages :
Transcription
1 Cassandra et Spark pour gérer la musique On-line 16 Juin Paris Hammed RAMDANI Architecte SI 3.0 et BigData mramdani@palo-it.com
2 Appelez-moi Hammed ;-) (Sidi Mo)Hammed Consultant chez Architecte SI 3.0 et BigData Trained Pig & Hive developer Coach Agile Innovation Games trained facilitator Speaker 2
3 Dream BIG and make IT happen! PALO IT est un cabinet de conseil en stratégie d innovation et réalisation numérique. Notre approche : Insuffler un esprit de Start-up; Identifier les technologies et les usages créateurs de nouveaux business models; Accélérer votre Go-To-Market par l adoption d une organisation Lean & Agile. Créée en 2009, PALO IT regroupe une communauté de 160 talents de plus de 20 nationalités, passionnés par l Agilité et l Open Source. PALO IT est une société apprenante et audacieuse qui se distingue par sa forte culture Projet. L esprit entrepreneurial, le fun, le partage de connaissances, le sens client et la simplicité constituent ses valeurs centrales. 3
4 PALO IT en quelques chiffres 160 collaborateurs 40 grands comptes +50% croissance organique/an 5 bureaux 4
5 Cassandra et Spark pour que vive la musique On-line! Un projet en cours
6 Nos clients 6
7 Notre vrai client DSP «Digital Service Providers» Créateurs et ayants droits Redistribution Client Collecte des droits musicaux 7
8 Données du On-line traitées > 3000 déclarations 8
9 Données du On-line traitées > 3000 déclarations > 1milliard de titres 9
10 Données du On-line traitées > 3000 déclarations > 150 milliard de streamings > 4milliard de titres > 1milliard de titres 10
11 Pas seulement le On-line! Créateurs et ayants droits Redistribution Média et supports traditionnels Client DSP «Digital Service Providers» Collecte des droits musicaux 11
12 Règles des 95 / 5 Non On-line < 5% des volumes Créateurs et ayants droits > 95% des droits Redistribution Client On-line > 95% des volumes < 5% des droits Collecte des droits musicaux 12
13 Marché en évolution Non On-line < 5% des volumes Créateurs et ayants droits > 95% des droits Redistribution Client On-line > 95% des volumes < 5% des droits Collecte des droits musicaux 13
14 Evolution du marché français 14
15 Téléchargement vs Streaming 15
16 System d information actuel Créateurs et ayants droits SI du Client Non On-line Analyse et filtrage Ident auto Ident manu Calcul des barèmes tarifaires Facturation et suivi des payements Redistrib des droits On-line Doc. des ouvres Calcul des droits 16
17 System d information actuel Créateurs et ayants droits SI du Client Non On-line Analyse et filtrage Ident auto Ident manu Calcul des barèmes tarifaires Facturation et suivi des payements Redistrib des droits On-line Doc. des ouvres Calcul des droits 17
18 System d information actuel Créateurs et ayants droits SI du Client Non On-line Analyse et filtrage Ident auto Ident manu Calcul des barèmes tarifaires Facturation et suivi des payements Redistrib des droits On-line Doc. des ouvres Calcul des droits 18
19 System d information actuel Créateurs et ayants droits Redistribution SI du Client Non On-line Analyse et filtrage Ident auto Ident manu Calcul des barèmes tarifaires Facturation et suivi des payements Redistrib des droits On-line Doc. des ouvres Calcul des droits IHM IHM IHM IHM IHM 19
20 Volumes et temps exponentiels 20
21 Un bel avenir! 21
22 Solution Créateurs et ayants droits SI du Client Non On-line Analyse et filtrage Ident auto Ident manu Doc. des ouvres Calcul des barèmes tarifaires Calcul des droits Facturation et suivi des payements Redistrib des droits On-line Process Workflow en Streaming Gisement BigData Vision 360 Dashboards Search & analytics Process mgmt Nouv services 22
23 BigData, Streaming et Cloud Créateurs et ayants droits SI du Client Non On-line Analyse et filtrage Ident auto Ident manu Doc. des ouvres Calcul des barèmes tarifaires Calcul des droits Facturation et suivi des payements Redistrib des droits On-line S1 S2 S3 S4 SX SY SZ Gisement BigData Vision 360 Dashboards Search & analytics Process mgmt Nouv services 23
24 Architecture logique SI du Client BigData Platform Import & export data flow management Streaming & batch processing On-line Raw data Repository NoSQL DB Indexing & Search Web Back-end Security & rôles managements Read services Write services Web front-end IHM Web 24
25 Choix techniques SI du Client BigData Platform Import & export data flow management On-line Avro Sur HDFS Apache Cassandra Apache Spark Elasticsearch Web Back-end Security & rôles managements Read services Write services Web front-end IHM Web 25
26 Le choix Cassandra Scalabilité linéaire Haute dispos + Distribuée + Consistance «tunable» (CAP : 2,5/3 ;-) Gestion de gros volumes (> 10To) Faible latence en lecture et en écriture (~<10ms) BD NoSQL mature avec des utilisateurs de référence (ebay, Apple, etc.) Outillée pour les clusters de production (Rack + DC management, etc) Modèle de données riche + langage CQL Projet Open sources Apache Support et formation assurés par DataStax 26
27 Le choix Cassandra Limites à prendre en compte : Pas de select where (non clé) (opérateur <> =) (group by) (order by) Pas de count( ) Pas de jointures Pas de contraintes d intégrité Pas de transactions : sauf if (not) exists Pas de «Proc Stock» Indexes secondaires à utiliser avec «grande» modération 27
28 Un PoC sinon rien 6 mois de déclarations 2014 (85%) On-line BigData Platform Import & export data flow management Streaming & batch processing NoSQL DB Indexing & Search Web Back-end Read services Web front-end IHM Web 28
29 Infrastructure du PoC OVH Cloude Plateforme : 10 x Nodes 1CPU-8Cores 32GB RAM 2 x 3TB HD Frontend Applications & Monitoring NoSQL DB Web App + Monitoring Node 2 Cassandra Node 3 Cassandra Node 4 Hadoop Cluster Hadoop Spark Node 1 Hadoop Spark Node 2 Cassandra Node 5 Cassandra Node 6 Elasticsearch Cluster ES Node 1 ES Node 2 ES Node 7 ES Node 8 Cassandra Node 9 Cassandra Node 10 29
30 PoC Agile 30
31 Planning du PoC Sprints November December January Sprint #1 Sprint #2 Sprint #3 Sprint #4 Sprint #5 Sprint #6 W44 W45 W46 W47 W48 W49 W50 W51 W52 W1 W2 W3 W4 W5 W6 W7 31
32 PoC Screenshots 32
33 PoC Jeux de données 6 mois de déclarations (DSR) : Q1 & Q2 / Q1 Q2 Total Spo4fy itunes Youtube Nombre de Resources par DSP 33
34 PoC Modèle de données NoSQL Data Model Cassandra Search & Analytics Elasticsearch DSP DSR By Status DSR DSR Release Release Resource By Status Resource Data Resource Sale Resource Sale 34
35 Datastax OpsCenter Nodes view 35
36 Datastax OpsCenter - Dashboard 36
37 PoC Mesures Benchmark du temps de chargement Cassandra 8,00 Loading forcast with a month* of DSR 7,00 6,00 13 nodes needed to load 1 month of DSR in 2 days 5,00 4,00 3,00 2,00 1,00 0, *1 month of DSR = of resources 37
38 PoC Mesures Benchmark du temps de chargement Cassandra Avec disques SATA 2 x 3To en RAID0 Node inserts / sec 156 Cluster size (nodes) Cluster resources / h Cluster resources / day Cassandra cluster size Resources / h Resources / day Total resources in 2014 ~ Resources by month in 2014 ~ Total month DSR loading Qme Total month DSR loading Qme 6 Nodes (servers) res/h res/day Millions 250 Millions 3,09 Days 74,19 h 38
39 PoC concluant, mais Quelques enseignements : A haut débit, les inserts de grands enregistrements «dé-normalisés» sont à proscrire Les updates fréquents de grands enregistrements sont interdits! Limitations fortes sur les IO disques (sur les machines utilisées) Enlever le RAID1 ;-) Le tuning VM est crucial (MAX_HEAP_SIZE, HEAP_NEWSIZE, etc) * D autres Params peuvent aider (CONCURRENT_READS, CONCURRENT_WRITES, MEMTABLE_TOTAL_SPACE) * Pénalisation des serveurs Cassandra lors des compactions Les écritures en batch n améliorent pas la situation, au contraire 8-( Les écritures asynchrones, pas mieux! Sur un système aux limites, contrôler le débit en amont! Envisager les disques SSD (*) Merci Duy Hai et Datastax 39
40 Et la suite Test avec disques SSD très concluants Re-modélisation : Dé-normalisation à bon escient Garder les tables petites Séparation des données «statiques» des données «dynamiques» Gestion de tables par «Status» avec bucketing si nécessaire Encore plus d intégration entre Spark et Cassandra : Connecteur Cassandra Spark amélioré Fonctions de partitionnement pour co-localisation les traitements 40
41 Mesures SATA vs SSD Nouveaux benchmarks du temps de chargement Cassandra Avec disques SATA 2 x 3To en RAID0 Node inserts / sec 156 Cluster size (nodes) Cluster resources / h Cluster resources / day Cassandra cluster size Resources / h Resources / day Total resources in 2014 ~ Resources by month in 2014 ~ Total month DSR loading Qme Total month DSR loading Qme 6 Nodes (servers) res/h res/day Millions 250 Millions 3,09 Days 74,19 h Avec disques SSD 4 x 800Go (1 SSD pour les CommitLogs + 3 SSD pour les SSTables) Node inserts / sec x SATA Cluster size (nodes) Cluster resources / h Cluster resources / day Cassandra cluster size 6 Nodes (servers) Resources / h res/h Resources / day res/day Total resources in 2014 ~ Millions Resources by month in 2014 ~ 250 Millions Total month DSR loading Qme 0,07 Days Total month DSR loading Qme 1,56 h Total month DSR loading Qme 93,75 min Amélioration x ~ SATA disks (Res/h) SSD disks (Res/h) 41
42 Modèle de données cible 42
43 Merci pour votre attention! 43
Cassandra chez Chronopost pour traiter en temps réel 1,5 milliard d événements par an
Cassandra chez Chronopost pour traiter en temps réel 1,5 milliard d événements par an Qui suis-je? Alexander DEJANOVSKI Ingénieur EAI Depuis 15 ans chez Chronopost @alexanderdeja Chronopost International
Plus en détailBig Data. Cyril Amsellem Consultant avant-vente. 16 juin 2011. Talend 2010 1
Big Data Cyril Amsellem Consultant avant-vente 16 juin 2011 Talend 2010 1 Big Data Architecture globale Hadoop Les projets Hadoop (partie 1) Hadoop-Core : projet principal. HDFS : système de fichiers distribués
Plus en détailHadoop, les clés du succès
Hadoop, les clés du succès Didier Kirszenberg, Responsable des architectures Massive Data, HP France Copyright 2015 Hewlett-Packard Development Company, L.P. The information contained herein is subject
Plus en détailDEMARRER UN PROJET BIGDATA EN QUELQUES MINUTES GRACE AU CLOUD
DEMARRER UN PROJET BIGDATA EN QUELQUES MINUTES GRACE AU CLOUD BIGDATA PARIS LE 1/4/2014 VINCENT HEUSCHLING @VHE74! 1 NOUS 100% Bigdata Infrastructure IT + Data Trouver vos opportunités Implémenter les
Plus en détailOrganiser vos données - Big Data. Patrick Millart Senior Sales Consultant
Organiser vos données - Big Data Patrick Millart Senior Sales Consultant The following is intended to outline our general product direction. It is intended for information purposes only, and may not be
Plus en détailCartographie des solutions BigData
Cartographie des solutions BigData Panorama du marché et prospective 1 1 Solutions BigData Défi(s) pour les fournisseurs Quel marché Architectures Acteurs commerciaux Solutions alternatives 2 2 Quels Défis?
Plus en détailHADOOP ET SON ÉCOSYSTÈME
HADOOP ET SON ÉCOSYSTÈME Mars 2013 2012 Affini-Tech - Diffusion restreinte 1 AFFINI-TECH Méthodes projets Outils de reporting & Data-visualisation Business & Analyses BigData Modélisation Hadoop Technos
Plus en détailFormation Cloudera Data Analyst Utiliser Pig, Hive et Impala avec Hadoop
Passez au niveau supérieur en termes de connaissance grâce à la formation Data Analyst de Cloudera. Public Durée Objectifs Analystes de données, business analysts, développeurs et administrateurs qui ont
Plus en détailStephan Hadinger, Sr. Mgr Solutions Architecture, AWS. Salon du Big Data 11 mars 2015
Stephan Hadinger, Sr. Mgr Solutions Architecture, AWS Salon du Big Data 11 mars 2015 Accélération de l innovation +500 +280 Amazon EC2 Container Service +159 AWS Storage Gateway Amazon Elastic Transcoder
Plus en détailAVRIL 2014. Au delà de Hadoop. Panorama des solutions NoSQL
AVRIL 2014 Panorama des solutions NoSQL QUI SOMMES NOUS? Avril 2014 2 SMILE, EN QUELQUES CHIFFRES 1er INTÉGRATEUR EUROPÉEN DE SOLUTIONS OPEN SOURCE 3 4 NOS EXPERTISES ET NOS CONVICTIONS DANS NOS LIVRES
Plus en détailOffre formation Big Data Analytics
Offre formation Big Data Analytics OCTO 2014 50, avenue des Champs-Elysées 75008 Paris - FRANCE Tél : +33 (0)1 58 56 10 00 Fax : +33 (0)1 58 56 10 01 www.octo.com 1 Présentation d OCTO Technology 2 Une
Plus en détailAnticiper et prédire les sinistres avec une approche Big Data
Anticiper et prédire les sinistres avec une approche Big Data Julien Cabot Directeur Big Data Analytics OCTO jcabot@octo.com @julien_cabot OCTO 2013 50, avenue des Champs-Elysées 75008 Paris - FRANCE Tél
Plus en détailL écosystème Hadoop Nicolas Thiébaud ni.thiebaud@gmail.com. Tuesday, July 2, 13
L écosystème Hadoop Nicolas Thiébaud ni.thiebaud@gmail.com HUG France 250 membres sur la mailing liste 30 présentations 9 meetups organisés, de 20 à 100 invités Présence de Cloudera, MapR, Hortonworks,
Plus en détailFouillez facilement dans votre système Big Data. Olivier TAVARD
Fouillez facilement dans votre système Big Data Olivier TAVARD A propos de moi : Cofondateur de la société France Labs Développeur (principalement Java) Formateur en technologies de moteurs de recherche
Plus en détailAcquisition des données - Big Data. Dario VEGA Senior Sales Consultant
Acquisition des données - Big Data Dario VEGA Senior Sales Consultant The following is intended to outline our general product direction. It is intended for information purposes only, and may not be incorporated
Plus en détailLabs Hadoop Février 2013
SOA - BRMS - ESB - BPM CEP BAM - High Performance Compute & Data Grid - Cloud Computing - Big Data NoSQL - Analytics Labs Hadoop Février 2013 Mathias Kluba Managing Consultant Responsable offres NoSQL
Plus en détailPanorama des solutions analytiques existantes
Arnaud LAROCHE Julien DAMON Panorama des solutions analytiques existantes SFdS Méthodes et Logiciels - 16 janvier 2014 - Données Massives Ne sont ici considérés que les solutions autour de l environnement
Plus en détailKick Off SCC 2015. EMC l offre EXTREMIO. fmarti@fr.scc.com Philippe.rolland@emc.com. Vers de nouveaux horizons
Kick Off SCC 2015 EMC l offre EXTREMIO fmarti@fr.scc.com Philippe.rolland@emc.com Vers de nouveaux horizons Context Marché Les baies de stockages traditionnelles ont permis de consolider fortement Les
Plus en détailDéploiement d une architecture Hadoop pour analyse de flux. françois-xavier.andreu@renater.fr
Déploiement d une architecture Hadoop pour analyse de flux françois-xavier.andreu@renater.fr 1 plan Introduction Hadoop Présentation Architecture d un cluster HDFS & MapReduce L architecture déployée Les
Plus en détailVos experts Big Data. contact@hurence.com. Le Big Data dans la pratique
Vos experts Big Data contact@hurence.com Le Big Data dans la pratique Expert Expert Infrastructure Data Science Spark MLLib Big Data depuis 2011 Expert Expert Hadoop / Spark NoSQL HBase Couchbase MongoDB
Plus en détailBases de données documentaires et distribuées Cours NFE04
Bases de données documentaires et distribuées Cours NFE04 Cloud et scalabilité Auteurs : Raphaël Fournier-S niehotta, Philippe Rigaux, Nicolas Travers prénom.nom@cnam.fr Département d informatique Conservatoire
Plus en détailHadoop dans l entreprise: du concept à la réalité. Pourquoi et comment?
Hadoop dans l entreprise: du concept à la réalité. Pourquoi et comment? Jean-Marc Spaggiari Cloudera jms@cloudera.com @jmspaggi Mai 2014 1 2 Avant qu on commence Agenda -Qu est-ce que Hadoop et pourquoi
Plus en détailSurmonter les 5 défis opérationnels du Big Data
Surmonter les 5 défis opérationnels du Big Data Jean-Michel Franco Talend Connect 9 octobre 2014 Talend 2014 1 Agenda Agenda Le Big Data depuis la découverte jusqu au temps réel en passant par les applications
Plus en détailLE BIG DATA. TRANSFORME LE BUSINESS Solution EMC Big Data
LE BIG DATA Solution EMC Big Data TRANSITION VERS LE BIG DATA En tirant profit du Big Data pour améliorer leur stratégie et son exécution, les entreprises se démarquent de la concurrence. La solution EMC
Plus en détailProjet Xdata. Cinequant, Data Publica, EDF, ESRI, Hurence, INRIA, Institut Mines Telecom, La Poste, Orange, Veolia
Projet Xdata Cinequant, Data Publica, EDF, ESRI, Hurence, INRIA, Institut Mines Telecom, La Poste, Orange, Veolia Mutualisation des données XData = Cross Data En croisant des données d origine diverses,
Plus en détailL'agilité appliquée à nous-mêmes. Philippe Krief, PhD Development Manager IBM France Lab
L'agilité appliquée à nous-mêmes Philippe Krief, PhD Development Manager IBM France Lab Agenda Où en était l équipe RPP il y a 24 mois Réorganisation de l équipe et du projet autour de Scrum et de RTC
Plus en détailHibernate vs. le Cloud Computing
Hibernate vs. le Cloud Computing Qui suis-je? Julien Dubois Co-auteur de «Spring par la pratique» Ancien de SpringSource Directeur du consulting chez Ippon Technologies Suivez-moi sur Twitter : @juliendubois
Plus en détailBI SWISS FORUM (ecom / SITB)
2015 04 21 - GENEVA BI SWISS FORUM (ecom / SITB) LE BIG DATA A L ASSAUT DES ZONES DE CONFORT TECH ET BUSINESS WWW.CROSS-SYSTEMS.CH GROUPE MICROPOLE 1100 COLLABORATEURS DONT 130 EN SUISSE +800 CLIENTS 27
Plus en détailaccompagner la transformation digitale grâce au Big & Fast Data Orange Business Services Confidentiel 02/10/2014
accompagner la transformation digitale grâce au Big & Fast Data Orange Business Services Confidentiel 02/10/2014 Big Data au-delà du "buzz-word", un vecteur d'efficacité et de différenciation business
Plus en détailBCO. Sébastien LECOT Directeur de GESS PARTNERS
BCO Sébastien LECOT Directeur de GESS PARTNERS Agenda Présentation de GESS PARTNERS L Apport du Capacity Planning dans les projets de transformation Présentation de BCO et de son architecture Présentation
Plus en détailBIG DATA et DONNéES SEO
BIG DATA et DONNéES SEO Vincent Heuschling vhe@affini-tech.com @vhe74 2012 Affini-Tech - Diffusion restreinte 1 Agenda Affini-Tech SEO? Application Généralisation 2013 Affini-Tech - Diffusion restreinte
Plus en détailSQL Server 2008 et YourSqlDba
SQL Server 2008 et YourSqlDba Le futur de la maintenance des bases de données et la haute-disponibilité Par : Maurice Pelchat Société GRICS Survol du sujet Haute disponibilité (HD) Assurer la disponibilité
Plus en détail20 ans du Master SIAD de Toulouse - BigData par l exemple - Julien DULOUT - 22 mars 2013. 20 ans du SIAD -"Big Data par l'exemple" -Julien DULOUT
20 ans du Master SIAD de Toulouse - BigData par l exemple - Julien DULOUT - 22 mars 2013 20 ans du SIAD -"BigData par l'exemple" -Julien DULOUT Qui a déjà entendu parler du phénomène BigData? Qui a déjà
Plus en détailIntroduction au Massive Data
Introduction au Massive Data Didier Kirszenberg, Responsable des architectures Massive Data, HP France Copyright 2015 Hewlett-Packard Development Company, L.P. The information contained herein is subject
Plus en détailagile Datacenter vert Le monde naissant des datacenters de nouvelle génération ICAR-2013 Gérald.Dulac@eolas.fr Ibrahim.Safieddine@eolas.
Le monde naissant des datacenters de nouvelle génération ICAR-2013 Datacenter vert agile Grenoble Lyon Paris Gérald.Dulac@eolas.fr Ibrahim.Safieddine@eolas.fr Datacenter de nouvelle génération vert agile?
Plus en détailHISTOIRE D UNE DIGITAL FACTORY
HISTOIRE D UNE DIGITAL FACTORY L ambition et le Contexte IT L Ambition de Bouygues Telecom fin 2012. 1. Fournir une expérience encore plus digitale à ses clients. 2. Faciliter l accès au monde digital.
Plus en détailCreation de Contenus Numériques pour
Creation de Contenus Numériques pour le Divertissement et la Communication 300 projets par an : longs métrages, publicités, programmes TV, communication, jeux vidéo and clips. Montage, effets spéciaux,
Plus en détailBI Open Source Octobre 2012. Alioune Dia, Consultant BI alioune.dia@openbridge.fr
BI Open Source Octobre 2012 Alioune Dia, Consultant BI alioune.dia@openbridge.fr 1 Le groupe, en bref 2004 Date de création +7M * Chiffre d affaires 2012 +80 Collaborateurs au 06/2011 35% Croissance chiffre
Plus en détailL ÉCHANGE DE DONNÉES TEMPS RÉEL
Talented Together L ÉCHANGE DE DONNÉES TEMPS RÉEL Retours d expériences avec Talend Julien DULOUT Manager Sopra Consulting Expert des offres BI, MDM & BigData Ludovic MONNIER Architecte Sopra Expert EAI
Plus en détailMapReduce. Malo Jaffré, Pablo Rauzy. 16 avril 2010 ENS. Malo Jaffré, Pablo Rauzy (ENS) MapReduce 16 avril 2010 1 / 15
MapReduce Malo Jaffré, Pablo Rauzy ENS 16 avril 2010 Malo Jaffré, Pablo Rauzy (ENS) MapReduce 16 avril 2010 1 / 15 Qu est ce que c est? Conceptuellement Données MapReduce est un framework de calcul distribué
Plus en détailWD et le logo WD sont des marques déposées de Western Digital Technologies, Inc, aux États-Unis et dans d'autres pays ; absolutely WD Re, WD Se, WD
WD et le logo WD sont des marques déposées de Western Digital Technologies, Inc, aux États-Unis et dans d'autres pays ; absolutely WD Re, WD Se, WD Xe, RAFF et StableTrac sont des marques de Western Digital
Plus en détailEXALOGIC ELASTIC CLOUD MANAGEMENT
EXALOGIC ELASTIC CLOUD MANAGEMENT Jean-Marc Digne Ingénieur Avant Vente Oracle France 1 The following is intended to outline our general product direction. It is intended for information purposes only,
Plus en détailCatherine Chochoy. Alain Maneville. I/T Specialist, IBM Information Management on System z, Software Group
1 Catherine Chochoy I/T Specialist, IBM Information Management on System z, Software Group Alain Maneville Executive I/T specialist, zchampion, IBM Systems and Technology Group 2 Le défi du Big Data (et
Plus en détailBig data et données géospatiales : Enjeux et défis pour la géomatique. Thierry Badard, PhD, ing. jr Centre de Recherche en Géomatique
Big data et données géospatiales : Enjeux et défis pour la géomatique Thierry Badard, PhD, ing. jr Centre de Recherche en Géomatique Événement 25e anniversaire du CRG Université Laval, Qc, Canada 08 mai
Plus en détailLe projet Gaïa, le Big Data au service du traitement de données satellitaires CRIP - 16/10/2013 Pierre-Marie Brunet
Le projet Gaïa, le Big Data au service du traitement de données satellitaires CRIP - 16/10/2013 Pierre-Marie Brunet 1 SOMMAIRE Le calcul scientifique au CNES Le BigData au CNES, le cas Gaïa HPC et BigData
Plus en détailLes participants repartiront de cette formation en ayant une vision claire de la stratégie et de l éventuelle mise en œuvre d un Big Data.
Big Data De la stratégie à la mise en oeuvre Description : La formation a pour objet de brosser sans concession le tableau du Big Data. Les participants repartiront de cette formation en ayant une vision
Plus en détailInfrastructure technique de géodonnées. Technische Geodateninfrastruktur. Cédric Moullet Forum e-geo.ch, 15. November 2013
Infrastructure technique de géodonnées Technische Geodateninfrastruktur Cédric Moullet Forum e-geo.ch, 15. November 2013 Agenda Introduction / Einführung Cloud Computing IDG actuelle / Aktuelles GDI Discussion
Plus en détailez Publish Cloud Edition Présentation
ez Publish Cloud Edition Présentation Pourquoi le Cloud? Le marché 13/07/12 Slide 3 Les attentes sont fortes 13/07/12 Slide 4 les defis à relever sont tout aussi importants! 13/07/12 Slide 5 L internet
Plus en détailProgrammation parallèle et distribuée
Programmation parallèle et distribuée (GIF-4104/7104) 5a - (hiver 2015) Marc Parizeau, Département de génie électrique et de génie informatique Plan Données massives («big data») Architecture Hadoop distribution
Plus en détailGroupe de Discussion Big Data Aperçu des technologies et applications. Stéphane MOUTON stephane.mouton@cetic.be
Groupe de Discussion Big Data Aperçu des technologies et applications Stéphane MOUTON stephane.mouton@cetic.be Recherche appliquée et transfert technologique q Agréé «Centre Collectif de Recherche» par
Plus en détailLa rencontre du Big Data et du Cloud
La rencontre du Big Data et du Cloud Libérez le potentiel de toutes vos données Visualisez et exploitez plus rapidement les données de tous types, quelle que soit leur taille et indépendamment de leur
Plus en détailVous êtes bien à la bonne présentation, c est juste que je trouvais que le titre de cette présentation étais un peu long,
Vous êtes bien à la bonne présentation, c est juste que je trouvais que le titre de cette présentation étais un peu long, en fait ça me faisait penser au nom d un certain projet gouvernemental je me suis
Plus en détailVirtualScale L expert infrastructure de l environnement Open source HADOOP Sofiane Ammar sofiane.ammar@virtualscale.fr
VirtualScale L expert infrastructure de l environnement Open source HADOOP Sofiane Ammar sofiane.ammar@virtualscale.fr Avril 2014 Virtualscale 1 Sommaire Les enjeux du Big Data et d Hadoop Quels enjeux
Plus en détailSommaire. 3. Les grands principes de GFS L architecture L accès de fichier en lecture L accès de fichier en écriture Bilan
1 Sommaire 1. Google en chiffres 2. Les raisons d être de GFS 3. Les grands principes de GFS L architecture L accès de fichier en lecture L accès de fichier en écriture Bilan 4. Les Evolutions et Alternatives
Plus en détailBig Data. Concept et perspectives : la réalité derrière le "buzz"
Big Data Concept et perspectives : la réalité derrière le "buzz" 2012 Agenda Concept & Perspectives Technologies & Acteurs 2 Pierre Audoin Consultants (PAC) Pierre Audoin Consultants (PAC) est une société
Plus en détailBig Graph Data Forum Teratec 2013
Big Graph Data Forum Teratec 2013 MFG Labs 35 rue de Châteaudun 75009 Paris, France www.mfglabs.com twitter: @mfg_labs Julien Laugel MFG Labs julien.laugel@mfglabs.com @roolio SOMMAIRE MFG Labs Contexte
Plus en détailLe traitement du Big Data inclue la collecte, la curation, le stockage, l enrichissement, le croisement, la partage, l analyse et la visualisation.
Les infrastructure du Big Data Le «Big Data» vise à tirer un avantage concurrentiel au travers de méthodes de collecte, d analyse et d exploitation des données qu on ne pouvait utiliser jusqu à présent
Plus en détailNBS System et Zend Technologies Découvrez la scalabilité sans limite pour vos applications PHP grâce au Zend Cloud
NBS System et Zend Technologies Découvrez la scalabilité sans limite pour vos applications PHP grâce au Zend Cloud Christian Durel GM urope Zend Technologies Maurice Kherlakian Consultant Senior Zend Technologies
Plus en détailProgramme New BI. Décember 2014. Thierry Milhé, Directeur des Systèmes d Information Sagem Défense Sécurité (groupe Safran)
Programme New Décember 201 Thierry Milhé, Directeur des Systèmes d Information Sagem Défense Sécurité (groupe Safran) 1. Présentation du programme New 2. Le projet et la technologie 3. Résultats. Questions
Plus en détailPerformances. Gestion des serveurs (2/2) Clustering. Grid Computing
Présentation d Oracle 10g Chapitre VII Présentation d ORACLE 10g 7.1 Nouvelles fonctionnalités 7.2 Architecture d Oracle 10g 7.3 Outils annexes 7.4 Conclusions 7.1 Nouvelles fonctionnalités Gestion des
Plus en détailLe nouveau visage de la Dataviz dans MicroStrategy 10
Le nouveau visage de la Dataviz dans MicroStrategy 10 Pour la première fois, MicroStrategy 10 offre une plateforme analytique qui combine une expérience utilisateur facile et agréable, et des capacités
Plus en détailProgrammation parallèle et distribuée
Programmation parallèle et distribuée (GIF-4104/7104) 5a - (hiver 2014) Marc Parizeau, Département de génie électrique et de génie informatique Plan Mégadonnées («big data») Architecture Hadoop distribution
Plus en détailArchitectures haute disponibilité avec MySQL. Olivier Olivier DASINI DASINI - - http://dasini.net/blog
Architectures haute disponibilité avec MySQL Architectures Architectures haute disponibilité haute disponibilité avec MySQL avec MySQL Olivier Olivier DASINI DASINI - - http://dasini.net/blog Forum PHP
Plus en détailBig Data. Les problématiques liées au stockage des données et aux capacités de calcul
Big Data Les problématiques liées au stockage des données et aux capacités de calcul Les problématiques liées au Big Data La capacité de stockage - Traitement : Ponctuel ou permanent? - Cycle de vie des
Plus en détailConsolidation. Grid Infrastructure avec la 11gR2
Consolidation Grid Infrastructure avec la 11gR2 Priorités IT durant les périodes difficiles Examiner et Limiter les dépenses d investissement Devenir plus efficace pour réduire les frais d'exploitation
Plus en détailIntroduction à MapReduce/Hadoop et Spark
1 / 36 Introduction à MapReduce/Hadoop et Spark Certificat Big Data Ludovic Denoyer et Sylvain Lamprier UPMC Plan 2 / 36 Contexte 3 / 36 Contexte 4 / 36 Data driven science: le 4e paradigme (Jim Gray -
Plus en détail1 Actuate Corporation 2012. + de données. + d analyses. + d utilisateurs.
1 Actuate Corporation 2012 + de données. + d analyses. + d utilisateurs. Actuate et BIRT Actuate est l Editeur spécialiste de la Business Intelligence et le Reporting qui a créé le projet Open Source BIRT
Plus en détailBig Data : utilisation d un cluster Hadoop HDFS Map/Reduce HBase
Big Data : utilisation d un cluster cluster Cécile Cavet cecile.cavet at apc.univ-paris7.fr Centre François Arago (FACe), Laboratoire APC, Université Paris Diderot LabEx UnivEarthS 14 Janvier 2014 C. Cavet
Plus en détailC-JDBC. Emmanuel Cecchet INRIA, Projet Sardes. http://sardes.inrialpes.fr
Emmanuel Cecchet INRIA, Projet Sardes http://sardes.inrialpes.fr Plan Motivations Idées principales Concepts Caching Perspectives /ObjectWeb 15 octobre 2002 Emmanuel.Cecchet@inrialpes.fr 2 - Motivations
Plus en détailInnovative BI with SAP Jean-Michel JURBERT D. de Marché BI, HANA, BIG DATA _ SAP France
Innovative BI with SAP Jean-Michel JURBERT D. de Marché BI, HANA, BIG DATA _ SAP France 2013 SAP AG. All rights reserved. Customer 1 Rôles et Attentes Instantanéité BIG DATA Users IT Real Time SAP HANA
Plus en détailAccélérez vos tests et développements avec le Cloud, découvrez SoftLayer, la dernière acquisition Cloud d'ibm
Accélérez vos tests et développements avec le Cloud, découvrez SoftLayer, la dernière acquisition Cloud d'ibm Matthieu Gross Senior Architect services d infrastructure IBM Cloud: Think it. Build it. Tap
Plus en détailCatalogue Formation «Vanilla»
Catalogue Formation «Vanilla» Date : octobre 2009 Table des matières Liste des Formations...2 Contenu des formations...3 Vanilla FastTrack...3 Vanilla Architecture...5 Enterprise Services...6 BIPortail...7
Plus en détailLivrer chaque jour ce qui est prêt! Points clés du développement d un produit avec une livrasion par jour.
Livrer chaque jour ce qui est prêt! Points clés du développement d un produit avec une livrasion par jour. Date : 10 avril 2015 Format : Conférence Speakers : Dimitri Baeli, Benjamin Degerbaix de Les Furets
Plus en détailIntroduction Big Data
Introduction Big Data SOMMAIRE Rédacteurs : Réf.: SH. Lazare / F. Barthélemy AXIO_BD_V1 QU'EST-CE QUE LE BIG DATA? ENJEUX TECHNOLOGIQUES ENJEUX STRATÉGIQUES BIG DATA ET RH ANNEXE Ce document constitue
Plus en détailGamme Serveurs HP ProLiant Rack
Gamme Serveurs HP ProLiant Rack Janvier 2015 Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. La gamme de produits la plus
Plus en détail<Insert Picture Here> Exadata Storage Server et DB Machine V2
Exadata Storage Server et DB Machine V2 Croissance de la Volumétrie des Données Volumes multipliés par 3 tous les 2 ans Evolution des volumes de données 1000 Terabytes (Données) 800
Plus en détailPentaho Business Analytics Intégrer > Explorer > Prévoir
Pentaho Business Analytics Intégrer > Explorer > Prévoir Pentaho lie étroitement intégration de données et analytique. En effet, les services informatiques et les utilisateurs métiers peuvent accéder aux
Plus en détailNoSQL. Introduction 1/30. I NoSQL : Not Only SQL, ce n est pas du relationnel, et le contexte. I table d associations - Map - de couples (clef,valeur)
1/30 2/30 Anne-Cécile Caron Master MIAGE - SGBD 1er trimestre 2014-2015 I : Not Only SQL, ce n est pas du relationnel, et le contexte d utilisation n est donc pas celui des SGBDR. I Origine : recherche
Plus en détailNFA 008. Introduction à NoSQL et MongoDB 25/05/2013
NFA 008 Introduction à NoSQL et MongoDB 25/05/2013 1 NoSQL, c'est à dire? Les bases de données NoSQL restent des bases de données mais on met l'accent sur L'aspect NON-relationnel L'architecture distribuée
Plus en détailNIMBUS TRAINING. Administration de Citrix NetScaler 10. Déscription : Objectifs. Publics. Durée. Pré-requis. Programme de cette formation
Administration de Citrix NetScaler 10 Déscription : Cette formation aux concepts de base et avancés sur NetScaler 10 permet la mise en oeuvre, la configuration, la sécurisation, le contrôle, l optimisation
Plus en détailHitachi Storage Viewer v7.2. 2010 Hitachi Data Systems
Hitachi Storage Viewer v7.2 François BOTTON Product Marketing Manager Rémy VINCENT Consultant Avant-Vente 2010 Hitachi Data Systems Agenda 2 Les Datacenters sous pression Valeur de la donnée Croissance
Plus en détailLES ENJEUX DU BIG DATA
LES ENJEUX DU BIG DATA POUR LA MISE EN PLACE DES SMART-GRIDS EDF R&D Marie-Luce Picard Projet SIGMA² 16 Janvier 2014 SMART GRIDS SMART METERS SMART DATA Partout dans le monde des projets smart-grids voient
Plus en détailOpportunités et enjeux à l heure du Cloud, du Big Data, de la mobilité et du Social Business
Opportunités et enjeux à l heure du Cloud, du Big Data, de la mobilité et du Social Business Véronique Blondelle, Leader Marketing Software Philippe Bournhonesque, Leader Stratégie Software Les grandes
Plus en détailIT SERVICES BUSINESS STORAGE DATA AUDIT PARTNERSHIP INTEGRATOR SECURITY PLANNING PRIVATE AGILITY DYNAMIC PUBLIC TECHNOLOGY SOLUTIONS MANAGEMENT
ACTIVE BUSINESS TALENT ANSWERS DESIGN AUDIT HYBRID DRP PRIVATE SOFTWARE ENGINEERING AGILITY DYNAMIC DEPLOY SECURITY COMPUTE USER Initialisation démonstration EVO:RAIL PROVISIONING ORCHESTRATION WORKLOAD
Plus en détailBIG DATA en Sciences et Industries de l Environnement
BIG DATA en Sciences et Industries de l Environnement François Royer www.datasio.com 21 mars 2012 FR Big Data Congress, Paris 2012 1/23 Transport terrestre Traçabilité Océanographie Transport aérien Télémétrie
Plus en détailSystèmes Répartis. Pr. Slimane Bah, ing. PhD. Ecole Mohammadia d Ingénieurs. G. Informatique. Semaine 24.2. Slimane.bah@emi.ac.ma
Ecole Mohammadia d Ingénieurs Systèmes Répartis Pr. Slimane Bah, ing. PhD G. Informatique Semaine 24.2 1 Semestre 4 : Fev. 2015 Grid : exemple SETI@home 2 Semestre 4 : Fev. 2015 Grid : exemple SETI@home
Plus en détailLab Westcon-F5-Vmware. Frédéric Nakhle Directeur technique Westcon Nicolas Berthier Consultant Avant-vente F5
Lab Westcon-F5-Vmware Frédéric Nakhle Directeur technique Westcon Nicolas Berthier Consultant Avant-vente F5 2 Agenda F5 et Vmware Objectif du lab Description du lab Démonstration du Long Distance Vmotion
Plus en détailFOURNIR UN SERVICE DE BASE DE DONNÉES FLEXIBLE. Database as a Service (DBaaS)
FOURNIR UN SERVICE DE BASE DE DONNÉES FLEXIBLE Database as a Service (DBaaS) 1 The following is intended to outline our general product direction. It is intended for information purposes only, and may
Plus en détailBases de Données OLAP
Bases de Données OLAP Hiver 2013/2014 Melanie Herschel melanie.herschel@lri.fr Université Paris Sud, LRI Chapitre 1 Introduction Détails administratifs Entrepôts de Données Perspective sur le semestre
Plus en détailAPX et VCE, Modèle d industrialisation de l intégration et du déploiement. Olivier BERNARD, VCE
APX et VCE, Modèle d industrialisation de l intégration et du déploiement Olivier BERNARD, VCE Généralisation des réseaux, suprématie d IP Consumérisation des terminaux informatiques Evolution vers une
Plus en détailLes technologies du Big Data
Les technologies du Big Data PRÉSENTÉ AU 40 E CONGRÈS DE L ASSOCIATION DES ÉCONOMISTES QUÉBÉCOIS PAR TOM LANDRY, CONSEILLER SENIOR LE 20 MAI 2015 WWW.CRIM.CA TECHNOLOGIES: DES DONNÉES JUSQU'À L UTILISATEUR
Plus en détailLes journées SQL Server 2013
Les journées SQL Server 2013 Un événement organisé par GUSS Les journées SQL Server 2013 Romain Casteres MVP SQL Server Consultant BI @PulsWeb Yazid Moussaoui Consultant Senior BI MCSA 2008/2012 Etienne
Plus en détailHadoop, Spark & Big Data 2.0. Exploiter une grappe de calcul pour des problème des données massives
Hadoop, Spark & Big Data 2.0 Exploiter une grappe de calcul pour des problème des données massives Qui suis-je? Félix-Antoine Fortin Génie info. (B. Ing, M. Sc, ~PhD) Passionné de Python, Data Analytics,
Plus en détailSéminaire Partenaires Esri France 7-8 juin 2011 - Paris Cloud Computing Stratégie Esri
Séminaire Partenaires Esri France 7-8 juin 2011 - Paris Cloud Computing Stratégie Esri Gaëtan LAVENU Plan de la présentation Evolution des architectures SIG Qu'est ce que le Cloud Computing? ArcGIS et
Plus en détailTables Rondes Le «Big Data»
Tables Rondes Le «Big Data» 2012-2013 1 Plan Introduc9on 1 - Présenta9on Ingensi 2 - Le Big Data c est quoi? 3 - L histoire 4 - Le monde du libre : Hadoop 5 - Le système HDFS 6 - Les algorithmes distribués
Plus en détailPortefeuille de solutions HP pour la virtualisation
Portefeuille de solutions HP pour la virtualisation Table des Matières Introduction P3 1. Les avantages de la Virtualisation P4 2. La valeur Ajoutée HP P6 3. La valeur Ajoutée Intel P8 4. Le portefeuille
Plus en détailMarc SALLIERES CEO ALTIC marc.sallieres@altic.org. www.altic.org
Marc SALLIERES CEO ALTIC marc.sallieres@altic.org www.altic.org Présentation ALTIC Les projets ALTIC BI Open Source véritable alternative Spécialiste BI Open Source Présentation ALTIC 2009 Club Finance
Plus en détailNoSQL. Introduction 1/23. I NoSQL : Not Only SQL, ce n est pas du relationnel, et le contexte. I table d associations - Map - de couples (clef,valeur)
1/23 2/23 Anne-Cécile Caron Master MIAGE - BDA 1er trimestre 2013-2014 I : Not Only SQL, ce n est pas du relationnel, et le contexte d utilisation n est donc pas celui des SGBDR. I Origine : recherche
Plus en détailBIG DATA : une vraie révolution industrielle (1) Les fortes évolutions liées à la digitalisation
BIG DATA : une vraie révolution industrielle (1) Les fortes évolutions liées à la digitalisation - définition - étapes - impacts La révolution en cours du big data - essai de définition - acteurs - priorités
Plus en détailL INFORMATIQUE SOUS FORME DE SERVICE POUR VOTRE ENTREPRISE. Farid BENREJDAL Senior Systems Engineer VMware
L INFORMATIQUE SOUS FORME DE SERVICE POUR VOTRE ENTREPRISE Farid BENREJDAL Senior Systems Engineer VMware ... VERS L IT AS A SERVICE Phase I Phase II Phase III Gain en CapEx / Consolidation Gain en fiabilité
Plus en détail