BIG DATA AVEC BULLION SEPTEMBRE 2014 Le succès d un projet Big Data dépend de multiples facteurs : clarté des objectifs métiers, solidité des équipes projets, implication du management. Mais la performance, l évolutivité et la fiabilité de la solution dépendent largement de l infrastructure mise en œuvre. St EXECUTIVE SUMMARY 2 LES QUATRE FORMES DU BIG DATA 3 LE DATA WAREHOUSE N EST PAS OBSOLÈTE 4 BULLION, LA PLATE-FORME IDEALE POUR LE 5 IN MEMORY 5 AINSI QUE POUR D AUTRES FORMES DE BIG DATA 6 BULL À VOS CÔTÉS 7
EXECUTIVE SUMMARY En promettant de transformer en or les montagnes de données que voient s accumuler les entreprises, le Big Data suscite un engouement qui engendre parfois certaines confusions. Derrière les «3 V» du Big Data (volume, vitesse et variété des données), se cachent des problématiques spécifiques à chaque entreprise, qui peuvent être classées en quatre grandes catégories : le Big Data originel, tel que le pratiquent les grands acteurs d Internet, le Big Data orienté business, qui démultiplie les capacités de pilotage de l activité en réduisant considérablement le temps d accès, la découverte d information temps réel et la gestion d événements complexes. Réussir ses projets de Big Data, c est donc en fixer clairement les objectifs, mais aussi s appuyer sur une infrastructure capable d en relever les défis. Dans tous les cas, bullion apporte la puissance, la fiabilité et l évolutivité nécessaires au Big Data. Ses capacités de calcul, sa mémoire extensible jusqu à 24 To et ses fonctionnalités RAS en font notamment la plate-forme idéale pour le calcul en mémoire, qui permet de mettre en œuvre le Big Data orienté business. Autour de bullion, Bull, en lien avec ses partenaires, propose un ensemble complet de services pour que le Big Data devienne une réalité créatrice de valeur.. 2 Big Data avec bullion
LES QUATRE FORMES DU BIG DATA Dans tous les secteurs d activité, les entreprises constatent qu elles pourraient tirer énormément de valeur des informations dont elles disposent, à condition de relever le défi des «3V» du Big Data : volume, vitesse, variété. Seulement, il ne se pose pas partout de la même façon, et ne se résout donc pas forcément avec les mêmes outils. Actuellement, on peut catégoriser quatre grandes familles d applications qui relèvent du Big Data au sens où le définit le McKinsey Global Institute : «des jeux de données dont la taille ne permet pas une capture, un stockage, une gestion et un traitement par des outils de gestion de bases de données classiques.» 1. Le Big Data «originel» : c est celui que pratiquent les grands acteurs d Internet et pour lequel ont été développées des technologies comme Hadoop. Il s agit de faire émerger des données internes et externes des informations nouvelles sur l environnement de l entreprise (ses clients, ses concurrents, ses marchés ). Les données sont structurées en amont afin d être en mesure de répondre à des questionnements métiers sur des profils de populations, des comportements et corrélations insoupçonnées Par rapport au décisionnel classique, il s agit d un changement de point de vue. 2. Le Big Data orienté business : fournir des indications précises, dans des délais courts, pour permettre un pilotage fin et réactif de l entreprise. Dans ce cas, c est l utilisateur qui définit ses besoins en amont (tableaux de bord, KPI, ajustement de prix ), et les données sont structurées pour y répondre. Par rapport au décisionnel traditionnel, il s agit d un changement de magnitude, en termes de capacités d analyse comme de rapidité de traitement, permettant une prise de décision et une réactivité inégalée. 3. La recherche d information temps réel : trouver rapidement et simplement une information précise (un chiffre, une citation, un document ), dans la masse des données et des documents accessibles. 4. La gestion d événements complexes : réagir automatiquement, en temps réel, aux circonstances en s appuyant sur des règles richement contextualisées. Ces quatre situations sont complémentaires et toutes susceptibles d intéresser l entreprise, mais elles impliquent des infrastructures différentes, des flux différents et des utilisateurs différents. Réussir un projet Big Data, c est donc d abord bien définir son objectif de manière à ne pas se tromper d approche. C est aussi cibler une infrastructure offrant des niveaux inédits de puissance, de sûreté et d évolutivité pour être capable de supporter une charge sans équivalent. 3 Big Data avec bullion
LE DATA WAREHOUSE N EST PAS OBSOLÈTE Pilier et symbole de la Business Intelligence traditionnelle, le Data Warehouse n est pas pour autant condamné par le Big Data. Les lourds investissements techniques et humains qu il a souvent nécessités au fil du temps peuvent être préservés, et même valorisés. Le Data Warehouse reste en effet le dépositaire d une part importante et précieuse de l information de l entreprise. Pour le Big Data orienté business, en particulier, il demeure la source première des données (structurées) qui permettront d élaborer les nouveaux indicateurs de pilotage. Pour pallier à ses limitations, notamment en termes de flux, il est possible de créer un Data Warehouse «logique» en lui adjoignant des extensions spécialisées : NoSQL pour les traitements massifs, calcul In Memory pour un gain énorme de vitesse d analyse, voire Hadoop. Cette approche permet d accéder aux applications Big Data tout en capitalisant sur l existant. Le In Memory, une révolution en douceur À mi-chemin du Big Data originel et de la Business Intelligence, le Big Data orienté business correspond souvent au besoin prioritaire exprimé par les métiers. Pour les utilisateurs, il constitue un bond en avant opérationnel sans rupture conceptuelle. Cette révolution en douceur est permise par le calcul en mémoire (In Memory) grâce auquel une notion métier telle que le pilotage des prix devient beaucoup plus dynamique : hier, il fallait construire des cubes multidimensionnels/datamarts pour obtenir après un long traitement les informations ; aujourd hui, il est possible de disposer d une base extrêmement réactive pour une prise de décision en «temps interactif». Mieux, on peut envisager de réaliser les traitements transactionnels (OLTP) et décisionnels (OLAP) sur la même source de données en mémoire pour disposer de la donnée primaire sans le long processus de recopie, de traitement des ETL et sans l impact de latence des architectures de bases de données traditionnelles. Il est donc possible d intégrer pas à pas cette technologie et de profiter progressivement des nouvelles possibilités offertes. Le matériel, une des clés de la réussite S appuyant sur des outils tels que SAP Hana, le calcul en mémoire ouvre les portes du Big Data orienté business et à un champ entièrement nouveau d applications. Mais c est aussi une approche particulièrement exigeante du point de vue matériel : elle nécessite des machines puissantes et dotées d une mémoire très importante. Le Data Warehouse d une grande entreprise compte typiquement moins d une dizaine de téraoctets de données. Pour fournir les performances attendues, la plate-forme In Memory devra pouvoir charger et traiter de tels volumes. Par ailleurs, les capacités brutes ne font pas tout. Destinée à un usage opérationnel, manipulant des données sensibles, la plate-forme de calcul en mémoire doit offrir toutes les garanties en matière de qualité de service et de sécurité. Enfin, son évolutivité n est pas à négliger car, comme tous les projets innovants, la mise en œuvre du Big Data débute par un pilote qui doit pouvoir être étendu aisément et à moindre coût.. Elasticité : - Modulation des ressources, où et quand vous en avez besoin - Ajout de ressource à la volée - Réallocation des ressources 4 Big Data avec bullion
BULLION, LA PLATE-FORME IDEALE POUR LE IN MEMORY Sur un sujet dont le nom lui-même rappelle la dimension critique de la volumétrie, le choix de l environnement matériel est au premier rang des facteurs de succès. Serveur x86 de dernière génération, bullion est la plate-forme idéale pour les usages In Memory» du Big Data. Des capacités uniques pour le Big Data orienté business et le calcul en mémoire Disponible de 2 CPU/48Go de RAM jusqu à 16 CPU/24To de RAM, bullion est le seul serveur x86 capable de répondre de manière fiable, élastique et économique aux besoins spécifiques des applications de calcul en mémoire telles que SAP Hana. Mesuré plus rapide serveur x86 au monde (benchmark SPECint, bullion 16 sockets), bullion bénéficie tout particulièrement de l apport des nouveaux processeurs Intel Xeon E7v2. bullion propose jusqu à 16 processeurs, soit 240 cœurs dans un seul serveur, pour des performances exceptionnelles. À cela, peuvent s ajouter jusqu à 24 To de RAM, un paramètre clé pour le calcul en mémoire. Offrant une évolutivité hors pair, bullion facilite la montée en puissance des solutions Big Data, du pilote jusqu à la généralisation de l application. Grâce à deux innovations exclusives développées par Bull la nouvelle génération du BCS (Bull Coherence Switch), qui permet d interconnecter simplement jusqu à 16 processeurs, et la Connecting Box, une colonne qui permet de connecter très simplement et sans câble apparent les différents modules, ajouter de la puissance de calcul devient une formalité. Il en va de même pour la mémoire et les éléments E/S : grâce à un système de lames breveté par Bull, il est possible d'ajuster à chaud, rapidement et très facilement, les capacités de bullion. Ceci permet de toujours disposer d une configuration adaptée, de lisser les investissements, mais aussi de simplifier l administration et la maintenance pour en minimiser les coûts et les inconvénients. 100% de fiabilité mémoire à coût optimisé Appelé à devenir l une des applications opérationnelles phares de l entreprise, le Big Data orienté business réclame une qualité de service maximale. Les nouveaux processeurs Intel Xeon E7v2 apportent de nombreuses fonctionnalités RAS, dont la technologie Run Sure, un ensemble de méthodes de protection de la RAM et de la plateforme. Combiné à un large ensemble d éléments de diagnostic, ceci permet d anticiper les problèmes et de réagir de façon appropriée. Bull a ajouté des points de contrôle (jusqu à plusieurs milliers par rack) pour surveiller en permanence tous les composants clés du serveur afin de réduire les défaillances et les risques d arrêt. bullion dispose également des fonctionnalités RAS de migration et de protection mémoire implémentées par Bull. Par exemple, le MCA Recovery Execution Path prévient le crash d un serveur en cas d erreur mémoire irrécupérable, dont l impact sera limité à la machine virtuelle utilisant le bloc fautif. De même, si plusieurs erreurs consécutives sont détectées sur une barrette mémoire (même s il y a une correction à la volée), bullion la migrera automatiquement pour pouvoir remplacer la lame défectueuse, et hyperviseurs et OS seront informés de ne plus utiliser ces plages d adresses. Une fois la mémoire migrée, la lame pourra être remplacée, sans arrêt de production, ni besoin de doubler la capacité pour obtenir un miroir.. 5 Big Data avec bullion
AINSI QUE POUR D AUTRES FORMES DE BIG DATA Grâce notamment à sa scalabilité inégalée et à sa capacité mémoire protégée exceptionnelle, bullion est tout à fait adapté aux autres formes et usages du Big Data. Base de données massivement parallélisée et In Memory clé en main avec Pivotal Pour faciliter la mise en place de contenants hybrides de données structurées, comprenant à la fois un contenant de gros volumes et d autre part d extrême vélocité, Bull a travaillé avec Pivotal pour mettre au point bullion fast data analytics. C est une architecture unifiée, optimisée et validée pour Pivotal Greenplum Database (base de donnée distribuée, massivement parallèle) et Pivotal GemFire (solution d analyse de données en mémoire). Clé en main, économique et souple, fast data analytics réduit la complexité de mise en œuvre et d exploitation, et permet d aborder facilement, mais de façon performante, le monde du Big Data. Validées par Sinequa, des capacités exceptionnelles pour la recherche temps réel bullion a démontré qu il était parfaitement adapté aux applications Big Data de découverte d information en temps réel et d analyse de contenu en obtenant des performances exceptionnelles avec la solution Search et Analyse en Temps Réel de Sinequa. La combinaison des deux technologies a permis d atteindre une capacité sans précédent de 100 milliards d enregistrements et une performance de 10 millions d enregistrements indexés. L intégration de la solution de search aux sources de données existantes est d autant plus facilitée que bullion est basé sur des composants standard et ouverts. La gestion d événements complexes, une porte sur le futur Permettant une réponse automatique à une situation donnée, la gestion d événements complexes s annonce comme un des grands enjeux du futur dans des domaines tels que la sécurité, la finance, la relation client ou la production industrielle. Pour pouvoir réagir en temps réel à un événement, un moteur de règles ne peut dépendre des temps de réponse de sources de données tierces, et il doit donc s appuyer sur les informations dont il dispose lui-même en mémoire. Les capacités mémoire sans équivalent de bullion permettent d associer aux moteurs de règles (par exemple celui de Tibco ) une richesse contextuelle exceptionnelle, et ainsi d accroître significativement la finesse et la variété des conditions. bullion permet d ores et déjà d entrevoir le futur de la gestion d événements, et de développer des pilotes évolutifs permettant d acquérir une expérience précieuse. 6 Big Data avec bullion
BULL À VOS CÔTÉS Bull propose un large éventail de services pour accompagner ses clients sur l ensemble des problématiques liées au Big Data, et leur permettre de tirer le meilleur de leurs données. Un réseau de partenaires Bull a développé des relations de longue date avec de nombreux partenaires qui comptent parmi les principaux acteurs du Big Data : SAP, Pivotal, Microsoft Bull entretient également des liens privilégiés avec le monde Open Source dont sont issues de nombreuses technologies clés, notamment Hadoop, ainsi que des fournisseurs innovants de technologie, tels que Tibco, Sinequa Un accompagnement de bout en bout Bull propose des prestations de conseil et l intervention de ses experts pour aider à définir la solution Big Data qui correspond véritablement aux besoins business de l entreprise, et à bâtir l architecture adéquate. Des spécialistes accompagnent la mise en œuvre de bullion pour aider ses clients à en maximiser le potentiel dans leur contexte de production. Enfin, en fonction des besoins, Bull apporte une offre complète de services pour optimiser et exploiter le Data Center. Bull Service Assurance Pour garantir les niveaux de service et les adapter en permanence aux besoins des métiers, Bull Service Assurance accompagne l exploitation avec des services end-to-end de surveillance unifiée et de support proactif reposant sur une organisation dédiée et des centres de services industriels. Bull propose un catalogue de services packagés et modulaires, structurés autour de trois piliers : surveillance unifiée des services IT et pilotage du Data Center ; gestion des changements et de la compatibilité ; haute disponibilité. Bienvenue dans nos Demo Centers Pour se faire une opinion sur une solution, rien ne vaut de la voir fonctionner. C est dans cette optique que Bull a conçu le Customer Briefing Center : mettre à disposition un environnement accueillant où clients et experts peuvent se rencontrer et échanger. Outre bullion, le Customer Briefing Center dispose de nombreux matériels de différents fournisseurs. Il reçoit chaque année des centaines de visiteurs, que ce soit pour un briefing technologique, un «Proof of Concept» ou un benchmark. 7 Big Data avec bullion
W-bullionS-BigData-fr1 Bull SAS - 2014 - RCS Versailles 642 058 739 - Toutes les marques citées dans ce document sont la propriété de leurs titulaires respectifs. Bull se réserve le droit de modifier ce document à tout moment et sans préavis. Certaines offres ou composants d offres décrits dans ce document peuvent ne pas être disponibles localement. Veuillez prendre contact avec votre correspondant Bull local pour prendre connaissance des offres disponibles dans votre pays. Ce document ne saurait faire l objet d un engagement contractuel. Bull - Rue Jean Jaurès - 78340 Les Clayes sous Bois France Ce flyer est imprimé sur papier composé de 40 % de fibres éco-certifiées issues d'une gestion forestière durable et de 60 % de fibres recyclées, en application des règles environnementales (ISO 14001). 8 Big Data avec bullion