IBM Software Big Data
2 Points clés Aide les utilisateurs à explorer de grands volumes de données complexes Permet de rationaliser le processus de développement d'applications impliquant de grands volumes de données Permet de surveiller et de gérer des systèmes impliquant de grands volumes de données, afin d'obtenir des performances sécurisées et optimisées Accélère le retour sur investissement, grâce à des modules analytiques propres à chaque secteur d'activité Définition de Big Data Chaque jour, nous créons 2,5 quintillions d'octets de données (il faut savoir que 90 % des données existantes dans le monde actuellement ont été créées au cours de ces deux dernières années). Ces données proviennent de sources multiples : capteurs utilisés pour recueillir des informations sur le climat, messages publiés sur les sites de réseaux sociaux, photos et vidéos numériques, enregistrements de transactions d'achats, signaux GPS de téléphones portables. Le Big Data recouvre quatre dimensions : Volume : Les entreprises sont submergées par un flux de données croissant, de tous types, qui représente plusieurs téraoctets (voir pétaoctets) d'informations. Vélocité : Pour les processus urgents tels que la lutte contre la fraude, les grands volumes de données doivent être analysés dès leur apparition dans l'entreprise, afin que leur valeur ajoutée soit maximisée. Variété : Le Big Data va au-delà des données structurées, et inclut des données non structurées de différentes sources : texte, données de capteurs, données audio, vidéo, données de parcours de navigation, fichiers journaux, notamment. Véracité : Avec l'augmentation constante de la complexité des données, les entreprises doivent veiller à garder le même niveau de confiance dans ces données. La création d'un climat de confiance est essentielle pour obtenir des résultats plus satisfaisants. Le Big data en action Services financiers Gestion des risques et de la fraude Vue à 360 du client Santé/Sciences de la vie Analyse de dossiers médicaux Analyses génomiques Télécommunications Traitement des enregistrements d'appels Monétisation des profils clients Supports numériques Ciblage publicitaire en temps réel Analyses de sites Web Commerce de détail Marketing omni-canal Analyse du parcours de navigation Web Maintien de l'ordre Surveillance multimodale en temps réel Détection de cyber-sécurité Energie et Services publics Analyses intelligentes de données de comptage Gestion des actifs Transports Optimisation de la logistique Gestion des embouteillages Figure 1 Le Big Data joue un rôle important dans les processus basés sur des informations, tous secteurs confondus, de la détection/gestion de la fraude à l'optimisation de la logistique. IBM a développé une plateforme Big Data complète, intégrée et solide, qui permet de répondre à tous les besoins des entreprises ayant recours à de grands volumes de données. Les principales fonctions de cette plateforme sont les suivantes : Fonctions d'analyse Hadoop : Elles permettent de traiter de grands ensembles de données sur des clusters de serveurs courants Fonctions de calcul en continu : Elles permettent d'effectuer l'analyse de grands volumes de données en continu, avec des temps de réponse inférieurs à une milliseconde Fonctions d'entreposage de données : Elles offrent une perspective opérationnelle approfondie, avec des capacités avancées d'analyse de base de données Fonctions d'intégration des informations et de gouvernance : Elles permettent de comprendre, de nettoyer, de transformer, de gérer et de fournir des informations fiables dans le cadre d'initiatives stratégiques pour l'entreprise
IBM Software 3 IBM offre également un large éventail de services pour plateforme : Les produits suivants constituent la base de l'offre IBM Big Data : Services de visualisation et de reconnaissance : Ils aident les utilisateurs à explorer de grands volumes de données complexes Services de développement d'applications : Ils permettent de rationaliser le processus de développement d'applications impliquant de grands volumes de données Services de gestion de systèmes : Ils permettent de surveiller et de gérer des systèmes impliquant de grands volumes de données, afin d'obtenir des performances sécurisées et optimisées Accélérateurs : Ils accélèrent le retour sur investissement, grâce à des modules analytiques propres à chaque secteur d'activité BI / reporting Exploration / visualisation Visualisation et reconnaissance Système Hadoop analytiques fonctionnelles industrielles Développement d'applications Accélérateurs Calculs en continu d'analyse prédictive Gestion des systèmes d'analyse de contenu Entreposage de données Fonctions d'intégration des informations et de gouvernance Figure 2. Cette plateforme intègre des technologies traditionnelles adaptées aux tâches structurées et répétitives, ainsi que de nouvelles technologies complémentaires, idéales pour l'exploration de données ad hoc, la reconnaissance et les analyses de données non structurées. IBM InfoSphere BigInsights : Permet aux entreprises de bénéficier des atouts de Hadoop, et renforce ses apports en termes de performances, de fiabilité, de sécurité et de fonctions d administration. Facilite la reconnaissance et l'analyse de nouvelles opportunités cachées dans de grands volumes de données complexes, structurées ou non. IBM PureData System for Hadoop : Système spécialement conçu basé sur des normes, permettant d'intégrer des logiciels, des serveurs et des espaces de stockage Hadoop InfoSphere BigInsights à un système très simple à gérer. IBM InfoSphere Streams : Permet d'utiliser des fonctions d'analyse à très faible latence sur différents types de données, ce qui renforce la visibilité et les prises de décisions de l'entreprise, et permet de réagir en temps réel à tous les événements. IBM PureData System for Analytics Doté de la technologie IBM Netezza, IBM PureData for Analytics est un dispositif d'une grande simplicité permettant de réaliser des analyses complexes. Il simplifie et optimise les performances des services de données pour applications analytiques, et permet d'exécuter en quelques minutes seulement (au lieu de longues heures) des algorithmes très complexes. Il associe rapidité, simplicité et retour sur investissement accéléré. IBM PureData System for Operational Analytics Ce système de données intégré et expert a été conçu et optimisé spécifiquement pour répondre aux besoins en matière de charges de travail analytiques opérationnelles. Il offre des niveaux élevés de performance et de fiabilité, et permet de gérer simultanément des milliers de requêtes opérationnelles. La fonction d'insertion de données en continu garantit la disponibilité des données les plus actualisées pour les analyses, tandis que les capacités adaptatives de compression de l'espace de stockage permettent d assurer des coûts de stockage inférieurs. IBM Smart Analytics System : Système intégré modulaire et flexible, doté d'un logiciel d'analyse et d'entreposage de données, ainsi que d'un serveur IBM et de capacités de stockage optimisées pour les analyses opérationnelles.
IBM DB2 avec BLU Acceleration : Permet d'accélérer le reporting et les analyses, grâce au recours à des technologies de traitement dynamique en colonnes, et offre une grande efficacité de recherche et d'analyse des données pertinentes. Doté d'innovations telles que le traitement vectoriel parallèle, le Data Skipping et la compression, il permet d'accélérer l'exécution des requêtes analytiques. IBM Informix : En plus de la prise en charge des workloads OLTP et OLAP, Informix contient des fonctions intégrées de gestion de données spatiales et d intervalle, utilisées dans des applications et des analyses spatiotemporelles. Pour la mise en route de la plateforme Big Data, visitez le site Web suivant : ibm.com/infosphere/quickstart ibm.com/infosphere/streams-quickstart IBM InfoSphere Information and Integration Governance : Cet ensemble de fonctionnalités rassemble des données issues de sources variées et destinées à différentes cibles. Il en gère la qualité et les données référentielles pour différents domaines. Par ailleurs, il permet de sécuriser et de protéger les données, de les gérer tout au long de leur cycle de vie et facilite la collaboration via une circulation améliorée des informations au sein de l'entreprise et des équipes techniques. Pourquoi choisir IBM? IBM offre une plateforme d'entreprise capable de prendre en charge l'étendue complète des cas d'utilisation de Big Data. La plateforme IBM Big Data possède cinq avantages majeurs : Une plateforme complète : Elle a été conçue pour la gestion et l'analyse de données volumineuses, variées et en mouvement, dans un souci de renforcement de la véracité et de la fiabilité de vos prises de décisions. Des capacités d'entreprise : Elle offre les fonctions de gestion, de sécurité, de fiabilité et de confort d'utilisation nécessaires aux déploiements à grande échelle Des accélérateurs analytiques : Elle contient des moteurs analytiques optimisés pour les grands volumes de données, ainsi que des accélérateurs intégrés pour applications spécifiques à certains secteurs d'activité (ou communes à plusieurs d'entre eux). Des outils de visualisation : Elle permet aux utilisateurs d'explorer toutes les données disponibles, à des fins d'analyse ad hoc. Intégration et gouvernance : Permet aux entreprises de mieux comprendre les données dont elles disposent, de les améliorer et de permettre aux utilisateurs métier (et aux autres) d'exercer une action sur ces données, augmentant ainsi la confiance dans leur Big Data. Pour en savoir plus Pour plus d'informations sur la plateforme IBM Big Data et sur les solutions Big Data, contactez votre représentant IBM ou votre Partenaire Commercial IBM, ou visitez le site Web suivant : ibm.com/bigdata ZZW03269-FRFR-00
Copyright IBM Corporation 2013 Compagnie IBM France 17 avenue de l Europe 92275 Bois Colombes Cedex FRANCE Imprimé en France Septembre 2013 IBM, le logo IBM, ibm.com, BigInsights, DB2, Informix, InfoSphere et PureData sont des marques déposées d'international Business Machines Corp. aux Etats-Unis et/ou dans certains autres pays. Les autres noms de produits et services peuvent appartenir à des tiers. La liste actualisée de toutes les marques d'ibm est disponible sur la page Web «Copyright and trademark information» à l'adresse ibm.com/legal/copytrade.shtml Netezza est une marque d'ibm International Group B.V., une entreprise du groupe IBM. Le présent document est en vigueur à compter de la date de publication. Il peut être modifié à tout moment par IBM. TOUTES LES INFORMATIONS DU PRESENT DOCUMENT SONT FOURNIES «EN L'ETAT», SANS AUCUNE GARANTIE DE QUELQUE NATURE QUE CE SOIT, EXPRESSE OU IMPLICITE, Y COMPRIS TOUTE GARANTIE DE QUALITE MARCHANDE, D'ADEQUATION A UN USAGE PARTICULIER OU DE NON-CONTREFACON. Les produits IBM sont garantis conformément aux conditions des accords selon lesquels ils sont fournis. Recyclable IMB14135-FRFR-02