3
Appliances analytiques: le "Data as a Service" pour vos utilisateurs décisionnels Frédéric Montaigu-Lancelin Philippe Ramé 3
«Data as a Service (DaaS)» Agilité les utilisateurs sont plus réactifs car l accès à la donnée est simple et ils n ont pas besoin d une connaissance pointue des modèles de données. Si il émerge un besoin d enrichissement ou de localisation, l implémentation est simple car les changements sont minimes. Economique les propriétaires des données mettent à disposition une couche de présentation (ex : SOA) simple à faire évoluer et qui facilite la mise à disposition aux utilisateurs de nouvelles informations. Qualité des données l accès aux données est fournie par des services dédiés, ce qui améliore la qualité du fait de l unicité des méthodes d accès. Une fois ces services validés par les utilisateurs, il suffit d en vérifier la nonrégression sur les prochains déploiements. Une fois chargée, les données sont accessible pour tout type d interrogations
Le volume des données disponibles au niveau mondial explose plus de données et de contenus dans la prochaine décennie des données mondiales sont non structurées 2020 2009 Source: IDC, The Digital Universe Decade Are You Ready?, May 2010 2010 IBM Global CEO Study Le constat est le même : une quantité d information croissante une grande variété de l information (structurée, non structurée) des analyses de plus en plus en complexes une réduction du temps de cycle entre collecte de données et prise de décision sur l information
Une plateforme Big Data doit pouvoir tout analyser Analyser l information en mouvement Gestion des Smart Grids Surveillance multimodale AnalyseTemps réel Cyber sécurité Surveillance des enfants (ICU) Négoce d options Analyse des click-stream Call Detail Record processing Analyse des logs Analyse de la traçabilité RFID Analyser une grande variété d information Analyse des media sociaux Analyse d opinion Analyses geospatiale Stratégie de marque Recherche scientifique Système d alerte épidémiologique Analyse de marché Analyse video Analyse audio Découverte & Expérimentation Analyze des volumes extrêmes d information Créer de nouvelles offres à partir de l analyse des données de transaction et la découverte de sens Modélisation et Détection de la Fraude Modélisation et Gestion des Risques Analyse des media sociaux / Analyse d opinion Analyse environmentale Gérer et planifier Analyse opérationnelle reporting BI Analyse de planification, de prévisions Simulation, Analyse prédictive Analyse d opinion Strategie de marque Recherche scientifique Analyse Ad-Hoc Développement de modèles Tests d hypothèses Découverte de sens par analyse des données et création de nouveaux produits et services.
La vision d IBM est de rendre l utilisation des systèmes décisionnels, simples, rapides et accessibles à tous A toute personne Déployer avec flexiblité des solutions d'analyse pour tous Tout rôle Toute taille de solution (individuel jusqu à l échelle de l internet Déploiement flexible (web, mobile, cloud ) Démarrer puis croitre avec toutes les perspectives qui lui importent et la liberté d'analyse qu elle est en droit d'attendre Permettre à tous de trouver et d interagir avec l'information la plus pertinente pour lui Responsabiliser chacun avec des moyens rapides et faciles d analyse, Tout horizon de temps (historique, temps réel, prédictif) Toutes sources de données Livrées dans son contexte Bonne équilibre de confiance Au travers de tous les processus Facile d utilisation pour les métiers Interfaces cohérentes au travers de toute les applications et/ou appareils Décisions collaboratives Interaction progressive
et de répondre à tous les types de besoins. Scorecards Dashboards Reports Predictive Analysis Ad-hoc Query Real-Time Monitoring What-If Analysis Trend & Statistical Analysis Analysis & Exploration 8
Les entrepôts de données sont sur le chemin critique de la performance des systèmes d information décisionnels Applications Transactionnelles et Collaboratives Analyser Intégrer Applications d analyses spécifiques Contenu Master Data Management Big Data (Hadoop) www Gérer & rer er ég Int ettoy N Sources Externes Données Cubes & Mining Data Warehouse Données Structurées Stream Processing Contenu Streaming Informatio n Gouverner Qualité Securité & Protection Cycle de Vie
Cette vision s appuie sur un portefeuille de solutions innovantes enrichi d investissements stratégiques réguliers $14B+ in Acquisitions Since 2005 10,000+ Technical Professionals 7,500+ Dedicated Consultants Social Analytics/Consumer Insight Largest Math Department in Private Industry 27,000+ Business Partner Certifications 8 Analytics Solutions Centers Optimized hardware and software offerings 100 analytics-based research assets; almost 300 researchers Significant marketing investment worldwide through Smarter Planet Deep Compressi Developer AutonomicProductivity on Operations pure XML Workload Optimized Advanced Case Systems Management Content Decision Analytics Managemen Stream tcomputin Pervasive g Content pure Scale Smarter Planet Growth Markets Business Analytics and Optimization Cloud and Next Generation Data Center 10 Initiatives de croissance IBM 2010-2015
La vision IBM du cycle de vie de la donnée Sources de données Applications Analytiques Ecosystème Big Data Real-time InfoSphere Analytic Zone Streams Streams F a bi ru q e d e d o n n é e s InfoSphere Information Streams Ingestion and Operational Information Stream Processing Data InfoSphere Integration Information Master Data Video/Audio Network/Sensor Entity Analytics Predictive Landing Area, Analytics Zone and Archive Server Intelligence Analysis Exploration, Integrated Warehouse, and Mart Zones Discovery PureData Deep Reflection Operational Systems Predictive BigInsights Raw Data Structured Data Text Analytics Data Mining Entity Analytics Machine Learning InfoSphere Information Server Information Governance, Security and Business Continuity A c c è s a u x D o n n é e s Decision Management BI and Predictive Analytics InfoSphere Analytic Data Explorer Applications
Qu est-ce que le 12 Go to 'View > Header and Footer' to change this footer text to the event title
T M Systèmes intégrés conçus pour le Cloud Computing Expertise intégrée Conçu comme un ensemble Intégrer les connaissances des experts dans tous les domaines de l appliance En intégrant très étroitement logiciel et matériel pour en tirer le maximum Opération Simplifiée Simplifier le cycle de vie informatique avec une administration globalisée et automatisée des sous-composants Go to 'View > Header and Footer' to change this footer text to the event title
Performance, simplicité, agilité Une appliance dédiée à l Analytique Le serveur, le stockage le système et la base de données ont été intégrés dès la conception. Analytics Database ODS, Datawarehouse et Datamart Storage Fonctions analytiques haute performance Server Go to 'View > Header and Footer' to change this footer text to the event title
PureData System for Analytics Powered by Netezza technology Transformer l expérience des utilisateurs Spécifiquement conçue pour le décisionnel Base de données, serveur et stockage intégrés Reposant sur des standards Excellent rapport Prix/Performances 10 à 100 plus rapide / système traditionnel Simple à utiliser et à administrer Capacité de Petaoctets de données utilisateur Analyses avancées hautes performances
IBM PureData System for Analytics L appliance Décisionnelle par excellence Built-in Expertise No indexes or tuning Data model agnostic Hardware accelerated, fully parallel, optimized, In Database Analytics Integration by Design Server, Storage, Database in one easy to use package Automatic parallelization and resource optimization to scale efficiently and economically Enterprise-class security and platform management Simplified Experience Up and running in hours Minimal up front design and tuning Minimal ongoing administration Standard interfaces to best of breed Analytics, Business Intelligence, and data integration tools Built-in, complex analytical capabilities allow users to derive insight from their data quickly Easy connectivity to other Big Data Platform components Go to 'View > Header and Footer' to change this footer text to the event title
Les qualités plébiscitées de PureData for Analytics Rapidité Evolutivité 15,000 utilisateurs faisant tourner 800,000+ requêtes par jour 50X plus rapide qu auparavant 1 PB sur Netezza 7 ans de données historiques Croissance annuelle des données : 100-200% «quand quelque chose prend 24 heures, je ne peux que l'exécuter, mais quand une opération ne prend que 10 secondes, j'ai le temps de repenser complètement l'activité» NYSE a remplacé sa base de données relationnelles Oracle avec Pure Data for Analytics ce qui lui a permis de conduire des recherches rapides sur plus de 650 terabytes de données ComputerWeekly.com - SVP Application Development, Nielsen Simplicité Agilité
What Makes PureData System for Analytics Up to 2000X faster than before Speed Growing by 30% every month Different? Netezza has allowed us to reduce the complexity of regulatory reporting and processing of exchange data from days down to minutes. Simplicity Up and running 6 months before having any training 200X faster than Oracle system ROI in less than 3 months Scalability 1 PB on Netezza 7 years of historical data 100-200% annual data growth Allowing the business users access to the Netezza box was what sold it. - Steve Taff, Executive Dir. of IT Services NYSE has replaced an Oracle IO relational database with a data warehousing appliance from Netezza, allowing it to conduct rapid searches of 650 terabytes of data. - ComputerWeekly.com Smart SUNY Buffalo researchers reduced the time to perform quintillions of computations from 27 hours to 12 minutes Go to 'View > Header and Footer' to change this footer text to the event title Once we had the data on Netezza we were able to do the same analysis and much more complex analysis in minutes. The research draws on medical records, lab results, MRI scans, and patient surveys. - Dr. Murali Ramanathan, SUNY Buffalo 18
L évolution de la technologie Netezza IBM PureData System for Analytics N2001 Latest Version of IBM PureData System for Analytics IBM PureData System for Analytics N1001 (with NPS 7.0) Introduction of the Analytic Data Warehouse Appliance Impact Impact Introduction of IBM PureData System for Analytics TwinFin with Netezza Analytics (300X Performance) TwinFin Petabyte Data Warehouse Appliance (150X Performance) NPS 10000 Series 100 TB Data Warehouse Appliance Introduction of the Data Warehouse Appliance (50X Performance) NPS 8000 Series 2003 2006 2009 2010 2012 2013
Bénéfices du PureData System for Analytics Le meilleur de la technologie Netezza Performance des requêtes décisionnelles Augmenter l efficacité de votre Data Center Simplicité et Administration réduite 3X plus vite que la génération précédente 128 GB/sec en lecture par rack2 50% de stockage en plus par rack Plus de puissance et moins de consommation par rack Résilience et Gestion facilitée 70% d appels support en moins Go to 'View > Header and Footer' to change this footer text to the event title
PureData System for Analytics Hardware Modèle N2001 12 Disk Enclosures 288 600 GB SAS2 Drives 240 for User Data 14 for S-Blades 34 Spare RAID 1 Mirroring 2 Hosts (Active-Passive) 2 6-Core Intel 3.46 GHz CPUs 7x300 GB SAS Drives Red Hat Linux 6 64-bit ½ Rack jusqu à 4 Racks 7 PureData for Analytics S-Blades 2 Intel 8 Core 2+ GHz CPUs 2 8-Engine Xilinx Virtex-6 FPGAs 128 GB RAM + 8 GB slice buffer Linux 64-bit Kernel User Data Capacity: Data Scan Speed: Load Speed (per system): 192 TB* 450 TB/hr* 5+ TB/hr * Assuming 4X compression Power Requirements: 7.5 kw Cooling Requirements: 27,000 BTU/hr
Le DaaS avec 22 Go to 'View > Header and Footer' to change this footer text to the event title
Moins d administration, plus de valeur ajoutée ü ü ü ü Simplicité d utilisation et d administration Portail d admin. Web Aucune installation logicielle Pas d index, pas de tuning Aucune gestion du stockage No dbspace/tablespace sizing and configuration No redo/physical/logical log sizing and configuration No page/block sizing and configuration for tables No extent sizing and configuration for tables No Temp space allocation and monitoring No RAID level decisions for dbspaces No logical volume creations of files No integration of OS kernel recommendations No maintenance of OS recommended patch levels No JAD sessions to configure host/network/storage Go to 'View > Header and Footer' to change this footer text to the event title Data Experts, not Database Experts
Running Latest IBM Netezza Platform Software (NPS) 7.x Improved Concurrency, Performance, I/O efficiency and Manageability Better Performance NPS 7 provides greater throughput for tactical queries vs. NPS 61 Directed Data Processing for improved concurrency Page Level Zone Maps eliminating unnecessary disk scanning Improved Management & Efficiency Netezza Performance Portal 2.0 More than half a dozen performance improvements in: Optimizer efficiency Memory management Communications protocols Workload management Faster, better, and completely transparent to the end-user
PureData System for Analytics Optimization With Other IBM Products Big Data Platform Data Integration Business Intelligence / Performance Management System Z InfoSphere Streams InfoSphere BigInsights System ML (Machine Learning) Information Server v9.1 InfoSphere Discovery v4.5 InfoSphere Data Architect v8.1 InfoSphere CDC Heterogeneous Replication InfoSphere Optim Data Archive 9.1 Industry Models v8.4 Banking, Insurance, Healthcare Industry Model Packs Supply Chain, Customer, Market & Campaign Tivoli Storage Manager Vivismo Data Explorer v8.2 Cognos v10.2 Cognos TM1 v9.5 Guardium DB Monitoring v9 SPSS Modeler v15 Unica EMM Marketing Analytics 8.6 Unica NetInsights 8.6 IBM DB2 Analytics Accelerator (IDAA) zlinux ODBC driver Go to 'View > Header and Footer' to change this footer text to the event title Coming Soon: PureData System for Operational Analytics Guardium Informix Data Warehouse Edition SPSS v16
Une plate-forme ouverte Go to 'View > Header and Footer' to change this footer text to the event title JDBC Data In ODBC Ab Initio Cloudera Composite Software IBM Big Insights IBM Information Server IBM InfoSphere Streams Informatica Oracle Data Integrator Oracle GoldenGate SAP Business Objects SQL OLE-DB Data Integration
Go to 'View > Header and Footer' to change this footer text to the event title Data Out ODBC IBM Cognos IBM SPSS IBM Unica Information Builders Kalido KXEN Microsoft Excel MicroStrategy Oracle OBIEE SAP Business Objects SAS Actuate SQL JDBC Reporting and Analysis OLE-DB Une plate-forme universelle
Maîtrise de la qualité de service Puissance garantie Puissance cappée Datamart 1 Chargement Data Warehouse Datamart 2 Chargement/mise à jour simultanés Environnements de travail personnels Requêtes analytiques complexes sur de grands volumes en conservant la performance Workload management Utilisateurs opérationnels Puissance cappée Analystes
PureData for Analytics: Une architecture porteuse de valeur ajoutée Adaptabilité ü Pas de redesign ü Pas de modification des outils et habitudes de travail utilisateurs ü Intégration à l architecture et aux outils existants Gains Extensibilité Réactivité Coût de possession ü Agrégats à la volée / Analyses complexes ü Reporting de masse/ ad-hoc ü Ouverture d espaces de liberté ü Ouverture à de nouveaux usages ü Mise en œuvre rapide de nouveaux besoins métiers (Time-toMarket) ü Mise à jour au fil de l eau accélérée ü Maîtrise de la disponibilité et des contrats de service (SLA) ü Solution intégrée, livrée prête à l emploi ü Diminution de la charge d administration (DBA): Pas d index, pas de gestion du stockage ü Prise en main et formation simplifiées Amélioration de l expérience utilisateur Ouverture de nouveaux horizons métiers Réduction du coût de possession global
Tak Th an k You Gr aci as Russe Espagnol Anglais Danois Coréen Arabe Hébreu Tack så m y ck et Tr u gar ez Hindi Ob r i gad o Chinois traditionnel Suédois M er c Brésilien portuguais Gr a z i e D an k on D an k u Français Italien Esperanto Japonais Chinois i Allemand Thaï Tamil D an k e Hollandais go r ai b h m a i th a ga t Gaélique Breton D ek u jem e Va m Tchèque 30