BIGDATA AN 3 : UNE NOUVELLE ERE DE B.I. QUELLES PERSPECTIVES POUR LES 20 PROCHAINES ANNEES? 22 MARS 2013 CHARLES PARAT, DIR. INNOVATION
adoption L ADOPTION DES EVOLUTIONS B.I. EST LENTE BIGDATA BUZZ MAINFRAME CLIENT/SERVEUR WEB? L4G + INFOCENTRE REQ METIER + SQL / DW DATAVIZ + NOSQL /?? 1970 1980 1990 2000 2010 Date - page 2
LE PROGRES B.I. : PLUS DE VOLUME, PLUS VITE DW Il faut adapter les concepts un peu académiques du modèle décisionnel classique En tirant partie des évolutions technologiques Occultées par les géants du secteur (bases de données classiques) Quelquefois éprouvées (l innovation est de les adopter enfin) Quelquefois neuves (l innovation est de les évaluer) En assouplissant les dogmes des années 80 Le couple Datawarehouse/DataMart a figé le time to business Les technologies aident à l adapter plus librement En prenant en compte les contraintes de la «vraie vie» En anticipant les besoins «nouveaux Mobilité, RealTime, BigData, DatViz, Flexibilité, Time to Business Page Date - 3 page 3
EFFET BIGDATA? DE QUOI PARLE-T-ON? DE VOLUMES DE DONNEES CONSIDERABLES EN STOCK EN FLUX D HETEROGEINEITE DE STUCTURES DE REFERENTIELS DE VITESSE DE CAPTAGE D ANALYSE DE PRISE DE DECISION DE DECOUVERTE DE SENS DE VALEUR DE LEVIERS DE VALEUR DE FANTASMES Date - page 4
MICROPOLE UN CŒUR DE BUSINESS IMPACTE PAR LE BIGDATA Date - page 5
BIGDATA : LA DISPARITE DES ENTREPRISES DONNEES AUTOMATES DONNEES CLIENTS DONNEES «SOCIALES» DONNEES «DU WEB»? QUELLE VALEUR? QUELLE CROISSANCE? QUELS ENJEUX? POUR L ENTREPRISE DONNEES PUBLIQUES DONNEES PRODUITS DONNEES METIERS DONNEES ADMIN. Date - page 6
LES GRANDES TYPOLOGIES D USAGE «BIG DATA» 80% des entreprises ont surtout ce problème Capteurs, Flux formaté «EFFET» BIG DATA! BIGDATA Contenu web, Flux ad hoc EXPLOSION PREVUE POUR 2015 Permanentes Volatiles Internes Externes DWH Documents (CMS) Structurées Non structurées Date - page 7
LES 3 GRANDES RUPTURES INDUITES PAR LE BIGDATA EN ENTREPRISE RUPTURE TECHNOLOGIQUE RUPTURE METHODOLOGIQUE RUPTURE STRATEGIQUE Date - page 8
LE BIGDATA NE DATE PAS D HIER DEPUIS 10 ANS, LE BUSINESS DE L INFORMATION MASSIVE S EST DÉJÀ POURVU Amazon.com American Airlines AOL ebay Fox Interactive Media Facebook Google LinkedIn Netflix Riot Games The New York Times Twitter Yahoo! ET DEPUIS 2009, LES EFFORTS DES PIONNIERS SONT REVERSES A L OPEN SOURCE (LEAD PROJET APACHE ) Date - page 9
innovation techno LE BIGDATA REVELE UNE LONGUE SUITE D INNOVATIONS TROP MECONNUES Search NOSQL In-Memory Colonnes Adoption innovations SGBD/R 1980 SGBD/R+ Principaux acteurs du marché 1990 2000 2010 Date - page 10
LE BIGDATA FORCE AU DISCERNEMENT B.I. Structurées Non structurées Search Internes Externes (VLDB s) MPP Capteurs, Flux formaté «effet» BIGDATA! Contenu web, Flux ad hoc nosql Colonnes CMS DWH Documents Date - page 11 Appliances
DATAVISUALIZATION, DATA MINING, SEARCH : LES OUTILS D UNE NOUVELLE FORME D ANALYSE DES DEMONSTRATIONS DE PERTINENCE A LA VOLEE DES CONNECTIVITES RICHES AUX DIVERSES SOURCES DES PERFORMANCES DE TRAITEMENT SIDERANTES DES ERGONOMIES DE PLUS EN PLUS EVIDENTES Date - page 12
internes externes internes externes UNE TENDANCE FORTE : CONVERGENCE B.I.-SEARCH La montée en puissance des usages de données externes (marketing, risques, achats, RH, ) La montée en puissance des usages des données variées (structurées et non-structurées) L enrichissement rapide des outils de restitution des éditeurs de Search (datavisualization) B.I. Search B.I. Search Web Data Web Data 2010 >> 2015? DWH CMS DWH CMS Date - page 13 structurées non-structurées structurées non-structurées La mutation des usages d analyse est en marche
ETL/CDC IN-MEMORY? LE BIGDATA CHAHUTE LES ARCHITECTURES Référentiel métiers Usage Ciblage à la volée, Recommandation SIO Gestion (Interne) ETL Usage B.I. opérationnelle, ciblage, segmentation, campaign mgt BigData externe (web, e-commerce, données sociales, données mobiles, données publiques, ) Flux opérationnels détails, par canal (BigData endogène)? CDC+ Stockage détail parallélisé Usage B.I. analytique / prédictive Date - page 14
LE BIGDATA MET LA PRESSION SUR L ORGANISATION DONNEES D ENTREPRISE = PROJET STRATEGIQUE 1 instance 1 mission 1 gouvernance Sponsor Stratégique collaboration pérennité redondance Statisticiens Métiers CORPORATE STRATEGIC DATA COUNCIL Informaticiens Je vais coûter cher, je suis DataScientist Date - page 15 Moyens propres (datalab ) exploration expérimentation étude
TIME-TO-BUSINESS : OBLIGATION DE PENSER AGILE SCENARIO AGILE BESOIN METIER Gouvernance forte SPECIFICATIONS IDENTIFICATION QUALIFICATION DONNEES UTILES ALIMENTATION DW REALISATION ETATS OUVERTURE D ACCES SCENARIO CLASSIQUE tunnel B.I. classique Temps de mise à disposition de la B.I. Date - page 16
TIME-TO-BUSINESS : OBLIGATION DE PENSER AGILE SCENARIO AGILE RAD ANALYSE PRESENTATION RAD VALIDATION RESULTAT PILOTE OPERATIONNEL, V0 EVALUATION CONTINUE VERSIONS SUIVANTES PRISE EN COMPTE des DONNEES COMMUNES BESOIN METIER Gouvernance adaptée Gouvernance forte SPECIFICATIONS IDENTIFICATION QUALIFICATION DONNEES UTILES ALIMENTATION DW REALISATION ETATS OUVERTURE D ACCES SCENARIO CLASSIQUE tunnel B.I. classique Temps de mise à disposition de la B.I. Date - page 17
MERCI Date - page 18