Pourquoi intégrer le Big Data à son organisa3on? Yvan Robert, VP Affaires Stratégiques Emmanuel Faug, Resp. pra>que BI Colloque 2014 Big Data
Agenda Qui sommes nous? L importance de l information Méthodes d analyse Comment intégrer le modèle big Data à son organisation? Conclusion
QUI SOMMES NOUS?
Qui sommes nous? Fondé en 2003 Plus de 120 employés Spécialiste dans les bases de données et l exploitation des données Oracle Java Centre d expertise : ü Acquisition et partage des connaissances ü Veille permanente sur les tendances ü Innovation sur les outils et les approches méthodologiques Intérêt pour le Big Data depuis plus d un an Projet Big Data en partenariat avec Desjardins et Université Laval
Nos dis3nc3ons 50 sociétés les mieux gérées du Canada Commandité par Deloitte, le groupe CIBC, La Presse et la Queen s School of Business, le concours des sociétés les mieux gérées au Canada est le principal palmarès des entreprises au pays. 2011, 2012 et 2013 Profit 200 Les Leaders de la croissance Classement des entreprises selon leur taux de croissance sur 5 ans 2009 Chambre de commerce de Québec Entreprise de l année 2009 Moyenne et grande entreprise Région Capitale- Na:onale et Chaudière- Appalaches Prix MauricePollack Prix québécois de la citoyenneté 2008 2005-2006-2011
L IMPORTANCE DE L INFORMATION?
L importance de l information L ère du feu ü L information est sous forme papier ü Difficile à exploiter pour comprendre les phénomènes, étudier et en faire une théorie ü Analyse du savoir par observation
L importance de l information L ère industrielle ü L information est numérisée ü Mise en place des chaînes de traitements et d outils pour traiter l information ü Capacité d avoir des états, des tendances et même, des projections
L importance de l information L ère du Web ü Avalanche d informations ü Modèle d analyse évolutif et itératif ü Accès à l information sans limite ü Ce n est pas la naissance du Big Data
L importance de l information Les organisations métiers L armée Les services de renseignements Les applications Web
L importance de l information Plus d'un milliard d'utilisateurs uniques visitent YouTube chaque mois Plus de six milliards d'heures de vidéo sont visionnées chaque mois presqu'une heure par personne sur Terre Chaque minute, les internautes mettent en ligne 100 heures de vidéo sur YouTube # utilisateurs actifs par jour : 757 millions en moyenne une augmentation de 22% année sur année # utilisateurs actifs mensuels : 1,23 milliard Chaque seconde : près de 100 000 300 millions d'utilisateurs actifs mensuels Représente 3.153 milliards de requêtes par an 1,5 milliard de photos chargées chaque semaine
L importance de l information Avez-vous besoin d un Jet pour vous déplacer en ville?
L importance de l information Avez-vous besoin d un autoroute pour vous rendre à votre chalet?
MÉTHODES D ANALYSE
Méthodes d analyse Mise en contexte Environnement transactionnel GÉRER LA DONNÉE POUR SUPPORTER LES OPÉRATIONS Actions Informations Environnement analytique EXPLOITER LA DONNÉE POUR ORIENTER LES DÉCISIONS ü Besoins différents è Compétences, méthodologies et technologies spécifiques
Méthodes d analyse Approche traditionnelle Besoin Comprendre le courant Améliorer la performance Environnement analytique Enrichissement de l'action Opérations Lignes affaires Enrichissement de l'analyse TI Conception de modèles prédéfinis (figés) en fonction des besoins E ntrepôt de données Données "organisées" transformées (fortement reliées) => Approche pertinente et efficace pour répondre à ce besoin! Processus complexe d'intégration (harmonisation, historisation, etc.) Sources de données "organisées" (faiblement reliées)
Méthodes d analyse Limites de l approche traditionnelle Nouveau besoin Intégrer les nouvelles sources Big Data pour créer et suivre de nouveaux indicateurs Environnement analytique Enrichissement de l'action Opérations Lignes affaires Conception de modèles prédéfinis (figés) en fonction des besoins Enrichissement de l'analyse E ntrepôt de données Données "organisées" transformées (fortement reliées) Impacts Révision des modèles d'exploitation et du processus d'intégration des données sources TI Processus complexe d'intégration (harmonisation, historisation, etc.) Sources de données "organisées" (faiblement reliées) => fastidieux et coûteux!!!
Méthodes d analyse Approche Big Data Le Big Data c est quoi? ü Données non organisées (structurées ou non) ü Les 3V (volume, variété, vélocité) et même plus valeur, variabilité, véracité, etc. Quels sont les enjeux? ü Intégrer rapidement des données multi structurées ü Créer dynamiquement des modèles évolutifs d exploitation de ces sources pour pouvoir interroger les mêmes données sous plusieurs perspectives
Méthodes d analyse Approche Big Data : «écosystème» "Écosystème" Big Data Outil BI #1 Outil BI #2... Outils BI traditionnels pour exploiter les résultats Moteurs de requêtes adaptés au besoin Moteur de requêtes #1 Moteur de requêtes #2... Couche sémantique Référentiel de métadonnées Association, mise en relation des données Interface pour lire les données sources Fichiers sources Données "brutes" Intégration : sélection, filtrage Bases de données opérationnels internes Données ouvertes Entrepôt de données Sources de données multiples et variées
Méthodes d analyse Fonctions de l écosystème Big Data Administrer Temps réel Différé Optimiser Sécuriser Analyser la donnée Multi usages Structurée Temps réel Non structurée Temps réel Collecter et intégrer la donnée Différé Différé Transformer la donnée Restituer l'information Temps réel Différé Multi canal Structurée Non structurée Stocker la donnée Mémoire Local Cloud Disque
COMMENT INTÉGRER LE MODÈLE BIG DATA À SON ORGANISATION?
Comment intégrer le Big Data? Capacité de concevoir des modèles de relations, à la demande Capacité de dénombrer les objets par catégories Difficile de distinguer les objets
Comment intégrer le Big Data? Modèle Big Data Conception de modèles et analyses par l'expérimentation (processus itératif) Environnement analytique Enrichissement de l'analyse Couche sémantique Données fortement reliées Environnement transactionnel Enrichissement de l'action Lignes affaires TI Référentiel de métadonnées Étiquetage des données Sources de données "Big Data" peu ou pas transformées (faiblement reliées)
Comment intégrer le Big Data? L approche Big Data n est pas seulement pour des organisations comme Google ü Ce concept est valorisable pour être appliqué à une plus petite échelle ü Les outils sont conçus pour cela et répondent aux besoins orientés «libre service» ü Il est possible et recommandé d y aller à la carte, en fonction du besoin, du type de données à traiter ü Le modèle est évolutif selon le volume, la variabilité, le temps de traitement, etc.
Comment intégrer le Big Data? Les impacts sur l organisation sont : Organisationnels ü Compétences / méthodologies: ü Analyste d affaires ü Analyste de données (Modélisateur) ü Mathématicien / Statisticien / Actuaire ü Spécialiste BI ü Équipe technologie de l information
Comment intégrer le Big Data? Les impacts sur l organisation sont : Culturels ü Gouvernance de la donnée, redistribution des rôles (TI vs Affaires) Techniques ü Nouvelles infrastructures et nouveaux outils : évolution et démocratisation en cours
CONCLUSION
Conclusion Constats ü Nouveau phénomène : pas encore assez de cas et peu de recul possible pour le moment ü Cependant : ü Incontournable, au même titre que ce que nous avons vécu par le passé avec les entrepôts de données ü Ne vient pas remplacer l approche traditionnelle mais plutôt répondre à de nouveaux besoins : exploitation libre, expérimentation de modèles d analyses ü Concept applicable à plus petite échelle : Inutile d attendre d avoir les 3V ou plus pour appliquer le concept dans vos organisations, petites ou grandes!!!
Conclusion En résumé ü Rien n est magique!!! ü il existe un investissement initial ü Cependant ü l effort en vaut la chandelle ü Gain important ü la mise en place d une approche Big Data va apporter beaucoup plus de flexibilité dans l organisation
Merci!