ELCA Forum 2014 BIG DATA Jérôme Berthier, Head of Division Christian Nançoz, BI Consultant September 2014
SPEAKER Jérôme Berthier Head of Division Topics: Business Intelligence Data Warehouse Big Data :JBerthier Christian Nancoz BI consultant Topics: Business Intelligence Architecture Big Data ELCA Forum 2014: Big Data 16.09.2014 2
AGENDA 1. Introduction au Big Data 2. Cas d utilisation : SBB-CFF-FFS 3. Take away 4. Questions ELCA Forum 2014: Big Data 16.09.2014 3
Qu est ce que c est? Big Data = BI dopée aux Dataphétamines Volume Variety Velocity @ source des images: étude IBM ELCA Forum 2014: Big Data 16.09.2014 4
Qu est ce que c est? PROJETS SERVICES IT Business Consulting IT Strategy Business Analysis COMPETENCES Transversal Competencies Technical Competencies System Integration BI, Big Data & Data Science CRM ECM BPM Collaboration& Intranet ecommerce Website Software Engineering Project Management IT Management ELCA s Specials ipension Sumex Data Protection Digital Mailroom Access & Identity Mgt edossier Project Management User Experience Information Security Offshoring BUSINESS-SOLUTION Vertical Solutions Secutix Fraud Management Architecture & SOA Mobile Horizontal Solutions Digital Mailroom Cloud Database Management Application Management edossier Migration Invoice Mgt Back-End Services ipension Suite Sumex Suite Marketing Automation Records Mgt Front-End Services Interfaces Life Science Quality Mgt Stakeholder Relationship Management 02.07.2014 5 OMC/CCM Sales Force Automation ELCA Forum 2014: Big Data 16.09.2014 5
Qu est ce que c est? Vidéo Audio Documents Texte Log Files Capteurs Analyse des données non structurées Big Data Stockage Traitement Business Intelligence Performance du Cloud ELCA Forum 2014: Big Data 16.09.2014 6
TECHNOLOGIE Vue d ensemble de l architecture Analyses Utilisateurs Standard EDW / DWH (relational DB) relational sources ELCA Forum 2014: Big Data 16.09.2014 7
TECHNOLOGIE Vue d ensemble de l architecture Analyses Utilisateurs Standard Analyses avancées Data Scientist InMemory EDW / DWH (relational DB) Data Lake (Hadoop) Real Time Streaming relational sources multi-structurel sources and external data ELCA Forum 2014: Big Data 16.09.2014 8
TECHNOLOGIE Vue d ensemble de l architecture Analyses Utilisateurs Standard Analyses avancées Data Scientist InMemory EDW / DWH (relational DB) Data Lake (Hadoop) Real Time Streaming Impala relational sources multi-structurel sources and external data ELCA Forum 2014: Big Data 16.09.2014 9
Exemple d applications d implémentation Système de recommandation (publicité en temps réel) Détection de fraudes Veille: eréputation Compétition Marché Optimisation de batch Quels types de données utilisez-vous ou planifiez-vous d'utiliser pour vos analyses Big Data? (n=212) (étude menée par BARC) ELCA Forum 2014: Big Data 16.09.2014 10
Exemple d applications d implémentation Système de recommandation (publicité en temps réel) Détection de fraudes Veille: eréputation Compétition Marché Optimisation de batch Quels types de données utilisez-vous ou planifiez-vous d'utiliser pour vos analyses Big Data? (n=212) (étude menée par BARC) ELCA Forum 2014: Big Data 16.09.2014 11
Cas utilisateur: Lliure powered by Secutix ELCA Forum 2014: Big Data 16.09.2014 12
Cas utilisateur: SUVA Les raisons de la fraude Les assurance accident paient mieux que les assurances maladie (Pas de franchise ou de participation du patient) Factures erronées : Causalité: Mélange des traitements entre la santé et accident (par exemple un genou blessé par accident, deux genoux opérés) Mauvaise qualité de la facture (par example copier/coller des factures DRG) Optimisation du rendement pour le compte de fournisseurs de soins. Nb d assurés : 2 millions Nb de compagnie assurée: 120 000 CA en 2013 : 4.2 Milliard Nb de facture du projet: >1.6 millions Approche Apprentissage supervisé : Utiliser les cas de fraudes connus pour détecter les patterns Apprentissage non-supervisé: Trouver des factures différentes ELCA Forum 2014: Big Data 16.09.2014 13
1 2 3 4 Data as an asset Qu'est-ce que cela signifie pour les CFF? Approche Big Data chez les CFF Comment avons-nous abordé la question? Outil de prévision pour la voie Valeur ajoutée par Big Data? Bilan ELCA Forum 2014: Big Data 16.09.2014 14
ELCA Forum 2014: Big Data 16.09.2014 15
Les «drivers» du big data "hypes" existent depuis longtemps chez les CFF; maintenant, l'effet se fait sentir au quotidien. ELCA Forum 2014: Big Data 16.09.2014 16
Les CFF conduisent le réseau ferroviaire le plus chargé au monde avec la plus grande ponctualité Charge du réseau ferroviaire 2011 Ponctualité 2011 SBB (CH) FS (IT) ÖBB (AT) DB AG (DE) SNCF (F) 0% 100% Quelle: UIC Ponctualité du trafic à longue distance en 2011 selon norme UIC (en pourcentage des trains arrivés tôt, à l'heure ou jusqu'à 15 minutes en retard) ELCA Forum 2014: Big Data 16.09.2014 17
Big Picture : Le cycle de production ferroviaire ELCA Forum 2014: Big Data 16.09.2014 18
L IT dans la production ferroviaire: Processus soutenus ELCA Forum 2014: Big Data 16.09.2014 19
Approche chez les CFF ELCA Forum 2014: Big Data 16.09.2014 20
Big Data roadmap et buts 2013 2014 2015 2016 Big Data Q1 Q2 Q3 Q4 Q1 Q2 Q3 Q4 Q1 Q2 Q3 Q4 Q1 Q2 Q3 Q4 Étude, élaboration, formulation du potentiel / use cases Potentiel: Proof-of-Value avec des use Cases réels Phase 1 Phase 2 Go/No-Go Décision DG IT Configuration Conception et réalisation de la plate-forme au shared service Réalisation use Cases : Déterminer les avantages et les exigences Phase 3 Maintenance, mise à l échelle, extension aux nouveaux use cases Phase 4 Dans la phase actuelle, l'identification du potentiel et les besoins sont primordiales : Identifier le potentiel d'utilisation sur la base d'expériences de l approche Big Data aux use cases réels des CFF Identifier les besoins au niveau de la Data Governance Concrétiser les exigences à la technologie d'une solution Big Data Comprendre les exigences à l'utilisation efficace d'une solution Big Data ELCA Forum 2014: Big Data 16.09.2014 21
Phase 1 : étude avec évaluation du potentiel ELCA Forum 2014: Big Data 16.09.2014 22
Phase 2 : La réalisation des use cases montre les possibilité d utilisation et les avantages du Big Data Exemple, But Challenges Analyse des données de mesure Optimisation Maintenance : économies financières grâce à des améliorations dans les possibilités de prévision. [Q] [t 1 ] [t 2 ] Grandes quantités de données; données complexes; formats différents, grande capacité de stockage et calcul requise. Analyse ponctualité Pour améliorer la ponctualité clientèle, il faut mieux comprendre l'effet des causes de retards. Accès aux données de différents systèmes; augmentation du volume des données et de la complexité; lien entre les différentes sources de données. Estimation transports collectifs Augmenter la précision dans la répartition des coûts en améliorant la distribution des bénéfices. SAS SAS SAS SAS X Abfragen Resultat im Resultat Excel im Resultat Excel im Resultat Excel im Excel X Resultate HOP- Resultat Manuell zusammenführen Endresultat Accès aux différentes sources de données; peu de possibilités de simulations et de prototypage (manque de capacités de calcul et outils). Analyse dérangements aux portes Réduction du nombre de dérangements aux portes. Combinaison et analyse des données SAP ainsi que de sources internes et externes dans une base de données performante. ELCA Forum 2014: Big Data 16.09.2014 23
ELCA Forum 2014: Big Data 16.09.2014 24
Outil de prévision pour la voie ELCA Forum 2014: Big Data 16.09.2014 25
La sécurité est la priorité absolue ELCA Forum 2014: Big Data 16.09.2014 26
Mesures à des fins de sécurité ELCA Forum 2014: Big Data 16.09.2014 27
Situation actuelle: Action réactive avec des données de mesure «offline» ELCA Forum 2014: Big Data 16.09.2014 28
Avenir : Action proactive avec capacité de prévision ELCA Forum 2014: Big Data 16.09.2014 29
Stockage des fichiers de données de mesure ELCA Forum 2014: Big Data 16.09.2014 30
Bilan ELCA Forum 2014: Big Data 16.09.2014 31
Prochaine étape ELCA Forum 2014: Big Data 16.09.2014 32
Les 3 pilliers ELCA Big Data Lab Processus Méthode Gestion du savoir-faire commercial Stockage CPU ensemble d outils Techno Personnes Statisticiens Spécialistes ETL Spécialistes outils ELCA Forum 2014: Big Data 16.09.2014 33
Big Data: C est à vous! Le Big Data révolutionne le monde, pourquoi ne pas en faire partie? Commencez à faire un Proof-of-Value avec notre Big Data Lab Prochaine étape: Nous venons présenter le big data chez vous Nous vous aidons à identifier les opportunités les plus prometteuses Nous vous faisons une offre pour un Proof-of-value ELCA Forum 2014: Big Data 16.09.2014 34
QUESTIONS ELCA Forum 2014: Big Data 16.09.2014 35
Merci. Contact Jérôme Berthier Head of BI division Jerome.berthier@elca.ch Christian Nancoz Consultant BI Christian.nancoz@elca.ch ELCA Informatique SA Lausanne 021 613 21 11 Genève 022 307 15 11 ELCA Informatik AG Zürich 044 456 32 11 Bern 031 556 63 11 www.elca.ch ELCA Forum 2014: Big Data ELCA 16.09.2014 36