Sécurité des entrepôts de données dans le Cloud Un SaaS pour le cryptage des données issues d un ETL Présenté par Hana Gara Kort Sous la direction de Dr Jalel Akaichi Maître de conférences 1
1.Introduction 2.Les problèmes de sécurité liés aux architectures des entrepôts de données dans le Cloud 3.Fonctionnalités et scénarios de migration vers le Cloud 4.Proposition d une architecture de sécurité 5.Mise en œuvre d un SaaS pour le cryptage 6.Conclusion & Perspectives 2/35
3/35 Introduction
Entrepôt de Cloud Sécurité données Computing 4/35
Les entrepôts de données, par leur nature même créent un conflit au niveau de la sécurité. Augmentation des risques d attaques et de violations des données dans ce nouvel environnement. provoquées par des menaces. 5/35
(1) : Aborder les problèmes de la sécurité liés aux architectures de l entrepôt de données dans le nuage, (2) : Analyser les différents scénarios possibles pour la migrations des fonctionnalités de l entrepôt de données vers le Cloud, (3): Proposer une solution SaaS pratique pour le cryptage des données dans l outil ETL Talend Open Studio. 6/35
Qu est-ce que le cloud Computing? Réseau omniprésent:un accès ubiquitaire au réseau Service mesuré facturé élasticité rapide Service à la demande Multi Locatères:Une mise en commun des ressources Caractéristiques SaaS PaaS IaaS Modèles de service Publique Privé Hybride Communauté Modèles de déploiement 7/35
Les problèmes de sécurité liés aux architectures des entrepôts de données dans le Cloud 8/35
1 Data Marts indépendant 2 Data Marts en bus 3 Entrepôt de données centralisé 4 Architecture Hub-and-Spoke 5 Architecture hybride (Fédérée) 6 Architecture trois tiers(niveau) 7 Architecture multi niveaux 9/35
Quels sont les problèmes de sécurité liés aux architectures de l entrepôt de données? 10/35
1 La centralisation 2 L hétérogénéité 3 Le niveau de détail 4 La sécurité de stockage 5 La sécurité de transmission 11/35
Quels sont les problèmes de sécurité liés aux architectures de l entrepôt de données qui peuvent être poser dans le Cloud? 12/35
1 La virtualisation 2 La localité des données 3 L impact des modèles de déploiement 4 La multi-location 5 La gestion des identités 13/35
Fonctionnalités de l entrepôt de données et migration vers le Cloud 14/35
Processus de migration E T L 1* Services d intégration Processus de chargement Data Marts Staging Area Entrepôt de données Métadonnées Data Marts Gestion des données 2*Services de modé élisation 3* Services de pilotage et d analyse Requêtes 15/35
OLAP Serveur OLTP Serveur ETL Serveur ED Tableaux ETL Staging Area Entrepôt de données DM DM Data Mart Serveur BI de bord Data mining Service d intégration Service de modélisation Service de pilotage et d analyse Scénario 1 : One out tow in 16/35
Serveur OLTP Serveur ETL Serveur ED OLAP Tableaux ETL Staging Area Entrepôt de données DM DM Data Mart Serveur BI de bord Data mining Service d intégration Service de modélisation Service de pilotage et d analyse Scénario 2 : Tow out one in 17/35
Serveur OLTP Serveur ETL Serveur ED OLAP Tableaux ETL Staging Area Entrepôt de données DM DM Data Mart Serveur BI de bord Data mining Service d intégration Service de modélisation Service de pilotage et d analyse Scénario 3 : One out one in one out 18/35
Serveur OLTP Serveur ETL Serveur ED OLAP Tableaux ETL Staging Area Entrepôt de données DM DM Data Mart Serveur BI de bord Data mining Service d intégration Service de modélisation Service de pilotage et d analyse Scénario 4 : All in 19/35
Externaliser le minimum Déléguer à un prestataire compétant le grand travail un système de sécurité complexe contre les attaques source de vulnérabilité et pas très souvent efficace. Solution fiable cout << et sécurité cout >> 20/35
21/35 Architecture de sécurité
Entreprise cliente : Source de données Bases de donnéesé Cloud :Fournisseur de service : Destination de données SaaS PaaS IaaS Infrastructure d analyse Répertoire FTP Web Base tampon+etl Codage routine Clé publique Fichier java ED Crypté Independant & homogéne OLAP Tableaux de bord Data mining Fichiers (XML, Texte, Cvs, Excel...) Extraction Cryptage Chargement Collecte 22/35 Stockage Distributio n Exploitation
Un SaaS pour le cryptage des données issues d un ETL 23/35
24/35
25/35 25
26/35
27/35
28/35
29/35
30/35 Conclusion & Perspectives
L apparition du Cloud Computing a apporté plusieurs avantages en termes de puissance du calcul, de rapidité d exécution et de réduction des couts. l empêchement majeur des entreprises pour l externalisation de leurs systèmes d information vers le Cloud est le manque de confiance accordée au fournisseur de services L objectif de cette solution est de diminuer la vulnérabilité de transmission et assurer la confidentialité. 31/35
Une étude de la possibilité d intégrer la cryptographie pour la sécurité de tous le processus décisionnel y compris le processus ETL. Une étude d un audit des systèmes décisionnels dans le cloud avec intégration d une étude de cout en profit des entreprises clientes. Une étude du meilleur algorithme de cryptage des données en Cloud. 32/35
Merci pour votre attention 33
1 Data Marts indépendant Sources des données ETL Data Marts indépendan ts Analyse Utilisateurs Source3 Staging Area Data Marts 3 Application3 Silos de données Source2 Staging Area Data Marts 2 Application2 Source1 Staging Area Data Marts 1 Application1 34
2 Architecture en bus de Data Marts Sources de données ETL Data Marts liés par dimensions conformes Analyse Utilisateurs Source1 Source2 Source3 ETL Staging Area Data Marts1 Data Marts2 Data Marts3 Infrastructure d' Analyse Entrepôt de données logique 35
3 Entrepôt de données centralisé Sources de données ETL Analyse Utilisateurs Source1 Source2 Source3 ETL Staging Area Entrepot de données centralisé, unique et intégré Infrastructure d'analyse 36
4 Architecture Hub-and-Spoke Sources de donnée s ETL Data Marts indépendants Analyse Utilisateurs Source1 Source2 Source3 ETL Staging Area Entrepot de données normalisé 3NF Data Marts1 Data Marts2 Data Marts3 Infrastructure d'analyse Concentrateur =Hub Rayon =Spoke 37
5 Architecture hybride (Fédérée) Sources de donnée s ETL Entrepôt de données autonome Analyse Utilisateurs Source1 Source2 Source3 ETL Staging Area ED1 ED2 ED3 Data Warehouse virtuel Infrastructure d'analyse 38
6 Architecture trois tiers Tiers3 Tiers2 Tiers1 Source1 Source2 Source3 ETL Staging Area Entrepot de données détaillé Data Marts1 Data Marts2 Data Marts3 Infrastructure d'analyse Dep A Dep B Dep C Sources de données très détaillées ETL Données détaillées Données résumées et agrégées Analyse Utilisateurs 39
7 Architecture multi niveaux Tiers4 Tiers3 Tiers2 Tiers1 Dep A Source1 Source2 Source3 ETL Staging Area Entrepot de données Entrepot de données Data Marts1 Data Marts2 Data Marts3 Infrastructure d'analyse Dep B Dep C Sources de données très détaillées ETL Données détaillées Données résumées Données résumées et agrégées Analyse Utilisateurs 40
41
42
43