Mémoire de fin d études. Thème Conception et réalisation d un Data Warehouse pour la mise en place d un système décisionnel

Dimension: px
Commencer à balayer dès la page:

Download "Mémoire de fin d études. Thème Conception et réalisation d un Data Warehouse pour la mise en place d un système décisionnel"

Transcription

1 Mémoire de fin d études Pour l obtention du diplôme d Ingénieur d Etat en Informatique Option : Systèmes d information Thème Conception et réalisation d un Data Warehouse pour la mise en place d un système décisionnel Document de base Réalisé par - FILALI ABDERRAHMANE - KEDJNANE SOFIANE Encadré par - MERABET SOUAD - MEDJAOUI NADJI Promotion : 2009/2010

2 Remerciements Nos remerciements vont tout spécialement à nos familles, qui ont sus nous supporter et encourager tout au long de notre vie, ainsi que pour leur aide inestimable, leur patience et leur soutien indéfectible. Nous tenons aussi, à remercier tout les enseignants qui ont contribué de près ou de loin à notre formation. Nous remercions Mme Souad Merbet et M. Nadji Medjaoui pour avoir assuré l encadrement de ce projet, qui n a pas toujours été de tout repos. On remercie monsieur Medjaoui pour nos séances de travail agréables et fructueuses, ses remarques pertinentes, mais aussi pour son écoute et son discours bienveillants. Nous remercions Mme Merabet pour la confiance quelle nous a accordé et de nous avoir donné l opportunité de travailler sur un projet d une tel envergure. Nous remercions Mme Ait Ali Yahia pour ces critiques constructives qui nous ont permis d améliorer ce mémoire. Nous nous devons de mentionner la précieuse et totale collaboration que nous avons reçu au sein de ELIT, de part les moyens mis à notre disposition et l aide et le support apporté par l ensemble des employés et des cadres. On remercie vivement Mesdames et Messieurs les membres du jury d avoir accepter d évaluer ce travail. Pour finir, et afin de n oublier personne (amis, membre de la famille et tous ceux qui nous sont chers) nous utiliserons la formule : «Merci à». ^xw}çtçx 9 Y ÄtÄ

3 Dédicaces Je dédie ce m odeste travail à : M es parents, qui n ont jam ais cessé de m encourager et m e soutenir, M on frère : M oham m ed, et m es sœurs :A m ina et Soum ia M on binôm e et am i Sofiane et sa fam ille, M es am is : A m ine, M ouhata, M oham m ed, L otfi Tous les m em bres de m a fam ille, Ceux qui m e sont chers, M on cousin : Sam ir, puisse dieu l accueillir dans son vaste paradis. TuwxÜÜt{ÅtÇx

4 Dédicaces A : M es parents, pour leur soutient indéniable et leur aide précieuse «Pourrais-je jam ais vous dire tous m on am our», M a grand-m ère, pour sa patience et pour avoir su m e supporter, M a sœur L inda, et m es frères Tareq et Yacine, pour leurs encouragem ents et leur am our, Tous les m em bres de la fam ille, pour l intérêt qu ils m ont m ontré, M on binôm e (et am i) A bderrahm ane «H am za» et toute sa fam ille, pour ce qu ils m ont apporté, M es am is, pour tous ce qu on a partagé ensem ble, Toutes les personnes proches que je n ai pas citées Je dédie ce travail. féy tçx

5 Sommaire Résumé :..I Abréviations :.II Liste des tableaux.iv Liste des figures...vi Introduction générale Problématique Objectifs du projet Partie I: Synthèse Bibliographique. I. Introduction I.1. Les systèmes décisionnels I.1.1. La place du décisionnel dans l entreprise I.1.2. Les différents composantes du décisionnel I.2. Décisionnel vs transactionnel II. Le Data Warehouse II.1 Qu est ce qu un Data Warehouse II.2 Historique des Data Warehouse II.3 Structure des données d un Data Warehouse II.4 Les éléments d un Data Warehouse II.5 Architecture d un Data Warehouse III. Modélisation des données de l entrepôt III.1 La modélisation dimensionnelle et ses concepts III.1.1 Concept de fait III.1.2 Concept de dimension III.1.3 Comparatif entre les tables de faits et les tables de dimensions III.2 Différents modèles de la modélisation dimensionnelle III.3 Le concept OLAP III.3.1 Généralités III.3.2 Architectures des serveurs OLAP III.4 La navigation dans les données III.4.1 Slice & Dice III.4.2 Drill-down & Roll-up IV. Démarche de Construction d un Data Warehouse IV.1 Modélisation et conception du Data Warehouse IV.1.1 Approche «Besoins d analyse»... 34

6 IV.1.2 Approche «Source de données» IV.1.3 Approche mixte IV.2 Alimentation du Data Warehouse IV.2.1 Les phases de l alimentation «E.T.L.» IV.2.2 Politiques de l alimentation IV.2.3 Les outils E.T.L IV.3 Mise en œuvre du Data Warehouse IV.4 Maintenance et expansion V. Conclusion PartieII: Conception de la solution. Chapitre 1: Présentation de l'organisme d'accueil. I. Présentation de SONELGAZ I.1 Historique I.1.1 Organisation du groupe SONELGAZ I.1.2 Le groupe SONELGAZ en chiffres I.2 Le métier de la distribution I.2.1 Organisation des sociétés de distribution I.2.2 La clientèle de la distribution I.3 L informatique au sein du groupe SONELGAZ I.3.1 Présentation de la filiale «ELIT» II. Conclusion Chapitre 2: L'éxistant décisionnel. I. Introduction II. Etat du décisionnel au sein du groupe II.1 Niveau Groupe II.2 Niveau Société de Distribution II.3 Niveau Direction de Distribution III. Conclusion Chapitre 3:Etude des besoins. I. Introduction I.1 Description de la démarche d'étude des besoins Étude préliminaire des systèmes sources et interviews sommaires avec les DBA Détection des postes susceptibles d'être porteur d'informations utiles Planification, préparation et conduite des interviews Autres moyens utilisés pour la détection des besoins... 67

7 5. Rédaction et validation du recueil récapitulatif des besoins I.2 Problèmes et obstacles rencontrés II. Conclusion Chapitre 4: Conception de la zone «entreposage des données». I. Introduction II. Processus de la modélisation dimensionnelle II.1 Volet «vente» II.2 Volet «recouvrement» II.3 Volet «suivi des affaires» II.4 Volet «Suivi des abonnés» III. Conclusion Chapitre 5: Conception de la zone «Alimentation». I. Introduction II. Etude et planification II.1 Les sources de données II.2 Détection des emplacements des données sources II.3 Définition de la périodicité de chargement III. Architecture du processus d alimentation IV. Processus de chargement IV.1 Processus de chargement de dimension IV.2 Processus de chargement des table de fait IV.3 Processus de chargement particulier IV.3.1 Processus de chargement de la dimension «temps» IV.3.2 Processus de construction d agrégats V. Conclusion Chapitre 6: Conception des cubes dimensionnels. I. Définition des niveaux et des hiérarchies II. La liste des cubes III. Présentation des cubes dimensionnels IV. Conclusion Chapitre 7: Conception des Meta Data. I. Les «Meta Data» ou «méta données» de l entrepôt II. Rôle des méta données III. Exploitation des métas données III.1 Présentation de la partie navigation

8 III.2 Présentation de la partie supervision IV. Conclusion Partie III: Implémentation et déploiement. I. Introduction II. Implémentation II.1 Périmètre technique et fonctionnel II.1.1 Matériel II.1.2 Systèmes d exploitation II.2 Architecture technique de la solution II.3 Zone de stockage II.4 Zone d alimentation de l entrepôt II.5 Zone de restitution III. Déploiement IV. III.1 Déploiement de la zone d alimentation III.2 Déploiement de la zone de restitution Conclusion Conclusion générale et perspectives Bibliographie

9 Résumé : Le groupe SONELGAZ, premier opérateur énergétique en Algérie, assure plusieurs missions dans le domaine de l énergie. Ces dernières, allant de la gestion du réseau électrique et gazier à la distribution et commercialisation de l électricité et du gaz au profit tant des professionnels que des particuliers, font de SONELGAZ un acteur incontournable de l économie nationale. Le groupe SONELGAZ rencontre, dans le cadre de son activité de distribution, quelques problèmes dans sa politique de Reporting clientèle. Ces difficultés sont liées notamment à la lenteur et au coût de la procédure, du fait du nombre important d intermédiaires et/ou intervenants. Ces difficultés ont rendu tout effort d analyse vain ; et c est pourquoi les dirigeants du groupe aspirent à la mise en place d un système qui procure aux décideurs les informations nécessaires et fiables, les aidant ainsi à pendre dans les meilleurs délais les décisions les plus appropriées. Dans ce contexte, et afin de répondre à ces attentes grandissantes le groupe a sollicité sa filiale spécialisée dans les systèmes d information et les nouvelles technologies «Elit». Le But recherché étant d aller vers la mise en place d un système s inscrivant dans le cadre du Système de Gestion de la Clientèle «S.G.C». Ce système sera construit autour d une base de données dédiée totalement aux décisionnel un «Data Warehouse» et répondant à tout les besoins d analyse du groupe dans sa fonction de distribution. Ce présent projet a donc pour vocation première de réaliser une telle base de données. Mots clés : Data Warehouse «Entrepôt de données», Décisionnel, Business Intelligence «B.I», intégration de données, solutions «BI» Open Source. I

10 Abréviations : BI : Business Intelligence. BT : Basse Tension. BP : Basse Pression. CTI : Centre de Traitement Informatique. DAP : Direction Analyses et Prévision. DAR : Direction Affaires De Régulation. DBA : Data Base Administrator. DCF : Direction Comptabilité et Finance. DCM: Direction Commercial Et Marketing. DD : Direction de Distribution. DED : Département Etudes et Développement. DGDS : Direction Générale du Développement et de la Stratégie. DIM : Dimension. DR : direction régionale(dd). DRD : Direction de Distribution Régionale. DW : Data Warehouse (Entrepôt de données). ED : Etude et développent. EDW : Entreprise Data Warehouse. EGA : Electricité et Gaz d Algérie. ELIT : EL-djazaïr Information Technology. EPIC : Etablissement Publique à caractère Industriel et Commercial. ETL : Extract, Transform and Load (ETC). FK: Foreign Key. FTP : File Transfer Protocol. HOLAP: Hybrid On Line Analytical Process. HP : Haute Pression. HT : Haute Tension. MOLAP: Multidimensional On Line Analytical Process. MP: Moyenne Pression. MT : Moyenne Tension. OLAP : On Line Analytical Process. OLTP: On Line Transactional Process. II

11 PDG: Président Directeur General. PK : Primary Key. ROLAP : Relational On Line Analytical Process. SD : Socièté de Distribution. SGC : Système de Gestion de la Clientèle. SI : Systèmes d Information. SID: Systèmes d Information Décisionnels. SID : Systèmes d information de la distribution. SIAD : Systèmes d Information d Aide à la Décision SGBD : Système de Gestion de Base de Données. SMTP : Server Mail Transfer Protocol. SONELGAZ : Société Nationale de l Electricité et du GAZ. SPA : Société Par Action. SQL : Structured Query Language. III

12 Liste des tableaux Partie I : Synthèse Bibliographique. Tableau I.1 : Tableau comparatif entre les systèmes transactionnels et les systèmes décisionnels Tableau I.2 : Tableau comparatif entre les tables de faits et les tables de dimensions Tableau I.3 : Avantages et inconvénients de l approche «Besoins d analyse» Tableau I.4 : Avantages et inconvénients de l approche «Sources de données» Partie II: Conception de la solution. Tableau II.1 : Le groupe SONELGAZ en chiffres Tableau II.2 : Présentation des sociétés de distribution Tableau II.3 : Tableau présentant la population a interviewé Tableau II.4 : Synthétisation des besoins détectés Tableau II.5 : Tableau descriptif de la dimension «Temps» Tableau II.6 : Tableau descriptif de la dimension «Client» Tableau II.7 : Tableau descriptif de la dimension «Facture» Tableau II.8 : Tableau descriptif de la dimension «Zone géographique» Tableau II.9 : Tableau descriptif de la dimension «Activité» Tableau II.10 : Tableau descriptif de la dimension «Tarif» Tableau II.11 : Tableau descriptif de la dimension «Energie» Tableau II.12 : Liste des agrégats potentiels de l activité «Vente» Tableau II.13 : Liste des agrégats utiles de l activité «Vente» Tableau II.14 : Détection des dimensions communes entre les volets «Vente» et «Recouvrement» Tableau II.15 : Tableau descriptif de la dimension «Nature» Tableau II.16 : Tableau descriptif des agrégats potentiel du modèle «Recouvrement» Tableau II.17 : Tableau descriptif des agrégats utiles du modèle «Recouvrement» Tableau II.18 : Détection des dimensions communes entre les volets «Vente», «Recouvrement» et «Suivi des affaires» Tableau II.19 : Tableau descriptif de la dimension «Affaire» Tableau II.20 : Tableau descriptif de la dimension «Type affaire»... 8 Tableau II.21 : Tableau descriptif de la dimension «Phase» Tableau II.22 : Tableau descriptif des agrégats potentiel du modèle «suivi des affaires» Tableau II.23 : Tableau descriptif de des agrégats utiles du modèle «Suivi des affaires» Tableau II.24 : Détection des dimensions communes entre les volets «Vente», «Recouvrement», «Suivi des affaires» et «suivi des abonnés» Tableau II.25 : Tableau descriptif de la dimension «Type abonné» IV

13 Tableau II.26 : Tableau descriptif des agrégats potentiels du modèle «Suivi abonnés» Tableau II.27 : Tableau descriptif des agrégats utiles du modèle «Suivi abonnés» Tableau II.28 : Tableau donnant les nivaux hiérarchiques de chaque dimension Tableau II.29 : Listes des cubes dimensionnels V

14 Liste des figures Figure I.1 : Le décisionnel au sein du système d information... 9 Figure I.2 : Les différentes composantes du décisionnel... 5 Figure I.3 : Historique des bases de données décisionnelles... 8 Figure I.4 : Structure des données d un Data Warehouse... 9 Figure I.5 : Les Data Mart dans un entrepôt de données selon l architecture proposée par B. Inmon dite Entreprise Data Warehouse Figure I.6 : Les Data Mart dans un entrepôt de données selon l architecture proposée par R. kimball dite approche bus Figure I.7 : Architecture globale d un Data Warehouse Figure I.8 : Considération d un sujet d analyse comme un cube à plusieurs dimensions. 14 Figure I.9 : Un modèle dimensionnel typique Figure I.10 : Principe de l architecture MOLAP Figure I.11 : Principe de l architecture ROLAP Figure I.12 : Exemple de Slicing Figure I.13 : Exemple de Dicing Figure I.14 : Exemple de Roll up Figure I.15 : Exemple de Drill Down Figure I.16 : Illustration de l approche «Besoin d analyse» grâce au cycle de vie dimensionnel de kimball Figure I.17 : Illustration de l approche «source de données» grâce au cycle de développement du Data Warehouse de Inmon Figure I.18 : Illustration de l approche mixte Figure I.19 : Objectif de qualité de données dans un processus E.T.L Figure II.1 : Planification de la conduite du projet Figure II.2 : Organigramme représentant l organisation du Groupe SONELGAZ Figure II.3 : Evolution du chiffre d affaire du groupe publiée dans le rapport d activité de l année Figure II.4 : Répartition du chiffre d affaire publiée dans le rapport d activité de l année Figure II.5 : Organisation des sociétés de distribution Figure II.6 : Organisation des directions de distribution Figure II.7 : Organisation de la filiale ELIT Figure II.8 : Organisation de la direction d étude et de développement Figure II.9 : Diagramme d activité modélisant l édition de rapport pour le niveau groupe48 VI

15 Figure II.10 : La place de l étape de définition des besoins dans un projet Data Warehouse.52 Figure II.11 : Analyse des priorités du cas de la distribution «SONELGAZ» Figure II.12 : La dimension du Temps de l activité «Vente» Figure II.13 : La dimension client de l activité «Vente» Figure II.14 : La dimension facture de l activité «Vente» Figure II.15 : La dimension zone de l activité «Vente» Figure II.16 : La dimension activité de l activité «Vente» Figure II.17 : La dimension Tarif de l activité «Vente» Figure II.18 : La dimension énergie de l activité «Vente» Figure II.19 : Modèle en étoile de l activité «Vente» Figure II.20 : La dimension Nature de l activité «Recouvrement» Figure II.21 : Modèle en étoile de l activité «Recouvrement» Figure II.22 : La dimension affaire de l activité «Suivi des affaires» Figure II.23 : La dimension type affaire de l activité «Suivi des affaires» Figure II.24 : La dimension phase de l activité «suivie des affaires» Figure II.25 : Modèle en étoile de l activité «Suivie des affaires» Figure II.26 : La dimension type abonné de l activité «Suivi des abonné» Figure II.27 : Modèle en étoile de l activité «Suivi des abonné» Figure II.28 : Architecture global du processus E.T.L Figure II.29 : Diagramme d activité du processus d alimentation Figure II.30 : Diagramme d activité du processus de chargement de dimension Figure II.31 : Diagramme d activité du processus de chargement de fait Figure II.32 : Cube dimensionnel «Suivi des ventes» Figure II.33 : Cube dimensionnel «Suivi des ventes et des consommations» Figure II.34 : Cube dimensionnel «Suivi des abonnés» Figure II.35 : Cube dimensionnel «Suivi des recouvrements» Figure II.36 : Cube dimensionnel «Suivi des affaires» Figure II.37 : Diagramme de classe des métadonnées Figure II.38 : DCU navigation dans les métadonnées et administration des MAJ utilisateurs Figure II.39 : DCU de supervision Figure II.40 : Architecture technique de la solution Figure II.41 : Digramme de déploiement de la zone d alimentation Figure II.42 : Diagramme de déploiement de la zone de restitution VII

16 Introduction générale 8

17 Contexte général C est dans un environnement fortement complexe et hautement concurrentiel qu évolue la majeure partie, si ce n est la totalité, des entreprises. Ce climat de forte concurrence exige de ces entreprises une surveillance très étroite du marché afin de ne pas se laisser distancer par les concurrents et cela en répondant, le plus rapidement possible, aux attentes du marché, de leur clientèle et de leurs partenaires. Pour se faire, les dirigeants de l entreprise, quelque en soit d ailleurs le domaine d activité, doivent être en mesure de mener à bien les missions qui leur incombent en la matière. Ils devront prendre notamment les décisions les plus opportunes. Ces décisions, qui influeront grandement sur la stratégie de l entreprise et donc sur son devenir, ne doivent pas être prises ni à la légère, ni de manière trop hâtive, compte tenu de leurs conséquences sur la survie de l entreprise. Il s agit de prendre des décisions fondées, basées sur des informations claires, fiables et pertinentes. Le problème est de savoir donc comment identifier et présenter ces informations à qui de droit, sachant par ailleurs que les entreprises croulent d une part sous une masse considérable de données et que d autre part les systèmes opérationnels «transactionnels» s avèrent limités, voire inaptes à fournir de telles informations et constituer par la même un support appréciable à la prise de décision. C est dans ce contexte que les «systèmes décisionnels» ont vu le jour. Ils offrent aux décideurs des informations de qualité sur lesquelles ils pourront s appuyer pour arrêter leurs choix décisionnels. Pour se faire, ces systèmes utilisent un large éventail de technologies et de méthodes, dont les «entrepôts de données» (Data Warehouse) représentent l élément principal et incontournable pour la mise en place d un bon système décisionnel. De part sa dimension économique et sa position sur le marché énergétique algérien, l activité journalière de la SONELGAZ génère des données complexes et volumineuses. Ces données représentent une source précieuse d informations, qui serait à même d améliorer de façon significative le processus de prise de décision. Cependant, ces données ne sont pas exploitées de manière satisfaisante, hypothéquant ainsi le processus de prise de décision à tous les niveaux du groupe. Le présent projet tend à la mise en place d un système en mesure de consolider les données issues des systèmes transactionnels, et d offrir des informations de qualité pour les décideurs. Il s agit en fait de mettre à la disposition des décideurs des données à même de les éclairer et leur faciliter une prise de décision prompte en connaissance de cause. Un tel système requiert la mise en place d un entrepôt de données fiables contenant les informations nécessaires à l accomplissement des processus décisionnels. 9

18 1. Problématique Le groupe SONELGAZ est l opérateur historique et leader du domaine énergétique en Algérie, notamment dans le domaine de la distribution de l électricité et du gaz pour les professionnels et les particuliers. Appelé à interagir avec ses clients sur différentes phases de la distribution (demande de branchement, facturation, résiliation, etc.), le groupe s est doté, dans un souci de suivi de la clientèle et de gestion de la distribution, d un «Système de Gestion de la Clientèle S.G.C.-» constitué de 35 applications, développées en interne et exploité par plus de 2900 utilisateurs. Ce système est déployé dans chacune des 58 directions de distributions «D.D.» exploitant une base de donnée décentralisée au niveau de chaque «D.D.». Dans un pareil contexte, la plus simple des opérations d analyse devient une tâche ardue. En effet, les sociétés de distributions «SD» se trouvent dans l incapacité de faire des analyses fiables, efficaces et à des moments opportuns sans engager des moyens considérables sur des périodes plus ou moins longues. Ainsi, les principales difficultés rencontrées peuvent être résumées en : Difficultés dans l élaboration des rapports d activité : L élaboration des rapports d activité fait intervenir, généralement, plusieurs intermédiaires. En effet, à chaque fois qu il est nécessaire d élaborer un rapport d activité, il faudra procéder d abord à l extraction les données à partir des 58 bases de données installées au niveau des directions de distribution, pour les acheminer ensuite manuellement vers une structure centralisée, qui en fera enfin la consolidation. Il s agit là d une procédure lourde outre les éventuelles incohérences et erreurs. Les retards enregistrés, parfois, font que le rapport d activité est élaboré sur la base d une consolidation antérieure, en sachant pertinemment que les données ne sont pas à jour. Lenteur de la procédure de Reporting : La politique de Reporting actuelle, qui du reste est quasi manuelle, connait des lenteurs qui n arrangent pas les décideurs. Ceux ci ont besoin d informations fiables et dans des délais raisonnables. À titre indicatif, l édition d un rapport national peut prendre, en moyenne, plus d un mois ce qui est plus que pénalisant pour une bonne prise de décision. Coût de la procédure de Reporting 1 : la procédure de Reporting est jugé très couteuse pour l entreprise, et cela est principalement du au nombre d intervenant et des moyens mis en place pour cette dernière. Insuffisance du module «Statistique» : Afin de produire et offrir un moyen de suivi des activités de la distribution, un module «Statistique» a été développé et intégré dans le système «SGC». Ce dernier fournit des états statistiques permettant, aux décideurs de niveau D.D., l analyse et la prise de décision. Cependant, ce module connait quelques 1 Voir annexe A 10

19 problèmes dû au fait qu il interroge directement la base de données en production. En effet le lancement de la production de n importe quel rapport du module pénalise le système. Pour éviter cela le module n est accessible qu au chef du CTI de la DD. 2. Objectifs du projet Afin de palier aux problèmes précédemment cités, le groupe a initié, à travers sa filiale Elit, le présent projet. Ce projet a pour but d introduire, en premier lieu, une informatique décisionnelle au sein du groupe, tout en conférant aux décideurs un support fiable pour une meilleure prise de décision. Ainsi, les principaux objectifs assignés au projet sont : La réduction de la durée globale de l élaboration des rapports, en essayant de ramener cette durée, au moins, en dessous de la barre des 48 heures. La Réduction des coûts de la procédure de Reporting actuelle. La réduction du nombre d intervenants lors de la production de rapports. Offrir aux décideurs et aux analystes la possibilité de faire des analyses appropriées. Offrir des informations fiables, cohérentes et pertinentes, contenant la logique business souhaitée. 11

20 Planification et conduite du projet L initiation de tout projet nécessite une phase de planification. Celle-ci permet de définir les tâches à réaliser, maîtriser les risques et rendre compte de l état d avancement du projet. «Planifier optimise ainsi les chances de réussite d'un projet en améliorant la productivité grâce à une meilleure maîtrise de la qualité.» [Soler, 2001]. Pour garantir le bon déroulement du projet, tout en respectant les délais, nous avons élaboré une planification globale de conduite du projet. Le diagramme suivant décrit cette planification ainsi que l ordonnancement prévu des phases du projet. Conception E.T.L Figure : Planification et conduite du projet. Afin de présenter notre travail, le présent mémoire est organisé en trois parties et se présente comme suit : Après une introduction générale dans laquelle nous présentons le contexte général du projet, ainsi que la problématique et les objectifs visés. La première partie présente les aspects théoriques du domaine des systèmes d information d aide à la décision, en évoquant leurs définitions et les concepts de bases relatifs aux «entrepôts de données» et à la modélisation dimensionnelle. 12

21 Dans la deuxième partie, nous présentons le travail réalisé au sein du Groupe SONELGAZ à travers les six suivants chapitres: Le chapitre un, présente l organisme d accueil, sa structure organisationnelle, son activité et la culture de l entreprise en matière d utilisation des technologies de l information. Le chapitre deux a pour vocation de présenter l existant décisionnel au sein de l entreprise et selon différents niveaux de prise de décision. Le chapitre trois présente une synthèse de la collecte des besoins des utilisateurs, ainsi que son déroulement. Le chapitre quatre contient la conception de la partie d entreposage de notre solution. Il présente entre autre les modèles dimensionnels des activités recensées. Le chapitre cinq à pour but de présenter la conception de la zone d alimentation, ainsi que les stratégies adoptées. Le chapitre six, quant à lui, donne la conception des cubes dimensionnels en détaillant les différentes caractéristiques de chaque cube (dimensions, mesurables et hiérarchies). La troisième partie décrie l architecture globale de la solution, et cela en présentant les différents outils intégrés et les volets de la solution développés. Elle décrit aussi la manière dont se passe le déploiement de la solution. Une conclusion générale est proposée afin de synthétiser le travail réalisé et de citer les perspectives du projet. 13

22 Partie I : Synthèse bibliographique «Un entrepôt de données ne s'achète pas, il se construit.» Bill Inmon 14

23 I. Introduction Toutes les entreprises du monde disposent d une masse de données plus ou moins considérable. Ces informations proviennent soit de sources internes (générées par leurs systèmes opérationnels au fil des activités journalières), ou bien de sources externes (web, partenaire,.. etc.). Cette surabondance de données, et l impossibilité des systèmes opérationnels de les exploiter à des fins d analyse conduit, inévitablement, l entreprise à se tourner vers une nouvelle informatique dite décisionnelle qui met l accent sur la compréhension de l environnement de l entreprise et l exploitation de ces données à bon escient. En effet, les décideurs de l entreprise ont besoin d avoir une meilleure vision de leur environnement et de son évolution, ainsi, que des informations auxquelles ils peuvent se fier. Cela ne peut se faire qu en mettant en place des indicateurs «business» clairs et pertinents permettant la sauvegarde, l utilisation de la mémoire de l entreprise et offrant à ses décideurs la possibilité de se reporter à ces indicateurs pour une bonne prise de décision. Le «Data Warehouse», «Entrepôt de données» en français, constitue, dans ces conditions, une structure informatique et une fondation des plus incontournables pour la mise en place d applications décisionnelles. Le concept de Data Warehouse, tel que connu aujourd hui, est apparu pour la première fois en 1980 ; l idée consistait alors à réaliser une base de données destinée exclusivement au processus décisionnel. Les nouveaux besoins de l entreprise, les quantités importantes de données produites par les systèmes opérationnels et l apparition des technologies aptes à sa mise en œuvre ont contribué à l apparition du concept «Data Warehouse» comme support aux systèmes décisionnels. I.1. Les systèmes décisionnels La raison d être d un entrepôt de données, comme évoqué précédemment, est la mise en place d une informatique décisionnelle au sein de l entreprise. Pour cela il serait assez intéressant de définir quelques concepts clés autour du décisionnel. Afin de mieux comprendre la finalité des systèmes décisionnels, nous nous devons de les placer dans leurs contextes et rappeler ce qu est un système d information. «Le système d information est l ensemble des méthodes et moyens de recueil de contrôle et de distribution des informations nécessaires à l exercice de l activité en tout point de l organisation. Il a pour fonction de produire et de mémoriser les informations, de l activité du système opérant (système opérationnel), puis de les mettre à disposition du système de décision (système de pilotage)»[le Moigne, 1977]. Les différences qui existent entre le système de pilotage et le système opérationnel, du point de vue fonctionnel ou des tâches à effectuer, conduit à l apparition des «systèmes d information décisionnels» (S.I.D.). Ces différences seront clairement illustrées un peu plus loin dans notre document. 15

24 Les origines des SID remontent au début de l informatique et des systèmes d information qui ont, tous deux, connu une grande et complexe évolution liée notamment à la technologie. Cette évolution se poursuit à ce jour 2. Parmi les différentes définitions du décisionnel «business intelligence B.I.» qui ont été données on trouve : "Le Décisionnel est le processus visant à transformer les données en informations et, par l'intermédiaire d'interrogations successives, transformer ces informations en connaissances." [Dresner, 2001]. I.1.1. La place du décisionnel dans l entreprise: Figure I.1 : Le décisionnel au sein du Système d information [Goglin, 1998]. La figure ci-dessus illustre parfaitement la place qui revient au décisionnel au sein d une entreprise. Cette place, comprend plusieurs fonctions clés de l entreprise. Les finalités décisionnelles, étant différentes selon le poste et la fonction occupée, ont pour but d engendrer plusieurs composantes. 2 Synthétisation à partir de la thèse de Bouzghoub A. «Modélisation des entrepôts de données XML: application au domaine de la sécurité sociale»[bouzghoub, 2008]. 16

25 I.1.2. Les différentes composantes du décisionnel En relation étroite avec les nouvelles technologies de l information et des télécommunications, le système décisionnel se manifeste à différents niveaux selon leurs utilités et leurs missions principales, comme illustré dans la figure suivante : Figure I.2 : Les différentes composantes du décisionnel [Goglin, 1998]. 17

26 I.3. Décisionnel vs transactionnel Le tableau suivant résume de façon non exhaustive les différences qu il peut y avoir entre les systèmes transactionnels et les systèmes décisionnels selon les données et l usage fait des systèmes. Différence Systèmes transactionnels SID par les données L usage Orienté applications Situation instantanée Donnée détaillées et codées non redondantes Données changeantes constamment Pas de référentiel commun Assure l activité au quotidien Pour les opérationnels Mises à jour et requêtes simples Temps de réponse immédiats Faibles volumes à chaque transaction Conçu pour la mise à jour Usage maîtrisé Orienté thèmes et sujets Situation historique Informations agrégées cohérentes souvent avec redondance Informations stables et synchronisées dans le temps Un référentiel unique Permet l analyse et la prise de décision Pour les décideurs Lecture unique et requêtes complexes transparentes Temps de réponse moins critiques Large volume manipulé Conçue pour l extraction Usage aléatoire Tableau I.1 : Tableau comparatif entre les systèmes transactionnels et les systèmes décisionnels. Ces différences font ressortir la nécessité de mettre en place un système répondant aux besoins décisionnels. Ce système n est rien d autre que le «Data Warehouse». 18

27 II. II.1 Le Data Warehouse Qu est ce qu un Data Warehouse Bill Inmon définit le Data Warehouse, dans son livre considéré comme étant la référence dans le domaine Building the Data Warehouse [Inmon, 2002] comme suit: «Le Data Warehouse est une collection de données orientées sujet, intégrées, non volatiles et évolutives dans le temps, organisées pour le support d un processus d aide à la décision.» Les paragraphes suivants illustrent les caractéristiques citées dans la définition d Inmon. Orienté sujet : le Data Warehouse est organisé autour des sujets majeurs de l entreprise, contrairement à l approche transactionnelle utilisée dans les systèmes opérationnels, qui sont conçus autour d applications et de fonctions telles que : cartes bancaires, solvabilité client, les Data Warehouse sont organisés autour de sujets majeurs de l entreprise tels que : clientèle, ventes, produits. Cette organisation affecte forcément la conception et l implémentation des données contenues dans le Data Warehouse. Le contenu en données et en relations entre elles diffère aussi. Dans un système opérationnel, les données sont essentiellement destinées à satisfaire un processus fonctionnel et obéit à des règles de gestion, alors que celles d un Data Warehouse sont destinées à un processus analytique. Intégrée : le Data Warehouse va intégrer des données en provenance de différentes sources. Cela nécessite la gestion de toute incohérence. Evolutives dans le temps : Dans un système décisionnel il est important de conserver les différentes valeurs d une donnée, cela permet les comparaisons et le suivi de l évolution des valeurs dans le temps, alors que dans un système opérationnel la valeur d une donnée est simplement mise à jour. Dans un Data Warehouse chaque valeur est associée à un moment «Every key structure in the data warehouse contains - implicitly or explicitly -an element of time» [Inmon, 2000]. Non volatiles : c est ce qui est, en quelque sorte la conséquence de l historisation décrite précédemment. Une donnée dans un environnement opérationnel peut être mise à jour ou supprimée, de telles opérations n existent pas dans un environnement Data Warehouse. Organisées pour le support d un processus d aide à la décision : Les données du Data Warehouse sont organisées de manière à permettre l exécution des processus d aide à la décision (Reporting, Data Mining ). 19

28 II.2 Historique des Data Warehouse L origine du concept «Data Warehouse» D.W (entrepôt de données en français) remonte aux années 80, durant lesquelles un intérêt croissant au système décisionnel a vu le jour, dû essentiellement à l émergence des SGBD relationnel et la simplicité du modèle relationnel et la puissance offerte par le langage SQL, Au début, le Data Warehouse n était rien d autre qu une copie des données du système opérationnel prise de façon périodique, dédiée à un environnement de support à la prise de décision. Ainsi, les données étaient extraites du système opérationnel, stockées dans une nouvelle base de données «concept d infocentre», le motif principal étant de répondre aux requêtes des décideurs sans pour autant altérer les performances des systèmes opérationnels. Le Data Warehouse, tel qu on le connaît actuellement, n est plus vu comme une copie -ou un cumul de copies prises de façon périodique- des données du système opérationnel. Il est devenu une nouvelle source d information, alimenté avec des données recueillies et consolidées des différentes sources internes et externes. Infocentre Entrepôt de données bases de données opérationnelles Figure I.3 : évolution des bases de données décisionnelles. 20

29 II.3 Structure des données d un Data Warehouse Le Data Warehouse a une structure bien définie, selon différents niveaux d agrégation et de détail des données. Cette structure est définie par Inmon [Inmon, 2000] comme suit : Données fortement agrégées M E T A D O N N É E S Données agrégées Données détaillées Données détaillées archivées Figure I.4 : Structure des données d un Data Warehouse. Données détaillées : ce sont les données qui reflètent les événements les plus récents, fréquemment consultées, généralement volumineuses car elles sont d un niveau détaillé. Données détaillées archivées : anciennes données rarement sollicitées, généralement stockées dans un disque de stockage de masse, peu coûteux, à un même niveau de détail que les données détaillées. Données agrégées : données agrégées à partir des données détaillées. Données fortement agrégées : données agrégées à partir des données détaillées, à un niveau d agrégation plus élevé que les données agrégées. 21

30 Meta données : ce sont les informations relatives à la structure des données, les méthodes d agrégation et le lien entre les données opérationnelles et celles du Data Warehouse. Les métadonnées doivent renseigner sur : Le modèle de données, La structure des données telle qu elle est vue par les développeurs, La structure des données telle qu elle est vue par les utilisateurs, Les sources des données, Les transformations nécessaires, Suivi des alimentations, II.4 Les éléments d un Data Warehouse L environnement du Data Warehouse est constitué essentiellement de quatre composantes : les applications opérationnelles, la zone de préparation des données, la présentation des données et les outils d accès aux données. Les applications opérationnelles : ce sont les applications du système opérationnel de l entreprise et dont la priorité est d assurer le fonctionnement de ce dernier et sa performance. Ces applications sont extérieures au Data Warehouse. Préparation des données : la préparation englobe tout ce qu il y a entre les applications opérationnelles et la présentation des données. Elle est constituée d un ensemble de processus appelé ETL, «Extract, transform and Load», les données sont extraites et stockées pour subir les transformations nécessaires avant leur chargement. «Un point très important, dans l aménagement d un entrepôt de données, est d interdire aux utilisateurs l accès à la zone de préparation des données, qui ne fournit aucun service de requête ou de présentation» [Kimball, 2002]. Présentation des données : c est l entrepôt où les données sont organisées et stockées. Si les données de la zone de préparation sont interdites aux utilisateurs, la zone de présentation est tout ce que l utilisateur voit et touche par le biais des outils d accès. L entrepôt de données est constitué d un ensemble de Data Mart. Ce dernier est défini comme étant une miniaturisation d un Data Warehouse, construit autour d un sujet précis d analyse ou consacré à un niveau départemental 3. Cette différence de construction, autour d un sujet ou au niveau départemental, définit la façon d implémentation du Data Mart au niveau de l entrepôt. On distingue, en effet, deux architectures internes du Data Warehouse : 3 Synthétisation [Chuck, 1998] page

31 1. Data Mart indépendant Les Data Mart sont des versions miniaturisées du Data Warehouse au niveau départemental, alimentéess par le Data Warehouse et baséess sur les besoins départementaux en informations [Inmon, 2002]. Figure I.5 : les Data Mart dans un entrepôt de données selon l architecture Entreprise Data Warehouse (E.D.W) [Inmon, 2002]. 23

32 2. Data Mart interconnectés Les Data Mart sont construits autour de sujets, interconnectés grâce aux tables des faits contenues dans le Data Warehouse, ce dernier se compose alors des Data Mart et ces tables des faits, appelées bus 4. Figure I.6 : les Data Mart dans un entrepôt de données selon l architecture bus de données [Kimball, 2002]. Zone d outils d accès : c est l ensemble des moyens fournis aux utilisateurs du Data Warehouse pour exploiter la zone de présentation des données en vue de la prise de décision. Ces outils varient des simples requêtes ad hoc aux outils permettant l application de forage de données plus complexes. Environ 80 à 90% des utilisateurs sont desservis par des applications d analyses préfabriquées, consistant essentiellement en des requêtes préétablies. 4 Appellation proposée par R. Kimball dans son ouvrage [Kimball, 2002]. 24

33 II.5 Architecture d un Data Warehouse Après avoir exposé et défini chacun des éléments constituant l environnement d un Data Warehouse, il serait intéressant de connaitre le positionnement de ces éléments dans une architecture globale d un Data Warehouse : Figure I.7 : Architecture globale d un Data Warehouse

34 III. III.1 Modélisation des données de l entrepôt La modélisation dimensionnelle et ses concepts Les Data Warehouse sont destinés à la mise en place de systèmes décisionnels. Ces systèmes, devant répondre à des objectifs différents des systèmes transactionnels, ont fait ressortir très vite la nécessité de recourir à un modèle de données simplifié et aisément compréhensible. La modélisation dimensionnelle permet cela. Elle consiste à considérer un sujet d analyse comme un cube à plusieurs dimensions, offrant des vues en tranches ou des analyses selon différents axes. Figure I.8 : Considération d un sujet d analyse comme un cube à plusieurs dimensions. En plus de la perception intuitive qu offre la modélisation dimensionnelle, celle-ci est réputée pour ses performances élevées. La nomination «schéma des jointures en étoile» a longtemps été adoptée pour décrire un modèle dimensionnel. Cette nomination est due au fait que le diagramme qui représente un modèle dimensionnel ressemble à une étoile, avec une grande table centrale et un jeu de petites tables auxiliaires disposées en étoile autour de la table centrale. Celle-ci est appelée table de faits et les autres tables sont appelées tables de dimensions. La figure suivante illustre untel modèle : 26

35 Figure I.9 : Un modèle dimensionnel typique [Kimball, 1996]. III.1.1 Concept de fait Une table de faits est la table centrale d un modèle dimensionnel, où les mesures de performances sont stockées. Une ligne d une table de faits correspond à une mesure. Ces mesures sont généralement des valeurs numériques, additives ; cependant des mesures textuelles peuvent exister mais sont rares. Le concepteur doit faire son possible pour faire des mesures textuelles des dimensions, car elles peuvent êtres corrélées efficacement avec les autres attributs textuels de dimensions. Une table de faits assure les liens plusieurs à plusieurs entre les dimensions. Elles comportent des clés étrangères, qui ne sont autres que les clés primaires des tables de dimension. III.1.2 Concept de dimension Les tables de dimension sont les tables qui raccompagnent une table de faits, elles contiennent les descriptions textuelles de l activité. Une table de dimension est constituée de nombreuses colonnes qui décrivent une ligne. C est grâce à cette table que l entrepôt de données est compréhensible et utilisable; elles permettent des analyses en tranches et en dés. Une dimension est généralement constituée : d une clé artificielle, une clé naturelle et des attributs. «Une table de dimension établit l interface homme / entrepôt, elle comporte une clé primaire» [Kimball, 2002]. 27

36 III.1.3 Comparatif entre les tables de faits et les tables de dimensions Le tableau suivant récapitule les différences au niveau des données de ces tables : Tables de faits Tables de dimensions Structure Peu de colonnes beaucoup de lignes Peu de lignes beaucoup de colonnes Données Mesurable, généralement numérique Descriptives généralement textuelles Référentiel Plusieurs clés étrangères Une clé primaire Valeur Prend de nombreuses valeurs Plus ou moins constantes Manipulation Participe à des calculs Participe à des contraintes Signification Valeurs de mesure Descriptive Rôle Assure les relations entre les Assure l interface homme / entrepôt dimensions de données Tableau I.2 : Tableau comparatif entre les tables de faits et les tables de dimensions. III.2 Différents modèles de la modélisation dimensionnelle Modèle en étoile : comme indiqué précédemment, ce modèle se présente comme une étoile dont le centre n est autre que la table des faits et les branches sont les tables de dimension. La force de ce type de modélisation est sa lisibilité et sa performance. Modèle en flocon : identique au modèle en étoile, sauf que ses branches sont éclatées en hiérarchies. Cette modélisation est généralement justifiée par l économie d espace de stockage, cependant elle peut s avérer moins compréhensible pour l utilisateur final, et très couteuse en terme de performances. Modèle en constellation : Ce n est rien d autre que plusieurs modèles en étoile liés entre eux par des dimensions communes. 28

37 III.3 Le concept OLAP III.3.1 Généralités Le terme OLAP (On-Line Analytical Processing) désigne une classe de technologies conçue pour l accès aux données et pour une analyse instantanée de ces dernières, dans le but de répondre aux besoins de Reporting et d analyse. R. Kimball définit le concept «OLAP» comme «Activité globale de requêtage et de présentation de données textuelles et numériques contenues dans l entrepôt de données; Style d interrogation spécifiquement dimensionnel» [Kimball, 2005]. C est en continuant sur sa lancée, qui lui a permis de définir le model OLTP pour les bases de données relationnelles, que le concept OLAP fut introduit et défini 6 en 1993 par E.F Codd, le père des bases de données relationnelles, dans un document technique portant le titre de «Providing OLAP (On-Line Analytical Processing) to User-Analysts : An IT Man-date» [Codd, 1993]. III.3.2 Architectures des serveurs OLAP Le noyau d un système OLAP est son serveur. Ces serveurs sont classés selon la politique régissant l architecture du serveur. Ainsi, ces architectures peuvent être distinguées comme suit: III Les systèmes à architecture MOLAP Ces systèmes MOLAP «Multidimentional On-line Analytical Processing» sont conçus exceptionnellement pour l analyse multidimensionnelle. R. Kimball définit ces systèmes comme étant un «Ensemble d interfaces utilisateur, d applications et de technologies de bases de données propriétaire dont l aspect dimensionnel est prépondérant» [Kimball, 2005]. Ainsi donc cette base adopte réellement la structure multidimensionnelle, exploitant de ce fait ces capacités au maximum. En effet MOLAP offre des temps d accès optimisés et cela en prédéfinissant les opérations de manipulation et de chemin d accès prédéfinis. Autre caractéristique du MOLAP c est qu il agrège tout par défaut, pénalisant du coup le système lorsque la quantité de données à traiter augmente. On parle généralement de volume de l ordre du giga-octet pas plus. 6 Cette définition passe par l introduction de 12 règles. Six autres règles furent par la suite, en 1995, ajoutées aux 12 précédentes et le terme «règles» remplacé par dispositif «features» par le même auteur à savoir Codd (Voir annexe B). 29

38 Data Warehouse Moteur MOLAP Aide à la décision Données Traitements Présentation Stockage des données détaillées (et agrégées) Rapports Multi-Dimensionnel Figure I.10 : Principe de l architecture MOLAP [Nakache, 1998]. III Les systèmes à architecture ROLAP «Ensemble d interfaces utilisateurs et d applications qui donnent une vision dimensionnelle à des bases de données relationnelles» [Kimball, 2005]. Les systèmes ROLAP «Relationnel On-line Analytical Processing» sont en mesure de simuler le comportement d une SGBD multidimensionnel en exploitant un SGBD relationnel. L utilisateur aura ainsi l impression d interroger un cube multidimensionnel alors qu en réalité il ne fait qu adresser des requêtes sur une base de données relationnelles. ROLAP n agrège rien. Les règles d agrégations sont crées au préalable et représentées dans une table relationnelle ce qui cause une lourdeur d administration mais confère une certaine performance et un gage de cohérence lors de l utilisation. Cette structure est généralement adoptée dans le but de se dispenser de l acquisition d un SGBD relationnel. Data Warehouse Moteur ROLAP Aide à la décision Données Traitements Présentation Stockage des données détaillées (et agrégées) et des méta-données Génération de plans d'exécution SQL afin d'obtenir des fonctionnalités OLAP. Rapports Multi-Dimensionnel Figure I.11 : Principe de l architecture ROLAP [Nakache, 1998]. 30

39 III Les systèmes à architecture HOLAP Les systèmes HOLAP «Hybride On-line Analytical Processing» sont une sorte de compromis entre les différents systèmes précités. Cette combinaison donne à ce type de système les avantages du ROLAP et du MOLAP en utilisant tour à tour l un ou l autre selon le type de données. III Autres architecture OLAP Bien que les architectures évoquées ci-dessus soient les plus répandues et les plus adoptées par les fournisseurs de solutions OLAP, d autres systèmes se basent sur des architectures différentes telles que l architecture OOLAP «Object On-line Analytical Processing», ou alors DOLAP «Desktop On-line Analytical Processing» qui décrit une catégorie de produits qui ne sont pas nécessairement connectés à un serveur et qui s appuient sur une source de données (un cube) construites, stockées et exploitées en local sur la machine de l utilisateur. III.4 La navigation dans les données Une fois que le serveur OLAP a construit le cube multidimensionnel «ou simulé ce cube selon l architecture du serveur», plusieurs opérations sont possibles sur ce dernier offrant ainsi la possibilité de naviguer dans les données qui le constituent. Ces opérations de navigation «Data Surfing» doivent être, d une part, assez complexes pour adresser l ensemble des données et, d autre part, assez simples afin de permettre à l utilisateur de circuler de manière libre et intuitive dans le modèle dimensionnel. Afin de répondre à ces attentes, un ensemble de mécanismes est exploité, permettant une navigation par rapport à la dimension et par rapport à la granularité d une dimension. III.4.1 Slice & Dice Le «Slicing» et le «Dicing» sont des techniques qui offrent la possibilité de faire des tranches «trancher» dans les données par rapport à des filtres de dimension bien précis, se classant de fait comme des opérations liées à la structure «se font sur les dimensions». La différence entre eux se manifestent dans le fait que : Le Slicing consiste à faire une sélection de tranches du cube selon des prédicats et selon une dimension «filtrer une dimension selon une valeur» [Chouder, 2008]. 31

40 Figure I.12 : Exemple de Slicing. Le Dicing, quant à lui, peut être vu comme étant une extraction d un sous cube. Figure I.13 : Exemple de Dicing. III.4.2 Drill-down & Roll-up Ces méthodes, appelées aussi «forage vers le bas/vers le haut», sont les méthodes les plus répandues pour une navigation dans un entrepôt de données. Elles consistent à représenter les données du cube à un niveau de granularité inférieur, dans le cas du «Drill - down», ou un niveau supérieur, c est le «Roll-up». En somme, ces deux opérations permettent de contrôler le niveau de détail des données du cube. 32

41 Ces opérations ne sont pas aussi faciles à implémenter car basées sur la notion d une bonne hiérarchisation des attributs d une dimension et la différenciation entre tous les niveaux de hiérarchie disponibles dans les différentes dimensions. Figure I.14 : Exemple de Roll up «moins de détails sur les années». Figure I.15 : Exemple de Drill-Down «plus de détails sur les régions». 33

42 IV. Démarche de Construction d un Data Warehouse Plusieurs chercheurs ou équipes de recherche ont essayé de proposer des démarches pour la réalisation d un projet Data Warehouse, ces démarches se croisent essentiellement dans les étapes suivantes : Modélisation et conception du Data Warehouse, Alimentation du Data Warehouse, Mise en œuvre du Data Warehouse, Administration et maintenance du Data Warehouse, IV.1 Modélisation et conception du Data Warehouse Les deux approches les plus connues dans la conception des Data Warehouse sont : L approche basée sur les besoins d analyse, L approche basée sur les sources de données, Aucune des deux approches citées n est ni parfaite, ni applicable à tous les cas. Toutes deux doivent être étudiées pour choisir celle qui s adapte le mieux à notre cas. Quelque soit l approche adoptée pour la conception d un Data Warehouse, la définition de celui-là reste la même. En étant un support d aide à la décision, le Data Warehouse se base sur une architecture dimensionnelle. IV.1.1 Approche «Besoins d analyse» Le contenu du Data Warehouse sera déterminé selon les besoins de l utilisateur final. Cette approche est aussi appelée «approche descendante» (Top-Down Approach) et est illustrée par R. Kimball grâce à son cycle de vie dimensionnel comme suit : Figure I.16 : illustration de l approche «Besoins d analyse» grâce au cycle de vie dimensionnel de Kimball [Kimball, 2004]. 34

43 Avantages Aucun risque de concevoir une solution obsolète avant d être opérationnelle Inconvénients Pas de prise en compte de l évolution des besoins de l utilisateur. Nécessite une modification de la structure du Data Warehouse en cas de nouveau besoin Négligence du système opérationnel Difficulté de déterminer les besoins des utilisateurs Tableau I.3 : Avantages et inconvénients de l approche «Besoins d analyse». IV.1.2 Approche «Source de données» Le contenu du Data Warehouse est déterminé selon les sources de données. Cette approche est appelée : Approche ascendante (Bottom-up Approach). Figure I.17 : Illustration de l approche «Source de données» grâce au cycle de développement du DW de Inmon [Inmon, 2002]. 35

44 Inmon considère que l utilisateur ne peut jamais déterminer ses besoins dès le départ, «Donnez moi ce que je vous demande, et je vous direz ce dont j ai vraiment besoin» 7, il considère que les besoins sont en constante évolution. Avantages Meilleure prise en charge de l évolution des besoins Inconvénients Risque de concevoir une solution obsolète avant qu elle soit opérationnelle Evolution du schéma des données source Complexité de source de données Tableau I.4 : Avantages et inconvénients de l approche «Sources de données». IV.1.3 Approche mixte Une combinaison des deux approches appelée hybride ou mixte peut s avérer efficace. Elle prend en considération les sources de données et les besoins des utilisateurs. Cette approche consiste à construire des schémas dimensionnels à partir des structures des données du système opérationnel, et les valider par rapport aux besoins analytiques. Cette approche cumule les avantages et quelques inconvénients des deux approches déjà citées, telles que la complexité des sources de données et la difficulté quant à la détermination des besoins analytiques. Figure I.18 : Illustration de l approche mixte. 7 Give me what I tell you I want, then I can tell you what I really want. [Inmon, 2002] 36

45 Cette étape aboutit à l établissement du modèle dimensionnel validé du Data Warehouse. Ce modèle dimensionnel sera transformé en modèle physique, qui différera du modèle dimensionnel. IV.2 Alimentation du Data Warehouse Une fois le Data Warehouse conçu, il faut l alimenter et le charger en données. Cette alimentation (le plus souvent appelée processus ETL «Extract-Transform-Load») se déroule en 3 phases qui sont : Extraction des données primaires (issues par exemple des systèmes de production), Transformation des données, Le chargement des données traitées dans l entrepôt de données, Ces trois étapes décrivent une mécanique cyclique qui a pour but de garantir l alimentation du Data Warehouse en données homogènes, propres et fiables. IV.2.1 Les phases de l alimentation «E.T.L.» Les phases du processus E.T.L. représentent la mécanique d alimentation du Data Warehouse. Ainsi elles se déroulent comme suit : a) L extraction des données «L extraction est la première étape du processus d apport de données à l entrepôt de données. Extraire, cela veut dire lire et interpréter les données sources et les copier dans la zone de préparation en vue de manipulations ultérieures.» [Kimball, 2005]. Elle consiste en : Cibler les données, Appliquer les filtres nécessaires, Définir la fréquence de chargement, Lors du chargement des données, il faut extraire les nouvelles données ainsi que les changements intervenus sur ces données. Pour cela, il existe trois stratégies de capture de changement : Colonnes d audit : la colonne d audit, est une colonne qui enregistre la date d insertion ou du dernier changement d un enregistrement. Cette colonne est mise à jour soit par des triggers ou par les applications opérationnelles, d où la nécessité de vérifier leur fiabilité. Capture des logs : certains outils ETL utilisent les fichiers logs des systèmes sources afin de détecter les changements (généralement logs du SGBD). En plus de l absence de cette fonctionnalité sur certains outils ETL du marché, l effacement des fichiers logs engendre la perte de toute information relative aux transactions. 37

46 Comparaison avec le dernier chargement : le processus d extraction sauvegarde des copies des chargements antérieurs, de manière à procéder à une comparaison lors de chaque nouvelle extraction. Il est impossible de rater un nouvel enregistrement avec cette méthode. b) La transformation des données La transformation est la seconde phase du processus. Cette étape, qui du reste est très importante, assure en réalité plusieurs tâches qui garantissent la fiabilité des données et leurs qualités. Ces tâches sont : Consolidation des données. Correction des données et élimination de toute ambiguïté. Elimination des données redondantes. Compléter et renseigner les valeurs manquantes. Cette opération se solde par la production d informations dignes d intérêt pour l entreprise et de et sont donc prêtes à être entreposées. c) Le chargement des données C est la dernière phase de l alimentation d un entrepôt de données, le chargement est une étape indispensable. Elle reste toute fois très délicate et exige une certaine connaissance des structures du système de gestion de la base de données (tables et index) afin d optimiser au mieux le processus. IV.2.2 Politiques de l alimentation Le processus de l alimentation peut se faire de différentes manières. Le choix de la politique de chargement dépend des sources : disponibilité et accessibilité. Ces politiques sont 8 : Push : dans cette méthode, la logique de chargement est dans le système de production. Il " pousse " les données vers la zone de préparation quand il en a l'occasion. L'inconvénient est que si le système est occupé, il ne poussera jamais les données. Pull : contrairement de la méthode précédente, le Pull " tire " les données de la source vers la zone de préparation. L'inconvénient de cette méthode est qu'elle peut surcharger le système s'il est en cours d'utilisation. Push-pull : c'est la combinaison des deux méthodes. La source prépare les données à envoyer et indique à la zone de préparation qu'elle est prête. La zone de préparation va alors récupérer les données

47 Aussi, le processus d alimentation doit répondre à certaines exigences illustrées par la figure suivante : Être correctif Être rapide Processus ETL Être sûr Être transparent Figure I.19 : Objectif de qualité de données dans un processus ETL [Kimball, 2004]. Sûr : assure l acheminement des données et leur livraison. Rapide : la quantité de données manipulées peut causer des lenteurs. Le processus d alimentation doit palier à ce problème et assurer le chargement du Data Warehouse dans des délais acceptables. Correctif : le processus d alimentation doit apporter les correctifs nécessaires pour améliorer la qualité des données. Transparent : le processus de l ETL doit être transparent afin d améliorer la qualité des données. 39

48 IV.2.3 Les outils E.T.L. Les outils E.T.L, en français E.T.C «Extraction-Transformation-Chargement» [Kimball, 2005], sont des outils qui garantissent la faisabilité et facilitent le déroulement des trois phases citées précédemment. D où leur importance dans un projet Data Warehouse. IV.3 Mise en œuvre du Data Warehouse C est la dernière étape d un projet Data Warehouse, soit son exploitation. L exploitation du Data Warehouse se fait par le biais d un ensemble d outils analytiques développés autour du Data Warehouse. Donc cette étape nécessite l achèvement du développement, ou de la mise en place, de ces outils qui peuvent accomplir les fonctions suivantes: a. Requêtage ad-hoc : Le requêtage ad-hoc reste très fréquent dans ce type de projet. En effet, les utilisateurs de l entrepôt de données, et spécialement les analystes, seront amenés à interagir avec le DW via des requêtes ad-hoc dans le but de faire les analyses requises par leurs métiers et, d élaborer aussi, des rapports et des tableaux de bords spécifiques. L accès à ce genre de service peut se faire via différentes méthodes et outils. Cependant, les spécialistes en la matière préconisent de laisser la possibilité à l utilisateur de choisir les outils qui lui paraissent les plus adéquats. b. Reporting : Destiné essentiellement à la production de rapports et de tableaux de bord, «il est la présentation périodique de rapports sur les activités et résultats d'une organisation, d'une unité de travail ou du responsable d'une fonction, destinée à en informer ceux chargés de les superviser en interne ou en externe, ou tout simplement concernés par ces activités ou résultants» 9. Ces outils de Reporting ne sont pas, à proprement parler, des instruments d'aide à la décision, mais, lorsqu ils sont utilisés de manière appropriée, ils peuvent fournir une précieuse vue d ensemble. Les rapports sont alors crées par le biais d outils de Reporting qui permettent de leur donner un format prédéterminé. Les requêtes sont constituées lors de l élaboration des rapports qui seront ensuite diffusés périodiquement en automatique ou ponctuellement à la demande

49 c. Analyse dimensionnelle des données: L analyse dimensionnelle est sans doute celle qui exploite et fait ressortir au mieux les capacités de l entrepôt de données. Le but par l analyse dimensionnelle est d offrir aux utilisateurs la possibilité d analyser les données selon différents critères afin de confirmer une tendance ou suivre les performances de l entreprise. Cette analyse se fait selon le principe OLAP, offrant de ce fait aux utilisateurs les possibilités de recourir à différentes opérations facilitant la navigation dans les données. La mise en place de ces outils est une option très intéressante dans la mesure où les données seront accessibles en analyses instantanées. Plusieurs fournisseurs de solution OLAP existent sur le marché et offrent des solutions construites sur des méthodes et technologies différentes. C est d ailleurs pour cela que le choix de la solution doit se faire au préalable, selon les besoins en utilisation, la taille de l entrepôt et les moyens techniques disponibles. d. Tableaux de bord : Les tableaux de bord sont un outil de pilotage qui donne une vision sur l évolution d un processus, afin de permettre aux responsables de mettre en place des actions correctives. «Le tableau de bord est un ensemble d indicateurs peu nombreux conçus pour permettre aux gestionnaires de prendre connaissance de l état et de l évolution des systèmes qu ils pilotent et d identifier les tendances qui les influenceront sur un horizon cohérent avec la nature de leurs fonctions» [Bouquin, 2003]. Cette forme de restitution a la particularité de se limiter à l essentiel, c'est-à-dire la mise en évidence de l état d un indicateur par rapport à un objectif, tout en adoptant une représentation graphique de l information. e. Data Mining : Au sens littéral du terme, le Data Mining signifie le forage de données. Le but de ce forage est d extraire de la matière brute qui, dans notre cas, représente de nouvelles connaissances. L idée de départ veut qu il existe dans toute entreprise des connaissances utiles, cachées sous des gisements de données. Le Data Mining permet donc, grâce à un certain nombre de techniques, de découvrir ces connaissances en faisant apparaître des corrélations entre ces données. Le Data Warehouse constituera alors la première source de données sur laquelle s exécutera le processus de découverte de connaissances. Dans la majeure partie du temps, l entrepôt de données représente un pré requis indispensable à toute fouille de données. Le recours à ce genre de méthode est de plus en plus utilisé dans les entreprises modernes. Les applications et outils implémentant ces solutions sont rarement développés en interne. En effet, les entreprises préfèrent se reposer sur des valeurs sûres du marché afin d exploiter au plus vite les données en leur possession. 41

50 IV.4 Maintenance et expansion La mise en service du Data Warehouse ne signifie pas la fin du projet, car un projet Data Warehouse nécessite un suivi constant compte tenu des besoins d optimisation de performance et ou d expansion. Il est donc nécessaire d investir dans les domaines suivants [Kimball, 2002] : Support : assurer un support aux utilisateurs pour leur faire apprécier l utilisation de l entrepôt de données. En outre, la relation directe avec les utilisateurs permet de détecter les correctifs nécessaires à apporter. Formation : il est indispensable d offrir un programme de formation permanant aux utilisateurs de l entrepôt de données. Support technique : un entrepôt de données est considéré comme un environnement de production. Naturellement le support technique doit surveiller avec la plus grande vigilance les performances et les tendances en ce qui concerne la charge du système. Management de l évolution : il faut toujours s assurer que l implémentation répond aux besoins de l entreprise. Les revues systématiques à certain point de contrôle sont un outil clé pour détecter et définir les possibilités d amélioration. En plus du suivi et de la maintenance du Data Warehouse, des demandes d expansion sont envisageables pour de nouveaux besoins, de nouvelles données ou pour des améliorations. Ces travaux d expansion sont à prévoir de façon à faciliter l évolution du schéma du Data Warehouse. 42

51 V. Conclusion Le concept «Data Warehouse» est apparu comme une réponse à des besoins grandissants dans le domaine décisionnel. Son adaptabilité et sa capacité de fournir les données nécessaires à une bonne analyse, ont fait de lui un atout majeur et incontournable pour toute entreprise soucieuse du suivi de ces performances. Afin de mettre en place ce genre de système, il est nécessaire de choisir et d adopter une démarche précise qui doit tenir compte des réalités de l entreprise et des contraintes du projet. La modélisation de l entrepôt se fait dans tous les cas grâce à la modélisation dimensionnelle. L alimentation en données constitue l étape à laquelle il faut accorder le plus d attention et de temps. En effet, elle est le garant de contenance de l entrepôt en données fiables et correctes. Une fois l alimentation terminée, l exploitation des données peut alors se faire par différentes méthodes. L utilisation d outil OLAP reste, cependant, l aspect le plus intéressant dans cette exploitation permettant la navigation dans les données de l entrepôt à la demande. Au cours de la seconde partie de cette étude, nous allons essayer d utiliser les concepts présentés dans la synthèse bibliographique, et cela afin de mettre en œuvre notre système. 43

52 Partie II : Cas pratique «filiales de distribution SONELGAZ» 44

53 Chapitre I : Présentation de l organisme d accueil. 45

54 I. Présentation de SONELGAZ I.1 Historique SONELGAZ est l opérateur historique dans le domaine de la fourniture des énergies électrique et gazière en Algérie. Ses missions principales sont la production, le transport et la distribution de l électricité ainsi que le transport et la distribution du gaz par canalisations. Son nouveau statut lui confère la possibilité d intervenir dans d autres segments d activités présentant un intérêt pour l entreprise et notamment dans le domaine de la commercialisation de l électricité et du gaz à l étranger. Durant son existence le groupe a connu des évolutions majeures qui peuvent être résumées comme suit : 1947, Création d EGA : C est le décret du 5 juin 1947 qui a crée l Etablissement Public National «Electricité et Gaz d Algérie» (EGA par abréviation). Par décret du 16 août 1947, seize sociétés qui se partageaient les concessions électriques ont été transférées à EGA. Ces sociétés détenaient alors 90% des propriétés industrielles électriques et gazières du pays. 1962, Le défi de la relève : Cette année représente la prise en main de l Algérie indépendante de la SONELGAZ alors Electricité et Gaz d Algérie et cela en faisant face au départ massif de cadres et techniciens français. Période allant de 1962 à 1969 : Cette période a été caractérisée par la baisse de la consommation (une baisse de prés de 33% en deux ans) dû au départ massive des étrangers qui représentaient plus de 87% de la clientèle. Par ailleurs, les tâches les plus urgentes ont été de reprendre le fichier des abonnés, reconstituer les plans des ouvrages et des réseaux, procéder au recrutement et à la formation dans tous les domaines et de ramener le niveau de consommation de l énergie à celui de , création de SONELGAZ: C est l ordonnance n du 28 juillet 1969) portant dissolution de l EGA et création de la nouvelle Société Nationale de l Electricité et du GAZ - SONELGAZ-. Ce texte s inscrit dans le cadre des mesures de nationalisation des secteurs clés de l économie nationale. L ordonnance précitée a attribué à l entreprise le monopole de la production, du transport, de la distribution, de l importation et de l exportation de l électricité et du gaz manufacturé (art. 4 et 7). L ensemble des biens de l ex-ega lui a été légué. 1977, le plan national d électrification : Dès le milieu des années 70, l Algérie s est engagée dans un ambitieux plan national d électrification qui avait objectif l amélioration des conditions de vie des populations des campagnes tout en assurant un développement harmonieux de l espace rural. 1983, naissance des entreprises travaux : six entreprises autonomes voient le jour : KAHRIF pour l électrification; KAHRAKIB - Infrastructures et installations électriques; KANAGAZ - Réalisation des réseaux gaz; INERGA - Génie civil; ETTERKIB Montage industriel et l entreprise AMC - Fabrication des compteurs et appareils de mesure et de contrôle. 46

55 1991, SONELGAZ EPIC : SONELGAZ change de nature juridique et devient Etablissement Public à caractère Industriel et Commercial (EPIC) en vertu du décret exécutif n du 14 décembre 1991, portant transformation de la nature juridique de la Société Nationale de l Electricité et du Gaz. Le décret exécutif n du 17 septembre 1995 confirme la nature de SONELGAZ en tant qu Etablissement Public à caractère Industriel et Commercial. 1998, création de filiales périphériques : Le 1er janvier 1998, neuf filiales périphériques ont vu le jour. 2002, promulgation de la loi 02 / 01 du 5 février 2002 : Promulguée en février 2002, la nouvelle loi relative à l électricité et à la distribution du gaz par canalisations est venue supprimer le monopole exercé jusque là par SONELGAZ, en ouvrant le secteur de l électricité et du gaz à la concurrence, sauf pour les activités de Transport qui ont un caractère de monopole naturel. Juin 2002, SONELGAZ SPA : En vertu du décret présidentiel n du 1er juin 2002 portant statuts de la Société algérienne de l électricité et du gaz dénommée "SONELGAZ. Spa", SONELGAZ est passé d Etablissement Public à caractère Industriel et Commercial à une Société Par Actions dont le capital est détenu par l Etat. Sur le plan de son fonctionnement, SONELGAZ Spa est dotée d une Assemblée Générale et d un Conseil d Administration. Elle est dirigée par un Président directeur général. I.1.1 Organisation du groupe SONELGAZ, et afin de se mettre en conformité avec les dispositions de la loi de février 2002, qui lui confère le statut de Société Par Actions, s est érigée en un Groupe Industriel constitué de sociétés opérationnelles et d une Société Mère. Chacune des sociétés ayant des missions et objectifs différents, il en ressort les principes d organisation suivants : Maison Mère : elle est chargée essentiellement de l élaboration de la stratégie et de pilotage du Groupe, le contrôle des filiales, l élaboration et la mise en œuvre de la politique financière et la définition de la politique de développement de la Ressource Humaine. Filiales Métiers de base : Durant ces cinq dernières années, les métiers de base de SONELGAZ ont été érigés en filiales. Au nombre de huit, ces dernières activent dans les domaines de la production, la gestion du réseau de transport, la gestion du système production / transport, la distribution de l électricité et du gaz (quatre sociétés). Filiales Travaux : Les entreprises de réalisation érigées en entreprises autonomes à la faveur de la restructuration de 1984 ont été réintégrées, depuis janvier 2006, au sein du Groupe SONELGAZ. Filiales Périphériques : SONELGAZ a externalisé ses activités périphériques et les a confiées à des filiales dont elle détient entièrement le capital. Ces filiales sont au nombre de quatorze et opèrent dans des activités diverses. 47

56 Sociétés en Participation : SONELGAZ s est investie dans des domaines clés à haute valeur technologique tels que les télécommunications ou la maintenance de turbines à gaz. L organigramme suivant donne une vision claire et précise de la structure de l entreprise et de son administration : Figure II.1 : Organigramme représentant l organisation du Groupe SONELGAZ. 48

et les Systèmes Multidimensionnels

et les Systèmes Multidimensionnels Le Data Warehouse et les Systèmes Multidimensionnels 1 1. Définition d un Datawarehouse (DW) Le Datawarehouse est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées

Plus en détail

Entrepôt de données 1. Introduction

Entrepôt de données 1. Introduction Entrepôt de données 1 (data warehouse) Introduction 1 Présentation Le concept d entrepôt de données a été formalisé pour la première fois en 1990 par Bill Inmon. Il s agissait de constituer une base de

Plus en détail

Le "tout fichier" Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique

Le tout fichier Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique Introduction à l informatique : Information automatisée Le premier ordinateur Définition disque dure, mémoire, carte mémoire, carte mère etc Architecture d un ordinateur Les constructeurs leader du marché

Plus en détail

BI = Business Intelligence Master Data-ScienceCours 4 - OLAP

BI = Business Intelligence Master Data-ScienceCours 4 - OLAP BI = Business Intelligence Master Data-Science Cours 4 - OLAP UPMC 15 février 2015 Plan Vision générale ETL Datawarehouse OLAP Reporting Data Mining Entrepôt de données Les entrepôts de données (data warehouse)

Plus en détail

L'infocentre sert à prendre des décisions opérationnelles basées sur des valeurs courantes

L'infocentre sert à prendre des décisions opérationnelles basées sur des valeurs courantes II - II 1ère génération 13 2ème génération : Entrepôt de données / Magasin de données 15 3ème génération OLAP 16 Références Bibliographiques 18 A. 1ère génération Infocentre Tableur Base de données Infocentre

Plus en détail

Entreposage, analyse en ligne et fouille de données

Entreposage, analyse en ligne et fouille de données Entreposage, analyse en ligne et fouille de données Houssem Jerbi IRIT - SIG/ED jerbi@irit.fr Journée COMPIL " Bases de Données" 14/12/2010 PLAN Introduction Bases de données Entrepôt de données Technologie

Plus en détail

Business Intelligence : Informatique Décisionnelle

Business Intelligence : Informatique Décisionnelle Business Intelligence : Informatique Décisionnelle On appelle «aide à la décision», «décisionnel», ou encore «business intelligence», un ensemble de solutions informatiques permettant l analyse des données

Plus en détail

Plan. Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation

Plan. Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation Data WareHouse Plan Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation 2 Présentation Besoin: prise de décisions

Plus en détail

Les Entrepôts de Données

Les Entrepôts de Données Les Entrepôts de Données Grégory Bonnet Abdel-Illah Mouaddib GREYC Dépt Dépt informatique :: GREYC Dépt Dépt informatique :: Cours Cours SIR SIR Systèmes d information décisionnels Nouvelles générations

Plus en détail

Urbanisation des SI-NFE107

Urbanisation des SI-NFE107 OLAP Urbanisation des SI-NFE107 Fiche de lecture Karim SEKRI 20/01/2009 OLAP 1 Introduction PLAN OLAP Les différentes technologies OLAP Plate formes et Outils 20/01/2009 OLAP 2 Informatique décisionnelle

Plus en détail

Chapitre 9 : Informatique décisionnelle

Chapitre 9 : Informatique décisionnelle Chapitre 9 : Informatique décisionnelle Sommaire Introduction... 3 Définition... 3 Les domaines d application de l informatique décisionnelle... 4 Architecture d un système décisionnel... 5 L outil Oracle

Plus en détail

Entrepôts de données. NEGRE Elsa Université Paris-Dauphine 2015-2016

Entrepôts de données. NEGRE Elsa Université Paris-Dauphine 2015-2016 Entrepôts de données NEGRE Elsa Université Paris-Dauphine 2015-2016 Contexte et problématique Le processus de prise de décision L entrepôt de données Définition Différence avec un SGBD Caractéristiques

Plus en détail

CARTE HEURISTIQUE...1 LA CHAÎNE DÉCISIONNELLE...2. Collecte des données...2 Stockage des Données...3 Exploitation des Données...4 OLTP ET OLAP...

CARTE HEURISTIQUE...1 LA CHAÎNE DÉCISIONNELLE...2. Collecte des données...2 Stockage des Données...3 Exploitation des Données...4 OLTP ET OLAP... Table des matières CARTE HEURISTIQUE...1 LA CHAÎNE DÉCISIONNELLE...2 Collecte des données...2 Stockage des Données...3 Exploitation des Données...4 OLTP ET OLAP...6 OPÉRATIONS SUR LES CUBES...7 Exemple

Plus en détail

Introduction à la B.I. Avec SQL Server 2008

Introduction à la B.I. Avec SQL Server 2008 Introduction à la B.I. Avec SQL Server 2008 Version 1.0 VALENTIN Pauline 2 Introduction à la B.I. avec SQL Server 2008 Sommaire 1 Présentation de la B.I. et SQL Server 2008... 3 1.1 Présentation rapide

Plus en détail

Bases de données multidimensionnelles OLAP. OnLine Analytical Processing

Bases de données multidimensionnelles OLAP. OnLine Analytical Processing Bases de données multidimensionnelles OLAP OnLine Analytical Processing OLAP OLAP (On Line Analytical Processing): Ensemble des outils nécessaires pour la mise en place d'un Système d'information décisionnel

Plus en détail

Bases de Données Avancées

Bases de Données Avancées 1/26 Bases de Données Avancées DataWareHouse Thierry Hamon Bureau H202 - Institut Galilée Tél. : 33 1.48.38.35.53 Bureau 150 LIM&BIO EA 3969 Université Paris 13 - UFR Léonard de Vinci 74, rue Marcel Cachin,

Plus en détail

Les entrepôts de données

Les entrepôts de données Les entrepôts de données Lydie Soler Janvier 2008 U.F.R. d informatique Document diffusé sous licence Creative Commons by-nc-nd (http://creativecommons.org/licenses/by-nc-nd/2.0/fr/) 1 Plan Introduction

Plus en détail

BI = Business Intelligence Master Data-ScienceCours 3 - Data

BI = Business Intelligence Master Data-ScienceCours 3 - Data BI = Business Intelligence Master Data-Science Cours 3 - Datawarehouse UPMC 8 février 2015 Rappel L Informatique Décisionnelle (ID), en anglais Business Intelligence (BI), est l informatique à l usage

Plus en détail

JASPERSOFT ET LE PAYSAGE ANALYTIQUE. Jaspersoft et le paysage analytique 1

JASPERSOFT ET LE PAYSAGE ANALYTIQUE. Jaspersoft et le paysage analytique 1 JASPERSOFT ET LE PAYSAGE ANALYTIQUE Jaspersoft et le paysage analytique 1 Ce texte est un résumé du Livre Blanc complet. N hésitez pas à vous inscrire sur Jaspersoft (http://www.jaspersoft.com/fr/analyticslandscape-jaspersoft)

Plus en détail

LES ENTREPOTS DE DONNEES

LES ENTREPOTS DE DONNEES Module B4 : Projet des Systèmes d information Lille, le 25 mars 2002 LES ENTREPOTS DE DONNEES Problématique : Pour capitaliser ses informations, une entreprise doit-elle commencer par mettre en œuvre des

Plus en détail

Les entrepôts de données pour les nuls... ou pas!

Les entrepôts de données pour les nuls... ou pas! Atelier aideà la Décision à tous les Etages AIDE@EGC2013 Toulouse Mardi 29 janvier 2013 Cécile Favre Fadila Bentayeb Omar Boussaid Jérôme Darmont Gérald Gavin Nouria Harbi Nadia Kabachi Sabine Loudcher

Plus en détail

Informatique Décisionnelle pour l environnement

Informatique Décisionnelle pour l environnement Territoires, Environnement, Télédétection et Information Spatiale Unité mixte de recherche AgroParisTech - Cirad - Irstea Informatique Décisionnelle pour l environnement Principe, architecture informatique

Plus en détail

IBM Cognos TM1. Fiche Produit. Aperçu

IBM Cognos TM1. Fiche Produit. Aperçu Fiche Produit IBM Cognos TM1 Aperçu Cycles de planification raccourcis de 75 % et reporting ramené à quelques minutes au lieu de plusieurs jours Solution entièrement prise en charge et gérée par le département

Plus en détail

Business & High Technology

Business & High Technology UNIVERSITE DE TUNIS INSTITUT SUPERIEUR DE GESTION DE TUNIS Département : Informatique Business & High Technology Chapitre 8 : ID : Informatique Décisionnelle BI : Business Intelligence Sommaire Introduction...

Plus en détail

Datawarehouse: Cubes OLAP. Marlyse Dieungang Khaoula Ghilani

Datawarehouse: Cubes OLAP. Marlyse Dieungang Khaoula Ghilani Datawarehouse: Cubes OLAP Marlyse Dieungang Khaoula Ghilani Table des matières 1 Data Warehouse 3 1.1 Introduction............................ 3 1.1.1 Définition......................... 3 1.1.2 Architecture........................

Plus en détail

Didier MOUNIEN Samantha MOINEAUX

Didier MOUNIEN Samantha MOINEAUX Didier MOUNIEN Samantha MOINEAUX 08/01/2008 1 Généralisation des ERP ERP génère une importante masse de données Comment mesurer l impact réel d une décision? Comment choisir entre plusieurs décisions?

Plus en détail

Les Entrepôts de Données. (Data Warehouses)

Les Entrepôts de Données. (Data Warehouses) Les Entrepôts de Données (Data Warehouses) Pr. Omar Boussaid Département d'informatique et de Sta5s5que Université Lyon2 - France Les Entrepôts de Données 1. Généralités, sur le décisionnel 2. L'entreposage

Plus en détail

Système OLAP Fresqueau

Système OLAP Fresqueau Système OLAP Fresqueau Kamal BOULIL Journées 20 mars Strasbourg Réunion plénière -Fresqueau 07-08 octobre 2013 1 Plan 1. Introduction 1. Projet ANR Fresqueau 2. Systèmes OLAP 2. Système OLAP Fresqueau

Plus en détail

X2BIRT : Mettez de l interactivité dans vos archives

X2BIRT : Mettez de l interactivité dans vos archives Présentation Produit Présentation Produit X2BIRT : Mettez de l interactivité dans vos archives L accès à l information est capital pour les affaires. X2BIRT, la dernière innovation d Actuate, prend le

Plus en détail

La place de la Géomatique Décisionnelle dans le processus de décision

La place de la Géomatique Décisionnelle dans le processus de décision Géomatique décisionnelle La place de la Géomatique Décisionnelle dans le processus de décision - Arnaud Van De Casteele Mines ParisTech - CRC Arnaud {dot} van_de_casteele {at} mines-paristech.fr Les rencontres

Plus en détail

Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours

Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours Information du cours Informatique décisionnelle et data mining www.lia.univ-avignon.fr/chercheurs/torres/cours/dm Juan-Manuel Torres juan-manuel.torres@univ-avignon.fr LIA/Université d Avignon Cours/TP

Plus en détail

CAPACITE CARTOGRAPHIQUE AUTOUR DES TECHNOLOGIES SOLAP

CAPACITE CARTOGRAPHIQUE AUTOUR DES TECHNOLOGIES SOLAP CONSERVATOIRE NATIONAL DES ARTS ET METIERS CENTRE REGIONAL RHONE-ALPES CENTRE D'ENSEIGNEMENT DE GRENOBLE UE ENG111 - Epreuve TEST Travail d'etude et de Synthèse Technique en INFORMATIQUE CAPACITE CARTOGRAPHIQUE

Plus en détail

BUSINESS OBJECTS V5 / V6

BUSINESS OBJECTS V5 / V6 BUSINESS OBJECTS V5 / V6 Durée Objectif 2 jours L objectif de ce cours est de savoir utiliser le logiciel BUSINESS OBJECTS pour faire des interrogations multi - dimensionnelles sur les univers BO et de

Plus en détail

Chapitre IX. L intégration de données. Les entrepôts de données (Data Warehouses) Motivation. Le problème

Chapitre IX. L intégration de données. Les entrepôts de données (Data Warehouses) Motivation. Le problème Chapitre IX L intégration de données Le problème De façon très générale, le problème de l intégration de données (data integration) est de permettre un accès cohérent à des données d origine, de structuration

Plus en détail

Bases de données multidimensionnelles et mise en œuvre dans Oracle

Bases de données multidimensionnelles et mise en œuvre dans Oracle Bases de données multidimensionnelles et mise en œuvre dans Oracle 1 Introduction et Description générale Les bases de données relationnelles sont très performantes pour les systèmes opérationnels (ou

Plus en détail

SQL Server 2014 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services, Power BI...)

SQL Server 2014 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services, Power BI...) Avant-propos 1. À qui s'adresse ce livre? 15 2. Pré-requis 15 3. Objectifs du livre 16 4. Notations 17 Introduction à la Business Intelligence 1. Du transactionnel au décisionnel 19 2. Business Intelligence

Plus en détail

ETL Extract - Transform - Load

ETL Extract - Transform - Load ETL Extract - Transform - Load Concept général d analyse en ligne (rappels) Rémy Choquet - Université Lyon 2 - Master 2 IIDEE - 2006-2007 Plan Définitions La place d OLAP dans une entreprise OLAP versus

Plus en détail

Fournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement

Fournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement Introduction Phases du projet Les principales phases du projet sont les suivantes : La mise à disposition des sources Des fichiers Excel sont utilisés pour récolter nos informations L extraction des données

Plus en détail

Entrepôt de Données. Jean-François Desnos. Jean-Francois.Desnos@grenet.fr ED JFD 1

Entrepôt de Données. Jean-François Desnos. Jean-Francois.Desnos@grenet.fr ED JFD 1 Entrepôt de Données Jean-François Desnos Jean-Francois.Desnos@grenet.fr ED JFD 1 Définition (Bill Inmon 1990) Un entrepôt de données (data warehouse) est une collection de données thématiques, intégrées,

Plus en détail

et les Systèmes Multidimensionnels

et les Systèmes Multidimensionnels Le Data Warehouse et les Systèmes Multidimensionnels 1 1. Définition d un Data warehouse (DW) Le Data warehouse (entrepôt de données) est une collection de données orientées sujet, intégrées, non volatiles

Plus en détail

QU EST-CE QUE LE DECISIONNEL?

QU EST-CE QUE LE DECISIONNEL? La plupart des entreprises disposent d une masse considérable d informations sur leurs clients, leurs produits, leurs ventes Toutefois ces données sont cloisonnées par les applications utilisées ou parce

Plus en détail

Licence Professionnelle en Statistique et Informatique Décisionnelle (S.I.D.)

Licence Professionnelle en Statistique et Informatique Décisionnelle (S.I.D.) Université de Lille 2 - Droit et Santé Ecole Supérieure des Affaires & Institut Universitaire de Technologie (IUT-C) Département Statistique et Traitement Informatique des Données Licence Professionnelle

Plus en détail

Introduction. d'informations Les entrepôts de données (Datawarehouse) Les datamarts Architecture Modélisation

Introduction. d'informations Les entrepôts de données (Datawarehouse) Les datamarts Architecture Modélisation Data WareHouse Plan Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamarts Architecture Modélisation 2 Présentation Besoin: prise de décisions

Plus en détail

UE 8 Systèmes d information de gestion Le programme

UE 8 Systèmes d information de gestion Le programme UE 8 Systèmes d information de gestion Le programme Légende : Modifications de l arrêté du 8 mars 2010 Suppressions de l arrêté du 8 mars 2010 Partie inchangée par rapport au programme antérieur Indications

Plus en détail

Bases de données multidimensionnelles OLAP

Bases de données multidimensionnelles OLAP Bases de données multidimensionnelles OLAP OLAP OLAP (On Line Analytical Processing): Ensemble des outils nécessaires pour l analyse multidimensionnelle. Les données sont historisées, résumées, consolidées.

Plus en détail

SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...)

SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...) Avant-propos 1. À qui s'adresse ce livre? 15 2. Pré-requis 15 3. Objectifs du livre 16 4. Notations 17 Introduction à la Business Intelligence 1. Du transactionnel au décisionnel 19 2. Business Intelligence

Plus en détail

Business Intelligence (BI) Stratégie de création d un outil BI

Business Intelligence (BI) Stratégie de création d un outil BI Business Intelligence (BI) La Business intelligence est un outil décisionnel incontournable à la gestion stratégique et quotidienne des entités. Il fournit de l information indispensable, sous plusieurs

Plus en détail

BUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise

BUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise BUSINESS INTELLIGENCE Une vision cockpit : utilité et apport pour l'entreprise 1 Présentation PIERRE-YVES BONVIN, SOLVAXIS BERNARD BOIL, RESP. SI, GROUPE OROLUX 2 AGENDA Définitions Positionnement de la

Plus en détail

Généralités sur les bases de données

Généralités sur les bases de données Généralités sur les bases de données Qu est-ce donc qu une base de données? Que peut-on attendre d un système de gestion de bases de données? Que peut-on faire avec une base de données? 1 Des données?

Plus en détail

Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise.

Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise. Solutions PME VIPDev Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise. Cette offre est basée sur la mise à disposition de l ensemble de nos compétences techniques et créatives au service

Plus en détail

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation Base de données S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Présentation du module Contenu général Notion de bases de données Fondements / Conception Utilisation :

Plus en détail

CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2012

CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2012 CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE Edition 2012 AGENDA Qui sommes nous? Présentation de Keyrus Keyrus : Expert en formations BI Nos propositions de formation 3 modes de formations Liste des

Plus en détail

Partie I : Introduction

Partie I : Introduction Partie I : Introduction Chapitre I : Introduction et Problématique 1. Introduction A l ère contemporaine, beaucoup d entreprises se sont adaptées au virage de la technologie en informatisant plusieurs

Plus en détail

Action de formation: SQL Server Business Intelligence & Data Warehouse

Action de formation: SQL Server Business Intelligence & Data Warehouse Action de formation: SQL Server Business Intelligence & Data Warehouse Contenu : Integration Services Présentation de Management Studio - Présenter les différentes tâches de SSMS - Structure des serveurs

Plus en détail

Ecole des Hautes Etudes Commerciales HEC Alger. par Amina GACEM. Module Informatique 1ière Année Master Sciences Commerciales

Ecole des Hautes Etudes Commerciales HEC Alger. par Amina GACEM. Module Informatique 1ière Année Master Sciences Commerciales Ecole des Hautes Etudes Commerciales HEC Alger Évolution des SGBDs par Amina GACEM Module Informatique 1ière Année Master Sciences Commerciales Evolution des SGBDs Pour toute remarque, question, commentaire

Plus en détail

Le Data Warehouse. Fait Vente. temps produit promotion. magasin. revenu ... Produit réf. libellé volume catégorie poids. Temps jour semaine date ...

Le Data Warehouse. Fait Vente. temps produit promotion. magasin. revenu ... Produit réf. libellé volume catégorie poids. Temps jour semaine date ... Le Data Warehouse Temps jour semaine date magasin nom ville m 2 région manager... Fait Vente temps produit promotion magasin revenu... Produit réf. libellé volume catégorie poids... Promo nom budget média

Plus en détail

Entrepôt de données autour du PMSI pour le pilotage d établissement hospitalier

Entrepôt de données autour du PMSI pour le pilotage d établissement hospitalier 1 Entrepôt de données autour du PMSI pour le pilotage d établissement hospitalier Lama EL SARRAJ Ingénieur Hospitalier (AP-HM) AP-HM 2 année de doctorat en informatique (LSIS) 14 octobre 2011 HOPITECH

Plus en détail

Les solutions SAS pour les Petites et Moyennes Entreprises

Les solutions SAS pour les Petites et Moyennes Entreprises BROCHURE SOLUTION Les solutions SAS pour les Petites et Moyennes Entreprises Sur un marché aussi compétitif que celui des Petites et Moyennes Entreprises, le temps et l efficacité sont deux valeurs prioritaires

Plus en détail

Prototype SOLAP appliqué sur des champs continus en mode raster

Prototype SOLAP appliqué sur des champs continus en mode raster Session démos 24 novembre 2014 Prototype SOLAP appliqué sur des champs continus en mode raster Analyse de hot spots de criminalité Jean-Paul Kasprzyk, doctorant Introduction 2 L informatique décisionnelle

Plus en détail

Informatique Décisionnelle pour l environnement

Informatique Décisionnelle pour l environnement Territoires, Environnement, Télédétection et Information Spatiale Unité mixte de recherche AgroParisTech - Cirad - Irstea Informatique Décisionnelle pour l environnement Principe, architecture informatique

Plus en détail

GUIDE COMPARATIF OLAP. www.viseo.com

GUIDE COMPARATIF OLAP. www.viseo.com GUIDE COMPARATIF OLAP www.viseo.com Table des matières Contexte et usage... Champs d application... Principes OLAP... 4 Les architectures OLAP... 5 Ouverture et complémentarité... 6 Questionnaire opérationnel...

Plus en détail

Le terme «ERP» provient du nom de la méthode MRP (Manufacturing Ressource Planning) utilisée dans les années 70 pour la gestion et la planification

Le terme «ERP» provient du nom de la méthode MRP (Manufacturing Ressource Planning) utilisée dans les années 70 pour la gestion et la planification Séminaire national Alger 12 Mars 2008 «L Entreprise algérienne face au défi du numérique : État et perspectives» CRM et ERP Impact(s) sur l entreprise en tant qu outils de gestion Historique des ERP Le

Plus en détail

Evry - M2 MIAGE Entrepôt de données

Evry - M2 MIAGE Entrepôt de données Evry - M2 MIAGE Entrepôt de données Introduction D. Ploix - M2 Miage - EDD - Introduction 1 Plan Positionnement du BI dans l entreprise Déclinaison fonctionnelle du décisionnel dans l entreprise Intégration

Plus en détail

5. Architecture et sécurité des systèmes informatiques Dimension Fonctionnelle du SI

5. Architecture et sécurité des systèmes informatiques Dimension Fonctionnelle du SI 5. Architecture et sécurité des systèmes informatiques Dimension Fonctionnelle du SI Un SI : et pour faire quoi? Permet de stocker de manière définitive des informations volatiles provenant d autre BD.

Plus en détail

L informatique des entrepôts de données

L informatique des entrepôts de données L informatique des entrepôts de données Daniel Lemire SEMAINE 8 Introduction à OLAP 8.1. Présentation de la semaine Le modèle OLAP (Online Analytical Processing) est un modèle quasiomniprésent en intelligence

Plus en détail

Méthodologie de conceptualisation BI

Méthodologie de conceptualisation BI Méthodologie de conceptualisation BI Business Intelligence (BI) La Business intelligence est un outil décisionnel incontournable à la gestion stratégique et quotidienne des entités. Il fournit de l information

Plus en détail

Ici, le titre de la. Tableaux de bords de conférence

Ici, le titre de la. Tableaux de bords de conférence Ici, le titre de la Tableaux de bords de conférence pilotage d entreprise, indicateurs de performance reporting et BI quels outils seront incontournables à l horizon 2010? Les intervenants Editeur/Intégrateur

Plus en détail

Etude de faisabilité visant à mettre en place un entrepôt de données sur les données de l IFN. Analyser et Explorer avec une grande interactivité

Etude de faisabilité visant à mettre en place un entrepôt de données sur les données de l IFN. Analyser et Explorer avec une grande interactivité Établissement chargé de réaliser l inventaire permanent du patrimoine forestier sur tout le territoire métropolitain indépendamment de toute question de propriété. Parmi ces objectifs: Connaissance de

Plus en détail

Conception de systèmes d'information et d'entrepôts de données

Conception de systèmes d'information et d'entrepôts de données Territoires, Environnement, Télédétection et Information Spatiale Unité mixte de recherche AgroParisTech - Cirad - Irstea Conception de systèmes d'information et d'entrepôts de données Vers des structures

Plus en détail

L information et la technologie de l informationl

L information et la technologie de l informationl L information et la technologie de l informationl CRM & informatique décisionnelled CRM CRM & informatique décisionnelle. d 1 2 3 Les Les fondements managériaux managériaux du du CRM. CRM. Les Les fondements

Plus en détail

La problématique. La philosophie ' ) * )

La problématique. La philosophie ' ) * ) La problématique!" La philosophie #$ % La philosophie &'( ' ) * ) 1 La philosophie +, -) *. Mise en oeuvre Data warehouse ou Datamart /01-2, / 3 13 4,$ / 5 23, 2 * $3 3 63 3 #, 7 Datawarehouse Data warehouse

Plus en détail

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles) SGBDR Systèmes de Gestion de Bases de Données (Relationnelles) Plan Approches Les tâches du SGBD Les transactions Approche 1 Systèmes traditionnels basés sur des fichiers Application 1 Gestion clients

Plus en détail

Présentation du module Base de données spatio-temporelles

Présentation du module Base de données spatio-temporelles Présentation du module Base de données spatio-temporelles S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Partie 1 : Notion de bases de données (12,5h ) Enjeux et principes

Plus en détail

Analyse comparative entre différents outils de BI (Business Intelligence) :

Analyse comparative entre différents outils de BI (Business Intelligence) : Analyse comparative entre différents outils de BI (Business Intelligence) : Réalisé par: NAMIR YASSINE RAGUI ACHRAF Encadré par: PR. L. LAMRINI Dans le domaine d économies des Big Data et Open Data, comment

Plus en détail

BUSINESS INTELLIGENCE

BUSINESS INTELLIGENCE GUIDE COMPARATIF BUSINESS INTELLIGENCE www.viseo.com Table des matières Business Intelligence :... 2 Contexte et objectifs... 2 Une architecture spécifique... 2 Les outils de Business intelligence... 3

Plus en détail

Un datawarehouse est un entrepôt de données (une base de données) qui se caractérise par des données :

Un datawarehouse est un entrepôt de données (une base de données) qui se caractérise par des données : Page 1 of 6 Entrepôt de données Un article de Wikipédia, l'encyclopédie libre. L'entrepôt de données, ou datawarehouse, est un concept spécifique de l'informatique décisionnelle, issu du constat suivant

Plus en détail

Choix de l outil PENTAHO

Choix de l outil PENTAHO Choix de l outil PENTAHO GROUPES : Encadrant : IDRISSI BADSSI abd al moughit Mme LEMRINI loubna HALIM hamza LARHROUCH mustapha Table des matières Business intelligence... 2 Les Outils Open source de Business

Plus en détail

Créer le modèle multidimensionnel

Créer le modèle multidimensionnel 231 Chapitre 6 Créer le modèle multidimensionnel 1. Présentation de SSAS multidimensionnel Créer le modèle multidimensionnel SSAS (SQL Server Analysis Services) multidimensionnel est un serveur de bases

Plus en détail

Durée ou Modalité: Examen! MOTS CLES : Architecture d application, Internet, Web2, RIA, Service Oriented Architecture, XML

Durée ou Modalité: Examen! MOTS CLES : Architecture d application, Internet, Web2, RIA, Service Oriented Architecture, XML DEPARTEMENT INFORMATIQUE ET GESTION S 9 PIGUE9.1 ARCHITECTURE DES SYSTEMES D INFORMATION & INTERNET! COORDINATEUR : Christophe FIORIO! EQUIPE PEDAGOGIQUE : Christophe FIORIO, Tiberiu STRATULAT! VOLUME

Plus en détail

Le concept de Data Warehouse a été formalisé pour la première fois en 1990.

Le concept de Data Warehouse a été formalisé pour la première fois en 1990. 1 - LE DATA WAREHOUSE 1.1 - PRESENTATION Le concept de Data Warehouse a été formalisé pour la première fois en 1990. L idée de constituer une base de données orientée sujet, intégrée, contenant des informations

Plus en détail

CONCEPTION ET REALISATION D'UN GENERATEUR DE TABLEAUX DE BORD PROSPECTIFS MULTIDIMENSIONNELS

CONCEPTION ET REALISATION D'UN GENERATEUR DE TABLEAUX DE BORD PROSPECTIFS MULTIDIMENSIONNELS CONCEPTION ET REALISATION D'UN GENERATEUR DE TABLEAUX DE BORD PROSPECTIFS MULTIDIMENSIONNELS Nazih Selmoune (*), Zaia Alimazighi (*) Selmoune@lsi-usthb.dz, Alimazighi@wissal.dz (*) Laboratoire des systèmes

Plus en détail

Fiche de lecture OLAP

Fiche de lecture OLAP Fiche de lecture OLAP NFE107 Urbanisation des Systèmes d Information Karim Sekri Informatique décisionnelle BI, Business Intelligence Système interprétant des données complexes permettant aux dirigeants

Plus en détail

Contexte général de l étude

Contexte général de l étude 1 2 Contexte général de l étude Les entrepôts de données associés à des outils d analyse On Line Analytical Processing (OLAP), représentent une solution effective pour l informatique décisionnelle (Immon,

Plus en détail

Intelligence Economique - Business Intelligence

Intelligence Economique - Business Intelligence Intelligence Economique - Business Intelligence Notion de Business Intelligence Dès qu'il y a une entreprise, il y a implicitement intelligence économique (tout comme il y a du marketing) : quelle produit

Plus en détail

(epc) Conformité avec les Global Trade

(epc) Conformité avec les Global Trade Des solutions de gestion des informations produit Pour vous aider à atteindre vos objectifs métier IBM WebSphere Product Center Points forts Offre une solution globale de gestion des informations produit

Plus en détail

Leçon 4 : Typologie des SI

Leçon 4 : Typologie des SI Leçon 4 : Typologie des SI Typologie des SI Système formel Système informel Typologie des SI Chaque jour au sein d une organisation Le système d info stocke, traie ou restitue des quantités importantes

Plus en détail

DEMANDE D INFORMATION RFI (Request for information)

DEMANDE D INFORMATION RFI (Request for information) DOD SEICAM RFI Demande d information EVDEC Réf. : RFI_EVDEC- GT5_Outil_reporting_BI_v4.doc Page 1/11 DEMANDE D INFORMATION RFI (Request for information) OUTIL INTÉGRÉ DE REPORTING ET D ANALYSE DÉCISIONNELLE

Plus en détail

Introduction aux S.G.B.D.

Introduction aux S.G.B.D. NFE113 Administration et configuration des bases de données - 2010 Introduction aux S.G.B.D. Eric Boniface Sommaire L origine La gestion de fichiers Les S.G.B.D. : définition, principes et architecture

Plus en détail

Sécurité des entrepôts de données dans le Cloud Un SaaS pour le cryptage des données issues d un ETL

Sécurité des entrepôts de données dans le Cloud Un SaaS pour le cryptage des données issues d un ETL Sécurité des entrepôts de données dans le Cloud Un SaaS pour le cryptage des données issues d un ETL Présenté par Hana Gara Kort Sous la direction de Dr Jalel Akaichi Maître de conférences 1 1.Introduction

Plus en détail

FICHE CONCEPT 01 ETL (EXTRACT TRANSFORM & LOAD)

FICHE CONCEPT 01 ETL (EXTRACT TRANSFORM & LOAD) FICHE CONCEPT 01 ETL (EXTRACT TRANSFORM & LOAD) BIEN GERER SES REFERENTIELS DE DONNEES : UN ENJEU POUR MIEUX PILOTER LA PERFORMANCE DE SON ETABLISSEMENT octobre 2008 GMSIH 44, Rue de Cambronne 75015 Paris.

Plus en détail

Présentation du module. Base de données spatio-temporelles. Exemple. Introduction Exemple. Plan. Plan

Présentation du module. Base de données spatio-temporelles. Exemple. Introduction Exemple. Plan. Plan Base de données spatio-temporelles S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Présentation du module Contenu général Partie 1 : Notion de bases de données (Conception

Plus en détail

Base de données en mémoire

Base de données en mémoire Base de données en mémoire Plan Bases de données relationnelles OnLine Analytical Processing Difficultés de l OLAP Calculs en mémoire Optimisations 1 Base de données relationnelle Introduction Date Exemple

Plus en détail

SQL SERVER 2008, BUSINESS INTELLIGENCE

SQL SERVER 2008, BUSINESS INTELLIGENCE SGBD / Aide à la décision SQL SERVER 2008, BUSINESS INTELLIGENCE Réf: QLI Durée : 5 jours (7 heures) OBJECTIFS DE LA FORMATION Cette formation vous apprendra à concevoir et à déployer une solution de Business

Plus en détail

Présentation de l offre produit de Business Objects XI

Présentation de l offre produit de Business Objects XI Conseil National des Assurances Séminaire - Atelier L information au service de tous Le 09 Novembre 2005 Présentation de l offre produit de XI Amar AMROUCHE Consultant Avant Vente aamrouche@aacom-algerie.com

Plus en détail

BASES DE DONNEES AVANCEES

BASES DE DONNEES AVANCEES 1.Introduction J.Korczak 1 BASES DE DONNEES AVANCEES Jerzy KORCZAK, Mohammed ATTIK email: {jjk,attik}@lsiit.u-strasbg.fr BDA Objectifs : Ce cours présente des méthodes, modèles et outils d'aide au développement

Plus en détail

La Business Intelligence & le monde des assurances

La Business Intelligence & le monde des assurances Conseil National des Assurances Séminaire - Atelier L information au service de tous Le 09 Novembre 2005 La Business Intelligence & le monde des assurances Karim NAFIE Regional Presales Manager EEMEA Operations

Plus en détail

Training Calendrier. Avril Septembre 2007

Training Calendrier. Avril Septembre 2007 Training Calendrier Avril Septembre 2007 Cours Description BUSINESS INTELLIGENCE (BI) Cognos 8 BI COGNOS 8 BI AD-HOC-QUERY (1 jour) Cognos 8 BI Création de Requêtes est un cours d une journée destiné aux

Plus en détail

PLAN. Les systèmes d'information analytiques. Exemples de décisions

PLAN. Les systèmes d'information analytiques. Exemples de décisions Les systèmes d'information analytiques Dr A.R. Baba-ali Maitre de conferences USTHB PLAN Le cycle de decision Les composants analytiques ETL (Extract, Transform and Load) Entrepot de (Data warehouse) Traitement

Plus en détail

Annexe. Méthodologie de mise en œuvre d un projet BusinessObjects

Annexe. Méthodologie de mise en œuvre d un projet BusinessObjects Annexe Méthodologie de mise en œuvre d un projet BusinessObjects Déroulement du cours 1 : Le rôle du Designer d Univers 2 : Créer un Univers avec l Assistant 3 : Créer un Univers étape par étape 4 : Enrichir

Plus en détail

La Business Intelligence 01/05/2012. Les Nouvelles Technologies

La Business Intelligence 01/05/2012. Les Nouvelles Technologies 2 La Business Intelligence Les Nouvelles Technologies 3 Une expertise méthodologique pour une intervention optimale sur tous les niveaux du cycle de vie d un projet 4 5 Ils nous font confiance : L ambition

Plus en détail