UNIVERSITÉ MOHAMMED V AGDAL. FACULTÉ DES SCIENCES Rabat THÈSE DE DOCTORAT. Présentée par ELhoussaine ZIYATI Discipline : Sciences de l ingénieur

Dimension: px
Commencer à balayer dès la page:

Download "UNIVERSITÉ MOHAMMED V AGDAL. FACULTÉ DES SCIENCES Rabat THÈSE DE DOCTORAT. Présentée par ELhoussaine ZIYATI Discipline : Sciences de l ingénieur"

Transcription

1 UNIVERSITÉ MOHAMMED V AGDAL FACULTÉ DES SCIENCES Rabat N d ordre 2491 THÈSE DE DOCTORAT Présentée par ELhoussaine ZIYATI Discipline : Sciences de l ingénieur Spécialité : Informatique et Télécommunications Titre : Optimisation de requêtes OLAP en Entrepôts de Données Approche basée sur la fragmentation génétique Soutenue le : 08 Mai 2010 Devant le jury : Président : Driss Aboutajdine, PES, Faculté des Sciences Rabat Examinateurs : O. El Beqqali, PES, Faculté des Sciences de Fès S. Ouatik El Alaoui, PH, Faculté des Sciences de Fès R. Oulad Haj Thami, PES, ENSIAS Rabat S. Mouline, PH, Faculté des Sciences Rabat A. El Qadi, PA, EST de Meknès Faculté des Sciences, 4 Avenue Ibn Battouta B.P RP, Rabat Maroc Tel +212 (05) /35/38, Fax: +212 (05) , 1

2 2

3 Avant propos Les travaux présentés dans ce mémoire ont été effectués au Laboratoire de Recherche en Informatique et Télécommunications, Unité associée au CNRST de la Faculté des Sciences de Rabat Université Mohammed V Agdal, Maroc, Sous la direction du Professeur Driss Aboutajdine. Je tiens à remercier : Mr. Driss Aboutajdine, Professeur à la Faculté des Sciences de Rabat-Université Mohammed V Agdal, pour la confiance qu il m a accordée en m autorisant à mener mes travaux de recherche dans ce laboratoire et d avoir présidé ce jury de thèse et pour l intérêt qu il a manifesté à ce travail en acceptant la charge de suivre de près ces travaux. Je le remercie vivement pour sa disponibilité, son soutien et ses encouragements. Les rapporteurs sur ce travail : Mr. Omar El Beqqali, Professeur à la Faculté des Sciences de Fès, et Mr. Said Ouatik Alaoui, Professeur à la Faculté des Sciences de Fès, pour avoir accepté d être rapporteur, et pour l intérêt qu ils ont manifesté pour ce travail, et pour leurs observations qui ont contribué à améliorer ce mémoire. Mr. Rachid Oulad Haj Thami, Professeur à l ENSIAS, Université Mohammed V Agdal, pour l honneur qu il me fait en faisant partie de ce jury de thèse. Mme Salma Mouline, Professeur à la Faculté des Sciences de Rabat, Université Mohammed V Agdal, pour le grand honneur qu il me fait en participant à ce jury de thèse, et pour ses remarques qui ont permis d améliorer la qualité de ce mémoire. 3

4 Mr. Abderrahim El Qadi, Professeur à l EST de Meknès, encadrant de ma thèse. Je voudrais lui exprimer ma profonde reconnaissance pour l aide qu il m a constamment octroyée tout au long de ce travail. Tous les membres du LRIT, Professeurs et Doctorants, pour leur esprit du groupe. Qu ils trouvent ici le témoignage de toute mon estime et ma sincère sympathie. Il m est enfin agréable d adresser ma profonde gratitude pour tous ceux qui m ont soutenu durant cette thèse, en particulier Mr. Ladjel Bellatreche, Mr. Kamel Boukhalfa et Mr. Hammadi Bouslous. Qu ils veuillent bien trouver ici le témoignage de ma profonde reconnaissance. Mes remerciements vont aussi à tous mes collègues dans les laboratoires LRIT, en particulier, un grand merci à Mounir AIT KERROUM, Rachid SAADANE, Ahmed FAQIHI, pour leurs aides et conseils. Je remercie chaleureusement mes parents mes parent pour leur soutien et pour leurs félicitations lors de mes réussites Enfin merci à ceux que je n ai pu citer mais qui ont toutes mes amitiés et mes remerciements. 4

5 5

6 Table des matières CHAPITRE 1 : ENTREPOT DE DONNEES : MODELES ET TECHNIQUES D OPTIMISATION Introduction Architecture des entrepôts de données Les caractéristiques des entrepôts de données Architecture d un système décisionnel Fouille de données multidimensionnelles Entrepôt et les bases de données relationnelles Les modèles des entrepôts de données La modélisation conceptuelle Concept de fait, de dimension et de hiérarchie Modèles en étoile, en flocon et en constellation La modélisation logique Les techniques d optimisation dans les entrepôts de données Les techniques redondantes Les vues matérialisées Les index Les techniques non redondantes La fragmentation horizontale La fragmentation horizontale dérivée La fragmentation verticale La fragmentation mixte (hybride) Conclusion CHAPITRE 2 : L OPTIMISATION DE L ENTREPOT DE DONNEES Introduction Les vues matérialisées

7 2.1. La sélection des vues Algorithmes sans contraintes Algorithme dans le contexte ROLAP Algorithme dans le contexte MOLAP Algorithmes avec contrainte Contrainte d espace Contrainte du temps de maintenance La maintenance des vues matérialisées La maintenance incrémentale La maintenance autonome La maintenance en temps réel Les fragmentations Fragmentation verticale Principe (problème de la fragmentation verticale) Les algorithmes de la fragmentation verticale Fragmentation horizontale Position du problème Principe de la fragmentation Propriétés de la fragmentation Les algorithmes de la FH Algorithme glouton Algorithme dirigé par contrainte Algorithme basé sur la minimalité et la complétude des prédicats Algorithme dirigé par les affinités des prédicats La fragmentation dérivée Conclusion CHAPITRE 3 : ENTREPOT DE DONNEES ET ALGORITHMES GENETIQUES Introduction

8 2 Concepts et principes des Algorithmes Génétiques Stratégie évolutive Principe de base Codage d individu Génération de la population initiale Evaluation Sélection Croisement Mutation Convergences des algorithmes génétiques Limitations des algorithmes génétiques Application des algorithmes génétiques à l entrepôt de données Processus génétique de la fragmentation horizontale Codage adopté Représentation des fragments horizontaux Sélection des individus Types de croisements Optimisation avec contrainte Mutation Conclusion CHAPITRE 4 : MISE EN ŒUVRE D UN ALGORITHME GENETIQUE POUR LA FRAGMENTATION MIXTE Introduction Présentation de notre approche : nouveau modèle d optimisation avec les AGs Processus génétique de fragmentation mixte Codage d individu Sélection des individus Croisement Mutation

9 Processus d amélioration Caractéristiques de notre algorithme Evaluation globale de l approche sur un benchmark Banc d essai Benchmark Implémentation Pseudo code Chargement de l entrepôt Types de requêtes prises en compte Evaluation Sans pénalisation Avec pénalisation Conclusion Conclusion et perspectives Références

10 Liste des figures Figure 1.1 : L entrepôt de données est la base des systèmes décisionnels Figure 1.2 : Architecture et niveaux d agrégation des données Figure 1.3 : Architecture simplifié d un entrepôt de données Figure 1.4 : La fouille de données et entrepôt de données Figure 1.5 : Application d une technique de datamining Figure 1.6 : Exemple de cube de données (Ventes par ville) Figure 1.7 : Exemple de modélisation en étoile Figure 1.8 : Exemple de modélisation en flocon de neige Figure 1.9 : Exemple de modélisation en constellation Figure 1.10 : Index de projection sur l attribut Age Figure 1.11 : Index de jointure pour l équi-jointure Département.ville = Employé.ville Figure 1.12 : La fragmentation mixte suivant une relation,,, R k Att Att Att Figure 2.1 : Les types de PSV Figure 2.2 : Le processus de sélection des vues matérialisées Figure 2.3 : Principe de base de la sélection de [YLK, 97] Figure 2.4 : Cube de données multidimensionnel Figure 2.5 : Exemple de requête Figure 2.6 : Treillis de vues Figure 2.7 : Schéma d un entrepôt de données Figure 2.8 : Principe général de l algorithme de [HN, 79] Figure 2.9 : Processus de sélection des dimensions Figure 2.10 : Structure de l algorithme glouton Figure 2.11 : Les deux relations R (N.emp, Nom, Fonction) et S (Fonction, Salaire) Figure 3.1 : Principe général des algorithmes génétiques Figure 3.2 : Slicing crossover Figure 3.3 : 3-point slicing Crossover Figure 3.4 : Mutation classique discrète Figure 3.5 : Mutation continue Figure 3.6 : Mutation adaptative Figure 3.7 : Les SDSs des attributs de fragmentation Figure 3.8 : Exemple de représentation de fragments dans le cas de trois attributs Figure 3.9 : Exemple de Mutation Figure 4.1 : Codage de différents individus pour un chromosome vertical (schéma de fragmentation verticale) Figure 4.2 : Croisement suivant la dimension Store Figure 4.3 : Exemple de mutation verticale Figure 4.4 : Schéma de l entrepôt utilisé APB benchmark

11 Figure 4.5 : Architecture du moteur générique Figure 4.6 : Démarche de fragmentation proposée Figure 4.7 : Chargement de l entrepôt de données Figure 4.8 : Fenêtre d exécution d une requête sous Aqua data studio Figure 4.9 : Temps d exécution des requêtes selon deux schémas (fragmenté et non fragmenté) Figure 4.10 : La différence entre la fragmentation mixte proposée et horizontale Figure 4.11 : L impact du nombre de fragments verticaux sur la performance Figure 4.12 : Cout total d exécutions de l ensemble suivant le nombre de partitions Figure 4.13 : Temps de réponse avec et sans pénalité Figure 4.14 : L impact du choix entre les trois modes de pénalité Figure 4.15 : La relation entre le coût total et le type de pénalité Figure 4.16 : Relation entre la valeur et le cout total d exécution Figure 4.17 : Effet du nombre de dimensions sur le coût total d exécution

12 Liste des tableaux Tableau 1.1 : Différences entre SGBD et entrepôt de données Tableau 1.2 : Comparaison des processus OLAP et OLTP Tableau 2.1 : La description de l algorithme [BLT, 86] Tableau 2.2 : Relation Projet Tableau 3.1 : Exemple d individu Tableau 4.1 : Principaux paramètres des différents algorithmes Tableau 4.2 : Taille des tables

13 Liste des algorithmes Algorithme 1 : La sélection des vues selon [YKL, 97] Algorithme 2 : La sélection des vues matérialisées selon [HRU, 96] Algorithme 3 : Algorithme de génération des prédicats complets et simples Algorithme 4 : Algorithme de fragmentation horizontale [OV, 91] Algorithme 5 : Algorithme évolutionnaire typique Algorithme 6 : Algorithme mixte proposé Algorithme 7 : Algorithme de croisement pour la fragmentation verticale Algorithme 8 : Opération de mutation

14 Abréviations SI OLAP OLTP DW AG SGBD(R) MOLAP ROLAP OOLAP PSV SPJ B.E.A AE EPS SDS IOC FS : Système d information : On-Line Analytical Processing : On-Line Transaction Processing : Data Warehouse : Algorithme Génétique : Système de Gestion de Base de données (Relationnel) : Multidimensionnel OLAP : Relational OLAP : Object OLAP : Problème de sélection des vues matérialisées : Sélection, Projection et Jointure : Bond Energy Algorithm : Algorithme Evolutionnaire : Ensemble des prédicats simples : Sous Domaine stable : Input Output Cost : Fragmentation Schème p Sel j F : Facteur de Sélectivité dans la table des faits pour le prédicat p j FV FH FM DM PMEV COM_MIN : Fragmentation verticale : Fragmentation horizontale : Fragmentation mixe : Data Mining : Plan multiple d exécution des vues : Complet et Minimal 14

15 Introduction générale L informatique décisionnelle a connu et connaît aujourd hui encore un essor important. Elle permet l exploitation des données d une organisation dans le but de faciliter la prise de décision. Parmi les objectifs des entrepôts de données (Data Warehouse), la transformation d un système d information (SI) qui avait une vocation de production en SI décisionnel (c est à dire la transformation des données de production en des informations stratégiques). L entrepôt de données est un ensemble de données destinées aux "décideurs", souvent ce sont des données de production avec des valeurs ajoutées (agrégation, intégrées et historisées). C est aussi, un ensemble d'outils permettant de : - regrouper, nettoyer, et intégrer les données, - Établir des requêtes, rapports, et analyses. - Extraire de connaissances (fouille de données) et administration du warehouse. Les SGBDs et DW ont des objectifs qui différent avec des traitements et stockage des données différentes et font l'objet également de requêtes différentes. Les SGBDs sont des systèmes dont le mode de travail est transactionnel (OLTP On-line Transaction Processing), permettant l'insertion, la modification, l interrogation des informations avec efficacité et sécurité. Les deux objectifs principaux sont : en premier lieu la sélection, l ajout, la mise à jour et la suppression des tuples, et en second lieu l exécution de ces opérations. Ces tâches s effectuent très rapidement et simultanément par de nombreux utilisateurs. Les DW sont des systèmes conçus pour l aide à la prise de décision (OLAP On-Line Analytical Processing), fréquemment utilisés en lecture (utilisateurs), avec pour objectifs principaux de regrouper, d organiser les informations provenant de sources diverses, les intégrer et les stocker pour donner à l utilisateur une vue orientée métier, retrouver et analyser l information avec facilité et rapidité. Les entrepôts de données sont souvent modélisés par un schéma en étoile. Ce schéma est caractérisé par une table de faits de très grande taille (allant de quelques Gigaoctets à plusieurs Téraoctets) liée à un ensemble de tables de dimension de plus petite taille. La table des faits contient les clés étrangères des tables de dimension ainsi qu un ensemble de mesures 15

16 collectées durant l activité de l organisation. Les tables de dimension contiennent des données qualitatives qui représentent des axes sur lesquels les mesures ont été collectées. Les requêtes de type OLAP définies sur un schéma en étoile (connues par requêtes de jointure en étoile) sont caractérisées par des opérations de sélection sur les tables de dimension, suivies de jointures avec la table des faits. Aucune jointure n existe entre les tables de dimension. Toute jointure doit passer par la table des faits, ce qui rend le coût d exécution de ces requêtes très important [Inm, 92] [Inm, 95]. Sans technique d optimisation, leur exécution peut prendre des heures, voire des jours. Plusieurs structures d optimisation ont été proposées pour améliorer la performance de ces requêtes. Nous pouvons ainsi citer les vues matérialisées, les index, la fragmentation, le traitement parallèle. Ces techniques peuvent être classées en deux catégories : - Des structures redondantes comme les vues matérialisées et les index du fait qu elles nécessitent un espace de stockage et un coût de rafraîchissement. - Des structures non redondantes comme la fragmentation (horizontale, verticale et hybride) ne nécessitant ni un coût d espace de stockage ni un coût de rafraîchissement. Ces techniques sont largement étudiées et utilisées dans les bases de données traditionnelles (relationnelles et orientées objets), dans le but de réduire le temps d exécution des requêtes. La fragmentation est une technique de conception logique introduite dans les années 80 dans les bases de données réparties [CNP, 82], [CP, 84]. A travers le modèle relationnel, les stratégies de la fragmentation sont décrites : horizontale, verticale et hybride. Les relations étant des tables, il s agit de trouver les différentes manières de diviser cette table en plusieurs petites tables. Le nombre de fragments est le degré de fragmentation défini en fonction des applications destinées à s exécuter sur la base de données. Dans le contexte des entrepôts de données la fragmentation hybride et la fragmentation verticale n ont pas eu le même succès que la fragmentation horizontale. Dans ce contexte, les travaux, présentés dans ce mémoire, constituent une investigation de l optimisation par des techniques de calcul évolutif. Ces méthodes qui s inspirent de métaphores biologiques (programmation génétique, algorithme génétique) offrent la possibilité de trouver des solutions optimales à des problèmes d optimisation globale. Ces techniques de base ont été proposées initialement pour résoudre un type de problème donné. Par conséquent, pour pouvoir mettre en œuvre une telle méthode, 16

17 il est indispensable de l adapter au problème à résoudre. Un bon réglage des paramètres est aussi exigé pour l obtention de bonnes solutions. De ce fait, un des objectifs principaux de ce travail consiste en la conception de nouvelles méthodes hybrides basées sur les Algorithmes Génétiques pour résoudre des problèmes complexes. Ces nouvelles méthodes tentent d'améliorer l'efficacité des algorithmes d'optimisation de base dans le contexte de l entrepôt de données. Par la suite, notre thèse sera articulée autour des points suivants : Dans le premier chapitre, nous précisons le cadre de cette thèse en définissant les concepts de base de l entrepôt de données. Nous effectuons un état de l'art concernant la recherche actuelle dans le domaine de l optimisation dans les entrepôts de données relationnels. Dans le deuxième chapitre, nous présentons les techniques d optimisation des requêtes les plus utilisées dans le contexte de l entrepôt de données. Nous mettons en évidence les problèmes liés à chaque technique, et nous présentons également les principales solutions et les algorithmes proposés dans le contexte de l optimisation des requêtes. Quant au troisième chapitre, il sera consacré à la description de l optimisation génétique et les différentes étapes de ce processus. Nous décrivons, aussi, le processus d évolution qu il induit à travers la structure des différents opérateurs génétiques. Ensuite, Nous rapportons les principaux travaux d application des algorithmes génétiques à l entrepôt de données. Nous illustrons, le processus de fragmentation horizontale basé sur les algorithmes génétiques. Un bilan critique et préliminaire de cette approche est présenté, il sert de cadre de réflexions pour définir de nouvelles perspectives à nos travaux. En ce qui concerne le quatrième chapitre, il présente notre contribution à la mise en œuvre d un modèle hybride de fragmentation génétique. Nous y décrivons notamment nos motivations, caractéristiques fondamentales de l AG d optimisation de requêtes que nous proposons, fonctionnement général, structures et objectifs des opérateurs génétiques proposés. Enfin, On y présente également les résultats d expérimentations réalisées dans le but de valider notre approche d optimisation de requêtes. Cette évaluation a pour but de 17

18 mesurer l efficacité de l algorithme proposé et estimer l impact de chacune de ses caractéristiques sur les résultats de la recherche. En conclusion, nous dressons un bilan de nos travaux, et nous présentons ensuite les horizons d évolution de ces travaux. 18

19 Chapitre 1 : Entrepôt de données : Modèles et techniques d optimisation 1 Introduction Comme cité précédemment, le concept Entrepôt de Données surgit à partir des besoins d analyse des données d une entreprise pour chercher des avantages compétitifs sur la concurrence. Les bases de données des systèmes existants de type «On-Line Transaction Processing» (OLTP) ne sont pas appropriées comme support de ces analyses parce qu elles ont été conçues pour des fonctions spécifiques réalisées dans l entreprise. Donc, les données pertinentes pour faire des analyses se trouvent disséminées entre plusieurs bases. De plus, leur conception vise à améliorer les performances des systèmes OLTP par rapport au traitement d un grand nombre de transactions de mise à jour, ce qui complique l interrogation. Nous présentons dans ce chapitre un état de l art portant sur l architecture, et les différents modèles de conception des entrepôts de données. Enfin, nous décrivons les principales techniques d optimisation utilisées qui ont été suggérés dans la littérature pour améliorer les performances des entrepôts de données. 2 Architecture des entrepôts de données L entrepôt de données joue un rôle stratégique dans la vie d une entreprise. Il stocke des données pertinentes aux besoins de prise de décision en provenance des systèmes opérationnels de l entreprise et d autres sources externes Les caractéristiques des entrepôts de données Un entrepôt de données, par contre, offre des données intégrées, consolidées et historisées pour faire des analyses (figure 1.1). Il s agit d une collection de données pour le support d un processus d aide à la décision. Les données d un entrepôt possèdent les caractéristiques suivantes : Orientation sujet : Les données d un entrepôt s organisent par sujets ou thèmes. Cette organisation permet de rassembler toutes les données, pertinentes à un sujet et nécessaires aux besoins d analyse, qui se trouvent répandues à travers les structures fonctionnelles d une entreprise. 19

20 Intégration : Les données d un entrepôt sont le résultat de l intégration de données en provenance de multiples sources ; ainsi, toutes les données nécessaires pour réaliser une analyse particulière se trouvent dans l entrepôt. L intégration est le résultat d un processus qui peut devenir très complexe du à l hétérogénéité des sources. Histoire : Les données d un entrepôt représentent l activité d une entreprise pendant une longue période ou il est important de gérer les différentes valeurs qu une donnée prises au cours du temps. Cette caractéristique donne la possibilité de suivre une donnée dans le temps pour analyser ses variations. Non-volatilité : les données chargées dans l entrepôt sont surtout utilisées en interrogation et ne peuvent pas être modifiées, sauf dans certains cas de rafraîchissement. Figure 1.1 : L entrepôt de données est la base des systèmes décisionnels 2.2. Architecture d un système décisionnel Les données d un entrepôt se trouvent selon deux axes : synthétique et historique (figure 1.2). L axe synthétique établit une hiérarchie d agrégation et comprend les données détaillées (qui représentent les événements les plus récents au bas de la hiérarchie), les données agrégées (qui synthétisent les données détaillées) et les données fortement agrégées (qui synthétisent à un niveau supérieur les données agrégées) [ECM, 99]. L axe historique comprend les données détaillées historiées, qui représentent des événements passés. Les Méta-données contiennent des informations concernant les données dans l entrepôt de données, telle que leur provenance et leur structure, ainsi que les méthodes utilisées pour faire l agrégation. 20

21 Figure 1.2 : Architecture et niveaux d agrégation des données. Dans la figure1.3 nous présentons une architecture simplifiée d un entrepôt [DG, 01]. Les différents composants ont été intégrés dans trois parties : les sources de données, l entrepôt et les outils existants dans le marché. Figure 1.3 : Architecture simplifié d un entrepôt de données a) Les sources : Les données de l entrepôt sont extraites de diverses sources souvent réparties et hétérogènes, et qui doivent être transformées avant leur stockage dans l entrepôt. Nous avons deux types de sources des données : internes et externes à l organisation. 21

22 Internes : La plupart des données sont saisies à partir des différents systèmes de production qui rassemblent les divers SGBD opérationnels, ainsi que des anciens systèmes de production qui contiennent des données encore exploitées par l entreprise. Externes : Ils représentent des données externes à l entreprise et qui sont souvent achetées. Par exemple, les sources de données démographiques. b) L entrepôt de données : Il existe plusieurs types de données dans un entrepôt, qui correspondent à diverses utilisations, comme : Données de détail courantes : Ce sont l ensemble des données quotidiennes et plus couramment utilisées. Ces données sont généralement stockées sur le disque pour avoir un accès rapide. Par exemple, le détail des ventes de l année en cours, dans les différents magasins. Données de détail anciennes : Ce sont des données quotidiennes concernant des événements passés, comme par exemple le détail des ventes des deux dernières années. Nous les utilisons pour arriver à l analyse des tendances ou des requêtes prévisionnelles. Néanmoins ces données sont plus rarement utilisées que les précédentes, et elles sont souvent stockées sur des mémoires d archives. Données résumées ou agrégées : Ce sont des données moins détaillées que les deux premières et elles permettent de réduire le volume des données à stocker. Le type de données, en fonction de leur niveau de détail, permet de les classifier comme des données légèrement ou fortement résumées. Par exemple, les ventes mensuelles par magasin des dix dernières années sont des données faiblement résumées, tandis que les ventes semestrielles, par région, des dix dernières années sont fortement résumées. Les méta-données : Ce sont des données essentielles pour parvenir à une exploitation efficace du contenu d un entrepôt. Elles représentent des informations nécessaires à l accès et l exploitation des données dans l entrepôt comme : la sémantique (leur signification), l origine (leur provenance), les règles d agrégation (leur périmètre), le stockage (leur format, par exemple : francs, euro,...) et finalement l utilisation (par quels programmes sont-elles utilisées). 22

23 c) Outils : Il existe sur le marché différents outils pour l aide à la décision, comme les outils de fouille de données (pour découvrir des liens sémantiques), outils d analyse en ligne (pour la synthèse et l analyse des données multidimensionnelles), outils d interrogation (pour faciliter l accès aux données en fournissant une interface conviviale au langage de requêtes),... [CD, 97], [DG, 01] Fouille de données multidimensionnelles L extraction de connaissances dans les bases de données désigne le processus d extraction d informations précédemment inconnues et potentiellement utiles concernant les données stockées dans les bases de données (figure 1.4) [PS, 91]. L analyse par exemple des transactions de vente d un supermarché permettra d étudier les habitudes des clients, en fonction de quoi il sera possible de réorganiser les rayons afin d améliorer les ventes. Figure 1.4 : La fouille de données et entrepôt de données Les données d entrepôts enregistrées sont subies à une opération d orpaillage où datamining qui est par définition la recherche de la connaissance. Il existe plusieurs techniques d orpaillage, telle que les algorithmes génétiques, l induction d arbres de décision et les réseaux de neurones. La figure 1.5 montre l application d une technique d orpaillage à un ensemble de données. Dans ce cas, il s agit d induire, à partir de n-uplets en entrée, un modèle de classification sous la forme d un arbre de décision. L algorithme appliqué a conduit un arbre dont l attribut le plus important pour distinguer un n-uplet d un autre est PRODUIT et dans un deuxième niveau, MAGAZIN. Dans cette figure, il est possible d observer que, quelque soit la localisation du magasin et l année, la vente des TV est élevée. En revanche, la vente de radio dépend de la localisation du magasin. 23

24 Figure 1.5 : Application d une technique de datamining 2.4. Entrepôt et les bases de données relationnelles Dans l environnement des entrepôts de données, les opérations, l organisation des données, les critères de performance, la gestion des méta-données, la gestion des transactions et le processus de requêtes sont très différents des systèmes de bases de données opérationnels. Par conséquent, les SGBDR orientés vers l environnement opérationnel, ne peuvent pas être directement transplantés dans un système d entrepôt de données [WMB, 97]. Les SGBDs ont été créés pour gérer de grands volumes d information contenus dans les différents systèmes opérationnels qui appartiennent à l entreprise. Ces données sont manipulées en utilisant des processus transactionnels en ligne [Cod, 93]. Par contre, les entrepôts de données ont été conçus pour l aide à la prise de décision. Ils intègrent les informations qui ont pour objectif de fournir une vue globale de l information aux analystes et aux décideurs. Parallèlement à l exploitation de l information contenue dans ces systèmes opérationnels, les dirigeants des entreprises ont besoin d avoir une vision globale concernant toute cette information pour faire des calculs prévisionnels, des statistiques ou pour établir des stratégies de développement et d analyses des tendances. Le tableau 1.1 résume ces différences entre les systèmes de gestion de bases de données et les entrepôts de données [DG, 01]. 24

25 SGBD Entrepôt de données Objectifs Gestion et production Consultation et analyse Utilisateurs Gestionnaire de production Décideurs, analystes Taille de la base Plusieurs Gigaoctets Plusieurs Téraoctets Organisation de données Par traitement Par métier Types de données Données de gestion (courantes) Données d analyses (résumées, historisées) Requêtes Simples, prédéterminées, Données détaillées Complexes, spécifiques Agrégations et group by Tableau 1.1 : Différences entre SGBD et entrepôt de données La conception ou la modélisation d un entrepôt est très différente de celle des bases de données des systèmes de type OLTP, parce qu il faut penser en terme de concepts plus ouverts et plus difficiles à définir. De plus, les besoins des utilisateurs de l entrepôt ne sont pas clairs que ceux des utilisateurs des systèmes OLTP. Les bases de données de type OLTP (On-Line Transaction Processing) permettent de gérer des données variées et de réaliser des transactions sur ces données (lectures, mises à jour, etc.). La fouille de données a une forte relation avec OLAP, dont les objectifs sont similaires, mais il faut cependant souligner une différence essentielle (tableau 1.2). OLAP traite les données, alors que le Datamining vise également à extraire des connaissances de ces données. Le tableau 1.2 compare les caractéristiques des processus OLTP et OLAP. 25

Entrepôt de données 1. Introduction

Entrepôt de données 1. Introduction Entrepôt de données 1 (data warehouse) Introduction 1 Présentation Le concept d entrepôt de données a été formalisé pour la première fois en 1990 par Bill Inmon. Il s agissait de constituer une base de

Plus en détail

et les Systèmes Multidimensionnels

et les Systèmes Multidimensionnels Le Data Warehouse et les Systèmes Multidimensionnels 1 1. Définition d un Datawarehouse (DW) Le Datawarehouse est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées

Plus en détail

Techniques d optimisation des requêtes dans les data warehouses

Techniques d optimisation des requêtes dans les data warehouses Techniques d optimisation des requêtes dans les data warehouses Ladjel Bellatreche LISI/ENSMA Téléport2-1, Avenue Clément Ader 86960 Futuroscope - FRANCE bellatreche@ensma.fr Résumé Un entrepôt de données

Plus en détail

MEMOIRE MAGISTER ECOLE DOCTORALE D INFORMATIQUE (STIC) THEME

MEMOIRE MAGISTER ECOLE DOCTORALE D INFORMATIQUE (STIC) THEME MINISTERE DE L ENSEIGNEMENT SUPERIEUR ET DE LA RECHERCHE SCIENTIFIQUE UNIVERSITE FERHAT ABBAS SETIF UFAS (ALGERIE) MEMOIRE Présenté à la Faculté des Sciences de l Ingénieur Département de l informatique

Plus en détail

Entrepôts de données. NEGRE Elsa Université Paris-Dauphine 2015-2016

Entrepôts de données. NEGRE Elsa Université Paris-Dauphine 2015-2016 Entrepôts de données NEGRE Elsa Université Paris-Dauphine 2015-2016 Contexte et problématique Le processus de prise de décision L entrepôt de données Définition Différence avec un SGBD Caractéristiques

Plus en détail

THESE. Pour l obtention du Grade de. Ecole Doctorale : Sciences pour l Ingénieur et Aéronautique. Secteur de Recherche : Informatique et Applications

THESE. Pour l obtention du Grade de. Ecole Doctorale : Sciences pour l Ingénieur et Aéronautique. Secteur de Recherche : Informatique et Applications THESE Pour l obtention du Grade de DOCTEUR DE L ECOLE NATIONALE SUPERIEURE DE MECANIQUE ET D AEROTECHNIQUE (Diplôme national-arrêté du 7 août 2006) Ecole Doctorale : Sciences pour l Ingénieur et Aéronautique

Plus en détail

Entreposage, analyse en ligne et fouille de données

Entreposage, analyse en ligne et fouille de données Entreposage, analyse en ligne et fouille de données Houssem Jerbi IRIT - SIG/ED jerbi@irit.fr Journée COMPIL " Bases de Données" 14/12/2010 PLAN Introduction Bases de données Entrepôt de données Technologie

Plus en détail

Le "tout fichier" Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique

Le tout fichier Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique Introduction à l informatique : Information automatisée Le premier ordinateur Définition disque dure, mémoire, carte mémoire, carte mère etc Architecture d un ordinateur Les constructeurs leader du marché

Plus en détail

Plan. Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation

Plan. Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation Data WareHouse Plan Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation 2 Présentation Besoin: prise de décisions

Plus en détail

Business Intelligence : Informatique Décisionnelle

Business Intelligence : Informatique Décisionnelle Business Intelligence : Informatique Décisionnelle On appelle «aide à la décision», «décisionnel», ou encore «business intelligence», un ensemble de solutions informatiques permettant l analyse des données

Plus en détail

Informatique Décisionnelle pour l environnement

Informatique Décisionnelle pour l environnement Territoires, Environnement, Télédétection et Information Spatiale Unité mixte de recherche AgroParisTech - Cirad - Irstea Informatique Décisionnelle pour l environnement Principe, architecture informatique

Plus en détail

Ministère de l Enseignement Supérieur et de la Recherche Scientifique. Ecole nationale Supérieure d Informatique (ESI) (Oued Semar, Alger) Mémoire

Ministère de l Enseignement Supérieur et de la Recherche Scientifique. Ecole nationale Supérieure d Informatique (ESI) (Oued Semar, Alger) Mémoire Ministère de l Enseignement Supérieur et de la Recherche Scientifique Ecole nationale Supérieure d Informatique (ESI) (Oued Semar, Alger) École Doctorale Sciences et Technologies de l'information et de

Plus en détail

Généralités sur les bases de données

Généralités sur les bases de données Généralités sur les bases de données Qu est-ce donc qu une base de données? Que peut-on attendre d un système de gestion de bases de données? Que peut-on faire avec une base de données? 1 Des données?

Plus en détail

Les Entrepôts de Données

Les Entrepôts de Données Les Entrepôts de Données Grégory Bonnet Abdel-Illah Mouaddib GREYC Dépt Dépt informatique :: GREYC Dépt Dépt informatique :: Cours Cours SIR SIR Systèmes d information décisionnels Nouvelles générations

Plus en détail

CARTE HEURISTIQUE...1 LA CHAÎNE DÉCISIONNELLE...2. Collecte des données...2 Stockage des Données...3 Exploitation des Données...4 OLTP ET OLAP...

CARTE HEURISTIQUE...1 LA CHAÎNE DÉCISIONNELLE...2. Collecte des données...2 Stockage des Données...3 Exploitation des Données...4 OLTP ET OLAP... Table des matières CARTE HEURISTIQUE...1 LA CHAÎNE DÉCISIONNELLE...2 Collecte des données...2 Stockage des Données...3 Exploitation des Données...4 OLTP ET OLAP...6 OPÉRATIONS SUR LES CUBES...7 Exemple

Plus en détail

Bases de Données Avancées

Bases de Données Avancées 1/26 Bases de Données Avancées DataWareHouse Thierry Hamon Bureau H202 - Institut Galilée Tél. : 33 1.48.38.35.53 Bureau 150 LIM&BIO EA 3969 Université Paris 13 - UFR Léonard de Vinci 74, rue Marcel Cachin,

Plus en détail

Datawarehouse: Cubes OLAP. Marlyse Dieungang Khaoula Ghilani

Datawarehouse: Cubes OLAP. Marlyse Dieungang Khaoula Ghilani Datawarehouse: Cubes OLAP Marlyse Dieungang Khaoula Ghilani Table des matières 1 Data Warehouse 3 1.1 Introduction............................ 3 1.1.1 Définition......................... 3 1.1.2 Architecture........................

Plus en détail

Bases de Données. Plan

Bases de Données. Plan Université Mohammed V- Agdal Ecole Mohammadia d'ingénieurs Rabat Bases de Données Mr N.EL FADDOULI 2014-2015 Plan Généralités: Définition de Bases de Données Le modèle relationnel Algèbre relationnelle

Plus en détail

Chapitre IX. L intégration de données. Les entrepôts de données (Data Warehouses) Motivation. Le problème

Chapitre IX. L intégration de données. Les entrepôts de données (Data Warehouses) Motivation. Le problème Chapitre IX L intégration de données Le problème De façon très générale, le problème de l intégration de données (data integration) est de permettre un accès cohérent à des données d origine, de structuration

Plus en détail

Base de données en mémoire

Base de données en mémoire Base de données en mémoire Plan Bases de données relationnelles OnLine Analytical Processing Difficultés de l OLAP Calculs en mémoire Optimisations 1 Base de données relationnelle Introduction Date Exemple

Plus en détail

Introduction à la B.I. Avec SQL Server 2008

Introduction à la B.I. Avec SQL Server 2008 Introduction à la B.I. Avec SQL Server 2008 Version 1.0 VALENTIN Pauline 2 Introduction à la B.I. avec SQL Server 2008 Sommaire 1 Présentation de la B.I. et SQL Server 2008... 3 1.1 Présentation rapide

Plus en détail

Bases de données multidimensionnelles OLAP. OnLine Analytical Processing

Bases de données multidimensionnelles OLAP. OnLine Analytical Processing Bases de données multidimensionnelles OLAP OnLine Analytical Processing OLAP OLAP (On Line Analytical Processing): Ensemble des outils nécessaires pour la mise en place d'un Système d'information décisionnel

Plus en détail

Chapitre 1 : Introduction aux bases de données

Chapitre 1 : Introduction aux bases de données Chapitre 1 : Introduction aux bases de données Les Bases de Données occupent aujourd'hui une place de plus en plus importante dans les systèmes informatiques. Les Systèmes de Gestion de Bases de Données

Plus en détail

Chapitre 9 : Informatique décisionnelle

Chapitre 9 : Informatique décisionnelle Chapitre 9 : Informatique décisionnelle Sommaire Introduction... 3 Définition... 3 Les domaines d application de l informatique décisionnelle... 4 Architecture d un système décisionnel... 5 L outil Oracle

Plus en détail

REPUBLIQUE ALGERIENNE DEMOCRATIQUE ET POPULAIRE MINISTERE DE L ENSEIGNEMENT SUPERIEUR ET DE LA RECHERCHE SCIENTIFIQUE UNIVERSITE D ORAN ES-SENIA

REPUBLIQUE ALGERIENNE DEMOCRATIQUE ET POPULAIRE MINISTERE DE L ENSEIGNEMENT SUPERIEUR ET DE LA RECHERCHE SCIENTIFIQUE UNIVERSITE D ORAN ES-SENIA REPUBLIQUE ALGERIENNE DEMOCRATIQUE ET POPULAIRE MINISTERE DE L ENSEIGNEMENT SUPERIEUR ET DE LA RECHERCHE SCIENTIFIQUE UNIVERSITE D ORAN ES-SENIA FACULTE DES SCIENCES DEPARTEMENT D INFORMATIQUE MEMOIRE

Plus en détail

Bases de données multidimensionnelles et mise en œuvre dans Oracle

Bases de données multidimensionnelles et mise en œuvre dans Oracle Bases de données multidimensionnelles et mise en œuvre dans Oracle 1 Introduction et Description générale Les bases de données relationnelles sont très performantes pour les systèmes opérationnels (ou

Plus en détail

Intégration de données hétérogènes et réparties. Anne Doucet Anne.Doucet@lip6.fr

Intégration de données hétérogènes et réparties. Anne Doucet Anne.Doucet@lip6.fr Intégration de données hétérogènes et réparties Anne Doucet Anne.Doucet@lip6.fr 1 Plan Intégration de données Architectures d intégration Approche matérialisée Approche virtuelle Médiateurs Conception

Plus en détail

Techniques Data Mining pour la sélection d une configuration d index de jointure binaire

Techniques Data Mining pour la sélection d une configuration d index de jointure binaire Faculté des Sciences Tidjani HADDAM Département de l Informatique Mémoire Pour l obtention du diplôme de MASTER Spécialité : Informatique Option : Modèles Intélligents et Décision (MID) THÈME Techniques

Plus en détail

ETL Extract - Transform - Load

ETL Extract - Transform - Load ETL Extract - Transform - Load Concept général d analyse en ligne (rappels) Rémy Choquet - Université Lyon 2 - Master 2 IIDEE - 2006-2007 Plan Définitions La place d OLAP dans une entreprise OLAP versus

Plus en détail

Circuits électroniques au service de l'optimisation multi-requêtes

Circuits électroniques au service de l'optimisation multi-requêtes Ecole Nationale de Mécanique et d Aérotechnique Laboratoire d Informatique et d Automatique pour les Systèmes Circuits électroniques au service de l'optimisation multi-requêtes Ahcène BOUKORCA Sous la

Plus en détail

Un modèle multidimensionnel pour un processus d analyse en ligne de résumés flous

Un modèle multidimensionnel pour un processus d analyse en ligne de résumés flous Un modèle multidimensionnel pour un processus d analyse en ligne de résumés flous Lamiaa Naoum To cite this version: Lamiaa Naoum. Un modèle multidimensionnel pour un processus d analyse en ligne de résumés

Plus en détail

Etude de faisabilité visant à mettre en place un entrepôt de données sur les données de l IFN. Analyser et Explorer avec une grande interactivité

Etude de faisabilité visant à mettre en place un entrepôt de données sur les données de l IFN. Analyser et Explorer avec une grande interactivité Établissement chargé de réaliser l inventaire permanent du patrimoine forestier sur tout le territoire métropolitain indépendamment de toute question de propriété. Parmi ces objectifs: Connaissance de

Plus en détail

Ministère de l Enseignement Supérieur et de la Recherche Scientifique Ecole nationale Supérieure d Informatique (E.S.I) Oued-Smar Alger.

Ministère de l Enseignement Supérieur et de la Recherche Scientifique Ecole nationale Supérieure d Informatique (E.S.I) Oued-Smar Alger. Ministère de l Enseignement Supérieur et de la Recherche Scientifique Ecole nationale Supérieure d Informatique (E.S.I) Oued-Smar Alger École Doctorale Sciences et Technologies de l'information et de la

Plus en détail

Un datawarehouse est un entrepôt de données (une base de données) qui se caractérise par des données :

Un datawarehouse est un entrepôt de données (une base de données) qui se caractérise par des données : Page 1 of 6 Entrepôt de données Un article de Wikipédia, l'encyclopédie libre. L'entrepôt de données, ou datawarehouse, est un concept spécifique de l'informatique décisionnelle, issu du constat suivant

Plus en détail

Modélisation multidimensionnelle des données complexes : application aux données médicales

Modélisation multidimensionnelle des données complexes : application aux données médicales Modélisation multidimensionnelle des données complexes : application aux données médicales Sommaire : Midouni Sid Ahmed Djallal Version 9 08/06/05 1. Introduction... 3 2. Etat de l art... 4 3. Modélisation

Plus en détail

Les principaux domaines de l informatique

Les principaux domaines de l informatique Les principaux domaines de l informatique... abordés dans le cadre de ce cours: La Programmation Les Systèmes d Exploitation Les Systèmes d Information La Conception d Interfaces Le Calcul Scientifique

Plus en détail

Business & High Technology

Business & High Technology UNIVERSITE DE TUNIS INSTITUT SUPERIEUR DE GESTION DE TUNIS Département : Informatique Business & High Technology Chapitre 8 : ID : Informatique Décisionnelle BI : Business Intelligence Sommaire Introduction...

Plus en détail

Les entrepôts de données

Les entrepôts de données Les entrepôts de données Lydie Soler Janvier 2008 U.F.R. d informatique Document diffusé sous licence Creative Commons by-nc-nd (http://creativecommons.org/licenses/by-nc-nd/2.0/fr/) 1 Plan Introduction

Plus en détail

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation Base de données S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Présentation du module Contenu général Notion de bases de données Fondements / Conception Utilisation :

Plus en détail

Cours Base de données relationnelles. M. Boughanem, IUP STRI

Cours Base de données relationnelles. M. Boughanem, IUP STRI Cours Base de données relationnelles 1 Plan 1. Notions de base 2. Modèle relationnel 3. SQL 2 Notions de base (1) Définition intuitive : une base de données est un ensemble d informations, (fichiers),

Plus en détail

Urbanisation des SI-NFE107

Urbanisation des SI-NFE107 OLAP Urbanisation des SI-NFE107 Fiche de lecture Karim SEKRI 20/01/2009 OLAP 1 Introduction PLAN OLAP Les différentes technologies OLAP Plate formes et Outils 20/01/2009 OLAP 2 Informatique décisionnelle

Plus en détail

Présentation du module Base de données spatio-temporelles

Présentation du module Base de données spatio-temporelles Présentation du module Base de données spatio-temporelles S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Partie 1 : Notion de bases de données (12,5h ) Enjeux et principes

Plus en détail

Introduction à l Informatique Décisionnelle - Business Intelligence (7)

Introduction à l Informatique Décisionnelle - Business Intelligence (7) Introduction à l Informatique Décisionnelle - Business Intelligence (7) Bernard ESPINASSE Professeur à Aix-Marseille Université (AMU) Ecole Polytechnique Universitaire de Marseille Septembre 2013 Emergence

Plus en détail

Méthodologie de conceptualisation BI

Méthodologie de conceptualisation BI Méthodologie de conceptualisation BI Business Intelligence (BI) La Business intelligence est un outil décisionnel incontournable à la gestion stratégique et quotidienne des entités. Il fournit de l information

Plus en détail

LES ENTREPOTS DE DONNEES

LES ENTREPOTS DE DONNEES Module B4 : Projet des Systèmes d information Lille, le 25 mars 2002 LES ENTREPOTS DE DONNEES Problématique : Pour capitaliser ses informations, une entreprise doit-elle commencer par mettre en œuvre des

Plus en détail

Les Entrepôts de Données. (Data Warehouses)

Les Entrepôts de Données. (Data Warehouses) Les Entrepôts de Données (Data Warehouses) Pr. Omar Boussaid Département d'informatique et de Sta5s5que Université Lyon2 - France Les Entrepôts de Données 1. Généralités, sur le décisionnel 2. L'entreposage

Plus en détail

Théories de la Business Intelligence

Théories de la Business Intelligence 25 Chapitre 2 Théories de la Business Intelligence 1. Architectures des systèmes décisionnels Théories de la Business Intelligence Depuis les premières requêtes sur les sources de données OLTP consolidées

Plus en détail

Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP)

Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP) Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP) Définition (G. Gardarin) Entrepôt : ensemble de données historisées variant

Plus en détail

F. Opérations multidimensionnelles

F. Opérations multidimensionnelles F. Opérations multidimensionnelles Roll up (drill-up)/drill down (roll down) Roll up (drill-up) : résumer, agréger des données en montant dans une hiérachie ou en oubliant une dimension Drill down (roll

Plus en détail

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles) SGBDR Systèmes de Gestion de Bases de Données (Relationnelles) Plan Approches Les tâches du SGBD Les transactions Approche 1 Systèmes traditionnels basés sur des fichiers Application 1 Gestion clients

Plus en détail

Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours

Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours Information du cours Informatique décisionnelle et data mining www.lia.univ-avignon.fr/chercheurs/torres/cours/dm Juan-Manuel Torres juan-manuel.torres@univ-avignon.fr LIA/Université d Avignon Cours/TP

Plus en détail

PLAN. Les systèmes d'information analytiques. Exemples de décisions

PLAN. Les systèmes d'information analytiques. Exemples de décisions Les systèmes d'information analytiques Dr A.R. Baba-ali Maitre de conferences USTHB PLAN Le cycle de decision Les composants analytiques ETL (Extract, Transform and Load) Entrepot de (Data warehouse) Traitement

Plus en détail

Concevoir et déployer un data warehouse

Concevoir et déployer un data warehouse Concevoir et déployer un data warehouse Ralph Kimball Éditions Eyrolles ISBN : 2-212-09165-6 2000 2 Le cycle de vie dimensionnel Avant d étudier de plus près les spécificités de la conception, du développement

Plus en détail

Bases de Données. Stella MARC-ZWECKER. stella@unistra.u-strasbg.fr. Maître de conférences Dpt. Informatique - UdS

Bases de Données. Stella MARC-ZWECKER. stella@unistra.u-strasbg.fr. Maître de conférences Dpt. Informatique - UdS Bases de Données Stella MARC-ZWECKER Maître de conférences Dpt. Informatique - UdS stella@unistra.u-strasbg.fr 1 Plan du cours 1. Introduction aux BD et aux SGBD Objectifs, fonctionnalités et évolutions

Plus en détail

Principes et mise en œuvre du modèle OLAP. -1 ère Partie- La modélisation multidimensionnelle

Principes et mise en œuvre du modèle OLAP. -1 ère Partie- La modélisation multidimensionnelle Principes et mise en œuvre du modèle OLAP -1 ère Partie- La modélisation multidimensionnelle 1 Le modèle multidimensionnel (1) Le modèle multidimensionnel est bien adapté pour représenter des données qui

Plus en détail

Datawarehousing and OLAP

Datawarehousing and OLAP Datawarehousing and OLAP Datawarehousing Syllabus, materials, notes, etc. See http://www.info.univ-tours.fr/ marcel/dw.html today introduction definition data integration model Introduction introduction

Plus en détail

BI = Business Intelligence Master Data-ScienceCours 3 - Data

BI = Business Intelligence Master Data-ScienceCours 3 - Data BI = Business Intelligence Master Data-Science Cours 3 - Datawarehouse UPMC 8 février 2015 Rappel L Informatique Décisionnelle (ID), en anglais Business Intelligence (BI), est l informatique à l usage

Plus en détail

INF 1250 INTRODUCTION AUX BASES DE DONNÉES. Guide d étude

INF 1250 INTRODUCTION AUX BASES DE DONNÉES. Guide d étude INF 1250 INTRODUCTION AUX BASES DE DONNÉES Guide d étude Sous la direction de Olga Mariño Télé-université Montréal (Québec) 2011 INF 1250 Introduction aux bases de données 2 INTRODUCTION Le Guide d étude

Plus en détail

Collabora'on IRISA/INRA sur le transfert de nitrates et l améliora'on de la qualité des eaux des bassins versants:

Collabora'on IRISA/INRA sur le transfert de nitrates et l améliora'on de la qualité des eaux des bassins versants: Collabora'on IRISA/INRA sur le transfert de nitrates et l améliora'on de la qualité des eaux des bassins versants: Tassadit BOUADI 22 Juin 2010, Saint Jacut 1 Plan Introduc

Plus en détail

SQL Server 2014 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services, Power BI...)

SQL Server 2014 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services, Power BI...) Avant-propos 1. À qui s'adresse ce livre? 15 2. Pré-requis 15 3. Objectifs du livre 16 4. Notations 17 Introduction à la Business Intelligence 1. Du transactionnel au décisionnel 19 2. Business Intelligence

Plus en détail

Mémoire. En vue de l obtention du diplôme de Magister en Informatique. Option : SIC (Systèmes d Information et de Connaissances)

Mémoire. En vue de l obtention du diplôme de Magister en Informatique. Option : SIC (Systèmes d Information et de Connaissances) République Algérienne Démocratique et Populaire Ministère de l Enseignement Supérieur et de la Recherche Scientifique E.S.I (Ecole nationale Supérieure d Informatique) (ex. INI) Mémoire En vue de l obtention

Plus en détail

basée sur le cours de Bertrand Legal, maître de conférences à l ENSEIRB www.enseirb.fr/~legal Olivier Augereau Formation UML

basée sur le cours de Bertrand Legal, maître de conférences à l ENSEIRB www.enseirb.fr/~legal Olivier Augereau Formation UML basée sur le cours de Bertrand Legal, maître de conférences à l ENSEIRB www.enseirb.fr/~legal Olivier Augereau Formation UML http://olivier-augereau.com Sommaire Introduction I) Les bases II) Les diagrammes

Plus en détail

Plan. Ce qu est le datawarehouse? Un modèle multidimensionnel. Architecture d un datawarehouse. Implémentation d un datawarehouse

Plan. Ce qu est le datawarehouse? Un modèle multidimensionnel. Architecture d un datawarehouse. Implémentation d un datawarehouse Datawarehouse 1 Plan Ce qu est le datawarehouse? Un modèle multidimensionnel Architecture d un datawarehouse Implémentation d un datawarehouse Autres développements de la technologie data cube 2 Ce qu

Plus en détail

10 Intégration de données sur le web

10 Intégration de données sur le web 10 Intégration de données sur le web 240 Requête utilisateur : Où est-ce que je peux voir les films qui ont participé au dernier Festival de Cannes? Je voudrais les résumés et critiques des films de Pedro

Plus en détail

INTERSYSTEMS CACHÉ COMME ALTERNATIVE AUX BASES DE DONNÉES RÉSIDENTES EN MÉMOIRE

INTERSYSTEMS CACHÉ COMME ALTERNATIVE AUX BASES DE DONNÉES RÉSIDENTES EN MÉMOIRE I N T E RS Y S T E M S INTERSYSTEMS CACHÉ COMME ALTERNATIVE AUX BASES DE DONNÉES RÉSIDENTES EN MÉMOIRE David Kaaret InterSystems Corporation INTERSySTEMS CAChé CoMME ALTERNATIvE AUx BASES de données RéSIdENTES

Plus en détail

FreeAnalysis. Schema Designer. Cubes

FreeAnalysis. Schema Designer. Cubes FreeAnalysis Schema Designer Cubes Charles Martin et Patrick Beaucamp BPM Conseil Contact : charles.martin@bpm-conseil.com, patrick.beaucamp@bpm-conseil.com Janvier 2013 Document : BPM_Vanilla_FreeAnalysisSchemaDesigner_v4.2_FR.odt

Plus en détail

UNE DÉMARCHE D ANALYSE À BASE DE PATRONS POUR LA DÉCOUVERTE DES BESOINS MÉTIER D UN SID

UNE DÉMARCHE D ANALYSE À BASE DE PATRONS POUR LA DÉCOUVERTE DES BESOINS MÉTIER D UN SID 1 UNE DÉMARCHE D ANALYSE À BASE DE PATRONS POUR LA DÉCOUVERTE DES BESOINS MÉTIER D UN SID 31 janvier 2012 Bordeaux Présentée par :Mme SABRI Aziza Encadrée par : Mme KJIRI Laila Plan 2 Contexte Problématique

Plus en détail

Objectif. Participant. Prérequis. Oracle BI Suite EE 10g R3 - Développer des référentiels. 5 Jours [35 Heures]

Objectif. Participant. Prérequis. Oracle BI Suite EE 10g R3 - Développer des référentiels. 5 Jours [35 Heures] Objectif Utiliser les techniques de gestion de la mise en cache pour contrôler et améliorer les performances des requêtes Définir des mesures simples et des mesures calculées pour une table de faits Créer

Plus en détail

Construction d'un entrepôt de métadonnées - LOM Application: E-learning

Construction d'un entrepôt de métadonnées - LOM Application: E-learning Construction d'un entrepôt de métadonnées - LOM Application: E-learning Nawel Iles, Azzeddine Chikh, Sidi Mohammed Chouiti Faculté des sciences de l ingénieur Université de Tlemcen Algérie (n_iles/ az_chikh

Plus en détail

OptAssist : outil d assistance pour l optimisation des entrepôts de données relationnels

OptAssist : outil d assistance pour l optimisation des entrepôts de données relationnels OptAssist : outil d assistance pour l optimisation des entrepôts de données relationnels Kamel Boukhalfa 1, Ladjel Bellatreche 2, and Zaia Alimazighi 1 1 USTHB University - Algiers - Algeria boukhalk@ensma.fr,

Plus en détail

Module BDR Master d Informatique (SAR)

Module BDR Master d Informatique (SAR) Module BDR Master d Informatique (SAR) Cours 6- Bases de données réparties Anne Doucet Anne.Doucet@lip6.fr 1 Bases de Données Réparties Définition Conception Décomposition Fragmentation horizontale et

Plus en détail

SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...)

SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...) Avant-propos 1. À qui s'adresse ce livre? 15 2. Pré-requis 15 3. Objectifs du livre 16 4. Notations 17 Introduction à la Business Intelligence 1. Du transactionnel au décisionnel 19 2. Business Intelligence

Plus en détail

MODELISATION UN ATELIER DE MODELISATION «RATIONAL ROSE»

MODELISATION UN ATELIER DE MODELISATION «RATIONAL ROSE» MODELISATION UN ATELIER DE MODELISATION «RATIONAL ROSE» Du cours Modélisation Semi -Formelle de Système d Information Du Professeur Jean-Pierre GIRAUDIN Décembre. 2002 1 Table de matière Partie 1...2 1.1

Plus en détail

et les Systèmes Multidimensionnels

et les Systèmes Multidimensionnels Le Data Warehouse et les Systèmes Multidimensionnels 1 1. Définition d un Data warehouse (DW) Le Data warehouse (entrepôt de données) est une collection de données orientées sujet, intégrées, non volatiles

Plus en détail

BUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise

BUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise BUSINESS INTELLIGENCE Une vision cockpit : utilité et apport pour l'entreprise 1 Présentation PIERRE-YVES BONVIN, SOLVAXIS BERNARD BOIL, RESP. SI, GROUPE OROLUX 2 AGENDA Définitions Positionnement de la

Plus en détail

Bases de données réparties

Bases de données réparties Bases de données réparties J. Akoka - I. Wattiau 1 Contexte Technologique : des solutions de communication efficace entre les machines des SGBD assurent la transparence des données réparties standardisation

Plus en détail

Dossier I Découverte de Base d Open Office

Dossier I Découverte de Base d Open Office ETUDE D UN SYSTEME DE GESTION DE BASE DE DONNEES RELATIONNELLES Définition : Un SGBD est un logiciel de gestion des données fournissant des méthodes d accès aux informations. Un SGBDR permet de décrire

Plus en détail

L INFORMATION GEOGRAPHIQUE

L INFORMATION GEOGRAPHIQUE Champs sur Marne ENSG/CERSIG Le 19-nove.-02 L INFORMATION GEOGRAPHIQUE Archivage Le Système d information géographique rassemble de l information afin de permettre son utilisation dans des applications

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme

Plus en détail

Présentation du module. Base de données spatio-temporelles. Exemple. Introduction Exemple. Plan. Plan

Présentation du module. Base de données spatio-temporelles. Exemple. Introduction Exemple. Plan. Plan Base de données spatio-temporelles S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Présentation du module Contenu général Partie 1 : Notion de bases de données (Conception

Plus en détail

Programme scientifique Majeure ARCHITECTURE DES SYSTEMES D INFORMATION. Mentions Ingénierie des Systèmes d Information Business Intelligence

Programme scientifique Majeure ARCHITECTURE DES SYSTEMES D INFORMATION. Mentions Ingénierie des Systèmes d Information Business Intelligence É C O L E D I N G É N I E U R D E S T E C H N O L O G I E S D E L I N F O R M A T I O N E T D E L A C O M M U N I C A T I O N Programme scientifique Majeure ARCHITECTURE DES SYSTEMES D INFORMATION Mentions

Plus en détail

JASPERSOFT ET LE PAYSAGE ANALYTIQUE. Jaspersoft et le paysage analytique 1

JASPERSOFT ET LE PAYSAGE ANALYTIQUE. Jaspersoft et le paysage analytique 1 JASPERSOFT ET LE PAYSAGE ANALYTIQUE Jaspersoft et le paysage analytique 1 Ce texte est un résumé du Livre Blanc complet. N hésitez pas à vous inscrire sur Jaspersoft (http://www.jaspersoft.com/fr/analyticslandscape-jaspersoft)

Plus en détail

Chapitre 10. Architectures des systèmes de gestion de bases de données

Chapitre 10. Architectures des systèmes de gestion de bases de données Chapitre 10 Architectures des systèmes de gestion de bases de données Introduction Les technologies des dernières années ont amené la notion d environnement distribué (dispersions des données). Pour reliér

Plus en détail

Information utiles. cinzia.digiusto@gmail.com. webpage : Google+ : http://www.ibisc.univ-evry.fr/ digiusto/

Information utiles. cinzia.digiusto@gmail.com. webpage : Google+ : http://www.ibisc.univ-evry.fr/ digiusto/ Systèmes de gestion de bases de données Introduction Université d Evry Val d Essonne, IBISC utiles email : cinzia.digiusto@gmail.com webpage : http://www.ibisc.univ-evry.fr/ digiusto/ Google+ : https://plus.google.com/u/0/b/103572780965897723237/

Plus en détail

Cours Bases de données

Cours Bases de données Informations sur le cours Cours Bases de données 9 (10) séances de 3h Polycopié (Cours + TD/TP) 3 année (MISI) Antoine Cornuéjols www.lri.fr/~antoine antoine.cornuejols@agroparistech.fr Transparents Disponibles

Plus en détail

Thibault Denizet. Introduction à SSIS

Thibault Denizet. Introduction à SSIS Thibault Denizet Introduction à SSIS 2 SSIS - Introduction Sommaire 1 Introduction à SQL Server 2008 Integration services... 3 2 Rappel sur la Business Intelligence... 4 2.1 ETL (Extract, Transform, Load)...

Plus en détail

Ecole des Hautes Etudes Commerciales HEC Alger. par Amina GACEM. Module Informatique 1ière Année Master Sciences Commerciales

Ecole des Hautes Etudes Commerciales HEC Alger. par Amina GACEM. Module Informatique 1ière Année Master Sciences Commerciales Ecole des Hautes Etudes Commerciales HEC Alger Évolution des SGBDs par Amina GACEM Module Informatique 1ière Année Master Sciences Commerciales Evolution des SGBDs Pour toute remarque, question, commentaire

Plus en détail

Bases de données réparties: Fragmentation et allocation

Bases de données réparties: Fragmentation et allocation Pourquoi une base de données distribuée? Bibliographie Patrick Valduriez, S. Ceri, Guiseppe Delagatti Bases de données réparties: Fragmentation et allocation 1 - Introduction inventés à la fin des années

Plus en détail

2 Serveurs OLAP et introduction au Data Mining

2 Serveurs OLAP et introduction au Data Mining 2-1 2 Serveurs OLAP et introduction au Data Mining 2-2 Création et consultation des cubes en mode client-serveur Serveur OLAP Clients OLAP Clients OLAP 2-3 Intérêt Systèmes serveurs et clients Fonctionnalité

Plus en détail

BD réparties. Bases de Données Réparties. SGBD réparti. Paramètres à considérer

BD réparties. Bases de Données Réparties. SGBD réparti. Paramètres à considérer Bases de Données Réparties Définition Architectures Outils d interface SGBD Réplication SGBD répartis hétérogènes BD réparties Principe : BD locales, accès locaux rapides accès aux autres SGBD du réseau

Plus en détail

SQL. Oracle. pour. 4 e édition. Christian Soutou Avec la participation d Olivier Teste

SQL. Oracle. pour. 4 e édition. Christian Soutou Avec la participation d Olivier Teste Christian Soutou Avec la participation d Olivier Teste SQL pour Oracle 4 e édition Groupe eyrolles, 2004, 2005, 2008, 2010, is BN : 978-2-212-12794-2 Partie III SQL avancé La table suivante organisée en

Plus en détail

IBM Cognos TM1. Fiche Produit. Aperçu

IBM Cognos TM1. Fiche Produit. Aperçu Fiche Produit IBM Cognos TM1 Aperçu Cycles de planification raccourcis de 75 % et reporting ramené à quelques minutes au lieu de plusieurs jours Solution entièrement prise en charge et gérée par le département

Plus en détail

Créer le schéma relationnel d une base de données ACCESS

Créer le schéma relationnel d une base de données ACCESS Utilisation du SGBD ACCESS Polycopié réalisé par Chihab Hanachi et Jean-Marc Thévenin Créer le schéma relationnel d une base de données ACCESS GENERALITES SUR ACCESS... 1 A PROPOS DE L UTILISATION D ACCESS...

Plus en détail

Le modèle de données relationnel

Le modèle de données relationnel Le modèle de données relationnel 1. Le modèle relationnel 1.1. Présentation Le modèle relationnel représente la base de données comme un ensemble de tables, sans préjuger de la façon dont les informations

Plus en détail

Université de Bangui. Modélisons en UML

Université de Bangui. Modélisons en UML Université de Bangui CRM Modélisons en UML Ce cours a été possible grâce à l initiative d Apollinaire MOLAYE qui m a contacté pour vous faire bénéficier de mes connaissances en nouvelles technologies et

Plus en détail

Fouille de Données : OLAP & Data Warehousing

Fouille de Données : OLAP & Data Warehousing Fouille de Données : OLAP & Data Warehousing Nicolas Pasquier Université de Nice Sophia-Antipolis Laboratoire I3S Chapitre 2. Data warehousing Définition : qu est-ce que le data warehousing? Entrepôt de

Plus en détail

Fournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement

Fournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement Introduction Phases du projet Les principales phases du projet sont les suivantes : La mise à disposition des sources Des fichiers Excel sont utilisés pour récolter nos informations L extraction des données

Plus en détail

Algèbre relationnelle

Algèbre relationnelle Algèbre relationnelle 1. Introduction L algèbre relationnelle est le support mathématique cohérent sur lequel repose le modèle relationnel. L algèbre relationnelle propose un ensemble d opérations élémentaires

Plus en détail

Le concept de Data Warehouse a été formalisé pour la première fois en 1990.

Le concept de Data Warehouse a été formalisé pour la première fois en 1990. 1 - LE DATA WAREHOUSE 1.1 - PRESENTATION Le concept de Data Warehouse a été formalisé pour la première fois en 1990. L idée de constituer une base de données orientée sujet, intégrée, contenant des informations

Plus en détail

LES OUTILS D ALIMENTATION DU REFERENTIEL DE DB-MAIN

LES OUTILS D ALIMENTATION DU REFERENTIEL DE DB-MAIN LES OUTILS D ALIMENTATION DU REFERENTIEL DE DB-MAIN Les contenues de ce document sont la propriété exclusive de la société REVER. Ils ne sont transmis qu à titre d information et ne peuvent en aucun cas

Plus en détail