Mémoire. En vue de l obtention du diplôme de Magister en Informatique. Option : SIC (Systèmes d Information et de Connaissances)

Dimension: px
Commencer à balayer dès la page:

Download "Mémoire. En vue de l obtention du diplôme de Magister en Informatique. Option : SIC (Systèmes d Information et de Connaissances)"

Transcription

1 République Algérienne Démocratique et Populaire Ministère de l Enseignement Supérieur et de la Recherche Scientifique E.S.I (Ecole nationale Supérieure d Informatique) (ex. INI) Mémoire En vue de l obtention du diplôme de Magister en Informatique Option : SIC (Systèmes d Information et de Connaissances) Approche dirigée par les fourmis pour la fragmentation horizontale des entrepôts de données relationnels Présenté par Dirigé par : Mohamed BARR : Mr. Ladjel BELLATRECHE, Maître de conférences Université Poitiers, France Devant le jury : Mr. A. BALLA, Maître de conférences ESI (Ex INI), Alger Mme. A.R BENATCHBA, Maître de conférences ESI (Ex INI), Alger Mr. A.R GHOMARI, Maître de conférences ESI (Ex INI), Alger Mr. K. BOUKHALFA, Maître de conférences USTHB, Alger Président Examinatrice Examinateur Examinateur Année universitaire:

2 Dédicaces «Louange à Dieu le tout puissant qui nous a aidé à achever ce travail de recherche, et que le salut soit sur son prophète Mohamed». A mes chers parents et beau-père à titre posthume ; A mes (belles) sœurs et (beaux) frères. A ma petite famille : «ma femme, mes enfants : Raid Salaheddine, Moaied Billah Mohamed, Selsabil, Tesnime, et Iyed Seif Elaqsa», et à ma belle-mère ; A ceux qui croient que la science est la seule voie pour accéder à une parfaite civilisation ; Et à ceux qui m ont aidé moralement et concrètement, de près ou de loin, pour réussir notre effort ; Je dédie cet humble mémoire.

3 Remerciements Je tiens à remercier vivement Monsieur BELLATRECHE Ladjel de m avoir proposé ce sujet qui s intègre dans une activité (Biomimétique) prometteuse qui aide à solutionner pas mal de problèmes qui restaient longtemps difficiles. Je n oublie pas mes gratitudes reconnaissances aux Docteurs BOUKHALFA Kamel, GHOMARI Réda Abdessamed et BOUKRA Abderrazek, pour leurs précieuses aides et orientations. Mes sincères salutations sont cordialement présentées à tous les membres de jury, composé de : - Mr. Amar BALLA de m avoir honoré par sa présidence du jury. Je le remercie également pour l intérêt qu il porte à ce travail. - Mme BENATCHBA, et Mrs Réda Abdessamed GHOMARI et Kamel BOUKHALFA d avoir accepté de faire partie du jury. Leur participation m honore.

4 Résumé Le sujet abordé rentre dans le cadre d utilisation de la biomimétique appliquée à l optimisation des entrepôts de données relationnels. Il consiste à utiliser l algorithme basé sur les colonies de fourmis pour la sélection d une technique d optimisation dans un entrepôt de données relationnel. La technique étudiée est celle de la fragmentation horizontale qui représente l une des techniques d optimisation non redondantes. Le caractère NP-Complet caractérisant cette technique justifie le recours aux méthodes approchées ou «méta heuristiques» pour résoudre ce problème en un temps fini. En effet, l intelligence collective des fourmis artificielles dans la résolution des problèmes d optimisation combinatoire NP-Complets est une activité très prometteuse. Cette approche tire sa capacité par le transfert d apprentissage au sein de la colonie d une manière stigmergique qui utilise l environnement pour communiquer le choix de bonnes solutions en se basant sur la visibilité et le dépôt de phéromone. L émergence vers les solutions optimales, en un temps fini, a fait de cette méthode approchée une possibilité de recours convenable. A travers notre travail, nous avons modélisé notre problème de sélection d un schéma de fragmentation horizontale pour être pris en charge par l approche basée sur les colonies de fourmis tout en définissant les variables d entrées qui sont : l entrepôt de données non fragmenté, la charge de requêtes fréquemment utilisées et le nombre maximal de fragments exigé par l administrateur de l entrepôt de données. Le résultat en sortie est le schéma de fragmentation horizontale qui minimise le coût global de la charge de requêtes. Le paramétrage approprié de dépôt de la phéromone, et l expression significative de l heuristique qui représente la visibilité, nous ont permis d obtenir des résultats très satisfaisants comparables aux résultats déjà obtenus en utilisant l algorithme génétique qui a fait ses preuves pour résoudre ce problème de fragmentation horizontale dans les entrepôts de données relationnels. L expérimentation de notre approche en utilisant un Benchmark (APB1 dans notre cas) est un moyen important pour vérifier l efficacité de la méthode proposée d une part, et de pouvoir la situer par rapport à d autres méthodes qui existent dans ce domaine, d autre part. Mots clés : Biomimétique, Entrepôt de données, Structures non redondantes, Optimisation, Problème NP-Complet, Métaheuristique, Colonie de fourmis.

5 Abstract The subject matter falls within the scope of use of biomimetic applied to the optimization of relational data warehouses. It involves using the algorithm based on ant colony for the selection of an optimization technique in a relational data warehouse. The horizontal fragmentation is a non-redundant technique. The NP-complete nature characterizing the selection of this technique justifies the use of approximate methods or metaheuristics to solve this problem in a finite time. Indeed the collective intelligence of artificial ants in solving combinatorial optimization problems NP- Complete is a highly promising. This approach draws its capacity through the transfer of learning within the colony in a manner that uses stigmergy environment to communicate the choice of good solutions based on visibility and depositing pheromone. The rise to optimal solutions in a finite time has made this method an approximate proper recourse. Through our work we have modeled the problem of selecting a horizontal fragmentation pattern to be supported by the ants approach with the following input variables: the unfragmented data warehouse, the query load frequently used, the maximum number of fragments required by the administrator of the data warehouse. The result output is a horizontal fragmentation pattern that minimizes the overall cost of the query load. Setting proper filing of the pheromone, and significant expression of heuristics which represents the visibility; we have obtained satisfactory results comparable to the ones already obtained using the genetic algorithm which is used to solve the problem of horizontal fragmentation in relational data warehouses. The testing of our approach according to a Benchmark (APB1 in our case) is an important way to verify the effectiveness of the method used on the one hand, and to situate it in relation to other methods that exist in this area on the other hand. Keywords: Biomimetics, Data Warehouse, Non-redundant structures, Optimization, NP-Complete problem, Metaheuristics, Ant-colony.

6 Sommaire Dédicaces... 2 Remerciements... 3 Résumé... 4 Liste des tableaux Liste des algorithmes Chapitre I. Introduction générale I.1. Problématique I.2. Motivations pour l utilisation de la métaheuristique basée sur les colonies de fourmis I.3. Notre approche I.4. Organisation du mémoire Chapitre II. Les Structures d optimisation dans un Entrepôt De Données Relationnel II.1. Introduction II.2. Notion d entrepôt de données II.3. Modèle de données pour les entrepôts II.4. Opérations liées à la structure II.5. Opérations associées à la granularité II.6. Les implémentations des modèles multidimensionnels II.7. Structures d optimisation d un entrepôt de données II.7.1. Les index II.8. Les vues matérialisées II.9. Sélection simultanée d index et des vues matérialisées II.10. Fragmentation II.11. Aperçu sur les travaux de fragmentation verticale II.12. Conclusion Chapitre III. Fragmentation Horizontale III.1. Introduction III.2. Fragmentation horizontale dans les entrepôts de données III.3. Méthodologie de fragmentation horizontale dans les entrepôts de données III.4. La complexité de la procédure de fragmentation III.5. Méthodes de fragmentation horizontale... 54

7 III.6. Processus de fragmentation horizontale III.7. Optimisation avec contraintes III.8. Estimation de la sélectivité des prédicats III.9. Estimation de la sélectivité des prédicats complexes Chapitre IV. Les Méta heuristiques. Cas particulier : méta heuristiques basées sur les fourmis IV.1. Introduction IV.2. Généralités sur la notion d optimisation IV.3. Etat de l art sur les méta-heuristiques IV.4. Colonies de fourmis IV.5. Fourmis artificielles IV.6. Inspiration dans le domaine de robotique IV.7. Les fourmis et l optimisation combinatoire IV.8. Méta heuristique basée sur les fourmis IV.9. Applications de la métaheuristique de fourmis IV.10. Les fourmis et le problème de classification IV.11. Méthodes de partitionnement et les fourmis IV.12. Hybridation des méthodes de Colonie de fourmis avec d autres heuristiques IV.13. Efficacité de l Algorithme basé sur les fourmis ACS (Ant colonies system) IV.14. Optimisation à base de Colonie de Fourmis (ACO) appliquées dans les bases de données Chapitre V. Approche dirigée par les fourmis pour la sélection de la fragmentation horizontale pour l optimisation d un entrepôt de données relationnel.. 85 V.1. Introduction V.2. Architecture générale de la solution V.3. Définition du problème de sac à dos V.4. Formulation Mathématique V.5. Formalisation de notre problème de fragmentation horizontale en utilisant le problème du sac à dos V.6. Définition des paramètres nécessaires pour l application de l Algorithme de Colonie de Fourmis V.7. Schéma de l entrepôt de données (en étoile) V.8. Implémentation de la solution V.9. Evaluation des résultats

8 V.10. Résultats d expérimentation V.11. Validation sous Oracle 10g V.12. Etude comparative entre l Algorithme Génétique et L Algorithme de Colonie de Fourmis V.13. Interprétation des résultats obtenus relativement aux deux méthodes Chapitre VI. Conclusion générale Bibliographie Annexe Annexe

9 Liste des figures Figure 1. Architecture générale d un Datawarehouse [GOGLIN, 2000] Figure 2. Schéma de l entrepôt (Modèle Conceptuel de Données MCD) Figure 3. Un exemple de cube Figure 4. Classification des techniques d optimisation Figure 5. Exemple d'expression AND-DAG [AOUICHE, 2005] Figure 6. Recommandation de technique d optimisation de RIZZI et SALTARELLI [DARMONT, 2006] Figure 7. Schéma d une recherche locale [CANEGHEM, 2002] Figure 8. Exemple d un voisinage 2 opt [CANEGHEM, 2002] Figure 9. Exemple d un voisinage 3 opt [CANEGHEM, 2002] Figure 10. Évolution des publications sur les fourmis artificielles [MONMARCHE, 2007] Figure 11. Emergence des fourmis en fonction de dépôt de phéromone Figure 12. Architecture générale de la solution retenue Figure 13. Quel objet à mettre dans le sac? Figure 14. Graphe des prédicats de sélection Figure 15. Modèle Logique de Données de l entrepôt du Benchmark APB Figure 16. Menu principal du logiciel Figure 17. Fenêtre principale du logiciel Figure 18. Paramètres d utilisation Figure 19. Lancement du logiciel Figure 20. Visualisation des résultats Figure 21. Sauvegarde des résultats Figure 22. Capture d écran du schéma de fragmentation plus l indication des tailles des partitions obtenues par le logiciel Figure 23. Evolution du nombre d'e/s en fonction du nombre de fragments Figure 24. Gains en nombre d'entrées/sorties en fonction du nombre de fragments Figure 25. Dégradation de la solution pour la négligence du facteur Bêta de l heuristique Figure 26. Capture d écran : taille de la table des faits actvars du Benchmark, avant fragmentation Figure 27. Capture d écran : taille des partitions de la table des faits partitionnée appelée «actvars_partitionné_by_list» du Benchmark, après fragmentation Figure 28. Comparaison entre l AG et l Approche des Fourmis (Nombre d Entrées/Sorties) en fonction des nombres de fragments Figure 29. Comparaisons des Résultats (gains en Entrées/Sorties) avant répartition Figure 30. Comparaison des résultats entre l AG et l Approche des Fourmis Figure 31. Comparaison des gains en nombre d entrées/sorties entre l AG et l AF suite à la répartition du fragment volumineux

10 Figure 32. Capture d écran de création de la table partitionnée sous oracle 10g et l outil PLSQL- Developper Figure 33. Capture d écran de visualisation de la table de travail t0 sous Discoverer oracle 10g. 172 Figure 34. Histogramme de la requête Q1 avant fragmentation Figure 35. Histogramme de la requête Q1 après fragmentation Figure 36. Interface de l outil de Business Intelligence «Oracle Discoverer Administrator : Figure 37. Interface de l outil de Business Intelligence «Oracle Discoverer desctop : partie client» pour visualisation des résultats de la requête 1 après fragmentation Figure 38. Visualisation des résultats de la requête 1 après fragmentation sous Oracle Discoverer Figure 39. Capture d écran de visualisation des résultats de la requête 32 après fragmentation Sous PLSQL-Developper Figure 40. Capture d écran de visualisation des résultats de la requête 32 après fragmentation. 179 Figure 41. Histogramme requête 55 avant fragmentation Figure 42. Requête 55 après fragmentation Figure 43. Résultats obtenus à base de l Algorithme Génétique (32 fragments) [BOUKHALFA, 2005]

11 Liste des tableaux Tableau 1. Comparaison entre les deux systèmes : ROLAP et MOLAP Tableau 2. Calcul de la pertinence entre deux vues matérialisées Tableau 3. Problèmes combinatoires traités par les fourmis [DORIGO, 2001] Tableau 4. Mapping entre le sac à dos et le problème de sélection de la fragmentation horizontale Tableau 5 Cardinalité des tables du Benchmark Tableau 6. Alimentation du logiciel des sélectivités des prédicats d attributs de l entrepôt de données du Benchmark pour évaluation des charges Tableau 7. Taux d amélioration en fonction du nombre de fragments Tableau 8. Nouveau gain en nombre d Entrées/Sorties après répartition de la partition volumineuse Tableau 9. Taux d amélioration suite à la répartition du fragment volumineux part_ Tableau 10. Tableau comparatif entre l Algorithme Génétique et l Algorithme de Colonie de Fourmis Tableau 11. Tableau comparatif des résultats entre L Approche des Fourmis et l Algorithme Génétique avant répartition des fragments volumineux Tableau 12. Comparaisons des Résultats (gains en Entrées/Sorties) avant répartition Tableau 13. Points forts et points faibles des deux méthodes (Ag et Approche des Fourmis) Tableau 14. Légende utilisée Tableau 15. Tableau d usage des prédicats simples par rapport aux requêtes de la charge Tableau 16. Tableau de mise en évidence des tailles relatives aux prédicats, dans la table des faits du Benchmark Tableau 17. Tableau de sélectivités des prédicats contenus dans la charge du Benchmark Tableau 18. Alimentation du logiciel par les sélectivités de tous les prédicats simples pour sélectionner les meilleurs sous ensembles de prédicats en termes d optimisation Tableau 19. Représentation des 32 fragments obtenus Tableau 20. Répartition d un prédicat sur plusieurs fragments Tableau 21. Evaluation du gain en nombre d Entrées/Sorties pour un schéma de 32 fragments. 170 Tableau 22. Eclatement de la partition volumineuse en sous partitions de tailles raisonnables en fonction de l attribut Mois_level Tableau 23. Feuille de calcul extraite des résultats via l outil Oracle Discoverer

12 Liste des algorithmes Algorithme 1 : Algorithme de construction d un index bitmap [FAVRE, 2003] Algorithme 2 : Algorithme de sélection de vues basée sur la pertinence [AOUICHE, 2005] Algorithme 3 :Algorithme de Hill Climbing [CANEGHEM, 2002] Algorithme 4 : Algorithme de Recuit simulé [CANEGHEM, 2002] Algorithme 5 : Algorithme Tabou [BREZELLEC, 1992] Algorithme 6 : Algorithmes génétiques [CANEGHEM, 2002] Algorithme 7 : Algorithme AS-TSP [DORIGO & AL., 2002] Algorithme 8 : Algorithme de détection d un graphe hamiltonien à base des fourmis [CANEGHEM, 2002] Algorithme 9 : Algorithme ACS-LK [TADUNFOCK & AL., 2006] Algorithme 10 : Pseudo code de l algorithme de fourmis [MANIEZZO & AL., 2001] Algorithme 11 : Algorithme ACO générique adapté pour le Sac A Dos [ALAYA & AL. 2005]... 95

13 Chapitre I. Introduction Générale Chapitre I. Introduction générale I.1. Problématique Les entrepôts de données sont des bases de données destinées à contenir les informations de prise de décisions qui sont utiles aux managers des entreprises. Les entrepôts de données peuvent être multidimensionnels ou relationnels. Ces derniers sont conçus suivant une architecture en étoile ou en flacon de neiges. Suivant ces deux architectures, les entrepôts sont construits autour d une table de faits, souvent très volumineuse, qui peut atteindre plusieurs téraoctets, entourée de plusieurs tables de dimensions qui contiennent les axes d analyse relativement aux indicateurs ou mesures contenus dans la table des faits. La volumétrie de la table de faits et la multitude de jointures entre elles et les tables de dimensions rendent l extraction des informations, via des requêtes décisionnelles, une tâche coûteuse en temps et en espace. Pour réduire le temps de réponse des requêtes décisionnelles, il y a lieu d utiliser des structures et des techniques d optimisation, comme les index, les vues matérialisées, les techniques de fragmentation horizontale, etc. Dans [AOUICHE., 2005], il a été démontré que le problème de sélection d une telle structure ou technique de fragmentation est un problème NP-complet. Cette caractéristique de l opération de sélection a obligé les chercheurs à recourir à des méthodes approchées ou «métaheuristiques» pour résoudre ce problème en un temps fini. Parmi ces métaheuristiques, qui sont déjà utilisées dans ce contexte, nous citons le travail présenté dans [BOUKHALFA & AL., 2005] basé sur les algorithmes génétiques. Notre travail se base sur l approche des colonies de fourmis pour exploiter l intelligence collective de ces dernières afin de sélectionner un schéma de fragmentation horizontale qui soit le plus optimal possible. La particularité de notre contribution est quelle n applique pas directement un algorithme, comme le font les approches existantes, pour solutionner le problème de fragmentation, mais elle effectue un mapping entre notre problème et celui du sac à dos, qui sont tous les deux NP-complets. La résolution du problème de sac à dos à l aide de l approche des fourmis [ALAYA & AL. 2005], nous a facilité la modélisation et la résolution de notre problème tout en adaptant et paramétrant l algorithme sur le problème 13

14 Chapitre I. Introduction Générale de fragmentation horizontale. Nous nous sommes basés sur un modèle de coût pour estimer le coût de la fonction objectif qui consiste, dans le cadre de notre contribution, à minimiser le nombre d entrées/sorties entre le disque et la mémoire centrale lors de l exécution des requêtes décisionnelles. Nous avons supposé également que les tailles des tables de dimensions et les coûts de jointure sont négligeables Enfin, les expérimentations que nous avons mené sur le Benchmark APB1 des entrepôts de données relationnels ainsi que la comparaison des résultats obtenus par rapport à ceux obtenus en utilisant les algorithmes génétiques, sont deux facteurs d intérêt capital pour juger de la pertinence de l approche proposée dans ce magister. I.2. Motivations pour l utilisation de la métaheuristique basée sur les colonies de fourmis L approche basée sur les colonies de fourmis tire sa force des éléments suivants : Le transfert de l apprentissage au sein de la colonie de fourmis d une manière stigmergique (en utilisant l environnement) en fonction de la matière ou «phéromone» déposée par les différentes fourmis afin de guider les fourmis qui suivent. La considération de la visibilité des points de choix dans l espace de recherche, qui aide à la résolution du problème des optimums locaux. Le procédé par exploration de la méthode en fonction de l heuristique utilisée, et par exploitation d une manière stigmergique à l aide de dépôt de phéromone, a fait d elle une approche de construction et d amélioration de solution à la fois [DREO & AL, 2003]. En effet, l application de cette approche a donné de bons résultats dans l optimisation des structures de bases de données. Les travaux menés dans [BOUKRA & AL, 2007] et [MANIEZZO & AL., 2001], sont deux exemples types de l illustration de la performance de la méthode. Ils concernent respectivement les vues matérialisées et la fragmentation verticale. Dans le premier travail, les auteurs ont justifié la performance de la méthode par le phénomène d émergence dans l organisation des fourmis provoquée par le transfert de l apprentissage intelligent par rapport à des générations aléatoires utilisées dans le cadre 14

15 Chapitre I. Introduction Générale des algorithmes génétiques. La même conclusion peut être faite dans le cadre du deuxième travail surtout dans le cas d un nombre important de requêtes de petite taille. I.3. Notre approche Nous nous intéressons dans le présent travail à la Fragmentation Horizontale, en particulier le problème de sélection d'un schéma de fragmentation horizontale. Nous proposons une approche de sélection basée sur les colonies de fourmis. Les étapes d adaptation de notre problème d optimisation sont les suivantes : Identifier les éléments (prédicats ou fragments dans notre cas) candidats qui peuvent participer aux solutions ; Construire des solutions en fonction des éléments ou objets candidats ; Procéder aux améliorations de la fonction objectif ; Mener des expérimentations en utilisant un Benchmark ; Evaluer la démarche ; Analyser les résultats ; Comparer la méthode avec l heuristique basée sur les algorithmes génétiques ; Tirer des conclusions et projeter des perspectives. I.4. Organisation du mémoire Ce mémoire est organisé de la manière suivante : Le chapitre II présente les structures d optimisation dans un entrepôt de données dans le but de donner une idée sur les structures d optimisation déjà utilisées et rappeler les contraintes de leurs usages. Le chapitre III est consacré au principal volet de notre travail qui est «la fragmentation horizontale». Dans ce chapitre un rappel sur la complexité du problème de fragmentation est présenté, et le processus de fragmentation horizontale est discuté. La difficulté du problème de sélection de la fragmentation horizontale, comme une technique de performance et d optimisation dans un entrepôt relationnel, a conduit au recours aux solutions approchées pour résoudre ce problème. 15

16 Chapitre I. Introduction Générale Dans le chapitre IV, un état de l art sur les métaheuristiques est présenté. Ces métaheuristiques sont illustrées par leurs algorithmes associés, afin de mettre en évidence les variables d entrée et les résultats retournés par chaque algorithme. Une étude plus détaillée a impliqué la métaheuristique basée sur les colonies de fourmis. C est cette approche que nous avons utilisé dans le cadre de notre travail pour prendre en charge le problème de sélection de la fragmentation horizontale. Dans le chapitre V, nous présentons la modélisation du problème de sélection de la Fragmentation Horizontale en utilisant une approche basée sur les colonies de fourmis. Le formalisme retenu a fait l objet d une expérimentation basée sur l utilisation du Benchmark APB1. Les résultats obtenus ont fait l objet d une évaluation et d une analyse pour montrer la bonne configuration de l algorithme. Enfin, et pour situer notre contribution par rapport aux méthodes existantes, nous avons procédé à une comparaison entre un algorithme génétique (AG) et celui basé sur les colonies de fourmis pour déterminer tous les aspects relatifs à l utilisation des deux algorithmes. Enfin, une conclusion rappelle la problématique étudiée ainsi que les résultats obtenus. Cette conclusion nous a permis de lister quelques perspectives de prolongement de nos travaux. 16

17 Chapitre II. Les Structures d optimisation dans un Entrepôt De Données Relationnel Chapitre II. Les Structures d optimisation dans un Entrepôt De Données Relationnel II.1. Introduction Le projet d informatique décisionnelle (ou Business Intelligence) constitue le pond qui relie la stratégie business et la stratégie technologie d information d une entreprise.[tea, 2004] Les entrepôts de données sont les bases qui contiennent les informations de prise de décision. Ces entrepôts peuvent être conçus d une manière multidimensionnelle ou relationnelle. Par rapport au modèle relationnel, les entrepôts de données sont de deux types en flocon de neiges ou en étoile. Et suivant l architecture en étoile, l entrepôt est constitué d une table de faits volumineuse, entourée de plusieurs tables de dimensions qui contiennent les axes d analyse. Pour extraire les indicateurs contenus dans les tables de faits, nous avons besoin d écrire des requêtes décisionnelles complexes caractérisées par une multitude de jointures entre la table des faits et les tables de dimensions. La conception physique des entrepôts de données est une préoccupation majeure des chercheurs dans le domaine de l informatique décisionnelle. [BELLATRECHE, 2007] Parmi les sujets qui rentrent dans le cadre de mise en place des entrepôts de données, nous trouvons les structures d optimisation ayant pour objectif fondamental la gestion des données des entrepôts d une manière performante. Ces techniques ou structures de données peuvent être des index, des vues matérialisées, ou la technique de la fragmentation (horizontale ou verticale). Certaines de ces structures présentent des avantages et/ou des inconvénients par rapport aux autres. L objectif prioritaire de ces techniques ou structures est de fournir des formes d optimisation par rapport aux différents critères tels que (le volume de stockage, la rapidité d accès, le coût de maintenance, etc..). 17

18 Chapitre II. Les Structures d optimisation dans un Entrepôt De Données Relationnel La sélection d une configuration d optimisation quelconque de ces structures est un problème NP-Complet. La difficulté de sélection d une telle structure peut être résolue par des méthodes exactes ou des approches approchées. Les limitations des méthodes exactes ont obligé les chercheurs à utiliser des approches approximatives appelées «métaheuristiques». Parmi les métaheuristiques les plus récentes, nous trouvons celle basée sur les fourmis, qui a été appliqué pour résoudre plusieurs problèmes NP-Complets. Notre contribution à travers ce mémoire, consistera à appliquer l algorithme de la colonie des fourmis pour résoudre le problème NP-Complet de la technique de «Fragmentation Horizontale» dans un entrepôt de données relationnel. [BELLATRECHE & AL., 2009] A travers ce chapitre, nous allons relater l état de l art des différentes structures et techniques d optimisation dans les entrepôts de données. Puis nous présentons quelques algorithmes utilisés pour sélectionner ces techniques ou structures. II.2. Notion d entrepôt de données II.2.1. Définitions Dans [INMON, 1994], l auteur considéré comme le père du concept «datawarehouse», le définit comme suit : Le data warhouse est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées pour le support d un processus d aide à la décision». Dans [FROMAN & AL., 2003], une deuxième définition est donnée : «Un entrepôt de données sert à consolider les données stratégiques de l organisation et les mettre à la disposition des gestionnaires à des fins d aide à la décision. Les nombreuses données accumulées dans les fichiers et les bases de données des systèmes transactionnels sont souvent dispersées, disparates, incohérentes, mal connues, et leur mise à jour n est pas toujours synchronisée. Il s agit alors de réorganiser ces grandes masses de données opérationnelles en fonction 18

19 Chapitre II. Les Structures d optimisation dans un Entrepôt De Données Relationnel de quatre caractéristiques: intégration, orientation sujet, sensibilité au temps, nonvolatilité, et d un objectif: l aide à la décision». «Structure informatique dans laquelle est centralisé un volume important de données consolidées à partir des différentes sources de renseignements d'une entreprise (notamment les bases de données internes). L'organisation des données est conçue pour que les personnes intéressées aient accès rapidement et sous forme synthétique à l'information stratégique dont elles ont besoin pour la prise de décision». Et enfin dans [KERKRI & AL., 1998], un entrepôt de données est défini comme suit : «Un entrepôt de données est défini comme étant une collection de technologies décisionnelles formant un environnement permettant aux décideurs de prendre des décisions plus pertinentes et plus rapides. Pour cela, l'entrepôt de données doit faciliter l'accès aux informations de l'entreprise, assurer la cohérence des informations et permettre le découpage des données. Ces objectifs impliquent l'intégration d'outils de requête, d'analyse et de présentation d'informations. De même les données doivent être soigneusement rassemblées à partir de différentes sources d'informations puis nettoyées et filtrées et n'être diffusées qu'après validation de leur qualité. Ainsi, l'information fournie par un entrepôt de données n'est pas une donnée brute mais une information qui éclaire le décideur ; elle est orientée sujet, agrégée, facile d'accès, fiable et pertinente, non volatile et possède un contexte temporel spécifique. Le Data Warehousing repose sur l'idée d'extraire des informations utiles et de les combiner dans un ensemble cohérent, le Data Warehouse ou entrepôt de données. La cohérence des données est mesurée globalement, elle est jugée du point de vue du manager qui cherche à savoir si par exemple un chargement de données en cours est bien un ensemble de données complet et cohérent» Ces définitions mettent l accent sur les caractéristiques suivantes des informations incluses dans l entrepôt, à savoir : 1- L information doit être thématique, c est-à-dire liée à un métier par exemple finances, ressources humaines, production, etc. 2- Elle doit être organisée pour aider à la décision. 19

20 Chapitre II. Les Structures d optimisation dans un Entrepôt De Données Relationnel 3- Elle doit être historiée pour permettre au décideur d aller dans le temps et faire des comparaisons et des projections dans le temps pour pouvoir donner des explications et des interprétations relativement à, l évolution de cette information. II.2.2. Entrepôt de données et bases de données opérationnelles L entrepôt de données étant la structure destinée à contenir les informations de prise de décision. Dans un système d information décisionnel séparé conceptuellement par rapport aux applications de production et dépendant pour son alimentation. Pour cet effet, le système d information décisionnel est un mécanisme à double face parce que : Il consomme des données d origines diverses, généralement opérationnelles ; Il produit des informations pour des objectifs bien définis. Figure 1. Architecture générale d un Datawarehouse [GOGLIN, 2000] II.2.3. Facteurs de succès d un Entrepôt de données Les caractéristiques le plus souvent associés à la réussite d un datawarehouse sont : des objectifs clairs à atteindre, d où la mesurabilité des phénomènes à prendre en charge, 20

Techniques d optimisation des requêtes dans les data warehouses

Techniques d optimisation des requêtes dans les data warehouses Techniques d optimisation des requêtes dans les data warehouses Ladjel Bellatreche LISI/ENSMA Téléport2-1, Avenue Clément Ader 86960 Futuroscope - FRANCE bellatreche@ensma.fr Résumé Un entrepôt de données

Plus en détail

OptAssist : outil d assistance pour l optimisation des entrepôts de données relationnels

OptAssist : outil d assistance pour l optimisation des entrepôts de données relationnels OptAssist : outil d assistance pour l optimisation des entrepôts de données relationnels Kamel Boukhalfa 1, Ladjel Bellatreche 2, and Zaia Alimazighi 1 1 USTHB University - Algiers - Algeria boukhalk@ensma.fr,

Plus en détail

et les Systèmes Multidimensionnels

et les Systèmes Multidimensionnels Le Data Warehouse et les Systèmes Multidimensionnels 1 1. Définition d un Datawarehouse (DW) Le Datawarehouse est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées

Plus en détail

THESE. Pour l obtention du Grade de. Ecole Doctorale : Sciences pour l Ingénieur et Aéronautique. Secteur de Recherche : Informatique et Applications

THESE. Pour l obtention du Grade de. Ecole Doctorale : Sciences pour l Ingénieur et Aéronautique. Secteur de Recherche : Informatique et Applications THESE Pour l obtention du Grade de DOCTEUR DE L ECOLE NATIONALE SUPERIEURE DE MECANIQUE ET D AEROTECHNIQUE (Diplôme national-arrêté du 7 août 2006) Ecole Doctorale : Sciences pour l Ingénieur et Aéronautique

Plus en détail

Entrepôts de données. NEGRE Elsa Université Paris-Dauphine 2015-2016

Entrepôts de données. NEGRE Elsa Université Paris-Dauphine 2015-2016 Entrepôts de données NEGRE Elsa Université Paris-Dauphine 2015-2016 Contexte et problématique Le processus de prise de décision L entrepôt de données Définition Différence avec un SGBD Caractéristiques

Plus en détail

Chapitre 9 : Informatique décisionnelle

Chapitre 9 : Informatique décisionnelle Chapitre 9 : Informatique décisionnelle Sommaire Introduction... 3 Définition... 3 Les domaines d application de l informatique décisionnelle... 4 Architecture d un système décisionnel... 5 L outil Oracle

Plus en détail

Entrepôt de données 1. Introduction

Entrepôt de données 1. Introduction Entrepôt de données 1 (data warehouse) Introduction 1 Présentation Le concept d entrepôt de données a été formalisé pour la première fois en 1990 par Bill Inmon. Il s agissait de constituer une base de

Plus en détail

Les Entrepôts de Données

Les Entrepôts de Données Les Entrepôts de Données Grégory Bonnet Abdel-Illah Mouaddib GREYC Dépt Dépt informatique :: GREYC Dépt Dépt informatique :: Cours Cours SIR SIR Systèmes d information décisionnels Nouvelles générations

Plus en détail

Ministère de l Enseignement Supérieur et de la Recherche Scientifique. Ecole nationale Supérieure d Informatique (ESI) (Oued Semar, Alger) Mémoire

Ministère de l Enseignement Supérieur et de la Recherche Scientifique. Ecole nationale Supérieure d Informatique (ESI) (Oued Semar, Alger) Mémoire Ministère de l Enseignement Supérieur et de la Recherche Scientifique Ecole nationale Supérieure d Informatique (ESI) (Oued Semar, Alger) École Doctorale Sciences et Technologies de l'information et de

Plus en détail

UNIVERSITÉ MOHAMMED V AGDAL. FACULTÉ DES SCIENCES Rabat THÈSE DE DOCTORAT. Présentée par ELhoussaine ZIYATI Discipline : Sciences de l ingénieur

UNIVERSITÉ MOHAMMED V AGDAL. FACULTÉ DES SCIENCES Rabat THÈSE DE DOCTORAT. Présentée par ELhoussaine ZIYATI Discipline : Sciences de l ingénieur UNIVERSITÉ MOHAMMED V AGDAL FACULTÉ DES SCIENCES Rabat N d ordre 2491 THÈSE DE DOCTORAT Présentée par ELhoussaine ZIYATI Discipline : Sciences de l ingénieur Spécialité : Informatique et Télécommunications

Plus en détail

CARTE HEURISTIQUE...1 LA CHAÎNE DÉCISIONNELLE...2. Collecte des données...2 Stockage des Données...3 Exploitation des Données...4 OLTP ET OLAP...

CARTE HEURISTIQUE...1 LA CHAÎNE DÉCISIONNELLE...2. Collecte des données...2 Stockage des Données...3 Exploitation des Données...4 OLTP ET OLAP... Table des matières CARTE HEURISTIQUE...1 LA CHAÎNE DÉCISIONNELLE...2 Collecte des données...2 Stockage des Données...3 Exploitation des Données...4 OLTP ET OLAP...6 OPÉRATIONS SUR LES CUBES...7 Exemple

Plus en détail

Business Intelligence : Informatique Décisionnelle

Business Intelligence : Informatique Décisionnelle Business Intelligence : Informatique Décisionnelle On appelle «aide à la décision», «décisionnel», ou encore «business intelligence», un ensemble de solutions informatiques permettant l analyse des données

Plus en détail

Informatique Décisionnelle pour l environnement

Informatique Décisionnelle pour l environnement Territoires, Environnement, Télédétection et Information Spatiale Unité mixte de recherche AgroParisTech - Cirad - Irstea Informatique Décisionnelle pour l environnement Principe, architecture informatique

Plus en détail

Introduction à la B.I. Avec SQL Server 2008

Introduction à la B.I. Avec SQL Server 2008 Introduction à la B.I. Avec SQL Server 2008 Version 1.0 VALENTIN Pauline 2 Introduction à la B.I. avec SQL Server 2008 Sommaire 1 Présentation de la B.I. et SQL Server 2008... 3 1.1 Présentation rapide

Plus en détail

Bases de données multidimensionnelles OLAP. OnLine Analytical Processing

Bases de données multidimensionnelles OLAP. OnLine Analytical Processing Bases de données multidimensionnelles OLAP OnLine Analytical Processing OLAP OLAP (On Line Analytical Processing): Ensemble des outils nécessaires pour la mise en place d'un Système d'information décisionnel

Plus en détail

Oracle Décisionnel : Modèle OLAP et Vue matérialisée D BILEK

Oracle Décisionnel : Modèle OLAP et Vue matérialisée D BILEK Oracle Décisionnel : Modèle OLAP et Vue matérialisée SOMMAIRE Introduction Le modèle en étoiles Requêtes OLAP Vue matérialisée Fonctions Roll up et Cube Application Introduction Data Warehouse Moteur OLAP

Plus en détail

Entreposage, analyse en ligne et fouille de données

Entreposage, analyse en ligne et fouille de données Entreposage, analyse en ligne et fouille de données Houssem Jerbi IRIT - SIG/ED jerbi@irit.fr Journée COMPIL " Bases de Données" 14/12/2010 PLAN Introduction Bases de données Entrepôt de données Technologie

Plus en détail

Bases de Données Avancées

Bases de Données Avancées 1/26 Bases de Données Avancées DataWareHouse Thierry Hamon Bureau H202 - Institut Galilée Tél. : 33 1.48.38.35.53 Bureau 150 LIM&BIO EA 3969 Université Paris 13 - UFR Léonard de Vinci 74, rue Marcel Cachin,

Plus en détail

Plan. Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation

Plan. Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation Data WareHouse Plan Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation 2 Présentation Besoin: prise de décisions

Plus en détail

MEMOIRE MAGISTER ECOLE DOCTORALE D INFORMATIQUE (STIC) THEME

MEMOIRE MAGISTER ECOLE DOCTORALE D INFORMATIQUE (STIC) THEME MINISTERE DE L ENSEIGNEMENT SUPERIEUR ET DE LA RECHERCHE SCIENTIFIQUE UNIVERSITE FERHAT ABBAS SETIF UFAS (ALGERIE) MEMOIRE Présenté à la Faculté des Sciences de l Ingénieur Département de l informatique

Plus en détail

Base de données en mémoire

Base de données en mémoire Base de données en mémoire Plan Bases de données relationnelles OnLine Analytical Processing Difficultés de l OLAP Calculs en mémoire Optimisations 1 Base de données relationnelle Introduction Date Exemple

Plus en détail

Techniques Data Mining pour la sélection d une configuration d index de jointure binaire

Techniques Data Mining pour la sélection d une configuration d index de jointure binaire Faculté des Sciences Tidjani HADDAM Département de l Informatique Mémoire Pour l obtention du diplôme de MASTER Spécialité : Informatique Option : Modèles Intélligents et Décision (MID) THÈME Techniques

Plus en détail

Un datawarehouse est un entrepôt de données (une base de données) qui se caractérise par des données :

Un datawarehouse est un entrepôt de données (une base de données) qui se caractérise par des données : Page 1 of 6 Entrepôt de données Un article de Wikipédia, l'encyclopédie libre. L'entrepôt de données, ou datawarehouse, est un concept spécifique de l'informatique décisionnelle, issu du constat suivant

Plus en détail

Le "tout fichier" Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique

Le tout fichier Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique Introduction à l informatique : Information automatisée Le premier ordinateur Définition disque dure, mémoire, carte mémoire, carte mère etc Architecture d un ordinateur Les constructeurs leader du marché

Plus en détail

Présentation du module Base de données spatio-temporelles

Présentation du module Base de données spatio-temporelles Présentation du module Base de données spatio-temporelles S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Partie 1 : Notion de bases de données (12,5h ) Enjeux et principes

Plus en détail

Circuits électroniques au service de l'optimisation multi-requêtes

Circuits électroniques au service de l'optimisation multi-requêtes Ecole Nationale de Mécanique et d Aérotechnique Laboratoire d Informatique et d Automatique pour les Systèmes Circuits électroniques au service de l'optimisation multi-requêtes Ahcène BOUKORCA Sous la

Plus en détail

CONCEPTION ET REALISATION D'UN GENERATEUR DE TABLEAUX DE BORD PROSPECTIFS MULTIDIMENSIONNELS

CONCEPTION ET REALISATION D'UN GENERATEUR DE TABLEAUX DE BORD PROSPECTIFS MULTIDIMENSIONNELS CONCEPTION ET REALISATION D'UN GENERATEUR DE TABLEAUX DE BORD PROSPECTIFS MULTIDIMENSIONNELS Nazih Selmoune (*), Zaia Alimazighi (*) Selmoune@lsi-usthb.dz, Alimazighi@wissal.dz (*) Laboratoire des systèmes

Plus en détail

Optimisation de requêtes. I3009 Licence d informatique 2015/2016. Traitement des requêtes

Optimisation de requêtes. I3009 Licence d informatique 2015/2016. Traitement des requêtes Optimisation de requêtes I3009 Licence d informatique 2015/2016 Cours 5 - Optimisation de requêtes Stéphane.Gançarski Stephane.Gancarski@lip6.fr Traitement et exécution de requêtes Implémentation des opérateurs

Plus en détail

Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours

Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours Information du cours Informatique décisionnelle et data mining www.lia.univ-avignon.fr/chercheurs/torres/cours/dm Juan-Manuel Torres juan-manuel.torres@univ-avignon.fr LIA/Université d Avignon Cours/TP

Plus en détail

Etude de faisabilité visant à mettre en place un entrepôt de données sur les données de l IFN. Analyser et Explorer avec une grande interactivité

Etude de faisabilité visant à mettre en place un entrepôt de données sur les données de l IFN. Analyser et Explorer avec une grande interactivité Établissement chargé de réaliser l inventaire permanent du patrimoine forestier sur tout le territoire métropolitain indépendamment de toute question de propriété. Parmi ces objectifs: Connaissance de

Plus en détail

Datawarehouse: Cubes OLAP. Marlyse Dieungang Khaoula Ghilani

Datawarehouse: Cubes OLAP. Marlyse Dieungang Khaoula Ghilani Datawarehouse: Cubes OLAP Marlyse Dieungang Khaoula Ghilani Table des matières 1 Data Warehouse 3 1.1 Introduction............................ 3 1.1.1 Définition......................... 3 1.1.2 Architecture........................

Plus en détail

Urbanisation des SI-NFE107

Urbanisation des SI-NFE107 OLAP Urbanisation des SI-NFE107 Fiche de lecture Karim SEKRI 20/01/2009 OLAP 1 Introduction PLAN OLAP Les différentes technologies OLAP Plate formes et Outils 20/01/2009 OLAP 2 Informatique décisionnelle

Plus en détail

REPUBLIQUE ALGERIENNE DEMOCRATIQUE ET POPULAIRE MINISTERE DE L ENSEIGNEMENT SUPERIEUR ET DE LA RECHERCHE SCIENTIFIQUE UNIVERSITE D ORAN ES-SENIA

REPUBLIQUE ALGERIENNE DEMOCRATIQUE ET POPULAIRE MINISTERE DE L ENSEIGNEMENT SUPERIEUR ET DE LA RECHERCHE SCIENTIFIQUE UNIVERSITE D ORAN ES-SENIA REPUBLIQUE ALGERIENNE DEMOCRATIQUE ET POPULAIRE MINISTERE DE L ENSEIGNEMENT SUPERIEUR ET DE LA RECHERCHE SCIENTIFIQUE UNIVERSITE D ORAN ES-SENIA FACULTE DES SCIENCES DEPARTEMENT D INFORMATIQUE MEMOIRE

Plus en détail

Chapitre IX. L intégration de données. Les entrepôts de données (Data Warehouses) Motivation. Le problème

Chapitre IX. L intégration de données. Les entrepôts de données (Data Warehouses) Motivation. Le problème Chapitre IX L intégration de données Le problème De façon très générale, le problème de l intégration de données (data integration) est de permettre un accès cohérent à des données d origine, de structuration

Plus en détail

La place de la Géomatique Décisionnelle dans le processus de décision

La place de la Géomatique Décisionnelle dans le processus de décision Géomatique décisionnelle La place de la Géomatique Décisionnelle dans le processus de décision - Arnaud Van De Casteele Mines ParisTech - CRC Arnaud {dot} van_de_casteele {at} mines-paristech.fr Les rencontres

Plus en détail

Bases de données multidimensionnelles et mise en œuvre dans Oracle

Bases de données multidimensionnelles et mise en œuvre dans Oracle Bases de données multidimensionnelles et mise en œuvre dans Oracle 1 Introduction et Description générale Les bases de données relationnelles sont très performantes pour les systèmes opérationnels (ou

Plus en détail

SQL. Oracle. pour. 4 e édition. Christian Soutou Avec la participation d Olivier Teste

SQL. Oracle. pour. 4 e édition. Christian Soutou Avec la participation d Olivier Teste Christian Soutou Avec la participation d Olivier Teste SQL pour Oracle 4 e édition Groupe eyrolles, 2004, 2005, 2008, 2010, is BN : 978-2-212-12794-2 Partie III SQL avancé La table suivante organisée en

Plus en détail

Business & High Technology

Business & High Technology UNIVERSITE DE TUNIS INSTITUT SUPERIEUR DE GESTION DE TUNIS Département : Informatique Business & High Technology Chapitre 8 : ID : Informatique Décisionnelle BI : Business Intelligence Sommaire Introduction...

Plus en détail

PLAN. Les systèmes d'information analytiques. Exemples de décisions

PLAN. Les systèmes d'information analytiques. Exemples de décisions Les systèmes d'information analytiques Dr A.R. Baba-ali Maitre de conferences USTHB PLAN Le cycle de decision Les composants analytiques ETL (Extract, Transform and Load) Entrepot de (Data warehouse) Traitement

Plus en détail

2 Serveurs OLAP et introduction au Data Mining

2 Serveurs OLAP et introduction au Data Mining 2-1 2 Serveurs OLAP et introduction au Data Mining 2-2 Création et consultation des cubes en mode client-serveur Serveur OLAP Clients OLAP Clients OLAP 2-3 Intérêt Systèmes serveurs et clients Fonctionnalité

Plus en détail

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation Base de données S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Présentation du module Contenu général Notion de bases de données Fondements / Conception Utilisation :

Plus en détail

Généralités sur les bases de données

Généralités sur les bases de données Généralités sur les bases de données Qu est-ce donc qu une base de données? Que peut-on attendre d un système de gestion de bases de données? Que peut-on faire avec une base de données? 1 Des données?

Plus en détail

LES ENTREPOTS DE DONNEES

LES ENTREPOTS DE DONNEES Module B4 : Projet des Systèmes d information Lille, le 25 mars 2002 LES ENTREPOTS DE DONNEES Problématique : Pour capitaliser ses informations, une entreprise doit-elle commencer par mettre en œuvre des

Plus en détail

Intelligence Economique - Business Intelligence

Intelligence Economique - Business Intelligence Intelligence Economique - Business Intelligence Notion de Business Intelligence Dès qu'il y a une entreprise, il y a implicitement intelligence économique (tout comme il y a du marketing) : quelle produit

Plus en détail

BUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise

BUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise BUSINESS INTELLIGENCE Une vision cockpit : utilité et apport pour l'entreprise 1 Présentation PIERRE-YVES BONVIN, SOLVAXIS BERNARD BOIL, RESP. SI, GROUPE OROLUX 2 AGENDA Définitions Positionnement de la

Plus en détail

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles) SGBDR Systèmes de Gestion de Bases de Données (Relationnelles) Plan Approches Les tâches du SGBD Les transactions Approche 1 Systèmes traditionnels basés sur des fichiers Application 1 Gestion clients

Plus en détail

Méthodologie de conceptualisation BI

Méthodologie de conceptualisation BI Méthodologie de conceptualisation BI Business Intelligence (BI) La Business intelligence est un outil décisionnel incontournable à la gestion stratégique et quotidienne des entités. Il fournit de l information

Plus en détail

Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP)

Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP) Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP) Définition (G. Gardarin) Entrepôt : ensemble de données historisées variant

Plus en détail

Ministère de l Enseignement Supérieur et de la Recherche Scientifique Ecole nationale Supérieure d Informatique (E.S.I) Oued-Smar Alger.

Ministère de l Enseignement Supérieur et de la Recherche Scientifique Ecole nationale Supérieure d Informatique (E.S.I) Oued-Smar Alger. Ministère de l Enseignement Supérieur et de la Recherche Scientifique Ecole nationale Supérieure d Informatique (E.S.I) Oued-Smar Alger École Doctorale Sciences et Technologies de l'information et de la

Plus en détail

Plan. Ce qu est le datawarehouse? Un modèle multidimensionnel. Architecture d un datawarehouse. Implémentation d un datawarehouse

Plan. Ce qu est le datawarehouse? Un modèle multidimensionnel. Architecture d un datawarehouse. Implémentation d un datawarehouse Datawarehouse 1 Plan Ce qu est le datawarehouse? Un modèle multidimensionnel Architecture d un datawarehouse Implémentation d un datawarehouse Autres développements de la technologie data cube 2 Ce qu

Plus en détail

SQL Server 2014 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services, Power BI...)

SQL Server 2014 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services, Power BI...) Avant-propos 1. À qui s'adresse ce livre? 15 2. Pré-requis 15 3. Objectifs du livre 16 4. Notations 17 Introduction à la Business Intelligence 1. Du transactionnel au décisionnel 19 2. Business Intelligence

Plus en détail

QU EST-CE QUE LE DECISIONNEL?

QU EST-CE QUE LE DECISIONNEL? La plupart des entreprises disposent d une masse considérable d informations sur leurs clients, leurs produits, leurs ventes Toutefois ces données sont cloisonnées par les applications utilisées ou parce

Plus en détail

Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise.

Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise. Solutions PME VIPDev Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise. Cette offre est basée sur la mise à disposition de l ensemble de nos compétences techniques et créatives au service

Plus en détail

ETL Extract - Transform - Load

ETL Extract - Transform - Load ETL Extract - Transform - Load Concept général d analyse en ligne (rappels) Rémy Choquet - Université Lyon 2 - Master 2 IIDEE - 2006-2007 Plan Définitions La place d OLAP dans une entreprise OLAP versus

Plus en détail

Dossier I Découverte de Base d Open Office

Dossier I Découverte de Base d Open Office ETUDE D UN SYSTEME DE GESTION DE BASE DE DONNEES RELATIONNELLES Définition : Un SGBD est un logiciel de gestion des données fournissant des méthodes d accès aux informations. Un SGBDR permet de décrire

Plus en détail

Les entrepôts de données

Les entrepôts de données Les entrepôts de données Lydie Soler Janvier 2008 U.F.R. d informatique Document diffusé sous licence Creative Commons by-nc-nd (http://creativecommons.org/licenses/by-nc-nd/2.0/fr/) 1 Plan Introduction

Plus en détail

Les Entrepôts de Données. (Data Warehouses)

Les Entrepôts de Données. (Data Warehouses) Les Entrepôts de Données (Data Warehouses) Pr. Omar Boussaid Département d'informatique et de Sta5s5que Université Lyon2 - France Les Entrepôts de Données 1. Généralités, sur le décisionnel 2. L'entreposage

Plus en détail

Programme scientifique Majeure ARCHITECTURE DES SYSTEMES D INFORMATION. Mentions Ingénierie des Systèmes d Information Business Intelligence

Programme scientifique Majeure ARCHITECTURE DES SYSTEMES D INFORMATION. Mentions Ingénierie des Systèmes d Information Business Intelligence É C O L E D I N G É N I E U R D E S T E C H N O L O G I E S D E L I N F O R M A T I O N E T D E L A C O M M U N I C A T I O N Programme scientifique Majeure ARCHITECTURE DES SYSTEMES D INFORMATION Mentions

Plus en détail

TP Bases de données réparties

TP Bases de données réparties page 1 TP Bases de données réparties requêtes réparties Version corrigée Auteur : Hubert Naacke, révision 5 mars 2003 Mots-clés: bases de données réparties, fragmentation, schéma de placement, lien, jointure

Plus en détail

Business Intelligence

Business Intelligence avec Excel, Power BI et Office 365 Téléchargement www.editions-eni.fr.fr Jean-Pierre GIRARDOT Table des matières 1 Avant-propos A. À qui s adresse ce livre?..................................................

Plus en détail

Apprentissage Automatique

Apprentissage Automatique Apprentissage Automatique Introduction-I jean-francois.bonastre@univ-avignon.fr www.lia.univ-avignon.fr Définition? (Wikipedia) L'apprentissage automatique (machine-learning en anglais) est un des champs

Plus en détail

Bases de données réparties

Bases de données réparties Bases de données réparties J. Akoka - I. Wattiau 1 Contexte Technologique : des solutions de communication efficace entre les machines des SGBD assurent la transparence des données réparties standardisation

Plus en détail

Workflow/DataWarehouse/DataMining. 14-09-98 LORIA - Université d automne 1998 - Informatique décisionnelle - L. Mirtain 1

Workflow/DataWarehouse/DataMining. 14-09-98 LORIA - Université d automne 1998 - Informatique décisionnelle - L. Mirtain 1 Workflow/DataWarehouse/DataMining 14-09-98 LORIA - Université d automne 1998 - Informatique décisionnelle - L. Mirtain 1 plan Workflow DataWarehouse Aide à la décision DataMinig Conclusion 14-09-98 LORIA

Plus en détail

Introduction à ORACLE WAREHOUSE BUILDER Cédric du Mouza

Introduction à ORACLE WAREHOUSE BUILDER Cédric du Mouza Introduction à ORACLE WAREHOUSE BUILDER Cédric du Mouza Avant de commencer à travailler avec le produit, il est nécessaire de comprendre, à un haut niveau, les problèmes en réponse desquels l outil a été

Plus en détail

SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...)

SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...) Avant-propos 1. À qui s'adresse ce livre? 15 2. Pré-requis 15 3. Objectifs du livre 16 4. Notations 17 Introduction à la Business Intelligence 1. Du transactionnel au décisionnel 19 2. Business Intelligence

Plus en détail

Présentation du module. Base de données spatio-temporelles. Exemple. Introduction Exemple. Plan. Plan

Présentation du module. Base de données spatio-temporelles. Exemple. Introduction Exemple. Plan. Plan Base de données spatio-temporelles S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Présentation du module Contenu général Partie 1 : Notion de bases de données (Conception

Plus en détail

Master Exploration Informatique des données DataWareHouse

Master Exploration Informatique des données DataWareHouse Master Exploration Informatique des données DataWareHouse Binôme Ahmed BENSI Enseignant tahar ARIB SOMMAIRE I. Conception...1 1. Contexte des contrats...1 2. Contexte des factures...1 II. Modèle physique...2

Plus en détail

Vers l auto-sélection des index dans les entrepôts de données: une approche basée sur la recherche des motifs fréquents maximaux

Vers l auto-sélection des index dans les entrepôts de données: une approche basée sur la recherche des motifs fréquents maximaux Vers l auto-sélection des index dans les entrepôts de données: une approche basée sur la recherche des motifs fréquents maximaux ZIANI Benameur - OUINTEN Youcef Laboratoire d Informatique et de Mathématiques

Plus en détail

4.2 Unités d enseignement du M1

4.2 Unités d enseignement du M1 88 CHAPITRE 4. DESCRIPTION DES UNITÉS D ENSEIGNEMENT 4.2 Unités d enseignement du M1 Tous les cours sont de 6 ECTS. Modélisation, optimisation et complexité des algorithmes (code RCP106) Objectif : Présenter

Plus en détail

Principes et mise en œuvre du modèle OLAP. -1 ère Partie- La modélisation multidimensionnelle

Principes et mise en œuvre du modèle OLAP. -1 ère Partie- La modélisation multidimensionnelle Principes et mise en œuvre du modèle OLAP -1 ère Partie- La modélisation multidimensionnelle 1 Le modèle multidimensionnel (1) Le modèle multidimensionnel est bien adapté pour représenter des données qui

Plus en détail

Évolution de schémas dans les entrepôts de données mise à jour de hiérarchies de dimension pour la personnalisation des analyses

Évolution de schémas dans les entrepôts de données mise à jour de hiérarchies de dimension pour la personnalisation des analyses Évolution de schémas dans les entrepôts de données mise à jour de hiérarchies de dimension pour la personnalisation des analyses Thèse présentée par Cécile FAVRE pour obtenir le titre de Docteur en Informatique

Plus en détail

Optimisation des tournées de ramassage scolaire de la commune de Seneffe

Optimisation des tournées de ramassage scolaire de la commune de Seneffe Optimisation des tournées de ramassage scolaire de la commune de Seneffe Laurie Hollaert Séminaire GRT 7 novembre Laurie Hollaert Optimisation des tournées de ramassage scolaire de la commune de Seneffe

Plus en détail

Encryptions, compression et partitionnement des données

Encryptions, compression et partitionnement des données Encryptions, compression et partitionnement des données Version 1.0 Grégory CASANOVA 2 Compression, encryption et partitionnement des données Sommaire 1 Introduction... 3 2 Encryption transparente des

Plus en détail

Mémoire de fin d études. Thème Conception et réalisation d un Data Warehouse pour la mise en place d un système décisionnel

Mémoire de fin d études. Thème Conception et réalisation d un Data Warehouse pour la mise en place d un système décisionnel Mémoire de fin d études Pour l obtention du diplôme d Ingénieur d Etat en Informatique Option : Systèmes d information Thème Conception et réalisation d un Data Warehouse pour la mise en place d un système

Plus en détail

5. Architecture et sécurité des systèmes informatiques Dimension Fonctionnelle du SI

5. Architecture et sécurité des systèmes informatiques Dimension Fonctionnelle du SI 5. Architecture et sécurité des systèmes informatiques Dimension Fonctionnelle du SI Un SI : et pour faire quoi? Permet de stocker de manière définitive des informations volatiles provenant d autre BD.

Plus en détail

Construction d'un entrepôt de métadonnées - LOM Application: E-learning

Construction d'un entrepôt de métadonnées - LOM Application: E-learning Construction d'un entrepôt de métadonnées - LOM Application: E-learning Nawel Iles, Azzeddine Chikh, Sidi Mohammed Chouiti Faculté des sciences de l ingénieur Université de Tlemcen Algérie (n_iles/ az_chikh

Plus en détail

et les Systèmes Multidimensionnels

et les Systèmes Multidimensionnels Le Data Warehouse et les Systèmes Multidimensionnels 1 1. Définition d un Data warehouse (DW) Le Data warehouse (entrepôt de données) est une collection de données orientées sujet, intégrées, non volatiles

Plus en détail

1 Introduction et installation

1 Introduction et installation TP d introduction aux bases de données 1 TP d introduction aux bases de données Le but de ce TP est d apprendre à manipuler des bases de données. Dans le cadre du programme d informatique pour tous, on

Plus en détail

INF 1250 INTRODUCTION AUX BASES DE DONNÉES. Guide d étude

INF 1250 INTRODUCTION AUX BASES DE DONNÉES. Guide d étude INF 1250 INTRODUCTION AUX BASES DE DONNÉES Guide d étude Sous la direction de Olga Mariño Télé-université Montréal (Québec) 2011 INF 1250 Introduction aux bases de données 2 INTRODUCTION Le Guide d étude

Plus en détail

BI = Business Intelligence Master Data-ScienceCours 3 - Data

BI = Business Intelligence Master Data-ScienceCours 3 - Data BI = Business Intelligence Master Data-Science Cours 3 - Datawarehouse UPMC 8 février 2015 Rappel L Informatique Décisionnelle (ID), en anglais Business Intelligence (BI), est l informatique à l usage

Plus en détail

La problématique. La philosophie ' ) * )

La problématique. La philosophie ' ) * ) La problématique!" La philosophie #$ % La philosophie &'( ' ) * ) 1 La philosophie +, -) *. Mise en oeuvre Data warehouse ou Datamart /01-2, / 3 13 4,$ / 5 23, 2 * $3 3 63 3 #, 7 Datawarehouse Data warehouse

Plus en détail

FreeAnalysis. Schema Designer. Cubes

FreeAnalysis. Schema Designer. Cubes FreeAnalysis Schema Designer Cubes Charles Martin et Patrick Beaucamp BPM Conseil Contact : charles.martin@bpm-conseil.com, patrick.beaucamp@bpm-conseil.com Janvier 2013 Document : BPM_Vanilla_FreeAnalysisSchemaDesigner_v4.2_FR.odt

Plus en détail

Méthode d extraction des signaux faibles

Méthode d extraction des signaux faibles Méthode d extraction des signaux faibles Cristelle ROUX GFI Bénélux, Luxembourg cristelle.roux@gfi.be 1. Introduction Au début d une analyse stratégique, la première question posée est très souvent la

Plus en détail

SAP BusinessObjects Web Intelligence (WebI) BI 4

SAP BusinessObjects Web Intelligence (WebI) BI 4 Présentation de la Business Intelligence 1. Outils de Business Intelligence 15 2. Historique des logiciels décisionnels 16 3. La suite de logiciels SAP BusinessObjects Business Intelligence Platform 18

Plus en détail

Fouille de Données : OLAP & Data Warehousing

Fouille de Données : OLAP & Data Warehousing Fouille de Données : OLAP & Data Warehousing Nicolas Pasquier Université de Nice Sophia-Antipolis Laboratoire I3S Chapitre 2. Data warehousing Définition : qu est-ce que le data warehousing? Entrepôt de

Plus en détail

Ecole des Hautes Etudes Commerciales HEC Alger. par Amina GACEM. Module Informatique 1ière Année Master Sciences Commerciales

Ecole des Hautes Etudes Commerciales HEC Alger. par Amina GACEM. Module Informatique 1ière Année Master Sciences Commerciales Ecole des Hautes Etudes Commerciales HEC Alger Évolution des SGBDs par Amina GACEM Module Informatique 1ière Année Master Sciences Commerciales Evolution des SGBDs Pour toute remarque, question, commentaire

Plus en détail

10 Intégration de données sur le web

10 Intégration de données sur le web 10 Intégration de données sur le web 240 Requête utilisateur : Où est-ce que je peux voir les films qui ont participé au dernier Festival de Cannes? Je voudrais les résumés et critiques des films de Pedro

Plus en détail

Travail de diplôme 2011 Business Intelligence Open Source SpagoBI/Talend Résumé

Travail de diplôme 2011 Business Intelligence Open Source SpagoBI/Talend Résumé ESNE Travail de diplôme 2011 Business Intelligence Open Source SpagoBI/Talend Résumé I.Cirillo 2010-2011 Introduction Le laboratoire de base de données de l ESNE a mis en place, il y a quelques années,

Plus en détail

Hervé Couturier EVP, SAP Technology Development

Hervé Couturier EVP, SAP Technology Development Hervé Couturier EVP, SAP Technology Development Hervé Biausser Directeur de l Ecole Centrale Paris Bernard Liautaud Fondateur de Business Objects Questions à: Hervé Couturier Hervé Biausser Bernard Liautaud

Plus en détail

Les principaux domaines de l informatique

Les principaux domaines de l informatique Les principaux domaines de l informatique... abordés dans le cadre de ce cours: La Programmation Les Systèmes d Exploitation Les Systèmes d Information La Conception d Interfaces Le Calcul Scientifique

Plus en détail

Business Intelligence avec Excel, Power BI et Office 365

Business Intelligence avec Excel, Power BI et Office 365 Avant-propos A. À qui s adresse ce livre? 9 1. Pourquoi à chaque manager? 9 2. Pourquoi à tout informaticien impliqué dans des projets «BI» 9 B. Obtention des données sources 10 C. Objectif du livre 10

Plus en détail

Bases de Données. Stella MARC-ZWECKER. stella@unistra.u-strasbg.fr. Maître de conférences Dpt. Informatique - UdS

Bases de Données. Stella MARC-ZWECKER. stella@unistra.u-strasbg.fr. Maître de conférences Dpt. Informatique - UdS Bases de Données Stella MARC-ZWECKER Maître de conférences Dpt. Informatique - UdS stella@unistra.u-strasbg.fr 1 Plan du cours 1. Introduction aux BD et aux SGBD Objectifs, fonctionnalités et évolutions

Plus en détail

UE 8 Systèmes d information de gestion Le programme

UE 8 Systèmes d information de gestion Le programme UE 8 Systèmes d information de gestion Le programme Légende : Modifications de l arrêté du 8 mars 2010 Suppressions de l arrêté du 8 mars 2010 Partie inchangée par rapport au programme antérieur Indications

Plus en détail

Ici, le titre de la. Tableaux de bords de conférence

Ici, le titre de la. Tableaux de bords de conférence Ici, le titre de la Tableaux de bords de conférence pilotage d entreprise, indicateurs de performance reporting et BI quels outils seront incontournables à l horizon 2010? Les intervenants Editeur/Intégrateur

Plus en détail

MYXTRACTION. 2009 La Business Intelligence en temps réel

MYXTRACTION. 2009 La Business Intelligence en temps réel MYXTRACTION 2009 La Business Intelligence en temps réel Administration Qui sommes nous? Administration et management des profils Connecteurs Base des données Gestion des variables et catégories de variables

Plus en détail

Discrétisation et génération de hiérarchies de concepts

Discrétisation et génération de hiérarchies de concepts Prétraitement des données 1 Pourquoi prétraiter les données? Nettoyage des données Intégration et transformation Réduction des données Discrétisation et génération de hiérarchies de g concepts Pourquoi

Plus en détail

SWISS ORACLE US ER GRO UP. www.soug.ch. Newsletter 5/2014 Sonderausgabe. OBIF DB licensing with VMware Delphix 12c: SQL Plan / Security Features

SWISS ORACLE US ER GRO UP. www.soug.ch. Newsletter 5/2014 Sonderausgabe. OBIF DB licensing with VMware Delphix 12c: SQL Plan / Security Features SWISS ORACLE US ER GRO UP www.soug.ch Newsletter 5/2014 Sonderausgabe OBIF DB licensing with VMware Delphix 12c: SQL Plan / Security Features 42 TIPS&TECHNIQUES Alexandre Tacchini, Benjamin Gaillard, Fabien

Plus en détail

Cours Base de données relationnelles. M. Boughanem, IUP STRI

Cours Base de données relationnelles. M. Boughanem, IUP STRI Cours Base de données relationnelles 1 Plan 1. Notions de base 2. Modèle relationnel 3. SQL 2 Notions de base (1) Définition intuitive : une base de données est un ensemble d informations, (fichiers),

Plus en détail

arxiv:0707.1304v1 [cs.db] 9 Jul 2007

arxiv:0707.1304v1 [cs.db] 9 Jul 2007 Hadj Mahboubi, Kamel Aouiche, Jérôme Darmont ERIC, Université Lumière Lyon 2 5 avenue Pierre Mendès-France 69676 Bron Cedex { hmahboubi kaouiche jdarmont}@eric.univ-lyon2.fr arxiv:0707.1304v1 [cs.db] 9

Plus en détail

Introduction à l Informatique Décisionnelle - Business Intelligence (7)

Introduction à l Informatique Décisionnelle - Business Intelligence (7) Introduction à l Informatique Décisionnelle - Business Intelligence (7) Bernard ESPINASSE Professeur à Aix-Marseille Université (AMU) Ecole Polytechnique Universitaire de Marseille Septembre 2013 Emergence

Plus en détail