Mémoire. En vue de l obtention du diplôme de Magister en Informatique. Option : SIC (Systèmes d Information et de Connaissances)

Dimension: px
Commencer à balayer dès la page:

Download "Mémoire. En vue de l obtention du diplôme de Magister en Informatique. Option : SIC (Systèmes d Information et de Connaissances)"

Transcription

1 République Algérienne Démocratique et Populaire Ministère de l Enseignement Supérieur et de la Recherche Scientifique E.S.I (Ecole nationale Supérieure d Informatique) (ex. INI) Mémoire En vue de l obtention du diplôme de Magister en Informatique Option : SIC (Systèmes d Information et de Connaissances) Approche dirigée par les fourmis pour la fragmentation horizontale des entrepôts de données relationnels Présenté par Dirigé par : Mohamed BARR : Mr. Ladjel BELLATRECHE, Maître de conférences Université Poitiers, France Devant le jury : Mr. A. BALLA, Maître de conférences ESI (Ex INI), Alger Mme. A.R BENATCHBA, Maître de conférences ESI (Ex INI), Alger Mr. A.R GHOMARI, Maître de conférences ESI (Ex INI), Alger Mr. K. BOUKHALFA, Maître de conférences USTHB, Alger Président Examinatrice Examinateur Examinateur Année universitaire:

2 Dédicaces «Louange à Dieu le tout puissant qui nous a aidé à achever ce travail de recherche, et que le salut soit sur son prophète Mohamed». A mes chers parents et beau-père à titre posthume ; A mes (belles) sœurs et (beaux) frères. A ma petite famille : «ma femme, mes enfants : Raid Salaheddine, Moaied Billah Mohamed, Selsabil, Tesnime, et Iyed Seif Elaqsa», et à ma belle-mère ; A ceux qui croient que la science est la seule voie pour accéder à une parfaite civilisation ; Et à ceux qui m ont aidé moralement et concrètement, de près ou de loin, pour réussir notre effort ; Je dédie cet humble mémoire.

3 Remerciements Je tiens à remercier vivement Monsieur BELLATRECHE Ladjel de m avoir proposé ce sujet qui s intègre dans une activité (Biomimétique) prometteuse qui aide à solutionner pas mal de problèmes qui restaient longtemps difficiles. Je n oublie pas mes gratitudes reconnaissances aux Docteurs BOUKHALFA Kamel, GHOMARI Réda Abdessamed et BOUKRA Abderrazek, pour leurs précieuses aides et orientations. Mes sincères salutations sont cordialement présentées à tous les membres de jury, composé de : - Mr. Amar BALLA de m avoir honoré par sa présidence du jury. Je le remercie également pour l intérêt qu il porte à ce travail. - Mme BENATCHBA, et Mrs Réda Abdessamed GHOMARI et Kamel BOUKHALFA d avoir accepté de faire partie du jury. Leur participation m honore.

4 Résumé Le sujet abordé rentre dans le cadre d utilisation de la biomimétique appliquée à l optimisation des entrepôts de données relationnels. Il consiste à utiliser l algorithme basé sur les colonies de fourmis pour la sélection d une technique d optimisation dans un entrepôt de données relationnel. La technique étudiée est celle de la fragmentation horizontale qui représente l une des techniques d optimisation non redondantes. Le caractère NP-Complet caractérisant cette technique justifie le recours aux méthodes approchées ou «méta heuristiques» pour résoudre ce problème en un temps fini. En effet, l intelligence collective des fourmis artificielles dans la résolution des problèmes d optimisation combinatoire NP-Complets est une activité très prometteuse. Cette approche tire sa capacité par le transfert d apprentissage au sein de la colonie d une manière stigmergique qui utilise l environnement pour communiquer le choix de bonnes solutions en se basant sur la visibilité et le dépôt de phéromone. L émergence vers les solutions optimales, en un temps fini, a fait de cette méthode approchée une possibilité de recours convenable. A travers notre travail, nous avons modélisé notre problème de sélection d un schéma de fragmentation horizontale pour être pris en charge par l approche basée sur les colonies de fourmis tout en définissant les variables d entrées qui sont : l entrepôt de données non fragmenté, la charge de requêtes fréquemment utilisées et le nombre maximal de fragments exigé par l administrateur de l entrepôt de données. Le résultat en sortie est le schéma de fragmentation horizontale qui minimise le coût global de la charge de requêtes. Le paramétrage approprié de dépôt de la phéromone, et l expression significative de l heuristique qui représente la visibilité, nous ont permis d obtenir des résultats très satisfaisants comparables aux résultats déjà obtenus en utilisant l algorithme génétique qui a fait ses preuves pour résoudre ce problème de fragmentation horizontale dans les entrepôts de données relationnels. L expérimentation de notre approche en utilisant un Benchmark (APB1 dans notre cas) est un moyen important pour vérifier l efficacité de la méthode proposée d une part, et de pouvoir la situer par rapport à d autres méthodes qui existent dans ce domaine, d autre part. Mots clés : Biomimétique, Entrepôt de données, Structures non redondantes, Optimisation, Problème NP-Complet, Métaheuristique, Colonie de fourmis.

5 Abstract The subject matter falls within the scope of use of biomimetic applied to the optimization of relational data warehouses. It involves using the algorithm based on ant colony for the selection of an optimization technique in a relational data warehouse. The horizontal fragmentation is a non-redundant technique. The NP-complete nature characterizing the selection of this technique justifies the use of approximate methods or metaheuristics to solve this problem in a finite time. Indeed the collective intelligence of artificial ants in solving combinatorial optimization problems NP- Complete is a highly promising. This approach draws its capacity through the transfer of learning within the colony in a manner that uses stigmergy environment to communicate the choice of good solutions based on visibility and depositing pheromone. The rise to optimal solutions in a finite time has made this method an approximate proper recourse. Through our work we have modeled the problem of selecting a horizontal fragmentation pattern to be supported by the ants approach with the following input variables: the unfragmented data warehouse, the query load frequently used, the maximum number of fragments required by the administrator of the data warehouse. The result output is a horizontal fragmentation pattern that minimizes the overall cost of the query load. Setting proper filing of the pheromone, and significant expression of heuristics which represents the visibility; we have obtained satisfactory results comparable to the ones already obtained using the genetic algorithm which is used to solve the problem of horizontal fragmentation in relational data warehouses. The testing of our approach according to a Benchmark (APB1 in our case) is an important way to verify the effectiveness of the method used on the one hand, and to situate it in relation to other methods that exist in this area on the other hand. Keywords: Biomimetics, Data Warehouse, Non-redundant structures, Optimization, NP-Complete problem, Metaheuristics, Ant-colony.

6 Sommaire Dédicaces... 2 Remerciements... 3 Résumé... 4 Liste des tableaux Liste des algorithmes Chapitre I. Introduction générale I.1. Problématique I.2. Motivations pour l utilisation de la métaheuristique basée sur les colonies de fourmis I.3. Notre approche I.4. Organisation du mémoire Chapitre II. Les Structures d optimisation dans un Entrepôt De Données Relationnel II.1. Introduction II.2. Notion d entrepôt de données II.3. Modèle de données pour les entrepôts II.4. Opérations liées à la structure II.5. Opérations associées à la granularité II.6. Les implémentations des modèles multidimensionnels II.7. Structures d optimisation d un entrepôt de données II.7.1. Les index II.8. Les vues matérialisées II.9. Sélection simultanée d index et des vues matérialisées II.10. Fragmentation II.11. Aperçu sur les travaux de fragmentation verticale II.12. Conclusion Chapitre III. Fragmentation Horizontale III.1. Introduction III.2. Fragmentation horizontale dans les entrepôts de données III.3. Méthodologie de fragmentation horizontale dans les entrepôts de données III.4. La complexité de la procédure de fragmentation III.5. Méthodes de fragmentation horizontale... 54

7 III.6. Processus de fragmentation horizontale III.7. Optimisation avec contraintes III.8. Estimation de la sélectivité des prédicats III.9. Estimation de la sélectivité des prédicats complexes Chapitre IV. Les Méta heuristiques. Cas particulier : méta heuristiques basées sur les fourmis IV.1. Introduction IV.2. Généralités sur la notion d optimisation IV.3. Etat de l art sur les méta-heuristiques IV.4. Colonies de fourmis IV.5. Fourmis artificielles IV.6. Inspiration dans le domaine de robotique IV.7. Les fourmis et l optimisation combinatoire IV.8. Méta heuristique basée sur les fourmis IV.9. Applications de la métaheuristique de fourmis IV.10. Les fourmis et le problème de classification IV.11. Méthodes de partitionnement et les fourmis IV.12. Hybridation des méthodes de Colonie de fourmis avec d autres heuristiques IV.13. Efficacité de l Algorithme basé sur les fourmis ACS (Ant colonies system) IV.14. Optimisation à base de Colonie de Fourmis (ACO) appliquées dans les bases de données Chapitre V. Approche dirigée par les fourmis pour la sélection de la fragmentation horizontale pour l optimisation d un entrepôt de données relationnel.. 85 V.1. Introduction V.2. Architecture générale de la solution V.3. Définition du problème de sac à dos V.4. Formulation Mathématique V.5. Formalisation de notre problème de fragmentation horizontale en utilisant le problème du sac à dos V.6. Définition des paramètres nécessaires pour l application de l Algorithme de Colonie de Fourmis V.7. Schéma de l entrepôt de données (en étoile) V.8. Implémentation de la solution V.9. Evaluation des résultats

8 V.10. Résultats d expérimentation V.11. Validation sous Oracle 10g V.12. Etude comparative entre l Algorithme Génétique et L Algorithme de Colonie de Fourmis V.13. Interprétation des résultats obtenus relativement aux deux méthodes Chapitre VI. Conclusion générale Bibliographie Annexe Annexe

9 Liste des figures Figure 1. Architecture générale d un Datawarehouse [GOGLIN, 2000] Figure 2. Schéma de l entrepôt (Modèle Conceptuel de Données MCD) Figure 3. Un exemple de cube Figure 4. Classification des techniques d optimisation Figure 5. Exemple d'expression AND-DAG [AOUICHE, 2005] Figure 6. Recommandation de technique d optimisation de RIZZI et SALTARELLI [DARMONT, 2006] Figure 7. Schéma d une recherche locale [CANEGHEM, 2002] Figure 8. Exemple d un voisinage 2 opt [CANEGHEM, 2002] Figure 9. Exemple d un voisinage 3 opt [CANEGHEM, 2002] Figure 10. Évolution des publications sur les fourmis artificielles [MONMARCHE, 2007] Figure 11. Emergence des fourmis en fonction de dépôt de phéromone Figure 12. Architecture générale de la solution retenue Figure 13. Quel objet à mettre dans le sac? Figure 14. Graphe des prédicats de sélection Figure 15. Modèle Logique de Données de l entrepôt du Benchmark APB Figure 16. Menu principal du logiciel Figure 17. Fenêtre principale du logiciel Figure 18. Paramètres d utilisation Figure 19. Lancement du logiciel Figure 20. Visualisation des résultats Figure 21. Sauvegarde des résultats Figure 22. Capture d écran du schéma de fragmentation plus l indication des tailles des partitions obtenues par le logiciel Figure 23. Evolution du nombre d'e/s en fonction du nombre de fragments Figure 24. Gains en nombre d'entrées/sorties en fonction du nombre de fragments Figure 25. Dégradation de la solution pour la négligence du facteur Bêta de l heuristique Figure 26. Capture d écran : taille de la table des faits actvars du Benchmark, avant fragmentation Figure 27. Capture d écran : taille des partitions de la table des faits partitionnée appelée «actvars_partitionné_by_list» du Benchmark, après fragmentation Figure 28. Comparaison entre l AG et l Approche des Fourmis (Nombre d Entrées/Sorties) en fonction des nombres de fragments Figure 29. Comparaisons des Résultats (gains en Entrées/Sorties) avant répartition Figure 30. Comparaison des résultats entre l AG et l Approche des Fourmis Figure 31. Comparaison des gains en nombre d entrées/sorties entre l AG et l AF suite à la répartition du fragment volumineux

10 Figure 32. Capture d écran de création de la table partitionnée sous oracle 10g et l outil PLSQL- Developper Figure 33. Capture d écran de visualisation de la table de travail t0 sous Discoverer oracle 10g. 172 Figure 34. Histogramme de la requête Q1 avant fragmentation Figure 35. Histogramme de la requête Q1 après fragmentation Figure 36. Interface de l outil de Business Intelligence «Oracle Discoverer Administrator : Figure 37. Interface de l outil de Business Intelligence «Oracle Discoverer desctop : partie client» pour visualisation des résultats de la requête 1 après fragmentation Figure 38. Visualisation des résultats de la requête 1 après fragmentation sous Oracle Discoverer Figure 39. Capture d écran de visualisation des résultats de la requête 32 après fragmentation Sous PLSQL-Developper Figure 40. Capture d écran de visualisation des résultats de la requête 32 après fragmentation. 179 Figure 41. Histogramme requête 55 avant fragmentation Figure 42. Requête 55 après fragmentation Figure 43. Résultats obtenus à base de l Algorithme Génétique (32 fragments) [BOUKHALFA, 2005]

11 Liste des tableaux Tableau 1. Comparaison entre les deux systèmes : ROLAP et MOLAP Tableau 2. Calcul de la pertinence entre deux vues matérialisées Tableau 3. Problèmes combinatoires traités par les fourmis [DORIGO, 2001] Tableau 4. Mapping entre le sac à dos et le problème de sélection de la fragmentation horizontale Tableau 5 Cardinalité des tables du Benchmark Tableau 6. Alimentation du logiciel des sélectivités des prédicats d attributs de l entrepôt de données du Benchmark pour évaluation des charges Tableau 7. Taux d amélioration en fonction du nombre de fragments Tableau 8. Nouveau gain en nombre d Entrées/Sorties après répartition de la partition volumineuse Tableau 9. Taux d amélioration suite à la répartition du fragment volumineux part_ Tableau 10. Tableau comparatif entre l Algorithme Génétique et l Algorithme de Colonie de Fourmis Tableau 11. Tableau comparatif des résultats entre L Approche des Fourmis et l Algorithme Génétique avant répartition des fragments volumineux Tableau 12. Comparaisons des Résultats (gains en Entrées/Sorties) avant répartition Tableau 13. Points forts et points faibles des deux méthodes (Ag et Approche des Fourmis) Tableau 14. Légende utilisée Tableau 15. Tableau d usage des prédicats simples par rapport aux requêtes de la charge Tableau 16. Tableau de mise en évidence des tailles relatives aux prédicats, dans la table des faits du Benchmark Tableau 17. Tableau de sélectivités des prédicats contenus dans la charge du Benchmark Tableau 18. Alimentation du logiciel par les sélectivités de tous les prédicats simples pour sélectionner les meilleurs sous ensembles de prédicats en termes d optimisation Tableau 19. Représentation des 32 fragments obtenus Tableau 20. Répartition d un prédicat sur plusieurs fragments Tableau 21. Evaluation du gain en nombre d Entrées/Sorties pour un schéma de 32 fragments. 170 Tableau 22. Eclatement de la partition volumineuse en sous partitions de tailles raisonnables en fonction de l attribut Mois_level Tableau 23. Feuille de calcul extraite des résultats via l outil Oracle Discoverer

12 Liste des algorithmes Algorithme 1 : Algorithme de construction d un index bitmap [FAVRE, 2003] Algorithme 2 : Algorithme de sélection de vues basée sur la pertinence [AOUICHE, 2005] Algorithme 3 :Algorithme de Hill Climbing [CANEGHEM, 2002] Algorithme 4 : Algorithme de Recuit simulé [CANEGHEM, 2002] Algorithme 5 : Algorithme Tabou [BREZELLEC, 1992] Algorithme 6 : Algorithmes génétiques [CANEGHEM, 2002] Algorithme 7 : Algorithme AS-TSP [DORIGO & AL., 2002] Algorithme 8 : Algorithme de détection d un graphe hamiltonien à base des fourmis [CANEGHEM, 2002] Algorithme 9 : Algorithme ACS-LK [TADUNFOCK & AL., 2006] Algorithme 10 : Pseudo code de l algorithme de fourmis [MANIEZZO & AL., 2001] Algorithme 11 : Algorithme ACO générique adapté pour le Sac A Dos [ALAYA & AL. 2005]... 95

13 Chapitre I. Introduction Générale Chapitre I. Introduction générale I.1. Problématique Les entrepôts de données sont des bases de données destinées à contenir les informations de prise de décisions qui sont utiles aux managers des entreprises. Les entrepôts de données peuvent être multidimensionnels ou relationnels. Ces derniers sont conçus suivant une architecture en étoile ou en flacon de neiges. Suivant ces deux architectures, les entrepôts sont construits autour d une table de faits, souvent très volumineuse, qui peut atteindre plusieurs téraoctets, entourée de plusieurs tables de dimensions qui contiennent les axes d analyse relativement aux indicateurs ou mesures contenus dans la table des faits. La volumétrie de la table de faits et la multitude de jointures entre elles et les tables de dimensions rendent l extraction des informations, via des requêtes décisionnelles, une tâche coûteuse en temps et en espace. Pour réduire le temps de réponse des requêtes décisionnelles, il y a lieu d utiliser des structures et des techniques d optimisation, comme les index, les vues matérialisées, les techniques de fragmentation horizontale, etc. Dans [AOUICHE., 2005], il a été démontré que le problème de sélection d une telle structure ou technique de fragmentation est un problème NP-complet. Cette caractéristique de l opération de sélection a obligé les chercheurs à recourir à des méthodes approchées ou «métaheuristiques» pour résoudre ce problème en un temps fini. Parmi ces métaheuristiques, qui sont déjà utilisées dans ce contexte, nous citons le travail présenté dans [BOUKHALFA & AL., 2005] basé sur les algorithmes génétiques. Notre travail se base sur l approche des colonies de fourmis pour exploiter l intelligence collective de ces dernières afin de sélectionner un schéma de fragmentation horizontale qui soit le plus optimal possible. La particularité de notre contribution est quelle n applique pas directement un algorithme, comme le font les approches existantes, pour solutionner le problème de fragmentation, mais elle effectue un mapping entre notre problème et celui du sac à dos, qui sont tous les deux NP-complets. La résolution du problème de sac à dos à l aide de l approche des fourmis [ALAYA & AL. 2005], nous a facilité la modélisation et la résolution de notre problème tout en adaptant et paramétrant l algorithme sur le problème 13

14 Chapitre I. Introduction Générale de fragmentation horizontale. Nous nous sommes basés sur un modèle de coût pour estimer le coût de la fonction objectif qui consiste, dans le cadre de notre contribution, à minimiser le nombre d entrées/sorties entre le disque et la mémoire centrale lors de l exécution des requêtes décisionnelles. Nous avons supposé également que les tailles des tables de dimensions et les coûts de jointure sont négligeables Enfin, les expérimentations que nous avons mené sur le Benchmark APB1 des entrepôts de données relationnels ainsi que la comparaison des résultats obtenus par rapport à ceux obtenus en utilisant les algorithmes génétiques, sont deux facteurs d intérêt capital pour juger de la pertinence de l approche proposée dans ce magister. I.2. Motivations pour l utilisation de la métaheuristique basée sur les colonies de fourmis L approche basée sur les colonies de fourmis tire sa force des éléments suivants : Le transfert de l apprentissage au sein de la colonie de fourmis d une manière stigmergique (en utilisant l environnement) en fonction de la matière ou «phéromone» déposée par les différentes fourmis afin de guider les fourmis qui suivent. La considération de la visibilité des points de choix dans l espace de recherche, qui aide à la résolution du problème des optimums locaux. Le procédé par exploration de la méthode en fonction de l heuristique utilisée, et par exploitation d une manière stigmergique à l aide de dépôt de phéromone, a fait d elle une approche de construction et d amélioration de solution à la fois [DREO & AL, 2003]. En effet, l application de cette approche a donné de bons résultats dans l optimisation des structures de bases de données. Les travaux menés dans [BOUKRA & AL, 2007] et [MANIEZZO & AL., 2001], sont deux exemples types de l illustration de la performance de la méthode. Ils concernent respectivement les vues matérialisées et la fragmentation verticale. Dans le premier travail, les auteurs ont justifié la performance de la méthode par le phénomène d émergence dans l organisation des fourmis provoquée par le transfert de l apprentissage intelligent par rapport à des générations aléatoires utilisées dans le cadre 14

15 Chapitre I. Introduction Générale des algorithmes génétiques. La même conclusion peut être faite dans le cadre du deuxième travail surtout dans le cas d un nombre important de requêtes de petite taille. I.3. Notre approche Nous nous intéressons dans le présent travail à la Fragmentation Horizontale, en particulier le problème de sélection d'un schéma de fragmentation horizontale. Nous proposons une approche de sélection basée sur les colonies de fourmis. Les étapes d adaptation de notre problème d optimisation sont les suivantes : Identifier les éléments (prédicats ou fragments dans notre cas) candidats qui peuvent participer aux solutions ; Construire des solutions en fonction des éléments ou objets candidats ; Procéder aux améliorations de la fonction objectif ; Mener des expérimentations en utilisant un Benchmark ; Evaluer la démarche ; Analyser les résultats ; Comparer la méthode avec l heuristique basée sur les algorithmes génétiques ; Tirer des conclusions et projeter des perspectives. I.4. Organisation du mémoire Ce mémoire est organisé de la manière suivante : Le chapitre II présente les structures d optimisation dans un entrepôt de données dans le but de donner une idée sur les structures d optimisation déjà utilisées et rappeler les contraintes de leurs usages. Le chapitre III est consacré au principal volet de notre travail qui est «la fragmentation horizontale». Dans ce chapitre un rappel sur la complexité du problème de fragmentation est présenté, et le processus de fragmentation horizontale est discuté. La difficulté du problème de sélection de la fragmentation horizontale, comme une technique de performance et d optimisation dans un entrepôt relationnel, a conduit au recours aux solutions approchées pour résoudre ce problème. 15

16 Chapitre I. Introduction Générale Dans le chapitre IV, un état de l art sur les métaheuristiques est présenté. Ces métaheuristiques sont illustrées par leurs algorithmes associés, afin de mettre en évidence les variables d entrée et les résultats retournés par chaque algorithme. Une étude plus détaillée a impliqué la métaheuristique basée sur les colonies de fourmis. C est cette approche que nous avons utilisé dans le cadre de notre travail pour prendre en charge le problème de sélection de la fragmentation horizontale. Dans le chapitre V, nous présentons la modélisation du problème de sélection de la Fragmentation Horizontale en utilisant une approche basée sur les colonies de fourmis. Le formalisme retenu a fait l objet d une expérimentation basée sur l utilisation du Benchmark APB1. Les résultats obtenus ont fait l objet d une évaluation et d une analyse pour montrer la bonne configuration de l algorithme. Enfin, et pour situer notre contribution par rapport aux méthodes existantes, nous avons procédé à une comparaison entre un algorithme génétique (AG) et celui basé sur les colonies de fourmis pour déterminer tous les aspects relatifs à l utilisation des deux algorithmes. Enfin, une conclusion rappelle la problématique étudiée ainsi que les résultats obtenus. Cette conclusion nous a permis de lister quelques perspectives de prolongement de nos travaux. 16

17 Chapitre II. Les Structures d optimisation dans un Entrepôt De Données Relationnel Chapitre II. Les Structures d optimisation dans un Entrepôt De Données Relationnel II.1. Introduction Le projet d informatique décisionnelle (ou Business Intelligence) constitue le pond qui relie la stratégie business et la stratégie technologie d information d une entreprise.[tea, 2004] Les entrepôts de données sont les bases qui contiennent les informations de prise de décision. Ces entrepôts peuvent être conçus d une manière multidimensionnelle ou relationnelle. Par rapport au modèle relationnel, les entrepôts de données sont de deux types en flocon de neiges ou en étoile. Et suivant l architecture en étoile, l entrepôt est constitué d une table de faits volumineuse, entourée de plusieurs tables de dimensions qui contiennent les axes d analyse. Pour extraire les indicateurs contenus dans les tables de faits, nous avons besoin d écrire des requêtes décisionnelles complexes caractérisées par une multitude de jointures entre la table des faits et les tables de dimensions. La conception physique des entrepôts de données est une préoccupation majeure des chercheurs dans le domaine de l informatique décisionnelle. [BELLATRECHE, 2007] Parmi les sujets qui rentrent dans le cadre de mise en place des entrepôts de données, nous trouvons les structures d optimisation ayant pour objectif fondamental la gestion des données des entrepôts d une manière performante. Ces techniques ou structures de données peuvent être des index, des vues matérialisées, ou la technique de la fragmentation (horizontale ou verticale). Certaines de ces structures présentent des avantages et/ou des inconvénients par rapport aux autres. L objectif prioritaire de ces techniques ou structures est de fournir des formes d optimisation par rapport aux différents critères tels que (le volume de stockage, la rapidité d accès, le coût de maintenance, etc..). 17

18 Chapitre II. Les Structures d optimisation dans un Entrepôt De Données Relationnel La sélection d une configuration d optimisation quelconque de ces structures est un problème NP-Complet. La difficulté de sélection d une telle structure peut être résolue par des méthodes exactes ou des approches approchées. Les limitations des méthodes exactes ont obligé les chercheurs à utiliser des approches approximatives appelées «métaheuristiques». Parmi les métaheuristiques les plus récentes, nous trouvons celle basée sur les fourmis, qui a été appliqué pour résoudre plusieurs problèmes NP-Complets. Notre contribution à travers ce mémoire, consistera à appliquer l algorithme de la colonie des fourmis pour résoudre le problème NP-Complet de la technique de «Fragmentation Horizontale» dans un entrepôt de données relationnel. [BELLATRECHE & AL., 2009] A travers ce chapitre, nous allons relater l état de l art des différentes structures et techniques d optimisation dans les entrepôts de données. Puis nous présentons quelques algorithmes utilisés pour sélectionner ces techniques ou structures. II.2. Notion d entrepôt de données II.2.1. Définitions Dans [INMON, 1994], l auteur considéré comme le père du concept «datawarehouse», le définit comme suit : Le data warhouse est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées pour le support d un processus d aide à la décision». Dans [FROMAN & AL., 2003], une deuxième définition est donnée : «Un entrepôt de données sert à consolider les données stratégiques de l organisation et les mettre à la disposition des gestionnaires à des fins d aide à la décision. Les nombreuses données accumulées dans les fichiers et les bases de données des systèmes transactionnels sont souvent dispersées, disparates, incohérentes, mal connues, et leur mise à jour n est pas toujours synchronisée. Il s agit alors de réorganiser ces grandes masses de données opérationnelles en fonction 18

19 Chapitre II. Les Structures d optimisation dans un Entrepôt De Données Relationnel de quatre caractéristiques: intégration, orientation sujet, sensibilité au temps, nonvolatilité, et d un objectif: l aide à la décision». «Structure informatique dans laquelle est centralisé un volume important de données consolidées à partir des différentes sources de renseignements d'une entreprise (notamment les bases de données internes). L'organisation des données est conçue pour que les personnes intéressées aient accès rapidement et sous forme synthétique à l'information stratégique dont elles ont besoin pour la prise de décision». Et enfin dans [KERKRI & AL., 1998], un entrepôt de données est défini comme suit : «Un entrepôt de données est défini comme étant une collection de technologies décisionnelles formant un environnement permettant aux décideurs de prendre des décisions plus pertinentes et plus rapides. Pour cela, l'entrepôt de données doit faciliter l'accès aux informations de l'entreprise, assurer la cohérence des informations et permettre le découpage des données. Ces objectifs impliquent l'intégration d'outils de requête, d'analyse et de présentation d'informations. De même les données doivent être soigneusement rassemblées à partir de différentes sources d'informations puis nettoyées et filtrées et n'être diffusées qu'après validation de leur qualité. Ainsi, l'information fournie par un entrepôt de données n'est pas une donnée brute mais une information qui éclaire le décideur ; elle est orientée sujet, agrégée, facile d'accès, fiable et pertinente, non volatile et possède un contexte temporel spécifique. Le Data Warehousing repose sur l'idée d'extraire des informations utiles et de les combiner dans un ensemble cohérent, le Data Warehouse ou entrepôt de données. La cohérence des données est mesurée globalement, elle est jugée du point de vue du manager qui cherche à savoir si par exemple un chargement de données en cours est bien un ensemble de données complet et cohérent» Ces définitions mettent l accent sur les caractéristiques suivantes des informations incluses dans l entrepôt, à savoir : 1- L information doit être thématique, c est-à-dire liée à un métier par exemple finances, ressources humaines, production, etc. 2- Elle doit être organisée pour aider à la décision. 19

20 Chapitre II. Les Structures d optimisation dans un Entrepôt De Données Relationnel 3- Elle doit être historiée pour permettre au décideur d aller dans le temps et faire des comparaisons et des projections dans le temps pour pouvoir donner des explications et des interprétations relativement à, l évolution de cette information. II.2.2. Entrepôt de données et bases de données opérationnelles L entrepôt de données étant la structure destinée à contenir les informations de prise de décision. Dans un système d information décisionnel séparé conceptuellement par rapport aux applications de production et dépendant pour son alimentation. Pour cet effet, le système d information décisionnel est un mécanisme à double face parce que : Il consomme des données d origines diverses, généralement opérationnelles ; Il produit des informations pour des objectifs bien définis. Figure 1. Architecture générale d un Datawarehouse [GOGLIN, 2000] II.2.3. Facteurs de succès d un Entrepôt de données Les caractéristiques le plus souvent associés à la réussite d un datawarehouse sont : des objectifs clairs à atteindre, d où la mesurabilité des phénomènes à prendre en charge, 20

Approche dirigée par les fourmis pour la fragmentation horizontale dans les entrepôts de données relationnels

Approche dirigée par les fourmis pour la fragmentation horizontale dans les entrepôts de données relationnels 16 Soumis le : 26 Avril 2010 Forme révisée acceptée le : 09 Juillet 2011 Email de l'auteur correspondant : m_barr@esi.dz Nature & Technologie Approche dirigée par les fourmis pour la fragmentation horizontale

Plus en détail

Techniques d optimisation des requêtes dans les data warehouses

Techniques d optimisation des requêtes dans les data warehouses Techniques d optimisation des requêtes dans les data warehouses Ladjel Bellatreche LISI/ENSMA Téléport2-1, Avenue Clément Ader 86960 Futuroscope - FRANCE bellatreche@ensma.fr Résumé Un entrepôt de données

Plus en détail

et les Systèmes Multidimensionnels

et les Systèmes Multidimensionnels Le Data Warehouse et les Systèmes Multidimensionnels 1 1. Définition d un Datawarehouse (DW) Le Datawarehouse est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées

Plus en détail

Administration et Tuning des Entrepôts de Données

Administration et Tuning des Entrepôts de Données Administration et Tuning des Entrepôts de Données Optimisation par Index de Jointure Binaires et Fragmentation Horizontale Rym Bouchakri Ecole Doctorale STIC ESI Alger, Algérie r_bouchakri@esi.dz Ladjel

Plus en détail

OptAssist : outil d assistance pour l optimisation des entrepôts de données relationnels

OptAssist : outil d assistance pour l optimisation des entrepôts de données relationnels OptAssist : outil d assistance pour l optimisation des entrepôts de données relationnels Kamel Boukhalfa 1, Ladjel Bellatreche 2, and Zaia Alimazighi 1 1 USTHB University - Algiers - Algeria boukhalk@ensma.fr,

Plus en détail

La conception physique des data warehouses

La conception physique des data warehouses La conception physique des data warehouses Ladjel Bellatreche LISI/ENSMA Téléport2-1, Avenue Clément Ader 86960 Futuroscope - France bellatreche@ensma.fr Résumé Un entrepôt de données est une collection

Plus en détail

Chapitre 9 : Informatique décisionnelle

Chapitre 9 : Informatique décisionnelle Chapitre 9 : Informatique décisionnelle Sommaire Introduction... 3 Définition... 3 Les domaines d application de l informatique décisionnelle... 4 Architecture d un système décisionnel... 5 L outil Oracle

Plus en détail

Entrepôt de données 1. Introduction

Entrepôt de données 1. Introduction Entrepôt de données 1 (data warehouse) Introduction 1 Présentation Le concept d entrepôt de données a été formalisé pour la première fois en 1990 par Bill Inmon. Il s agissait de constituer une base de

Plus en détail

Maintenance de charge pour l optimisation des entrepôts de données évolutifs : aide à l administrateur

Maintenance de charge pour l optimisation des entrepôts de données évolutifs : aide à l administrateur Maintenance de charge pour l optimisation des entrepôts de données évolutifs : aide à l administrateur Cécile Favre, Fadila Bentayeb, Omar Boussaid Université de Lyon (Laboratoire ERIC - Lyon 2) 5 av.

Plus en détail

ParAdmin: Un Outil d'assistance à l'administration et Tuning d'un Entrepôt de Données

ParAdmin: Un Outil d'assistance à l'administration et Tuning d'un Entrepôt de Données Laboratoire d Informatique Scientifique et Industrielle École Nationale Supérieure de Mécanique et d Aérotechnique, avenue Clément Ader - BP 49-8696 Futuroscope cedex - France ParAdmin: Un Outil d'assistance

Plus en détail

THESE. Pour l obtention du Grade de. Ecole Doctorale : Sciences pour l Ingénieur et Aéronautique. Secteur de Recherche : Informatique et Applications

THESE. Pour l obtention du Grade de. Ecole Doctorale : Sciences pour l Ingénieur et Aéronautique. Secteur de Recherche : Informatique et Applications THESE Pour l obtention du Grade de DOCTEUR DE L ECOLE NATIONALE SUPERIEURE DE MECANIQUE ET D AEROTECHNIQUE (Diplôme national-arrêté du 7 août 2006) Ecole Doctorale : Sciences pour l Ingénieur et Aéronautique

Plus en détail

Entrepôts de données. NEGRE Elsa Université Paris-Dauphine 2015-2016

Entrepôts de données. NEGRE Elsa Université Paris-Dauphine 2015-2016 Entrepôts de données NEGRE Elsa Université Paris-Dauphine 2015-2016 Contexte et problématique Le processus de prise de décision L entrepôt de données Définition Différence avec un SGBD Caractéristiques

Plus en détail

Ministère de l Enseignement Supérieur et de la Recherche Scientifique. Ecole nationale Supérieure d Informatique (ESI) (Oued Semar, Alger) Mémoire

Ministère de l Enseignement Supérieur et de la Recherche Scientifique. Ecole nationale Supérieure d Informatique (ESI) (Oued Semar, Alger) Mémoire Ministère de l Enseignement Supérieur et de la Recherche Scientifique Ecole nationale Supérieure d Informatique (ESI) (Oued Semar, Alger) École Doctorale Sciences et Technologies de l'information et de

Plus en détail

Informatique Décisionnelle pour l environnement

Informatique Décisionnelle pour l environnement Territoires, Environnement, Télédétection et Information Spatiale Unité mixte de recherche AgroParisTech - Cirad - Irstea Informatique Décisionnelle pour l environnement Principe, architecture informatique

Plus en détail

Les Entrepôts de Données

Les Entrepôts de Données Les Entrepôts de Données Grégory Bonnet Abdel-Illah Mouaddib GREYC Dépt Dépt informatique :: GREYC Dépt Dépt informatique :: Cours Cours SIR SIR Systèmes d information décisionnels Nouvelles générations

Plus en détail

UNIVERSITÉ MOHAMMED V AGDAL. FACULTÉ DES SCIENCES Rabat THÈSE DE DOCTORAT. Présentée par ELhoussaine ZIYATI Discipline : Sciences de l ingénieur

UNIVERSITÉ MOHAMMED V AGDAL. FACULTÉ DES SCIENCES Rabat THÈSE DE DOCTORAT. Présentée par ELhoussaine ZIYATI Discipline : Sciences de l ingénieur UNIVERSITÉ MOHAMMED V AGDAL FACULTÉ DES SCIENCES Rabat N d ordre 2491 THÈSE DE DOCTORAT Présentée par ELhoussaine ZIYATI Discipline : Sciences de l ingénieur Spécialité : Informatique et Télécommunications

Plus en détail

Bases de Données Avancées

Bases de Données Avancées 1/26 Bases de Données Avancées DataWareHouse Thierry Hamon Bureau H202 - Institut Galilée Tél. : 33 1.48.38.35.53 Bureau 150 LIM&BIO EA 3969 Université Paris 13 - UFR Léonard de Vinci 74, rue Marcel Cachin,

Plus en détail

Sommaire. Introduction. Opérations typiques. Langages. Architectures

Sommaire. Introduction. Opérations typiques. Langages. Architectures OLAP IED 2006-2007 Sommaire Introduction Opérations typiques Langages Architectures Introduction Contexte un entrepôt de données offre des données - nombreuses - homogènes - exploitables - multidimensionnelles

Plus en détail

CARTE HEURISTIQUE...1 LA CHAÎNE DÉCISIONNELLE...2. Collecte des données...2 Stockage des Données...3 Exploitation des Données...4 OLTP ET OLAP...

CARTE HEURISTIQUE...1 LA CHAÎNE DÉCISIONNELLE...2. Collecte des données...2 Stockage des Données...3 Exploitation des Données...4 OLTP ET OLAP... Table des matières CARTE HEURISTIQUE...1 LA CHAÎNE DÉCISIONNELLE...2 Collecte des données...2 Stockage des Données...3 Exploitation des Données...4 OLTP ET OLAP...6 OPÉRATIONS SUR LES CUBES...7 Exemple

Plus en détail

Le "tout fichier" Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique

Le tout fichier Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique Introduction à l informatique : Information automatisée Le premier ordinateur Définition disque dure, mémoire, carte mémoire, carte mère etc Architecture d un ordinateur Les constructeurs leader du marché

Plus en détail

Bases de données multidimensionnelles OLAP. OnLine Analytical Processing

Bases de données multidimensionnelles OLAP. OnLine Analytical Processing Bases de données multidimensionnelles OLAP OnLine Analytical Processing OLAP OLAP (On Line Analytical Processing): Ensemble des outils nécessaires pour la mise en place d'un Système d'information décisionnel

Plus en détail

BI = Business Intelligence Master Data-ScienceCours 4 - OLAP

BI = Business Intelligence Master Data-ScienceCours 4 - OLAP BI = Business Intelligence Master Data-Science Cours 4 - OLAP UPMC 15 février 2015 Plan Vision générale ETL Datawarehouse OLAP Reporting Data Mining Entrepôt de données Les entrepôts de données (data warehouse)

Plus en détail

Business Intelligence : Informatique Décisionnelle

Business Intelligence : Informatique Décisionnelle Business Intelligence : Informatique Décisionnelle On appelle «aide à la décision», «décisionnel», ou encore «business intelligence», un ensemble de solutions informatiques permettant l analyse des données

Plus en détail

Système OLAP Fresqueau

Système OLAP Fresqueau Système OLAP Fresqueau Kamal BOULIL Journées 20 mars Strasbourg Réunion plénière -Fresqueau 07-08 octobre 2013 1 Plan 1. Introduction 1. Projet ANR Fresqueau 2. Systèmes OLAP 2. Système OLAP Fresqueau

Plus en détail

Entreposage, analyse en ligne et fouille de données

Entreposage, analyse en ligne et fouille de données Entreposage, analyse en ligne et fouille de données Houssem Jerbi IRIT - SIG/ED jerbi@irit.fr Journée COMPIL " Bases de Données" 14/12/2010 PLAN Introduction Bases de données Entrepôt de données Technologie

Plus en détail

Présentation du module Base de données spatio-temporelles

Présentation du module Base de données spatio-temporelles Présentation du module Base de données spatio-temporelles S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Partie 1 : Notion de bases de données (12,5h ) Enjeux et principes

Plus en détail

Oracle Décisionnel : Modèle OLAP et Vue matérialisée D BILEK

Oracle Décisionnel : Modèle OLAP et Vue matérialisée D BILEK Oracle Décisionnel : Modèle OLAP et Vue matérialisée SOMMAIRE Introduction Le modèle en étoiles Requêtes OLAP Vue matérialisée Fonctions Roll up et Cube Application Introduction Data Warehouse Moteur OLAP

Plus en détail

Business & High Technology

Business & High Technology UNIVERSITE DE TUNIS INSTITUT SUPERIEUR DE GESTION DE TUNIS Département : Informatique Business & High Technology Chapitre 8 : ID : Informatique Décisionnelle BI : Business Intelligence Sommaire Introduction...

Plus en détail

Techniques Data Mining pour la sélection d une configuration d index de jointure binaire

Techniques Data Mining pour la sélection d une configuration d index de jointure binaire Faculté des Sciences Tidjani HADDAM Département de l Informatique Mémoire Pour l obtention du diplôme de MASTER Spécialité : Informatique Option : Modèles Intélligents et Décision (MID) THÈME Techniques

Plus en détail

Optimisation de requêtes. I3009 Licence d informatique 2015/2016. Traitement des requêtes

Optimisation de requêtes. I3009 Licence d informatique 2015/2016. Traitement des requêtes Optimisation de requêtes I3009 Licence d informatique 2015/2016 Cours 5 - Optimisation de requêtes Stéphane.Gançarski Stephane.Gancarski@lip6.fr Traitement et exécution de requêtes Implémentation des opérateurs

Plus en détail

Base de données en mémoire

Base de données en mémoire Base de données en mémoire Plan Bases de données relationnelles OnLine Analytical Processing Difficultés de l OLAP Calculs en mémoire Optimisations 1 Base de données relationnelle Introduction Date Exemple

Plus en détail

Chapitre 1 : Introduction aux Systèmes de Gestion de Bases de Données (Eléments de base)

Chapitre 1 : Introduction aux Systèmes de Gestion de Bases de Données (Eléments de base) Chapitre 1 : Introduction aux Systèmes de Gestion de Bases de Données (Eléments de base) 1. Généralités sur l'information et sur sa Représentation 1.1 Informations et données : a. Au sen de la vie : C

Plus en détail

Etude de faisabilité visant à mettre en place un entrepôt de données sur les données de l IFN. Analyser et Explorer avec une grande interactivité

Etude de faisabilité visant à mettre en place un entrepôt de données sur les données de l IFN. Analyser et Explorer avec une grande interactivité Établissement chargé de réaliser l inventaire permanent du patrimoine forestier sur tout le territoire métropolitain indépendamment de toute question de propriété. Parmi ces objectifs: Connaissance de

Plus en détail

Circuits électroniques au service de l'optimisation multi-requêtes

Circuits électroniques au service de l'optimisation multi-requêtes Ecole Nationale de Mécanique et d Aérotechnique Laboratoire d Informatique et d Automatique pour les Systèmes Circuits électroniques au service de l'optimisation multi-requêtes Ahcène BOUKORCA Sous la

Plus en détail

Chapitre 2 : Conception de BD Réparties

Chapitre 2 : Conception de BD Réparties 2/22 Chapitre 2 : Conception de BD Réparties 2/22 Introduction Une BDR diffère d'une BD centralisée avec certains concepts nouveaux qui sont particuliers à la répartition des données.. Méthode de conception

Plus en détail

Indépendance données / applications

Indépendance données / applications Vues 1/27 Indépendance données / applications Les 3 niveaux d abstraction: Plusieurs vues, un seul schéma conceptuel (logique) et schéma physique. Les vues décrivent comment certains utilisateurs/groupes

Plus en détail

Introduction à la B.I. Avec SQL Server 2008

Introduction à la B.I. Avec SQL Server 2008 Introduction à la B.I. Avec SQL Server 2008 Version 1.0 VALENTIN Pauline 2 Introduction à la B.I. avec SQL Server 2008 Sommaire 1 Présentation de la B.I. et SQL Server 2008... 3 1.1 Présentation rapide

Plus en détail

Plan. Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation

Plan. Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation Data WareHouse Plan Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation 2 Présentation Besoin: prise de décisions

Plus en détail

MEMOIRE MAGISTER ECOLE DOCTORALE D INFORMATIQUE (STIC) THEME

MEMOIRE MAGISTER ECOLE DOCTORALE D INFORMATIQUE (STIC) THEME MINISTERE DE L ENSEIGNEMENT SUPERIEUR ET DE LA RECHERCHE SCIENTIFIQUE UNIVERSITE FERHAT ABBAS SETIF UFAS (ALGERIE) MEMOIRE Présenté à la Faculté des Sciences de l Ingénieur Département de l informatique

Plus en détail

Contexte général de l étude

Contexte général de l étude 1 2 Contexte général de l étude Les entrepôts de données associés à des outils d analyse On Line Analytical Processing (OLAP), représentent une solution effective pour l informatique décisionnelle (Immon,

Plus en détail

Chapitre IX. L intégration de données. Les entrepôts de données (Data Warehouses) Motivation. Le problème

Chapitre IX. L intégration de données. Les entrepôts de données (Data Warehouses) Motivation. Le problème Chapitre IX L intégration de données Le problème De façon très générale, le problème de l intégration de données (data integration) est de permettre un accès cohérent à des données d origine, de structuration

Plus en détail

La place de la Géomatique Décisionnelle dans le processus de décision

La place de la Géomatique Décisionnelle dans le processus de décision Géomatique décisionnelle La place de la Géomatique Décisionnelle dans le processus de décision - Arnaud Van De Casteele Mines ParisTech - CRC Arnaud {dot} van_de_casteele {at} mines-paristech.fr Les rencontres

Plus en détail

Introduction aux S.G.B.D.

Introduction aux S.G.B.D. NFE113 Administration et configuration des bases de données - 2010 Introduction aux S.G.B.D. Eric Boniface Sommaire L origine La gestion de fichiers Les S.G.B.D. : définition, principes et architecture

Plus en détail

Plan de cette partie. Implantation des SGBD relationnels. Définition et fonctionnalités. Index. Coûts pour retrouver des données

Plan de cette partie. Implantation des SGBD relationnels. Définition et fonctionnalités. Index. Coûts pour retrouver des données Implantation des SGBD relationnels Université de Nice Sophia-Antipolis Version 3.4 25//06 Richard Grin Plan de cette partie Nous allons étudier (très rapidement!) quelques éléments de solutions utilisés

Plus en détail

Urbanisation des SI-NFE107

Urbanisation des SI-NFE107 OLAP Urbanisation des SI-NFE107 Fiche de lecture Karim SEKRI 20/01/2009 OLAP 1 Introduction PLAN OLAP Les différentes technologies OLAP Plate formes et Outils 20/01/2009 OLAP 2 Informatique décisionnelle

Plus en détail

Un datawarehouse est un entrepôt de données (une base de données) qui se caractérise par des données :

Un datawarehouse est un entrepôt de données (une base de données) qui se caractérise par des données : Page 1 of 6 Entrepôt de données Un article de Wikipédia, l'encyclopédie libre. L'entrepôt de données, ou datawarehouse, est un concept spécifique de l'informatique décisionnelle, issu du constat suivant

Plus en détail

SQL. Oracle. pour. 4 e édition. Christian Soutou Avec la participation d Olivier Teste

SQL. Oracle. pour. 4 e édition. Christian Soutou Avec la participation d Olivier Teste Christian Soutou Avec la participation d Olivier Teste SQL pour Oracle 4 e édition Groupe eyrolles, 2004, 2005, 2008, 2010, is BN : 978-2-212-12794-2 Partie III SQL avancé La table suivante organisée en

Plus en détail

BUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise

BUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise BUSINESS INTELLIGENCE Une vision cockpit : utilité et apport pour l'entreprise 1 Présentation PIERRE-YVES BONVIN, SOLVAXIS BERNARD BOIL, RESP. SI, GROUPE OROLUX 2 AGENDA Définitions Positionnement de la

Plus en détail

L informatique des entrepôts de données

L informatique des entrepôts de données L informatique des entrepôts de données Daniel Lemire SEMAINE 8 Introduction à OLAP 8.1. Présentation de la semaine Le modèle OLAP (Online Analytical Processing) est un modèle quasiomniprésent en intelligence

Plus en détail

Prototype SOLAP appliqué sur des champs continus en mode raster

Prototype SOLAP appliqué sur des champs continus en mode raster Session démos 24 novembre 2014 Prototype SOLAP appliqué sur des champs continus en mode raster Analyse de hot spots de criminalité Jean-Paul Kasprzyk, doctorant Introduction 2 L informatique décisionnelle

Plus en détail

Intelligence Economique - Business Intelligence

Intelligence Economique - Business Intelligence Intelligence Economique - Business Intelligence Notion de Business Intelligence Dès qu'il y a une entreprise, il y a implicitement intelligence économique (tout comme il y a du marketing) : quelle produit

Plus en détail

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation Base de données S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Présentation du module Contenu général Notion de bases de données Fondements / Conception Utilisation :

Plus en détail

Méthodologie de conceptualisation BI

Méthodologie de conceptualisation BI Méthodologie de conceptualisation BI Business Intelligence (BI) La Business intelligence est un outil décisionnel incontournable à la gestion stratégique et quotidienne des entités. Il fournit de l information

Plus en détail

Plan. Cours 4 : Méthodes d accès aux données. Architecture système. Objectifs des SGBD (rappel)

Plan. Cours 4 : Méthodes d accès aux données. Architecture système. Objectifs des SGBD (rappel) UPMC - UFR 99 Licence d informatique 205/206 Module 3I009 Cours 4 : Méthodes d accès aux données Plan Fonctions et structure des SGBD Structures physiques Stockage des données Organisation de fichiers

Plus en détail

PRODUCTION DE JEUX DE DONNÉES ANONYMISÉES

PRODUCTION DE JEUX DE DONNÉES ANONYMISÉES PRODUCTION DE JEUX DE DONNÉES ANONYMISÉES Les contenus de ce document sont la propriété exclusive de la société REVER. Ils ne sont transmis qu à titre d information et ne peuvent en aucun cas être considérés

Plus en détail

CHAPITRE 1 ARCHITECTURE BASES DE DONNÉES AVANCÉES 2014-2015 20/10/2014. Université des sciences et de la Technologie Houari Boumediene USTHB Alger

CHAPITRE 1 ARCHITECTURE BASES DE DONNÉES AVANCÉES 2014-2015 20/10/2014. Université des sciences et de la Technologie Houari Boumediene USTHB Alger Université des sciences et de la Technologie Houari Boumediene USTHB Alger Département d Informatique BASES DE DONNÉES AVANCÉES 2014-2015 RESPONSABLES M. KAMEL BOUKHALFA (SII CHAPITRE 1 ARCHITECTURE 1

Plus en détail

Informatique Décisionnelle pour l environnement

Informatique Décisionnelle pour l environnement Territoires, Environnement, Télédétection et Information Spatiale Unité mixte de recherche AgroParisTech - Cirad - Irstea Informatique Décisionnelle pour l environnement Principe, architecture informatique

Plus en détail

Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours

Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours Information du cours Informatique décisionnelle et data mining www.lia.univ-avignon.fr/chercheurs/torres/cours/dm Juan-Manuel Torres juan-manuel.torres@univ-avignon.fr LIA/Université d Avignon Cours/TP

Plus en détail

Bases de données multidimensionnelles OLAP

Bases de données multidimensionnelles OLAP Bases de données multidimensionnelles OLAP OLAP OLAP (On Line Analytical Processing): Ensemble des outils nécessaires pour l analyse multidimensionnelle. Les données sont historisées, résumées, consolidées.

Plus en détail

Généralités sur les bases de données

Généralités sur les bases de données Généralités sur les bases de données Qu est-ce donc qu une base de données? Que peut-on attendre d un système de gestion de bases de données? Que peut-on faire avec une base de données? 1 Des données?

Plus en détail

Encryptions, compression et partitionnement des données

Encryptions, compression et partitionnement des données Encryptions, compression et partitionnement des données Version 1.0 Grégory CASANOVA 2 Compression, encryption et partitionnement des données Sommaire 1 Introduction... 3 2 Encryption transparente des

Plus en détail

L'infocentre sert à prendre des décisions opérationnelles basées sur des valeurs courantes

L'infocentre sert à prendre des décisions opérationnelles basées sur des valeurs courantes II - II 1ère génération 13 2ème génération : Entrepôt de données / Magasin de données 15 3ème génération OLAP 16 Références Bibliographiques 18 A. 1ère génération Infocentre Tableur Base de données Infocentre

Plus en détail

Clermont Ferrand - Janvier 2003

Clermont Ferrand - Janvier 2003 DISDAMIN: Algorithmes de Data Mining Distribués Valerie FIOLET (1,2) - Bernard TOURSEL (1) 1 Equipe PALOMA - LIFL - USTL - LILLE (FRANCE) 2 Service Informatique - UMH - MONS (BELGIUM) Clermont Ferrand

Plus en détail

SQL Server 2014 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services, Power BI...)

SQL Server 2014 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services, Power BI...) Avant-propos 1. À qui s'adresse ce livre? 15 2. Pré-requis 15 3. Objectifs du livre 16 4. Notations 17 Introduction à la Business Intelligence 1. Du transactionnel au décisionnel 19 2. Business Intelligence

Plus en détail

Dossier I Découverte de Base d Open Office

Dossier I Découverte de Base d Open Office ETUDE D UN SYSTEME DE GESTION DE BASE DE DONNEES RELATIONNELLES Définition : Un SGBD est un logiciel de gestion des données fournissant des méthodes d accès aux informations. Un SGBDR permet de décrire

Plus en détail

Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise.

Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise. Solutions PME VIPDev Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise. Cette offre est basée sur la mise à disposition de l ensemble de nos compétences techniques et créatives au service

Plus en détail

Bases de données multidimensionnelles et mise en œuvre dans Oracle

Bases de données multidimensionnelles et mise en œuvre dans Oracle Bases de données multidimensionnelles et mise en œuvre dans Oracle 1 Introduction et Description générale Les bases de données relationnelles sont très performantes pour les systèmes opérationnels (ou

Plus en détail

10/04/2011. Serveur de données. Serveur de données. Client. Programme d'application Logiciel intermédiaire Pilote de télécommunication.

10/04/2011. Serveur de données. Serveur de données. Client. Programme d'application Logiciel intermédiaire Pilote de télécommunication. 1 BD locale BD locale Programme d'application Logiciel intermédiaire Client SGBD réparti Logiciel intermédiaire données SGBD réparti Logiciel intermédiaire données 2 Bénéfices potentiels Performance Fiabilité

Plus en détail

Annexe. Méthodologie de mise en œuvre d un projet BusinessObjects

Annexe. Méthodologie de mise en œuvre d un projet BusinessObjects Annexe Méthodologie de mise en œuvre d un projet BusinessObjects Déroulement du cours 1 : Le rôle du Designer d Univers 2 : Créer un Univers avec l Assistant 3 : Créer un Univers étape par étape 4 : Enrichir

Plus en détail

2 Serveurs OLAP et introduction au Data Mining

2 Serveurs OLAP et introduction au Data Mining 2-1 2 Serveurs OLAP et introduction au Data Mining 2-2 Création et consultation des cubes en mode client-serveur Serveur OLAP Clients OLAP Clients OLAP 2-3 Intérêt Systèmes serveurs et clients Fonctionnalité

Plus en détail

REPUBLIQUE ALGERIENNE DEMOCRATIQUE ET POPULAIRE MINISTERE DE L ENSEIGNEMENT SUPERIEUR ET DE LA RECHERCHE SCIENTIFIQUE UNIVERSITE D ORAN ES-SENIA

REPUBLIQUE ALGERIENNE DEMOCRATIQUE ET POPULAIRE MINISTERE DE L ENSEIGNEMENT SUPERIEUR ET DE LA RECHERCHE SCIENTIFIQUE UNIVERSITE D ORAN ES-SENIA REPUBLIQUE ALGERIENNE DEMOCRATIQUE ET POPULAIRE MINISTERE DE L ENSEIGNEMENT SUPERIEUR ET DE LA RECHERCHE SCIENTIFIQUE UNIVERSITE D ORAN ES-SENIA FACULTE DES SCIENCES DEPARTEMENT D INFORMATIQUE MEMOIRE

Plus en détail

CONCEPTION ET REALISATION D'UN GENERATEUR DE TABLEAUX DE BORD PROSPECTIFS MULTIDIMENSIONNELS

CONCEPTION ET REALISATION D'UN GENERATEUR DE TABLEAUX DE BORD PROSPECTIFS MULTIDIMENSIONNELS CONCEPTION ET REALISATION D'UN GENERATEUR DE TABLEAUX DE BORD PROSPECTIFS MULTIDIMENSIONNELS Nazih Selmoune (*), Zaia Alimazighi (*) Selmoune@lsi-usthb.dz, Alimazighi@wissal.dz (*) Laboratoire des systèmes

Plus en détail

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles) SGBDR Systèmes de Gestion de Bases de Données (Relationnelles) Plan Approches Les tâches du SGBD Les transactions Approche 1 Systèmes traditionnels basés sur des fichiers Application 1 Gestion clients

Plus en détail

Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP)

Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP) Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP) Définition (G. Gardarin) Entrepôt : ensemble de données historisées variant

Plus en détail

CAPACITE CARTOGRAPHIQUE AUTOUR DES TECHNOLOGIES SOLAP

CAPACITE CARTOGRAPHIQUE AUTOUR DES TECHNOLOGIES SOLAP CONSERVATOIRE NATIONAL DES ARTS ET METIERS CENTRE REGIONAL RHONE-ALPES CENTRE D'ENSEIGNEMENT DE GRENOBLE UE ENG111 - Epreuve TEST Travail d'etude et de Synthèse Technique en INFORMATIQUE CAPACITE CARTOGRAPHIQUE

Plus en détail

Optimisation des tournées de ramassage scolaire de la commune de Seneffe

Optimisation des tournées de ramassage scolaire de la commune de Seneffe Optimisation des tournées de ramassage scolaire de la commune de Seneffe Laurie Hollaert Séminaire GRT 7 novembre Laurie Hollaert Optimisation des tournées de ramassage scolaire de la commune de Seneffe

Plus en détail

Ecole des Hautes Etudes Commerciales HEC Alger. par Amina GACEM. Module Informatique 1ière Année Master Sciences Commerciales

Ecole des Hautes Etudes Commerciales HEC Alger. par Amina GACEM. Module Informatique 1ière Année Master Sciences Commerciales Ecole des Hautes Etudes Commerciales HEC Alger Évolution des SGBDs par Amina GACEM Module Informatique 1ière Année Master Sciences Commerciales Evolution des SGBDs Pour toute remarque, question, commentaire

Plus en détail

SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...)

SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...) Avant-propos 1. À qui s'adresse ce livre? 15 2. Pré-requis 15 3. Objectifs du livre 16 4. Notations 17 Introduction à la Business Intelligence 1. Du transactionnel au décisionnel 19 2. Business Intelligence

Plus en détail

Datawarehouse: Cubes OLAP. Marlyse Dieungang Khaoula Ghilani

Datawarehouse: Cubes OLAP. Marlyse Dieungang Khaoula Ghilani Datawarehouse: Cubes OLAP Marlyse Dieungang Khaoula Ghilani Table des matières 1 Data Warehouse 3 1.1 Introduction............................ 3 1.1.1 Définition......................... 3 1.1.2 Architecture........................

Plus en détail

TP Bases de données réparties

TP Bases de données réparties page 1 TP Bases de données réparties requêtes réparties Version corrigée Auteur : Hubert Naacke, révision 5 mars 2003 Mots-clés: bases de données réparties, fragmentation, schéma de placement, lien, jointure

Plus en détail

PLAN. Les systèmes d'information analytiques. Exemples de décisions

PLAN. Les systèmes d'information analytiques. Exemples de décisions Les systèmes d'information analytiques Dr A.R. Baba-ali Maitre de conferences USTHB PLAN Le cycle de decision Les composants analytiques ETL (Extract, Transform and Load) Entrepot de (Data warehouse) Traitement

Plus en détail

BI = Business Intelligence Master Data-ScienceCours 3 - Data

BI = Business Intelligence Master Data-ScienceCours 3 - Data BI = Business Intelligence Master Data-Science Cours 3 - Datawarehouse UPMC 8 février 2015 Rappel L Informatique Décisionnelle (ID), en anglais Business Intelligence (BI), est l informatique à l usage

Plus en détail

Cours de Master Recherche

Cours de Master Recherche Cours de Master Recherche Spécialité CODE : Résolution de problèmes combinatoires Christine Solnon LIRIS, UMR 5205 CNRS / Université Lyon 1 2007 Rappel du plan du cours 1 - Introduction Qu est-ce qu un

Plus en détail

Hervé Couturier EVP, SAP Technology Development

Hervé Couturier EVP, SAP Technology Development Hervé Couturier EVP, SAP Technology Development Hervé Biausser Directeur de l Ecole Centrale Paris Bernard Liautaud Fondateur de Business Objects Questions à: Hervé Couturier Hervé Biausser Bernard Liautaud

Plus en détail

10 Intégration de données sur le web

10 Intégration de données sur le web 10 Intégration de données sur le web 240 Requête utilisateur : Où est-ce que je peux voir les films qui ont participé au dernier Festival de Cannes? Je voudrais les résumés et critiques des films de Pedro

Plus en détail

Conception de BDR et requêtes. Migration vers une BDR. Conception d'une BDR par Décomposition. Objectifs de la Décomposition

Conception de BDR et requêtes. Migration vers une BDR. Conception d'une BDR par Décomposition. Objectifs de la Décomposition Conception de BDR et requêtes Migration vers une BDR Approche décomposition Fragmentation Allocation des fragments Fragmentation de requêtes Optimisation de requêtes Décomposition en BD locales BD BD1

Plus en détail

1 Introduction et installation

1 Introduction et installation TP d introduction aux bases de données 1 TP d introduction aux bases de données Le but de ce TP est d apprendre à manipuler des bases de données. Dans le cadre du programme d informatique pour tous, on

Plus en détail

Business Intelligence

Business Intelligence avec Excel, Power BI et Office 365 Téléchargement www.editions-eni.fr.fr Jean-Pierre GIRARDOT Table des matières 1 Avant-propos A. À qui s adresse ce livre?..................................................

Plus en détail

SURETE DE FONCTIONNEMENT ET REPRISE APRES PANNE

SURETE DE FONCTIONNEMENT ET REPRISE APRES PANNE Université des sciences et de la Technologie Houari Boumediene USTHB Alger Département d Informatique ARCHITECTURE ET ADMINISTRATION DES BASES DE DONNÉES 2013-2014 RESPONSABLES M. KAMEL BOUKHALFA (SII)

Plus en détail

Introduction. d'informations Les entrepôts de données (Datawarehouse) Les datamarts Architecture Modélisation

Introduction. d'informations Les entrepôts de données (Datawarehouse) Les datamarts Architecture Modélisation Data WareHouse Plan Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamarts Architecture Modélisation 2 Présentation Besoin: prise de décisions

Plus en détail

Évolution de modèle dans les entrepôts de données : existant et perspectives

Évolution de modèle dans les entrepôts de données : existant et perspectives EDA'07 3èmes journées francophones sur les Entrepôts de Données et l'analyse en ligne Poitiers, 7 et 8 Juin 2007 Évolution de modèle dans les entrepôts de données : existant et perspectives Cécile Favre,

Plus en détail

Des contenus pédagogiques standardisés SCORM sur la plate-forme Cognifer

Des contenus pédagogiques standardisés SCORM sur la plate-forme Cognifer Normes et standards FOAD «L interopérabilité pédagogique» Des contenus pédagogiques standardisés SCORM sur la plate-forme Cognifer Manuel du concepteur élaboré par Mokhtar BEN HENDA 2005 Le contenu de

Plus en détail

BUSINESS OBJECTS V5 / V6

BUSINESS OBJECTS V5 / V6 BUSINESS OBJECTS V5 / V6 Durée Objectif 2 jours L objectif de ce cours est de savoir utiliser le logiciel BUSINESS OBJECTS pour faire des interrogations multi - dimensionnelles sur les univers BO et de

Plus en détail

Optimisation des bases de données

Optimisation des bases de données Optimisation des bases de données Mise en œuvre sous Oracle Laurent Navarro Avec la contribution technique d Emmanuel Lecoester Pearson Education France a apporté le plus grand soin à la réalisation de

Plus en détail

LES ENTREPOTS DE DONNEES

LES ENTREPOTS DE DONNEES Module B4 : Projet des Systèmes d information Lille, le 25 mars 2002 LES ENTREPOTS DE DONNEES Problématique : Pour capitaliser ses informations, une entreprise doit-elle commencer par mettre en œuvre des

Plus en détail

QU EST-CE QUE LE DECISIONNEL?

QU EST-CE QUE LE DECISIONNEL? La plupart des entreprises disposent d une masse considérable d informations sur leurs clients, leurs produits, leurs ventes Toutefois ces données sont cloisonnées par les applications utilisées ou parce

Plus en détail

Ingénierie d aide à la décision

Ingénierie d aide à la décision Ingénierie d aide à la décision Maria Malek 1 er septembre 2009 1 Objectifs et débouchés Nous proposons dans cette option deux grands axes pour l aide à la décision : 1. La recherche opérationnelle ; 2.

Plus en détail

Les principaux domaines de l informatique

Les principaux domaines de l informatique Les principaux domaines de l informatique... abordés dans le cadre de ce cours: La Programmation Les Systèmes d Exploitation Les Systèmes d Information La Conception d Interfaces Le Calcul Scientifique

Plus en détail

Introduction aux bases de données

Introduction aux bases de données 1/73 Introduction aux bases de données Formation continue Idir AIT SADOUNE idir.aitsadoune@supelec.fr École Supérieure d Électricité Département Informatique Gif sur Yvette 2012/2013 2/73 Plan 1 Introduction

Plus en détail