INTRODUCTION AUX TECHNOLOGIES D INGENIERIE DES DONNEES DIRIGEE PAR LES MODELES Les contenus de ce document sont la propriété exclusive de la société REVER. Ils ne sont transmis qu à titre d information et ne peuvent en aucun cas être considérés comme un engagement de la société REVER. Toutes utilisations, en ce compris le référencement, de la totalité ou d une partie de ce document ne sont autorisées qu avec l accord formel et écrit de REVER. REVER S.A. Belgique ; +32 71 20 71 61 ; http://www.rever.eu
La documentation de REVER est structurée sur trois niveaux qui se superposent hiérarchiquement comme le représente le schéma ci-dessous : le premier niveau décrit les technologies de base de REVER et explique le fonctionnement des outils ; le deuxième niveau décrit les méthodes de REVER à suivre pour une utilisation optimale des technologies ; le troisième niveau décrit les solutions de REVER pour répondre aux besoins des clients. Un document de niveau «i» peut faire référence à un ou plusieurs documents de niveaux inférieurs : il est vivement conseillé au lecteur d en prendre connaissance pour avoir une compréhension correcte du document. Afin de rendre les explications plus claires, il est fait un usage régulier de schéma et de couleur. Il est recommandé pour une lecture aisée des documents de les imprimer en couleur. Par cette démarche structurée, REVER poursuit un double objectif : rendre la lecture de la documentation de REVER plus aisée en séparant clairement les différents éléments constitutifs des propositions de REVER ; permettre aux lecteurs de mieux appréhender les aspects innovants des propositions de REVER, en les abordant, soit dans une lecture «top-down» (de la «solution» à la «technologie»), soit dans une lecture «bottom-up» (de la «technologie» à la solution). Le premier type de lecture correspond à une approche de compréhension du «comment» les méthodes et outils de REVER permettent la réalisation de solutions qui semblent à priori complexes, voire impossibles. Le second type de lecture correspond à une démarche de «constructeur de maison» : le premier niveau décrit les matériaux de base, le second niveau explique comment les différents matériaux sont utilisés pour construire des «murs» et, enfin, le troisième niveau définit les architectures de «maisons» possibles. Service Marketing 29/04/2008 TE00 Page 2 / 9
Quelque soit l approche, l équipe de rédaction souhaite que ces documents apportent les éléments d information attendus. Service Marketing 29/04/2008 TE00 Page 3 / 9
Table des matières 1Les concepts... 6 2Description générale... 8 2.1Outil pour l ingénierie des bases de données : DB-MAIN... 9 2.2Les outils pour la rétro-ingénierie des bases de données : l alimentation du référentiel de DB-MAIN... 9 2.3Les outils de re-ingénierie des bases de données : l exploitation du référentiel de DB- MAIN... 9 Service Marketing 29/04/2008 TE00 Page 4 / 9
Pour la réalisation des projets d ingénierie, de rétro-ingénierie et de re-ingénierie des bases de données qui leur sont confiés, les experts de REVER utilisent un ensemble de technologies spécifiques à la gestion des bases de données, résultats des efforts importants de recherche et développement réalisé par le Laboratoire d Ingénierie de Bases de Données de l Université de Namur (Belgique) au cours des 20 dernières années. Ces technologies continuent à être développées et maintenues par les experts de REVER en collaboration étroite avec les chercheurs de l Université. Ce document a pour objectif : de donner une description de l ensemble des technologies dont dispose REVER ; de décrire les fondements de ces technologies. L attention du lecteur est attirée sur le fait que ce document n a pas pour vocation de montrer comment ces technologies sont utilisées pour répondre aux besoins des utilisateurs, ni quels sont les résultats produits par celles-ci : ces deux points sont explicités dans d autres documents. Pour décrire les technologies de REVER, ce document aborde successivement : les concepts liés à la modélisation et aux modèles de données ; une description générale des différentes technologies et de leurs articulations ; une description détaillée des apports innovants et spécifiques de ces technologies. Service Marketing 29/04/2008 TE00 Page 5 / 9
1 Les concepts Les descriptions des différents concepts utilisés dans ce document sont définies et illustrées à partir d une application informatique (voir schéma ci-dessous) : du point de vue «métier», l application peut-être décrite comme un sous-ensemble du système d informations de l organisation. Ce sous-ensemble intègre en un tout cohérent les données et les «règles métiers» qui y sont liées pour le domaine concerné par l application. Afin d éviter des ambiguïtés dans la suite, précisons ici que les «règles métiers» sont constituées par deux sous-ensembles distincts et complémentaires à savoir «les règles données» et les «règles traitement». Par «règles données», on entend toutes règles «métiers» qui, en cas de non respect, créent une incohérence dans les données stockées (typiquement une règle «référentielle» telle que : «un bon de commande doit contenir une référence à un client»). Les «règles traitements» sont celles qui définissent les règles de calcul à effectuer sur les données (typiquement un calcul d intérêt financier) : en cas de non respect, ces règles ne créent pas d incohérence dans les données stockées; du point de vue de l informatique, l application peut être décrite comme un ensemble de programmes «applicatifs» écrit en PLI et C++ fonctionnant sur deux machines différentes (Mainframe sous ZOS et serveur départemental sous UNIX) ; Service Marketing 29/04/2008 TE00 Page 6 / 9
utilisant des produits de gestion des données différents (VSAM, IMS, ORACLE). Ces produits (appelés par la suite SGBD) ont pour fonction principale la gestion et l accès aux données par les programmes. Ces fonctions sont accomplies par les produits en prenant en compte : d une part des règles générales de gestion utilisées lors de la réalisation des produits (par exemple ORACLE relève du modèle «relationnel» dont les règles ont été définies en partant des travaux de Codd, ) ; d autre part des règles spécifiques de l application (structure des données, taille des fichiers, clés d accès, etc ) Pour pouvoir «modéliser» (partie droite du schéma) les processus appliqués aux données d une telle application, il est nécessaire d envisager trois niveaux de modèles : le modèle «conceptuel ou sémantique» qui est une description du système d informations de l application tel que le voient les utilisateurs «métiers». Ce modèle est, par nature, indépendant de toutes technologies et contient, outre la description des données et de leurs structures, les «règles données» ; le modèle «logique» qui prend en compte les règles de gestion utilisées lors de la réalisation des produits (SGBD). Le modèle logique est donc dépendant d un type de technologie (fichier plat, base de données hiérarchique, base de données relationnelle, ) ; le modèle physique qui prend en compte les règles imposées par une technologie particulière (VSAM, IMS, ORACLE, ) pour l implémentation du système d information sur une plateforme technique définie. L objectif poursuivi par une telle démarche de modélisation est la génération du «code source» (appelé DDL) qui permet de transmettre, dans un langage compréhensible par le SGBD, les spécificités des données de l application. Service Marketing 29/04/2008 TE00 Page 7 / 9
2 Description générale L architecture générale des outils de REVER est articulée (voir schéma ci-dessous) de la manière suivante : au centre, le référentiel de DB-MAIN qui reprend de manière cohérente et ordonnée les modèles de données et l ensemble des éventuels «objets» techniques complémentaires tels que les codes «source» des programmes,... Ce référentiel est géré par l outil Db-MAIN ; à gauche, les outils qui permettent d alimenter le référentiel : DB-MAIN et les analyseurs spécialisés ; à droite, se trouvent les outils d exploitation du référentiel de DB-MAIN qui permettent de produire des résultats en se basant sur les informations contenues dans le référentiel. Service Marketing 29/04/2008 TE00 Page 8 / 9
2.1 Outil pour l ingénierie des bases de données : DB-MAIN Les activités d ingénierie des bases de données de REVER sont réalisées au moyen de l outil de modélisation DB-MAIN. Plus particulièrement, DB-MAIN permet la création, la maintenance et l évolution des modèles de données. Des explications et des illustrations plus détaillées au sujet de DB-MAIN sont fournies dans le document intitulé «DB-MAIN». Le manuel de référence et une version gratuite sont accessibles sur le site de DB-MAIN (http://www.db-main.com). 2.2 Les outils pour la rétro-ingénierie des bases de données : l alimentation du référentiel de DB-MAIN Les activités de rétro-ingénierie ont pour objectif de reconstruire les modèles des données à partir des éléments techniques existants. L automatisation de cette reconstruction n est possible qu à travers la mise à disposition de différents types d outils : des analyseurs de codes «source» concernant les structures et les relations des données ; des analyseurs de codes «source» des objets procéduraux tels que triggers, dbprocedure, programmes applicatifs, JCL, ; des analyseurs de données. L ensemble des résultats produits par les analyses sont conservés dans le référentiel de DB- MAIN. Des explications plus détaillées au sujet de ces différents points sont fournies dans le document intitulé «Les outils d alimentation du référentiel de DB-MAIN». 2.3 Les outils de re-ingénierie des bases de données : l exploitation du référentiel de DB-MAIN Les activités de re-ingénierie des bases de données sont réalisées avec l outil DB-MAIN et par des outils complémentaires : des extracteurs du contenu du référentiel ; des générateurs de données ; des générateurs de codes «source» de programmes ; des outils de «mapping» ; des transformateurs de codes «source». Des explications plus détaillées au sujet de ces différents points sont fournies dans le document intitulé «Les outils d exploitation du référentiel de DB-MAIN». Service Marketing 29/04/2008 TE00 Page 9 / 9