Evry - M2 MIAGE Entrepôt de données



Documents pareils
Master Informatique et Systèmes. Architecture des Systèmes d Information. 02 Architecture Applicative

Avant-propos... Introduction... Première partie Comprendre : les concepts. Chapitre 1 La gestion des données de référence... 3

Evry - M2 MIAGE Entrepôt de données

AMUE : PRISME - Référentiel des données partagées. 3 décembre 2009

Enterprise Data Quality : fiabilisez vos processus E-Business Suite en améliorant la qualité des données

Construction d un EDD avec SQL 2008 R2. D. Ploix - M2 Miage - EDD - Création

Pôle Référentiels Métier (Master Data Management)

Comment réussir son projet de Master Data Management?

Urbanisation des Systèmes d Information Architecture d Entreprise. 05 Architecture des données. Plan du chapitre. Références. 1 Définitions & enjeux

Business & High Technology

Fiabilisation des bases de données BtoB : Un enjeu majeur

Créer un référentiel client grâce à Talend MDM

Objectif : Passer de l analyse métier et fonctionnelle à la définition des applications qui

Urbanisation des Systèmes d Information Architecture d Entreprise. 04 Architecture du SI : identifier et décrire les services, structurer le SI

Le "tout fichier" Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique

Sécurité des entrepôts de données dans le Cloud Un SaaS pour le cryptage des données issues d un ETL

Les activités numériques

Les Entrepôts de Données. (Data Warehouses)

Gestion des données de référence (MDM)

Première partie : Impératif économique et stratégiques

L information et la technologie de l informationl

Le Guide Pratique des Processus Métiers

et les Systèmes Multidimensionnels

CRM Assurance. Fonctionnalités clés. Vue globale de l assuré. Gestion des échanges en Multicanal

Démarches d urbanisation : réorganiser le Système d Information en structurant ses fonctions dans des blocs fonctionnels communicants.

Projet CASI: Master Data Management

Résumé CONCEPTEUR, INTEGRATEUR, OPERATEUR DE SYSTEMES CRITIQUES

L ÉCHANGE DE DONNÉES TEMPS RÉEL

Conception, architecture et urbanisation des systèmes d information

<Insert Picture Here> La GRC en temps de crise, difficile équilibre entre sentiment de sécurité et réduction des coûts

BUSINESS INTELLIGENCE

DataStudio. Solution d intégration des données et de diffusion de l information

Technologie data distribution Cas d usage.

Master Informatique et Systèmes. Architecture des Systèmes d Information. 03 Architecture Logicielle et Technique

DEMANDE D INFORMATION RFI (Request for information)

Business & High Technology

Evry - M2 MIAGE Entrepôts de Données

Talend Technical Note

Un datawarehouse est un entrepôt de données (une base de données) qui se caractérise par des données :

Solvabilité et calcul des fonds propres

Guide d accompagnement. Document réalisé par Softcomputing et Microsoft France.

Semarchy Convergence for Data Integration La Plate-Forme d Intégration pour le MDM Évolutionnaire

MANAGEMENT PAR LA QUALITE ET TIC

MANAGEMENT PAR LA QUALITE ET TIC

WHITEPAPER. Quatre indices pour identifier une intégration ERP inefficace

AXIAD Conseil pour décider en toute intelligence

Décisionnel & Reporting

Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise.

Distribuez une information fiable. IBM InfoSphere Master Data Management Server 9.0. Des données fiables pour de meilleurs résultats

Architecture d'entreprise : Guide Pratique de l'architecture Logique

Réussir le choix de son SIRH

BI = Business Intelligence Master Data-ScienceCours 3 - Data

Semarchy Convergence for MDM La Plate-Forme MDM Évolutionnaire

La gestion des données de référence ou comment exploiter toutes vos informations

BI = Business Intelligence Master Data-ScienceCours 2 - ETL

ORACLE DATA INTEGRATOR ENTERPRISE EDITION - ODI EE

BASES DE DONNÉES. CNAM Centre associé de Clermont-Ferrand Cycle A Année J. Darmont I. INTRODUCTION II. LES SYSTÈMES HIÉRARCHIQUES

Conseil et Ingénierie des Systèmes d Information d Entreprise

Chapitre 9 : Informatique décisionnelle

Les entrepôts de données

Méthodologie de conceptualisation BI

Sélection d un moteur de recherche pour intranet : Les sept points à prendre en compte

Les PGI. A l origine, un progiciel était un logiciel adapté aux besoins d un client.

LES OUTILS DU TRAVAIL COLLABORATIF

L outillage du Plan de Continuité d Activité, de sa conception à sa mise en œuvre en situation de crise

Qualité des données sur la chaine de valeur globale du reporting réglementaire, du Pilier 1 au Pilier 3 de Solvabilité 2

Linux Expo Gestion des Identités et des Accès. Le 16 mars Arismore

Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION

Base de données clients outil de base du CRM

INDUSTRIALISATION ET RATIONALISATION

Augmenter l efficacité et la sécurité avec la gestion des identités et le SSO

COMMUNIQUE DE LANCEMENT

Entrepôt de données 1. Introduction

Accenture Software. IDMF Insurance Data Migration Factory. La migration en toute confiance de vos données d assurance

Le terme «ERP» provient du nom de la méthode MRP (Manufacturing Ressource Planning) utilisée dans les années 70 pour la gestion et la planification

LIVRE BLANC. Dématérialisation des factures fournisseurs

Reza MADANI Manager et Consultant Indépendant Stratégie, organisation, management et transformation de systèmes d information

Assurance et Protection sociale Les enjeux du Digital Commerce

Gouvernance des mesures de sécurité avec DCM-Manager. Présentation du 22 mai 2014

Démarche de traçabilité globale

Introduction. Les articles de la presse spécialisée tendent à nous laisser penser que c est en effet le cas :

Les 10 causes principales des problèmes de qualité de données

DEMANDE D INFORMATION RFI (Request for information)

L ACCROISSEMENT DE L ENTROPIE DES SYSTÈMES D INFORMATION EST-ELLE UNE FATALITÉ?

l E R P s a n s l i m i t e

Gestion des Donnés Métier de Référence

Septembre 2009 LIVRE BLANC. Master Data Management Un actif stratégique : la donnée maître

BI CONSULTING. Présentation de l offre. Mai La Synthèse et le Pilotage en réponse aux besoins des métiers

Introduction à la B.I. Avec SQL Server 2008

eframe pour optimiser les reportings métiers et réglementaires

Programme scientifique Majeure ARCHITECTURE DES SYSTEMES D INFORMATION. Mentions Ingénierie des Systèmes d Information Business Intelligence

Nell Armonia Shuttle Web

Axe de valeur BMC Identity Management, la stratégie d optimisation de la gestion des identités de BMC Software TM

WHITE PAPER Une revue de solution par Talend & Infosense

DOSSIER SOLUTION CA ERwin Modeling. Comment gérer la complexité des données et améliorer l agilité métier?

DataEXchanger. Echangez en toute simplicité. Atelier Dex Etat des lieux Dex X. Présentation DEX X

APPEL D OFFRE. Projet décisionnel. Juillet 2011

Software Application Portfolio Management

Titre : La BI vue par l intégrateur Orange

Transcription:

Evry - M2 MIAGE Entrepôt de données Intégration de données multi-sources D. Ploix - M2 Miage - EDD - IDMS 1

Intégration de données L intégration de données désigne l ensemble des opérations aboutissant à l alimentation de l entrepôt de données à partir des données du SI de l entreprise. Les étapes sont : Identification des données sources, Préparation des données, Intégration dans les faits et dimensions. D. Ploix - M2 Miage - EDD - IDMS 2

Intégration de données multi-sources Données sources Fonctions d intégration Intégration par étapes Intégration de la fonction MDM D. Ploix - M2 Miage - EDD - IDMS 3

Données sources Acquisition de données multisource : du transactionnel vers le décisionnel D. Ploix - M2 Miage - EDD - IDMS 4

Données sources Activités Informations en sortie Données Processus Informations en entrée Métiers Les données instanciation de l activité au sein des processus (métier) D. Ploix - M2 Miage - EDD - IDMS 5 5

Données de référence? Parmi toutes les données en circulation dans le système d information, certaines sont plus critiques pour l activité métier car structurantes et largement partagées (disséminées) entre plusieurs applications. Ce sont les données de référence. Elles sont particulièrement structurantes pour les EDD : constitutives des dimensions instanciation des faits Elles sont partagées entre plusieurs applications transactionnelles, chacune en responsabilité d une partie selon sa position dans le processus métier attenant. D. Ploix - M2 Miage - EDD - IDMS 6

Référentiel client Contractuel (CRM) Commande Facturation Quelques exemples Référentiel de localisation géographique Adresses Référentiel des fournisseurs Centralisation des achats pour un groupe, Référentiel des données de marcher D. Ploix - M2 Miage - EDD - IDMS 7

Caractéristiques des DR : typologie Elles peuvent être classifiées en types : «DR Maître» : objets métiers principaux («cœur de métier») d un domaine fonctionnel et structurante pour l ensemble des applications du domaine. «DR Constitutives» : entrent dans la composition de plusieurs données maître (par ex. adresses). «DR Paramètre» : tables de valeurs ou nomenclature (code postaux, code devises, taux des taxes, ) partagées. Cet analyse des données et de leur constitution est particulièrement important dans l intégration de données dans un EDD : Les objets métiers (et par extension les données de référence) sont les sources autant des dimensions (ex. client) que des faits (ex. vente). La distinction fait / dimension est une vue décisionnelle sur les objets métiers en circulation. D. Ploix - M2 Miage - EDD - IDMS 8

DR : positionnement D. Ploix - M2 Miage - EDD - IDMS 9

Exemple des l EDD Transport Dans l analyse relative à l EDD de Transport, un certain nombre de dimensions adresses des données «de référence» : Les aéroports, Les passagers, Les vols Elles sont positionnées en tant que telles du fait de leur transversalité au métier du transport aérien : de la réservation, à l organisation des vols, à la facturation, chacun des systèmes manipulera les caractéristiques de ces informations qui le concerne. On les traitera en tant qu objet métier de référence. D. Ploix - M2 Miage - EDD - IDMS 10

Données sources Le multi-source (non urbanisé) est à la source des problèmes : Conflit sémantiques Conflit de modèle Conflit de l âge Conflit de mode opératoire sur le cycle de vie Conflit de modalité de diffusion Conflit de niveau de sécurité D. Ploix - M2 Miage - EDD - IDMS 11

Données sources L enjeu est donc d obtenir l assurance sur : Cohérence globale Unicité Visibilité / disponibilité Productivité / agilité Contraintes réglementaires Qualité Sécurité D. Ploix - M2 Miage - EDD - IDMS 12

Données sources Rappels sur la qualité des données Critères intrinsèques : Unicité Quelles données sont en doublons? Complétude Quel attribut manque ou est inutilisable? Exactitude Quelle donnée est incorrecte? Conformité Quelle donnée est dans un format non prévu? Cohérence Quelles données fournissent des informations conflicutelles? Intégrité Quelle relation manque? D. Ploix - M2 Miage - EDD - IDMS 13

Données sources Rappels sur la qualité des données Critères de service Actualité Impact la modalité de transmission et d acquisition dans les contextes transactionnel / décisionnel. Accessibilité Pertinence Compréhensibilité Critères de sécurité Disponibilité Intégrité Confidentialité Traçabilité D. Ploix - M2 Miage - EDD - IDMS 14

Données sources Rappels sur le cycle de vie des données Création Mise à jour Technique Fusion (rapprochement de données) Historisation Consommation Archivage Suppression logique Suppression physique Métier Étude / prospect Saisie / pré-validation Validation Commercialisation Arrêt de com. En Extinction D. Ploix - M2 Miage - EDD - IDMS 15

Données sources Comment réussir l intégration des données : Mettre en place une démarche d urbanisation des données (objets métier, formats pivots, ) Gérer le processus d intégration (ou de circulation) des données comme une activité à part entière Utiliser les fonctions issues de la gestion de données de référence (Master Data Managment) qui définit : La notion de données de référence, objet principal de la démarche d urbanisation et source des données en entrée de l entrepôt. L ensemble des fonctions qui devront apparaître dans le processus d intégration des données. D. Ploix - M2 Miage - EDD - IDMS 16

Intégration de données multi-sources Données sources Fonctions d intégration Intégration par étapes Intégration de la fonction MDM D. Ploix - M2 Miage - EDD - IDMS 17

Fonctions du MDM et intégration ED Les fonctions (re)définies dans le cadre du MDM peuvent servir d ossature au processus d intégration des données sources dans l entrepôt. D. Ploix - M2 Miage - EDD - IDMS 18

MDM et ED Exemple construction d un ED pour l analyse de sinistres pour une compagnie d assurance. Deux applications sont sources de données : Une de gestion des contrats d assurance Une de gestion des sinistres Particularité : La compagnie à racheté une petite compagnie d assurance locale et doit traiter des sinistres pour des contrats dont elle n a pas la gestion. Le système de gestion de sinistres a été adapté afin de pouvoir intégrer des liens vers le nouveau système et intégrer les données quelle ne gère pas. D. Ploix - M2 Miage - EDD - IDMS 19

Modèle de données gestion contrat D. Ploix - M2 Miage - EDD - IDMS 20

Modèle de données gestion sinistre D. Ploix - M2 Miage - EDD - IDMS 21

Objet de l ED Pour les biens, on va étudier le montant de la prime et des remboursement du fait de sinistres, La localisation des clients assurés Afin de construire des tableaux de bord par type de risque de sinistre avec le total payé dans le mois et le total reçu dans le mois en fonction des biens et des régions. D. Ploix - M2 Miage - EDD - IDMS 22

Analyse de l objet de l ED pour la partie étude Les données nécessaires à l étude sont : montant de la prime : correspond à la prime d'assurance par rapport à un risque remboursement du fait de sinistres : correspond à des opérations de remboursement lié à un sinistre localisation des clients assurés : correspond à l'adresse des clients Les caractéristiques des faits nécessaires à l'étude seront alors : risque : désignation Prime clients (pour le risque considéré) : Nom Prénom Adresse Opération de nature "remboursement" (pour un sinistre sur le risque et le client considéré) : Date Montant Possibilité d'agrégation : somme des opérations de remboursement et de collecte de prime par désignation de risque par jour par région des clients D. Ploix - M2 Miage - EDD - IDMS 23

Analyse de l objet de l ED pour la partie TDB Les données nécessaires au tableau de bord sont : type de risque de sinistre : désignation des risques total payé dans le mois : somme des montant des opérations de remboursements par sinistre correspondant aux type de risque par mois mois : date des opérations biens : désignation des biens régions : localisation des clients / des biens? choix des clients en cohérence avec la partie étude. Les caractéristiques des faits nécessaires au tableau de bord sont : risque : Désignation clients (pour le risque considéré) : Nom prénom Adresse biens (pour le client et le risque considéré) : désignation opération de nature "remboursement" (pour un sinistre sur le risque et le client considéré) : Date Montant Possibilité d'agrégation : somme des opérations de remboursement Par mois par région des clients par désignation de bien par désignation de risque D. Ploix - M2 Miage - EDD - IDMS 24

Construction de l entrepôt de données Décision d'agrégation : somme des opérations de remboursement et de collecte de prime par jours par région des clients par désignation de bien par désignation de risque effet : la caractéristique «client» devient la caractéristique «région des clients» la caractéristique «date des opérations» deviens «jour des opérations» (plus d'heure...) Fait : flux financiers par jour par région par type de bien et par type de risque FluxFinanciers Risque Région des client Bien Date des opérations Désignation Code postal Désignation Jour Désignation région Mois Année Montant Prime collectée Montant remboursement effectué D. Ploix - M2 Miage - EDD - IDMS 25

Chaîne de traitement d intégration des données Intégration des données Utilisation de l entrepôt D. Ploix - M2 Miage - EDD - IDMS 26

Rôle de l ODS «staging area» Le rôle du staging area qui sert à stocker les données extraites des systèmes sources. On y effectue aussi les différentes transformations à savoir : Le nettoyage des données, le merge, la standardisation, le déduplication... des données. Par contre les données dans l'ods ne sont détruites qu'après la durée de vie des données dans l'ods, facteur définit par l'organisation et dépend de plusieurs critères. La durée de vie d une données dans l ODS en tant que MDM est fonction de son usage par les systèmes opérationnels (transactionnels). Les données historiques sont conservées dans l ED. En résumé : Sources ODS DSA DW Selon la multiplicité des sources et les transformations il peut y a voir une fusion des étapes ODS et DSA (mais pas leur disparition). D. Ploix - M2 Miage - EDD - IDMS 27

Schémas ODS et sources Structures de données de l ODS (staging aréa) : en fonction de l espace disponible car la multiplication de la copie des données peut-être très coûteuse. 1) ODS/DSA Phase 1 le modèle est proche des sources (transactionnelles) : permet de récupérer une image des données source selon un pas de temps fixé et de travailler à l intégration dans le DW sans impacter le fonctionnement du système opérationnel. 2) ODS/DSA Phase 2 fusionne les modèles sources dans un modèle unique pour y effectuer les étapes d intégration décrites par la suite. Il est possible de se passer de l étape 1 mais la seconde reste nécessaire car les données injectées dans le DW doivent avoir été nettoyées D. Ploix - M2 Miage - EDD - IDMS 28

Proposition : positionnement du MDM en point de vérité pour les données de référence D. Ploix - M2 Miage - EDD - IDMS 29

Fonctions d intégration modèles et méta-données D. Ploix - M2 Miage - EDD - IDMS 30

Fonctions d intégration modèles et méta-données Identification des données de référence nécessaires : taux, clients et des autres données sinistres, Pour les données de référence : si possible, mettre en œuvre une démarche de normalisation. Mais, impact sur les applications sources Pour les autres données : attention aux données intégrant dans leur composition des données de référence. Cette fonction d intégration sera utilisée pour la construction des modèles de données ODS et DSA D. Ploix - M2 Miage - EDD - IDMS 31

Construction du schéma de l ODS Identification des données «de référence» dont la modélisation provient du processus d urbanisation des données Identification des données «des sources» qui représentent le même objet fonctionnel hors données de référence Construction des modèles ODS (Operationnal Data Store) proches des sources limités aux données nécessaires à l entrepôt Construction du modèle DSA qui «fusionne» les différents modèles de données sources dans un modèle de données relationnel unique. D. Ploix - M2 Miage - EDD - IDMS 32

Analyse et identification des DR Les objets métiers (risque, bien, client) sont des données de référence maître par rapport à notre besoin. Les DR constitutives sont les adresses Les DR paramètres sont les taux, mais également les types d opération, (Ces données ne sont pas «utiles» directement dans l EDD) D. Ploix - M2 Miage - EDD - IDMS 33

MDM source D. Ploix - M2 Miage - EDD - IDMS 34

ODS intégration des données gestion de contrat D. Ploix - M2 Miage - EDD - IDMS 35

ODS intégration des données gestion sinistre D. Ploix - M2 Miage - EDD - IDMS 36

DSA : fusion des modèles ODS_C et ODS_S Tables fusionnées : -Client -Adresse -Risque -Bien -Opération Toutes les relations ne sont pas valuées D. Ploix - M2 Miage - EDD - IDMS 37

Fonctions d intégration acquisition La fonction acquisition MDM clarifie la source d une donnée de référence et l outille. Dans le cas présent, il s agit d identifier l application source principale pour chacune des données de référence. L autre «source» de donnée devra se conformer au valeurs présentes dans la première. Permet de spécifier le processus de passage des ODS vers le DSA D. Ploix - M2 Miage - EDD - IDMS 38

Fonctions d intégration acquisition Donnée de référence Application (ODS) source Nouveaux Clients MDM > Contrat Clients «externes» MDM > Sinistre Adresses MDM > Contrat > Sinistre OM : Risques, Biens, Contrat > Sinistre Opérations Contrat + Sinistre D. Ploix - M2 Miage - EDD - IDMS 39

Fonctions d intégration validation La fonction validation décrit les règles permettant de valider une donnée. Ce sont les Règles syntaxiques, Règles de gestion, Règles de cohérence (par exemple, pour un objet métier intégrant une donnée de référence paramètre). Règle d identification unique d une donnée Règles de transcodification Via des tables de correspondance entre les valeurs des deux applications Via des mises en correspondance entre les ID des données entre deux applications D. Ploix - M2 Miage - EDD - IDMS 40

Règles de gestion syntaxique / métier Exemple de normalisation syntaxique : Normalisation des dates Normalisation des valeurs «nulles» Le processus de normalisation des données d une part et validation métier d autre part est critique pour les entrepôts de données car des données non correctes peuvent biaiser le résultat des analyses. Il est préférable de ne pas intégrer des données plutôt que des données fausses. Le MDM prend là toute sa valeur par le travail en amont de normalisation, de validation et de centralisation des règles de gestion. Attention, en terme d architecture, les outils d intermédiation ne sont pas conçus pour des règles de gestions métier complexes mais pour des règles syntaxiques les validations métiers doivent être réalisées en amont (par les applications propriétaires) ou en aval. D. Ploix - M2 Miage - EDD - IDMS 41

Règles de gestion / syntaxique Dans notre cas, l analyse devra préciser les formats techniques des données (particulièrement les dates) et s assurer que les règles de gestion sont bien les mêmes dans les deux applications. D. Ploix - M2 Miage - EDD - IDMS 42

Exemple de règle de gestion syntaxique Dans l exemple des données de gestion d assurance, les éléments à vérifier sont les dates mais également les taux si les systèmes reposent sur des technologies différentes. Par exemple, Oracle définit les règles syntaxiques de format (date, nombre, ) au niveau de la base, au niveau de la connexion du client vers la base et au niveau des requêtes. D. Ploix - M2 Miage - EDD - IDMS 43

Cohérence des données Les schémas incluent des références croisées : sur les adresses, sur les clients et les polices. Pour autant, les règles et mécanismes de synchronisations ne sont pas décrits / connus. Le processus d intégration directe / via un MDM, doit intégrer la notion d application «maître» de la données (faisant référence). Mais, dans notre cas en cas de conflit, seule l analyse des tables des opérations permettra de savoir quelle donnée utiliser. D. Ploix - M2 Miage - EDD - IDMS 44

Key mapping : transcodification d ID Données historisées Instance / occurrence de données ID d instance 11223344 9922344 Données actuelles Identifiant UID 12345678 12345678 ID Application A PKI1123 PKI1123 ID Application B 002134 002134 Civilité M. M. Nom Jean Jean Prénom Dupuis Dupuis Type voie Rue Avenue Adresse Rue des chaumes Avenue du moulin Code Postal 13100 13008 Localité Aix en Provence Marseille La transcodification de l ID peut alors être réalisé par l intermédiation ou par l outils de MDM. D. Ploix - M2 Miage - EDD - IDMS 45

Tables de transcodification de valeurs Application A Application B Attribut A Attribut 1 Attribut 2 FRA France Euro CAD Canada Dollar Lors de la transmission des données de A vers B, la valeurs des Attributs 1 et 2 de l application B seront fixés selon la valeur de l attribut A de l application A (et inversement). D. Ploix - M2 Miage - EDD - IDMS 46

Fonctions d intégration validation Dans notre cas, la table «Client» de l application Sinistre fait office de source de transcodification pour les ID des clients de l application de gestion de contrats. Son utilisation permet de garantir que deux clients dans le dataware n auront pas le même ID. Par contre, si un client était déjà client de l entreprise «externe», il apparaîtra deux fois. Le risque est alors de faire apparaître des incohérence sur la couverture contractuelle des biens. Il doit être identifié et tracé pour permettre l analyse des incohérences / rejets potentiels. D. Ploix - M2 Miage - EDD - IDMS 47

Fonctions d intégration Pilotage La fonction pilotage est assurée par des outils (tableaux de bords, ) basés sur la mise en place d indicateurs, d audits (historisation/journalisation) et d analyse d impacts. Dans le cas d intégration de données dans un ED, cette fonction de pilotage se traduira principalement par la mise en place d indicateurs sur la mesure du taux de rejet des donnée différenciée par les causes : obsolescence (une adresse pas vérifiée depuis plus d un an à 10% de chance d être fausse), transcodification, format technique, cohérence, règle de gestion Du fait du volume, une analyse sur les causes possible doit être réalisée préalablement. D. Ploix - M2 Miage - EDD - IDMS 48

Fonctions d intégration Pilotage Dans notre cas, les indicateurs se focaliseront sur la mesure de : La cohérence : «taux» partagé entre les applications, L obsolescence : identification des objets métiers «anciens», n ayant pas fait l objet d opération depuis 1 an (cf pb adresse), Ce pilotage en amont (des analyses) a comme fonction de préparer un ED «propre». S il fait partie de la phase d acquisition des données et doit également traiter les données de l ED lui-même (fait comme dimensions). D. Ploix - M2 Miage - EDD - IDMS 49

Fonctions d intégration stockage et journalisation Mise en œuvre de la base MDM sur les données identifiées : Via un modèle normalisé intégrant, au besoin, les ID multiples (correspondant à leur instanciation dans les applications sources/consommatrices), Il peut également intégrer des dimension de contextualisation (cf transcodification). Intégrant une journalisation de l historique des données afin de pouvoir porter les fonctions d audit et de pilotage. Un modèle dépendant du contexte de partage (dans sa richesse fonctionnelle) mais, par exemple, qui simplifie le processus de mise à jours des ED via l historisation. D. Ploix - M2 Miage - EDD - IDMS 50

Fonctions d intégration stockage et journalisation Dans notre exemple, des données sont placées dans une base MDM : les biens, les risques, les clients, les adresses. Le reste est construit directement à partir des bases sources. La phase MDM met en place d UID et la date de màj. D. Ploix - M2 Miage - EDD - IDMS 51

Fonctions d intégration accès et diffusion Le MDM ne se positionne pas uniquement en tant que base de stockage d un certain nombre de données mais également en source et doit, de ce fait, être interfacé via une IHM de gestion et des composants d intermédiation vers/depuis les applications destinatrices/sources. Dans notre cas, l application finale intègrera deux composants : une intégration des sources vers l ED et une base MDM destination et source des données de références. D. Ploix - M2 Miage - EDD - IDMS 52

Fonctions d intégration administration et maintenance Le positionnement du MDM comme «point de vérité» lui impose les contraintes des applications les plus strictes En terme de gestion des droits d accès En terme de niveau disponibilité Ce problème se retrouve également en point central des difficultés rencontrées par le SOA : Problème de coût induit Problème de délégation de responsabilité Problème de niveau de disponibilité quasi impossible à atteindre D. Ploix - M2 Miage - EDD - IDMS 53

Intégration de données multi-sources Données sources Fonctions d intégration Intégration par étapes Intégration de la fonction MDM D. Ploix - M2 Miage - EDD - IDMS 54

Intégration par étapes Contexte Contexte : intégration de données de ventes en provenance de plusieurs chaînes de magasin. Les chaînes utilisent le même logiciel de gestion. Un entrepôt de données des ventes doit être construit pour la réalisation de différents types d analyses. D. Ploix - M2 Miage - EDD - IDMS 55

Intégration par étapes Schéma source Le logiciel source a comme schéma : D. Ploix - M2 Miage - EDD - IDMS 56

Intégration par étapes Schéma cible La modélisation décisionnelle aboutie au schéma suivant : D. Ploix - M2 Miage - EDD - IDMS 57

Intégration par étapes identification des données de référence Les données de référence maître sont : Les clients Les produits Les magasins Les fournisseurs Les données de référence constitutives sont : Les adresses Les données de référence paramètre sont : Les dates D. Ploix - M2 Miage - EDD - IDMS 58

Intégration par étapes Schéma des données de référence Les données de références seront (dans notre exemple) stockées dans l ODS d intégration des données sources. Leur schéma sera : Tables de liaison entre les identifiants des applications sources et le référentiel D. Ploix - M2 Miage - EDD - IDMS 59

Intégration par étapes Contraintes d intégration Les étapes de l intégration des données seront : 1. Mise à jour des données de références 2. Mise à jour des dimensions de l entrepôt 3. Mise à jour des faits de vente avec complétion de la dimension date D. Ploix - M2 Miage - EDD - IDMS 60

Intégration par étapes Fonction acquisition Ordre Table Cible Table Source A.1 ReferenceClient Client, téléphone, carte_fidelite A.2 ClientMagasin ReferenceClient, Client A.1 ReferenceAdresse Fournisseur, Magasin, téléphone A.2 ReferenceMagasin Magasin, ReferenceAdresse A.2 ReferenceFournisseur Fournisseur, ReferenceAdresse A.3 ReferenceProduit Produit, ReferenceFournisseur A.4 ProduitMagasin Stock, Produit, Magasin, ReferenceProduit, ReferenceMagasin B.1 DimClient ReferenceClient B.1 DimMagasin ReferenceMagasin + ReferenceAdresse B.1 DimProduit ReferenceProduit + ReferenceAdresse B.2 DimDate Vente + fonctions base de données B.2 FaitVente Vente + ClientMagasin + ProduitMagasin D. Ploix - M2 Miage - EDD - IDMS 61

Intégration par étapes Fonction Validation et Qualité Table Règle Description ReferenceProduit PK fonctionnelle EAN+Fournisseur+Designation ReferenceProduit PK Référence PK source Table ProduitMagasin ReferenceClient PK fonctionnelle Nom, prenom, adresse ReferenceClient PK Référence PK source Table ClientMagasin D. Ploix - M2 Miage - EDD - IDMS 62

Intégration par étapes Fonction modèles de données méta données Table DimDate Attribut cible Attribut source Fonction d intégration DimDate.date Vente.date DimDate.num_jour_mois Vente.date datepart(month, date) D. Ploix - M2 Miage - EDD - IDMS 63

Intégration par étapes Fonction pilotage En cas de rejets sur l intégration des produits du fait de la désignation, un filtrage par EAN + Fournisseur sera réalisé afin de détecter les modifications de désignations. En cas de rejets sur l intégration des fournisseurs du fait de l adresse, un filtrage par historique du fournisseur sera réalisé afin de détecter les modifications d adresse, D. Ploix - M2 Miage - EDD - IDMS 64

Intégration par étapes Fonction stockage et historisation Les tables de références sont intégrées à la base de données ODS et ne sont pas purgées entre deux intégrations. La question d une table d audit référençant l historique des intégrations se pose. Les modifications de désignations des produits et d adresse des fournisseurs est gérée par écrasement de l ancienne valeur (attention aux incohérences entre les magasins ). D. Ploix - M2 Miage - EDD - IDMS 65

Intégration par étapes Accès, diffusion et administration Question à résoudre : Quelle interface pour gérer les rejets des produits et des fournisseurs? Question à préciser : Ordonnancement de l intégration des données selon les sources et de mise à jour des données de l entrepôt une fois les données de références intégrées. D. Ploix - M2 Miage - EDD - IDMS 66

Gestion de Données de Référence Données sources Fonctions d intégration Intégration par étapes Intégration de la fonction MDM D. Ploix - M2 Miage - EDD - IDMS 67

Des DR à la Gestion des DR (MDM) D. Ploix - M2 Miage - EDD - IDMS 68

Fonctions du MDM dans l intégration des données D. Ploix - M2 Miage - EDD - IDMS 69

Situation des données de référence dans le SI Processus amont : Point d acquisition d une donnée Source(s), états transitoires de validation, contrôles de gestion, Point de vérité (MDM) Processus aval : Consommation de la donnée Journalisation, diffusion (ETL, EAI, ) Données Valides. D. Ploix - M2 Miage - EDD - IDMS 70

Situation des GDR dans le SI Situation dans la chaîne de l information Référentiel en début de chaîne : Unique point de saisie de la donnée Passerelle entre un fournisseur de donnée externe Point de vérité = point d acquisition Meilleurs situation possible Référentiel en milieu de chaîne : Récupère et réconcilie la donnée issue de points d acquisition multiples Assure la redistribution des données et son contrôle qualitatif Référentiel en fin de chaine Assure les traitements qualitatifs de redressement et de rapprochement. Souvent très complexes et coûteux à mettre en œuvre. D. Ploix - M2 Miage - EDD - IDMS 71

Typologies d architectures MDM Consolidation Consolidation : plusieurs sources alimentent le référentiel et les points d acquisition sont distincts du point de vérité. D. Ploix - M2 Miage - EDD - IDMS 72

Typologies d architectures MDM Répertoire Virtuel Répertoire Virtuel : comparable à de la consolidation avec une intermédiation de type EAI/ESB ou EII (BD virtuelle). D. Ploix - M2 Miage - EDD - IDMS 73

Typologies d architectures MDM Coopération Coopération : consolidation avec un couplage fort entre les applications source et la solution de référentiel (font parties ou dépendent de) D. Ploix - M2 Miage - EDD - IDMS 74

Typologies d architectures MDM Centralisation Centralisation : fusion du point d acquisition et du point de vérité. D. Ploix - M2 Miage - EDD - IDMS 75

Typologie d architecture La réalité est souvent une composition des patterns selon les données (voir les parties de données). D. Ploix - M2 Miage - EDD - IDMS 76

Critères de choix d une architecture D. Ploix - M2 Miage - EDD - IDMS 77

Outillage du MDM : quelle solution? Le MDM est souvent répartis entre plusieurs outils couvrant tout ou partie des fonctions qu il requière : DQM (Data Quality Managment) EII (Entreprise Information Integration) Annuaires CRM (Customer Relationship Managment) PLM (Product Lifecycle Managment) D. Ploix - M2 Miage - EDD - IDMS 78

Relation DQM / MDM Fonctions principales portées par le DQM : Nettoyage des données (normalisation, consolidation, enrichissement, surveillance, analyse, profilage) en fonction de règles spécifiques de gestion de la qualité. Périmètre de données plus large que les données de références Brique essentielle du MDM Mais il manque : La persistance (stockage) : fonction de point de vérité À l inverse, un MDM peu exister sans DQM mais il ne garanti plus la qualité des données. D. Ploix - M2 Miage - EDD - IDMS 79

Relation EII / MDM L EII et le MDM ont des fonctions séparées et complémentaires, le MDM référence les données alors que l EII les restitues sans harmonisation ni réconciliation ni correspondance à une vérité unique. D. Ploix - M2 Miage - EDD - IDMS 80

Annuaire et MDM Les annuaires (LDAP principalement) permettent de stocker des données hiérarchisées «spécialisées» dans la gestion de l identification Même s ils imposent une structure de données, ils ne peuvent que servir de conteneur technique de données au sein d un MDM spécialisé sur ces sujets. Pas constituer un MDM (couverture fonctionnelle trop faible). D. Ploix - M2 Miage - EDD - IDMS 81

Progiciel métier comme MDM L utilisation de progiciel métier (CRM, ERP, ) s adapte mal à porter la fonction de MDM car ils : Imposent le schéma de données Contraignent fortement les règles de gestion sur la qualité Ne couvrent pas une partie importante des fonctionnalités attendues (key maping, pilotage, ). Imposent un rythme de mise à jour Mais : adaptés si la couverture fonctionnelle est suffisante, peu ou pas de besoin de pilotage ou de gouvernance des données, intègre les processus métier prioritaires. D. Ploix - M2 Miage - EDD - IDMS 82

Solutions pour le MDM D. Ploix - M2 Miage - EDD - IDMS 83

Modes d intermediation D. Ploix - M2 Miage - EDD - IDMS 84

MDM et phases d un projet D. Ploix - M2 Miage - EDD - IDMS 85

Migration de données D. Ploix - M2 Miage - EDD - IDMS 86