MTI820 Entrepôts de données et intelligence d affaires. Intégration des données et ETL

Documents pareils
BI = Business Intelligence Master Data-ScienceCours 2 - ETL

Le cycle de vie d'un projet en intelligence d'affaires

Architectures d'intégration de données

Business Intelligence avec SQL Server 2012 Maîtrisez les concepts et réalisez un système décisionnel

Introduction aux outils BI de SQL Server Tutoriel sur SQL Server Integration Services (SSIS)

Business Intelligence avec SQL Server 2014 Maîtrisez les concepts et réalisez un système décisionnel

TP2_1 DE BUSINESS INTELLIGENCE ISIMA ZZ3 F3

Les entrepôts de données et l analyse de données

Urbanisme du Système d Information et EAI

Chapitre 9 : Informatique décisionnelle

Département Génie Informatique

Bases de Données Avancées

Introduc;on à l intelligence d affaires et aux entrepôts de données

Business & High Technology

Plan. Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation

Le "tout fichier" Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique

Introduction à la B.I. Avec SQL Server 2008

L Information en Temp Réel

Business Intelligence avec SQL Server 2012

Architecture des entrepôts de données

TP2 DE BUSINESS INTELLIGENCE ISIMA ZZ3 F3

Programme détaillé. Administrateur de Base de Données Oracle - SQLServer - MySQL. Objectifs de la formation. Les métiers

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)

Urbanisation des SI. Des composants technologiques disponibles. Urbanisation des Systèmes d'information Henry Boccon Gibod 1

SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...)

Fournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement

BUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise

SQL Server 2012 et SQL Server 2014

Business Intelligence avec SQL Server 2012

Business Intelligence avec Excel, Power BI et Office 365

ORACLE DATA INTEGRATOR ENTERPRISE EDITION - ODI EE

Thibault Denizet. Introduction à SSIS

Introduction à ORACLE WAREHOUSE BUILDER Cédric du Mouza

BI = Business Intelligence Master Data-Science

Clients et agents Symantec NetBackup 7

DÉPLOIEMENT DE QLIKVIEW POUR DES ANALYSES BIG DATA CHEZ KING.COM

Business & High Technology

Un datawarehouse est un entrepôt de données (une base de données) qui se caractérise par des données :

Technologie data distribution Cas d usage.

BI = Business Intelligence Master Data-ScienceCours 3 - Data

CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2012

Analyse comparative entre différents outils de BI (Business Intelligence) :

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

CURRICULUM VITAE. Martin Harnois. Consultant depuis 23 ans Spécialiste en Business Intelligence / entrepôt de données depuis 11 ans.

Cours Base de données relationnelles. M. Boughanem, IUP STRI

Entrepôt de données 1. Introduction

et Groupe Eyrolles, 2006, ISBN :

LES ENTREPOTS DE DONNEES

Data Tier Application avec SQL Server 2008 R2

Les Entrepôts de Données. (Data Warehouses)

Présentation du module Base de données spatio-temporelles

Les méthodes de sauvegarde en environnement virtuel

La problématique. La philosophie ' ) * )

INGÉNIEUR - DÉVELOPPEUR CONFIRMÉE ORACLE - PL/SQL. 27 ans - 4 ans d'expérience

LES NOUVEAUTES DE COST AND PROFITABILITY MANAGEMENT 8.1

Business Intelligence : Informatique Décisionnelle

Simple Database Monitoring - SDBM Guide de l'usager

LA GOUVERNANCE, OU COMMENT RAPPROCHER LES ÉQUIPES DE DÉVELOPPEMENT ET D INFRASTRUCTURE

SQL SERVER 2008, BUSINESS INTELLIGENCE

La réplication sous SQL Server 2005

En synthèse. HVR pour garantir les échanges sensibles de l'entreprise

Bases de Données. Stella MARC-ZWECKER. Maître de conférences Dpt. Informatique - UdS

SQL. Oracle. pour. 4 e édition. Christian Soutou Avec la participation d Olivier Teste

Catalogue Formation «Vanilla»

Urbanisation des Systèmes d'information

Entrepôts de données. NEGRE Elsa Université Paris-Dauphine

Travail de diplôme 2011 Business Intelligence Open Source SpagoBI/Talend Résumé

Datawarehouse and OLAP

FAMILLE EMC RECOVERPOINT

Structure fonctionnelle d un SGBD

BizTalk Server Principales fonctions

et les Systèmes Multidimensionnels

SQL Server Administration d'une base de données transactionnelle avec SQL Server Management Studio (édition enrichie de vidéos)

FORMATION Offre de Formation - Packaging. Les bonnes pratiques du packaging avec Installshield et AdminStudio. Contact et inscriptions

<Insert Picture Here> Best Practice : Réduction Coût de migration R12

Information utiles. webpage : Google+ : digiusto/

Intégration de données hétérogènes et réparties. Anne Doucet

Retek Data Warehouse 11.0 Guide des opérations

Le Ro le Hyper V Troisie me Partie Haute disponibilite des machines virtuelles

MYXTRACTION La Business Intelligence en temps réel

La Business Intelligence pour les Institutions Financières. Jean-Michel JURBERT Resp Marketing Produit

Programme scientifique Majeure ARCHITECTURE DES SYSTEMES D INFORMATION. Mentions Ingénierie des Systèmes d Information Business Intelligence

EMC DATA DOMAIN OPERATING SYSTEM

CAHIER DES CHARGES D'IMPLANTATION

Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP)

DATASET / NETREPORT, propose une offre complète de solutions dans les domaines suivants:

Didier MOUNIEN Samantha MOINEAUX

Projet CASI: Master Data Management

Virginie!SALAS Janvier!09! NFE107

MANAGEMENT DES SERVICES INFORMATIQUES

Architecture N-Tier. Ces données peuvent être saisies interactivement via l interface ou lues depuis un disque. Application

SAP Business Suite Powered by SAP HANA Transactionnel et Analytique réunis

Groupe d usagers SharePoint Québec

Projet Ecureuil DataWarehouse CNIP. ETL avec Talend. Travail de diplôme Yannick Perret. Responsable de projet: Sylvie Bouchard

SQL Server SQL Server Implémentation d une solution. Implémentation d une solution de Business Intelligence.

TIVOLI STORAGE MANAGER. Denis Vandaele

EMC DATA DOMAIN HYPERMAX

Sécurité des entrepôts de données dans le Cloud Un SaaS pour le cryptage des données issues d un ETL

CA ARCserve Backup. Avantages. Vue d'ensemble. Pourquoi choisir CA

Enterprise Intégration

Transcription:

MTI820 Entrepôts de données et intelligence d affaires Intégration des données et ETL Département de génie logiciel et des TI MTI820 Hiver 2011 S. Chafki, C. Desrosiers 1

Le cycle de vie d un projet en BI Diagramme de flux de travail: Conception de l architecture technique Sélection et installation des produits Croissance Planification de projet / programme Définition des besoins d affaires Modélisation des données Conception physique Conception et développement du système ETL Déploiement Conception des application de BI Développement des applications de BI Maintenance Gestion de projet / programme Département de génie logiciel et des TI MTI820 Hiver 2011 S. Chafki, C. Desrosiers 2

Question Pourquoi est-il nécessaire de faire l intégration des données? Département de génie logiciel et des TI MTI820 Hiver 2011 S. Chafki, C. Desrosiers 3

Les problèmes des sources de données 1. Sources diverses et disparates; 2. Sources sur différentes plateformes et OS; 3. Applications legacy utilisant des BD et autres technologies obsolètes; 4. Historique de changement non-préservé dans les sources; 5. Qualité de données douteuse et changeante dans le temps; 6. Structure des systèmes sources changeante dans le temps; 7. Incohérence entre les différentes sources; 8. Données dans un format difficilement interprétable ou ambigu. Département de génie logiciel et des TI MTI820 Hiver 2011 S. Chafki, C. Desrosiers 4

Question Quelles sont les principales approches d intégration et quels sont leurs principaux avantages/inconvénients? Département de génie logiciel et des TI MTI820 Hiver 2011 S. Chafki, C. Desrosiers 5

Approches d intégration Source: EII - ETL EAI What, Why, and How!, Tom Yu, 2005 ETL EII EAI Target / Data Warehouse SQL (or Content) Application Data Source load transform extract Data Source Structured Data Source Data Virtualization Legacy Data Source unstructured Application Interpret Transform Route Application Extract, Transform and Load Intégrationet livraison des données en lot Transformations appliquées sur les données Enterprise Information Intergration Fédération de données provenant de plusieurs sources Accès temps-réel aux données Données structurées ou semistructurées Enterprise Application Intergration Processus d intégration des données d applications Basé sur l échange de messages sur un bus commun Département de génie logiciel et des TI MTI820 Hiver 2011 S. Chafki, C. Desrosiers 6

Extract, Transform and Load (ETL) Caractéristiques: Permet la consolidation des données à l aide des trois opérations suivantes: Extraction: identifier et extraire les données de sources ayant subi une modification depuis la dernière exécution; Transformation: appliquer diverses transformations aux données pour les nettoyer, les intégrer et les agréger; Chargement: insérer les données transformées dans l entrepôt et gérer les changements aux données existantes (ex: stratégies SCD). Traite normalement de grande quantités de données en lots cédulés; Est surtout utilisé avec les entrepôts de données et les comptoirs de données. Département de génie logiciel et des TI MTI820 Hiver 2011 S. Chafki, C. Desrosiers 7

Avantages: Extract, Transform and Load (ETL) Optimisé pour la structure de l entrepôt de données; Peut traiter de grandes quantités de données dans une même exécution (traitement en lot); Permet des transformations complexes et agrégations sur les données; La cédule d exécution peut être contrôlée par l administrateur; La disponibilité d outils GUI sur le marché permet d améliorer la productivité; Permet la réutilisation des processus et transformations (ex: packages dans SSIS). Département de génie logiciel et des TI MTI820 Hiver 2011 S. Chafki, C. Desrosiers 8

Extract, Transform and Load (ETL) Inconvénients: Processus de développement long et coûteux; Gestion des changements nécessaire; Exige de l espace disque pour effectuer les transformations (staging area); Exécuté indépendamment du besoin réel; Latence des données entre la source et l entrepôt; Unidirectionnel (des sources vers l entrepôt de données). Département de génie logiciel et des TI MTI820 Hiver 2011 S. Chafki, C. Desrosiers 9

Entreprise Information Integration (EII) Caractéristiques: Fournit une vue unifiée des données de l'entreprise, où les sources de données forment une fédération; Les sources de données dispersées sont consolidées à l'aide d'une BD virtuelle, de manière transparente aux applications utilisant ces données; Toute requête à la BD virtuelle est décomposée en sous-requêtes aux sources respectives, dont les réponses sont assemblées en un résultat unifié et consolidé; Permet de consolider uniquement les données utilisées, au moment où elles sont utilisées (source data pulling). Le traitement en-ligne des données peut cependant entraîner des délais importants. Département de génie logiciel et des TI MTI820 Hiver 2011 S. Chafki, C. Desrosiers 10

Entreprise Information Integration (EII) Avantages: Accès relationnel à des sources non-relationnelles; Permet d explorer les données avec la création du modèle de l entrepôt de données; Accélère le déploiement de la solution; Peut être réutilisé par le système ETL dans une itération future; Aucun déplacement de données. Département de génie logiciel et des TI MTI820 Hiver 2011 S. Chafki, C. Desrosiers 11

Entreprise Information Integration (EII) Inconvénients: Requiert la correspondance des clés d une source à l autre; Consolidation des données plus complexe que dans l ETL; Surtaxe les système sources; Plus limité que l ETL dans la quantité de données pouvant être traitée; Transformations limitées sur les données; Peut consommer une grande bande passante du réseau. Département de génie logiciel et des TI MTI820 Hiver 2011 S. Chafki, C. Desrosiers 12

Entreprise Application Integration (EAI) Caractéristiques: Approche permettant de fournir à l'entrepôt des données provenant des sources (source data pushing); Repose sur l'intégration et le partage des fonctionnalités des applications sources à l'aide d'une architecture SOA; Généralement utilisé en temps réel ou en semi-temps réel (Near Real Time); L'EAI ne remplace pas le processus ETL, mais permet de simplifier ce dernier. Département de génie logiciel et des TI MTI820 Hiver 2011 S. Chafki, C. Desrosiers 13

Entreprise Application Integration (EAI) Avantages: Facilite l interopérabilité des applications; Permet l accès en (quasi) temps-réel; Ne transfère que les données nécessaires; Contrôle du flot de l information. Département de génie logiciel et des TI MTI820 Hiver 2011 S. Chafki, C. Desrosiers 14

Entreprise Application Integration (EAI) Inconvénients: Support limité aux transformations et agrégations des données; Taille des transactions limitée (en nombre de lignes); Développement complexe; Gestion complexe de l intégrité sémantique des données (e.g., règles d affaires); Utilise la bande passante du réseau durant les heures de pointe. Département de génie logiciel et des TI MTI820 Hiver 2011 S. Chafki, C. Desrosiers 15

Comparaison entre les approches d intégration Flot de données Mouvement de données ETL EII EAI Unidirectionnel (sources à l entrepôt) Lots cédulés Bidirectionnel Au moment de la requête Bidirectionnel Déclenché par la transaction Latence Journalier à mensuel Temps-réel Quasi temps-réel Transformations/agré gations des données Volume des données Grande capacité Moyennecapacité Faible capacité Grand (millions ou milliards de lignes) Moyen (10,000 1,000,000 de lignes) Petit (100-1000 lignes) Département de génie logiciel et des TI MTI820 Hiver 2011 S. Chafki, C. Desrosiers 16

Quand utiliser les approches d intégration Approche ETL: Consolidation d une grande quantité de données Transformations complexes Approche EII: Relier un entrepôt (EDW) existant avec des données de sources spécifiques Données sources volatiles et accessibles à l aide de requêtes simples (ex: SQL). Approche EAI: Intégration de transactions Requêtes analytiques simples Sources non-accessibles directement Département de génie logiciel et des TI MTI820 Hiver 2011 S. Chafki, C. Desrosiers 17

Exemples de produits commerciaux Outils ETL: Oracle Warehouse Builder; IBM Infosphere Information Server; Microsoft SQL Server Integration Services (SSIS); SAS Data Integration Studio. Outils EAI: IBM WebSphere Message Broker; Microsoft BizTalk Server; Oracle SOA Suite. Outils EII: SAP BusinessObjects Data Federator; IBM WebSphere Federation Server. Département de génie logiciel et des TI MTI820 Hiver 2011 S. Chafki, C. Desrosiers 18

Question Quelles sont les principales étapes dans le développement du système ETL? Département de génie logiciel et des TI MTI820 Hiver 2011 S. Chafki, C. Desrosiers 19

Tâches et étapes de l'etl ETL des tables de faits ETL des tables de dimension Définir les procédures pour le chargement de données Préparer le staging area et les outils d'assurance qualité Planifier les agrégations de données Définir les règles de transformation et de nettoyage des données Définir les règles d'extraction des données cibles Déterminer les sources internes et externes renfermant ces données Déterminer les données nécessaires à la solution de BI Département de génie logiciel et des TI MTI820 Hiver 2011 S. Chafki, C. Desrosiers 20

Considérations pratiques: Extraction des données Identifier les sources de données et leurs structures; Décider, pour chaque source, si l'extraction est faite à la main (ex: script) ou à l'aide d'un outil; Choisir, pour chaque source, la fenêtre temporelle durant laquelle sera faite l'extraction; Déterminer la séquence des tâches d'extraction; Déterminer comment gérer les exceptions. Département de génie logiciel et des TI MTI820 Hiver 2011 S. Chafki, C. Desrosiers 21

Identification des sources: Extraction des données 1. Énumérer les items cibles (métriques et attributs de dimension) nécessaires à l'entrepôt de données; 2. Pour chaque item cible, trouver la source et l'item correspondant de cette source; 3. Si plusieurs sources sont trouvées, choisir la plus pertinente; 4. Si l'item cible exige des données de plusieurs sources, former des règles de consolidation; 5. Si l'item source referme plusieurs items cibles (ex: un seul champs pour le nom et l'adresse du client), définir des règles de découpage; 6. Inspecter les sources pour des valeurs manquantes. Département de génie logiciel et des TI MTI820 Hiver 2011 S. Chafki, C. Desrosiers 22

Extraction des données Extraction complète: Capture l'ensemble des données à un certain instant (snapshot de l'état opérationnel); Normalement employée dans deux situations: 1. Chargement initial des données; 2. Rafraîchissement complet des données (ex: modification d'une source). Peut être très coûteuse en temps (ex: plusieurs heures/jours). Extraction incrémentale: Capture uniquement les données qui ont changées ou ont été ajoutées depuis la dernière extraction; Peut être faite de deux façons: 1. Extraction temps-réel; 2. Extraction différée (en lot). Département de génie logiciel et des TI MTI820 Hiver 2011 S. Chafki, C. Desrosiers 23

Question Comment peut-on extraire les données qui ont changées dans les sources: En temps-réel? En différé (lot)? Département de génie logiciel et des TI MTI820 Hiver 2011 S. Chafki, C. Desrosiers 24

Extraction des données Extraction temps-réel: S'effectue au moment où les transactions surviennent dans les systèmes sources. Systèmes opérationnels sources BD sources triggers Journal de transactions Option 1: Capture à l'aide des journaux de transactions Fichiers générés par les sources Option 3: Capture dans les applications sources Fichiers générés par les triggers Option 2: Capture à l'aide de triggers Zone de préparation de données (staging area) Département de génie logiciel et des TI MTI820 Hiver 2011 S. Chafki, C. Desrosiers 25

Extraction des données Option 1: Capture à l'aide du journal des transactions Utilise les logs de transactions de la BD servant à la récupération en cas de panne; Aucune modification requise à la BD ou aux sources; Doit être fait avant le rafraîchissement périodique du journal; Pas possible avec les systèmes legacy ou les sources à base de fichiers (il faut une BD journalisée). Département de génie logiciel et des TI MTI820 Hiver 2011 S. Chafki, C. Desrosiers 26

Extraction des données Option 2: Capture à l'aide de triggers Des procédures déclenchées (triggers) sont définies dans la BD pour recopier les données à extraire dans un fichier de sortie; Meilleur contrôle de la capture d'évènements; Exige de modifier les BD sources; Pas possible avec les systèmes legacy ou les sources à base de fichiers. Département de génie logiciel et des TI MTI820 Hiver 2011 S. Chafki, C. Desrosiers 27

Extraction des données Option 3: Capture à l'aide des applications sources Les applications sources sont modifiées pour écrire chaque ajout et modification de données dans un fichier d'extraction; Exige des modifications aux applications existantes; Entraîne des coûts additionnels de développement et de maintenance; Peut être employé sur des systèmes legacy et les systèmes à base de fichiers. Département de génie logiciel et des TI MTI820 Hiver 2011 S. Chafki, C. Desrosiers 28

Extraction des données Extraction différée: Extrait tous les changements survenus durant une période donnée (ex: heure, jour, semaine, mois). Systèmes opérationnels sources BD sources Extraction d'aujourd'hui Extraction d'hier Fichiers d'extraction utilisant les timestamps Option 1: Capture basée sur les timestamps Programme d'extraction Zone de préparation de données (staging area) Programme de comparaison Option 2: Capture par comparaison de fichiers Fichiers d'extraction utilisant la comparaison Département de génie logiciel et des TI MTI820 Hiver 2011 S. Chafki, C. Desrosiers 29

Extraction des données Option 1: Capture basée sur les timestamps Une estampille (timestamp) d'écriture est ajoutée à chaque ligne des systèmes sources; L'extraction se fait uniquement sur les données dont le timestamp est plus récent que la dernière extraction; Fonctionne avec les systèmes legacy et les fichiers plats, mais peut exiger des modifications aux systèmes sources; Gestion compliquée des suppressions. Département de génie logiciel et des TI MTI820 Hiver 2011 S. Chafki, C. Desrosiers 30

Extraction des données Option 2: Capture par comparaison de fichiers Compare deux snapshots successifs des données sources; Extrait seulement les différences (ajouts, modifications, suppressions) entre les deux snapshots; Peut être employé sur des systèmes legacy et les systèmes à base de fichiers, sans aucune modification; Exige de conserver une copie de l'état des données sources; Approche relativement coûteuse. Département de génie logiciel et des TI MTI820 Hiver 2011 S. Chafki, C. Desrosiers 31

Question Quelles sont les transformations à effectuer sur les données sources avant de les charger dans l entrepôt? Département de génie logiciel et des TI MTI820 Hiver 2011 S. Chafki, C. Desrosiers 32

Transformation des données Types de transformation: 1. Révision de format: Ex: Changer le type ou la longueur de champs individuels. 2. Décodage de champs: Consolider les données de sources multiples Ex: ['homme', 'femme'] vs ['M', 'F'] vs [1,2]. Traduire les valeurs cryptiques Ex: 'AC', 'IN', 'SU' pour les statuts actif, inactif et suspendu. 3. Pré-calcul des valeurs dérivées: Ex: profit calculé à partir de ventes et coûts. 4. Découpage de champs complexes: Ex: extraire les valeurs prénom, secondprénom et nomfamille à partir d'une seule chaîne de caractères nomcomplet. Département de génie logiciel et des TI MTI820 Hiver 2011 S. Chafki, C. Desrosiers 33

Transformation des données Types de transformation (suite): 5. Fusion de plusieurs champs: Ex: information d'un produit Source 1: code et description; Source 2: types de forfaits; Source 3: coût. 6. Conversion de jeu de caractères: Ex: EBCDIC (IBM) vers ASCII. 7. Conversion des unités de mesure: Ex: impérial à métrique. 8. Conversion de dates: Ex: '24 FEB 2011' vs '24/02/2011' vs '02/24/2011'. 9. Pré-calcul des agrégations: Ex: ventes par produit par semaine par région. 10. Déduplication: Ex: Plusieurs enregistrements pour un même client. Département de génie logiciel et des TI MTI820 Hiver 2011 S. Chafki, C. Desrosiers 34

Transformation des données Problème de résolution d'entités: Survient lorsqu'une même entité se retrouve sur différentes sources, sans qu'on ait la correspondance entre ces sources; Ex: clients de longue date ayant un identifiant différent sur les différentes sources; L'intégration des données requiert de retrouver la correspondance; Approches basées sur des règles de résolution Ex: les entités doivent avoir au moins N champs identiques (fuzzy lookup / matching). Problème des sources multiples: Survient lorsqu'une entité possède une représentation différente sur plusieurs sources; Approches de sélection: Choisir la source la plus prioritaire; Choisir la source ayant l'information la plus récente. Département de génie logiciel et des TI MTI820 Hiver 2011 S. Chafki, C. Desrosiers 35

Transformation des données Gestion des changements dimensionnels: Déterminer la stratégie de gestion des changements (SCD Type 1, 2 ou 3) de chaque attribut dimensionnel modifié; Préparer l'image de chargement (load image) en conséquence: SCD Type 1: ancienne valeur écrasée; SCD Type 2: nouvelle ligne ajoutée; SCD Type 3: déplacement de l'ancienne valeur dans la colonne d'historique et écriture de la nouvelle valeur dans la colonne courante. Département de génie logiciel et des TI MTI820 Hiver 2011 S. Chafki, C. Desrosiers 36

Exemples de transformations: (SSIS) Département de génie logiciel et des TI MTI820 Hiver 2011 S. Chafki, C. Desrosiers 37

Transformation des données Matrice de transformation: Champs cible Table cible Champs source Table source Règle de transformation Département de génie logiciel et des TI MTI820 Hiver 2011 S. Chafki, C. Desrosiers 38

Types de chargement: Chargement des données Chargement initial: Fait une seule fois lors de l'activation de l'entrepôt de données; Les indexes et contraintes d'intégrité référentielle (clé étrangères) sont normalement désactivés temporairement; Peut prendre plusieurs heures. Chargement incrémental: Fait une fois le chargement initial complété; Tient compte de la nature des changements (ex: SCD Type 1, 2 ou 3); Peut être fait en temps-réel ou en lot. Rafraîchissement complet: Employé lorsque le nombre de changements rend le chargement incrémental trop complexe; Ex: lorsque plus de 20% des enregistrements ont changé depuis le dernier chargement. Département de génie logiciel et des TI MTI820 Hiver 2011 S. Chafki, C. Desrosiers 39

Chargement des données Considération additionnelles: Faire les chargements en lot dans une période creuse (entrepôt de données non utilisé); Considérer la bande passante requise pour le chargement; Avoir un plan pour évaluer la qualité des données chargées dans l'entrepôt; Commencer par charger les données des tables de dimension. Département de génie logiciel et des TI MTI820 Hiver 2011 S. Chafki, C. Desrosiers 40