Evry - M2 MIAGE Entrepôts de Données
|
|
|
- Jérémie Malenfant
- il y a 10 ans
- Total affichages :
Transcription
1 Evry - M2 MIAGE Entrepôts de Données Modélisation décisionnelle D. Ploix - M2 MIAGE - Conception EDD 1
2 Plan Construction de l entrepôt : les faits et les dimensions Préparation de l analyse : Les agrégats les rapports et les cubes Optimisation Exemple d analyse Transport D. Ploix - M2 MIAGE - Conception EDD 2
3 Faits et dimensions Une méthode de modélisation faits/dimensions part du processus métier analysé vers l analyse : 1. Identification du processus métier analysé 2. Établissement du niveau de granularité de l analyse 3. Établissement des dimensions qui s appliquent à chaque ligne de fait 4. Identification des caractéristiques numériques qui s appliquent à chaque ligne de fait Cette méthode demande une vision complète et décrite du processus métier et de son implémentation. Elle permet de construire le tableau qui croise les processus métier (et les différentes étapes des processus métier) et les dimensions : Processus\ Dimension Date Entrepôt Produit Magasin Promotion Vente au détail X X X X Stock entrepôt X X X Commande X X X D. Ploix - M2 MIAGE - Conception EDD 3
4 Faits et dimensions Deux type d informations caractérisent les faits : Des mesures numériques propre à chaque instance de faits (quantité, prix, ) Des dimensions caractéristiques plus ou moins complexes (fournisseur, produit, ) Les mesures numériques propres à chaque fait sont l objet de calculs d analyse (montant global, moyenne globale, ) et les dimensions constituent des facteurs de sélection des faits étudiés (produits de telle ou telle marque, ). D. Ploix - M2 MIAGE - Conception EDD 4
5 Faits et dimensions À partir de l entrepôt de données intégrant l ensemble des faits et dimensions constitutif des processus métier, une analyse doit être réalisée pour identifier les éléments nécessaires aux analystes (pour construire les datamarts, agrégats et autres cubes). Méthode d identification du modèle décisionnel à partir de l analyse cible : Que voulez vous analyser? Faits Quels sont vos critères d'analyse? Dimensions Jusqu'à quel niveau de détail voulez vous aller? Mesures dans les faits Attributs des dimensions La modélisation sera réalisée à l aide d un tableau par «fait» : Chaque colonne désigne une dimension Chaque éléments de chaque colonne désigne les caractéristiques des dimensions Dans la première colonne sont placées les caractéristiques intégrées à la table de faits (mesures, facteurs). FaitX : Attribut1, Attribut2, Dimension 1 Dimension 2 Dimension 3 Attribut1 Dim 1 Attribut 1 Dim 2 Attribut 1 Dim 3 Attribut 2 Dim 1 Attribut 2 Dim 2 Attribut 2 Dim 3 D. Ploix - M2 MIAGE - Conception EDD 5
6 Faits et dimensions Exemple : Le département en charge des approvisionnement des magasins souhaite faire une étude sur la fidélité des clients en période de vacances pour les produits à forte valeur ajoutée. Les analystes souhaiteraient en particulier identifier les déplacements de population d une région vers une autre pour pouvoir mieux approvisionner les magasin des produits consommés par les clients pendant leurs vacances. Date Client Magasin Produit Localisation du client Localisation du magasin Date Id client Id magasin Désignation Code postal Code postal Libelle mois Libelle année Nom Ville Ville Taille Région Région Pays Pays Fait de vente : quantité, prix unitaire D. Ploix - M2 MIAGE - Conception EDD 6
7 Schéma en étoile D. Ploix - M2 MIAGE - Conception EDD 7
8 les faits Quelques règles [conseils] sur les faits [Kimball] Une ligne [un enregistrement] dans une table de faits correspond à une mesure. Une mesure est une ligne [un enregistrement] dans une table de faits. Les caractéristiques les plus utiles d une table de faits sont numériques et additives. Toutes les caractéristiques dans une table de faits doivent être de même granularité. Dans les modèles dimensionnels, les tables de faits expriment des relations de plusieurs à plusieurs entre les dimensions. D. Ploix - M2 MIAGE - Conception EDD 8
9 «ce qui est fait des faits» Les calculs réalisés dans les EDD sont des calculs d agrégation : pour un ensemble de faits partageant des caractéristiques communes, on va réaliser des opérations d agrégation sur des caractéristiques numériques des faits («ce qui est analysé»). Exemple de fonctions d agrégations sur les caractéristiques numériques : Somme : par exemple, la quantité totale vendue, Min, max : plus petite / grande quantité Moyenne : quantité moyenne Numération : Nombre de ventes effectuées par catégorie de produit Nombre de valeurs différentes : nombre de prix pour la vente d un produit D. Ploix - M2 MIAGE - Conception EDD 9
10 caractéristiques des faits Exemple de tables de faits pour les ventes : Le positionnement de caractéristiques numériques unitaires dans la table de fait est essentielle pour la performance des calcul réalisés au cours des analyses : cela évite les jointures sur les éléments à la base du calcul réalisé. Les questions induites sont alors : Quelles mesures unitaires intégrer? Quel niveau de normalisation doit-on appliquer? D. Ploix - M2 MIAGE - Conception EDD 10
11 caractéristiques des faits Mesures à intégrer : Toutes les mesures qui seront nécessaires aux analyses (agrégations) réalisées. Niveau de normalisation : La question se pose lorsque des mesures caractérisant un fait sont de nature fonctionnelle proche (différents types de quantités, de prix, ) sont présents dans la table de fait. Cette normalisation ne doit, généralement, pas être mise en œuvre car elle aura comme effet : La multiplication du nombre de fait, La réalisation de jointure lors des calculs Attention à bien distinguer l usage d une caractéristiques comme élément d analyse («ce qui est analysé») par rapport à un usage comme critère de sélection d une partie des faits («critère d analyse»), dans le premier cas, il s agit d une caractéristique numérique (non normalisée), et dans le second d une dimension. D. Ploix - M2 MIAGE - Conception EDD 11
12 caractéristiques des faits Exemple de fait «complexes» : instantané récapitulatif du pipeline de traitement des commande. L ensemble des «points de vue» sur la commande traitée seront présents par autant de quantités de type différents. Des facteurs faisant correspondre une unité de quantification d un département à l autre permettent d en gérer la diversité (par exemple : la distribution et livraison sont réalisés par casiers lorsque la production travaille de manière unitaire, ). Le placement des facteurs de conversion dans la table de faits garanti leur utilisation correcte. La présentation des données aux différents types d utilisateurs sera réalisée par la création d autant de vues qui intègreront les quantités qui les concernent dans leur unité de mesure (avec application du facteur). D. Ploix - M2 MIAGE - Conception EDD 12
13 caractéristiques des faits La majeur partie des mesures sont additives sur toutes les dimensions. Par exemple : montant d une vente, quantité vendue, coûts du produit vendu, Certain types de mesures numérique représentent des valeurs qui ne peuvent être additionnées selon toutes les dimensions d analyse. Par exemple, niveau de stock est additif (agrégation via somme) sur une dimension «magasins» mais ne le sera pas sur la dimension temps. D autres opérations d agrégations restent utilisables (moyenne, min, max, ). D autres mesures ne sont additive sur aucune dimension. Par exemple : le prix unitaire du produit ou le ratio bénéfice brut / chiffre d affaire (= marge brute). D. Ploix - M2 MIAGE - Conception EDD 13
14 caractéristiques des faits Pour le cas de mesures non additives comme la marge brute (calculée en divisant le bénéfice brut par le chiffre d affaire) et dont mesures utilisées pour son calcul peuvent l être pour un ensemble d éléments (groupe de produits, de magasin, ), on va intégrer tous les composants utiles au calcul dans la base de faits et réaliser le calcul de la mesure dynamiquement par rapport à l ensemble de faits considérés. De même pour les fonctions d agrégation, les résultats de certaines sont additive (somme des valeurs), d autres semi additives (min / max), d autres non additives (nombre de faits) On définira donc, pour chacune des caractéristique numérique (agrégée ou non) de la table de faits et pour chaque fonction d agrégation, les dimensions sur lesquelles elles sont additives (utilisables) et celles pour lesquelles elles ne le sont pas. D. Ploix - M2 MIAGE - Conception EDD 14
15 la granularité des faits Les faits de granularité différentes ne peuvent être fusionnés même s ils semblent s appliquer à un même objet. Exemple typique : entête d une commande (frais d expédition, ) et lignes de la commande (produit, quantité, ). Solution : Soit deux tables de faits sont construites : une pour les faits de haut niveau (entête de commande) et une pour les faits de niveau plus fin (lignes de commande). Soit les faits de plus haut niveau (frais d expéditions) sont répartis à un niveau plus détaillé (entre les lignes de la commande) en suivant un facteur d allocation (en fonction du poids unitaire et de la quantité, ), D. Ploix - M2 MIAGE - Conception EDD 15
16 la granularité des faits On distingue alors trois grandes familles de granularité : Granularité de transaction : mesure unitaire d une action métier. Granularité de l instantané périodique : mesure des actions métier dans un intervalle fixe (semaine, mois, ). Granularité de l instantané récapitulatif : mesure des actions métier sur une période non prédéterminée (instantané des productions ) Les faits transactionnels constituent la base de l entrepôt de données d entreprise. Les faits périodiques et récapitulatifs sont généralement utilisés dans les datamarts. Ils seront construits par l agrégation des faits transactionnels (constitution d agrégas). D. Ploix - M2 MIAGE - Conception EDD 16
17 la granularité des faits Pour reprendre l exemple des ventes : Les faits transactionnels identifient chacun des tickets de caisse, Les faits d instantanés périodiques identifient les ventes journalières, hebdomadaires, mensuelles, Les faits d instantanés récapitulatifs identifient les ventes sur un mois glissant, depuis le début du mois, D. Ploix - M2 MIAGE - Conception EDD 17
18 la granularité des faits Caractéristique Transaction Instantané périodique Instantané récapitulatif Période dans le temps représenté Grain Chargement des tables de faits Mise à jours des lignes de faits Dimension date Faits Point dans le temps Une ligne par événement Intervalles réguliers prévisibles Une ligne par période Durée indéterminée généralement courte Une ligne pour la vie de l entité Insertion Insertion Insertion et mise à jours Pas de mise à jour Pas de mise à jour Mise à jour pour chaque activité Date de la transaction Activité de la transaction Date de la fin de la période Performance dans un intervalle prédéfini Dates multiples pour des étapes standard Performance sur une durée de vie limitée D. Ploix - M2 MIAGE - Conception EDD 18
19 ce qui est fait des dimensions Les dimensions sont les «critères d analyse» permettant de fixer le champs sémantique des faits analysés. Les clients, les produits, les dates, les adresses de livraisons, les adresses de clients, Dans une démarche d urbanisation, les dimensions les plus «utiles» sont issues des données «de référence» [cf MDM] (ou transverses à l entreprise ou conformes [Kimball]) car les caractéristiques en sont partagées au niveau sémantique et syntaxique par toute l entreprise. Ces dimensions auront la même signification pour toutes les tables de faits qui y font référence D. Ploix - M2 MIAGE - Conception EDD 19
20 Construire les dimensions Attribut des dimensions : il est important de considérer la fonction des attributs des dimensions. Ils vont être utiliser par les utilisateurs comme critère de sélection des faits. Ainsi, il est préférable de placer des attributs supplémentaires aux dimensions pour en faciliter l usage. La liste des attributs sera donc construite en fonction du contexte du processus métier et des analyses. Exemple typique : la dimension date se verra compléter d attributs qualifiant la date : jour férié, numéro de jour dans la semaine, dans le mois, dans l année, numéro de semaine dans le mois, dans l année, trimestre calendrier, Il est important de noter qu il est infiniment plus simple de n afficher qu une partie des caractéristiques d une dimension à l utilisateur par rapport au travail demandé pour en rajouter une à postériori dans l entrepôt de données. D. Ploix - M2 MIAGE - Conception EDD 20
21 Construire les dimensions Dimensions dégénérées en ligne de fait : Dans certain cas de figure, les dimensions peuvent se réduire à un numéro unique (numéro de commande, de lettre, de facture, ). Dimension qui ne s applique pas à tous les faits : certain cas de dimension (promotion par exemple) ne sont pas intrinsèquement liés aux faits. Il est alors nécessaire d ajouter une ligne «élément null» dans la dimension pour éviter des clés étrangères nulle dans la table de faits. Pour la table de promotion, on ajoutera ainsi un fait «pas de promotion». Dimension jeu de rôle : la dimension date peut jouer différents rôles pour, par exemple, un fait qui traite les clients d hôtels : date d arrivée, date de départ, date de réservation, On dit alors qu elle joue plusieurs rôle. Elle n est créée qu une fois et la clé entre la table de faits et la dimension en précise le rôle. D. Ploix - M2 MIAGE - Conception EDD 21
22 Construire les dimensions Grand nombre de dimension : Lorsque la modélisation fait apparaître un grand nombre de dimensions (> 15), un travail de rationalisation (regroupement) des dimensions doit être réalisé pour en réduire le nombre quitte à réaliser des dimensions avec beaucoup d attributs. Une solution à ce problème peut être la mise en place de dimension fourre-tout (junk dimension) qui intégrera les séries d indicateurs à faible cardinalité ou de drapeaux (valeurs oui/non) comme autant d attributs. ID dimension indicateurs de commande Type de règlement Groupe type de règlement Indicateur commande UE / hors UE Indicateur de commission 1 Cash Cash Union Europ. Commissionnable Normal Indicateur type de commande 2 Cash Cash Union Europ. Hors Commission Présentation 3 Cash Cash Union Europ. Hors Commission Normal 4 Cash Cash Hors UE Commissionnable Présentation 5 MasterCard Crédit Union Europ. Commissionnable Normal 6 VisaCard Crédit Union Europ. Commissionnable Présentation D. Ploix - M2 MIAGE - Conception EDD 22
23 Dimension à évolution lente (SCD) Les valeurs des enregistrement des dimensions peuvent être amenés à évoluer. Par exemple, un produit va changer de nom, de rayon, de numéro de version (par ex. logiciels) Trois méthodes sont possible pour gérer ces évolutions : 1. Écrasement de la valeur par la nouvelle Solution la plus simple : ni la table de faits ni la table de dimension ne change dans leur structure ou leur organisation. Désavantage : il y a perte de l historique. 2. Ajout d une ligne de dimension pour y intégrer la modification (même si elle ne concerne qu une sous partie des attributs). La nouvelle ligne aura un nouvel ID unique et il est donc important de prévoir une clé primaire différente de la clé primaire naturelle, Elle permet de segmenter la table de faits en fonction de l historique. 3. Ajout d une colonne de dimension Permet d associer l ancienne valeur de l attribut directement avec la nouvelle Dans le cas de caractéristique de dimension à évolution rapide, il est préférable de les isoler dans une dimension spécifique (ex. dimension client). D. Ploix - M2 MIAGE - Conception EDD 23
24 Dimension à évolution lente (SCD) Exemple de traitement d une dimension à évolution lente : le rayon de vente d un produite High Tech Valeur d origine Ecrasement Clé produit Description Rayon EAN IntelliKids Éducation Clé produit Description Rayon EAN IntelliKids Stratégie Ajout ligne Clé produit Description Rayon EAN IntelliKids Éducation IntelliKids Stratégie Ajout colonne Clé produit Description Rayon Rayon antérieur EAN IntelliKids Stratégie Éducation D. Ploix - M2 MIAGE - Conception EDD 24
25 Normalisation des dimensions La question de la conservation d une forme dénormalisée vs une forme normalisée se pose. Deux écoles coexistent : Les pro normalisation : Économie d espace : les informations sont stockées une seule fois dans les dimensions, Facilité de mise à jours en cas de changement de valeur. Les anti normalisation : L économie d espace est très relative comparée à la table de faits, Complexification de la navigation dans les dimensions : la simplicité est un des principaux objectifs du modèle décisionnel, l ajout de tables de dimension complexifie (dans notre exemple, passage de 5 à 9 dimensions). L optimisation SGBD est moins performante (index bitmap), parcours de hiérarchie, Conclusion de Kimball (très anti mais une référence) : Les tables de dimension doivent rester des tables physiques plates Les outils de restitution (la suite microsoft par exemple) savent restituer une hiérarchie fonctionnelle issue de tables physiques plates. D. Ploix - M2 MIAGE - Conception EDD 25
26 Dimensions hiérarchiques Les moteurs de bases de données (transactionnel comme décisionnel) traitent mal les structures hiérarchiques. Par exemple : comment représenter la hiérarchie suivante : D. Ploix - M2 MIAGE - Conception EDD 26
27 Dimensions hiérarchiques La représentation «naturelle» sera sous la forme de tables «récursive» : Ce qui rend complexe l intégration dans une dimension et, même dans une modélisation transactionnelle, rend le code SQL permettant d identifier la position hiérarchique et les «ancêtres» complexe. ID Famille ID Père Description 1 0 Nourriture 2 1 Produits frais 3 1 Produits sec 4 2 Légumes 5 2 Poissons 6 2 Viande 7 3 Conserves 8 3 Pâtes 9 4 Tomates 10 4 Salades 11 5 Truites 12 6 Bœuf 13 6 Mouton 14 7 Sauces 15 8 Spagetti D. Ploix - M2 MIAGE - Conception EDD 27
28 Dimensions hiérarchiques Une solution est l utilisation d attributs pour la position hiérarchique (speed table) ID Racine ID Famille ID Sous Famille ID Catégorie Description Nourriture Produits frais Produits sec Légumes Poissons Viande Conserves Pâtes Tomates Salades Truites Bœuf Mouton Sauces Spagetti D. Ploix - M2 MIAGE - Conception EDD 28
29 Dimensions hiérarchiques Tables passerelles : elles indiquent la distance à la racine (position dans la hiérarchie) et le fait d être une feuille ou une racine. Par exemple, la table passerelle pour la partie droite (produits sec) de la structure exemple. L usage conseillé est de construire une vue table de faits + table de hiérarchie à clé unique (profondeur à la racine fixé, ) évitant les valeurs multiples et donnant une flexibilité sans multiplier les dimensions jeu de rôle. Clé parent Clé famille Niveau depuis parent Drapeau inf Drapeau sup N O N N N N N N O N O N N N N N N N O N O N N N O N O N N N O N O N D. Ploix - M2 MIAGE - Conception EDD 29
30 Dimensions hiérarchiques Chaque méthode à ses avantages : Speed table : plus simple à maintenir et à intégrer aux dimensions, Table passerelle : plus simple à utiliser (tous les éléments de niveau 2, Et ses inconvénients : Speed table : très complexe d ajouter un niveau de profondeur dans la hiérarchie, Table passerelle : la jointure entre la table de faits et la dimension passe par la table passerelle. Il faut faire attention à ne pas compter plusieurs fois le même fait. Pour les deux : attention aux modifications de structure hiérarchique D. Ploix - M2 MIAGE - Conception EDD 30
31 Schéma normalisé : en flocon Les dimensions Date et Localisation ne sont pas normalisées car des attributs sont fortement redondants : libelle mois, libelle année, région, pays, Leur normalisation permet la construction d un schéma en flocon : D. Ploix - M2 MIAGE - Conception EDD 31
32 Plan Construction de l entrepôt : les faits et les dimensions Préparation de l analyse : Les agrégats, les rapports et les cubes Optimisation Exemple d analyse Transport D. Ploix - M2 MIAGE - Conception EDD 32
33 Les agrégats, les rapports et les cubes Une fois l entrepôt de données, les faits, les dimensions, voir les agrégats construits, on passe à l outillage de la navigation dans les données. Solutions : Publication d un rapport visualisant le résultat de recherches/analyses régulières sur l entrepôt, Construction d analyse spécifique visant à chercher une partie de faits (ou des opérations de sommes sur les faits) sans idées à priori des dimensions parcourues. Construction de tables d agrégats Construction de cubes D. Ploix - M2 MIAGE - Conception EDD 33
34 Les agrégats L agrégation est le moyen de passer d une granularité fine à une granularité plus importante. Par exemple, la table des faits des tickets de caisses contient l ensemble des tickets. Si les analyses sont uniquement basées sur une période journalière (voir hebdomadaire ou mensuelle), chaque interrogation de l entrepôt va demander de recalculer les mêmes sommes. Des tables de faits agrégés (tables d agrégats) vont alors être construites sur le niveau requis pour les analyses. D. Ploix - M2 MIAGE - Conception EDD 34
35 Les agrégats Avantage : gain significatif du temps de calcul des analyses Inconvénient : l espace nécessaire au stockage de l entrepôt croit de manière importante (même si les tables d agrégats sont, pas nature, de taille moindre aux tables de faits initiales). Usage : généralement utilisé pour passer de l entrepôt de données d entreprise vers les datamarts conçu de manière précise pour des champs d analyse. D. Ploix - M2 MIAGE - Conception EDD 35
36 Les agrégats La gestion de la granularité dans la modélisation décisionnelle suit alors le schéma suivant Analyse du processus métier Faits de type Transaction de granularité la plus fine Construction des faits orientés analyse Agrégation stable pour des périodicité (pas que temporelles) fixes : création d instantanés périodiques Agrégation dynamique pour des périodicités (pas que temporelles) de taille variables : création d instantanés récapitulatifs Mise en place des calculs d agrégats en mode batch en parallèle du processus d alimentation des données. Les méthodes utilisées pour l agrégation des faits sont liées au niveau d additivité des mesures présentes dans les faits transactionnels. D. Ploix - M2 MIAGE - Conception EDD 36
37 Les rapports La différence entre un rapport d analyse et la navigation dans un cube et que le rapport est statique et présente une vue unique sur les données. La construction de rapports reviendra alors à : Identifier les informations métier nécessaires à une activité de pilotage : nombre de produit vendu par XXX sur la période YYY dans la région ZZZ, Les données de l entrepôt à la source des informations et les calculs composant le rapport : Fait X, Dimension Y, agrégation, fonction sur les données, La forme la plus appropriée pour la lecture des informations : table de valeur, élément graphique (camembert, ), Le risque le plus courant est la réalisation d un nombre trop important de rapports par rapport au besoin métier. Le point d attention réside dans l identification du besoin de navigation dans le cube par un nombre réduit d utilisateur par rapport à la consultation d un nombre d information limité pour le pilotage courant de l activité métier. D. Ploix - M2 MIAGE - Conception EDD 37
38 Les cubes Les cubes sont un moyens de naviguer dans les données de l entrepôt afin d en découvrir des propriétés sous différents points de vues. Par exemple, nous voulons pouvoir analyser les ventes d un produit ou d une gamme de produits selon une période données dans toutes les régions puis, pour affiner notre analyse, souhaiter voir quelles sont les ventes pour une région particulière mais sur une période de temps différente, Ce type de navigation est facilité via l utilisation de cube. D. Ploix - M2 MIAGE - Conception EDD 38
39 Les cubes Voici un exemple d entrepôt : D. Ploix - M2 MIAGE - Conception EDD 39
40 Les cubes Chaque ligne du cube correspond à un produit, chaque colonne à une région et chaque profondeur à une année. Chaque point du cube correspond à un fait correspondant aux différentes données des dimensions (vente de Modems en Asie en 2000). Si on prend la tranche (slice) Asie, on obtient toutes les ventes des différents produits en Asie de 2000 à La tranche 2000 permet d avoir la table des données correspondant aux ventes des différents produits dans le monde. La tranche Modems permet d avoir la table des données de ventes des Modems dans le monde de 2000 à D. Ploix - M2 MIAGE - Conception EDD 40
41 One peut également choisir une ligne ou une sous partie du cube. Ces opérations (de sélection d une partie des données du cube), s appelle Drill Down lorsqu on réduit la partie des données du cube sélectionnées et Drill Up lorsqu on l élargie. Les cubes D. Ploix - M2 MIAGE - Conception EDD 41
42 Les cubes Il est également possible de varier le grain d agrégation des données dans les cubes. Cette opération de concentration (agrégation) est appelée Roll-Up. L inverse sera Roll-Down D. Ploix - M2 MIAGE - Conception EDD 42
43 Les cubes Enfin, il est également possible de changer l orientation du cube (et de changer les points de vue) en le faisant pivoter : D. Ploix - M2 MIAGE - Conception EDD 43
44 Les cubes La construction d un cube d analyse reviendra à sélectionner un ensemble de mesures d un fait (ou un ensemble de mesures d une agrégation issues d un fait) et les dimensions qui seront parcourues. Exemple : Pour la mesure quantité du fait Vente, Les niveaux hebdomadaire, mensuels et annuels de la dimension date, L ensemble des caractéristiques de la dimension produit, L ensemble des caractéristiques des clients. Il pourra alors être généré au sein du système d entrepôt de données, les différents croisements possibles entre les mesures et dimensions choisies (éléments du cube) permettant de réaliser les différentes rotations et agrégations (drill-up et down). D. Ploix - M2 MIAGE - Conception EDD 44
45 Plan Construction de l entrepôt : les faits et les dimensions Préparation de l analyse : Les agrégats les rapports et les cubes Optimisation Exemple d entrepôt Transport (inspiré de [Kimball2002]) D. Ploix - M2 MIAGE - Conception EDD 45
46 Optimisation L optimisation d un dataware est très lié au type d usage : L utilisation des cubes entraîne la génération de requêtes dynamiques pour lesquelles des indexes doivent être préalablement posés Les rapports étant constituées de requêtes particulières, leur optimisation consiste dans l optimisation de leur plan d exécution D. Ploix - M2 MIAGE - Conception EDD 46
47 Indexation d un DW Les SGBD fournissent différents types d indexes : Indexes basées sur Btree : Cluster : les enregistrements sont ordonnés selon l index, les feuilles de l arbre B sont les pages de données. La taille de l index peut être estimée à 5% du stockage de l intégralité des clés d indexes (dans l arbre) + un identificateur unique (interne, ajouté par le système) pour chaque enregistrement (les feuilles de l arbre ne sont pas stockées dans l index). Non cluster : les enregistrements ne sont pas ordonnés selon l index : les feuilles de l arbre sont stockées dans l indexe et contiennent les valeurs de clés ainsi que les numéros d enregistrements (ou de blocs en Oracle). La taille de l index généré dépendra du nombre de valeurs Indexes de type bitmap : Utilisables pour des valeurs 0/1. Stockage très efficace (1 bit par enregistrement) et convient aux sollicitations de type décisionnelle. L éclatement de liste de valeur (classe d un billet) en drapeau est même conseillé par certain concepteur de DW afin de permettre l utilisation de ce type d indexe. Les autres types d indexes comme Hashcode ou basés sur une fonction utilisateur ne sont pas présents dans tous les SGBD mais doivent, si présents, être utilisés si appropriés. D. Ploix - M2 MIAGE - Conception EDD 47
48 Indexation d un DW Tables de faits : Les indexes de type B cluster seront utilisés pour les clés primaires de la table de faits. Attention toutefois aux effets de bords sur l ajout de données qui peut donner lieu à une restructuration de la table si des valeurs viennent s intégrer entre des valeurs existantes et modifier la structure cluster de la table, Les indexes de type B non cluster pour les clés étrangères vers les dimensions très sollicités (date,..), La table de faits sera partitionnée selon la dimension d analyse la plus sollicité (souvent la date), Tables de dimensions Index cluster pour la clé primaire, Indexes de type bitmap ou B pour les valeurs des dimensions très sollicitées Les indexes de type bitmap sont particulièrement appropriés aux problématiques DW : accès unique, stockage optimisé. Il peut ainsi être intéressant de construire des ensembles d attributs drapeau (valués 0/1) à la place d un attribut avec liste de valeur pour en permettre une indexation de type bitmap. Une indexation plus systématique que la table de faits est possible du fait de la taille moindre de ces tables par rapport à la table de faits. D. Ploix - M2 MIAGE - Conception EDD 48
49 D. Ploix - M2 MIAGE - Conception EDD 49
50 Optimisation, points d attention Les optimisations sont fortement liées au SGBD sous jacent et à l architecture de déploiement choisie. La source principales des problèmes réside dans le mode de parallélisation des traitements : Pour SQL Serveur, des verrous sur les tables partitionnées au niveau de la table ou des partitions peuvent empêcher la construction de lots de données appropriés. Il est également à noter que la parrallèlisation des traitements a été amélioré entre 2005 et Pour Oracle, la répartition de requêtes DW sur plusieurs nœuds d un RAC n est pas conseillée dans le cas de jointure sur les résultats car cela entraîne une très forte communication d inter-connect. Il est également important de bien comprendre le mode de fonctionnement des SGBD et des actualisations qui sont nécessaires à leur bon fonctionnement (statistiques, ré-indexation, gestion des segments, ). Opérations qui peuvent, dans le cas de tables de grande taille, devenir très lourdes pour les systèmes opérationnels. Les DW étant les types de calculs mettant en chalenge la capacité des SGBD, leur surveillance et administration correcte en est particulièrement cruciale. D. Ploix - M2 MIAGE - Conception EDD 50
51 Plan Construction de l entrepôt : les faits et les dimensions Préparation de l analyse : Les agrégats les rapports et les cubes Optimisation Exemple d entrepôt Transport (inspiré de [Kimball2002]) D. Ploix - M2 MIAGE - Conception EDD 51
52 Sujet de l entrepôt Le service marketing d une compagnie aérienne veut analyser les vols de chaque participant de son programme passagers réguliers. Il s intéresse aux vols que prennent les passagers, aux avions qu ils utilisent, aux tarifs de base qu ils paient, à la fréquence à laquelle ils passent à une classe supérieure, à la façon dont ils obtiennent et font usage de leur bonus kilométrique de passagers réguliers, il veut savoir s ils réagissent sur certains vols, connaître la durée de leur séjours, ainsi que la promotion de ceux qui sont dans la catégorie première classe, affaire et économique. Le processus d entreprise mis en jeu par cette étude est l activité de vol proprement dite. Nous ne nous intéressons pas à la réservation ni à l émission de billets qui ne concerne pas un passager régulier. D. Ploix - M2 MIAGE - Conception EDD 52
53 Identification des faits La problématique principale dans l établissement des faits provient de la granularité de la notion de «voyage» : Trajet par un avion entre deux aéroports, Trajet d un voyage assuré par un même avion mais avec une escale (qui sera alors un segment et qui correspond à une ligne sur un billet d avion), Trajet d un aéroport de départ à un aéroport d arrivée avec changement d avion (qui sera alors un vol et qui correspond à la demande du client), Voyage complet comprenant le vol aller et le vol retour. L équipe d analyse décide de se baser sur le niveau segment qui est le plus fin ayant un sens pour le service marketing. Si une extension de l entrepôt à un usage par l équipe de programmation des vols, l ensemble des trajets devront alors être intégrés. D. Ploix - M2 MIAGE - Conception EDD 53
54 Identification des dimensions Les dimensions d analyse du segment sont Caractéristiques du segment Les aéroports de départ et d arrivée, Les dates et heures de départ prévu, d arrivée prévu, de départ réel, d arrivée réelle du segment, Les caractéristiques des passagers réguliers Les caractéristiques du vol (avion, classe, ), Les caractéristiques du tarif appliqué. D. Ploix - M2 MIAGE - Conception EDD 54
55 Caractéristique du segment Ces caractéristiques (i.e. les critères d analyse) sont pour le segment (mesures dans la table de faits) : Non additif : Numéro de voyage (Identifiant unique du voyage, correspondant à une dimension dégradée), Numéro de billet (DD), Numéro d ordre du segment (DD), Additifs : Chiffre d affaire brut du segment, Distance du segment en KM, Miles gagnés au niveau du segment, Durée du vol du segment, Nombre de minutes de retard au départ, Nombre de minutes de retard à l arrivée, Nombre total de minutes de retard D. Ploix - M2 MIAGE - Conception EDD 55
56 Caractéristique des aéroports Les caractéristiques retenues lors de l analyse sont : Nom, Trigramme, Région, Ville, Code postal, Pays, Fuseau horaire, Nombre de terminaux, Capacité maximum, Salon prémium, D. Ploix - M2 MIAGE - Conception EDD 56
57 Caractéristiques des dimensions date/heure Granularité de la date/heure : Si on construit une seule dimension qui regroupe la date et l heure, il y aura une explosion du nombre de lignes dans la dimension pour un degré de finesse de la granularité au niveau des minutes (voir des secondes). Dans ce type de configuration, il est préférable de construire une dimension date et une dimension heure. D. Ploix - M2 MIAGE - Conception EDD 57
58 Caractéristiques des dimensions date Caractéristiques générales des dates : Date, Jour de la semaine, Numéro de jour année calendaire, Numéro de jour mois calendaire, Numéro de jour année comptable, Numéro de jour mois comptable, Indicateur de dernier jour de semaine, Indicateur de dernier jour de mois, Numéro de semaine calendaire dans l année, Numéro de mois calendaire dans l année, Année-mois calendrier (AAAA-MM) Trimestre calendaire, Semestre calendaire, Année calendaire, Trimestre comptable, Semestre comptable, Année comptable, Que l on peut compléter avec des informations spécifiques par pays : Nom du pays, Drapeau jour férié civil, Nom jour férié civil, Drapeau jour férié religieux, Nom jour férié religieux, Indicateur jour de travail, Nom de saison D. Ploix - M2 MIAGE - Conception EDD 58
59 Caractéristiques des passagers Les caractéristiques retenues sont : Nom, Prénom, Date de naissance, Statu marital, Nombre d enfants, Ville client, Région client Code postal client, Date inscription, Drapeau voyages professionnels, Drapeau voyages touristiques, L analyse des caractéristiques fait apparaitre des données de catégorisation qui peuvent changer en cours d année, elles apparaîtront donc comme une dimension à part entière dans le modèle cible. Nom de la catégorie, Nombre de KM parcourus minimum, Nombre de KM parcourus maximum, Réduction tarifaire D. Ploix - M2 MIAGE - Conception EDD 59
60 Caractéristiques du vol Les caractéristiques retenues lors de l analyse sont : Avion utilisé, Classe du siège (économique, première, business, ), Drapeau place hublot D. Ploix - M2 MIAGE - Conception EDD 60
61 Caractéristiques du tarif Le tarif indique l ensemble des éléments relatifs au calcul du prix du segment : Promotion liée au média de vente Promotion liée à une opération spécifique Réduction promotionnelle appliquée Réduction achat à l avance, Pénalité de résiliation, Pénalité de modification, D. Ploix - M2 MIAGE - Conception EDD 61
62 Récapitulatif des dimensions Segment Aéroport départ Aéroport arrivée Date départ prévue Date arrivée prévue Date départ réelle Date arrivée réelle Passager Type Passager Vol Tarif Nom Date Nom Nom catégorie Avion Promotion média Trigramme Jour de la semaine Prénom Nb KM min Classe Promotion spécifique Région Numéro de année calendaire, Date naissance Nb KM max Drapeau hublot Réduction appliquée Ville Numéro de année comptable, Statu marital Réduction tarifaire Réduction achat à l avance Code postal Indicateur de dernier jour de Enfants Pénalité résiliation Pays Numéro de calendaire dans l année Ville Pénalité modification Fuseau horaire calendaire Région Utilisation milles Nombre de terminaux comptable Code postal Nombre de milles utilisé Capacité maximum Pays.Nom du pays Date inscription Salon prémium Pays.Drapeau jour férié civil Professionnel Pays.Nom jour férié civil Tourisme Pays. Numéro de voyage Numéro de billet Numéro d ordre du segment Chiffre d affaire brut du segment Distance du segment en KM Miles gagnés au niveau du segment Durée du vol du segment Nombre de minutes de retard au départ Nombre de minutes de retard à l arrivée Nombre total de minutes de retard D. Ploix - M2 MIAGE - Conception EDD 62
63 Préparation des rapports Quels sont les rapports attendus : «Il s intéresse aux vols que prennent les passagers, aux avions qu ils utilisent, [ ], à la fréquence à laquelle ils passent à une classe supérieure» Le périmètre étant très large, il faut distinguer le besoin de rapport du besoin de navigation dans un cube : Un rapport mensuel sur le nombre de milles et le chiffre d affaire cumulé par catégorie de passagers et par mois, Un rapport quotidien sur le nombre de milles et le chiffre d affaire cumulé par catégorie de passagers et par jour du mois en cours. D. Ploix - M2 MIAGE - Conception EDD 63
64 Préparation des cubes Pour réaliser les navigations d analyses décrites dans l énoncé, le cube prendra l ensemble des mesures du fait. L ensemble des dimensions analysées seront parcourues. Les caractéristiques utiles seront : Date : mois, années calendaires et comptables Vol : classe, avion Aéroport : région, ville, code postal, pays Passager : région, ville, code postal, pays, Type de passager : nom catégorie Tarif : promotion média et spécifique D. Ploix - M2 MIAGE - Conception EDD 64
65 Exercice Caractéristiques numériques Le sujet portera sur la téléphonie mobile. Le service marketing de FreeMobile souhaite étudier l évolution de l utilisation des différents types d abonnements par les consommateurs en fonction du temps et de la localisation géographique. Sujet : Identifiez différentes caractéristiques numériques Proposez deux niveaux de granularité pour chaque caractéristiques Indiquez l additivité de chaque caractéristique D. Ploix - M2 MIAGE - Conception EDD 65
Evry - M2 MIAGE Entrepôt de données
Evry - M2 MIAGE Entrepôt de données Introduction D. Ploix - M2 Miage - EDD - Introduction 1 Plan Positionnement du BI dans l entreprise Déclinaison fonctionnelle du décisionnel dans l entreprise Intégration
Entrepôt de données 1. Introduction
Entrepôt de données 1 (data warehouse) Introduction 1 Présentation Le concept d entrepôt de données a été formalisé pour la première fois en 1990 par Bill Inmon. Il s agissait de constituer une base de
Plan. Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation
Data WareHouse Plan Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation 2 Présentation Besoin: prise de décisions
BI = Business Intelligence Master Data-ScienceCours 3 - Data
BI = Business Intelligence Master Data-Science Cours 3 - Datawarehouse UPMC 8 février 2015 Rappel L Informatique Décisionnelle (ID), en anglais Business Intelligence (BI), est l informatique à l usage
Construction d un EDD avec SQL 2008 R2. D. Ploix - M2 Miage - EDD - Création
Construction d un EDD avec SQL 2008 R2 Plan Analyse du DW construit Construction de la base DW dans SQL 2008 Construction des tables de faits et dimensions Injection des données Étapes de l injection des
Les entrepôts de données
Les entrepôts de données Lydie Soler Janvier 2008 U.F.R. d informatique Document diffusé sous licence Creative Commons by-nc-nd (http://creativecommons.org/licenses/by-nc-nd/2.0/fr/) 1 Plan Introduction
Introduction à la B.I. Avec SQL Server 2008
Introduction à la B.I. Avec SQL Server 2008 Version 1.0 VALENTIN Pauline 2 Introduction à la B.I. avec SQL Server 2008 Sommaire 1 Présentation de la B.I. et SQL Server 2008... 3 1.1 Présentation rapide
Evry - M2 MIAGE Entrepôt de données
Evry - M2 MIAGE Entrepôt de données Intégration de données multi-sources D. Ploix - M2 Miage - EDD - IDMS 1 Intégration de données L intégration de données désigne l ensemble des opérations aboutissant
et les Systèmes Multidimensionnels
Le Data Warehouse et les Systèmes Multidimensionnels 1 1. Définition d un Datawarehouse (DW) Le Datawarehouse est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées
Entrepôt de Données. Jean-François Desnos. [email protected] ED JFD 1
Entrepôt de Données Jean-François Desnos [email protected] ED JFD 1 Définition (Bill Inmon 1990) Un entrepôt de données (data warehouse) est une collection de données thématiques, intégrées,
NF26 Data warehouse et Outils Décisionnels Printemps 2010
NF26 Data warehouse et Outils Décisionnels Printemps 2010 Rapport Modélisation Datamart VU Xuan Truong LAURENS Francis Analyse des données Avant de proposer un modèle dimensionnel, une analyse exhaustive
LES ENTREPOTS DE DONNEES
Module B4 : Projet des Systèmes d information Lille, le 25 mars 2002 LES ENTREPOTS DE DONNEES Problématique : Pour capitaliser ses informations, une entreprise doit-elle commencer par mettre en œuvre des
Les Entrepôts de Données
Les Entrepôts de Données Grégory Bonnet Abdel-Illah Mouaddib GREYC Dépt Dépt informatique :: GREYC Dépt Dépt informatique :: Cours Cours SIR SIR Systèmes d information décisionnels Nouvelles générations
Méthodologie de conceptualisation BI
Méthodologie de conceptualisation BI Business Intelligence (BI) La Business intelligence est un outil décisionnel incontournable à la gestion stratégique et quotidienne des entités. Il fournit de l information
Urbanisation des SI-NFE107
OLAP Urbanisation des SI-NFE107 Fiche de lecture Karim SEKRI 20/01/2009 OLAP 1 Introduction PLAN OLAP Les différentes technologies OLAP Plate formes et Outils 20/01/2009 OLAP 2 Informatique décisionnelle
Datawarehouse: Cubes OLAP. Marlyse Dieungang Khaoula Ghilani
Datawarehouse: Cubes OLAP Marlyse Dieungang Khaoula Ghilani Table des matières 1 Data Warehouse 3 1.1 Introduction............................ 3 1.1.1 Définition......................... 3 1.1.2 Architecture........................
Le "tout fichier" Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique
Introduction à l informatique : Information automatisée Le premier ordinateur Définition disque dure, mémoire, carte mémoire, carte mère etc Architecture d un ordinateur Les constructeurs leader du marché
Entrepôts de données. NEGRE Elsa Université Paris-Dauphine 2015-2016
Entrepôts de données NEGRE Elsa Université Paris-Dauphine 2015-2016 Contexte et problématique Le processus de prise de décision L entrepôt de données Définition Différence avec un SGBD Caractéristiques
SQL SERVER 2008, BUSINESS INTELLIGENCE
SGBD / Aide à la décision SQL SERVER 2008, BUSINESS INTELLIGENCE Réf: QLI Durée : 5 jours (7 heures) OBJECTIFS DE LA FORMATION Cette formation vous apprendra à concevoir et à déployer une solution de Business
SWISS ORACLE US ER GRO UP. www.soug.ch. Newsletter 5/2014 Sonderausgabe. OBIF DB licensing with VMware Delphix 12c: SQL Plan / Security Features
SWISS ORACLE US ER GRO UP www.soug.ch Newsletter 5/2014 Sonderausgabe OBIF DB licensing with VMware Delphix 12c: SQL Plan / Security Features 42 TIPS&TECHNIQUES Alexandre Tacchini, Benjamin Gaillard, Fabien
Business & High Technology
UNIVERSITE DE TUNIS INSTITUT SUPERIEUR DE GESTION DE TUNIS Département : Informatique Business & High Technology Chapitre 8 : ID : Informatique Décisionnelle BI : Business Intelligence Sommaire Introduction...
MyReport, une gamme complète. La Business Intelligence en toute simplicité : Concevez, partagez, actualisez! pour piloter votre activité au quotidien.
MyReportle reporting sous excel La Business Intelligence en toute simplicité : Concevez, partagez, actualisez! MyReport, une gamme complète pour piloter votre activité au quotidien. En rendant les données
4. Utilisation d un SGBD : le langage SQL. 5. Normalisation
Base de données S. Lèbre [email protected] Université de Strasbourg, département d informatique. Présentation du module Contenu général Notion de bases de données Fondements / Conception Utilisation :
CONCEPTION Support de cours n 3 DE BASES DE DONNEES
CONCEPTION Support de cours n 3 DE BASES DE DONNEES Auteur: Raymonde RICHARD PRCE UBO PARTIE III. - LA DESCRIPTION LOGIQUE ET PHYSIQUE DES DONNEES... 2 A. Les concepts du modèle relationnel de données...
SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...)
Avant-propos 1. À qui s'adresse ce livre? 15 2. Pré-requis 15 3. Objectifs du livre 16 4. Notations 17 Introduction à la Business Intelligence 1. Du transactionnel au décisionnel 19 2. Business Intelligence
L Edition Pilotée XL
L Edition Pilotée XL Piloter son activité, une nécessité Processus décisionnel: «Exploiter les données de l entreprise dans le but de faciliter la prise de décision» Etre informé en permanence sur l état
La Business Intelligence en toute simplicité :
MyReportle reporting sous excel La Business Intelligence en toute simplicité : Concevez, partagez, actualisez! En rendant les données accessibles aux personnes habilitées dans l entreprise (comptabilité,
Introduction au domaine du décisionnel et aux data warehouses
Data warehouse Introduction au domaine du décisionnel et aux data warehouses http://dwh.crzt.fr STÉPHANE CROZAT Paternité - Partage des Conditions Initiales à l'identique : http://creativecommons.org/licenses/by-sa/2.0/fr/
L information et la technologie de l informationl
L information et la technologie de l informationl CRM & informatique décisionnelled CRM CRM & informatique décisionnelle. d 1 2 3 Les Les fondements managériaux managériaux du du CRM. CRM. Les Les fondements
Rejoignez la Communauté
Rejoignez la Communauté MODÉLISATION DIMENSIONNELLE Le fondement du datawarehouse 2 MODÉLISATION DIMENSIONNELLE Le fondement du datawarehouse 3 QUI SOMMES NOUS? Jean-Pierre Riehl Pratice Manager SQL Azeo
Business Intelligence avec SQL Server 2012 Maîtrisez les concepts et réalisez un système décisionnel
Avant-propos 1. À qui s'adresse ce livre? 9 2. Les pré-requis 10 3. Les objectifs du livre 10 Introduction 1. Présentation du décisionnel 15 1.1 La notion de décideur 15 1.2 Les facteurs d'amélioration
SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)
SGBDR Systèmes de Gestion de Bases de Données (Relationnelles) Plan Approches Les tâches du SGBD Les transactions Approche 1 Systèmes traditionnels basés sur des fichiers Application 1 Gestion clients
Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP)
Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP) Définition (G. Gardarin) Entrepôt : ensemble de données historisées variant
DEMANDE D INFORMATION RFI (Request for information)
DOD SEICAM RFI Demande d information EVDEC Réf. : RFI_EVDEC- GT5_Outil_reporting_BI_v4.doc Page 1/11 DEMANDE D INFORMATION RFI (Request for information) OUTIL INTÉGRÉ DE REPORTING ET D ANALYSE DÉCISIONNELLE
Aide. Réservez votre séjour pour Disneyland Resort Paris en quelques clics!
Aide Réservez votre séjour pour Disneyland Resort Paris en quelques clics! Etape 1 : Vos souhaits... 1 Etape 2 : Nos propositions... 2 Etape 3 : Vos besoins transports... 3 Etape 4 : Nos propositions transport...
Business Intelligence avec SQL Server 2014 Maîtrisez les concepts et réalisez un système décisionnel
Avant-propos 1. À qui s'adresse ce livre? 9 2. Les pré-requis 10 3. Les objectifs du livre 11 Introduction 1. Présentation du décisionnel 13 1.1 La notion de décideur 14 1.2 Les facteurs d'amélioration
BUSINESS INTELLIGENCE
GUIDE COMPARATIF BUSINESS INTELLIGENCE www.viseo.com Table des matières Business Intelligence :... 2 Contexte et objectifs... 2 Une architecture spécifique... 2 Les outils de Business intelligence... 3
Business Intelligence avec SQL Server 2012
Editions ENI Business Intelligence avec SQL Server 2012 Maîtrisez les concepts et réalisez un système décisionnel Collection Solutions Informatiques Table des matières Les éléments à télécharger sont disponibles
Leçon 12. Le tableau de bord de la gestion des stocks
CANEGE Leçon 12 Le tableau de bord de la gestion des stocks Objectif : A l'issue de la leçon l'étudiant doit être capable de : s initier au suivi et au contrôle de la réalisation des objectifs fixés au
Objectif. Participant. Prérequis. Oracle BI Suite EE 10g R3 - Développer des référentiels. 5 Jours [35 Heures]
Objectif Utiliser les techniques de gestion de la mise en cache pour contrôler et améliorer les performances des requêtes Définir des mesures simples et des mesures calculées pour une table de faits Créer
QU EST-CE QUE LE DECISIONNEL?
La plupart des entreprises disposent d une masse considérable d informations sur leurs clients, leurs produits, leurs ventes Toutefois ces données sont cloisonnées par les applications utilisées ou parce
Chapitre IX. L intégration de données. Les entrepôts de données (Data Warehouses) Motivation. Le problème
Chapitre IX L intégration de données Le problème De façon très générale, le problème de l intégration de données (data integration) est de permettre un accès cohérent à des données d origine, de structuration
données en connaissance et en actions?
1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)
CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2012
CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE Edition 2012 AGENDA Qui sommes nous? Présentation de Keyrus Keyrus : Expert en formations BI Nos propositions de formation 3 modes de formations Liste des
Comparatif fonctionnel des offre Saas d'igsi Easy CRM, Pro CRM, CRM On Demand
Comparatif fonctionnel des offre Saas d'igsi,, On Fonctionnalités Gestion de Contacts Gestion des sociétés & contacts Gestion des prospects (leads) Gestion des relations Utilisateurs Nouveau Utilisateur
Business Intelligence : Informatique Décisionnelle
Business Intelligence : Informatique Décisionnelle On appelle «aide à la décision», «décisionnel», ou encore «business intelligence», un ensemble de solutions informatiques permettant l analyse des données
BUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise
BUSINESS INTELLIGENCE Une vision cockpit : utilité et apport pour l'entreprise 1 Présentation PIERRE-YVES BONVIN, SOLVAXIS BERNARD BOIL, RESP. SI, GROUPE OROLUX 2 AGENDA Définitions Positionnement de la
DESCRIPTION DES PRODUITS ET MÉTRIQUES
DESCRIPTION DES PRODUITS ET MÉTRIQUES DPM Adobe - Adobe Analytics (2015v1) Les Produits et Services décrits dans cette DPM sont soit des Services On-demand soit des Services Gérés (comme décrits ci-dessous)
1 Modélisation d une base de données pour une société de bourse
IN306 : Corrigé SID Christophe Garion 18 octobre 2010 Ce document est un corrigé succinct de l examen du module IN306. 1 Modélisation d une base de données pour une société de bourse Une
Exemple accessible via une interface Web. Bases de données et systèmes de gestion de bases de données. Généralités. Définitions
Exemple accessible via une interface Web Une base de données consultable en ligne : Bases de données et systèmes de gestion de bases de données The Trans-atlantic slave trade database: http://www.slavevoyages.org/tast/index.faces
Bases de Données Avancées
1/26 Bases de Données Avancées DataWareHouse Thierry Hamon Bureau H202 - Institut Galilée Tél. : 33 1.48.38.35.53 Bureau 150 LIM&BIO EA 3969 Université Paris 13 - UFR Léonard de Vinci 74, rue Marcel Cachin,
BROCHURE DE PRESENTATION
MS -sms Introduction Le SMS Marketing est l outil de communication one-to-one idéal. vous offre la possibilité de : Communiquer en temps réal avec vos clients Promouvoir une offre Diffuser des informations
Easy to. report. Connexion. Transformation. Stockage. Construction. Exploitation. Diffusion
M y R e p o r t, L A S O L U T I O N R E P O R T I N G D E S U T I L I S AT E U R S E X C E L Connexion Transformation Stockage Construction Exploitation Diffusion OBJECTIF REPORTING : De la manipulation
Chapitre 9 : Informatique décisionnelle
Chapitre 9 : Informatique décisionnelle Sommaire Introduction... 3 Définition... 3 Les domaines d application de l informatique décisionnelle... 4 Architecture d un système décisionnel... 5 L outil Oracle
Dossier I Découverte de Base d Open Office
ETUDE D UN SYSTEME DE GESTION DE BASE DE DONNEES RELATIONNELLES Définition : Un SGBD est un logiciel de gestion des données fournissant des méthodes d accès aux informations. Un SGBDR permet de décrire
ETL Extract - Transform - Load
ETL Extract - Transform - Load Concept général d analyse en ligne (rappels) Rémy Choquet - Université Lyon 2 - Master 2 IIDEE - 2006-2007 Plan Définitions La place d OLAP dans une entreprise OLAP versus
La Geo-Business Intelligence selon GALIGEO avec 26/10/2005 1
La Geo-Business Intelligence selon GALIGEO avec ESRI 2005 session «Décisionnel» 26/10/2005 1 La Business Intelligence : Une Définition La Business intelligence permet l utilisation des données opérationnelles
Présentation du module Base de données spatio-temporelles
Présentation du module Base de données spatio-temporelles S. Lèbre [email protected] Université de Strasbourg, département d informatique. Partie 1 : Notion de bases de données (12,5h ) Enjeux et principes
25 October 2013 Dossier Confidentiel MTS CONSULTING ORCA. ORCA est une suite d outils d informatique décisionnel dédiée aux télécoms.
1 est une suite d outils d informatique décisionnel dédiée aux télécoms. C est un produit unique qui permet d accéder directement à vos multiples sources de données (Switch, IN, Facturation, Ventes, Comptabilité).
Catalogue Formation «Vanilla»
Catalogue Formation «Vanilla» Date : octobre 2009 Table des matières Liste des Formations...2 Contenu des formations...3 Vanilla FastTrack...3 Vanilla Architecture...5 Enterprise Services...6 BIPortail...7
Département Génie Informatique
Département Génie Informatique BD51 : Business Intelligence & Data Warehouse Projet Rédacteur : Christian FISCHER Automne 2011 Sujet : Développer un système décisionnel pour la gestion des ventes par magasin
Ecole des Hautes Etudes Commerciales HEC Alger. par Amina GACEM. Module Informatique 1ière Année Master Sciences Commerciales
Ecole des Hautes Etudes Commerciales HEC Alger Évolution des SGBDs par Amina GACEM Module Informatique 1ière Année Master Sciences Commerciales Evolution des SGBDs Pour toute remarque, question, commentaire
Gestion commerciale. Une réponse fonctionnelle quel que soit votre secteur d activité
Gestion commerciale La rentabilité d une entreprise passe par l augmentation du chiffre d affaires et la maîtrise des coûts de gestion. Avec Sage 100 Gestion Commerciale, vous contrôlez votre activité
1 Introduction et installation
TP d introduction aux bases de données 1 TP d introduction aux bases de données Le but de ce TP est d apprendre à manipuler des bases de données. Dans le cadre du programme d informatique pour tous, on
Technologie data distribution Cas d usage. www.gamma-soft.com
Technologie data distribution Cas d usage www.gamma-soft.com Applications stratégiques (ETL, EAI, extranet) Il s agit d une entreprise industrielle, leader français dans son domaine. Cette entreprise est
Cours 6. Sécurisation d un SGBD. DBA - M1ASR - Université Evry 1
Cours 6 Sécurisation d un SGBD DBA - M1ASR - Université Evry 1 Sécurisation? Recette d une application Vérification des fonctionnalités Vérification de l impact sur le SI existant Gestion du changement
Business Intelligence
avec Excel, Power BI et Office 365 Téléchargement www.editions-eni.fr.fr Jean-Pierre GIRARDOT Table des matières 1 Avant-propos A. À qui s adresse ce livre?..................................................
Oracle Décisionnel : Modèle OLAP et Vue matérialisée D BILEK
Oracle Décisionnel : Modèle OLAP et Vue matérialisée SOMMAIRE Introduction Le modèle en étoiles Requêtes OLAP Vue matérialisée Fonctions Roll up et Cube Application Introduction Data Warehouse Moteur OLAP
Faculté des sciences de gestion et sciences économiques BASE DE DONNEES
BASE DE DONNEES La plupart des entreprises possèdent des bases de données informatiques contenant des informations essentielles à leur fonctionnement. Ces informations concernent ses clients, ses produits,
Un datawarehouse est un entrepôt de données (une base de données) qui se caractérise par des données :
Page 1 of 6 Entrepôt de données Un article de Wikipédia, l'encyclopédie libre. L'entrepôt de données, ou datawarehouse, est un concept spécifique de l'informatique décisionnelle, issu du constat suivant
SUGARCRM MODULE RAPPORTS
SUGARCRM MODULE RAPPORTS Référence document : SYNOLIA_Support_SugarCRM_Module_Rapports_v1.0.docx Version document : 1.0 Date version : 2 octobre 2012 Etat du document : En cours de rédaction Emetteur/Rédacteur
Bases de données Cours 1 : Généralités sur les bases de données
Cours 1 : Généralités sur les bases de données POLYTECH Université d Aix-Marseille [email protected] http://odile.papini.perso.esil.univmed.fr/sources/bd.html Plan du cours 1 1 Qu est ce qu une
Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise.
Solutions PME VIPDev Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise. Cette offre est basée sur la mise à disposition de l ensemble de nos compétences techniques et créatives au service
CegidBusinessPlaceMode. Back Office. www.cegid.fr/mode. Le progiciel de gestion intégré pour piloter votre réseau de distribution
CegidBusinessPlaceMode Cegid Business Place Mode Back Office Le progiciel de gestion intégré pour piloter votre réseau de distribution Cegid Back Office est un véritable outil de pilotage adapté à votre
GESTION LOGISTIQUE GESTION COMMERCIALE GESTION DE PRODUCTION
GESTION LOGISTIQUE GESTION COMMERCIALE GESTION DE PRODUCTION Votre contact : Pierre Larchères 06 30 35 96 46 18, rue de la Semm - 68000 COLMAR [email protected] PRESENTATION GENERALE LES PROGICIELS
Le Concept Dynamics Nav. B.I.Conseil
Développement Croissance Développement Productivité Investissement Environnement Ouverture B.I.Conseil Nous sommes Microsoft Business Solutions Partner, ce qui nous permet de travailler en étroite collaboration
Excel Avancé. Plan. Outils de résolution. Interactivité dans les feuilles. Outils de simulation. La valeur cible Le solveur
Excel Avancé Plan Outils de résolution La valeur cible Le solveur Interactivité dans les feuilles Fonctions de recherche (ex: RechercheV) Utilisation de la barre d outils «Formulaires» Outils de simulation
Business Intelligence avec SQL Server 2012
Editions ENI Business Intelligence avec SQL Server 2012 Maîtrisez les concepts et réalisez un système décisionnel Collection Solutions Informatiques Extrait Alimenter l'entrepôt de données avec SSIS Business
Introduction aux Bases de Données
Introduction aux Bases de Données I. Bases de données I. Bases de données Les besoins Qu est ce qu un SGBD, une BD Architecture d un SGBD Cycle de vie Plan du cours Exemples classiques d'applications BD
PromoPost Manuel d utilisation
PromoPost Manuel d utilisation Version 01.02 Mars 2014 1 Table des matières 1 Accès 4 1.1 Accès via My Post Business 4 1.2 Bienvenue dans le tool PromoPost 5 1.3 Accès pour les utilisateurs non enregistrés
1220 Promenade du St-Laurent, Batiscan, QC, G0X1A0 Tél: 819-415-0451
Un logiciel sophistiqué, simple à utiliser et conçu avec la toute dernière technologie informatique. Orchestra version Web est un logiciel de Management des ressources de production de type ERP. Il est
Business Intelligence avec Excel, Power BI et Office 365
Avant-propos A. À qui s adresse ce livre? 9 1. Pourquoi à chaque manager? 9 2. Pourquoi à tout informaticien impliqué dans des projets «BI» 9 B. Obtention des données sources 10 C. Objectif du livre 10
PLATEFORME MÉTIER DÉDIÉE À LA PERFORMANCE DES INSTALLATIONS DE PRODUCTION
PLATEFORME MÉTIER DÉDIÉE À LA PERFORMANCE DES INSTALLATIONS DE PRODUCTION KEOPS Automation Espace Performance 2B, rue du Professeur Jean Rouxel BP 30747 44481 CARQUEFOU Cedex Tel. +33 (0)2 28 232 555 -
Découpe fonctionnelle Gestion commerciale Sage 30, 100 et Start
Découpe fonctionnelle Gestion commerciale Sage 30, 100 et Start Commentaire : en bleu les nouveautés Vi7.50. Gestion des ventes / Facturation clients Gestion des factures électroniques (Emission uniquement)
Termes et Conditions : Opération Brother Vols Europe
Termes et Conditions : Opération Brother Vols Europe 1. L offre, nominative et limitée à une participation par foyer (même nom, même adresse), est réservée aux personnes âgées de 18 ans et plus, résidant
Atelier Symposium MicroStrategy
Atelier Symposium MicroStrategy Présentation de Soft Computing «De l'usage de MicroStrategy pour la Connaissance Client dans le secteur de la Distribution» G.MANGEON Soft Computing 16 Juin 2016 Soft Computing
BI = Business Intelligence Master Data-Science
BI = Business Intelligence Master Data-Science UPMC 25 janvier 2015 Organisation Horaire Cours : Lundi de 13h30 à 15h30 TP : Vendredi de 13h30 à 17h45 Intervenants : Divers industriels (en cours de construction)
Cours Bases de données 2ème année IUT
Cours Bases de données 2ème année IUT Cours 13 : Organisation d une base de données, ou comment soulever (un peu) le voile Anne Vilnat http://www.limsi.fr/individu/anne/cours Plan 1 Les clusters de table
Distribuez une information fiable. IBM InfoSphere Master Data Management Server 9.0. Des données fiables pour de meilleurs résultats
IBM InfoSphere Master Data Management Server 9.0 Des données fiables pour de meilleurs résultats Les entreprises génèrent et collectent chaque jour une multitude de données : informations sur les comptes,
Techniques d optimisation des requêtes dans les data warehouses
Techniques d optimisation des requêtes dans les data warehouses Ladjel Bellatreche LISI/ENSMA Téléport2-1, Avenue Clément Ader 86960 Futuroscope - FRANCE [email protected] Résumé Un entrepôt de données
Cours Base de données relationnelles. M. Boughanem, IUP STRI
Cours Base de données relationnelles 1 Plan 1. Notions de base 2. Modèle relationnel 3. SQL 2 Notions de base (1) Définition intuitive : une base de données est un ensemble d informations, (fichiers),
Bases de Données OLAP
Bases de Données OLAP Hiver 2013/2014 Melanie Herschel [email protected] Université Paris Sud, LRI Chapitre 1 Introduction Détails administratifs Entrepôts de Données Perspective sur le semestre
TP Conception de Datawarehouse Initiation à ORACLE WAREHOUSE BUILDER Cédric du Mouza
TP Conception de Datawarehouse Initiation à ORACLE WAREHOUSE BUILDER Cédric du Mouza Ce TP s appuie sur le tutorial de prise en main de Oracle Warehouse Builder, que vous pouvez trouver en anglais sur
Datawarehouse and OLAP
Datawarehouse and OLAP Datawarehousing Syllabus, materials, notes, etc. See http://www.info.univ-tours.fr/ marcel/dw.html today architecture ETL refreshing warehousing projects architecture architecture
Reporting et Décisions 100
Reporting et Décisions 100 Version 10.00 Référence COMPOSITION DU PROGICIEL PROPRIETE & USAGE CONFORMITE & MISE EN GARDE EVOLUTION FICHE DE SUGGESTION MARQUES Votre progiciel est composé d'un boîtier de
Le Data Warehouse. Fait Vente. temps produit promotion. magasin. revenu ... Produit réf. libellé volume catégorie poids. Temps jour semaine date ...
Le Data Warehouse Temps jour semaine date magasin nom ville m 2 région manager... Fait Vente temps produit promotion magasin revenu... Produit réf. libellé volume catégorie poids... Promo nom budget média
Introduction : présentation de la Business Intelligence
Les exemples cités tout au long de cet ouvrage sont téléchargeables à l'adresse suivante : http://www.editions-eni.fr Saisissez la référence ENI de l'ouvrage RI3WXIBUSO dans la zone de recherche et validez.
Urbanisation des Systèmes d Information Architecture d Entreprise. 04 Architecture du SI : identifier et décrire les services, structurer le SI
Plan du chapitre Master Informatique et Systèmes Urbanisation des Systèmes d Information Architecture d Entreprise 04 Architecture du SI : identifier et décrire les services, structurer le SI 1 2 3 1.1
l ERP sans limite Multi Evolutif et modulaire Import-Export des informations
l ERP sans limite Gestion commerciale & Logistique Divalto infinity Gestion commerciale & Logistique gère de manière performante tous les événements de la gestion commerciale, des achats et des stocks,
