Les ntrepôts de onnées. (Data Warehouses) La Modélisation

Dimension: px
Commencer à balayer dès la page:

Download "Les ntrepôts de onnées. (Data Warehouses) La Modélisation"

Transcription

1 Les ntrepôts de onnées (Data Warehouses) La Modélisation 1 Les$Faits La$défini-on$ Unfaitestlapluspe-teinforma-onanalysable.C'estuneinforma-onqui con-entlesdonnéesobservables(les$faits)quel'onpossèdesurunsujetet quel'onveutétudier,selondiversaxesd'analyse(les$dimensions). Les«faits»dansunentrepôtdedonnées,sontnormalementnumériques, puisqued'ordrequan-ta-f.ilpeuts'agirdumontant-en-argent-des-ventes,du nombre-d'unités-vendues-d'un-produit,etc. 2

2 Les$Faits$$(suite) La$défini-on$(suite)$ Lesfaitsreprésententdesassocia-onsdontl'existenced'uneoccurrencedépenddel'existence desoccurrencescorrespondantesparmilesdescripteursdimensionnels. C'estGàGdire, la ''table'' de faits con-ent l'ensemble des mesures correspondant aux informa-onsdel'ac-vitéàanalyser. Mais$certaines$tables$de$faits$peuvent$ne$contenir$aucun$a;ribut$et$représentent$des$liaisons$ entre$tables$dimensionnelles. Touslesélémentsquipointentsurlatabledefaitssontliésàuneséman-queexprimablepar unephrase.parconséquent,la''table''defaitsestlamatérialisa-ond'uneassocia-onentren en-tés. 3 Les$Faits$(suite) Structure$de$base$d'une$''table''$de$faits$$ Une''table''defaitsdevraitavoirlastructuresuivante: Date%cal.%(FK) Clef%étrangères%vers%les%dimensions Dimensions%dégénérées Mesures% Id%Dim 1 %(FK) Id%Dim 2 %(FK) Id%Dim n %(FK) Code%Dim%Dég%1%(DD) Code%Dim%Dég%2%(DD) Code%Dim%Dég%m%(DD) Mesure%1 Mesure%2 Mesure%n 4

3 Les$Faits$(suite) Caractéris-ques$d'une$''table''$des$faits$ Une''table''defaitscon-entlesvaleursnumériquesdecequ'ondésiremesurer Une''table''defaitscon-entlesclésassociéesauxdimensions.Ils'agitdeclésétrangèresvers lesdimensions Engénéralune''table''defaitscon-entunpe-tnombredecolonnes Une''table''defaitscon-entplusd'enregistrementsqu'une''table''dedimension Lesinforma-onsdansune''table''defaitssontcaractérisées: " Ellessontnumériquesetsontu-liséespourfairedesSUM,-AVG... " Lesdonnéesdoiventêtreaddi-vesousemiGaddi-ves Lesmesures(Mes 1,-Mes 2 - -Mes n )doiventréféreretavoirunliendirectaveclesclésdesdimensions(date-cal,-id- Dim 1,-- Id-Dim 2-,-...,-Id-Dim n- )danslamêmetable. 5 Les$Faits$(suite) Exemple$d'une$''table''$de$faits$ VENTES$ Id_Cde Id_Client Id_Vendeur Id_Produit Id_Date Id_Ville 5 Quantité Prix5Total 5 Clef$ (clés étrangères vers les dimensions) Mesures$ 6

4 Dimension La$défini-on$ # Unedimensionestune''table''quireprésenteunaxe$d'analyse$selonlequelonveut étudier des données observables (les$ faits) qui, soumises à une analyse mul-dimensionnelle, donnent aux u-lisateurs des renseignements nécessaires à la prise dedécision. # Onappelledonc''dimension''unaxed'analyse.Ilpeuts'agirdesClientsoudesProduits d'une entreprise, d'une Période de temps comme un exercice financier, des ac-vités menéesauseind'unesociété,etc. 7 Dimension$$(suite) Structure de base d'une dimension Une dimension devrait avoir la structure suivante : Clé(de(substitution((Surrogate(key) Clé(primaire((PK) Clé(d'affaire((natural(key(ou(buisness( key)((peut_être(composée(de(plusieurs( attributs Clé(naturelle((NK) Attributs(de(la(dimension Attribut 1 (((.(.(. Attribut n Clés(spéciales(pour(la(gestion(de( l'historique(de(la(dimension Date(effective Date(de(retrait Indicateur(effectif 8

5 Dimension$$(suite) Caractéris-ques$d'une$dimension$ # Une"table''dedimensioncon-entledétailsurlesfaits # Une''table''dedimensioncon-entlesinforma-onsdescrip-vesdesvaleursnumériquesdelatable desfaits # Vuquelesdonnéesdansla''table''dedimensionsontnormalisées,ellecon-entunplusgrand nombredecolonnes # Une''table''dedimensioncon-entengénéralbeaucoupmoinsd'enregistrementsqu'une''table'' desfaits # LesaSributsd'une''table''dedimensionsontsouventu-liséscomme«Tête-de-lignes»et«Tête-decolonne»dansunrapportourésultatderequête. 9 Dimension$D$composantes Composante$1:surrogate-key--ouclédesubs-tu-on Composantes$2$:aSributs Composantes$3$:clésspéciales 10

6 Dimension$ $composantes$(suite) Composante$1$:$surrogate$key$$ou$clé$de$subs-tu-on$ $Exemple Dim.%PRODUIT Id#Produit Nom#Produit Description#Produit Sous3catégorie Famille#Produit Description#Catégorie Surrogate$Clef$ (clé de substitution ) Clef$naturelle$ (clé artificielle)$ PRODUIT Code_Produit Désignation Description33 Prix3unitaire. Prix#unitaire - Table d'une BD de production - Table d'une BD multidimensionnelle 11 Dimension$ $composantes$(suite) Composante$1$:$surrogate$key$$ou$clé$de$subs-tu-on$ $La$Défini-on$ Uneclédesubs-tu-on(Surrogate-key)estuneclénonsignifica-veu-liséeafindesubs-tuerla clénaturelle(business-key)quiprovientdessystèmesopéra-onnels. Laclénaturelleest,engénéral,composéedeplusieurscolonnes. Dansunsystèmeopéra-onnel,onu-liseunecléar-ficielleafind'iden-fierd'unefaçonuniqueun élémentdel'en-té:(client_idpourl'en-téclient,emp_idpourl'en-téemployé). Laclédesubs-tu-onnedoitpasêtreconfondueaveclacléar-ficielleaSribuéeparlessystèmes opéra-onnels. Laclédesubs-tu-onestalorsu-liséedansunentrepôtdedonnéespourremplaceretcompléter lacléar-ficielledusystèmeopéra-onnelafinderendreunélémentuniquedansladimension. 12

7 Dimension$ $composantes$(suite) Composante$1$:$surrogate$key$$ou$clé$de$subs-tu-on$ Les$Fonc-onnalités$$ # Remplacer$ la$ clé$ ar-ficielle$ ou$ naturelle$:$effec-vement une clé de subs-tu-on remplacelacléar-ficielleentermed'u-lisa-on,cen'estpluslaclénaturellequiserau-liséepour fairelesjointuresaveclestablesdefaitsetlesautrestablesdedimension. # Compléter$l'informa-on$:$Laclédesubs-tu-onn'aaucunsensentermed'affaire,elleest u-liséedansl'edseulement La clé ar-ficielle ou naturelle dans la dimension est toujours nécessaire pour pouvoir faire la correspondanceentrel'élémentdedimension(unclientparexemple)dansl'edetl'élémentdela tabledesclientsdanslesystèmeopéra-onnel. 13 Dimension$ $composantes$(suite) Composante$1$:$surrogate$key$$ou$clé$de$subs-tu-on$ Les$avantages$ $$$ # Performance : Accélère l'accès aux données du moment ou l'on va u-liser un index numériquevuqueletypededonnéesdelaclédesubs-tu-onestnumérique. # Indépendance$du$système$source:Onnepeutgaran-rquelacléd'affairenechangepas danslessystèmessources. # Historique$ des$ changements$ et$ granularité$ infinie: Si l'on désire garder l'historique des changementsdeladimensionseloncertainscritères,ondoitgérerlaclédesubs-tu-on.onse retrouve facilement avec plusieurs enregistrements de la même clé d'affaire dans la dimension. 14

8 Dimension$ $composantes$(suite) Composantes$2$$$:$$$a;ributs$$ Enplusdelaclédesubs-tu-onoudelaclénaturelle,d'autresaSributssontajoutésàladimension. CesaSributssontdescrip-fsetreprésentel'informa-onu-lesurladimension(Le-salaire-d'unemployé,-l'adresse-d'un-client...) Dim.%PRODUIT Surrogate$Clef$ (clé de substitution ) Id#Produit Nom#Produit Description#Produit A;ributs$ (descripteurs ) Sous3catégorie Famille#Produit Description#Catégorie Prix#unitaire 15 Dimension$ $composantes$(suite) Composantes$3$$$:$$$clés$spéciales$$ Date$effec-ve:Dateàlaquellel'enregistrementàétécréé,depréférencedanslesystèmed'enregistrements (Systemofrecords). Date$retrait:Dateàlaquellel'enregistrementaétére-rédusystèmed'enregistrements. Indicateur$effec-f:Engénéralest'O'sil'enregistrementesttoujoursac-f(Dateretraitestnulle),'N'sinon. Dim.%PRODUIT Id#Produit Nom#Produit Description#Produit Sous3catégorie Famille#Produit Description#Catégorie Prix#unitaire date#effective Date#retrait Indicateur#effectif 16 Surrogate$Clef$ (clé de substitution ) A;ributs$$(descripteurs ) Clés$spéciales

9 Différents$types$de$dimensions$ Dimension$dégénérée$(Degenerate/dimension)$$ Ladimension$dégénérée$estuneclédedimensiondansla''table''defaitsquiestengénéral sansasribut. Exemple:N -de-bon-de-cde,n -d'interruppon-de-service... Vu qu'il s'agit d'une seule clé de dimension, nous évitons alors de créer une ''table'' de dimension,cequifaitquecese''table''dedimensionadégénérédansla''table''desfaits:c'est pourceseraisonquecesecléestappelée«dimensiondégénérée» 17 Différents$types$de$dimensions$ Dimension$dégénérée$(Degenerate/dimension)$$ La dimension$ dégénérée$ est une clé de dimension dans la ''table'' de faits qui est en généralsansasribut. Exemple:No-de-bon-de-Cde,No-d'interrupPon-de-service... 18

10 Différents$types$de$dimensions$(suite) Junk$dimension$ Ladimensiondegenre«Junk/dimension/»estunedimensionquicon-enttoutessortede flags,statuts,codesquinefontpar-ed'aucunedimensionrégulière. Dansledomainedeladistribu-ondel'énergie,uneinterrup-ondeservicepeutêtrede type«basse-tension»ou«moyenne-tension». Cegenredecodeestdoncstockédansunetablespécialeappelée «Junk-dimension». 19 Différents$types$de$dimensions$(suite) Dimension$à$évolu-on$lente$(SCD/:/Slowly/Changing/Dimension)$ Unedimensionpeutsubirdeschangementsdedescrip-ondesmembres Unclientpeutchangerd'adresse,semarier,... Unproduitpeutchangerdenoms,deformula-ons; exemple:«tree's»en«m&m»;«raider»en«twix»;«yaourt-à-la-vanille»en«yaourt-saveur- Vanille» CeSesitua-onpeutGêtregéréeenchoisissantentre3solu-ons: Écrasementdel'anciennevaleur Versionnement Valeurd'origine/valeurcourante - Remarque-:-Danscertaincaslatransi-onn'estpasimmédiate:ilrestependantuncertaintemps desanciensproduitsenrayon.ilestalorsconseillédelestraitercommedeuxmembres différents. 20

11 Différents$types$de$dimensions$(suite) Dimension$à$évolu-on$rapide$(RCD/:/Rapid/Changing/Dimension)$ Unedimension$à$changement$rapideestunedimensionquisubitdeschangementstrèsfréquents desasributsdontonveutpréserverl'historique. Solution: isoler les attributs qui changent rapidement Exemple:Sil'onveutpréserverl'historiquedeschangementsd'adressedansladimension «Clients»dansunpaysoù70%delapopula-ondéménageunefoisparannée(le1 ier juilletpar exempleaucanada), Ladimension«Clients»devientdanscecasunedimensionàévolu-onrapide(RCD) 21 Différents$types$de$dimensions$(suite) Dimension$à$évolu-on$rapide$(RCD/:/Rapid/Changing/Dimension)$ 22

12 Différents$types$de$dimensions$(suite) Dimension$causale$(Causal/dimension)$ Ils'agitd'unedimensionquiprovoquedesfaits. Exemple:ladimension«Promo=on»peutengénéralprovoquerdesventes Autre exemple dans le domaine de la distribu-on de l'énergie la dimension «CondiPonclimaPque»peutprovoquerdes«InterrupPons-de-service».Ladimension«CondiPon-climaPque» estdoncune$dimension$causale. 23 Différents$types$de$dimensions$(suite) Dimension$conforme$(Conformed/dimension)$ Unedimension$conformeoupartagéeestunedimensionu-liséeparlesfaitsdeplusieurs datamarts. Exemple:ladimension«Produit»estu-liséepardifférentsdatamarts«Finance»,«Marke-ng» 24

13 Différents$types$de$dimensions$(suite) Mini$dimension$ $ Danstoutentrepôtdedonnées,ilexisteaumoinsunegrandedimension,quecesoitenterme d'enregistrementsoud'asributs. - Exemple:Ladimension«Clients»peutcontenirdesmillionsd'enregistrements.Leplussouvent, ongèrel'évolu-onlente(voirmêmel'évolu-onrapide)surcegenrededimensionce quiaugmenteencoreplusleurstailles. Unmoyenderéduirelatailledecegenrededimensionestsoitderecouriràlatechniquede «flocondeneige»siladimensionesthiérarchique,soitdecréerunemini$dimension,quicon-ent touslesasributssurlesquelsongèrel'évolu-onlente. 25 Différents$types$de$dimensions$(suite) Mini$dimension$ $ Exemple:Ladimension«Clients»d'unsystèmededistribu-ond'énergiecon-entplusieursmillions d'enregistrements,dontlesasributssont: $ IDclient(Iden-fiantduclient,surrogatekey) $ Codeduclient(Lacléd'affaireduclient,provenantdusystèmesource) $ Nomduclient. $ Adresseduclient. $ Transformateurassocié.(transformateurélectriquequialimenteleclient) $ Codeincidence(coded'incidenceduclient:MapourMajeur,MopourMoyen,Mipourmineur,GepourGrande Entrepris) $ 26

14 Différents$types$de$dimensions$(suite) Mini$dimension$ Supposonsquepourdesbesoinsd'affaires,lesu-lisateursdécidentdepréserverl'historiquedes changementsdesasributssuivants:«transformateur-associé»et«code-d'incidence». Nouscréonsdoncuneminidimensionquicon-entlescolonnessuivantes: $ IDSCDClient $ Transformateurassocié $ Coded'incidence Etdansladimension«Clients»,nousajoutonsunenouvelleclédedimension«ID-SCD-client»pour fairelelienentreladimension«clients»etlaminigdimension «SCD-Client» - Remarque:ladimension«Clients»con-nuedecontenirtouslesaSributsmêmeceuxsurlesquelsnous géronsl'évolu-onlente. 27 La$Modélisa-on$Mul-dimensionnelle La$modélisa-on$en$3FN$Vs$La$Modélisa-on$mul-dimensionnelle$: Dimension(TEMPS Dimension(MAGASIN ID#Temps ID#Magasin Description Description FAITS Année Ville ID#Magasin Provincr ID#Prrpoduit ID#Temps#(Date#Cde) ID#Client ID#Client#Demog Dimension(Démogrphie(Client Dimension(PRODUIT ID#Prrpoduit NomProduit TypeProduit DescProduit ID#Categorie DescCategorie Ventes Profits ID#Clien#Demog Id#Client Date Attributs#client Dimension(CLIENT ID#Client Nom 28

15 La$Modélisa-on$Mul-dimensionnelle " Lemodèlemul-dimensionneln'adhèrepaslarègledela3FN,enapla-ssanttouslesniveauxdela dimension. Dansnotreexemple,la''table''«Produit»estapla-eetlesniveauxTypeProduit,IdCategoriesont avectouslesasributsdanslamême''table''dedimension«produit». " Ilviolelarègledelale2FNdanslatabledesfaits. LacolonneId-Temps-(Date-Cde)-faitpar-edelacommandeetestreprisedanslatabledesfaits. " IlnesuitpaslarègledeBCFN(Boyce[Codd-normal-form)enpermeSantlaredondancedes données. Toutcommedanslatable«Client»etlaminidimension«Démographie-client». 29 La$Modélisa-on$Mul-dimensionnelle " Ilexiste3formesdemodèlesmul-dimensionnels: 1. Lemodèleenétoile(Star-schema) 2. Lemodèleenflocondeneige(Snowflake-schema) 3. Lemodèleenconstella-on(Fac`lake-schema) 30

16 Le$modèle$en$étoile$ PRODUIT COMMANDE N Cde Date Cde Code produit Nom Produit Description Produit TABLE DE FAITS Catégorie CLIENT N Client Nom Client Adresse Client Ville VENDEUR Code vendeur Nom Vendeur Ville Vendeur Quota N Cde N Client Code vendeur Code produit Clef date Nom Ville Quantité Prix total Description catégorie Prix unitaire DATE Clef date Date Mois Année VILLE Nom Ville Région Pays 31 Le$modèle$en$étoile$ % Une''table''$de$faits$:iden-fiantsdestablesdedimension;uneouplusieursmesures % Plusieurstables$de$dimension:descripteursdesdimensions Unegranularitédéfinieparlesiden-fiantsdanslatabledesfaits. Avantages/://// Facilitédenaviga-on Performances:nombredejointureslimité;ges-ondesdonnéescreuses. Ges-ondesagrégats Fiabilitédesrésultats Inconvénients/:/ Touteslesdimensionsneconcernentpaslesmesures Redondancesdanslesdimensions Alimenta-oncomplexe. 32

17 Propriétés$des$mesures$ Addi-vité:somme sur toutes les dimensions Quantités vendues, chiffre d affaire Peut être le résultat d un calcul Bénéfice = montant vente coût SemiDaddi-vité:somme sur certaines dimensions Solde d un compte bancaire Pas de sens d additionner les dates car cela représente des instantanés d un niveau Σ sur les comptes: on connaît ce que nous possédons en banque Non$addi-f$: fait non additionnable quelque soit la dimension Prix unitaire: l addition sur n importe quelle dimension donne un nombre dépourvu de sens 33 Exemples$de$modèles$mul-dimensionnels$$$ $Dans$la$grande$distribu-on$: Quelques''tables''defaits:détailléesetvolumineuses ''Tables''dedimensions: Classiques:Produit,--Fournisseur,--Temps,--Etablissement-(structuregéographique,fonc-onnelle)... Stratégiques:Client,-PromoPons, - Remarque-:Obtenirleplusd'enregistrementspossibles. $Dans$le$secteur$des$banques$: ''Tables''desfaits:nombreuses,dédiéesàchaqueproduit,peudétailléesetpeuvolumineuses. ''Tables''dedimensions: Classiques:Produit,--Temps,--Etablissement-(structuregéographique,fonc-onnelle)... Stratégiques:Client,... Remarque-:-Obtenirleplusdedonnées(champs)possibles. 34

18 Le modèle en flocons de neige Le modèle de l' ED doit être simple à comprendre. On peut augmenter sa lisibilité en regroupant certaines dimensions. On définit ainsi des hiérarchies. Celles-ci peuvent être géographiques ou organisationnelles. Exemple : Commune, Département, Région, Pays, Continent Client Commune Département Region Pays Continent Pepone Lyon 1 Rhône Rhône-Alpes France Europe Testut Lyon 2 Rhône Rhône-Alpes France Europe Soinin Lyon 3 Rhône Rhône-Alpes France Europe Vepont Paris 1 Paris Ile-de-France France Europe Martin Paris 2 Paris Ile-de-France France Europe Elvert Versailles Yvelines Ile-de-France France Europe 35 Le modèle en flocons de neige PRODUIT COMMANDE Code produit N Cde Nom Produit Date Cde PRODUIT Description Produit CATEGORIE COMMANDE TABLE DE FAITS Code produit Catégorie Catégorie N Cde N Cde Nom Produit Description catégorie Desc. Cat Date Cde Desc. Produit CLIENT N Client Prix unitaire TABLE DE FAITS Catégorie N Client Code vendeur N Cde Prix unitaire CLIENTNom Client N Client Code produit DATE N Client Adresse ClientCode vendeur Clef date Clef date ANNEE Nom Client Ville Code produit Nom Ville DATE Date MOIS Année Adresse Client Clef date Clef date Mois Quantité Mois Ville Nom Ville Date Année VENDEUR Prix total Année Quantité Mois VENDEUR Code vendeurprix total Code vendeur Nom Vendeur VILLE Nom Vendeur VILLE REGION PAYS Ville Vendeur Nom Ville Ville Vendeur Nom Ville Région Pays Quota Quota Région Région Pays Pays Pays 36

19 Le modèle en flocons de neige Id#Marque Id#Famille MARQUE Id#Produit Nom#Produit Id#Cde Description#Produit Famille Date#Cde ANNEE Sous9catégorie Id#Année Famille#Produit Description#Catégorie SEMESTRE Prix#unitaire ###Id#Semestre COMMANDE SOUS4CATEGORIE SEMAINE MOIS PRODUIT Id#Semaine Id#Mois VENTES CATEGORIE DATE Id#Cde Id#Sous9catégorie Id#Client JOUR Id#Vendeur Id#Sous9catégorie Id#Produit ##Id#Mois Id#Date Id#Client CLIENT Id#Ville Nom#Client VILLE DEPARTEMENT Adresse#Client Quantité MAGASIN Ville#Client Prix+total ###Id#Département VENDEUR Id#Ville## Id#Magasin ZONEGEO. Id#Vendeur## Ville#Mag. Id#Zone#géo. Ville#Vendeur#### Département#Mag. Quota# Zone#géographique Région#Mag. Pays#Mag. 37 Le$modèle$en$flocons$de$neige$ Schéma en arbre d'attributs ANNEE COMMANDE Famille MARQUE SEMESTRE VENTES Id#Cde Id#Client PRODUIT SEMAINE MOIS DATE Id#Vendeur SOUS7CATEGORIE CATEGORIE Id#Produit Id#Date CLIENT Id#Ville VILLE DEPARTEMENT REGION PAYS JOUR MAGASIN Quantité Prix+total VENDEUR ZONEGEO. 38

20 Le$modèle$en$flocons$de$neige$ Modèle en flocons de neige = Modèle en étoile + normalisation des dimension Lorsque les tables sont trop volumineuses Avantages : réduction du volume permettre des analyse par pallier (drill down) sur la dimension hiérarchisée Inconvénients : navigation difficile nombreuses jointures 39 Les$hiérarchies$ Les différents types d'hiérarchies " Les hiérarchies strictes et simples 40

21 Les$hiérarchies$ Les différents types d'hiérarchies " Les hiérarchies multiples alternatives 41 Les$hiérarchies$ Les différents types d'hiérarchies " Les hiérarchies multiples parallèles 42

22 Les hiérarchies Les différents types d'hiérarchies " Les hiérarchies multiples parallèles 43 Les$hiérarchies$ Les différents types d'hiérarchies " Les hiérarchies multiples parallèles Etat$ Propaga-on$virus$du$Nil$ Ville$ Territoire$ Pays$ occidental Province$ 44

23 $Représenta-on$$des$données$mul-dimensionnelles$ & Les diagramme UML de SOLAP Dim.%ANNEE Id#Année Dim.%SEMESTRE Id#Semestre Dim.%MOIS Id#Mois Dim.%PAYS Id#Pays Dim.%MARQUE Dim.%CATEGORIE Dim.%REGION Dim.%ZONE%GEO. Id#Marque Id#Région Id#Région Id#Zone#géo. Dim.%Famille Dim.%SOUS:CATEGORIE Dim.%DEPARTEMENT Dim.%VILLE Dim.%JOUR Id#Famille Id#Sous;catégorie Id#Département Id#Ville Id#Jour VENTES Id#Cde Id#Client Dim.%PRODUIT Dim%DATE Id#Vendeur Id#Produit Dim.%MAGASIN Id#Date Id#Produit Nom#Produit Id#Magasin Dim.%CLIENT Jour Id#Date Description#Produit Ville#Mag. Id#Client Semaine Id#Ville Sous;catégorie Département#Mag. Nom#Client Dim.%VENDEUR Dim.%COMMANDE Mois Famille#Produit Zone#géographique Adresse#Client Id#Vendeur Id#Cde Semestre Quantité Description#Catégorie Région#Mag. Ville#Client Ville#Vendeur Date#Cde Année Prix+total Prix#unitaire Pays#Mag. Quota 45 Lemodèle$en$constella-on$(FactDflaked)$ " La modélisation en constellation consiste à fusionner plusieurs modèles en étoile qui peuvent utiliser des dimensions communes. " Un modèle en constellation comprend donc plusieurs tables de faits et des tables de dimensions communes ou non à ces tables de faits. 46

24 Lemodèle$en$constella-on$(FactDflaked)$ Dim.%ANNEE Id#Année Dim.%PRODUCTION Dim.%USINE Id#Production Id#Usine Id#Produit Dim.%SEMESTRE Id#Date Id#Semestre Dim.%COMMANDE Id#Usine Dim.%SEMAINE Id#Cde # Id#Semaine Date#Cde Qté$produite Dim.%MOIS Dim.%PRODUIT Id#Mois Dim%DATE Id#Produit Id#Date Nom#Produit Dim.%Famille Dim.%MARQUE Jour Description#Produit Id#Famille Id#Marque Dim.%JOUR Semaine VENTES Sous=catégorie Id#Jour Mois Id#Cde Famille#Produit Semestre Id#Client Description#Catégorie Dim.%SOUS9CATEGORIE Dim.%CATEGORIE Année Id#Vendeur Prix#unitaire Id#Sous=catégorie Id#Région Id#Produit Id#Date Dim.%CLIENT Id#Ville Dim.%REGION Dim.%PAYS Id#Client Id#Région Id#Pays Nom#Client Quantité Dim.%DEPARTEMENT Adresse#Client Prix$total Id#Département Ville#Client Dim.%MAGASIN Id#Magasin Ville#Mag. Dim.%VILLE Dim.%ZONE%GEO. Dim.%VENDEUR Département#Mag. Id#Ville Id#Zone#géo. Id#Vendeur Zone#géographique Ville#Vendeur Région#Mag. Quota Pays#Mag. 47 Es-mer$le$volume$du$DW$$ Calculer ou estimer le nombre d'enregistrements Prendre en compte : # La ''table'' de faits # Les dimensions significatives # Les agrégats # Les index # Saisonnalité des ventes # Croissance du CA, des encours, du nombre de points de ventes 48

25 Exemples Grandes distribution : CA annuel : M$ Prix moyen d'un article d'un ticket : 5$ Nbre d'articles vendus pour un an : 80 * 10 9 / 5 = 16 * 10 9 Volume du DW : 16*10 9 *3 ans * 24 octets = 1,54 To (1,54*10 12 = Go ) Téléphonie : Nbre d'appels quotidiens : 100 millions Historique : 3 ans * 365 jours= jours Volume du DW : 100 millions * jours * 24 octets = 3,94 To Cartes de crédit : Nbre de clients : 50 millions Nbre moyen mensuel de transactions : 30 Volume : 50 millions * 26 mois * 30 transactions * 24 octets = 1,73 To 49 Modélisa-on$logique$ou$Représenta-on$des$données$ Les données sont perçues à travers plusieurs dimensions. Elles sont qualifiées de multidimensionnelles, indépendamment de leur support (tables relationnelles ou tableaux multidimensionnels) Produit Region Ventes Clous Est 50 Clous Ouest 60 Clous Centre 100 Vis Est 40 Vis Ouest 70 Vis Centre 80 Boulons Est 90 Boulons Ouest 120 Boulons Centre 140 Nettoyeurs Est 20 Nettoyeurs Ouest 10 Nettoyeurs Centre 30 Est Ouest Centre Clous, Vis Boulons N ettoyeurs Représentation des données dans un tableau multidimensionnel Représentation des données dans une table relationnelle 50

26 Les$requêtes$décisionnelles$ On peut calculer divers totaux. Quelle est le total des ventes dans la région Est? # Tables relationnelles : on peut traiter quelques centaines de tuples par seconde. # Tableau multidimensionnel : on peut rajouter en lignes et en colonnes plus de valeurs par seconde. Pour accélérer les temps de réponses, il est préférable de pré-calculer des sous totaux. 51 Les$requêtes$décisionnelles$ Produit Region Ventes Clous Est 50 Clous Ouest 60 Clous Centre 100 Clous Total 210 Vis Est 40 Vis Ouest 70 Vis Centre 80 Vis Total 190 Boulons Est 90 Boulons Ouest 120 Boulons Centre 140 Boulons Total 350 Nettoyeurs Est 20 Nettoyeurs Ouest 10 Nettoyeurs Centre 30 Nettoyeurs Total 60 Total Est 200 Total Ouest 260 Total Centre 350 Total Total 810 Pour le calcul de ces totaux : 28 accès en lecture et 8 accès en écriture. Est Ouest Centre Total Clous Vis Boulons Nettoyeurs Total OLAP consolide entre et cellules/s Un SGBDR lit 200 enregist/s et en écrit environ 20/s. 52

27 Les$requêtes$décisionnelles$ La valeur ALL remplace une colonne ou une valeur d'agrégats. Magasin Date Rayon CA Ventes Mag1 1/2/ Mag1 6/2/ Mag1 10/2/ Mag1 ALL Mag2 S'il y a N attributs concourant à la construction du cube, il y aura : 2 N -1 agrégations Soit C 1, C 2,,C N les cardianlités des N attributs, le cube aura : (C i +1) enregistrements Dans la tables VENTES si on a 2*3*3 = 18 enregist. dans le cube on aura 3*4*4* = 48 enregist. 53 Les$différentes$approches$d'OLAP$ L'approche relationnelle (ROLAP) (MicroStrategy MS ; Informix's Metacube MC, Information Advantage IA) L'ensemble des données est stocké dans une BDR. Les données sont sous forme d'enregistrements (tuples). VENTES (Magasin, Rayon, Date, CA Ventes, Nb Client) Select Magasin, Date, Sum(CA Ventes) From VENTES Group By Magasin, Date Opérateurs d'agrégation : cube, rollup. ' J.Gray, A. Bosworth, A. Leyman, H. Pirahesh, Data Cube : A relationnal Aggregation Operator Generalizing Group-By, Cross- Tab, and Sub-Total, in Data Mining and Knowledge Discovery Journal, 1(1), 1997] 54

28 Les$requêtes$décisionnelles$ L'union de plusieurs group-by donne naissance à un cube : Select ALL, ALL, ALL, Sum(CA Ventes) From VENTES UNION Select Magasin, ALL, ALL, Sum(CA Ventes) From VENTES Group-By Magasin ; UNION Select Magasin, Date, ALL, Sum(CA Ventes) From VENTES Group-By Magasin, Date ; UNION Select Magasin, Date, Rayon, Sum(CA Ventes) From VENTES Group-By Magasin, Date, Rayon ; L'opérateur cube est une généralisation N-dimensionnelle de fonctions d'agrégations simples. C'est un opérateur relationnel. Select Magasin, date, Rayon, Sum(CA Ventes) From VENTES Group-By Cube Magasin, Date, Rayon ; 55 Les$différentes$approches$d'OLAP$ L'approche multidimensionnelle (MOLAP) Arbor Software : hyperion (Codd & co ), Express Oracle, LightShip (de Pilot) Il s'agit de stocker les données dans des tableaux multidimensionnels. Ces tableaux peuvent être éparses. On y stocke dans les cellules les mesures (valeurs à observer), les données représentant les dimensions sont les coordonnées de ces valeurs : f = (d 1, d 2,, d n, m 1, m 2,, m p ) [Zhao Yihong, Deshpande Prasad M., Naughton Jeffrey F., «An Array-Based Algorithm for Simultaneous Multidimensional Aggregates», in SIGMOD Record n 26, Vol 2, 1997.] 56

29 Les$différentes$approches$d'OLAP$ BD éparse # Plus on a de dimensions plus on a de cellules. Seulement une partie des produits peut être vendue ( des cellules sans valeur : données éparses. Exemple : On dispose de données (eq. tuples) 4 dimensions ayant une cardinalité de 30 modalités chacune: 30 * 30 * 30 * 30 = cellules (dont vides : 12,3% seulement sont pleines) # Une BD est considérée comme éparse si elle a moins de 40% de ses cellules peuplées. # Techniques de compression des données 57 Les$différentes$approches$d'OLAP$ L'approche hybride (HOLAP) Approche relationnelle : 30% du temps est consacré aux I/O Approche multidimensionnelle : 20% (70% calculs et 10% décompression) La 3 voie préconisée consiste à utiliser les tables comme structure permanente de stockage des données et les tableaux comme structure des requêtes. La démarche consisterait en 3 étapes : 1. Charger les données d'une table vers un tableau. 2. Calculer le cube de ce tableau selon les méthodes initialement présentées. 3. Stocker les résultats (données agrégées) dans un table. 1 Pays 5 Régions 500 Villes BDM Clients BDR 58

30 Les$différentes$structures$mul-dimensionnelles$ " Les magasins de données (data marts) & Simples magasins de données (Data Marts), on y stockera des données portant sur une seule des activités de l'entreprise & Ceux sont en quelque sorte des vues métier & Exemple : Data Mart Comptabilité, Data Mart RH,... & Ces mini ED peuvent alors être considérés comme des espaces d'analyse, du fait que les données sont bien moins nombreuses et surtout qu'elles sont thématiques et modélisées en multidimensionnel & Ils peuvent également servir de bases de construction à des cubes de données 59 Entrepôts,$Magasins$et$Cubes$de$données$ MD Magasins de données Data Mining MD Entrepôt$ de$ données$ MD MD MD Cube Cube Cube Cubes de données Analyses statistiques MD OLAP Reporting 60

Datawarehouse: Cubes OLAP. Marlyse Dieungang Khaoula Ghilani

Datawarehouse: Cubes OLAP. Marlyse Dieungang Khaoula Ghilani Datawarehouse: Cubes OLAP Marlyse Dieungang Khaoula Ghilani Table des matières 1 Data Warehouse 3 1.1 Introduction............................ 3 1.1.1 Définition......................... 3 1.1.2 Architecture........................

Plus en détail

Plan. Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation

Plan. Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation Data WareHouse Plan Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation 2 Présentation Besoin: prise de décisions

Plus en détail

Les entrepôts de données

Les entrepôts de données Les entrepôts de données Lydie Soler Janvier 2008 U.F.R. d informatique Document diffusé sous licence Creative Commons by-nc-nd (http://creativecommons.org/licenses/by-nc-nd/2.0/fr/) 1 Plan Introduction

Plus en détail

Entrepôt de données 1. Introduction

Entrepôt de données 1. Introduction Entrepôt de données 1 (data warehouse) Introduction 1 Présentation Le concept d entrepôt de données a été formalisé pour la première fois en 1990 par Bill Inmon. Il s agissait de constituer une base de

Plus en détail

Fouille de Données : OLAP & Data Warehousing

Fouille de Données : OLAP & Data Warehousing Fouille de Données : OLAP & Data Warehousing Nicolas Pasquier Université de Nice Sophia-Antipolis Laboratoire I3S Chapitre 2. Data warehousing Définition : qu est-ce que le data warehousing? Entrepôt de

Plus en détail

Entrepôts de données. NEGRE Elsa Université Paris-Dauphine 2015-2016

Entrepôts de données. NEGRE Elsa Université Paris-Dauphine 2015-2016 Entrepôts de données NEGRE Elsa Université Paris-Dauphine 2015-2016 Contexte et problématique Le processus de prise de décision L entrepôt de données Définition Différence avec un SGBD Caractéristiques

Plus en détail

Le "tout fichier" Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique

Le tout fichier Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique Introduction à l informatique : Information automatisée Le premier ordinateur Définition disque dure, mémoire, carte mémoire, carte mère etc Architecture d un ordinateur Les constructeurs leader du marché

Plus en détail

et les Systèmes Multidimensionnels

et les Systèmes Multidimensionnels Le Data Warehouse et les Systèmes Multidimensionnels 1 1. Définition d un Datawarehouse (DW) Le Datawarehouse est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées

Plus en détail

Urbanisation des SI-NFE107

Urbanisation des SI-NFE107 OLAP Urbanisation des SI-NFE107 Fiche de lecture Karim SEKRI 20/01/2009 OLAP 1 Introduction PLAN OLAP Les différentes technologies OLAP Plate formes et Outils 20/01/2009 OLAP 2 Informatique décisionnelle

Plus en détail

Bases de données multidimensionnelles et mise en œuvre dans Oracle

Bases de données multidimensionnelles et mise en œuvre dans Oracle Bases de données multidimensionnelles et mise en œuvre dans Oracle 1 Introduction et Description générale Les bases de données relationnelles sont très performantes pour les systèmes opérationnels (ou

Plus en détail

Plan. Ce qu est le datawarehouse? Un modèle multidimensionnel. Architecture d un datawarehouse. Implémentation d un datawarehouse

Plan. Ce qu est le datawarehouse? Un modèle multidimensionnel. Architecture d un datawarehouse. Implémentation d un datawarehouse Datawarehouse 1 Plan Ce qu est le datawarehouse? Un modèle multidimensionnel Architecture d un datawarehouse Implémentation d un datawarehouse Autres développements de la technologie data cube 2 Ce qu

Plus en détail

BI = Business Intelligence Master Data-ScienceCours 3 - Data

BI = Business Intelligence Master Data-ScienceCours 3 - Data BI = Business Intelligence Master Data-Science Cours 3 - Datawarehouse UPMC 8 février 2015 Rappel L Informatique Décisionnelle (ID), en anglais Business Intelligence (BI), est l informatique à l usage

Plus en détail

LES ENTREPOTS DE DONNEES

LES ENTREPOTS DE DONNEES Module B4 : Projet des Systèmes d information Lille, le 25 mars 2002 LES ENTREPOTS DE DONNEES Problématique : Pour capitaliser ses informations, une entreprise doit-elle commencer par mettre en œuvre des

Plus en détail

Collabora'on IRISA/INRA sur le transfert de nitrates et l améliora'on de la qualité des eaux des bassins versants:

Collabora'on IRISA/INRA sur le transfert de nitrates et l améliora'on de la qualité des eaux des bassins versants: Collabora'on IRISA/INRA sur le transfert de nitrates et l améliora'on de la qualité des eaux des bassins versants: Tassadit BOUADI 22 Juin 2010, Saint Jacut 1 Plan Introduc

Plus en détail

Business Intelligence : Informatique Décisionnelle

Business Intelligence : Informatique Décisionnelle Business Intelligence : Informatique Décisionnelle On appelle «aide à la décision», «décisionnel», ou encore «business intelligence», un ensemble de solutions informatiques permettant l analyse des données

Plus en détail

et les Systèmes Multidimensionnels

et les Systèmes Multidimensionnels Le Data Warehouse et les Systèmes Multidimensionnels 1 1. Définition d un Data warehouse (DW) Le Data warehouse (entrepôt de données) est une collection de données orientées sujet, intégrées, non volatiles

Plus en détail

Un datawarehouse est un entrepôt de données (une base de données) qui se caractérise par des données :

Un datawarehouse est un entrepôt de données (une base de données) qui se caractérise par des données : Page 1 of 6 Entrepôt de données Un article de Wikipédia, l'encyclopédie libre. L'entrepôt de données, ou datawarehouse, est un concept spécifique de l'informatique décisionnelle, issu du constat suivant

Plus en détail

Entrepôt de Données. Jean-François Desnos. Jean-Francois.Desnos@grenet.fr ED JFD 1

Entrepôt de Données. Jean-François Desnos. Jean-Francois.Desnos@grenet.fr ED JFD 1 Entrepôt de Données Jean-François Desnos Jean-Francois.Desnos@grenet.fr ED JFD 1 Définition (Bill Inmon 1990) Un entrepôt de données (data warehouse) est une collection de données thématiques, intégrées,

Plus en détail

Les entrepôts de données et l analyse de données

Les entrepôts de données et l analyse de données LOG660 - Bases de données de haute performance Les entrepôts de données et l analyse de données Quelques définitions Entreposage de données (data warehousing): «La copie périodique et coordonnée de données

Plus en détail

Les Entrepôts de Données

Les Entrepôts de Données Les Entrepôts de Données Grégory Bonnet Abdel-Illah Mouaddib GREYC Dépt Dépt informatique :: GREYC Dépt Dépt informatique :: Cours Cours SIR SIR Systèmes d information décisionnels Nouvelles générations

Plus en détail

Entrepôt de données et l Analyse en ligne. Maguelonne Teisseire Hugo Alatrista Salas hugo.alatrista- salas@teledetec9on.fr Flavien Bouillot

Entrepôt de données et l Analyse en ligne. Maguelonne Teisseire Hugo Alatrista Salas hugo.alatrista- salas@teledetec9on.fr Flavien Bouillot Entrepôt de données et l Analyse en ligne Maguelonne Teisseire Hugo Alatrista Salas hugo.alatrista- salas@teledetec9on.fr Flavien Bouillot Déroulement du cours 17 janvier : cours et TD 20 janvier : cours?

Plus en détail

Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP)

Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP) Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP) Définition (G. Gardarin) Entrepôt : ensemble de données historisées variant

Plus en détail

Le Data Warehouse. Fait Vente. temps produit promotion. magasin. revenu ... Produit réf. libellé volume catégorie poids. Temps jour semaine date ...

Le Data Warehouse. Fait Vente. temps produit promotion. magasin. revenu ... Produit réf. libellé volume catégorie poids. Temps jour semaine date ... Le Data Warehouse Temps jour semaine date magasin nom ville m 2 région manager... Fait Vente temps produit promotion magasin revenu... Produit réf. libellé volume catégorie poids... Promo nom budget média

Plus en détail

Introduction à la B.I. Avec SQL Server 2008

Introduction à la B.I. Avec SQL Server 2008 Introduction à la B.I. Avec SQL Server 2008 Version 1.0 VALENTIN Pauline 2 Introduction à la B.I. avec SQL Server 2008 Sommaire 1 Présentation de la B.I. et SQL Server 2008... 3 1.1 Présentation rapide

Plus en détail

Les Entrepôts de Données. (Data Warehouses)

Les Entrepôts de Données. (Data Warehouses) Les Entrepôts de Données (Data Warehouses) Pr. Omar Boussaid Département d'informatique et de Sta5s5que Université Lyon2 - France Les Entrepôts de Données 1. Généralités, sur le décisionnel 2. L'entreposage

Plus en détail

FreeAnalysis. Schema Designer. Cubes

FreeAnalysis. Schema Designer. Cubes FreeAnalysis Schema Designer Cubes Charles Martin et Patrick Beaucamp BPM Conseil Contact : charles.martin@bpm-conseil.com, patrick.beaucamp@bpm-conseil.com Janvier 2013 Document : BPM_Vanilla_FreeAnalysisSchemaDesigner_v4.2_FR.odt

Plus en détail

Evry - M2 MIAGE Entrepôts de Données

Evry - M2 MIAGE Entrepôts de Données Evry - M2 MIAGE Entrepôts de Données Modélisation décisionnelle D. Ploix - M2 MIAGE - Conception EDD 1 Plan Construction de l entrepôt : les faits et les dimensions Préparation de l analyse : Les agrégats

Plus en détail

Oracle Décisionnel : Modèle OLAP et Vue matérialisée D BILEK

Oracle Décisionnel : Modèle OLAP et Vue matérialisée D BILEK Oracle Décisionnel : Modèle OLAP et Vue matérialisée SOMMAIRE Introduction Le modèle en étoiles Requêtes OLAP Vue matérialisée Fonctions Roll up et Cube Application Introduction Data Warehouse Moteur OLAP

Plus en détail

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles) SGBDR Systèmes de Gestion de Bases de Données (Relationnelles) Plan Approches Les tâches du SGBD Les transactions Approche 1 Systèmes traditionnels basés sur des fichiers Application 1 Gestion clients

Plus en détail

2 Serveurs OLAP et introduction au Data Mining

2 Serveurs OLAP et introduction au Data Mining 2-1 2 Serveurs OLAP et introduction au Data Mining 2-2 Création et consultation des cubes en mode client-serveur Serveur OLAP Clients OLAP Clients OLAP 2-3 Intérêt Systèmes serveurs et clients Fonctionnalité

Plus en détail

Entrepôts de données : Systèmes OLAP : ROLAP, MOLAP et OLAP (5) 1 Introduction aux systèmes

Entrepôts de données : Systèmes OLAP : ROLAP, MOLAP et OLAP (5) 1 Introduction aux systèmes Entrepôts de données : Systèmes : R, M et H (5) Bernard ESPINASSE Professeur à Aix-Marseille Université (AMU) Ecole Polytechnique Universitaire de Marseille Septembre 2013 Introduction aux systèmes Systèmes

Plus en détail

ETL Extract - Transform - Load

ETL Extract - Transform - Load ETL Extract - Transform - Load Concept général d analyse en ligne (rappels) Rémy Choquet - Université Lyon 2 - Master 2 IIDEE - 2006-2007 Plan Définitions La place d OLAP dans une entreprise OLAP versus

Plus en détail

Techniques d optimisation des requêtes dans les data warehouses

Techniques d optimisation des requêtes dans les data warehouses Techniques d optimisation des requêtes dans les data warehouses Ladjel Bellatreche LISI/ENSMA Téléport2-1, Avenue Clément Ader 86960 Futuroscope - FRANCE bellatreche@ensma.fr Résumé Un entrepôt de données

Plus en détail

Evry - M2 MIAGE Entrepôt de données

Evry - M2 MIAGE Entrepôt de données Evry - M2 MIAGE Entrepôt de données Introduction D. Ploix - M2 Miage - EDD - Introduction 1 Plan Positionnement du BI dans l entreprise Déclinaison fonctionnelle du décisionnel dans l entreprise Intégration

Plus en détail

Entrepôts de Données

Entrepôts de Données République Tunisienne Ministère de l Enseignement Supérieur Institut Supérieur des Etudes Technologique de Kef Support de Cours Entrepôts de Données Mention : Technologies de l Informatique (TI) Parcours

Plus en détail

SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...)

SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...) Avant-propos 1. À qui s'adresse ce livre? 15 2. Pré-requis 15 3. Objectifs du livre 16 4. Notations 17 Introduction à la Business Intelligence 1. Du transactionnel au décisionnel 19 2. Business Intelligence

Plus en détail

RÉPUBLIQUE ALGÉRIENNE DÉMOCRATIQUE ET POPULAIRE. Ministère de l Enseignement Supérieur et de la Recherche Scientifique I.N.I THEME : Les outils OLAP

RÉPUBLIQUE ALGÉRIENNE DÉMOCRATIQUE ET POPULAIRE. Ministère de l Enseignement Supérieur et de la Recherche Scientifique I.N.I THEME : Les outils OLAP RÉPUBLIQUE ALGÉRIENNE DÉMOCRATIQUE ET POPULAIRE Ministère de l Enseignement Supérieur et de la Recherche Scientifique I.N.I THEME : Les outils OLAP REALISE PAR : BENAKEZOUH Leïla & TIFOUS Amira Quatrième

Plus en détail

Chapitre IX. L intégration de données. Les entrepôts de données (Data Warehouses) Motivation. Le problème

Chapitre IX. L intégration de données. Les entrepôts de données (Data Warehouses) Motivation. Le problème Chapitre IX L intégration de données Le problème De façon très générale, le problème de l intégration de données (data integration) est de permettre un accès cohérent à des données d origine, de structuration

Plus en détail

Introduction à l Informatique Décisionnelle - Business Intelligence (7)

Introduction à l Informatique Décisionnelle - Business Intelligence (7) Introduction à l Informatique Décisionnelle - Business Intelligence (7) Bernard ESPINASSE Professeur à Aix-Marseille Université (AMU) Ecole Polytechnique Universitaire de Marseille Septembre 2013 Emergence

Plus en détail

La problématique. La philosophie ' ) * )

La problématique. La philosophie ' ) * ) La problématique!" La philosophie #$ % La philosophie &'( ' ) * ) 1 La philosophie +, -) *. Mise en oeuvre Data warehouse ou Datamart /01-2, / 3 13 4,$ / 5 23, 2 * $3 3 63 3 #, 7 Datawarehouse Data warehouse

Plus en détail

Datawarehouse and OLAP

Datawarehouse and OLAP Datawarehouse and OLAP Datawarehousing Syllabus, materials, notes, etc. See http://www.info.univ-tours.fr/ marcel/dw.html today architecture ETL refreshing warehousing projects architecture architecture

Plus en détail

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation Base de données S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Présentation du module Contenu général Notion de bases de données Fondements / Conception Utilisation :

Plus en détail

Théories de la Business Intelligence

Théories de la Business Intelligence 25 Chapitre 2 Théories de la Business Intelligence 1. Architectures des systèmes décisionnels Théories de la Business Intelligence Depuis les premières requêtes sur les sources de données OLTP consolidées

Plus en détail

Rejoignez la Communauté

Rejoignez la Communauté Rejoignez la Communauté MODÉLISATION DIMENSIONNELLE Le fondement du datawarehouse 2 MODÉLISATION DIMENSIONNELLE Le fondement du datawarehouse 3 QUI SOMMES NOUS? Jean-Pierre Riehl Pratice Manager SQL Azeo

Plus en détail

C-CUBE: Un nouvel opérateur d agrégation pour les entrepôts de données en colonnes

C-CUBE: Un nouvel opérateur d agrégation pour les entrepôts de données en colonnes C-CUBE: Un nouvel opérateur d agrégation pour les entrepôts de données en colonnes Khaled Dehdouh Fadila Bentayeb Nadia Kabachi Omar Boussaid Laboratoire ERIC, Université de Lyon 2 5 avenue Pierre Mendes-France,

Plus en détail

Introduction au domaine du décisionnel et aux data warehouses

Introduction au domaine du décisionnel et aux data warehouses Data warehouse Introduction au domaine du décisionnel et aux data warehouses http://dwh.crzt.fr STÉPHANE CROZAT Paternité - Partage des Conditions Initiales à l'identique : http://creativecommons.org/licenses/by-sa/2.0/fr/

Plus en détail

La place de la Géomatique Décisionnelle dans le processus de décision

La place de la Géomatique Décisionnelle dans le processus de décision Géomatique décisionnelle La place de la Géomatique Décisionnelle dans le processus de décision - Arnaud Van De Casteele Mines ParisTech - CRC Arnaud {dot} van_de_casteele {at} mines-paristech.fr Les rencontres

Plus en détail

SQL SERVER 2008, BUSINESS INTELLIGENCE

SQL SERVER 2008, BUSINESS INTELLIGENCE SGBD / Aide à la décision SQL SERVER 2008, BUSINESS INTELLIGENCE Réf: QLI Durée : 5 jours (7 heures) OBJECTIFS DE LA FORMATION Cette formation vous apprendra à concevoir et à déployer une solution de Business

Plus en détail

L information et la technologie de l informationl

L information et la technologie de l informationl L information et la technologie de l informationl CRM & informatique décisionnelled CRM CRM & informatique décisionnelle. d 1 2 3 Les Les fondements managériaux managériaux du du CRM. CRM. Les Les fondements

Plus en détail

Fournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement

Fournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement Introduction Phases du projet Les principales phases du projet sont les suivantes : La mise à disposition des sources Des fichiers Excel sont utilisés pour récolter nos informations L extraction des données

Plus en détail

Évolution de schémas dans les entrepôts de données mise à jour de hiérarchies de dimension pour la personnalisation des analyses

Évolution de schémas dans les entrepôts de données mise à jour de hiérarchies de dimension pour la personnalisation des analyses Évolution de schémas dans les entrepôts de données mise à jour de hiérarchies de dimension pour la personnalisation des analyses Thèse présentée par Cécile FAVRE pour obtenir le titre de Docteur en Informatique

Plus en détail

Mémoire de fin d études. Thème Conception et réalisation d un Data Warehouse pour la mise en place d un système décisionnel

Mémoire de fin d études. Thème Conception et réalisation d un Data Warehouse pour la mise en place d un système décisionnel Mémoire de fin d études Pour l obtention du diplôme d Ingénieur d Etat en Informatique Option : Systèmes d information Thème Conception et réalisation d un Data Warehouse pour la mise en place d un système

Plus en détail

UNIVERSITÉ MOHAMMED V AGDAL. FACULTÉ DES SCIENCES Rabat THÈSE DE DOCTORAT. Présentée par ELhoussaine ZIYATI Discipline : Sciences de l ingénieur

UNIVERSITÉ MOHAMMED V AGDAL. FACULTÉ DES SCIENCES Rabat THÈSE DE DOCTORAT. Présentée par ELhoussaine ZIYATI Discipline : Sciences de l ingénieur UNIVERSITÉ MOHAMMED V AGDAL FACULTÉ DES SCIENCES Rabat N d ordre 2491 THÈSE DE DOCTORAT Présentée par ELhoussaine ZIYATI Discipline : Sciences de l ingénieur Spécialité : Informatique et Télécommunications

Plus en détail

Bases de Données Avancées

Bases de Données Avancées 1/26 Bases de Données Avancées DataWareHouse Thierry Hamon Bureau H202 - Institut Galilée Tél. : 33 1.48.38.35.53 Bureau 150 LIM&BIO EA 3969 Université Paris 13 - UFR Léonard de Vinci 74, rue Marcel Cachin,

Plus en détail

OLAP : Mondrian + Pentaho. Maguelonne Teisseire Hugo Alatrista Salas hugo.alatrista- salas@teledetec9on.fr Flavien Bouillot

OLAP : Mondrian + Pentaho. Maguelonne Teisseire Hugo Alatrista Salas hugo.alatrista- salas@teledetec9on.fr Flavien Bouillot OLAP : Mondrian + Pentaho Maguelonne Teisseire Hugo Alatrista Salas hugo.alatrista- salas@teledetec9on.fr Flavien Bouillot Outils Open Source Mondrian : serveur OLAP JFreeReport : ou9l de «Repor9ng» KeHle

Plus en détail

25/05/2012. Business Intelligence. Plan de Présentation

25/05/2012. Business Intelligence. Plan de Présentation Business Intelligence Prof. Mourad Oubrich Plan de Présentation Définition de la BI Chaine de la valeur de la BI Marché de la BI Métiers de la BI Architecture de la BI Technologie SAP BI Les priorités

Plus en détail

L informatique décisionnelle

L informatique décisionnelle L informatique décisionnelle Thèse Professionnelle. Ce document est une thèse professionnelle dont la problématique est : Quelles sont les bonnes pratiques dans la mise en place d une solution décisionnelle

Plus en détail

Ministère de l Enseignement Supérieur et de la Recherche Scientifique. Ecole nationale Supérieure d Informatique (ESI) (Oued Semar, Alger) Mémoire

Ministère de l Enseignement Supérieur et de la Recherche Scientifique. Ecole nationale Supérieure d Informatique (ESI) (Oued Semar, Alger) Mémoire Ministère de l Enseignement Supérieur et de la Recherche Scientifique Ecole nationale Supérieure d Informatique (ESI) (Oued Semar, Alger) École Doctorale Sciences et Technologies de l'information et de

Plus en détail

Introduction à la modélisation dimensionnelle

Introduction à la modélisation dimensionnelle Introduction à la modélisation dimensionnelle Data warehouse http://dwh.crzt.fr Paternité - Partage des Conditions Initiales à l'identique : http://creativecommons.org/licenses/by-sa/4.0/fr/ 11 février

Plus en détail

Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours

Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours Information du cours Informatique décisionnelle et data mining www.lia.univ-avignon.fr/chercheurs/torres/cours/dm Juan-Manuel Torres juan-manuel.torres@univ-avignon.fr LIA/Université d Avignon Cours/TP

Plus en détail

Introduction à lʼinformatique. Décisionnelle (ID) / Business. Intelligence» (1)

Introduction à lʼinformatique. Décisionnelle (ID) / Business. Intelligence» (1) Introduction à lʼinformatique Décisionnelle et la «Business Intelligence» (1) Bernard ESPINASSE Professeur à Aix-Marseille Université (AMU) Ecole Polytechnique Universitaire de Marseille Septembre 2013

Plus en détail

Fonctionnalités des différentes éditions de SQL Server 2012

Fonctionnalités des différentes éditions de SQL Server 2012 Fonctionnalités des différentes éditions de SQL Server 2012 Cette rubrique décrit les s prises en charge par les versions de SQL Server 2012. Toutes les s de SQL Server 2008 R2 sont disponibles dans les

Plus en détail

Introduction aux entrepôts de données (2)

Introduction aux entrepôts de données (2) Introduction aux entrepôts de données (2) Bernard ESPINASSE Professeur à Aix-Marseille Université (AMU) Ecole Polytechnique Universitaire de Marseille Septembre 2013 Introduction et définition dʼun entrepôt

Plus en détail

Bases de données cours 4 Construction de requêtes en SQL. Catalin Dima

Bases de données cours 4 Construction de requêtes en SQL. Catalin Dima Bases de données cours 4 Construction de requêtes en SQL Catalin Dima Requêtes SQL et langage naturel Énoncés en langage naturel. Traduction en SQL? Correspondance entre syntagmes/phrases et opérations

Plus en détail

1. LA GESTION DES BASES DE DONNEES RELATIONNELLES

1. LA GESTION DES BASES DE DONNEES RELATIONNELLES Dossier G11 - Interroger une base de données La base de données Facturation contient tout un ensemble d'informations concernant la facturation de la SAFPB (société anonyme de fabrication de produits de

Plus en détail

Bases de Données relationnelles et leurs systèmes de Gestion

Bases de Données relationnelles et leurs systèmes de Gestion III.1- Définition de schémas Bases de Données relationnelles et leurs systèmes de Gestion RAPPELS Contraintes d intégrité sous Oracle Notion de vue Typage des attributs Contrainte d intégrité Intra-relation

Plus en détail

Big Data On Line Analytics

Big Data On Line Analytics Fdil Fadila Bentayeb Lb Laboratoire ERIC Lyon 2 Big Data On Line Analytics ASD 2014 Hammamet Tunisie 1 Sommaire Sommaire Informatique décisionnelle (BI Business Intelligence) Big Data Big Data analytics

Plus en détail

Rapport de DEA. Intégration de versions fonctionnelles dans les entrepôts de données multimédias au sein des systèmes OLAP. Anne-Muriel ARIGON

Rapport de DEA. Intégration de versions fonctionnelles dans les entrepôts de données multimédias au sein des systèmes OLAP. Anne-Muriel ARIGON Rapport de DEA Intégration de versions fonctionnelles dans les entrepôts de données multimédias au sein des systèmes OLAP Anne-Muriel ARIGON LIRIS INSA de Lyon Bâtiment 501 69621 Villeurbanne, France Encadré

Plus en détail

Le Géodécisionnel. P7 : Projet Bibliographique Dans le cadre du Mastère ASIG. Les SIG au service du géodécisionnel.

Le Géodécisionnel. P7 : Projet Bibliographique Dans le cadre du Mastère ASIG. Les SIG au service du géodécisionnel. P7 : Projet Bibliographique Dans le cadre du Mastère ASIG Le Géodécisionnel Les SIG au service du géodécisionnel Thierry Lallemant 15 Mai 2008 Mastère ASIG / Projet Bibliographique 2008 1 TABLE DES MATIERES

Plus en détail

CONSERVATOIRE NATIONAL DES ARTS ET METIERS CENTRE REGIONAL ASSOCIE DE BOURGOGNE MEMOIRE. présenté en vue d'obtenir le DIPLOME D'INGENIEUR C.N.A.M.

CONSERVATOIRE NATIONAL DES ARTS ET METIERS CENTRE REGIONAL ASSOCIE DE BOURGOGNE MEMOIRE. présenté en vue d'obtenir le DIPLOME D'INGENIEUR C.N.A.M. CONSERVATOIRE NATIONAL DES ARTS ET METIERS CENTRE REGIONAL ASSOCIE DE BOURGOGNE MEMOIRE présenté en vue d'obtenir le DIPLOME D'INGENIEUR C.N.A.M. SPECIALITE : INFORMATIQUE OPTION : SYSTEMES D INFORMATION

Plus en détail

SQL Server 2014. SQL Server 2014. Implémentation d une solution. Implémentation d une solution de Business Intelligence.

SQL Server 2014. SQL Server 2014. Implémentation d une solution. Implémentation d une solution de Business Intelligence. Ce livre sur s adresse à toutes les personnes désireuses de mettre en œuvre les techniques de l informatique décisionnelle (ou BI, Business Intelligence) à l aide des composants de la suite Microsoft :

Plus en détail

Objectif. Participant. Prérequis. Oracle BI Suite EE 10g R3 - Développer des référentiels. 5 Jours [35 Heures]

Objectif. Participant. Prérequis. Oracle BI Suite EE 10g R3 - Développer des référentiels. 5 Jours [35 Heures] Objectif Utiliser les techniques de gestion de la mise en cache pour contrôler et améliorer les performances des requêtes Définir des mesures simples et des mesures calculées pour une table de faits Créer

Plus en détail

Compétences Business Objects - 2014

Compétences Business Objects - 2014 Compétences Business Objects - 2014 «Mars-Juin 2014. Réf : Version 1 Page 1 sur 34 Sommaire CONTEXTE DE LA REMISE A NIVEAU EN AUTOFORMATION... 3 1. MODELISATION... 4 1.1 DESCRIPTION FONCTIONNEL DE L'APPLICATION

Plus en détail

Skills Technology Software PARTENAIRE TECHNOLOGIQUE DE VOTRE DÉVELOPPEMENT

Skills Technology Software PARTENAIRE TECHNOLOGIQUE DE VOTRE DÉVELOPPEMENT Skills Technology Software w w w.s PARTENAIRE TECHNOLOGIQUE DE VOTRE DÉVELOPPEMENT ka ty s. co m E U OG ION L TA AT A C RM FO Accélérateur de votre RÉUSSITE 2 Formation Aujourd hui, la formation constitue

Plus en détail

Présentation du module Base de données spatio-temporelles

Présentation du module Base de données spatio-temporelles Présentation du module Base de données spatio-temporelles S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Partie 1 : Notion de bases de données (12,5h ) Enjeux et principes

Plus en détail

CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2012

CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2012 CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE Edition 2012 AGENDA Qui sommes nous? Présentation de Keyrus Keyrus : Expert en formations BI Nos propositions de formation 3 modes de formations Liste des

Plus en détail

Construction d un EDD avec SQL 2008 R2. D. Ploix - M2 Miage - EDD - Création

Construction d un EDD avec SQL 2008 R2. D. Ploix - M2 Miage - EDD - Création Construction d un EDD avec SQL 2008 R2 Plan Analyse du DW construit Construction de la base DW dans SQL 2008 Construction des tables de faits et dimensions Injection des données Étapes de l injection des

Plus en détail

Eduardo Almeida. Master Alma Université de Nantes {eduardo.almeida@univ-nantes.fr}

Eduardo Almeida. Master Alma Université de Nantes {eduardo.almeida@univ-nantes.fr} Data Warehouse - OLAP Master Alma Université de Nantes {eduardo.almeida@univ-nantes.fr} Objectif Présenter les concepts de base d'un Data Warehouse (DW) et On Line Analytical Processing (OLAP). Présenter

Plus en détail

Sécurité des entrepôts de données dans le Cloud Un SaaS pour le cryptage des données issues d un ETL

Sécurité des entrepôts de données dans le Cloud Un SaaS pour le cryptage des données issues d un ETL Sécurité des entrepôts de données dans le Cloud Un SaaS pour le cryptage des données issues d un ETL Présenté par Hana Gara Kort Sous la direction de Dr Jalel Akaichi Maître de conférences 1 1.Introduction

Plus en détail

BUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise

BUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise BUSINESS INTELLIGENCE Une vision cockpit : utilité et apport pour l'entreprise 1 Présentation PIERRE-YVES BONVIN, SOLVAXIS BERNARD BOIL, RESP. SI, GROUPE OROLUX 2 AGENDA Définitions Positionnement de la

Plus en détail

NF26 Data warehouse et Outils Décisionnels Printemps 2010

NF26 Data warehouse et Outils Décisionnels Printemps 2010 NF26 Data warehouse et Outils Décisionnels Printemps 2010 Rapport Modélisation Datamart VU Xuan Truong LAURENS Francis Analyse des données Avant de proposer un modèle dimensionnel, une analyse exhaustive

Plus en détail

Atelier Symposium MicroStrategy

Atelier Symposium MicroStrategy Atelier Symposium MicroStrategy Présentation de Soft Computing «De l'usage de MicroStrategy pour la Connaissance Client dans le secteur de la Distribution» G.MANGEON Soft Computing 16 Juin 2016 Soft Computing

Plus en détail

Didier MOUNIEN Samantha MOINEAUX

Didier MOUNIEN Samantha MOINEAUX Didier MOUNIEN Samantha MOINEAUX 08/01/2008 1 Généralisation des ERP ERP génère une importante masse de données Comment mesurer l impact réel d une décision? Comment choisir entre plusieurs décisions?

Plus en détail

Intégration de données hétérogènes et réparties. Anne Doucet Anne.Doucet@lip6.fr

Intégration de données hétérogènes et réparties. Anne Doucet Anne.Doucet@lip6.fr Intégration de données hétérogènes et réparties Anne Doucet Anne.Doucet@lip6.fr 1 Plan Intégration de données Architectures d intégration Approche matérialisée Approche virtuelle Médiateurs Conception

Plus en détail

Entrepôts de données multidimensionnelles NoSQL

Entrepôts de données multidimensionnelles NoSQL Entrepôts de données multidimensionnelles NoSQL Max Chevalier, Mohammed El Malki, Arlind Kopliku, Olivier Teste, Ronan Tournier Université de Toulouse, IRIT UMR 5505, Toulouse, France http://www.irit.fr

Plus en détail

Option OLAP d'oracle Database 10g

Option OLAP d'oracle Database 10g Option OLAP d'oracle Database 10g Quand utiliser l'option OLAP pour améliorer le contenu et les performances d'une application de Business Intelligence Livre blanc Oracle Juin 2005 Option OLAP d'oracle

Plus en détail

SWISS ORACLE US ER GRO UP. www.soug.ch. Newsletter 5/2014 Sonderausgabe. OBIF DB licensing with VMware Delphix 12c: SQL Plan / Security Features

SWISS ORACLE US ER GRO UP. www.soug.ch. Newsletter 5/2014 Sonderausgabe. OBIF DB licensing with VMware Delphix 12c: SQL Plan / Security Features SWISS ORACLE US ER GRO UP www.soug.ch Newsletter 5/2014 Sonderausgabe OBIF DB licensing with VMware Delphix 12c: SQL Plan / Security Features 42 TIPS&TECHNIQUES Alexandre Tacchini, Benjamin Gaillard, Fabien

Plus en détail

UML et les Bases de Données

UML et les Bases de Données CNAM UML et les Bases de Données UML et les Bases de Données. Diagramme de classes / diagramme d objets (UML)...2.. Premier niveau de modélisation des données d une application...2.2. Les éléments de modélisation...2.2..

Plus en détail

Présentations personnelles. filière IL

Présentations personnelles. filière IL Présentations personnelles filière IL Résumé Liste de sujets de présentations personnelles. Chaque présentation aborde un sujet particulier, l'objectif étant que la lecture du rapport ainsi que l'écoute

Plus en détail

Ecole des Hautes Etudes Commerciales HEC Alger. par Amina GACEM. Module Informatique 1ière Année Master Sciences Commerciales

Ecole des Hautes Etudes Commerciales HEC Alger. par Amina GACEM. Module Informatique 1ière Année Master Sciences Commerciales Ecole des Hautes Etudes Commerciales HEC Alger Évolution des SGBDs par Amina GACEM Module Informatique 1ière Année Master Sciences Commerciales Evolution des SGBDs Pour toute remarque, question, commentaire

Plus en détail

Bases de Données OLAP

Bases de Données OLAP Bases de Données OLAP Hiver 2013/2014 Melanie Herschel melanie.herschel@lri.fr Université Paris Sud, LRI Chapitre 1 Introduction Détails administratifs Entrepôts de Données Perspective sur le semestre

Plus en détail

Les bases de données Page 1 / 8

Les bases de données Page 1 / 8 Les bases de données Page 1 / 8 Sommaire 1 Définitions... 1 2 Historique... 2 2.1 L'organisation en fichier... 2 2.2 L'apparition des SGBD... 2 2.3 Les SGBD relationnels... 3 2.4 Les bases de données objet...

Plus en détail

Département Génie Informatique

Département Génie Informatique Département Génie Informatique BD51 : Business Intelligence & Data Warehouse Projet Rédacteur : Christian FISCHER Automne 2011 Sujet : Développer un système décisionnel pour la gestion des ventes par magasin

Plus en détail

Business & High Technology

Business & High Technology UNIVERSITE DE TUNIS INSTITUT SUPERIEUR DE GESTION DE TUNIS Département : Informatique Business & High Technology Chapitre 8 : ID : Informatique Décisionnelle BI : Business Intelligence Sommaire Introduction...

Plus en détail

Business Intelligence avec SQL Server 2012

Business Intelligence avec SQL Server 2012 Editions ENI Business Intelligence avec SQL Server 2012 Maîtrisez les concepts et réalisez un système décisionnel Collection Solutions Informatiques Extrait Alimenter l'entrepôt de données avec SSIS Business

Plus en détail

Business Intelligence Reporting

Business Intelligence Reporting Maître de stage : Claude Bordanave Sirinya ON-AT Année 2011 / 2012 Master1 Informatique Université Bordeaux 1 SOMMAIRE REMERCIEMENTS...4 INTRODUCTION...4 I) PRESENTATION DE L ENTREPRISE... 5 1) Raison

Plus en détail

CONCEPTION ET REALISATION D'UN GENERATEUR DE TABLEAUX DE BORD PROSPECTIFS MULTIDIMENSIONNELS

CONCEPTION ET REALISATION D'UN GENERATEUR DE TABLEAUX DE BORD PROSPECTIFS MULTIDIMENSIONNELS CONCEPTION ET REALISATION D'UN GENERATEUR DE TABLEAUX DE BORD PROSPECTIFS MULTIDIMENSIONNELS Nazih Selmoune (*), Zaia Alimazighi (*) Selmoune@lsi-usthb.dz, Alimazighi@wissal.dz (*) Laboratoire des systèmes

Plus en détail

République Algérienne Démocratique et Populaire

République Algérienne Démocratique et Populaire République Algérienne Démocratique et Populaire Ministère de l Enseignement Supérieur et de la Recherche Scientifique Institut National de formation en Informatique Direction de la Post-Graduation et de

Plus en détail

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données et le Data Mining Nous suivons le plan suivant : Fonctionnement de Spad Catalogue des méthodes (statistiques

Plus en détail

Structure fonctionnelle d un SGBD

Structure fonctionnelle d un SGBD Fichiers et Disques Structure fonctionnelle d un SGBD Requetes Optimiseur de requetes Operateurs relationnels Methodes d acces Gestion de tampon Gestion de disque BD 1 Fichiers et Disques Lecture : Transfert

Plus en détail