Les ntrepôts de onnées. (Data Warehouses) La Modélisation
|
|
- Jean-Bernard Renaud
- il y a 8 ans
- Total affichages :
Transcription
1 Les ntrepôts de onnées (Data Warehouses) La Modélisation 1 Les$Faits La$défini-on$ Unfaitestlapluspe-teinforma-onanalysable.C'estuneinforma-onqui con-entlesdonnéesobservables(les$faits)quel'onpossèdesurunsujetet quel'onveutétudier,selondiversaxesd'analyse(les$dimensions). Les«faits»dansunentrepôtdedonnées,sontnormalementnumériques, puisqued'ordrequan-ta-f.ilpeuts'agirdumontant-en-argent-des-ventes,du nombre-d'unités-vendues-d'un-produit,etc. 2
2 Les$Faits$$(suite) La$défini-on$(suite)$ Lesfaitsreprésententdesassocia-onsdontl'existenced'uneoccurrencedépenddel'existence desoccurrencescorrespondantesparmilesdescripteursdimensionnels. C'estGàGdire, la ''table'' de faits con-ent l'ensemble des mesures correspondant aux informa-onsdel'ac-vitéàanalyser. Mais$certaines$tables$de$faits$peuvent$ne$contenir$aucun$a;ribut$et$représentent$des$liaisons$ entre$tables$dimensionnelles. Touslesélémentsquipointentsurlatabledefaitssontliésàuneséman-queexprimablepar unephrase.parconséquent,la''table''defaitsestlamatérialisa-ond'uneassocia-onentren en-tés. 3 Les$Faits$(suite) Structure$de$base$d'une$''table''$de$faits$$ Une''table''defaitsdevraitavoirlastructuresuivante: Date%cal.%(FK) Clef%étrangères%vers%les%dimensions Dimensions%dégénérées Mesures% Id%Dim 1 %(FK) Id%Dim 2 %(FK) Id%Dim n %(FK) Code%Dim%Dég%1%(DD) Code%Dim%Dég%2%(DD) Code%Dim%Dég%m%(DD) Mesure%1 Mesure%2 Mesure%n 4
3 Les$Faits$(suite) Caractéris-ques$d'une$''table''$des$faits$ Une''table''defaitscon-entlesvaleursnumériquesdecequ'ondésiremesurer Une''table''defaitscon-entlesclésassociéesauxdimensions.Ils'agitdeclésétrangèresvers lesdimensions Engénéralune''table''defaitscon-entunpe-tnombredecolonnes Une''table''defaitscon-entplusd'enregistrementsqu'une''table''dedimension Lesinforma-onsdansune''table''defaitssontcaractérisées: " Ellessontnumériquesetsontu-liséespourfairedesSUM,-AVG... " Lesdonnéesdoiventêtreaddi-vesousemiGaddi-ves Lesmesures(Mes 1,-Mes 2 - -Mes n )doiventréféreretavoirunliendirectaveclesclésdesdimensions(date-cal,-id- Dim 1,-- Id-Dim 2-,-...,-Id-Dim n- )danslamêmetable. 5 Les$Faits$(suite) Exemple$d'une$''table''$de$faits$ VENTES$ Id_Cde Id_Client Id_Vendeur Id_Produit Id_Date Id_Ville 5 Quantité Prix5Total 5 Clef$ (clés étrangères vers les dimensions) Mesures$ 6
4 Dimension La$défini-on$ # Unedimensionestune''table''quireprésenteunaxe$d'analyse$selonlequelonveut étudier des données observables (les$ faits) qui, soumises à une analyse mul-dimensionnelle, donnent aux u-lisateurs des renseignements nécessaires à la prise dedécision. # Onappelledonc''dimension''unaxed'analyse.Ilpeuts'agirdesClientsoudesProduits d'une entreprise, d'une Période de temps comme un exercice financier, des ac-vités menéesauseind'unesociété,etc. 7 Dimension$$(suite) Structure de base d'une dimension Une dimension devrait avoir la structure suivante : Clé(de(substitution((Surrogate(key) Clé(primaire((PK) Clé(d'affaire((natural(key(ou(buisness( key)((peut_être(composée(de(plusieurs( attributs Clé(naturelle((NK) Attributs(de(la(dimension Attribut 1 (((.(.(. Attribut n Clés(spéciales(pour(la(gestion(de( l'historique(de(la(dimension Date(effective Date(de(retrait Indicateur(effectif 8
5 Dimension$$(suite) Caractéris-ques$d'une$dimension$ # Une"table''dedimensioncon-entledétailsurlesfaits # Une''table''dedimensioncon-entlesinforma-onsdescrip-vesdesvaleursnumériquesdelatable desfaits # Vuquelesdonnéesdansla''table''dedimensionsontnormalisées,ellecon-entunplusgrand nombredecolonnes # Une''table''dedimensioncon-entengénéralbeaucoupmoinsd'enregistrementsqu'une''table'' desfaits # LesaSributsd'une''table''dedimensionsontsouventu-liséscomme«Tête-de-lignes»et«Tête-decolonne»dansunrapportourésultatderequête. 9 Dimension$D$composantes Composante$1:surrogate-key--ouclédesubs-tu-on Composantes$2$:aSributs Composantes$3$:clésspéciales 10
6 Dimension$ $composantes$(suite) Composante$1$:$surrogate$key$$ou$clé$de$subs-tu-on$ $Exemple Dim.%PRODUIT Id#Produit Nom#Produit Description#Produit Sous3catégorie Famille#Produit Description#Catégorie Surrogate$Clef$ (clé de substitution ) Clef$naturelle$ (clé artificielle)$ PRODUIT Code_Produit Désignation Description33 Prix3unitaire. Prix#unitaire - Table d'une BD de production - Table d'une BD multidimensionnelle 11 Dimension$ $composantes$(suite) Composante$1$:$surrogate$key$$ou$clé$de$subs-tu-on$ $La$Défini-on$ Uneclédesubs-tu-on(Surrogate-key)estuneclénonsignifica-veu-liséeafindesubs-tuerla clénaturelle(business-key)quiprovientdessystèmesopéra-onnels. Laclénaturelleest,engénéral,composéedeplusieurscolonnes. Dansunsystèmeopéra-onnel,onu-liseunecléar-ficielleafind'iden-fierd'unefaçonuniqueun élémentdel'en-té:(client_idpourl'en-téclient,emp_idpourl'en-téemployé). Laclédesubs-tu-onnedoitpasêtreconfondueaveclacléar-ficielleaSribuéeparlessystèmes opéra-onnels. Laclédesubs-tu-onestalorsu-liséedansunentrepôtdedonnéespourremplaceretcompléter lacléar-ficielledusystèmeopéra-onnelafinderendreunélémentuniquedansladimension. 12
7 Dimension$ $composantes$(suite) Composante$1$:$surrogate$key$$ou$clé$de$subs-tu-on$ Les$Fonc-onnalités$$ # Remplacer$ la$ clé$ ar-ficielle$ ou$ naturelle$:$effec-vement une clé de subs-tu-on remplacelacléar-ficielleentermed'u-lisa-on,cen'estpluslaclénaturellequiserau-liséepour fairelesjointuresaveclestablesdefaitsetlesautrestablesdedimension. # Compléter$l'informa-on$:$Laclédesubs-tu-onn'aaucunsensentermed'affaire,elleest u-liséedansl'edseulement La clé ar-ficielle ou naturelle dans la dimension est toujours nécessaire pour pouvoir faire la correspondanceentrel'élémentdedimension(unclientparexemple)dansl'edetl'élémentdela tabledesclientsdanslesystèmeopéra-onnel. 13 Dimension$ $composantes$(suite) Composante$1$:$surrogate$key$$ou$clé$de$subs-tu-on$ Les$avantages$ $$$ # Performance : Accélère l'accès aux données du moment ou l'on va u-liser un index numériquevuqueletypededonnéesdelaclédesubs-tu-onestnumérique. # Indépendance$du$système$source:Onnepeutgaran-rquelacléd'affairenechangepas danslessystèmessources. # Historique$ des$ changements$ et$ granularité$ infinie: Si l'on désire garder l'historique des changementsdeladimensionseloncertainscritères,ondoitgérerlaclédesubs-tu-on.onse retrouve facilement avec plusieurs enregistrements de la même clé d'affaire dans la dimension. 14
8 Dimension$ $composantes$(suite) Composantes$2$$$:$$$a;ributs$$ Enplusdelaclédesubs-tu-onoudelaclénaturelle,d'autresaSributssontajoutésàladimension. CesaSributssontdescrip-fsetreprésentel'informa-onu-lesurladimension(Le-salaire-d'unemployé,-l'adresse-d'un-client...) Dim.%PRODUIT Surrogate$Clef$ (clé de substitution ) Id#Produit Nom#Produit Description#Produit A;ributs$ (descripteurs ) Sous3catégorie Famille#Produit Description#Catégorie Prix#unitaire 15 Dimension$ $composantes$(suite) Composantes$3$$$:$$$clés$spéciales$$ Date$effec-ve:Dateàlaquellel'enregistrementàétécréé,depréférencedanslesystèmed'enregistrements (Systemofrecords). Date$retrait:Dateàlaquellel'enregistrementaétére-rédusystèmed'enregistrements. Indicateur$effec-f:Engénéralest'O'sil'enregistrementesttoujoursac-f(Dateretraitestnulle),'N'sinon. Dim.%PRODUIT Id#Produit Nom#Produit Description#Produit Sous3catégorie Famille#Produit Description#Catégorie Prix#unitaire date#effective Date#retrait Indicateur#effectif 16 Surrogate$Clef$ (clé de substitution ) A;ributs$$(descripteurs ) Clés$spéciales
9 Différents$types$de$dimensions$ Dimension$dégénérée$(Degenerate/dimension)$$ Ladimension$dégénérée$estuneclédedimensiondansla''table''defaitsquiestengénéral sansasribut. Exemple:N -de-bon-de-cde,n -d'interruppon-de-service... Vu qu'il s'agit d'une seule clé de dimension, nous évitons alors de créer une ''table'' de dimension,cequifaitquecese''table''dedimensionadégénérédansla''table''desfaits:c'est pourceseraisonquecesecléestappelée«dimensiondégénérée» 17 Différents$types$de$dimensions$ Dimension$dégénérée$(Degenerate/dimension)$$ La dimension$ dégénérée$ est une clé de dimension dans la ''table'' de faits qui est en généralsansasribut. Exemple:No-de-bon-de-Cde,No-d'interrupPon-de-service... 18
10 Différents$types$de$dimensions$(suite) Junk$dimension$ Ladimensiondegenre«Junk/dimension/»estunedimensionquicon-enttoutessortede flags,statuts,codesquinefontpar-ed'aucunedimensionrégulière. Dansledomainedeladistribu-ondel'énergie,uneinterrup-ondeservicepeutêtrede type«basse-tension»ou«moyenne-tension». Cegenredecodeestdoncstockédansunetablespécialeappelée «Junk-dimension». 19 Différents$types$de$dimensions$(suite) Dimension$à$évolu-on$lente$(SCD/:/Slowly/Changing/Dimension)$ Unedimensionpeutsubirdeschangementsdedescrip-ondesmembres Unclientpeutchangerd'adresse,semarier,... Unproduitpeutchangerdenoms,deformula-ons; exemple:«tree's»en«m&m»;«raider»en«twix»;«yaourt-à-la-vanille»en«yaourt-saveur- Vanille» CeSesitua-onpeutGêtregéréeenchoisissantentre3solu-ons: Écrasementdel'anciennevaleur Versionnement Valeurd'origine/valeurcourante - Remarque-:-Danscertaincaslatransi-onn'estpasimmédiate:ilrestependantuncertaintemps desanciensproduitsenrayon.ilestalorsconseillédelestraitercommedeuxmembres différents. 20
11 Différents$types$de$dimensions$(suite) Dimension$à$évolu-on$rapide$(RCD/:/Rapid/Changing/Dimension)$ Unedimension$à$changement$rapideestunedimensionquisubitdeschangementstrèsfréquents desasributsdontonveutpréserverl'historique. Solution: isoler les attributs qui changent rapidement Exemple:Sil'onveutpréserverl'historiquedeschangementsd'adressedansladimension «Clients»dansunpaysoù70%delapopula-ondéménageunefoisparannée(le1 ier juilletpar exempleaucanada), Ladimension«Clients»devientdanscecasunedimensionàévolu-onrapide(RCD) 21 Différents$types$de$dimensions$(suite) Dimension$à$évolu-on$rapide$(RCD/:/Rapid/Changing/Dimension)$ 22
12 Différents$types$de$dimensions$(suite) Dimension$causale$(Causal/dimension)$ Ils'agitd'unedimensionquiprovoquedesfaits. Exemple:ladimension«Promo=on»peutengénéralprovoquerdesventes Autre exemple dans le domaine de la distribu-on de l'énergie la dimension «CondiPonclimaPque»peutprovoquerdes«InterrupPons-de-service».Ladimension«CondiPon-climaPque» estdoncune$dimension$causale. 23 Différents$types$de$dimensions$(suite) Dimension$conforme$(Conformed/dimension)$ Unedimension$conformeoupartagéeestunedimensionu-liséeparlesfaitsdeplusieurs datamarts. Exemple:ladimension«Produit»estu-liséepardifférentsdatamarts«Finance»,«Marke-ng» 24
13 Différents$types$de$dimensions$(suite) Mini$dimension$ $ Danstoutentrepôtdedonnées,ilexisteaumoinsunegrandedimension,quecesoitenterme d'enregistrementsoud'asributs. - Exemple:Ladimension«Clients»peutcontenirdesmillionsd'enregistrements.Leplussouvent, ongèrel'évolu-onlente(voirmêmel'évolu-onrapide)surcegenrededimensionce quiaugmenteencoreplusleurstailles. Unmoyenderéduirelatailledecegenrededimensionestsoitderecouriràlatechniquede «flocondeneige»siladimensionesthiérarchique,soitdecréerunemini$dimension,quicon-ent touslesasributssurlesquelsongèrel'évolu-onlente. 25 Différents$types$de$dimensions$(suite) Mini$dimension$ $ Exemple:Ladimension«Clients»d'unsystèmededistribu-ond'énergiecon-entplusieursmillions d'enregistrements,dontlesasributssont: $ IDclient(Iden-fiantduclient,surrogatekey) $ Codeduclient(Lacléd'affaireduclient,provenantdusystèmesource) $ Nomduclient. $ Adresseduclient. $ Transformateurassocié.(transformateurélectriquequialimenteleclient) $ Codeincidence(coded'incidenceduclient:MapourMajeur,MopourMoyen,Mipourmineur,GepourGrande Entrepris) $ 26
14 Différents$types$de$dimensions$(suite) Mini$dimension$ Supposonsquepourdesbesoinsd'affaires,lesu-lisateursdécidentdepréserverl'historiquedes changementsdesasributssuivants:«transformateur-associé»et«code-d'incidence». Nouscréonsdoncuneminidimensionquicon-entlescolonnessuivantes: $ IDSCDClient $ Transformateurassocié $ Coded'incidence Etdansladimension«Clients»,nousajoutonsunenouvelleclédedimension«ID-SCD-client»pour fairelelienentreladimension«clients»etlaminigdimension «SCD-Client» - Remarque:ladimension«Clients»con-nuedecontenirtouslesaSributsmêmeceuxsurlesquelsnous géronsl'évolu-onlente. 27 La$Modélisa-on$Mul-dimensionnelle La$modélisa-on$en$3FN$Vs$La$Modélisa-on$mul-dimensionnelle$: Dimension(TEMPS Dimension(MAGASIN ID#Temps ID#Magasin Description Description FAITS Année Ville ID#Magasin Provincr ID#Prrpoduit ID#Temps#(Date#Cde) ID#Client ID#Client#Demog Dimension(Démogrphie(Client Dimension(PRODUIT ID#Prrpoduit NomProduit TypeProduit DescProduit ID#Categorie DescCategorie Ventes Profits ID#Clien#Demog Id#Client Date Attributs#client Dimension(CLIENT ID#Client Nom 28
15 La$Modélisa-on$Mul-dimensionnelle " Lemodèlemul-dimensionneln'adhèrepaslarègledela3FN,enapla-ssanttouslesniveauxdela dimension. Dansnotreexemple,la''table''«Produit»estapla-eetlesniveauxTypeProduit,IdCategoriesont avectouslesasributsdanslamême''table''dedimension«produit». " Ilviolelarègledelale2FNdanslatabledesfaits. LacolonneId-Temps-(Date-Cde)-faitpar-edelacommandeetestreprisedanslatabledesfaits. " IlnesuitpaslarègledeBCFN(Boyce[Codd-normal-form)enpermeSantlaredondancedes données. Toutcommedanslatable«Client»etlaminidimension«Démographie-client». 29 La$Modélisa-on$Mul-dimensionnelle " Ilexiste3formesdemodèlesmul-dimensionnels: 1. Lemodèleenétoile(Star-schema) 2. Lemodèleenflocondeneige(Snowflake-schema) 3. Lemodèleenconstella-on(Fac`lake-schema) 30
16 Le$modèle$en$étoile$ PRODUIT COMMANDE N Cde Date Cde Code produit Nom Produit Description Produit TABLE DE FAITS Catégorie CLIENT N Client Nom Client Adresse Client Ville VENDEUR Code vendeur Nom Vendeur Ville Vendeur Quota N Cde N Client Code vendeur Code produit Clef date Nom Ville Quantité Prix total Description catégorie Prix unitaire DATE Clef date Date Mois Année VILLE Nom Ville Région Pays 31 Le$modèle$en$étoile$ % Une''table''$de$faits$:iden-fiantsdestablesdedimension;uneouplusieursmesures % Plusieurstables$de$dimension:descripteursdesdimensions Unegranularitédéfinieparlesiden-fiantsdanslatabledesfaits. Avantages/://// Facilitédenaviga-on Performances:nombredejointureslimité;ges-ondesdonnéescreuses. Ges-ondesagrégats Fiabilitédesrésultats Inconvénients/:/ Touteslesdimensionsneconcernentpaslesmesures Redondancesdanslesdimensions Alimenta-oncomplexe. 32
17 Propriétés$des$mesures$ Addi-vité:somme sur toutes les dimensions Quantités vendues, chiffre d affaire Peut être le résultat d un calcul Bénéfice = montant vente coût SemiDaddi-vité:somme sur certaines dimensions Solde d un compte bancaire Pas de sens d additionner les dates car cela représente des instantanés d un niveau Σ sur les comptes: on connaît ce que nous possédons en banque Non$addi-f$: fait non additionnable quelque soit la dimension Prix unitaire: l addition sur n importe quelle dimension donne un nombre dépourvu de sens 33 Exemples$de$modèles$mul-dimensionnels$$$ $Dans$la$grande$distribu-on$: Quelques''tables''defaits:détailléesetvolumineuses ''Tables''dedimensions: Classiques:Produit,--Fournisseur,--Temps,--Etablissement-(structuregéographique,fonc-onnelle)... Stratégiques:Client,-PromoPons, - Remarque-:Obtenirleplusd'enregistrementspossibles. $Dans$le$secteur$des$banques$: ''Tables''desfaits:nombreuses,dédiéesàchaqueproduit,peudétailléesetpeuvolumineuses. ''Tables''dedimensions: Classiques:Produit,--Temps,--Etablissement-(structuregéographique,fonc-onnelle)... Stratégiques:Client,... Remarque-:-Obtenirleplusdedonnées(champs)possibles. 34
18 Le modèle en flocons de neige Le modèle de l' ED doit être simple à comprendre. On peut augmenter sa lisibilité en regroupant certaines dimensions. On définit ainsi des hiérarchies. Celles-ci peuvent être géographiques ou organisationnelles. Exemple : Commune, Département, Région, Pays, Continent Client Commune Département Region Pays Continent Pepone Lyon 1 Rhône Rhône-Alpes France Europe Testut Lyon 2 Rhône Rhône-Alpes France Europe Soinin Lyon 3 Rhône Rhône-Alpes France Europe Vepont Paris 1 Paris Ile-de-France France Europe Martin Paris 2 Paris Ile-de-France France Europe Elvert Versailles Yvelines Ile-de-France France Europe 35 Le modèle en flocons de neige PRODUIT COMMANDE Code produit N Cde Nom Produit Date Cde PRODUIT Description Produit CATEGORIE COMMANDE TABLE DE FAITS Code produit Catégorie Catégorie N Cde N Cde Nom Produit Description catégorie Desc. Cat Date Cde Desc. Produit CLIENT N Client Prix unitaire TABLE DE FAITS Catégorie N Client Code vendeur N Cde Prix unitaire CLIENTNom Client N Client Code produit DATE N Client Adresse ClientCode vendeur Clef date Clef date ANNEE Nom Client Ville Code produit Nom Ville DATE Date MOIS Année Adresse Client Clef date Clef date Mois Quantité Mois Ville Nom Ville Date Année VENDEUR Prix total Année Quantité Mois VENDEUR Code vendeurprix total Code vendeur Nom Vendeur VILLE Nom Vendeur VILLE REGION PAYS Ville Vendeur Nom Ville Ville Vendeur Nom Ville Région Pays Quota Quota Région Région Pays Pays Pays 36
19 Le modèle en flocons de neige Id#Marque Id#Famille MARQUE Id#Produit Nom#Produit Id#Cde Description#Produit Famille Date#Cde ANNEE Sous9catégorie Id#Année Famille#Produit Description#Catégorie SEMESTRE Prix#unitaire ###Id#Semestre COMMANDE SOUS4CATEGORIE SEMAINE MOIS PRODUIT Id#Semaine Id#Mois VENTES CATEGORIE DATE Id#Cde Id#Sous9catégorie Id#Client JOUR Id#Vendeur Id#Sous9catégorie Id#Produit ##Id#Mois Id#Date Id#Client CLIENT Id#Ville Nom#Client VILLE DEPARTEMENT Adresse#Client Quantité MAGASIN Ville#Client Prix+total ###Id#Département VENDEUR Id#Ville## Id#Magasin ZONEGEO. Id#Vendeur## Ville#Mag. Id#Zone#géo. Ville#Vendeur#### Département#Mag. Quota# Zone#géographique Région#Mag. Pays#Mag. 37 Le$modèle$en$flocons$de$neige$ Schéma en arbre d'attributs ANNEE COMMANDE Famille MARQUE SEMESTRE VENTES Id#Cde Id#Client PRODUIT SEMAINE MOIS DATE Id#Vendeur SOUS7CATEGORIE CATEGORIE Id#Produit Id#Date CLIENT Id#Ville VILLE DEPARTEMENT REGION PAYS JOUR MAGASIN Quantité Prix+total VENDEUR ZONEGEO. 38
20 Le$modèle$en$flocons$de$neige$ Modèle en flocons de neige = Modèle en étoile + normalisation des dimension Lorsque les tables sont trop volumineuses Avantages : réduction du volume permettre des analyse par pallier (drill down) sur la dimension hiérarchisée Inconvénients : navigation difficile nombreuses jointures 39 Les$hiérarchies$ Les différents types d'hiérarchies " Les hiérarchies strictes et simples 40
21 Les$hiérarchies$ Les différents types d'hiérarchies " Les hiérarchies multiples alternatives 41 Les$hiérarchies$ Les différents types d'hiérarchies " Les hiérarchies multiples parallèles 42
22 Les hiérarchies Les différents types d'hiérarchies " Les hiérarchies multiples parallèles 43 Les$hiérarchies$ Les différents types d'hiérarchies " Les hiérarchies multiples parallèles Etat$ Propaga-on$virus$du$Nil$ Ville$ Territoire$ Pays$ occidental Province$ 44
23 $Représenta-on$$des$données$mul-dimensionnelles$ & Les diagramme UML de SOLAP Dim.%ANNEE Id#Année Dim.%SEMESTRE Id#Semestre Dim.%MOIS Id#Mois Dim.%PAYS Id#Pays Dim.%MARQUE Dim.%CATEGORIE Dim.%REGION Dim.%ZONE%GEO. Id#Marque Id#Région Id#Région Id#Zone#géo. Dim.%Famille Dim.%SOUS:CATEGORIE Dim.%DEPARTEMENT Dim.%VILLE Dim.%JOUR Id#Famille Id#Sous;catégorie Id#Département Id#Ville Id#Jour VENTES Id#Cde Id#Client Dim.%PRODUIT Dim%DATE Id#Vendeur Id#Produit Dim.%MAGASIN Id#Date Id#Produit Nom#Produit Id#Magasin Dim.%CLIENT Jour Id#Date Description#Produit Ville#Mag. Id#Client Semaine Id#Ville Sous;catégorie Département#Mag. Nom#Client Dim.%VENDEUR Dim.%COMMANDE Mois Famille#Produit Zone#géographique Adresse#Client Id#Vendeur Id#Cde Semestre Quantité Description#Catégorie Région#Mag. Ville#Client Ville#Vendeur Date#Cde Année Prix+total Prix#unitaire Pays#Mag. Quota 45 Lemodèle$en$constella-on$(FactDflaked)$ " La modélisation en constellation consiste à fusionner plusieurs modèles en étoile qui peuvent utiliser des dimensions communes. " Un modèle en constellation comprend donc plusieurs tables de faits et des tables de dimensions communes ou non à ces tables de faits. 46
24 Lemodèle$en$constella-on$(FactDflaked)$ Dim.%ANNEE Id#Année Dim.%PRODUCTION Dim.%USINE Id#Production Id#Usine Id#Produit Dim.%SEMESTRE Id#Date Id#Semestre Dim.%COMMANDE Id#Usine Dim.%SEMAINE Id#Cde # Id#Semaine Date#Cde Qté$produite Dim.%MOIS Dim.%PRODUIT Id#Mois Dim%DATE Id#Produit Id#Date Nom#Produit Dim.%Famille Dim.%MARQUE Jour Description#Produit Id#Famille Id#Marque Dim.%JOUR Semaine VENTES Sous=catégorie Id#Jour Mois Id#Cde Famille#Produit Semestre Id#Client Description#Catégorie Dim.%SOUS9CATEGORIE Dim.%CATEGORIE Année Id#Vendeur Prix#unitaire Id#Sous=catégorie Id#Région Id#Produit Id#Date Dim.%CLIENT Id#Ville Dim.%REGION Dim.%PAYS Id#Client Id#Région Id#Pays Nom#Client Quantité Dim.%DEPARTEMENT Adresse#Client Prix$total Id#Département Ville#Client Dim.%MAGASIN Id#Magasin Ville#Mag. Dim.%VILLE Dim.%ZONE%GEO. Dim.%VENDEUR Département#Mag. Id#Ville Id#Zone#géo. Id#Vendeur Zone#géographique Ville#Vendeur Région#Mag. Quota Pays#Mag. 47 Es-mer$le$volume$du$DW$$ Calculer ou estimer le nombre d'enregistrements Prendre en compte : # La ''table'' de faits # Les dimensions significatives # Les agrégats # Les index # Saisonnalité des ventes # Croissance du CA, des encours, du nombre de points de ventes 48
25 Exemples Grandes distribution : CA annuel : M$ Prix moyen d'un article d'un ticket : 5$ Nbre d'articles vendus pour un an : 80 * 10 9 / 5 = 16 * 10 9 Volume du DW : 16*10 9 *3 ans * 24 octets = 1,54 To (1,54*10 12 = Go ) Téléphonie : Nbre d'appels quotidiens : 100 millions Historique : 3 ans * 365 jours= jours Volume du DW : 100 millions * jours * 24 octets = 3,94 To Cartes de crédit : Nbre de clients : 50 millions Nbre moyen mensuel de transactions : 30 Volume : 50 millions * 26 mois * 30 transactions * 24 octets = 1,73 To 49 Modélisa-on$logique$ou$Représenta-on$des$données$ Les données sont perçues à travers plusieurs dimensions. Elles sont qualifiées de multidimensionnelles, indépendamment de leur support (tables relationnelles ou tableaux multidimensionnels) Produit Region Ventes Clous Est 50 Clous Ouest 60 Clous Centre 100 Vis Est 40 Vis Ouest 70 Vis Centre 80 Boulons Est 90 Boulons Ouest 120 Boulons Centre 140 Nettoyeurs Est 20 Nettoyeurs Ouest 10 Nettoyeurs Centre 30 Est Ouest Centre Clous, Vis Boulons N ettoyeurs Représentation des données dans un tableau multidimensionnel Représentation des données dans une table relationnelle 50
26 Les$requêtes$décisionnelles$ On peut calculer divers totaux. Quelle est le total des ventes dans la région Est? # Tables relationnelles : on peut traiter quelques centaines de tuples par seconde. # Tableau multidimensionnel : on peut rajouter en lignes et en colonnes plus de valeurs par seconde. Pour accélérer les temps de réponses, il est préférable de pré-calculer des sous totaux. 51 Les$requêtes$décisionnelles$ Produit Region Ventes Clous Est 50 Clous Ouest 60 Clous Centre 100 Clous Total 210 Vis Est 40 Vis Ouest 70 Vis Centre 80 Vis Total 190 Boulons Est 90 Boulons Ouest 120 Boulons Centre 140 Boulons Total 350 Nettoyeurs Est 20 Nettoyeurs Ouest 10 Nettoyeurs Centre 30 Nettoyeurs Total 60 Total Est 200 Total Ouest 260 Total Centre 350 Total Total 810 Pour le calcul de ces totaux : 28 accès en lecture et 8 accès en écriture. Est Ouest Centre Total Clous Vis Boulons Nettoyeurs Total OLAP consolide entre et cellules/s Un SGBDR lit 200 enregist/s et en écrit environ 20/s. 52
27 Les$requêtes$décisionnelles$ La valeur ALL remplace une colonne ou une valeur d'agrégats. Magasin Date Rayon CA Ventes Mag1 1/2/ Mag1 6/2/ Mag1 10/2/ Mag1 ALL Mag2 S'il y a N attributs concourant à la construction du cube, il y aura : 2 N -1 agrégations Soit C 1, C 2,,C N les cardianlités des N attributs, le cube aura : (C i +1) enregistrements Dans la tables VENTES si on a 2*3*3 = 18 enregist. dans le cube on aura 3*4*4* = 48 enregist. 53 Les$différentes$approches$d'OLAP$ L'approche relationnelle (ROLAP) (MicroStrategy MS ; Informix's Metacube MC, Information Advantage IA) L'ensemble des données est stocké dans une BDR. Les données sont sous forme d'enregistrements (tuples). VENTES (Magasin, Rayon, Date, CA Ventes, Nb Client) Select Magasin, Date, Sum(CA Ventes) From VENTES Group By Magasin, Date Opérateurs d'agrégation : cube, rollup. ' J.Gray, A. Bosworth, A. Leyman, H. Pirahesh, Data Cube : A relationnal Aggregation Operator Generalizing Group-By, Cross- Tab, and Sub-Total, in Data Mining and Knowledge Discovery Journal, 1(1), 1997] 54
28 Les$requêtes$décisionnelles$ L'union de plusieurs group-by donne naissance à un cube : Select ALL, ALL, ALL, Sum(CA Ventes) From VENTES UNION Select Magasin, ALL, ALL, Sum(CA Ventes) From VENTES Group-By Magasin ; UNION Select Magasin, Date, ALL, Sum(CA Ventes) From VENTES Group-By Magasin, Date ; UNION Select Magasin, Date, Rayon, Sum(CA Ventes) From VENTES Group-By Magasin, Date, Rayon ; L'opérateur cube est une généralisation N-dimensionnelle de fonctions d'agrégations simples. C'est un opérateur relationnel. Select Magasin, date, Rayon, Sum(CA Ventes) From VENTES Group-By Cube Magasin, Date, Rayon ; 55 Les$différentes$approches$d'OLAP$ L'approche multidimensionnelle (MOLAP) Arbor Software : hyperion (Codd & co ), Express Oracle, LightShip (de Pilot) Il s'agit de stocker les données dans des tableaux multidimensionnels. Ces tableaux peuvent être éparses. On y stocke dans les cellules les mesures (valeurs à observer), les données représentant les dimensions sont les coordonnées de ces valeurs : f = (d 1, d 2,, d n, m 1, m 2,, m p ) [Zhao Yihong, Deshpande Prasad M., Naughton Jeffrey F., «An Array-Based Algorithm for Simultaneous Multidimensional Aggregates», in SIGMOD Record n 26, Vol 2, 1997.] 56
29 Les$différentes$approches$d'OLAP$ BD éparse # Plus on a de dimensions plus on a de cellules. Seulement une partie des produits peut être vendue ( des cellules sans valeur : données éparses. Exemple : On dispose de données (eq. tuples) 4 dimensions ayant une cardinalité de 30 modalités chacune: 30 * 30 * 30 * 30 = cellules (dont vides : 12,3% seulement sont pleines) # Une BD est considérée comme éparse si elle a moins de 40% de ses cellules peuplées. # Techniques de compression des données 57 Les$différentes$approches$d'OLAP$ L'approche hybride (HOLAP) Approche relationnelle : 30% du temps est consacré aux I/O Approche multidimensionnelle : 20% (70% calculs et 10% décompression) La 3 voie préconisée consiste à utiliser les tables comme structure permanente de stockage des données et les tableaux comme structure des requêtes. La démarche consisterait en 3 étapes : 1. Charger les données d'une table vers un tableau. 2. Calculer le cube de ce tableau selon les méthodes initialement présentées. 3. Stocker les résultats (données agrégées) dans un table. 1 Pays 5 Régions 500 Villes BDM Clients BDR 58
30 Les$différentes$structures$mul-dimensionnelles$ " Les magasins de données (data marts) & Simples magasins de données (Data Marts), on y stockera des données portant sur une seule des activités de l'entreprise & Ceux sont en quelque sorte des vues métier & Exemple : Data Mart Comptabilité, Data Mart RH,... & Ces mini ED peuvent alors être considérés comme des espaces d'analyse, du fait que les données sont bien moins nombreuses et surtout qu'elles sont thématiques et modélisées en multidimensionnel & Ils peuvent également servir de bases de construction à des cubes de données 59 Entrepôts,$Magasins$et$Cubes$de$données$ MD Magasins de données Data Mining MD Entrepôt$ de$ données$ MD MD MD Cube Cube Cube Cubes de données Analyses statistiques MD OLAP Reporting 60
Datawarehouse: Cubes OLAP. Marlyse Dieungang Khaoula Ghilani
Datawarehouse: Cubes OLAP Marlyse Dieungang Khaoula Ghilani Table des matières 1 Data Warehouse 3 1.1 Introduction............................ 3 1.1.1 Définition......................... 3 1.1.2 Architecture........................
Plus en détailPlan. Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation
Data WareHouse Plan Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation 2 Présentation Besoin: prise de décisions
Plus en détailLes entrepôts de données
Les entrepôts de données Lydie Soler Janvier 2008 U.F.R. d informatique Document diffusé sous licence Creative Commons by-nc-nd (http://creativecommons.org/licenses/by-nc-nd/2.0/fr/) 1 Plan Introduction
Plus en détailEntrepôt de données 1. Introduction
Entrepôt de données 1 (data warehouse) Introduction 1 Présentation Le concept d entrepôt de données a été formalisé pour la première fois en 1990 par Bill Inmon. Il s agissait de constituer une base de
Plus en détailFouille de Données : OLAP & Data Warehousing
Fouille de Données : OLAP & Data Warehousing Nicolas Pasquier Université de Nice Sophia-Antipolis Laboratoire I3S Chapitre 2. Data warehousing Définition : qu est-ce que le data warehousing? Entrepôt de
Plus en détailEntrepôts de données. NEGRE Elsa Université Paris-Dauphine 2015-2016
Entrepôts de données NEGRE Elsa Université Paris-Dauphine 2015-2016 Contexte et problématique Le processus de prise de décision L entrepôt de données Définition Différence avec un SGBD Caractéristiques
Plus en détailLe "tout fichier" Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique
Introduction à l informatique : Information automatisée Le premier ordinateur Définition disque dure, mémoire, carte mémoire, carte mère etc Architecture d un ordinateur Les constructeurs leader du marché
Plus en détailet les Systèmes Multidimensionnels
Le Data Warehouse et les Systèmes Multidimensionnels 1 1. Définition d un Datawarehouse (DW) Le Datawarehouse est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées
Plus en détailUrbanisation des SI-NFE107
OLAP Urbanisation des SI-NFE107 Fiche de lecture Karim SEKRI 20/01/2009 OLAP 1 Introduction PLAN OLAP Les différentes technologies OLAP Plate formes et Outils 20/01/2009 OLAP 2 Informatique décisionnelle
Plus en détailBases de données multidimensionnelles et mise en œuvre dans Oracle
Bases de données multidimensionnelles et mise en œuvre dans Oracle 1 Introduction et Description générale Les bases de données relationnelles sont très performantes pour les systèmes opérationnels (ou
Plus en détailPlan. Ce qu est le datawarehouse? Un modèle multidimensionnel. Architecture d un datawarehouse. Implémentation d un datawarehouse
Datawarehouse 1 Plan Ce qu est le datawarehouse? Un modèle multidimensionnel Architecture d un datawarehouse Implémentation d un datawarehouse Autres développements de la technologie data cube 2 Ce qu
Plus en détailBI = Business Intelligence Master Data-ScienceCours 3 - Data
BI = Business Intelligence Master Data-Science Cours 3 - Datawarehouse UPMC 8 février 2015 Rappel L Informatique Décisionnelle (ID), en anglais Business Intelligence (BI), est l informatique à l usage
Plus en détailLES ENTREPOTS DE DONNEES
Module B4 : Projet des Systèmes d information Lille, le 25 mars 2002 LES ENTREPOTS DE DONNEES Problématique : Pour capitaliser ses informations, une entreprise doit-elle commencer par mettre en œuvre des
Plus en détailCollabora'on IRISA/INRA sur le transfert de nitrates et l améliora'on de la qualité des eaux des bassins versants:
Collabora'on IRISA/INRA sur le transfert de nitrates et l améliora'on de la qualité des eaux des bassins versants: Tassadit BOUADI 22 Juin 2010, Saint Jacut 1 Plan Introduc
Plus en détailBusiness Intelligence : Informatique Décisionnelle
Business Intelligence : Informatique Décisionnelle On appelle «aide à la décision», «décisionnel», ou encore «business intelligence», un ensemble de solutions informatiques permettant l analyse des données
Plus en détailet les Systèmes Multidimensionnels
Le Data Warehouse et les Systèmes Multidimensionnels 1 1. Définition d un Data warehouse (DW) Le Data warehouse (entrepôt de données) est une collection de données orientées sujet, intégrées, non volatiles
Plus en détailUn datawarehouse est un entrepôt de données (une base de données) qui se caractérise par des données :
Page 1 of 6 Entrepôt de données Un article de Wikipédia, l'encyclopédie libre. L'entrepôt de données, ou datawarehouse, est un concept spécifique de l'informatique décisionnelle, issu du constat suivant
Plus en détailEntrepôt de Données. Jean-François Desnos. Jean-Francois.Desnos@grenet.fr ED JFD 1
Entrepôt de Données Jean-François Desnos Jean-Francois.Desnos@grenet.fr ED JFD 1 Définition (Bill Inmon 1990) Un entrepôt de données (data warehouse) est une collection de données thématiques, intégrées,
Plus en détailLes entrepôts de données et l analyse de données
LOG660 - Bases de données de haute performance Les entrepôts de données et l analyse de données Quelques définitions Entreposage de données (data warehousing): «La copie périodique et coordonnée de données
Plus en détailLes Entrepôts de Données
Les Entrepôts de Données Grégory Bonnet Abdel-Illah Mouaddib GREYC Dépt Dépt informatique :: GREYC Dépt Dépt informatique :: Cours Cours SIR SIR Systèmes d information décisionnels Nouvelles générations
Plus en détailEntrepôt de données et l Analyse en ligne. Maguelonne Teisseire Hugo Alatrista Salas hugo.alatrista- salas@teledetec9on.fr Flavien Bouillot
Entrepôt de données et l Analyse en ligne Maguelonne Teisseire Hugo Alatrista Salas hugo.alatrista- salas@teledetec9on.fr Flavien Bouillot Déroulement du cours 17 janvier : cours et TD 20 janvier : cours?
Plus en détailMagasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP)
Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP) Définition (G. Gardarin) Entrepôt : ensemble de données historisées variant
Plus en détailLe Data Warehouse. Fait Vente. temps produit promotion. magasin. revenu ... Produit réf. libellé volume catégorie poids. Temps jour semaine date ...
Le Data Warehouse Temps jour semaine date magasin nom ville m 2 région manager... Fait Vente temps produit promotion magasin revenu... Produit réf. libellé volume catégorie poids... Promo nom budget média
Plus en détailIntroduction à la B.I. Avec SQL Server 2008
Introduction à la B.I. Avec SQL Server 2008 Version 1.0 VALENTIN Pauline 2 Introduction à la B.I. avec SQL Server 2008 Sommaire 1 Présentation de la B.I. et SQL Server 2008... 3 1.1 Présentation rapide
Plus en détailLes Entrepôts de Données. (Data Warehouses)
Les Entrepôts de Données (Data Warehouses) Pr. Omar Boussaid Département d'informatique et de Sta5s5que Université Lyon2 - France Les Entrepôts de Données 1. Généralités, sur le décisionnel 2. L'entreposage
Plus en détailFreeAnalysis. Schema Designer. Cubes
FreeAnalysis Schema Designer Cubes Charles Martin et Patrick Beaucamp BPM Conseil Contact : charles.martin@bpm-conseil.com, patrick.beaucamp@bpm-conseil.com Janvier 2013 Document : BPM_Vanilla_FreeAnalysisSchemaDesigner_v4.2_FR.odt
Plus en détailEvry - M2 MIAGE Entrepôts de Données
Evry - M2 MIAGE Entrepôts de Données Modélisation décisionnelle D. Ploix - M2 MIAGE - Conception EDD 1 Plan Construction de l entrepôt : les faits et les dimensions Préparation de l analyse : Les agrégats
Plus en détailOracle Décisionnel : Modèle OLAP et Vue matérialisée D BILEK
Oracle Décisionnel : Modèle OLAP et Vue matérialisée SOMMAIRE Introduction Le modèle en étoiles Requêtes OLAP Vue matérialisée Fonctions Roll up et Cube Application Introduction Data Warehouse Moteur OLAP
Plus en détailSGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)
SGBDR Systèmes de Gestion de Bases de Données (Relationnelles) Plan Approches Les tâches du SGBD Les transactions Approche 1 Systèmes traditionnels basés sur des fichiers Application 1 Gestion clients
Plus en détail2 Serveurs OLAP et introduction au Data Mining
2-1 2 Serveurs OLAP et introduction au Data Mining 2-2 Création et consultation des cubes en mode client-serveur Serveur OLAP Clients OLAP Clients OLAP 2-3 Intérêt Systèmes serveurs et clients Fonctionnalité
Plus en détailEntrepôts de données : Systèmes OLAP : ROLAP, MOLAP et OLAP (5) 1 Introduction aux systèmes
Entrepôts de données : Systèmes : R, M et H (5) Bernard ESPINASSE Professeur à Aix-Marseille Université (AMU) Ecole Polytechnique Universitaire de Marseille Septembre 2013 Introduction aux systèmes Systèmes
Plus en détailETL Extract - Transform - Load
ETL Extract - Transform - Load Concept général d analyse en ligne (rappels) Rémy Choquet - Université Lyon 2 - Master 2 IIDEE - 2006-2007 Plan Définitions La place d OLAP dans une entreprise OLAP versus
Plus en détailTechniques d optimisation des requêtes dans les data warehouses
Techniques d optimisation des requêtes dans les data warehouses Ladjel Bellatreche LISI/ENSMA Téléport2-1, Avenue Clément Ader 86960 Futuroscope - FRANCE bellatreche@ensma.fr Résumé Un entrepôt de données
Plus en détailEvry - M2 MIAGE Entrepôt de données
Evry - M2 MIAGE Entrepôt de données Introduction D. Ploix - M2 Miage - EDD - Introduction 1 Plan Positionnement du BI dans l entreprise Déclinaison fonctionnelle du décisionnel dans l entreprise Intégration
Plus en détailEntrepôts de Données
République Tunisienne Ministère de l Enseignement Supérieur Institut Supérieur des Etudes Technologique de Kef Support de Cours Entrepôts de Données Mention : Technologies de l Informatique (TI) Parcours
Plus en détailSQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...)
Avant-propos 1. À qui s'adresse ce livre? 15 2. Pré-requis 15 3. Objectifs du livre 16 4. Notations 17 Introduction à la Business Intelligence 1. Du transactionnel au décisionnel 19 2. Business Intelligence
Plus en détailRÉPUBLIQUE ALGÉRIENNE DÉMOCRATIQUE ET POPULAIRE. Ministère de l Enseignement Supérieur et de la Recherche Scientifique I.N.I THEME : Les outils OLAP
RÉPUBLIQUE ALGÉRIENNE DÉMOCRATIQUE ET POPULAIRE Ministère de l Enseignement Supérieur et de la Recherche Scientifique I.N.I THEME : Les outils OLAP REALISE PAR : BENAKEZOUH Leïla & TIFOUS Amira Quatrième
Plus en détailChapitre IX. L intégration de données. Les entrepôts de données (Data Warehouses) Motivation. Le problème
Chapitre IX L intégration de données Le problème De façon très générale, le problème de l intégration de données (data integration) est de permettre un accès cohérent à des données d origine, de structuration
Plus en détailIntroduction à l Informatique Décisionnelle - Business Intelligence (7)
Introduction à l Informatique Décisionnelle - Business Intelligence (7) Bernard ESPINASSE Professeur à Aix-Marseille Université (AMU) Ecole Polytechnique Universitaire de Marseille Septembre 2013 Emergence
Plus en détailLa problématique. La philosophie ' ) * )
La problématique!" La philosophie #$ % La philosophie &'( ' ) * ) 1 La philosophie +, -) *. Mise en oeuvre Data warehouse ou Datamart /01-2, / 3 13 4,$ / 5 23, 2 * $3 3 63 3 #, 7 Datawarehouse Data warehouse
Plus en détailDatawarehouse and OLAP
Datawarehouse and OLAP Datawarehousing Syllabus, materials, notes, etc. See http://www.info.univ-tours.fr/ marcel/dw.html today architecture ETL refreshing warehousing projects architecture architecture
Plus en détail4. Utilisation d un SGBD : le langage SQL. 5. Normalisation
Base de données S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Présentation du module Contenu général Notion de bases de données Fondements / Conception Utilisation :
Plus en détailThéories de la Business Intelligence
25 Chapitre 2 Théories de la Business Intelligence 1. Architectures des systèmes décisionnels Théories de la Business Intelligence Depuis les premières requêtes sur les sources de données OLTP consolidées
Plus en détailRejoignez la Communauté
Rejoignez la Communauté MODÉLISATION DIMENSIONNELLE Le fondement du datawarehouse 2 MODÉLISATION DIMENSIONNELLE Le fondement du datawarehouse 3 QUI SOMMES NOUS? Jean-Pierre Riehl Pratice Manager SQL Azeo
Plus en détailC-CUBE: Un nouvel opérateur d agrégation pour les entrepôts de données en colonnes
C-CUBE: Un nouvel opérateur d agrégation pour les entrepôts de données en colonnes Khaled Dehdouh Fadila Bentayeb Nadia Kabachi Omar Boussaid Laboratoire ERIC, Université de Lyon 2 5 avenue Pierre Mendes-France,
Plus en détailIntroduction au domaine du décisionnel et aux data warehouses
Data warehouse Introduction au domaine du décisionnel et aux data warehouses http://dwh.crzt.fr STÉPHANE CROZAT Paternité - Partage des Conditions Initiales à l'identique : http://creativecommons.org/licenses/by-sa/2.0/fr/
Plus en détailLa place de la Géomatique Décisionnelle dans le processus de décision
Géomatique décisionnelle La place de la Géomatique Décisionnelle dans le processus de décision - Arnaud Van De Casteele Mines ParisTech - CRC Arnaud {dot} van_de_casteele {at} mines-paristech.fr Les rencontres
Plus en détailSQL SERVER 2008, BUSINESS INTELLIGENCE
SGBD / Aide à la décision SQL SERVER 2008, BUSINESS INTELLIGENCE Réf: QLI Durée : 5 jours (7 heures) OBJECTIFS DE LA FORMATION Cette formation vous apprendra à concevoir et à déployer une solution de Business
Plus en détailL information et la technologie de l informationl
L information et la technologie de l informationl CRM & informatique décisionnelled CRM CRM & informatique décisionnelle. d 1 2 3 Les Les fondements managériaux managériaux du du CRM. CRM. Les Les fondements
Plus en détailFournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement
Introduction Phases du projet Les principales phases du projet sont les suivantes : La mise à disposition des sources Des fichiers Excel sont utilisés pour récolter nos informations L extraction des données
Plus en détailÉvolution de schémas dans les entrepôts de données mise à jour de hiérarchies de dimension pour la personnalisation des analyses
Évolution de schémas dans les entrepôts de données mise à jour de hiérarchies de dimension pour la personnalisation des analyses Thèse présentée par Cécile FAVRE pour obtenir le titre de Docteur en Informatique
Plus en détailMémoire de fin d études. Thème Conception et réalisation d un Data Warehouse pour la mise en place d un système décisionnel
Mémoire de fin d études Pour l obtention du diplôme d Ingénieur d Etat en Informatique Option : Systèmes d information Thème Conception et réalisation d un Data Warehouse pour la mise en place d un système
Plus en détailUNIVERSITÉ MOHAMMED V AGDAL. FACULTÉ DES SCIENCES Rabat THÈSE DE DOCTORAT. Présentée par ELhoussaine ZIYATI Discipline : Sciences de l ingénieur
UNIVERSITÉ MOHAMMED V AGDAL FACULTÉ DES SCIENCES Rabat N d ordre 2491 THÈSE DE DOCTORAT Présentée par ELhoussaine ZIYATI Discipline : Sciences de l ingénieur Spécialité : Informatique et Télécommunications
Plus en détailBases de Données Avancées
1/26 Bases de Données Avancées DataWareHouse Thierry Hamon Bureau H202 - Institut Galilée Tél. : 33 1.48.38.35.53 Bureau 150 LIM&BIO EA 3969 Université Paris 13 - UFR Léonard de Vinci 74, rue Marcel Cachin,
Plus en détailOLAP : Mondrian + Pentaho. Maguelonne Teisseire Hugo Alatrista Salas hugo.alatrista- salas@teledetec9on.fr Flavien Bouillot
OLAP : Mondrian + Pentaho Maguelonne Teisseire Hugo Alatrista Salas hugo.alatrista- salas@teledetec9on.fr Flavien Bouillot Outils Open Source Mondrian : serveur OLAP JFreeReport : ou9l de «Repor9ng» KeHle
Plus en détail25/05/2012. Business Intelligence. Plan de Présentation
Business Intelligence Prof. Mourad Oubrich Plan de Présentation Définition de la BI Chaine de la valeur de la BI Marché de la BI Métiers de la BI Architecture de la BI Technologie SAP BI Les priorités
Plus en détailL informatique décisionnelle
L informatique décisionnelle Thèse Professionnelle. Ce document est une thèse professionnelle dont la problématique est : Quelles sont les bonnes pratiques dans la mise en place d une solution décisionnelle
Plus en détailMinistère de l Enseignement Supérieur et de la Recherche Scientifique. Ecole nationale Supérieure d Informatique (ESI) (Oued Semar, Alger) Mémoire
Ministère de l Enseignement Supérieur et de la Recherche Scientifique Ecole nationale Supérieure d Informatique (ESI) (Oued Semar, Alger) École Doctorale Sciences et Technologies de l'information et de
Plus en détailIntroduction à la modélisation dimensionnelle
Introduction à la modélisation dimensionnelle Data warehouse http://dwh.crzt.fr Paternité - Partage des Conditions Initiales à l'identique : http://creativecommons.org/licenses/by-sa/4.0/fr/ 11 février
Plus en détailIntroduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours
Information du cours Informatique décisionnelle et data mining www.lia.univ-avignon.fr/chercheurs/torres/cours/dm Juan-Manuel Torres juan-manuel.torres@univ-avignon.fr LIA/Université d Avignon Cours/TP
Plus en détailIntroduction à lʼinformatique. Décisionnelle (ID) / Business. Intelligence» (1)
Introduction à lʼinformatique Décisionnelle et la «Business Intelligence» (1) Bernard ESPINASSE Professeur à Aix-Marseille Université (AMU) Ecole Polytechnique Universitaire de Marseille Septembre 2013
Plus en détailFonctionnalités des différentes éditions de SQL Server 2012
Fonctionnalités des différentes éditions de SQL Server 2012 Cette rubrique décrit les s prises en charge par les versions de SQL Server 2012. Toutes les s de SQL Server 2008 R2 sont disponibles dans les
Plus en détailIntroduction aux entrepôts de données (2)
Introduction aux entrepôts de données (2) Bernard ESPINASSE Professeur à Aix-Marseille Université (AMU) Ecole Polytechnique Universitaire de Marseille Septembre 2013 Introduction et définition dʼun entrepôt
Plus en détailBases de données cours 4 Construction de requêtes en SQL. Catalin Dima
Bases de données cours 4 Construction de requêtes en SQL Catalin Dima Requêtes SQL et langage naturel Énoncés en langage naturel. Traduction en SQL? Correspondance entre syntagmes/phrases et opérations
Plus en détail1. LA GESTION DES BASES DE DONNEES RELATIONNELLES
Dossier G11 - Interroger une base de données La base de données Facturation contient tout un ensemble d'informations concernant la facturation de la SAFPB (société anonyme de fabrication de produits de
Plus en détailBases de Données relationnelles et leurs systèmes de Gestion
III.1- Définition de schémas Bases de Données relationnelles et leurs systèmes de Gestion RAPPELS Contraintes d intégrité sous Oracle Notion de vue Typage des attributs Contrainte d intégrité Intra-relation
Plus en détailBig Data On Line Analytics
Fdil Fadila Bentayeb Lb Laboratoire ERIC Lyon 2 Big Data On Line Analytics ASD 2014 Hammamet Tunisie 1 Sommaire Sommaire Informatique décisionnelle (BI Business Intelligence) Big Data Big Data analytics
Plus en détailRapport de DEA. Intégration de versions fonctionnelles dans les entrepôts de données multimédias au sein des systèmes OLAP. Anne-Muriel ARIGON
Rapport de DEA Intégration de versions fonctionnelles dans les entrepôts de données multimédias au sein des systèmes OLAP Anne-Muriel ARIGON LIRIS INSA de Lyon Bâtiment 501 69621 Villeurbanne, France Encadré
Plus en détailLe Géodécisionnel. P7 : Projet Bibliographique Dans le cadre du Mastère ASIG. Les SIG au service du géodécisionnel.
P7 : Projet Bibliographique Dans le cadre du Mastère ASIG Le Géodécisionnel Les SIG au service du géodécisionnel Thierry Lallemant 15 Mai 2008 Mastère ASIG / Projet Bibliographique 2008 1 TABLE DES MATIERES
Plus en détailCONSERVATOIRE NATIONAL DES ARTS ET METIERS CENTRE REGIONAL ASSOCIE DE BOURGOGNE MEMOIRE. présenté en vue d'obtenir le DIPLOME D'INGENIEUR C.N.A.M.
CONSERVATOIRE NATIONAL DES ARTS ET METIERS CENTRE REGIONAL ASSOCIE DE BOURGOGNE MEMOIRE présenté en vue d'obtenir le DIPLOME D'INGENIEUR C.N.A.M. SPECIALITE : INFORMATIQUE OPTION : SYSTEMES D INFORMATION
Plus en détailSQL Server 2014. SQL Server 2014. Implémentation d une solution. Implémentation d une solution de Business Intelligence.
Ce livre sur s adresse à toutes les personnes désireuses de mettre en œuvre les techniques de l informatique décisionnelle (ou BI, Business Intelligence) à l aide des composants de la suite Microsoft :
Plus en détailObjectif. Participant. Prérequis. Oracle BI Suite EE 10g R3 - Développer des référentiels. 5 Jours [35 Heures]
Objectif Utiliser les techniques de gestion de la mise en cache pour contrôler et améliorer les performances des requêtes Définir des mesures simples et des mesures calculées pour une table de faits Créer
Plus en détailCompétences Business Objects - 2014
Compétences Business Objects - 2014 «Mars-Juin 2014. Réf : Version 1 Page 1 sur 34 Sommaire CONTEXTE DE LA REMISE A NIVEAU EN AUTOFORMATION... 3 1. MODELISATION... 4 1.1 DESCRIPTION FONCTIONNEL DE L'APPLICATION
Plus en détailSkills Technology Software PARTENAIRE TECHNOLOGIQUE DE VOTRE DÉVELOPPEMENT
Skills Technology Software w w w.s PARTENAIRE TECHNOLOGIQUE DE VOTRE DÉVELOPPEMENT ka ty s. co m E U OG ION L TA AT A C RM FO Accélérateur de votre RÉUSSITE 2 Formation Aujourd hui, la formation constitue
Plus en détailPrésentation du module Base de données spatio-temporelles
Présentation du module Base de données spatio-temporelles S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Partie 1 : Notion de bases de données (12,5h ) Enjeux et principes
Plus en détailCATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2012
CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE Edition 2012 AGENDA Qui sommes nous? Présentation de Keyrus Keyrus : Expert en formations BI Nos propositions de formation 3 modes de formations Liste des
Plus en détailConstruction d un EDD avec SQL 2008 R2. D. Ploix - M2 Miage - EDD - Création
Construction d un EDD avec SQL 2008 R2 Plan Analyse du DW construit Construction de la base DW dans SQL 2008 Construction des tables de faits et dimensions Injection des données Étapes de l injection des
Plus en détailEduardo Almeida. Master Alma Université de Nantes {eduardo.almeida@univ-nantes.fr}
Data Warehouse - OLAP Master Alma Université de Nantes {eduardo.almeida@univ-nantes.fr} Objectif Présenter les concepts de base d'un Data Warehouse (DW) et On Line Analytical Processing (OLAP). Présenter
Plus en détailSécurité des entrepôts de données dans le Cloud Un SaaS pour le cryptage des données issues d un ETL
Sécurité des entrepôts de données dans le Cloud Un SaaS pour le cryptage des données issues d un ETL Présenté par Hana Gara Kort Sous la direction de Dr Jalel Akaichi Maître de conférences 1 1.Introduction
Plus en détailBUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise
BUSINESS INTELLIGENCE Une vision cockpit : utilité et apport pour l'entreprise 1 Présentation PIERRE-YVES BONVIN, SOLVAXIS BERNARD BOIL, RESP. SI, GROUPE OROLUX 2 AGENDA Définitions Positionnement de la
Plus en détailNF26 Data warehouse et Outils Décisionnels Printemps 2010
NF26 Data warehouse et Outils Décisionnels Printemps 2010 Rapport Modélisation Datamart VU Xuan Truong LAURENS Francis Analyse des données Avant de proposer un modèle dimensionnel, une analyse exhaustive
Plus en détailAtelier Symposium MicroStrategy
Atelier Symposium MicroStrategy Présentation de Soft Computing «De l'usage de MicroStrategy pour la Connaissance Client dans le secteur de la Distribution» G.MANGEON Soft Computing 16 Juin 2016 Soft Computing
Plus en détailDidier MOUNIEN Samantha MOINEAUX
Didier MOUNIEN Samantha MOINEAUX 08/01/2008 1 Généralisation des ERP ERP génère une importante masse de données Comment mesurer l impact réel d une décision? Comment choisir entre plusieurs décisions?
Plus en détailIntégration de données hétérogènes et réparties. Anne Doucet Anne.Doucet@lip6.fr
Intégration de données hétérogènes et réparties Anne Doucet Anne.Doucet@lip6.fr 1 Plan Intégration de données Architectures d intégration Approche matérialisée Approche virtuelle Médiateurs Conception
Plus en détailEntrepôts de données multidimensionnelles NoSQL
Entrepôts de données multidimensionnelles NoSQL Max Chevalier, Mohammed El Malki, Arlind Kopliku, Olivier Teste, Ronan Tournier Université de Toulouse, IRIT UMR 5505, Toulouse, France http://www.irit.fr
Plus en détailOption OLAP d'oracle Database 10g
Option OLAP d'oracle Database 10g Quand utiliser l'option OLAP pour améliorer le contenu et les performances d'une application de Business Intelligence Livre blanc Oracle Juin 2005 Option OLAP d'oracle
Plus en détailSWISS ORACLE US ER GRO UP. www.soug.ch. Newsletter 5/2014 Sonderausgabe. OBIF DB licensing with VMware Delphix 12c: SQL Plan / Security Features
SWISS ORACLE US ER GRO UP www.soug.ch Newsletter 5/2014 Sonderausgabe OBIF DB licensing with VMware Delphix 12c: SQL Plan / Security Features 42 TIPS&TECHNIQUES Alexandre Tacchini, Benjamin Gaillard, Fabien
Plus en détailUML et les Bases de Données
CNAM UML et les Bases de Données UML et les Bases de Données. Diagramme de classes / diagramme d objets (UML)...2.. Premier niveau de modélisation des données d une application...2.2. Les éléments de modélisation...2.2..
Plus en détailPrésentations personnelles. filière IL
Présentations personnelles filière IL Résumé Liste de sujets de présentations personnelles. Chaque présentation aborde un sujet particulier, l'objectif étant que la lecture du rapport ainsi que l'écoute
Plus en détailEcole des Hautes Etudes Commerciales HEC Alger. par Amina GACEM. Module Informatique 1ière Année Master Sciences Commerciales
Ecole des Hautes Etudes Commerciales HEC Alger Évolution des SGBDs par Amina GACEM Module Informatique 1ière Année Master Sciences Commerciales Evolution des SGBDs Pour toute remarque, question, commentaire
Plus en détailBases de Données OLAP
Bases de Données OLAP Hiver 2013/2014 Melanie Herschel melanie.herschel@lri.fr Université Paris Sud, LRI Chapitre 1 Introduction Détails administratifs Entrepôts de Données Perspective sur le semestre
Plus en détailLes bases de données Page 1 / 8
Les bases de données Page 1 / 8 Sommaire 1 Définitions... 1 2 Historique... 2 2.1 L'organisation en fichier... 2 2.2 L'apparition des SGBD... 2 2.3 Les SGBD relationnels... 3 2.4 Les bases de données objet...
Plus en détailDépartement Génie Informatique
Département Génie Informatique BD51 : Business Intelligence & Data Warehouse Projet Rédacteur : Christian FISCHER Automne 2011 Sujet : Développer un système décisionnel pour la gestion des ventes par magasin
Plus en détailBusiness & High Technology
UNIVERSITE DE TUNIS INSTITUT SUPERIEUR DE GESTION DE TUNIS Département : Informatique Business & High Technology Chapitre 8 : ID : Informatique Décisionnelle BI : Business Intelligence Sommaire Introduction...
Plus en détailBusiness Intelligence avec SQL Server 2012
Editions ENI Business Intelligence avec SQL Server 2012 Maîtrisez les concepts et réalisez un système décisionnel Collection Solutions Informatiques Extrait Alimenter l'entrepôt de données avec SSIS Business
Plus en détailBusiness Intelligence Reporting
Maître de stage : Claude Bordanave Sirinya ON-AT Année 2011 / 2012 Master1 Informatique Université Bordeaux 1 SOMMAIRE REMERCIEMENTS...4 INTRODUCTION...4 I) PRESENTATION DE L ENTREPRISE... 5 1) Raison
Plus en détailCONCEPTION ET REALISATION D'UN GENERATEUR DE TABLEAUX DE BORD PROSPECTIFS MULTIDIMENSIONNELS
CONCEPTION ET REALISATION D'UN GENERATEUR DE TABLEAUX DE BORD PROSPECTIFS MULTIDIMENSIONNELS Nazih Selmoune (*), Zaia Alimazighi (*) Selmoune@lsi-usthb.dz, Alimazighi@wissal.dz (*) Laboratoire des systèmes
Plus en détailRépublique Algérienne Démocratique et Populaire
République Algérienne Démocratique et Populaire Ministère de l Enseignement Supérieur et de la Recherche Scientifique Institut National de formation en Informatique Direction de la Post-Graduation et de
Plus en détailStructure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données
Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données et le Data Mining Nous suivons le plan suivant : Fonctionnement de Spad Catalogue des méthodes (statistiques
Plus en détailStructure fonctionnelle d un SGBD
Fichiers et Disques Structure fonctionnelle d un SGBD Requetes Optimiseur de requetes Operateurs relationnels Methodes d acces Gestion de tampon Gestion de disque BD 1 Fichiers et Disques Lecture : Transfert
Plus en détail