Nouspresentonslesprincipauxaspectsautourdelanotion(entrep^otde Resume
|
|
- Eléonore Pagé
- il y a 8 ans
- Total affichages :
Transcription
1 EdgardBentez-Guerrero,ChristineCollet,MichelAdiba Entrep^otsdeDonnees:SyntheseetAnalyse RR1017-I-LSR8 RAPPORTDERECHERCHE Mai1999
2
3 Entrep^otsdeDonnees:SyntheseetAnalyse EdgardBentez-Guerrero,ChristineCollet,MichelAdiba LaboratoireLogiciels,Systemes,Reseaux-IMAG BP72,38402SaintMartind'HeresCedex parlonsaussidestechniquesd'analyse(l'olap,l'orpaillageetlavisualisation) entrep^otavantdediscuterlesaspectsrelatifsasonstockageetsagestion.nous processusdeconstructionetlestechniquesderafra^chissementperiodiqued'un tueletlemodelelogiqueutilisespourconcevoirunentrep^ot.nousabordonsle parunebasededonneestraditionnelle.nousdecrivonsensuitelemodeleconcep- donnees)dansledomainedesbasesdedonnees.toutd'abord,nousintroduisonslescaracteristiquesd'unentrep^otetlescomparonsaveccellespresentees Nouspresentonslesprincipauxaspectsautourdelanotion(entrep^otde Resume 1Introduction chissementperiodique,sgbdmultidimensionnel,vuesmaterialisees,olap, Orpaillage,Visualisation. deperspectivesderecherchedanscedomaine. Motsclef:Entrep^otdeDonnees,CubedeDonnees,SchemaenEtoile,Rafra^- quipeuvent^etreappliqueessurl'entrep^ot.enn,nousidentionsunensemble etplusde30%ontprevudelefairedansles3ans[fra97].deplus,desentrep^ots 6000entreprisesenqu^etees,plusde40%ontdebutelamiseenplaced'unentrep^ot ontetemisenplaceavecsuccesdansplusieursindustriestellesquelafabrication,le Institute[DWI98],uneorganisationamericainedeprofessionnels,indiquequesurles timepourlesproduitsetlesservicesautourdestechnologiesdesentrep^otsdedonnees raison,ilssontdevenusdeselementsstrategiquespourlesentreprises.lemarchees- aeuunecroissanceenorme:ilestpassede2milliardsdedollarsen1994a8milliardsdedollarsen1998[cd97].uneetuderealiseeen1996parledatawarehousing LesEntrep^otsdeDonneessontindispensablesalaprisededecisionset,pourcette developpementetderecherchesuruneperiodedetempstrescourte[mh98][gre98]. commerce,lesservicesnanciers,letransport,lestelecommunications,lamedecine [CD97]etdanslesuniversites[HGML+95]. lasection4.lestockageetlagestiondesdonneesd'unentrep^otsontpresentesdans Denombreuxconceptsonteteproposesetilestparfoisdiciledes'yretrouver. donnees.ilestorganisedelamanieresuivante:lasection2presenteladenitionet d'unentrep^ot.laconstructionetlerafra^chissemend'unentrep^otsontintroduitsdans Cetarticletentedesynthetiserlesprincipauxconceptsassociesauxentrep^otsde lastructuredesentrep^otsetlasection3decritlemodeled'organisationdesdonnees Lethemedesentrep^otsdedonneesadoncdonnelieuadenombreuxtravauxde 1
4 2Caracteristique Donnees Usage Unitedetravail NombrededonneesDizaines BasedeDonnees Courantes Supportdel'operationSupportdel'analyse del'entreprise Entrep^otsdeDonnees:SyntheseetAnalyse accedees Moded'acces Transaction Typed'utilisateurEmploye Lecture/Ecriture Historiques del'entreprise Requ^ete Millions Lecture (principalement) section6etnalementlasection7conclutcetarticle. lasection5.lessystemesolap,l'orpaillageetlavisualisationsontabordesdansla Nombred'utilisateursMille Tab.1{BasesdeDonneesvsEntrep^otsdeDonnees Decideur Cent 2Entrep^otsdeDonneesetBasesdeDonnees basesdedonneesdessystemesexistantsdetypeon-linetransactionprocessing d'uneentreprisepourchercherdesavantagescompetitivessurlaconcurrence.les (OLTP)nesontpasappropieescommesupportdecesanalysesparcequ'ellesontete pertinentespourfairedesanalysessetrouventdissemineesentreplusieursbases.de concuespourdesfonctionsspeciquesrealisesdansl'entreprise.donc,lesdonnees plus,leurconceptionviseaameliorerlesperformancesdessystemesoltpparrapport autraitementd'ungrandnombredetransactions(courtesetfrequentes)demise-ajour,cequicompliquel'interrogation.unentrep^otdedonnees,parcontre,oredes LeconceptEntrep^otdeDonneessurgitapartirdesbesoinsd'analysedesdonnees suivantes: decision[inm92][inm95].lesdonneesd'unentrep^otpossedentlescaracteristiques donneesintegrees,consolideesethistoriseespourfairedesanalyses. {Orientationsujet.Lesdonneesd'unentrep^ots'organisentparsujetsouthemes. Ils'agitd'unecollectiondedonneespourlesupportd'unprocessusd'aideala {Integration.Lesdonneesd'unentrep^otsontleresultatdel'integrationde dessources. estleresultatd'unprocessusquipeutdevenirtrescomplexedual'heterogeneite Cetteorganisationpermetderassemblertouteslesdonnees,pertinentesaun lesstructuresfonctionnellesd'unentreprise. pourrealiseruneanalyseparticulieresetrouventdansl'entrep^ot.l'integration donneesenprovenancedemultiplessources;ainsi,touslesdonneesnecessaires sujetetnecessairesauxbesoinsd'analyse,quisetrouventrepanduesatravers {Histoire.Lesdonneesd'unentrep^otrepresententl'activited'unentreprisependantunelongueperiodeouilestimportantdegererlesdierentesvaleursqu'une donneeprisesaucoursdutemps.cettecaracteristiquedonnelapossibilitede suivreunedonneedansletempspouranalysersesvariations.
5 Bentez-Guerrero,Collet,Adiba 3 {Non-volatilite.Lesdonneeschargeesdansl'entrep^otsontsurtoututiliseesen interrogationetnepeuventpas^etremodiees,saufdanscertainscasderafra^chissement.extraction Epuration Chargement Orpaillage Visualisation OLAP Decisionnels Systèmes Données Entrepôt de Sources Externes Stockage Bases de Données Analyse Construction Rafraîchissement Fig.1{L'Entrep^otdeDonneesestlabasedessystemesdecisionnels L'entrep^otdedonnees(ED)joueunr^olestrategiquedansuneentreprisecomme lemontrelagure1.ilstockedesdonneesinteressantesenprovenancedessystemes OLTPdel'entrepriseetd'autressourcesexternes.Avantd'^etrechargeesdansl'entrep^ot,lesdonneesselectionneesdoivent^etreextraitesdessourcesetsoigneusement epurees,poureliminerdeserreursetreconcilierlesdierencessemantiques.apartir desdonneesd'uneddenombreusesanalysespeuventavoirlieu;pourcela,ilfaut associerauxsystemesdecisionnelsdestechniquesd'analysetelsquecellesdetype On-LineAnalyticalProcessing(OLAP),d'orpaillageetdevisualisation.L'informationetlaconnaissanceobtenuesparl'exploitationd'unentrep^otsontdirectement traduisiblesenbenecespourl'entreprise(augmentationdesventesautraversd'un marketingmieuxcible,ameliorationdestauxderotationdesstocks,etc.)[fra97]. Commeexemple,consideronsunecha^nedemagasinsrepartisgeographiquement dansplusieurspays,commelafranceetlemexique.l'analyseglobaledelacha^ne estunet^achetrescompliquee,maisunentrep^otdedonneesfournitlecadreideal pourl'eectuer.l'entrep^ots'organiseautourdessujetslesplusimportantspourla cha^ne,c'estadire,lesproduitsquiontetevendusdanslesmagasinsaucoursdu temps.lesdonneesnecesairespoureectuerdesanalysessontextraitesdedierents basesdedonneesetchiers(utilisesparchaquemagasinpoursupportersesactivitesquotidiennesdeventes)etintegreesdansl'entrep^ot.apartirdecetentrep^ot, legestionnairedelacha^nepeuteectuerdesanalysesetprendredesdecisionsqui aecterontlesactivitesfuturesdel'entreprise. Lesdonneesd'unentrep^otsestructurentselondeuxaxes:synthetiqueethistorique (cf.gure2)[fra97].l'axesynthetiqueetablitunehierarchied'agregationetcomprendlesdonneesdetaillees(quirepresententlesevenementslesplusrecentsaubas delahierarchie),lesdonneesagregees(quisynthetisentlesdonneesdetaillees)etles donneesfortementagregees(quisynthetisentaunniveausuperieurlesdonneesagregees).l'axehistoriquecomprendlesdonneesdetailleeshistorisees,quirepresentent desevenementspasses.lesmetadonneescontiennentdesinformationsconcernant lesdonneesdansl'entrep^ot,tellequeleurprovenanceetleurstructure,ainsiqueles methodesutiliseespourfairel'agregation. L'entrep^otdedonneessetrouvesouventstockeetgereparunsystemedegestiondebasesdedonnees(SGBD)dansunordinateurnonlieauxsystemesOLTP del'entreprise.laprincipaleraisonpoureectuercetteseparationestladegradationeventuelledesperformancesdessystemesoltpprovoqueparl'executiondes
6 4 Entrep^otsdeDonnees:SyntheseetAnalyse Données fortement agregées M e t a Axe D Données agregées synthétique o n n é e s Données detaillées dansunsystemeoltp.cependantcescaracteristiquesnesontpascritiquespourles processusd'analysedel'entrep^ot,oulescheminsd'accesauxdonneessontdicilesa dutraitementdestransactionsetlescourtstempsdereponsesonttresimportants processusd'analysesurlesdonneesdel'entrep^ot[gup97b].lahauteperformance Fig.2{Lastructured'unEntrep^otdeDonnees Données detaillées historisées d'unentrep^ot. denirapriorietletempsdereponsen'estpasrigide. OLTP.Danslasectionsuivante,nousabordonslaproblematiquedelamodelisation miseenoeuvretotalementdierentesdecellesutiliseespourconstruireunsysteme Pourconstruireunentrep^ot,ilfautadopterdestechniquesdeconceptionetde Axe historique 3Modelisationdel'Entrep^ot 3.1ModeleMultidimensionneldeDonnees multidimensionneldedonnees. pasaussiclairsqueceuxdesutilisateursdessystemesoltp.danslasuitedecette section,nousexpliquonslemodeleconceptueldesentrep^otsdedonnees:lemodele etplusdicilesadenir.deplus,lesbesoinsdesutilisateursdel'entrep^otnesont donneesdessystemesoltp,parcequ'ilfautpenserentermesdeconceptsplusouverts Laconceptiond'unentrep^otdedonneesesttresdierentedecelledesbasesde elementaires(entites)encherchantl'eliminationdesredondances,cequiprovoque Relation(E-R).Cemodelepermetdefaireladescriptiondesrelationsentredonnees LaconceptiondesbasesdedonneesestengeneralbaseesurlemodeleEntite-
7 devientcompliqueetlediagrammegeneredevientdicileacomprendrepourune Bentez-Guerrero,Collet,Adiba l'introductiond'unnombreimportantdenouvellesentites.ainsi,l'accesauxdonnees personne.pourcetteraison,l'utilisationdelamodelisatione-rpourlaconception d'unedn'estpasappropriee[col96b]. teeauxbesoinsdel'analysedesdonneesd'unentrep^ot[kim96].cemodelepermet Lemodelemultidimensionneldedonnees(MMD)estunealternativemieuxadap- 5 auxdonneesetenplusestfacileacomprendreycomprispourlespersonnesquine d'observerlesdonneesselonplusieursperspectivesouaxesd'analyse,facilitel'acces sontpasexperteseninformatique.pourcetteraison,cemodeleaeteadoptepar lespraticiens[kim97][inm92]etparleschercheursdesbasesdedonnees[ags95] [TDV97]pourorganiserlesdonneesd'unentrep^ot. (ousimplementcube1)[tdv97].uncubeorganiselesdonneesenuneouplusieurs 3.1.1LeCubedeDonnees LeconstructeurfondamentaldumodelemultidimensionnelestleCubedeDonnees Fig.3{UnexempledeCubedeDonnees peutprendredierentesvaleurs.lesdimensionspossedentengeneraldeshierarchies associeesquiorganisentlesattributsadierentsniveauxpourobserverlesdonnees adierentesgranularites.unedimensionpeutavoirplusieurshierarchiesassociees, chacunespeciantdierentesrelationsd'ordreentresesattributs. lyse.chaquedimensionestformeeparunensembled'attributsetchaqueattribut dontonregardelesdonneespourlesanalyser,alorsqu'unemesureestunobjetd'ana- dimensionsquideterminentunemesured'inter^et.unedimensionspecielamaniere en1994danslemagasinsitueaannecy. presentelecubeventes,quimontreque1000unitesduproduitontetevendus (representeparlavilleauquelilappartient)auninstantdutemps.lagure3 cas,lamesured'inter^etestlaquantited'unproduitvendudansunmagasin cube.cependant,cetermeestutilepourcomprendrelemodeleenutilisantunemetaphoregraphique. Pourcetteraison,danscetarticlenouscontinueronsautiliserceterme. multidimensionnel,uncubeestunemaniered'organiserdesdonneeset,enrealite,cen'estpasun 1.Engeometrie,uncubedesigneuncorpssolideasixfacescarreesdetailleegale;danslemodele Consideronsunmodelemultidimensionnelpourlacha^nedemagasins.Dansce PRODUIT P2 P3 Lyon Grenoble Annecy MAGASIN TEMPS 1994
8 6produitsetaoperependant3annees(1095jours),alorsilyaplusde5millionsde lesproduitsnesontpastousvendusdanstouslemagasinspendantlesm^emesperiodes seulementunnombretresfaibledescellulesd'uncubeaientunevaleur.parexemple, combinaisonspossibles(auniveaujour),chacuneavecuneventepotentielle.sil'on detemps.sil'onconsiderequelacha^nedemagasinspossede50magasins,vend1000 Lesdonneesmultidimensionnellessontdenatureeparsecarilestpossibleque Entrep^otsdeDonnees:SyntheseetAnalyse onpeutdirequ'ilyaunedispersionde99%. supposequelesdonneessontdisponiblespourseulement1%deventes(plusde5000), rationsonteteproposees[sah95]: {SliceouRotation EtantdonneelarepresentationsousformedeCubed'unentrep^ot,plusieursope- Fig.4{DataSlice {Dice {Roll-UpetDrill-Down Fig.5{DataDice P R O D U I T PRODUIT P2 P3 P2 P Lyon Grenoble Annecy Lyon MAGASIN Grenoble MAGASIN Annecy TEMPS TEMPS 1994 M A G A S I N Lyon Grenoble Annecy P3 PRODUIT P3 P2 PRODUIT Lyon Annecy MAGASIN TEMPS TEMPS
9 Bentez-Guerrero,Collet,Adiba 7 LaRotationouSlicepermetd'avoiraccesauxdierentesvuesdedonneessans lesreordonnerphysiquement.pouruncubea3dimensionsilexistesixvuespossibles etpour4dimensions,12.engeneral,uncubedendimensionsan(n 1)vues possibles.ondenotel'operateursliceparslicedimension(cube).lagure4presente leresultatdel'applicationdel'operateurslicesurlecubeventesselonladimension MAGASINetquiestdenoteepar: SliceMAGASIN(VENTES). L'operateurDicepermetderestreindrelesvaleursdansuneouplusieursdimensions.OnvadenotercetoperateurparDicerestriction(CUBE).Ainsi,lagure5presenteleresultatdel'applicationdeDicesurlescubeVENTESpourselectionnerles ventesdesproduitsetp3danslesmagasinsdelyonetdeannecypendantles anneesde1994etde1996etquiestdenoteepar: DicePRODUIT6=P2^MAGASIN6=Grenoble^TEMPS6=1995(VENTES) P R O D U I T France TEMPS P2 P3 P4 P P R O D U I T Creteil Lyon Annecy Grenoble Paris Ile de France P R O D U I T ROLL-UP DRILL-DOWN TEMPS P2 P3 P4 P MAGASIN Lyon Grenoble Annecy Creteil Paris France région ville pays Alpes Rhône TEMPS P2 P3 P4 P Ile de Alpes France Rhône Fig.6{RollUpetDrillDown LesoperateursRoll-UpetDrill-Downautorisentl'analysededonneesadierents niveauxd'agregationenutilisantdeshierarchiesassocieesachaquedimension.l'operateurroll-upeectuel'agregationdesmesuresallantd'unniveauparticulierversun general,alorsquedrill-downrealisel'operationinverse.ondenotel'operateurroll- UpparRollUpniveausuperieur niveauinferieur(cube),alorsquel'operateurdrill-downestdenote pardrilldownniveauinferieur niveausuperieur(cube). Lagure6montrel'applicationdesoperateursRoll-UpetDrill-DownsurladimensionMAGASIN,quiaassocieelahierarchie\ville!region!pays".Cettehierarchie determinelesrelationsquiexistententrevillesetregions,etentreregionsetpays.la guremontreaussiuneinstancepossibledecettehierarchie,quiregroupelesvilles
10 8Formalisme Hypercube (Agrawalet.al.,1995) Cube IntroductionOperateurs deshierarchies Entrep^otsdeDonnees:SyntheseetAnalyse Multidimensionnel (LietWang,1996) Table N-Dimensionnelle (Gyssenset Relations Pull,Push,DestroyDimension, Lakshmanan,1997) Fonctions Restriction,Merge,Join Cube AddDimension,Transfer,RC-Join (Thomaset.al.,1997)entreattributsAggregation,CartesianProduct, Construct,CubeAggregation, F-table Unfold,Fold,Selection (Cabibbo OrdrepartielPull,Push,Partition Projection,Renaming,Union ettorlone,1998)tab.2{formalismesproposes OrdrepartielRoll-Up entreattributsintersection,dierence, Sumarization,Classication Join,Union,Dierence appliquerl'operateurroll-upsurladimensionmagasin,ensommantlestotauxde FrancedanslepaysFrance.Pourdeterminerletotaldeventesauniveauregion,ilfaut ensommantlesventestotalesdechaqueregion.l'operateurdrill-downeectueles deparisetcreteildanslaregionile-de-franceetlesregionsrh^one-alpesetile-de- chaqueville: Lem^ememecanismes'appliquesionveutcalculerletotaldeventesauniveauPays, operationsinverses: DrillDownville RollUpregion ville(ventes) duitsvisentacouvrirlesbesoinsdesutilisateursetchaqueproduitfournitsapropre visiondumodeleetdesoperationsassociees.donciln'existepas(i)unformalisme lemarche([ken97],[app98],[as98],parexemple).lesservicesproposesparcespro QuelquesFormalismesProposes industrielleetmaintenantdenombreuxproduitsbasessurcemodelesetrouventsur Lemodelemultidimensionneldedonneesaattirel'attentiondelacommunaute region(ventes) sous-jacentquifacilitel'ecriturederequ^etescomplexesdontlesagregationsadhoc avechierarchiesmultiplesetmesurescomplexes,et(ii)unlangaged'interrogation independantdelamiseenoeuvrequiautoriseladenitiondedimensionsstructurees deniesparunefonctionquiassocieaunecombinaisondevaleursdesdimensions(i) percube.unhypercubeestdetermineparkdimensionsetseselements(cellules)sont HypercubeAgrawaletal.[AGS95]proposentunmodelebasesurlanotiond'hy- rechercheaproposeplusieursformalismes(cf.table2). soientautorisees[ags95][bshd98].pourpalliercettesituation,lacommunautede
11 lacombinaisonexiste,ou(iii)unn-uplet,s'ilexistedel'informationsupplementaire associeeauxelements;ladescriptiondescomposantsd'unn-upleteststockeecomme multiplesetd'agregationsad-hoc. unemetadonnee.cemodeleutilisedesfonctionspourladenitiondehierarchies Bentez-Guerrero,Collet,Adiba lavaleur0,silacombinaisonn'existepasdanslabasededonnees,(ii)lavaleur1,si 9 Fig.7{L'HyperCubedeAgrawaletal.Leselementsdel'hypercube(a)prennentdes n-upletsou0commevaleuralorsqueceuxde(b)prennentlesvaleurs1ou0 MAGASINetTEMPS,etseselementssontdesn-uplets(parexemple<1000;:::> viseunemiseenoeuvresurunsgbdrelationneletsembleplut^otpragmatique. etladierence,ainsiquel'agregationcommeroll-upetdrill-down.cetteapproche d'autresoperateursdetyperelationneltelsquelaprojection,l'union,l'intersection senterleshierarchies.lesoperateursproposespeuvent^etrecomposespourconstruire queleurdenitionsoitcomplexeacausedel'introductiondesfonctionspourrepre- minimal(unoperateurnepeutpas^etreeliminesanspertedesfonctionnalites)bien Lagure7(a)presentel'hypercubeVENTESdontlesdimensionssontPRODUIT, Lesoperateurs(cf.table2)ontunesemantiquebiendenieetformentunensemble caslen-uplet<quantite;:::>).lagure7(b)presenteunautrehypercubeavecles dimensionsproduit,magasinetquantiteetseselementsprennentlavaleur pourl'elementquicorrespondaproduit=p2,magasin=lyonet TEMPS=1994)oulavaleur0(pourleselementsnonrepresentesdanslagure).La metadonneededescriptiondeselementsestuneannotationdel'hypercube(dansce 1(parexemple,l'elementquicorrespondaPRODUIT=P2,MAGASIN=Lyon etquantite=1000)oubienlavaleur0. ensortie.ilspeuvent^etrecomposespourexprimerdesrequ^etescomplexes. CubeMultidimensionnelPourLietWang[LW96]unebasededonneesmultidimensionnelleestunensemblenideCubesMultidimensionnelsetunensembleni derelations.uncubemultidimensionnelconsisteenuncertainnombrederelations (lesdimensions)etpourchaquecombinaisonden-uplets,unn-upletpourchaque dimension,ilexisteunevaleurassociee(unemesure).danscemodele,lesmesures teurs(cf.table2)prennentdescubesetrelationsenentreeetproduisentdescubes nepeuvent^etrequedesvaleursnumeriques.lesauteursintroduisentlanotionde relationsderegroupementcommemoyenpourrepresenterdeshierarchies.lesopera- P R O D P2 U I T P3 <Quantité,...> <1000,...><1000,...> Lyon Grenoble MAGASIN (a) <1000,...> Annecy <2000,...> TEMPS 1994 P R O D P2 U I T P3 1 1 Lyon Grenoble Annecy MAGASIN (b) QUANTITE 1000
12 lavaleurassociee100.lapartie(b)delagure8montrelarelationquiregroupeles PRODUIT=<;10;Noir>etTEMPS=<15;Mai;1996>,ilexiste villesdegrenoble,lyonetannecydanslaregionrh^one-alpesetlesvillesdecreteil etparisdanslaregionile-de-france. PRODUIT,MAGASINetTEMPS.Pourlesn-upletsMAGASIN=<Grenoble>, Lagure8(a)montrelecubemultidimensionnelVENTESformeparlesrelations Entrep^otsdeDonnees:SyntheseetAnalyse TablesN-dimensionnellesGyssensetLakshmananproposentdans[GL97]un formalismeautourdelanotiondetablen-dimensionnelle.uneinstancedecetypede (b)relationderegroupement Fig.8{LeCubeMultidimensionneldeLietWang.(a)CubeMultidimensionnel. tableestunensemblederelations,unepourchaquedimensionetuneautrepourles Rhône-Alpes mentionneesetellessontincorporeesendenissantdesfonctions.lesoperateurs cube.lesauteursmontrentqu'unetablen-dimensionnellepeut^etrerepresenteepar proposes(cf.table2)prennentenentreeuncubeetproduisentensortieunautre semantiquedesoperateurs.enfait,chaqueoperateurconvertitlatablestructureendimensionnelleenunerelationclassique,eectuelesoperationsnecessairesetconvertit cetterelationenunetablen-dimensionnelle.lesoperateursproposespeuvent^etre composespourenexprimerd'autres,commeroll-up. PRODUITetTEMPS,etlamesureVENTES.LesattributsNometPoidssontassociesaPRODUIT,alorsquelesattributsMoisetAnneesontassociesaTEMPS. Onpeutvoirdanscettegureque100unitesduproduitontetevendusaumois quiestformeeparlesrelationsrproduit,rtempsetrm.chaquen-upletdesrelationsrproduitetrtempsestvuecommeune\coordonnee"danslesdimensions PRODUITetTEMPSrespectivement,alorsqu'unn-upletdermrepresentelavaleur dejanvier1996.lapartie(b)delam^emegurepresenteuneinstancedeventes, associeeaunecombinaisondecoordonnees,unecoordonneepourchaquedimension. Lagure9(a)presentelatablebi-dimensionnelleVENTESaveclesdimensions unerelationclassiqueetvice-versaetc'estapartirdeceresultatqu'ilsdeveloppentla clesdedimensionetlesmesuresrespectives.leshierarchiesnesontpasexplicitement unensembledecubes,denisentermesdedimensions,mesures,attributsetfonctionsquiassocientlesattributsauxdimensions.ilestpossiblededenirdesschemas CubePourThomaset.al.[TDV97]unebasededonneesmultidimensionnelleest MAGASIN PRODUIT TEMPS Ville Nom Poids Couleur Jour Mois Année Grenoble 10 Noir 15 Mai Grenoble P2 10 Noir 15 Mai Annecy 20 Noir 15 Mai Lyon P2 20 Blanc 15 Mai Creteil 10 Blanc 15 Mai Paris P2 10 Blanc 15 Mai (a) Quantité Region Rhône-Alpes Rhône-Alpes Ile-de-France Ile-de-France MAGASIN.Ville (b) Grenoble Annecy Lyon Creteil Paris
13 Bentez-Guerrero,Collet,Adiba 11 representeesetellesdoivent^etredeniesaprioricommeunordrepartielentreles nnelle(b)instancedelatablebi-dimensionnelle decubes,quispecientdemaniereabstraitelastructured'uncube.apartird'un schema,desinstancespeuvent^etrecreees.leshierarchiesnesontpasexplicitement Fig.9{TableN-DimensionnelledeGyssensetLakshmanan.(a)Tablebi-dimensio- Lesoperateurspeuvent^etrecomposespourdenird'autresoperateurscommeRoll-Up simplesdesoperateursalgebriques,ouchaqueoperateurexecuteunefonctionunique. etdrill-down. attributsd'unedimension.lesoperateursdel'algebreproposee(cf.table2)prennent enentreeuncubeetproduisentensortieuncube.lemodelefournitdesdenitions D1(PRODUIT),D2(MAGASIN)etD3(TEMPS).L'attributa1deladimension a3deladimensiontempsest\annee". PRODUITest\nom",l'attributa1deladimensionMAGASINest\ville"etl'attribut Fig.10{LeCubedeThomasetal.Cetteguremontreuncubeetsescomposants Lagure10montrelecube(instancedecube)VENTESdeniparlesdimensions VENTES P R O D U I T Nom P2 Poids Mois TEMPS Année Vente a1 = Nom (a) D1 = PRODUIT Jan Fev... Jan Fev P2 P Lyon Grenoble Annecy a1 = Ville <1000> D2 = MAGASIN rproduit Tid Nom Poids t1 t2 t3 t4... P2 P2... rm t1 t2... t1 t2 VENTES rtemps P.Tid T.Tid Quantité t1 t1... t2 t2 (b) Tid Année Mois t1 t2 t3 t Jan Fev Jan Fev a3 = Année 1994 D3 = TEMPS
14 12 F-tablesCabibboetTorlone[CT98]proposentuneformalismeautourdelanotion def-table,quiestunefonctiondescoordonneesdesdimensionsauxmesures.ilest possibledespecierleschemad'unef-tableetdedenir,apartirdeceschema,unensembled'instances.ceformalismeautoriselastructurationcomplexedeshierarchies Entrep^otsdeDonnees:SyntheseetAnalyse d'interrogation[ct97]estbasesurlalogiquedupremierordreetdoncautorisel'ecriturederequ^etesdefacondeclarative.celangagepermetl'incorporationdesfonctions d'agregationmieuxadaptesauxbesoinsdudomained'application. dansunedimension,endenisantdesordrespartielsentresesattributs.lelangage dimensiontempsauniveaujour.lapartie(b)delagure11montreuneinstance produits.lesattributs\v",\p"et\j"deceschemarepresentent,respectivement,la lesventesdelacha^nedemagasins,mesureesentermesdelaquantitevenduede dimensionmagasinauniveauville,ladimensionproduitauniveaunometla Onpeutvoirdanslapartie(a)delagure11leschemadelaf-tablequirepresente Fig.11{Lesf-tablesdeCabbiboetTorlone.(a)Schema(b)Instance deceschema. implantedirectementpardessystemesspecialises,appelessgbdmultidimensionnels, 3.2ModeleLogique modeleslogiqueslesplusutilises. nauteindustrielleadeveloppedesmodeleslogiquesadhocpourfairefaceauxpres- sionsdumarcheetalaforteconcurrence.danslasectionsuivante,nousabordonsles Lemodelemultidimensionneldedonneesdecritdanslasectionprecedenteest Malgrel'absenced'unformalismeconceptuelcommunementaccepte,lacommu Schemaenetoile sousformed'etoile,deocondeneigeetdeconstellationdefaitsonteteproposes. presentesdanslasection5.cependant,lamiseenoeuvredumodeleducuben'est pourunnombreelevederelations[ks95b].pourevitercesdesavantages,lesschemas pasrestreinteacetypedesgbd. faitsetchaquedimensionparunerelationdedimension.larelationdefaitsreference approprieepourunentrep^otacausedugrandnombredejointuresetderestrictions Dansleschemaenetoile[Kim96],lesmesuressontrepresenteesparunerelationde Larepresentationdedonneesenrelationsentroisiemeformenormalen'estplus VENTES [v : ville <MAGASIN>, p : nom <PRODUIT>, j : jour <TEMPS>] : quantité (a) v Grenoble Grenoble Annecy Lyon Creteil Paris p P2 P2 P2 (b) j 15 Mai Mai Mai Mai Mai Mai 1996 VENTES
15 Bentez-Guerrero,Collet,Adiba 13 Produit Magasin Temps Quantité DIMENSION Nom Poids Couleur Produit DIMENSION DIMENSION Ventes Produit Magasin Temps Ville Magasin Jour Mois Année Temps Region Pays RELATION DE FAITS Fig.12{SchemaenEtoile lesrelationsdedimensionenutilisantunecleetrangerepourchacuneetstockeles valeursdesmesurespourlacombinaisondescles.autourdecetterelationgurentles relationsdedimensionquiregroupentlescaracteristiquesdesdimensions.larelation defaitsestnormaliseeetpeutatteindreunetailleimportanteparrapportaunombre den-uplets;parcontre,lestablesdedimensionsontdenormalisees(c'estadire,des dependencesfonctionnellespeuvent^etretrouveesentrelesattributs)etsontengeneral d'unefaibletaille.lagure12montreleschemaenetoilepourlecubeventesou larelationdefaitsstockelaquantitedeproduitsvendusetlesrelationscorrespondant aproduit,amagasinetatempscomportentlesinformationsinteressantes surcesdimensions SchemaenformedeFlocondeNeige Leschemaenetoilenereetepasleshierarchiesassocieesaunedimension.Pour resoudreceprobleme,leschemaenformedeocondeneigeaetepropose.ceschema normaliselesdimensions,reduisantlatailledechacunedesrelationsetpermettant ainsideformaliserlanotiondehierarchieauseind'unedimension[fra97].lagure13montrelesrelationsnecessairespourrepresenterunniveaudeshierarchies desdimensionsmagasinettemps Constellationdefaits Ilestpossibled'avoirplusieursrelationsdefaitspourrepresenterlessituations danslesquelleslesfaits(mesures)nesontpasdeterminesparexactementlem^eme ensemblededimensions.danscecas,lesrelationsdefaitsformentunefamille[ks95b] quipartageplusieursrelationsdedimensionmaisouchaquemembrepossedeses dimensionspropres.bienentendu,silesrelationsdefaitspartagentunedimension, ilfautverierquecettedimensionestexactementlam^eme.leschemaresultant s'appelleconstellationdefaits[cd97]. Lesschemasrelationnelsadaptesauxbesoinsdumodelemultidimensionnelpossedentuneseried'avantagesparrapportauxschemasentroisiemeformenormale. L'etoile,leoconetlaconstellationautorisentl'expressiondesmesures,desdimensionsetdeshierarchies,d'unemanieresimplequipermetdelesdistinguerclairement
16 14 Entrep^otsdeDonnees:SyntheseetAnalyse Jour Mois Temps Année Mois Mois Produit Magasin Temps Quantité DIMENSION Nom Poids Couleur Produit DIMENSION DIMENSION Ventes Produit Magasin Temps Ville Magasin Region Region Region Pays RELATION DE FAITS Fig.13{SchemaenFlocondeNeige etdoncilssontfacilesacomprendre.cesschemasfacilitentegalementl'accesaux mesures,m^emesilatailled'unrelationdefaitsestsouventimportante,parcequele nombredejointuresestpluspetit. 4ConstructionetRafra^chissementdel'Entrep^ot 4.1Construction Lesdonneesintegreesdansunentrep^otontunegrandevaleurpouruneentreprise.Orleurintegrationn'estpasunet^achefacile,parcequ'engenerallesdonneesse trouventdissemineesdansdemultiplessourcesquipossedentleurspropresstructures, formatsetdenitions.enplus,cessourcespeuventcontenirdeserreurs,commedes valeursmanquantes,desvaleursillegalesoudescontradictions,desvaleursincoherentesetdesrelationsinvalides[mos98].pourcesraisons,lesdonneesenprovenance desourcesheterogenesdoivent^etretraiteesavantd'^etrechargeesdansunentrep^ot [Boh97].Cetraitementsecomposedetroisphases: 1.Extractiondesdonneesapartirdeleurssourcesetconversiondansunerepresentationintermediaire. 2.Epurationpardesmecanismesquiassurentleurqualite. 3.Chargementdesdonneesdansl'entrep^ot. Desestimationsindiquentquelaplupartdutemps(80%enmoyenne)dela constructiond'unentrep^otestdedieacest^aches[inm92].cependant,laplupart desentreprisessous-estimentlacomplexitedeceprocessus,m^emes'ilpeut^etredeterminantpourlesuccesdel'entrep^otetpourlaqualitedesanalyses[cm95]. 4.2Rafra^chissementPeriodique Leprocessusdedetectiondechangementsdanslessourcesetleurpropagation versl'entrep^otestconnusouslenomderafra^chissement[wb97].ceprocessusse realiseperiodiquementetlaperiodedependdesbesoinsdesutilisateursetdelacharge
17 d'accesal'entrep^ot.lestechniquesderafra^chissementpeuvent^etreclasseesdans Bentez-Guerrero,Collet,Adiba Lapremiereestlatechniquelaplussimpleetconsisteaprendreunephotographie tique,cellebaseesurdestimestampsetcellebaseesurlacomparaisondechiers. instantparticulierdansletemps.danscettecategoriesetrouventlatechniquesta- deuxcategories:statiquesetincrementielles[bt98]. Lestechniquesstatiquesprennentunephotographiedesdonneessourcesaun 15 etlesintegrerdansl'entrep^ot. acomparerl'etatcourantd'unchieravecl'etatanterieurpourtrouverlesdierences rafra^chissement.finalement,lacapturebaseesurlacomparaisondechiersconsiste donneesetquiindiqueletempsdesamiseajourlaplusrecentepoureectuerla timestampsutiliseuneinformationsupplementaire(nommeetimestamp)associeeaux photographiedesdonneesdontladatedutimestampestposterieureacelledudernier dessourcesetareconstruirel'entrep^otenutilisantcelle-ci.lacapturebaseesurdes triggersesttressemblablealatechniqueprecedentemaisladetectiondeschangementsetlesdiversesoperationssontrealiseespartriggersdanslabasededonnees. d'identierleschangementsdanslesdonneesetdestockerceschangementsdansune zonetemporairepourlesutiliseranderafra^chirl'entrep^ot.lacaptureassisteepar parl'applicationrequiertdelapartdesapplicationsquitraitentlesdonneessources tion,partriggersetparlejournalsetrouventdanscettecategorie.lacaptureassistee lessourcesaumomentouilsarrivent.lestechniquesdecaptureassisteparl'applica- Lestechniquesincrementiellesderafra^chissementcapturentleschangementsdans Finalement,lacaptureparlejournalutilisecetteinformationpropreauSGBDpour chercherleschangementsinteressants. 5StockageetGestion tuerlestockageetlagestiondedonneesmultidimensionnelles. 5.1SGBDMultidimensionnel Danscettesection,nousdecrivonslestechniqueslesplusimportantespoureec- cellelaplusutiliseepourlestockagedesdonneesmultidimensionnelles[sho97].dans cettetechnique,unnombreestassocieachaquevaleurpossibled'unedimension. modelemultidimensionneletsespropresstrategiesdestockageetdegestion. lemarche(essbased'arborsoft,holosdeseagate,etc.)utilisesapropreversiondu technologiquecommunpourledeveloppementdessgbdmdcarchaqueproduitsur detraiterdesdonneesmultidimensionnelles.actuellement,iln'existepasdecadre Ilestpossiblecependantdedistinguerlatechniquedearraylinearisationcomme UnSGBDMultidimensionnel(SGBDMD)estunSGBDcapabledestockeret eparsedesdonnees.laplupartdessgbdmdutilisentunestrategieadeuxniveaux destechniquesdecompressiondoivents'appliquerpourreduirel'espacedestockage. niqueestapproprieelorsquel'espacemultidimensionnelestdense;danslecascontraire, nombresassociesauxvaleursdesdimensionsquideterminentlacellule.cettetech- Lapositiond'unecelluledansunvecteurmultidimensionnelestlacombinaisondes unegeneralisationanniveauxdecettetechniquedebase,ouunarbreb+estconstruit danslaquellelesdimensionsdensessontindexeesparunestructurequistockeles combinaisonsdevaleursdesdimensionseparses[dshb98].colliat[col96b]presente Lestechniquesd'indexationsontunesolutionalternativepourtraiterlanature
18 feuillescontiennentdespointeursverslesblocsdesdimensionsdenses. 5.2SGBDRelationnel 16 apartirdescombinaisonspossiblesdesvaleursdedimensionseparsesetdontles Entrep^otsdeDonnees:SyntheseetAnalyse cetypedesystemes.cependant,lessgbdrdoivent^etreadaptesparcequ'ilsne plupartdeseortsquivisentalaconstructiond'unentrep^otdedonneesconsiderent Danscettesection,nousabordonscesadaptations ExtensionsdulangageSQL possedentpaslescaracteristiquesadequatespourrepondreauxbesoinsdesentrep^ots. environ80%dumarchedessystemesdegestiondebasesdedonnees.decefait,la Lessystemesdegestiondebasesdedonneesrelationnelles(SGBDR)representent dicilesvoireimpossiblesaexprimer[ks95a].pourfaciliterl'expressiondesrequ^etes fonctionsprimitivespourlesanalyser.cependant,lesanalyseslesplussimplessont l'expressionderequ^etespourlesdonneesrelationnellesetfournitunensemblede pouranalyserunentrep^ot,lescommunautesindustrielleetderechercheontpropose desextensionsasql.danslasuitedecettesection,nousabordonscesextensions. Lelangaged'interrogationstandarddesSGBDRestSQL.Celangageautorise vendus: vanteordonnelesproduitsparlaquantitevendueetacheseulementlescinqlesplus fonctionscommerank,percentileetd'autresdetypenancieronteteincorporees dansl'extensionrisqldusgbdrredbrick[rbs96].parexemple,larequ^etesui- permetdeconna^treles5produitslesplusvendus)sontnecessaires.acepropos,des l'anneederniere)etletraitementsequentieldesdonneesresultatd'unerequ^ete(qui SUMetAVG.Cesfonctionssontutilesmaisinsusantespouranalyserlesdonneesd'un entrep^ot,oulescomparaisons(lesventesdecetteanneecompareesauxventesde LelangageSQLfournitunensembledefonctionsd'agregationtellesqueCOUNT, selectrank(quantite) fromventes estcalculeechaqueagregation.larequ^etesuivantecalculelecubepourlesattributs relationnelledesdonneesetutiliselavaleur\all"pourdenoterl'ensemblesurlequel deplusieursoperationsgroup-by.l'operateurcubeestbasesurunerepresentation dimensionsdel'operateurgroup-by.cetoperateurcalculelesgroup-bypourtous lessous-ensemblespossiblesdesnattributs(dimensions)etestequivalental'union L'operateurcubeproposeparGrayetal.[GCB+97]estlageneralisationenn whenrank(quantite)<=5 Agarwaletal.[AAD+96]modelisentlescalculseectuesparcubecommeunehie- delarelationventes: Lamiseenoeuvreecacedecetoperateuraattirel'attentiondeschercheurs. from groupbycubeproduit,magasin,temps select ventes Produit,Magasin,Temps,SUM(quantite)
19 desoperationscommunesentreplusieursgroup-byetquiutilisentdescalculsdeja [GL98]proposent,dansuncontextedefederationdebasesdedonnees,lelangagenD- eectuespourencalculerd'autres.l'evaluationempiriquemontrequeeectivement rarchied'operationsdetypegroup-byetproposentdesalgorithmesquicombinent Bentez-Guerrero,Collet,Adiba l'utilisationdecesalgorithmesameliorelesperformancesducalcul. D'autresextensionsaSQLonteteproposees.Parexemple,GingrasetLakshmanan Vuesmaterialisees commecube. relationnellesavecdesschemasheterogenesetsupportedesoperateursd'agregation SQL.Celangageeliminelesdierencessemantiquesentreplusieursbasesdedonnees pourrepresenterlesagregationsdesrelationsd'unschemaenetoile.lesrequ^etes ensemblederelationsalorsqu'unevuematerialiseeestl'extension(lesdonneesm^emes) peuventutilisercesdonneespre-agregeesetonpeutainsiaugmenterlesperformances d'unevue[rou97].dansunentrep^otdedonnees,lesvuesmaterialiseessontutilisees dusysteme. Unevueestunespecicationpourderiverunenouvellerelationapartird'un Unevuematerialiseepeutaideraenconstruired'autresetainsidesuite.Unproblemeimportantestlaselectiond'unensembleminimalapartirduquelonpourrait [Ull96]:lamaterialisationdetouteslesvues,lamaterialisationd'aucunevueoula deriverlesautresvues.ilexistetroisapprochespourlaselectiondecetensemble Fig.14{Treillisdevues P ladeuxiemenefournitaucunavantagepourlesperformancesdusysteme.ainsi,la sabled^ualaquantited'espacenecessairepourmaterialisertouteslesvuespossibles, selectiondevuesamaterialiseretproposeunalgorithmegeneralavecplusieursheuristiques.parailleurs,harinarayanetal.[hru96]modelisentleproblemesouslaformser.guptapresentedans[gup97a]uncadretheoriquedetravailpourleproblemede materialisationselectivedequelquesvues.tandisquelapremiereapprocheestinfai- seulesolutionplausibleestlamaterialisationselective. dansunerequ^eteetontunco^utdetermineparleurnombreden-uplets.lagure14 d'untreillisdevues,outouteslesvuesontlam^emeprobabilited'^etredemandees Ilexistedestravauxquiabordentleproblemedelaselectiondevuesamateriali- PT P M T PM M aucune MT T
20 etrestreintlarechercheaunenombrexedevuesamaterialiser,enminimisantle tempsmoyend'evaluationdechacuned'entreelles.lesauteursmontrentquecetalgorithmepresentedesperformancestresprochedel'optimal;cependant,ilparcourt 18 montreletreillisdesvuespossiblesapartirdesdimensionsproduit(representee parp),magasin(representeeparm)ettemps(representeepart). L'algorithmeproposefaitlaselectiondesvues(amaterialiser)apartirdecetreillis Entrep^otsdeDonnees:SyntheseetAnalyse proposentl'algorithmepbsquiessaied'evitercesdesavantages. tresimportantdanslapratique.pourpalliercessituations,shuklaetal.[sdn98] lement,perdredesbonnessolutions.enplus,sontempsd'executionpeutdevenir l'espacedessolutionspossiblesaunniveauelevedegranulariteetilpeut,eventuel- unerequ^eteentermesdesrelationsdebase.ceproblemeestidentiedans[lmss95] leselementspertinentsdutreillismultidimensionnelparrapportauxbesoinsdesutilisateurs.unefoismaterialisees,trouverlesvueslesplusapproprieespourrepondrmancesdecestechniquessedegradentamesurequelenombreetlacomplexitedes l'entrep^otpossedeunnombrefaiblededimensions,etpourcetteraison,lesperfor- Lestechniquesproposeespourlaselectiondevuesamaterialiserconsiderentque aunerequ^eten'estpasevident,surtoutsil'onconsiderequel'utilisateurexprime proposentunetechniquequireduitl'espacedessolutions,enconsiderantseulement dimensionsaugmentent.cettesituationaeteidentieeparbaralisetal.[bpt97]qui parlevyetal.quiconsiderentleproblemedelareecrituredesrequ^etesenutilisant seulementlesvuesmaterialiseesdisponibles IndexationBinaire (parexemplelesoperateurslogiqueset,ou)demaniereperformante[oq97]. len-upletassocieeestmembredelalisteou0danslecascontraire.unindexbinaire estunestructuredetaillereduitequipeut^etregereeenmemoire,cequiamelioreles performancesdusgbdr.deplus,ilestpossibled'executerdesoperationslogiques cevecteur,chaquen-upletd'unerelationestassocieeaunbitquiprendlavaleur1si indexbinaire[og95]utiliseunvecteurdebitspourrepresenterunetelleliste.dans (oud'ungrouped'attributs),lalistedesn-upletsquicontiennentcettevaleur.un Cettetechniqued'indexationestapproprieelorsquelenombredevaleurspossibles Dansunerelation,unindexassocie,pourchaquevaleurpossibled'unattribut d'unattributestfaible.evidement,leco^utdemaintenancepeut^etreelevecartous destockageaugmenteenpresencededimensionsdegrandecardinalite,parcequ'il fautgererunequantiteimportantedevecteurseparsesquicontiennentpresquedans lesindexdoivent^etreactualisesachaquenouvelleinsertiond'unn-upletetl'espace leurtotalitedesbitsaveclavaleur0.pourevitercesproblemes,destechniquesde compressiondedonnees,commelerun-lengthencoding,sontutilisees.danscette technique,unesequencedebitsdelam^emevaleurestrepresenteedemanierecompacte parunepairedontlepremierelementestlavaleurdesbitsetledeuxiemeestlenombre debitsdanslasequence.l'utilisationdecetypedemethodedegradelesperformances dusgbdracausedelacompressionetladecompressiondesindex. 6.1SystemesOLAP lasynthese,l'analyseetlaconsolidationdynamiquedesdonneesmultidimension- 6Analysedel'Entrep^ot LestechniquesdetypeOn-LineAnalyticalProcessing(OLAP)[Cod93]eectuent
21 Bentez-Guerrero,Collet,Adiba 19 ploiterunentrep^otacausedesonorganisationmultidimensionnelle.lacombinaison decennie[pc98][oc98].lestechniquesolapsontlamanierelaplusnaturelled'ex- debutdesannees70maisellesontetedeveloppeesdansl'industriependantcette nelles.cestechniquessontapparuespourlapremierefoisauniveaurechercheau Fig.15{MOLAP classementsetdesprevisions.lessystemesolapsontsouventclassesparrapport ausystemedegestionutilisepourlestockageetlagestiondesdonnees;ainsi,ilen [Pil98].Cesmecanismescomprennentdesrequ^etesquiimpliquentdesagregations,des auxdonneesdel'entrep^otetluifournissantdepuissantsmecanismesd'interrogation leur.unsystemeolapaideledecideuraeectuerdesanalyses,luiautorisantl'acces OLAP[DMT98]. d'unentrep^otetdestechniquesolapassocieespourl'exploiters'appellesysteme existefondamentalementtroistypes:multidimensionnel,relationnelethybride. LessystemesOLAPtransformentlesdonneesd'unentrep^oteninformationdeva- dansunsgbdmd(cf.gure15).cessystemespresententuntempsdereponse 6.1.1SystemesMOLAP faibleauxcalculscomplexesparcequ'ilseectuentlapre-agregationetlepre-calcul desdonneessurtouslesniveauxdeshierarchiesdumodeledel'entrep^ot.celageneredegrandsvolumesdedonnees,enprovoquanteventuellementladegradationdes performancesdusysteme.enplus,lestechniquesincrementiellesderafra^chissement n'ontpasetesusammentdeveloppeesetilfautreconstruirel'entrep^otdemaniere periodique. LessystemesdetypeOLAPMultidimensionnel(MOLAP)stockentlesdonnees beaucoup[rad95].lesproduitsessbased'arborsoftwareco.[as98],pilotdepilot Software[Pil98]etTM1d'Applix[App98]appartiennentacettefamilledesystemes. depassepasquelquesgigaoctectsetlorsquelemodelemultidimensionnelnechangepas 6.1.2SystemesROLAP l'analysed'unentrep^otlorsquelaquantiteestimeepourlesdonneesd'unentrep^otne LessystemesMOLAPfournissentunesolutionacceptablepourlestockageet quifournitunevisionmultidimensionnelledel'entrep^ot(organisesousformed'etoile pourstockerl'entrep^ot(cf.gure16).lemoteurolapestunelementsupplementaire oudeocondeneige),descalculsdedonneesderivesetdesagregationsadierents LessystemesdetypeOLAPRelationnel(ROLAP)utilisentunSGBDRelationnel Bases de Données Sources Externes Integration OLAP Sources de Données SGBD Multidimensionnel Interface OLAP
22 20 Entrep^otsdeDonnees:SyntheseetAnalyse (cf.section5.2.2).enfait,l'ecacitedesrequ^etessqlgenereesparlemoteurolap auschemarelationneldel'entrep^otetquiprotentdesvuesmaterialiseesexistantes systemerolap[dshb98]. estlefacteurprincipalpourmesurerlesperformancesetlepassageaechelled'un niveaux.ilestaussileresponsabledelagenerationdesrequ^etessqlmieuxadaptees Fig.16{ROLAP peuventpresenteruntempsdereponseeleveetsontincapablesd'eectuerdescalculs complexes.lesexemplesdeproduitsdecettefamilledesystemesolapsontdss AgentdeMicroStrategy[Mic98]etMetaCubed'Informix[Inf98] SystemesHOLAP LessystemesROLAPpeuventstockerdegrandsvolumesdedonnees,maisils systemesolap. LesproduitsExpressd'OracleCorp.[Ora98],Media/MRdeSpeedwareCorp.[Spe97] etholosdeseagatetechnologyinc.[sea98]sontdesexemplesdecettefamillede etlesdonneesdetailleesdansunsgbdr.ainsi,ilestpossibledegererunegrande LAPetROLAP,enstockantlesdonneesagregeesd'unentrep^otdansunSGBDMD quantitededonneeset,enm^emetemps,d'avoiruntempsdereponseacceptable. larechercheversdeszonesinteressantesdansl'espacemultidimensionnel.cependant, Lessystemeshybrides(HOLAP)essaientd'eviterlesproblemesdessystemesMOl'espaceaanalyserpeut^etred'unegrandetailleetl'utilisateurn'estpascapablede l'explorer.danslasuite,nousabordonsdesmecanismespluspuissantset\intelligents" quiautomatisentunepartieduprocessusd'analyseetquisontconnussouslenom d'orpaillage. 6.2Orpaillage DanslessystemesOLAP,l'initiatived'analyseappartiental'utilisateurquidirige lastatistique,etlesbasesdedonnees.actuellement,ilexisteunnombreimportantdetechniquesd'orpaillagetellesquelaregressionlineaire,l'inductiond'arbres formationdegroupes. L'orpaillageouDataMiningestlarecherchedelaconnaissance,sousformedemodelesdecomportement,cacheedanslesdonnees[Fra91].L'orpaillageestundomaine jeunequisetrouveal'intersectiondesdomainestelsquel'intelligencearticielle, dedecision,lesalgorithmesgenetiques,lesreseauxdeneuronesetlesalgorithmesde classicationsouslaformed'unearbrededecision.l'algorithmeappliqueaconstruit donnees.danscecas,ils'agitd'induire,apartirdesn-upletsenentree,unmodelede Lagure17montrel'applicationd'unetechniqued'orpaillageaunensemblede Bases de Données Sources Externes Sources de Données Integration SGBD Relationnel Requête Reponse Moteur OLAP OLAP Interface OLAP
23 Bentez-Guerrero,Collet,Adiba 21 unarbredontl'attributleplusimportantpourdistinguerunn-upletd'unautreest PRODUITetdansundeuxiemeniveau,MAGASIN.Danslagure17,ilestpossible elevee.enrevanche,laventederadiosdependdelalocalisationdumagasin. d'observerque,quelquesoitlalocalisationdumagasinetl'annee,laventedestvest Fig.17{Applicationd'unetechniqued'orpaillage evitentquel'outilpassedutempsafairedest^achesprealables,tellequel'epuration pouranalyserlesdonneesd'unentrep^ot,parcequelesdonneesdequalitequ'ilintegre D'uncote,lestechniquesd'orpaillagesontplusperformanteslorsqu'ellessontutilisees jourd'hui,cestechniquessontentraind'evoluerpours'integreraveclesentrep^ots.la auxutilisateursdel'entrep^otprovoqueuneaugmentationdesavaleurstrategique. dedonnees.del'autrecote,lacapacited'analyseuniquequecesoutilsfournissent synergieentrel'orpaillageetlesentrep^otsaetereconnuejusqu'arecemment[inm96]. desoutilsstatistiquesspecialisespourl'analysedequantitesreduitesdedonnees;au- Plusieurstechniquesd'orpaillageonteteutiliseespourplusd'unedecenniedans interrelationsentredonnees.lesoutilsdevisualisationautorisentquel'utilisateur en2ou3dimensionsetenanimationsquipeuvent^etreanalyseesencherchantdes techniquesdevisualisationconvertissentdesdonneescomplexesenimages,graphiques 6.3Visualisation [Bro97]:d'unepart,lesdonneesdequalited'unentrep^otevitentqu'unetechnique exploredemaniereinteractivedegrandesquantitesdedonnees[avs98]. commencerecemment.cettecollaborationadesavantagespourlesdeuxdomaines pendantplusieursannees.l'integrationdecelles-cidanslecontextedesentrep^otsa Lestechniquesdevisualisationonteteutilisesaussidansdesoutilsspecialises Lavisualisationdesdonneesdoitfaciliterleuranalyseetleurinterpretation.Les mente;d'autrepart,lavisualisationaideal'utilisateuramieuxcomprendrelesca- racteristiquesdesdonneesdel'entrep^ot. selectionneesetintegreesenprovenancedemultiplessourcesheterogenes.lesdonnees d'unentrep^otsontorganiseespour^etrefacilementaccessiblesetanalysables.cette 7Conclusion traliseeetnonlieeauxenvironnementsoperationnelsd'uneentreprise,desdonnees devisualisationrealisedest^achesd'epurationdesdonneesetainsisonecaciteaug- UnEntrep^otdeDonneesrassemble,dansunebasededonneeslogiquementcen- PRODUIT MAGASIN TEMPS Vente TV Grenoble 1996 Radio Grenoble 1996 TV Lyon 1996 TV Annecy 1996 Radio Creteil 1996 Radio Paris 1996 Haute Basse Haute Haute Basse Haute Orpaillage TV Haute PRODUIT Grenoble Radio MAGASIN Creteil Paris Basse Basse Haute
24 ladecision).ilfautconsidereraussidesfacteurseconomiques(l'achatd'equipements, neesheterogenesetleurmodelisation,ainsiquelaconceptiondessystemesd'aidea 22 caracteristiqueestexploiteeparlessystemesd'aidealadecisionquiutilisentlestechniquesd'analyseolap,d'orpaillageetdevisualisation.laconstructiond'unentrep^ot dierentesnatures.ilfautconsidererdesfacteurstechniques(l'integrationdesdon- dedonneesn'estpasunprocessussimple,parcequ'ilfauttenircomptedefacteursde Entrep^otsdeDonnees:SyntheseetAnalyse delogicielsoudeservices)etlescaracteristiquesdesanalysesavenir. perdenouvellessolutionscarlessolutionstraditionnellesnesontplusappropriees, materialisationdevuesdanscenouveaucontexte.cependant,ilfautencoredevelopportantjusqu'arecemment,avecparexemplel'importationdetechniquesconnuesde estqueledomaineesttresjeuneetqu'iln'estpasencorestable.m^emesil'industrie surlessystemesmolap.parailleurs,larechercheacommenceeajouerunr^oleim- poursedistinguerl'undel'autreetaudebatdelasuprematiedessystemesrolap astimulesondeveloppementpratique,enm^emetemps,elleaprovoqueunetatde confusiondual'introductiondestermesutilisespourchaqueconcurrentsurlemarche Nousavonsrealiseunetatdel'artdesentrep^otsdedonnees.Laconclusiongenerale ments,citonsparexemple: multidimensionnelles. emp^eched'avoiruneapprocherigoureuseauproblemedelamodelisationdesdonnes sontoperationnels.cetteinuencedelatechnologiedominantedesbasesdedonnes esttresinuenceeparlemodelerelationneletparlesnombreuxsgbddecetypequi commedanslecasdestechniquesd'indexation.enplus,laconceptiondesentrep^ots {Lesentrep^otsdedonneessepr^etentbienal'utilisationdestechniquesdepartitiondedonneespourletraitementparalleleentreplusieursprocesseurs[DMT98]. Onpourraitainsiameliorerlestempsdereponsepourdesrequ^etescomplexes {Lerafra^chissementperiodiqued'unentrep^otestunproblemeouvertsil'onveut Lesentrep^otsdedonneessontunterrainfertilepourdesnouveauxdeveloppe- {L'utilisationdel'Internetetdel'intranetpourl'accesauxentrep^otsprovoquera actives[col96a]peuvent^etreenvisageespourcela. lerealiserecacement.desnouvellestechniqueslieesauxbasesdedonnees surdegrandesquantitesdedonnees. {Ladimensiontempsesttresimportantedansunentrep^ot.Ilfautetudierles {L'analyseetlacritiquedesmodelesexistantespourlesdonneesmultidimensionnellesnousindiquentqu'ilfauttirerpartidetoutletravaillieauxobjets l'incorporationdemecanismescomplexesdesecurite. complexesetmultimedia[ac93].ceciouvriralaportepourdesnouveauxentrep^ots,commeceuxd'imagessatelliteoucliniquesetdedonneesgeographiques. malexplore.ilestclairquelesdonneesgenereesaujourd'huisontdeplusenplus {L'explorationdesnouvellestechniquesd'indexation.DansledomainedesBases liensaveclesbasesdedonneestemporelles[fcs97]. nombreuses,volumineuses,heterogenesetreparties.lesintegrerdansdesentrep^ots, Toutcelaconstitueundomainederecherchevastequiestactuellementencore pourl'indexationdesdonneesmultidimensionnelles[sar97]. dedonneesspatiales,plusieurstechniquesd'indexationonteteproposees,comme parexemple,lesarbresr[bs96].cetypedetechniquespourraient^etreutiles
25 futur. References lesorganiser,lesgerer,lesrafra^chiretlesanalyserecacementconstituentlesprincipauxdespourconstruirelesentrep^otsdedonneesetlessystemesdecisionnelsdu 23 Bentez-Guerrero,Collet,Adiba [AC93]Adiba(Michel)etCollet(Christine).{Objetsetbasesdedonnees:le [AGS95]Agrawal(Rakesh),Gupta(Ashish)etSarawagi(Sunita).{Modeling [AAD+96]Agarwal(Sameet),Agrawal(Rakesh),Deshpande(Prasad),Gupta nita).{onthecomputationofmultidimensionalaggregates.in:pro- ceedingsofthe22ndvldbconference.{bombay,india,1996. (Ashish),Naughton(Jere),Ramakrishnan(Raghu)etSarawagi(Su- [App98]Applix.{TM1Technology.{Rapporttechnique,ApplixInc.,1998. SGBD02.{Paris,France,Hermes, SanJose,CA95120,USA,IBMAlmadenResearchCenter,September MultidimensionalDatabases.{Rapporttechnique,650HarryRoad, [AVS98]AVS.{GainingInsightThroughDataVisualisation.{Rapporttechnique,AdvancedVisualSystemsInc., { lizedviewselectioninamultidimensionaldatabase.in:proceedingsof [AS98]Arbor-Software, [Boh97]Bohn(Kathy).{Convertingdataforwarehouses.DBMSOn-Line,June [BPT97]Baralis(Elena),Paraboschi(Stefano)etTeniente(Ernest).{Materia- [BSHD98]Blaschka(Markus),Sapia(Carsten),Hoing(Gabriele)etDinter(Barbara).{Findingyourwaythroughmultidimensionaldatamodels.In: ProceedingsofInternationalWorkshoponDataWarehouseDesignand [BS96]Bontempo(Charles)etSaracco(C.).{Acceleratingindexedsearching. [Bro97]Brooks(Peter).{Visualizingdata.DBMSOn-Line,August1997.{ DatabaseProgrammingandDesign,July1996. the23rdvldbconference.{athenes,greece,1997. OLAPTechnology(DWDOT),pp.198{203.{Vienna,Autrich,August [BT98]Bokun(Michele)etTaglienti(Carmen).{Incrementaldata [CD97]Chauduri(Surajit)etDayal(Umeshwar).{Anoverviewofdataware- warehouseupdates:approachesandstrategiesforcapturingchangeddata.datamanagementreview,may1998.{ housingandolaptechnology.sigmodrecord,no1,1997,pp.65{74.
Les Entrepôts de Données
Les Entrepôts de Données Grégory Bonnet Abdel-Illah Mouaddib GREYC Dépt Dépt informatique :: GREYC Dépt Dépt informatique :: Cours Cours SIR SIR Systèmes d information décisionnels Nouvelles générations
Plus en détailOracle Décisionnel : Modèle OLAP et Vue matérialisée D BILEK
Oracle Décisionnel : Modèle OLAP et Vue matérialisée SOMMAIRE Introduction Le modèle en étoiles Requêtes OLAP Vue matérialisée Fonctions Roll up et Cube Application Introduction Data Warehouse Moteur OLAP
Plus en détailETL Extract - Transform - Load
ETL Extract - Transform - Load Concept général d analyse en ligne (rappels) Rémy Choquet - Université Lyon 2 - Master 2 IIDEE - 2006-2007 Plan Définitions La place d OLAP dans une entreprise OLAP versus
Plus en détailet les Systèmes Multidimensionnels
Le Data Warehouse et les Systèmes Multidimensionnels 1 1. Définition d un Datawarehouse (DW) Le Datawarehouse est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées
Plus en détailQU EST-CE QUE LE DECISIONNEL?
La plupart des entreprises disposent d une masse considérable d informations sur leurs clients, leurs produits, leurs ventes Toutefois ces données sont cloisonnées par les applications utilisées ou parce
Plus en détailBases de données multidimensionnelles et mise en œuvre dans Oracle
Bases de données multidimensionnelles et mise en œuvre dans Oracle 1 Introduction et Description générale Les bases de données relationnelles sont très performantes pour les systèmes opérationnels (ou
Plus en détailDatawarehouse: Cubes OLAP. Marlyse Dieungang Khaoula Ghilani
Datawarehouse: Cubes OLAP Marlyse Dieungang Khaoula Ghilani Table des matières 1 Data Warehouse 3 1.1 Introduction............................ 3 1.1.1 Définition......................... 3 1.1.2 Architecture........................
Plus en détailEntrepôts de données. NEGRE Elsa Université Paris-Dauphine 2015-2016
Entrepôts de données NEGRE Elsa Université Paris-Dauphine 2015-2016 Contexte et problématique Le processus de prise de décision L entrepôt de données Définition Différence avec un SGBD Caractéristiques
Plus en détailUrbanisation des SI-NFE107
OLAP Urbanisation des SI-NFE107 Fiche de lecture Karim SEKRI 20/01/2009 OLAP 1 Introduction PLAN OLAP Les différentes technologies OLAP Plate formes et Outils 20/01/2009 OLAP 2 Informatique décisionnelle
Plus en détailBig Data On Line Analytics
Fdil Fadila Bentayeb Lb Laboratoire ERIC Lyon 2 Big Data On Line Analytics ASD 2014 Hammamet Tunisie 1 Sommaire Sommaire Informatique décisionnelle (BI Business Intelligence) Big Data Big Data analytics
Plus en détailIntroduction à l Informatique Décisionnelle - Business Intelligence (7)
Introduction à l Informatique Décisionnelle - Business Intelligence (7) Bernard ESPINASSE Professeur à Aix-Marseille Université (AMU) Ecole Polytechnique Universitaire de Marseille Septembre 2013 Emergence
Plus en détailLes entrepôts de données
Les entrepôts de données Lydie Soler Janvier 2008 U.F.R. d informatique Document diffusé sous licence Creative Commons by-nc-nd (http://creativecommons.org/licenses/by-nc-nd/2.0/fr/) 1 Plan Introduction
Plus en détailPlan. Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation
Data WareHouse Plan Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation 2 Présentation Besoin: prise de décisions
Plus en détailUn datawarehouse est un entrepôt de données (une base de données) qui se caractérise par des données :
Page 1 of 6 Entrepôt de données Un article de Wikipédia, l'encyclopédie libre. L'entrepôt de données, ou datawarehouse, est un concept spécifique de l'informatique décisionnelle, issu du constat suivant
Plus en détailEntrepôt de données 1. Introduction
Entrepôt de données 1 (data warehouse) Introduction 1 Présentation Le concept d entrepôt de données a été formalisé pour la première fois en 1990 par Bill Inmon. Il s agissait de constituer une base de
Plus en détailLes Entrepôts de Données. (Data Warehouses)
Les Entrepôts de Données (Data Warehouses) Pr. Omar Boussaid Département d'informatique et de Sta5s5que Université Lyon2 - France Les Entrepôts de Données 1. Généralités, sur le décisionnel 2. L'entreposage
Plus en détailIntroduction à lʼinformatique. Décisionnelle (ID) / Business. Intelligence» (1)
Introduction à lʼinformatique Décisionnelle et la «Business Intelligence» (1) Bernard ESPINASSE Professeur à Aix-Marseille Université (AMU) Ecole Polytechnique Universitaire de Marseille Septembre 2013
Plus en détailCollabora'on IRISA/INRA sur le transfert de nitrates et l améliora'on de la qualité des eaux des bassins versants:
Collabora'on IRISA/INRA sur le transfert de nitrates et l améliora'on de la qualité des eaux des bassins versants: Tassadit BOUADI 22 Juin 2010, Saint Jacut 1 Plan Introduc
Plus en détailWorkflow/DataWarehouse/DataMining. 14-09-98 LORIA - Université d automne 1998 - Informatique décisionnelle - L. Mirtain 1
Workflow/DataWarehouse/DataMining 14-09-98 LORIA - Université d automne 1998 - Informatique décisionnelle - L. Mirtain 1 plan Workflow DataWarehouse Aide à la décision DataMinig Conclusion 14-09-98 LORIA
Plus en détailBI = Business Intelligence Master Data-Science
BI = Business Intelligence Master Data-Science UPMC 25 janvier 2015 Organisation Horaire Cours : Lundi de 13h30 à 15h30 TP : Vendredi de 13h30 à 17h45 Intervenants : Divers industriels (en cours de construction)
Plus en détailSGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)
SGBDR Systèmes de Gestion de Bases de Données (Relationnelles) Plan Approches Les tâches du SGBD Les transactions Approche 1 Systèmes traditionnels basés sur des fichiers Application 1 Gestion clients
Plus en détailChapitre IX. L intégration de données. Les entrepôts de données (Data Warehouses) Motivation. Le problème
Chapitre IX L intégration de données Le problème De façon très générale, le problème de l intégration de données (data integration) est de permettre un accès cohérent à des données d origine, de structuration
Plus en détailBI2 : Un profil UML pour les Indicateurs Décisionnels
BI2 : Un profil UML pour les Indicateurs Décisionnels Sandro Bimonte Irstea, TSCF, 9 Av. Blaise Pascal, 63178, Aubière, France sandro.bimonte@irstea.fr Thème de Recherche MOTIVE www.irstea.fr 2 Plan Motivations
Plus en détailLe "tout fichier" Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique
Introduction à l informatique : Information automatisée Le premier ordinateur Définition disque dure, mémoire, carte mémoire, carte mère etc Architecture d un ordinateur Les constructeurs leader du marché
Plus en détailBases de Données Avancées
1/26 Bases de Données Avancées DataWareHouse Thierry Hamon Bureau H202 - Institut Galilée Tél. : 33 1.48.38.35.53 Bureau 150 LIM&BIO EA 3969 Université Paris 13 - UFR Léonard de Vinci 74, rue Marcel Cachin,
Plus en détailLa place de la Géomatique Décisionnelle dans le processus de décision
Géomatique décisionnelle La place de la Géomatique Décisionnelle dans le processus de décision - Arnaud Van De Casteele Mines ParisTech - CRC Arnaud {dot} van_de_casteele {at} mines-paristech.fr Les rencontres
Plus en détailBusiness Intelligence : Informatique Décisionnelle
Business Intelligence : Informatique Décisionnelle On appelle «aide à la décision», «décisionnel», ou encore «business intelligence», un ensemble de solutions informatiques permettant l analyse des données
Plus en détailFournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement
Introduction Phases du projet Les principales phases du projet sont les suivantes : La mise à disposition des sources Des fichiers Excel sont utilisés pour récolter nos informations L extraction des données
Plus en détailIntroduction à la B.I. Avec SQL Server 2008
Introduction à la B.I. Avec SQL Server 2008 Version 1.0 VALENTIN Pauline 2 Introduction à la B.I. avec SQL Server 2008 Sommaire 1 Présentation de la B.I. et SQL Server 2008... 3 1.1 Présentation rapide
Plus en détailSQL SERVER 2008, BUSINESS INTELLIGENCE
SGBD / Aide à la décision SQL SERVER 2008, BUSINESS INTELLIGENCE Réf: QLI Durée : 5 jours (7 heures) OBJECTIFS DE LA FORMATION Cette formation vous apprendra à concevoir et à déployer une solution de Business
Plus en détailBusiness & High Technology
UNIVERSITE DE TUNIS INSTITUT SUPERIEUR DE GESTION DE TUNIS Département : Informatique Business & High Technology Chapitre 8 : ID : Informatique Décisionnelle BI : Business Intelligence Sommaire Introduction...
Plus en détailBI = Business Intelligence Master Data-ScienceCours 3 - Data
BI = Business Intelligence Master Data-Science Cours 3 - Datawarehouse UPMC 8 février 2015 Rappel L Informatique Décisionnelle (ID), en anglais Business Intelligence (BI), est l informatique à l usage
Plus en détailPlan. Ce qu est le datawarehouse? Un modèle multidimensionnel. Architecture d un datawarehouse. Implémentation d un datawarehouse
Datawarehouse 1 Plan Ce qu est le datawarehouse? Un modèle multidimensionnel Architecture d un datawarehouse Implémentation d un datawarehouse Autres développements de la technologie data cube 2 Ce qu
Plus en détailRapport de DEA. Intégration de versions fonctionnelles dans les entrepôts de données multimédias au sein des systèmes OLAP. Anne-Muriel ARIGON
Rapport de DEA Intégration de versions fonctionnelles dans les entrepôts de données multimédias au sein des systèmes OLAP Anne-Muriel ARIGON LIRIS INSA de Lyon Bâtiment 501 69621 Villeurbanne, France Encadré
Plus en détailXCube XML For Data Warehouses
XCube XML For Data Warehouses Auteurs : Wolfgang Hümmer Andreas Bauer Gunnar Harde Présenté par : David TA KIM 2005-12-05 Sommaire Sommaire I Introduction au Datawarehouse Sommaire I Introduction au Datawarehouse
Plus en détailEntrepôt de Données. Jean-François Desnos. Jean-Francois.Desnos@grenet.fr ED JFD 1
Entrepôt de Données Jean-François Desnos Jean-Francois.Desnos@grenet.fr ED JFD 1 Définition (Bill Inmon 1990) Un entrepôt de données (data warehouse) est une collection de données thématiques, intégrées,
Plus en détailUNIVERSITÉ MOHAMMED V AGDAL. FACULTÉ DES SCIENCES Rabat THÈSE DE DOCTORAT. Présentée par ELhoussaine ZIYATI Discipline : Sciences de l ingénieur
UNIVERSITÉ MOHAMMED V AGDAL FACULTÉ DES SCIENCES Rabat N d ordre 2491 THÈSE DE DOCTORAT Présentée par ELhoussaine ZIYATI Discipline : Sciences de l ingénieur Spécialité : Informatique et Télécommunications
Plus en détailMagasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP)
Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP) Définition (G. Gardarin) Entrepôt : ensemble de données historisées variant
Plus en détailLES ENTREPOTS DE DONNEES
Module B4 : Projet des Systèmes d information Lille, le 25 mars 2002 LES ENTREPOTS DE DONNEES Problématique : Pour capitaliser ses informations, une entreprise doit-elle commencer par mettre en œuvre des
Plus en détailet les Systèmes Multidimensionnels
Le Data Warehouse et les Systèmes Multidimensionnels 1 1. Définition d un Data warehouse (DW) Le Data warehouse (entrepôt de données) est une collection de données orientées sujet, intégrées, non volatiles
Plus en détailCahier des charges de l application visant à effectuer un suivi de consommation énergétique pour les communes. Partenaires du projet :
Cahier des charges de l application visant à effectuer un suivi de consommation énergétique pour les communes Partenaires du projet : 1 Sommaire A) Contexte... 3 B) Description de la demande... 4 1. Les
Plus en détailFouille de Données : OLAP & Data Warehousing
Fouille de Données : OLAP & Data Warehousing Nicolas Pasquier Université de Nice Sophia-Antipolis Laboratoire I3S Chapitre 2. Data warehousing Définition : qu est-ce que le data warehousing? Entrepôt de
Plus en détailEntrepôts de Données
République Tunisienne Ministère de l Enseignement Supérieur Institut Supérieur des Etudes Technologique de Kef Support de Cours Entrepôts de Données Mention : Technologies de l Informatique (TI) Parcours
Plus en détailTechniques d optimisation des requêtes dans les data warehouses
Techniques d optimisation des requêtes dans les data warehouses Ladjel Bellatreche LISI/ENSMA Téléport2-1, Avenue Clément Ader 86960 Futuroscope - FRANCE bellatreche@ensma.fr Résumé Un entrepôt de données
Plus en détailCATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2012
CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE Edition 2012 AGENDA Qui sommes nous? Présentation de Keyrus Keyrus : Expert en formations BI Nos propositions de formation 3 modes de formations Liste des
Plus en détailBusiness Intelligence avec Excel, Power BI et Office 365
Avant-propos A. À qui s adresse ce livre? 9 1. Pourquoi à chaque manager? 9 2. Pourquoi à tout informaticien impliqué dans des projets «BI» 9 B. Obtention des données sources 10 C. Objectif du livre 10
Plus en détailLe Géodécisionnel. P7 : Projet Bibliographique Dans le cadre du Mastère ASIG. Les SIG au service du géodécisionnel.
P7 : Projet Bibliographique Dans le cadre du Mastère ASIG Le Géodécisionnel Les SIG au service du géodécisionnel Thierry Lallemant 15 Mai 2008 Mastère ASIG / Projet Bibliographique 2008 1 TABLE DES MATIERES
Plus en détailPrésentation du module Base de données spatio-temporelles
Présentation du module Base de données spatio-temporelles S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Partie 1 : Notion de bases de données (12,5h ) Enjeux et principes
Plus en détailIntroduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours
Information du cours Informatique décisionnelle et data mining www.lia.univ-avignon.fr/chercheurs/torres/cours/dm Juan-Manuel Torres juan-manuel.torres@univ-avignon.fr LIA/Université d Avignon Cours/TP
Plus en détailCONCEPTION ET REALISATION D'UN GENERATEUR DE TABLEAUX DE BORD PROSPECTIFS MULTIDIMENSIONNELS
CONCEPTION ET REALISATION D'UN GENERATEUR DE TABLEAUX DE BORD PROSPECTIFS MULTIDIMENSIONNELS Nazih Selmoune (*), Zaia Alimazighi (*) Selmoune@lsi-usthb.dz, Alimazighi@wissal.dz (*) Laboratoire des systèmes
Plus en détailIci, le titre de la. Tableaux de bords de conférence
Ici, le titre de la Tableaux de bords de conférence pilotage d entreprise, indicateurs de performance reporting et BI quels outils seront incontournables à l horizon 2010? Les intervenants Editeur/Intégrateur
Plus en détailCATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2014
CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE Edition 2014 SOMMAIRE Présentation de Keyrus Les modes de formation Liste des formations, Plan de cours & Pré-requis IBM Cognos QlikView Microsoft Talend Oracle
Plus en détailL information et la technologie de l informationl
L information et la technologie de l informationl CRM & informatique décisionnelled CRM CRM & informatique décisionnelle. d 1 2 3 Les Les fondements managériaux managériaux du du CRM. CRM. Les Les fondements
Plus en détailLe concept de Data Warehouse a été formalisé pour la première fois en 1990.
1 - LE DATA WAREHOUSE 1.1 - PRESENTATION Le concept de Data Warehouse a été formalisé pour la première fois en 1990. L idée de constituer une base de données orientée sujet, intégrée, contenant des informations
Plus en détailINTRODUCTION A LA B.I AVEC PENTAHO BUSINESS ANALYTICS Formation animée par
Séminaire de formation INTRODUCTION A LA B.I AVEC PENTAHO BUSINESS ANALYTICS Formation animée par M. Dia Alioune Expert consultant BI OPEN SOURCE Directeur BADIA OA GROUP : OpenAfriki France Du 09 au 11
Plus en détailAnalyse comparative entre différents outils de BI (Business Intelligence) :
Analyse comparative entre différents outils de BI (Business Intelligence) : Réalisé par: NAMIR YASSINE RAGUI ACHRAF Encadré par: PR. L. LAMRINI Dans le domaine d économies des Big Data et Open Data, comment
Plus en détail4. Utilisation d un SGBD : le langage SQL. 5. Normalisation
Base de données S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Présentation du module Contenu général Notion de bases de données Fondements / Conception Utilisation :
Plus en détailChapitre 9 : Informatique décisionnelle
Chapitre 9 : Informatique décisionnelle Sommaire Introduction... 3 Définition... 3 Les domaines d application de l informatique décisionnelle... 4 Architecture d un système décisionnel... 5 L outil Oracle
Plus en détailBases de Données. Stella MARC-ZWECKER. stella@unistra.u-strasbg.fr. Maître de conférences Dpt. Informatique - UdS
Bases de Données Stella MARC-ZWECKER Maître de conférences Dpt. Informatique - UdS stella@unistra.u-strasbg.fr 1 Plan du cours 1. Introduction aux BD et aux SGBD Objectifs, fonctionnalités et évolutions
Plus en détailJEDOX FACTSHEETS SELF-SERVICE BUSINESS INTELLIGENCE, ANALYTICS & PERFORMANCE MANAGEMENT
1. Excel Add-In 2. 3. 4. OLAP-Server 5. ETL 6. SAP 7. 8. Profil JEDOX FACTSHEETS SELF-SERVICE BUSINESS INTELLIGENCE, ANALYTICS & PERFORMANCE MANAGEMENT Excel OLAP Server ETL SAP JEDOX EXCEL ADD-IN Transformer
Plus en détailSQL Server 2012 et SQL Server 2014
SQL Server 2012 et SQL Server 2014 Principales fonctions SQL Server 2012 est le système de gestion de base de données de Microsoft. Il intègre un moteur relationnel, un outil d extraction et de transformation
Plus en détailSkills Technology Software PARTENAIRE TECHNOLOGIQUE DE VOTRE DÉVELOPPEMENT
Skills Technology Software w w w.s PARTENAIRE TECHNOLOGIQUE DE VOTRE DÉVELOPPEMENT ka ty s. co m E U OG ION L TA AT A C RM FO Accélérateur de votre RÉUSSITE 2 Formation Aujourd hui, la formation constitue
Plus en détailSQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...)
Avant-propos 1. À qui s'adresse ce livre? 15 2. Pré-requis 15 3. Objectifs du livre 16 4. Notations 17 Introduction à la Business Intelligence 1. Du transactionnel au décisionnel 19 2. Business Intelligence
Plus en détailL INTELLIGENCE D AFFAIRE DANS LA VIE QUOTIDIENNE D UNE ENTREPRISE
2009 L INTELLIGENCE D AFFAIRE DANS LA VIE QUOTIDIENNE D UNE ENTREPRISE Chapitre 1 : BI Une introduction La plupart des administrateurs de bases de données (DBA) ont rencontré une certaine forme de business
Plus en détailMémoire de fin d études. Thème Conception et réalisation d un Data Warehouse pour la mise en place d un système décisionnel
Mémoire de fin d études Pour l obtention du diplôme d Ingénieur d Etat en Informatique Option : Systèmes d information Thème Conception et réalisation d un Data Warehouse pour la mise en place d un système
Plus en détailFreeAnalysis. Schema Designer. Cubes
FreeAnalysis Schema Designer Cubes Charles Martin et Patrick Beaucamp BPM Conseil Contact : charles.martin@bpm-conseil.com, patrick.beaucamp@bpm-conseil.com Janvier 2013 Document : BPM_Vanilla_FreeAnalysisSchemaDesigner_v4.2_FR.odt
Plus en détailIntégration de données hétérogènes et réparties. Anne Doucet Anne.Doucet@lip6.fr
Intégration de données hétérogènes et réparties Anne Doucet Anne.Doucet@lip6.fr 1 Plan Intégration de données Architectures d intégration Approche matérialisée Approche virtuelle Médiateurs Conception
Plus en détailBusiness Intelligence simple et efficace avec Excel et PowerPivot
Présentation de PowerPivot A. L analyse de données 7 1. Activité 7 2. Définitions 8 a. Mesures et dimensions 8 b. Traitement et analyse 8 c. Robustesse et confiance 9 B. Des solutions pour les gros volumes
Plus en détailPrésentations personnelles. filière IL
Présentations personnelles filière IL Résumé Liste de sujets de présentations personnelles. Chaque présentation aborde un sujet particulier, l'objectif étant que la lecture du rapport ainsi que l'écoute
Plus en détailGestion et analyse personnalisées des demandes marketing : cas de LCL-Le Crédit Lyonnais
Gestion et analyse personnalisées des demandes marketing : cas de LCL-Le Crédit Lyonnais Cécile Favre * Michel Rougié ** Fadila Bentayeb * Omar Boussaid * * Université de Lyon (Laboratoire ERIC-Lyon 2)
Plus en détail2 Serveurs OLAP et introduction au Data Mining
2-1 2 Serveurs OLAP et introduction au Data Mining 2-2 Création et consultation des cubes en mode client-serveur Serveur OLAP Clients OLAP Clients OLAP 2-3 Intérêt Systèmes serveurs et clients Fonctionnalité
Plus en détailMinistère de l Enseignement Supérieur et de la Recherche Scientifique. Ecole nationale Supérieure d Informatique (ESI) (Oued Semar, Alger) Mémoire
Ministère de l Enseignement Supérieur et de la Recherche Scientifique Ecole nationale Supérieure d Informatique (ESI) (Oued Semar, Alger) École Doctorale Sciences et Technologies de l'information et de
Plus en détailHERMES SYSTEM et BEWISE souhaitent vous offrir les meilleures compétences.
Notre alliance, Votre atout. HERMES SYSTEM et BEWISE souhaitent vous offrir les meilleures compétences. C est de cette philosophie qu est née notre partenariat avec la société toulousaine (31) Bewise,
Plus en détailLe Data Warehouse. Fait Vente. temps produit promotion. magasin. revenu ... Produit réf. libellé volume catégorie poids. Temps jour semaine date ...
Le Data Warehouse Temps jour semaine date magasin nom ville m 2 région manager... Fait Vente temps produit promotion magasin revenu... Produit réf. libellé volume catégorie poids... Promo nom budget média
Plus en détailThibault Denizet. Introduction à SSIS
Thibault Denizet Introduction à SSIS 2 SSIS - Introduction Sommaire 1 Introduction à SQL Server 2008 Integration services... 3 2 Rappel sur la Business Intelligence... 4 2.1 ETL (Extract, Transform, Load)...
Plus en détailEasy to. report. Connexion. Transformation. Stockage. Construction. Exploitation. Diffusion
M y R e p o r t, L A S O L U T I O N R E P O R T I N G D E S U T I L I S AT E U R S E X C E L Connexion Transformation Stockage Construction Exploitation Diffusion OBJECTIF REPORTING : De la manipulation
Plus en détailLe petit glossaire du décisionnel
Le petit glossaire du décisionnel ABC/ABM Activity Based Costing Activity Based Management ABC/ABM : méthodes au cœur du pilotage stratégique de la performance, visant l optimisation des processus, via
Plus en détailBases de Données OLAP
Bases de Données OLAP Hiver 2013/2014 Melanie Herschel melanie.herschel@lri.fr Université Paris Sud, LRI Chapitre 1 Introduction Détails administratifs Entrepôts de Données Perspective sur le semestre
Plus en détailIntroduction à Business Objects. J. Akoka I. Wattiau
Introduction à Business Objects J. Akoka I. Wattiau Introduction Un outil d'aide à la décision accès aux informations stockées dans les bases de données et les progiciels interrogation génération d'états
Plus en détailCompétences Business Objects - 2014
Compétences Business Objects - 2014 «Mars-Juin 2014. Réf : Version 1 Page 1 sur 34 Sommaire CONTEXTE DE LA REMISE A NIVEAU EN AUTOFORMATION... 3 1. MODELISATION... 4 1.1 DESCRIPTION FONCTIONNEL DE L'APPLICATION
Plus en détailMyReport, LE REPORTING SOUS EXCEL
MyReport, LE REPORTING SOUS EXCEL De la simplicité d Excel à l autonomie des utilisateurs Avec MyReport : De la manipulation en moins. De l analyse en plus! Tous les services de l entreprise utilisent
Plus en détailLe VDI et les solutions SaaS : Des outils puissants pour les DSI au service des utilisateurs. Château de Montchat, 7 octobre 2013
Le VDI et les solutions SaaS : Des outils puissants pour les DSI au service des utilisateurs Château de Montchat, 7 octobre 2013 De la virtualisation à la VDI hébergée Jan GABRIEL Directeur Alliances &
Plus en détailUniversité Paris IX DAUPHINE DATE : 24/04/06
Master Informatique Décisionnelle Application des outils de l'informatique Décisionnelle en entreprise ETUDE SUR LES MARQUES ET LES CONTRUCTEUR DES VÉHICULES APPARTENANT AUX CLIENTS D UNE COMPAGNIE D ASSURANCE
Plus en détailLes entrepôts de données et l analyse de données
LOG660 - Bases de données de haute performance Les entrepôts de données et l analyse de données Quelques définitions Entreposage de données (data warehousing): «La copie périodique et coordonnée de données
Plus en détailEntrepôt de données et l Analyse en ligne. Maguelonne Teisseire Hugo Alatrista Salas hugo.alatrista- salas@teledetec9on.fr Flavien Bouillot
Entrepôt de données et l Analyse en ligne Maguelonne Teisseire Hugo Alatrista Salas hugo.alatrista- salas@teledetec9on.fr Flavien Bouillot Déroulement du cours 17 janvier : cours et TD 20 janvier : cours?
Plus en détailNos Solutions PME VIPDev sont les Atouts Business de votre entreprise.
Solutions PME VIPDev Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise. Cette offre est basée sur la mise à disposition de l ensemble de nos compétences techniques et créatives au service
Plus en détailEvry - M2 MIAGE Entrepôt de données
Evry - M2 MIAGE Entrepôt de données Introduction D. Ploix - M2 Miage - EDD - Introduction 1 Plan Positionnement du BI dans l entreprise Déclinaison fonctionnelle du décisionnel dans l entreprise Intégration
Plus en détailBusiness Intelligence
avec Excel, Power BI et Office 365 Téléchargement www.editions-eni.fr.fr Jean-Pierre GIRARDOT Table des matières 1 Avant-propos A. À qui s adresse ce livre?..................................................
Plus en détailIntelligence Economique - Business Intelligence
Intelligence Economique - Business Intelligence Notion de Business Intelligence Dès qu'il y a une entreprise, il y a implicitement intelligence économique (tout comme il y a du marketing) : quelle produit
Plus en détailOutils informatiques et l aide à la prise de décision en entreprise
Projet 15 Année universitaire 2007 2008 Outils informatiques et l aide à la prise de décision en entreprise Réalisé par : Didier MOUNIEN Samantha MOINEAUX Enseignant chercheur responsable : Mr Dominique
Plus en détailLe marché immobilier en France
Le marché immobilier en France Immobilier d entreprise, logement, immobilier de loisirs Jean-Claude GINISTY Notaire à Paris Juin 2013 1 L immobilier d entreprise dans le GRAND PARIS 2 L immobilier d entreprise
Plus en détailRejoignez la Communauté
Rejoignez la Communauté MODÉLISATION DIMENSIONNELLE Le fondement du datawarehouse 2 MODÉLISATION DIMENSIONNELLE Le fondement du datawarehouse 3 QUI SOMMES NOUS? Jean-Pierre Riehl Pratice Manager SQL Azeo
Plus en détailEntreposage de données complexes pour la médecine d anticipation personnalisée
Manuscrit auteur, publié dans "9th International Conference on System Science in Health Care (ICSSHC 08), Lyon : France (2008)" Entreposage de données complexes pour la médecine d anticipation personnalisée
Plus en détailMise en place d un Datawarehouse
Mise en place d un Datawarehouse Logistique ESSILOR LINCOLN Plan de la présentation Constituer un entrepôt de données afin d avoir une vue synthétique des flux de verres entre les différents continents.
Plus en détailMarchés immobiliers : conjoncture et perspectives
Marchés immobiliers : conjoncture et perspectives CB Richard Ellis 16 septembre 2008 Contexte économique Environnement international o L économie mondiale tourne au ralenti (incertitudes financières, inflation,
Plus en détailThéories de la Business Intelligence
25 Chapitre 2 Théories de la Business Intelligence 1. Architectures des systèmes décisionnels Théories de la Business Intelligence Depuis les premières requêtes sur les sources de données OLTP consolidées
Plus en détailTP2_1 DE BUSINESS INTELLIGENCE ISIMA ZZ3 F3
TP2_1 DE BUSINESS INTELLIGENCE ISIMA ZZ3 F3 03/11/2014 Plan du TP 2 Présentation de la suite Microsoft BI Ateliers sur SSIS (2H) Ateliers sur RS (2H) 3 Présentation de la suite Microsoft BI Présentation
Plus en détailEn route vers le succès avec une solution de BI intuitive destinée aux entreprises de taille moyenne
Présentation du produit SAP s SAP pour les PME SAP BusinessObjects Business Intelligence, édition Edge Objectifs En route vers le succès avec une solution de BI intuitive destinée aux entreprises de taille
Plus en détailGroupe d usagers SharePoint Québec
Groupe d usagers SharePoint Québec Rencontre du groupe d usagers Chapitre Québec SEPTEMBRE 2009 Informatique Décisionnelle 101 Informatique Décisionnelle 101 Définition Les moyens, outils et méthodes qui
Plus en détail