Nouspresentonslesprincipauxaspectsautourdelanotion(entrep^otde Resume

Save this PDF as:
 WORD  PNG  TXT  JPG

Dimension: px
Commencer à balayer dès la page:

Download "Nouspresentonslesprincipauxaspectsautourdelanotion(entrep^otde Resume"

Transcription

1 EdgardBentez-Guerrero,ChristineCollet,MichelAdiba Entrep^otsdeDonnees:SyntheseetAnalyse RR1017-I-LSR8 RAPPORTDERECHERCHE Mai1999

2

3 Entrep^otsdeDonnees:SyntheseetAnalyse EdgardBentez-Guerrero,ChristineCollet,MichelAdiba LaboratoireLogiciels,Systemes,Reseaux-IMAG BP72,38402SaintMartind'HeresCedex parlonsaussidestechniquesd'analyse(l'olap,l'orpaillageetlavisualisation) entrep^otavantdediscuterlesaspectsrelatifsasonstockageetsagestion.nous processusdeconstructionetlestechniquesderafra^chissementperiodiqued'un tueletlemodelelogiqueutilisespourconcevoirunentrep^ot.nousabordonsle parunebasededonneestraditionnelle.nousdecrivonsensuitelemodeleconcep- donnees)dansledomainedesbasesdedonnees.toutd'abord,nousintroduisonslescaracteristiquesd'unentrep^otetlescomparonsaveccellespresentees Nouspresentonslesprincipauxaspectsautourdelanotion(entrep^otde Resume 1Introduction chissementperiodique,sgbdmultidimensionnel,vuesmaterialisees,olap, Orpaillage,Visualisation. deperspectivesderecherchedanscedomaine. Motsclef:Entrep^otdeDonnees,CubedeDonnees,SchemaenEtoile,Rafra^- quipeuvent^etreappliqueessurl'entrep^ot.enn,nousidentionsunensemble etplusde30%ontprevudelefairedansles3ans[fra97].deplus,desentrep^ots 6000entreprisesenqu^etees,plusde40%ontdebutelamiseenplaced'unentrep^ot ontetemisenplaceavecsuccesdansplusieursindustriestellesquelafabrication,le Institute[DWI98],uneorganisationamericainedeprofessionnels,indiquequesurles timepourlesproduitsetlesservicesautourdestechnologiesdesentrep^otsdedonnees raison,ilssontdevenusdeselementsstrategiquespourlesentreprises.lemarchees- aeuunecroissanceenorme:ilestpassede2milliardsdedollarsen1994a8milliardsdedollarsen1998[cd97].uneetuderealiseeen1996parledatawarehousing LesEntrep^otsdeDonneessontindispensablesalaprisededecisionset,pourcette developpementetderecherchesuruneperiodedetempstrescourte[mh98][gre98]. commerce,lesservicesnanciers,letransport,lestelecommunications,lamedecine [CD97]etdanslesuniversites[HGML+95]. lasection4.lestockageetlagestiondesdonneesd'unentrep^otsontpresentesdans Denombreuxconceptsonteteproposesetilestparfoisdiciledes'yretrouver. donnees.ilestorganisedelamanieresuivante:lasection2presenteladenitionet d'unentrep^ot.laconstructionetlerafra^chissemend'unentrep^otsontintroduitsdans Cetarticletentedesynthetiserlesprincipauxconceptsassociesauxentrep^otsde lastructuredesentrep^otsetlasection3decritlemodeled'organisationdesdonnees Lethemedesentrep^otsdedonneesadoncdonnelieuadenombreuxtravauxde 1

4 2Caracteristique Donnees Usage Unitedetravail NombrededonneesDizaines BasedeDonnees Courantes Supportdel'operationSupportdel'analyse del'entreprise Entrep^otsdeDonnees:SyntheseetAnalyse accedees Moded'acces Transaction Typed'utilisateurEmploye Lecture/Ecriture Historiques del'entreprise Requ^ete Millions Lecture (principalement) section6etnalementlasection7conclutcetarticle. lasection5.lessystemesolap,l'orpaillageetlavisualisationsontabordesdansla Nombred'utilisateursMille Tab.1{BasesdeDonneesvsEntrep^otsdeDonnees Decideur Cent 2Entrep^otsdeDonneesetBasesdeDonnees basesdedonneesdessystemesexistantsdetypeon-linetransactionprocessing d'uneentreprisepourchercherdesavantagescompetitivessurlaconcurrence.les (OLTP)nesontpasappropieescommesupportdecesanalysesparcequ'ellesontete pertinentespourfairedesanalysessetrouventdissemineesentreplusieursbases.de concuespourdesfonctionsspeciquesrealisesdansl'entreprise.donc,lesdonnees plus,leurconceptionviseaameliorerlesperformancesdessystemesoltpparrapport autraitementd'ungrandnombredetransactions(courtesetfrequentes)demise-ajour,cequicompliquel'interrogation.unentrep^otdedonnees,parcontre,oredes LeconceptEntrep^otdeDonneessurgitapartirdesbesoinsd'analysedesdonnees suivantes: decision[inm92][inm95].lesdonneesd'unentrep^otpossedentlescaracteristiques donneesintegrees,consolideesethistoriseespourfairedesanalyses. {Orientationsujet.Lesdonneesd'unentrep^ots'organisentparsujetsouthemes. Ils'agitd'unecollectiondedonneespourlesupportd'unprocessusd'aideala {Integration.Lesdonneesd'unentrep^otsontleresultatdel'integrationde dessources. estleresultatd'unprocessusquipeutdevenirtrescomplexedual'heterogeneite Cetteorganisationpermetderassemblertouteslesdonnees,pertinentesaun lesstructuresfonctionnellesd'unentreprise. pourrealiseruneanalyseparticulieresetrouventdansl'entrep^ot.l'integration donneesenprovenancedemultiplessources;ainsi,touslesdonneesnecessaires sujetetnecessairesauxbesoinsd'analyse,quisetrouventrepanduesatravers {Histoire.Lesdonneesd'unentrep^otrepresententl'activited'unentreprisependantunelongueperiodeouilestimportantdegererlesdierentesvaleursqu'une donneeprisesaucoursdutemps.cettecaracteristiquedonnelapossibilitede suivreunedonneedansletempspouranalysersesvariations.

5 Bentez-Guerrero,Collet,Adiba 3 {Non-volatilite.Lesdonneeschargeesdansl'entrep^otsontsurtoututiliseesen interrogationetnepeuventpas^etremodiees,saufdanscertainscasderafra^chissement.extraction Epuration Chargement Orpaillage Visualisation OLAP Decisionnels Systèmes Données Entrepôt de Sources Externes Stockage Bases de Données Analyse Construction Rafraîchissement Fig.1{L'Entrep^otdeDonneesestlabasedessystemesdecisionnels L'entrep^otdedonnees(ED)joueunr^olestrategiquedansuneentreprisecomme lemontrelagure1.ilstockedesdonneesinteressantesenprovenancedessystemes OLTPdel'entrepriseetd'autressourcesexternes.Avantd'^etrechargeesdansl'entrep^ot,lesdonneesselectionneesdoivent^etreextraitesdessourcesetsoigneusement epurees,poureliminerdeserreursetreconcilierlesdierencessemantiques.apartir desdonneesd'uneddenombreusesanalysespeuventavoirlieu;pourcela,ilfaut associerauxsystemesdecisionnelsdestechniquesd'analysetelsquecellesdetype On-LineAnalyticalProcessing(OLAP),d'orpaillageetdevisualisation.L'informationetlaconnaissanceobtenuesparl'exploitationd'unentrep^otsontdirectement traduisiblesenbenecespourl'entreprise(augmentationdesventesautraversd'un marketingmieuxcible,ameliorationdestauxderotationdesstocks,etc.)[fra97]. Commeexemple,consideronsunecha^nedemagasinsrepartisgeographiquement dansplusieurspays,commelafranceetlemexique.l'analyseglobaledelacha^ne estunet^achetrescompliquee,maisunentrep^otdedonneesfournitlecadreideal pourl'eectuer.l'entrep^ots'organiseautourdessujetslesplusimportantspourla cha^ne,c'estadire,lesproduitsquiontetevendusdanslesmagasinsaucoursdu temps.lesdonneesnecesairespoureectuerdesanalysessontextraitesdedierents basesdedonneesetchiers(utilisesparchaquemagasinpoursupportersesactivitesquotidiennesdeventes)etintegreesdansl'entrep^ot.apartirdecetentrep^ot, legestionnairedelacha^nepeuteectuerdesanalysesetprendredesdecisionsqui aecterontlesactivitesfuturesdel'entreprise. Lesdonneesd'unentrep^otsestructurentselondeuxaxes:synthetiqueethistorique (cf.gure2)[fra97].l'axesynthetiqueetablitunehierarchied'agregationetcomprendlesdonneesdetaillees(quirepresententlesevenementslesplusrecentsaubas delahierarchie),lesdonneesagregees(quisynthetisentlesdonneesdetaillees)etles donneesfortementagregees(quisynthetisentaunniveausuperieurlesdonneesagregees).l'axehistoriquecomprendlesdonneesdetailleeshistorisees,quirepresentent desevenementspasses.lesmetadonneescontiennentdesinformationsconcernant lesdonneesdansl'entrep^ot,tellequeleurprovenanceetleurstructure,ainsiqueles methodesutiliseespourfairel'agregation. L'entrep^otdedonneessetrouvesouventstockeetgereparunsystemedegestiondebasesdedonnees(SGBD)dansunordinateurnonlieauxsystemesOLTP del'entreprise.laprincipaleraisonpoureectuercetteseparationestladegradationeventuelledesperformancesdessystemesoltpprovoqueparl'executiondes

6 4 Entrep^otsdeDonnees:SyntheseetAnalyse Données fortement agregées M e t a Axe D Données agregées synthétique o n n é e s Données detaillées dansunsystemeoltp.cependantcescaracteristiquesnesontpascritiquespourles processusd'analysedel'entrep^ot,oulescheminsd'accesauxdonneessontdicilesa dutraitementdestransactionsetlescourtstempsdereponsesonttresimportants processusd'analysesurlesdonneesdel'entrep^ot[gup97b].lahauteperformance Fig.2{Lastructured'unEntrep^otdeDonnees Données detaillées historisées d'unentrep^ot. denirapriorietletempsdereponsen'estpasrigide. OLTP.Danslasectionsuivante,nousabordonslaproblematiquedelamodelisation miseenoeuvretotalementdierentesdecellesutiliseespourconstruireunsysteme Pourconstruireunentrep^ot,ilfautadopterdestechniquesdeconceptionetde Axe historique 3Modelisationdel'Entrep^ot 3.1ModeleMultidimensionneldeDonnees multidimensionneldedonnees. pasaussiclairsqueceuxdesutilisateursdessystemesoltp.danslasuitedecette section,nousexpliquonslemodeleconceptueldesentrep^otsdedonnees:lemodele etplusdicilesadenir.deplus,lesbesoinsdesutilisateursdel'entrep^otnesont donneesdessystemesoltp,parcequ'ilfautpenserentermesdeconceptsplusouverts Laconceptiond'unentrep^otdedonneesesttresdierentedecelledesbasesde elementaires(entites)encherchantl'eliminationdesredondances,cequiprovoque Relation(E-R).Cemodelepermetdefaireladescriptiondesrelationsentredonnees LaconceptiondesbasesdedonneesestengeneralbaseesurlemodeleEntite-

7 devientcompliqueetlediagrammegeneredevientdicileacomprendrepourune Bentez-Guerrero,Collet,Adiba l'introductiond'unnombreimportantdenouvellesentites.ainsi,l'accesauxdonnees personne.pourcetteraison,l'utilisationdelamodelisatione-rpourlaconception d'unedn'estpasappropriee[col96b]. teeauxbesoinsdel'analysedesdonneesd'unentrep^ot[kim96].cemodelepermet Lemodelemultidimensionneldedonnees(MMD)estunealternativemieuxadap- 5 auxdonneesetenplusestfacileacomprendreycomprispourlespersonnesquine d'observerlesdonneesselonplusieursperspectivesouaxesd'analyse,facilitel'acces sontpasexperteseninformatique.pourcetteraison,cemodeleaeteadoptepar lespraticiens[kim97][inm92]etparleschercheursdesbasesdedonnees[ags95] [TDV97]pourorganiserlesdonneesd'unentrep^ot. (ousimplementcube1)[tdv97].uncubeorganiselesdonneesenuneouplusieurs 3.1.1LeCubedeDonnees LeconstructeurfondamentaldumodelemultidimensionnelestleCubedeDonnees Fig.3{UnexempledeCubedeDonnees peutprendredierentesvaleurs.lesdimensionspossedentengeneraldeshierarchies associeesquiorganisentlesattributsadierentsniveauxpourobserverlesdonnees adierentesgranularites.unedimensionpeutavoirplusieurshierarchiesassociees, chacunespeciantdierentesrelationsd'ordreentresesattributs. lyse.chaquedimensionestformeeparunensembled'attributsetchaqueattribut dontonregardelesdonneespourlesanalyser,alorsqu'unemesureestunobjetd'ana- dimensionsquideterminentunemesured'inter^et.unedimensionspecielamaniere en1994danslemagasinsitueaannecy. presentelecubeventes,quimontreque1000unitesduproduitontetevendus (representeparlavilleauquelilappartient)auninstantdutemps.lagure3 cas,lamesured'inter^etestlaquantited'unproduitvendudansunmagasin cube.cependant,cetermeestutilepourcomprendrelemodeleenutilisantunemetaphoregraphique. Pourcetteraison,danscetarticlenouscontinueronsautiliserceterme. multidimensionnel,uncubeestunemaniered'organiserdesdonneeset,enrealite,cen'estpasun 1.Engeometrie,uncubedesigneuncorpssolideasixfacescarreesdetailleegale;danslemodele Consideronsunmodelemultidimensionnelpourlacha^nedemagasins.Dansce PRODUIT P2 P3 Lyon Grenoble Annecy MAGASIN TEMPS 1994

8 6produitsetaoperependant3annees(1095jours),alorsilyaplusde5millionsde lesproduitsnesontpastousvendusdanstouslemagasinspendantlesm^emesperiodes seulementunnombretresfaibledescellulesd'uncubeaientunevaleur.parexemple, combinaisonspossibles(auniveaujour),chacuneavecuneventepotentielle.sil'on detemps.sil'onconsiderequelacha^nedemagasinspossede50magasins,vend1000 Lesdonneesmultidimensionnellessontdenatureeparsecarilestpossibleque Entrep^otsdeDonnees:SyntheseetAnalyse onpeutdirequ'ilyaunedispersionde99%. supposequelesdonneessontdisponiblespourseulement1%deventes(plusde5000), rationsonteteproposees[sah95]: {SliceouRotation EtantdonneelarepresentationsousformedeCubed'unentrep^ot,plusieursope- Fig.4{DataSlice {Dice {Roll-UpetDrill-Down Fig.5{DataDice P R O D U I T PRODUIT P2 P3 P2 P Lyon Grenoble Annecy Lyon MAGASIN Grenoble MAGASIN Annecy TEMPS TEMPS 1994 M A G A S I N Lyon Grenoble Annecy P3 PRODUIT P3 P2 PRODUIT Lyon Annecy MAGASIN TEMPS TEMPS

9 Bentez-Guerrero,Collet,Adiba 7 LaRotationouSlicepermetd'avoiraccesauxdierentesvuesdedonneessans lesreordonnerphysiquement.pouruncubea3dimensionsilexistesixvuespossibles etpour4dimensions,12.engeneral,uncubedendimensionsan(n 1)vues possibles.ondenotel'operateursliceparslicedimension(cube).lagure4presente leresultatdel'applicationdel'operateurslicesurlecubeventesselonladimension MAGASINetquiestdenoteepar: SliceMAGASIN(VENTES). L'operateurDicepermetderestreindrelesvaleursdansuneouplusieursdimensions.OnvadenotercetoperateurparDicerestriction(CUBE).Ainsi,lagure5presenteleresultatdel'applicationdeDicesurlescubeVENTESpourselectionnerles ventesdesproduitsetp3danslesmagasinsdelyonetdeannecypendantles anneesde1994etde1996etquiestdenoteepar: DicePRODUIT6=P2^MAGASIN6=Grenoble^TEMPS6=1995(VENTES) P R O D U I T France TEMPS P2 P3 P4 P P R O D U I T Creteil Lyon Annecy Grenoble Paris Ile de France P R O D U I T ROLL-UP DRILL-DOWN TEMPS P2 P3 P4 P MAGASIN Lyon Grenoble Annecy Creteil Paris France région ville pays Alpes Rhône TEMPS P2 P3 P4 P Ile de Alpes France Rhône Fig.6{RollUpetDrillDown LesoperateursRoll-UpetDrill-Downautorisentl'analysededonneesadierents niveauxd'agregationenutilisantdeshierarchiesassocieesachaquedimension.l'operateurroll-upeectuel'agregationdesmesuresallantd'unniveauparticulierversun general,alorsquedrill-downrealisel'operationinverse.ondenotel'operateurroll- UpparRollUpniveausuperieur niveauinferieur(cube),alorsquel'operateurdrill-downestdenote pardrilldownniveauinferieur niveausuperieur(cube). Lagure6montrel'applicationdesoperateursRoll-UpetDrill-DownsurladimensionMAGASIN,quiaassocieelahierarchie\ville!region!pays".Cettehierarchie determinelesrelationsquiexistententrevillesetregions,etentreregionsetpays.la guremontreaussiuneinstancepossibledecettehierarchie,quiregroupelesvilles

10 8Formalisme Hypercube (Agrawalet.al.,1995) Cube IntroductionOperateurs deshierarchies Entrep^otsdeDonnees:SyntheseetAnalyse Multidimensionnel (LietWang,1996) Table N-Dimensionnelle (Gyssenset Relations Pull,Push,DestroyDimension, Lakshmanan,1997) Fonctions Restriction,Merge,Join Cube AddDimension,Transfer,RC-Join (Thomaset.al.,1997)entreattributsAggregation,CartesianProduct, Construct,CubeAggregation, F-table Unfold,Fold,Selection (Cabibbo OrdrepartielPull,Push,Partition Projection,Renaming,Union ettorlone,1998)tab.2{formalismesproposes OrdrepartielRoll-Up entreattributsintersection,dierence, Sumarization,Classication Join,Union,Dierence appliquerl'operateurroll-upsurladimensionmagasin,ensommantlestotauxde FrancedanslepaysFrance.Pourdeterminerletotaldeventesauniveauregion,ilfaut ensommantlesventestotalesdechaqueregion.l'operateurdrill-downeectueles deparisetcreteildanslaregionile-de-franceetlesregionsrh^one-alpesetile-de- chaqueville: Lem^ememecanismes'appliquesionveutcalculerletotaldeventesauniveauPays, operationsinverses: DrillDownville RollUpregion ville(ventes) duitsvisentacouvrirlesbesoinsdesutilisateursetchaqueproduitfournitsapropre visiondumodeleetdesoperationsassociees.donciln'existepas(i)unformalisme lemarche([ken97],[app98],[as98],parexemple).lesservicesproposesparcespro QuelquesFormalismesProposes industrielleetmaintenantdenombreuxproduitsbasessurcemodelesetrouventsur Lemodelemultidimensionneldedonneesaattirel'attentiondelacommunaute region(ventes) sous-jacentquifacilitel'ecriturederequ^etescomplexesdontlesagregationsadhoc avechierarchiesmultiplesetmesurescomplexes,et(ii)unlangaged'interrogation independantdelamiseenoeuvrequiautoriseladenitiondedimensionsstructurees deniesparunefonctionquiassocieaunecombinaisondevaleursdesdimensions(i) percube.unhypercubeestdetermineparkdimensionsetseselements(cellules)sont HypercubeAgrawaletal.[AGS95]proposentunmodelebasesurlanotiond'hy- rechercheaproposeplusieursformalismes(cf.table2). soientautorisees[ags95][bshd98].pourpalliercettesituation,lacommunautede

11 lacombinaisonexiste,ou(iii)unn-uplet,s'ilexistedel'informationsupplementaire associeeauxelements;ladescriptiondescomposantsd'unn-upleteststockeecomme multiplesetd'agregationsad-hoc. unemetadonnee.cemodeleutilisedesfonctionspourladenitiondehierarchies Bentez-Guerrero,Collet,Adiba lavaleur0,silacombinaisonn'existepasdanslabasededonnees,(ii)lavaleur1,si 9 Fig.7{L'HyperCubedeAgrawaletal.Leselementsdel'hypercube(a)prennentdes n-upletsou0commevaleuralorsqueceuxde(b)prennentlesvaleurs1ou0 MAGASINetTEMPS,etseselementssontdesn-uplets(parexemple<1000;:::> viseunemiseenoeuvresurunsgbdrelationneletsembleplut^otpragmatique. etladierence,ainsiquel'agregationcommeroll-upetdrill-down.cetteapproche d'autresoperateursdetyperelationneltelsquelaprojection,l'union,l'intersection senterleshierarchies.lesoperateursproposespeuvent^etrecomposespourconstruire queleurdenitionsoitcomplexeacausedel'introductiondesfonctionspourrepre- minimal(unoperateurnepeutpas^etreeliminesanspertedesfonctionnalites)bien Lagure7(a)presentel'hypercubeVENTESdontlesdimensionssontPRODUIT, Lesoperateurs(cf.table2)ontunesemantiquebiendenieetformentunensemble caslen-uplet<quantite;:::>).lagure7(b)presenteunautrehypercubeavecles dimensionsproduit,magasinetquantiteetseselementsprennentlavaleur pourl'elementquicorrespondaproduit=p2,magasin=lyonet TEMPS=1994)oulavaleur0(pourleselementsnonrepresentesdanslagure).La metadonneededescriptiondeselementsestuneannotationdel'hypercube(dansce 1(parexemple,l'elementquicorrespondaPRODUIT=P2,MAGASIN=Lyon etquantite=1000)oubienlavaleur0. ensortie.ilspeuvent^etrecomposespourexprimerdesrequ^etescomplexes. CubeMultidimensionnelPourLietWang[LW96]unebasededonneesmultidimensionnelleestunensemblenideCubesMultidimensionnelsetunensembleni derelations.uncubemultidimensionnelconsisteenuncertainnombrederelations (lesdimensions)etpourchaquecombinaisonden-uplets,unn-upletpourchaque dimension,ilexisteunevaleurassociee(unemesure).danscemodele,lesmesures teurs(cf.table2)prennentdescubesetrelationsenentreeetproduisentdescubes nepeuvent^etrequedesvaleursnumeriques.lesauteursintroduisentlanotionde relationsderegroupementcommemoyenpourrepresenterdeshierarchies.lesopera- P R O D P2 U I T P3 <Quantité,...> <1000,...><1000,...> Lyon Grenoble MAGASIN (a) <1000,...> Annecy <2000,...> TEMPS 1994 P R O D P2 U I T P3 1 1 Lyon Grenoble Annecy MAGASIN (b) QUANTITE 1000

12 lavaleurassociee100.lapartie(b)delagure8montrelarelationquiregroupeles PRODUIT=<;10;Noir>etTEMPS=<15;Mai;1996>,ilexiste villesdegrenoble,lyonetannecydanslaregionrh^one-alpesetlesvillesdecreteil etparisdanslaregionile-de-france. PRODUIT,MAGASINetTEMPS.Pourlesn-upletsMAGASIN=<Grenoble>, Lagure8(a)montrelecubemultidimensionnelVENTESformeparlesrelations Entrep^otsdeDonnees:SyntheseetAnalyse TablesN-dimensionnellesGyssensetLakshmananproposentdans[GL97]un formalismeautourdelanotiondetablen-dimensionnelle.uneinstancedecetypede (b)relationderegroupement Fig.8{LeCubeMultidimensionneldeLietWang.(a)CubeMultidimensionnel. tableestunensemblederelations,unepourchaquedimensionetuneautrepourles Rhône-Alpes mentionneesetellessontincorporeesendenissantdesfonctions.lesoperateurs cube.lesauteursmontrentqu'unetablen-dimensionnellepeut^etrerepresenteepar proposes(cf.table2)prennentenentreeuncubeetproduisentensortieunautre semantiquedesoperateurs.enfait,chaqueoperateurconvertitlatablestructureendimensionnelleenunerelationclassique,eectuelesoperationsnecessairesetconvertit cetterelationenunetablen-dimensionnelle.lesoperateursproposespeuvent^etre composespourenexprimerd'autres,commeroll-up. PRODUITetTEMPS,etlamesureVENTES.LesattributsNometPoidssontassociesaPRODUIT,alorsquelesattributsMoisetAnneesontassociesaTEMPS. Onpeutvoirdanscettegureque100unitesduproduitontetevendusaumois quiestformeeparlesrelationsrproduit,rtempsetrm.chaquen-upletdesrelationsrproduitetrtempsestvuecommeune\coordonnee"danslesdimensions PRODUITetTEMPSrespectivement,alorsqu'unn-upletdermrepresentelavaleur dejanvier1996.lapartie(b)delam^emegurepresenteuneinstancedeventes, associeeaunecombinaisondecoordonnees,unecoordonneepourchaquedimension. Lagure9(a)presentelatablebi-dimensionnelleVENTESaveclesdimensions unerelationclassiqueetvice-versaetc'estapartirdeceresultatqu'ilsdeveloppentla clesdedimensionetlesmesuresrespectives.leshierarchiesnesontpasexplicitement unensembledecubes,denisentermesdedimensions,mesures,attributsetfonctionsquiassocientlesattributsauxdimensions.ilestpossiblededenirdesschemas CubePourThomaset.al.[TDV97]unebasededonneesmultidimensionnelleest MAGASIN PRODUIT TEMPS Ville Nom Poids Couleur Jour Mois Année Grenoble 10 Noir 15 Mai Grenoble P2 10 Noir 15 Mai Annecy 20 Noir 15 Mai Lyon P2 20 Blanc 15 Mai Creteil 10 Blanc 15 Mai Paris P2 10 Blanc 15 Mai (a) Quantité Region Rhône-Alpes Rhône-Alpes Ile-de-France Ile-de-France MAGASIN.Ville (b) Grenoble Annecy Lyon Creteil Paris

13 Bentez-Guerrero,Collet,Adiba 11 representeesetellesdoivent^etredeniesaprioricommeunordrepartielentreles nnelle(b)instancedelatablebi-dimensionnelle decubes,quispecientdemaniereabstraitelastructured'uncube.apartird'un schema,desinstancespeuvent^etrecreees.leshierarchiesnesontpasexplicitement Fig.9{TableN-DimensionnelledeGyssensetLakshmanan.(a)Tablebi-dimensio- Lesoperateurspeuvent^etrecomposespourdenird'autresoperateurscommeRoll-Up simplesdesoperateursalgebriques,ouchaqueoperateurexecuteunefonctionunique. etdrill-down. attributsd'unedimension.lesoperateursdel'algebreproposee(cf.table2)prennent enentreeuncubeetproduisentensortieuncube.lemodelefournitdesdenitions D1(PRODUIT),D2(MAGASIN)etD3(TEMPS).L'attributa1deladimension a3deladimensiontempsest\annee". PRODUITest\nom",l'attributa1deladimensionMAGASINest\ville"etl'attribut Fig.10{LeCubedeThomasetal.Cetteguremontreuncubeetsescomposants Lagure10montrelecube(instancedecube)VENTESdeniparlesdimensions VENTES P R O D U I T Nom P2 Poids Mois TEMPS Année Vente a1 = Nom (a) D1 = PRODUIT Jan Fev... Jan Fev P2 P Lyon Grenoble Annecy a1 = Ville <1000> D2 = MAGASIN rproduit Tid Nom Poids t1 t2 t3 t4... P2 P2... rm t1 t2... t1 t2 VENTES rtemps P.Tid T.Tid Quantité t1 t1... t2 t2 (b) Tid Année Mois t1 t2 t3 t Jan Fev Jan Fev a3 = Année 1994 D3 = TEMPS

14 12 F-tablesCabibboetTorlone[CT98]proposentuneformalismeautourdelanotion def-table,quiestunefonctiondescoordonneesdesdimensionsauxmesures.ilest possibledespecierleschemad'unef-tableetdedenir,apartirdeceschema,unensembled'instances.ceformalismeautoriselastructurationcomplexedeshierarchies Entrep^otsdeDonnees:SyntheseetAnalyse d'interrogation[ct97]estbasesurlalogiquedupremierordreetdoncautorisel'ecriturederequ^etesdefacondeclarative.celangagepermetl'incorporationdesfonctions d'agregationmieuxadaptesauxbesoinsdudomained'application. dansunedimension,endenisantdesordrespartielsentresesattributs.lelangage dimensiontempsauniveaujour.lapartie(b)delagure11montreuneinstance produits.lesattributs\v",\p"et\j"deceschemarepresentent,respectivement,la lesventesdelacha^nedemagasins,mesureesentermesdelaquantitevenduede dimensionmagasinauniveauville,ladimensionproduitauniveaunometla Onpeutvoirdanslapartie(a)delagure11leschemadelaf-tablequirepresente Fig.11{Lesf-tablesdeCabbiboetTorlone.(a)Schema(b)Instance deceschema. implantedirectementpardessystemesspecialises,appelessgbdmultidimensionnels, 3.2ModeleLogique modeleslogiqueslesplusutilises. nauteindustrielleadeveloppedesmodeleslogiquesadhocpourfairefaceauxpres- sionsdumarcheetalaforteconcurrence.danslasectionsuivante,nousabordonsles Lemodelemultidimensionneldedonneesdecritdanslasectionprecedenteest Malgrel'absenced'unformalismeconceptuelcommunementaccepte,lacommu Schemaenetoile sousformed'etoile,deocondeneigeetdeconstellationdefaitsonteteproposes. presentesdanslasection5.cependant,lamiseenoeuvredumodeleducuben'est pourunnombreelevederelations[ks95b].pourevitercesdesavantages,lesschemas pasrestreinteacetypedesgbd. faitsetchaquedimensionparunerelationdedimension.larelationdefaitsreference approprieepourunentrep^otacausedugrandnombredejointuresetderestrictions Dansleschemaenetoile[Kim96],lesmesuressontrepresenteesparunerelationde Larepresentationdedonneesenrelationsentroisiemeformenormalen'estplus VENTES [v : ville <MAGASIN>, p : nom <PRODUIT>, j : jour <TEMPS>] : quantité (a) v Grenoble Grenoble Annecy Lyon Creteil Paris p P2 P2 P2 (b) j 15 Mai Mai Mai Mai Mai Mai 1996 VENTES

15 Bentez-Guerrero,Collet,Adiba 13 Produit Magasin Temps Quantité DIMENSION Nom Poids Couleur Produit DIMENSION DIMENSION Ventes Produit Magasin Temps Ville Magasin Jour Mois Année Temps Region Pays RELATION DE FAITS Fig.12{SchemaenEtoile lesrelationsdedimensionenutilisantunecleetrangerepourchacuneetstockeles valeursdesmesurespourlacombinaisondescles.autourdecetterelationgurentles relationsdedimensionquiregroupentlescaracteristiquesdesdimensions.larelation defaitsestnormaliseeetpeutatteindreunetailleimportanteparrapportaunombre den-uplets;parcontre,lestablesdedimensionsontdenormalisees(c'estadire,des dependencesfonctionnellespeuvent^etretrouveesentrelesattributs)etsontengeneral d'unefaibletaille.lagure12montreleschemaenetoilepourlecubeventesou larelationdefaitsstockelaquantitedeproduitsvendusetlesrelationscorrespondant aproduit,amagasinetatempscomportentlesinformationsinteressantes surcesdimensions SchemaenformedeFlocondeNeige Leschemaenetoilenereetepasleshierarchiesassocieesaunedimension.Pour resoudreceprobleme,leschemaenformedeocondeneigeaetepropose.ceschema normaliselesdimensions,reduisantlatailledechacunedesrelationsetpermettant ainsideformaliserlanotiondehierarchieauseind'unedimension[fra97].lagure13montrelesrelationsnecessairespourrepresenterunniveaudeshierarchies desdimensionsmagasinettemps Constellationdefaits Ilestpossibled'avoirplusieursrelationsdefaitspourrepresenterlessituations danslesquelleslesfaits(mesures)nesontpasdeterminesparexactementlem^eme ensemblededimensions.danscecas,lesrelationsdefaitsformentunefamille[ks95b] quipartageplusieursrelationsdedimensionmaisouchaquemembrepossedeses dimensionspropres.bienentendu,silesrelationsdefaitspartagentunedimension, ilfautverierquecettedimensionestexactementlam^eme.leschemaresultant s'appelleconstellationdefaits[cd97]. Lesschemasrelationnelsadaptesauxbesoinsdumodelemultidimensionnelpossedentuneseried'avantagesparrapportauxschemasentroisiemeformenormale. L'etoile,leoconetlaconstellationautorisentl'expressiondesmesures,desdimensionsetdeshierarchies,d'unemanieresimplequipermetdelesdistinguerclairement

16 14 Entrep^otsdeDonnees:SyntheseetAnalyse Jour Mois Temps Année Mois Mois Produit Magasin Temps Quantité DIMENSION Nom Poids Couleur Produit DIMENSION DIMENSION Ventes Produit Magasin Temps Ville Magasin Region Region Region Pays RELATION DE FAITS Fig.13{SchemaenFlocondeNeige etdoncilssontfacilesacomprendre.cesschemasfacilitentegalementl'accesaux mesures,m^emesilatailled'unrelationdefaitsestsouventimportante,parcequele nombredejointuresestpluspetit. 4ConstructionetRafra^chissementdel'Entrep^ot 4.1Construction Lesdonneesintegreesdansunentrep^otontunegrandevaleurpouruneentreprise.Orleurintegrationn'estpasunet^achefacile,parcequ'engenerallesdonneesse trouventdissemineesdansdemultiplessourcesquipossedentleurspropresstructures, formatsetdenitions.enplus,cessourcespeuventcontenirdeserreurs,commedes valeursmanquantes,desvaleursillegalesoudescontradictions,desvaleursincoherentesetdesrelationsinvalides[mos98].pourcesraisons,lesdonneesenprovenance desourcesheterogenesdoivent^etretraiteesavantd'^etrechargeesdansunentrep^ot [Boh97].Cetraitementsecomposedetroisphases: 1.Extractiondesdonneesapartirdeleurssourcesetconversiondansunerepresentationintermediaire. 2.Epurationpardesmecanismesquiassurentleurqualite. 3.Chargementdesdonneesdansl'entrep^ot. Desestimationsindiquentquelaplupartdutemps(80%enmoyenne)dela constructiond'unentrep^otestdedieacest^aches[inm92].cependant,laplupart desentreprisessous-estimentlacomplexitedeceprocessus,m^emes'ilpeut^etredeterminantpourlesuccesdel'entrep^otetpourlaqualitedesanalyses[cm95]. 4.2Rafra^chissementPeriodique Leprocessusdedetectiondechangementsdanslessourcesetleurpropagation versl'entrep^otestconnusouslenomderafra^chissement[wb97].ceprocessusse realiseperiodiquementetlaperiodedependdesbesoinsdesutilisateursetdelacharge

17 d'accesal'entrep^ot.lestechniquesderafra^chissementpeuvent^etreclasseesdans Bentez-Guerrero,Collet,Adiba Lapremiereestlatechniquelaplussimpleetconsisteaprendreunephotographie tique,cellebaseesurdestimestampsetcellebaseesurlacomparaisondechiers. instantparticulierdansletemps.danscettecategoriesetrouventlatechniquesta- deuxcategories:statiquesetincrementielles[bt98]. Lestechniquesstatiquesprennentunephotographiedesdonneessourcesaun 15 etlesintegrerdansl'entrep^ot. acomparerl'etatcourantd'unchieravecl'etatanterieurpourtrouverlesdierences rafra^chissement.finalement,lacapturebaseesurlacomparaisondechiersconsiste donneesetquiindiqueletempsdesamiseajourlaplusrecentepoureectuerla timestampsutiliseuneinformationsupplementaire(nommeetimestamp)associeeaux photographiedesdonneesdontladatedutimestampestposterieureacelledudernier dessourcesetareconstruirel'entrep^otenutilisantcelle-ci.lacapturebaseesurdes triggersesttressemblablealatechniqueprecedentemaisladetectiondeschangementsetlesdiversesoperationssontrealiseespartriggersdanslabasededonnees. d'identierleschangementsdanslesdonneesetdestockerceschangementsdansune zonetemporairepourlesutiliseranderafra^chirl'entrep^ot.lacaptureassisteepar parl'applicationrequiertdelapartdesapplicationsquitraitentlesdonneessources tion,partriggersetparlejournalsetrouventdanscettecategorie.lacaptureassistee lessourcesaumomentouilsarrivent.lestechniquesdecaptureassisteparl'applica- Lestechniquesincrementiellesderafra^chissementcapturentleschangementsdans Finalement,lacaptureparlejournalutilisecetteinformationpropreauSGBDpour chercherleschangementsinteressants. 5StockageetGestion tuerlestockageetlagestiondedonneesmultidimensionnelles. 5.1SGBDMultidimensionnel Danscettesection,nousdecrivonslestechniqueslesplusimportantespoureec- cellelaplusutiliseepourlestockagedesdonneesmultidimensionnelles[sho97].dans cettetechnique,unnombreestassocieachaquevaleurpossibled'unedimension. modelemultidimensionneletsespropresstrategiesdestockageetdegestion. lemarche(essbased'arborsoft,holosdeseagate,etc.)utilisesapropreversiondu technologiquecommunpourledeveloppementdessgbdmdcarchaqueproduitsur detraiterdesdonneesmultidimensionnelles.actuellement,iln'existepasdecadre Ilestpossiblecependantdedistinguerlatechniquedearraylinearisationcomme UnSGBDMultidimensionnel(SGBDMD)estunSGBDcapabledestockeret eparsedesdonnees.laplupartdessgbdmdutilisentunestrategieadeuxniveaux destechniquesdecompressiondoivents'appliquerpourreduirel'espacedestockage. niqueestapproprieelorsquel'espacemultidimensionnelestdense;danslecascontraire, nombresassociesauxvaleursdesdimensionsquideterminentlacellule.cettetech- Lapositiond'unecelluledansunvecteurmultidimensionnelestlacombinaisondes unegeneralisationanniveauxdecettetechniquedebase,ouunarbreb+estconstruit danslaquellelesdimensionsdensessontindexeesparunestructurequistockeles combinaisonsdevaleursdesdimensionseparses[dshb98].colliat[col96b]presente Lestechniquesd'indexationsontunesolutionalternativepourtraiterlanature

18 feuillescontiennentdespointeursverslesblocsdesdimensionsdenses. 5.2SGBDRelationnel 16 apartirdescombinaisonspossiblesdesvaleursdedimensionseparsesetdontles Entrep^otsdeDonnees:SyntheseetAnalyse cetypedesystemes.cependant,lessgbdrdoivent^etreadaptesparcequ'ilsne plupartdeseortsquivisentalaconstructiond'unentrep^otdedonneesconsiderent Danscettesection,nousabordonscesadaptations ExtensionsdulangageSQL possedentpaslescaracteristiquesadequatespourrepondreauxbesoinsdesentrep^ots. environ80%dumarchedessystemesdegestiondebasesdedonnees.decefait,la Lessystemesdegestiondebasesdedonneesrelationnelles(SGBDR)representent dicilesvoireimpossiblesaexprimer[ks95a].pourfaciliterl'expressiondesrequ^etes fonctionsprimitivespourlesanalyser.cependant,lesanalyseslesplussimplessont l'expressionderequ^etespourlesdonneesrelationnellesetfournitunensemblede pouranalyserunentrep^ot,lescommunautesindustrielleetderechercheontpropose desextensionsasql.danslasuitedecettesection,nousabordonscesextensions. Lelangaged'interrogationstandarddesSGBDRestSQL.Celangageautorise vendus: vanteordonnelesproduitsparlaquantitevendueetacheseulementlescinqlesplus fonctionscommerank,percentileetd'autresdetypenancieronteteincorporees dansl'extensionrisqldusgbdrredbrick[rbs96].parexemple,larequ^etesui- permetdeconna^treles5produitslesplusvendus)sontnecessaires.acepropos,des l'anneederniere)etletraitementsequentieldesdonneesresultatd'unerequ^ete(qui SUMetAVG.Cesfonctionssontutilesmaisinsusantespouranalyserlesdonneesd'un entrep^ot,oulescomparaisons(lesventesdecetteanneecompareesauxventesde LelangageSQLfournitunensembledefonctionsd'agregationtellesqueCOUNT, selectrank(quantite) fromventes estcalculeechaqueagregation.larequ^etesuivantecalculelecubepourlesattributs relationnelledesdonneesetutiliselavaleur\all"pourdenoterl'ensemblesurlequel deplusieursoperationsgroup-by.l'operateurcubeestbasesurunerepresentation dimensionsdel'operateurgroup-by.cetoperateurcalculelesgroup-bypourtous lessous-ensemblespossiblesdesnattributs(dimensions)etestequivalental'union L'operateurcubeproposeparGrayetal.[GCB+97]estlageneralisationenn whenrank(quantite)<=5 Agarwaletal.[AAD+96]modelisentlescalculseectuesparcubecommeunehie- delarelationventes: Lamiseenoeuvreecacedecetoperateuraattirel'attentiondeschercheurs. from groupbycubeproduit,magasin,temps select ventes Produit,Magasin,Temps,SUM(quantite)

19 desoperationscommunesentreplusieursgroup-byetquiutilisentdescalculsdeja [GL98]proposent,dansuncontextedefederationdebasesdedonnees,lelangagenD- eectuespourencalculerd'autres.l'evaluationempiriquemontrequeeectivement rarchied'operationsdetypegroup-byetproposentdesalgorithmesquicombinent Bentez-Guerrero,Collet,Adiba l'utilisationdecesalgorithmesameliorelesperformancesducalcul. D'autresextensionsaSQLonteteproposees.Parexemple,GingrasetLakshmanan Vuesmaterialisees commecube. relationnellesavecdesschemasheterogenesetsupportedesoperateursd'agregation SQL.Celangageeliminelesdierencessemantiquesentreplusieursbasesdedonnees pourrepresenterlesagregationsdesrelationsd'unschemaenetoile.lesrequ^etes ensemblederelationsalorsqu'unevuematerialiseeestl'extension(lesdonneesm^emes) peuventutilisercesdonneespre-agregeesetonpeutainsiaugmenterlesperformances d'unevue[rou97].dansunentrep^otdedonnees,lesvuesmaterialiseessontutilisees dusysteme. Unevueestunespecicationpourderiverunenouvellerelationapartird'un Unevuematerialiseepeutaideraenconstruired'autresetainsidesuite.Unproblemeimportantestlaselectiond'unensembleminimalapartirduquelonpourrait [Ull96]:lamaterialisationdetouteslesvues,lamaterialisationd'aucunevueoula deriverlesautresvues.ilexistetroisapprochespourlaselectiondecetensemble Fig.14{Treillisdevues P ladeuxiemenefournitaucunavantagepourlesperformancesdusysteme.ainsi,la sabled^ualaquantited'espacenecessairepourmaterialisertouteslesvuespossibles, selectiondevuesamaterialiseretproposeunalgorithmegeneralavecplusieursheuristiques.parailleurs,harinarayanetal.[hru96]modelisentleproblemesouslaformser.guptapresentedans[gup97a]uncadretheoriquedetravailpourleproblemede materialisationselectivedequelquesvues.tandisquelapremiereapprocheestinfai- seulesolutionplausibleestlamaterialisationselective. dansunerequ^eteetontunco^utdetermineparleurnombreden-uplets.lagure14 d'untreillisdevues,outouteslesvuesontlam^emeprobabilited'^etredemandees Ilexistedestravauxquiabordentleproblemedelaselectiondevuesamateriali- PT P M T PM M aucune MT T

20 etrestreintlarechercheaunenombrexedevuesamaterialiser,enminimisantle tempsmoyend'evaluationdechacuned'entreelles.lesauteursmontrentquecetalgorithmepresentedesperformancestresprochedel'optimal;cependant,ilparcourt 18 montreletreillisdesvuespossiblesapartirdesdimensionsproduit(representee parp),magasin(representeeparm)ettemps(representeepart). L'algorithmeproposefaitlaselectiondesvues(amaterialiser)apartirdecetreillis Entrep^otsdeDonnees:SyntheseetAnalyse proposentl'algorithmepbsquiessaied'evitercesdesavantages. tresimportantdanslapratique.pourpalliercessituations,shuklaetal.[sdn98] lement,perdredesbonnessolutions.enplus,sontempsd'executionpeutdevenir l'espacedessolutionspossiblesaunniveauelevedegranulariteetilpeut,eventuel- unerequ^eteentermesdesrelationsdebase.ceproblemeestidentiedans[lmss95] leselementspertinentsdutreillismultidimensionnelparrapportauxbesoinsdesutilisateurs.unefoismaterialisees,trouverlesvueslesplusapproprieespourrepondrmancesdecestechniquessedegradentamesurequelenombreetlacomplexitedes l'entrep^otpossedeunnombrefaiblededimensions,etpourcetteraison,lesperfor- Lestechniquesproposeespourlaselectiondevuesamaterialiserconsiderentque aunerequ^eten'estpasevident,surtoutsil'onconsiderequel'utilisateurexprime proposentunetechniquequireduitl'espacedessolutions,enconsiderantseulement dimensionsaugmentent.cettesituationaeteidentieeparbaralisetal.[bpt97]qui parlevyetal.quiconsiderentleproblemedelareecrituredesrequ^etesenutilisant seulementlesvuesmaterialiseesdisponibles IndexationBinaire (parexemplelesoperateurslogiqueset,ou)demaniereperformante[oq97]. len-upletassocieeestmembredelalisteou0danslecascontraire.unindexbinaire estunestructuredetaillereduitequipeut^etregereeenmemoire,cequiamelioreles performancesdusgbdr.deplus,ilestpossibled'executerdesoperationslogiques cevecteur,chaquen-upletd'unerelationestassocieeaunbitquiprendlavaleur1si indexbinaire[og95]utiliseunvecteurdebitspourrepresenterunetelleliste.dans (oud'ungrouped'attributs),lalistedesn-upletsquicontiennentcettevaleur.un Cettetechniqued'indexationestapproprieelorsquelenombredevaleurspossibles Dansunerelation,unindexassocie,pourchaquevaleurpossibled'unattribut d'unattributestfaible.evidement,leco^utdemaintenancepeut^etreelevecartous destockageaugmenteenpresencededimensionsdegrandecardinalite,parcequ'il fautgererunequantiteimportantedevecteurseparsesquicontiennentpresquedans lesindexdoivent^etreactualisesachaquenouvelleinsertiond'unn-upletetl'espace leurtotalitedesbitsaveclavaleur0.pourevitercesproblemes,destechniquesde compressiondedonnees,commelerun-lengthencoding,sontutilisees.danscette technique,unesequencedebitsdelam^emevaleurestrepresenteedemanierecompacte parunepairedontlepremierelementestlavaleurdesbitsetledeuxiemeestlenombre debitsdanslasequence.l'utilisationdecetypedemethodedegradelesperformances dusgbdracausedelacompressionetladecompressiondesindex. 6.1SystemesOLAP lasynthese,l'analyseetlaconsolidationdynamiquedesdonneesmultidimension- 6Analysedel'Entrep^ot LestechniquesdetypeOn-LineAnalyticalProcessing(OLAP)[Cod93]eectuent

21 Bentez-Guerrero,Collet,Adiba 19 ploiterunentrep^otacausedesonorganisationmultidimensionnelle.lacombinaison decennie[pc98][oc98].lestechniquesolapsontlamanierelaplusnaturelled'ex- debutdesannees70maisellesontetedeveloppeesdansl'industriependantcette nelles.cestechniquessontapparuespourlapremierefoisauniveaurechercheau Fig.15{MOLAP classementsetdesprevisions.lessystemesolapsontsouventclassesparrapport ausystemedegestionutilisepourlestockageetlagestiondesdonnees;ainsi,ilen [Pil98].Cesmecanismescomprennentdesrequ^etesquiimpliquentdesagregations,des auxdonneesdel'entrep^otetluifournissantdepuissantsmecanismesd'interrogation leur.unsystemeolapaideledecideuraeectuerdesanalyses,luiautorisantl'acces OLAP[DMT98]. d'unentrep^otetdestechniquesolapassocieespourl'exploiters'appellesysteme existefondamentalementtroistypes:multidimensionnel,relationnelethybride. LessystemesOLAPtransformentlesdonneesd'unentrep^oteninformationdeva- dansunsgbdmd(cf.gure15).cessystemespresententuntempsdereponse 6.1.1SystemesMOLAP faibleauxcalculscomplexesparcequ'ilseectuentlapre-agregationetlepre-calcul desdonneessurtouslesniveauxdeshierarchiesdumodeledel'entrep^ot.celageneredegrandsvolumesdedonnees,enprovoquanteventuellementladegradationdes performancesdusysteme.enplus,lestechniquesincrementiellesderafra^chissement n'ontpasetesusammentdeveloppeesetilfautreconstruirel'entrep^otdemaniere periodique. LessystemesdetypeOLAPMultidimensionnel(MOLAP)stockentlesdonnees beaucoup[rad95].lesproduitsessbased'arborsoftwareco.[as98],pilotdepilot Software[Pil98]etTM1d'Applix[App98]appartiennentacettefamilledesystemes. depassepasquelquesgigaoctectsetlorsquelemodelemultidimensionnelnechangepas 6.1.2SystemesROLAP l'analysed'unentrep^otlorsquelaquantiteestimeepourlesdonneesd'unentrep^otne LessystemesMOLAPfournissentunesolutionacceptablepourlestockageet quifournitunevisionmultidimensionnelledel'entrep^ot(organisesousformed'etoile pourstockerl'entrep^ot(cf.gure16).lemoteurolapestunelementsupplementaire oudeocondeneige),descalculsdedonneesderivesetdesagregationsadierents LessystemesdetypeOLAPRelationnel(ROLAP)utilisentunSGBDRelationnel Bases de Données Sources Externes Integration OLAP Sources de Données SGBD Multidimensionnel Interface OLAP

22 20 Entrep^otsdeDonnees:SyntheseetAnalyse (cf.section5.2.2).enfait,l'ecacitedesrequ^etessqlgenereesparlemoteurolap auschemarelationneldel'entrep^otetquiprotentdesvuesmaterialiseesexistantes systemerolap[dshb98]. estlefacteurprincipalpourmesurerlesperformancesetlepassageaechelled'un niveaux.ilestaussileresponsabledelagenerationdesrequ^etessqlmieuxadaptees Fig.16{ROLAP peuventpresenteruntempsdereponseeleveetsontincapablesd'eectuerdescalculs complexes.lesexemplesdeproduitsdecettefamilledesystemesolapsontdss AgentdeMicroStrategy[Mic98]etMetaCubed'Informix[Inf98] SystemesHOLAP LessystemesROLAPpeuventstockerdegrandsvolumesdedonnees,maisils systemesolap. LesproduitsExpressd'OracleCorp.[Ora98],Media/MRdeSpeedwareCorp.[Spe97] etholosdeseagatetechnologyinc.[sea98]sontdesexemplesdecettefamillede etlesdonneesdetailleesdansunsgbdr.ainsi,ilestpossibledegererunegrande LAPetROLAP,enstockantlesdonneesagregeesd'unentrep^otdansunSGBDMD quantitededonneeset,enm^emetemps,d'avoiruntempsdereponseacceptable. larechercheversdeszonesinteressantesdansl'espacemultidimensionnel.cependant, Lessystemeshybrides(HOLAP)essaientd'eviterlesproblemesdessystemesMOl'espaceaanalyserpeut^etred'unegrandetailleetl'utilisateurn'estpascapablede l'explorer.danslasuite,nousabordonsdesmecanismespluspuissantset\intelligents" quiautomatisentunepartieduprocessusd'analyseetquisontconnussouslenom d'orpaillage. 6.2Orpaillage DanslessystemesOLAP,l'initiatived'analyseappartiental'utilisateurquidirige lastatistique,etlesbasesdedonnees.actuellement,ilexisteunnombreimportantdetechniquesd'orpaillagetellesquelaregressionlineaire,l'inductiond'arbres formationdegroupes. L'orpaillageouDataMiningestlarecherchedelaconnaissance,sousformedemodelesdecomportement,cacheedanslesdonnees[Fra91].L'orpaillageestundomaine jeunequisetrouveal'intersectiondesdomainestelsquel'intelligencearticielle, dedecision,lesalgorithmesgenetiques,lesreseauxdeneuronesetlesalgorithmesde classicationsouslaformed'unearbrededecision.l'algorithmeappliqueaconstruit donnees.danscecas,ils'agitd'induire,apartirdesn-upletsenentree,unmodelede Lagure17montrel'applicationd'unetechniqued'orpaillageaunensemblede Bases de Données Sources Externes Sources de Données Integration SGBD Relationnel Requête Reponse Moteur OLAP OLAP Interface OLAP

23 Bentez-Guerrero,Collet,Adiba 21 unarbredontl'attributleplusimportantpourdistinguerunn-upletd'unautreest PRODUITetdansundeuxiemeniveau,MAGASIN.Danslagure17,ilestpossible elevee.enrevanche,laventederadiosdependdelalocalisationdumagasin. d'observerque,quelquesoitlalocalisationdumagasinetl'annee,laventedestvest Fig.17{Applicationd'unetechniqued'orpaillage evitentquel'outilpassedutempsafairedest^achesprealables,tellequel'epuration pouranalyserlesdonneesd'unentrep^ot,parcequelesdonneesdequalitequ'ilintegre D'uncote,lestechniquesd'orpaillagesontplusperformanteslorsqu'ellessontutilisees jourd'hui,cestechniquessontentraind'evoluerpours'integreraveclesentrep^ots.la auxutilisateursdel'entrep^otprovoqueuneaugmentationdesavaleurstrategique. dedonnees.del'autrecote,lacapacited'analyseuniquequecesoutilsfournissent synergieentrel'orpaillageetlesentrep^otsaetereconnuejusqu'arecemment[inm96]. desoutilsstatistiquesspecialisespourl'analysedequantitesreduitesdedonnees;au- Plusieurstechniquesd'orpaillageonteteutiliseespourplusd'unedecenniedans interrelationsentredonnees.lesoutilsdevisualisationautorisentquel'utilisateur en2ou3dimensionsetenanimationsquipeuvent^etreanalyseesencherchantdes techniquesdevisualisationconvertissentdesdonneescomplexesenimages,graphiques 6.3Visualisation [Bro97]:d'unepart,lesdonneesdequalited'unentrep^otevitentqu'unetechnique exploredemaniereinteractivedegrandesquantitesdedonnees[avs98]. commencerecemment.cettecollaborationadesavantagespourlesdeuxdomaines pendantplusieursannees.l'integrationdecelles-cidanslecontextedesentrep^otsa Lestechniquesdevisualisationonteteutilisesaussidansdesoutilsspecialises Lavisualisationdesdonneesdoitfaciliterleuranalyseetleurinterpretation.Les mente;d'autrepart,lavisualisationaideal'utilisateuramieuxcomprendrelesca- racteristiquesdesdonneesdel'entrep^ot. selectionneesetintegreesenprovenancedemultiplessourcesheterogenes.lesdonnees d'unentrep^otsontorganiseespour^etrefacilementaccessiblesetanalysables.cette 7Conclusion traliseeetnonlieeauxenvironnementsoperationnelsd'uneentreprise,desdonnees devisualisationrealisedest^achesd'epurationdesdonneesetainsisonecaciteaug- UnEntrep^otdeDonneesrassemble,dansunebasededonneeslogiquementcen- PRODUIT MAGASIN TEMPS Vente TV Grenoble 1996 Radio Grenoble 1996 TV Lyon 1996 TV Annecy 1996 Radio Creteil 1996 Radio Paris 1996 Haute Basse Haute Haute Basse Haute Orpaillage TV Haute PRODUIT Grenoble Radio MAGASIN Creteil Paris Basse Basse Haute

24 ladecision).ilfautconsidereraussidesfacteurseconomiques(l'achatd'equipements, neesheterogenesetleurmodelisation,ainsiquelaconceptiondessystemesd'aidea 22 caracteristiqueestexploiteeparlessystemesd'aidealadecisionquiutilisentlestechniquesd'analyseolap,d'orpaillageetdevisualisation.laconstructiond'unentrep^ot dierentesnatures.ilfautconsidererdesfacteurstechniques(l'integrationdesdon- dedonneesn'estpasunprocessussimple,parcequ'ilfauttenircomptedefacteursde Entrep^otsdeDonnees:SyntheseetAnalyse delogicielsoudeservices)etlescaracteristiquesdesanalysesavenir. perdenouvellessolutionscarlessolutionstraditionnellesnesontplusappropriees, materialisationdevuesdanscenouveaucontexte.cependant,ilfautencoredevelopportantjusqu'arecemment,avecparexemplel'importationdetechniquesconnuesde estqueledomaineesttresjeuneetqu'iln'estpasencorestable.m^emesil'industrie surlessystemesmolap.parailleurs,larechercheacommenceeajouerunr^oleim- poursedistinguerl'undel'autreetaudebatdelasuprematiedessystemesrolap astimulesondeveloppementpratique,enm^emetemps,elleaprovoqueunetatde confusiondual'introductiondestermesutilisespourchaqueconcurrentsurlemarche Nousavonsrealiseunetatdel'artdesentrep^otsdedonnees.Laconclusiongenerale ments,citonsparexemple: multidimensionnelles. emp^eched'avoiruneapprocherigoureuseauproblemedelamodelisationdesdonnes sontoperationnels.cetteinuencedelatechnologiedominantedesbasesdedonnes esttresinuenceeparlemodelerelationneletparlesnombreuxsgbddecetypequi commedanslecasdestechniquesd'indexation.enplus,laconceptiondesentrep^ots {Lesentrep^otsdedonneessepr^etentbienal'utilisationdestechniquesdepartitiondedonneespourletraitementparalleleentreplusieursprocesseurs[DMT98]. Onpourraitainsiameliorerlestempsdereponsepourdesrequ^etescomplexes {Lerafra^chissementperiodiqued'unentrep^otestunproblemeouvertsil'onveut Lesentrep^otsdedonneessontunterrainfertilepourdesnouveauxdeveloppe- {L'utilisationdel'Internetetdel'intranetpourl'accesauxentrep^otsprovoquera actives[col96a]peuvent^etreenvisageespourcela. lerealiserecacement.desnouvellestechniqueslieesauxbasesdedonnees surdegrandesquantitesdedonnees. {Ladimensiontempsesttresimportantedansunentrep^ot.Ilfautetudierles {L'analyseetlacritiquedesmodelesexistantespourlesdonneesmultidimensionnellesnousindiquentqu'ilfauttirerpartidetoutletravaillieauxobjets l'incorporationdemecanismescomplexesdesecurite. complexesetmultimedia[ac93].ceciouvriralaportepourdesnouveauxentrep^ots,commeceuxd'imagessatelliteoucliniquesetdedonneesgeographiques. malexplore.ilestclairquelesdonneesgenereesaujourd'huisontdeplusenplus {L'explorationdesnouvellestechniquesd'indexation.DansledomainedesBases liensaveclesbasesdedonneestemporelles[fcs97]. nombreuses,volumineuses,heterogenesetreparties.lesintegrerdansdesentrep^ots, Toutcelaconstitueundomainederecherchevastequiestactuellementencore pourl'indexationdesdonneesmultidimensionnelles[sar97]. dedonneesspatiales,plusieurstechniquesd'indexationonteteproposees,comme parexemple,lesarbresr[bs96].cetypedetechniquespourraient^etreutiles

25 futur. References lesorganiser,lesgerer,lesrafra^chiretlesanalyserecacementconstituentlesprincipauxdespourconstruirelesentrep^otsdedonneesetlessystemesdecisionnelsdu 23 Bentez-Guerrero,Collet,Adiba [AC93]Adiba(Michel)etCollet(Christine).{Objetsetbasesdedonnees:le [AGS95]Agrawal(Rakesh),Gupta(Ashish)etSarawagi(Sunita).{Modeling [AAD+96]Agarwal(Sameet),Agrawal(Rakesh),Deshpande(Prasad),Gupta nita).{onthecomputationofmultidimensionalaggregates.in:pro- ceedingsofthe22ndvldbconference.{bombay,india,1996. (Ashish),Naughton(Jere),Ramakrishnan(Raghu)etSarawagi(Su- [App98]Applix.{TM1Technology.{Rapporttechnique,ApplixInc.,1998. SGBD02.{Paris,France,Hermes, SanJose,CA95120,USA,IBMAlmadenResearchCenter,September MultidimensionalDatabases.{Rapporttechnique,650HarryRoad, [AVS98]AVS.{GainingInsightThroughDataVisualisation.{Rapporttechnique,AdvancedVisualSystemsInc., { lizedviewselectioninamultidimensionaldatabase.in:proceedingsof [AS98]Arbor-Software, [Boh97]Bohn(Kathy).{Convertingdataforwarehouses.DBMSOn-Line,June [BPT97]Baralis(Elena),Paraboschi(Stefano)etTeniente(Ernest).{Materia- [BSHD98]Blaschka(Markus),Sapia(Carsten),Hoing(Gabriele)etDinter(Barbara).{Findingyourwaythroughmultidimensionaldatamodels.In: ProceedingsofInternationalWorkshoponDataWarehouseDesignand [BS96]Bontempo(Charles)etSaracco(C.).{Acceleratingindexedsearching. [Bro97]Brooks(Peter).{Visualizingdata.DBMSOn-Line,August1997.{ DatabaseProgrammingandDesign,July1996. the23rdvldbconference.{athenes,greece,1997. OLAPTechnology(DWDOT),pp.198{203.{Vienna,Autrich,August [BT98]Bokun(Michele)etTaglienti(Carmen).{Incrementaldata [CD97]Chauduri(Surajit)etDayal(Umeshwar).{Anoverviewofdataware- warehouseupdates:approachesandstrategiesforcapturingchangeddata.datamanagementreview,may1998.{ housingandolaptechnology.sigmodrecord,no1,1997,pp.65{74.

Entreposage, analyse en ligne et fouille de données

Entreposage, analyse en ligne et fouille de données Entreposage, analyse en ligne et fouille de données Houssem Jerbi IRIT - SIG/ED jerbi@irit.fr Journée COMPIL " Bases de Données" 14/12/2010 PLAN Introduction Bases de données Entrepôt de données Technologie

Plus en détail

Oracle Décisionnel : Modèle OLAP et Vue matérialisée D BILEK

Oracle Décisionnel : Modèle OLAP et Vue matérialisée D BILEK Oracle Décisionnel : Modèle OLAP et Vue matérialisée SOMMAIRE Introduction Le modèle en étoiles Requêtes OLAP Vue matérialisée Fonctions Roll up et Cube Application Introduction Data Warehouse Moteur OLAP

Plus en détail

PLAN. Les systèmes d'information analytiques. Exemples de décisions

PLAN. Les systèmes d'information analytiques. Exemples de décisions Les systèmes d'information analytiques Dr A.R. Baba-ali Maitre de conferences USTHB PLAN Le cycle de decision Les composants analytiques ETL (Extract, Transform and Load) Entrepot de (Data warehouse) Traitement

Plus en détail

Système OLAP Fresqueau

Système OLAP Fresqueau Système OLAP Fresqueau Kamal BOULIL Journées 20 mars Strasbourg Réunion plénière -Fresqueau 07-08 octobre 2013 1 Plan 1. Introduction 1. Projet ANR Fresqueau 2. Systèmes OLAP 2. Système OLAP Fresqueau

Plus en détail

Datawarehouse. C. Vangenot

Datawarehouse. C. Vangenot Datawarehouse C. Vangenot Plan Partie 1 : Introduction 1. Objectifs 2. Qu'est ce qu'un datawarehouse? 3. Pourquoi ne pas réutiliser les BD? Partie 2 : Implémentation d'un datawarehouse ROLAP MOLAP HOLAP

Plus en détail

Informatique Décisionnelle pour l environnement

Informatique Décisionnelle pour l environnement Territoires, Environnement, Télédétection et Information Spatiale Unité mixte de recherche AgroParisTech - Cirad - Irstea Informatique Décisionnelle pour l environnement Principe, architecture informatique

Plus en détail

Bases de données multidimensionnelles OLAP. OnLine Analytical Processing

Bases de données multidimensionnelles OLAP. OnLine Analytical Processing Bases de données multidimensionnelles OLAP OnLine Analytical Processing OLAP OLAP (On Line Analytical Processing): Ensemble des outils nécessaires pour la mise en place d'un Système d'information décisionnel

Plus en détail

Informatique Décisionnelle pour l environnement

Informatique Décisionnelle pour l environnement Territoires, Environnement, Télédétection et Information Spatiale Unité mixte de recherche AgroParisTech - Cirad - Irstea Informatique Décisionnelle pour l environnement Principe, architecture informatique

Plus en détail

et les Systèmes Multidimensionnels

et les Systèmes Multidimensionnels Le Data Warehouse et les Systèmes Multidimensionnels 1 1. Définition d un Datawarehouse (DW) Le Datawarehouse est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées

Plus en détail

Urbanisation des SI-NFE107

Urbanisation des SI-NFE107 OLAP Urbanisation des SI-NFE107 Fiche de lecture Karim SEKRI 20/01/2009 OLAP 1 Introduction PLAN OLAP Les différentes technologies OLAP Plate formes et Outils 20/01/2009 OLAP 2 Informatique décisionnelle

Plus en détail

L'infocentre sert à prendre des décisions opérationnelles basées sur des valeurs courantes

L'infocentre sert à prendre des décisions opérationnelles basées sur des valeurs courantes II - II 1ère génération 13 2ème génération : Entrepôt de données / Magasin de données 15 3ème génération OLAP 16 Références Bibliographiques 18 A. 1ère génération Infocentre Tableur Base de données Infocentre

Plus en détail

PARTIE 1 : ETAT DE L ART...

PARTIE 1 : ETAT DE L ART... Table des matières INTRODUCTION... 1 Contexte général de l étude... 3 Problématiques... 4 Contributions des nos travaux de recherche... 5 Organisation du mémoire... 6 PARTIE 1 : ETAT DE L ART... 9 CHAPITRE

Plus en détail

L informatique des entrepôts de données

L informatique des entrepôts de données L informatique des entrepôts de données Daniel Lemire SEMAINE 9 Les opérations OLAP 9.1. Présentation de la semaine Nous avons vu la semaine précédente qu il est possible de définir partiellement le paradigme

Plus en détail

Les Entrepôts de Données

Les Entrepôts de Données Les Entrepôts de Données Grégory Bonnet Abdel-Illah Mouaddib GREYC Dépt Dépt informatique :: GREYC Dépt Dépt informatique :: Cours Cours SIR SIR Systèmes d information décisionnels Nouvelles générations

Plus en détail

Bases de données multidimensionnelles et mise en œuvre dans Oracle

Bases de données multidimensionnelles et mise en œuvre dans Oracle Bases de données multidimensionnelles et mise en œuvre dans Oracle 1 Introduction et Description générale Les bases de données relationnelles sont très performantes pour les systèmes opérationnels (ou

Plus en détail

BI = Business Intelligence Master Data-ScienceCours 4 - OLAP

BI = Business Intelligence Master Data-ScienceCours 4 - OLAP BI = Business Intelligence Master Data-Science Cours 4 - OLAP UPMC 15 février 2015 Plan Vision générale ETL Datawarehouse OLAP Reporting Data Mining Entrepôt de données Les entrepôts de données (data warehouse)

Plus en détail

ETL Extract - Transform - Load

ETL Extract - Transform - Load ETL Extract - Transform - Load Concept général d analyse en ligne (rappels) Rémy Choquet - Université Lyon 2 - Master 2 IIDEE - 2006-2007 Plan Définitions La place d OLAP dans une entreprise OLAP versus

Plus en détail

Collabora'on IRISA/INRA sur le transfert de nitrates et l améliora'on de la qualité des eaux des bassins versants:

Collabora'on IRISA/INRA sur le transfert de nitrates et l améliora'on de la qualité des eaux des bassins versants: Collabora'on IRISA/INRA sur le transfert de nitrates et l améliora'on de la qualité des eaux des bassins versants: Tassadit BOUADI 22 Juin 2010, Saint Jacut 1 Plan Introduc

Plus en détail

Datawarehouse: Cubes OLAP. Marlyse Dieungang Khaoula Ghilani

Datawarehouse: Cubes OLAP. Marlyse Dieungang Khaoula Ghilani Datawarehouse: Cubes OLAP Marlyse Dieungang Khaoula Ghilani Table des matières 1 Data Warehouse 3 1.1 Introduction............................ 3 1.1.1 Définition......................... 3 1.1.2 Architecture........................

Plus en détail

Base de données en mémoire

Base de données en mémoire Base de données en mémoire Plan Bases de données relationnelles OnLine Analytical Processing Difficultés de l OLAP Calculs en mémoire Optimisations 1 Base de données relationnelle Introduction Date Exemple

Plus en détail

Contexte général de l étude

Contexte général de l étude 1 2 Contexte général de l étude Les entrepôts de données associés à des outils d analyse On Line Analytical Processing (OLAP), représentent une solution effective pour l informatique décisionnelle (Immon,

Plus en détail

Entrepôt de données (ED) Exercice traité en cours

Entrepôt de données (ED) Exercice traité en cours Enoncé Entrepôt de données (ED) Exercice traité en cours Une grande entreprise à succursales multiples veut rassembler toutes les nuits dans un entrepôt de données des informations sur les s du jour afin

Plus en détail

Entrepôts de données. NEGRE Elsa Université Paris-Dauphine 2015-2016

Entrepôts de données. NEGRE Elsa Université Paris-Dauphine 2015-2016 Entrepôts de données NEGRE Elsa Université Paris-Dauphine 2015-2016 Contexte et problématique Le processus de prise de décision L entrepôt de données Définition Différence avec un SGBD Caractéristiques

Plus en détail

Top_Keyword: Agrégation de motsclefs dans un environnement OLAP

Top_Keyword: Agrégation de motsclefs dans un environnement OLAP SIG/ED Top_Keyword: Agrégation de motsclefs dans un environnement OLAP Franck Ravat, Olivier Teste, Ronan Tournier, Gilles Zurfluh. IRIT: Institut de Recherche en Informatique de Toulouse. tournier@irit.fr

Plus en détail

Bases de Données Avancées

Bases de Données Avancées 1/26 Bases de Données Avancées DataWareHouse Thierry Hamon Bureau H202 - Institut Galilée Tél. : 33 1.48.38.35.53 Bureau 150 LIM&BIO EA 3969 Université Paris 13 - UFR Léonard de Vinci 74, rue Marcel Cachin,

Plus en détail

Bases de données. Modèle décisionnel. Jérôme Rocheteau. Lecture 8. Institut Catholique d Arts et Métiers Site de Nantes

Bases de données. Modèle décisionnel. Jérôme Rocheteau. Lecture 8. Institut Catholique d Arts et Métiers Site de Nantes Bases de données Lecture 8 1 / 25 Bases de données Modèle décisionnel Jérôme Rocheteau Institut Catholique d Arts et Métiers Site de Nantes Lecture 8 Bases de données Lecture 8 2 / 25 1 Structure multidimensionnelle

Plus en détail

SQL SERVER 2008, BUSINESS INTELLIGENCE

SQL SERVER 2008, BUSINESS INTELLIGENCE SGBD / Aide à la décision SQL SERVER 2008, BUSINESS INTELLIGENCE Réf: QLI Durée : 5 jours (7 heures) OBJECTIFS DE LA FORMATION Cette formation vous apprendra à concevoir et à déployer une solution de Business

Plus en détail

Etude de faisabilité visant à mettre en place un entrepôt de données sur les données de l IFN. Analyser et Explorer avec une grande interactivité

Etude de faisabilité visant à mettre en place un entrepôt de données sur les données de l IFN. Analyser et Explorer avec une grande interactivité Établissement chargé de réaliser l inventaire permanent du patrimoine forestier sur tout le territoire métropolitain indépendamment de toute question de propriété. Parmi ces objectifs: Connaissance de

Plus en détail

Prototype SOLAP appliqué sur des champs continus en mode raster

Prototype SOLAP appliqué sur des champs continus en mode raster Session démos 24 novembre 2014 Prototype SOLAP appliqué sur des champs continus en mode raster Analyse de hot spots de criminalité Jean-Paul Kasprzyk, doctorant Introduction 2 L informatique décisionnelle

Plus en détail

BUSINESS OBJECTS V5 / V6

BUSINESS OBJECTS V5 / V6 BUSINESS OBJECTS V5 / V6 Durée Objectif 2 jours L objectif de ce cours est de savoir utiliser le logiciel BUSINESS OBJECTS pour faire des interrogations multi - dimensionnelles sur les univers BO et de

Plus en détail

La place de la Géomatique Décisionnelle dans le processus de décision

La place de la Géomatique Décisionnelle dans le processus de décision Géomatique décisionnelle La place de la Géomatique Décisionnelle dans le processus de décision - Arnaud Van De Casteele Mines ParisTech - CRC Arnaud {dot} van_de_casteele {at} mines-paristech.fr Les rencontres

Plus en détail

Bases de données multidimensionnelles OLAP

Bases de données multidimensionnelles OLAP Bases de données multidimensionnelles OLAP OLAP OLAP (On Line Analytical Processing): Ensemble des outils nécessaires pour l analyse multidimensionnelle. Les données sont historisées, résumées, consolidées.

Plus en détail

Bases de données multimédias Bases de données multidimensionnelles

Bases de données multimédias Bases de données multidimensionnelles Bases de données multimédias Bases de données multidimensionnelles Contenu BD Multimédia : Caractéristiques Modélisation Interrogation Architectures des SGBD multimédias BD Multidimensionnelles Motivations

Plus en détail

L informatique des entrepôts de données

L informatique des entrepôts de données L informatique des entrepôts de données Daniel Lemire SEMAINE 8 Introduction à OLAP 8.1. Présentation de la semaine Le modèle OLAP (Online Analytical Processing) est un modèle quasiomniprésent en intelligence

Plus en détail

Data Mining, fouille de données: Concepts et techniques. Marius Fieschi Faculté de Médecine de Marseille

Data Mining, fouille de données: Concepts et techniques. Marius Fieschi Faculté de Médecine de Marseille Data Mining, fouille de données: Concepts et techniques Marius Fieschi Faculté de Médecine de Marseille Data Mining, fouille de données: Concepts et techniques Ce cours est très proche du cours diffusé

Plus en détail

Plan. Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation

Plan. Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation Data WareHouse Plan Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation 2 Présentation Besoin: prise de décisions

Plus en détail

BDMD NI248. Exercice 1 : Cube

BDMD NI248. Exercice 1 : Cube Nom : Prénom : Page 1 Université Pierre et Marie Curie Paris 6 Master d'informatique BDMD NI248 23 mars 2011 Documents autorisés - 2h Exercice 1 : Cube 5 pts Soit une table Ventes (Magasin, Produit, Couleur,

Plus en détail

Sommaire. Introduction. Opérations typiques. Langages. Architectures

Sommaire. Introduction. Opérations typiques. Langages. Architectures OLAP IED 2006-2007 Sommaire Introduction Opérations typiques Langages Architectures Introduction Contexte un entrepôt de données offre des données - nombreuses - homogènes - exploitables - multidimensionnelles

Plus en détail

CAPACITE CARTOGRAPHIQUE AUTOUR DES TECHNOLOGIES SOLAP

CAPACITE CARTOGRAPHIQUE AUTOUR DES TECHNOLOGIES SOLAP CONSERVATOIRE NATIONAL DES ARTS ET METIERS CENTRE REGIONAL RHONE-ALPES CENTRE D'ENSEIGNEMENT DE GRENOBLE UE ENG111 - Epreuve TEST Travail d'etude et de Synthèse Technique en INFORMATIQUE CAPACITE CARTOGRAPHIQUE

Plus en détail

BI2 : Un profil UML pour les Indicateurs Décisionnels

BI2 : Un profil UML pour les Indicateurs Décisionnels BI2 : Un profil UML pour les Indicateurs Décisionnels Sandro Bimonte Irstea, TSCF, 9 Av. Blaise Pascal, 63178, Aubière, France sandro.bimonte@irstea.fr Thème de Recherche MOTIVE www.irstea.fr 2 Plan Motivations

Plus en détail

Bases de Données OLAP

Bases de Données OLAP Bases de Données OLAP Hiver 013/014 Melanie Herschel melanie.herschel@lri.fr Université Sud, Groupe Bases de Données, LRI Systèmes Opérationnels vs. Entrepôts de Données Requêtes Requêtes BD opérationnelles

Plus en détail

Introduction. d'informations Les entrepôts de données (Datawarehouse) Les datamarts Architecture Modélisation

Introduction. d'informations Les entrepôts de données (Datawarehouse) Les datamarts Architecture Modélisation Data WareHouse Plan Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamarts Architecture Modélisation 2 Présentation Besoin: prise de décisions

Plus en détail

Projet Fresqueau: un entrepôt des données pour analyser la qualité de l eau en France

Projet Fresqueau: un entrepôt des données pour analyser la qualité de l eau en France Projet Fresqueau: un entrepôt des données pour analyser la qualité de l eau en France 12 juin 2013 Atelier SOLAP @EDA2013 Démarrage Projet MIDAS - 29 Janvier 2008 1 Plan Projet Fresqueau Objectifs généraux

Plus en détail

Datawarehousing and OLAP

Datawarehousing and OLAP Datawarehousing and OLAP Datawarehousing Syllabus, materials, notes, etc. See http://www.info.univ-tours.fr/ marcel/dw.html today introduction definition data integration model Introduction introduction

Plus en détail

Bases de Données OLAP. Systèmes Opérationnels vs. Entrepôts de Données Requêtes. Donné un Modèle Multidimensionnel

Bases de Données OLAP. Systèmes Opérationnels vs. Entrepôts de Données Requêtes. Donné un Modèle Multidimensionnel 007 006 00 00 00 00 Books s s North America Asia Europe Bases de Données OLAP Hiver 0/0 Melanie Herschel melanie.herschel@lri.fr Université Sud, Groupe Bases de Données, LRI Systèmes Opérationnels vs.

Plus en détail

Cisco Expo 2007. De Netflow à l Expertise Décisionnelle. On Demand IT Expertise

Cisco Expo 2007. De Netflow à l Expertise Décisionnelle. On Demand IT Expertise Cisco Expo 2007 De Netflow à l Expertise Décisionnelle On Demand IT Expertise accellent, l entreprise Notre métier L expertise des flux d applications et de services voix et données sur les réseaux et

Plus en détail

Les entrepôts de données

Les entrepôts de données Les entrepôts de données Lydie Soler Janvier 2008 U.F.R. d informatique Document diffusé sous licence Creative Commons by-nc-nd (http://creativecommons.org/licenses/by-nc-nd/2.0/fr/) 1 Plan Introduction

Plus en détail

BI = Business Intelligence Master Data-ScienceCours 3 - Data

BI = Business Intelligence Master Data-ScienceCours 3 - Data BI = Business Intelligence Master Data-Science Cours 3 - Datawarehouse UPMC 8 février 2015 Rappel L Informatique Décisionnelle (ID), en anglais Business Intelligence (BI), est l informatique à l usage

Plus en détail

Entrepôt de données 1. Introduction

Entrepôt de données 1. Introduction Entrepôt de données 1 (data warehouse) Introduction 1 Présentation Le concept d entrepôt de données a été formalisé pour la première fois en 1990 par Bill Inmon. Il s agissait de constituer une base de

Plus en détail

LE DIPLOME DE MAGISTER

LE DIPLOME DE MAGISTER Département Informatique MEMOIRE Présenté par ZANOUN Nabil Pour obtenir LE DIPLOME DE MAGISTER Spécialité : Informatique Option : Informatique et Automatique Intitulé : La construction en Ligne des tables

Plus en détail

Fournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement

Fournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement Introduction Phases du projet Les principales phases du projet sont les suivantes : La mise à disposition des sources Des fichiers Excel sont utilisés pour récolter nos informations L extraction des données

Plus en détail

Les entrepôts de données pour les nuls... ou pas!

Les entrepôts de données pour les nuls... ou pas! Atelier aideà la Décision à tous les Etages AIDE@EGC2013 Toulouse Mardi 29 janvier 2013 Cécile Favre Fadila Bentayeb Omar Boussaid Jérôme Darmont Gérald Gavin Nouria Harbi Nadia Kabachi Sabine Loudcher

Plus en détail

F. Opérations multidimensionnelles

F. Opérations multidimensionnelles F. Opérations multidimensionnelles Roll up (drill-up)/drill down (roll down) Roll up (drill-up) : résumer, agréger des données en montant dans une hiérachie ou en oubliant une dimension Drill down (roll

Plus en détail

Thibault Denizet. Introduction à SSIS

Thibault Denizet. Introduction à SSIS Thibault Denizet Introduction à SSIS 2 SSIS - Introduction Sommaire 1 Introduction à SQL Server 2008 Integration services... 3 2 Rappel sur la Business Intelligence... 4 2.1 ETL (Extract, Transform, Load)...

Plus en détail

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles) SGBDR Systèmes de Gestion de Bases de Données (Relationnelles) Plan Approches Les tâches du SGBD Les transactions Approche 1 Systèmes traditionnels basés sur des fichiers Application 1 Gestion clients

Plus en détail

XCube XML For Data Warehouses

XCube XML For Data Warehouses XCube XML For Data Warehouses Auteurs : Wolfgang Hümmer Andreas Bauer Gunnar Harde Présenté par : David TA KIM 2005-12-05 Sommaire Sommaire I Introduction au Datawarehouse Sommaire I Introduction au Datawarehouse

Plus en détail

Un datawarehouse est un entrepôt de données (une base de données) qui se caractérise par des données :

Un datawarehouse est un entrepôt de données (une base de données) qui se caractérise par des données : Page 1 of 6 Entrepôt de données Un article de Wikipédia, l'encyclopédie libre. L'entrepôt de données, ou datawarehouse, est un concept spécifique de l'informatique décisionnelle, issu du constat suivant

Plus en détail

Le "tout fichier" Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique

Le tout fichier Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique Introduction à l informatique : Information automatisée Le premier ordinateur Définition disque dure, mémoire, carte mémoire, carte mère etc Architecture d un ordinateur Les constructeurs leader du marché

Plus en détail

Entrepôts de données pour l aide à la décision médicale: conception et expérimentation

Entrepôts de données pour l aide à la décision médicale: conception et expérimentation Entrepôts de données pour l aide à la décision médicale: conception et expérimentation Serna Encinas María Trinidad To cite this version: Serna Encinas María Trinidad. Entrepôts de données pour l aide

Plus en détail

Leçon 4 : Typologie des SI

Leçon 4 : Typologie des SI Leçon 4 : Typologie des SI Typologie des SI Système formel Système informel Typologie des SI Chaque jour au sein d une organisation Le système d info stocke, traie ou restitue des quantités importantes

Plus en détail

ENRICHIR LES DONNEES DE DETAILS ACCEDEES A TRAVERS UN RAPPORT OLAP

ENRICHIR LES DONNEES DE DETAILS ACCEDEES A TRAVERS UN RAPPORT OLAP ENRICHIR LES DONNEES DE DETAILS ACCEDEES A TRAVERS UN RAPPORT OLAP SAS Web Report Studio offre depuis de nombreuses versions la possibilité de visualiser les observations spécifiques à partir des données

Plus en détail

Rappels( Requêtes(OLAP( Rappels( Requêtes(SIO/SID(

Rappels( Requêtes(OLAP( Rappels( Requêtes(SIO/SID( RequêtesOLAP Rappels Aucoursprécédent,onavu Ladis9nc9onOLTP/OLAP Lemodèlemul9dimensionnel,etsonimplémenta9onen rela9onnelschémaenétoile/flocon) Lareprésenta9ondesfaitsetdesdimensionsàl aided uncube Unemesure=une

Plus en détail

Principes et mise en œuvre du modèle OLAP. -1 ère Partie- La modélisation multidimensionnelle

Principes et mise en œuvre du modèle OLAP. -1 ère Partie- La modélisation multidimensionnelle Principes et mise en œuvre du modèle OLAP -1 ère Partie- La modélisation multidimensionnelle 1 Le modèle multidimensionnel (1) Le modèle multidimensionnel est bien adapté pour représenter des données qui

Plus en détail

Chapitre IX. L intégration de données. Les entrepôts de données (Data Warehouses) Motivation. Le problème

Chapitre IX. L intégration de données. Les entrepôts de données (Data Warehouses) Motivation. Le problème Chapitre IX L intégration de données Le problème De façon très générale, le problème de l intégration de données (data integration) est de permettre un accès cohérent à des données d origine, de structuration

Plus en détail

QU EST-CE QUE LE DECISIONNEL?

QU EST-CE QUE LE DECISIONNEL? La plupart des entreprises disposent d une masse considérable d informations sur leurs clients, leurs produits, leurs ventes Toutefois ces données sont cloisonnées par les applications utilisées ou parce

Plus en détail

Entrepôt de Données. Jean-François Desnos. Jean-Francois.Desnos@grenet.fr ED JFD 1

Entrepôt de Données. Jean-François Desnos. Jean-Francois.Desnos@grenet.fr ED JFD 1 Entrepôt de Données Jean-François Desnos Jean-Francois.Desnos@grenet.fr ED JFD 1 Définition (Bill Inmon 1990) Un entrepôt de données (data warehouse) est une collection de données thématiques, intégrées,

Plus en détail

CARTE HEURISTIQUE...1 LA CHAÎNE DÉCISIONNELLE...2. Collecte des données...2 Stockage des Données...3 Exploitation des Données...4 OLTP ET OLAP...

CARTE HEURISTIQUE...1 LA CHAÎNE DÉCISIONNELLE...2. Collecte des données...2 Stockage des Données...3 Exploitation des Données...4 OLTP ET OLAP... Table des matières CARTE HEURISTIQUE...1 LA CHAÎNE DÉCISIONNELLE...2 Collecte des données...2 Stockage des Données...3 Exploitation des Données...4 OLTP ET OLAP...6 OPÉRATIONS SUR LES CUBES...7 Exemple

Plus en détail

Prix de l Immobilier constatés à la mise en vente en Février 2014

Prix de l Immobilier constatés à la mise en vente en Février 2014 Prix de l Immobilier constatés à la mise en vente en Les prix de l immobilier n augmenteront pas au second trimestre 2014 Notre indice SeLoger des prix affichés de mise en vente est stable depuis le mois

Plus en détail

Business Intelligence avec Excel, Power BI et Office 365

Business Intelligence avec Excel, Power BI et Office 365 Avant-propos A. À qui s adresse ce livre? 9 1. Pourquoi à chaque manager? 9 2. Pourquoi à tout informaticien impliqué dans des projets «BI» 9 B. Obtention des données sources 10 C. Objectif du livre 10

Plus en détail

Workflow/DataWarehouse/DataMining. 14-09-98 LORIA - Université d automne 1998 - Informatique décisionnelle - L. Mirtain 1

Workflow/DataWarehouse/DataMining. 14-09-98 LORIA - Université d automne 1998 - Informatique décisionnelle - L. Mirtain 1 Workflow/DataWarehouse/DataMining 14-09-98 LORIA - Université d automne 1998 - Informatique décisionnelle - L. Mirtain 1 plan Workflow DataWarehouse Aide à la décision DataMinig Conclusion 14-09-98 LORIA

Plus en détail

Big Data On Line Analytics

Big Data On Line Analytics Fdil Fadila Bentayeb Lb Laboratoire ERIC Lyon 2 Big Data On Line Analytics ASD 2014 Hammamet Tunisie 1 Sommaire Sommaire Informatique décisionnelle (BI Business Intelligence) Big Data Big Data analytics

Plus en détail

2014/2015. Rapport 4 REALISE PAR : ISMAIL NAIT ABDELLAH OUALI SOUFIANE HOURRI MOHAMED OUSSAFI ENCADRE PAR : MME L.LAMRINI ANOUAR OUFQIR SMARTSIR

2014/2015. Rapport 4 REALISE PAR : ISMAIL NAIT ABDELLAH OUALI SOUFIANE HOURRI MOHAMED OUSSAFI ENCADRE PAR : MME L.LAMRINI ANOUAR OUFQIR SMARTSIR 2014/2015 Rapport 4 REALISE PAR : ISMAIL NAIT ABDELLAH OUALI SOUFIANE HOURRI MOHAMED OUSSAFI ENCADRE PAR : ANOUAR OUFQIR MME L.LAMRINI SMARTSIR Table des matières Introduction... 2 Choix de l outil pour

Plus en détail

Introduction à l Informatique Décisionnelle - Business Intelligence (7)

Introduction à l Informatique Décisionnelle - Business Intelligence (7) Introduction à l Informatique Décisionnelle - Business Intelligence (7) Bernard ESPINASSE Professeur à Aix-Marseille Université (AMU) Ecole Polytechnique Universitaire de Marseille Septembre 2013 Emergence

Plus en détail

OLAP PAR L'EXEMPLE. La vente de chaussures. NEGRE Elsa 2015-2016 Université Paris-Dauphine S o u r c e : B e r n a r d L u p i n

OLAP PAR L'EXEMPLE. La vente de chaussures. NEGRE Elsa 2015-2016 Université Paris-Dauphine S o u r c e : B e r n a r d L u p i n OLAP PAR L'EXEMPLE La vente de chaussures NEGRE Elsa 2015-2016 Université Paris-Dauphine S o u r c e : B e r n a r d L u p i n CONTEXTE La société Au bon pied, installée à Bonneuil, désire construire une

Plus en détail

SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...)

SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...) Avant-propos 1. À qui s'adresse ce livre? 15 2. Pré-requis 15 3. Objectifs du livre 16 4. Notations 17 Introduction à la Business Intelligence 1. Du transactionnel au décisionnel 19 2. Business Intelligence

Plus en détail

Plan. Ce qu est le datawarehouse? Un modèle multidimensionnel. Architecture d un datawarehouse. Implémentation d un datawarehouse

Plan. Ce qu est le datawarehouse? Un modèle multidimensionnel. Architecture d un datawarehouse. Implémentation d un datawarehouse Datawarehouse 1 Plan Ce qu est le datawarehouse? Un modèle multidimensionnel Architecture d un datawarehouse Implémentation d un datawarehouse Autres développements de la technologie data cube 2 Ce qu

Plus en détail

Réda DEHAK reda@lrde.epita.fr 2012/2013 http://www.lrde.epita.fr/~reda/bdd

Réda DEHAK reda@lrde.epita.fr 2012/2013 http://www.lrde.epita.fr/~reda/bdd Réda DEHAK reda@lrde.epita.fr 2012/2013 http://www.lrde.epita.fr/~reda/bdd Calcul relationnel de tuples Forme générale : { t P(t) } Où : t est une variable tuple P est un prédicat (formule) construit à

Plus en détail

Prix de l Immobilier constatés à la mise en vente en Novembre 2012

Prix de l Immobilier constatés à la mise en vente en Novembre 2012 Prix de l Immobilier constatés à la mise en vente en Les prix résistent toujours «Dans un marché immobilier pourtant grippé, les prix résistent toujours en ce mois de Novembre. Avec un indice qui ne progresse

Plus en détail

ERP & Processus. lacreuse@unistra.fr

ERP & Processus. lacreuse@unistra.fr ERP & Processus Métiers lacreuse@unistra.fr Processus : «Système d activités qui utilise des ressources pour transformer des éléments d entrée en résultat» Iso9000 Approche par processus Axes de modélisation

Plus en détail

5. Architecture et sécurité des systèmes informatiques Dimension Fonctionnelle du SI

5. Architecture et sécurité des systèmes informatiques Dimension Fonctionnelle du SI 5. Architecture et sécurité des systèmes informatiques Dimension Fonctionnelle du SI Un SI : et pour faire quoi? Permet de stocker de manière définitive des informations volatiles provenant d autre BD.

Plus en détail

Les ntrepôts de onnées. (Data Warehouses) La Modélisation

Les ntrepôts de onnées. (Data Warehouses) La Modélisation Les ntrepôts de onnées (Data Warehouses) La Modélisation 1 Les$Faits La$défini-on$ Unfaitestlapluspe-teinforma-onanalysable.C'estuneinforma-onqui con-entlesdonnéesobservables(les$faits)quel'onpossèdesurunsujetet

Plus en détail

Évolution de modèle dans les entrepôts de données : existant et perspectives

Évolution de modèle dans les entrepôts de données : existant et perspectives EDA'07 3èmes journées francophones sur les Entrepôts de Données et l'analyse en ligne Poitiers, 7 et 8 Juin 2007 Évolution de modèle dans les entrepôts de données : existant et perspectives Cécile Favre,

Plus en détail

Introduction à la B.I. Avec SQL Server 2008

Introduction à la B.I. Avec SQL Server 2008 Introduction à la B.I. Avec SQL Server 2008 Version 1.0 VALENTIN Pauline 2 Introduction à la B.I. avec SQL Server 2008 Sommaire 1 Présentation de la B.I. et SQL Server 2008... 3 1.1 Présentation rapide

Plus en détail

2 Serveurs OLAP et introduction au Data Mining

2 Serveurs OLAP et introduction au Data Mining 2-1 2 Serveurs OLAP et introduction au Data Mining 2-2 Création et consultation des cubes en mode client-serveur Serveur OLAP Clients OLAP Clients OLAP 2-3 Intérêt Systèmes serveurs et clients Fonctionnalité

Plus en détail

Modélisation et manipulation des systèmes OLAP : de l intégration des documents à l usager

Modélisation et manipulation des systèmes OLAP : de l intégration des documents à l usager MEMOIRE pour l obtention de l HABILITATION à DIRIGER des RECHERCHES Spécialité Informatique Modélisation et manipulation des systèmes OLAP : de l intégration des documents à l usager Olivier Teste Soutenue

Plus en détail

Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP)

Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP) Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP) Définition (G. Gardarin) Entrepôt : ensemble de données historisées variant

Plus en détail

UNIVERSITÉ MOHAMMED V AGDAL. FACULTÉ DES SCIENCES Rabat THÈSE DE DOCTORAT. Présentée par ELhoussaine ZIYATI Discipline : Sciences de l ingénieur

UNIVERSITÉ MOHAMMED V AGDAL. FACULTÉ DES SCIENCES Rabat THÈSE DE DOCTORAT. Présentée par ELhoussaine ZIYATI Discipline : Sciences de l ingénieur UNIVERSITÉ MOHAMMED V AGDAL FACULTÉ DES SCIENCES Rabat N d ordre 2491 THÈSE DE DOCTORAT Présentée par ELhoussaine ZIYATI Discipline : Sciences de l ingénieur Spécialité : Informatique et Télécommunications

Plus en détail

La Business Intelligence 01/05/2012. Les Nouvelles Technologies

La Business Intelligence 01/05/2012. Les Nouvelles Technologies 2 La Business Intelligence Les Nouvelles Technologies 3 Une expertise méthodologique pour une intervention optimale sur tous les niveaux du cycle de vie d un projet 4 5 Ils nous font confiance : L ambition

Plus en détail

Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours

Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours Information du cours Informatique décisionnelle et data mining www.lia.univ-avignon.fr/chercheurs/torres/cours/dm Juan-Manuel Torres juan-manuel.torres@univ-avignon.fr LIA/Université d Avignon Cours/TP

Plus en détail

et les Systèmes Multidimensionnels

et les Systèmes Multidimensionnels Le Data Warehouse et les Systèmes Multidimensionnels 1 1. Définition d un Data warehouse (DW) Le Data warehouse (entrepôt de données) est une collection de données orientées sujet, intégrées, non volatiles

Plus en détail

OLAP : un pas vers la navigation

OLAP : un pas vers la navigation Arnaud Giacometti, Patrick Marcel, Elsa Negre Université François-Rabelais de Tours Laboratoire d Informatique, Campus de Blois 3 place Jean Jaurès, 41000 Blois {Arnaud.Giacometti,Patrick.Marcel,Elsa.Negre}@univ-tours.fr

Plus en détail

Université Paris IX DAUPHINE DATE : 24/04/06

Université Paris IX DAUPHINE DATE : 24/04/06 Master Informatique Décisionnelle Application des outils de l'informatique Décisionnelle en entreprise ETUDE SUR LES MARQUES ET LES CONTRUCTEUR DES VÉHICULES APPARTENANT AUX CLIENTS D UNE COMPAGNIE D ASSURANCE

Plus en détail

L'infocentre sert à prendre des décisions opérationnelles basées sur des valeurs courantes

L'infocentre sert à prendre des décisions opérationnelles basées sur des valeurs courantes II - II A. 1ère génération Infocentre L'infocentre sert à prendre des décisions opérationnelles basées sur des valeurs courantes Définition L'infocentre est une collection de données orientées sujet, intégrées,

Plus en détail

UNE DÉMARCHE D ANALYSE À BASE DE PATRONS POUR LA DÉCOUVERTE DES BESOINS MÉTIER D UN SID

UNE DÉMARCHE D ANALYSE À BASE DE PATRONS POUR LA DÉCOUVERTE DES BESOINS MÉTIER D UN SID 1 UNE DÉMARCHE D ANALYSE À BASE DE PATRONS POUR LA DÉCOUVERTE DES BESOINS MÉTIER D UN SID 31 janvier 2012 Bordeaux Présentée par :Mme SABRI Aziza Encadrée par : Mme KJIRI Laila Plan 2 Contexte Problématique

Plus en détail

Introduction à lʼinformatique. Décisionnelle (ID) / Business. Intelligence» (1)

Introduction à lʼinformatique. Décisionnelle (ID) / Business. Intelligence» (1) Introduction à lʼinformatique Décisionnelle et la «Business Intelligence» (1) Bernard ESPINASSE Professeur à Aix-Marseille Université (AMU) Ecole Polytechnique Universitaire de Marseille Septembre 2013

Plus en détail

Etude d implantation en France

Etude d implantation en France Etude d implantation en France pour l entreprise MUSTER GmbH D-00000 Muster 1. Introduction et présentation du projet 1.1. et planification stratégique du projet de l entreprise MUSTER GmbH en France 6

Plus en détail

1.1 Exemple introductif d un cube de données... 2

1.1 Exemple introductif d un cube de données... 2 1.1 Exemple introductif d un cube de données............... 2 2.1 Pré-traitement des données avec les outils OLAP [MHW00]...... 14 2.2 Architecture d un système intégrant SGBD, OLAP et MOLAP [Fu05] 16

Plus en détail

Prix de l Immobilier constatés à la mise en vente en Février 2012

Prix de l Immobilier constatés à la mise en vente en Février 2012 Prix de l Immobilier constatés à la mise en vente en Stabilité des prix de mise en vente «Une quasi stabilité des prix affichés à la mise en vente, qui se confirme depuis la fin de l année, avec un indice

Plus en détail

RAPPORT ENTREPOT DE DONNEES

RAPPORT ENTREPOT DE DONNEES RAPPORT ENTREPOT DE DONNEES Informatique Décisionnelle Réalisé par : Supervisé par : Ait Skourt Brahim Bouchana Adil Ed-dahmouni Bouthayna El Issaoui Naoufal Pr. L.Lamrini Informatique décisionnelle (BI)

Plus en détail