Problèmes d additivité dus à la présence de hiérarchies
|
|
|
- Alain Gamache
- il y a 10 ans
- Total affichages :
Transcription
1 Problèmes d additivité dus à la présence de hiérarchies complexes dans les modèles multidimensionnels : définitions, solutions et travaux futurs Marouane Hachicha, Jérôme Darmont To cite this version: Marouane Hachicha, Jérôme Darmont. Problèmes d additivité dus à la présence de hiérarchies complexes dans les modèles multidimensionnels : définitions, solutions et travaux futurs. 9èmes journées francophones sur les Entrepôts de Données et l Analyse en ligne (EDA 2013), Jun 2013, lois, France. Hermann, -9, pp.7-16, RNTI. <hal > HAL Id: hal Submitted on 21 Jun 2013 HAL is a multi-disciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.
2 Problèmes d additivité dus à la présence de hiérarchies complexes dans les modèles multidimensionnels : définitions, solutions et travaux futurs Marouane Hachicha, Jérôme Darmont Université de Lyon (ERIC Lyon 2) 5 Avenue Pierre Mendès-France ron Cedex France Courriel:pré[email protected] Résumé. De nos jours, les entrepôts de données et les outils d analyse OLAP sont très utilisés dans les entreprises qui ont besoin de systèmes décisionnels qui s adaptent à toutes les situations particulières du monde réel, pour éviter les erreurs d analyse (plus connues dans la littérature sous le nom de problèmes d additivité ou summarizability issues en Anglais). Dans cet article, nous présentons un état de l art des travaux sur les problèmes d additivité dus à la présence de hiérarchies complexes dans les modèles multidimensionnels et discutons des travaux restant à mener dans ce domaine. Mots clés : Entrepôts de données, OLAP, Problèmes d additivité, Hiérarchies non-strictes, Hiérarchies non-couvrantes, Hiérarchies complexes, Normalisation, Transformation, Solutions en temps réel. 1 Introduction De nos jours, les systèmes d information décisionnels, basés sur les entrepôts de données et les analyses OLAP (On-Line Analytical Processing), sont très utilisés en entreprise dans un but d aide à la décision. Afin de les préparer au stockage et à l analyse, les données décisionnelles sont modélisées, au niveau conceptuel, d une façon dite multidimensionnelle. La modélisation multidimensionnelle consiste à représenter les données décisionnelles selon leurs niveaux d agrégation (faits et dimensions qui peuvent être hiérarchisées). Par exemple, le modèle conceptuel UML de la figure 1 représente des faits ventes décrits selon deux dimensions : (1) la dimension géographique organisée en hiérarchie : ville-région-pays (du plus détaillé au plus général) et (2) la dimension date organisée en hiérarchie : jour-semaine-mois-année (du plus détaillé au plus général). D après Mazón et al. (2009), dans un modèle multidimensionnel, le concepteur doit garantir (1) la représentation adéquate des associations fait-dimension et (2) la représentation adéquate des différents niveaux d agrégation d une dimension exprimée en hiérarchie. Généralement, les situations du monde réel sont modélisées selon des hiérarchies simples. Les associations entre les différents niveaux d une hiérarchie simple sont de type un à plusieurs. Mais, certaines situations du monde réel sont modélisées selon des hiérar-
3 Problèmes d additivité dus à la présence de hiérarchies complexes Figure 1 refaite par le modèle de Mazon et al, jour D date [1..*] d d r semaine D semaine [1..*] r 1 r [1..*] mois D nom d r 1 année D année y [1..*] 1 x z 1 [0..*] date ventes FA prix y z x géo ville D nom [1..*] [1..*] 1 [0..1] r d région D nom r pays D nom r [0..*] FIG. 1 Exemple de modélisation multidimensionnelle de ventes (voir Mazón et al., 2009, figure 1). chies dites complexes. Par définition, une hiérarchie complexe est une hiérarchie qui est à la fois non-stricte et non-couvrante (Hachicha et al., 2012). Une hiérarchie est dite non-stricte lorsque l association entre deux niveaux hiérarchiques est de type plusieurs à plusieurs et non de type un à plusieurs (Malinowski et Zimányi, 2006). Par exemple, une semaine peut appartenir à plusieurs mois et non un seul. Par ailleurs, un mois contient plusieurs semaines (figure 1). Une hiérarchie est dite non-couvrante lorsque deux niveaux hiérarchiques sont reliés l un à l autre en sautant un ou plusieurs niveaux intermédiaires (Malinowski et Zimányi, 2006). L association entre pays et région dans la figure 1 (zéro à plusieurs) reflète le cas réel où certains pays ne contiennent pas de région (comme Monaco, qui est à la fois une ville et un état). Les hiérarchies complexes sont un sujet très sensible dans les entrepôts de données et l OLAP. Le fait d ignorer la nature de ces hiérarchies en concevant l entrepôt de données (et/ou les opérateurs OLAP) peut être à l origine d erreurs d analyse et, par la suite, la cause principale de l échec de tout un projet décisionnel. Les problèmes dus à la présence des hiérarchies non-couvrantes, non-strictes ou complexes sont connus dans la littérature sous le nom de problèmes d additivité ou summarizability issues en Anglais (Mazón et al., 2009). L objectif de cet article est de présenter un état des lieux des problèmes d additivité dus aux hiérarchies complexes et de leur traitement, inédit en Français. Notons qu il n est pas une traduction de l état de l art de Mazón et al. (2009). Nous classons en effet et discutons les travaux sur les problèmes d additivité d une façon différente, et nous élargissons de plus notre étude aux solutions en temps réel, qui ne sont pas étudiées par Mazón et al. (2009) et nous semblent très prometteuses. Notons enfin que nous n avons pas dans cet article l espace suffisant pour étudier d autres travaux sur l additivité comme les travaux sur les contraintes de compatibilité de type (Lenz et Shoshani, 1997; Prat et al., 2011). Le reste de cet article est organisé comme suit. Dans la section 2, nous définissons l additivité et étudions les contraintes d additivité liées aux hiérarchies complexes. Dans la section 3, nous étudions les solutions présentées dans la littérature pour les problèmes d additivité dus aux hiérarchies complexes et nous les discutons. Nous présentons les travaux que nous anticipons pour le futur dans la section 4. Nous concluons cet article dans la section 5.
4 M. Hachicha et J. Darmont 2 Additivité 2.1 Définition de l additivité La notion d additivité (summarizability) a été introduite par Rafanelli et Shoshani (1990) dans le contexte des bases de données statistiques et analysée par Lenz et Shoshani (1997) dans le contexte des bases de données multidimensionnelles. Soit une dimension, appartenant à l ensemble des dimensions d un modèle multidimensionnel et exprimée en hiérarchie. Par définition, l additivité désigne le calcul correct des valeurs agrégées à un niveau d agrégation donné à partir des valeurs agrégées à un niveau d agrégation inférieur (Mazón et al., 2009). Ce calcul n est autre que l opération OLAP de forage vers le haut (roll-up) (Teste, 2009). Notons que le terme additivité que nous utilisons dans cet article est la traduction imparfaite du terme anglo-saxon summarizability. Dans la littérature, le terme anglo-saxon additivity désigne un cas particulier de summarizability lorsque la fonction d agrégation utilisée est la somme (Horner et al., 2004). Dans cet article, nous étudions les problèmes d additivité (summarizability issues) qui concernent toutes les fonctions d agrégation. 2.2 Contraintes d additivité liées aux hiérarchies complexes Rafanelli et Shoshani (1990) et Lenz et Shoshani (1997) introduisent les contraintes suivantes pour de garantir l additivité. (1) Les cardinalités de type plusieurs à plusieurs ne doivent pas être utilisées, c est-à-dire que la cardinalité maximale associée au niveau supérieur (dans une association entre un niveau inférieur et un niveau supérieur d une hiérarchie) ne peut être que 1. (2) Toutes les associations entre les niveaux hiérarchiques doivent être de type un à plusieurs. (3) Dans une hiérarchie de dimension, les relations de type zéro à plusieurs ne doivent pas être utilisées : toute instance du niveau inférieur doit être liée à au moins une instance du niveau supérieur. Nous concluons donc que, pour garantir l additivité dans un modèle multidimensionnel, deux contraintes majeures doivent être vérifiées : les associations entre les niveaux hiérarchiques d une dimension doivent être à la fois strictes et couvrantes. Il est alors évident que la présence de hiérarchies complexes dans un modèle multidimensionnel provoque des problèmes d additivité Hiérarchies de dimension non-strictes et problèmes d additivité Soit la dimension date de la figure 1. Dans la vie de tous les jours, nous disons couramment qu un mois se compose de quatre semaines. Or, en réalité, quatre semaines correspondent à vingt-huit jours, ce qui est strictement inférieur au nombre de jours d un mois (généralement trente ou trente-et-un). Donc, un mois est composé de quatre semaines et d une partie de la cinquième semaine, elle-même première semaine du mois suivant. En conclusion, une semaine peut appartenir à plusieurs mois et un mois contient plusieurs semaines. L association entre semaine et mois est de type plusieurs à plusieurs, donc elle est non-stricte. Supposons maintenant que nous voulions calculer le total des ventes d un produit donné pour les mois de juin et de juillet 2011 (tableau 1(b)) à partir des ventes par semaine (tableau 1(a)). Le tableau 1(b) montre que si nous comptons la cinquième semaine deux fois (une fois pour chaque mois), nous obtenons un total incorrect (différent du celui du tableau 1(a)).
5 Problèmes d additivité dus à la présence de hiérarchies complexes Cet exemple, inspiré d un cas réel, illustre comment les hiérarchies non-strictes provoquent des problèmes d additivité. Semaine Ventes S S S S S S S S S Total 90 (a) Ventes par semaine Mois Ventes Total 100 (b) Ventes par mois TA. 1 Hiérarchies non-strictes et problèmes d additivité Hiérarchies de dimension non-couvrantes et problèmes d additivité Soit la la dimension géographique de la figure 1. Les cardinalités entre région et pays (zéro à plusieurs) reflètent le cas réel où certains pays du monde ne contiennent pas de région (comme Monaco, qui est à la fois une ville et un état). Cette relation est donc non-couvrante. Les tableaux 2(a) et 2(b) représentent les sommes des ventes d un produit donné par région et par pays, respectivement. La somme des ventes par pays est différente de la somme des ventes par région car il n existe pas de région à Monaco. Cet exemple, inspiré d un cas réel, démontre que les hiérarchies non-couvrantes provoquent des problèmes d additivité. Région Ventes Île-de-France 200 Rhône-Alpes 200 avière 200 Total 600 (a) Ventes par région Pays Ventes France 400 Allemagne 200 Monaco 200 Total 800 (b) Ventes par pays TA. 2 Hiérarchies non-couvrantes et problèmes d additivité. Remarque. Toutes les contraintes d additivité que nous avons étudiées jusqu à maintenant concernent les différents niveaux d une dimension organisée en hiérarchie. Ces contraintes sont appelées contraintes intradimensionnelles par Lehner et al. (1998). Les auteurs introduisent également un autre type de contraintes d additivité : les contraintes sur les relations entre faits et dimensions dans un modèle multidimensionnel (contraintes interdimensionnelles). Même si certains auteurs identifient les relations inter et intradimensionnelles comme des problèmes
6 M. Hachicha et J. Darmont séparés (Mazón et al., 2008), ces relations sont de même nature et les solutions pour régler les problèmes d additivité sont exactement les mêmes (Pedersen et al., 1999). 3 Résolution des problèmes d additivité Dans cette section, nous étudions les solutions présentées dans la littérature pour les problèmes d additivité dus aux hiérarchies complexes : la normalisation des modèles multidimensionnels (section 3.1), la transformation de données multidimensionnelles (section 3.2) et les solutions en temps réel (section 3.3). Nous concluons et discutons l ensemble de ces travaux dans la section Normalisation des modèles multidimensionnels La normalisation d un modèle multidimensionnel est définie comme la transformation des hiérarchies de dimension (ou des associations fait-dimension) qui sont à l origine des problèmes d additivité en hiérarchies simples (strictes et couvrantes). Nous classons les stratégies de normalisation en deux familles. Dans la première, le but est de définir des contraintes et des règles de transformation du modèle multidimensionnel. Hurtado et al. (2005) présentent deux solutions pour les problèmes d additivité dans les hiérarchies de dimension non-couvrantes (appelées hétérogènes par les auteurs). Par définition, une hiérarchie hétérogène est décrite de plusieurs façons dans le même schéma. Pour faire face à ce problème, Hurtado et al. (2005) définissent un graphe direct G enrichi par deux types de contraintes : les contraintes de chemin (Path atoms) et les contraintes d égalité (Equality atoms). Les contraintes de chemin sont de la forme [c 0, c 1,..., c n ] tel que [c 0, c 1,..., c n ] est un chemin dans la hiérarchie hétérogène. Les contraintes d égalité sont de la forme [c 1 = k] tel que k M (M est un ensemble d instances d un membre d une dimension). Plusieurs signes sont autorisés dans la définition des contraintes comme (négation), (différent de), etc. Ensuite, Hurtado et al. (2005) introduisent la notion de dimensions couvrantes minimales (frozen dimensions). Ces dimensions sont représentées dans le même graphe avec les dimensions non-couvrantes. Le but de cette représentation est de rendre plus facile la compréhension des hiérarchies hétérogènes. La deuxième stratégie de normalisation ajoute de nouvelles structures au modèle logique dans le but de garantir l additivité, appelées les tables de jointure ou bridge tables en Anglais (Malinowski et Zimányi, 2006). De cette manière, les autres tables contiennent les données qui ne posent pas de problèmes d additivité. Dans ce sens, Mazón et al. (2008) proposent un modèle conceptuel UML pour les différentes associations fait-dimension, non-strictes et noncouvrantes, afin de faciliter la représentation des situations du monde réel. Ils dérivent ensuite, à partir de ce modèle, un modèle conceptuel normalisé qui évite les problèmes d additivité. Pour normaliser les associations fait-dimension non-strictes, deux solutions sont proposées par Mazón et al. (2008). Dans la première solution, si nous connaissons la contribution de chaque instance de dimension pour chaque instance de fait, les valeurs des mesures sont partagées entre les différentes instances des dimensions en question. Dans ce cas, la multiplicité maximale côté dimension est transformée de plusieurs à un. Cette méthode ne nécessite pas l ajout de nouvelle classe au modèle conceptuel, mais il suffit de regrouper les différentes instances de dimensions qui posent des problèmes d additivité dans un nouvel attribut ajouté aux faits.
7 Problèmes d additivité dus à la présence de hiérarchies complexes Dans la deuxième solution, si nous ne connaissons pas la contribution de quelques instances de dimension pour chaque instance de fait, les auteurs procèdent comme suit : (1) les instances connues sont traitées comme dans la première solution et (2) les instances inconnues sont séparées dans une nouvelle classe de dimension. 3.2 Transformation de données multidimensionnelles Les approches de transformation de données multidimensionnelles consistent à modifier les valeurs des instances de dimensions afin d assurer l additivité. Dans un premier travail, Pedersen et al. (1999) proposent une solution pour résoudre les problèmes d additivité dans les hiérarchies de dimension complexes. Ils présentent trois algorithmes : (1) MakeCovering et (2) MakeOnto pour remplacer les valeurs manquantes dans les hiérarchies non-couvrantes et non-ontos 1, respectivement ; et (3) MakeStrict pour fusionner les valeurs des instances multiples dans les hiérarchies non-strictes. MakeCovering : Soit la hiérarchie adresse-ville-région-pays. L algorithme commence par donner des valeurs aux valeurs manquantes à partir du niveau le plus détaillé de la hiérarchie (adresse dans cet exemple) jusqu au niveau supérieur (pays dans cet exemple) en passant par les niveaux intermédiaires (ville puis région dans cet exemple). MakeCovering recherche les valeurs manquantes dans les métadonnées associées aux données multidimensionnelles et/ou fait appel à un expert. Par exemple, supposons que nous voulions compléter l adresse d une ruelle en Australie ou aux États-Unis, un avis d expert peut être décisif en l absence des métadonnées nécessaires. Le principe de MakeOnto est le même que celui de MakeCovering. MakeStrict : Une fois les hiérarchies non-couvrantes et non-ontos transformées en hiérarchies couvrantes et ontos, respectivement, l algorithme MakeStrict est appelé afin de fusionner les valeurs des instances d un même niveau hiérarchique ayant le même élément parent en une seule valeur. Les valeurs fusionnées sont ensuite insérées entre les deux niveaux hiérarchiques parent et enfant. Dans une extension de ce travail, Mansmann et Scholl (2007) regroupent toutes les instances d un niveau hiérarchique donné pour lesquelles nous ne connaissons pas les valeurs des instances de l élément parent en dessous d un niveau hiérarchique artificiel nommé Others, dans les hiérarchies non-couvrantes et non-ontos. Les auteurs transforment les hiérarchies nonstrictes en utilisant MakeStrict. 3.3 Solutions en temps réel Le principe des solutions en temps réel est de détecter et de résoudre les problèmes d additivité au moment du calcul des agrégations et non a priori (normalisation et transformation). L opérateur projection généralisée de Pedersen et al. (2002) permet de calculer des agrégations. Au cas où il détecte des hiérarchies non-strictes ou non-couvrantes, cet opérateur retourne un résultat vide. Dans un deuxième travail, Horner et Song (2005) ouvrent des perspectives pour des nouvelles solutions en temps réel. Pour résoudre les problèmes d additivité dans les hiérarchies non-strictes, les auteurs proposent d exécuter des scripts pour (1) déterminer combien 1. Les hiérarchies non-ontos représentent un cas particulier des hiérarchies non-couvrantes. Une hiérarchie est dite non-onto lorsque la distance entre le plus haut et le plus bas niveaux de granularité de la hiérarchie varie d un cas à un autre (Pedersen et al., 1999).
8 M. Hachicha et J. Darmont de fois les mesures ont été agrégées dans ces hiérarchies et (2) identifier le nombre total de valeurs multiples. Ensuite, Horner et Song (2005) distinguent trois types de valeurs manquantes : orphelines, omises et non-applicables, et proposent un traitement spécial pour chaque type. Dans une approche plus récente, nous présentons deux opérateurs XOLAP d agrégation et regroupement et de forage vers le haut (Hachicha et al., 2012). Dans cette approche, nous modélisons les données multidimensionnelles à l aide d arbres de données, que nous appelons les arbres de données multidimensionnels. Pour résoudre les problèmes d additivité, nos deux opérateurs XOLAP sont basés sur l algorithme QS (Query-ased Summarizability) qui est composé de deux étapes : (1) détection des problèmes d additivité et (2) création/mise à jour du résultat. QS parcourt les faits de l arbre de données un par un. Dans l étape (1), si la hiérarchie en cours est non-couvrante, il regroupe toutes les instances correspondantes à chaque critère de regroupement dans une seule valeur artificielle Other. En cas de hiérarchie non-stricte, il regroupe toutes les instances correspondantes à chaque critère de regroupement dans un seul groupe, comme dans MakeStrict (Pedersen et al., 1999). En cas de hiérarchie complexe, QS associe ces deux solutions. Dans l étape (2), QS vérifie si l ensemble de groupes créés à l étape (1) existe dans un des arbres de données du résultat. Si c est le cas, il met à jour le résultat d agrégation avec la mesure en cours. Sinon, il crée un nouvel arbre dans le résultat final. Une fois tous les faits parcourus, tous les arbres résultats sont réunis sous une seule racine pour former le résultat final de la requête. 3.4 Discussion Transformation ou normalisation? Toutes les approches de transformation se basent sur les algorithmes MakeStrict et Make- Covering de Pedersen et al. (1999). En fait, les hiérarchies non-strictes existent dans plusieurs situations du monde réel (Pedersen et al., 1999) et leur transformation à l aide du processus de fusion nécessite le respect de la sémantique des données exprimées dans ces hiérarchies (Mansmann et Scholl, 2007). Li et al. (2005) démontrent toutefois que l algorithme MakeCovering n est pas adapté à certains cas réels. Soit l exemple de la dimension géographique liée à la Chine : district-villeprovince-pays, où certaines provinces sont elles même des villes, comme Pékin. MakeCovering ne permet pas de résoudre ce problème. Li et al. (2005) étendent alors MakeCovering afin de pouvoir traiter les problèmes d additivité liés à la hiérarchie géographique en Chine. L inconvénient de ce travail est qu il ne traite que ce cas particulier. La transformation souffre de quelques problèmes de performance. En effet, à chaque fois que l entrepôt est mis à jour, les contraintes d additivité doivent être vérifiées. C est pourquoi le choix de la transformation comme solution pour les problèmes d additivité a été abandonné par les auteurs des approches de normalisation (Hurtado et al., 2005; Mazón et al., 2008). Nous pensons d ailleurs que les dimensions non-couvrantes minimales de Hurtado et al. (2005) peuvent être associées à l algorithme MakeCovering pour résoudre les problèmes présentés dans l article de Li et al. (2005). Si nous associons la hiérarchie non-couvrante minimale district-province-pays à toutes les provinces-villes, MakeCovering pourra traiter les hiérarchies non-couvrantes minimales sans qu il soit nécessaire de le modifier. Enfin, cette proposition (théorique) nécessite l intervention d un expert, ce qui ne contredit pas le principe de Make- Covering.
9 Problèmes d additivité dus à la présence de hiérarchies complexes La deuxième technique de normalisation, les tables de jointure (bridge tables), est utilisée au niveau logique (Malinowski et Zimányi, 2006). Seuls Mazón et al. (2008) emploient cette technique au niveau conceptuel. Leur motivation est que l utilisation de ces techniques au niveau logique nécessite une grande expertise pour modéliser les situations du monde réel les plus complexes. Les avantages des tables de jointure se résument dans leur très faible taille et leur utilité lorsque les informations reliées aux mesures ne changent pas dans le temps (Malinowski et Zimányi, 2006). Par contre, côté performance, des efforts supplémentaires sont nécessaires pour agréger toutes les mesures, distribuées entre les faits originaux et les tables de jointure. Enfin, dans la liste suivante, nous récapitulons les limitations de la normalisation et de la transformation : (1) Modification des données et des situations réelles (normalisation, transformation). (2) esoin d un expert de la modélisation multidimensionnelle et de la technique des tables de jointure (normalisation). (3) esoin de métadonnées et/ou d un expert du domaine et des données entreposées, non prise en compte de toutes les situations complexes du monde réel et nécessité de mettre à jour toutes les données transformées à chaque fois que l entrepôt est mis à jour (transformation) Vers des solutions en temps réel? Même si elles sont différentes, la transformation et la normalisation partagent le même objectif : s assurer de ne pas avoir des problèmes d additivité au moment de l exécution des requêtes OLAP (solutions a priori). Nous avons présenté dans la section 3.3 les seuls travaux qui proposent des solutions en temps réel pour les problèmes d additivité. Ces travaux partagent le même objectif : la prise en compte des problèmes d additivité au moment de l analyse. L opérateur projection généralisée de Pedersen et al. (2002), proposé dans le cadre d une approche XOLAP, permet de signaler la présence des hiérarchies non-strictes ou non-couvrantes en retournant un résultat vide. Nous pensons que la détection de ces hiérarchies ne représente pas une solution à la hauteur des solutions de transformation ou de normalisation. Les directives de Horner et Song (2005) présentent plus de choix en terme de solutions pour les problèmes d additivité que Pedersen et al. (2002). Toutefois, les auteurs ne présentent pas d algorithme ni de programme pour implémenter ces directives. (Hachicha et al., 2012) est la première solution en temps réel complète, dans le sens où elle détecte et résout les problèmes d additivité en sortie de la requête utilisateur. 4 Perspectives de recherche Mazón et al. (2009) attirent l attention sur le fait que les entrepôts de données sont de plus en plus utilisés dans de nouveaux domaines (biologie, multimédia ou spatio-temporel). Ils concluent que l additivité ne doit pas être assurée sans la prise en compte des propriétés sémantiques de chaque domaine et proposent d intégrer ces propriétés dans l entrepôt de données. Mazón et al. (2009) proposent aussi de traiter l additivité en définissant de nouveaux opérateurs OLAP qui utilisent les techniques de fouille de données nécessaires à la gestion de ces données. Comme Mazón et al. (2009), nous encourageons la proposition de nouvelles solutions de normalisation et de transformation pour faire face aux problèmes d additivité dans tous les
10 M. Hachicha et J. Darmont outils basés sur les entrepôts de données et les analyses OLAP. Mais, pour qu elles soient efficaces, ces nouvelles propositions doivent prendre en compte les inconvénients que nous citons à la fin de la section 3.4.1, ainsi que toutes les propositions et directives que nous trouvons dans la littérature comme les trois types de valeurs manquantes de Horner et Song (2005) (orphelines, omises et non-applicables). Par ailleurs, nous préférons l utilisation des solutions en temps réel pour faire face aux problèmes d additivité. Même si ces solutions sont actuellement immatures, nous pensons que plusieurs travaux futurs sont possibles. Par exemple, il serait intéressant que les propositions de Horner et Song (2005) soient implémentés, afin de tester leur efficacité dans le cadre d une solution en temps réel. Dans nos travaux futurs, nous comptons en premier lieu améliorer notre approche en temps réel (Hachicha et al., 2012) par la définition de nouveaux opérateurs XOLAP qui prennent en compte les problèmes d additivité. Comme le temps d exécution de l étape (2) de l algorithme QS augmente de façon considérable en fonction du nombre des dimensions (critères de regroupement) dans la requête et de la taille des données, nous comptons élargir notre solution XOLAP à une approche holiste. Le but d une approche holiste est de limiter l accès à la mémoire en utilisant les étiquettes des nœuds pour le parcours et le traitement des arbres de données (voir Hachicha, 2012, chapitre 6, section 6.2). 5 Conclusion Dans cet article, nous avons présenté un état de l art des problèmes d additivité dus aux hiérarchies complexes. En premier lieu, nous avons défini l additivité et nous avons étudié les contraintes qui permettent de la garantir. Ensuite, nous avons étudié et discuté les trois familles de solutions pour les problèmes d additivité : normalisation, transformation et en temps réel. Pour chaque famille de solution, nous étudions son principe, ses avantages et ses inconvénients. Nous concluons cette étude par des propositions de travaux futurs. En tout cas, quelle que soit la nature des données, nous pensons que l additivité doit être considérée dans tout projet décisionnel. Références Hachicha, M. (2012). Modélisation de hiérarchies complexes dans les entrepôts de données XML et traitement des problèmes d additivité dans l analyse en ligne XOLAP. Thèse de Doctorat, Université Lumière Lyon 2, France. Hachicha, M., C. Kit, et J. Darmont (2012). A Novel Query-ased Approach for Addressing Summarizability Issues in XOLAP. In COMAD 12, Pune, India, pp CSI. Horner, J. et I.-Y. Song (2005). A Taxonomy of Inaccurate Summaries and Their Management in OLAP Systems. In ER 05, Klagenfurt, Austria, Volume 3716 of LNCS, pp Springer. Horner, J., I.-Y. Song, et P. P. Chen (2004). An Analysis of Additivity in OLAP Systems. In DOLAP 04, Washington, DC, USA, pp ACM. Hurtado, C. A., C. Gutiérrez, et A. O. Mendelzon (2005). Capturing Summarizability with Integrity Constraints in OLAP. ACM Trans. Database Syst. 30(3),
11 Problèmes d additivité dus à la présence de hiérarchies complexes Lehner, W., J. Albrecht, et H. Wedekind (1998). Normal Forms for Multidimensional Databases. In SSDM 98, Capri, Italy, pp IEEE Computer Society. Lenz, H.-J. et A. Shoshani (1997). Summarizability in OLAP and Statistical Data ases. In SSDM 97, Olympia, Washington, USA, pp IEEE Computer Society. Li, Z., J. Sun, J. Zhao, et H. Yu (2005). Transforming Non-covering Dimensions in OLAP. In APWeb 05, Shanghai, China, Volume 3399 of LNCS, pp Springer. Malinowski, E. et E. Zimányi (2006). Hierarchies in a multidimensional model : From conceptual modeling to logical representation. Data & Knowledge Engineering 59(2), Mansmann, S. et M. H. Scholl (2007). Empowering the OLAP Technology to Support Complex Dimension Hierarchies. Int. Journal of Data Warehousing and Mining 3(4), Mazón, J.-N., J. Lechtenbörger, et J. Trujillo (2008). Solving Summarizability Problems in Fact-Dimension Relationships for Multidimensional Models. In DOLAP 08, Napa Valley, USA, pp ACM. Mazón, J.-N., J. Lechtenbörger, et J. Trujillo (2009). A survey on summarizability issues in multidimensional modeling. Data & Knowledge Engineering 68(12), Pedersen, D., K. Riis, et T.. Pedersen (2002). A Powerful and SQL-Compatible Data Model and Query Language for OLAP. In ADC 02, Melbourne, Australia, Volume 5 of CRPIT. Australian Computer Society. Pedersen, T.., C. S. Jensen, et C. E. Dyreson (1999). Extending Practical Pre-Aggregation in On-Line Analytical Processing. In VLD 99, Edinburgh, UK, pp Morgan Kaufmann. Prat, N., I. Comyn-Wattiau, et J. Akoka (2011). Combining objects with rules to represent aggregation knowledge in data warehouse and OLAP systems. Data Knowl. Eng. 70(8), Rafanelli, M. et A. Shoshani (1990). STORM : A Statistical Object Representation Model. In SSDM 90, Charlotte, USA, Volume 420 of LNCS. Springer. Teste, O. (2009). Modélisation et manipulation des systèmes OLAP : de l intégration des documents à l usager. Mémoire d HDR, Université Paul Sabatier - Toulouse III, France. Summary Nowadays, data warehousing and OLAP tools play a decisive role in companies all around the world. These companies have to use data analysis tools adapted to all real-world situations in order to avoid summarizability issues, which in turn may lead to erroneous analysis results. In this paper, we present a survey on summarizability issues in complex hierarchies: definitions, existing solutions and suggestions for future works. Keywords: Data warehouses, OLAP, Summarizability issues, Non-strict hierarchies, Incomplete hierarchies, Complex hierarchies, Normalization approaches, Transformation approaches, Query-time approaches.
La voix en images : comment l évaluation objectivée par logiciel permet d optimiser la prise en charge vocale
La voix en images : comment l évaluation objectivée par logiciel permet d optimiser la prise en charge vocale Stéphanie Perriere To cite this version: Stéphanie Perriere. La voix en images : comment l
Système de diffusion d information pour encourager les PME-PMI à améliorer leurs performances environnementales
Système de diffusion d information pour encourager les PME-PMI à améliorer leurs performances environnementales Natacha Gondran To cite this version: Natacha Gondran. Système de diffusion d information
Entreposage de données complexes pour la médecine d anticipation personnalisée
Manuscrit auteur, publié dans "9th International Conference on System Science in Health Care (ICSSHC 08), Lyon : France (2008)" Entreposage de données complexes pour la médecine d anticipation personnalisée
AGROBASE : un système de gestion de données expérimentales
AGROBASE : un système de gestion de données expérimentales Daniel Wallach, Jean-Pierre RELLIER To cite this version: Daniel Wallach, Jean-Pierre RELLIER. AGROBASE : un système de gestion de données expérimentales.
statique J. Bertrand To cite this version: HAL Id: jpa-00237017 https://hal.archives-ouvertes.fr/jpa-00237017
Quelques théorèmes généraux relatifs à l électricité statique J. Bertrand To cite this version: J. Bertrand. Quelques théorèmes généraux relatifs à l électricité statique. J. Phys. Theor. Appl., 1874,
Compte-rendu de Hamma B., La préposition en français
Compte-rendu de Hamma B., La préposition en français Badreddine Hamma To cite this version: Badreddine Hamma. Compte-rendu de Hamma B., La préposition en français. Revue française de linguistique appliquée,
Comptabilité à base d activités (ABC) et activités informatiques : une contribution à l amélioration des processus informatiques d une banque
Comptabilité à base d activités (ABC) et activités informatiques : une contribution à l amélioration des processus informatiques d une banque Grégory Wegmann, Stephen Nozile To cite this version: Grégory
Une méthode d apprentissage pour la composition de services web
Une méthode d apprentissage pour la composition de services web Soufiene Lajmi * Chirine Ghedira ** Khaled Ghedira * * Laboratoire SOIE (ENSI) University of Manouba, Manouba 2010, Tunisia [email protected],
BI2 : Un profil UML pour les Indicateurs Décisionnels
BI2 : Un profil UML pour les Indicateurs Décisionnels Sandro Bimonte Irstea, TSCF, 9 Av. Blaise Pascal, 63178, Aubière, France [email protected] Thème de Recherche MOTIVE www.irstea.fr 2 Plan Motivations
Approche de modélisation multidimensionnelle des. des données complexes : Application aux données médicales. 5èmes Journées
Approche de modélisation multidimensionnelle des données complexes : Application aux données médicales Sid Ahmed Djallal Midouni, Jérôme Darmont, Fadila Bentayeb To cite this version: Sid Ahmed Djallal
Notes de lecture : Dan SPERBER & Deirdre WILSON, La pertinence
Notes de lecture : Dan SPERBER & Deirdre WILSON, La pertinence Gwenole Fortin To cite this version: Gwenole Fortin. Notes de lecture : Dan SPERBER & Deirdre WILSON, La pertinence. 2006.
Evolution et personnalisation des analyses dans les entrepôts
Evolution et personnalisation des analyses dans les entrepôts de données Une approche orientée utilisateur Cécile Favre Fadila Bentayeb Omar Boussaid Laboratoire ERIC Université de Lyon - Campus Porte
L indice de SEN, outil de mesure de l équité des systèmes éducatifs. Une comparaison à l échelle européenne
L indice de SEN, outil de mesure de l équité des systèmes éducatifs. Une comparaison à l échelle européenne Sophie Morlaix To cite this version: Sophie Morlaix. L indice de SEN, outil de mesure de l équité
Dessin assisté par ordinateur en lycée professionnel
Dessin assisté par ordinateur en lycée professionnel Bernard Dauga To cite this version: Bernard Dauga. Dessin assisté par ordinateur en lycée professionnel. Bulletin de l EPI (Enseignement Public et Informatique),
Entrepôt de données 1. Introduction
Entrepôt de données 1 (data warehouse) Introduction 1 Présentation Le concept d entrepôt de données a été formalisé pour la première fois en 1990 par Bill Inmon. Il s agissait de constituer une base de
Sur le grossissement des divers appareils pour la mesure des angles par la réflexion d un faisceau lumineux sur un miroir mobile
Sur le grossissement des divers appareils pour la mesure des angles par la réflexion d un faisceau lumineux sur un miroir mobile W. Lermantoff To cite this version: W. Lermantoff. Sur le grossissement
Information utiles. [email protected]. webpage : Google+ : http://www.ibisc.univ-evry.fr/ digiusto/
Systèmes de gestion de bases de données Introduction Université d Evry Val d Essonne, IBISC utiles email : [email protected] webpage : http://www.ibisc.univ-evry.fr/ digiusto/ Google+ : https://plus.google.com/u/0/b/103572780965897723237/
4. Utilisation d un SGBD : le langage SQL. 5. Normalisation
Base de données S. Lèbre [email protected] Université de Strasbourg, département d informatique. Présentation du module Contenu général Notion de bases de données Fondements / Conception Utilisation :
Budget Constrained Resource Allocation for Non-Deterministic Workflows on a IaaS Cloud
Budget Constrained Resource Allocation for Non-Deterministic Workflows on a IaaS Cloud Eddy Caron, Frédéric Desprez, Adrian Muresan, Frédéric Suter To cite this version: Eddy Caron, Frédéric Desprez, Adrian
Évolution de schémas dans les entrepôts de données mise à jour de hiérarchies de dimension pour la personnalisation des analyses
Évolution de schémas dans les entrepôts de données mise à jour de hiérarchies de dimension pour la personnalisation des analyses Thèse présentée par Cécile FAVRE pour obtenir le titre de Docteur en Informatique
Les Entrepôts de Données
Les Entrepôts de Données Grégory Bonnet Abdel-Illah Mouaddib GREYC Dépt Dépt informatique :: GREYC Dépt Dépt informatique :: Cours Cours SIR SIR Systèmes d information décisionnels Nouvelles générations
Introduction à la B.I. Avec SQL Server 2008
Introduction à la B.I. Avec SQL Server 2008 Version 1.0 VALENTIN Pauline 2 Introduction à la B.I. avec SQL Server 2008 Sommaire 1 Présentation de la B.I. et SQL Server 2008... 3 1.1 Présentation rapide
Un SIG collaboratif pour la recherche historique Partie. Partie 1 : Naissance et conception d un système d information géo-historique collaboratif.
Un SIG collaboratif pour la recherche historique Partie 1 : Naissance et conception d un système d information géo-historique collaboratif Claire-Charlotte Butez, Francesco Beretta To cite this version:
Datawarehouse: Cubes OLAP. Marlyse Dieungang Khaoula Ghilani
Datawarehouse: Cubes OLAP Marlyse Dieungang Khaoula Ghilani Table des matières 1 Data Warehouse 3 1.1 Introduction............................ 3 1.1.1 Définition......................... 3 1.1.2 Architecture........................
Les intermédiaires privés dans les finances royales espagnoles sous Philippe V et Ferdinand VI
Les intermédiaires privés dans les finances royales espagnoles sous Philippe V et Ferdinand VI Jean-Pierre Dedieu To cite this version: Jean-Pierre Dedieu. Les intermédiaires privés dans les finances royales
Démarche dirigée par les modèles pour la conception d entrepôts de données multidimensionnelles. F.Atigui, F.Ravat, O.Teste, G.
Démarche dirigée par les modèles pour la conception d entrepôts de données multidimensionnelles F.Atigui, F.Ravat, O.Teste, G.Zurfluh IRIT (SIG/ED) Université Paul Sabatier 118 route de Narbonne 31062
Peut-on perdre sa dignité?
Peut-on perdre sa dignité? Eric Delassus To cite this version: Eric Delassus. Peut-on perdre sa dignité?. 2013. HAL Id: hal-00796705 https://hal.archives-ouvertes.fr/hal-00796705 Submitted
Personnalisation collaborative pour l enrichissement des analyses dans les entrepôts de données complexes
Personnalisation collaborative pour l enrichissement des analyses dans les entrepôts de données complexes Cécile Favre, Fadila Bentayeb, Omar Boussaid Université de Lyon (ERIC Lyon 2) 5 av. Pierre Mendès-France
Jean-Luc Archimbaud. Sensibilisation à la sécurité informatique.
Sensibilisation à la sécurité informatique Jean-Luc Archimbaud To cite this version: Jean-Luc Archimbaud. Sensibilisation à la sécurité informatique. lieux en France, 1997, pp.17. École
et les Systèmes Multidimensionnels
Le Data Warehouse et les Systèmes Multidimensionnels 1 1. Définition d un Datawarehouse (DW) Le Datawarehouse est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées
Hervé Couturier EVP, SAP Technology Development
Hervé Couturier EVP, SAP Technology Development Hervé Biausser Directeur de l Ecole Centrale Paris Bernard Liautaud Fondateur de Business Objects Questions à: Hervé Couturier Hervé Biausser Bernard Liautaud
SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)
SGBDR Systèmes de Gestion de Bases de Données (Relationnelles) Plan Approches Les tâches du SGBD Les transactions Approche 1 Systèmes traditionnels basés sur des fichiers Application 1 Gestion clients
Présentation du module Base de données spatio-temporelles
Présentation du module Base de données spatio-temporelles S. Lèbre [email protected] Université de Strasbourg, département d informatique. Partie 1 : Notion de bases de données (12,5h ) Enjeux et principes
Workflow/DataWarehouse/DataMining. 14-09-98 LORIA - Université d automne 1998 - Informatique décisionnelle - L. Mirtain 1
Workflow/DataWarehouse/DataMining 14-09-98 LORIA - Université d automne 1998 - Informatique décisionnelle - L. Mirtain 1 plan Workflow DataWarehouse Aide à la décision DataMinig Conclusion 14-09-98 LORIA
Alimenter un entrepôt de données par des données issues de services web. Une approche médiation pour le prototype DaWeS
Alimenter un entrepôt de données par des données issues de services web. Une approche médiation pour le prototype DaWeS John Samuel LIMOS (Laboratoire d Informatique, de Modélisation et d Optimisation
Les entrepôts de données pour les nuls... ou pas!
Les entrepôts de données pour les nuls... ou pas! Cécile Favre, Fadila Bentayeb, Omar Boussaid, Jérôme Darmont, Gérald Gavin, Nouria Harbi, Nadia Kabachi, Sabine Loudcher Université de Lyon ERIC - Lyon
Entrepôts de données multidimensionnelles NoSQL
Entrepôts de données multidimensionnelles NoSQL Max Chevalier, Mohammed El Malki, Arlind Kopliku, Olivier Teste, Ronan Tournier Université de Toulouse, IRIT UMR 5505, Toulouse, France http://www.irit.fr
Bases de Données OLAP
Bases de Données OLAP Hiver 2013/2014 Melanie Herschel [email protected] Université Paris Sud, LRI Chapitre 1 Introduction Détails administratifs Entrepôts de Données Perspective sur le semestre
Program Analysis and Transformation: From the Polytope Model to Formal Languages
Program Analysis and Transformation: From the Polytope Model to Formal Languages Albert Cohen To cite this version: Albert Cohen. Program Analysis and Transformation: From the Polytope Model to Formal
Modélisation d objets mobiles dans un entrepôt de données
Tao Wan, Karine Zeitouni Laboratoire PRISM, Université de Versailles 45, avenue des Etats-Unis, 78035 Versailles Cedex, France [email protected], [email protected] http://www.prism.uvsq.fr/users/karima/
17/07/2013. Décisionnel dans le Nuage. Laboratoire ERIC. Section 1. Équipe d Accueil 3083. Décisionnel dans le Nuage.
Master 2 FDGC-ECD Année 203-204 Laboratoire ERIC Équipe d Accueil 3083 et Jérôme Darmont eric.univ-lyon2.fr/~jdarmont/ Section Décisionnel dans le Nuage 2 Le meilleur des mondes Du décisionnel à papa datawarehousing0.wikispaces.com
Généralisation contextuelle de mesures dans les entrepôts de données
Généralisation contextuelle de mesures dans les entrepôts de données Application aux entrepôts de données médicales Yoann Pitarch* Cécile Favre** Anne Laurent* Pascal Poncelet* * LIRMM, UMR 5506 161, Rue
Étude des formes de pratiques de la gymnastique sportive enseignées en EPS à l école primaire
Étude des formes de pratiques de la gymnastique sportive enseignées en EPS à l école primaire Stéphanie Demonchaux To cite this version: Stéphanie Demonchaux. Étude des formes de pratiques de la gymnastique
Une proposition d extension de GML pour un modèle générique d intégration de données spatio-temporelles hétérogènes
303 Schedae, 2007 Prépublication n 46 Fascicule n 2 Une proposition d extension de GML pour un modèle générique d intégration de données spatio-temporelles hétérogènes Samya Sagar, Mohamed Ben Ahmed Laboratoire
Chapitre IX. L intégration de données. Les entrepôts de données (Data Warehouses) Motivation. Le problème
Chapitre IX L intégration de données Le problème De façon très générale, le problème de l intégration de données (data integration) est de permettre un accès cohérent à des données d origine, de structuration
Techniques d optimisation des requêtes dans les data warehouses
Techniques d optimisation des requêtes dans les data warehouses Ladjel Bellatreche LISI/ENSMA Téléport2-1, Avenue Clément Ader 86960 Futuroscope - FRANCE [email protected] Résumé Un entrepôt de données
Lamia Oukid, Ounas Asfari, Fadila Bentayeb, Nadjia Benblidia, Omar Boussaid. 14 Juin 2013
Cube de textes et opérateur d'agrégation basé sur un modèle vectoriel adapté Text Cube Model and aggregation operator based on an adapted vector space model Lamia Oukid, Ounas Asfari, Fadila Bentayeb,
ISTEX, vers des services innovants d accès à la connaissance
ISTEX, vers des services innovants d accès à la connaissance Synthèse rédigée par Raymond Bérard, directeur de l ABES, à partir du dossier de candidature d ISTEX aux Initiatives d excellence et des réunions
Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services
69 Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services M. Bakhouya, J. Gaber et A. Koukam Laboratoire Systèmes et Transports SeT Université de Technologie de Belfort-Montbéliard
Méthodes d évolution de modèle produit dans les systèmes du type PLM
Résumé de thèse étendu Méthodes d évolution de modèle produit dans les systèmes du type PLM Seyed Hamedreza IZADPANAH Table des matières 1. Introduction...2 2. Approche «Ingénierie Dirigée par les Modèles»
Les Entrepôts de Données. (Data Warehouses)
Les Entrepôts de Données (Data Warehouses) Pr. Omar Boussaid Département d'informatique et de Sta5s5que Université Lyon2 - France Les Entrepôts de Données 1. Généralités, sur le décisionnel 2. L'entreposage
La problématique. La philosophie ' ) * )
La problématique!" La philosophie #$ % La philosophie &'( ' ) * ) 1 La philosophie +, -) *. Mise en oeuvre Data warehouse ou Datamart /01-2, / 3 13 4,$ / 5 23, 2 * $3 3 63 3 #, 7 Datawarehouse Data warehouse
Bases de Données. Stella MARC-ZWECKER. [email protected]. Maître de conférences Dpt. Informatique - UdS
Bases de Données Stella MARC-ZWECKER Maître de conférences Dpt. Informatique - UdS [email protected] 1 Plan du cours 1. Introduction aux BD et aux SGBD Objectifs, fonctionnalités et évolutions
Présentations personnelles. filière IL
Présentations personnelles filière IL Résumé Liste de sujets de présentations personnelles. Chaque présentation aborde un sujet particulier, l'objectif étant que la lecture du rapport ainsi que l'écoute
INF 1250 INTRODUCTION AUX BASES DE DONNÉES. Guide d étude
INF 1250 INTRODUCTION AUX BASES DE DONNÉES Guide d étude Sous la direction de Olga Mariño Télé-université Montréal (Québec) 2011 INF 1250 Introduction aux bases de données 2 INTRODUCTION Le Guide d étude
La complémentaire santé : une généralisation qui
La complémentaire santé : une généralisation qui n efface pas les inégalités Thibaut De Saint Pol, François Marical To cite this version: Thibaut De Saint Pol, François Marical. La complémentaire santé
Les entrepôts de données
Les entrepôts de données Lydie Soler Janvier 2008 U.F.R. d informatique Document diffusé sous licence Creative Commons by-nc-nd (http://creativecommons.org/licenses/by-nc-nd/2.0/fr/) 1 Plan Introduction
C-CUBE: Un nouvel opérateur d agrégation pour les entrepôts de données en colonnes
C-CUBE: Un nouvel opérateur d agrégation pour les entrepôts de données en colonnes Khaled Dehdouh Fadila Bentayeb Nadia Kabachi Omar Boussaid Laboratoire ERIC, Université de Lyon 2 5 avenue Pierre Mendes-France,
L hypertexte, le multimédia, c est quoi?
L hypertexte, le multimédia, c est quoi? Hervé Platteaux Centre NTE et Département de pédagogie Université de Fribourg Cours de pédagogie - Second cycle Session du 29 octobre 2001 Selon vous, l hypertexte
Francis BISSON (06 794 819) Kenny CÔTÉ (06 836 427) Pierre-Luc ROGER (06 801 883) IFT702 Planification en intelligence artificielle
Francis BISSON (06 794 819) Kenny CÔTÉ (06 836 427) Pierre-Luc ROGER (06 801 883) PLANIFICATION DE TÂCHES DANS MS PROJECT IFT702 Planification en intelligence artificielle Présenté à M. Froduald KABANZA
Plan. Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation
Data WareHouse Plan Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation 2 Présentation Besoin: prise de décisions
Bases de Données Avancées
1/26 Bases de Données Avancées DataWareHouse Thierry Hamon Bureau H202 - Institut Galilée Tél. : 33 1.48.38.35.53 Bureau 150 LIM&BIO EA 3969 Université Paris 13 - UFR Léonard de Vinci 74, rue Marcel Cachin,
OPEN DATA : CHALLENGES ET PERSPECTIVES D ENTREPOSAGE
OPEN DATA : CHALLENGES ET PERSPECTIVES D ENTREPOSAGE «Journée Open Data» 5 Novembre 2013 Présenté par : Imen Megdiche Directeur de thèse : Pr. Olivier Teste (SIG-IRIT) Co-directeur de thèse : Mr. Alain
Protection de la vie privée basée sur des ontologies dans un système Android
Protection de la vie privée basée sur des ontologies dans un système Android Johann Vincent, Tom Dubin, Christine Porquet To cite this version: Johann Vincent, Tom Dubin, Christine Porquet. Protection
Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours
Information du cours Informatique décisionnelle et data mining www.lia.univ-avignon.fr/chercheurs/torres/cours/dm Juan-Manuel Torres [email protected] LIA/Université d Avignon Cours/TP
Pascal Brunot Hadrien Cambazard UML FOR BUSINESS INTELLIGENCE PROJECT
UML FOR BUSINESS INTELLIGENCE PROJECT Abstract : this document deals with the role of UML into business intelligence projects (like data warehousing). After a quick overview of what UML offers, it focuses
Algèbre OLAP et langage graphique
Algèbre OLAP et langage graphique Franck Ravat, Olivier Teste, Gilles Zurfluh To cite this version: Franck Ravat, Olivier Teste, Gilles Zurfluh. Algèbre OLAP et langage graphique. Congrès Informatique
REMOTE DATA ACQUISITION OF EMBEDDED SYSTEMS USING INTERNET TECHNOLOGIES: A ROLE-BASED GENERIC SYSTEM SPECIFICATION
REMOTE DATA ACQUISITION OF EMBEDDED SYSTEMS USING INTERNET TECHNOLOGIES: A ROLE-BASED GENERIC SYSTEM SPECIFICATION THÈSE N O 2388 (2001) PRÉSENTÉE AU DÉPARTEMENT D'INFORMATIQUE ÉCOLE POLYTECHNIQUE FÉDÉRALE
AVERTISSEMENT. D autre part, toute contrefaçon, plagiat, reproduction illicite de ce travail expose à des poursuites pénales.
AVERTISSEMENT Ce document est le fruit d un long travail approuvé par le jury de soutenance et mis à disposition de l ensemble de la communauté universitaire élargie. Il est soumis à la propriété intellectuelle
Urbanisation des SI-NFE107
OLAP Urbanisation des SI-NFE107 Fiche de lecture Karim SEKRI 20/01/2009 OLAP 1 Introduction PLAN OLAP Les différentes technologies OLAP Plate formes et Outils 20/01/2009 OLAP 2 Informatique décisionnelle
Le "tout fichier" Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique
Introduction à l informatique : Information automatisée Le premier ordinateur Définition disque dure, mémoire, carte mémoire, carte mère etc Architecture d un ordinateur Les constructeurs leader du marché
CURRICULUM VITAE. Informations Personnelles
CURRICULUM VITAE Informations Personnelles NOM: BOURAS PRENOM : Zine-Eddine STRUCTURE DE RATTACHEMENT: Département de Mathématiques et d Informatique Ecole Préparatoire aux Sciences et Techniques Annaba
The space to start! Managed by
The space to start! Managed by ESA Business Incubation Centers (ESA BICs) : un programme de soutien à la création d entreprises L Agence Spatiale Européenne (ESA) dispose d un programme de transfert de
Sécurité des entrepôts de données dans le Cloud Un SaaS pour le cryptage des données issues d un ETL
Sécurité des entrepôts de données dans le Cloud Un SaaS pour le cryptage des données issues d un ETL Présenté par Hana Gara Kort Sous la direction de Dr Jalel Akaichi Maître de conférences 1 1.Introduction
Solution A La Gestion Des Objets Java Pour Des Systèmes Embarqués
International Journal of Engineering Research and Development e-issn: 2278-067X, p-issn: 2278-800X, www.ijerd.com Volume 7, Issue 5 (June 2013), PP.99-103 Solution A La Gestion Des Objets Java Pour Des
Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe
Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe Karima Dhouib, Sylvie Després Faiez Gargouri ISET - Sfax Tunisie, BP : 88A Elbustan ; Sfax [email protected],
Les Champs Magnétiques
Les Champs Magnétiques Guillaume Laurent To cite this version: Guillaume Laurent. Les Champs Magnétiques. École thématique. Assistants de prévention, Paris, France. 2014, pp.31. HAL Id:
Filière Fouille de Données et Décisionnel FDD (Data Mining) Pierre Morizet-Mahoudeaux www.hds.utc.fr/~pmorizet pierre.morizet@utc.
Filière Fouille de Données et Décisionnel FDD (Data Mining) Pierre Morizet-Mahoudeaux www.hds.utc.fr/~pmorizet [email protected] Plan Motivations Débouchés Formation UVs spécifiques UVs connexes Enseignants
Big Data et Graphes : Quelques pistes de recherche
Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de Lyon/Université Claude Bernard Lyon 1/Université
Entrepôt de Données. Jean-François Desnos. [email protected] ED JFD 1
Entrepôt de Données Jean-François Desnos [email protected] ED JFD 1 Définition (Bill Inmon 1990) Un entrepôt de données (data warehouse) est une collection de données thématiques, intégrées,
SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...)
Avant-propos 1. À qui s'adresse ce livre? 15 2. Pré-requis 15 3. Objectifs du livre 16 4. Notations 17 Introduction à la Business Intelligence 1. Du transactionnel au décisionnel 19 2. Business Intelligence
ICA Congress, Brisbane 2012 Thème général : Les temps qui changent. La confiance et les archives*
ICA Congress, Brisbane 2012 Thème général : Les temps qui changent. La confiance et les archives* Titre : Un résumé de la pratique archivistique internationale adaptée au niveau local : manuel pratique
TRS: Sélection des sous-graphes représentants par l intermédiaire des attributs topologiques et K-medoïdes
TRS: Sélection des sous-graphes représentants par l intermédiaire des attributs topologiques et K-medoïdes Mohamed Moussaoui,Wajdi Dhifli,Sami Zghal,Engelbert Mephu Nguifo FSJEG, Université de Jendouba,
TRAVAUX DE RECHERCHE DANS LE
TRAVAUX DE RECHERCHE DANS LE DOMAINE DE L'EXPLOITATION DES DONNÉES ET DES DOCUMENTS 1 Journée technologique " Solutions de maintenance prévisionnelle adaptées à la production Josiane Mothe, FREMIT, IRIT
CONCEPTION DE PROJET SIG AVEC UML
Bulletin de la Société géographique de Liège, 42, 2002, 19-25 CONCEPTION DE PROJET SIG AVEC UML François LAPLANCHE Résumé Avec son statut de standard, le langage UML (Unified Modelling Language) jouit
Programme scientifique Majeure ARCHITECTURE DES SYSTEMES D INFORMATION. Mentions Ingénierie des Systèmes d Information Business Intelligence
É C O L E D I N G É N I E U R D E S T E C H N O L O G I E S D E L I N F O R M A T I O N E T D E L A C O M M U N I C A T I O N Programme scientifique Majeure ARCHITECTURE DES SYSTEMES D INFORMATION Mentions
La démarche MDA. Auteur : Projet ACCORD (Assemblage de composants par contrats en environnement ouvert et réparti)*
La démarche MDA Auteur : Projet ACCORD (Assemblage de composants par contrats en environnement ouvert et réparti)* Référence : Livrable 1.1-5 Date : Mai 2002 * : Les partenaires du projet ACCORD sont CNAM,
Collabora'on IRISA/INRA sur le transfert de nitrates et l améliora'on de la qualité des eaux des bassins versants:
Collabora'on IRISA/INRA sur le transfert de nitrates et l améliora'on de la qualité des eaux des bassins versants: Tassadit BOUADI 22 Juin 2010, Saint Jacut 1 Plan Introduc
Techniques d analyse et de conception d outils pour la gestion du processus de segmentation des abonnés des entreprises de télécommunication
Techniques d analyse et de conception d outils pour la gestion du processus de segmentation des abonnés des entreprises de télécommunication R. Carlos Nana Mbinkeu 1,3, C. Tangha 1, A. Chomnoue 1, A. Kuete
UML (Paquetage) Unified Modeling Language
UML (Paquetage) Unified Modeling Language Sommaire Introduction Objectifs Paquetage Espace de nommage d un paquetage Dépendances entre paquetages 2 Notion introduite véritablement par UML car superficiellement
BUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise
BUSINESS INTELLIGENCE Une vision cockpit : utilité et apport pour l'entreprise 1 Présentation PIERRE-YVES BONVIN, SOLVAXIS BERNARD BOIL, RESP. SI, GROUPE OROLUX 2 AGENDA Définitions Positionnement de la
FreeAnalysis. Schema Designer. Cubes
FreeAnalysis Schema Designer Cubes Charles Martin et Patrick Beaucamp BPM Conseil Contact : [email protected], [email protected] Janvier 2013 Document : BPM_Vanilla_FreeAnalysisSchemaDesigner_v4.2_FR.odt
CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2012
CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE Edition 2012 AGENDA Qui sommes nous? Présentation de Keyrus Keyrus : Expert en formations BI Nos propositions de formation 3 modes de formations Liste des
LE RESEAU GLOBAL INTERNET
LE RESEAU GLOBAL INTERNET 1. INTRODUCTION Internet est un réseau international, composé d'une multitude de réseaux répartis dans le monde entier - des réseaux locaux, régionaux et nationaux, ainsi que
Entrepôts de données. NEGRE Elsa Université Paris-Dauphine 2015-2016
Entrepôts de données NEGRE Elsa Université Paris-Dauphine 2015-2016 Contexte et problématique Le processus de prise de décision L entrepôt de données Définition Différence avec un SGBD Caractéristiques
RÉSUMÉ DE THÈSE. L implantation des systèmes d'information (SI) organisationnels demeure une tâche difficile
RÉSUMÉ DE THÈSE L implantation des systèmes d'information (SI) organisationnels demeure une tâche difficile avec des estimations de deux projets sur trois peinent à donner un résultat satisfaisant (Nelson,
Évaluation d une architecture de stockage RDF distribuée
Évaluation d une architecture de stockage RDF distribuée Maeva Antoine 1, Françoise Baude 1, Fabrice Huet 1 1 INRIA MÉDITERRANÉE (ÉQUIPE OASIS), UNIVERSITÉ NICE SOPHIA-ANTIPOLIS, I3S CNRS pré[email protected]
Business Intelligence : Informatique Décisionnelle
Business Intelligence : Informatique Décisionnelle On appelle «aide à la décision», «décisionnel», ou encore «business intelligence», un ensemble de solutions informatiques permettant l analyse des données
