Quelle vision pour le matching à large échelle?

Dimension: px
Commencer à balayer dès la page:

Download "Quelle vision pour le matching à large échelle?"

Transcription

1 Quelle vision pour le matching à large échelle? Sana Sellami, Aïcha-Nabila Benharkat, Youssef Amghar LIRIS, Institut National des Sciences Appliquées de Lyon, France Abstract Ce papier présente une étude détaillée des travaux de Matching à large échelle. Il focalise sur les approches Pair-wise et holistique. Nous en donnons une classification selon les techniques et méthodes d optimisation utilisées. Cette étude nous a permis de synthétiser le plus intéressant de ces techniques pour asseoir notre vision du matching à large échelle. Key words: Large échelle, Matching, techniques d optimisation 1. Introduction Aujourd hui, il existe des centaines voire même des milliers de schémas disponibles sur le Web qui nécessitent d être rassemblés, organisés et mis en correspondances. La diversité de ces sources d information distribuées et leur hétérogénéité sont une des principales difficultés rencontrées par les utilisateurs du Web aujourd hui. Cette hétérogénéité peut provenir du format ou de la structure des sources (sources structurées : bases de données relationnelles, sources semi-structurées : documents XML, ou non structurées : textes), de l hétérogénéité sémantique, etc. Les challenges inhérents à l intégration des données deviennent alors nombreux : la gestion des données, l évolution des données, le mapping et le matching des données. Le matching, plus particulièrement, est un pré requis à des processus facilitant l interopérabilité (échange, intégration, transformation). Le matching représente une opération cruciale dans plusieurs domaines d application tels que l intégration des données (schémas, taxonomies, ontologies), le web sémantique, les entrepôts de données. Le matching est par définition un processus qui vise à identifier et découvrir les correspondances sémantiques entre différents formats de données tels que les schémas, les ontologies, les taxonomies, interfaces web, Plusieurs travaux de matching [1, 2,3] ont été proposés comme solution à la problématique de l intégration des données. La plupart de ces travaux se sont focalisés sur le matching des schémas simples et de petite dimension entre 50 et 100 composants (éléments, attributs) alors que dans un matching à large échelle les données du monde réel sont très volumineuses (une centaine voire même un millier d éléments). Par conséquence, dès que l on passe à un contexte fortement dynamique et à large échelle, on remarquera que la plupart des algorithmes de matching proposés se heurtent à plusieurs problèmes. En effet, L'accroissement de la quantité de données entraîne des problèmes d'efficacité en temps d'exécution des algorithmes. De plus, le processus de matching est tellement complexe qu un passage à l échelle, en utilisant les algorithmes de matching classiques, devient presque impossible. Nous présentons dans cet article une étude complète et détaillée des approches de Matching à large échelle. L objectif de notre étude est de proposer une approche et une méthodologie de Matching qui résiste au passage à l échelle. Le présent article est organisé comme suit : Dans la section 2, nous présenterons la motivation de notre travail ainsi qu une classification des facteurs qualité pour le matching à large échelle. La section 3 représente une étude de l état de l art et une classification qui réunit les approches proposées dans la littérature. Nous décrirons dans la section 4 notre vision du système de Matching large échelle et nous terminerons finalement par une conclusion et quelques perspectives. 2. Motivation L objectif de notre travail est de relever le challenge de matching des schémas à grande échelle afin d assurer l intégration des sources de données hétérogènes dans un contexte où l on constate l émergence de l intégration des données, du web sémantique ou encore du Web profond (Deep Web), etc. Notre intérêt vient du constat de naïveté et de fragilité des algorithmes et systèmes de matching actuels confrontés à un contexte fortement dynamique tel que le Web. Ces algorithmes traitant souvent des schémas simples, structurés, généralement de petite dimension rencontrent des problèmes d efficacité, de performance, de redondance, de scalabilité (passage à l échelle) et de précision dans les mesures de similarité lors du matching des schémas volumineux du monde réel. Nous avons donc dégagé un certain nombre de facteurs qui peuvent avoir un impact sur les performances des systèmes de Matching et par ailleurs sur la qualité du Matching (QoM). Nous définissons la qualité de Matching (QoM) comme l évaluation des systèmes de Matching à large échelle. En effet, les facteurs qui peuvent influer sur le passage à l échelle et les problèmes qui peuvent surgir dans le matching à grande échelle sont essentiellement liés aux données (entrées/sorties) et aux algorithmes/systèmes de matching. 2.1 Classification des facteurs qualité pour le matching à large échelle

2 Les Facteurs liés aux données Les entrées : La qualité du Matching dépend de la qualité des sources de données utilisées (cohérence, complétude, homogénéité etc.). Elle dépend également du type et des structures de ces données (schémas, ontologies, taxonomies, interfaces Web, etc). Le domaine : Les données sont fortement liées au domaine. Cependant, lors d un Matching, les données peuvent être hétérogènes si elles sont extraites de domaines différents. Par conséquence, les données peuvent être incomplètes, bruités et ceci peut influer considérablement la qualité du Matching. Il est donc primordial de déterminer le type et les caractéristiques du domaine associé aux données. Les Facteurs liés aux algorithmes/systèmes de Matching Techniques : La mesure de qualité de matching nécessite une connaissance approfondie des algorithmes et techniques utilisés (e.g le type de matchers implémentés). En effet, certaines de ces techniques peuvent être relativement coûteuses (e.g utilisation des ressources sémantiques auxiliaires). Besoins en temps d exécution : La qualité de Matching dépend fortement du temps d exécution nécessaire à chaque algorithme de Matching et techniques utilisés. Les algorithmes les plus efficaces sont ceux qui présentent un minimum de temps d exécution. Complexité : Dans un contexte fortement dynamique et à large échelle, la complexité et la taille des schémas XML posent des problèmes de performances pour les algorithmes de matching les plus usuels ce qui influe considérablement la qualité de Matching. Effort Humain : Le Matching est en général semi automatique. En effet, l utilisateur est très sollicité lors d un processus de Matching. Cet effort humain peut avoir des conséquences dans un contexte à large échelle. Il est donc important d évaluer et de prendre en considération ce genre d effort en spécifiant le type d utilisateur (expert du domaine ou simple utilisateur) et l effort fourni pour aboutir à un résultat de Matching. 3. Approches de Matching à Large échelle Il existe dans la littérature deux approches de Matching à large échelle : Le matching «pairwise» et le Matching «holistique». Nous allons décrire, dans cette partie, les travaux liés à ces deux approches en mettant l accent sur les techniques d optimisation qui ont été utilisées. L objectif de cette étude est montrer les différences majeures de ces deux approches, d exposer l importance d intégration des techniques d optimisation pour améliorer la qualité de Matching (QoM) à large échelle Approches de Matching pairwise L approche dite classique de détermination du Matching est l approche «pairwise». La plupart des travaux de matching adoptent cette approche. Son principe est trouver les correspondances entre paires d éléments de deux schémas/ontologies Matching de schémas Plusieurs travaux de matching de schémas à large échelle ont été proposés dans la littérature [4,5,6,7,8,9]. Les approches [7,8] proposent un processus de matching de schémas pair-wise qui fait appel à des techniques de découpage, de fragmentation, de clustering etc. En effet, dans [7], les auteurs ont développé une approche de Matching basée sur la fragmentation des schémas. Cette approche consiste à décomposer le problème de matching de schémas volumineux en un matching simple de petits fragments de schémas. L outil COMA++ [10] présente une implémentation de cette approche. Cependant, la limite de cette approche est que les critères de fragmentation ne prennent pas en considération les liens sémantiques entre les schémas. En effet il s agit plus d une décomposition structurelle «basique» sans prendre en considération le contexte et la sémantique liés aux éléments des schémas. De plus, COMA++ présente une interface qui prend en entrée uniquement deux schémas et non pas un ensemble de schémas. Contrairement à la fragmentation a priori (réalisée avant le Matching), l approche proposée dans [8] insère une étape de regroupement (clustering), après avoir mis en correspondance un schéma personnel et un répertoire de schémas, comme étape intermédiaire pour identifier les régions qui peuvent être constituées de bons mappings. Il s agit la d un regroupement a posteriori (après le Matching). Le regroupement est réalisé grâce à l adaptation de l algorithme K-means [11]. Cet algorithme est connu pour sa simplicité et sa complexité non exponentielle. De plus, le regroupement a été combiné avec l utilisation de l algorithme «meilleur d abord» (Branch and Bound [12] (B&B)) pour déterminer les meilleures solutions de Matching (tous ceux qui ont un rang élevé). Cependant, l utilisation de telles techniques dans cette approche peut conduire à la perte de certains résultats de matching. En plus, la technique de clustering a été utilisée sans évaluer la qualité des clusters afin de décider de ceux qui aboutiront à un bon résultat de Matching qui est uniquement de type 1 :1. Ces techniques ont été implémentées dans le système Bellflower [13]. Les entrées de ce système sont un répertoire de schémas (regroupant un ensemble de petits schémas) et un petit schéma cible ce qui représente une première tentative pour la conception d un système de Matching qui résiste au passage à l échelle mais loin de représenter le système de matching à large échelle Matching d ontologies

3 Le matching d ontologies permet de trouver les correspondances entre des entités d ontologies reliées sémantiquement. Ces correspondances peuvent être utilisées pour différentes applications telles que le fusionnement d ontologies, la transformation des données ou pour le web sémantique. Plusieurs approches [14,15,16,17,18] ont été proposées pour étudier le problème de Matching d ontologies volumineuses. Par exemple, dans [15] les auteurs proposent une approche de matching de classes hiérarchiques volumineuses (type d ontologies à large échelle) en utilisant une méthode de partitionnement en blocs. L idée principale est de sélectionner les paires de blocs mis en correspondance en combinant deux types de relations déterminées par des Anchor prédéfinis et des documents virtuels. Le partitionnement est réalisé grâce à des algorithmes de clustering tel que l algorithme ROCK [20] qui est un algorithme de clustering hiérarchique qui emploie les liens pour mesurer la similarité/ proximité au moment du fusionnement des clusters. Cependant, cette approche n est pas applicable aux ontologies volumineuses. Pour résoudre le problème de Matching et de partitionnement d ontologies volumineuses, les auteurs dans [14] ont proposé une approche basée partitionnement pour le matching en blocs. Cette approche utilise la notion de liens pondérés qui reflètent l information sur la proximité entre les classes. Le partitionnement est réalisé grâce à l utilisation d un algorithme de partitionnement agglomératif hiérarchique inspiré de ROCK. Une autre catégorie d approches [18] propose la modularisation d ontologies en utilisant des techniques telles que les E- connections [21]. L epsilon-connection est une méthode définie comme la combinaison d autres formalismes logiques. Elle représente un formalisme approprié pour la combinaison des bases de connaissances (knowledge base KB) et pour la réalisation de développement d ontologies modulaires dans le web. Toutes ces approches, cependant, ne permettent pas de déterminer les matchings complexes entre les ontologies. De plus, les systèmes et architectures développés intégrant ces approches prennent uniquement en entrée deux ontologies Approches de Matching Holistique L'approche holistique permet de réaliser le matching de schémas multiples (il s agit d interfaces Web représentant des requêtes sur des bases de données du Web profond) pour trouver les attributs correspondants parmi tous les schémas en une seule fois. Ce type de matching de schémas est surtout une approche statistique basée sur des observations (cooccurrences patterns ). Le domaine d application de cette approche est le Web profond (Deep Web). Plusieurs approches de matching holistique ont été proposées dans la littérature [22, 23,24,26,27,28,29,19]. L approche holistique a été introduite dans [23,24] en proposant deux cadres d application MGS (Modélisation, Génération, Sélection) [24] et DCM (Dual Correlation Mining) [23]. Ce sont, en effet, des approches d évaluation holistiques qui ont été proposées pour la découverte d attributs synonymes et des mappings complexes. MGS est une évaluation globale qui considère le matching comme la découverte d un modèle caché. C est une approche statistique basée sur des observations plutôt que sur l information linguistique ou du domaine. Elle a été testée selon le test du Khi-deux X² qui permet d évaluer la différence entre les probabilités estimées et les fréquences observées. Cependant, les matchings découverts par MGS ne sont basés que sur des statistiques et des observations des attributs les plus fréquents. De plus, cette approche ne prend pas en considération les mappings complexes. DCM (évaluation locale) a donc été proposé par les mêmes auteurs pour remédier au problème de découverte des mappings complexes. Le matching holistique dans cette approche est basé sur la détermination de la cooccurrence des attributs entre les schémas. Cependant, ces approches ne donnent de bons résultats que si une évidence peut être observée. Donc, seuls les attributs qui apparaissent fréquemment peuvent être mis en correspondance. De plus, ces approches souffrent de la présence d attributs erronés (représentations confuses d attributs, attributs flous, attributs mal orthographiés, ). Les travaux dans [22] sont donc une extension de ces approches car ils rajoutent des techniques d échantillonnage (réalisées a priori) et de vote (a posteriori) inspirées des «bagging predictors» pour rendre leur système plus robuste vis à vis de ces données erronées. D autres approches [29,19] se sont plus focalisées sur la découverte de mappings complexes sans la connaissance du domaine et sont assez similaires à l approche DCM [23]. La différence est que ces nouvelles approches utilisent un algorithme de découverte de matching de complexité polynomiale et une nouvelle mesure de score de matching qui différencie les attributs fréquents des attributs rares. HSM (Holistic Schema Matching) [29] et PSM (Parallel Schema Matching) [19] sont donc basées sur la comparaison d interfaces web en les mettant en parallèle et en supprimant les attributs communs qui apparaissent (attributs communs) pour saisir les correspondances de matching entre le groupement d attributs (attributs ayant le même concept). Une autre approche de matching de schémas basé corpus [26] utilise un corpus de schémas comme une formation de schémas pour améliorer le matching. Un tel corpus contient plusieurs schémas qui modélisent des concepts similaires ce qui facilite la découverte des variations des éléments ainsi que leurs propriétés et des mappings entre certains schémas. Cette approche est donc basée sur l hypothèse que les schémas sont souvent désignés d une manière similaire et par conséquence partagent des propriétés communes. Le corpus est utilisé pour découvrir les patterns des schémas. Un moyen pour découvrir ces patterns est en formant les groupes (clusters) d éléments similaires du corpus. Cette approche utilise donc un algorithme de regroupement hiérarchique qui permet de fusionner ces

4 concepts similaires au sein d un seul groupe. Seulement la plupart de ces approches présentent des limites car elles souffrent de données erronées et d une faible performance. Pour remédier à ces problèmes, des approches telles que [27,28] ont proposé d intégrer une étape de regroupement a priori. Par exemple, l approche [27] propose une méthode d échantillonnage en utilisant un algorithme de clustering K-Means pour extraire les attributs stables et instables à partir d une collection de données. Ces approches se sont focalisées sur les matchings de type 1 : Synthèse et classification des approches de Matching Nous présentons dans cette partie une classification des approches et des techniques décrites dans les sections précédentes. Cette classification (figure 1) est divisée en deux niveaux : le premier niveau représente les différentes données en entrée des approches holistiques et pair-wise. Le deuxième niveau est consacré aux méthodes reliées aux techniques d optimisation utilisées dans ces approches. Notre classification est en effet inspirée de celle proposée dans [3] en prenant en considération uniquement les techniques de Matching à large échelle. En effet, nous avons remarqué, suite à notre étude de l état de l art, que les approches de Matching pair-wise et holistiques partagent le même objectif qui est la détermination du Matching mais y aboutissent de manière très différente. Premièrement, dans les approches pairwise, les systèmes et architectures proposés prennent uniquement en entrée deux schémas ou ontologies. Cependant, ces données sont volumineuses et variées (schémas XML, onotolgies, taxonomies, etc.). En revanche, le matching holistique prend un ensemble de schémas en entrée et détermine le matching en une seule fois. Les schémas utilisés lors d un matching holistique sont des interfaces Web de petite taille (petit nombre d attributs) et extraites d un même domaine le Web profond. Deuxièmement, nous avons constaté que pour la détermination des correspondances, les approches pair-wise ont souvent recours à des ressources sémantiques (utilisation de l information auxiliaire, dictionnaires, thésaurus, etc) pour l identification des synonymes spécifiques au domaine ou des correspondances plus complexes [5, 25, 1]. Cependant, les travaux de matching holistique ne font pas référence à l utilisation de telles ressources. Enfin, les approches holistiques se différencient des approches pair-wise car elles représentent des approches statistiques basées sur les observations comme illustré à la figure 1. Enfin, ces deux approches partagent l utilisation de techniques d optimisation soit a priori soit a posteriori pour améliorer la qualité de Matching (QoM). Figure 1. Classification des approches de Matching à large échelle 4. Notre vision du matching à large échelle Suite à nos observations et notre étude de l existant, nous illustrons dans cette section notre vision d un système de matching à large échelle qui regroupe les différents points suivants : Nous pensons intéressant de combiner les deux approches holistique et pair-wise. En effet, malgré leurs différences, la combinaison des deux pourrait aboutir à une approche hybride efficace. Nous avons remarqué que l utilisation des techniques d optimisation est primordiale pour améliorer la qualité de Matching. En effet, notre premier objectif est de proposer un système efficace et optimisé de Matching. Nos techniques d optimisation seront intégrées a priori (avant le matching) et a posteriori (après le Matching). La qualité de Matching (QoM) représente une évaluation du système de Matching. Plus précisément, la qualité de Matching nous permet de tester la performance, la précision, la scalabilité, l adaptabilite et l extensibilité du système. Les ressources sémantiques sont utilisées pour affiner et apporter de la sémantique au résultat de Matching. Elles représentent aussi un moyen pour la détermination des mappings sémantiques entre les différentes données en entrée. Notre travail consiste donc à proposer et adapter des techniques et algorithmes efficaces de Matching de schémas XML qui résistent au passage à l échelle et qui regroupe tous les points décrits précédemment. Aussi, nous définissons l architecture générale (Fig.2) d un système de Matching de schémas XML à large échelle.

5 Figure 2. Architecture générale du système de Matching à large échelle L architecture du système est divisée en trois grandes parties : Etape de PréMatching : Dans cette étape nous déterminons les caractéristiques communes et similaires entre plusieurs schémas XML volumineux de manière efficace afin de faciliter le processus de Matching. En effet, cette phase représente un prétraitement des schémas. Le module «approche holistique» représente le cœur de cette étape. Il considère que les schémas extraits d un même domaine peuvent partager des sous structures communes. Nous utiliserons donc une technique d extraction des données telle que les algorithmes d extraction d arbres fréquents pour identifier ces sous structures occurrentes (ou fréquentes). Une fois identifiées, ces sous structures seront par la suite élaguées des schémas pour former une partition à part ce qui réduira considérablement la taille des schémas d origine. Ils seront par ailleurs référenciés par des labels dans leurs schémas d origine. Suite à cette étape, on testera la taille des schémas. Si les schémas restent volumineux c'est-à-dire que nous n avons pas eu de résultats suite à l étape d extraction ou bien que les résultats obtenus ne permettent pas de réduire la taille des schémas, dans ce cas on applique une méthode de décomposition (a priori) qui permettra de diviser les schémas encore volumineux en des sous schémas. Sinon on passe directement à l étape de Matching. Durant l étape de décomposition, une évaluation de la qualité des sous schémas décomposés sera appliquée afin de déterminer la fiabilité des fragments obtenus. Etape de Matching : Nous obtenons suite à l étape précédente un ensemble de schémas de taille réduite. Nous allons utiliser dans cette étape le processus de Matching Pair-wise. Le module «matcher pair-wise» peut inclure un matcher élémentaire ou une combinaison de matchers [10] dépendant de l application. Nous appliquerons cependant des techniques d optimisation qui permettront d optimiser le temps de calcul des correspondances et améliorer par ailleurs l efficacité du processus. Nous utiliserons de plus des ressources sémantiques qui permettront de déterminer les correspondances les plus complexes. Etape de PostMatching : Une fois le matching réalisé, l ensemble des correspondances sera sauvegardé pour être réutilisé. On regroupera (Regroupement a posteriori) par la suite toutes les similarités déterminées dans des clusters pour sélectionner les correspondances qui ont le rang le plus élevé afin de limiter l espace de recherche et de disposer d un résultat de matching plus pertinent.. Nous évaluerons la qualité de cette sélection pour prouver l exactitude et la pertinence du résultat. Ceci nous permettra la réutilisation d un résultat de matching qui soit fiable. L évaluation de la qualité interviendra durant cette étape à deux reprises. Nous évaluerons au début la qualité des clusters obtenus suite à l étape de regroupement et ensuite la qualité des résultats finals obtenus ainsi que la performance du système de Matching. 5. Conclusion et perspectives Dans cet article, nous avons présenté un état de l art et une étude détaillée des catégories et caractéristiques des travaux de Matching à large échelle. Nous avons présenté les deux approches de Matching existantes : Pair-wise et holistique. Cette étude nous a permis d aboutir à plusieurs observations telles que l importance de l utilisation de techniques d optimisation pour l amélioration de la qualité de matching, les critères à prendre en considération pour le passage à l échelle, etc. Pour conclure, le Matching de schémas représente un domaine large et complexe qui nécessite la prise en considération de plusieurs connaissances des données, du domaine, des techniques, etc. Il n existe, en effet, aucun système de Matching qui peut résoudre complètement tous les problèmes mentionnés dans cette étude. Nous avons néanmoins présenté notre vision d un système de Matching à large échelle. Nous proposons pour des travaux futurs de concevoir et réaliser ce système de Matching incluant : une formalisation de la qualité de Matching (les métriques) pour l évaluation du système, les techniques d extraction, de décomposition et de regroupement (clustering). Ce système sera une plateforme complète pour le matching à large échelle de plusieurs schémas, ontologies, taxonomies relatifs à des domaines variés tels que la biologie, phylogénie, etc. 6. Références [1] Do, H.H., Melnik, S., and Rahm, E Comparison of schema Matching Evaluations. In GI-Workshop Web and Databases (Erfurt, Germany, October 7-10, 2002), [2] Rahm, E., Bernstein, P.A A survey of approaches to automatic schema matching. In The International Journal on Very Large Data Bases, [3] Shvaiko P., and Euzenat J A Survey of Schemabased Matching approaches. Journal on Data Semantics IV 3730 (2005) [4] Avesani, P., Yatskevich, M., Giunchiglia, F A Large Scale Dataset for the Evaluation of Matching

6 Systems. In Proceedings of the 4th European Semantic Web Conference, ESWC 07. [5] Bernstein, P. A., Melnik, S.,Petropoulos, M., and Quix, C Industrial-Strength Schema Matching. In ACM SIGMOD Record 33, 4 (December 2004), [6] Lu, J., Wang, S., and Wang, J An experiment on the Matching and Reuse of XML Schemas. In Proceedings of the 5th International Conference on Web engineering (Sydney, Australia, July 27-29, 2005). ICWE [7] Rahm, E., Do, H.H., and Maβmann, S Matching Large XML Schemas. In SIGMOD Record. ACM Press, New York, NY, [8] Smiljanic, M., Keulen, M., and Jonker, W Using Element Clustering to Increase the Efficiency of XML Schema Matching. In Proceedings of the 22 nd International Conference on Data Engineering Workshops (Atlanta, GA, USA, April 3-7, 2006), ICDE Workshops [9] Wang, S., Lu, J., and Wang, J Approximate Common Structures in XML Schema Matching. In Proceedings of the 6th International Conference on Web- Age Information Management (Hangzhou, China, October 11-13, 2005). WAIM [10] Aumuller, D., Do, H.H., Maβman, M., and Rahm, E Schema and Ontology Matching with COMA++. In Proceedings of the ACM SIGMOD International Conference on Management of Data (Baltimore, Maryland, USA, June 14-16, 2005). ACM Press, New York, NY, [11] Xu, R., and Wunsch, D Survey of Clustering Algorithms.. Neural Networks, IEEE Transactions, (May2005), [12] Clausen, J., and Zilinskas, A Subdivision, Sampling, and Initialization Strategies for Simplical Branch and Bound in Global Optimization. Computer and Mathematics with Applications, (2002). [13] Smiljanic, M XML Schema Matching Balancing Efficiency and Effectiveness By means of clustering. Doctoral thesis. University of Twente. [14] Hu, W. and Qu, Y Block Matching for Ontologies. In Proceedings of the 5th International Semantic Web Conference (Athens, GA, USA, November 5-9, 2006).ISWC [15] Hu, W., Zhao, Y., and Qu,Y Partition-Based Block Matching of Large Class Hierarchies. In Proceedings of the First Asian Semantic Web Conference (Beijing, China, September 3-7, 2006).ASWC [16] Qu, Y., Hu, W., and Cheng, G Constructing Virtual Documents for Ontology Matching. In Proceedings of the 15th International Conference on World Wide Web (Edinburgh, Scotland, May 23-26, 2006). WWW '06. ACM Press, New York, NY, [17] Stuckenschmidt, H., and Klein, M Structurebased Partitioning of large concept hierarchies. In Proceedings of the 3rd International Semantic Web Conference (Hiroshima, Japan, November 7-11, 2004).ISWC [18] Wang, Z., Wang, Y., Zhang, S., Shen, G. and Du, T Effective Large Scale Ontology Mapping. In Proceedings of the First International Conference Knowledge Science, Engineering and Management (Guilin, China, August 5-8, 2006). KSEM [19] Su, W., Wang, J., and Lochovsky, F Holistic Query Interface Matching using Parallel Schema Matching. In Proceedings of the 22nd International Conference on Data Engineering (Atlanta, GA, USA, April 3-8, 2006) ICDE [20] Guha, S., Rastogi, R., and Shim, K ROCK: A Robust Clustering Algorithm for Categorical Attributes. In Proceedings of the 15th International Conference on Data Engineering (Sydney, Austrialia March ). ICDE [21] Grau, B. C., Parsia, B., Sirin, E., and Kalyanpur, A Automatic Partitioning of OWL Ontologies Using ε -Connections. In Proceedings of the 2005 International Workshop on Description Logics (Edinburgh, Scotland, UK, July 26-28, 2005). DL 05. [22] He, B., and Chen-chuan Chang, K Making Holistic Schema Matching Robust: An Ensemble Approach. In Proceedings of the Eleventh ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (Chicago, Illinois, USA, August 21-24, 2005).KDD 05. ACM Press, New York, NY, [23] He, B., Chen-Chan Chang, K., and Han, J Discovering complex matchings across Web Query Interfaces: A Correlation Mining Approach. In Proceedings of the Tenth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (Seattle, Washington, USA, August 22-25, 2004). KDD 04. ACM Press, New York, NY, [24] He, B., Chen-Chan Chang, K Statistical Schema Matching across Web Query Interfaces. In Proceedings of the 2003 ACM SIGMOD International Conference on Management of Data (San Diego, California, USA, June 9-12, 2003) [25] Sabou M., D Aqui M., Motta E Using the Semantic Web as Background Knowledge for Ontology Mapping. In Proceedings International Workshop on Ontology Matching (OM-2006), collocated with ISWC'06. [26] Madhavan, J., Bernstein, P. A., Doan, A., and Halevy, A.Y Corpus-based Schema Matching. In Proceedings of the 21st International Conference on Data Engineering (Tokyo, Japan, April 5-8, 2005). ICDE [27] Pei, J., Hong, J., Bell, D.A A Novel Clusteringbased Approach to Schema Matching. In Proceedings of the 4th International Conference on Advances in Information Systems (Izmir, Turkey, October 18-20, 2006).ADVIS [28] Pei, J., Hong, J., and Bell, D.A A Robust Approach to Schema Matching over Web Query Interfaces. In Proceedings of the 22nd International Conference on Data Engineering Workshops (Atlanta, GA, USA, April 3-7, 2006). ICDE Workshops [29] Su, W., Wang, J., and Lochovsky, F Holistic Schema Matching for Web Query Interface. In Proceedings of the 10th International Conference on Extending Database Technology (Munich, Germany, March 26-31, 2006). EDBT

TRS: Sélection des sous-graphes représentants par l intermédiaire des attributs topologiques et K-medoïdes

TRS: Sélection des sous-graphes représentants par l intermédiaire des attributs topologiques et K-medoïdes TRS: Sélection des sous-graphes représentants par l intermédiaire des attributs topologiques et K-medoïdes Mohamed Moussaoui,Wajdi Dhifli,Sami Zghal,Engelbert Mephu Nguifo FSJEG, Université de Jendouba,

Plus en détail

CURRICULUM VITAE. Informations Personnelles

CURRICULUM VITAE. Informations Personnelles CURRICULUM VITAE Informations Personnelles NOM: BOURAS PRENOM : Zine-Eddine STRUCTURE DE RATTACHEMENT: Département de Mathématiques et d Informatique Ecole Préparatoire aux Sciences et Techniques Annaba

Plus en détail

Développements algorithmiques au LIAMA et àamap en vue de l'analyse d'une scène forestière

Développements algorithmiques au LIAMA et àamap en vue de l'analyse d'une scène forestière Développements algorithmiques au LIAMA et àamap en vue de l'analyse d'une scène forestière Principaux contributeurs: Zhang Xiaopeng (CASIA-NLPR-LIAMA Coordinateur Groupe Image) Li HongJun (CASIA-NLPR-LIAMA

Plus en détail

Alimenter un entrepôt de données par des données issues de services web. Une approche médiation pour le prototype DaWeS

Alimenter un entrepôt de données par des données issues de services web. Une approche médiation pour le prototype DaWeS Alimenter un entrepôt de données par des données issues de services web. Une approche médiation pour le prototype DaWeS John Samuel LIMOS (Laboratoire d Informatique, de Modélisation et d Optimisation

Plus en détail

Application de K-means à la définition du nombre de VM optimal dans un cloud

Application de K-means à la définition du nombre de VM optimal dans un cloud Application de K-means à la définition du nombre de VM optimal dans un cloud EGC 2012 : Atelier Fouille de données complexes : complexité liée aux données multiples et massives (31 janvier - 3 février

Plus en détail

OPEN DATA : CHALLENGES ET PERSPECTIVES D ENTREPOSAGE

OPEN DATA : CHALLENGES ET PERSPECTIVES D ENTREPOSAGE OPEN DATA : CHALLENGES ET PERSPECTIVES D ENTREPOSAGE «Journée Open Data» 5 Novembre 2013 Présenté par : Imen Megdiche Directeur de thèse : Pr. Olivier Teste (SIG-IRIT) Co-directeur de thèse : Mr. Alain

Plus en détail

Laboratoire 4 Développement d un système intelligent

Laboratoire 4 Développement d un système intelligent DÉPARTEMENT DE GÉNIE LOGICIEL ET DES TI LOG770 - SYSTÈMES INTELLIGENTS ÉTÉ 2012 Laboratoire 4 Développement d un système intelligent 1 Introduction Ce quatrième et dernier laboratoire porte sur le développement

Plus en détail

Big Data et Graphes : Quelques pistes de recherche

Big Data et Graphes : Quelques pistes de recherche Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de Lyon/Université Claude Bernard Lyon 1/Université

Plus en détail

Solution A La Gestion Des Objets Java Pour Des Systèmes Embarqués

Solution A La Gestion Des Objets Java Pour Des Systèmes Embarqués International Journal of Engineering Research and Development e-issn: 2278-067X, p-issn: 2278-800X, www.ijerd.com Volume 7, Issue 5 (June 2013), PP.99-103 Solution A La Gestion Des Objets Java Pour Des

Plus en détail

Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services

Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services 69 Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services M. Bakhouya, J. Gaber et A. Koukam Laboratoire Systèmes et Transports SeT Université de Technologie de Belfort-Montbéliard

Plus en détail

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems

Plus en détail

Propriétés du Document EMA. Résumé

Propriétés du Document EMA. Résumé Propriétés du Document Source du Document FSN OpenPaaS Titre du Document Définition et exploitation d un référentiel de processus collaboratifs : Rapport de synthèse quant aux référentiels existants Module(s)

Plus en détail

Une méthode d apprentissage pour la composition de services web

Une méthode d apprentissage pour la composition de services web Une méthode d apprentissage pour la composition de services web Soufiene Lajmi * Chirine Ghedira ** Khaled Ghedira * * Laboratoire SOIE (ENSI) University of Manouba, Manouba 2010, Tunisia Soufiene.lajmi@ensi.rnu.tn,

Plus en détail

EXTRACTION DE CONNAISSANCES À PARTIR DE DONNÉES TEXTUELLES VUE D ENSEMBLE

EXTRACTION DE CONNAISSANCES À PARTIR DE DONNÉES TEXTUELLES VUE D ENSEMBLE ème Colloque National AIP PRIMECA La Plagne - 7- avril 7 EXTRACTION DE CONNAISSANCES À PARTIR DE DONNÉES TEXTUELLES VUE D ENSEMBLE Bruno Agard Département de Mathématiques et de Génie Industriel, École

Plus en détail

Big Data et Graphes : Quelques pistes de recherche

Big Data et Graphes : Quelques pistes de recherche Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci http://liris.cnrs.fr/hamamache.kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de

Plus en détail

Formula Negator, Outil de négation de formule.

Formula Negator, Outil de négation de formule. Formula Negator, Outil de négation de formule. Aymerick Savary 1,2, Mathieu Lassale 1,2, Jean-Louis Lanet 1 et Marc Frappier 2 1 Université de Limoges 2 Université de Sherbrooke Résumé. Cet article présente

Plus en détail

Intégration de la dimension sémantique dans les réseaux sociaux

Intégration de la dimension sémantique dans les réseaux sociaux Intégration de la dimension sémantique dans les réseaux sociaux Application : systèmes de recommandation Maria Malek LARIS-EISTI maria.malek@eisti.fr 1 Contexte : Recommandation dans les réseaux sociaux

Plus en détail

Résumé hybride de flux de données par échantillonnage et classification automatique

Résumé hybride de flux de données par échantillonnage et classification automatique Résumé hybride de flux de données par échantillonnage et classification automatique Nesrine Gabsi,, Fabrice Clérot Georges Hébrail Institut TELECOM ; TELECOM ParisTech ; CNRS LTCI 46, rue Barrault 75013

Plus en détail

Apprentissage statistique dans les graphes et les réseaux sociaux

Apprentissage statistique dans les graphes et les réseaux sociaux Apprentissage statistique dans les graphes et les réseaux sociaux Patrick Gallinari Collaboration : L. Denoyer, S. Peters Université Pierre et Marie Curie AAFD 2010 1 Plan Motivations et Problématique

Plus en détail

Bologne à l EPFL. Réforme de Bologne Implications pour l EPFL. Prof. Dominique Bonvin, Doyen Bachelor-Master

Bologne à l EPFL. Réforme de Bologne Implications pour l EPFL. Prof. Dominique Bonvin, Doyen Bachelor-Master Bologne à l EPFL Réforme de Bologne Implications pour l EPFL Prof. Dominique Bonvin, Doyen Bachelor-Master EPFL Quelques chiffres 6 600 Etudiants, 23% femmes, 38% étrangers, 109 nationalités 1 400 Doctorants

Plus en détail

Entreposage de données complexes pour la médecine d anticipation personnalisée

Entreposage de données complexes pour la médecine d anticipation personnalisée Manuscrit auteur, publié dans "9th International Conference on System Science in Health Care (ICSSHC 08), Lyon : France (2008)" Entreposage de données complexes pour la médecine d anticipation personnalisée

Plus en détail

Equilibrage de charge (Load

Equilibrage de charge (Load Equilibrage de charge (Load balancing) dans les MPSoCs Présenté Le : 02 Décembre 2013 Par : A. AROUI Encadreur : A.E. BENYAMINA 01/12/2013 1 Problématique Comportement dynamique des applications et la

Plus en détail

Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe

Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe Karima Dhouib, Sylvie Després Faiez Gargouri ISET - Sfax Tunisie, BP : 88A Elbustan ; Sfax karima.dhouib@isets.rnu.tn,

Plus en détail

Recherche d information en langue arabe : influence des paramètres linguistiques et de pondération de LSA

Recherche d information en langue arabe : influence des paramètres linguistiques et de pondération de LSA RÉCITAL 2005, Dourdan, 6-10 juin 2005 Recherche d information en langue arabe : influence des paramètres linguistiques et de pondération de LSA Siham Boulaknadel (1,2), Fadoua Ataa-Allah (2) (1) LINA FRE

Plus en détail

INTRODUCTION AU DATA MINING

INTRODUCTION AU DATA MINING INTRODUCTION AU DATA MINING 6 séances de 3 heures mai-juin 2006 EPF - 4 ème année - Option Ingénierie d Affaires et de Projets Bertrand LIAUDET TP DE DATA MINING Le TP et le projet consisteront à mettre

Plus en détail

Approche hybride pour le diagnostic industriel basée sur le RàPC et le Datamining : Utilisation de la plateforme JCOLIBRI 2.1

Approche hybride pour le diagnostic industriel basée sur le RàPC et le Datamining : Utilisation de la plateforme JCOLIBRI 2.1 Approche hybride pour le diagnostic industriel basée sur le RàPC et le Datamining : Utilisation de la plateforme JCOLIBRI 2.1 Noureddine Mekroud 1, Abdelouahab Moussaoui 2 Département de l informatique,

Plus en détail

Sécurisation du stockage de données sur le Cloud Michel Kheirallah

Sécurisation du stockage de données sur le Cloud Michel Kheirallah Sécurisation du stockage de données sur le Cloud Michel Kheirallah Introduction I Présentation du Cloud II Menaces III Exigences de sécurité IV Techniques de sécurisation 2 26/02/2015 Présentation du Cloud

Plus en détail

Problématiques de recherche. Figure Research Agenda for service-oriented computing

Problématiques de recherche. Figure Research Agenda for service-oriented computing Problématiques de recherche 90 Figure Research Agenda for service-oriented computing Conférences dans le domaine ICWS (International Conference on Web Services) Web services specifications and enhancements

Plus en détail

RI sociale : intégration de propriétés sociales dans un modèle de recherche

RI sociale : intégration de propriétés sociales dans un modèle de recherche RI sociale : intégration de propriétés sociales dans un modèle de recherche Ismail Badache 1 Institut de Recherche en Informatique de Toulouse, UMR 5505 CNRS, SIG 118 Route de Narbonne F-31062 Toulouse

Plus en détail

Découverte des dépendances fonctionnelles conditionnelles fréquentes

Découverte des dépendances fonctionnelles conditionnelles fréquentes Découverte des dépendances fonctionnelles conditionnelles fréquentes Thierno Diallo et Noël Novelli Université de Lyon, LIRIS, CNRS-UMR5205 7 av, Jean Capelle, 69621 Villeurbanne Cedex, France thierno.diallo@insa-lyon.fr

Plus en détail

Amélioration de la fiabilité d inspection en CND grâce à la fusion d information : applications en rayons X et ultrasons

Amélioration de la fiabilité d inspection en CND grâce à la fusion d information : applications en rayons X et ultrasons Amélioration de la fiabilité d inspection en CND grâce à la fusion d information : applications en rayons X et ultrasons Ahmad OSMAN 1a, Valérie KAFTANDJIAN b, Ulf HASSLER a a Fraunhofer Development Center

Plus en détail

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

Modélisation d objets mobiles dans un entrepôt de données

Modélisation d objets mobiles dans un entrepôt de données Tao Wan, Karine Zeitouni Laboratoire PRISM, Université de Versailles 45, avenue des Etats-Unis, 78035 Versailles Cedex, France Tao.Wan@prism.uvsq.fr, Karine.Zeitouni@prism.uvsq.fr http://www.prism.uvsq.fr/users/karima/

Plus en détail

Curriculum Vitae 1 er février 2008

Curriculum Vitae 1 er février 2008 Curriculum Vitae 1 er février 2008 Informations générales Cédric MEUTER Nationalité belge Né à La Louvière, le 16 novembre 1979 Adresse personnelle : Adresse professionnelle : Ave Général Bernheim, 57

Plus en détail

Techniques d interaction dans la visualisation de l information Séminaire DIVA

Techniques d interaction dans la visualisation de l information Séminaire DIVA Techniques d interaction dans la visualisation de l information Séminaire DIVA Zingg Luca, luca.zingg@unifr.ch 13 février 2007 Résumé Le but de cet article est d avoir une vision globale des techniques

Plus en détail

Techniques d analyse et de conception d outils pour la gestion du processus de segmentation des abonnés des entreprises de télécommunication

Techniques d analyse et de conception d outils pour la gestion du processus de segmentation des abonnés des entreprises de télécommunication Techniques d analyse et de conception d outils pour la gestion du processus de segmentation des abonnés des entreprises de télécommunication R. Carlos Nana Mbinkeu 1,3, C. Tangha 1, A. Chomnoue 1, A. Kuete

Plus en détail

Une méthode de classification supervisée sans paramètre pour l apprentissage sur les grandes bases de données

Une méthode de classification supervisée sans paramètre pour l apprentissage sur les grandes bases de données Une méthode de classification supervisée sans paramètre pour l apprentissage sur les grandes bases de données Marc Boullé Orange Labs 2 avenue Pierre Marzin 22300 Lannion marc.boulle@orange-ftgroup.com,

Plus en détail

Université Abou-Bekr Belkaid Tlemcen Faculté des Sciences Economiques et de Gestion. BENBOUZIANE Mohamed

Université Abou-Bekr Belkaid Tlemcen Faculté des Sciences Economiques et de Gestion. BENBOUZIANE Mohamed Université Abou-Bekr Belkaid Tlemcen Faculté des Sciences Economiques et de Gestion CV BENBOUZIANE Mohamed Nom : BENBOUZIANE Prénom : Mohamed Date et Lieu de Naissance : 04/ 12/ 1963 à Honaine Tlemcen-

Plus en détail

R-ICP : une nouvelle approche d appariement 3D orientée régions pour la reconnaissance faciale

R-ICP : une nouvelle approche d appariement 3D orientée régions pour la reconnaissance faciale R-ICP : une nouvelle approche d appariement 3D orientée régions pour la reconnaissance faciale Boulbaba BEN AMOR, Karima OUJI, Mohsen ARDABILIAN, et Liming CHEN Laboratoire d InfoRmatique en Images et

Plus en détail

Gestion de données incertaines et de leur provenance

Gestion de données incertaines et de leur provenance Gestion de données incertaines et de leur provenance Pierre Senellart Séminaire INSERM & Institut TELEOM 7 octobre 2008 P. Senellart (TELEOM ParisTech) Données incertaines et provenance 07/10/2008 1 /

Plus en détail

Application de K-Means à la définition du nombre de VM optimal dans un Cloud

Application de K-Means à la définition du nombre de VM optimal dans un Cloud Application de K-Means à la définition du nombre de VM optimal dans un Cloud Khaled Tannir; Hubert. Kadima ; Maria Malek Laboratoire LARIS/EISTI Ave du Parc 95490 Cergy-Pontoise France contact@khaledtannir.net,

Plus en détail

Introduction aux algorithmes MapReduce. Mathieu Dumoulin (GRAAL), 14 Février 2014

Introduction aux algorithmes MapReduce. Mathieu Dumoulin (GRAAL), 14 Février 2014 Introduction aux algorithmes MapReduce Mathieu Dumoulin (GRAAL), 14 Février 2014 Plan Introduction de la problématique Tutoriel MapReduce Design d algorithmes MapReduce Tri, somme et calcul de moyenne

Plus en détail

http://blog.khaledtannir.net

http://blog.khaledtannir.net Algorithme de parallélisations des traitements Khaled TANNIR Doctorant CIFRE LARIS/ESTI http://blog.khaledtannir.net these@khaledtannir.net 2e SéRI 2010-2011 Jeudi 17 mars 2011 Présentation Doctorant CIFRE

Plus en détail

Jean-Daniel Cryans jdcryans@apache.org Twitter: @jdcryans. École de technologie supérieure, Montréal septembre 2009

Jean-Daniel Cryans jdcryans@apache.org Twitter: @jdcryans. École de technologie supérieure, Montréal septembre 2009 Jean-Daniel Cryans jdcryans@apache.org Twitter: @jdcryans École de technologie supérieure, Montréal septembre 2009 1. Introduction 2. Le Cloud Computing selon la littérature 3. Les produits 4. Études de

Plus en détail

Clustering par optimisation de la modularité pour trajectoires d objets mobiles

Clustering par optimisation de la modularité pour trajectoires d objets mobiles Clustering par optimisation de la modularité pour trajectoires d objets mobiles Mohamed K. El Mahrsi, Télécom ParisTech, Département INFRES 46, rue Barrault 75634 Paris CEDEX 13, France Fabrice Rossi,

Plus en détail

Offre de thèse. Co-encadrant de thèse : HENRY Sébastien Coordonnées électroniques : Sébastien.Henry@univ-lyon1.fr Laboratoire : DISP (www.disp-lab.

Offre de thèse. Co-encadrant de thèse : HENRY Sébastien Coordonnées électroniques : Sébastien.Henry@univ-lyon1.fr Laboratoire : DISP (www.disp-lab. Offre de thèse 1. Profil recherché Issu d une formation d ingénieur ou d un master, le candidat disposera idéalement des compétences dans les domaines suivants : Pilotage des systèmes de production. Systèmes

Plus en détail

Intégration de données hétérogènes et réparties. Anne Doucet Anne.Doucet@lip6.fr

Intégration de données hétérogènes et réparties. Anne Doucet Anne.Doucet@lip6.fr Intégration de données hétérogènes et réparties Anne Doucet Anne.Doucet@lip6.fr 1 Plan Intégration de données Architectures d intégration Approche matérialisée Approche virtuelle Médiateurs Conception

Plus en détail

Projet. Présentation du projet. Performance in Relationships Adapted to extended Innovation with Suppliers. Coordinateur du Projet

Projet. Présentation du projet. Performance in Relationships Adapted to extended Innovation with Suppliers. Coordinateur du Projet Projet Performance in Relationships Adapted to extended Innovation with Suppliers Praxis (nf, d'origine grec), signifiant action, désigne l'ensemble des activités humaines susceptibles de transformer le

Plus en détail

Vers une Optimisation de l Algorithme AntTreeStoch

Vers une Optimisation de l Algorithme AntTreeStoch Revue des Sciences et de la Technologie - RST- Volume 3 N 1 / janvier 2012 Vers une Optimisation de l Algorithme AntTreeStoch O. KADRI, H. MOUSS, A. ABDELHADI, R. MAHDAOUI Laboratoire d Automatique et

Plus en détail

Classification Automatique de messages : une approche hybride

Classification Automatique de messages : une approche hybride RECIAL 2002, Nancy, 24-27 juin 2002 Classification Automatique de messages : une approche hybride O. Nouali (1) Laboratoire des Logiciels de base, CE.R.I.S., Rue des 3 frères Aïssiou, Ben Aknoun, Alger,

Plus en détail

1997 Maîtrise d économétrie, Université des Sciences et Technologies de Lille 1.

1997 Maîtrise d économétrie, Université des Sciences et Technologies de Lille 1. Fany DECLERCK Chercheur IDEI Professeur des Universités IAE Toulouse School of Economics Université de Toulouse Adresse Université de Toulouse 1 Manufacture des Tabacs Aile Jean-Jacques LAFFONT - MF 311

Plus en détail

ÉVALUATION DE L UTILISABILITÉ D UN SITE WEB : TESTS D UTILISABILITÉ VERSUS ÉVALUATION HEURISTIQUE

ÉVALUATION DE L UTILISABILITÉ D UN SITE WEB : TESTS D UTILISABILITÉ VERSUS ÉVALUATION HEURISTIQUE ÉVALUATION DE L UTILISABILITÉ D UN SITE WEB : TESTS D UTILISABILITÉ VERSUS ÉVALUATION HEURISTIQUE BOUTIN MARIO Centre de recherche informatique de Montréal (CRIM), 550, rue Sherbrooke Ouest, Bureau 100,

Plus en détail

Une proposition d extension de GML pour un modèle générique d intégration de données spatio-temporelles hétérogènes

Une proposition d extension de GML pour un modèle générique d intégration de données spatio-temporelles hétérogènes 303 Schedae, 2007 Prépublication n 46 Fascicule n 2 Une proposition d extension de GML pour un modèle générique d intégration de données spatio-temporelles hétérogènes Samya Sagar, Mohamed Ben Ahmed Laboratoire

Plus en détail

VISUALISATION DE NUAGES DE POINTS

VISUALISATION DE NUAGES DE POINTS ARNAUD BLETTERER MULTI-RÉSOLUTION 1/16 VISUALISATION DE NUAGES DE POINTS MULTI-RÉSOLUTION AU TRAVERS DE CARTES DE PROFONDEUR Arnaud Bletterer Université de Nice Sophia Antipolis Laboratoire I3S - Cintoo

Plus en détail

Un processus dirigé par les modèles pour la création de bases de connaissance ontologiques

Un processus dirigé par les modèles pour la création de bases de connaissance ontologiques Un processus dirigé par les modèles pour la création de bases de connaissance ontologiques Guillaume Hillairet, Frédéric Bertrand, Jean Yves Lafaye Laboratoire Informatique Image Interaction Université

Plus en détail

Data Mining. Master 1 Informatique - Mathématiques UAG

Data Mining. Master 1 Informatique - Mathématiques UAG Data Mining Master 1 Informatique - Mathématiques UAG 1.1 - Introduction Data Mining? On parle de Fouille de données Data Mining Extraction de connaissances à partir de données Knowledge Discovery in Data

Plus en détail

Entrepôt de données 1. Introduction

Entrepôt de données 1. Introduction Entrepôt de données 1 (data warehouse) Introduction 1 Présentation Le concept d entrepôt de données a été formalisé pour la première fois en 1990 par Bill Inmon. Il s agissait de constituer une base de

Plus en détail

OPTIMISATION DE LA MAINTENANCE DES EQUIPEMENTS DE MANUTENTION DU TERMINAL A CONTENEURS DE BEJAIA (BMT)

OPTIMISATION DE LA MAINTENANCE DES EQUIPEMENTS DE MANUTENTION DU TERMINAL A CONTENEURS DE BEJAIA (BMT) OPTIMISATION DE LA MAINTENANCE DES EQUIPEMENTS DE MANUTENTION DU TERMINAL A CONTENEURS DE BEJAIA (BMT) LAGGOUNE Radouane 1 et HADDAD Cherifa 2 1,2: Dépt. de G. Mécanique, université de Bejaia, Targa-Ouzemour

Plus en détail

Préparer un état de l art

Préparer un état de l art Préparer un état de l art Khalil DRIRA LAAS-CNRS, Toulouse Unité de recherche ReDCAD École Nationale d ingénieurs de Sfax Étude de l état de l art? Une étude ciblée, approfondie et critique des travaux

Plus en détail

Évaluation d une architecture de stockage RDF distribuée

Évaluation d une architecture de stockage RDF distribuée Évaluation d une architecture de stockage RDF distribuée Maeva Antoine 1, Françoise Baude 1, Fabrice Huet 1 1 INRIA MÉDITERRANÉE (ÉQUIPE OASIS), UNIVERSITÉ NICE SOPHIA-ANTIPOLIS, I3S CNRS prénom.nom@inria.fr

Plus en détail

Introduction à la B.I. Avec SQL Server 2008

Introduction à la B.I. Avec SQL Server 2008 Introduction à la B.I. Avec SQL Server 2008 Version 1.0 VALENTIN Pauline 2 Introduction à la B.I. avec SQL Server 2008 Sommaire 1 Présentation de la B.I. et SQL Server 2008... 3 1.1 Présentation rapide

Plus en détail

L utilisation d un réseau de neurones pour optimiser la gestion d un firewall

L utilisation d un réseau de neurones pour optimiser la gestion d un firewall L utilisation d un réseau de neurones pour optimiser la gestion d un firewall Réza Assadi et Karim Khattar École Polytechnique de Montréal Le 1 mai 2002 Résumé Les réseaux de neurones sont utilisés dans

Plus en détail

Qualité de la conception de tests logiciels : plate-forme de conception et processus de test

Qualité de la conception de tests logiciels : plate-forme de conception et processus de test Ecole Doctorale en Sciences de l Ingénieur de l ECP Formation doctorale en Génie Industriel Qualité de la conception de tests logiciels : plate-forme de conception et processus de test Quality of the design

Plus en détail

Performances. Gestion des serveurs (2/2) Clustering. Grid Computing

Performances. Gestion des serveurs (2/2) Clustering. Grid Computing Présentation d Oracle 10g Chapitre VII Présentation d ORACLE 10g 7.1 Nouvelles fonctionnalités 7.2 Architecture d Oracle 10g 7.3 Outils annexes 7.4 Conclusions 7.1 Nouvelles fonctionnalités Gestion des

Plus en détail

Curriculum Vitae - Emmanuel Hebrard. Emmanuel Hebrard

Curriculum Vitae - Emmanuel Hebrard. Emmanuel Hebrard Emmanuel Hebrard Adresse 5 Tuckey Street Cork, Ireland emmanuel.hebrard@gmail.com http ://4c.ucc.ie/ ehebrard/home.html Adresse Professionnelle Cork Constraint Computation Centre Cork, Ireland Telephone

Plus en détail

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique Objectifs Clustering On ne sait pas ce qu on veut trouver : on laisse l algorithme nous proposer un modèle. On pense qu il existe des similarités entre les exemples. Qui se ressemble s assemble p. /55

Plus en détail

Principes. 2A-SI 3 Prog. réseau et systèmes distribués 3. 3 Programmation en CORBA. Programmation en Corba. Stéphane Vialle

Principes. 2A-SI 3 Prog. réseau et systèmes distribués 3. 3 Programmation en CORBA. Programmation en Corba. Stéphane Vialle 2A-SI 3 Prog. réseau et systèmes distribués 3. 3 Programmation en CORBA Stéphane Vialle Stephane.Vialle@supelec.fr http://www.metz.supelec.fr/~vialle 1 Principes 2 Architecture 3 4 Aperçu d utilisation

Plus en détail

Apprentissage actif pour le clustering semi-supervisé

Apprentissage actif pour le clustering semi-supervisé Apprentissage actif pour le clustering semi-supervisé Nicolas Labroche Sorbonne Universités, UPMC Univ Paris 06 CNRS, UMR 7606, LIP6 F-75005, Paris, France Atelier Clustering and Co-clustering (CluCo),

Plus en détail

Curriculum Vitae. Karel HEURTEFEUX. Education

Curriculum Vitae. Karel HEURTEFEUX. Education Address CNRS, Verimag - Laboratory / Synchrone Team 2, Avenue de Vignate, 38610 Gières, France Tel. : +33 (0)4 56 52 03 86 Curriculum Vitae Karel HEURTEFEUX Born 10.21.1982 French karel.heurtefeux@imag.fr

Plus en détail

Les Bases de Données et l Objet Introduction

Les Bases de Données et l Objet Introduction Les Bases de Données et l Objet Introduction Didier DONSEZ Université de Valenciennes Institut des Sciences et Techniques de Valenciennes donsez@univ-valenciennes.fr Plan Définitions d un Objet Propriétés

Plus en détail

Plan 1/9/2013. Génération et exploitation de données. CEP et applications. Flux de données et notifications. Traitement des flux Implémentation

Plan 1/9/2013. Génération et exploitation de données. CEP et applications. Flux de données et notifications. Traitement des flux Implémentation Complex Event Processing Traitement de flux de données en temps réel Romain Colle R&D Project Manager Quartet FS Plan Génération et exploitation de données CEP et applications Flux de données et notifications

Plus en détail

Lamia Oukid, Ounas Asfari, Fadila Bentayeb, Nadjia Benblidia, Omar Boussaid. 14 Juin 2013

Lamia Oukid, Ounas Asfari, Fadila Bentayeb, Nadjia Benblidia, Omar Boussaid. 14 Juin 2013 Cube de textes et opérateur d'agrégation basé sur un modèle vectoriel adapté Text Cube Model and aggregation operator based on an adapted vector space model Lamia Oukid, Ounas Asfari, Fadila Bentayeb,

Plus en détail

Monitoring elderly People by Means of Cameras

Monitoring elderly People by Means of Cameras Nuadu project Technologies for Personal Hearth Seminar, June 4th, 2009 Monitoring elderly People by Means of Cameras Laurent LUCAT Laboratory of Embedded Vision Systems CEA LIST, Saclay, France 1 Summary

Plus en détail

Enrichissement du profil utilisateur à partir de son réseau social dans un contexte dynamique : application d une méthode de pondération temporelle

Enrichissement du profil utilisateur à partir de son réseau social dans un contexte dynamique : application d une méthode de pondération temporelle Enrichissement du profil utilisateur à partir de son réseau social dans un contexte dynamique : application d une méthode de pondération temporelle Marie-Françoise Canut, Sirinya On-at, André Péninou,

Plus en détail

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com Intelligence Artificielle et Systèmes Multi-Agents Badr Benmammar bbm@badr-benmammar.com Plan La première partie : L intelligence artificielle (IA) Définition de l intelligence artificielle (IA) Domaines

Plus en détail

Le Baromètre Semestriel d Inclusion Bancaire et Financière en Tunisie (Evolution des Indices d Inclusion au 2ème Semestre 2013)

Le Baromètre Semestriel d Inclusion Bancaire et Financière en Tunisie (Evolution des Indices d Inclusion au 2ème Semestre 2013) Le Baromètre Semestriel d Inclusion Bancaire et Financière en Tunisie (Evolution des Indices d Inclusion au 2ème Semestre 213) 1. Exposé des motifs et référentiels internationaux. La circularité des concepts

Plus en détail

La segmentation à l aide de EG-SAS. A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM

La segmentation à l aide de EG-SAS. A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM La segmentation à l aide de EG-SAS A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM Définition de la segmentation - Au lieu de considérer une population dans son ensemble,

Plus en détail

Présentations personnelles. filière IL

Présentations personnelles. filière IL Présentations personnelles filière IL Résumé Liste de sujets de présentations personnelles. Chaque présentation aborde un sujet particulier, l'objectif étant que la lecture du rapport ainsi que l'écoute

Plus en détail

Linked Open Data. Le Web de données Réseau, usages, perspectives. Eric Charton. Eric Charton

Linked Open Data. Le Web de données Réseau, usages, perspectives. Eric Charton. Eric Charton Linked Open Data Le Web de données Réseau, usages, perspectives Sommaire Histoire du Linked Open Data Structure et évolution du réseau Utilisations du Linked Open Data Présence sur le réseau LOD Futurs

Plus en détail

Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH

Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH Boris Hejblum 1,2,3 & Rodolphe Thiébaut 1,2,3 1 Inserm, U897

Plus en détail

Maîtrise énergétique des centres de données

Maîtrise énergétique des centres de données LABORATOIRE D INFORMATIQUE DE NANTES-ATLANTIQUE UMR 6241 ÉCOLE DOCTORALE STIM, N. 503 «Sciences et technologies de l information et des mathématiques» Sujet de thèse pour 2010 Maîtrise énergétique des

Plus en détail

Knowledge Enabled Real-Time Recommendation System

Knowledge Enabled Real-Time Recommendation System Knowledge Enabled Real-Time Recommendation System Syed Gillani, Jules Chevalier syed.gillani@univ-st-etienne.fr jules.chevalier@univ-st-etienne.fr Institut Henri Fayol, École des Mines de Saint-Étienne

Plus en détail

Plan de cours ADM 992C Page 1. École des sciences de la gestion Département de management et technologie Université du Québec à Montréal

Plan de cours ADM 992C Page 1. École des sciences de la gestion Département de management et technologie Université du Québec à Montréal Plan de cours ADM 992C Page 1 École des sciences de la gestion Département de management et technologie Université du Québec à Montréal ADM-992C LES TECHNOLOGIES D'AIDE À LA PRISE DE DÉCISION DANS LES

Plus en détail

Analyse de grandes bases de données en santé

Analyse de grandes bases de données en santé .. Analyse de grandes bases de données en santé Alain Duhamel Michaël Genin Mohamed Lemdani EA 2694 / CERIM Master 2 Recherche Biologie et Santé Journée Thématique Fouille de Données Plan. 1 Problématique.

Plus en détail

Les OST peuvent impacter les activités d autres services des institutions financières, telles que :

Les OST peuvent impacter les activités d autres services des institutions financières, telles que : Introduction A l inverse des services clearing et settlement des institutions financières, les services Opérations sur Titres n ont pas, jusqu à récemment, bénéficié de développements permettant le traitement

Plus en détail

Codage vidéo par block matching adaptatif

Codage vidéo par block matching adaptatif Traitement et analyse d'images(39) Codage vidéo par block matching adaptatif Abdelhamid Djeffal Département d informatique Université Mohamed Khider BISKRA, ALGERIE Abdelhamid_Djeffal@yahoo.fr Zine Eddine

Plus en détail

Proposition des cadres d évaluation adaptés à un système de RI personnalisé

Proposition des cadres d évaluation adaptés à un système de RI personnalisé Proposition des cadres d évaluation adaptés à un système de RI personnalisé Mariam Daoud, Lynda Tamine-Lechani Laboratoire IRIT, Université Paul Sabatier 118 Route de Narbonne, F-31062 TOULOUSE CEDEX 9

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme

Plus en détail

Mesure et modélisation de l énergie logicielle

Mesure et modélisation de l énergie logicielle Mesure et modélisation de l énergie logicielle Adel Noureddine, Romain Rouvoy, Lionel Seinturier Green Days @ Lille 29 novembre 2013 Plan Contexte! Problèmes et limitations! Mesure énergétique des logiciels

Plus en détail

Bigdata et Web sémantique. les données + l intelligence= la solution

Bigdata et Web sémantique. les données + l intelligence= la solution Bigdata et Web sémantique les données + l intelligence= la solution 131214 1 big data et Web sémantique deux notions bien différentes et pourtant... (sable et silicium). «bigdata» ce n est pas que des

Plus en détail

BI dans les nuages. Olivier Bendavid, UM2 Prof. A. April, ÉTS

BI dans les nuages. Olivier Bendavid, UM2 Prof. A. April, ÉTS BI dans les nuages Olivier Bendavid, UM2 Prof. A. April, ÉTS Table des matières Introduction Description du problème Les solutions Le projet Conclusions Questions? Introduction Quelles sont les défis actuels

Plus en détail

Problèmes d additivité dus à la présence de hiérarchies

Problèmes d additivité dus à la présence de hiérarchies Problèmes d additivité dus à la présence de hiérarchies complexes dans les modèles multidimensionnels : définitions, solutions et travaux futurs Marouane Hachicha, Jérôme Darmont To cite this version:

Plus en détail

Hervé Couturier EVP, SAP Technology Development

Hervé Couturier EVP, SAP Technology Development Hervé Couturier EVP, SAP Technology Development Hervé Biausser Directeur de l Ecole Centrale Paris Bernard Liautaud Fondateur de Business Objects Questions à: Hervé Couturier Hervé Biausser Bernard Liautaud

Plus en détail

Etude d un cas industriel : Optimisation de la modélisation de paramètre de production

Etude d un cas industriel : Optimisation de la modélisation de paramètre de production Revue des Sciences et de la Technologie RST- Volume 4 N 1 /janvier 2013 Etude d un cas industriel : Optimisation de la modélisation de paramètre de production A.F. Bernate Lara 1, F. Entzmann 2, F. Yalaoui

Plus en détail

Définition et diffusion de signatures sémantiques dans les systèmes pair-à-pair

Définition et diffusion de signatures sémantiques dans les systèmes pair-à-pair Définition et diffusion de signatures sémantiques dans les systèmes pair-à-pair Raja Chiky, Bruno Defude, Georges Hébrail GET-ENST Paris Laboratoire LTCI - UMR 5141 CNRS Département Informatique et Réseaux

Plus en détail

Adaptation du modèle de langue pour le tri des réponses dans les BD

Adaptation du modèle de langue pour le tri des réponses dans les BD Adaptation du modèle de langue pour le tri des réponses dans les BD Abdelhamid CHELLAL * Mohand BOUGHANEM * Karima AMROUCHE ** *Institut de Recherche en Informatique de Toulouse, 118 route de Narbonne

Plus en détail

Equilibrage de charge pour les grilles de calcul : classe des tâches dépendantes et indépendantes.

Equilibrage de charge pour les grilles de calcul : classe des tâches dépendantes et indépendantes. Equilibrage de charge pour les grilles de calcul : classe des tâches dépendantes et indépendantes. Meriem Meddeber 1 et Belabbas Yagoubi 2 1 Université de Mascara, Faculté des sciences, Département des

Plus en détail

An Ontology-Based Approach for Closed-Loop Product Lifecycle Management

An Ontology-Based Approach for Closed-Loop Product Lifecycle Management An Ontology-Based Approach for Closed-Loop Product Lifecycle Management THÈSE N O 4823 (2010) PRÉSENTÉE LE 15 OCTOBRE 2010 À LA FACULTÉ SCIENCES ET TECHNIQUES DE L'INGÉNIEUR LABORATOIRE DES OUTILS INFORMATIQUES

Plus en détail

CLOUD PUBLIC, PRIVÉ OU HYBRIDE : LEQUEL EST LE PLUS ADAPTÉ À VOS APPLICATIONS?

CLOUD PUBLIC, PRIVÉ OU HYBRIDE : LEQUEL EST LE PLUS ADAPTÉ À VOS APPLICATIONS? CLOUD PUBLIC, PRIVÉ OU HYBRIDE : LEQUEL EST LE PLUS ADAPTÉ À VOS APPLICATIONS? Les offres de Cloud public se sont multipliées et le Cloud privé se généralise. Désormais, toute la question est de savoir

Plus en détail