Permanents : Doctorants : Post-Doc : Anciens Doctorants :



Documents pareils
Modélisation d objets mobiles dans un entrepôt de données

Les Entrepôts de Données

THÈSE. présentée à TÉLÉCOM PARISTECH. pour obtenir le grade de. DOCTEUR de TÉLÉCOM PARISTECH. Mention Informatique et Réseaux. par.

Hervé Couturier EVP, SAP Technology Development

Journée SITG, Genève 15 octobre Nicolas Lachance-Bernard M.ATDR Doctorant, Laboratoire de systèmes d information géographique

Quatre axes au service de la performance et des mutations Four lines serve the performance and changes

Plan 1/9/2013. Génération et exploitation de données. CEP et applications. Flux de données et notifications. Traitement des flux Implémentation

Institut français des sciences et technologies des transports, de l aménagement

Lamia Oukid, Ounas Asfari, Fadila Bentayeb, Nadjia Benblidia, Omar Boussaid. 14 Juin 2013

Monitoring elderly People by Means of Cameras

Evolution et architecture des systèmes d'information, de l'internet. Impact sur les IDS. IDS2014, Nailloux 26-28/05/2014

Intégration de données

Performances. Gestion des serveurs (2/2) Clustering. Grid Computing

Master Informatique Aix-Marseille Université

ENOVIA 3DLive. IBM PLM Solutions 1 er Octobre Philippe Georgelin Sébastien Veret

Forthcoming Database

La problématique. La philosophie ' ) * )

Informatique Médicale & Ingénierie des Connaissances Pour la e-santé

Ingénierie et gestion des connaissances

UML : Unified Modeling Language

L OBSERVATOIRE DE LA BIOLOGIE DE SYNTHESE SYNTHETIC BIOLOGY OBSERVATORY

Architectures d'intégration de données

Intégration de données hétérogènes et réparties. Anne Doucet

04/05/2011 Amundi Liquidity A creative market introduction Date

Protection des données personnelles : Vers un Web personnel sécurisé

Instructions Mozilla Thunderbird Page 1

Module Title: French 4

Problématiques de recherche. Figure Research Agenda for service-oriented computing

Préconisations pour une gouvernance efficace de la Manche. Pathways for effective governance of the English Channel

MANUEL MARKETING ET SURVIE PDF

Application Form/ Formulaire de demande

Les ontologies pour l intégration sémantique : enjeux et défis

Innovation in Home Insurance: What Services are to be Developed and for what Trade Network?

4. SERVICES WEB REST 46

Bigdata et Web sémantique. les données + l intelligence= la solution

Grégoire de Lassence. Copyright 2006, SAS Institute Inc. All rights reserved.

Tier 1 / Tier 2 relations: Are the roles changing?

INSTITUT MARITIME DE PREVENTION. For improvement in health and security at work. Created in 1992 Under the aegis of State and the ENIM

Stratégie DataCenters Société Générale Enjeux, objectifs et rôle d un partenaire comme Data4

TRAVAUX DE RECHERCHE DANS LE

GPC Computer Science

Relions les hommes à l entreprise Linking people to companies

Une méthode d apprentissage pour la composition de services web

An Ontology-Based Approach for Closed-Loop Product Lifecycle Management

CALM Un système de gestion de données de CApteurs à Localisation Mobile

Big Data et Graphes : Quelques pistes de recherche

affichage en français Nom de l'employeur *: Lions Village of Greater Edmonton Society

Table ronde gestion de l énergie : réseaux, stockages, consommations

Pascale Betinelli CEA LIST. Demi-journée d'information ECHORD++ 20 avril M.E.N.E.S.R

PEINTAMELEC Ingénierie

How to Login to Career Page

DOCUMENTATION - FRANCAIS... 2

UNIV. LA ROCHELLE (IUT) Référence GALAXIE : 4099

Comprendre l impact de l utilisation des réseaux sociaux en entreprise SYNTHESE DES RESULTATS : EUROPE ET FRANCE

Services internationaux en géodésie spatiale

Outils d'analyse de la sécurité des réseaux. HADJALI Anis VESA Vlad

Entreprises Citoyennes: Sécurité et Risques Industriels. Journées Annuelles du Pétrole. Christiane Muller, Air Liquide. Les Hydrocarbures de l extrême

Colloque «Télécommunicationsréseaux du futur et services»

Définition et diffusion de signatures sémantiques dans les systèmes pair-à-pair

Women s State of the Media Democracy 2012 L observatoire international des usages et interactions des médias

20 ans du Master SIAD de Toulouse - BigData par l exemple - Julien DULOUT - 22 mars ans du SIAD -"Big Data par l'exemple" -Julien DULOUT

Adaptabilité d un MOOC aux styles d apprentissage. Hubert Kadima Directeur de Recherche LARIS/EISTI hubert.kadima@eisti.fr

Informatique / Computer Science

Présentation du sujet de thèse Schémas temporels hybrides fondés sur les SVMs pour l analyse du comportement du conducteur

L'Ombudsman des banques: une alternative à la résolution des différends

Tom Pertsekos. Sécurité applicative Web : gare aux fraudes et aux pirates!

CENTRALE TELESURVEILLANCE VIA INTERNET WEB

SMALL CITY COMMERCE (EL PEQUEÑO COMERCIO DE LAS PEQUEÑAS CIUDADES)

Mise en place d un système de cabotage maritime au sud ouest de l Ocean Indien. 10 Septembre 2012

SOMMAIRE. Conseil de lecture Préface Introduction. 1 Comprendre le rôle des technologies 1. 2 Maîtriser les concepts technologiques 13

Archived Content. Contenu archivé

ANNEXE 2 DESCRIPTION DU CONTENU DE L OFFRE BUSINESS INFORMATION AND ANALYSIS PACKAGE

RÉSUMÉ DE THÈSE. L implantation des systèmes d'information (SI) organisationnels demeure une tâche difficile

Data issues in species monitoring: where are the traps?

Networking Solutions. Worldwide VSAT Maintenance VSAT dans le Monde Entretien. Satellite Communications Les Communications par Satellite

IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21

Dérivation automatique d'ontologie

MapReduce. Malo Jaffré, Pablo Rauzy. 16 avril 2010 ENS. Malo Jaffré, Pablo Rauzy (ENS) MapReduce 16 avril / 15

SparkInData. Place de Marché des applications Spatiales

Université de Technologie Sino-Européenne de l Université de Shanghai

Présentations personnelles. filière IL

Une proposition d extension de GML pour un modèle générique d intégration de données spatio-temporelles hétérogènes

Présentation de la majeure ISN. ESILV - 18 avril 2013

Base de données de capteurs à localisation mobile

France SMS+ MT Premium Description

Big Data et Graphes : Quelques pistes de recherche

BUSINESS INTELLIGENCE

Introduction aux «Services Web»

PRESENTATION. CRM Paris - 19/21 rue Hélène Boucher - ZA Chartres Est - Jardins d'entreprises GELLAINVILLE

Les enjeux du Big Data Innovation et opportunités de l'internet industriel. Datasio 2013

GESTE COMMISSION Petites Annonces 10 Septembre 2014

BIG DATA en Sciences et Industries de l Environnement

Le cadre de conception est présenté sous forme d une matrice 6x6 avec les interrogations en colonne et les éléments de réification en ligne.

Secrétaire générale Fédération Internationale du Vieillissement Secretary general International Federation on Ageing Margaret Gillis Canada

L Internet des objets

Préparer un état de l art

Provide supervision and mentorship, on an ongoing basis, to staff and student interns.

Catalogue des formations Edition 2015

Conserver les Big Data, source de valeur pour demain

Transcription:

Avril 2010 Permanents : Karine Zeitouni, Prof. UVSQ Georges GARDARIN, Prof. émérite UVSQ Benjamin NGUYEN, MdC UVSQ Yann LOYER, MdC UVSQ Laurent YEH, MdC UVSQ Doctorants : Tristan ALLARD, MRES Fatiha Amanzougaren, CDD Bogdan BUTNARU, MRES Qingfeng FAN, CDD Ahmed KHARRAT, Bourse cotutelle Tunisie Isma Saadoun, Contrat doctoral Post-Doc : Iulian SANDU POPA, ATER Anciens Doctorants : Ivan BEDINI, 2009, Orange Recherche Florin DRAGAN, 2008, BO-SAP Clément JAMARD, 2008, BO-SAP Nicolas TRAVERS, 2007, MdC, CNAM Tao WAN, 2007, Sergent Major Tuyet-Tram DANG-NGOC, 2006, MdC, Cergy Lionel SAVARY, 2005, Bull 2 1

Motivations Sources de données hétérogènes et complexes Types de données variés considérés : Spatiale, séquences ou séries temporelles, trajectoires d objets mobiles, documents XML comme modèle d'échange et d'intégration Problématique de l'intégration de données Accès distribué client-serveur web et serveur-serveur Emergence du P2P avec réseaux dynamiques Mapping de schémas, intégration de contenus Emergence des technos du Web sémantique (W3C) Ontologie, Fils d'infos RSS, Web services, OWL, Intégration sur demande nécessitant des performances 3 Problématique de la fouille de données Sujet vaste ciblé sur des données complexes : Fouille de données géolocalisées intégrant les relations spatiales Fouille de trajectoires appliquée à l analyse de la mobilité Fouille de séquences pour découvrir des motifs ou des épisodes Fouille de textes pour les annoter avec la sémantique et permettre l intégration de sources Web. Entrepôts et OLAP pour analyser des données spatiotemporelles 4 2

Bases de données XML : Optimisation XQuery P2P Indexation P2P Intégration sémantique de schémas Construction d ontologies Publication de flux RSS Réseaux sociaux Projets : ACI SemWeb, ANR WebContent, collaboration France Telecom, ANR ROSES 5 Bases de données spatiales/temporelles : Entrepôts de données spatiotemporels Intégration et optimisation de requêtes Serveur de Geo-capteurs mobiles Requêtes multi-critères continues Data Mining Spatial & spatiotemporal data mining Sequence mining Text mining Projets : FP6 HEARTS, CERTU, INRETS/LIVIC, RNTL ContextBourse, ANR PlugDB, ANR FURET, BDSTIC 6 3

ACI SemWeb: Optimisation XQuery P2P Text query (Bloom Filter Distrib.) Structure query Représentation des plans TGV, Xalgèbre Peer #2 Peer #1 MEDIAT OR Application #1 Data Sources MEDIAT OR MEDIAT OR Application #2 Data Sources Peer #3 Application #3 Data Sources 7 Collaboration avec France Telecom (Orange Lab) Besoin d'intégrer plusieurs schémas XML Modélisation sémantique de schémas de source Compléter la sémantique des schémas Unifier, intégrer les schémas Cas du B2B: nombreux standards UBL, ebxml, CXML, OAGIS, STAR, PapiNet, 8 4

Everything is related to everything else, but near things are more related than distance things [Tobler 1979] Observations (e.g. temperature) tend to change smoothly in space Many phenomena are influenced by others (flood near rivers, accident only along roads and often near traffic generators) Spatial DM aims at discovering hidden knowledge that involves objects themselves and/or neighboring objects and their relationship 9 How to efficiently compute spatial relationships? Many type of spatial relationships (topological (9), metric, ) On-line calculation is inefficient (cost of spatial join) Pre-compute them beforehand How to account for spatial relationships? Conventional DM do not consider links between objects Integrate neighborhood properties within each object Then, apply any Data Mining Algorithm 10 5

11 Environment Monitoring and Survey Climate and pollution studies Animal tracking, species migration Population Mobility and Activity Monitoring and Survey Transportation and logistics Navigation Trafic monitoring and analysis RFID based product tracking Location Based Sevices Family finder services Safety, Health, Tourism Mobile social network 12 6

Transport Planning Analysis: Data exploration along space, time, vehicle type, at different granularity levels Source: http://www.sytadin.tm.fr/ 13 Extending Star Schema by: Continuous Dimension as a continuum Time is any Point in a line, a location is a point in a 2D space A Person is rather a normal (discrete) dimension Mobile Fact as a continuous function of time, space and a moving object MO. Time Hour Hour Minute Minute Temporal hierarchy Exact time Other attributes MO_Perso n ID Name Age Mobile FACT Count of MO Networks Network Id Other attributes Segment Segment Id Other attributes Spatial hierarchy Space Exact location 14 7

15 Trajectory clustering: In free space [Han 07] In fixed network (our approach) [Kharrat 08, 09] Real-time clustering: In free space [Jensen 04, 06] In fixed network (our approach) [Meng 07] 16 8

Serveur d objets avec capteurs mobiles Modèle Langage Optimisation Application en transport intelligent Résultats : 2 thèses, Projet DIGITEO, Collaborations LIVIC, NJIT, Chine 17 Butnaru: Evaluation de requêtes XQuery P2P Kharrat : Mining/Résumé d objets mobiles Allard : Privacité de requêtes agrégats dans des serveurs de données personnels (collaboration avec équipe SMIS) Sadoun : Requêtes multi-critères continues (Furet) Amanzougaren : Prise en compte de l incertitude dans les entrepôts spatiaux (coencadrement) Fan : Optimisation de requêtes XQuery sur des flux (RSS, localisation, capteur ) en P2P 18 9

Distributed measurement networks (e.g. GPS) RFID Wireless sensor networks Industrial Monitoring 19 Pairs fixes ou mobiles : Terminaux / Capteurs mobiles geolocalisés, Bornes d infrastructure, véhicules intelligents, avec communication sans fil à courte portée La gestion de données doit s adapter au contexte très dynamique du réseau Requêtes continues flexibles (certaines ressources passent de disponible à indisponible, push vs pull) Stratégies de dissémination des résultats en push (broadcast vs geocast, prise en compte de la durée de vie limitée de l information, de la densité du réseau) Intégration à des informations externes (carte routière, plan de route, profils personnel) 20 10

e-santé (données personnelles + flux d évènements / capteurs) Transport (sécurité, RideShare, services mobiles) Urban sensing (citoyens sondeurs, ex: projet «montre verte» à Paris ou censeable-city à UCLA) Logistique (Transport d oeuvres d arts) BTP (planification/monitoring de chantiers) GEOSS (Global Earth Observation System of Systems) Domotique (sensor web) 21 11