Entrepôt de données complexes pour le trafic routier

Dimension: px
Commencer à balayer dès la page:

Download "Entrepôt de données complexes pour le trafic routier"

Transcription

1 LABORATOIRED ANALYSE ET MODÉLISATIONDE SYSTÈMES POURL AIDE À LA DÉCISION UNITÉ DE ECHERCHEASSOCIÉECNRS UMR 7024 UNIVERSITÉPARIS Entrepôt de données complexes pour le trafic routier AUPHINEPLACE DU M al DE LATTRE DE TASSIGNYF PARISCEDEX 16 TÉLÉPHONE (33 1)(01) TÉLÉCOPIE(33 1)(01) rohe@lamsade.dauphine.frwe B ww.lamsade.dauphine.fr NOTE N 39 mars 2006 O. Carles, G. Jomier, M. Manouvrier, Y. Naïja, G. Scemama (1) (1) CNRS- LAMSADE, Université Paris-Dauphine, Place du Maréchal De Lattre de Tassigny, Paris Cedex 16.

2 Entrepôt de données complexes pour le trafic routier O.Carles *, G.Jomier **, M.Manouvrier **, Y.Naïja **, G.Scemama * * INRETS - Laboratoire GRETIA 2, Avenue du Général Malleret Joinville Arcueil Cedex {carles, scemama}@inrets.fr ** Université Paris Dauphine - Laboratoire LAMSADE Place du Maréchal de Lattre de Tassigny Paris Cedex 16 {naija, manouvrier, jomier}@lamsade.dauphine.fr RÉSUMÉ. Après avoir présenté les données spatio-temporelles utilisées dans le domaine du trafic routier et les fonctionnalités des applications de ce domaine, les auteurs montrent comment le stockage des données dans un entrepôt de données spatiales ouvre de nouvelles perspectives pour l amélioration du trafic. Ils présentent les premiers travaux sur la structuration de l entrepôt. Ce travail est réalisé dans le cadre du projet CADDY de l ACI (Action Concertée Incitative) "Masse de Données". ABSTRACT. This paper firstly presents spatio-temporal data and road traffic application functionalities. Then, the authors show how the storage of these data in a spatial datawarehouse offers new opportunities for these applications. Eventually, the first elements of the spatial datawarehouse design are described. This work takes place in the CADDY project. MOTS-CLÉS : Modélisation du trafic routier, séquences spatio-temporelles, entrepôts de données spatiales KEYWORDS: Road traffic modeling, spatio-temporal series, spatial datawarehouse

3 2 Note de recherche - 02/ Introduction Les exploitants de réseaux de transport ont besoin d outils d observation du trafic pour améliorer le fonctionnement de leur réseau. Les recherches de l INRETS (Institut National de REcherche sur les Transports et leur Sécurité) ont conduit à l élaboration de tels outils [SCE 94, SCE 00, SCE 04]. D une manière générale, ces outils produisent des rapports périodiques, mensuels ou annuels, traduisant des états du trafic. La masse des données relatives au trafic et la diversité de leurs sources sont des obstacles à leur exploitation. Ceci justifie l intérêt pour les entrepôts de données et singulièrement les entrepôts de données spatiales qui couplent les fonctionnalités d un Système d Information Géographique (SIG) à celle d un entrepôt OLAP (On- Line Analytic Processing). Cependant, les travaux sur le domaine émergeant des entrepôts de données spatiales [AHM 04, PAP 01, PAP 02, PRA 04, RIV 01, RAO 03] traitent essentiellement d aspects généraux de ces systèmes indépendamment des applications. Ils abordent en particulier l indexation, l agrégation spatiale et les interfaces utilisateurs. Bien que le domaine du trafic routier pourrait tirer un grand bénéfice de cette approche, à notre connaissance, très peu de travaux [LU 04, SHE 02] ont été menés sur ce domaine. Une des raisons en est peut-être qu ils nécessiteraient une collaboration de chercheurs spécialistes des transports, de la modélisation mathématique, de la fouille de données et des bases de données. Ainsi, les fonctionnalités des entrepôts de données spatiales pourraient être étendues de manière à couvrir les besoins d applications dans des domaines dépassant largement le cadre du trafic routier. Cet article présente une démarche engagée pour mener des travaux dans ce sens dans le cadre du projet CADDY 1 de l ACI "Masse de Données". La section 2 introduit au domaine du trafic routier puis en étudie les données et les applications existantes. La section 3 présente, dans une première partie, les objectifs et les premières démarches suivies pour élaborer un entrepôt de données spatiales destiné au trafic routier. L élaboration d un tel entrepôt nécessite l approximation et la classification de séquences temporelles : les approches utilisables dans cette perspective sont exposées dans la deuxième partie de cette section. 2. Domaine du trafic routier : données et applications Dans une optique de compréhension de l évolution du trafic routier, différents types d information sont nécessaires tels que [SCH 98] : Les valeurs des variables macroscopiques de trafic comme le débit (traffic volume ou flow rates), la vitesse, le taux d occupation (road occupancy), la concentration (ou densité) et le temps de parcours qui sont recueillis à l aide de capteurs déposés sur les axes routiers. 1. Voir présentation des membres du projet page 19.

4 Entrepôt de données - trafic routier 3 La topologie du réseau routier qui décrit la position des capteurs sur le réseau. Les événements affectant le réseau tels que les pannes de feu de circulation, les travaux, les accidents, etc. Les mesures météorologiques et environnementales (neige, verglas, pollution, etc.) Le trafic routier est modélisé selon différentes approches classées selon un niveau de granularité ou niveau de détail lié au nombre de véhicules. Les modélisations sub-microscopiques prennent en compte toutes les composantes des véhicules et leurs interactions avec l environnement. Les modèles microscopiques décrivent le comportement de chaque véhicule et conducteur dans un environnement modélisé avec lequel ils interagissent [CAR 01] ; les techniques multi-agents sont fréquemment utilisées dans ce cadre [ESP 95, NII 01, BAL 05]. L approche mésoscopique décompose le trafic en pelotons de véhicules. Enfin, l approche macroscopique [HEL 95] consiste à modéliser l écoulement de flux de véhicules dans les sections du réseau de déplacement. Dans la suite de l article, nous nous intéressons uniquement aux données macroscopiques et à la topologie du réseau Données temporelles et spatiales du trafic routier Les modèles macroscopiques assimilent l écoulement du trafic routier à un flot continu sur chaque section de route et utilisent les équations de la mécanique des fluides. Le trafic est décrit à l aide de variables macroscopiques temporelles mesurées par des capteurs. La sous-section présente les variables macroscopiques du trafic routier ainsi que les principaux capteurs qui servent à les mesurer. La sous-section décrit les données spatiales du trafic routier, c est-à-dire la modélisation du réseau routier sur lequel sont positionnés les capteurs Données temporelles : les variables macroscopiques du trafic Le réseau routier est structuré en routes et autoroutes. Chaque axe de circulation est décomposé longitudinalement en sections, encore appelées tronçons. La chaussée est elle-même constituée de voies. Les variables macroscopiques permettent de décrire l état du trafic dans l espace et dans le temps. Elles sont définies de la manière suivante : Le débit (q) traduit le nombre de véhicules qui passent en un point x donné sur le réseau pendant un intervalle de temps δt. Il s exprime en véhicules par unité de temps, généralement des heures ou des minutes. La concentration (k) ou densité de trafic traduit la répartition des véhicules le long des axes du réseau. Elle est définie à l instant t sur un tronçon routier donné par le rapport entre le nombre de véhicules présents à cet instant sur ce tronçon et la longueur du tronçon. La concentration s exprime en véhicules par kilomètre.

5 4 Note de recherche - 02/2005. Le taux d occupation (τ) est une variable largement utilisée dans le domaine de la gestion et de la régulation du trafic car il peut être mesuré à faible coût [COH 93]. Il est égal au rapport entre le temps de passage d un véhicule sur le capteur et l intervalle de temps de la mesure. Il est proportionnel à la concentration. Le taux d occupation est une grandeur sans dimension (pourcentage). La vitesse moyenne est définie de deux manières. La vitesse moyenne dans le temps en un point x d un axe de circulation est la moyenne arithmétique des vitesses instantanées des véhicules passant en x pendant un intervalle de temps δt. La vitesse moyenne d espace [WAR 52] est définie sur un tronçon routier à l instant t par la moyenne arithmétique des vitesses des véhicules présents sur le tronçon à cet instant. Les vitesses s expriment en kilomètres par heure. Figure 1. Diagramme fondamental représenté dans le plan (débit, taux d occupation). On observe à l aide de mesures effectuées sur le terrain que les valeurs du débit et du taux d occupation sont relativement dispersées en raison de l évolution dynamique du trafic (cycle d hystérésis 2 ). Cependant, des méthodes statistiques de régression permettent de trouver une fonction polynomiale, logarithmique ou exponentielle dont la courbe (voir figure 1) passe au plus près du nuage des points mesurés (voir figure 2.(a)). Cette courbe, appelée diagramme fondamental, exprime le débit (q) en fonction du taux d occupation (τ). La partie gauche de la courbe jusqu au point critique Cr de coordonnées (Ocr, q max ) traduit un écoulement fluide du trafic. A partir du point critique Cr, le débit diminue ce qui indique une congestion de plus en plus importante. La valeur q max correspond au débit maximal susceptible d être écoulé, c est-à-dire à la capacité de l infrastucture [COH 93] ; au delà de ce seuil, le taux d occupation augmente alors que le débit diminue et la circulation est dite saturée. Il est à noter que pour un débit donné, la circulation peut être fluide ou saturée. Un débit nul peut notamment signifier que le tronçon est vide ou que le taux d occupation a at- 2. Existence de plusieurs chemins entre l état fluide et l état congestionné, et vice versa.

6 Entrepôt de données - trafic routier 5 teint sa valeur limite. Les diagrammes fondamentaux exprimant les relations entre les variables de débit, de vitesse et/ou de concentration sont déductibles du diagramme fondamental entre le débit et le taux d occupation. Figure 2. Variation du débit en fonction du taux d occupation. Pour plus de détails sur les variables macroscopiques du trafic routier et sur leurs relations, le lecteur est invité à consulter [COH 93, LIE 02]. Les capteurs de mesure des variables du trafic routier sont reliés à des détecteurs, eux-mêmes faisant partie d une station de mesure. La station de mesure est équipée d un moyen d acquisition en lien avec les détecteurs, d un moyen de stockage et d un moyen de transmission permettant de restituer les mesures effectuées. Nous nous intéressons ici à l élément externe qu est le capteur et présentons les principaux types utilisés pour mesurer les états du trafic. Les boucles électromagnétiques, encore appelées inductives, représentent le type de capteur le plus souvent utilisé. Chaque boucle électromagnétique est enfouie dans la chaussée sous une voie donnée. La boucle est activée en présence d un véhicule, désactivée dans le cas contraire. Ce type de capteur permet donc de mesurer directement le taux d occupation. Par déduction, on obtient le débit et le temps intervéhiculaire très utilisé pour les applications liées à la sécurité. La concentration est obtenue en divisant le taux d occupation par la longueur moyenne "électrique 3 ". Pour estimer les vitesses ou connaître le sens de passage des véhicules, il faut installer deux boucles successives (boucle double) sous la voie. Les capteurs pneumatiques sont constitués d un câble de caoutchouc relié à un manomètre. Le câble est tendu en travers de la voie ou de la chaussée sur laquelle on veut effectuer la mesure. L augmentation de pression due au passage de chaque essieu est détectée par le manomètre et il est ainsi possible de compter les véhicules. En considérant deux essieux par véhicule, on obtient le nombre de véhicules pour une 3. Somme de la longueur de la boucle le long de la voie et de la longueur moyenne des véhicules.

7 6 Note de recherche - 02/2005. période donnée et donc finalement le débit. Ces capteurs sont plus fragiles que les boucles électromagnétiques. Il est à noter que l installation de deux capteurs pneumatiques distants de 1 à 2 mètres permet également de mesurer les vitesses. Les caméras vidéo couplées à un système de traitement d images peuvent également être utilisées. Elles permettent d obtenir des informations complémentaires comme la longueur des files d attente par exemple. Il s agit d un capteur spatial, à la différence des boucles éléctromagnétiques et des capteurs pneumatiques. D autres types de capteurs existent tels que les détecteurs à ultrasons, les capteurs à micro-ondes ou radars à effet Doppler à faisceaux directifs, les magnétomètres et les capteurs optiques (photodiode, phototransistor ou barrière laser). Pour plus d information sur les types de capteurs, le lecteur peut se reporter à [Cer01]. En raison des coûts liés à l installation et à la maintenance des capteurs, ceux-ci n assurent qu une couverture partielle du territoire. Sur le réseau routier national, les capteurs sont utilisés par l Etat pour effectuer la surveillance permanente et établir des statistiques (connaître le volume de trafic sur certains tronçons de routes nationales). En moyenne, on compte une boucle éléctromagnétique tous les 40 kilomètres. Sur les autoroutes concédées 4, des boucles sont placées à des fins d exploitation un peu en amont et en aval des échangeurs soit environ tous les 20 kilomètres en moyenne. En milieu urbain, les capteurs sont situés essentiellement sur les grands axes et aux abords des intersections, notamment pour permettre la régulation du trafic. Sur le périphérique parisien, en chaussée intérieure et extérieure, on trouve une boucle simple tous les 500 mètres et une boucle double tous les 2500 mètres. Au total, en Ile-de- France, en milieux urbain et périurbain confondus, on trouve environ 5000 boucles électromagnétiques dont 4000 sur le réseau du Système d Information pour un Réseau Intelligible aux USagers (SIRIUS) du Service Interdépartemental de la Sécurité et de l Exploitation de la Route (SISER). Le système SYTADIN R [Syt] repose en particulier sur SIRIUS. Outre le nombre de capteurs mis en place, leur positionnement peut avoir une influence importante sur la mesure des variables du trafic. Aux abords des carrefours notamment, la position des capteurs est très liée au système de régulation mis en place. Enfin, les capteurs ne sont pas fiables à 100%. Par exemple, en 1990, l imprécision sur les mesures issues des capteurs pneumatiques pouvait dépasser 20% en période de saturation [COH 93]. Pour les boucles électromagnétiques, l erreur sur les mesures de débit est généralement comprise entre 3% et 5%. Cependant, l erreur peut atteindre 20% dans certains cas particuliers. De plus, le taux de panne des boucles électromagnétiques est de l ordre de 10% à 20% en moyenne et quand les exploitants n assurent pas une maintenance régulière, elle peut atteindre 50% (source [Cer01]). 4. La concession est le système permettant à l Etat de confier pour un temps donné à une société d autoroutes la construction et l entretien d une autoroute. La société rembourse ses créances de construction grâce au péage acquitté par chaque utilisateur.

8 Entrepôt de données - trafic routier 7 Les variables macroscopiques représentent des données temporelles agrégées selon les besoins du terrain de quelques secondes à quelques minutes voire heures. Ces données temporelles sont associées à des informations spatiales sur le réseau routier (données topologiques décrivant les routes du réseau routier). La sous-section suivante décrit comment le réseau routier est modélisé Données spatiales : modélisation du réseau routier La modélisation d un réseau routier consiste à construire une abstraction des éléments de l infrastructure et de l environnement. Il s agit donc de modéliser les éléments comme les routes, leurs intersections, la signalisation horizontale et verticale, le terrain, les conditions météorologiques, etc. Il existe différents types de modélisations [CAR 01] : graphes des routes et de leurs intersections, modèles analytiques ou géométriques filaires représentant les axes de circulation, modèles géométriques en deux ou trois dimensions, modélisation symbolique, modèles de SIG (Systèmes d Information Géographique), etc. Cette sous-section présente uniquement l utilisation des graphes et des SIG. A titre d exemple, nous décrivons comment le système CLAIRE [SCE 94, SCE 00, SCE 04] modélise les données spatiales. Dans ce système, les données spatiales issues du trafic correspondent à la description des positions des capteurs sur le réseau routier. Ces données sont dites statiques puisque la position des capteurs est rarement mise à jour ; exceptionnellement des mises à jour se font lors de travaux ou lors d ajout de nouveaux axes routiers ou de nouveaux capteurs sur des axes existants. Le réseau routier est modélisé par un graphe orienté où chaque arc représente une voie de la chaussée sur un tronçon de route. Un axe routier représente un chemin dans le graphe. Chaque capteur est placé sur un arc donné. La figure 3 montre un exemple de cette modélisation. Certains arcs peuvent être dépourvus de capteur, la répartition des capteurs sur le réseau étant faite selon les besoins du système. Un axe peut donc être décrit soit par une suite d arcs, dans le cas où l on s intéresse à la description spatiale, soit par une suite de capteurs lorsqu on s intéresse aux mesures de trafic obtenues par les capteurs placés sur cet axe. Une représentation similaire est utilisée dans le système prototype SITTI 5 [DEM 00]. La modélisation est difficilement indépendante des applications. Comme indiqué dans [CAR 03], un graphe peut apparaître avec différents niveaux de granularité. Par exemple, les nœuds du graphe peuvent représenter les villes, et les arcs les axes routiers ; à un niveau de granularité plus fin, les arcs peuvent représenter des voies sur des tronçons de route, et les nœuds les extrémités des tronçons. En étiquetant les sommets et les arcs du graphe - on parle alors de graphe valué - on peut répondre d une manière simple aux besoins des algorithmes de recherche de chemin, de visualisation des états des axes des réseaux (ce que permettent par exemple les systèmes SYTADIN [Syt] et CLAIRE) ou encore de simulations de trafic. Cette modélisation se trouve au 5. Serveur d Information du Trafic sur Toulouse par Internet - prototype développé par le laboratoire LAAS en collaboration avec la société SODIT.

9 8 Note de recherche - 02/2005. A 1 A 5 A 4 A2 A 3 A 6 A 9 A 8 A 7 A 10 A 11 Légende A i Noeud Nom de l arc Orientation de l arc Capteur Figure 3. Représentation du réseau routier par un graphe orienté. coeur des applications du domaine des transports et de leur intégration, sujet sur lequel l INRETS mène des travaux de recherche et développement [CAR 02]. Les Systèmes d Information Géographique (SIG) manipulent des données ayant un caractère spatial, c est-à-dire des données représentant des phénomènes survenus sur, au-dessus ou au-dessous de la surface terrestre [SCH 01]. L extension de ces systèmes au domaine des transports a donné naissance à l acronyme GIS-T pour Geographic Information System for Transportation [THI 00]. La topologie est représentée dans les SIG selon différents modèles appelés modèles spaghetti, réseau ou topologique (le lecteur est invité à consulter [RIG 02] pour une description détaillée de ces modèles). Lorsque le réseau routier est modélisé sous la forme d un graphe, comme nous l avons précisé précédemment, le modèle topologique sous-jacent dans un SIG est le modèle dit réseau (network model). Les données spatiales sont représentées dans ce cas en mode vectoriel (ou mode vecteur) [SCH 01]. Le modèle réseau est le plus utilisé dans le domaine du transport [THI 00]. En plus de la description spatiale des données, ce modèle permet d ajouter d autres attributs aux données. Dans le prototype SITTI, des attributs tels que les identificateurs, les longueurs et le sens des voies sont stockés dans la base géographique pour caractériser les tronçons de route. En outre, ce système utilise le mode dit raster (ou tessellation - représentation sous la forme d une grille de cellules) pour les données relatives au fond de carte. Les SIG sont utilisés dans le domaine des transports pour leur capacité à gérer les données spatiales, à les interroger et à les visualiser. Ils sont généralement couplés à des systèmes d information de transport (TIS - Transportation Information System) [THI 00], les SIG n offrant pas toujours toutes les fonctionnalités nécessaires au domaine du transport [RAL 00]. Dans [MIL 01], par exemple, les auteurs couplent un SIG avec leur outil de gestion de trafic, afin de pouvoir visualiser les congestions et aider les utilisateurs

10 Entrepôt de données - trafic routier 9 à déterminer leur itinéraire. Le système CLAIRE utilise également un SIG dans ses implémentations actuelles. Le lecteur est invité à consulter [GOO 00, THI 00] pour plus de détails sur l association des SIG au domaine du transport Fonctionnalités des applications du domaine du trafic routier On distingue trois fonctionnalités dans les applications du domaine du trafic routier [BIE 91] : le recueil des données, l analyse et l interprétation de ces données, et la décision et le contrôle qui en résultent. Ces trois fonctionnalités sont présentées ci-dessous en illustrant plus particulièrement les deux dernières au travers de l application CLAIRE Recueil des données Comme évoqué précédemment, la couverture en terme de capteurs est rarement totale sur le réseau et les mesures peuvent comporter des erreurs ou être indisponibles dans le cas de panne de capteur. Le recueil des données brutes fournit par conséquent une vision des états des axes de circulation du réseau global partielle et empreinte d erreurs. C est la raison pour laquelle des méthodes de qualification (=identification) des données aberrantes et de reconstitution des données manquantes sont développées. La qualification des données aberrantes comprend la détection des pannes franches, facilement détectables par des tests de plausibilité simples ainsi que des méthodes plus élaborées. Une première méthode consiste à se référer au diagramme fondamental et à autoriser une marge d erreur sur le débit pour un taux d occupation mesuré. Hors de la plage d erreur, les mesures sont considérées invalides. Une deuxième méthode proposée dans [HAJ 97] consiste à calculer deux courbes définissant une enveloppe autour de la courbe du diagramme fondamental (voir figure 2.(b)). Toute mesure située hors de l enveloppe est déclarée invalide. Le diagramme fondamental peut parfois être utilisé pour remplacer les données aberrantes. La reconstitution des données manquantes peut se faire selon différentes approches. L approche automatique utilise le filtre de Kalman [KAL 60]. L approche statistique est basée sur la notion de dépendance entre les capteurs proches dans l espace. Cette méthode calcule le coefficient de corrélation linéaire de Bravais-Pearson [HAJ 97]. Les mesures non fournies par un capteur en panne sont estimées à l aide des mesures fournies par les capteurs voisins. Notons que les capteurs dits voisins sont sélectionnés grâce à un découpage spatial qui évite de calculer le coefficient de corrélation linéaire avec des capteurs éloignés. La dimension temporelle est utilisée pour la recherche du capteur remplaçant. [HAJ 00] propose un autre algorithme de reconstitution basé sur la résolution des équations mathématiques d un modèle d écoulement macroscopique et dynamique du trafic. La résolution est accomplie en utilisant une discrétisation spatiotemporelle.

11 10 Note de recherche - 02/2005. La fonction de recueil des données peut aussi avoir une fonction de génération de données dérivées des données mesurées. Il s agit par exemple de données concernant la demande de déplacement : répartition du flux à une intersection, répartition entre différentes origines et destinations Analyse et interprétation des données La fonction d interprétation et d analyse des données détermine les états du trafic dans le réseau et permet leur suivi (monitoring). Cette fonction nécessite la conservation de données recueillies. Elle permet de construire une interprétation compréhensible de l état du réseau ou de certains de ses éléments par l utilisation d états symboliques. Ainsi, l état symbolique d un axe de circulation peut être exprimé par "fluide" ou "saturé". Le logiciel CLAIRE [SCE 94, SCE 00, SCE 04] permet de suivre l évolution d un nombre quelconque d indicateurs concernant un réseau donné. CLAIRE définit un réseau à partir d ensembles d entités de même nature : des graphes, des nœuds, des arcs, des véhicules, des personnels navigants ou des passagers. Un ensemble d indicateurs est attaché à chaque entité. Par exemple, les indicateurs débit, taux d occupation et vitesse peuvent être attachés à une entité arc. Un indicateur peut être associé à trois variables contenant respectivement la valeur théorique, la valeur réelle et la valeur prévue de l indicateur. Chacune de ces variables est issue d une mesure en temps réel ou est calculée à partir d autres variables de l indicateur ou encore d autres indicateurs. Chaque indicateur est également associé à une quatrième variable dite supervisée pouvant prendre des états symboliques prédéfinis. Cette valeur peut être fonction de l écart calculé entre la valeur réelle et la valeur théorique ou bien être fonction d un seuil de tolérance. Les variables supervisées permettent de déterminer les congestions Décision et contrôle La fonctionnalité de décision et de contrôle propose à l opérateur des actions de contrôle et peut dans certains cas lancer l exécution de la commande associée. Un système expert d aide à la décision peut implémenter ce niveau fonctionnel. Le système CLAIRE agit en temps réel et en temps différé. En temps réel, le but des actions de contrôle est d adapter le service de transport public. Les actions concernent d une part les nœuds du réseau, comme la synchronisation des feux de circulation, et d autre part les conducteurs ou les véhicules, comme la mise en service d un autobus ou le remplacement d un agent. Pour chaque événement de perturbation, l opérateur ou le système CLAIRE peut décider d une action de commande. En temps différé, CLAIRE aide les opérateurs à déterminer les causes de congestion et les actions à mener. Des points noirs sont identifiés en utilisant une méthode de classification de perturbations et d événements. L observatoire se fonde sur le raisonnement à base de cas pour classifier et identifier les perturbations ou les événements

12 Entrepôt de données - trafic routier 11 récurrents. Il permet de résumer une période d exploitation selon les besoins des planificateurs, des contrôleurs, des décideurs, des opérateurs et des autorités organisatrices. A l heure actuelle, les données utilisées par le système CLAIRE sont structurées et stockées dans des fichiers ou des bases de données adaptés aux fonctionnalités indiquées précédemment. La suite de cet article montre que le stockage des données dans un entrepôt ouvre de nouvelles perspectives Entrepôts de données pour le trafic routier Immon [INM 92] définit un entrepôt de données (datawarehouse) comme une collection de données organisées par sujet, temporelles et persistantes. Cette collection est destinée à être utilisée dans le processus d aide à la décision. Les utilisateurs interrogent les données à des fins d analyse en se basant sur des données historisées, agrégées ou résumées [DOU 01]. Ces données peuvent provenir de différentes sources et sont regroupées dans une base unique conçue pour des analystes et des décideurs. La visualisation des données des entrepôts se fait généralement via un cube multidimensionnel. Un tel cube est défini par un ensemble de cellules qui contiennent des mesures, comme le débit, dépendant de dimensions, comme l emplacement du capteur, la date et l instant de saisie de la donnée. Par agrégation, on peut construire d autres cubes. Par exemple, en agrégeant sur la dimension date et sur la dimension horaire, on peut obtenir un cube faisant apparaître pour chaque capteur le débit moyen par heure pour les lundis de 2004 entre 12h et 14h. Cet exemple introduit aux entrepôts de données spatiales. Ce domaine de recherche très récent a donné lieu à des approches de visualisation des résultats des requêtes [RIV 01], d indexation [RAO 03, PAP 02] et d agrégation spatiale [PAP 01, PRA 04]. A notre connaissance, l utilisation d entrepôts de données spatiales pour le trafic routier n a été faite que dans [LU 04, SHE 02] où un entrepôt de données est établi à des fins de stockage et de visualisation. Les mécanismes de visualisation se basent sur l utilisation de couleurs permettant de différencier les cas de congestion de trafic des cas de fluidité. La variation de la couleur est fonction de l état du trafic, ce qui facilite la compréhension des données du trafic par l utilisateur. La visualisation relève de la fonction de suivi du trafic routier. Cependant, elle ne concerne pas les fonctionnalités de décision et de contrôle. La section suivante présente comment un entrepôt de données spatiales pourrait prendre en compte ces fonctionnalités. 3. Vers un entrepôt de données complexes pour le trafic routier Cette section présente les objectifs et la démarche suivie dans le cadre du projet CADDY pour le domaine du trafic routier et dresse un état de l art des approches propres à la problématique du projet.

13 12 Note de recherche - 02/ Le projet CADDY Le projet Contrôle de l Acquisition de Données temporelles massives, stockage et modèles DYnamiques 6, CADDY, a démarré en juillet Ce projet multidisciplinaire fait intervenir des aspects de modélisation mathématiques, de statistiques, d analyse de données et de bases de données. Il a pour axe de recherche principal l étude de méthodes d acquisition, de représentation et de recherche des séquences temporelles (time series) interdépendantes. Notre objectif est de proposer une méthodologie générale permettant d améliorer le fonctionnement des systèmes complexes manipulant ce type de données. Nous avons mené nos travaux dans le cadre des systèmes de trafic routier en collaboration avec l INRETS. Ceci a motivé notre intérêt pour un entrepôt de données spatiales Objectifs Les mesures des variables macroscopiques du trafic associées à une représentation du réseau routier sont couramment utilisées par les applications du domaine du trafic routier. L utilisation des bases de données classiques offre des facilités de stockage et permet d interroger les données brutes et de répondre à des requêtes du type "Quelles sont les valeurs de débit d un capteur c à une date d pour toutes les heures?", Quel est le taux d occupation moyen d un capteur c à une date d entre l heure h et l heure h + i?" ou "Quels sont les capteurs ayant eu, à une date d, un débit moyen inférieur à m entre 16h et 18h". Les mécanismes d agrégation, comme des calculs de moyenne ou de taux, proposés dans les entrepôts de données OLAP (On-Line Analytic Processing) sont bien adaptés à des applications classiques de gestion, basées sur l exploitation de l historique des données. Ils permettent, grâce au stockage de données agrégées, de répondre rapidement à des requêtes de la forme "Pour chaque capteur, quel est le débit moyen pour les lundis de 2004 entre 12h et 14h?". Lorsque des états symboliques sont calculés à partir des données brutes et de seuils fixés par les experts du domaine du trafic routier, l entrepôt peut stocker ces états symboliques et permettre ainsi de répondre à des requêtes telles que "Quels sont les états symboliques (ex. fluide ou saturé) du trafic sur un ensemble de capteurs pour les jeudis du premier semestre 2004 entre les heures 17h et 20h?". Dans le projet CADDY, nous proposons d étendre les mécanismes des entrepôts de données en utilisant des techniques de résumé plus fines à partir desquelles il est possible d extraire de l information et de l interroger à différents niveaux hiérarchiques. Dans CADDY, les données sont regroupées sur des critères temporels (ex. sur les jours ouvrés), spatiaux (ex. en agrégeant les arcs modélisant la rue de Rivoli) ou spatiotemporels. Un résumé, est associé à chaque regroupement. Il correspond à une représentation simplifiée mais fidèle de l information d origine (par exemple une courbe de débit type). Les résumés sont calculés à partir des courbes de débit et taux d occupation ou des états symboliques associés et sont organisés en hiérarchie. 6. Voir présentation des membres du projet page 19.

14 Entrepôt de données - trafic routier 13 A partir des données d origine et des résumés, CADDY doit permettre de répondre non seulement à des requêtes de bas niveau, mais aussi et surtout à des requêtes plus complexes utilisant l information des résumés. Ces requêtes complexes peuvent être par exemple "Etant donné un événement (ex. match de rugby) devant avoir lieu à un endroit e (ex. le stade Charletty à Paris), à une date d et une heure h quel est l état prévu du trafic dans la zone z aux heures h i ou h + j?", "L état actuel (en temps réel) du trafic dans une zone z est-il habituel?", "La rue de Rivoli est-elle bouchée le dimanche entre 14h et 16h?", "La situation observée sur le trafic correspond t elle à des situations analogues du passé?" ou "Y a t il des simultanéités de congestion sur des zones non connexes?". Alors que les requêtes de bas niveau consistent à identifier des états de trafic ou à prédire de futurs états en réalisant des statistiques sur ces états identifiés, les autres types de requêtes nécessitent, quant à eux, l extraction de connaissances à partir des données stockées dans l entrepôt. Les données de base de l entrepôt, que nous présentons dans la sous-section 3.1.2, doivent être organisées de telle sorte qu elles puissent permettre de répondre à tous les types de requêtes cités précédemment. La sous-section présente la démarche suivie Données Figure 4. Exemples de séquences journalières de débit et de taux d occupation. Les données mises à notre disposition sont extraites de celles utilisées dans le système CLAIRE : le graphe routier décrivant la répartition des capteurs sur le réseau routier d une ville française et, pour chaque capteur, les mesures des variables macroscopiques de débit et de taux d occupation. Les mesures de débit et de taux d occupation constituent des séquences temporelles (time series). La figure 4 en présente un exemple pour chacune des deux variables. Les valeurs de ces séquences sont enregistrées toutes les 3 minutes par plus que 400 capteurs. Elles forment un ensemble d environ valeurs élémentaires par jour (480 valeurs de débit et 480 valeurs de taux d occupation par capteur). En outre, ces variables sont interdépendantes puisqu elles sont reliées par un diagramme

15 14 Note de recherche - 02/2005. fondamental (voir section figure 1). Elles correspondent donc complètement aux types de données de la problématique du projet CADDY. Une main courante d annotations est disponible en complément des mesures précédentes. Elle reflète des événements, positionnés dans l espace et dans le temps, ayant pu affecter le trafic : incidents sur la voie publique, pannes de feux de signalisation, chute de neige, etc. D autres séquences temporelles pertinentes pourraient être ultérieurement ajoutées dans l entrepôt, par exemple des données propres au transport public ou des données météorologiques Démarche Figure 5. Exemple de résumés de séquences temporelles de débit. Pour répondre aux objectifs à partir des données dont on dispose, les séquences journalières de débit et de taux d occupation, associées au graphe routier, doivent être représentées de telle sorte qu elles puissent être stockées, manipulées et interrogées au sein d un entrepôt de données. Il y a en effet un niveau d abstraction important entre les objectifs à atteindre et les données dont on dispose. Les séquences temporelles contiennent chacune 480 valeurs. Stockées telles quelles dans une base de données, elles offrent un potentiel faible d interrogation. De plus, le temps d exécution des requête sur de telles séquences est proportionnel à leur taille. Une première étape pour la constitution d un entrepôts de données spatio-temporelles consiste donc à les résumer.

16 Entrepôt de données - trafic routier 15 Une séquence peut être résumée numériquement ou représentée de manière symbolique. Le choix du type de résumé est fortement lié au type de requête auquel le système doit pouvoir répondre. La figure 5.(b) présente un exemple de résumés numériques de séquences journalières de débit : les séquence résumées ne contiennent qu une trentaine de valeurs par rapport aux 480 valeurs des séquences mesurées. Les mêmes séquences sont représentées par des descripteurs symboliques sur la figure 5.(c). Les descripteurs smboliques peuvent faciliter l expression des requêtes utilisateur. L évolution des valeurs des séquences temporelles issues du trafic routier est fortement corrélée avec l activité humaine. Par exemple, sur les séquences temporelles de la figure 4 concernant le débit et le taux d occupation d un jour de semaine ordinaire, on peut remarquer que le débit augmente pendant les heures de pointe (entre 8h et 10h et entre 17h et 20h) et que, de manière corrélée, les pics du taux d occupation sont visibles pendant ces mêmes tranches horaires. Pendant les heures de pointe, la présence d une congestion sur certains axes routiers représente donc une situation habituelle pouvant être considérée comme typique. En revanche, pendant les heures où le trafic devrait être fluide, la détection d une congestion permet d alerter le système sur la présence d une situation "atypique". Ceci amène à la définition de classes de séquences représentant des profils types de circulation. Dans le contexte du trafic routier, le fait que les séquences sont issues de capteurs placés sur des axes routiers ajoute un caractère spatial à leur caractére temporel. Ces séquences peuvent donc être regroupées en classes sur des critères temporels et/ou des critères spatiaux. Par exemple, le fait que les séquences des lundis se ressemblent entre elles mais diffèrent des séquences du dimanche, qui elles-mêmes se ressemblent entre elles, peut amener à créer deux classes, une pour les lundis et une pour les dimanches. De même, le fait que les séquences temporelles générées, à une heure donnée et à une date donnée, par des capteurs successifs sur un axe se ressemblent peut amener à regrouper ces séquences dans une même classe. Nous nous sommes focalisés dans un premier temps sur la classification des séquences, en ne considérant que leur caractère temporel. Le but est d étudier comment se répartissent les séquences et de voir si des classes créées sur le critère temporel permettent de déduire des informations sur le critère spatial. L objectif à terme du projet CADDY est de proposer aux utilisateurs un outil d aide à la décision permettant d analyser les données à un niveau spatio-temporel : partir du comportement temporel au niveau capteur (séquence temporelle brute ou résumée d un capteur) pour arriver à un comportement global d un système de trafic (séquences spatio-temporelles brutes ou résumées). La sous-section suivante présente plusieurs approches d approximations des séquences temporelles et de classification qui pourraient être utilisées dans le projet CADDY.

17 16 Note de recherche - 02/ Etat de l art des approches d approximation et de classification de séquences temporelles Approximation numérique Les méthodes numériques d approximation de séquences temporelles permettent de représenter une séquence de n valeurs par un vecteur de k valeurs (k n). Il existe plusieurs méthodes d approximation de séquences temporelles [AGR 93, CHA 99, CHA 02, FAL 04, FAL 94, HOT 33, KEO 01, KEO 00, KEO 98, KEO 99, PEA 01, RAF 99, WU 00, YI 00, HOT 33]. Ces méthodes peuvent être divisées en deux catégories selon le type de traitement effectué : (1) les fonctions qui représentent les séquences par des segments, et (2) les méthodes de transformation qui modifient l espace initial de définition des séquences. Dans la première catégorie, les méthodes PAA (Piecewise Aggregate Approximation) [KEO 00, YI 00], APCA (Adaptive Piecewise Constant Approximation) [CHA 02] utilisent des fonctions d ordre 0, constantes par morceaux. La méthode PLA (Piecewise Linear Approximation) [KEO 98, KEO 99, KEO 01] utilise, quant à elle, des fonctions d ordre 1. On peut bien sûr passer à des ordres supérieurs en utilisant des fonctions de Béziers ou splines [BAR 03]. La méthode PAA consiste à représenter une séquence temporelle de n valeurs par une fonction en escalier de k segments de même longueur, k étant fixé au départ. La valeur de la fonction pour chaque segment est la moyenne des n/k valeurs successives de la séquence d origine correspondant au segment. La méthode APCA est une extension de la méthode PAA où les segments peuvent ne pas avoir la même longueur. La méthode PLA utilise, quant à elle, des fonctions affines pour chaque segment. Dans ces deux méthodes, les longueurs de segment pouvant être différentes, le problème consiste à déterminer le point de coupure entre chaque paire de segments. Différents algorithmes ont été proposés pour répondre à ce problème. Dans [HUG 03, KEO 01], ils sont répartis en quatre catégories allant de la plus rapide à celle qui permet de trouver la solution optimale. L algorithme agrégatif construit les segments d approximation de chaque séquence en considérant les valeurs de la séquence dans l ordre de leur saisie. L algorithme descendant et l algorithme ascendant sont récursifs. Le premier part de la séquence pour déterminer les segments d approximation : à chaque étape, la segmentation de la séquence est calculée en divisant en deux l un des segments obtenu à l étape précédente. Au départ du deuxième algorithme, les segments d approximation sont construits à partir des paires de valeurs successives de la séquence puis, à chaque étape, l algorithme fusionne deux segments obtenus à l étape précédente. L algorithme optimal permet d obtenir une représentation de la séquence en k segments en recherchant l optimum global. Cet algorithme se base sur le fait qu une segmentation optimale en p segments (p k) est construite à partir d un premier segment et du résultat d une segmentation optimale en p 1 segments. La condition d arrêt de ces algorithmes est fixée par un nombre de segments ou un seuil d erreur.

18 Entrepôt de données - trafic routier 17 Les méthodes de transformation permettent de décomposer les séquences temporelles dans un espace de fonctions connues a priori, comme pour la Transformée de Fourier Discrète (DF Discrete Fourier Transform) et la Transformée en Ondelettes Discrètes (DWT Discrete Wavelet Transform) ou dans un espace de fonctions adaptatives comme pour la méthode d Analyse en Composantes Principales (ACP). La Transformée de Fourier Discrète, utilisée dans [AGR 93, FAL 94, RAF 99], permet de décomposer une séquence temporelle de n valeurs en une suite de fonctions sinusoïdales. La séquences est représentée dans un espace de fréquences. Les amplitudes associées à ces fonctions, appelées coefficients de Fourier, sont utilisées pour décrire la séquence temporelle. Seuls k coefficients sont conservés, k étant inférieur à n, soit les premiers, soit de préférence ceux qui correspondent aux fréquences les plus représentatives. Contrairement à la DF T, la Transformée en Ondelettes Discrète permet une représentation multirésolution d une séquence temporelle dans un espace temps/fréquence. Les séquences ne sont plus décomposées en fonctions sinusoïdales mais en ondelettes. Chaque ondelette décrit la variation de la séquence en terme de fréquence, sur un intervalle de temps limité, d où la transformation dans l espace temps/fréquence. Il existe plusieurs bases d ondelettes. Dans [CHA 99], les ondelettes de HARR sont utilisées. Etant donnée une séquence de n valeurs, le principe de cette méthode consiste à de calculer à chaque niveau de résolution (1) les moyennes des paires de valeurs successives du niveau précédent et (2) les différences entre chaque valeur et la moyenne associée. Les n coefficients d ondelettes correspondent à la moyenne de toutes les valeurs de la séquence obtenue au dernier niveau et à l ensemble des différences de chaque niveau de résolution. En choisissant le niveau de résolution, une séquence à n valeurs est seulement représentée par k coefficients parmi les n coefficients représentant la séquence. L analyse en composantes principales [PEA 01, HOT 33] est une méthode d analyse de données multidimensionnelles permettant de représenter un nuage de m points à n dimensions dans un espace à k dimensions par projection des données sur k axes bien choisis. Ces k axes maximisent l inertie du nuage projeté, c est-à-dire la moyenne pondérée des carrés des distances entre les points projetés et leur centre de gravité. L ACP permet ainsi de représenter chaque point multidimensionnel par k coordonnées appelées composantes principales. Ces composantes sont classées selon leur pouvoir explicatif (maximisation de la variance). Généralement, seules les deux ou trois premières composantes principales sont utilisées afin de permettre une représentation lisible des points à projeter Représentation symbolique La représentation symbolique permet de décrire une séquence temporelle par un ensemble de symboles discrets. La plupart des approches, dont [PAR 00], utilise la méthode de discrétisation Equal-length categorisation pour représenter symboliquement les séquences. Cette méthode consiste à diviser les domaines de valeurs de la sé-

19 18 Note de recherche - 02/2005. quence en intervalles de même longueur et à associer un symbole à chaque intervalle. Ainsi, chaque valeur de la séquence est associée au symbole de l intervalle auquel elle appartient. Cette méthode a été étendue en prenant des intervalles ayant des longueurs différentes et en associant un symbole, non plus à chaque valeur de la séquence, mais à la différence de deux valeurs successives [AND 97]. D autres approches associent quant à elles des symboles aux segments d approximation de la séquence obtenus par la méthode PAA [LIN 03] ou par la méthode APCA [HUG 03] Classification automatique Les méthodes de classification automatique permettent de partitionner un ensemble de vecteurs multidimensionnels en se basant sur un critère de proximité [HAL 01, JAI 99]. Ces méthodes, lorsqu elles sont appliquées aux séquences temporelles, se répartissent en trois catégories. Les méthodes basées sur le partitionnement telles que K-means [DID 71, MCQ 67], PAM [KAU 90], CLARA [KAU 90] et CLARANS [NG 94] permettent d obtenir k groupes de vecteurs, k étant généralement fixé par l utilisateur. Les méthodes hiérarchiques permettent de construire différents niveaux de partitions (de 1 à n-1 niveaux) en partant de n vecteurs en entrée. Parmi ces méthodes, on peut citer les méthodes hiérarchiques par agrégation et par division [KAU 90], BIRCH [ZHA 96] et CURE [GUH 98]. Les méthodes basées sur la densité produisent des groupes de vecteurs dont la densité est suffisamment importante. L importance de la densité se mesure à l aide de seuils à fixer par l utilisateur. DBSCAN [EST 96] est un exemple de ce type de méthodes. Plusieurs solutions ont été proposées pour représenter les groupes ou partitions [JAI 99] : Un centre : un groupe peut être représenté par le centre de gravité des vecteurs du groupe. Le centre est donc un vecteur qui n appartient pas nécessairement au groupe. La méthode K-means [DID 71, MCQ 67] utilise ce type de représentant. Un médoïde : le médoïde d un groupe appartient obligatoirement à ce groupe et correspond au vecteur qui minimise les distances entre lui et les autres vecteurs du groupe. Les méthodes PAM [KAU 90], CLARA [KAU 90] et CLARANS [NG 94] utilisent un médoïde. Un ensemble de vecteurs : ces vecteurs délimitent la frontière du groupe. Le nombre de vecteurs dépend d un seuil de contrôle. La méthode CURE [GUH 98] est basée sur ce principe. Les groupes obtenus par les méthodes de classification automatique peuvent être étiquetés par des noms de classes et utilisés pour faire une classification supervisée. 4. Etat d avancement et conclusion Jusqu à présent, nous avons étendu l algorithme agrégatif appliqué à la méthode d approximation PLA pour obtenir une représentation numérique synthétique des séquences temporelles. Nous travaillons à l application des mécanismes de représen-

20 Entrepôt de données - trafic routier 19 tation symbolique de [HUG 03] et testons une nouvelle méthode d approximation spatio-temporelle. En terme de classification, nous avons appliqué l approche K-means afin d obtenir une première analyse des données. Le résultat de cette analyse nous a permis de définir des classes de comportement temporel par capteur. Cette analyse doit être étendue à la dimension spatiale. L extension des méthodes d approximation et de classification que nous envisageons ainsi que le résultat de leur application sur les données du trafic routier feront l objet d un autre article. Au delà de ces premières réalisations, le but du projet est clair mais de nombreux aspects restent à aborder avant la construction d un prototype intégrant l ensemble des propositions nouvelles. Remerciements Les auteurs tiennent à remercier Simon Cohen, Habib Haj-Salem, Mehdi Danech- Pajouh de l INRETS-GRETIA et Bernard Hugueney du LAMSADE pour leur participation à la documentation et à la relecture de l article ainsi que tous les membres du projet CADDY. Cadre de rédaction de l article : le projet Contrôle de l Acquisition de Données temporelles massives, stockage et modèles DYnamiques, CADDY, est financé dans le cadre de l ACI (Action Concertée Incitative) "Masse de données" Il est coordonné par Florian De Vuyst de l Ecole Centrale Paris (Laboratoire MAS) et réunit Georges Hébrail de l ENS Télécom-Paris, Geneviève Jomier, Bernard Hugueney, Maude Manouvrier, Yosr Naïja et Laurent Steffan de l Université Paris-Dauphine (LAM- SADE). CADDY s appuie sur une collaboration avec Gérard Scemama et Olivier Carles de l INRETS qui ont suggéré l étude du trafic routier. 5. Bibliographie [AGR 93] AGRAWAL R., FALOUTSOS C., SWAMI A., «Efficient Similarity Search in Sequence Databases», Int. Conf. on Foundations of Data Organization and Algorithms, Chicago, Illinois, USA, Oct. 1993, p [AHM 04] AHMED T., MIQUEL M., LAURINI R., «Continuous data warehouse : concepts, challenges and potentials», Proc. of the 12th International Conference on Geoinformatics, 2004, p [AND 97] ANDRÉ-JÖNSSON H., BADAL D.-Z., «Using Signature Files for Querying Time- Series Data», Proc. of the 1st European Symposium on Principles of Data Mining and Knowledge Discovery, Springer-Verlag, 1997, p [BAL 05] BALBO F., PINSON S., «Dynamic modeling of a disturbance in a multi-agent system for traffic regulation», Decision Support Systems, vol. à paraître, [BAR 03] BAR-JOSEPH Z., GERBER G., GIFFORD D., JAAKKOLA T., SIMON I., «Continuous Representations of Time Series Gene Expression Data», Journal of Computational Biology, vol. 10, n o 3-4, 2003, p

Modélisation et simulation du trafic. Christine BUISSON (LICIT) Journée Simulation dynamique du trafic routier ENPC, 9 Mars 2005

Modélisation et simulation du trafic. Christine BUISSON (LICIT) Journée Simulation dynamique du trafic routier ENPC, 9 Mars 2005 Modélisation et simulation du trafic Christine BUISSON (LICIT) Journée Simulation dynamique du trafic routier ENPC, 9 Mars 2005 Plan de la présentation! Introduction : modèles et simulations définition

Plus en détail

Introduction à la B.I. Avec SQL Server 2008

Introduction à la B.I. Avec SQL Server 2008 Introduction à la B.I. Avec SQL Server 2008 Version 1.0 VALENTIN Pauline 2 Introduction à la B.I. avec SQL Server 2008 Sommaire 1 Présentation de la B.I. et SQL Server 2008... 3 1.1 Présentation rapide

Plus en détail

et les Systèmes Multidimensionnels

et les Systèmes Multidimensionnels Le Data Warehouse et les Systèmes Multidimensionnels 1 1. Définition d un Datawarehouse (DW) Le Datawarehouse est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées

Plus en détail

Comprendre le trafic routier

Comprendre le trafic routier direction générale des Infrastructures, des Transports et de la Mer Références Comprendre le trafic routier - Méthodes et calculs Certu Comprendre le trafic routier Méthodes et calculs Christine Buisson

Plus en détail

Les Entrepôts de Données

Les Entrepôts de Données Les Entrepôts de Données Grégory Bonnet Abdel-Illah Mouaddib GREYC Dépt Dépt informatique :: GREYC Dépt Dépt informatique :: Cours Cours SIR SIR Systèmes d information décisionnels Nouvelles générations

Plus en détail

Big Data et Graphes : Quelques pistes de recherche

Big Data et Graphes : Quelques pistes de recherche Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci http://liris.cnrs.fr/hamamache.kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de

Plus en détail

Modélisation d objets mobiles dans un entrepôt de données

Modélisation d objets mobiles dans un entrepôt de données Tao Wan, Karine Zeitouni Laboratoire PRISM, Université de Versailles 45, avenue des Etats-Unis, 78035 Versailles Cedex, France Tao.Wan@prism.uvsq.fr, Karine.Zeitouni@prism.uvsq.fr http://www.prism.uvsq.fr/users/karima/

Plus en détail

Analyse de la vidéo. Chapitre 4.1 - La modélisation pour le suivi d objet. 10 mars 2015. Chapitre 4.1 - La modélisation d objet 1 / 57

Analyse de la vidéo. Chapitre 4.1 - La modélisation pour le suivi d objet. 10 mars 2015. Chapitre 4.1 - La modélisation d objet 1 / 57 Analyse de la vidéo Chapitre 4.1 - La modélisation pour le suivi d objet 10 mars 2015 Chapitre 4.1 - La modélisation d objet 1 / 57 La représentation d objets Plan de la présentation 1 La représentation

Plus en détail

TRAVAUX DE RECHERCHE DANS LE

TRAVAUX DE RECHERCHE DANS LE TRAVAUX DE RECHERCHE DANS LE DOMAINE DE L'EXPLOITATION DES DONNÉES ET DES DOCUMENTS 1 Journée technologique " Solutions de maintenance prévisionnelle adaptées à la production Josiane Mothe, FREMIT, IRIT

Plus en détail

OPEN DATA : CHALLENGES ET PERSPECTIVES D ENTREPOSAGE

OPEN DATA : CHALLENGES ET PERSPECTIVES D ENTREPOSAGE OPEN DATA : CHALLENGES ET PERSPECTIVES D ENTREPOSAGE «Journée Open Data» 5 Novembre 2013 Présenté par : Imen Megdiche Directeur de thèse : Pr. Olivier Teste (SIG-IRIT) Co-directeur de thèse : Mr. Alain

Plus en détail

Extraction d informations stratégiques par Analyse en Composantes Principales

Extraction d informations stratégiques par Analyse en Composantes Principales Extraction d informations stratégiques par Analyse en Composantes Principales Bernard DOUSSET IRIT/ SIG, Université Paul Sabatier, 118 route de Narbonne, 31062 Toulouse cedex 04 dousset@irit.fr 1 Introduction

Plus en détail

Entrepôt de données 1. Introduction

Entrepôt de données 1. Introduction Entrepôt de données 1 (data warehouse) Introduction 1 Présentation Le concept d entrepôt de données a été formalisé pour la première fois en 1990 par Bill Inmon. Il s agissait de constituer une base de

Plus en détail

Big Data et Graphes : Quelques pistes de recherche

Big Data et Graphes : Quelques pistes de recherche Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de Lyon/Université Claude Bernard Lyon 1/Université

Plus en détail

Nom de l application

Nom de l application Ministère de l Enseignement Supérieur et de la Recherche Scientifique Direction Générale des Etudes Technologiques Institut Supérieur des Etudes Technologiques de Gafsa Département Technologies de l Informatique

Plus en détail

Modélisation et Simulation

Modélisation et Simulation Cours de modélisation et simulation p. 1/64 Modélisation et Simulation G. Bontempi Département d Informatique Boulevard de Triomphe - CP 212 http://www.ulb.ac.be/di Cours de modélisation et simulation

Plus en détail

Cours de Génie Logiciel

Cours de Génie Logiciel Cours de Génie Logiciel Sciences-U Lyon Diagrammes UML (2) http://www.rzo.free.fr Pierre PARREND 1 Avril 2005 Sommaire Les Diagrammes UML Diagrammes de Collaboration Diagrammes d'etats-transitions Diagrammes

Plus en détail

données en connaissance et en actions?

données en connaissance et en actions? 1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)

Plus en détail

Historique. Architecture. Contribution. Conclusion. Définitions et buts La veille stratégique Le multidimensionnel Les classifications

Historique. Architecture. Contribution. Conclusion. Définitions et buts La veille stratégique Le multidimensionnel Les classifications L intelligence économique outil stratégique pour l entreprise Professeur Bernard DOUSSET dousset@irit.fr http://atlas.irit.fr Institut de Recherche en Informatique de Toulouse (IRIT) Equipe Systèmes d

Plus en détail

Cours n 12. Technologies WAN 2nd partie

Cours n 12. Technologies WAN 2nd partie Cours n 12 Technologies WAN 2nd partie 1 Sommaire Aperçu des technologies WAN Technologies WAN Conception d un WAN 2 Lignes Louées Lorsque des connexions dédiées permanentes sont nécessaires, des lignes

Plus en détail

Une proposition d extension de GML pour un modèle générique d intégration de données spatio-temporelles hétérogènes

Une proposition d extension de GML pour un modèle générique d intégration de données spatio-temporelles hétérogènes 303 Schedae, 2007 Prépublication n 46 Fascicule n 2 Une proposition d extension de GML pour un modèle générique d intégration de données spatio-temporelles hétérogènes Samya Sagar, Mohamed Ben Ahmed Laboratoire

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme

Plus en détail

LES OUTILS D ALIMENTATION DU REFERENTIEL DE DB-MAIN

LES OUTILS D ALIMENTATION DU REFERENTIEL DE DB-MAIN LES OUTILS D ALIMENTATION DU REFERENTIEL DE DB-MAIN Les contenues de ce document sont la propriété exclusive de la société REVER. Ils ne sont transmis qu à titre d information et ne peuvent en aucun cas

Plus en détail

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

Dan Istrate. Directeur de thèse : Eric Castelli Co-Directeur : Laurent Besacier

Dan Istrate. Directeur de thèse : Eric Castelli Co-Directeur : Laurent Besacier Détection et reconnaissance des sons pour la surveillance médicale Dan Istrate le 16 décembre 2003 Directeur de thèse : Eric Castelli Co-Directeur : Laurent Besacier Thèse mené dans le cadre d une collaboration

Plus en détail

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com Intelligence Artificielle et Systèmes Multi-Agents Badr Benmammar bbm@badr-benmammar.com Plan La première partie : L intelligence artificielle (IA) Définition de l intelligence artificielle (IA) Domaines

Plus en détail

LES ENJEUX DU BIG DATA

LES ENJEUX DU BIG DATA LES ENJEUX DU BIG DATA POUR LA MISE EN PLACE DES SMART-GRIDS EDF R&D Marie-Luce Picard Projet SIGMA² 16 Janvier 2014 SMART GRIDS SMART METERS SMART DATA Partout dans le monde des projets smart-grids voient

Plus en détail

Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS

Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence

Plus en détail

Utilisation du SIG dans une entreprise industrielle pour l analyse et la prise de décision

Utilisation du SIG dans une entreprise industrielle pour l analyse et la prise de décision 309 Schedae, 2007 Prépublication n 47 Fascicule n 2 Utilisation du SIG dans une entreprise industrielle pour l analyse et la prise de décision Mohamed Najeh Lakhoua UR : Système, Énergétique, Productique

Plus en détail

Techniques d analyse et de conception d outils pour la gestion du processus de segmentation des abonnés des entreprises de télécommunication

Techniques d analyse et de conception d outils pour la gestion du processus de segmentation des abonnés des entreprises de télécommunication Techniques d analyse et de conception d outils pour la gestion du processus de segmentation des abonnés des entreprises de télécommunication R. Carlos Nana Mbinkeu 1,3, C. Tangha 1, A. Chomnoue 1, A. Kuete

Plus en détail

Introduction au datamining

Introduction au datamining Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des

Plus en détail

Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise.

Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise. Solutions PME VIPDev Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise. Cette offre est basée sur la mise à disposition de l ensemble de nos compétences techniques et créatives au service

Plus en détail

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007 Vision industrielle et télédétection - Détection d ellipses Guillaume Martinez 17 décembre 2007 1 Table des matières 1 Le projet 3 1.1 Objectif................................ 3 1.2 Les choix techniques.........................

Plus en détail

Traitement bas-niveau

Traitement bas-niveau Plan Introduction L approche contour (frontière) Introduction Objectifs Les traitements ont pour but d extraire l information utile et pertinente contenue dans l image en regard de l application considérée.

Plus en détail

Chapitre 9 : Informatique décisionnelle

Chapitre 9 : Informatique décisionnelle Chapitre 9 : Informatique décisionnelle Sommaire Introduction... 3 Définition... 3 Les domaines d application de l informatique décisionnelle... 4 Architecture d un système décisionnel... 5 L outil Oracle

Plus en détail

basée sur le cours de Bertrand Legal, maître de conférences à l ENSEIRB www.enseirb.fr/~legal Olivier Augereau Formation UML

basée sur le cours de Bertrand Legal, maître de conférences à l ENSEIRB www.enseirb.fr/~legal Olivier Augereau Formation UML basée sur le cours de Bertrand Legal, maître de conférences à l ENSEIRB www.enseirb.fr/~legal Olivier Augereau Formation UML http://olivier-augereau.com Sommaire Introduction I) Les bases II) Les diagrammes

Plus en détail

Rapport de DEA. Intégration de versions fonctionnelles dans les entrepôts de données multimédias au sein des systèmes OLAP. Anne-Muriel ARIGON

Rapport de DEA. Intégration de versions fonctionnelles dans les entrepôts de données multimédias au sein des systèmes OLAP. Anne-Muriel ARIGON Rapport de DEA Intégration de versions fonctionnelles dans les entrepôts de données multimédias au sein des systèmes OLAP Anne-Muriel ARIGON LIRIS INSA de Lyon Bâtiment 501 69621 Villeurbanne, France Encadré

Plus en détail

Annexe commune aux séries ES, L et S : boîtes et quantiles

Annexe commune aux séries ES, L et S : boîtes et quantiles Annexe commune aux séries ES, L et S : boîtes et quantiles Quantiles En statistique, pour toute série numérique de données à valeurs dans un intervalle I, on définit la fonction quantile Q, de [,1] dans

Plus en détail

Julien MATHEVET Alexandre BOISSY GSID 4. Rapport RE09. Load Balancing et migration

Julien MATHEVET Alexandre BOISSY GSID 4. Rapport RE09. Load Balancing et migration Julien MATHEVET Alexandre BOISSY GSID 4 Rapport Load Balancing et migration Printemps 2001 SOMMAIRE INTRODUCTION... 3 SYNTHESE CONCERNANT LE LOAD BALANCING ET LA MIGRATION... 4 POURQUOI FAIRE DU LOAD BALANCING?...

Plus en détail

Table des matières. Avant-propos. Chapitre 2 L actualisation... 21. Chapitre 1 L intérêt... 1. Chapitre 3 Les annuités... 33 III. Entraînement...

Table des matières. Avant-propos. Chapitre 2 L actualisation... 21. Chapitre 1 L intérêt... 1. Chapitre 3 Les annuités... 33 III. Entraînement... III Table des matières Avant-propos Remerciements................................. Les auteurs..................................... Chapitre 1 L intérêt............................. 1 1. Mise en situation...........................

Plus en détail

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre : Terminale STSS 2 012 2 013 Pourcentages Synthèse 1) Définition : Calculer t % d'un nombre, c'est multiplier ce nombre par t 100. 2) Exemples de calcul : a) Calcul d un pourcentage : Un article coûtant

Plus en détail

Modélisation de la demande de transport

Modélisation de la demande de transport Modélisation de la demande de transport Logiciels pour la modélisation déplacements-trafic Fabien Leurent ENPC / LVMT Les Systèmes d Information Géographique Les boîtes à outils de planification Logiciels

Plus en détail

Projet de Traitement du Signal Segmentation d images SAR

Projet de Traitement du Signal Segmentation d images SAR Projet de Traitement du Signal Segmentation d images SAR Introduction En analyse d images, la segmentation est une étape essentielle, préliminaire à des traitements de haut niveau tels que la classification,

Plus en détail

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc) 87 FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc) Dans le cadre de la réforme pédagogique et de l intérêt que porte le Ministère de l Éducation

Plus en détail

TEPZZ 568448A_T EP 2 568 448 A1 (19) (11) EP 2 568 448 A1 (12) DEMANDE DE BREVET EUROPEEN. (51) Int Cl.: G07F 7/08 (2006.01) G06K 19/077 (2006.

TEPZZ 568448A_T EP 2 568 448 A1 (19) (11) EP 2 568 448 A1 (12) DEMANDE DE BREVET EUROPEEN. (51) Int Cl.: G07F 7/08 (2006.01) G06K 19/077 (2006. (19) TEPZZ 68448A_T (11) EP 2 68 448 A1 (12) DEMANDE DE BREVET EUROPEEN (43) Date de publication: 13.03.2013 Bulletin 2013/11 (1) Int Cl.: G07F 7/08 (2006.01) G06K 19/077 (2006.01) (21) Numéro de dépôt:

Plus en détail

INTRODUCTION AU DATA MINING

INTRODUCTION AU DATA MINING INTRODUCTION AU DATA MINING 6 séances de 3 heures mai-juin 2006 EPF - 4 ème année - Option Ingénierie d Affaires et de Projets Bertrand LIAUDET TP DE DATA MINING Le TP et le projet consisteront à mettre

Plus en détail

Une méthode d apprentissage pour la composition de services web

Une méthode d apprentissage pour la composition de services web Une méthode d apprentissage pour la composition de services web Soufiene Lajmi * Chirine Ghedira ** Khaled Ghedira * * Laboratoire SOIE (ENSI) University of Manouba, Manouba 2010, Tunisia Soufiene.lajmi@ensi.rnu.tn,

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Gilles Gasso, Stéphane Canu INSA Rouen -Département ASI Laboratoire LITIS 8 septembre 205. Ce cours est librement inspiré du cours DM de Alain Rakotomamonjy Gilles Gasso, Stéphane

Plus en détail

Projet de traitement d'image - SI 381 reconstitution 3D d'intérieur à partir de photographies

Projet de traitement d'image - SI 381 reconstitution 3D d'intérieur à partir de photographies Projet de traitement d'image - SI 381 reconstitution 3D d'intérieur à partir de photographies Régis Boulet Charlie Demené Alexis Guyot Balthazar Neveu Guillaume Tartavel Sommaire Sommaire... 1 Structure

Plus en détail

Calcul des pertes de pression et dimensionnement des conduits de ventilation

Calcul des pertes de pression et dimensionnement des conduits de ventilation Calcul des pertes de pression et dimensionnement des conduits de ventilation Applications résidentielles Christophe Delmotte, ir Laboratoire Qualité de l Air et Ventilation CSTC - Centre Scientifique et

Plus en détail

LIDAR LAUSANNE 2012. Nouvelles données altimétriques sur l agglomération lausannoise par technologie laser aéroporté et ses produits dérivés

LIDAR LAUSANNE 2012. Nouvelles données altimétriques sur l agglomération lausannoise par technologie laser aéroporté et ses produits dérivés LIDAR LAUSANNE 2012 Nouvelles données altimétriques sur l agglomération lausannoise par technologie laser aéroporté et ses produits dérivés LIDAR 2012, nouveaux modèles altimétriques 1 Affaire 94022 /

Plus en détail

Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels

Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels Etab=MK3, Timbre=G430, TimbreDansAdresse=Vrai, Version=W2000/Charte7, VersionTravail=W2000/Charte7 Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels

Plus en détail

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée. ANALYSE 5 points Exercice 1 : Léonie souhaite acheter un lecteur MP3. Le prix affiché (49 ) dépasse largement la somme dont elle dispose. Elle décide donc d économiser régulièrement. Elle a relevé qu elle

Plus en détail

Didier MOUNIEN Samantha MOINEAUX

Didier MOUNIEN Samantha MOINEAUX Didier MOUNIEN Samantha MOINEAUX 08/01/2008 1 Généralisation des ERP ERP génère une importante masse de données Comment mesurer l impact réel d une décision? Comment choisir entre plusieurs décisions?

Plus en détail

SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...)

SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...) Avant-propos 1. À qui s'adresse ce livre? 15 2. Pré-requis 15 3. Objectifs du livre 16 4. Notations 17 Introduction à la Business Intelligence 1. Du transactionnel au décisionnel 19 2. Business Intelligence

Plus en détail

Automatique Linéaire 1 Travaux Dirigés 1A ISMIN

Automatique Linéaire 1 Travaux Dirigés 1A ISMIN Automatique Linéaire 1 Travaux Dirigés Travaux dirigés, Automatique linéaire 1 J.M. Dutertre 2014 TD 1 Introduction, modélisation, outils. Exercice 1.1 : Calcul de la réponse d un 2 nd ordre à une rampe

Plus en détail

Entreposage de données complexes pour la médecine d anticipation personnalisée

Entreposage de données complexes pour la médecine d anticipation personnalisée Manuscrit auteur, publié dans "9th International Conference on System Science in Health Care (ICSSHC 08), Lyon : France (2008)" Entreposage de données complexes pour la médecine d anticipation personnalisée

Plus en détail

1 La visualisation des logs au CNES

1 La visualisation des logs au CNES 1 La visualisation des logs au CNES 1.1 Historique Depuis près de 2 ans maintenant, le CNES a mis en place une «cellule d analyse de logs». Son rôle est multiple : Cette cellule est chargée d analyser

Plus en détail

Dossier de presse. Création de l observatoire sanef 1 ère étude scientifique des comportements au volant sur autoroute JUILLET 2012

Dossier de presse. Création de l observatoire sanef 1 ère étude scientifique des comportements au volant sur autoroute JUILLET 2012 Dossier de presse SOMMAIRE Présentation...3 Une étude scientifique pour dresser un état des lieux des comportements sur autoroute...4 L occupation des voies : des résultats venant confirmer l importance

Plus en détail

Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION

Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION Classe de terminale de la série Sciences et Technologie du Management et de la Gestion Préambule Présentation Les technologies de l information

Plus en détail

Apprentissage Automatique

Apprentissage Automatique Apprentissage Automatique Introduction-I jean-francois.bonastre@univ-avignon.fr www.lia.univ-avignon.fr Définition? (Wikipedia) L'apprentissage automatique (machine-learning en anglais) est un des champs

Plus en détail

Principe de symétrisation pour la construction d un test adaptatif

Principe de symétrisation pour la construction d un test adaptatif Principe de symétrisation pour la construction d un test adaptatif Cécile Durot 1 & Yves Rozenholc 2 1 UFR SEGMI, Université Paris Ouest Nanterre La Défense, France, cecile.durot@gmail.com 2 Université

Plus en détail

Data Mining. Vincent Augusto 2012-2013. École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto.

Data Mining. Vincent Augusto 2012-2013. École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto. des des Data Mining Vincent Augusto École Nationale Supérieure des Mines de Saint-Étienne 2012-2013 1/65 des des 1 2 des des 3 4 Post-traitement 5 représentation : 6 2/65 des des Définition générale Le

Plus en détail

La continuité de service

La continuité de service La continuité de service I INTRODUCTION Si la performance est un élément important de satisfaction de l'utilisateur de réseau, la permanence de la disponibilité des ressources l'est encore davantage. Ici

Plus en détail

CARTOGRAPHIE EN LIGNE ET GÉNÉRALISATION

CARTOGRAPHIE EN LIGNE ET GÉNÉRALISATION CARTOGRAPHIE EN LIGNE ET GÉNÉRALISATION par Julien Gaffuri JRC IES SDI unit Via Enrico Fermi, 21027 Ispra, Italie Julien.Gaffuri@gmail.com Les cartes en ligne pourraient être améliorées par l utilisation

Plus en détail

Business Intelligence : Informatique Décisionnelle

Business Intelligence : Informatique Décisionnelle Business Intelligence : Informatique Décisionnelle On appelle «aide à la décision», «décisionnel», ou encore «business intelligence», un ensemble de solutions informatiques permettant l analyse des données

Plus en détail

TRS: Sélection des sous-graphes représentants par l intermédiaire des attributs topologiques et K-medoïdes

TRS: Sélection des sous-graphes représentants par l intermédiaire des attributs topologiques et K-medoïdes TRS: Sélection des sous-graphes représentants par l intermédiaire des attributs topologiques et K-medoïdes Mohamed Moussaoui,Wajdi Dhifli,Sami Zghal,Engelbert Mephu Nguifo FSJEG, Université de Jendouba,

Plus en détail

Caractéristiques des ondes

Caractéristiques des ondes Caractéristiques des ondes Chapitre Activités 1 Ondes progressives à une dimension (p 38) A Analyse qualitative d une onde b Fin de la Début de la 1 L onde est progressive puisque la perturbation se déplace

Plus en détail

Datawarehouse: Cubes OLAP. Marlyse Dieungang Khaoula Ghilani

Datawarehouse: Cubes OLAP. Marlyse Dieungang Khaoula Ghilani Datawarehouse: Cubes OLAP Marlyse Dieungang Khaoula Ghilani Table des matières 1 Data Warehouse 3 1.1 Introduction............................ 3 1.1.1 Définition......................... 3 1.1.2 Architecture........................

Plus en détail

Production des Services d Assurance non-vie selon le SCN 2008

Production des Services d Assurance non-vie selon le SCN 2008 REPUBLIQUE DU CAMEROUN Paix - Travail Patrie ---------- INSTITUT NATIONAL DE LA STATISTIQUE ---------- REPUBLIC OF CAMEROON Peace - Work Fatherland ---------- NATIONAL INSTITUTE OF STATISTICS ----------

Plus en détail

Chapitre IX. L intégration de données. Les entrepôts de données (Data Warehouses) Motivation. Le problème

Chapitre IX. L intégration de données. Les entrepôts de données (Data Warehouses) Motivation. Le problème Chapitre IX L intégration de données Le problème De façon très générale, le problème de l intégration de données (data integration) est de permettre un accès cohérent à des données d origine, de structuration

Plus en détail

STREAMCORE. Gestion de Performance et Optimisation Réseau

STREAMCORE. Gestion de Performance et Optimisation Réseau sc STREAMCORE Gestion de Performance et Optimisation Réseau Gestion de Performance et Optimisation Réseau avec Streamcore Visualisation des performances applicatives sur le réseau Surveillance de la qualité

Plus en détail

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R Yves Aragon, David Haziza & Anne Ruiz-Gazen GREMAQ, UMR CNRS 5604, Université des Sciences

Plus en détail

Sillage Météo. Notion de sillage

Sillage Météo. Notion de sillage Sillage Météo Les représentations météorologiques sous forme d animation satellites image par image sont intéressantes. Il est dommage que les données ainsi visualisées ne soient pas utilisées pour une

Plus en détail

Application de K-means à la définition du nombre de VM optimal dans un cloud

Application de K-means à la définition du nombre de VM optimal dans un cloud Application de K-means à la définition du nombre de VM optimal dans un cloud EGC 2012 : Atelier Fouille de données complexes : complexité liée aux données multiples et massives (31 janvier - 3 février

Plus en détail

Cours 9. Régimes du transistor MOS

Cours 9. Régimes du transistor MOS Cours 9. Régimes du transistor MOS Par Dimitri galayko Unité d enseignement Élec-info pour master ACSI à l UPMC Octobre-décembre 005 Dans ce document le transistor MOS est traité comme un composant électronique.

Plus en détail

CONCEPTION ET REALISATION D'UN GENERATEUR DE TABLEAUX DE BORD PROSPECTIFS MULTIDIMENSIONNELS

CONCEPTION ET REALISATION D'UN GENERATEUR DE TABLEAUX DE BORD PROSPECTIFS MULTIDIMENSIONNELS CONCEPTION ET REALISATION D'UN GENERATEUR DE TABLEAUX DE BORD PROSPECTIFS MULTIDIMENSIONNELS Nazih Selmoune (*), Zaia Alimazighi (*) Selmoune@lsi-usthb.dz, Alimazighi@wissal.dz (*) Laboratoire des systèmes

Plus en détail

LIVRE BLANC Décembre 2014

LIVRE BLANC Décembre 2014 PARSING MATCHING EQUALITY SEARCH LIVRE BLANC Décembre 2014 Introduction L analyse des tendances du marché de l emploi correspond à l évidence à une nécessité, surtout en période de tension comme depuis

Plus en détail

TRAFFIC EXPERT. LA SOLUTION INTELLIGENTE POUR LES SYSTEMES DE GESTION DE TRAFFIC L expérience de STERIA à SINGAPOUR. Nabil DJEMAME (Steria)

TRAFFIC EXPERT. LA SOLUTION INTELLIGENTE POUR LES SYSTEMES DE GESTION DE TRAFFIC L expérience de STERIA à SINGAPOUR. Nabil DJEMAME (Steria) TRAFFIC EXPERT LA SOLUTION INTELLIGENTE POUR LES SYSTEMES DE GESTION DE TRAFFIC L expérience de STERIA à SINGAPOUR LILLE : 8h30 TRAFIC FLUIDE Postes Opérateurs Ecran de gauche Ecran de droite Dédié aux

Plus en détail

Urbanisation des SI-NFE107

Urbanisation des SI-NFE107 OLAP Urbanisation des SI-NFE107 Fiche de lecture Karim SEKRI 20/01/2009 OLAP 1 Introduction PLAN OLAP Les différentes technologies OLAP Plate formes et Outils 20/01/2009 OLAP 2 Informatique décisionnelle

Plus en détail

Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes.

Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes. Promotion X 004 COURS D ANALYSE DES STRUCTURES MÉCANIQUES PAR LA MÉTHODE DES ELEMENTS FINIS (MEC 568) contrôle non classant (7 mars 007, heures) Documents autorisés : polycopié ; documents et notes de

Plus en détail

SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique

SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique DOMAINE P3.C3.D1. Pratiquer une démarche scientifique et technologique, résoudre des

Plus en détail

Utilisation d informations visuelles dynamiques en asservissement visuel Armel Crétual IRISA, projet TEMIS puis VISTA L asservissement visuel géométrique Principe : Réalisation d une tâche robotique par

Plus en détail

Présentation du module Base de données spatio-temporelles

Présentation du module Base de données spatio-temporelles Présentation du module Base de données spatio-temporelles S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Partie 1 : Notion de bases de données (12,5h ) Enjeux et principes

Plus en détail

BI2 : Un profil UML pour les Indicateurs Décisionnels

BI2 : Un profil UML pour les Indicateurs Décisionnels BI2 : Un profil UML pour les Indicateurs Décisionnels Sandro Bimonte Irstea, TSCF, 9 Av. Blaise Pascal, 63178, Aubière, France sandro.bimonte@irstea.fr Thème de Recherche MOTIVE www.irstea.fr 2 Plan Motivations

Plus en détail

Mesurage de la qualité acoustique de revêtements. acoustique de revêtements

Mesurage de la qualité acoustique de revêtements. acoustique de revêtements Monitoring de la performance acoustique d un d revêtement phonoabsorbant en milieu urbain François Aballéa, Pierre-Jean René a Olivier Schalbetter, Lucien Pignat b Daniel Vaucher de la Croix, Fabien Lassablière

Plus en détail

Champ électromagnétique?

Champ électromagnétique? Qu est-ce qu un Champ électromagnétique? Alain Azoulay Consultant, www.radiocem.com 3 décembre 2013. 1 Définition trouvée à l article 2 de la Directive «champs électromagnétiques» : des champs électriques

Plus en détail

AXES DE RECHERCHE - DOMAINE D'INTERET MAJEUR LOGICIELS ET SYSTEMES COMPLEXES

AXES DE RECHERCHE - DOMAINE D'INTERET MAJEUR LOGICIELS ET SYSTEMES COMPLEXES 1 AXES DE RECHERCHE - DOMAINE D'INTERET MAJEUR LOGICIELS ET SYSTEMES COMPLEXES 2 Axes de recherche L activité du DIM LSC concerne la méthodologie de la conception et le développement de systèmes à forte

Plus en détail

MODELISATION UN ATELIER DE MODELISATION «RATIONAL ROSE»

MODELISATION UN ATELIER DE MODELISATION «RATIONAL ROSE» MODELISATION UN ATELIER DE MODELISATION «RATIONAL ROSE» Du cours Modélisation Semi -Formelle de Système d Information Du Professeur Jean-Pierre GIRAUDIN Décembre. 2002 1 Table de matière Partie 1...2 1.1

Plus en détail

PRIME/ESSENTIAL NAVIGATION QUICK START GUIDE

PRIME/ESSENTIAL NAVIGATION QUICK START GUIDE PRIME/ESSENTIAL NAVIGATION QUICK START GUIDE FR Configuration initiale 1. Sélectionnez votre langue préférée, puis touchez pour confirmer la sélection. Vous pourrez la modifier par la suite dans les paramètres

Plus en détail

THOT - Extraction de données et de schémas d un SGBD

THOT - Extraction de données et de schémas d un SGBD THOT - Extraction de données et de schémas d un SGBD Pierre-Jean DOUSSET (France), Benoît ALBAREIL (France) pj@miningdb.com, benoit@miningdb.com Mots clefs : Fouille d information, base de données, système

Plus en détail

E/ECE/324/Rev.1/Add.12/Rev.7/Amend.4 E/ECE/TRANS/505/Rev.1/Add.12/Rev.7/Amend.4

E/ECE/324/Rev.1/Add.12/Rev.7/Amend.4 E/ECE/TRANS/505/Rev.1/Add.12/Rev.7/Amend.4 6 décembre 2012 Accord Concernant l adoption de prescriptions techniques uniformes applicables aux véhicules à roues, aux équipements et aux pièces susceptibles d être montés ou utilisés sur un véhicule

Plus en détail

TP 7 : oscillateur de torsion

TP 7 : oscillateur de torsion TP 7 : oscillateur de torsion Objectif : étude des oscillations libres et forcées d un pendule de torsion 1 Principe général 1.1 Définition Un pendule de torsion est constitué par un fil large (métallique)

Plus en détail

UML (Diagramme de classes) Unified Modeling Language

UML (Diagramme de classes) Unified Modeling Language UML (Diagramme de classes) Unified Modeling Language Sommaire Introduction Objectifs Diagramme de classes Classe (Nom, attribut, opération) Visibilité et portée des constituants d une classe Association

Plus en détail

Efficace et ciblée : La surveillance des signaux de télévision numérique (2)

Efficace et ciblée : La surveillance des signaux de télévision numérique (2) Efficace et ciblée : La surveillance des signaux de télévision numérique (2) La première partie de cet article publié dans le numéro 192 décrit la méthode utilisée pour déterminer les points de surveillance

Plus en détail

3. Artefacts permettant la mesure indirecte du débit

3. Artefacts permettant la mesure indirecte du débit P-14V1 MÉTHODE DE MESURE DU DÉBIT D UN EFFLUENT INDUSTRIEL EN CANALISATIONS OUVERTES OU NON EN CHARGE 1. Domaine d application Cette méthode réglemente la mesure du débit d un effluent industriel en canalisations

Plus en détail

Le montant des garanties constituées aux fins du STPGV est-il excessif?

Le montant des garanties constituées aux fins du STPGV est-il excessif? Le montant des garanties constituées aux fins du STPGV est-il excessif? Kim McPhail et Anastasia Vakos* L e système canadien de transfert des paiements de grande valeur (STPGV) sert à effectuer les paiements

Plus en détail

Concevoir et déployer un data warehouse

Concevoir et déployer un data warehouse Concevoir et déployer un data warehouse Ralph Kimball Éditions Eyrolles ISBN : 2-212-09165-6 2000 2 Le cycle de vie dimensionnel Avant d étudier de plus près les spécificités de la conception, du développement

Plus en détail

CAPTEURS - CHAINES DE MESURES

CAPTEURS - CHAINES DE MESURES CAPTEURS - CHAINES DE MESURES Pierre BONNET Pierre Bonnet Master GSI - Capteurs Chaînes de Mesures 1 Plan du Cours Propriétés générales des capteurs Notion de mesure Notion de capteur: principes, classes,

Plus en détail

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation Base de données S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Présentation du module Contenu général Notion de bases de données Fondements / Conception Utilisation :

Plus en détail