Appariement de graphes de réseau avec PostGIS



Documents pareils
PostgreSQL. Formations. SQL avancé Calendrier... 18

PostgreSQL, le cœur d un système critique

CATALOGUE FORMATION 2014

Laurent Jégou novembre 2014 M2 Sigma U351_33 WebMapping. Séance 2 Les systèmes de gestion de bases de données spatiales : L'exemple de PostGIS

PostgreSQL. Formations. Catalogue Calendrier... 8

Laurent Jégou 07/12/2012 M2 Sigma

Fournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement

PostgreSQL. Formations. Calendrier... 14

Présentation du projet

MySQL. (Administrateur) (Dernière édition) Programme de formation. France, Belgique, Suisse, Roumanie - Canada

Principe, applications et limites

Introduction: 1. définition d un ETL 2. importance et diversité des données spatiales utilitédes ETL géographiques

Les applications webmapping en opensource. 1 Christophe Adriaensen

Les bases de données relationnelles

Conduite de projets informatiques Développement, analyse et pilotage (2ième édition)

Présentation du module Base de données spatio-temporelles

Réplication E-maj Foreign Data Wrapper PostGIS PostgreSQL-f

Visual Paradigm Contraintes inter-associations

Gestion de données avec TALEND

Un SIG collaboratif pour la recherche historique Partie. Partie 1 : Naissance et conception d un système d information géo-historique collaboratif.

Développement de base de données Microsoft SQL Server Durée : 5 jours Référence : DPSQL12. Contenu

Sybase PowerAMC 16. Guide des nouvelles fonctionnalités générales. DOCUMENTATION

Le "tout fichier" Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique

//////////////////////////////////////////////////////////////////// Administration bases de données

Gestion collaborative de documents

Performances. Gestion des serveurs (2/2) Clustering. Grid Computing

Projet CASI: Master Data Management

Fichier sql.ini, Serveurs

ArcGIS 10.1 for Server

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

Initiation aux bases de données (SGBD) Walter RUDAMETKIN

Intégration du référentiel hydrographique Bd Carthage dans le Système d Information de l agence de l eau Adour Garonne

DataStudio. Solution d intégration des données et de diffusion de l information

Conseil et Ingénierie des Systèmes d Information d Entreprise

Démonstrateur libre Application des données Open Street Map à l analyse géographique de réseaux de voirie et Transports Collectifs

Procédure d'installation de PostgreSQL pour Windows

Mercredi 15 Janvier 2014

LES LOGICIELS OPEN SOURCE DANS LA GEOMATIQUE

FICHE PRODUIT. MapInfo Professional v12.5 Evolution. Comparaison de la v12.5 avec les anciennes versions. Les plus de MapInfo Professional v12.

GPC Computer Science

et Groupe Eyrolles, 2006, ISBN :

Introduction à ORACLE WAREHOUSE BUILDER Cédric du Mouza

Les Géodatabases en 9.2

Les Entrepôts de Données

Programme scientifique Majeure ARCHITECTURE DES SYSTEMES D INFORMATION. Mentions Ingénierie des Systèmes d Information Business Intelligence

Des solutions sur mesure à partir de modules fonctionnels & CRM associés à un studio de customisation.

Université Libre de Tunis

OFFRE MDB Service & Architecture Technique. MyDataBall Saas (Software as a Service) MyDataBall On Premise

M2 SIAW - Exemples de stages réalisés. Gabriella Salzano - Document de travail - 28/1/2015

Intégration de Données et Systèmes Décisionnels. Au cœur de la performance

SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...)

CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2012

SQL Server 2014 Administration d'une base de données transactionnelle avec SQL Server Management Studio

PostGIS, un module de PostgreSQL pour les données spatiales

SQL Server 2012 Administrez une base de données : Exercices et corrigés

Chaîne opératoire de réalisation d une base de données. ANF «Comment concevoir une base de données» (29-30/01/2015)

ArcGIS Mobile 9.3. Cédric Pesty Gael Simon. Conférence SIG 2008 Ateliers Techniques. S'il vous plait! Merci d'éteindre vos appareils portables

La place de la Géomatique Décisionnelle dans le processus de décision

Notre Catalogue des Formations IT / 2015

Travail de diplôme 2011 Business Intelligence Open Source SpagoBI/Talend Résumé

EXPERIENCES SIGNIFICATIVES

Accélérer l agilité de votre site de e-commerce. Cas client

ArcGIS. for Server. Comprendre notre monde

GEOTREK, une application opensource pour la gestion et la valorisation des sentiers. Parc national des Ecrins Juin 2014 / Forum TIC de l ATEN

BI Open Source Octobre Alioune Dia, Consultant BI

Domaines d intervention

Cursus Sage ERP X3 Outils & Développement. Le parcours pédagogique Sage ERP X3 Outils et Développement

FORMATION TALEND. Page 1 sur 9

SQL Server 2012 et SQL Server 2014

Glossaire. base de données géographiques Voir géodatabase (GDB).

Resolution limit in community detection

Nouveautés ArcGIS 10.2

Bases de Données. Le cas des BD relationnelles ouverture sur les BD relationnelles spatiales Séance 2 : Mise en oeuvre

Mise en oeuvre d'une base de données mono-utilisateur avec SQLite

SOMMAIRE Thématique : Systèmes d'information et d'exploitation

Offres de stages 2011/2012

Urbanisme du Système d Information et EAI

ArcGIS Server / 9.4. Gaëtan LAVENU Jean-Marie DULISCOUET

SQL Server Administration d'une base de données transactionnelle avec SQL Server Management Studio (édition enrichie de vidéos)

GESTIONNAIRE DES DONNEES SIG

DÉPARTEMENT FORMATIONS 2015 FORMATION-RECRUTEMENT CATALOGUE. CONTACTS (+226)

Catalogue des formations

Livret de Stages 2014 / 2015

Business Intelligence avec Excel, Power BI et Office 365

Rémi BOVARD Ingénieur BSc HES en géomatique

CESI Bases de données

La replication dans PostgreSQL

Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP)

ArcGIS. for Server. Sénégal. Comprendre notre monde

INGENIERIE DES SYSTEMES INFORMATIQUES - PARCOURS : MOBILITE ET CLOUD COMPUTING

Le cloud computing au service des applications cartographiques à haute disponibilité

Les technologies du Big Data

Master Informatique Aix-Marseille Université

Postes à pourvoir 2015

Sécurité des applications Retour d'expérience

White Paper ADVANTYS. Workflow et Gestion de la Performance

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)

Transcription:

Appariement de graphes de réseau avec PostGIS VincentPicavetMakinaCorpus OGRS2009

Vincent Picavet / Makina Corpus vincent.picavet@makina-corpus.com Ingénieur Systèmes d'information Géographique Contributeur PostGIS SSLL Française ~ 50 personnes SIG Outils collaboratifs Business Intelligence Système VincentPicavetMakinaCorpus OGRS2009

Contexte Mission actuelle chez le client X, en recherche & développement du domaine géomatique Métier utilisant la cartographie du terrain (exemple : taxis, Pages Jaunes, transport routier, DDE ) Expertise PostgreSQL / PostGIS VincentPicavetMakinaCorpus OGRS2009

PostgreSQL Base de données relationnelle Libre (BSD) Nombreuses fonctionnalités avancées (MVCC, Contraintes, Triggers, CTE, PITR, HOT, Full-Text search ) Langages côté serveur (Pl/PgSQL, Python, Java, Perl, LOLcode) CANIHAZCOUNT(*) FROMFISHES? Adaptabilité (embarqué Data Warehouse) VincentPicavetMakinaCorpus OGRS2009

PostGIS Cartouche spatial de PostgreSQL Types géométriques Index spatiaux Opérateurs et fonctions d'analyse spatiale A venir : rasters, geodésique VincentPicavetMakinaCorpus OGRS2009

Problèmatique Client X : besoin info géographique pour le métier Graphes de réseaux routiers Données métier associées à ces graphes Données initiales 2004 Evolution en parallèle pendant 4 ans Désynchronisation des données Same same,butdifferent VincentPicavetMakinaCorpus OGRS2009

Problèmatique VincentPicavetMakinaCorpus OGRS2009

Objectif Resynchroniser les données «recoller» les graphes Réassocier et/ou reconstruire les données métier Construire un processus de mise à jour des données Rendre ce process automatique Mises à jour systèmatiques VincentPicavetMakinaCorpus OGRS2009

VincentPicavetMakinaCorpus OGRS2009

Traitements Méthodologie des traitements effectués (1) (2) (3) (4) (5) (6) (7) (8) Chargement données de référence Chargement données métier Création du modèle d'entrée d'appariement Appariement des graphes (noeuds, voies, tronçons) par méthodes sémantiques, topologiques, et géométriques. Correspondances des données métier Recréation de données métier Création de modèle de sortie Export du modèle de sortie VincentPicavetMakinaCorpus OGRS2009

Méthodes sémantiques Basées sur la toponymie Traitement de texte Correspondance des intersections (sémantique et topologique) er ôti ric l'ab e ed Ru lle au G e ld a r né gé u d e Ru ral né é eg Ru alle G de er oti ric l'ab de ue en Av Voies de noms proches Rue du général de Gaulle Rue général de Galle Rue de l'abri côtier avenue de l'abricotier VincentPicavetMakinaCorpus OGRS2009

Méthodes topologiques Propagation de l'appariement noeuds Signatures locales des noeuds noeuds 043260981234 043260981234 Plus courts chemins tronçons VincentPicavetMakinaCorpus OGRS2009

Méthodes géométriques Points «superposés» Avec des gardes fous Tronçons de même géométrie problèmatique de l'égalité de géométrie Voies sur les tronçons de même géométrie Méthodes efficaces sur réseaux très proches Source d'erreurs si désynchronisation VincentPicavetMakinaCorpus OGRS2009

Données : modélisation des graphes VincentPicavetMakinaCorpus OGRS2009

Données : modèle TODO : Screenshot du modèle (si validation) VincentPicavetMakinaCorpus OGRS2009

Résultats Périmètre : 2004 2008 : 70% des tronçons 93% des données métier 2008 2009 : 70% de la population française 2700 communes 99% des tronçons 99.95% des données métier Moins de différence des réseaux Travail de nettoyage sur les données métier VincentPicavetMakinaCorpus OGRS2009

Résultats VincentPicavetMakinaCorpus OGRS2009

VincentPicavetMakinaCorpus OGRS2009

VincentPicavetMakinaCorpus OGRS2009

Des chiffres Données ~ 50 Tables + tables temporaires + tables de controle et stats Entre quelques Mo et quelques Go Entre 1500 et > 10M enregistrements ~ 30 champs de géométrie Volume total : ~ 150Go en fin de traitement 30K lignes SQL 3000 requêtes 6000 lignes Python VincentPicavetMakinaCorpus OGRS2009

Typologie d'utilisation de BDD «ELT» : Extract, Load, Transform Traitements longs et lourds Chaine de production globale ~ 20j Appariement : 5j Traitements dans Postgres + Postgis + quelques outils externes Non utilisés : Gestion de droits Accès conccurentiels Réplication VincentPicavetMakinaCorpus OGRS2009

Environnement Serveurs windows Clients windows Deux serveurs de test et prod Dimensionnement large Avantage libre : serveurs de dev en local Développement PgAdmin III Editeurs classiques SVN Python + psycopg2 VincentPicavetMakinaCorpus OGRS2009

Outils : intégration et exports Shp2pgsql, pgsql2shp & ogr2ogr Intégration des données géographiques de référence Exports de la géographie en fin de process BCP Sybase PostgreSQL Talend SDI Données métier Sybase vers PostgreSQL Postgres vers Sybase VincentPicavetMakinaCorpus OGRS2009

Outils : modélisation et contrôle Modélisation : PowerAMC Lié à Sybase En amont : conception En aval : rétroingénierie pour controle Visualisation Udig GvSIG Mapinfo (exports SHP) Mapinfo 10 (PostGIS) VincentPicavetMakinaCorpus OGRS2009

Difficultés rencontrées Utilisation ELT Transactions longues Cache de requêtes inefficace Gestion manuelle indexes, structure, maintenance (vacuum, analyze) Compromis modularité / généricité / performances Optimisation Paramétrage serveur Tuning requêtes Coût (temps, matériel) environnement de test réél VincentPicavetMakinaCorpus OGRS2009

Directions futures Industrialisation Optimisation Passage sous environnement UNIX Intégration des outils externes sous forme de modules PostgreSQL/PostGIS Changement des entrées / sorties Généralisation de PostgreSQL/PostGIS VincentPicavetMakinaCorpus OGRS2009

Conclusion Projet atypique Bons résultats algorithmiques Bons résultats techniques Montée en compétence Volonté de généraliser l'utilisation de PG Reversement au libre? VincentPicavetMakinaCorpus OGRS2009

Questions? Vincent Picavet vincent.pro@picavet.info Makina Corpus www.makina-corpus.com contact@makina-corpus.com Tel : 01 44 82 00 80 VincentPicavetMakinaCorpus OGRS2009