Analyse exploratoire de données spatiales GeoXp et Géomarketing



Documents pareils
SIG ET ANALYSE EXPLORATOIRE

Optimiser ses graphiques avec R

Traitement bas-niveau

Création de fonds de cartes statiques et dynamiques avec R et Google Maps

Prise en main du logiciel de SIG MapInfo

Support de TD ArcGIS Introduction à l automatisation et au développement avec ArcGIS 10.1 JEAN-MARC GILLIOT e année ingénieur

Adobe Illustrator Logiciel de dessin vectoriel et de Cartographie Assistée par Ordinateur

BLANC LIVRE. Data Discovery L alternative à la BI?

MOI 1 VEILLE MARKETING LE GEOMARKETING

Logiciel XLSTAT version rue Damrémont PARIS

RÉALISATION DE GRAPHIQUES AVEC OPENOFFICE.ORG 2.3

PAGE 1. L écran du logiciel d Open Office Draw. Barre de menu: Les commandes du logiciel

Réalisation de cartes vectorielles avec Word

Infolettre #18 : Les graphiques avec Excel 2010

Cartographie Informatique Eclairage Public

Utilisation du module «Geostatistical Analyst» d ARCVIEW dans le cadre de la qualité de l air

Inspiration 7.5. Brève description d Inspiration. Avantages d Inspiration. Inconvénients d Inspiration

Fiche TD avec le logiciel. Courbes de niveau. D. Chessel

ANALYSES SPATIALES SOUS R

Présentation du logiciel

FAIRE SES COMPTES AVEC GRISBI

INITIATION A MAPINFO PROFESSIONAL ETAPE I CARTOGRAPHIE ELEMENTAIRE AVEC MAPINFO PROFESSIONAL

Gestionnaire de champs PRO

ou clic objet. R rouge B bleu : 65 Le fond votre travail en P :. d étoiles dupliquer. Esbly Page 1 / 5

Faire un semi variograme et une carte krigée avec surfer

Tapez le titre de la page «BASTIA ville méditerranéenne», puis allez deux fois à la ligne à l aide de la touche Entrée.

FICHE PRODUIT. MapInfo Professional v12.5 Evolution. Comparaison de la v12.5 avec les anciennes versions. Les plus de MapInfo Professional v12.

Objectif : optimiser des décisions et croiser des données en tenant compte de leur caractère géographique

La structure de la base de données et l utilisation de PAST. Musée Royal de l Afrique Centrale (MRAC Tervuren)

HMI target Visu / PLC HMI. Pour réaliser une interface homme machine avec PLC control

Endpoint Protection. Guide d installation simplifié

1 Modélisation d être mauvais payeur

d interpolation spatiale, la piézométrie à l aide de l extension Geostatistical Analyst d ArcGIS du système aquifère phréatique de Sfax (Tunisie)

Aide - mémoire gnuplot 4.0

Extraction d informations stratégiques par Analyse en Composantes Principales

Fiches d aide à MapInfo

Correction des Travaux Pratiques Organiser son espace de travail

Gestion de projet d une base de données cartographiques

Manuel utilisateur Netviewer one2one

ProxiLens : Exploration interactive de données multidimensionnelles à partir de leur projection

L espace de travail de Photoshop

Activité 11 : Nuage de points ou diagramme de dispersion

NOTICE D INSTALLATION ET D UTILISATION DE LIVE BACKUP

GUIDE D UTILISATION DE L ISU SEPTEMBRE 2013 GUIDE D UTILISATION DU NAVIGATEUR UIS.STAT (VERSION BÊTA)

INTRODUCTION GENERALE...1 LA CONNEXION ODBC :...1. CONNEXION AU TRAVERS D EXCEL(tm)...6. LOGICIEL QUANTUM GIS (Qgis)... 10

LA GMAO ACCEDER : PRESENTATION et VISUALISATION

DOSSIER D'ACTIVITES SUR TUXPAINT Dessiner avec Tuxpaint. Objectifs :

Analyse exploratoire des données

Utilisation de l ordinateur portable Bluetooth avec le hub Logitech sans fil

1. Installation de COMPTINE

[SUIVI PEDAGOGIQUE PASS ROUSSEAU / EASYWEB DANS EASYSYSTEME] Guide d utilisation. Codes Rousseau Juin

Celestia. 1. Introduction à Celestia (2/7) 1. Introduction à Celestia (1/7) Université du Temps Libre - 08 avril 2008

S.P.S.N. Lac du Der 2008

Les Géodatabases en 9.2

Opérations de base sur ImageJ

Innovations Majeures de la Version 4

Avenir Concept Monaco

lancent la Chaire SIRIUS :

Utilisation du SIG dans une entreprise industrielle pour l analyse et la prise de décision

Géométrie discrète Chapitre V

PROCÉDURE DE RÉCUPÉRATION DES CLÉS ET DES CERTIFICATS (SIGNATURE NUMÉRIQUE)

Programme de formation Photoshop : Initiation 24 heures de formation (3 jours) 1/2

Tp_chemins..doc. Dans la barre "arche 2" couleur claire 1/5 21/01/13

Introduction à Eclipse

R00 Installation du logiciel R sous Windows

AGASC / BUREAU INFORMATION JEUNESSE Saint Laurent du Var - E mail : bij@agasc.fr / Tel : CONSIGNE N 1 :

MANUEL D UTILISATION PRO-FACE

Ecran : Processeur : OS : Caméra : Communication : Mémoire : Connectique : Audio : Batterie : Autonomie : Dimensions : Poids : DAS :

Atelier Découverte de Windows. janvier 2012

Introduction à la Visualisation Scientifique

Parcours FOAD Formation EXCEL 2010

Utilisation du logiciel GALAAD

OCLOUD BACKUP MINI GUIDE. 1 Ocloud Backup/Mini- Guide

1) Installation de Dev-C++ Téléchargez le fichier devcpp4990setup.exe dans un répertoire de votre PC, puis double-cliquez dessus :

Département de l ARIEGE

L ARBORESCENCE. Qu est-ce qu un dossier? L arborescence?

Guide d'utilisation. OpenOffice Calc. AUTEUR INITIAL : VINCENT MEUNIER Publié sous licence Creative Commons

Représentation d une distribution

Mathcad Ces capacités font de Mathcad l outil de calcul technique le plus utilisé au monde.

Evolution et architecture des systèmes d'information, de l'internet. Impact sur les IDS. IDS2014, Nailloux 26-28/05/2014

TD Introduction aux SIG avec ArcGis 9

SOMMAIRE. Présentation assistée sur ordinateur. Collège F.Rabelais 1/10

Découverte du logiciel ordinateur TI-n spire / TI-n spire CAS

LOCAL TRUST SUB. Guide d utilisation Tiers

Master mention Economie et Statistique

Contenu de la version 3.4 C I V I L N E T A D M I N I S T R A T I O N

Cahier n o 6. Mon ordinateur. Fichiers et dossiers Sauvegarde et classement

Construction d un Service Web d Aide à la Décision Géo-Marketing à partir d Outils OpenSource

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007

TABLE DES MATIÈRES 1. DÉMARRER ISIS 2 2. SAISIE D UN SCHÉMA 3 & ' " ( ) '*+ ", ##) # " -. /0 " 1 2 " 3. SIMULATION 7 " - 4.

La simulation probabiliste avec Excel

GUIDE DE DÉMARRAGE. SitagriPro Infinite FINANCEAGRI. Un service. c o r p o r a t e

Cartographie mobile implantée au service de police de la ville de Québec

Note de cours. Introduction à Excel 2007

Séries Statistiques Simples

PROFIS Installation. Module 4: Module 3D Design

Logiciel ArpentGIS-PC Guide de l utilisateur

Les algorithmes de base du graphisme

Transcription:

Analyse exploratoire de données spatiales GeoXp et Géomarketing Christine Thomas-Agnan - Thibault Laurent Toulouse School of Economics en collaboration avec Jean-Pascal Garcia ELLIPSA 1 / 19

1 Présentation de GeoXp 2 Application Géomarketing : exploratoire 3 Application Géomarketing : modélisation 2 / 19

Le projet GeoXp Analyse descriptive interactive de données géoréférencées : explorer des bases de données en tenant compte de la position géographique des observations. Les SIG (systèmes d information géographique) tels que ArcView et Mapinfo sont très performants pour cartographier mais incorporent peu d outils de statistique spatiale Besoin d un logiciel interactif, indépendant (pas lié à un SIG), gratuit et complet. Historique : développé à UT1 Capitole depuis 2001, Splus, Matlab et finalement un package de R disponible sur CRAN en 2007, de nos jours version 1.6.0 3 / 19

Principe de GeoXp GeoXp lie de façon dynamique des graphiques statistiques avec une carte Nature des graphiques statistiques classiques : histogrammes, boîtes à moustaches, diagramme de dispersion, courbe Lorentz, etc. spécifiquement spatiaux : nuage de variogramme, diagramme de Moran Lien dynamique La sélection d un point ou d une zone sur la carte résulte en la mise en évidence des éléments correspondants du graphique statistique (changement couleur et/ou symbole) La sélection d un élément du graphique statistique résulte en la mise évidence des points ou zones correspondantes sur la carte (changement couleur et/ou symbole) La sélection peut se faire par point ou par polygone. 4 / 19

Interface de GeoXp : trois fenêtres 5 / 19

Format des données Les données ainsi que les contours géographiques doivent être importées sous R, par exemple avec maptools ou rgdal Elles doivent être ensuite mises à l un des deux formats suivants de classe Spatial (package sp), de même que pour les packages geor, gstat, spdep SpatialPointsDataFrame SpatialPolygonDataFrame en utilisant les fonctions readshapepoly (librairie maptools) ou readogr (librairie rgdal). 6 / 19

Exemple de syntaxe R> library("geoxp") R> data("mp.school") R> mp.school_coord <- cbind(mp.school$longitude,mp.school$latitude) R> mp.school_sp <- SpatialPoints(mp.school_coord) R> mp.school_spdf <- SpatialPointsDataFrame(mp.school_sp,mp.school) R> shp.file <- system.file("shapes/school.shp", package = "GeoXp")[1] R> mp_map <- readshapepoly(shp.file) R> mp.contour <- spdf2list(mp_map)$poly R> scattermap(mp.school_spdf, c("occupancy.rate","cost.per.student"), quantiles=c(0.25,0.75), carte=mp.contour, pch=15, cex=0.9, xlab=c("occupancy rate","cost per student")) 7 / 19

Exemple : histogramme Coût par élève : sites sélectionnés par clic de souris sur les barres de l histogramme et représentés en rouge sur la carte. 8 / 19

Exemple : histogramme Coût par élève : sites sélectionnés par clic de souris sur les barres de l histogramme et représentés en rouge sur la carte. 8 / 19

Exemple : histogramme Coût par élève : sites sélectionnés point par point ou par polygone sur la carte et représentés en rouge sur l histogramme. 9 / 19

Exemple : histogramme Coût par élève : sites sélectionnés point par point ou par polygone sur la carte et représentés en rouge sur l histogramme. 9 / 19

Options possibilité de sauvegarder la sélection pour analyse ultérieure possibilité de corriger une sélection en cours possibilité d afficher des labels ajout de graphiques supplémentaires (semi-interactifs) bubbles sélection non interactive 10 / 19

Objectifs analyser des tendances analyser des structures de voisinage analyser la présence d autocorrélation spatiale 11 / 19

Application Géomarketing : exploratoire Un jeu de données Régions Aquitaine et Midi-Pyrénées (6317 iris). Magasins d une enseigne de type ameublement, décoration, électroménager, TV, etc. et 29 magasins d enseignes concurrentes. Graphique des CA des magasins (enseigne et concurrence) 12 / 19

Application Géomarketing : exploratoire Concentration du potentiel cumulé Potentiel : P ij CA du magasin j provenant de l iris i. Potentiel total de l iris i : somme des potentiels sur tous les magasins (enseigne et concurrence). Produits blancs : 86 % des iris aux plus faibles potentiels concentrent 50 % du potentiel total (correspondant à des dépenses de moins de 277090.33 euros sur la période d interêt) agglomérations toulousaines et bordelaises. 13 / 19

Application Géomarketing : exploratoire Potentiel blanc par habitant Pour la magasin E085, sélection d iris ayant un fort potentiel par habitant comparé à des iris à même distance de E085. hristine Thomas-Agnan - Thibault Laurent (TOULOUSE GeoXp SCHOOL et Géomarketing OF ECONOMICS) 14 / 19

Application Géomarketing : exploratoire Zone de chalandise basée sur les distances-temps Zone de chalandise du magasin E085 basée sur les distances-temps. Une imputation des distances manquantes a été réalisée par régression linéaire. 15 / 19

Application Géomarketing : exploratoire Zone de chalandise basée sur le CA observé Zone de chalandise du magasin E085 basée sur les CA : les 29 % des iris ayant réalisé les meilleures recettes comptabilisent 90 % du chiffre d affaire total du magasin 16 / 19

Application Géomarketing : modélisation Modèle de Huff CA ij chiffre d affaire du magasin j provenant de clients de l iris i D ij distance entre magasin j et iris i P i population iris i S j surface du magasin j log(ca ij ) = α + β 1 log(1 + D ij ) + β 2 log(1 + P i ) + β 3 log(sj) + ɛ ij Selon Produit Blanc/Brun et selon Dans ou Hors agglomération toulousaine/bordelaise. Pour produit Blanc et dans agglomération toulousaine/bordelaise, on trouve β 1 = 1.43, β 2 = 0.39, β 3 = 1.45 avec un R 2 ajusté de 0.42. 17 / 19

Application Géomarketing : modélisation Zone de chalandise basée sur le CA prédit Zone de chalandise du magasin E085 basée sur les CA : les 27 % des iris ayant réalisé les meilleures recettes prédites comptabilisent 90 % du chiffre d affaire total du magasin. A droite, celle basée sur les CA observés. hristine Thomas-Agnan - Thibault Laurent (TOULOUSE GeoXp SCHOOL et Géomarketing OF ECONOMICS) 18 / 19

Application Géomarketing : modélisation Autocorrélation des résidus Notion de voisinage entre flux : CA ij est proche de CA kj si l iris i et l iris k ont une frontière commune. Avec ces voisinages, le diagramme de Moran représente la moyenne des résidus voisins en fonction des résidus : Autocorrélation spatiale positive nécéssité d utiliser des modèles d interaction intégrant l autocorrélation. 19 / 19