La Grille, moyen fondamental de l analyse



Documents pareils
RÉALISATION DE GRAPHIQUES AVEC OPENOFFICE.ORG 2.3

L a d é m a r c h e e t l e s o u t i l s p r o p o s é s

L analyse boursière avec Scilab

COMPTE-RENDU «MATHS EN JEANS» LYCEE OZENNE Groupe 1 : Comment faire une carte juste de la Terre?

INSERER DES OBJETS - LE RUBAN INSERTION... 3 TABLEAUX

Projet Matlab : un logiciel de cryptage

fiche m mo technique

eproject Manuel utilisateur Version 0.0

GÉODÉSIE, COORDONNÉES ET GPS

Manuel d utilisation 26 juin Tâche à effectuer : écrire un algorithme 2

données en connaissance et en actions?

Freeway 7. Nouvelles fonctionnalités

Pourquoi utiliser des visuels et des logiciels de présentation?

Premiers Pas avec OneNote 2013

Infolettre #18 : Les graphiques avec Excel 2010

IMAGES NUMÉRIQUES MATRICIELLES EN SCILAB

Celestia. 1. Introduction à Celestia (2/7) 1. Introduction à Celestia (1/7) Université du Temps Libre - 08 avril 2008

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES

Utilisation du logiciel ImageJ gratuit

Reconstruction de bâtiments en 3D à partir de nuages de points LIDAR

L ANALYSE DU «PARC SOCIAL DE FAIT» PARISIEN EN 2003 : UNE ANALYSE TERRITORIALISÉE DES PROFILS D OCCUPATION DES PARCS ET DES QUARTIERS

LES TOUT PREMIERS PAS

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007

Débuter avec Excel. Excel

Analyse et interprétation des données

Relation entre deux variables : estimation de la corrélation linéaire

La structure de la base de données et l utilisation de PAST. Musée Royal de l Afrique Centrale (MRAC Tervuren)

FORD C-MAX + FORD GRAND C-MAX CMAX_Main_Cover_2013_V3.indd /08/ :12

Collecter des informations statistiques

EXCEL TUTORIEL 2012/2013

PROBABILITÉS CONDITIONNELLES

COURS DU GEOMARKETING

RECUPEREZ DES FICHIERS SUPPRIMES AVEC RECUVA

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

Épreuve collaborative

Traitement des données avec Microsoft EXCEL 2010

Logiciel XLSTAT version rue Damrémont PARIS

Le Système d Information Routier

Géoréférencement et RGF93

ht t p: // w w w.m e di al o gis.c om E - Ma i l : m ed i a l og i m e di a l o g i s. c om Envoi des SMS

Opérations de base sur ImageJ

Découverte du logiciel ordinateur TI-n spire / TI-n spire CAS

Projet Matlab/Octave : segmentation d'un ballon de couleur dans une image couleur et insertion d'un logo

SINE QUA NON. Découverte et Prise en main du logiciel Utilisation de bases

Traitement numérique de l'image. Raphaël Isdant

Dragon Naturally Speaking 13

Les nombres entiers. Durée suggérée: 3 semaines

Création WEB avec DreamweaverMX

Manuel d utilisation de la plate-forme de gestion de parc UCOPIA. La mobilité à la hauteur des exigences professionnelles

Sommaire. 2. Utiliser la télécommande Télécommande Administrateur Télécommande Utilisateur Échanger une télécommande...

Gestion administrative de la prospection

Démographie des masseurs-kinésithérapeutes

INTRODUCTION AU DATA MINING

Guide de l utilisateur du Centre de gestion des licences en volume LICENCES EN VOLUME MICROSOFT

A chaque couleur dans l'air correspond une longueur d'onde.

La Clé informatique. Formation Excel XP Aide-mémoire

Chap17 - CORRECTİON DES EXERCİCES

Gestionnaire de champs PRO

Renouvellement du conseil d administration du CCAS/CIAS

Guide utilisateur Performance

Guide d'utilisation. OpenOffice Calc. AUTEUR INITIAL : VINCENT MEUNIER Publié sous licence Creative Commons

Problématique : la mutualisation comme solution pour le maintien des services publics en milieu rural

Les clients puissance cube

Access 2007 FF Access FR FR Base

Utilisation avancée de SugarCRM Version Professional 6.5

F7n COUP DE BOURSE, NOMBRE DÉRIVÉ

Exercices de dénombrement

Présentation des équipements d accessibilité dans les gares et les trains

315 et 495 sont dans la table de 5. 5 est un diviseur commun. Leur PGCD n est pas 1. Il ne sont pas premiers entre eux

ACADÉMIE D ORLÉANS-TOURS NOTE D INFORMATION n 21

Les dirigeants face à l innovation

Démonstration d utilisation De NesmaCom

TD Introduction aux SIG avec ArcGis 9

Feuille d exercices 2 : Espaces probabilisés

les outils de vérification de la comptabilité et la clôture de la comptabilité

Aide - mémoire gnuplot 4.0

EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG

Projet de traitement d'image - SI 381 reconstitution 3D d'intérieur à partir de photographies

Créer un document composite avec NéoOffice J et le partager

Modes Opératoires WinTrans Mai 13 ~ 1 ~

démographie des masseurs-kinésithérapeutes

point On obtient ainsi le ou les points d inter- entre deux objets».

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Généralités. Premier lancement

Comment optimiser dans ImageReady?

Rallye Mathématiques de liaison 3 ème /2 nde et 3 ème /2 nde pro Epreuve finale Jeudi 21 mai 2015 Durée : 1h45

MON GUIDE POUR MON RAPPORT

Guide utilisateur des services WASATIS (Manuel Version 1.1)

1. LA DÉMARCHE GEOMARKETING

TABLE DES MATIERES MENTIONS LEGALES INTRODUCTION CHAPITRE 1 : INSTALLATION DE L ALGORITHME CHAPITRE 2 : EXECUTION & OPTIMISATION DU BACKTEST

Baccalauréat ES/L Métropole La Réunion 13 septembre 2013 Corrigé

ANALYSE CATIA V5. 14/02/2011 Daniel Geffroy IUT GMP Le Mans

Chapitre 13 Numérisation de l information

Traitement bas-niveau

INTRODUCTION GENERALE...1 LA CONNEXION ODBC :...1. CONNEXION AU TRAVERS D EXCEL(tm)...6. LOGICIEL QUANTUM GIS (Qgis)... 10

Sous réserve de modifications techniques et des disponibilités, fabrication française.

RapidMiner. Data Mining. 1 Introduction. 2 Prise en main. Master Maths Finances 2010/ Présentation. 1.2 Ressources

Baccalauréat ES Amérique du Nord 4 juin 2008

EXEMPLE DE RAPPORT D'AUDIT. Site Internet

Transcription:

Fiche méthodologie #1 La Grille, moyen fondamental de l analyse Cette rubrique présente des notes et documents publiés par Philippe Latour, enseignant au Master Géomarketing et stratégies territoriales des entreprises et des institutions publiques. Vous pouvez retrouver ces publications, ainsi que d'autres thèmes, développés sur le site www.spatialist.fr ainsi que dans l'ouvrage "Géomarketing : Principes, méthodes et applications" Les représentations traditionnelles et leurs limites Les systèmes d information géographique sont conçus pour afficher une donnée avec un choix de représentations diverses. Afin de positionner une donnée dans l espace, il est indispensable de connaître ses coordonnées. Les coordonnées X,Y traditionnellement utilisées en France dans le système de projection Lambert 2 étendu correspondent au nombre de mètres calculés depuis l intersection de l abscisse et de l ordonnée d un graphique qui contiendrait la totalité du territoire métropolitain (depuis 2002, le système officiel est le RGF 93 et les mètres ont été remplacés par des degrés). A partir d une adresse (lieu repéré dans l espace par une désignation qui existe dans la carte) une opération de traitement, le " géocodage ", permet d obtenir les valeurs X et Y. Celles ci autorisent l affichage automatique d une représentation de la donnée au point précis calculé. L affichage de ce type est appelé symbolique, les éléments servant à représenter les données géocodées étant des symboles.

Tous ces modes de représentation (points, boules, camemberts, histogrammes, logos, codes barre.) peuvent être qualifiés au mieux de descriptifs, sinon d anecdotiques, en ce sens où ils ne peuvent décrire qu un faible volume de données sous une forme fragmentée; ils ne fournissent pas une information synthétique sur la zone étudiée et ne peuvent pas, tels quels, faire l objet de traitements. Dans la pratique, l analyse ne doit surtout pas porter sur un examen visuel de représentations de ce type, car le choix des formes, des volumes et des couleurs, la superposition inévitable d informations fausseront nécessairement le jugement de l observateur. Il est donc indispensable d avoir recours à d autres modes descriptifs dont la lecture ne puisse être mise en question. En outre, dans le cadre d études, il est fréquemment nécessaire de faire appel à des fichiers volumineux, ainsi, par exemple, la population de l ensemble des communes ou la localisation des entreprises implantées sur une agglomération. Prenons l exemple des 45.000 entreprises de Bordeaux; si l on représente l information sous forme de points, la lecture devient impossible, aussi bien pour évaluer la quantité d entreprises et leur concentration (les points se superposent) qu à fortiori pour représenter des valeurs qui peuvent être attachées à chaque entreprise (ses effectifs, son chiffre d affaires,.). Il est, par conséquent, indispensable d utiliser une approche différente qui sache fournir l information requise sous une forme claire, fiable et précise. La réponse va consister à agglomérer les informations de façon lisible selon un mode et une finesse qui seront liés au volume de données et à l étendue du territoire étudié. La méthode d agglomération forme la base de l analyse spatiale et a été conçue dans le droit fil des travaux d économistes en économie spatiale bien connus, comme Lösch et Christaller. Cette méthode repose sur une division homogène de l espace, non pas en hexagones, qui seraient plus complexes à gérer, mais en simples carrés, dont la taille peut se réduire (en théorie) à celle d un point.

Description de la méthode d analyse sur grille Les données, localisées par leur position X,Y, doivent être affectées aux carreaux de grilles (qui seront désignés par le terme "cellules") en fonction des coordonnées X, Y,.. X, Y de chaque carreau. Le chargement des données dans ces cellules homogènes, présente deux avantages essentiels : d une part, il libère l utilisateur des contraintes imposées par les découpages administratifs et lui permet de travailler sur des zones plus fines, d autre part l information à traiter est mise en densité automatiquement ; ainsi dans l exemple qui suit, les effectifs des entreprises sont répartis dans des zones de 30 x 30 m et les valeurs résultantes affectées aux cellules indiquent de façon pertinente la répartition des salariés sur la zone étudiée. Les données affectées aux cellules peuvent être n importe quel type d information disponible dans la base étudiée: le nombre d entreprises présentes dans le périmètre d une cellule (comptage), la somme des valeurs affectées à une adresse (effectifs, chiffre d affaires, consommation des ménages...). Lorsque la source support des données est non plus une adresse, mais une surface, îlot, Iris, commune, canton ou département, (Ex : statistiques de population) la dimension de la surface administrative en question peut être supérieure à celle de la cellule. Dans ce cas, les valeurs devront être réparties en fonction de la surface intersectée par la cellule. Dans l hypothèse où les cellules auraient une taille moyenne équivalente ou supérieure aux surfaces administratives considérées, le principe du calcul est absolument identique, car, dans tous les cas, la cellule pourra intersecter un objet administratif dont il sera nécessaire de distribuer la valeur. Les avantages de l analyse de grille La plupart des logiciels S.I.G. qui ont été conçus à l origine pour traiter principalement la cartographie, se sont convertis au géomarketing qui offre des débouchés potentiels non négligeables. Toutefois l approche technique disponible n apporte pas une réponse satisfaisante pour l analyste : les systèmes traditionnels traitent la carte en objets (dans le sens d objet informatique) : les tronçons de rues, les communes, les îlots,., sont gérés comme des objets et les valeurs des données correspondantes sont affectées à ces objets. Le résultat est trompeur à la lecture : Considérons à titre d exemple la représentation des populations à l Iris sur le nord du département des Hauts de Seine (en dégradés de cyan). L Iris 4E avec 9.938 h sur 8 km2 est représenté comme proportionnellement beaucoup plus peuplé que l Iris 1B avec 5.182 h dont la surface est 100 fois plus faible. Ceci est vrai en valeur absolue; toutefois pour les objectifs du marketing, il est infiniment préférable d avoir par exemple 200.000 prospects dans les Hauts de Seine, plutôt que dans le Sahara. Seule une représentation en densité rendra compte de l intérêt économique d un territoire, comme l exprime la carte suivante (en dégradés d orange), l Iris 1B ayant une densité de population 50 fois supérieure à l Iris 4E, il représente un potentiel marketing bien plus important.

Avantage supplémentaire de l analyse de grille, l organisation de l espace en cellules identiques, homogènes et homothétiques sous forme de carroyage correspond précisément à un modèle mathématique de matrice. Le calcul matriciel est simple et permet de traiter les séries de données avec des opérateurs de type arithmétique, statistique ou booléen. Cette approche autorise ainsi l introduction des moyens de calcul sur les données spatialisées ; ces fonctions ne peuvent bien évidemment pas être mises en oeuvre dans les systèmes qui affectent les données aux objets de la carte. C est sur base de cette capacité au calcul matriciel que l on peut distinguer les outils de géomarketing de ceux de cartographie.

Des précautions évidentes sont à prendre en fonction du type de données à traiter; si l on doit afficher une valeur moyenne, une densité ou une proportion (revenu moyen à la commune, densité de population à l Iris ou part de marché au département, il ne faudra pas répartir ces valeurs en fonction de la surface, mais les attribuer globalement à chaque cellule qui compose l objet géographique considéré. En conclusion, la grande force de l approche de l analyse de grille consiste en l affectation permanente de la donnée (Chiffre d affaires, consommation,..) à la position géographique réelle et précise de son support (Société, ménage,..) exprimée en coordonnées X,Y. Le traitement des données est ainsi libéré des contraintes liées à la sémantique du découpage de l espace en objets (îlots < Iris < Commune < Canton < Département < Région < Pays), qui se complique encore lors du traitement au numéro dans la rue, une rue pouvant être répartie entre plusieurs Iris. La lecture d une donnée devient donc immédiate, du niveau "n dans la rue" au niveau "pays entier", sans modification du référent (Coordonnées X,Y). Exemples de traitement de séries de données dans l espace La répartition des phénomènes économiques dans l espace fait qu il est souvent difficile d identifier les nuances d une série de données lorsqu il existe une très forte amplitude dans la répartition des données de la série considérée. Ainsi, si l on souhaite représenter l implantation des ménages en France, la densité varie de 0,01 à plus de 50.000 unités au km2. En utilisant un simple affichage en densité, le dégradé de couleurs en mode 32 bits, fait apparaître un point noir sur Paris et un dégradé de couleur quasiment uniforme sur le reste de la France. Un phénomène identique est constaté dans le cadre de l analyse de la plupart des données économiques à cause du poids considérable de la région parisienne. On appliquera donc une opération de statistique descriptive, la discrétisation, qui consistera à repartir les 20.344.520 ménages en classes de taille identique. Le nombre de classes doit être laissé au choix de l opérateur; toutefois, sur des séries de données importantes, il sera recommandé de choisir dix classes de chacune environ 2.034.452 ménages.

En affectant un degré de couleur à chaque classe dont les valeurs varieront de 1 à 10, on obtient une représentation beaucoup plus lisible de l implantation des ménages. Enfin, en regroupant les 5 classes de plus forte densité (classes 6 à 10) et en leur affectant une couleur spécifique (rouge), puis les 3 classes suivantes (3 à 5) avec une autre couleur (orange), et enfin les deux dernières (1 et 2) d une troisième couleur (jaune), l observateur est à même de visualiser directement l implantation de 50 % (en rouge) ou 80% (en rouge + orange) des ménages qui habitent dans les zones à plus forte densité. La répartition 80 / 20 est intéressante dans la mesure ou elle confirme dans la plupart des cas le principe de la loi de Pareto. Ici, 80% de la population est implantée sur environ 20% du territoire. Moyennes, corrélations et écarts à la régression Lorsque deux phénomènes économiques paraissent liés, il est intéressant d utiliser l analyse bivariée qui consiste à appliquer un calcul de régression de Y en X et de X en Y, pour vérifier le niveau de lien entre deux séries de données. Ainsi les ventes d un produit d équipement des ménages semblent très étroitement liées à la densité de population de la zone étudiée : On effectuera, dans un premier temps un calcul de pénétration de marché (valeur des ventes / population des ménages). Pour une meilleure lecture du résultat, l affichage est réparti en classes partagés sur base de la valeur de l écart type; à ces sous ensembles sont affectées des couleurs discriminantes. La représentation de la série obtenue est globalement assez homogène, avec une moyenne à 7,5% et un écart type de 0,036. Par contre, certaines cellules indiquent une très forte pénétration (72%), le minimum étant à 0,14%. On constate, en particulier, une très forte pénétration de marché aux alentours de Rennes;

Dans le cadre d une analyse géomarketing, l inconvénient majeur d une analyse de pénétration de marché par recours classique à la division des valeurs des ventes par les valeurs de marché, est que, si la valeur du marché d une zone est très faible et que les ventes sur la même zone soient proportionnellement élevées, une lecture peu attentive du résultat sur la carte pourra faire penser que l on a identifié une zone intéressante dans l absolu. Le raisonnement est également valable à contrario, où l on constate, par exemple, ci dessus que la ville de Rennes est proche de la moyenne avec 7%, ce qui occultera la valeur absolue attachée aux ventes et correspondant à ce demi point de différence avec la moyenne. Une méthode plus efficace pour faire apparaître les écarts significatifs en valeur absolue, consiste à utiliser le calcul d écarts à la régression spatiale. Dans notre exemple, l étude de la régression ventes / ménages et ménages / ventes, réalisée sur l intersection dans l espace des deux séries à prés de 100%, fournit deux droites très proches dont l angle de régression est très faible. La configuration du nuage de points présente une forte densité. Toutefois, on constate qu un certain nombre de points (les résidus en statistique) échappent au nuage, aussi bien dans le sens d une pénétration beaucoup plus forte du marché par rapport à la population, qu au contraire dans le sens d une pénétration plus faible. Comme aucune variable explicative immédiate ne justifie le phénomène, on aura recours à une représentation dans l espace avec, au préalable, une analyse des écarts à la régression. Cette analyse confirme les conclusions précédentes, avec des positions extrêmes relativement dispersées (- 20 à +56) et un écart-type de seulement 2,66. La localisation des écarts sur une carte permet de visualiser les valeurs les plus importantes sur les zones les plus fortement urbanisées. La carte démontre, en outre, que les communes à population relativement faible, mais à écart élevé (très forte pénétration de marché), sont limitrophes des villes les plus importantes. Les villes de taille moyenne (10-25.000 ménages) ont une consommation supérieure à celle du nuage, alors que Brest (62.000 ménages) est dans la moyenne et que la commune de Rennes (84.000 ménages) est très en retrait.

Pour cette dernière, la faiblesse de consommation du produit concerné est compensée par une sur - consommation de la part des communes avoisinantes. Ce mode de représentation donne une meilleure idée des ventes, puisque n apparaissent comme significatives que les zones où les valeurs absolues des différences sont fortes; ainsi les 0,5 points de sous réalisation par rapport à la moyenne, à Rennes, correspondent à 1.319 ventes et les 65 points de sur performance de la commune voisine portent sur seulement 780 ventes. Les deux exemples présentés illustrent les capacités offertes par l analyse de grille. Celle ci de par sa configuration matricielle permet l utilisation de nombreuses autres fonctions ouvertes issues des opérateurs mathématiques classiques.