MISE EN PLACE D UNE COUCHE D OCCUPATION DES SOLS A PARTIR D IMAGES SATELLITES. Guide Technique Version 2015
|
|
|
- Jean-Pierre Dumas
- il y a 8 ans
- Total affichages :
Transcription
1 MISE EN PLACE D UNE COUCHE D OCCUPATION DES SOLS A PARTIR D IMAGES SATELLITES Guide Technique Version 2015
2 INFORMATIONS CONTRACTUELLES Direction générale de l'aménagement, du logement et de la nature Ministère du logement et de l'égalité des territoires / Ministère de l'écologie, du développement durable et de l'énergie Arche de la Défense Paroi Sud FR La Défense Cedex Organisme(s) commanditaire(s) Direction Régionale Eau Aménagement Logement Rhône-Alpes Adresse postale : DREAL Rhône-Alpes, CEPE/UDG LYON CEDEX 06 Adresse physique : 5 place Jules Ferry (immeuble Lugdunum - métro Brotteaux) Lyon Magali Di Salvo-Delehaye Responsable de l'unité des données géographiques tel : mel : [email protected] Références administratives Affaire n C14ST commandée le : 20 mars 2013 Affaire suivie par Jacques BOUFFIER Jacques BOUFFIER Cerema / Direction Territoriale Sudouest / Délégation de Toulouse HISTORIQUE DES VERSIONS DU DOCUMENT Version Date de validation Commentaire V /10/2014 Jacques BOUFFIER - Intialisation V /01/2015 Jacques BOUFFIER - Premier Jet V /01/2015 Thomas GOARANT / Anne MISSERI / Jacques BOUFFIER / Intégration parties DterCE au premier jet V0.3 10/02/2015 Intégration de la relecture de Laure CHANDELIER, Anne MISSERI et Thomas GOARANT V0.4 17/02/2015 Intégration de la relecture de Dominique HEBRARD V0.5 03/03/2015 Intégration de la relecture de Lucie CHADOURNE FACON VALIDATION DU DOCUMENT Rédacteurs Contributeurs Jacques BOUFFIER Chargé de projets Thomas GOARANT Chargé d études SIG Dominique HEBRARD (également relecteur) Chargé d études Courriel : [email protected] Tel : Courriel : [email protected] Tel : Courriel : [email protected] Tel :
3 Relectrices Validé par Arnaud MAYIS Assistant d études Sébastien RUCQUOI Chargé d études Laure CHANDELIER Chargée de projets Anne MISSERI CETC-CTCS Lucie CHADOURNE-FACON Directrice adjointe de la Dalett Courriel : [email protected] Tel : Courriel : [email protected] Tel : Courriel : [email protected] Tel : Courriel : [email protected] Tel : Courriel : [email protected] Tel : MÉTADONNÉES Référence documentaire Titre Description Auteur(s) N ISRN : Cerema DterSO FR Mise en place d une couche d occupation des sols à partir d images satellites Guide technique Date du rapport Janvier 2015 Mots clés Mots clés géographiques : Pays, région(s), département(s), commune(s) Type Règles de diffusion Jacques BOUFFIER Anne MISSERI Thomas GOARANT Images satellites Télédétection Occupation des sols Région Rhône-Alpes Rapport technique En cas de confidentialité, indiquer le motif admis par la commission d accès aux documents administratifs (CADA) ( : Le document contient des secrets (délibération du gouvernement, défense nationale, politique extérieure, vie privée, industriel et commercial). La communication du document peut nuire au déroulement d une procédure contentieuse, à la recherche d infractions fiscales ou douanières, à la sûreté de l Etat et à la sécurité publique. La communication de ce document est interdite par la loi. Document intermédiaire ou préparatoire à une décision. Rapport nominatif comportant un jugement de valeur sur une personne physique citée ou identifiable. Source : Circulaire no du 26 février 2001 relative à la littérature grise : repérage, traitement, diffusion et valorisation sur Internet et Intranet des rapports d études et de recherche du ministère de l équipement, des transports et du logement Droits Ce document ne peut être reproduit en totalité ou en partie sans autorisation expresse du Cerema, de la DGALN ou de la DREAL Rhône Alpes
4 SYNTHESE DU RAPPORT Les besoins de caractérisation de l occupation des sols sont forts et multiples pour répondre au contexte réglementaire de suivi des politiques publiques de gestion économe de l espace. Les méthodes de suivi des territoires habituellement retenues par les services de l État et les collectivités en charge de l aménagement des territoires reposent principalement sur l utilisation de bases de données existantes. Cette approche, qui donne un premier niveau de résultats, présente toutefois certaines limites en termes d homogénéité de l information ou de fréquence de mise à jour. Les technologies d observation de la terre par satellite sont entrées depuis quelques années dans une phase de maturité nouvelle permettant d envisager leur utilisation opérationnelle pour ces thématiques. Ce rapport est un guide technique présentant une méthodologie expérimentale de production de couches d occupation des sols basée sur l utilisation d algorithmes de traitements semi-automatiques d images appliqués à des images satellitaires sur des emprises départementales ou régionales. Ce type de traitement seul n étant pas suffisant pour produire des couches de qualité maximale, le rapport présente également comment utiliser de manière complémentaire et cohérente des bases de données existantes sur un territoire. Ce guide est à destination de tout service souhaitant produire des couches d occupation des sols en interne ou souhaitant avoir des éléments techniques pour la mise en place de cahier des charges basés sur cette approche. Il détaille chacune des étapes méthodologiques, et est à destination d utilisateurs ayant déjà une connaissance de base des outils de télédétection et de géomatique. Page 4 / 106
5 1.INTRODUCTION CONTEXTE DE L ETUDE APPROCHE GENERALE DE LA CREATION D UNE OCS LES SPÉCIFICATIONS INTRODUCTION SPÉCIFICATIONS SÉMANTIQUES NOMENCLATURE CONFUSIONS SEMANTIQUES L AGGLOMERATION DE L INFORMATION SPÉCIFICATIONS GÉOMÉTRIQUES TAILLE DES PLUS PETITS ELEMENTS IDENTIFIES PRECISION GEOMETRIQUE REGLES TOPOLOGIQUES SQUELETTE LINEAIRE SPÉCIFICATIONS TEMPORELLES MILLESIMES ET FREQUENCES DE MISE A JOUR HOMOGENEITE TEMPORELLE DE L INFORMATION AUTRES SPÉCIFICATIONS LES SPECIFICATIONS RETENUES POUR L OCS LA METHODOLOGIE - GENERALITES LES OUTILS DE TRAVAIL LES DONNEES IMAGE LES DONNEES EXOGENES LES LOGICIELS LE MATERIEL INFORMATIQUE NECESSAIRE LES COMPETENCES TECHNIQUES REQUISES GENERALITES SUR L APPROCHE METHODOLOGIQUE LA METHODOLOGIE - DETAILS CHOIX ET OBTENTION DES IMAGES SATELLITES INTRODUCTION LE CHOIX DES IMAGES GENERALITES SUR L IMAGERIE SATELLITAIRE LES CARACTERISTIQUES LIEES AU CAPTEUR LES CARACTERISTIQUES LIEES AUX CONDITIONS D ACQUISITION LES CARACTERISTIQUES LIEES AUX TRAITEMENTS OBTENTION DES IMAGES LES INFORMATIONS D APPRENTISSAGE PRETRAITEMENTS PREPARATION DES IMAGES SATELLITES MISE EN FORME DES IMAGES SATELLITES ENRICHISSEMENT DES INFORMATIONS DE L IMAGE SATELLITE LES NEOCANAUX LE CHOIX DES NEOCANAUX AMELIORATION DES INFORMATIONS D APPRENTISSAGE PRINCIPE GENERAL LE NETTOYAGE PAR INDICES SEUILLES LE SOUS ECHANTILLONAGE CLASSIFICATION DE L ENSEMBLE DE L IMAGE POST-TRAITEMENTS LA FUSION DES MICRO-CLASSES LES OPERATIONS DE LISSAGE L UTILISATION DE BASES DE DONNEES EXOGENES PRINCIPE PREPARATION DES INFORMATIONS EXOGENES DETERMINATION DE REGLES DE POST-TRAITEMENTS LE POST-TRAITEMENT DIRECT...66 Page 5 / 106
6 LE POST-TRAITEMENT INDIRECT L INFORMATION DE CORRECTIONS ISSUES DE BASES DE DONNEES EXOGENES LA VECTORISATION ET LA GESTION DE L UMC LE MODELE DE DONNEES L INFORMATION USAGE DES SOLS PRINCIPE GENERAL EXTRACTION DE L INFORMATION D USAGE DES BD EXOGENES CREATION DE LA COUCHE USAGE APPLICATION DE L USAGE A LA COUCHE D OCS COMPLEMENTS LE PARAMETRAGE INTRODUCTION LES METHODOLOGIES DE CALIBRATION LES INDICATEURS DE QUALITE STABILITE DE LA METHODOLOGIE LES METHODES DE RECHERCHE LA MISE A JOUR LES TEMPS PASSES CONCLUSION GENERALE...89 GLOSSAIRE ANNEXES...95!"#$ %!"#$% & '(!)*!)++, (-%. /"!")*!%. 0 1!)2((%. 3 "*!)& 4 15"*!)& 6 "!7"- "&%!-! &0!! &0 8)!)*!9&4 % 8!5!"*:!: 7. & ;#)04 1 8)/6 1 +9*! <! 1 '(!! '(!2 Page 6 / 106
7 !% 1% '(!!-!=;1 1& & 1. "!7)+ >. 10 /) '(!)!2! )*!"*, ",?!: '()!/@&!A@ B :&! '()!/A@ B 6:&! /1 <<?' 1 8!5!C/2(2* 1 '(!2!A1!; 1% /!# 1& '(!)!"!!#!% 1. '(!2+;& 10 C2!/+2!!;*6%& 13 ")! )!!6<! B'7B"D>%6 14 '(!)!D!%6 16 8!2" '(!!/@.!#!+% 1 '(!)!B'7!E#% 1 '(!)77-!#%% 1 '(!!7%& 1% '(!(%0 1& '(!!%4 1. '(!7&6 10 '(! "*!*"+&& 13 '(!*&. 14 '(!*&3 16 B"!#)!+!!F 2(-.6 1 *!!. 1 '(!!2*"G.3 1 8"!)H0 1% '(!79!5!+C*-0 1& '(!++0 1.?!)0& 10!+2+!29!-03 Page 7 / 106
8 13 8(!)"D!! )2#36 14!I<!*3 1%6 '(!""7!#(!-: *(3 1% =!#!7I!7&* **93 1% '(!(!-3% 1% '(!)7)- "3% 1%% "!<9 3& 1%& "!<9 3. 1%. "!<9 3. 1%0?!!24. 1%3?!!22" #40 1%4 =#*!+43 1&6 =##)!<-"44 1& =##)!<"6 1& #*!#!!#!F :H!(!" *2+; 15!!! @+. Page 8 / 106
9 @+4 '(!!#*<&66!L00 '!"!! *!"33 Page 9 / 106
10 1. INTRODUCTION 1.1. CONTEXTE DE L ETUDE Les besoins liés la caractérisation de l'occupation du sol sont multiples et à fort enjeu : étude de l'étalement urbain, localisation et quantification de la dynamique des territoires, suivi de l efficacité des politiques publiques de gestion économe de l'espace, cartographie des corridors écologiques. Ces thématiques font l objet d études dans les services de l État et des collectivités, selon des méthodologies généralement basées sur l'exploitation de bases de données existantes (Référentiel Grande Echelle de l'ign, fichiers fonciers, registre parcellaire graphique...). Actuellement, peu de méthodes opérationnelles utilisent des couches d'informations issues de traitements automatiques d'images satellites malgré des avantages forts en termes d actualisation potentielle de la donnée et d approche globale sur de grands territoires. Le monde de l'imagerie satellitaire est entré ces dernières années dans une phase de maturité nouvelle. Sur le plan technique, les satellites d'observation de la terre sont de plus en plus nombreux et de plus en plus performants en termes de précision ou de capacité de revisite. Sur le plan institutionnel également, des programmes forts de développement des applications satellitaires et de mise à disposition des données (Copernicus, Géosud/THEIA) ont vu le jour. Illustration 1: Vue d'artiste du satellite Pléiades. De même, de nombreux logiciels libres et performants pour le traitement d images satellites se développent [1] et les méthodes d extraction d informations sont de plus en plus perfectionnées. Le Pôle de Compétences et d Innovations «Applications Satellitaires et Télécommunication» du MEDDE (PCI AST), localisé au sein de la Direction territoriale du Sud-Ouest du Cerema, a pour mission d aider les services institutionnels à intégrer les technologies satellitaires dans leurs méthodes de travail. Dans ce contexte, le PCI AST a déjà travaillé sur l utilisation d images satellites pour la constitution de couches d occupations du sol (OCS) à différentes échelles, sur des emprises locales (Toulouse, Bordeaux) à régionales (Limousin, Rhône-Alpes). La place de l'image satellite pour l'étude des différentes thématiques liées à l'occupation du sol dans le contexte actuel ou dans un futur proche est analysée dans le rapport «Place de l'imagerie satellitaire pour l étude de l occupation des sol» rédigé par le PCI «Application Satellitaire et Télécommunication» [2]. Le présent rapport a pour objectif de proposer la méthodologie exploratoire développée par le Cerema pour Page 10 / 106
11 construire une occupation des sols de premier niveau de nomenclatures (cinq à dix classes) à partir d images satellites. Il est à destination de tous les services désirant mener des études en interne sur ce sujet ou ayant vocation à mettre en place un CCTP en vue de la consultation d un prestataire de service APPROCHE GENERALE DE LA CREATION D UNE OCS Les méthodes de constitution d une couche d occupation des sols diffèrent selon les spécifications demandées, les moyens disponibles, l expérience du prestataire ou l existence de millésimes pré-existants. Cependant, la constitution même d une couche met toujours en œuvre les mêmes macro-étapes, qui s articulent de la manière suivante : Figure 1: Les principales étapes de création d une OCS Dans le contexte de ce rapport, l utilisateur final est un service de l État ou une collectivité en charge de la mise en œuvre ou du suivi d une politique publique d aménagement des territoires. Son besoin est donc de pouvoir calculer des indicateurs statistiques caractérisant l occupation des sols et son évolution, et, dans une certaine mesure, de localiser et visualiser les changements du territoire. Les spécifications sont la traduction du besoin de l utilisateur en caractéristiques techniques décrivant les propriétés de l OCS. Elles traitent par exemple de la nomenclature recherchée, de la surface des plus petits éléments à identifier, des règles d agglomération des éléments plus fins que cette surface minimale, ou du taux de confusions acceptable. La phase de production proprement dit commence par le choix et l obtention des données de base. Ces données sont généralement des bases de données pré-existantes sur le territoire et des informations images, issues de campagnes aériennes ou d acquisitions par satellite. Les bases de données pourront être directement appliquées, fourniront des informations d apprentissage pour des classifications sur images satellites ou pourront identifier des problèmes en post-traitements. Les images satellites pourront être utilisées pour fournir tout ou partie de l information de l occupation des sols ou pour lever des ambiguïtés. Les prétraitements correspondent à un ensemble de manipulations sur les données sources afin de les sélectionner, les enrichir, de les sous-échantillonner et de les mettre en forme pour la suite. L obtention de la connaissance de l occupation des sols est l étape clé de la méthodologie et de l approche. Ces informations peuvent être obtenues de différentes manières (information directement disponible dans une base de donnée existante, photo-interprétation, classifications automatiques...). Ces différentes approches apportent des informations exhaustives ou non. Les post-traitements sont les manipulations effectuées pour combiner les différents types d informations Page 11 / 106
12 afin d obtenir une description cohérente et exhaustive du territoire. Ils ont également pour objectif d en améliorer la qualité à travers des lissages, des corrections, des fusions, et des mises en cohérence avec les spécifications. L estimation de la qualité interne du résultat consiste à évaluer l adéquation entre le produit et les spécifications. Deux étapes importantes s ajoutent généralement à ces considérations systématiques. D une part, la phase de calibration et de validation de la méthodologie permet de confirmer l approche en amont. Elle se fait sur une ou plusieurs petites zones tests, dans une démarche si possible pro-active avec l utilisateur. D autre part, une OCS n a vraiment de sens qu à travers sa mise à jour selon une méthode cohérente, condition sine qua non pour mesurer une évolution réelle. Cet aspect est à prendre en compte, même lors de la production d un seul millésime, dans le choix des données et de l approche. Figure 2: Les principales étapes de création d une OCS (Détails) Ce rapport décrit pour chacune de ces étapes les enjeux associés et propose une solution pour les mettre en œuvre en s appuyant sur la méthodologie développée par le PCI AST. Illustration 2: Objectif du rapport : décrire les étapes permettant de produire une occupation des sols à partir d images satellites. Illustration sur le département de la Drôme. Images RapiEye issues du programme Géosud Page 12 / 106
13 2. LES SPÉCIFICATIONS 2.1. INTRODUCTION Une couche d occupation des sols se caractérise par un ensemble de critères qui constituent ses spécifications. Les spécifications sont à préciser en amont de la production. Elles traduisent les besoins des futurs utilisateurs en caractéristiques techniques, impactent la méthodologie, permettent d estimer la qualité interne du produit (qui se définit au regard du respect des spécifications) et sont nécessaires pour assurer une cohérence entre différents opérateurs. Ces critères sont de différentes natures [3] [4]. Les spécifications sémantiques sont les critères relatifs à la labellisation des objets de la couche. Elles précisent la nomenclature utilisée, le taux de confusions acceptable entre les classes ou encore les règles de labellisation lors de l agglomération d informations de natures différentes (seuils de recouvrement par exemple). Les spécifications géométriques correspondent aux caractéristiques liées au «positionnement» et au «contour» des objets de la couche : taille minimale des éléments identifiés, unités minimales de collecte ou d intérêt (UMC/UMI), cohérence géométrique entre les objets (présence ou non de doublons, trous...), «contours en adéquation» avec la réalité du territoire, qualité du géo-référencement. Les spécifications temporelles correspondent aux caractéristiques liées à la date de l information. Elles concernent l homogénéité temporelle des informations, leur actualité et leur fréquence de mise à jour. Des caractéristiques diverses complètent ces spécifications, comme la nature et précision des métadonnées, l intégrité et la généalogie de la donnée, la structure du modèle de données, le format de livraison ou l homogénéité de la qualité. Les spécifications d une couche OCS doivent permettre à l utilisateur de répondre à son besoin. Les besoins utilisateurs en matière d OCS sont aujourd hui relativement bien connus et définis par ailleurs [5] [2] [6] [7]. D une manière générale, ils sont relatifs aux exigences réglementaires de calcul d indicateurs chiffrés de mesure, d évolution de l occupation des sols et de spatialisation des dynamiques mesurées. L objet de ce rapport n est pas de refaire l analyse des besoins, le point de départ de l analyse menée est l identification des spécifications. Les spécifications doivent souvent s adapter avec les contraintes techniques (données brutes existantes, ressources en calcul disponibles, délais) et financières du projet. Dans ce rapport, l hypothèse de travail initiale de traitements automatisés sur images satellites à des emprises régionales permet de répondre à un premier niveau de besoins de calcul d indicateurs macro (évolution des surfaces anthropisées, évolution des espaces naturels, agricoles et forestiers par exemple) sur des territoires de taille de SCOT ou supérieure. Des besoins plus fins comme la cartographie précise de la trame verte et bleue par exemple nécessitent des méthodes et des coûts différents. Le rapport développe ici les notions associées aux différents types de spécifications et leur lien avec le besoin utilisateur. Si des exemples sont parfois donnés à titre illustratif, l objectif de cette partie est de rappeler à un commanditaire les points importants à considérer en amont au regard de son besoin. Le lien entre les spécifications et la méthodologie utilisée est présenté dans les parties 3 et SPÉCIFICATIONS SÉMANTIQUES NOMENCLATURE La nomenclature d une couche OCS correspond à la manière dont sont définis et catégorisés les différents éléments du sol. Elle doit permettre à l utilisateur d accéder à l information thématique qu il recherche. Elle est a priori divisée en différents niveaux de précision emboîtés. Le contenu de chaque poste de Page 13 / 106
14 nomenclature est développé exhaustivement par le niveau plus fin qui lui est associé. Chaque élément du territoire doit se retrouver dans un et un seul poste de nomenclature à chaque niveau de précision. Différents cadres et nomenclatures de référence existent au niveau européen, comme la nomenclature Corinne Land Cover [8] ou celle du groupe de travail EAGLE (Eionet Action Group on Land monitoring in Europe) de l EIONET (European Environment Information and Observation Network) [9]. Au niveau national, une nomenclature a été définie en 2014 par un groupe de travail sur l occupation des sols [4] mis en place à la demande de la DGALN, aujourd hui passé sous la tutelle du CNIG, piloté par la DTec TV du Cerema. Cette nomenaclature fournit à l ensemble des utilisateurs et des producteurs de données d occupation du sol un cadre de travail théorique, structurant et consensuel selon quatre dimensions : la «couverture bio-physique» du sol (surface arborées, surfaces herbacées...), l «usage» (agricole, résidentiel...), la «morphologie» (qui qualifie les objets en fonction de l organisation des éléments), et la «caractéristique» (qui définit les objets par rapport à un état ponctuel, présent, passé ou spécifique). Cette séparation en quatre dimensions répond aux exigences de la directive INSPIRE [10] [11]. Illustration 3: Exemple de nomenclature : Extrait de la dimension couverture de la nomenclature nationale Les cases colorées correspondent à la nomenclature retenue pour la méthodologie. Le poste fait ici référence à une classe particulière : le squelette linéaire structurant le paysage, qui est une sous partie des surfaces anthropisées. Cette nomenclature nationale (version janvier 2015) est rappelée en annexe. Le projet Occupation des Sols à Grand Echelle (OCS GE) de l IGN s appuie sur ces travaux et la nomenclature utilisée pour le produit OCS GE est un sous ensemble de cette nomenclature nationale. Le rapport s intéresse principalement à la dimension couverture. L usage, la morphologie ou la caractéristique ne s obtiennent pas sauf dans certains cas avec des méthodes de télédétection. D autres approches sont alors à privilégier. Des exemples sont donnés en fin de rapport sur l intégration d informations sur l usage CONFUSIONS SEMANTIQUES Le taux de confusion des classes mesure la précision sémantique. Il quantifie les erreurs de labellisation entre différentes classes de la nomenclature au regard des spécifications. Il s établit à partir d indicateurs statistiques issus de la comparaison entre l OCS produite et des échantillons Page 14 / 106
15 de contrôle, statistiquement représentatifs, respectant les spécifications et obtenus de manière indépendante. Plusieurs indicateurs statistiques sont utilisables : matrices de confusion, précision globale, kappa, F-Score, kappa multi-échelle [12] [13] [14] [15]... Du fait de la subjectivité des échantillons de contrôle et de l interprétation potentiellement variable des spécifications, ces chiffres doivent toujours être interprétés avec précaution L AGGLOMERATION DE L INFORMATION Les spécifications géométriques précisent les dimensions des plus petits éléments retenus pour l OCS. Des règles de labellisation d informations agglomérées doivent être définies pour interpréter des éléments plus fins susceptibles d être détectés, par exemple dans le cas de terrains de couverture mixte. Ces règles se traduisent généralement au regard de taux de recouvrement. Le taux de recouvrement est le rapport en pourcentage entre la surface du terrain recouverte par un élément et la surface totale de l élément englobant. Par exemple, le label d un parking goudronné ombragé (sur lequel des arbres sont plantés) peut dépendre du taux de recouvrement par le couvert arboré (défini en prenant en compte la projection verticale des houppiers). La règle peut, comme c est par exemple le cas pour les spécifications de la couche OCS GE de l IGN, consister à dire que si le taux de recouvrement est inférieur à 75 % (par exemple), le parking est labellisé «surfaces anthropisées», sinon, il est labellisé «végétation ligneuse». Des critères de continuité impactent également la labellisation ou la géométrie d un polygone de manière indépendante de ce qu il couvre mais au regard de sa position par rapport à son environnement. Par exemple, il peut être décidé, comme pour l OCS GE de l IGN, d agglomérer les bâtiments distants de moins de 10 m les uns des autres avec un comblement de l espace interstitiel SPÉCIFICATIONS GÉOMÉTRIQUES TAILLE DES PLUS PETITS ELEMENTS IDENTIFIES La taille des plus petits éléments identifiés se caractérise par différents indicateurs. L UMC (Unité Minimale de Collecte) est la surface des plus petits éléments identifiés dans la couche. L UMI (Unité Minimale d Interêt) est la surface des plus petits éléments identifiés dans la couche par type de classe. Une UMI est donc une UMC spécifique à certains éléments de la nomenclature. La LMC (Largeur Minimale de Collecte) est la largeur minimale d un objet pour qu il soit intégré à la couche. Lorsque cette largeur dépend du type de classe, on parle de LMI (Largeur Minimale d Intérêt). Dans la même logique, la HMC ou HMI est la Hauteur minimale pour intégrer un objet dans la couche. Le choix de l UMC a un impact direct sur les indicateurs statistiques qui seront extraits de la couche d OCS. Ainsi, une UMC élevée localisera les éléments sous forme de larges tâches et n identifiera pas les phénomènes fins comme le mitage. Une petite UMC aura pour conséquence une prise en compte détaillée des contours des éléments du paysage. Les statistiques correspondantes seront alors modifiées. Des éléments sur le lien entre UMC et échelle d exploitation sont donnés dans le paragraphe À titre d exemple, les UMI de la future OCS GE de l IGN varient entre 200 m² et 2500 m² suivant les classes de la nomenclature. Des règles complémentaires liées aux frontières communes sont parfois utilisées. Une notion complémentaire parfois précisée est la notion de prise en compte de certains éléments du paysage, de superficie inférieure à l UMC, mais supérieure à un certain seuil. Par exemple, la future OCS GE de l IGN identifie tous les bâtiments de superficie supérieure à 50 m², et les dilate jusqu à ce qu ils correspondent à l UMC. Cette spécification permet de garder certaines informations du paysage (mitage...), mais a un impact sur les éventuelles statistiques qui seront déduites ultérieurement PRECISION GEOMETRIQUE La précision géométrique, ou qualité de géoréférencement de la couche OCS, correspond à la précision de localisation des objets de l OCS dans la projection cartographique considérée. Elle dépend de la précision Page 15 / 106
16 géométrique des ortho-images utilisées comme support et de la qualité du géoréférencement des autres bases de données fournissant l information. La qualité géométrique d une ortho-image est principalement conditionnée par celle du modèle numérique de terrain (MNT) utilisé pour l orthorectification. Avec les MNT «classiques», les zones de montagnes sont généralement moins bien géoréférencées que les zones de plaine. La précision géométrique est importante dans la mesure où elle impacte directement la possibilité de pouvoir superposer différentes données REGLES TOPOLOGIQUES Les règles topologiques traitent de certaines propriétés géométriques des polygones, comme la présence acceptable ou non de superposition de polygones, de discontinuités, de micro-polygones, de fermetures anormales (papillons), de nœuds inutiles ou de polygones jointifs de même label SQUELETTE LINEAIRE L OCS GE de l IGN structure le territoire selon un découpage macroscopique reposant sur les principaux axes de communication. Ce découpage est appelé «ossature». Si cette structuration n est pas obligatoire, elle est fortement encouragée pour des raisons de compatibilité et de cohésion spatiale avec les grandes données d OCS existantes. Les spécifications de construction d un tel squelette sont disponibles dans les travaux du groupe de travail national sur le sujet [4] SPÉCIFICATIONS TEMPORELLES MILLESIMES ET FREQUENCES DE MISE A JOUR Les couches d occupation des sols servent généralement à calculer des statistiques d évolution des territoires. Les millésimes des couches doivent être déterminés au regard du pas temporel voulu pour le suivi. Des millésimes «thématiquement partiels», n actualisant que les classes de haut niveau par exemple, s avèrent parfois intéressants. La réflexion sur le choix des millésimes doit être menée le plus en amont possible dans le sens où les contraintes techniques (mise à jour des données brutes, puissances de calcul...) ou financières dimensionnent l approche méthodologique. Si des images satellites peuvent être régulièrement actualisées sur de grands territoires (des couvertures nationales actualisées chaque année sont disponibles dans le cadre du programme Géosud par exemple), d autres données sont mises à jour beaucoup moins fréquemment. Aujourd hui, les bases de données d OCS sont classiquement mises à jour à une fréquence entre 5 et 10 ans. Certains territoires présentent toutefois des mises à jours annuelles ou bi-annuelles, mais généralement sur de petites zones HOMOGENEITE TEMPORELLE DE L INFORMATION L homogénéité temporelle traduit le décalage temporel acceptable de l information des différentes zones du territoire. Cette information est directement corrélée au millésime des données brutes utilisées (image, bases de données...). L actualisation annuelle ou bi-annuelle d un millésime nécessite un rafraîchissement intraannuel du maximum des données brutes. Les images satellites peuvent couvrir rapidement de grands territoires. L homogénéité temporelle ce type d information est généralement de l ordre de quelques mois pour une surface régionale. Cependant, les décalages temporels avec des données exogènes doivent être identifiés, corrigés, ou a minima pris en compte dans les conseils d utilisation. Page 16 / 106
17 2.5. AUTRES SPÉCIFICATIONS Les réflexions amont doivent spécifier d autres critères, comme l homogénéité de la qualité entre les différentes zones et les paysages (les zones urbaines s avèrent souvent plus fiables que les zones de montagne), la structure de la table attributaire (label majoritaire, source des données...), la nature et la qualité des méta-données. Le travail sur la méthodologie commence lorsque l ensemble de ces spécifications ont été précisées LES SPECIFICATIONS RETENUES POUR L OCS Le tableau ci-dessous synthétise les spécifications auxquelles la méthodologie proposée a pour objectif de répondre. Page 17 / 106
18 SPECIFICATIONS SEMANTIQUES LES SPECIFICATIONS RETENUES Nomenclature de la couverture Surfaces anthropisées Squelette linaire (routes principales) Sols nus (éboulis, rochers...) Surfaces en eau Neige éternelles et glaciers Végétation ligneuses Végétation non ligneuse Nomenclature de l usage Taux de Confusions 11. Agriculture 13. Mines et carrières 235. Résidentiel 411. Réseau de transports routiers 412. Réseau de transports ferrés 413. Réseau de transports aérien Seul le taux de confusion de la classification est estimé à travers une matrice de confusion et des indicateurs statistiques associés. Le kappa ( ) doit être supérieur à 0.8 pour la dimension couverture du sol. Un taux de confusion doit être défini pour le produit final, associé à la manière dont il est calculé et le procédé de fabrication de l information de contrôle Agglomération de l information Les polygones de surface inférieure à l UMC sont agrégés avec le polygone voisin partageant la plus grande frontière. Le label du polygone est le label majoritaire de son contenu. SPECIFICATIONS GEOMETRIQUES UMC 500 m² UMI LMC HMC Précision planimétrique Règles topologiques Squelette linéaire Exhaustivité Critère de continuité L UMC est unique pour toute les classes, aucune UMI spécifique n est définie 15 m SPECIFICATIONS TEMPORELLES Sans objet (l information de hauteur n est jamais prise en compte dans la méthodologie) L écart de positionnement entre l objet sur l OCS et les données de référence sont de +/- 5 mètres Pas de doublons, pas de trous, pas de polygones papillon, les données ne contiennent que des objets surfaciques, les polygones sont jointifs, pas de polygones jointifs de même label Oui. Utilisation du squelette linéaire de l IGN ou à défaut du squelette obtenu par la méthodologie fournie par IGN. Couche exhaustive dans la dimension couverture Couche non exhaustive dans la dimension usage Pas de critère de continuité (en particulier, pas de critère de continuité sur le bâti ou sur les éléments linéaires), pas de seuil de prise en compte spécifiques à certains éléments du paysage. Millésimes Millésime Les autres millésimes pourraient être 2005 et Homogénéité temporelle de l information L information a moins d 1 an de décalage sur l ensemble du territoire Tableau 1: Les spécifications retenues pour l OCS Une procédure de qualité interne, à effectuer à réception de la couche et non traitée dans ce document, doit être mise en place pour l évaluation de ces différentes spécifications. Une partie de ces questions est traitée dans la bibliographie [16]. Page 18 / 106
19 3. LA METHODOLOGIE - GENERALITES 3.1. LES OUTILS DE TRAVAIL LES DONNEES IMAGE La méthodologie présentée ici s applique à tout type d images satellites, aériennes ou issues de drones. Différentes résolutions spatiales peuvent être utilisées. En pratique, des résolutions entre 2 et 10 m permettent de travailler sur des surfaces régionales. En raison de temps de calculs importants, des résolutions plus fines sont réservées à de plus petites surfaces (emprises d agglomérations ou de ScoT). Les images ont différentes bandes de couleur. Des images contenant deux à trois bandes dans le visible et une bande dans l infra-rouge (par exemple : rouge, vert, bleu et proche infra-rouge) sont en pratique un minimum. Les informations dans l infra-rouge sont notamment pertinentes pour discriminer la végétation des autres éléments de couverture. Ce rapport ne traite pas de l utilisation d images radar pour ce type d applications, même si cette technologie est pertinente pour certains éléments du sol [17] [18]. Les images doivent être bien géoréférencées pour des raisons de superposition et de compatibilité entre elles et avec les données exogènes LES DONNEES EXOGENES Les données exogènes peuvent être de tout type à partir du moment où elles apportent des informations «pertinentes» sur la connaissance de l occupation des sols : informations thématiques, exhaustives ou partielles, disponibles nationalement ou spécifiques au territoire [19] [20] Si les bases de données classiques permettent d apporter les principaux éléments pertinents, la qualité de la couche finale augmente avec le nombre de données exogènes disponibles. Page 19 / 106
20 LES BASES DE DONNEES CLASSIQUES RGE de l IGN, et principalement la BD Topo RPG LES BASES DE DONNEES EXOGENES UTILISEES La BD Topo est une des composantes du Référentiel Grande Echelle de l IGN qui décrit vectoriellement les éléments du territoire et de ses infrastructures Le Registre Parcellaire Graphique est un SIG permettant l identification des parcelles agricoles sur le territoire français de métropole et d outre mer. Mis à jour annuellement, il sert au calcul des subventions de la PAC. Fichiers fonciers Majic Les fichiers MAJIC sont les fichiers fonciers de la Direction Générale des Finances Publiques qui contiennent des informations sur les propriétés croisées avec le cadastre LES BASES DE DONNEES SPECIFIQUES Casier Viticole Informatisé OCS pré-existantes Corine Land Cover SPOT Thema Urban Atlas Observatoires territoriaux Elles doivent être cohérentes géométriquement (en termes de géo-référencement et d échelle d exploitation) et dans la mesure du possible temporellement avec les images. Suivant leur qualité, elles sont utilisées de plusieurs façons, pour obtenir des informations d apprentissage et/ou en post-traitement par application directe (si l information exogène est imposée) ou indirecte (si l information exogène sert à lever des confusions spécifiques) LES LOGICIELS Identification des parcelles viti-vinicoles Dépend du territoire d étude Inventaire biophysique de l occupation des terres au niveau européen. Du fait de sa faible résolution et sa faible fréquence de mise à jour, il est utilisé dans la méthodologie que pour quelques cas particuliers. Base de donnée d occupation des sols à l échelle des agglomérations développée par Airbus Base de données vectorielle d occupation des sols disponible gratuitement sur les principales villes européennes Dépend du territoire d étude Tableau 2: Les bases de données exogènes utilisables La plupart des étapes décrites dans ce rapport sont réalisables par plusieurs logiciels. Toutes peuvent être réalisées par des logiciels libres, même si certains logiciels payants apportent une plus-value intéressante. Les expérimentations menées par le PCI AST et la DTER CE utilisent les outils suivants. Quantum GIS (QGIS), système d information géographique libre et multi plate-forme, a été utilisé pour les aspects cartographiques, la visualisation vecteur et raster, et certains traitements sur les vecteurs [21]. Les librairies GDAL [22] pour un certain nombre de traitements raster et vecteur, et en particulier à travers la bibliothèque ogr2ogr [23]. L ORFEO ToolBox (OTB) est un outil pour le traitement d images satellites. Les OTB applications permettent d effectuer les différents traitements liés à l extraction d informations à partir des images satellites de manière automatisées [24] [25]. PostgresSQL est un système de gestion de base de données relationnelles et objet, libre (licence BSD) et multiplate-forme. Son module spatial est PostGIS [26]. Sqlite est un système de gestion de bases de données dont SpatiaLite est le module spatial qui peut être utilisé à travers les spatialite_tools [27]. Page 20 / 106
21 Enfin, l enchaînement automatique des étapes est nécessaire pour travailler efficacement sur de grands territoires. Il se fait sous forme de scripts appelant successivement les fonctions des logiciels précédents, par exemple en langage Python, ou en créant des suites de traitements via le modeleur QGIS, exécutables en totalité ou par lot. Suivant l étape du traitement, l une ou l autre des solutions a été appliquée. Illustration 4: Exemple de modèle de traitement sous QGIS pour la rasterisation LE MATERIEL INFORMATIQUE NECESSAIRE Lors de la mise en œuvre opérationnelle de la méthodologie, les données manipulées sont lourdes (compter par exemple 5 Go pour une image couvrant un département) et les traitements effectués sont nombreux et longs (calculs de textures, de classifications, de vectorisation sur de larges territoires, nécessitant jusqu à plusieurs dizaines d heures de calcul chacun). Un découpage en dalles permettant de traiter le territoire morceaux par morceaux ainsi qu une automatisation maximale sont nécessaires. Mais même avec cette approche, les ressources suivantes sont requises à minima. Mémoire RAM Processeurs Disque Dur Écran CARACTERISTIQUES INFORMATIQUES MINIMALES REQUISES 8 Go Au moins 8 cœurs à plus de 3 GHz 800 Go de libre Double écran quasiment indispensable Tableau 3: Caractéristiques informatiques minimales requises pour la mise en œuvre de la méthodologie sur un département Pour des raisons pratiques, le PCI AST travaille sur des machines virtuelles sous Linux, mises en place sur différentes stations de travail. Une organisation de travail distribué permet d utiliser conjointement les ressources de calcul de plusieurs machines. D autres organisations, par exemple sous windows, sont possibles. Idéalement, l utilisation d un serveur de calcul plus puissant permettrait de gagner du temps et d optimiser les ressources LES COMPETENCES TECHNIQUES REQUISES L objet de ce rapport n est pas d expliquer comment fonctionnent les différents logiciels utilisés, ce thème étant traité par ailleurs, notamment dans les liens donnés en fin de rapport. Par contre, des exemples de fonctions à appliquer sont systématiquement donnés pour une mise en œuvre par un utilisateur averti. Une connaissance de base des logiciels présentés ci-dessous (ou de logiciels équivalent) est donc nécessaire pour pouvoir mettre en œuvre la méthodologie. Une montée en compétence pour avoir les pré-requis de base peut être à prendre en compte. Page 21 / 106
22 3.2. GENERALITES SUR L APPROCHE METHODOLOGIQUE Lors de la mise en place d une OCS, le choix de l approche méthodologique générale dimensionne le processus de production. Il correspond au poids donné aux différents procédés d obtention de l information thématique. Les différentes approches d obtention d informations sont présentées ci-dessous. L extraction d informations d une image par photo-interprétation, généralement assistée par ordinateur (PIAO), correspond à la saisie directe d information par des opérateurs qui visualisent l image et digitalisent manuellement l information. Cette méthode nécessite une description précise des éléments à interpréter, une analyse métier du paysage et un calibrage entre interprètes pour limiter les différences d interprétation. Elle est indispensable pour un travail sur une nomenclature fine, mais le traitement est long et coûteux. L extraction d informations d une image par classification automatique utilise des algorithmes pour identifier automatiquement des informations thématiques (label sémantique) selon des critères mathématiques à partir des valeurs radiométriques (couleurs) des pixels. Ces méthodes utilisent ou non des informations d apprentissage. Elles sont aujourd hui peu utilisées dans les services car plus complexes que les méthodes de photo-interprétation pure. Elles se limitent en pratique à des classes thématiques simples, mais traitent toutefois de larges surfaces et fournissent rapidement une caractérisation de l OCS utile pour un premier niveau d analyse. Ce rapport met l accent sur ce type de traitements, tout en proposant des manières de combiner avec les autres. L information contenue dans des bases de données existantes peut provenir elle-même d images (c est le cas de la BD Topo par exemple, basé sur de la PIAO sur images aériennes) ou d autres sources (comme les fichiers fonciers qui proviennent des déclarations d impôts enregistrées par la DGFip). Sauf certains cas particuliers, les bases de données exogènes ne couvrent pas tous les territoires ni toutes les thématiques de l occupation des sols. Elles peuvent être redondantes, contradictoires entre elles, hétérogènes en terme de qualité. Cependant, la sélection, le traitement et le croisement «pertinent» de ces données fournit des informations précieuses pour construire des couches d occupation des sols. Les visites terrain permettent de déterminer avec grande précision le label (y compris d usage) et le contour des polygones. Potentiellement très coûteuse, cette méthode nécessite une cohérence temporelle avec le millésime de la couche d OCS et ne peut être utilisée que de manière partielle sur de larges territoires. Au regard de ces différentes approches, deux macro-scénarios méthodologiques permettent de produire des couches d occupation des sols de premier niveau de nomenclature. Ces couches peuvent ensuite être complétées localement, à partir de méthodes complémentaires basées principalement sur de la photointerprétation fine et des visites terrain. Les traitements pour les classes fines de la nomenclature (niveau 3 et 4 de la nomenclature du groupe de travail national OCS GE) ne sont pas traités ici. Le premier macro-scénario méthodologique repose sur l utilisation croisée de bases de données existantes, corrigées et complétées ensuite par de la photo-interprétation sur images satellites ou aériennes. Des traitements automatiques sont parfois utilisés ensuite comme aide à la décision pour identifier rapidement des zones à corriger manuellement. Ce scénario est pertinent si une nomenclature détaillée est requise (OCS GE de l IGN, si des données de bonne qualité sont disponibles, et si la zone de production est suffisamment petite et/ou si de nombreux photo-interprètes sont disponibles. Ce type d approche est par exemple retenu par l IGN pour sa production de l OCS Grande Echelle. Le second scénario offre une part plus importante aux traitements automatiques dans la mesure où l information de base de la couche d occupation des sols est celle du résultat de classifications automatiques. Ces résultats de classifications sont ensuite corrigés et post traités avec des BD exogènes et parfois des méthodes de photo-interprétation. C est l approche retenue par le PCI AST Les schémas ci-dessous précisent le contenu de ces deux solutions. Les blocs de couleurs différentes ne mettent pas en jeu les mêmes compétences techniques et peuvent être effectués par des opérateurs distincts. Chaque bloc peut par ailleurs être mis en œuvre de différentes façon. Si tous les blocs de couleur ont un intérêt pour améliorer la qualité du résultat, certains sont facultatifs. Une vision générale et transversale doit être assurée pour vérifier la cohérence et le bon enchaînement de chacune des étapes. Page 22 / 106
23 Figure 3: Macro-scénario méthodologique n 1 Dans le premier macro-scénario, l information de base est obtenue par le croisement de bases de données existantes. Cette couche est corrigée et complétée par l action de photo-interprètes. Des traitements automatiques peuvent être utilisés comme aide à la décision pour identifier des zones à traiter plus finement, cette dernière étape (bloc vert) étant facultative. Page 23 / 106
24 Figure 4: Macro-scénario méthodologique n 2 Dans le second macro-scénario, l information de base est obtenue par classifications automatiques sur les images disponibles. Cette couche est corrigée par l utilisation directe et indirect de bases de données exogènes dans un premier temps, puis si nécessaire, de photo-interprétation. Ce rapport décrit de manière détaillée les différentes étapes de production correspondant à l approche du second macro-scénario, selon une méthodologie exploratoire mise en place par le Cerema. Page 24 / 106
25 4. LA METHODOLOGIE - DETAILS 4.1. CHOIX ET OBTENTION DES IMAGES SATELLITES INTRODUCTION Dans la méthodologie de production, l information brute a deux origines : l image satellite et les bases de données pré-existantes. Le choix des données résulte d un compromis entre la qualité de l information, son actualité, sa précision, sa spécificité et sa disponibilité sur l ensemble du territoire. D autres rapports présentent les bases de données existantes, leurs caractéristiques et leurs liens avec l occupation des sols [28] [29] [30] [31]. Cette analyse est plus rare sur les images satellites disponibles, c est pourquoi nous présentons ici les critères de choix de sélection d images satellites et proposons quelques pistes sur la manière de les obtenir LE CHOIX DES IMAGES GENERALITES SUR L IMAGERIE SATELLITAIRE Un satellite d observation est un objet artificiel en orbite autour de la terre. Il est constitué d une plate-forme structurante et de charges utiles (panneaux solaires, antennes de communication, capteurs...). Classiquement, ce type de satellite fait quelques dizaines de centimètres à quelques mètres de long, et pèse quelques centaines de kilogrammes à plusieurs tonnes. Plus de 170 satellites d observation de la terre sont aujourd hui en activité [32]. Chaque satellite a des caractéristiques techniques propres permettant différentes applications : météorologie, géodésie, climat, inventaire et suivi des ressources naturelles ou agricoles, suivi des catastrophes, connaissance des territoires À titre d exemple, des satellites comme ceux de la filière SPOT, Pléiades, RapidEye, Landsat ou les futurs Sentinel sont utilisables pour des applications d occupation des sols. Illustration 5: Exemples de satellites d'observation de la terre. Source : CNES Page 25 / 106
26 Illustration 6: Schéma présentant les grands types d'orbite. Source : Auteur du rapport Ces satellites défilent autour de la terre, généralement en orbite elliptique basse 1. Certains satellites d observation sont parfois beaucoup plus éloignés, en orbite géostationnaire, pour des applications en météorologie 2 par exemple. Ils sont équipés de capteurs qui mesurent une lumière reçue. Cette lumière peut correspondre à la lumière du soleil réfléchie par la surface du sol (capteur passif) ou à la réflexion d une lumière émise par le satellite lui-même, généralement dans des longueurs d ondes correspondant à des bandes RADAR 3 (capteur actif). Ces mesures sont transférées au sol lorsque le satellite entre en visibilité d antennes de réceptions localisées un peu partout dans le monde. Illustration 7: Principe général de l'observation de la terre par satellite 1 Orbite elliptique basse: trajectoires entre 500 et 1000 km d altitude, légèrement inclinées par rapport aux pôles. Les satellites sur ce type d orbite sont mobiles par rapport au sol et font un tour de la terre toutes les 100 minutes environ. Pour un observateur au sol, le passage d un horizon à l autre dure environ 20 minutes. À chaque rotation du satellite, la trace au sol est décalée de quelques milliers de kilomètres vers l ouest. Ce type de trajectoire permet de couvrir l ensemble des points du globe en quelques jours. 2 Orbite géo-stationnaire : trajectoire à km d altitude, localisée sur le plan équatorial, présentant la particularité pour le satellite d être toujours à la verticale du même point de la terre, propriété très utile pour les satellites de télécommunication. 3 Les longueurs d onde radar varient entre 3 mm et 10 m. Les bandes radar les plus classiques sont les bandes L (longueur d onde : cm, fréquence : 1 à 2 GHz), bande C (longueur d onde : 3,75 à 7,5 cm, fréquence 4 à 8 GHz), bande X (longueur d onde : 2,5 à 3,75 cm, fréquence : 8-12 GHz) et bande K (longueur d onde entre 1,11 et 1,67 cm, fréquence entre 18 et 27 GHz). Page 26 / 106
27 La lumière ainsi mesurée correspond à la lumière réfléchie par le sol dans les parties visibles du spectre lumineux (du bleu au rouge ) ou à des parties invisibles par l œil (proche ou moyen infra rouge, microondes, bande C, bande X ). Chacune de ces parties du spectre mesuré fourni une image caractérisant l information contenue dans certaines bandes de fréquence. Ces images constituent les bandes de l image satellite. Illustration 8: Exemple d'image satellite visualisée en composition colorée intégrant l'information de proche infrarouge - Baie du Mont-Saint-Michel (Basse Normandie), 2010 Source : Géosud (C) (2010), RapidEye AG, Germany, Distribution GEOSYS, all rights reserved Les caractéristiques des images satellites utilisées dimensionnent la qualité de l information qui pourra être extraite. Elles peuvent être intrinsèquement liées au satellite et au capteur (résolution spatiale, capteur actif ou passif, résolution temporelle, résolution radiométrique, fauchées, orbites...), aux conditions d acquisition (date, couverture nuageuse, angles d incidence...) ou aux traitements effectués sur l image acquise avant son utilisation opérationnelle (corrections atmosphérique, égalisation radiométrique, fusion panchromatique/multispectrale, orthorectification...) LES CARACTERISTIQUES LIEES AU CAPTEUR La résolution spatiale, en mètres, traduit la taille réelle des pixels, qui sont les plus petits éléments de l image. Une image de résolution spatiale de 2 mètres signifie que les pixels de l image mesurent 2 mètres de côté sur le terrain. En 2015, les images satellitaires à usage civil les plus fines ont une résolution spatiale de l ordre de 40 cm. Suivant les échelles d exploitation recherchées, les images utilisées pour caractériser l occupation des sols ont une résolution entre 40 cm et 10 m. Une même image présente généralement une résolution spatiale différente en fonction du mode «Page 27 / 106
28 multispectral» ou «panchromatique» choisi. Le mode multispectral, parfois appelé XS, correspond à la mesure d'information dans des bandes de fréquences «fines» (rouge, vert, bleu, proche infra-rouge par exemple...). Le mode panchromatique, parfois appelé P ou Pan, correspond à la mesure d'information dans un spectre plus large, correspondant souvent au spectre de l ensemble des autres bandes multispectrales de l image. Ces modes panchromatiques ont la plupart du temps une résolution spatiale deux fois plus petite que les modes multispectraux. La fusion est l opération qui consiste à modifier les bandes multispectrales pour leur donner la résolution spatiale de la bande panchromatique. L image en bandes multispectrales et panchromatiques séparées est généralement appelée bundle, l image après fusion est l image fusionnée. Dans la pratique, il est préférable pour nos applications de travailler directement sur des images fusionnées. Exemple Une image SPOT 5 en bundle contient quatre bandes de résolution différentes : trois bandes XS (une bande à 10 m pour le vert, une bande à 10 m pour le rouge et une bande à 10 m pour le PIR) et une bande P (une bande à 5 m sur l ensemble du spectre entre le vert et le PIR). Une image SPOT 5 fusionnée contient trois bandes de même résolution: une bande verte, une rouge et une du PIR, à 5m. Le choix de la résolution spatiale à retenir pour faire une couche d OCS dépend des spécifications géométriques de la couche, en particulier l UMC retenue. Théoriquement, l UMC d une couche issue de traitements directs sur image satellite est la surface d un pixel de l image. Cependant, le lien entre résolution spatiale et UMC doit prendre en compte les aspects liés à la nature de l image (des effets de «mixel» au niveau des bordures des éléments du paysage peuvent «mélanger» l information du sol sur quelques pixels) et les traitements qui seront effectués (interprétation de l image, classifications automatiques, filtres de lissages, agglomération d informations). En ce sens, l UMC correspond en pratique à plusieurs fois la surface d un pixel. Plusieurs travaux proposent des liens entre UMC et résolution spatiale [33] [34]. Au regard de notre expérience sur différents territoires et différentes résolutions, les correspondances adaptées à la méthodologie de ce rapport correspondent en première approximation avec celles décrites par le tableau cidessous. Page 28 / 106
29 Résolution spatiale de l image Très haute résolution Haute résolution Moyenne résolution Basse résolution UMC minimale conseillée (correspond à une surface de 20 pixels) Echelle maximale d exploitation (on considère arbitrairement que l UMC se visualise au maximum à 0,2 cm x 0,2 cm) Surface d étude adaptée (au regard des temps de calcul associés) 0,5 m 0,0005 ha = 5 m² 1/1 000 EPCI 1 m 0,002 ha = 20 m² 1/2 000 EPCI à Département 2,5 m 0,0125 ha = 125 m² 1/5 000 SCoT à Région 5 m 0,05 ha = 500 m² 1/ SCoT à Région 10 m 0,2 ha = m² 1/ m 0,8 ha = m² 1/ m 5 ha = m² 1/ m 125 ha = m² 1/ InterScot à région Département à région Région à nationale Interrégionale à internationale Exemple d images Pléiades, Géoeye, Worldview... SPOT 6-7 SPOT 5 (Supermode) SPOT 5, Rapid Eye, ALOS, ALSAT, CARTOSAT 1 et 2 SENTINELLE 2, SPOT 1 à 5 Landsat, SPOT 1 à 4 Landsat... MODIS Tableau 4: Correspondance entre résolution spatiale, UMC maximale et échelle d exploitation maximale À titre illustratif, voici une même zone à deux résolutions différentes. Illustration 9: Extrait d'image SPOT 5 en supermode Toulouse - Résolution : 2,5 mètres Source : CNES Distribution Airbus DS / SPOT image Page 29 / 106
30 Illustration 10: Extrait d'image Pléiade Toulouse - Résolution : 0,5 mètres Source : CNES Distribution Airbus DS / SPOT image Si la résolution spatiale est l une des caractéristiques les plus importantes d un capteur, d autres paramètres entrent également en compte dans le choix de l image. La nature passive ou active du capteur permet des applications différentes. Les capteurs passifs offrent une vision du paysage intuitive et facile à interpréter, adaptée aux traitements automatiques et à la thématique de l observation des territoires. Ils permettent également d appréhender le relief du sol dans le cas de prises stéréoscopiques ou tri-stéréoscopiques, qui sont l acquisition de plusieurs images d une même zone avec des angles de visée différents. Ils sont par contre fortement dépendants aux couvertures nuageuses qui cachent l information au niveau du sol. Les capteurs actifs permettent de voir à travers les nuages et permettent l acquisition de clichés de nuit. Leur utilisation est cependant plus complexe pour un utilisateur non confirmé, dans la mesure ou les couches d informations sont différentes des images issues de capteurs passifs (rapports d amplitudes, rapports de phases entre les signaux émis et reçus). Ces images sont intéressantes pour obtenir des informations d humidité des sols, de texture, de phénologie et sont donc plus ou moins directement utiles pour caractériser l occupation des sols. Elles sont également utilisées à travers des traitements dits interférométriques, qui mesurent des changements d altitude fins entre deux images de la même zone. Ces traitements permettent entre autres de suivre dans le temps des déformations verticales du sol avec une précision de quelques millimètres. Dans ce rapport, nous nous focalisons sur des images optiques. La fauchée traduit la taille de la zone couverte par une image. Elle augmente généralement lorsque la résolution spatiale diminue. Elle varie entre 15 et 20 km pour les images à très haute résolution et plusieurs milliers de kilomètres pour les images à basse résolution. La résolution temporelle traduit la capacité de revisite du satellite. Elle dépend de la trajectoire du satellite Page 30 / 106
31 et de son caractère agile ou non. En pratique, la plupart des satellites sont en capacité de revisiter tout point de la terre à quelques jours d intervalle. L acquisition de la zone n est cependant pas systématique et peut dépendre d une programmation préalable. Les bandes spectrales disponibles sont une caractéristique importante du capteur. Ce sont les bandes de fréquence mesurées, correspondant à autant de bandes de l image satellite : rouge, vert, bleu, procheinfrarouge, infra-rouge thermique etc. La résolution radiométrique du capteur est sa capacité à distinguer différentes longueurs d onde. Sa dynamique correspond à la plage de valeurs possibles pour l information d un pixel, et traduit le ratio entre l intensité lumineuse maximale et minimale qu il peut enregistrer. Enfin, l encodage du fichier (8 bits ou 16 bits) est relié à la manière dont est sauvegardée l information. Une image en 16 bits stocke l information de chaque pixel sur 16 bits pour chaque bande, ce qui permet valeurs, même si cela ne veut pas dire que toutes les valeurs possibles sont utilisées (les images Pléiades codées en 16 bits par exemple n ont une information utile que sur 12 bits). Pour de la visualisation simple, une image en 8 bits est préférable car deux fois plus légère et donc plus facile à manier. Pour des traitements automatiques, en encodage en 16 bits est à privilégier LES CARACTERISTIQUES LIEES AUX CONDITIONS D ACQUISITION Un même capteur fournit des images différentes suivant les conditions de prises de vue. En archive comme en programmation, l angle entre la prise de vue et la verticale est une composante importante dans le choix de l image. Illustration 12 : Visualisation d une même zone (Paris) avec deux angles de vue différents. Gauche : angle élevé. Droite : Angle faible. Source : Astrium Illustration 11: Visualisation de l angle de prise de vue d un satellite Pléiades. Il résulte d un angle par rapport à la trace au sol et d un angle perpendiculaire à la trace au sol. Source : CNES Afin de limiter les problèmes d ombres, de surfaces verticales visibles (façades), de géoréférencement et de distorsion de surfaces, les images avec l angle global le plus faible (moins de 15 ) sont à privilégier dans la mise en place d occupations des sols, surtout dans le cadre d étude d évolutions. Les acquisitions stéréoscopiques (ou tri-stéréoscopiques) consistent à acquérir une même zone selon différents angles. La différence d angle entre les deux (ou trois) images permet de reconstituer le relief au niveau du sol. La date de la période d acquisition joue un rôle direct dans la qualité des informations extraites. Au Page 31 / 106
32 printemps et en été, la forte activité végétale permet de bien discriminer la végétation des autres éléments du paysage en accentuant le contraste entre les objets urbains et non urbains. D une manière générale, pour l occupation des sols, cette période est à privilégier. La couverture nuageuse acceptable est également importante. C est la proportion de l image non exploitable car recouverte par des nuages. D une manière générale, les images ayant une couverture nuageuse inférieure à 5% de l'image sont à privilégier, sauf si l étude se concentre sur une sous partie de l image. Illustration 13: Exemple de couverture nuageuse sur image satellite Images Géosud généralement relâchées LES CARACTERISTIQUES LIEES AUX TRAITEMENTS Dans le nouveau contexte apporté par les futurs satellites Sentinel[35], qui couvriront systématiquement de très larges territoires forcément partiellement nuageux, cette approche est progressivement remplacée par l idée de supprimer les zones nuageuses des images et de combler les trous par des informations d images acquises à d autres dates. Cette méthode a toutefois l inconvénient de fournir des images hybrides et donc non homogènes, ce qui est préjudiciable pour des traitements automatiques ultérieurs. Des conditions restrictives d angles ou de couvertures nuageuses, complétées éventuellement de conflits de programmation, restreignent les fenêtres possibles d acquisition. Des semaines voire des mois peuvent s écouler avant de rencontrer les conditions demandées, dans ce cas, les conditions sont L image brute nécessite avant manipulation des traitements de correction géométriques et radiométriques. Sauf si la compétence est disponible en interne, il est préférable que ces traitements soient externalisés, soit en amont lors de la livraison des images, soit en sous traitance à des experts dans le domaine. Les traitements géométriques ont généralement pour objectif d obtenir une ortho-image, c est-à-dire une image rectifiée dans une projection cartographique, pour laquelle chaque pixel est relié à une localisation fiable. Pour orthorectifier une image, la connaissance de son modèle géométrique et une description du relief du terrain est nécessaire. Différents instruments sont embarqués à bord du satellite afin de fournir une localisation approchée de l image. L orbite peut être mesurée lors du passage au-dessus de balises (réseau DORIS par exemple). L attitude, c est-à-dire les angles qui définissent l orientation du satellite dans l espace, est déterminée grâce aux senseurs stellaires qui mesurent la position de sources connues (étoiles, etc.) et / ou via des gyroscopes qui donnent des informations sur les variations d orientation. Cette localisation approchée est variable selon les satellites (par exemple 25 m pour SPOT 5 4 ). Le modèle de localisation de l image est affiné par des points d appui, détails visibles dans les images et dont la position sur le terrain est connue dans la projection cartographique de travail. Si la zone à traiter est couverte par plusieurs images, des points de liaisons (détails communs sur les parties en recouvrement entre images) peuvent être utilisés afin d améliorer la qualité et/ou de diminuer le nombre de points d appui requis. Le modèle géométrique de l image peut être physique (paramètres de prise de vue : instant du pixel, position et orientation du satellite à cet instant et direction de visée), analytique (fonctions rationnelles) ou échantillonné (grilles de localisation) Le modèle numérique de terrain (MNT) décrit le relief du terrain et permet de corriger les effets de variation d altitude dans l'image. Ce MNT peut être provenir d une autre source de données (RGE Alti, Reference 3D, 4 Page 32 / 106
33 SRTM) ou être constitué à partir des images elles-mêmes si on dispose d un couple stéréoscopique. La mise en place du modèle de localisation fin se nomme spatio-triangulation. L image orthorectifiée est l image brute modifiée par application du modèle géométrique et projetée dans le système de coordonnées souhaité. La précision géométrique de l'ortho-image dépend bien entendu de la précision du modèle géométrique et du MNT utilisés. Elle peut être évaluée théoriquement ou par calcul des distances entre les positions de points, mesurés à la fois sur l'ortho-image et sur le terrain (par exemple, la précision géométrique est de 10 m pour SPOT 5, avec Reference 3D). Dans le cas, où plusieurs images sont utilisées sur la zone, il est nécessaire de mosaïquer les ortho-images calculées à partir de ces dernières Illustration 14: Principe des corrections géométriques Ce niveau de traitement est nécessaire pour la réalisation de couche d occupation des sols : il permet de faire la cohérence avec les autres bases de données utilisées et il conditionne la précision de géoréférencement du produit final (voir 2.3.2). La qualité des traitements géométriques dépend particulièrement des points d appui et du MNT utilisé. Dans un souci de compatibilité géométrique entre les différentes sources de données, il est impératif que les outils utilisés pour le géoréférencement soient vérifiés. En particulier, fournir le bon MNT et la bonne image de référence pour l orthorectification est parfois indispensable. Aujourd hui, cette référence est donnée en France par les données IGN, dont la précision planimétrique est «de l ordre du mètre». Les traitements radiométriques consistent à modifier les valeurs des pixels pour corriger certains défauts liés à la traversée de l atmosphère (diffusions, atténuation, réfraction, absorption ) ou pour homogénéiser des images entre elles. Pour notre méthodologie, les corrections atmosphériques sont intéressantes mais non indispensables, l homogénéisation (ou égalisation) radiométrique entre différentes images est déconseillée même si elle permettrait dans une certaine limite de traiter plusieurs images de la même manière, à condition que la date d acquisition des différentes images ne soient pas trop éloignées (la couverture végétale change sensiblement selon la saison par exemple). En effet, l égalisation détériore potentiellement l information brute, appliquer un traitement spécifique à chaque image est préférable. Dans la suite de la méthodologie, les images utilisées ne sont pas égalisées et les traitements sont effectués séparément d une image à l autre. 5 5 Dans cette approche, le lien entre un objet du paysage et sa radiométrie (couleur) diffère donc selon l image. Cet aspect est développé dans le rapport, notamment dans la partie « Mise en forme des images satellites» Page 33 / 106
34 Illustration 15: Exemple d'image non homogénéisées radiométriquement. La fusion, décrite précédemment, peut être classée dans les traitements radiométrique OBTENTION DES IMAGES Source : images RapidEye Geosud Les critères d obtention des images, en particulier leur coût et leur accessibilité, dimensionnent leur choix. Un catalogue simplifié des principaux satellites d observation de la terre est proposé en annexe 2. Il permet de pré-selectionner les images en fonction des caractéristiques des capteurs décrits précédemment. Dans le cas général, une fois un type d images retenu, le site internet du fournisseur d image correspondant permet d identifier des images d archive déjà acquises et de les sélectionner au regard des critères d acquisitions précédemment décrits. Cette sélection se fait généralement via des portails de diffusion, dont certains liens sont données en annexe ou dans la bibliographie. Si aucune image adaptée n est disponible, le fournisseur peut être contacté pour des acquisitions spécifiques à programmer. Une programmation est plus coûteuse que des images d archives. Des initiatives et des programmes mutualisés d acquisition financent des images et les mettent à disposition des utilisateurs institutionnels de manière gratuite et facile. Ces programmes proposent également parfois des compléments de financement ou donnent accès à des tarifs préférentiels. En raison du coût potentiellement élevé des images, les possibilités offertes par ces dispositifs structurants de l accès à la donnée doivent être étudiées avant tout achat. En 2015, les programmes majeurs d accès à l imagerie satellitaire pour les utilisateurs institutionnels sont les programmes Geosud et Théia. Le projet Equipex Géosud [36] propose gratuitement de nombreuses données satellitaires mutli-capteurs à haute et très haute résolution dont des couvertures nationales actualisées chaque année. Le tableau ci-dessous décrit les spécificités de ces couvertures nationales en métropole. Page 34 / 106
35 Millésime Capteur Résolution Compléments 2014 SPOT 6/7 1,5 m Disponible orthorectifié par image SPOT 5 2,5 m Disponible orthorectifié et dallé, mais non fusionné 2011 RapidEye 5 m Disponible orthorectifié, fusionné et par dalles 2010 RapidEye 5 m Disponible orthorectifié et par département SPOT 5 5 m Disponible uniquement en brut (non orthorectifié et non fusionné) et par scène Tableau 5: Spécification des couvertures nationales disponibles dans le cadre de Géosud Illustration 16: Exemple de couverture nationale disponible dans le cadre de Géosud Illustration 17: Les zones couvertes par des images Pléiades disponibles via le programme Géosud fin 2014 Par ailleurs, ce programme propose des couvertures régionales spécifiques, des images Pléiades (en archive ou à programmer), des images sur d autres pays, des images Radar, des images Landsat 8 et des données Lidar satellitaires. Concrètement, l obtention de ces images se fait de manière simple en deux étapes [37]. La première étape consiste à adhérer au dispositif Géosud en ouvrant un compte. La seconde étape consiste à sélectionner et commander les images à partir du site internet. Des demandes de programmation peuvent également être faites selon une procédure décrite sur le site de Géosud. En complément, Géosud propose des capacités de calcul, met à disposition des utilisateurs des licences de logiciels de télédétection, des appuis méthodologiques et thématiques ainsi qu une mise en réseau entre la communauté scientifique et les acteurs publics. Le pôle THEIA, ou Pôle Thématique Surface Continentale, s intègre dans un processus global de construction d une filière nationale institutionnelle pour l observation des surfaces continentales par satellite. Porté par dix partenaires dont le CNES et le Cerema, ce pôle Page 35 / 106
36 est en cours de construction et a vocation à intégrer le programme Géosud et à le péréniser. À terme, THEIA mettra à disposition par l intermédiaire de son serveur web [38], l ensemble des données Géosud, des images Pléiades issues d un programme du CNES appelé «Recette Thématique Utilisateurs», des images Landsat et Sentinel 2, les produits du programme Kalideos du CNES, des images SPOT issues des programmes SPOT 4/Take 5 et SPOT 5 /Take 5, les données SPOT du programme World Heritage et une composante SPOT 6/7 qui permettra d acquérir des images pour des besoins spécifiques. À court terme, l arrivée des images Sentinel 2 du programme européen Copernicus [39], permettra aux utilisateurs d obtenir gratuitement des couvertures systématiques à 10 mètres de résolution ré-actualisées tous les cinq à dix jours. En parallèle de ces initiatives structurantes (et liées), plusieurs fournisseurs de données satellitaires ont ouvert ou sont en train d ouvrir leurs données d archives. Dans ce contexte, le programme SPOT World Heritage va mettre progressivement à disposition des utilisateurs les images des satellites SPOT datant de plus de cinq ans. L ESA propose également un catalogue en ligne, EOLi (Earth Observation Link), qui permet d'accéder aux données satellitaires ENVISAT, ERS, LANDSAT, IKONOS, DMC, ALOS, SPOT, KOMPSAT, PROBA, IRS, SCISAT. EOLi se présente comme une application java à télécharger et à installer [40]. L'emprise, les métadonnées et les pré-visualisation des images du catalogue sont consultables par l'ensemble du public. Les produits sont libres d'accès et téléchargeables par la communauté scientifique disposant au préalable d'un compte auprès de l'esa. Le programme LANDSAT, développé par la NASA, est composé de huit satellites lancés entre 1972 et Ces images, à 15 mètres de résolution pour les plus récentes d entre elles, sont distribuées gratuitement sur le portail de l USGS (United States Geological Survey) [41]. D autres archives à plus basse résolution (250 mètres), comme les données MODIS [42], sont également disponibles gratuitement. Enfin, des initiatives internationales ont été mises en place pour acquérir des images dans le cas particulier des catastrophes de grande ampleur (inondations, incendies, séismes, tsunamis...). Au niveau européen, le service GIO EMS (ou Copernicus Emergency Management Service) [43] regroupe depuis 2012 les États membres de l Union et les pays participant au mécanisme européen de protection civile. Au niveau mondial, la Charte Internationale «Espace et Catastrophes majeurs» [44] regroupe aujourd hui 15 agences spatiales. Ces programmes acquièrent et mutualisent des images satellites et des produits cartographiques dérivés et les mettent à disposition des utilisateurs institutionnels, qui peuvent les demander en France via le COGIC. Ces images couvrent toutefois de petites surfaces et correspondent à des situations particulières, pas forcément adaptées aux thématiques de l occupation des sols. L utilisation principale de ce dispositif est par ailleurs l utilisation des cartes dérivées plutôt que des images satellites sources. Dans le cadre de la méthodologie présentée dans ce rapport, nous utilisons des images RapidEye issues du programme Géosud. En 2015, le programme Géosud est le dispositif à privilégier pour obtenir rapidement et facilement des images sur de larges territoires. Les images satellites RapidEye utilisées ont une résolution spatiale de 5m, sont encodées en 16 bits, disposent de 5 bandes spectrales (bleu, vert, rouge, vert, red-edge 6 et proche infrarouge), sont issues du millésime 2011, ont été orthorectifiées par IGN pour une précision planimétrique annoncée «de l ordre du mètre» sur le site de Géosud, et ne présentent pas d égalisation radiométriques entre elles. Les traitements sont facilement adaptables à tout type d image de résolution inférieure à 30 m LES INFORMATIONS D APPRENTISSAGE Dans la méthodologie présentée ici, l obtention de l information de couverture du sol repose en grande partie sur des classifications supervisées. Les classifications supervisées sont des traitements automatiques nécessitant des informations d apprentissage. En pratique, les informations (ou échantillons) d apprentissage 6 Le red-edge correspond à une bande de fréquence à la limite du visible, entre le rouge et le proche infra-rouge Page 36 / 106
37 sont des polygones correctement détourés au regard de l image satellite, bien géoréférencés et labellisés selon la nomenclature de l étude. Les valeurs des pixels contenus dans ces polygones caractérisent par la suite la radiométrie des classes qu ils représentent. La classification consiste à identifier pour tous les pixels de l image la classe «mathématiquement la plus proche» au regard des caractéristiques définies à partir de ces informations d apprentissage. Suivant les images et les informations disponibles, plusieurs niveaux de nomenclature peuvent être atteints par traitements automatisés. Certains laboratoires de recherche travaillant sur de petites zones et disposant de nombreuses images au cours des saisons peuvent obtenir avec une «bonne qualité» des couches en 15 à 20 classes d occupation des sols, voire dans certains cas, jusqu à 70 classes [45] [46] [47]. En configuration opérationnelle dans laquelle nous nous plaçons, une seule image satellite est disponible. Le tableau suivant présente la nomenclature que l on peut espérer dans ces conditions en s appuyant sur le cadre défini par le groupe de travail national sur l OCS. Tableau 6: Intérêt des traitements automatisés au regard des classes de la nomenclature nationale D une manière générale, ces échantillons sont obtenus par photo-interprétation directe sur l image satellite ou par utilisation de bases de données exogènes, à condition que celles-ci soient cohérentes avec l image en termes de millésimes, de géoférencement ou de précision spatiale. Si une petite surface d apprentissage est suffisante (1 ou 2% du territoire total), la qualité de la classification sera a priori meilleure avec la plus grande surface d apprentissage possible. Par ailleurs, l apprentissage doit être représentatif de l hétérogénéité des paysages de la zone d étude. Par exemple, les échantillons d apprentissage des surfaces herbacées doivent inclure des zones de cultures, des sols nus agricoles et des prairies, dont les caractéristiques radiométriques (couleurs) sont différentes. Cela permettra de limiter les confusions dues aux variations de surfaces herbacées. Pour des raisons d objectivité, de superficie d apprentissage, de représentativité des différents paysages et de rapidité de mise en œuvre, la méthodologie retenue pour la mise en place des informations d apprentissages repose sur l utilisation de bases de données exogènes, éventuellement complétée de photo-interprétation. Pour le travail mené sur la Drôme, qui sera le territoire illustrant les différentes étapes Page 37 / 106
38 de ce rapport, les bases de données utilisées sont : BD Topo, BD Carto, BD Forêt, Corine Land Cover, le Registre Parcellaire Graphique, la base de donnée des Vergers Prunus et le casier Viticole Informatisé (CVI), croisé avec la BD Parcellaire pour obtenir la géométrie des objets. Le tableau ci-dessous donne un exemple de sélection et de traitements de données exogènes pour obtenir des échantillons d apprentissage. S il peut être utilisé pour tout traitement sur des images à 5 mètres de résolution, il est à adapter en cas de travail sur des images à d autres résolution ou en cas d intégration de nouvelles bases de données. Les éléments de ce tableau sont obtenus par un travail visuel de comparaison systématique entre les éléments des bases de données disponibles et l image satellite. L objectif est d identifier pour chaque poste de la base s il est adapté à la nomenclature, s il se «superpose» avec l image satellite et quel traitement (généralement érosions pour éviter les problèmes de bordures hétérogènes ou mal délimitées) appliqué aux polygones permet de localiser des pixels de la classe avec une «bonne fiabilité». A titre illustratif, le tableau ci-dessous propose d utiliser parmi les informations d apprentissage de la classe eau, les surfaces en eau de la BD Topo, érodées de 15m. Page 38 / 106
39 Couche compilée (Du moins fiable (1) au plus fiable (8)) Base de données Nomenclature OCS (voir illustration 17) Couche(s) de la base de données Buffer appliqué (en mètres) négatif = érosion 1 BD carto Carrière, décharge - 15 Corine land cover RPG Roches nues Glaciers et neige éternelle - 50 Id = 20, 21, 22, 23, 27 Id = 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 14, 15, 16, 18, 19, 25 3 CVI Vergers prunus BD Forêt V BD Topo végétation BD Topo bati BD Topo hydro BD Topo réseau routier 2011 BD Topo voies ferrées Forêt fermée de conifères, Forêt fermée de feuillus, Forêt fermée mixte, lande, peupleraie, Formation herbacée Bois Haies Zone arborée Réservoir (château d eau+réservoir industriel), bâti remarquable, industriel, indifférencié, gare, cimetière, terrain sport (terrain de tennis) Piste aérodrome en dur Piste aérodrome en herbe Permanent Route (autoroute, bretelle, quasiautoroute, route à une chaussée, route à 2 chaussées) Route (route empierrée) Surface route Tronçon ferré Aire de triage Tableau 7: Sélection et traitement des données exogènes pour l obtention des informations d apprentissage , ,5 Page 39 / 106
40 Illustration 18: Origine des échantillons d'apprentissage au regard de la nomenclature d'apprentissage du produit OCS pour la production d un millésime 2011 à partir d images RapidEye sur Rhône Alpes Suivant le contexte de l étude, la nomenclature d apprentissage peut être plus affinée si les données correspondantes sont disponibles et si cela est adapté à l image satellite (il est souvent possible de dissocier les formations arborées des autres végétations ligneuses). Des incohérences entre données exogènes et images satellites sont acceptables à ce stade, à condition qu elles restent limitées. Des traitements en partie automatisables permettront par la suite de les corriger. Concrètement, toutes les bases de données sont intégrées dans une base Postgresql utilisant l extension Postgis. Des couches compilées (1 à 8) sont créées à partir des données des BD exogènes selon le tableau précédent. Ces couches sont ensuite rasterisées, par exemple sous QGIS en utilisant les fonctionnalités de Grass 7. Lors de la rasterisation, les différentes couches doivent être cohérentes en termes d emprise et de grille de pixel. Le plus pratique est de créer au préalable une couche raster du secteur d étude sur la totalité du territoire d étude pour servir de modèle sous Grass (cf illustration ci-contre). Les 8 couches raster sont «compilées» à l aide d une calculatrice raster pour obtenir une seule couche d apprentissage 8. Cette «compilation» est réalisée de manière à ce que les informations de la couche 08 recouvrent les informations de la couche 07, qui recouvrent les informations de la couche 06, et ainsi de suite jusqu à la couche La couche d apprentissage raster ainsi obtenue pèse environ 30 Mo pour un département comme la Drôme. La rasterisation permet de gérer facilement les superpositions, mais la «fusion» des différentes données peut être faite en vectoriel selon des procédés similaires. Illustration 19: Exemple d'emprise (Drôme) Suivant l outil utilisé pour les classifications, il peut être nécessaire d avoir les informations d apprentissage 7 La rasterisation peut par exemple s effectuer avec la fonction v.to.rast.attribute de Grass. La fonction r.mapcalculator remplace préalablement la valeur no data en 0. Compter 3 minutes pour une rasterisation sur l ensemble du département. 8 Par exemple avec l outil GRASS r.mapcalculator (s il y a plus de 6 couches, l opération doit être réalisée en 2 fois) 9 Avec une calculatrice raster et une expression du type : if(couche08>0,couche08,if(couche07>0,couche07,if(couche06>0,couche06,if(couche05>0,couche05,if(couche04>0, couche04,if(couche03>0,couche03,if(couche02>0,couche02,couche01))))))) Page 40 / 106
41 sous forme de polygones. La couche d apprentissage doit alors être vectorisée 10. La principale difficulté de cette étape réside dans le temps machine. Si la procédure est rapide sur un petit secteur, elle est beaucoup plus longue sur un département complet (compter 5 à 10 jours avec une machine assez performante suivant l outil utilisé). Un traitement par dalle (par exemple de 5km x 5 km) est conseillé 11 et permet une vectorisation beaucoup plus rapide. A l issue de ces traitements, les informations d apprentissages sont disponibles. Elles couvrent entre 40 et 70% du territoire suivant les zones. Le poids de la couche vecteur d apprentissage d un département comme la Drôme est environ 700 Mo. Au final, la figure ci-dessous illustre les échantillons d apprentissage utilisés sur un département. Figure 5: Exemple d'informations d'apprentissages brutes obtenues par utilisation de BD exogène. Gauche : Échantillons sur l ensemble de la Drome. Droite : Superposition entre apprentissage et image satellite sur une petite zone. Remarque : cet exemple est donné à titre illustratif. En pratique, les échantillons de formation arborées et autres formations ligneuses ont été fusionnés pour les traitements sur la Drôme. L illustration ci-dessous montre des exemples de mauvais échantillons d apprentissage résultant de l utilisation de données non compatibles géométriquement et temporellement. Sur les axes de communication par exemple, certains polygones sont localisés juste à côté de la route et non sur elle. Les informations d apprentissage associées, utilisées comme des échantillons de surfaces anthropisées, correspondent en réalité à d autres éléments (talus, herbacés, arbres...). De même, les échantillons de végétation obtenus par les bases de données exogènes recouvrent des habitations, du fait probablement de la différence de millésime entre l image et la base de données. De mauvaises informations d apprentissage de végétation se traduiront ultérieurement par des confusions. 10 Par exemple avec GRASS : r.to.vect ou GDAL : rasteriser sous QGIS (temps de calcul équivalents) 11 Qgis permet facilement de créer une grille vecteur calée sur le raster (menu vecteur / outils de recherche / grille vecteur). L outil gdalwarp permet ensuite de découper la couche raster par une couche vecteur. Enfin, l outil gdal_polygonize permet de vectoriser la couche raster. Page 41 / 106
42 Illustration 20: Visualisation de mauvais échantillons d apprentissage dans le cadre d une autre étude. Exemple sur images SPOT 6 de précision planimétrique moins bonne 4.3. PRETRAITEMENTS Les parties précédentes montrent comment obtenir les images satellites et les informations d apprentissage de base. Cette partie montre quels traitements sont à effectuer à ce stade sur ces deux sources d informations PREPARATION DES IMAGES SATELLITES La préparation des images satellites se fait en deux étapes majeure. La première est une étape de sélection, mosaïquage et dallage des images, la seconde consiste à enrichir les bandes d informations pour améliorer les résultats de classification MISE EN FORME DES IMAGES SATELLITES La mise en forme des images satellites dépend du format de livraison. La partie ci-dessous traite de la livraison de la couverture 2011 du programme Géosud et est à adapter aux différents types de livraisons possibles. L étape de téléchargement des images, par fpt dont le lien est fourni lors de la commande des images, peut poser certaines difficultés. Le téléchargement des images est très long (environ 300 Go pour les versions zippées, le téléchargement se compte en semaines pour l ensemble de la région 12 ) et des dalles peuvent être mal téléchargées, ce qui nécessite une vérification systématique et parfois un nouveau téléchargement. Les images de ce millésime sont livrées découpées en dalles carrées de 160 Mo chacune. Par ailleurs, plusieurs images sont disponibles et téléchargées pour chaque dalle (aucun mosaïquage n est proposé à la livraison du millésime 2011 de géosud). Pour la méthodologie, l ensemble des points de la zone d étude doit être couvert par une et une seule image, ce qui nécessite une sélection d images et certains traitements. Le choix de l image la plus pertinente pour une zone résulte d un compromis entre différents critères. Une couverture nuageuse élevée, la présence de voiles nuageux ou de perturbations atmosphériques est éliminatoire. Les images prises en hiver, présentant un couvert neigeux élevé et une faible activité végétale, sont également à retirer. Enfin, les images trop petites sont à éviter. Une fois le choix des images effectué, un mosaïquage rassemble l ensemble des dalles d une image en une seule image 13. A l issue de cette étape, nous retrouvons les images telles qu elles étaient avant d être dallées. 12 Le temps de téléchargement dépend directement du débit du réseau. 13 Par exemple, avec la fonction gdal_merge de GDAL, ou en créant un raster virtuel avec la commande gdalbuildvrt Page 42 / 106
43 Illustration 21: Exemple d'image satellites RapidEye dont les dalles sont mosaïquées Gauche : Drome entière en deux images - Droite : Zoom sur la limite entre deux images Un département est ainsi couvert par plusieurs images (classiquement entre 1 et 4 images). Les classifications sont d autant plus performantes que les paysages classifiés sont homogènes. Les images étant par ailleurs trop lourdes pour être traitées en une seule fois (elles peuvent faire jusqu à 7 ou 8 Go), elles sont découpées au regard des paysages présents sur le territoire. La définition des paysages se fait à travers un petit état de l art des travaux existants sur le territoire : analyse visuelle macroscopique de l image, cartographie des typologies des paysages, altitudes, géologie, grandes zones agricoles recensées, localisation des informations d apprentissage. Pour des raisons de calculs ultérieurs, chaque «morceau 14» doit être le plus rectangulaire possible et leur poids ne doit pas dépasser 1 Go. 14 Un «morceau» est donc une image découpée sur une zone de paysage homogène Page 43 / 106
44 Illustration 22: Exemple de cartes utilisées pour l'analyse paysagère macroscopique 1. Typologie des paysages. 2. Occupation des Sols (CLC) 3. Cartes d altitude. 4. Cartes géologiques. 5. Cartes des grands territoires. 6. Échantillons d apprentissage disponibles Les vecteurs de découpage sont obtenus manuellement, et sont utilisés pour découper les images en fonction des paysages 15, comme le montre l illustration ci-dessous. 15 Par exemple en utilisant la commande gdalwarp de GDAL (ne pas oublier le -crop_to_cutline) Page 44 / 106
45 Illustration 23: Exemple de découpage par image et par paysage Les deux images initiales sont découpées en 7 morceaux non réguliers au regard des paysages qu elles contiennent et de la taille maximale (1Go) des morceaux Chacune de ces nouvelles dalles sera ensuite traitée indépendamment, avec les mêmes traitements ENRICHISSEMENT DES INFORMATIONS DE L IMAGE SATELLITE LES NEOCANAUX Chacune des images est initialement constituée de ses bandes radiométriques seules (rouge, vert, bleu, rededge et proche infrarouge dans notre cas par exemple). La classification automatique de chaque pixel de l image dépend de ses valeurs sur chacune de ces bandes d information. Ces couches radiométriques de base peuvent être complétées en «empilant» à l image des couches d informations complémentaires 16. Ces nouvelles couches enrichissent l information générale associée à chaque pixel. L information caractérisant un pixel étant plus complète, la discrimination de ces pixels est alors potentiellement plus fiable. Ces informations additionnelles améliorent le résultat de la classification, sous réserve que ces informations soient pertinentes. De nombreuses informations peuvent être ajoutées en fonction des données disponibles. Ces informations 16 En utilisant par exemple l application OTB «otbcli_concatenateimages». Il est conseillé de centrer et réduire les valeurs des différentes bandes pour les rendre comparables. Cela peut être fait avec l application «otbcli_bandmath» de l OTB et une expression du type (im1bn- (mean_value) /(stddev_value) Page 45 / 106
46 peuvent être dérivées de l image brute (bandes de textures, bandes indicielles) ou peuvent provenir d autres sources (images de la même zone à d autres dates, couches d occupation des sols préexistantes, MNT ). Ces nouvelles bandes sont appelées néo-canaux. Les néo-canaux déduits des bandes radiométriques brutes sont parfois appelés «primitives». Figure 6 : Principe d enrichissement des couches d'information La figure ci-dessous illustre l impact potentiel de l apport de ces bandes d informations complémentaires sur la qualité du résultat de classification. Figure 7 : Impact potentiel de l'apport de nouveaux canaux A gauche : Résultat de classification directement issu de l image satellite. A droite : Résultat de classification avec ajout de textures (toutes choses égales par ailleurs). Les confusions entre surfaces bâties et les surfaces herbacées sont grandement réduites Page 46 / 106
47 Dans la méthodologie, seules les informations texturales et indicielles sont retenues. Les textures sont une expression des variations locales des valeurs des pixels [48]. Elles fournissent pour chaque pixel une information sur son environnement (homogénéité de la zone par exemple), ce qui est utile pour discriminer certaines classes de radiométrie proche. Par exemple, les surfaces herbacées sont généralement homogènes tandis les surfaces arborées sont généralement hétérogènes. La prise en compte de cette information est utile pour les discriminer lorsque les surfaces herbacées et arborées présentent des valeurs radiométriques proches (mêmes nuances de vert). De nombreuses textures existent : variance, énergie, corrélation Elles sont calculées par bande radiométrique, et dépendent de la taille de la fenêtre qui sera utilisée pour définir la distance caractérisant l entourage d un pixel. Illustration 24: Exemple de textures D une manière générale, nous privilégions des textures calculées avec de petites fenêtres (rayon 2 ou 3 pixels) sur les bandes rouges et proche infra-rouge. Les textures jugées pertinentes pour la méthodologie sont principalement la texture IC2 et la corrélation d Haralik. La plupart des logiciels de télédétection permettent de les calculer 17. Les couches indicielles sont obtenues par combinaison non linéaire de bandes radiométriques [49]. Ces couches mettent en évidence certains aspects du territoire. Par exemple, le NDVI (Normalized Difference Vegetation Index, ou Indice de Végétation), calculé à partir des bandes rouges et proche infrarouge, traduit l activité photosynthétique de la végétation au niveau du sol. Sa prise en compte permet alors de mieux discriminer les surfaces végétalisées des surfaces non végétalisées. Une liste d indices potentiellement intéressant est proposée en annexe. Ces indices sont calculés directement lorsque le logiciel propose cette fonctionnalité, ou peuvent être 17 Nous conseillons l utilisation de l OTB application «otbcli_haralicktextureextraction» Page 47 / 106 En haut à gauche : Extrait d image satellite THRS. Colorisation en fausses couleurs En haut à droite : Variance de la bande bleue En bas à gauche : Energie de la bande bleue En bas à droite : Entropie de la bande bleue
48 implémentés manuellement avec une calculatrice raster 18. Classiquement, l indice ajouté à minima est le NDVI, ou, lorsque cela est possible, le NDVI Mod 19 qui intègre le canal Red-Edge dans le calcul LE CHOIX DES NEOCANAUX Si certains néocanaux lève des confusions, d autres peuvent en rajouter. Le choix des néocanaux est important et impacte directement la qualité du résultat. Plusieurs processus définissent les néocanaux optimaux pour une image. Une analyse bibliographique permet d identifier les néocanaux communément utilisés et pertinents. Ce rapport par exemple en identifie certains. Il n existe toutefois pas de néocanaux, ou combinaisons de néocanaux, universellement optimaux. Le choix dépend du type d images, des conditions d acquisition (date, atmosphère ) et du type de paysage. Dans la pratique, trouver dans la bibliographie le choix adapté à notre étude est difficile. Une analyse paramétrique peut être menée, généralement sur des zones tests. Elle consiste à étudier l évolution de la qualité de classification en fonction de différents choix de néocanaux. Cette approche intéressante, développée en partie 5, est toutefois particulièrement chronophage en temps machine (les calculs des différents tests, à mener par dizaines ou centaines, peuvent prendre des semaines suivant la finesse recherchée) et en temps humain (les échantillons de vérification sont généralement obtenus par photo-interprétation dans ce cas). Pour cette raison, les études paramétriques sont menées seulement lors des phases de test et de mise en place méthodologique. Des néocanaux combinant différentes informations peuvent également être obtenus. Dans cette méthode, l ensemble des néocanaux potentiellement pertinents sont empilés aux bandes radiométriques de l image (par exemple une vingtaine de couches de textures et d indices). L application d une réduction de dimension 20 crée de nouveaux canaux, par combinaison linéaire de l ensemble des canaux initiaux, et contenant la plupart de l explicativité de chacune des bandes d information [50] [51]. La sélection des canaux les plus explicatifs (par exemple, les cinq de ces nouveaux canaux les plus explicatifs) permet de regrouper la majeure partie de l information avec un nombre beaucoup plus restreint de bandes, ce qui permet de gagner du temps de calcul aux étapes suivantes. Ces nouvelles bandes, qui contiennent et mélangent les informations des bandes précédentes, présentent une modification des compositions colorées à l affichage. L opération de réduction de dimension nécessite toutefois des ressources de calcul élevées qui peuvent limiter la taille maximale des paysages sur lesquels travailler. Dans la méthodologie retenue, ces néocanaux artificiels sont construits de manière à avoir 5 ou 6 bandes au maximum à partir d une large concaténation de bandes «classiques» : les bandes radiométriques du maximum de dates disponibles (1 à 4 dates suivant les paysages), un ou deux indices de végétation, un indice d eau, un indice de bâti, des textures IC2 et Haralick corrélation sur les bandes rouges et PIR avec une fenêtre de 1 pixel. 18 comme l application OTB «otbcli_bandmath». À titre d exemple, le NDVI est défini par (PIR-Rouge)/(PIR+Rouge). 19 NDVIMod = (PIR-Rouge+RedEdge)/(PIR+Rouge+RedEdge). 20 Effectuée par exemple avec l application OTB «otbcli_dimensionalityreduction» et le paramètre PCA (analyse en composantes principales). Page 48 / 106
49 Illustration 25: Exemple de réduction de dimension En haut et à gauche : Extrait d images satellite à différentes dates sur une même zone. Chaque image contient 5 bandes de couleur, leur concaténation en contient donc 15 En bas à droite : Extrait du résultat de la concaténation des différentes dates, suivie d une réduction de dimension à 5 bandes. La composition colorée n est pas naturelle, mais l image contient la plupart des informations des 3 images précédentes AMELIORATION DES INFORMATIONS D APPRENTISSAGE PRINCIPE GENERAL Le nettoyage des informations d apprentissage contient deux étapes. La première étape est un nettoyage direct des échantillons par croisement avec des bandes indicielles (indices de végétation, indice d eau...). La seconde étape est un sous-échantillonnage de l information, suivi d un contrôle visuel de sélection des micro-classes les plus propres LE NETTOYAGE PAR INDICES SEUILLES Les couches indicielles décrites précédemment permettent d obtenir rapidement une information relativement fiable, quoi que non exhaustive, de certains éléments du paysage. Ainsi, les valeurs élevées d indices de végétation garantissent généralement la présence de végétation, et donc l exclusion de classes non végétalisées. En prenant les marges adaptées, cette propriété permet de nettoyer efficacement des erreurs grossières obtenues lors de la construction des échantillons d apprentissage. En pratique, l application des règles suivantes, par utilisation classique d une calculatrice raster par exemple, donne de bons résultats. Page 49 / 106
50 Classes Labels Règle Artificialisé Suppression des pixels pour lesquels le NDWI > 0.3 Suppression des pixels pour lesquels le NDVI > 0.3 Eau Surfaces_Arborées et Surfaces_Herbacées Ajout des pixels pour lesquels le NDWI > 0.3 Suppression des pixels pour lesquels le NDWI < 0 Suppression des pixels pour lesquels le NDVI > 0.3 Suppression des pixels pour lesquels le NDWI > 0.3 Suppression des pixels pour lesquels le NDVI < Tableau 8: Règles de nettoyage direct des échantillons d apprentissage Illustration 26: Exemple de nettoyage direct En haut à gauche : Visualisation d échantillons d apprentissage obtenus à partir de bases de données exogènes. La zone présente une erreur : une zone identifiées comme apprentissage d une zone végétalisée correspond en réalité à du bâti En haut à droite : Visualisation du NDVI calculé sur la zone. Blanc : zones à fort indice de végétation, Noir : zones à faibles indices de végétation. En bas à gauche : superposition de l image avec le NDVI seuillé. Bleu : NDVI < -0.18, Vert : NDVI > 0.3 En bas à droite : Échantillons d apprentissage nettoyés : la zone correspondant à la surface bâtie n est plus prise en compte comme apprentissage de zone végétalisée. NB: elle n est plus prise en apprentissage du tout Page 50 / 106
51 LE SOUS ECHANTILLONAGE L information d apprentissage doit être la plus exhaustive possible et contenir l ensemble des variations radiométriques de chaque classe. Les échantillons «bruts» d une classe sont donc souvent radiométriquement hétérogènes, c est-à-dire constitués de pixels de couleurs variés, pour être représentatifs de l hétérogénéité de la classe. Cependant, par construction de la plupart des algorithmes de classification, une classification est de meilleure qualité si ses classes sont radiométriquement homogènes. En première approximation, un pixel est relié sans ambiguïté à une classe homogène, alors finement caractérisée. Une classe radiométriquement hétérogène, par définition grossièrement définie, entraîne à contrario des confusions importantes. L enjeu est de définir des informations d apprentissage, chacune radiométriquement homogène, mais représentatives à elles toutes de l hétérogénéité des paysages. Cela s obtient en sous-échantillonnant les informations d apprentissages brutes en fonction de critères radiométriques. La nomenclature initiale et les échantillons sont décomposés en sous-classes, ou microclasses, qui n ont pas nécessairement de signification thématique, mais qui sont «radiométriquement propres». Ce sous échantillonage est obtenu ici par un procédé de classifications dites non supervisées, c est-à-dire n utilisant pas d apprentissage. A l issue de ce découpage en sous-classes (ou micro-classes), un contrôle permet d enlever les subdivisions non pertinentes (micro-classes couvrant une surface trop petite, micro-classes contenant des informations relatives à différentes macro-classes de la nomenclature - mixels au niveau de bordures par exemple ). De même, certaines micro-classes correspondent parfois thématiquement à une autre classe que leur classe d origine. Cela arrive notamment lorsque les échantillons d apprentissage sont obtenus par des bases de données exogènes imparfaites au regard de l image satellite. Une fois identifiées, elles sont considérées par la suite comme micro-classes issues de cette autre macro-classe. Par exemple, si les échantillons d apprentissage bruts de surfaces arborées contiennent du bâti isolé en forêt, celui-ci constituera probablement une sous-classe des surfaces arborées à l issue du découpage. L idée est alors d identifier cette sous-classe et de la traiter comme une sous-classe de surfaces anthropisées (cf case grise dans le schéma ci-dessous). Figure 8: Le sous échantillonnage des informations d'apprentissage L exemple suivant illustre l apport du sous échantillonnage des informations d apprentissage. Page 51 / 106
52 Figure 9: Intérêt du sous échantillonnage des informations d'apprentissage a. Image satellite. b. Résultat de classification avec utilisation des échantillons d apprentissage bruts c. Résultat de classification avec sous-échantillonnage, nettoyage et réaffectation des micro-classes Page 52 / 106
53 Les étapes associées à ces traitements, décrites plus finement dans les prochaines pages, sont des étapes importantes de la méthodologie. Le sous échantillonnage des échantillons d apprentissage se fait indépendamment macro-classe par macroclasse. Pour rappel, les six macro-classes de notre étude sont les surfaces anthropisées (label ), les sols nus (label ), les surfaces en eau (label ), les surfaces couvertes de neige éternelle ou de glaciers (12 300), la végétation ligneuse (label ) et la végétation non ligneuse (label ). La première étape du sous échantillonnage consiste à construire pour chaque macro-classes un masque binaire identifiant les zones d apprentissage de la macro-classe (image b) 21. Ce masque permettra de travailler uniquement sur les zones d apprentissage de la macro-classe par la suite. La seconde étape consiste à effectuer une classification non supervisée 22 de l image 23 afin de décomposer automatiquement en fonction de critères radiométriques les territoires correspondant aux échantillons d information de macro-classe. Le nombre de micro-classes est une entrée de l algorithme de classification non supervisée (image c). Nous conseillons entre 10 et 20 sous-classes par macro-classe. Leur label de sortie est déterminé automatiquement par l algorithme. Si besoin, il est à remettre en cohérence par calculatrice raster avec les labels utilisés pour la nomenclature (par exemple, pour les sousclasses de , choisir , , , ). La classification non supervisée ne prend en compte que les surfaces retenues par le masque binaire pour définir les règles de classification, mais elle est appliquée à l ensemble de l image. La troisième étape commence par masquer 24 le résultat de classification non supervisée au regard des zones d apprentissage de la macro-classe afin de n avoir des informations que sur ces zones.. Le résultat est ensuite vectorisé 25. Les polygones résultants sont érodés pour limiter les pollutions éventuelles liées aux bordures 26, et leur géométrie est simplifiée pour alléger leur poids dans les futurs traitements 27 (image d). La dernière étape consiste à identifier les sous-classes de la macro-classe non pertinentes pour l apprentissage, soit parce qu il faut les supprimer (trop petites, trop mauvaises) soit parce qu il faut les réaffecter (correspond en réalité à d autres macro-classes). Début 2015, la solution retenue pour identifier ces traitements éventuels est un contrôle visuel micro-classe par micro-classe, en comparant avec l image satellite. Des tentatives d automatisation de cette étape d identification ont été menées avec un succès mitigé. Si aucune micro-classe ne semble à supprimer ou à ré-affecter, le sous échantillonnage s arrête là. Dans le cas contraire, les polygones d apprentissage en micro-classe sont rasterisés, et la suppression et la réaffectation des micro-classes se fait ensuite par calculatrice raster 28. Ces étapes sont appliquées successivement à l ensemble des macro-classes. Les informations ainsi obtenues, labellisées en micro-classes, sont les informations d apprentissage à fournir en entrée de l étape de classification supervisée sur l ensemble de l image. Suivant ce que permet ou demande le logiciel utilisé pour la classification, ces échantillons doivent être en format raster ou vecteur, séparés par micro-classe ou 21 En utilisant une calculatrice raster (otbcli_bandmath de l otb par exemple). Si Im1b1 est le rasteur d apprentissage, le masque binaire de la macro-classe se construit avec l expression if(im1b1 == label_macroclasse, 1,0) 22 Par exemple avec l application OTB «otbcli_kmeansclassification» 23 Certaines implémentations du K-Means (c est le cas de l implémentation dans l OTB) demandent un masque en argument. Le masque à fournir dans ce cas est le masque binaire construit à l étape précédente. Si cette option n est pas disponible, il faut appliquer le masque en amont de la classification, par exemple en calculatrice raster avec la formule suivante. Si im1bn sont les bandes de l image satellite et im2b1 est le raster d apprentissage, l expression de l image masquée est (if(im2b1 == label_macroclasse, im1bn,0). Suivant les propriétés de la calculatrice raster, les bandes de l image peuvent être à séparer en amont, et à ré-empiler après l application du bandmath. 24 Par calculatrice raster. Si Im1b1 est le résultat de classification et Im2b1 est le masque binaire de la macro-classe, la formule peut être du type : if(im2b1 == 1, Im1b1, 0) 25 Par exemple avec la fonction gdal_polygonize 26 Par exemple en utilisant avec OGR : feature_output.setgeometry(ingeom.buffer(buffer)) où ingeom = feature_input.getgeometryref() 27 Par exemple en utilisant avec OGR : feature_output.setgeometry(geometry.simplify(tolerance)) où geometry = feature_input.getgeometryref 28 En utilisant une calculatrice raster (otbcli_bandmath de l otb par exemple). On note Im1b1 le raster de microclasses. La formule est du type if(im1b1 == label_microclasse_à supprimer,0, if(im1b1 == label_microclasse_à_réaffecter_en_macroclasse_n, label_microclasse_adapté_de_la_macroclasse_n, im1b1)) Page 53 / 106
54 fusionnés 29. Le schéma ci-dessous résume ces différentes étapes de sous -échantillonnage des échantillons d apprentissage. Figure 10: Schéma de synthèse des étapes de sous-échantillonnage 29 Pour les applications de l OTB, les informations d apprentissage sont à fournir en format shape, sous la forme d un seul shape regroupant l ensemble des (micro-)classes d apprentissage. Page 54 / 106
55 Illustration 27: Exemple de sous-échantillonnage d informations de surfaces herbacées a. Image satellite et exemple d échantillons d apprentissage bruts de surfaces herbacées. b. Image masquée par rapport aux échantillons d apprentissage. c. Résultat de classification non supervisée en neuf sous classes sur l image masquée. d. Vecteurs érodés en micro-classes 4.4. CLASSIFICATION DE L ENSEMBLE DE L IMAGE La classification est l étape de transformation de l image satellite en couche d occupation des sols brute. Les pixels de l image complète sont labellisés à partir de l information contenue dans les échantillons d apprentissage. Cette étape s effectue avec des logiciels disposant d algorithmes permettant d extraire de l information à partir d images : l ORFEO ToolBox, ENVI [52], ERDAS IMAGINE [53]... Les classifications peuvent être sans apprentissage (non supervisées). Dans ce cas, les pixels sont classés automatiquement en fonction de critères statistiques et mathématiques directement par rapport à leurs valeurs. L éventuelle labellisation des classes intervient a postériori. Dans notre chaîne de traitement, ce type de classification est utilisé pour sous échantillonner les informations d apprentissage (algorithme k- means, voir paragraphe précédent). Les classifications avec apprentissage (ou supervisées) basent leurs règles de classification en fonction de valeurs associées à des échantillons d apprentissage. Ce type de classification est utilisé ici pour classer l ensemble des pixels de l image 30. L algorithme retenu est le SVM (Support Vector Machine) à noyau linéaire. Le random forest peut éventuellement être utilisé pour traiter plus rapidement de grandes surfaces 30 Sous l OTB, les classifications se font en trois étapes : le calcul des statistiques de l image (otbcli_computeimagesstatistics), la création d un modèle de classification (otbcli_trainimagesclassifier, contenant l algorithme de classification retenu en paramètre d entrée), l application du modèle de classification(otbcli_imageclassifier). Page 55 / 106
56 ou des images avec beaucoup de bandes [54], pour une qualité proche, mais légèrement moindre. Pour des raisons de qualité, nous privilégions le SVM, mais lorsque les temps de calculs sont trop importants, nous retenons le Random Forest. 31 Illustration 28: Exemple de classification A gauche : extrait d image satellite (avec zoom) A droite : résultat brut de classification en micro-classe (avec zoom) 4.5. POST-TRAITEMENTS Les post-traitements sont les diverses opérations effectuées à l issue de la classification pour en améliorer la qualité LA FUSION DES MICRO-CLASSES En sortie de classification, l occupation des sols est classée selon la nomenclature des micro-classes utilisée pour l apprentissage. Ces micro-classes n ont pas forcément de signification thématique unique (elles sont construites par rapport à des critères radiométriques) et présentent certaines confusions. En pratique, les confusions sont majoritairement entre micro-classes d une même macro-classe. La fusion des micro-classes est l étape qui agglomère les classes, réduit les taux de confusions associés à ces nouvelles classes, et redonne un sens thématique à la nomenclature. La fusion peut être complète (schéma 1) ou intermédiaire (schéma 2) si cela s avère pertinent. 31 D autres approches sont possibles. Les approches objet par exemple consistent à segmenter l image dans un premier temps, puis à classifier les polygones ainsi obtenus en fonction de considérations radiométriques mais également géométriques. Les approches de logique floue quant à elles consistent à calculer différentes occupations des sols sur un même territoire et à en déduire pour chaque point du territoire une probabilité d appartenance à une classe (les zones donnant les mêmes résultats quels que soient la méthode d obtention faisant plus consensus que les zones où les classifications donnent des résultats différents). Ces solutions n ont pas été retenues dans notre méthodologie pour des raisons de performance des outils utilisés. Page 56 / 106
57 Figure 11: Fusion complète des microclasses Figure 12: Fusion intermédiaire des micro-classes Cette opération, qui peut s automatiser en script, s effectue simplement via une calculatrice raster Beaucoup de logiciels proposent une calculatrice raster : l OTB (otbcli_bandmath), QGIS (outil Raster calculator), ArcGIS (outil Spatial Analyst) L expression pour une fusion complète s écrit simplement : expression="rint(im1b1/100)*100" (attention, rint(x) fournit la partie entière la plus proche de x, et non systématiquement par valeur inférieure) L expression pour une fusion intermédiaire doit être détaillée micro-classe par micro-classe, par exemple : expression = "if(im1b1 == 10 or im1b1 == 11 or im1b1 == 12, 1000, if(im1b1 == 20 or im1b1 == 22 or im1b1 == 23, 2000, if(im1b1 == 21 or im1b1 == 26 or im1b1 == 29, 3000, if(im1b1 == 13 or im1b1 == 14, 4000, im1b1))))" Page 57 / 106
58 Illustration 29: Exemple de fusion A gauche : résultat brut de classification en micro-classe (avec zoom) A droite : classification fusionnée LES OPERATIONS DE LISSAGE Le lissage consiste à appliquer à l image un traitement qui atténue un bruit qui corrompt l information. Concrètement, ce traitement supprime la plupart des pixels isolés et limite les problèmes de bordures mal reconnues entre deux occupations du sol différentes. Cette opération se fait classiquement par application de filtre de voisinage. L option retenue est le filtre majoritaire qui associe à chaque pixel de l image le label majoritaire parmi les pixels de son voisinage, la taille de ce voisinage étant paramétrable (par défaut, trois pixels) Le lissage peut être effectué par différents logiciels : l OTB (otbcli_classificationmapregularization), ENVI (option Majority/Minority Analysis), ArcGIS (option MajorityFilter de Spatial Analyst...). Page 58 / 106
59 Figure 13: Visualisation de l'impact du passage d'un filtre majoritaire a. Pas de filtre - b. Filtre de taille 2 - c. Filtre de taille L UTILISATION DE BASES DE DONNEES EXOGENES PRINCIPE Les bases de données exogènes fournissent des informations précieuses pour améliorer en post-traitement le résultat de classification. Les éléments jugés fiables et cohérents (temporellement et géométriquement), ou du moins de meilleure qualité que le résultat de classification, peuvent être intégrées directement au résultat pour en améliorer la précision spatiale ou thématique. Dans ce cas, l information de classification est «écrasée» par une information exogène. L intégration du squelette linéaire de l IGN aux surfaces anthropisées permet par exemple de reconnecter le réseau routier, difficilement identifiable sur des images à cinq mètres de résolution. Dans le cas où l élément est moins juste et/ou cohérente avec l image satellite, il peut cependant s avérer indirectement pertinent pour lever certaines confusions ou a minima détecter des zones à problème, en identifiant des zones où certaines classes ne sont a priori pas présentes. Des protocoles de post-traitements plus ou moins efficaces peuvent être mis en place. L objectif de la procédure décrite ici est d automatiser au maximum cette étape, qui se déroule en trois parties. La première consiste à préparer les informations exogènes et à identifier les zones de litiges avec le résultat de classification. La seconde consiste à déterminer finement des règles de post-traitements directs et indirects. La troisième partie consiste à appliquer ces règles. Le détail de toutes ces étapes est précisé dans le tableau ci-dessous et développé dans les pages suivantes. Page 59 / 106
60 Illustration 30: Représentation schématique de l'ensemble des étapes de post-traitement mettant en œuvre des données exogènes PREPARATION DES INFORMATIONS EXOGENES La première étape consiste à «compiler» sous format raster les informations potentiellement pertinentes des bases de données exogènes et à identifier automatiquement des zones de contradiction entre le résultat de classification et ces informations exogènes.. Le procédé de construction de toutes les couches raster directement issues de données exogène est identique à celui des informations d apprentissage 34, en adaptant au cas par cas les éléments à sélectionner et les érosions ou dilations à leur appliquer en fonction des tableaux proposés. La première couche mise en place est la «couche de comparaison» qui compile les informations exogènes qui seront comparées au résultat de classification. Le tableau ci-dessous spécifie les éléments qu elle prend en compte. De la même manière que pour la mise en place des échantillons d apprentissage, d autres bases de données ou d autres postes de nomenclature peuvent être envisagés selon l étude. Il est cependant impératif de garder une cohérence entre la nomenclature d apprentissage et la nomenclature de comparaison. Cette couche a des caractéristiques très proche de la couche d apprentissage en macro-classes, mais diffère dans la mesure où aucune érosion ou dilatation n est appliquée (sauf pour les routes pour lesquels les segments sont dilatés pour obtenir des surfaces). 34 Compilation des données sous PostgreSQL en différentes couches vecteur, rasterisation de chaque couche, puis fusion de toutes les couches. Page 60 / 106
61 Couche compilée moins fiable : (1) plus fiable : (8) Base de données Nomenclature de la couche de comparaison 1 BD carto Carrière, décharge Corine land cover RPG CVI Vergers prunus BD Forêt V BD Topo végétation BD Topo bati BD Topo hydro BD Topo réseau routier 2011 BD Topo voies ferrées Roches nues Glaciers et neige éternelle Données, couche(s) Id = 20, 21, 22, 23, 27 Id = 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 14, 15, 16, 18, 19, 25 (le code 17 n est pas retenu du fait de sa qualité généralement insuffisante au regard du besoin) Forêt fermée de conifères, Forêt fermée de feuillus, Forêt fermée mixte, lande, peupleraie, Formation herbacée Bois Haies Zone arborée Réservoir (château d eau+réservoir industriel), bâti remarquable, industriel, indifférencié, gare, cimetière, terrain sport (terrain de tennis) Piste aérodrome en dur Piste aérodrome en herbe Permanent Route (autoroute, bretelle, quasi-autoroute, route à une chaussée, route à 2 chaussées, route empierrée) Surface route Tronçon ferré Aire de triage Tableau 9: Sélection et traitement des données exogènes pour l obtention des informations de comparaison Page 61 / 106
62 Le résultat de classification (raster) et la couche de comparaison (raster) permettent ensuite d obtenir par calculatrice raster 35 une couche de concordance, qui se définit selon les quatre classes suivantes : Valeur du pixel (Codage adaptable, mais qui permet quelques astuces de calcul par la suite) La couche de concordance permet de calculer quelques statistiques simples de comparaisons entre classification et données existantes, et est surtout une étape intermédiaire à la construction de la couche de litiges. La couche de litiges affine la couche de concordance en identifiant la nature des litiges éventuels entre le résultat de classification et les informations des données exogènes. Elle est obtenue par calculatrice raster 36 entre le résultat de classification raster, la couche de comparaison raster et la couche de concordance. La formule donnée en bas de page permet d obtenir la lecture suivante pour les types de litiges, alors codés en sept chiffres: le 1 er chiffre traduit la concordance ou non entre classification et BD exogènes ; les 2 e, 3 e et 4 e chiffres représentent le code nomenclature attribué par la classification ; Illustration 31: Origine des informations de comparaison Signification pour la couche de concordance 0 le pixel est en dehors de la zone d étude 1 le label de la couche de comparaison et celui de la classification concordent 2 le label de la couche de comparaison et celui de la classification diffèrent 10 la couche de comparaison n a pas d informations pour ce pixel Tableau 10 : Interprétation de la couche de concordance les 5 e, 6 e et 7 e chiffre représentent le code nomenclature attribué par la couche de comparaison. Ainsi, se lit : présence d un litige (2) entre la couche «classification» qui affiche surfaces en eau (122) et la couche «comparaison» qui affiche végétation ligneuse (210). Pour une nomenclature de classification en six postes, les 30 types de litiges suivants sont théoriquement possibles : 35 Par exemple avec la fonction r. mapcalculator de Grass dans QGIS avec la formule : if(classification=0,0,if(comparaison=0,10,if(comparaison=classification,1,2))) 36 Par exemple avec la fonction r. mapcalculator de Grass dans QGIS avec la formule : concordance* classification*10+ comparaison/100 Page 62 / 106
63 Comparaison Classification Classe Classe Classe Classe Classe Classe Classe Sans objet Classe Sans objet Classe Sans objet Classe Sans objet Classe Sans objet Classe Sans objet Tableau 11 : Identification de tout les types de litiges théoriquement possibles CLASSIFICATION COMPARAISON CONCORDANCE TYPES DE LITIGES Figure 14: Visualisation sur un même territoire des couches classification, comparaison, concordance et type de litiges En pratique, les informations contenues dans la couche comparaison représentent entre environ 70 % du territoire, dont environ 25 % correspond à des zones de litiges. Sur la Drôme, le principal litige est entre la végétation non ligneuse de la classification et les formations arborées de la couche comparaison (70 % des litiges environ). Cela s explique sur la Drôme par le fait que les territoires couverts par des vignes (formations arborées) sont mal identifiés par la classification de l image DETERMINATION DE REGLES DE POST-TRAITEMENTS La couche de litige sert à identifier des règles de post-traitements et à en appliquer certaines. Ce rapport propose des règles applicables par défaut, issues de l expérience apportée par les expérimentations sur différents territoires. Cette partie est donc facultative en première approximation, même si idéalement, les règles sont à confirmer pour chaque nouvelle image et/ou nouveau type de paysage. D une manière générale, la détermination de règles de post-traitements se fait par comparaison visuelle de données de bases exogènes (en pratique la couche de comparaison) avec le résultat de classification, l information présente sur l image satellite faisant foi. Les zones à contrôler sont les zones de la couche de litiges dont le label commence par «2». Des contrôles visuels «type de litige» par «type de litige» déterminent pour chaque type de litige si c est le résultat de classification qui est généralement juste, si ce sont les bases de données exogènes qui sont généralement juste ou si aucune des deux approches n est plus juste que l autre. En pratique, une centaine Page 63 / 106
64 de polygones sur une dizaine de secteurs pour chaque type de litige semble fournir des conclusions statistiquement valables. Arbitrairement, une couche est considérée plus fiable qu une autre si 80 % des cas lui donnent raison. Ce travail a par exemple été mené sur les sept dalles de la Drôme. Illustration Type de litige Classification Comparaison Gestion du litige : végétation non ligneuse : végétation ligneuse La couche classification est plus fiable : végétation non ligneuse : artificialisé La couche comparaison (et donc les BD exogènes) sont plus fiables : végétation non ligneuse : végétation ligneuse Aucune des deux n a raison. Il s agit de : sols nus. Tableau 12 : Exemple de contrôles visuels Parfois, un travail plus fin, mené au niveau de la base de donnée exogène plutôt que de la couche de comparaison, permet d identifier les éléments exogènes précis qui sont pertinents pour les corrections. L ensemble de ces comparaisons est résumé dans le tableau suivant. Page 64 / 106
65 COMPARAISON CLASSIFICATION Classe Surfaces anthropisées Classe Sols nus Classe Surfaces en eau Classe Neige et Glace Classe Végétation ligneuse Classe Végétation non ligneuse Classe Surfaces anthropisées Sans objet CLC plus fiable BD Topo Hydro plus fiable CVI plus fiable BD Topo bâti (aérodrome en herbe) plus fiable Classe Sols nus BD Topo Bâti, réseau routier et voies ferrées plus fiable Sans objet BD Topo Hydro plus fiable Classe Surfaces en eau BD Topo Bâti, réseau routier et voies ferrées plus fiable Sans objet CVI plus fiable BD Topo bâti (aérodrome en herbe) plus fiable Classe Neige et Glace Sans objet Classe Végétation ligneuse BD Topo Bâti, réseau routier et voies ferrées plus fiable CLC plus fiable BD Topo Hydro plus fiable Sans objet Classe Végétation non ligneuse BD Topo Bâti, réseau routier et voies ferrées plus fiable CLC plus fiable BD Topo Hydro plus fiable CVI plus fiable Sans objet Case vide La classification a généralement raison dans ce type de litige Type de litige très rare La règle marche généralement, mais peut dépendre des images ou des paysages Tableau 13 : Tableau de comparaison par type de litige Ces informations sont valables uniquement sur les zones de litiges, qui sont une petite partie de l ensemble du territoire. Sur les autres zones, soit l information n est pas disponible dans les bases de données exogènes, soit la classification est en accord avec les informations exogènes. Page 65 / 106
66 Au final, ces contrôles visuels mettent en évidence les règles de correction. Le tableau précédent permet d identifier les règles de traitements directs, l analyse visuelle permet d appréhender les post-traitements indirects. Sauf certains cas particuliers, les traitements directs peuvent être effectués indépendamment des traitements indirects LE POST-TRAITEMENT DIRECT Certaines bases de données sont quasiment systématiquement plus fiables que la classification sur toutes les zones de litiges. C est le cas par exemple du réseau routier de la BD Topo ou du casier viticole informatisé. Dans d autres cas, l information exogène n est meilleure que dans certains cas de litiges. Par exemple, les carrières et décharges de CLC sont plus précises que les non ligneux de la classification, mais pas plus justes que les ligneux. L information exogène est alors imposée sous condition. Le fait d imposer des données exogènes, de manière systématique ou conditionnée, correspond à ce qu on appelle ici les post-traitements directs. Ils s effectuent en deux étapes : la construction de la couche de post-traitement direct, et son application. La couche de post-traitement direct systématique, en format raster, se construit de la même manière que les couches d apprentissage et de comparaison 37. Les spécifications de la couche de post-traitement dépendent cependant des règles définies à l étape précédente. Par défaut, nous proposons les règles suivantes : Couche compilée (Du moins fiable [1] au plus fiable [4]) Base de données Nomenclature de la couche de posttraitements directs et systématiques 1 CVI Vignes 2 BD Topo bati BD Topo hydro BD Topo réseau routier 2011 BD Topo voies ferrées Données, couche(s) Bâti remarquable, industriel, indifférencié, terrain sport (terrain de tennis) Piste aérodrome en dur Piste aérodrome en herbe Permanent Route (autoroute, bretelle, quasi-autoroute, route à une chaussée, route à 2 chaussées, route empierrée) Surface route Tronçon ferré Aire de triage Tableau 14: Construction de la couche de post-traitement directs et systématiques La nomenclature à ce stade peut évoluer par rapport à la nomenclature d apprentissage. En effet, des informations exogènes fines et pertinentes permettent de compléter la nomenclature. C est le cas ici du poste (Route) qui est obtenu par l utilisation de BD exogènes uniquement. Cette couche est ensuite «imposée» par calculatrice raster 38 au résultat de classification. 37 Compilation sous PostgreSQL, rasterisation des 4 couches, fusion des 4 couches par calculatrice raster en prenant en compte l ordre de fiabilité. 38 Formule : if(post-traitement direct > 0, post-traitement direct, couche classification) Page 66 / 106
67 Le tableau suivant résume les post-traitements directs conditionnels retenus. Type litige Couche «classification» Couche «comparaison» Couche «classification corrigée direct conditionel» Nomenclature Définition Nomenclature Définition Nomenclature Définition Sols nus Artificialisé Artificialisé Non ligneux Artificialisé Artificialisé Artificialisé Sols nus Sols nus Non ligneux Sols nus Sols nus Non ligneux Ligneux Ligneux Tableau 15: Les post-traitements directs conditionnés au type de litige La couche de post-traitements associée est la couche comparaison, qui est appliquée au résultat de classification via une calculatrice raster 39. Remarque : Au lieu d appliquer successivement la couche de post-traitement direct systématique et la couche de post-traitement direct conditionnelle au résultat de classification, une unique couche de posttraitement direct peut être construite par calculatrice raster à partir de la couche de litige et des BD exogènes, pour une seule application au résultat de classification LE POST-TRAITEMENT INDIRECT Au-delà des conclusions du tableau de comparaison, l analyse visuelle met en évidence que les informations exogènes peuvent être utilisées pour lever certaines confusions en identifiant des zones géographiques dans lesquelles certaines classes ne peuvent pas être. Ce type d approche correspond à ce qu on appelle ici les post-traitements indirects. D une manière générale, les classifications automatiques présentent certaines confusions systématiques. C est le cas par exemple entre les espaces anthropisés et les sols nus (éboulis...) en zones de montagnes. Au regard des similitudes des signatures spectrales entre ces deux classes, ces confusions ne peuvent pas être traitées directement lors de la classification, du moins avec l'approche retenue (images satellites à 5 m, approche pixel en monodate). La levée de ce problème n est possible qu à travers l utilisation de BD exogènes. Pour faciliter la présentation de cette étape, les «espaces sans végétation» sont définis pour cette partie comme l'union des espaces anthropisés et de sols nus. Lever les confusions entre sols nus et espaces anthropisés revient à définir parmi les pixels identifiés comme " espaces sans végétation ", lesquels sont de l'anthropisé et lesquels sont des sols nus. Il ne s agit pas de rajouter donc de nouvelles surfaces d'anthropisé ou de sols nus, mais de les discriminer parmi les surfaces d «espaces sans végétation». Les éléments pertinents d «espaces sans végétation» (routes, habitations...) issus de BD exogènes ont été rajoutés lors de l étape précédente. Pour cela, trois zones sont identifiées à partir des données exogènes. D une part, les zones de bâtis et de routes diverses 40 de la BD Topo, dilatées de 30 m, sont des zones dans lesquelles on considère qu il ne peut pas y avoir de sols nus (éboulis, falaises...) dans l immense majorité des cas. Les «espaces sans végétation» y deviennent systématiquement des surfaces anthropisées. D autre part, dans les zones à plus de 150 m de bâtis et de routes connues dans la BD Topo, les «espaces sans végétation» ne peuvent pas être du bâti ou de la route, et deviennent systématiquement des sols nus. Enfin, les zones entre 30 m et 150 m de bâtis et de routes connues sont des zones où il n est pas possible de trancher, et où le label des «espaces sans végétation» reste inchangé par rapport au résultat de classification et aux premiers post-traitements. Autrement dit, dans ces zones, les surfaces identifiées 39 Formule : if(litige type= or litige type= or litige type= or litige type= or litige type= ,comparaison,classification) 40 L intégration des chemins non goudronnés (chemins forestiers, chemins de pierre etc...) pour la mise en place de ce masque est discutable et à valider avec l utilisateur avant la construction de la couche. En fonction du choix retenu, ces chemins seront considérés comme sols nus ou comme surfaces anthropisées. Page 67 / 106
68 comme surfaces «anthropisées» restent des surfaces anthropisées et celles comme sols nus restent des sols nus. Concrètement, une couche raster en trois classes est crée à partir des éléments de bâti et de routes de la BD Topo dilatés à 30 et à 150 mètres. Le processus de construction est dans la même logique que la création de couches raster précédentes à partir de BD exogènes. Une calculatrice raster conditionnelle corrige ensuite le résultat de classification 41. Illustration 32: Exemple de traitement indirect pour lever les confusions anthropisés / sols nus En haut à gauche : image satellite. En bas à gauche : résultat de classification sans post-traitement indirect. En haut à droite : zones tampon Rouge : zones proches d anthropisés de données exogènes, où les sols nus seront relabellisés en anthropisé Blanc : zones intermédiaires où aucune modification ne sera faite Gris : zones éloignées d anthropisé «connu» où les pixels anthropisés seront modifiés en sols nus. En bas à droite : Classification après post-traitement indirect. Cette méthode rapide permet en pratique de corriger rapidement une part importante des confusions. Les seuils de 30 et 150 mètres peuvent être affinés en fonction de l étude et du paysage. Ils sont adaptés pour du travail sur des images à 5 mètres en zone de montagne. Les fichiers fonciers peuvent également être utilisés pour construire la couche raster des post-traitements indirects. Il suffit d intégrer les surfaces bâties des fichiers fonciers en complément du bâti dilaté de la BD Topo lors de la construction des zones d exclusion des sols nus. 41 Si im1 est l OCS et im2 la couche pour les traitements indirects ; si les espaces anthropisés correspondent au label et les sols nus correspondent au label ; si 0 correspond aux zones à moins de 30 mètres d anthropisé connu, 1 aux zones à plus de 150 m et 2 aux zones entre les deux, l expression est du type : expression = "if((im1b1 == or im1b1 == 11000) and im2b1 == 0, , if((im1b1 == or im1b1 == 11000) and im2b1 == 1, , im1b1)) Page 68 / 106
69 Ce type d approche peut être utilisée si besoin pour lever d autres confusions. Ainsi, le RPG ou le CVI peuvent aider à supprimer le bâti présent à l intérieur des polygones de cultures, en utilisant une érosion de 15 mètres par exemple L INFORMATION DE CORRECTIONS ISSUES DE BASES DE DONNEES EXOGENES L information de chaque modification apportée à la classification est à sauvegarder pour garder en mémoire la source d information de l OCS. Cette information est à stocker sous forme d une couche raster «source de l information exogène» construite à partir des bases de données exogènes et de la couche de litige, avec les propriétés décrites dans le tableau ci-dessous. Cette couche se construit de la même manière que les autres couches du même type, en appliquant 42 une calculatrice raster complémentaire pour les zones correspondant aux traitements directs conditionnels. 42 Formule du type : if(post traitement direct systématique >0 and (litige == or litige == or litige = or litige == or litige == ),Code_BD,0)) Page 69 / 106
70 Nature du posttraitem ent Direct conditi onnel Direct systém atique Couche compilée (Du moins fiable (1) au plus fiable (9)) Base de donné es 1 BD Carto Nomenclature de la couche «source de l information exogène» Données, couche(s) Traitement 101 Sélection uniquement sur les zones reconnues comme sols nus et non ligneux par la classification 2 CLC 401 Roches nues Sélection uniquement sur les zones reconnues comme artificialisé et non ligneux par la classification 3 BD Foret 4 BD Topo Végétat ion 5 Vergers prunus 6 CVI BD Topo bati BD Topo hydro BD Topo réseau routier 2011 BD Topo voies ferrées Forêt fermée de conifères, Forêt fermée de feuillus, Forêt fermée mixte peupleraie, Formation herbacée Bois Haies Zone arborée 501 Vignes Toutes les zones Bâti remarquable, Bâti industriel, Bâti indifférencié, Terrain sport (terrain de tennis) Piste aérodrome en dur Piste aérodrome en herbe Sélection uniquement sur les zones reconnues comme non ligneuses par la classification Toutes les zones Toutes les zones 208 Permanent Toutes les zones Route (autoroute, bretelle, quasi-autoroute, route à une chaussée, route à 2 chaussées, route empierrée) Surface route Tronçon ferré Aire de triage Toutes les zones Toutes les zones Tableau 16: Construction de la couche «source de l information» Page 70 / 106
71 LA VECTORISATION ET LA GESTION DE L UMC La vectorisation consiste à transformer l image raster de l occupation des sols post-traitée en polygones. Cette étape peut être faite avec différents outils, par exemple, sous QGIS en utilisant GDAL 43 ou GRASS. Pour les travaux sur de grandes zones, l application LSMS 44 de l OTB [55] est à privilégier. Lors de la vectorisation, les polygones de surface inférieure à l UMC 45 doivent être fusionnés avec les polygones voisins afin de respecter les spécifications. En effet, l UMC à l issue de la classification correspond théoriquement à la surface du pixel de l image satellite (25m² pour une image RapidEye par exemple), même si l information à ce niveau de détail n est pas forcément pertinente. L UMC correspondant à une simple vectorisation du raster correspond à la surface d un pixel et est atteinte lorsque des pixels isolés deviennent des polygones. Les règles d agglomération sont définies dans les spécifications. Dans l état de développement actuel de la méthodologie, l agglomération sémantique de l information se fait par rapport au label majoritaire dans le polygone aggloméré lors de l application de l OTB application «otbcli_lsmssmallregionsmerging». Certaines couches d occupation du sol, comme la future couche nationale OCS GE, ont une autre approche en donnant parfois plus d importance à certaines classes (une surface de 500m² contenant seulement 100m² de surface anthropisée sera par exemple considérée comme surface anthropisé). Si cette approche est retenue, des développements complémentaires, non décrits dans ce rapport, doivent être mis en place. Illustration 33: Visualisation de changement d'umc Gauche : UMC = 25 m² Droite : UMC = 500 m² Remarque : l application d une telle agglomération a pour conséquence la perte des objets linéaires trop fins, qui n apparaissent plus qu aux endroits où ils sont suffisamment larges pour respecter l UMC. A l issue de cette étape, des polygones adjacents de même label apparaissent aux endroits où des polygones de même labels étaient séparés par un polygone de surface inférieure à celle de l UMC (une route dans une forêt par exemple). 43 Outil polygoniser 44 Nous conseillons l OTB application otbcli_lsmssmallregionsmerging pour cette étape, en mettant la valeur de l UMC pour le paramètre «minsize» 45 Dans notre cas, l UMC est de 500 m². L outil présenté à cette étape ne permet pas de traiter différemment différentes classes d occupation des sols, on ne peut donc pas définir d UMI spécifiques à certaines classes. Page 71 / 106
72 Illustration 34: Exemples de polygones adjacents de même labels en zones forestière Pour des raisons de manipulation, de poids et d esthétique, la couche doit être simplifiée. Deux options sont possibles. La plus longue consister à rasteriser 46 la couche puis de la vectoriser à nouveau. L autre option consiste à fusionner les polygones de même label en un seul polygone multiparties 47, qui seront ensuite séparées 48. Suivant les puissances de calcul disponibles, le territoire doit parfois être vectorisé morceaux par morceaux. En pratique, le découpage par morceaux se fait selon une grille de cases carrées d environ 50 km de côté. Le découpage du raster peut se faire par exemple sous QGIS 49. A l issue de la vectorisation effectuée dalle par dalle, les dalles vecteurs peuvent également être fusionnées via QGIS LE MODELE DE DONNEES Le dernier traitement de la couche d OCS consiste à finaliser la table attributaire des polygones. Le modèle de données est à définir au niveau des spécifications. Dans le cas de l OCS produite sur Rhône-Alpes, elle contient les éléments suivants : - un identifiant unique, sous forme de nombre entier caractérisant le polygone; - le label majoritaire de couverture du sol associée au polygone, fournissant la couverture majoritaire sur la surface du polygone présente sur la couche OCS à 25m² ; 46 Par exemple via l OTB avec «otbcli_rasterization» 47 Par exemple avec la commande OGR et la requète suivante : ogr2ogr -f \"%s\" %s %s -dialect sqlite -sql \"SELECT ST_Union(geometry), %s FROM %s GROUP BY %s\""%(format_shape,tmp_file,input_file,column, filename,column)) 48 Par exemple avec OGR en appliquant à toutes les parties du polygone ogr.creategeometryfromwkb et ogr.feature 49 Création de la grille : QGIS > Vecteur > Outils de recherche > Grille Vecteur (Polygone, basée sur l'emprise de l'image, m...). Durée < 1min Séparation des cases de la grille en vecteurs de découpage : QGIS > Vecteur > outils de gestion de données > Séparer une couche vectorielle... Durée < 1min Découpage de l'image en dalles : QGIS > Raster > Extraction > Découpage selon masque (Attention, il peut y avoir un problème de 0, même si on définit une valeur nulle à 0) Durée < 5min En cas de problèmes de 0 : QGIS > Raster > Conversion > Convertir (Translate) (paramètres : mettre nodata : 0 càd gdal_translate -a_nodata 0). Durée < 5min 50 Assemblage des dalles vecteurs en une seule : QGIS > Vecteur > outils de gestion de données > fusionner les shapefile en 1 seul. Durée < 10min Page 72 / 106
73 - la date de mise à jour (qui correspond à la date de l image si l information du polygone est majoritairement issue de l image ou à la date de la BD exogène si l information vient majoritairement d une BD exogène) ; - la source majoritaire de l information (classification, identifiée RE pour RapidEye, ou nature de la base de donnée exogène : CLC, Vergers Prunus, BD Carto, BD Topo, CVI, BD Topo ou RPG) ; - la proportion (en%) de l information du polygone au regard de chacune des sources. Illustration 35: Exemple de table attributaire Ces informations sont disponibles dans les rasters utilisés lors de la construction de la couche, à savoir le résultat de classification post traité à 25 m², et la couche «source de l information exogène». La table attributaire s obtient en croisant les polygones avec ces couches raster 51. Cette même méthode peut être utilisée pour définir des statistiques d occupation des sols sur le territoire que l on veut (par départements, par communes ). Enfin, les toutes dernières étapes de nettoyage peuvent également s effectuer sous QGIS l outil privilégié par le PCI est la librairie rasterstat [56] pour calculer les statistiques et les fonctions OGR adaptées pour leur intégration aux tables attributaires 52 Sous QGIS : Mettre les float en int : Ouvrir la table attributaire - > Calc de champs : créer un nouveau champ > expression : toint("champs_actuel qui sera à supprimer à posteriori") Date de la source majoritaire : création de la colonne Datemaj. Exemple d expression : Case When majority like "Classif" Then 2011 when majority like "BDCarto" Then 2010 Else 2009 End Calcul de l'identifiant unique : Ouvrir la table attributaire - > Calc de champs : $rownum Page 73 / 106
74 L INFORMATION USAGE DES SOLS PRINCIPE GENERAL Cette partie présente les manipulations complémentaires pour intégrer des informations d usage du sol à la couche. Ces réflexions sont en cours de mise en place, la méthodologie de ce rapport ne fournit pas un usage exhaustif sur tout le territoire. Ces informations sont exclusivement issues de bases de données existantes, en l occurrence la BD Topo, la BD Carto, les fichiers fonciers, le RPG, les vergers prunus et le CVI (croisé avec la BD Parcellaire pour avoir les objets géométriques). La méthode se décompose en quatre étapes, dans la même logique que les étapes de mise en place des échantillons d apprentissage en macroclasse ou que les post-traitements utilisant des données exogènes. Dans un premier temps, les bases de données exogènes sont combinées sous PostgreSQL/PostGis pour fournir sept couches d usage, qui sont rasterisées sous QGIS. Ces couches sont ensuite fusionnées en une seule couche d usage suivant certaines règles de priorisation et de cohérence avec la couverture du sol. Une analyse statistique entre la couche d OCS et la couche d usage permet d identifier l usage majoritaire de chaque polygone. Cette information finale d usage est enfin appliquée à la couche d OCS. Les prochaines pages détaillent spécifiquement ces différentes étapes. Tableau 17: Visualisation des différentes étapes de l'intégration de l'usage dans la couche EXTRACTION DE L INFORMATION D USAGE DES BD EXOGENES La nomenclature retenue pour l usage des sols s appuie sur celle de l OCS GE de l IGN [57]. Notre nomenclature est non exhaustive et s est précisée au regard des données disponibles pour l étude. Le tableau ci-dessous identifie les données exogènes utilisées et les codes de nomenclature retenus en pratique. Ces codes diffèrent des codes du groupe de travail OCS GE (du type US 1.x.x ) pour faciliter les manipulations ultérieures. Page 74 / 106
75 Illustration 36: Nomenclature retenue pour l'usage des sols Dans la même logique que pour les informations d apprentissage, les données sont placées dans sept couches «compilations» construites selon les règles suivantes. Les objets ne sont pas érodés. Couche compilée (Du moins fiable [1] au plus fiable [8]) Base de données Code usage OCS GE Code usage de l étude 1 BD carto 2010 US Carrière, décharge Données, couches 2 RPG 2011 US Tout sauf 0 (pas d information) et 28 (divers) 3 Majic 2011 US terrains à bâtir, terrain d agrément 4 CVI 2010 US Vergers prunus 2012 US BD Topo bati 2011 US Réservoir (château d eau+réservoir industriel), bâti remarquable (hors gare et aérogare), bâti industriel, bâti indifférencié, gare, cimetière, terrain sport (terrain de tennis) 7 BD Topo réseau routier 2011 BD Topo voies ferrées 2011 US Bâti agricole, serre, silo US Gare US Piste aérodrome en herbe, Piste aérodrome en dur, aérogare US Route (autoroute, bretelle, quasi-autoroute, route à une chaussée, route à 2 chaussées, route empierrée), surface route US Tronçon ferré, aire de triage Tableau 18: Tableau de construction des couches d'usage Page 75 / 106
76 Ces couches de compilations sont ensuite rasterisées sous QGIS selon la même méthode que pour les informations d apprentissage et fournissent sept couches raster chacune contenant une partie des informations d usage CREATION DE LA COUCHE USAGE La couche «usage» est une couche globale en six classes caractérisant l usage des sols. Elle est issue des sept couches d usage raster issues de l étape précédente et de l OCS raster finale. Les informations d usage sont conservées seulement si elles sont cohérentes avec les informations d occupation du sol, selon les règles d application décrites dans le tableau suivant, et sont traitées par ordre de fiabilité dans la même logique que les manipulations pour l obtention des informations d apprentissage. Tableau 19 : Correspondance entre usage et occupation du sol Concrètement, cette couche est construite en utilisant une calculatrice raster APPLICATION DE L USAGE A LA COUCHE D OCS L OCS finale à 500 m² est rasterisée 54 selon le code identifiant unique de chaque polygone. Cette OCS raster est ensuite croisée statistiquement 55 avec la couche usage. 53 Par exemple sous QGIS avec r.mapcalculator de Grass. La formule est du type : if(usage_bd=110 and (classification=12100 or classification=12300 or classification=21000 or classification=22000), 11, if(usage_bd=111 and classification=11000, 11, if(usage_bd=13, 13, if(usage_bd=2350 and classification=11000, 235, if(usage_bd=2351, 235, if(usage_bd=411 and classification=11000, 411, if(usage_bd=412 and classification=11000, 412, if(usage_bd=413 and (classification=11000 or classification=22000), 413, 0)))))))) 54 La rasterisation se fait selon les mêmes méthodes que les autres étapes de rasterisation du rapport. 55 Par exemple sous QGIS avec l outil r.stats de Grass, en demandant les catégories et le dénombrement des cellules. Cet outil renvoie tous les croisements possibles en dénombrant le nombre de pixels associés à chaque croisement. Il crée un fichier html, qui peut être ouvert sous libre office puis enregistré sous format tableur. Ce tableau peut être traité directement à partir de libre office ou sous Postgresql, ce qui est l option retenue lors de l étude. Page 76 / 106
77 Les statistiques obtenues à l étape précédente permettent de calculer le pourcentage de représentation de chaque usage au sein de chaque objet géométrique. Si un des usages égale ou dépasse 50 % de représentation, alors l ensemble de l objet sera qualifié de cet usage, sinon, aucun usage n est spécifié pour l objet. Cette opération est réalisée sous Postgresql. Le tableau ci-dessous illustre trois exemples rencontrés sur le secteur test de l Assemblée du Pays Tarentaise Vanoise. Id Usa ge Nb Pixel s % de pré sen ce Répartition avant attribution de l usage Interprétation % 86% L objet identifié 240 recouvre au total 104 pixels, dont 15 sont classés sans information usage et 89 en agricole. Après attribution usage % L objet identifié 7977 recouvre au % total 103 pixels, dont 43 sont classés sans % information usage, 52 en résidentiel et 8 en transport routier % L objet identifié 8598 recouvre au total 430 pixels, dont 228 sont % classés sans information usage, 152 en résidentiel et 50 en transport routier % Tableau 20: Exemple de croisement statistique entre l usage et la classification à 500m² Du fait de la vectorisation à 500 m² en fonction de la couverture du sol, beaucoup de secteurs résidentiels relativement diffus disparaissent en usage. Dans notre exemple c est le cas de l objet identifié L utilisation de ces informations par la suite doit prendre en compte ce type de biais. Page 77 / 106
78 5. COMPLEMENTS 5.1. LE PARAMETRAGE INTRODUCTION Comme l illustre l exemple suivant, la qualité de l OCS finale dépend fortement du choix des paramètres. Illustration 37: Comparaison de résultats obtenus avec un bon et au mauvais jeu de paramètres Haut : image satellite. Gauche : Résultat obtenu avec un bon jeu de paramètres. Droite : Résultat obtenu avec un mauvais jeu de paramètres Page 78 / 106
79 Le paramétrage de la méthodologie consiste à déterminer les valeurs des paramètres dont l utilisation fournit la couche d occupation des sols de la meilleure qualité possible. Les paramètres sont l ensemble des facteurs susceptibles d impacter la qualité du résultat : choix des néocanaux utilisés, critères de construction (sélections, érosions...) des informations d apprentissage, nombre de classes de sous-échantillonnage pour chaque macro-classes, paramètres de sélection des micro-classes, paramètres liés à l algorithme de classification (noyau de transformation du SVM, ratios divers...) ou paramètres liés aux post-traitements (taille de fenêtres associés au filtre majoritaire, tampons choisis pour les bases de données exogènes ) Tout au long de ce rapport, les paramètres conseillés, issus d expérimentations sur différents territoires, ont été proposés. Cette partie précise les moyens de les confirmer, affiner ou de les identifier dans le cadre de nouvelles études. Maximiser la qualité d une couche d OCS nécessite de pouvoir la quantifier de manière objective, reproductible et comparable. La notion de qualité d une couche d OCS est complexe et se décompose en différents volets. La qualité externe d une part, correspond à l adéquation entre le besoin utilisateur et les spécifications. Par exemple, la couche a une bonne qualité externe si ses spécifications permettent de calculer les indicateurs requis pour le suivi des politiques publiques de gestion économe de l espace. La qualité interne d autre part correspond à la qualité intrinsèque du produit au regard des spécifications. C est par exemple le respect de la nomenclature ou de l UMC définie dans les spécifications. Les spécifications sont elles-mêmes décomposées en différents volets : les spécifications géométriques, sémantiques, temporelles, structurelles... Figure 15: Généralités sur la qualité d'une OCS Le calibrage traité dans cette partie correspond à une sous partie du volet «sémantique» de la qualité interne : son objectif est de limiter les confusions entre les classes à l issue de la classification et des premiers post-traitements (fusions, lissages...). La même logique peut être appliquée pour estimer la qualité sémantique de la couche d OCS finale à l issue des traitements complets. Dans ce cas, les temps de calculs seront plus élevés (intégration de données exogènes, régularisation de l UMC ) et les informations de contrôle doivent être adaptées. Le principe du paramétrage consiste à évaluer la qualité obtenue avec différents jeux de paramètres, ou scénarios, et identifier celui maximise la qualité. Page 79 / 106
80 5.1.2.LES METHODOLOGIES DE CALIBRATION LES INDICATEURS DE QUALITE Les confusions s évaluent classiquement de manière statistique au regard d échantillons de contrôles, également appelés échantillons de référence. Ces échantillons sont des polygones labellisés et détourés de manière cohérente avec les règles de représentation de l étude (cohérence directe avec l image satellite si on calibre la classification seule, cohérence avec les règles de représentation de l OCS si on calibre la couche d OCS finale). Ils sont issus de contrôles terrain si cela est possible et adapté, ou d une photointerprétation fine de l image, généralement croisée avec une photo-interprétation sur des images plus résolues à la même date pour lever d éventuelles incertitudes. Des pré-traitements de segmentation de l image peuvent accélérer leur obtention, même si les tests menés par le PCI AST en la matière ne se sont pas avérés concluants. Par rapport aux échantillons d apprentissage, une petite surface suffit pour la vérification (quelques dizaines de polygones par classe), à condition que les échantillons soient représentatifs de l hétérogénéité des paysages et choisis de manière la plus objective possible. Par contre, ces échantillons doivent être parfaitement justes, dans la mesure où leurs erreurs impactent directement le calibrage des paramètres. L obtention d échantillons de contrôle est parfois difficile. Au-delà du caractère chronophage lié à une digitalisation fine, ils sont subjectifs, et d autant plus litigieux que la nomenclature ou la géométrie est fine. En particulier, lorsque l on cherche à qualifier le résultat final de l OCS (avec l ensemble des posttraitements), ils sont définis au regard des spécifications de la couche, et donc dépendent de l interprétation de ces spécifications. De ce fait, les taux de confusion calculés doivent être utilisés avec beaucoup de précautions. Nous les utilisons exclusivement de manière relative, pour comparer deux résultats de classification. Les présenter comme indicateurs absolus de qualité de la couche d OCS est discutable. En pratique, une digitalisation exhaustive de zones représentatives de différents paysages fournit ces échantillons. Illustration 38: Visualisation d exemples d'échantillons de contrôles saisis manuellement et utilisés pour l'évaluation de la qualité Page 80 / 106
81 Le croisement entre les échantillons de contrôle et la couche d OCS permet d obtenir une matrice de confusions 56. C est un tableau à double entrée qui précise la distribution des pixels des échantillons de contrôle au regard du résultat de classification. Elle quantifie statistiquement les confusions entre les classes. Tableau 21 : Lecture d une matrice de confusion Tableau 22: Exemple de matrice de confusions Les indicateurs de qualité sémantique utilisables pour la calibration se calculent alors directement à partir de cette matrice de confusion. La précision globale représente le nombre de pixels de vérification bien reconnus par rapport au nombre total de pixels de vérification (entre 0 et 100%, 100 % étant la valeur traduisant la meilleure qualité). L indicateur kappa représente la qualité de la classification par rapport à la qualité d une classification «aléatoire». Il évolue entre -1, pour les classifications extrêmement mauvaises, et 1, pour les classifications parfaites par rapport aux échantillons de vérification. 57 Le F-Score est un indicateur qui se calcule classe par classe en fonction de deux indicateurs intermédiaires, le rappel et la précision. Une classe dont le F-Score est de 1 est parfaitement classée (les pixels identifiés comme appartenant à cette classe sont effectivement de cette classe, et aucun pixel de cette classe n est oublié). Ces indicateurs sont calculés automatiquement par les logiciels de télédétection, ou peuvent être calculés 56 Par exemple avec l application otbcli_computeconfusionmatrix de l OTB 57 L indicateur Kappa, s il permet d obtenir des résultats intéressant en première approche, est cependant discutable sur différents points [58] Page 81 / 106
82 manuellement sur un tableau en utilisant les formules données par la bibliographie. Classiquement, nous utilisons l indicateur Kappa pour le paramétrage [12] [59] [60] défini de la manière suivante : Dans la formule ci-dessus : - N est le nombre d observations de la matrice de confusion (nombre total de pixel) - r est le nombre de lignes de la matrice (nombre de classes pour le contrôle), - x i+ et x +i sont respectivement les totaux marginaux 58 de la ligne i et de la colonne i - x ii est le nombre d observations dans la colonne i et la ligne i (nombre de pixels bien reconnus de la classe i) Une autre approche qualifie la qualité sémantique et géométrique d une couche d OCS. Elle consiste à contrôler aléatoirement un nombre statistiquement valide de polygones de chaque classe de la couche finale et de mesurer les confusions associées. Cette méthode, qui évite de produire des informations de contrôle inévitablement «discutables», nécessite toutefois un travail visuel important pour chaque test mené, ce qui n est pas compatible avec un paramétrage automatique, c est pourquoi nous ne l avons pas retenue. Elle reste également dans une moindre mesure dépendante de l interprétation des spécifications STABILITE DE LA METHODOLOGIE Certaines étapes de la chaîne de traitement mettent en jeu des tirages aléatoires (algorithme k-means par exemple). Un même jeu de paramètres donne ainsi potentiellement deux résultats différents. Si le kappa évolue trop fortement entre plusieurs simulations d un même scénario 59, la qualité de ce scénario doit être la moyenne des qualités obtenues avec plusieurs simulations de ce même scénario. En pratique, jusqu à cinq simulations 60 peuvent être nécessaires par scénario pour obtenir un indicateur kappa stable. Par ailleurs, la qualité de la méthodologie s évalue également au regard de sa stabilité. Une méthodologie trop instable est à écarter dans un souci de reproductibilité LES METHODES DE RECHERCHE Illustration 39: Formule du Kappa à partir de la matrice de confusions En pratique, les combinaisons de paramètres possibles sont en nombre trop élevé pour une étude exhaustive qui demanderait des milliers d années de calculs. Une recherche partielle, et si possible optimisée, s impose. En raison de temps de calcul important, les études paramétriques sont menées sur des zones tests plus petites, chacune représentative d un paysage. Pour des images à 5 mètres de résolution, il est conseillé de retenir des zones entre 50 et 100 km². Deux méthodes de recherche du scénario optimal ont été utilisées. Une approche systématique et une approche avec tirages aléatoires. L approche systématique consiste à fixer la quasi-totalité des paramètres, à n en faire varier qu un ou deux et à analyser l impact de leurs variations sur la qualité de classification. Cette approche sert également à réduire le nombre de paramètres de recherche en détectant rapidement ceux ayant peu d influence sur la qualité. 58 total marginal : somme des produits deux à deux des sommes sur les lignes avec les sommes sur les colonnes 59 Pour rappel, un scénario est un jeu de paramètres 60 Les temps de calculs sont alors multipliés par cinq Page 82 / 106
83 Illustration 40: Exemple de recherche systématique pour deux paramètres, tout les autres étant fixés par ailleurs La figure ci-dessous illustre cette approche dans le cas de l étude de l impact de l ajout d une bande de texture, calculée selon différentes formules, sur différentes bandes, avec différentes tailles de fenêtres. Illustration 41: Qualité sémantique moyenne (Kappa moyen sur 5 classifications) de la classification en fonction du néocanal ajouté. Chaque texture est calculée selon trois tailles de fenêtre (5,10 et 15 pixels) pour chaque bande (R,V,B,RE et PIR). Cet exemple montre qu une seule nouvelle bande d information impacte sensiblement la qualité du résultat (kappa entre 0.72 et 0.88), généralement en l améliorant, mais parfois en la dégradant. Pour l apport d une seule bande d informations, la texture IC2 est la texture donnant les meilleurs résultats (bandes bleues clair). Il est difficile d identifier une bande plus pertinente que les autres pour calculer les textures. Cependant, le Red-Edge donne globalement de bons résultats, tandis que le bleu est moins pertinent. La taille de la fenêtre influence également la qualité du résultat. Une analyse plus fine montrerai ici que la taille de fenêtre à privilégier est de cinq pixels. Page 83 / 106
84 L approche systématique n est cependant pas efficace pour étudier l influence combinée de plusieurs paramètres. L approche aléatoire permet de tester des combinaisons plus larges de paramètres. Elle s initialise en définissant un scénario initial et un «espace paramétrique» 61 dans lequel les paramètres sont susceptibles d évoluer. L algorithme retenu se base sur une adaptation du recuit simulé [61]. L algorithme définit à chaque étape le nouveau jeu de paramètres à tester en effectuant un tirage aléatoire dans le voisinage du scénario dont la classification a donné le meilleur résultat parmi les scénarios précédemment testés. L algorithme se poursuit jusqu à converger vers une qualité maximale. Pour éviter les maximums locaux, l algorithme est relancé plusieurs fois à partir de différentes configurations initiales. Le schéma suivant illustre le mécanisme. Illustration 42: Exemple de parcours aléatoire dans un espace de deux paramètres Illustration 43: Exemple d'analyse aléatoire pour l'étude des critères de sous-échantillonnage Les valeurs en ordonnées correspondent à l indicateur de qualité moyen sur 5 itérations de chaque scénario. 61 Concrètement, l espace paramétrique identifie les valeurs ou plages de valeurs à tester pour chaque paramètre Page 84 / 106
85 L axe des abscisses correspond aux différentes combinaisons de sous-échantillonnage testées (de bas en haut : [nombre de micro-classes d eau, nombre de micro-classes d anthropisé, nombre de micro-classes de ligneux, nombre de micro-classes d herbacés]).l espace d analyse est donc ici en quatre dimensions, «mises à plat» dans le graphique précédent. Les critères de sous échantillonnage des informations d apprentissage impactent sensiblement la qualité du résultat (0.12 points sur le kappa). Ce type d approche permet d identifier des sous-découpages présentant de bons résultats. Ces deux approches sont implémentées dans la chaîne de traitement du PCI AST et permettent d affiner les jeux de paramètres lorsque de nouvelles configurations sont rencontrées LA MISE A JOUR L objectif principal des couches d OCS est le suivi de la dynamique des territoires. La méthodologie proposée n a donc de sens qu au regard de la production de plusieurs millésimes dont seule la comparaison permet de valider la démarche. À ce jour, les tests associés à la mise à jour de la donnée n ont pas été effectués par le PCI. Cette partie propose différents éléments de réflexion sur ce point. Les aspects liés à la mise à jour d une couche d OCS sont dimensionnants pour la production d un seul millésime. Par exemple, la production d une OCS ne peut pas fondamentalement dépendre d une donnée dont la fréquence de mise à jour est décorrélée de la fréquence recherchée pour la couche d occupation des sols. Plusieurs scénarios techniques existent pour la méthodologie de mise à jour. Trois exemples de scénarios sont ici proposés sous forme schématique. Le premier scénario consiste à produire l OCS du millésime n de la même manière que l on a produit le MOS du millésime n-1. Illustration 44: Méthodologie de mise à jour - Scénario 1 Ce scénario, intuitif, présente deux limites. D une part, si les évolutions recherchées sont dans l intervalle d incertitude de la méthodologie, les indicateurs d évolution extraits n auront pas de sens. D autre part, la cohérence géométrique entre les polygones de deux millésimes n est pas assurée, tous les contours étant potentiellement légèrement modifiés lors des étapes automatiques. Le second scénario, qui consiste à modifier l OCS du millésime n-1 en fonction de changements identifiés de manière automatique, permet de contourner ces limites. Page 85 / 106
86 Illustration 45: Méthodologie de mise à jour - Scénario 2 Le troisième scénario est une variante du scénario 2, les zones de changement étant identifiées par photointerprétation sur les nouvelles images. Illustration 46: Méthodologie de mise à jour - Scénario 3 Cette méthode potentiellement plus juste est toutefois plus coûteuse et peut présenter un biais dû au choix des zones contrôlées. Au regard des exigences classiques des services, le scenario 2 semble être à privilégier LES TEMPS PASSES Cette partie propose, à titre informatif, un ordre de grandeur des temps humains et machine nécessaires à chacune des macro-étapes de production. Cet ordre de grandeur est estimé au regard de trois hypothèses fortes. La première hypothèse est que la méthodologie est arrêtée (par exemple en prenant les propositions de ce rapport) et implémentée de manière à ce que l ensemble des tâches s enchaînent automatiquement, sans nécessiter de développements complémentaires et sans présenter de bugs. La deuxième hypothèse est que la méthodologie est mise en œuvre par un utilisateur averti qui maîtrise les outils et la chaîne de traitement. Enfin, la troisième hypothèse est que les données satellitaires comme exogènes sont propres et disponibles. L estimation ne prend pas en compte l obtention de la BD Topo par exemple. Page 86 / 106
87 Si une de ces hypothèses n est pas respectée, les ordres de grandeurs temporels sont à adapter en conséquence et sont potentiellement multipliés. Page 87 / 106
88 Tableau 23: Estimation des ressources humaines et des temps de calcul pour les différentes étapes de la méthodologie Page 88 / 106
89 6. CONCLUSION GENERALE Au final, la méthodologie présentée dans ce rapport permet d obtenir selon des processus en grande partie automatisés des couches d OCS en 4 à 8 postes d occupation des sols avec une UMC à 500 m², actualisables fréquemment. La couche est disponible en format raster ou vecteur. Les données sont assez lourdes. Pour un département, la couche raster est de l ordre de 2 Go, la couche vecteur de 500 Mo. Dans l hypothèse (forte) où les traitements sont automatisés et où le producteur maîtrise les différentes étapes, la mise en place d une production sur un département prend environ 1,5 mois. L optimisation des étapes est un enjeu important, le temps de calcul étant l élément principalement bloquant pour les délais de production d une telle couche. Certaines pistes peuvent être testées pour améliorer la méthodologie. Ainsi, si les ressources de calcul sont disponibles, l utilisation d images plus résolues (images SPOT 6 à 1,5 mètres par exemple, disponibles sur le territoire national en millésime 2014 par le programme Géosud), ou l utilisation d images en multi-date intraannuelles peut présenter un intérêt fort sur des critères géométriques ou sémantiques. Par ailleurs, des développements méthodologiques peuvent améliorer la qualité finale : intégration de l approche objet dans les classifications, croisement de résultats de classification aux qualités différentes, intégration de nouvelles bases de données en apprentissage et en post-traitement, affinage des posttraitements indirects, développement de la part de photo-interprétation... Ces développements, parfois mis en œuvre dans les laboratoires de recherche, demandent un travail méthodologique et une validation significative pour leur intégration dans une chaîne de production opérationnelle. Par ailleurs, si les outils et les méthodes évoluent, il est impératif d obtenir des couches comparables d un millésime à l autre. À ce jour, cette méthodologie n a pas été testée pour la mise à jour de couches. Des tests complémentaires doivent être menés pour prouver que cette approche permet de mesurer les dynamiques du territoire telles qu elles sont recherchées. Au final, le contexte actuel des technologies satellitaires permet d envisager l intégration d images satellites aux réflexions globales d occupation des sols en tant qu outil complémentaire aux outils historiques dans le domaine. Dans le futur, ce type de traitement sera de plus en plus simple à mettre en œuvre (projets d interfaçage web pour mettre à disposition des solutions ergonomiques et efficaces pour débutants, logiciels de plus en plus simples d utilisation, méthodologies de plus en plus fines ). L amélioration continue des logiciels libres utilisés, de la qualité des images, la diminution des temps de calcul permettent d envisager à moyen terme une utilisation étendue de ce type d approche. Page 89 / 106
90 GLOSSAIRE >/ > >7!/ >7 >1 >1,, '> 'B'> )1*!)'2!2!!!!!' > ' ( B#: '2!: +>!! /'B?1H /!!)+2@ 81 ' ;/ '>;' '1?'@ '> 'H'@>@ ;' ;' 81*! '2@>?@ ;/+# '>;! ' '@1*!>7 '>7 'H )( >@ '@# ;+'"+27! *7! ;+'!72!!! )+2@:9"/'B?1H M1M M!15M! "!!+9 1;? 1 *! "# *-! 7!):) *)*!"#* 1?/1B' 1?'' 1B >/ 1**1*! ' 1?#NN!# 1*B/!## )! 036! !)1B /1B/"1*B:)! 036!%66!:1B71*B:%66!<666!1B1*B:666! <666666! )>/5"!!!+9 Page 90 / 106
91 >O1 '' >O1*! -N:2!+N 71*B -?! # )'2 B "# )! 2 P P"2:"+Q! N!? -?!#**?' -?!#@B): )+-7"+Q! 2?' B'"+2 7-! )+2)!# 2?'?)' /MB:)!2)>1> 1! R7! /1 /1*! /1>@ /1> /D! 12 /" 1> /1B /"1*B /@ B>>B B;' B/; /D@"! #*!@M'1>#!<!!!2 B>>B! Référentiel Grande Échelle. Bases de données développé par l'ign constitué de :," "":B&6!: <9#:,@!#!"#,/ 1*!* )!+,>!:!!B;'>(!:(! B/;"# Page 91 / 106
92 @8, H H1 S 7-!)1*!;"#*!*! > "!"@?2!+ 8 " " *!# 2 2B@! 2)(!*!*! )+2 "2)2#>!: -#)@MB 8, H! *7" H!15 *77" Page 92 / 106
93 !!;'H:>-(2G: " GTTT*GT+GG!:/D>:6:P/)!))P :6&:;*#"#:" G#G %!:?1;:6%:/+)< ":" G2*GUVW36.4 &!:":6%:P7"-)+)") " /7P:%&. :6:!!))+ /!!")2: " GTTT &0 & 0 1;?:6:'+<";': " G*GGGG*G7"VV+V V!* 3 ''2 " GTTT#2! +2*G GG3&"! 4 '1?'@'@1*!>7:" GG'>;' 6 21?/1B' 2: " GG!GV*G1?/1B'V*VV26* 21?/1B' H: " GG!GV*G1?/1B'V*VHV26* OB:I";;:P@"!*+2>!*P:,!:&4 0% ;"::>!:M7::663:P@"!/*!" 7*!!*#2#2!P:1'''@;B!:" % :" G! +**GV""GG!GV;"G/+GB'' 663 1''';V;"' /* % *:/:7:::6%:P;*!7*"P: B!*'2! & B:;:6%:P@"?!"*7!**"!!P: H27*@T:!*'"7!>7. 1;#"#)P:/ 1:B1>@ 0 9::6%:P!+!:!"-: H2 3 >+::6:P)*!@>B SP: 1!/:>/@" 4 "!B/; " GTTT +*GU#WG3&. 6 :663:P*"*2;1 >!!!*">O1 1P: 8! =; " GTTT#G*GG ; " GTTTG " GTTTG"! %?':6&:@,*T;H*@, %:" GTTT* +(GRG@,*T;* &?':6%:@"*@,(R+R:* 2 H*@, %:" GTTT* +(GRG@,R,R*. /;= " GTTT#*G 0 :V " G!+!G!G7G!GV"!: 3 :6:!!))+ /!!")2: " GTTT 2!*G1;G*G'B@HVVV+V0+*:$1,? &0 & 4 ;:6:PB2;:H+!!):#!P: " GTTT2! +2*G1;G*GB2V;V!V+* 6 /DP>''P:6:P>)!) )P 1;?:6:P;!"#!* /,;'P: " G**GG*G*G,8?@ 64 /Y 6Y 6VY 61;?Y 6 Y 6V' 4 6% V2Y 6(* ( " GG(G"!Z )'@"#7:66&:P+"#) 2" +*!*(+P:'B@H % 2::6:!?H:!!' Page 93 / 106
94 & * " GTTTG G*GG. ; " G*G 0 ; /)- " G*GT+GG " GTTT" *G 4 " GGT+GG"! %6 "!)!)'> " G"GT+GG % )H; " G"(2G %!1 " G! *2G % ;1' " G!7G!G! * 2 " %% " " GTTT"GT+G"G2 %& 1:O:6:P):!![!"UP:',1: " GTTT+ *G!!GUW4 %. :::>:66:P!!!*!"!2!!*P:B>=B)1 %0 :>:6:P@!7**!!7P:1''': >7*!B!1!:/64 %3?':@,*T;:"%:/ & %4?':@,*T;:":/4& 6 &6,:/:44:P/>+7"(*!7P:/++7:%6. %6 & >7!>/:\R:" GTTT!"2 *G]+G\RG*G! ( & '?81 " GTTT**G'S'1( & 'B> " GTTT7!*GG "G! &%?':@,*T;:"4:/%4 &6 &&?':6%:@"*@,(R+R:"*!:"%:/&4.:" GTTT* +(GRG@,R,R* &. +B " G"+!G7G7" ";')1;?PX " G**GG*G*G,8?@?!VY 61;?Y 6Y 6;'V'* &3 /:B;:::6:P"I +"*#7!!* 7!P:1O*B!:8!1&%%60 %%4 &4 7"-R " G"2G"!G*"G%%3G"!.6 7"-*! " GTTTG]+G3GG*V!(G*V!("!. >:'M:"2:8:43&:P "!+!C +!P:/"OB:%6%:4. Page 94 / 106
95 7. ANNEXES ANNEXE 1 : NOMENCLATURE NATIONALE ANNEXE 2 : QUELQUES CARACTERISTIQUES D IMAGES SATELLITES ANNEXE 3 : EXEMPLE D INDICES ANNEXE 4 : NOMENCLATURE DU REGISTRE PARCELLAIRE GRAPHIQUE Page 95 / 106
96 ANNEXE 1 : NOMENCLATURE NATIONALE?1;" G2*GUVW36.4+( [!! /:2?1; Illustration 47: Nomenclature nationale - Croisement couverture et usage
97 Illustration 48: Nomenclature nationale - Croisement couverture avec Morphologie et Caractéristique
98 ANNEXE 2 : QUELQUES CARACTERISTIQUES D IMAGES SATELLITES Illustration 49: Quelques sites de références sur les images satellites disponibles
99 Illustration 50: Quelques caractéristiques d'images satellites à très haute résolution
100
101 Illustration 51: Quelques caractéristiques d'images satellites à haute résolution
102
103 Illustration 52: Quelques caractéristiques d'images satellites à moyenne résolution
104 ANNEXE 3 : EXEMPLE D INDICES Un listing assez complet d indices existants, et les références bibliographiques associées, est disponible ici : INDICES DE VEGETATION INDICES DE SOL INDICES D EAU INDICES DE BATI NDVI (Normalized Difference Vegetation Index) RVI (Ratio Vegetation Index) PVI (Perpendicular Vegetation Index) SAVI (Soil Adjusted Vegetation) TSAVI (Transformed Soil Adjusted Vegetation) MSAVI (Modified Soil Adjusted Vegetation) MSAVI2 (Modified Soil Adjusted Vegetation 2) GEMI (Global Environment Monitoring Index) WDVI (Weighted Difference Vegetation Index) AVI (Angular Vegetation Index) ARVI (Atmosphérically Resistant Vegetation Index) TSARVI (Transformed Soil Adjusted Vegetation Index) EVI (Enhanced Vegetation Index) IPVI (Infrared Percentage Vegetation Index) TNDVI (Transformed NDVI) IR (Redness Index) IC (Color Index) IB (Brilliance Index) IB2 (Brilliance Index 2) SRWI (Simple Ratio Water Index) NDWI (Normalized Difference Water Index) NDWI2 (Normalized Difference Water Index) MNDWI (Modified Normalized Difference Water Index) NDPI (Normalized Difference Pond Index) NDTI (Normalized Difference Turbidity Index) SA (Spectral Angle) NDBI (Normalized Difference Built Up Index) ISU (Index Surfaces Built)
105 ANNEXE 4 : NOMENCLATURE DU REGISTRE PARCELLAIRE GRAPHIQUE
106 Centre d études et d expertise sur les risques, l environnement, la mobilité et l aménagement Rue Pierre Ramond - CS Saint-Médard-en-Jalles Téléphone Télécopie Courriel : Siège social : Cité des mobilités - 25, avenue François Mitterrand - CS F Bron Cedex - Tél : +33 (0) Connaissance et prévention des risques - Développement des infrastructures - Énergie et climat - Gestion du patrimoine d infrastructures - Impacts sur la santé - Mobilités et transports - Territoires durables et ressources naturelles - Ville et bâtiments durables
La collecte et la gestion des données dans le cadre de la prospection d énergie solaire
Conférence SIG 2012 - ESRIFRANCE La collecte et la gestion des données dans le cadre de la prospection d énergie solaire Serge MANG-JOUBERT GAIAGO Eric VIDALENC - ADEME 1 Auteurs : Rodrigo MARIONI, Serge
Elaboration d un Plan Local d Urbanisme / d un Agenda 21
Elaboration d un Plan Local d Urbanisme / d un Agenda 21 Phase diagnostic Par : P. Mordelet, Université Toulouse 3 C. Aschan-Leygonie, Université Lyon 2 F. Boussama, Université Montpellier 1 C. Mathieu,
Prédiction de couverture de champ radioélectrique pour les réseaux radiomobiles : L apport du Système d Information Géographique ArcInfo 8
Prédiction de couverture de champ radioélectrique pour les réseaux radiomobiles : L apport du Système d Information Géographique ArcInfo 8 Christine TURCK 1 * et **, Christiane WEBER**, Dominique THOME*
BD PARCELLAIRE. Version 1.2. Descriptif de contenu Format DXF. www.ign.fr. Révisé le : Avril 2012. Date du Document : Avril 2011
BD PARCELLAIRE Version 1.2 Descriptif de contenu Format DXF Date du Document : Avril 2011 Révisé le : Avril 2012 www.ign.fr BD PARCELLAIRE Version 1.2 Format DXF Descriptif de contenu Création du document
LIDAR LAUSANNE 2012. Nouvelles données altimétriques sur l agglomération lausannoise par technologie laser aéroporté et ses produits dérivés
LIDAR LAUSANNE 2012 Nouvelles données altimétriques sur l agglomération lausannoise par technologie laser aéroporté et ses produits dérivés LIDAR 2012, nouveaux modèles altimétriques 1 Affaire 94022 /
PRÉSENTATION DU PROGRAMME DE SERVICE PUBLIC 2014 DE L IGN
PRÉSENTATION DU PROGRAMME DE SERVICE PUBLIC 2014 DE L IGN Commission Animation territoriale CNIG 28/01/2014 Marie-Louise ZAMBON IGN (chef du service des programmes à la direction des programmes civils
Mise en place d'une chaîne de production raster multi-échelles
25 Février 2014 Thierry Boch [email protected] Mise en place d'une chaîne de production raster multi-échelles FranceRaster Programme FranceRaster v4 Le produit "France Raster", coédition Esri France
Cartes de bruit stratégiques
Département de la Sarthe Cartes de bruit stratégiques Grandes infrastructures de transports Réseau autoroutier COFIROUTE Résumé non technique Article R 572-5 du code de l environnement Vu pour être annexé
Cartes de l étendue des eaux libres liés aux inondations Guide des produits
Cartes de l étendue des eaux libres liés aux inondations Guide des produits Contexte Les crues ont parfois des effets dévastateurs sur la vie humaine, les infrastructures, l économie, les espèces sauvages
Cahier des Clauses techniquesparticulières
ARCHES PUBLICS MAIRIE DE BASTIA Avenue Pierre Guidicelli 20410 BASTIA CEDEX MARCHE D ETUDES A MAITRISE D OUVRAGE EN VUE DE L ORIENTATION ET DU DEVELOPPEMENT DU SYTEME D INFORMATION GEOGRAPHIQUE SERVICE
3 - Description et orbite d'un satellite d'observation
Introduction à la télédétection 3 - Description et orbite d'un satellite d'observation OLIVIER DE JOINVILLE Table des matières I - Description d'un satellite d'observation 5 A. Schéma d'un satellite...5
L accès aux données spatiales au profit des applications satellitaires
L accès aux données spatiales au profit des applications satellitaires Le projet Geosud Pierre Maurel, coordinateur du projet GEOSUD Journée du CINES Montpellier, 9 juin 2015 1 Projet GEOSUD Des financements
Territoire3D. Descriptif de contenu. Institut Géographique National. www.ign.fr. Date du Document : Mars 2011
Territoire3D Descriptif de contenu Date du Document : Mars 2011 Institut Géographique National 73 avenue de Paris 94165 Saint-Mandé Cedex www.ign.fr Révision : Spécifications externes A 18/03/2011 Création
Intervenant : Séverin Poutrel, BURGEAP
Capacités d accueil, aménagements commerciaux, mutabilité foncière : des outils concrets pour construire un SCOT intégrant les vulnérabilités énergétiques et climatique Intervenant : Séverin Poutrel, BURGEAP
Le Parc naturel régional des SIG. Restructuration d un SIG et diffusion des données dans le cadre de la directive Inspire
SIG Restructuration d un SIG et diffusion des données dans le cadre de la directive Inspire Comment utiliser la directive Inspire à l échelle d un SIG historique pour en assurer la refonte? Claire Devaud
EVOLUTION SPATIO-TEMPORELLE DE L OCCUPATION DES ESPACES SUR LE TRIANGLE MARNAIS
EVOLUTION SPATIO-TEMPORELLE DE L OCCUPATION DES ESPACES SUR LE TRIANGLE MARNAIS MARTIN S. *, DELAHAYE F. ** Bureau d études E3C 2 rue Léon Patoux CS 50001 51664 REIMS CEDEX * Mr Stéphane MARTIN, Directeur
Document d accompagnement pour le référentiel national du C2i niveau 2 Métiers de l environnement et de l aménagement durables
Document d accompagnement pour le référentiel national du C2i niveau 2 Métiers de l environnement et de l aménagement durables A - Compétences générales et transversales liées à l exercice des métiers
Mobilité du trait de côte et cartographie historique
Mobilité du trait de côte et cartographie historique 1 Frédéric POUGET Université de La Rochelle UMR 6250 LIENSS (Littoral Environnement et SociétéS) Colloque Les littoraux à l heure du changement climatique
RESERVOIR MONITORING A PARTIR D IMAGES SATELLITES APPLICATIONS POUR LES ACTIVITÉS AMONT DE SONATRACH EN ALGÉRIE
RESERVOIR MONITORING A PARTIR D IMAGES SATELLITES APPLICATIONS POUR LES ACTIVITÉS AMONT DE SONATRACH EN ALGÉRIE Johanna GRANDA (1), Alain ARNAUD (1) et Azzédine BOUDIAF (2) (1) ALTAMIRA INFORMATION S.L.,
Charte d exploitation et de demande d accès aux Géoservices. Plateforme Territoriale GUYANE SIG
Charte d exploitation et de demande d accès aux Géoservices Plateforme Territoriale GUYANE SIG 25/02/2014 SOMMAIRE 1. LEXIQUE... 3 2. DEFINITION... 3 3. DOMAINE D APPLICATION... 3 A. Objet... 3 B. Bénéficiaires...
SPOT4 (Take 5) : Sentinel-2 avec deux ans d avance
SPOT4 (Take 5) : Sentinel-2 avec deux ans d avance Olivier Hagolle Mercredi 6 février 2012 Sentinel-2 : révolution du suivi de la végétation par télédétection 13 bandes spectrales, résolution 10m à 20m,
Pays Rhin-Vignoble -Grand Ballon
Pays Rhin-Vignoble -Grand Ballon Schéma Régional de Cohérence Écologique (SRCE) Réunion commission EauBiodiversité-Déchets 22 janvier 2015 DGALN - Direction de l'eau et de la Biodiversité 1 Ordre du jour
Perspectives d applications de la télédétection en grandes culture à court et moyen terme dans le Sud-Ouest
Perspectives d applications de la télédétection en grandes culture à court et moyen terme dans le Sud-Ouest Jean-François DEJOUX CESBIO & Luc CHAMPOLIVIER CETIOM Télédétection en agriculture : nouveau
Global Monitoring Emergency Services
Global Monitoring Emergency Services Christelle BOSC Olivier POCHARD 22/05/2012 Pôle Applications Satellitaires et Télécommunicaton CETE Sud-Ou LE PROGRAMME GMES Global Monitoring for Environment and Security
Christophe SANNIER [email protected]
Systèmes d Information à Référence Spatiale Utilisation d un Estimateur de Régression avec des Données Landsat pour l Estimation de l Etendu et des Changements du Couvert Forestier du Gabon de 1990 à 2010
Le Scanner 3D Dynamique
Le Scanner 3D Dynamique Présentation & Références 2015 Page 1 / 9 1. Présentation Techniques Topo, est une société de Géomètres Experts créée en 1964 comptant aujourd hui près de 120 collaborateurs répartis
La base de données régionale sur les sols. d Alsace. La base de données régionale sur les sols d Alsace
3 outils complémentaires pour connaître les sols en Alsace La base de données régionale sur les sols d Alsace Le guide des sols d Alsace La base de données régionale sur les sols Le réseau de mesure de
Le Système d Information Routier
Le Système d Information Routier CONTEXTE DU PROJET : 2004 INSTITUTIONNEL : ACTE II DE LA DECENTRALISATION La loi du 13 août 2004 relative aux libertés et Responsabilités locales a prévu dans le domaine
Intégration du référentiel hydrographique Bd Carthage dans le Système d Information de l agence de l eau Adour Garonne
Intégration du référentiel hydrographique Bd Carthage dans le Système d Information de l agence de l eau Adour Garonne point de vue sur l importance attributaire d un référentiel 1 Plan de la présentation
AMTEC RESOURCES MANAGEMENT LTD. CREATION D UNE BANQUE DE DONNEES DONNEES GEOSPATIALES NATIONALE
AMTEC RESOURCES MANAGEMENT LTD. CREATION D UNE BANQUE DE DONNEES GEOSPATIALE CREATION A D UNE L ECHELLE BANQUE NATIONAL DE DONNEES GEOSPATIALES NATIONALE 1 AMTEC RESOURCES MANAGEMENT LTD. P O Box 3463
Support de TD ArcGIS 10.1. Introduction à l automatisation et au développement avec ArcGIS 10.1 JEAN-MARC GILLIOT 2014-2015. 3 e année ingénieur
JEAN-MARC GILLIOT 2014-2015 Durée 1,5 heures Introduction à l automatisation et au développement avec ArcGIS 10.1 3 e année ingénieur Support de TD ArcGIS 10.1 Grande école européenne d'ingénieurs et de
Université de Toulouse MASTER 2 GEOMATIQUE. Parcours Professionnel : http://sigma.univ-toulouse.fr RAPPORT DE STAGE.
Université de Toulouse MASTER 2 GEOMATIQUE Parcours Professionnel : «Science de l Information Géoréférencée pour la Maîtrise de l environnement et l Aménagement des territoires» (SIGMA) http://sigma.univ-toulouse.fr
Traitement numérique de l'image. Raphaël Isdant - 2009
Traitement numérique de l'image 1/ L'IMAGE NUMÉRIQUE : COMPOSITION ET CARACTÉRISTIQUES 1.1 - Le pixel: Une image numérique est constituée d'un ensemble de points appelés pixels (abréviation de PICture
LA TÉLÉDETECTION EN AGRICULTURE. par Bruno Tisseyre 1
1 LA TÉLÉDETECTION EN AGRICULTURE par Bruno Tisseyre 1 RÉSUMÉ Avec la médiatisation des applications développées à partir des drones, la télédétection appliquée à l'agriculture fait aujourd hui beaucoup
«Bases de données géoréférencées pour la gestion agricole et environnementale en Roumanie»
«Bases de données géoréférencées pour la gestion agricole et environnementale en Roumanie» Dr. Alexandru BADEA Directeur Applications Spatiales Agence Spatiale Roumaine Tél : +40(0)744506880 [email protected]
Nom de l application
Ministère de l Enseignement Supérieur et de la Recherche Scientifique Direction Générale des Etudes Technologiques Institut Supérieur des Etudes Technologiques de Gafsa Département Technologies de l Informatique
L outil 3D «Grand Territoire» de l Agglomération de Montpellier- De la communication à la participation?
L outil 3D «Grand Territoire» de l Agglomération de Montpellier- De la communication à la participation? Marc APARICIO, Responsable Service SIG Observatoires Direction Urbanisme et de l Habitat Montpellier
Changement du trait de côte et images satellites. Tempêtes 2014, plage de la Salie, côte atlantique française
Les tempêtes L expert Avec la crise climatique, les rivages subissent plus durement les assauts de la mer et les crues de fleuves. Pour anticiper et prévenir des risques d érosion et d inondation, il est
BIEN CHOISIR VOTRE SYSTEME DE GUIDAGE PAR SATELLITES
BIEN CHOISIR VOTRE SYSTEME DE GUIDAGE PAR SATELLITES Le guidage par GPS est un outil qui trouve maintenant sa place dans les structures de type polyculture-élevage. Avec des prix de plus en plus abordables,
Résumé non technique. Tableaux d estimation
Résumé non technique Tableaux d estimation 4 Chapitre 1 Introduction 5 E n application de la directive européenne 2002/49/CE, et de ses retranscriptions en droit français (décret 2006-361 du 24 mars 2006
Document d Appui n 3.3. : Repérage ou positionnement par Global Positionning System G.P.S (extrait et adapté de CAMELEO 2001)
Document d Appui n 3.3. : Repérage ou positionnement par Global Positionning System G.P.S (extrait et adapté de CAMELEO 2001) 1. Présentation du GPS Le GPS (Global Positionning System=système de positionnement
LA GMAO ACCEDER : EXPLOITATION POUR L ENSEIGNEMENT
LA GMAO ACCEDER : EXPLOITATION POUR L ENSEIGNEMENT 1 - AVANTAGES DE LA GMAO ACCEDER POUR ENSEIGNER 2 - GENERALITES POUR L EXPLOITATION EN BAC PRO ET BTS 3 LA GMAO ET LE NOUVEAU REFERENTIEL BTS 2014 MAINTENANCE
Gestion de projet d une base de données cartographiques
RapportdeStage ServiceClientsAcxiomFrance Gestiondeprojetd unebasededonnées cartographiques PRESENTEETSOUTENUPAR EvelyneBALLOU AnnéeUniversitaire2005-2006 SOUSLADIRECTIONDE ChristopheLeBOUILLE (Maître
Étude de la carte de Vézelise. Initiation à la lecture du relief sur une carte topographique
Étude de la carte de Vézelise Initiation à la lecture du relief sur une carte topographique Double objectif de la séance Étude d un paysage lorrain de côte Apprentissage de la lecture du relief sur une
Franck VAUTIER, Jean-Pierre TOUMAZET, Erwan ROUSSEL, Marlène FAURE, Mohamed ABADI, Marta FLOREZ, Bertrand DOUSTEYSSIER
Utilisation d images dérivées d un jeu de données LIDAR pour la détection automatisée de vestiges archéologiques (programme de recherche méthodologique LiDARCHEO) Franck VAUTIER, Jean-Pierre TOUMAZET,
La directive INSPIRE en Wallonie: le géoportail et l infrastructure de diffusion des géodonnées en Région wallonne (InfraSIG(
La directive INSPIRE en Wallonie: le géoportail et l infrastructure de diffusion des géodonnées en Région wallonne (InfraSIG( InfraSIG) Jean-Pierre KINNAERT Directeur Département de la géomatique Service
Logic - fair. Présentation d une des solutions de gestion de la gamme «Oxygis» Gestion d événements - Foires et Salons Marchés & Brocantes
Logic - fair Présentation d une des solutions de gestion de la gamme «Oxygis» Gestion d événements - Foires et Salons Marchés & Brocantes Natura 2000 - European Contry Fair Forexpo 2012 à Mimizan à Hex
Cédric Gendre Inra, ESR Toulouse
ODR, Bases de données administratives à différentes échelles spatiales Cédric Gendre Inra, ESR Toulouse 2èmes journées de recherches en sciences sociales INRA SFER CIRAD 11 & 12 décembre 2008 LILLE, France
opentaxepub Documentation
opentaxepub Documentation Release rc1 openmairie November 02, 2012 CONTENTS 1 Utilisation 3 1.1 Les principes............................................... 3 1.2 Saisir une entreprise...........................................
Cadre légal des CLD. Au Canada le développement socioéconomique relève de la juridiction des provinces
Banque de terres Simon Ouellet Agent de développement rural Un outil pour le développement territorial CLD des Collines-de-l Outaouais Emmanuel Roy Agent de développement écologique Cadre légal des CLD
Rosemont- La Petite-Patrie. Îlots de chaleur urbains. Tout. savoir! ce qu il faut
Rosemont- La Petite-Patrie Îlots de chaleur urbains Tout savoir! ce qu il faut Qu est-ce qu un îlot de chaleur? Un îlot de chaleur désigne une élévation localisée des températures, particulièrement des
Atlas départemental de la couverture 2G et 3G en France métropolitaine : Bas-Rhin (67)
Novembre 2012 Atlas départemental de la couverture 2G et 3G en France métropolitaine : Bas-Rhin (67) Autorité de régulation des communications électroniques et des postes ISSN : 2258-3106 CONTENU DE L
L eau dans les documents d urbanisme. L approche des solutions environnementales de l urbanisme CAUE 40 26 mai 2011
L eau dans les documents d urbanisme L approche des solutions environnementales de l urbanisme CAUE 40 26 mai 2011 Pourquoi ce guide? Participer à «décloisonner» les services «Environnement Eau» et «Urbanisme»
Savoir lire une carte, se situer et s orienter en randonnée
Savoir lire une carte, se situer et s orienter en randonnée Le b.a.-ba du randonneur Fiche 2 Lire une carte topographique Mais c est où le nord? Quel Nord Le magnétisme terrestre attire systématiquement
Géoréférencement et RGF93
Géoréférencement et RGF93 Théorie et concepts - Fiche T3 Les projections coniques conformes 9 zones T3 Décembre 2008 2008/54 Historique Ces projections ont été définies par l'ign, suite à une recommandation
Session Usager, Infrastructures, Réseaux sociaux et Transports intelligents
Session Usager, Infrastructures, Réseaux sociaux et Transports intelligents Président : Benoît CLOCHERET Artelia Modérateur : Christophe DESNOUAILLES Cerema Données mobiles : De la mobilité 2.0 au PDU
4. Résultats et discussion
17 4. Résultats et discussion La signification statistique des gains et des pertes bruts annualisés pondérés de superficie forestière et du changement net de superficie forestière a été testée pour les
CREDIT AGRICOLE SUD RHONE ALPES
CREDIT AGRICOLE SUD RHONE ALPES Société coopérative à capital et personnel variables Siège social : 15-17, rue Paul Claudel - 381 GRENOBLE Siret 42 121 958 19 - APE 651 D Note d information émise à l occasion
P.L.U. Plan Local d'urbanisme PRESCRIPTION D'ISOLEMENT ACOUSTIQUE AU VOISINAGE DES INFRASTRUCTURES TERRESTRES DOCUMENT OPPOSABLE
Commune du Département de l'oise P.L.U Plan Local d'urbanisme PRESCRIPTION D'ISOLEMENT ACOUSTIQUE AU VOISINAGE DES INFRASTRUCTURES TERRESTRES DOCUMENT OPPOSABLE Document Établi le 20 septembre 2013 Le
Les outils actuels permettent-ils d automatiser la production de cartes? De quels outils dispose-t-on?
Le "Portrait de la Biodiversité Communale" est un document réalisé au niveau national pour chaque commune, regroupant les connaissances publiques disponibles et mobilisables à l'échelle nationale en matière
Installations classées pour la protection de l'environnement Campagne de mesure de bruit SOMMAIRE I. OBJET DE L ETUDE... 3
SOMMAIRE I. OBJET DE L ETUDE... 3 II. MODE OPERATOIRE... 3 A. MATERIEL UTILISE... 3 1) Sonomètre... 3 2) Calibreur... 3 B. METHODE DE MESURE... 4 C. POSITIONNEMENT DU MATERIEL... 4 III. CAMPAGNE DE MESURE...
Plateformes vidéo d entreprise. Choisir sa plateforme vidéo d entreprise
Plateformes vidéo d entreprise Mars 2014 Sommaire Introduction... 3 Les attentes et besoins des entreprises... 4 >> La communication, principal besoin des entreprises... 4 >> Chaine de télévision KTO :
Introduction à la méthodologie de la recherche
MASTER DE RECHERCHE Relations Économiques Internationales 2006-2007 Introduction à la méthodologie de la recherche [email protected] Les Etapes de la Recherche Les étapes de la démarche Etape
L a d é m a r c h e e t l e s o u t i l s p r o p o s é s
Guide méthodologique pour la construction d un bilan quantitatif et qualitatif des contrats de territoire. L a d é m a r c h e e t l e s o u t i l s p r o p o s é s Il est proposé de bâtir le bilan avec
GÉODÉSIE, COORDONNÉES ET GPS
GÉODÉSIE, COORDONNÉES ET GPS LES PROJECTIONS La représentation du globe terrestre sur un plan en deux dimensions exige une opération nommée projection. Une projection s appuie sur un géoïde, qui est une
Jean Pierre THIBAULT / DREAL Aquitaine / Stratégie nationale
Jean Pierre THIBAULT / DREAL Aquitaine / Stratégie nationale Stratégie nationale de gestion intégrée du trait de côte : vers la relocalisation des activités et des biens Ministère de l'écologie, du développement
Exemple et réflexion sur l utilisation de données satellitaires
Exemple et réflexion sur l utilisation de données satellitaires Données Global Forest Change Détection des coupes rases non reboisées Importance et répartition des coupes définitives Le renouvellement
Rapport de certification ANSSI-CSPN-2010/07. KeePass Version 2.10 Portable
PREM IE R M IN IS T R E Secrétariat général de la défense et de la sécurité nationale Agence nationale de la sécurité des systèmes d information Rapport de certification ANSSI-CSPN-2010/07 KeePass Version
swisstlm 3D Version 1.3 Publication 2015 Généralités sur swisstlm 3D
Département fédéral de la défense, de la protection de la population et des sports DDPS Office fédéral de topographie swisstopo swisstlm 3D Version 1.3 Publication 2015 Généralités sur swisstlm 3D Le modèle
I Mise en place d un SIG pour la gestion des équipements sur les routes départementales de la Loire I
I Mise en place d un SIG pour la gestion des équipements sur les routes départementales de la Loire I I Déroulement de la présentation I Les missions de la cellule programmation Le patrimoine routier Le
Utilisation du SIG dans une entreprise industrielle pour l analyse et la prise de décision
309 Schedae, 2007 Prépublication n 47 Fascicule n 2 Utilisation du SIG dans une entreprise industrielle pour l analyse et la prise de décision Mohamed Najeh Lakhoua UR : Système, Énergétique, Productique
OUVERT02 - Maintien de l ouverture par élimination mécanique ou manuelle des rejets ligneux et autres végétaux indésirables Sous-mesure :
OUVERT02 - Maintien de l ouverture par élimination mécanique ou manuelle des rejets ligneu et autres végétau indésirables Sous-mesure : 10.1 Paiements au titre d'engagements agroenvironnementau et climatiques
SITI Agri La nouvelle génération du Système Intégré de Gestion et de Contrôle pour l administration des subventions
SITI Agri La nouvelle génération du Système Intégré de Gestion et de Contrôle pour l administration des subventions Fichier des exploitations agricoles Dossier du bénéficiaire personnalisable Categories
GKR. Geological Knowledge Representation Base de connaissances métallogéniques
GKR Geological Knowledge Representation Base de connaissances métallogéniques Objets Organiser un ensemble d informations complexes et hétérogènes pour orienter l exploration minière aux échelles tactiques
La mobilisation des statistiques énergie pour les schémas territoriaux en Rhône-Alpes
La mobilisation des statistiques énergie pour les schémas territoriaux en Rhône-Alpes Yves Pothier DREAL Rhône-Alpes 21/11/2014 Crédit photo : Arnaud Bouissou/MEDDE Direction régionale de l'environnement,
Les textes et règlements
Réglementation applicable aux chapiteaux, tentes et Note : cette fiche est extraite pour l essentiel de l ouvrage «Organiser un événement artistique dans l espace public : Guide des bons usages», édité
Ingénierie et action foncière. Janvier 2014
ANJOU PORTAGE FONCIER Ingénierie et action foncière dans la Politique Départementale de l Habitat Janvier 2014 Les outils d action foncière et td d urbanisme durable du PDH Une phase d étude préalable
Décrets, arrêtés, circulaires
1 er juin 2011 JOURNAL OFFICIEL DE LA RÉPUBLIQUE FRANÇAISE Texte 8 sur 152 Décrets, arrêtés, circulaires TEXTES GÉNÉRAUX MINISTÈRE DE L ÉCOLOGIE, DU DÉVELOPPEMENT DURABLE, DES TRANSPORTS ET DU LOGEMENT
Réaliser la fiche de lecture du document distribué en suivant les différentes étapes de la méthodologie (consulter le support du TD!
Réaliser la fiche de lecture du document distribué en suivant les différentes étapes de la méthodologie (consulter le support du TD!) 1. Réaliser la note sur l auteur (bien lire le document, utiliser Internet)
RESUMÉ NON TECHNIQUE ELABORATION DES CARTES DE BRUIT COMMUNAUTE D AGGLOMERATION DU HAUT VAL DE MARNE
DIRECTION GENERALE ADJOINTE CHARGEE DE L AMENAGEMENT ET DU DEVELOPPEMENT Service études et prospective RESUMÉ NON TECHNIQUE ELABORATION DES CARTES DE BRUIT COMMUNAUTE D AGGLOMERATION DU HAUT VAL DE MARNE
Infrastructures de géodonnées. L expérience belge au niveau des régions: la Wallonie
Infrastructures de géodonnées. L expérience belge au niveau des régions: la Wallonie Jean-Pierre KINNAERT Directeur Département de la Géomatique Service public de Wallonie Représentant belge au Comité
LOGICIELS ET ORGANISATION POUR GERER LES DONNEES ET L INFORMATION GEOGRAPHIQUE DES RESEAUX DE DISTRIBUTION
LOGICIELS ET ORGANISATION POUR GERER LES DONNEES ET L INFORMATION GEOGRAPHIQUE DES RESEAUX DE DISTRIBUTION Pascal Bertolini, Alberto Rica EDENOR Azopardo 1025-1107 BUENOS AIRES (ARGENTINE) Tél : 54 1 43
Station Totale Geomax Série Zoom30
Station Totale Geomax Série Zoom30 GeoMax Profil de l entreprise GeoMax est une entreprise fort de solides positions sur L étroite collaboration qui présente à l international et le marché des technologies
La nouvelle RÉGLEMENTATION PARASISMIQUE applicable aux bâtiments
La nouvelle RÉGLEMENTATION PARASISMIQUE applicable aux bâtiments dont le permis de construire est déposé à partir du 1 er mai 2011 Janvier 2011 Ministère de l'écologie, du Développement durable, des Transports
LE MONITORING DE LA BIODIVERSITE EN SUISSE. Hervé LETHIER, EMC2I
LE MONITORING DE LA BIODIVERSITE EN SUISSE Hervé LETHIER, EMC2I INTRODUCTION OBJECTIFS L INSTRUMENT LES INDICATEURS UN PREMIER BILAN INTRODUCTION OBJECTIF De simples inventaires spécialisés et ciblés Combler
Mémo d'utilisation de BD Dico1.6
Mémo d'utilisation de BD Dico1.6 L'application BDDico a été développée par la Section Cadastre et Géomatique de la RCJU. Son utilisation demeure réservée aux personnes autorisées. Les demandes d'utilisation
Protocole de constitution d une base de données 1960
Protocole de constitution d une base de données 1960 Rapport numéro Titre Rédigé par Etat (en cours / final) Relu par L2.0-3 Constitution d'une base de données topographique vectorielle à partir des cartes
Le drone de cartographie professionnelle
Le drone de cartographie professionnelle 4 raisons de choisir l'ebee 01. Réalisez plus de cartes, d'une plus grande précision L'eBee peut couvrir jusqu'à 12 km² au cours d'un seul vol. Quand il survole
Enjeux environnementaux prioritaires des forêts de Poitou-Charentes
Annexe 3 Enjeux environnementaux prioritaires des forêts de Poitou-Charentes Cette annexe présente les enjeux environnementaux ayant été définis comme prioritaires en Poitou-Charentes. Une série de cartes
De la consultation à la gestion intégrée Pour les collectivités et les entreprises
Exploitations des données images provenant de survols de drones De la consultation à la gestion intégrée Pour les collectivités et les entreprises Une chaine d applications au service des PME & des collectivités
TAXES & PARTICIPATIONS : quelques outils à la disposition des communes
TAXES & PARTICIPATIONS : quelques outils à la disposition des communes La loi n 2000-1028 du 13 décembre 2000 relative à la solidarité et au renouvellement urbain, dite «loi SRU», avait instauré une participation
Un accueil de qualité :
Un accueil de qualité : Mercredi 08 Juin 2011, dans l après-midi, notre classe de 3 ème de Découverte Professionnelle s est rendue sur le site de THALES ALENIA SPACE à CANNES LA BOCCA. Nous étions accompagnés
www.u-bordeaux3.fr Master professionnel Urbanisme : stratégie, projets, maîtrise d ouvrage (USPMO)
www.u-bordeaux3.fr Master professionnel Urbanisme : stratégie, projets, maîtrise d ouvrage (USPMO) Former des urbanistes Le master Urbanisme : stratégie, projets, maîtrise d ouvrage (USPMO) s appuie sur
Esri Location Analytics pour. la Banque. Etude de cas
Esri Location Analytics pour la Banque Etude de cas Améliorer la performance de la banque grâce à Esri Location Analytics Ce cas pratique détaille l intérêt de l usage de la location analytics (l analyse
Trait de côte Histolitt v1.0 Descriptif technique Version du document 1.0 *** Sommaire
Trait de côte Histolitt v1.0 Descriptif technique Version du document 1.0 *** Sommaire 1 Producteurs 2 Dénomination du produit 3 Protection militaire 4 Abréviations 5 Description générale 1. Définition
Distribution d électricité et réseaux souterrains
Distribution d électricité et réseaux souterrains Cabos 09-2 - 3 octobre 2009 Maceió, Alagoas, Brésil Les réseaux de distribution : un enjeu essentiel Les réseaux de distribution constituent une infrastructure
Objectif : optimiser des décisions et croiser des données en tenant compte de leur caractère géographique
S853-1 LE GEOMARKETING S85 Informatique appliquée à la gestion de l offre S853 La mise en place de l offre dans l unité commerciale 1 Qu est ce que le géomarketing? Le géomarketing est la prise en compte,
Les parcs de logements et leur occupation. dans l Aire Urbaine de Lille et sa zone d influence. Situation 2005 et évolution 1999-2005
Les parcs de logements et leur occupation dans l Aire Urbaine de Lille et sa zone d influence Situation 2005 et évolution 1999-2005 Décembre 2008 Le territoire d étude 2 Agence de développement et d urbanisme
de l air pour nos enfants!
B u l l e t i n d e l O Q A I n 1 Crèches et lieux d enseignement : de l air pour nos enfants! Le programme de l OQAI «Lieux de vie fréquentés par les enfants» a débuté en 2006. Une première phase de recueil
