MISE EN PLACE D UNE COUCHE D OCCUPATION DES SOLS A PARTIR D IMAGES SATELLITES. Guide Technique Version 2015

Documents pareils
La collecte et la gestion des données dans le cadre de la prospection d énergie solaire

Elaboration d un Plan Local d Urbanisme / d un Agenda 21

Prédiction de couverture de champ radioélectrique pour les réseaux radiomobiles : L apport du Système d Information Géographique ArcInfo 8

BD PARCELLAIRE. Version 1.2. Descriptif de contenu Format DXF. Révisé le : Avril Date du Document : Avril 2011

LIDAR LAUSANNE Nouvelles données altimétriques sur l agglomération lausannoise par technologie laser aéroporté et ses produits dérivés

PRÉSENTATION DU PROGRAMME DE SERVICE PUBLIC 2014 DE L IGN

Mise en place d'une chaîne de production raster multi-échelles

Cartes de bruit stratégiques

Cartes de l étendue des eaux libres liés aux inondations Guide des produits

Cahier des Clauses techniquesparticulières

3 - Description et orbite d'un satellite d'observation

L accès aux données spatiales au profit des applications satellitaires

Territoire3D. Descriptif de contenu. Institut Géographique National. Date du Document : Mars 2011

Intervenant : Séverin Poutrel, BURGEAP

Le Parc naturel régional des SIG. Restructuration d un SIG et diffusion des données dans le cadre de la directive Inspire

EVOLUTION SPATIO-TEMPORELLE DE L OCCUPATION DES ESPACES SUR LE TRIANGLE MARNAIS

Document d accompagnement pour le référentiel national du C2i niveau 2 Métiers de l environnement et de l aménagement durables

Mobilité du trait de côte et cartographie historique

RESERVOIR MONITORING A PARTIR D IMAGES SATELLITES APPLICATIONS POUR LES ACTIVITÉS AMONT DE SONATRACH EN ALGÉRIE

Charte d exploitation et de demande d accès aux Géoservices. Plateforme Territoriale GUYANE SIG

SPOT4 (Take 5) : Sentinel-2 avec deux ans d avance

Pays Rhin-Vignoble -Grand Ballon

Perspectives d applications de la télédétection en grandes culture à court et moyen terme dans le Sud-Ouest

Global Monitoring Emergency Services

Christophe SANNIER

Le Scanner 3D Dynamique

La base de données régionale sur les sols. d Alsace. La base de données régionale sur les sols d Alsace

Le Système d Information Routier

Intégration du référentiel hydrographique Bd Carthage dans le Système d Information de l agence de l eau Adour Garonne

AMTEC RESOURCES MANAGEMENT LTD. CREATION D UNE BANQUE DE DONNEES DONNEES GEOSPATIALES NATIONALE

Support de TD ArcGIS Introduction à l automatisation et au développement avec ArcGIS 10.1 JEAN-MARC GILLIOT e année ingénieur

Université de Toulouse MASTER 2 GEOMATIQUE. Parcours Professionnel : RAPPORT DE STAGE.

Traitement numérique de l'image. Raphaël Isdant

LA TÉLÉDETECTION EN AGRICULTURE. par Bruno Tisseyre 1

«Bases de données géoréférencées pour la gestion agricole et environnementale en Roumanie»

Nom de l application

L outil 3D «Grand Territoire» de l Agglomération de Montpellier- De la communication à la participation?

Changement du trait de côte et images satellites. Tempêtes 2014, plage de la Salie, côte atlantique française

BIEN CHOISIR VOTRE SYSTEME DE GUIDAGE PAR SATELLITES

Résumé non technique. Tableaux d estimation

Document d Appui n 3.3. : Repérage ou positionnement par Global Positionning System G.P.S (extrait et adapté de CAMELEO 2001)

LA GMAO ACCEDER : EXPLOITATION POUR L ENSEIGNEMENT

Gestion de projet d une base de données cartographiques

Étude de la carte de Vézelise. Initiation à la lecture du relief sur une carte topographique

Franck VAUTIER, Jean-Pierre TOUMAZET, Erwan ROUSSEL, Marlène FAURE, Mohamed ABADI, Marta FLOREZ, Bertrand DOUSTEYSSIER

La directive INSPIRE en Wallonie: le géoportail et l infrastructure de diffusion des géodonnées en Région wallonne (InfraSIG(

Logic - fair. Présentation d une des solutions de gestion de la gamme «Oxygis» Gestion d événements - Foires et Salons Marchés & Brocantes

Cédric Gendre Inra, ESR Toulouse

opentaxepub Documentation

Cadre légal des CLD. Au Canada le développement socioéconomique relève de la juridiction des provinces

Rosemont- La Petite-Patrie. Îlots de chaleur urbains. Tout. savoir! ce qu il faut

Atlas départemental de la couverture 2G et 3G en France métropolitaine : Bas-Rhin (67)

L eau dans les documents d urbanisme. L approche des solutions environnementales de l urbanisme CAUE mai 2011

Savoir lire une carte, se situer et s orienter en randonnée

Géoréférencement et RGF93

Session Usager, Infrastructures, Réseaux sociaux et Transports intelligents

4. Résultats et discussion

CREDIT AGRICOLE SUD RHONE ALPES

P.L.U. Plan Local d'urbanisme PRESCRIPTION D'ISOLEMENT ACOUSTIQUE AU VOISINAGE DES INFRASTRUCTURES TERRESTRES DOCUMENT OPPOSABLE

Les outils actuels permettent-ils d automatiser la production de cartes? De quels outils dispose-t-on?

Installations classées pour la protection de l'environnement Campagne de mesure de bruit SOMMAIRE I. OBJET DE L ETUDE... 3

Plateformes vidéo d entreprise. Choisir sa plateforme vidéo d entreprise

Introduction à la méthodologie de la recherche

L a d é m a r c h e e t l e s o u t i l s p r o p o s é s

GÉODÉSIE, COORDONNÉES ET GPS

Jean Pierre THIBAULT / DREAL Aquitaine / Stratégie nationale

Exemple et réflexion sur l utilisation de données satellitaires

Rapport de certification ANSSI-CSPN-2010/07. KeePass Version 2.10 Portable

swisstlm 3D Version 1.3 Publication 2015 Généralités sur swisstlm 3D

I Mise en place d un SIG pour la gestion des équipements sur les routes départementales de la Loire I

Utilisation du SIG dans une entreprise industrielle pour l analyse et la prise de décision

OUVERT02 - Maintien de l ouverture par élimination mécanique ou manuelle des rejets ligneux et autres végétaux indésirables Sous-mesure :

SITI Agri La nouvelle génération du Système Intégré de Gestion et de Contrôle pour l administration des subventions

GKR. Geological Knowledge Representation Base de connaissances métallogéniques

La mobilisation des statistiques énergie pour les schémas territoriaux en Rhône-Alpes

Les textes et règlements

Ingénierie et action foncière. Janvier 2014

Décrets, arrêtés, circulaires

Réaliser la fiche de lecture du document distribué en suivant les différentes étapes de la méthodologie (consulter le support du TD!

RESUMÉ NON TECHNIQUE ELABORATION DES CARTES DE BRUIT COMMUNAUTE D AGGLOMERATION DU HAUT VAL DE MARNE

Infrastructures de géodonnées. L expérience belge au niveau des régions: la Wallonie

LOGICIELS ET ORGANISATION POUR GERER LES DONNEES ET L INFORMATION GEOGRAPHIQUE DES RESEAUX DE DISTRIBUTION

Station Totale Geomax Série Zoom30

La nouvelle RÉGLEMENTATION PARASISMIQUE applicable aux bâtiments

LE MONITORING DE LA BIODIVERSITE EN SUISSE. Hervé LETHIER, EMC2I

Mémo d'utilisation de BD Dico1.6

Protocole de constitution d une base de données 1960

Le drone de cartographie professionnelle

Enjeux environnementaux prioritaires des forêts de Poitou-Charentes

De la consultation à la gestion intégrée Pour les collectivités et les entreprises

TAXES & PARTICIPATIONS : quelques outils à la disposition des communes

Un accueil de qualité :

Master professionnel Urbanisme : stratégie, projets, maîtrise d ouvrage (USPMO)

Esri Location Analytics pour. la Banque. Etude de cas

Trait de côte Histolitt v1.0 Descriptif technique Version du document 1.0 *** Sommaire

Distribution d électricité et réseaux souterrains

Objectif : optimiser des décisions et croiser des données en tenant compte de leur caractère géographique

Les parcs de logements et leur occupation. dans l Aire Urbaine de Lille et sa zone d influence. Situation 2005 et évolution

de l air pour nos enfants!

Transcription:

MISE EN PLACE D UNE COUCHE D OCCUPATION DES SOLS A PARTIR D IMAGES SATELLITES Guide Technique Version 2015

INFORMATIONS CONTRACTUELLES Direction générale de l'aménagement, du logement et de la nature Ministère du logement et de l'égalité des territoires / Ministère de l'écologie, du développement durable et de l'énergie Arche de la Défense Paroi Sud FR-92055 La Défense Cedex Organisme(s) commanditaire(s) Direction Régionale Eau Aménagement Logement Rhône-Alpes Adresse postale : DREAL Rhône-Alpes, CEPE/UDG - 69453 LYON CEDEX 06 Adresse physique : 5 place Jules Ferry (immeuble Lugdunum - métro Brotteaux) - 69006 Lyon Magali Di Salvo-Delehaye Responsable de l'unité des données géographiques tel : 04 26 28 67 88 mel : magali.disalvo@developpementdurable.gouv.fr Références administratives Affaire n C14ST0074-2 commandée le : 20 mars 2013 Affaire suivie par Jacques BOUFFIER Jacques BOUFFIER Cerema / Direction Territoriale Sudouest / Délégation de Toulouse HISTORIQUE DES VERSIONS DU DOCUMENT Version Date de validation Commentaire V 0.0 03/10/2014 Jacques BOUFFIER - Intialisation V 0.1 15/01/2015 Jacques BOUFFIER - Premier Jet V 0.2 28/01/2015 Thomas GOARANT / Anne MISSERI / Jacques BOUFFIER / Intégration parties DterCE au premier jet V0.3 10/02/2015 Intégration de la relecture de Laure CHANDELIER, Anne MISSERI et Thomas GOARANT V0.4 17/02/2015 Intégration de la relecture de Dominique HEBRARD V0.5 03/03/2015 Intégration de la relecture de Lucie CHADOURNE FACON VALIDATION DU DOCUMENT Rédacteurs Contributeurs Jacques BOUFFIER Chargé de projets Thomas GOARANT Chargé d études SIG Dominique HEBRARD (également relecteur) Chargé d études Courriel : jacques.bouffier@cerema.fr Tel : 05 62 25 97 31 Courriel : thomas.goarant@cerema.fr Tel : 04 74 27 51 73 Courriel : dominique.hebrard@cerema.fr Tel : 05 62 25 97 52

Relectrices Validé par Arnaud MAYIS Assistant d études Sébastien RUCQUOI Chargé d études Laure CHANDELIER Chargée de projets Anne MISSERI CETC-CTCS Lucie CHADOURNE-FACON Directrice adjointe de la Dalett Courriel : arnaud.mayis@cerema.fr Tel : 05 62 25 97 08 Courriel : sebastien.rucquoi@cerema.fr Tel : 05 62 25 97 16 Courriel : laure.candelier@cerema.fr Tel : 05 62 25 93 66 Courriel : anne.misseri@cerema.fr Tel : 05 62 25 93 66 Courriel : lucie.chadourne-facon@cerema.fr Tel : 05 62 25 97 02 MÉTADONNÉES Référence documentaire Titre Description Auteur(s) N ISRN : Cerema DterSO 15 18-FR Mise en place d une couche d occupation des sols à partir d images satellites Guide technique Date du rapport Janvier 2015 Mots clés Mots clés géographiques : Pays, région(s), département(s), commune(s) Type Règles de diffusion Jacques BOUFFIER Anne MISSERI Thomas GOARANT Images satellites Télédétection Occupation des sols Région Rhône-Alpes Rapport technique En cas de confidentialité, indiquer le motif admis par la commission d accès aux documents administratifs (CADA) ( : Le document contient des secrets (délibération du gouvernement, défense nationale, politique extérieure, vie privée, industriel et commercial). La communication du document peut nuire au déroulement d une procédure contentieuse, à la recherche d infractions fiscales ou douanières, à la sûreté de l Etat et à la sécurité publique. La communication de ce document est interdite par la loi. Document intermédiaire ou préparatoire à une décision. Rapport nominatif comportant un jugement de valeur sur une personne physique citée ou identifiable. Source : Circulaire no 2001-15 du 26 février 2001 relative à la littérature grise : repérage, traitement, diffusion et valorisation sur Internet et Intranet des rapports d études et de recherche du ministère de l équipement, des transports et du logement Droits Ce document ne peut être reproduit en totalité ou en partie sans autorisation expresse du Cerema, de la DGALN ou de la DREAL Rhône Alpes

SYNTHESE DU RAPPORT Les besoins de caractérisation de l occupation des sols sont forts et multiples pour répondre au contexte réglementaire de suivi des politiques publiques de gestion économe de l espace. Les méthodes de suivi des territoires habituellement retenues par les services de l État et les collectivités en charge de l aménagement des territoires reposent principalement sur l utilisation de bases de données existantes. Cette approche, qui donne un premier niveau de résultats, présente toutefois certaines limites en termes d homogénéité de l information ou de fréquence de mise à jour. Les technologies d observation de la terre par satellite sont entrées depuis quelques années dans une phase de maturité nouvelle permettant d envisager leur utilisation opérationnelle pour ces thématiques. Ce rapport est un guide technique présentant une méthodologie expérimentale de production de couches d occupation des sols basée sur l utilisation d algorithmes de traitements semi-automatiques d images appliqués à des images satellitaires sur des emprises départementales ou régionales. Ce type de traitement seul n étant pas suffisant pour produire des couches de qualité maximale, le rapport présente également comment utiliser de manière complémentaire et cohérente des bases de données existantes sur un territoire. Ce guide est à destination de tout service souhaitant produire des couches d occupation des sols en interne ou souhaitant avoir des éléments techniques pour la mise en place de cahier des charges basés sur cette approche. Il détaille chacune des étapes méthodologiques, et est à destination d utilisateurs ayant déjà une connaissance de base des outils de télédétection et de géomatique. Page 4 / 106

1.INTRODUCTION...10 1.1.CONTEXTE DE L ETUDE...10 1.2.APPROCHE GENERALE DE LA CREATION D UNE OCS...11 2.LES SPÉCIFICATIONS...13 2.1. INTRODUCTION...13 2.2. SPÉCIFICATIONS SÉMANTIQUES...13 2.2.1. NOMENCLATURE...13 2.2.2.CONFUSIONS SEMANTIQUES...14 2.2.3.L AGGLOMERATION DE L INFORMATION...15 2.3. SPÉCIFICATIONS GÉOMÉTRIQUES...15 2.3.1.TAILLE DES PLUS PETITS ELEMENTS IDENTIFIES...15 2.3.2. PRECISION GEOMETRIQUE...15 2.3.3.REGLES TOPOLOGIQUES...16 2.3.4.SQUELETTE LINEAIRE...16 2.4. SPÉCIFICATIONS TEMPORELLES...16 2.4.1. MILLESIMES ET FREQUENCES DE MISE A JOUR...16 2.4.2.HOMOGENEITE TEMPORELLE DE L INFORMATION...16 2.5. AUTRES SPÉCIFICATIONS...17 2.6. LES SPECIFICATIONS RETENUES POUR L OCS...17 3.LA METHODOLOGIE - GENERALITES...19 3.1.LES OUTILS DE TRAVAIL...19 3.1.1. LES DONNEES IMAGE...19 3.1.2. LES DONNEES EXOGENES...19 3.1.3.LES LOGICIELS...20 3.1.4.LE MATERIEL INFORMATIQUE NECESSAIRE...21 3.1.5.LES COMPETENCES TECHNIQUES REQUISES...21 3.2.GENERALITES SUR L APPROCHE METHODOLOGIQUE...22 4.LA METHODOLOGIE - DETAILS...25 4.1.CHOIX ET OBTENTION DES IMAGES SATELLITES...25 4.1.1.INTRODUCTION...25 4.1.2. LE CHOIX DES IMAGES...25 4.1.2.1.GENERALITES SUR L IMAGERIE SATELLITAIRE...25 4.1.2.2.LES CARACTERISTIQUES LIEES AU CAPTEUR...27 4.1.2.3.LES CARACTERISTIQUES LIEES AUX CONDITIONS D ACQUISITION...31 4.1.2.4.LES CARACTERISTIQUES LIEES AUX TRAITEMENTS...32 4.1.3.OBTENTION DES IMAGES...34 4.2.LES INFORMATIONS D APPRENTISSAGE...36 4.3.PRETRAITEMENTS...42 4.3.1.PREPARATION DES IMAGES SATELLITES...42 4.3.1.1.MISE EN FORME DES IMAGES SATELLITES...42 4.3.2.ENRICHISSEMENT DES INFORMATIONS DE L IMAGE SATELLITE...45 4.3.2.1.LES NEOCANAUX...45 4.3.2.2.LE CHOIX DES NEOCANAUX...48 4.3.3.AMELIORATION DES INFORMATIONS D APPRENTISSAGE...49 4.3.3.1.PRINCIPE GENERAL...49 4.3.3.2.LE NETTOYAGE PAR INDICES SEUILLES...49 4.3.3.3.LE SOUS ECHANTILLONAGE...51 4.4.CLASSIFICATION DE L ENSEMBLE DE L IMAGE...55 4.5.POST-TRAITEMENTS...56 4.5.1.LA FUSION DES MICRO-CLASSES...56 4.5.2.LES OPERATIONS DE LISSAGE...58 4.5.3.L UTILISATION DE BASES DE DONNEES EXOGENES...59 4.5.3.1.PRINCIPE...59 4.5.3.2.PREPARATION DES INFORMATIONS EXOGENES...60 4.5.3.3.DETERMINATION DE REGLES DE POST-TRAITEMENTS...63 4.5.3.4.LE POST-TRAITEMENT DIRECT...66 Page 5 / 106

4.5.3.5.LE POST-TRAITEMENT INDIRECT...67 4.5.3.6.L INFORMATION DE CORRECTIONS ISSUES DE BASES DE DONNEES EXOGENES...69 4.5.4. LA VECTORISATION ET LA GESTION DE L UMC...71 4.5.5.LE MODELE DE DONNEES...72 4.5.6. L INFORMATION USAGE DES SOLS...74 4.5.6.1.PRINCIPE GENERAL...74 4.5.6.2.EXTRACTION DE L INFORMATION D USAGE DES BD EXOGENES...74 4.5.6.3.CREATION DE LA COUCHE USAGE...76 4.5.6.4.APPLICATION DE L USAGE A LA COUCHE D OCS...76 5.COMPLEMENTS...78 5.1.LE PARAMETRAGE...78 5.1.1.INTRODUCTION...78 5.1.2.LES METHODOLOGIES DE CALIBRATION...80 5.1.2.1.LES INDICATEURS DE QUALITE...80 5.1.2.2.STABILITE DE LA METHODOLOGIE...82 5.1.2.3.LES METHODES DE RECHERCHE...82 5.2.LA MISE A JOUR...85 5.3.LES TEMPS PASSES...86 6.CONCLUSION GENERALE...89 GLOSSAIRE...90 7.ANNEXES...95!"#$ %!"#$% & '(!)*!)++, (-%. /"!")*!%. 0 1!)2((%. 3 "*!)& 4 15"*!)& 6 "!7"- "&%!-! &0!! &0 8)!)*!9&4 % 8!5!"*:!: 7. & ;#)04 1 8)/6 1 +9*! <! 1 '(!! '(!2 Page 6 / 106

!% 1% '(!!-!=;1 1& & 1. "!7)+ >. 10 /)+2. 13 '(!)!2! )*!"*, ",?!:66 0 14 '()!/@&!A@ B :&!- 4 16 '()!/A@ B 6:&!-6 1 82/1 <<?' 1 8!5!C/2(2* 1 '(!2!A1!; 1% /!# 1& '(!)!"!!#!% 1. '(!2+;& 10 C2!/+2!!;*6%& 13 ")! )!!6<! B'7B"D>%6 14 '(!)!D!%6 16 8!2" '(!!/@.!#!+% 1 '(!)!B'7!E#% 1 '(!)77-!#%% 1 '(!!7%& 1% '(!(%0 1& '(!!%4 1. '(!7&6 10 '(! "*!*"+&& 13 '(!*&. 14 '(!*&3 16 B"!#)!+!!F 2(-.6 1 *!!. 1 '(!!2*"G.3 1 8"!)H0 1% '(!79!5!+C*-0 1& '(!++0 1.?!)0& 10!+2+!29!-03 Page 7 / 106

13 8(!)"D!! )2#36 14!I<!*3 1%6 '(!""7!#(!-: *(3 1% =!#!7I!7&* **93 1% '(!(!-3% 1% '(!)7)- "3% 1%% "!<9 3& 1%& "!<9 3. 1%. "!<9 3. 1%0?!!24. 1%3?!!22" #40 1%4 =#*!+43 1&6 =##)!<-"44 1& =##)!<"6 1& =##)!<!76 @+ *3 @+ +(-+6 @+ #*!#!!#!F 2!"! @+% :H!(!" (!(!4 @+& *2+; & @+. 15!!! 0 @+0!(-+ *!4 @+3 B-7"&6 @+4!(-+ *!!. @+6 1". @+ 1*7"#!+. @+ '(!D2.% @+ @+!7.& @+% "!7!#.. @+&!7.0 @+. "J*!K06 @+0 8*))" 0% @+3 @+")0& Page 8 / 106

@+4 0. @+6 '(!!#*<&66!L00 @+!*3 @+ '(!!*3 @+ '!"!! *!"33 Page 9 / 106

1. INTRODUCTION 1.1. CONTEXTE DE L ETUDE Les besoins liés la caractérisation de l'occupation du sol sont multiples et à fort enjeu : étude de l'étalement urbain, localisation et quantification de la dynamique des territoires, suivi de l efficacité des politiques publiques de gestion économe de l'espace, cartographie des corridors écologiques. Ces thématiques font l objet d études dans les services de l État et des collectivités, selon des méthodologies généralement basées sur l'exploitation de bases de données existantes (Référentiel Grande Echelle de l'ign, fichiers fonciers, registre parcellaire graphique...). Actuellement, peu de méthodes opérationnelles utilisent des couches d'informations issues de traitements automatiques d'images satellites malgré des avantages forts en termes d actualisation potentielle de la donnée et d approche globale sur de grands territoires. Le monde de l'imagerie satellitaire est entré ces dernières années dans une phase de maturité nouvelle. Sur le plan technique, les satellites d'observation de la terre sont de plus en plus nombreux et de plus en plus performants en termes de précision ou de capacité de revisite. Sur le plan institutionnel également, des programmes forts de développement des applications satellitaires et de mise à disposition des données (Copernicus, Géosud/THEIA) ont vu le jour. Illustration 1: Vue d'artiste du satellite Pléiades. De même, de nombreux logiciels libres et performants pour le traitement d images satellites se développent [1] et les méthodes d extraction d informations sont de plus en plus perfectionnées. Le Pôle de Compétences et d Innovations «Applications Satellitaires et Télécommunication» du MEDDE (PCI AST), localisé au sein de la Direction territoriale du Sud-Ouest du Cerema, a pour mission d aider les services institutionnels à intégrer les technologies satellitaires dans leurs méthodes de travail. Dans ce contexte, le PCI AST a déjà travaillé sur l utilisation d images satellites pour la constitution de couches d occupations du sol (OCS) à différentes échelles, sur des emprises locales (Toulouse, Bordeaux) à régionales (Limousin, Rhône-Alpes). La place de l'image satellite pour l'étude des différentes thématiques liées à l'occupation du sol dans le contexte actuel ou dans un futur proche est analysée dans le rapport «Place de l'imagerie satellitaire pour l étude de l occupation des sol» rédigé par le PCI «Application Satellitaire et Télécommunication» [2]. Le présent rapport a pour objectif de proposer la méthodologie exploratoire développée par le Cerema pour Page 10 / 106

construire une occupation des sols de premier niveau de nomenclatures (cinq à dix classes) à partir d images satellites. Il est à destination de tous les services désirant mener des études en interne sur ce sujet ou ayant vocation à mettre en place un CCTP en vue de la consultation d un prestataire de service. 1.2. APPROCHE GENERALE DE LA CREATION D UNE OCS Les méthodes de constitution d une couche d occupation des sols diffèrent selon les spécifications demandées, les moyens disponibles, l expérience du prestataire ou l existence de millésimes pré-existants. Cependant, la constitution même d une couche met toujours en œuvre les mêmes macro-étapes, qui s articulent de la manière suivante : Figure 1: Les principales étapes de création d une OCS Dans le contexte de ce rapport, l utilisateur final est un service de l État ou une collectivité en charge de la mise en œuvre ou du suivi d une politique publique d aménagement des territoires. Son besoin est donc de pouvoir calculer des indicateurs statistiques caractérisant l occupation des sols et son évolution, et, dans une certaine mesure, de localiser et visualiser les changements du territoire. Les spécifications sont la traduction du besoin de l utilisateur en caractéristiques techniques décrivant les propriétés de l OCS. Elles traitent par exemple de la nomenclature recherchée, de la surface des plus petits éléments à identifier, des règles d agglomération des éléments plus fins que cette surface minimale, ou du taux de confusions acceptable. La phase de production proprement dit commence par le choix et l obtention des données de base. Ces données sont généralement des bases de données pré-existantes sur le territoire et des informations images, issues de campagnes aériennes ou d acquisitions par satellite. Les bases de données pourront être directement appliquées, fourniront des informations d apprentissage pour des classifications sur images satellites ou pourront identifier des problèmes en post-traitements. Les images satellites pourront être utilisées pour fournir tout ou partie de l information de l occupation des sols ou pour lever des ambiguïtés. Les prétraitements correspondent à un ensemble de manipulations sur les données sources afin de les sélectionner, les enrichir, de les sous-échantillonner et de les mettre en forme pour la suite. L obtention de la connaissance de l occupation des sols est l étape clé de la méthodologie et de l approche. Ces informations peuvent être obtenues de différentes manières (information directement disponible dans une base de donnée existante, photo-interprétation, classifications automatiques...). Ces différentes approches apportent des informations exhaustives ou non. Les post-traitements sont les manipulations effectuées pour combiner les différents types d informations Page 11 / 106

afin d obtenir une description cohérente et exhaustive du territoire. Ils ont également pour objectif d en améliorer la qualité à travers des lissages, des corrections, des fusions, et des mises en cohérence avec les spécifications. L estimation de la qualité interne du résultat consiste à évaluer l adéquation entre le produit et les spécifications. Deux étapes importantes s ajoutent généralement à ces considérations systématiques. D une part, la phase de calibration et de validation de la méthodologie permet de confirmer l approche en amont. Elle se fait sur une ou plusieurs petites zones tests, dans une démarche si possible pro-active avec l utilisateur. D autre part, une OCS n a vraiment de sens qu à travers sa mise à jour selon une méthode cohérente, condition sine qua non pour mesurer une évolution réelle. Cet aspect est à prendre en compte, même lors de la production d un seul millésime, dans le choix des données et de l approche. Figure 2: Les principales étapes de création d une OCS (Détails) Ce rapport décrit pour chacune de ces étapes les enjeux associés et propose une solution pour les mettre en œuvre en s appuyant sur la méthodologie développée par le PCI AST. Illustration 2: Objectif du rapport : décrire les étapes permettant de produire une occupation des sols à partir d images satellites. Illustration sur le département de la Drôme. Images RapiEye issues du programme Géosud Page 12 / 106

2. LES SPÉCIFICATIONS 2.1. INTRODUCTION Une couche d occupation des sols se caractérise par un ensemble de critères qui constituent ses spécifications. Les spécifications sont à préciser en amont de la production. Elles traduisent les besoins des futurs utilisateurs en caractéristiques techniques, impactent la méthodologie, permettent d estimer la qualité interne du produit (qui se définit au regard du respect des spécifications) et sont nécessaires pour assurer une cohérence entre différents opérateurs. Ces critères sont de différentes natures [3] [4]. Les spécifications sémantiques sont les critères relatifs à la labellisation des objets de la couche. Elles précisent la nomenclature utilisée, le taux de confusions acceptable entre les classes ou encore les règles de labellisation lors de l agglomération d informations de natures différentes (seuils de recouvrement par exemple). Les spécifications géométriques correspondent aux caractéristiques liées au «positionnement» et au «contour» des objets de la couche : taille minimale des éléments identifiés, unités minimales de collecte ou d intérêt (UMC/UMI), cohérence géométrique entre les objets (présence ou non de doublons, trous...), «contours en adéquation» avec la réalité du territoire, qualité du géo-référencement. Les spécifications temporelles correspondent aux caractéristiques liées à la date de l information. Elles concernent l homogénéité temporelle des informations, leur actualité et leur fréquence de mise à jour. Des caractéristiques diverses complètent ces spécifications, comme la nature et précision des métadonnées, l intégrité et la généalogie de la donnée, la structure du modèle de données, le format de livraison ou l homogénéité de la qualité. Les spécifications d une couche OCS doivent permettre à l utilisateur de répondre à son besoin. Les besoins utilisateurs en matière d OCS sont aujourd hui relativement bien connus et définis par ailleurs [5] [2] [6] [7]. D une manière générale, ils sont relatifs aux exigences réglementaires de calcul d indicateurs chiffrés de mesure, d évolution de l occupation des sols et de spatialisation des dynamiques mesurées. L objet de ce rapport n est pas de refaire l analyse des besoins, le point de départ de l analyse menée est l identification des spécifications. Les spécifications doivent souvent s adapter avec les contraintes techniques (données brutes existantes, ressources en calcul disponibles, délais) et financières du projet. Dans ce rapport, l hypothèse de travail initiale de traitements automatisés sur images satellites à des emprises régionales permet de répondre à un premier niveau de besoins de calcul d indicateurs macro (évolution des surfaces anthropisées, évolution des espaces naturels, agricoles et forestiers par exemple) sur des territoires de taille de SCOT ou supérieure. Des besoins plus fins comme la cartographie précise de la trame verte et bleue par exemple nécessitent des méthodes et des coûts différents. Le rapport développe ici les notions associées aux différents types de spécifications et leur lien avec le besoin utilisateur. Si des exemples sont parfois donnés à titre illustratif, l objectif de cette partie est de rappeler à un commanditaire les points importants à considérer en amont au regard de son besoin. Le lien entre les spécifications et la méthodologie utilisée est présenté dans les parties 3 et 4. 2.2. SPÉCIFICATIONS SÉMANTIQUES 2.2.1. NOMENCLATURE La nomenclature d une couche OCS correspond à la manière dont sont définis et catégorisés les différents éléments du sol. Elle doit permettre à l utilisateur d accéder à l information thématique qu il recherche. Elle est a priori divisée en différents niveaux de précision emboîtés. Le contenu de chaque poste de Page 13 / 106

nomenclature est développé exhaustivement par le niveau plus fin qui lui est associé. Chaque élément du territoire doit se retrouver dans un et un seul poste de nomenclature à chaque niveau de précision. Différents cadres et nomenclatures de référence existent au niveau européen, comme la nomenclature Corinne Land Cover [8] ou celle du groupe de travail EAGLE (Eionet Action Group on Land monitoring in Europe) de l EIONET (European Environment Information and Observation Network) [9]. Au niveau national, une nomenclature a été définie en 2014 par un groupe de travail sur l occupation des sols [4] mis en place à la demande de la DGALN, aujourd hui passé sous la tutelle du CNIG, piloté par la DTec TV du Cerema. Cette nomenaclature fournit à l ensemble des utilisateurs et des producteurs de données d occupation du sol un cadre de travail théorique, structurant et consensuel selon quatre dimensions : la «couverture bio-physique» du sol (surface arborées, surfaces herbacées...), l «usage» (agricole, résidentiel...), la «morphologie» (qui qualifie les objets en fonction de l organisation des éléments), et la «caractéristique» (qui définit les objets par rapport à un état ponctuel, présent, passé ou spécifique). Cette séparation en quatre dimensions répond aux exigences de la directive INSPIRE [10] [11]. Illustration 3: Exemple de nomenclature : Extrait de la dimension couverture de la nomenclature nationale Les cases colorées correspondent à la nomenclature retenue pour la méthodologie. Le poste 11 120 fait ici référence à une classe particulière : le squelette linéaire structurant le paysage, qui est une sous partie des surfaces anthropisées. Cette nomenclature nationale (version janvier 2015) est rappelée en annexe. Le projet Occupation des Sols à Grand Echelle (OCS GE) de l IGN s appuie sur ces travaux et la nomenclature utilisée pour le produit OCS GE est un sous ensemble de cette nomenclature nationale. Le rapport s intéresse principalement à la dimension couverture. L usage, la morphologie ou la caractéristique ne s obtiennent pas sauf dans certains cas avec des méthodes de télédétection. D autres approches sont alors à privilégier. Des exemples sont donnés en fin de rapport sur l intégration d informations sur l usage. 2.2.2.CONFUSIONS SEMANTIQUES Le taux de confusion des classes mesure la précision sémantique. Il quantifie les erreurs de labellisation entre différentes classes de la nomenclature au regard des spécifications. Il s établit à partir d indicateurs statistiques issus de la comparaison entre l OCS produite et des échantillons Page 14 / 106

de contrôle, statistiquement représentatifs, respectant les spécifications et obtenus de manière indépendante. Plusieurs indicateurs statistiques sont utilisables : matrices de confusion, précision globale, kappa, F-Score, kappa multi-échelle [12] [13] [14] [15]... Du fait de la subjectivité des échantillons de contrôle et de l interprétation potentiellement variable des spécifications, ces chiffres doivent toujours être interprétés avec précaution. 2.2.3.L AGGLOMERATION DE L INFORMATION Les spécifications géométriques précisent les dimensions des plus petits éléments retenus pour l OCS. Des règles de labellisation d informations agglomérées doivent être définies pour interpréter des éléments plus fins susceptibles d être détectés, par exemple dans le cas de terrains de couverture mixte. Ces règles se traduisent généralement au regard de taux de recouvrement. Le taux de recouvrement est le rapport en pourcentage entre la surface du terrain recouverte par un élément et la surface totale de l élément englobant. Par exemple, le label d un parking goudronné ombragé (sur lequel des arbres sont plantés) peut dépendre du taux de recouvrement par le couvert arboré (défini en prenant en compte la projection verticale des houppiers). La règle peut, comme c est par exemple le cas pour les spécifications de la couche OCS GE de l IGN, consister à dire que si le taux de recouvrement est inférieur à 75 % (par exemple), le parking est labellisé «surfaces anthropisées», sinon, il est labellisé «végétation ligneuse». Des critères de continuité impactent également la labellisation ou la géométrie d un polygone de manière indépendante de ce qu il couvre mais au regard de sa position par rapport à son environnement. Par exemple, il peut être décidé, comme pour l OCS GE de l IGN, d agglomérer les bâtiments distants de moins de 10 m les uns des autres avec un comblement de l espace interstitiel. 2.3. SPÉCIFICATIONS GÉOMÉTRIQUES 2.3.1.TAILLE DES PLUS PETITS ELEMENTS IDENTIFIES La taille des plus petits éléments identifiés se caractérise par différents indicateurs. L UMC (Unité Minimale de Collecte) est la surface des plus petits éléments identifiés dans la couche. L UMI (Unité Minimale d Interêt) est la surface des plus petits éléments identifiés dans la couche par type de classe. Une UMI est donc une UMC spécifique à certains éléments de la nomenclature. La LMC (Largeur Minimale de Collecte) est la largeur minimale d un objet pour qu il soit intégré à la couche. Lorsque cette largeur dépend du type de classe, on parle de LMI (Largeur Minimale d Intérêt). Dans la même logique, la HMC ou HMI est la Hauteur minimale pour intégrer un objet dans la couche. Le choix de l UMC a un impact direct sur les indicateurs statistiques qui seront extraits de la couche d OCS. Ainsi, une UMC élevée localisera les éléments sous forme de larges tâches et n identifiera pas les phénomènes fins comme le mitage. Une petite UMC aura pour conséquence une prise en compte détaillée des contours des éléments du paysage. Les statistiques correspondantes seront alors modifiées. Des éléments sur le lien entre UMC et échelle d exploitation sont donnés dans le paragraphe 4.1.2.2. À titre d exemple, les UMI de la future OCS GE de l IGN varient entre 200 m² et 2500 m² suivant les classes de la nomenclature. Des règles complémentaires liées aux frontières communes sont parfois utilisées. Une notion complémentaire parfois précisée est la notion de prise en compte de certains éléments du paysage, de superficie inférieure à l UMC, mais supérieure à un certain seuil. Par exemple, la future OCS GE de l IGN identifie tous les bâtiments de superficie supérieure à 50 m², et les dilate jusqu à ce qu ils correspondent à l UMC. Cette spécification permet de garder certaines informations du paysage (mitage...), mais a un impact sur les éventuelles statistiques qui seront déduites ultérieurement. 2.3.2. PRECISION GEOMETRIQUE La précision géométrique, ou qualité de géoréférencement de la couche OCS, correspond à la précision de localisation des objets de l OCS dans la projection cartographique considérée. Elle dépend de la précision Page 15 / 106

géométrique des ortho-images utilisées comme support et de la qualité du géoréférencement des autres bases de données fournissant l information. La qualité géométrique d une ortho-image est principalement conditionnée par celle du modèle numérique de terrain (MNT) utilisé pour l orthorectification. Avec les MNT «classiques», les zones de montagnes sont généralement moins bien géoréférencées que les zones de plaine. La précision géométrique est importante dans la mesure où elle impacte directement la possibilité de pouvoir superposer différentes données. 2.3.3.REGLES TOPOLOGIQUES Les règles topologiques traitent de certaines propriétés géométriques des polygones, comme la présence acceptable ou non de superposition de polygones, de discontinuités, de micro-polygones, de fermetures anormales (papillons), de nœuds inutiles ou de polygones jointifs de même label. 2.3.4.SQUELETTE LINEAIRE L OCS GE de l IGN structure le territoire selon un découpage macroscopique reposant sur les principaux axes de communication. Ce découpage est appelé «ossature». Si cette structuration n est pas obligatoire, elle est fortement encouragée pour des raisons de compatibilité et de cohésion spatiale avec les grandes données d OCS existantes. Les spécifications de construction d un tel squelette sont disponibles dans les travaux du groupe de travail national sur le sujet [4]. 2.4. SPÉCIFICATIONS TEMPORELLES 2.4.1. MILLESIMES ET FREQUENCES DE MISE A JOUR Les couches d occupation des sols servent généralement à calculer des statistiques d évolution des territoires. Les millésimes des couches doivent être déterminés au regard du pas temporel voulu pour le suivi. Des millésimes «thématiquement partiels», n actualisant que les classes de haut niveau par exemple, s avèrent parfois intéressants. La réflexion sur le choix des millésimes doit être menée le plus en amont possible dans le sens où les contraintes techniques (mise à jour des données brutes, puissances de calcul...) ou financières dimensionnent l approche méthodologique. Si des images satellites peuvent être régulièrement actualisées sur de grands territoires (des couvertures nationales actualisées chaque année sont disponibles dans le cadre du programme Géosud par exemple), d autres données sont mises à jour beaucoup moins fréquemment. Aujourd hui, les bases de données d OCS sont classiquement mises à jour à une fréquence entre 5 et 10 ans. Certains territoires présentent toutefois des mises à jours annuelles ou bi-annuelles, mais généralement sur de petites zones. 2.4.2.HOMOGENEITE TEMPORELLE DE L INFORMATION L homogénéité temporelle traduit le décalage temporel acceptable de l information des différentes zones du territoire. Cette information est directement corrélée au millésime des données brutes utilisées (image, bases de données...). L actualisation annuelle ou bi-annuelle d un millésime nécessite un rafraîchissement intraannuel du maximum des données brutes. Les images satellites peuvent couvrir rapidement de grands territoires. L homogénéité temporelle ce type d information est généralement de l ordre de quelques mois pour une surface régionale. Cependant, les décalages temporels avec des données exogènes doivent être identifiés, corrigés, ou a minima pris en compte dans les conseils d utilisation. Page 16 / 106

2.5. AUTRES SPÉCIFICATIONS Les réflexions amont doivent spécifier d autres critères, comme l homogénéité de la qualité entre les différentes zones et les paysages (les zones urbaines s avèrent souvent plus fiables que les zones de montagne), la structure de la table attributaire (label majoritaire, source des données...), la nature et la qualité des méta-données. Le travail sur la méthodologie commence lorsque l ensemble de ces spécifications ont été précisées. 2.6. LES SPECIFICATIONS RETENUES POUR L OCS Le tableau ci-dessous synthétise les spécifications auxquelles la méthodologie proposée a pour objectif de répondre. Page 17 / 106

SPECIFICATIONS SEMANTIQUES LES SPECIFICATIONS RETENUES Nomenclature de la couverture 11 000. Surfaces anthropisées 11 120. Squelette linaire (routes principales) 12100. Sols nus (éboulis, rochers...) 12 200. Surfaces en eau 12 300. Neige éternelles et glaciers 21 000. Végétation ligneuses 22 000. Végétation non ligneuse Nomenclature de l usage Taux de Confusions 11. Agriculture 13. Mines et carrières 235. Résidentiel 411. Réseau de transports routiers 412. Réseau de transports ferrés 413. Réseau de transports aérien Seul le taux de confusion de la classification est estimé à travers une matrice de confusion et des indicateurs statistiques associés. Le kappa (5.1.2.1) doit être supérieur à 0.8 pour la dimension couverture du sol. Un taux de confusion doit être défini pour le produit final, associé à la manière dont il est calculé et le procédé de fabrication de l information de contrôle Agglomération de l information Les polygones de surface inférieure à l UMC sont agrégés avec le polygone voisin partageant la plus grande frontière. Le label du polygone est le label majoritaire de son contenu. SPECIFICATIONS GEOMETRIQUES UMC 500 m² UMI LMC HMC Précision planimétrique Règles topologiques Squelette linéaire Exhaustivité Critère de continuité L UMC est unique pour toute les classes, aucune UMI spécifique n est définie 15 m SPECIFICATIONS TEMPORELLES Sans objet (l information de hauteur n est jamais prise en compte dans la méthodologie) L écart de positionnement entre l objet sur l OCS et les données de référence sont de +/- 5 mètres Pas de doublons, pas de trous, pas de polygones papillon, les données ne contiennent que des objets surfaciques, les polygones sont jointifs, pas de polygones jointifs de même label Oui. Utilisation du squelette linéaire de l IGN ou à défaut du squelette obtenu par la méthodologie fournie par IGN. Couche exhaustive dans la dimension couverture Couche non exhaustive dans la dimension usage Pas de critère de continuité (en particulier, pas de critère de continuité sur le bâti ou sur les éléments linéaires), pas de seuil de prise en compte spécifiques à certains éléments du paysage. Millésimes Millésime 2011. Les autres millésimes pourraient être 2005 et 2015. Homogénéité temporelle de l information L information a moins d 1 an de décalage sur l ensemble du territoire Tableau 1: Les spécifications retenues pour l OCS Une procédure de qualité interne, à effectuer à réception de la couche et non traitée dans ce document, doit être mise en place pour l évaluation de ces différentes spécifications. Une partie de ces questions est traitée dans la bibliographie [16]. Page 18 / 106

3. LA METHODOLOGIE - GENERALITES 3.1. LES OUTILS DE TRAVAIL 3.1.1. LES DONNEES IMAGE La méthodologie présentée ici s applique à tout type d images satellites, aériennes ou issues de drones. Différentes résolutions spatiales peuvent être utilisées. En pratique, des résolutions entre 2 et 10 m permettent de travailler sur des surfaces régionales. En raison de temps de calculs importants, des résolutions plus fines sont réservées à de plus petites surfaces (emprises d agglomérations ou de ScoT). Les images ont différentes bandes de couleur. Des images contenant deux à trois bandes dans le visible et une bande dans l infra-rouge (par exemple : rouge, vert, bleu et proche infra-rouge) sont en pratique un minimum. Les informations dans l infra-rouge sont notamment pertinentes pour discriminer la végétation des autres éléments de couverture. Ce rapport ne traite pas de l utilisation d images radar pour ce type d applications, même si cette technologie est pertinente pour certains éléments du sol [17] [18]. Les images doivent être bien géoréférencées pour des raisons de superposition et de compatibilité entre elles et avec les données exogènes. 3.1.2. LES DONNEES EXOGENES Les données exogènes peuvent être de tout type à partir du moment où elles apportent des informations «pertinentes» sur la connaissance de l occupation des sols : informations thématiques, exhaustives ou partielles, disponibles nationalement ou spécifiques au territoire [19] [20] Si les bases de données classiques permettent d apporter les principaux éléments pertinents, la qualité de la couche finale augmente avec le nombre de données exogènes disponibles. Page 19 / 106

LES BASES DE DONNEES CLASSIQUES RGE de l IGN, et principalement la BD Topo RPG LES BASES DE DONNEES EXOGENES UTILISEES La BD Topo est une des composantes du Référentiel Grande Echelle de l IGN qui décrit vectoriellement les éléments du territoire et de ses infrastructures Le Registre Parcellaire Graphique est un SIG permettant l identification des parcelles agricoles sur le territoire français de métropole et d outre mer. Mis à jour annuellement, il sert au calcul des subventions de la PAC. Fichiers fonciers Majic Les fichiers MAJIC sont les fichiers fonciers de la Direction Générale des Finances Publiques qui contiennent des informations sur les propriétés croisées avec le cadastre LES BASES DE DONNEES SPECIFIQUES Casier Viticole Informatisé OCS pré-existantes Corine Land Cover SPOT Thema Urban Atlas Observatoires territoriaux Elles doivent être cohérentes géométriquement (en termes de géo-référencement et d échelle d exploitation) et dans la mesure du possible temporellement avec les images. Suivant leur qualité, elles sont utilisées de plusieurs façons, pour obtenir des informations d apprentissage et/ou en post-traitement par application directe (si l information exogène est imposée) ou indirecte (si l information exogène sert à lever des confusions spécifiques). 3.1.3.LES LOGICIELS Identification des parcelles viti-vinicoles Dépend du territoire d étude Inventaire biophysique de l occupation des terres au niveau européen. Du fait de sa faible résolution et sa faible fréquence de mise à jour, il est utilisé dans la méthodologie que pour quelques cas particuliers. Base de donnée d occupation des sols à l échelle des agglomérations développée par Airbus Base de données vectorielle d occupation des sols disponible gratuitement sur les principales villes européennes Dépend du territoire d étude Tableau 2: Les bases de données exogènes utilisables La plupart des étapes décrites dans ce rapport sont réalisables par plusieurs logiciels. Toutes peuvent être réalisées par des logiciels libres, même si certains logiciels payants apportent une plus-value intéressante. Les expérimentations menées par le PCI AST et la DTER CE utilisent les outils suivants. Quantum GIS (QGIS), système d information géographique libre et multi plate-forme, a été utilisé pour les aspects cartographiques, la visualisation vecteur et raster, et certains traitements sur les vecteurs [21]. Les librairies GDAL [22] pour un certain nombre de traitements raster et vecteur, et en particulier à travers la bibliothèque ogr2ogr [23]. L ORFEO ToolBox (OTB) est un outil pour le traitement d images satellites. Les OTB applications permettent d effectuer les différents traitements liés à l extraction d informations à partir des images satellites de manière automatisées [24] [25]. PostgresSQL est un système de gestion de base de données relationnelles et objet, libre (licence BSD) et multiplate-forme. Son module spatial est PostGIS [26]. Sqlite est un système de gestion de bases de données dont SpatiaLite est le module spatial qui peut être utilisé à travers les spatialite_tools [27]. Page 20 / 106

Enfin, l enchaînement automatique des étapes est nécessaire pour travailler efficacement sur de grands territoires. Il se fait sous forme de scripts appelant successivement les fonctions des logiciels précédents, par exemple en langage Python, ou en créant des suites de traitements via le modeleur QGIS, exécutables en totalité ou par lot. Suivant l étape du traitement, l une ou l autre des solutions a été appliquée. Illustration 4: Exemple de modèle de traitement sous QGIS pour la rasterisation 3.1.4.LE MATERIEL INFORMATIQUE NECESSAIRE Lors de la mise en œuvre opérationnelle de la méthodologie, les données manipulées sont lourdes (compter par exemple 5 Go pour une image couvrant un département) et les traitements effectués sont nombreux et longs (calculs de textures, de classifications, de vectorisation sur de larges territoires, nécessitant jusqu à plusieurs dizaines d heures de calcul chacun). Un découpage en dalles permettant de traiter le territoire morceaux par morceaux ainsi qu une automatisation maximale sont nécessaires. Mais même avec cette approche, les ressources suivantes sont requises à minima. Mémoire RAM Processeurs Disque Dur Écran CARACTERISTIQUES INFORMATIQUES MINIMALES REQUISES 8 Go Au moins 8 cœurs à plus de 3 GHz 800 Go de libre Double écran quasiment indispensable Tableau 3: Caractéristiques informatiques minimales requises pour la mise en œuvre de la méthodologie sur un département Pour des raisons pratiques, le PCI AST travaille sur des machines virtuelles sous Linux, mises en place sur différentes stations de travail. Une organisation de travail distribué permet d utiliser conjointement les ressources de calcul de plusieurs machines. D autres organisations, par exemple sous windows, sont possibles. Idéalement, l utilisation d un serveur de calcul plus puissant permettrait de gagner du temps et d optimiser les ressources. 3.1.5.LES COMPETENCES TECHNIQUES REQUISES L objet de ce rapport n est pas d expliquer comment fonctionnent les différents logiciels utilisés, ce thème étant traité par ailleurs, notamment dans les liens donnés en fin de rapport. Par contre, des exemples de fonctions à appliquer sont systématiquement donnés pour une mise en œuvre par un utilisateur averti. Une connaissance de base des logiciels présentés ci-dessous (ou de logiciels équivalent) est donc nécessaire pour pouvoir mettre en œuvre la méthodologie. Une montée en compétence pour avoir les pré-requis de base peut être à prendre en compte. Page 21 / 106

3.2. GENERALITES SUR L APPROCHE METHODOLOGIQUE Lors de la mise en place d une OCS, le choix de l approche méthodologique générale dimensionne le processus de production. Il correspond au poids donné aux différents procédés d obtention de l information thématique. Les différentes approches d obtention d informations sont présentées ci-dessous. L extraction d informations d une image par photo-interprétation, généralement assistée par ordinateur (PIAO), correspond à la saisie directe d information par des opérateurs qui visualisent l image et digitalisent manuellement l information. Cette méthode nécessite une description précise des éléments à interpréter, une analyse métier du paysage et un calibrage entre interprètes pour limiter les différences d interprétation. Elle est indispensable pour un travail sur une nomenclature fine, mais le traitement est long et coûteux. L extraction d informations d une image par classification automatique utilise des algorithmes pour identifier automatiquement des informations thématiques (label sémantique) selon des critères mathématiques à partir des valeurs radiométriques (couleurs) des pixels. Ces méthodes utilisent ou non des informations d apprentissage. Elles sont aujourd hui peu utilisées dans les services car plus complexes que les méthodes de photo-interprétation pure. Elles se limitent en pratique à des classes thématiques simples, mais traitent toutefois de larges surfaces et fournissent rapidement une caractérisation de l OCS utile pour un premier niveau d analyse. Ce rapport met l accent sur ce type de traitements, tout en proposant des manières de combiner avec les autres. L information contenue dans des bases de données existantes peut provenir elle-même d images (c est le cas de la BD Topo par exemple, basé sur de la PIAO sur images aériennes) ou d autres sources (comme les fichiers fonciers qui proviennent des déclarations d impôts enregistrées par la DGFip). Sauf certains cas particuliers, les bases de données exogènes ne couvrent pas tous les territoires ni toutes les thématiques de l occupation des sols. Elles peuvent être redondantes, contradictoires entre elles, hétérogènes en terme de qualité. Cependant, la sélection, le traitement et le croisement «pertinent» de ces données fournit des informations précieuses pour construire des couches d occupation des sols. Les visites terrain permettent de déterminer avec grande précision le label (y compris d usage) et le contour des polygones. Potentiellement très coûteuse, cette méthode nécessite une cohérence temporelle avec le millésime de la couche d OCS et ne peut être utilisée que de manière partielle sur de larges territoires. Au regard de ces différentes approches, deux macro-scénarios méthodologiques permettent de produire des couches d occupation des sols de premier niveau de nomenclature. Ces couches peuvent ensuite être complétées localement, à partir de méthodes complémentaires basées principalement sur de la photointerprétation fine et des visites terrain. Les traitements pour les classes fines de la nomenclature (niveau 3 et 4 de la nomenclature du groupe de travail national OCS GE) ne sont pas traités ici. Le premier macro-scénario méthodologique repose sur l utilisation croisée de bases de données existantes, corrigées et complétées ensuite par de la photo-interprétation sur images satellites ou aériennes. Des traitements automatiques sont parfois utilisés ensuite comme aide à la décision pour identifier rapidement des zones à corriger manuellement. Ce scénario est pertinent si une nomenclature détaillée est requise (OCS GE de l IGN, si des données de bonne qualité sont disponibles, et si la zone de production est suffisamment petite et/ou si de nombreux photo-interprètes sont disponibles. Ce type d approche est par exemple retenu par l IGN pour sa production de l OCS Grande Echelle. Le second scénario offre une part plus importante aux traitements automatiques dans la mesure où l information de base de la couche d occupation des sols est celle du résultat de classifications automatiques. Ces résultats de classifications sont ensuite corrigés et post traités avec des BD exogènes et parfois des méthodes de photo-interprétation. C est l approche retenue par le PCI AST Les schémas ci-dessous précisent le contenu de ces deux solutions. Les blocs de couleurs différentes ne mettent pas en jeu les mêmes compétences techniques et peuvent être effectués par des opérateurs distincts. Chaque bloc peut par ailleurs être mis en œuvre de différentes façon. Si tous les blocs de couleur ont un intérêt pour améliorer la qualité du résultat, certains sont facultatifs. Une vision générale et transversale doit être assurée pour vérifier la cohérence et le bon enchaînement de chacune des étapes. Page 22 / 106

Figure 3: Macro-scénario méthodologique n 1 Dans le premier macro-scénario, l information de base est obtenue par le croisement de bases de données existantes. Cette couche est corrigée et complétée par l action de photo-interprètes. Des traitements automatiques peuvent être utilisés comme aide à la décision pour identifier des zones à traiter plus finement, cette dernière étape (bloc vert) étant facultative. Page 23 / 106

Figure 4: Macro-scénario méthodologique n 2 Dans le second macro-scénario, l information de base est obtenue par classifications automatiques sur les images disponibles. Cette couche est corrigée par l utilisation directe et indirect de bases de données exogènes dans un premier temps, puis si nécessaire, de photo-interprétation. Ce rapport décrit de manière détaillée les différentes étapes de production correspondant à l approche du second macro-scénario, selon une méthodologie exploratoire mise en place par le Cerema. Page 24 / 106

4. LA METHODOLOGIE - DETAILS 4.1. CHOIX ET OBTENTION DES IMAGES SATELLITES 4.1.1.INTRODUCTION Dans la méthodologie de production, l information brute a deux origines : l image satellite et les bases de données pré-existantes. Le choix des données résulte d un compromis entre la qualité de l information, son actualité, sa précision, sa spécificité et sa disponibilité sur l ensemble du territoire. D autres rapports présentent les bases de données existantes, leurs caractéristiques et leurs liens avec l occupation des sols [28] [29] [30] [31]. Cette analyse est plus rare sur les images satellites disponibles, c est pourquoi nous présentons ici les critères de choix de sélection d images satellites et proposons quelques pistes sur la manière de les obtenir. 4.1.2. LE CHOIX DES IMAGES 4.1.2.1. GENERALITES SUR L IMAGERIE SATELLITAIRE Un satellite d observation est un objet artificiel en orbite autour de la terre. Il est constitué d une plate-forme structurante et de charges utiles (panneaux solaires, antennes de communication, capteurs...). Classiquement, ce type de satellite fait quelques dizaines de centimètres à quelques mètres de long, et pèse quelques centaines de kilogrammes à plusieurs tonnes. Plus de 170 satellites d observation de la terre sont aujourd hui en activité [32]. Chaque satellite a des caractéristiques techniques propres permettant différentes applications : météorologie, géodésie, climat, inventaire et suivi des ressources naturelles ou agricoles, suivi des catastrophes, connaissance des territoires À titre d exemple, des satellites comme ceux de la filière SPOT, Pléiades, RapidEye, Landsat ou les futurs Sentinel sont utilisables pour des applications d occupation des sols. Illustration 5: Exemples de satellites d'observation de la terre. Source : CNES Page 25 / 106

Illustration 6: Schéma présentant les grands types d'orbite. Source : Auteur du rapport Ces satellites défilent autour de la terre, généralement en orbite elliptique basse 1. Certains satellites d observation sont parfois beaucoup plus éloignés, en orbite géostationnaire, pour des applications en météorologie 2 par exemple. Ils sont équipés de capteurs qui mesurent une lumière reçue. Cette lumière peut correspondre à la lumière du soleil réfléchie par la surface du sol (capteur passif) ou à la réflexion d une lumière émise par le satellite lui-même, généralement dans des longueurs d ondes correspondant à des bandes RADAR 3 (capteur actif). Ces mesures sont transférées au sol lorsque le satellite entre en visibilité d antennes de réceptions localisées un peu partout dans le monde. Illustration 7: Principe général de l'observation de la terre par satellite 1 Orbite elliptique basse: trajectoires entre 500 et 1000 km d altitude, légèrement inclinées par rapport aux pôles. Les satellites sur ce type d orbite sont mobiles par rapport au sol et font un tour de la terre toutes les 100 minutes environ. Pour un observateur au sol, le passage d un horizon à l autre dure environ 20 minutes. À chaque rotation du satellite, la trace au sol est décalée de quelques milliers de kilomètres vers l ouest. Ce type de trajectoire permet de couvrir l ensemble des points du globe en quelques jours. 2 Orbite géo-stationnaire : trajectoire à 36 000 km d altitude, localisée sur le plan équatorial, présentant la particularité pour le satellite d être toujours à la verticale du même point de la terre, propriété très utile pour les satellites de télécommunication. 3 Les longueurs d onde radar varient entre 3 mm et 10 m. Les bandes radar les plus classiques sont les bandes L (longueur d onde : 15-30 cm, fréquence : 1 à 2 GHz), bande C (longueur d onde : 3,75 à 7,5 cm, fréquence 4 à 8 GHz), bande X (longueur d onde : 2,5 à 3,75 cm, fréquence : 8-12 GHz) et bande K (longueur d onde entre 1,11 et 1,67 cm, fréquence entre 18 et 27 GHz). Page 26 / 106