Analyse des images 2006, 2007, 2008 du satellite Formosat-2 Projet «Sud-Ouest» Rédacteur : Danielle Ducrot Claire Marais Sicre Avec la participation de Jean François Dejoux, Pierrette Gouaux Stagiaires : Gaëtan Lacombe, Mathieu Pocquet, Tanguy Bureau, Antoine Massé, Newdeskarl St Fleur 1
SOMMAIRE Résumé des chapitres Chapitre 1 : Objectif de l étude... 3 Chapitre 2 : Les données Sud ouest 2006-2007 - 2008... 3 Chapitre 3 : Analyse des images 2006 2007 2008... 4 Chapitre 4 : Les classifications... 5 Chapitre 5 : Analyse du paysage, comparaison SPOT-FORMOSAT... 5 1 - Introduction... 7 1.1 Caractéristiques des images FORMOSAT-2... 7 1.2 Objectif de l étude... 11 2 Les données Sud ouest 2006-2007 - 2008... 12 2.1 Présentation de la région d étude... 12 2.2 Les données Formosat 2006, 2007, 2008... 13 2.3 Les logiciels... 16 2.4 Les prétraitements... 17 2.4.1 Image commune - création d un masque... 17 2.4.2 Apprentissage avec saisie automatique des échantillons et le RPG (PAC graphique)... 18 3 - Analyse des images 2006 2007-2008... 41 3.1 - Analyse des images Formosat 2006... 41 3.1.1 - Introduction... 41 3.1.2 - Les étapes des traitements... 41 3.2 Mesure de la qualité de discrimination des canaux spectraux et temporels - évolution spectrale et temporelle... 47 3.2.1 Recherche des meilleures dates discriminatoires : Création automatique des matrices de confusions de toutes les combinaisons de dates... 48 3.2.2 Meilleurs canaux pour la discrimination des classes : Pourcentages de biens classés globaux 49 4 - Classifications... 67 4.1 Classifications non supervisées 2006... 67 4.2 Classifications supervisées 2006... 70 4.3 Classifications supervisées 2007... 78 4.3.1 Comparaison de méthodes de classifications... 78 4.3.2 Classifications avec le RPG... 81 4.4 Classifications supervisées 2008... 87 4.5 Comparaison des données PAC Graphique avec les classifications FORMOSAT... 96 4.6 Conclusion sur les classifications... 98 5 - Analyse de paysage... 99 5.1 Concepts et définitions... 99 5.2 - Les images... 100 5.3 Analyse de l hétérogénéité... 101 5.4 Les descripteurs du paysage... 104 6 - Conclusion... 110 7 - Bibliographie... 112 2
Résumé et résultats des chapitres Chapitre 1 : Objectif de l étude Analyse des données FORMOSAT-2 de 2006 à 2008 sur une région agricole du Sud- Ouest Toulouse (France) Suivi spectral et temporel o étude des signatures spectrales de chaque classe (76 images pour 2006) dans tous les canaux de toutes les dates o Profils temporels Référentiel / Echantillonnage o Sélection des données les plus performantes pour la carte d occupation des sols (OS) Classification multitemporelle des données Réalisation de la carte d occupation du sol très détaillée Intérêt de la haute répétitivité temporelle et haute résolution spatiale Pratiques culturales (Rotation des cultures, Préparation des terres, Irrigation.) Usage des terres (autre rapport) Analyse de paysage : comparaison SPOT/FORMOSAT-2 Réalisation d une classification non supervisée et d interprétation automatique d après des données radiométriques plus anciennes, date après date (autre rapport). La région est assez anthropisée. Pour notre étude, nous avons détaillé l occupation du sol à vocation agricole en précisant leurs différents types : o Végétation permanente : Feuillus, Résineux, Eucalyptus, Peupliers, Jachère, Friche, Prairie, Pré o Culture d été : Tournesol, Maïs, Sorgho, Soja o Culture d hiver et de printemps : Blé, Colza, Orge, Pois o Eau et urbain : Eau libre, Lac, Gravières, Bâti et Surfaces minérales L'accent est mis sur l'automatisation et la précision des traitements, indispensable à la haute répétitivité, l'évaluation de l'apport de ces données pour la classification de l'occupation du sol. Ce rapport n est qu un résumé de nombreux tests réalisés la plupart du temps de façon exhaustive. L analyse des résultats obtenus avec les images Formosat 2006, 2007, 2008 se veulent le plus complet et le plus «véridique» possible. Tous les résultats statistiques ne sont pas présentés dans ce rapport, mais dans d autres documents qui peuvent être consultée (sur stock2). Chapitre 2 : Les données Sud ouest 2006-2007 - 2008 La sélection des échantillons est déterminante et délicate pour obtenir une classification satisfaisante. Suivant les années les profils temporels des cultures sont variables Une telle superficie d étude engendre une grande variabilité de réponses, pour une même classe, due à la situation topographique et aux climats locaux (zones de plaines, de vallées, de coteaux, de piémont ) L exemple du Sorgho a permis de montrer qu une classe ayant peu d échantillons, mais qui présente un taux de variabilité important, est préjudiciable pour la mesure de validation de la classification avec la matrice de confusion. Les résultats sont très 3
différents suivant que les tests sont réalisés sur l échantillonnage total, ou une partie des échantillons Le choix des sous classes n est pas forcément le même d une année à l autre, celui-ci dépend des conditions de semis, climatique ; il donc difficile de reproduire d une année à l autre la même démarche. Dans le cas des vérités terrain, le seuil de segmentation doit être choisi avec minutie pour créer la collection d échantillons à l échelle du parcellaire, il est parfois nécessaire de considérer les polygones au cas par cas. L érosion des échantillons est un facteur important qui peut modifier la classification. Une érosion trop faible des échantillons peut prendre en compte par exemple les bordures de champs, les lisières de forêts, qui ne sont pas représentatives de la classe et entraînent une hétérogénéité trop importante des réponses. A l inverse, une érosion trop forte restreint l hétérogénéité offerte par la classe, par exemple les prairies qui ne sont pas forcément uniformes sur une même parcelle. Avril est indispensable pour discriminer le Colza, le Maïs ensilage est bien reconnu début septembre, l Eucalyptus à partir de début de l automne. Pour le Tournesol, les canaux spectraux B2 et B3 sont importants. Divers indices (hors NDVI) brillance, rougeur, texture ont été étudiés, mais n ont pas été concluant. Chapitre 3 : Analyse des images 2006 2007 2008 Suivant le jeu d échantillons utilisé les résultats sont variables. En théorie, la classification est validée avec un jeu d échantillons indépendant, mais cela supprime des échantillons pour l apprentissage qui sont donc moins représentatif. La meilleure solution, pour supprimer certaines confusions, est de choisir des sous classes pour la classification, puis les regrouper après la classification. Chaque année est différente, les dates les plus discriminantes ne sont pas exactement les mêmes, suivant l année, les conditions climatiques, la croissance de la végétation varie. Le choix des dates et les règles à appliquer ne peuvent qu être qu indicatives et pas toujours généralisables. Pour obtenir les résultats ce n est pas la quantité des échantillons qui est la plus importante, mais leur représentativité. Une classe peut être présente, mais non considérée, cas du Maïs ensilage, les pixels de cette classe étaient classés principalement en Tournesol. Confirmation des résultats obtenus avec les courbes de réflectance, les meilleures dates pour discriminer : o le Maïs ensilage sont les dates de début septembre o le Tournesol les dates d été de début juillet jusqu à la récolte début octobre o l Eucalyptus à partir du début de l automne. Le mois d avril est très important pour la discrimination du Colza, mais également les cultures d hiver et de printemps, les Feuillus. Si on n a pas avril, il est intéressant d avoir mars et éventuellement début mai, à défaut la combinaison mai, juin, ce qui a déjà été observé avec les images SPOT. 4
Fin d hiver - début printemps et fin de printemps avec début d été sont des périodes qui assurent un meilleur score dès qu ils participent à une combinaison (confirméavec SPOT). Une date de fin d été ajoutée, assure l augmentation des MPCC, ainsi qu une date de fin de saison : septembre, octobre. Ces deux dates permettront de discriminer les cultures d été. Quelque soit les canaux spectraux et/ou temporels, le Sorgho a un profil très proche du Maïs. D une façon générale pour les cultures d été les meilleures dates sont juillet - août. Chapitre 4 : Les classifications Les divers indices autre que le NDVI n on pas apporté d amélioration, le principe de fusion de classifications s avère plus efficace, car la complémentarité des canaux augmente la discrimination des classes dans le processus de la classification. Le nombre de dates étant important, des données supplémentaires ne sont pas toujours utiles, cela peut entrainer une diminution du taux de bien classés. Le choix des dates est important pour les cultures, ce qui prouve l avantage de la haute répétitivité Une culture délicate à discriminer est le Tournesol, qui est en général surestimé car il est confondu avec le Mais, le Sorgho et la Prairie dans une moindre mesure. La façon la plus efficace de le discriminer a été l utilisation de B2 et B3 seuls pour 2 dates (4 août, 8 septembre) combinées à 5 autres dates bien choisies 20/30, 5/04, 6/30, 11/8, 15/9 dans une classification et de fusionner cette classification avec la précédente. Certaines pratiques culturales, telles les cultures dérobées (c'est-à-dire deux cultures par année sur la même parcelle, culture intermédiaire à croissance différée) engendrent des confusions au niveau de la classification. Ceci est difficile à maîtriser, mais doit être considéré au regard de la réglementation qui préconise ces pièges à nitrates et qui diminuent l érosion des sols. Les objets fins comme certaines routes, chemins et haies se distinguent avec FORMOSAT La conclusion la plus importante est que l on ne peut reproduire systématiquement les mêmes combinaisons chaque année car : on n a pas forcément les mêmes dates, grande variabilité des résultats de classification suivant le choix du jeu des échantillons RPG ou vérité terrain, les pratiques culturales peuvent également varier pour des raisons très diverses climatologique, raison personnelle de l agriculteur Chapitre 5 : Analyse du paysage, comparaison SPOT-FORMOSAT Cette étude, à partir de deux images satellites SPOT à 20m, FORMOSAT à 8m et d une photographie aérienne a permis d analyser l observation de la structure du paysage à différentes échelles. Les résultats montrent que la caractérisation du paysage est influencée par la résolution spatiale (20m, 8m et 50cm) des images. La différence d échelle a une influence sur l analyse de paysage, une résolution moins fine percevant moins de détails. La caractérisation du paysage varie en fonction du nombre de patchs, celui-ci diffère en fonction de la résolution du satellite. Ce nombre intervient dans une grande partie des indices du paysage. Le résultat de l analyse du paysage est donc différent du point de vue de FORMOSAT ou de SPOT. 5
Toutefois certaines variations sont dues aux images qui ne sont pas prises la même année (2004 pour SPOT, 2008 pour FORMOSAT), il existe quelques changements dans l occupation du sol. L étude des caractéristiques paysagères en milieu urbanisé, à l échelle de photographies aériennes (50cm) permet de faire ressortir les différentes morphologies urbaines et la complexité d un paysage urbain. Ces caractéristiques obtenues par des calculs affinent la description du paysage et donne une mesure à des propriétés perçues visuellement. La mise en forme numérique du paysage voit son effet réducteur compensé par la capacité de la méthode à analyser de vastes étendues et à fournir des mesures objectives et quantifiées des paysages. Les statistiques sur l occupation du sol ont permis de quantifier l organisation de cette zone urbaine, qui est très végétalisée. Ainsi, la proportion de pelouses, dans le paysage s est avérée importante, par rapport aux maisons. Les espaces arborés qui paraissaient plus morcelés visuellement, ont un indice de morcellement modéré qui reflète plus la réalité. L aspect paysage urbain, donc anthropisé, est bien détecté grâce à l indice de dimension fractale. 6
1- INTRODUCTION Cette étude s inscrit dans le projet Sud-Ouest du CESBIO (dans la région Midi-pyrénées, sud-ouest toulousain) et la mission Venµs. La carte d occupation des sols devra être dressée annuellement et les variations temporelles à court et à long terme seront données. La mission Venµs (microsatellite scientifique Franco-Israélien lancement prévu en 2012) est réalisée en partenariat entre le CNES et l'agence Spatiale Israélienne (ISA). Venµs fournira des données de haute résolution (10 m), de répétitivité temporelle élevée (2 jours ou 3 jours), d angles d'observation constants pour un site donné et de richesse spectrale (12 bandes spectrales de 420 nm à 900 nm). Cette mission doit démontrer l'utilité de ce type de données notamment pour des applications centrées sur l'occupation des sols et le fonctionnement des écosystèmes naturels ou cultivés. Un des buts est de démontrer l'intérêt d'associer haute résolution spatiale et haute répétitivité pour l'occupation des sols et le fonctionnement des écosystèmes. La carte d occupation des sols et les variations temporelles à court et à long terme sont réalisées avec des données FORMOSAT- 2 qui présentent des caractéristiques proches de celles de Venµs, dont les images peuvent être acquises tous les jours (mais le coût est alors trop élevé). Dans le cadre du projet Sud Ouest l acquisition est de l ordre d une semaine à un mois en 2007 et 2008, fréquence plus élevée en 2006. 1.1 Caractéristiques des images FORMOSAT-2 D après Spot image et O.Hagolle Cesbio/Cnes FORMOSAT-2 est un satellite du NSPO (Taiwan), fabriqué par Astrium. Il a été lancé en mai 2004, d une durée de vie nominale de 5 ans. Son orbite est située à 891 Km. Le satellite FORMOSAT-2 effectue une observation quotidienne en décrivant une orbite géosynchrone (même zone de couverture), les données sont ainsi acquises de n'importe quel point dans sa région chaque jour du même angle et dans les mêmes conditions d'éclairage. Ces caractéristiques permettent ainsi une détection optimum des changements. Son orbite est également hélio-synchrone (même conditions d éclairement), ce qui signifie qu'il peut imager chaque région du globe à la même heure solaire locale 9 heure 30 TU, chaque jour en nœud descendant, contre 10h30 pour la majorité des systèmes optiques actuels. C'est un avantage important dans des régions équatoriales où la couverture de nuage est forte, rendant l'acquisition d'image plus difficile. Ce léger décalage, couplé à la revisite quotidienne, permet d augmenter les chances de succès d acquisitions d images exploitables dans les zones équatoriales au-dessus desquelles les nuages de convection se forment tout au long de la matinée. De plus sa position permet de conserver le même angle de visée. Le satellite décrit 14 orbites différentes chaque jour. L intérêt est donc la répétitivité des images qui permettre de suivre des phénomènes de courtes durées (ex : campagne d irrigation). A la différence des solutions très haute résolution, les paramètres de prise de vue de FORMOSAT-2 sont constants et connus à l'avance. Ils offrent ainsi une garantie quant au nombre d'images acquises et à leur superposition. À l'instar des satellites à très haute résolution, FORMOSAT-2 dispose de quatre bandes : bleu, vert, rouge et proche infrarouge. La bande bleue, associée aux bandes rouge et verte, permet de réaliser 7
sans traitement particulier des compositions en couleurs naturelles. Seule ou associée aux autres canaux, elle apporte également des informations spécifiques pour la cartographie des hauts fonds, la différenciation entre sol et végétation, la cartographie forestière et l'identification de cultures, les corrections atmosphériques. Figure 1.1 : Orbites décrites par le satellite FORMOSAT-2 quotidiennement Les bandes spectrales sont : B1 : 0,45 0,52 µm (Bleu) B2 : 0,52 0,60 µm (Vert) B3 : 0,63 0,69 µm (Rouge) B4 : 0,76 0,90 µm (Proche Infra Rouge) Il a une résolution de 8m (2m en Panchro) et un champ de 24 km x 24 km pour donner des images de 8 bits par pixel. Les données sont exprimées pour des images acquises en visée verticale (au nadir) pour minimiser les effets directionnels. Zones accessibles par Formosat-2 Figure 1.2 : les bandes spectrales de Formosat2 comparée à SPOT Les images FORMOSAT sont disponibles à 3 niveaux de prétraitement : 8
Niveau 1A Correction radiométrique des distorsions dues aux écarts de sensibilité entre les détecteurs élémentaires de l'instrument de prise de vue. Niveau 2A Correction radiométrique identique à celle du niveau 1A. Correction géométrique effectuée dans la projection cartographique standard (UTM WGS84 par défaut). Ortho Correction radiométrique identique à celle du niveau 1A. Correction géométrique effectuée dans une projection cartographique définie par l'utilisateur et intégrant la correction des effets du relief (carte et /ou points d'appuis et modèle numérique d'élévation à fournir). Les images FORMOSAT sont délivrées au format DIMAP : la partie image au format GeoTIFF, la partie métadonnées descriptives au format XML 1.1.1. QUALITE DE IMAGES FORMOSAT2 Instrument de bonne qualité Bon rapport signal sur bruit, bonne FTM Recette en vol succincte Codage sur 8 bits, gains programmables Géométrie o Données auxiliaires (attitude, orbite) d'assez mauvaise qualité o plateforme stable (vibrations sur images à 2m corrigées) o Superposition correcte (1pixel) après traitement de corrélation o La superposition multispectrale pourrait être meilleure Etalonnage Radiométrique (fait au CNES) : très bon Mode et résolution spatiale Bandes spectrales Emprise Revisite Angles de visée Orbite Programmation Dynamique de l image Taille des images (niveau 1A hors métadonnées) Poids commercialisation Multispectral (R, V, B, PIR) : 8 m Panchromatique : 2 m Bundle (images Pan et MS séparées) P : 0,45 0,90 µm B1 : 0,45 0,52 µm (Bleu) B2 : 0,52 0,60 µm (Vert) B3 : 0,63 0,69 µm (Rouge) B4 : 0,76 0,90 µm (Proche Infra Rouge) 24 km x 24 km quotidienne (cycle d'un jour) Angles de visée constants => minimisation des effets directionnels latéral et avant-arrière : +/- 45 891 km oui L acquisition simultanée des images panchromatiques et multispectrales est possible 8 bits/pixel MS : 35 Mo Pan : 137 Mo 760 kg (3 fois Venµs) SPOT Image Tableau 1.1 : résumé des caractéristiques 9
1.1.2. FORMOSAT2 ET LA DETECTION DE CHANGEMENTS La détection de changements et l'actualisation de bases de données sont essentielles à la compréhension des événements et donc à la prise de décisions. Facilement exploitables, les images FORMOSAT-2 sont d un très grand intérêt pour la surveillance de sites et la détection de changements. La fréquence des observations est choisie par l'utilisateur. Elles permettent de mettre rapidement en évidence toute variation de l occupation du sol et des infrastructures. FORMOSAT-2 allie : résolution temporelle : information actualisée pour améliorer l interprétation ou la classification résolution spatiale : pour travailler à une échelle fine Revisité chaque jour pour avoir une information la plus à jour possible afin d améliore l'analyse et la classification Pour la défense, la surveillance maritime, la gestion de désastre et l'agriculture, les séries chronologiques FORMOSAT-2 sont une nouvelle et unique solution pour la surveillance de site, pour une planification stratégique et tactique des diverses opérations dans un domaine. Les applications concernent la cartographie de l'occupation et de l'usage des terres, l'évaluation du besoin en eau des cultures, le diagnostic de pratiques culturales, suivi de l irrigation, préparation du futur : apport du moyen infrarouge et de l infrarouge thermique. 1.1.3. EVOLUTIONS SPECTRALES SPOT 2004/FORMOSAT-2 Une comparaison avec les résultats de l analyse des données 2004 et 2005 avec les images SPOT ont montrés que les réflectances spectrales sont : Similaires dans le vert et le rouge Globalement plus élevées dans le PIR avec SPOT pour la végétation Figure 1.3 : bandes spectrales comparées Spot - Formosat 10
Ce qui s'explique par la différence entre la largeur des bandes spectrales (voir figure 1.3). En effet, la largeur spectrale du canal proche-infrarouge est plus étroite pour SPOT que pour FORMOSAT. XS3 est sur la partie maximale de la courbe de réflectance de la végétation tandis que B4 englobe les réflectances de la partie croissante de la courbe. La moyenne sera donc plus élevée avec SPOT. Nos images sont du niveau 1A, elles ont été orthorectifiées et corrigées des effets atmosphériques par le CNES. Elles sont fournies en réflectance de surface (16bits, entier court signé). 1.2 Objectif de l étude Analyse des données FORMOSAT-2 de 2006 à 2008 sur une région agricole du Sud- Ouest Toulouse (France) Suivi spectral et temporel o étude des signatures spectrales de chaque classe (76 images pour 2006) dans tous les canaux de toutes les dates o Profils temporels Référentiel / Echantillonnage o Sélection des données les plus performantes pour la carte d occupation des sols (OS) Classification multitemporelle des données Réalisation de la carte d occupation du sol très détaillée Intérêt de la haute répétitivité temporelle et haute résolution spatiale Pratiques culturales (Rotation des cultures, Préparation des terres, Irrigation.) Usage des terres (autre rapport) Analyse de paysage : comparaison SPOT/FORMOSAT-2 Réalisation d une classification non supervisée et d interprétation automatique d après des données radiométriques plus anciennes, date après date (autre rapport). La région est assez anthropisée. Pour notre étude, nous avons détaillé l occupation du sol à vocation agricole en précisant leurs différents types : o Végétation permanente : Feuillus, Résineux, Eucalyptus, Peupliers, Jachère, Friche, Prairie, Pré o Culture d été : Tournesol, Maïs, Sorgho, Soja o Culture d hiver et de printemps : Blé, Colza, Orge, Pois o Eau et urbain : Eau libre, Lac, Gravières, Bâti et Surfaces minérales L'accent est mis sur l'automatisation et la précision des traitements, indispensable à la haute répétitivité, l'évaluation de l'apport de ces données pour la classification de l'occupation du sol. L analyse des résultats obtenus avec les images Formosat 2006, 2007, 2008 se veulent le plus complet et le plus «véridique» possible. Tous les résultats statistiques ne sont pas présentés dans ce rapport, mais dans d autres documents qui peuvent être consultés (sur stock2). Ce rapport n est qu un résumé de nombreux tests réalisés la plupart du temps de façon exhaustive. L analyse des résultats obtenus avec les images Formosat 2006, 2007, 2008 se veulent le plus complet et le plus «véridique» possible. Tous les résultats statistiques ne sont pas présentés dans ce rapport, mais dans d autres documents qui peuvent être consultés (stock2). 11
2 LES DONNEES SUD OUEST 2006-2007 - 2008 2.1 Présentation de la région d étude La zone région Midi-Pyrénées prise par le satellite Formosat se situe dans la région Midi-Pyrénées, centrée sur la ville de Rieumes au Sud-ouest de l agglomération toulousaine (50 km * 50 km environ). La zone couverte par Formosat représente environ le quart de celle couverte par Spot (figure 2.1), voir la description plus approfondie dans les rapports précédents avec les images SPOT 2002, 2003, 2004, 2005. La région est soumise à plusieurs influences climatiques : Atlantique (climat tempéré océanique) Continental (climat occasionnellement très froid) Méditerranéen (vent d autan) Légende : Zone Spot en bleu (50km x 50km) Figure 2.1 : Zone couverte par les satellites Spot et Formosat Zone Formosat en rouge (24km x 24 km) Fugure 2.1 : région couverte par les images formosat 2006 et SPOTdes années précédentes 12
2.2 Les données Formosat 2006, 2007, 2008 Les images FORMOSAT-2 sont utilisées avec les quatre bandes spectrales : B1 : 0,45-0,52 µm (bleu), B2 : 0,52-0,60 µm (vert), B3 : 0,63-0,69 µm (rouge), B4 : 0,76-0,90 µm (proche infrarouge). Pour 2006 Données de 02/2006 à 11/2006 : o 1 jour sur 3 o Données manquantes en avril (acquisitions pour d'autres clients) o Météo défavorable en mai (pas de données entre le 2 et le 27 mai) o Classification NSPO : Moyenne 54 % de nuages Plutôt optimiste, Ombres, Cirrus fins non comptabilisés Au départ les images étudiées étaient au nombre de 24 soit 96 images avec les quatre bandes spectrales. Les données sont transformées en réflectance (codage en 16 bits), (tableau 2.1). Figure 2.2 : Cadre Formosat 2006 sur fond de carte IGN SCAN 100 (plotscan100_formosat06.jpg) 13
Dates de prises de vues 2006 Qualité générale 06 février nuages peu nombreux éparpillés sur presque toute l'image sauf Auradé (nuages et voile) canal b1 très sombre 17 février Nuages important très localisés ouest centre image Qualité/ stations expérimentales Lamasquère bien 1 Images retenues pour la 1 classification supervisée (en 2007) non utilisée à cause de B1 valeurs très basses Etude des profils temporels et analyse des réflectances B1 non utilisée Lamasquère bien 2 non utilisée utilisée 21 février nuages très moutonneux Inutilisable 3 non utilisée non utilisée 24 février nuages étalés N-S et ombre, presque toute la scène Bonne qualité, très petits nuages à peine 14 mars perceptible à l ouest (centre) 17 mars 20 mars 26 mars 29 mars voile nuage et ombre nuage dense localisée sud-ouest, nord-est presque toute la scène. petits nuages WNW-ESE disposés en barres parallèles et ombres, grande partie de la scène. gros nuage et ombre, centre nuages par paquets et ombres très distincts, centre 02 mai nuages et voile sur Tlse et banlieue ouest barre nuageuse NE le reste bien 10 mai 14 mai 16 mai 25 mai nuages par paquets et ombres bien distincts, toute la scène voile et ombre, presque toute la scène Nuages, diagonale NW-SE, presque toute la scène Nuages, coté ouest de la diagonale NE-SW, voile très léger dans le tiers nord de la scène inutilisable 4 non utilisée non utilisée Pas de nuage 5 utilisée 1 utilisée Auradé ombre lamasquère voile 6 Auradé nuages; lamasquère peut être utilisé 7 Auradé touché par ombre Lamasqère ombre 8 Auradé AB lamasquère nuages 9 Auradé, Lamsquère: TB 10 Auradé, station B; BV ombre; Lamasquère ombre 11 Auradé ombre; Lamasquère voile 12 Auradé ombre; Lamasquère voile 13 Auradé nuage; Lamasquère nuages légers 14 non utilisée non utilisée non utilisée non utilisée utilisée 2 non utilisée pour la segmentaion non utilisée non utilisée non utilisée non utilisée non utilisée non utilisée non utilisée non utilisée non utilisée non utilisée non utilisée non utilisée 14 utilisée 27 mai Pas de nuage, excellente 15 utilisée 3 utilisée 02 juin mauvaise; gros paquets de nuages (et ombre) non utilisée 16 répartis sur toute l'image 05 juin Excellente 17 utilisée 4 utilisée 08 juin bande nuageuse WNW-ESE et son ombre non utilisée utilisée portée coupant le nord de l'image depuis St lys jusqu'à Muret; le reste de l'image ok pas de nuage 18 utilisée 14 juin excellente 19 utilisée 5 gros paquets de nuages, se répartissent en Inutilisable20 17 juin larges bandes parallèles sur toute l'image non utilisée utilisée 23 juin excellente utilisée 6 26 juin Nuage plus de la moitie image (sud ouest) Inutilisable21 non utilisée utilisée 22 29 juin excellente, très nette utilisée 7 9 02 juillet excellente 23 utilisée 8 utilisée
Dates de prises de vues 2006 08 juillet 14 juillet Qualité générale Très bien, mais très petits nuages à l extrême 24 ouest excellente 17 juillet voile léger Nord Est scène (toulouse) 20 juillet 23 juillet Presque pas de nuages : très petits nuages disséminés dans l image gros nuages moutonneux régulièrement répartis 26 juillet Nuage centre-sud-ouest gros nuages moutonneux régulièrement 29 juillet répartis (espaces visibles) gros nuages moutonneux régulièrement 7 août répartis 10 août Très bonne, un petit nuage au nord ouest nuages sur la plaine garonnaise et quelques 19 août uns sur les coteaux pas de nuage, excellent 31 août 03 septembre multiples nuages dans la plaine alluviale 06 pas de nuage, excellent septembre 09 pas de nuage, excellent septembre 12 septembre nuages moutonneux (avec ombre portée) sur la partie au nord de la diagonale NW-SE; angle SW zone nuageuse continue; seule une bande au sud de la diagonale est visible pas de nuage, excellent 27 septembre 3 octobre Beaucoup de nuages, partout 6 octobre Beaucoup de nuages, partout 9 octobre Beaucoup de nuages, partout 15 octobre Quelques nuages quart nord ouest 30 octobre pas de nuage, excellent 2 novembre pas de nuage, excellent 5 novembre pas de nuage, excellent Nuages quart nord est et voile nuageux au 8 novembre centre 14 novembre pas de nuage, excellent 23 novembre pas de nuage, excellent 25 26 Qualité/ stations expérimentales très petits nuages audessus de 2 parcelles de maïs (Cambernard, Poucharramet) 27 Images retenues pour la classification supervisée utilisée 9 utilisée 10 utilisée 11 utilisée 12 non utilisée 28 non utilisée 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 48 49 non utilisée non utilisée utilisée 13 non utilisée utilisée 14 non utilisée utilisée 15 utilisée 16 non utilisée non utilisée non utilisée non utilisée non utilisée non utilisée utilisée 17 non utilisée non utilisée non utilisée Etude des meilleurs canaux Analyse des réflectances utilisée utilisée utilisée utilisée utilisée utilisée utilisée utilisée utilisée utilisée utilisée utilisée utilisée Non utilisée Tableau 2.1 : Dates des prises de vues des images Formosat 2006 et qualités des images 15
Dates de prises de vues 2007 Qualité générale de l image 15/02/2007 Image dont il manque une partie Images retenues pour la segmentation et la classification supervisée Inutilisée 23/02/2007 utilisée 1 20/04/2007 utilisée 2 30/05/2007 Nuages au Sud de 30/06/2007 Légère l image couverture nuageuse dans la partie Nord-Est utilisée 3 utilisée 4 Dates de prise de vue 2008 11/02/2008 Qualité générale de l'image Nuages dans la zone Centre- Ouest Images retenues pour la segmentation et la classification supervisée utilisée 1 19/06/2008 utilisée 2 26/06/2008 Nuages partie ouest Non utilisées pour classif OS 08 07/07/2007 utilisée 5 10/07/2008 utilisée 3 31/07/2008 utilisée 4 04/08/2007 utilisée 6 21/08/2008 utilisée 5 11/08/2007 utilisée 7 01/09/2007 Petits nuages disséminés sur toute l image Inutilisée 28/08/2008 Nuages éparpillé dans l image Non utilisées pour classif OS 08 08/09/2007 utilisée 8 15/09/2007 utilisée 9 25/09/2008 utilisée 6 13/10/2007 Légère couverture nuageuse et ombre Non utilisée pour la classification, mais utilisée pour les statistiques 06/10/2008 utilisée 7 20/10/2007 «Traits» sur l image Inutilisée 10/10/2008 utilisée 8 27/10/2007 Couverture nuageuse Inutilisée 26/10/2008 utilisée 9 Tableau 2.2 : Dates des prises de vues des images Formosat 2007 et 2008 et qualités des images, respectivement 10 et 9 dates retenues pour déterminer l Occupation du sol 2.3 Les logiciels ENVI 4.4 ArcGis 9.2 pour l acquisition des vérités-terrain. TITE (Traitement de l Image de TElédétection), développé au CESBIO qui permet les opérations suivantes : saisie automatique des échantillons segmentation classifications supervisées et non supervisées interprétation semi automatique des classifications non supervisées calculs de statistiques sur ces images conversions de format de fichiers post-classification détection des changements de paysage et des rotations de culture analyse de paysage 16
2.4 Les prétraitements Les premières images étaient initialement en comptes numérique CN (codage en 16 bits), elles sont ensuite transformées en luminance L puis en réflectance ρ avec les relations : L= Ak*CN + CN 0 ρ = Π L Es cosθs Figure 2.3 : Composition colorée (B1, B2, B3) de la région toulousaine On étalonne la fonction en utilisant des mesures de nuit pour calculer CN 0, car L égale 0 la nuit. Il faut aussi prendre en compte les effets atmosphériques, pour cela on mesure chaque jour l épaisseur optique d aérosol à l aide d un photomètre solaire. La réflectance de surface est définie comme la part du rayonnement solaire réfléchi par la surface continentale. Elle dépend de la configuration angulaire de visée et d éclairement. Au-dessus des continents, l algorithme satellitaire est basé sur les mesures polarisées et, de ce fait, seuls les plus petits aérosols sont détectés. L épaisseur optique peut être déduite des mesures spatiales. La correction AOT (Aerosol Optical Thickness) est la contribution des aérosols, elle est calculée à partir d une fonction dépendant de l angle de diffusion et de l épaisseur optique. Les comptes numériques des pixels représentent la réflectance apparente du sol au sommet de l atmosphère, c est ce que l on appelle la réflectance TOA (Top Of Atmosphère). 2.4.1 Image commune - création d un masque Pour 2006, au départ on a extrait une fenêtre contenant les parties communes de l image, par la suite ceci a été abandonné pour garder, chaque année la même taille des images. Des tailles différentes d image compliquent les comparaisons des différentes dates. Actuellement, les images sont donc de la même taille pour chaque année (4500 colonnes par 4000 lignes). Un masque est créé automatiquement pour masquer les parties non communes aux différentes dates, et ainsi avoir une série d images toujours informée (sans partie non significative, à zéro). 17
2.4.2 Apprentissage avec saisie automatique des échantillons et le RPG (PAC graphique) 2.4.2.1 INTRODUCTION VERITES TERRAIN La classification supervisée nécessite de connaître des éléments du terrain. Plusieurs sorties sont effectuées par an afin de connaître les cultures pratiquées dans la région. Le CESBIO entretient des relations avec un groupement d agriculteurs d Auradé. Les échantillons ont été créés à partir de ces sorties terrains qui permettent de relever les différents thèmes (les classes) et les coordonnées GPS correspondantes. La prise des échantillons est une tâche fastidieuse car de celle-ci dépend en grande partie les résultats de la classification. La réalisation des polygones d entraînement par sélection manuelle est influencée par l image de travail, le plus souvent monodate, ce qui est l inconvénient majeur, car des hétérogénéités temporelles peuvent fausser le dessin des polygones. Le logiciel TITE permet de créer automatiquement des fichiers d échantillons à partir de «fichiers terrain» et d une segmentation des images (d après des données multi-spectrale, multi-date et multisource). Cette méthode d apprentissage présente des avantages, outre l automaticité, la prise directe des échantillons sur l image à partir des coordonnées géographiques de la base de données, l utilisation de tous les canaux disponibles pour la segmentation de l image, l obtention de zones temporellement homogènes, ce qui implique des échantillons précis. RPG (PAC GRAPHIQUE) Tous les agriculteurs en Europe qui touchent des aides de la PAC (Politique Agricole Commune) doivent déclarer chaque année leur occupation du sol. Pour celà, des ilôts culturaux ont été numérisés, ils constituent un ensemble de parcelles agricoles contigües, cultivées par le même agriculteur et délimitées par des éléments fixes (routes, rivières, haies...). L ensemble de ces données géographiques constitue le Référentiel Pac Graphique : RPG. Ces données sont consolidées au niveau national, depuis la campagne agricole 2005/2006 et diffusées par l AUP (Agence Unique de Paiement). La fiabilité de ces données est estimées à plus de 99%, d après les contrôles aléatoires effectués chaque année par l administration sur quelques pourcents des parcelles. Nous avons utilisé ces données pour l apprentissage et la validation des classifications. Pour celà, nous n avons utilisé que les ilôts PAC constitués d une seule culture, ce qui représente près de 50% des ilôts PAC. 2.4.2.2 SEGMENTATION DE L IMAGE MULTI-DATE La segmentation permet de définir des contours sur l image contenant une région dont les pixels sont homogènes entre eux. Elle décompose l image, à partir de tous les canaux spectraux et de toutes les dates disponibles (elle est multi temporelle), en un ensemble de sous-régions, ou segments, homogènes, contenant des pixels radiométriquement proches. Ainsi une segmentation est une description ou représentation de l image en termes de contours ou de régions. La segmentation diffère de la classification car elle ne cherche pas à identifier les régions créées et à les rassembler par classe. Ces deux opérations sont complémentaires car on se sert de la segmentation pour définir les échantillons et améliorer la classification. Trois étapes sont nécessaires à la réalisation d une segmentation : 18
calcul du module de gradient de l image. extraction des contours à partir de l image précédente : on obtient alors une image binaire qui représente le contour et le non-contour. labellisation (étiquetage) des images de contours : chaque région est numérotée, l image labellisée mise en correspondance avec la base de données va alors servir à la création du fichier d échantillons L image résultante est une image dynamique, le logiciel réalisant une représentation hiérarchique des différents niveaux de l image : un seuil bas montre une image très segmentée et plus le seuil est élevé, moins les critères d homogénéité sont stricts et plus les segments de même nature son rassemblés. Une image de contour multitemporel (segmentation de l image) a été créée à l aide de 10 dates pour 2006, des 9 dates pour 2007 et 2008 (voir 2.2). 2.4.2.3 LES ECHANTILLONS Les classes étudiées dans la région sont présentées dans le tableau 2.4. 2006 2007 2008 Les boisements regroupant la végétation arborée feuillus, résineux, eucalyptus, peupliers feuillus, résineux, eucalyptus, peupliers feuillus, résineux, eucalyptus, peupliers Les cultures d hiver : blé, blé tardif, (sous blé, orge blé, orge céréales classe) orge, orge tardif (sous classe) oléagineux colza colza colza Les cultures de printemps pois pois Les cultures d été : maïs, maïs ensilage, maïs, sorgho (partagé maïs, sorgho céréales sorgho en 2 sous classes Sorgho I et sorgho II) oléagineux tournesol tournesol tournesol, tournesol tardif, tournesol très hétérogène protéagineux soja soja soja Les surfaces toujours en herbe prairie temporaire, prairie prairie, prairie prairie permanente (ou pré) permanente Les surfaces enherbées plus ou moins jachère, friche jachère, friche jachère, friche fournies, éventuellement arboré Les surfaces non végétales Autre bâti dense ou lâche, bâti/minéral, rivière, lac, gravière bâti dense, bâti diffus, bâti/industriel, rivière, lac, gravière Tableau 2.3 : Classes répertoriées en 2006, 2007 et 2008 bâti dense, bâti diffus, bâti/industriel, rivière, lac, gravière biculture Les bicultures sont des pratiques culturales, telles que les cultures dérobées (c'est-à-dire deux cultures par année sur la même parcelle, culture intermédiaire à croissance différée) qui peuvent engendrer des confusions au niveau de la classification, il est intéressant de prendre des échantillons de biculture. Cette classe n a été introduite qu en 2008. Le RPG, ne permet pas de connaitre les doubles cultures. Même si la réglementation tend vers l utilisation des cultures intermédiaires comme pièges à nitrate pendant l interculture, à ce jour, nous n avons pas de données connues en assez grand nombre. Pour améliorer la classification de 2007, les échantillons de Sorgho ont dû être partagés en deux sous classes, en raison de leur trop grande diversité, et ce malgré leur faible quantité. 19
A PARTIR DES VERITES TERRAIN Pour l apprentissage réalisé automatiquement, il faut choisir le seuil le plus adapté à la sélection des échantillons, c'est-à-dire que les segments correspondent au mieux aux objets souhaités et ainsi ne pas créer des régions trop grandes englobant plusieurs parcelles. Avec des régions trop petites, les échantillons ne seront plus assez représentatifs. De manière générale, le seuil choisi fait correspondre les segments aux parcelles agricoles, par l observation de la superposition de l image de contours sur l image multitemporelle (figure 2.4 et 2.5). Les seuils permettant un ajustement aux parcelles sont 6, 8, 9 suivant les images. Figure 2.4 : Composition colorée (B2, B3, B4) de la région de la forêt de Rieumes, avec la prise d échantillons, Formosat 2006 L apprentissage réalisé automatiquement consiste à convertir le fichier vérité-terrain en fichier échantillons. Le logiciel va positionner les points issus de la base de donnée GPS, d après leurs coordonnées, sur l image segmentée et labellisée (un n est affecté à chaque segment appelé aussi label), au segment correspondant est attribué le type d occupation du sol, ce qui constitue un échantillon. Un échantillon occupe, donc, une région délimitée par des segments. Il est possible de prendre des échantillons à des seuils adaptés à chaque classe, ce qui permet une sélection précise. Une fois l échantillonnage effectué, l utilisateur peut appliquer sur les échantillons, une érosion d épaisseur choisie, car les bordures de parcelles sont des pixels mixtes qui ne sont pas significatifs de la classe et qui ne doivent pas être pris en compte dans les statistiques. Une érosion de deux pixels est appliquée sur les échantillons pour toutes les classes afin d éviter les mixels (pixels mixtes) qui peuvent diminuer la représentativité des échantillons. Les données de vérité terrain ne concernent, sauf exception, que les classes de cultures, les échantillons des autres classes d occupation du sol sont sélectionnés manuellement (feuillus, bâti ), car ils sont connus grâce à des cartes et aux travaux antérieurs, ils occupent généralement les mêmes lieux sur le long terme, et sont facilement repérables. 20
Figure 2.5 : autre exemple de prise d échantillons pour l image Formosat 2006 Pour 2007 et 2008, une fusion de ce type d échantillons a été réalisée avec ceux de 2006. Ces polygones ajoutés appartiennent aux classes d eau : Rivière, Lac, Gravière et de minéral (Bâti dense, Bâti lâche/minéral, Bâti/minéral), ainsi que de végétation pérenne. L opération a été renouvelée avec l emploi de la PAC graphique, présentée ci-dessous, pour les années 2006 et 2007. L échantillonnage de base compte 21 classes d occupation du sol auxquels s ajoute des classes supplémentaires à partir de vérités terrain prises suivant les années, qui permettent de réduire certaines confusions entre classes ce qui peut mener à 26 classes. AVEC LA PAC GRAPHIQUE (RPG) A partir de 2006 les échantillons ont été obtenus par le Référentiel PAC graphique : RPG. et tout le processus a été recommencé. Ces données ont été utilisées pour l apprentissage et la validation des classifications. Pour celà, nous n avons utilisé que les ilôts PAC constitués d une seule culture, ce qui représente près de 50% des ilôts PAC. Un type de culture est nommée «céréales», elle correspond soit à du Blé dur, soit à du Sorgho. Pour avoir des échantillons de Sorgho, il a fallu les distinguer d après leurs valeurs spectrales pour les séparer du Blé. Il y avait environ 400 ilôts purs de céréales de plus de un hectare. Pour ces échantillons les courbes spectrales on été crées dans le NDVI, de façon à distinguer culture d hiver et d été. Le sorgho ainsi récupéré a été vérifié un à un pour obtenir les échantillons. Le Blé dur a été intégré avec les échantillons de Blé tendre, qui se trouvent ainsi mélangé dans la classe Blé. Les échantillons sont érodés pour éviter de fausser les statistiques, en raison des mixels en bordure. 21
L apprentissage est finalisé : 2.4.2.4 SEPARATION AUTOMATIQUE DES ECHANTILLONS D APPRENTISSAGE ET DE VERIFICATION - en calculant les statistiques (minimum, moyenne, maximum, écart-type et, matrice de covariance) sur tous les échantillons dans chacun des canaux considérés par l utilisateur. Il est donc possible de reconsidérer les échantillons incertains. - en séparant le fichier d échantillons en deux fichiers : un échantillon sur deux, par classe, est affecté d une part aux échantillons d apprentissage, d autre part aux échantillons de vérification. Les échantillons sont ainsi répartis automatiquement en deux jeux : apprentissage et vérification. Les classes culturales d Orge, de Sorgho, Pois sont peu échantillonnées. Pour ces classes peu représentées, il est difficile, dans une zone agricole aussi vaste et hétérogène composée d un petit parcellaire, de trouver suffisamment d échantillons pour deux jeux d apprentissage. Pour la réalisation des matrices de confusion, il est parfois nécessaire d ajouter les échantillons d apprentissage de ces classes dans le jeu de vérification afin d avoir un effectif plus important. Echantillons complets 2006 Effectifs total (en pixels) Surface (en ha) Tableau 2.4 : Effectifs et surface des classes en 2006 des échantillons dérivés de la PAC graphique PAC graphique 2006 Nbre échantillons Fréquence (%) Echantillons d apprentissage 2006 Effectifs Fréquence Surface total (en (en ha) pixels) (%) Echantillons de vérification 2006 Effectifs Fréquence Surface total (en (en ha) pixels) (%) 1 feuillus. 47 33790 3.01 216.256 22756 3.85 145.638 11034 2.07 70.618 2 résineux. 26 12882 1.15 82.445 7575 1.28 48.480 5307 0.99 33.965 3 eucalyptus. 15 4771 0.42 30.534 3158 0.53 20.211 1613 0.30 10.323 25 peupliers. 4 4752 0.42 30.413 4248 0.72 27.187 504 0.09 3.226 16 friche. 51 1822 0.16 11.661 1078 0.18 6.899 744 0.14 4.762 15 jachère/surfaces gel 247 169191 15.05 1082.822 85111 14.41 544.710 84080 15.76 538.112 17 prairie temporaire 22 67414 6 431.45 33562 5.68 214.797 33852 6.34 216.653 28 pré/prairie permanente 98 83617 7.44 535.149 49678 8.41 317.939 33939 6.36 217.210 4 blé. 307 300614 26.74 1923.93 152572 25.82 976.461 148042 27.75 947.469 7 orge. 69 45964 4.09 294.17 26437 4.47 169.197 19527 3.66 124.973 6 colza. 56 55012 4.89 352.077 27710 4.69 177.344 27302 5.12 174.733 12 pois. 28 14319 1.27 91.642 9892 1.67 63.309 4427 0.83 28.333 8 mais 63 74126 6.59 474.406 32929 5.57 210.746 41197 7.72 263.661 40 mais ensilage. 21 19139 1.7 122.49 13808 2.34 88.371 5331 1.00 34.118 9 tournesol. 174 149012 13.25 953.677 81096 13.73 519.014 67916 12.73 434.662 10 sorgho 23 22728 2.02 145.459 11187 1.89 71.597 11541 2.16 73.862 11 soja. 36 17803 1.58 113.939 8522 1.44 54.541 9281 1.74 59.398 18 eau libre. 22 9554 0.85 61.146 3261 0.55 20.870 6293 1.18 40.275 19 lac. 15 13658 1.21 87.411 5559 0.94 35.578 8099 1.52 51.834 24 gravieres. 19 20752 1.85 132.813 8652 1.46 55.373 12100 2.27 77.440 20 bâti dense. 45 1219 0.11 7.802 769 0.13 4.922 450 0.08 2.880 21 bâti industriel. 35 693 0.06 4.435 377 0.06 2.413 316 0.06 2.022 32 bâti diffus. 25 1050 0.09 6.72 514 0.09 3.290 536 0.10 3.430 38 surface minérale. 37 455 0.04 2.912 348 0.06 2.227 107 0.02 0.685 24 classes 1124337 100 7195.757 590799 100.00 3781.114 533538 100.00 3414.643 22
PAC graphique 2007 Nbre echan tillons Echantillons complets 2007 Effectifs total (en pixels) Fréqu ence (%) Surface (en ha) Echantillons d apprentissage 2007 Effectifs Fréque Surface total (en nce (%) (en ha) pixels) Tableau 2.5 : Effectifs et surface des classes en 2007 des échantillons dérivés de la PAC graphique Echantillons de vérification 2007 Effectifs Fréqu Surface total (en ence (en ha) pixels ) (%) 1 feuillus. 50 33826 3.24 216.486 16766 3.29 107.302 17060 3.19 109.184 2 résineux. 28 13158 1.26 84.211 7728 1.52 49.459 5430 1.02 34.752 3 eucalyptus. 18 8478 0.81 54.259 3394 0.67 21.722 5084 0.95 32.538 25 peupliers. 4 4752 0.46 30.413 4248 0.83 27.187 504 0.09 3.226 16 friche. 41 2126 0.20 13.606 1106 0.22 7.078 1020 0.19 6.528 15 jachère/surfaces gel 288 116818 11.19 747.635 57071 11.21 365.254 59747 11.18 382.381 17 prairie temporaire 134 55882 5.36 357.645 28037 5.51 179.437 27845 5.21 178.208 28 pré/prairie permanente 106 60265 5.78 385.696 29784 5.85 190.618 30481 5.70 195.078 4 blé. 403 278417 26.68 781.869 133297 26.18 853.101 145120 27.15 928.768 7 orge. 76 53125 5.09 340.000 28268 5.55 180.915 24857 4.65 159.085 6 colza. 81 49008 4.70 13.651 23789 4.67 152.250 25219 4.72 61.402 12 pois. 33 15322 1.47 98.061 9071 1.78 58.054 6251 1.17 40.006 8 mais irrigue. 131 162120 15.54 1037.568 78616 15.44 503.142 83504 15.62 534.426 42 mais non irrigue 12 3273 0.31 20.947 1306 0.26 8.358 1967 0.37 12.589 40 mais ensilage. 19 19865 1.90 127.136 10784 2.12 69.018 9081 1.70 58.118 9 tournesol. 154 80386 7.70 14.470 38629 7.59 247.226 41757 7.81 267.245 10 sorgho I. 5 4107 0.39 26.285 2487 0.49 15.917 1620 0.30 10.368 41 sorgho II. 5 3823 0.37 24.467 1348 0.26 8.627 2475 0.46 15.840 11 soja. 29 26637 2.55 170.477 10725 2.11 68.640 15912 2.98 01.837 18 eau libre. 23 10907 1.05 69.805 6478 1.27 41.459 4429 0.83 28.346 19 lac. 16 17036 1.63 109.030 5559 1.09 35.578 11477 2.15 73.453 24 gravieres. 19 20752 1.99 132.813 8652 1.70 55.373 12100 2.26 77.440 20 bâti dense. 45 1219 0.12 7.802 769 0.15 4.922 450 0.08 2.880 21 bâti industriel. 35 693 0.07 4.435 377 0.07 2.413 316 0.06 2.022 32 bâti diffus. 23 1007 0.10 6.445 473 0.09 3.027 534 0.10 3.418 38 surface minérale. 45 524 0.05 3.354 302 0.06 1.933 222 0.04 1.421 26 classes 1043526 100.00 6678.566 509064 100.00 258.010 534462 100.00 3420.557 On peut remarquer qu en 2006 et 2007, la classe Maïs ensilage a été rajoutée ce qui a supprimé des confusions entre le Maïs et le Tournesol. En 2007 on a pu introduire la distinction entre le Maïs et le Maïs non irrigué, grâce au RPG plus détaillé en 2007 qu en 2006. Remarque : la numérotation des échantillons peut paraitre anarchique, mais pour la cohérence des études faites depuis 2002 sur cette région, les numéros sont conservés, ce qui implique que les classes ajoutées le sont à la fin de la liste, par exemple : la classe Peuplier n était pas considérée au départ, lorsque cette classe a été introduite, elle a été numérotée 25. 23
PAC graphique 2007 Nbre echan tillons Echantillons complets 2007 Emprise 2006 Effectifs Fréqu Surface total (en ence (en ha) pixels) (%) Echantillons d apprentissage2007/2006 Effectifs Fréque Surface total (en nce (%) (en ha) pixels) Echantillons de vérification 2007/2006 Effectifs Fréqu Surface total (en ence (en ha) pixels ) (%) 1 feuillus. 50 33826 3.37 216.486 16766 3.44 107.302 17060 3.37 109.184 2 résineux. 28 13158 1.31 84.211 7728 1.58 49.459 5430 1.31 34.752 3 eucalyptus. 18 8478 0.84 54.259 3394 0.70 21.722 5084 0.84 32.538 25 peupliers. 4 4752 0.47 30.413 4248 0.87 27.187 504 0.47 3.226 16 friche. 41 2126 0.21 13.606 1106 0.23 7.078 1020 0.21 6.528 15 jachère/surfaces gel 272 111543 11.11 713.875 54751 11.23 350.406 56792 11.11 363.469 17 prairie temporaire 130 53411 5.32 341.830 26290 5.39 168.256 27121 5.32 173.574 28 pré/prairie permanente 98 57335 5.71 366.944 28549 5.85 182.714 28786 5.71 184.230 4 blé. 384 265141 26.42 1696.902 127062 26.06 813.197 138079 26.42 883.706 7 orge. 70 48099 4.79 307.834 26793 5.49 171.475 21306 4.79 136.358 6 colza. 79 46702 4.65 298.893 21726 4.46 139.046 24976 4.65 159.846 12 pois. 29 15015 1.50 96.096 8998 1.85 57.587 6017 1.50 38.509 8 mais irrigue. 129 159744 15.92 1022.362 76240 15.63 487.936 83504 15.92 534.426 42 mais non irrigue 12 3273 0.33 20.947 1306 0.27 8.358 1967 0.33 12.589 40 mais ensilage. 19 19865 1.98 127.136 10784 2.21 69.018 9081 1.98 58.118 9 tournesol. 150 77382 7.71 495.245 37552 7.70 240.333 39830 7.71 254.912 10 sorgho I. 3 1696 0.17 10.854 76 0.02 0.486 1620 0.17 10.368 41 sorgho II. 5 3823 0.38 24.467 1348 0.28 8.627 2475 0.38 15.840 11 soja. 28 26403 2.63 168.979 10491 2.15 67.142 15912 2.63 101.837 18 eau libre. 22 10651 1.06 68.166 6312 1.29 40.397 4339 1.06 27.770 19 lac. 16 17036 1.70 109.030 5559 1.14 35.578 11477 1.70 73.453 24 gravières. 19 20752 2.07 132.813 8652 1.77 55.373 12100 2.07 77.440 20 bâti dense. 45 1219 0.12 7.802 769 0.16 4.922 450 0.12 2.880 21 bâti industriel. 35 693 0.07 4.435 377 0.08 2.413 316 0.07 2.022 32 bâti diffus. 23 1007 0.10 6.445 473 0.10 3.027 534 0.10 3.418 38 surface minérale. 45 524 0.05 3.354 302 0.06 1.933 222 0.05 1.421 26 classes 1003654 100.00 6423.386 487652 100.00 3120.973 516002 100.00 3302.413 Tableau 2.6 : Effectifs et surface des classes en 2007 des échantillons dérivés de la PAC graphique, emprise 2006/2007 (sur la partie commune des images 2006 et 2007), en gras les échantillons en nombre réduit par rapport aux échantillons hors partie commune L emprise 2006/2007 concerne la partie commune des images 2006 et 2007 pour un essai de classification en rajoutant les dates d hiver de 2006 qui correspondent aux semis des cultures d hiver de 2007. Ces dates d hiver 2006, on eut très peu d impact sur le PCC du Colza contrairement à ce que les courbes spectrales laissaient présager. Ceci en raison de la présence d une date d avril, date extrêmement importante pour la discrimination du Colza. Pour l année 2007, le Colza était déjà très bien classé. Ceci devrait s avérer intéressant si l image d avril n est pas disponible. 24
Classes Echantillons complets 2008 Effectifs total (en pixels) Fréquen ce (%) Surface (en ha) Echantillons d apprentissage2008 Fréque nce (%) Effectifs total (en pixels) Surface (en ha) Echantillons de vérification 2008 Effectifs Fréque Surface total (en nce (en ha) pixels ) (%) 1 feuillus. 42 34343 13.58 219.795 21343 15.28 136.595 13000 11.47 83.2 2 résineux. 28 13158 5.2 84.211 7728 5.53 49.459 5430 4.79 34.752 3 eucalyptus. 18 8493 3.36 54.355 3410 2.44 21.824 5083 4.49 32.531 4 blé. 142 49986 19.76 319.91 23329 16.7 149.306 26657 23.53 170.605 6 colza. 38 12974 5.13 83.034 6979 5 44.666 5995 5.29 38.368 7 orge. 13 5935 2.35 37.984 1652 1.18 10.573 4283 3.78 27.411 8 mais. 83 39309 15.54 251.578 20309 14.54 129.978 19000 16.77 121.6 9 tournesol. 83 17304 6.84 110.746 8642 6.19 55.309 8662 7.64 55.437 10 sorgho. 10 1749 0.69 11.194 653 0.47 4.179 1096 0.97 7.014 11 soja. 14 7943 3.14 50.835 4364 3.12 27.93 3579 3.16 22.906 15 jachère/surfaces gel 26 5167 2.04 33.069 2855 2.04 18.272 2312 2.04 14.797 16 friche. 28 1316 0.52 8.422 590 0.42 3.776 726 0.64 4.646 17 prairie. 49 11933 4.72 76.371 6890 4.93 44.096 5043 4.45 32.275 18 eau libre. 18 9117 3.6 58.349 5579 3.99 35.706 3538 3.12 22.643 19 lac. 7 9997 3.95 63.981 7728 5.53 49.459 2269 2 14.522 20 bâti dense. 6 279 0.11 1.786 116 0.08 0.742 163 0.14 1.043 21 bâti indus/surf minéral 21 278 0.11 1.779 144 0.1 0.922 134 0.12 0.858 24 gravières. 6 12933 5.11 82.771 9481 6.79 60.678 3452 3.05 22.093 25 peupliers. 4 4752 1.88 30.413 4248 3.04 27.187 504 0.44 3.226 32 bâti diffus. 16 552 0.22 3.533 224 0.16 1.434 328 0.29 2.099 36 biculture. 8 2140 0.85 13.696 1721 1.23 11.014 419 0.37 2.682 37tournesol particulier 4 583 0.23 3.731 227 0.16 1.453 356 0.31 2.278 38 surface minérale. 47 546 0.22 3.494 318 0.23 2.035 228 0.2 1.459 39 tournesol tardif 14 2192 0.87 14.029 1137 0.81 7.277 1055 0.93 6.752 24 classes 252979 252979 1619.066 139667 100 893.869 113312 100 725.197 Tableau 2.7 : Effectifs et surface des classes en 2008 d après des vérités terrain D après le tableau 2.8, en 2006 l ensemble des échantillons représente 7195.7 ha pour une zone d étude de 55565 ha. L échantillonnage total représente donc environ 13% de la superficie, et 11% pour 2007. Les échantillons issus du RPG, sont plus nombreux que ceux de 2008 issus de vérités terrain (2,4%). Année Surface totale des échantillons Surface de la zone d étude Représentation de l échantillonnage total sur la superficie utile 2006 7195.757 ha 55565 ha 13% RGP 2007 6423.386 ha 59772.3 ha 11% RGP 2008 1619 ha 68754.7 ha 2.4% vérité terrain Tableau 2.8 : pourcentage de la surface des échantillons par rapport à la surface de la scène 25
2.4.2.1 LES NUAGES Des échantillons sous les nuages ou l ombre des nuages ont du être enlevés de certaines dates pour les signatures spectrales et les profils temporels, pour avoir les résultats avec un maximum de dates. Pour 2006, on a enlevé 4 échantillons sous les nuages le 06/02, et 2 échantillons le 17/02. Des échantillons ont été supprimés avec les dates 02/05, 08/06 et une dizaine avec le 15/10. Pour 2007 et 2008 les mêmes dates ont été utilisées pour la classification et les profils temporels. Le problème de la présence de nuages sur des images, peut être résolu de diverses manières. S il y a beaucoup d images comme en 2006, si certaines images présentent une quantité importante de nuages, ces dates ne sont pas utilisées dans la classification. Avec 6 à 10 dates (voir étude sur les canaux discriminants) la classification donne de bons résultats. Par contre, cela peut être gênant de ne pas utiliser une date quand les dates ne sont pas bien réparties dans le temps. Par exemple pour 2008, il n y pas de dates de début de printemps, le mois de février avec des nuages a du être utilisée dans la classification. Une première méthode consiste à prendre des échantillons sous les nuages, faire une classification avec ces échantillons (ombre, nuages épais, pourtour,..) et de se servir de ces nuages comme masque. Nous avons utilisé la classification non supervisée pour obtenir le masque des nuages. Les nuages des canaux qui en possèdent, sont masqués pendant la classification. Ainsi seule l information significative de cette date est utilisée dans la classification. Une autre technique qui peut s avérer très utile quand on a peu de dates, c est de prendre des sous classes sous les nuages et l ombre des nuages et considérer ces échantillons pour ces canaux uniquement pendant la classification. En général cette méthode donne de bons résultats. Le principe du traitement des nuages utilisé pour la classification 2008 est présenté dans la partie classification, avec des fusions de classification. 2.4.2.1 LE COLZA Cette classe est très bien classée si l on a au moins une image pendant la floraison du colza, qui dure en moyenne 1 mois (de fin mars à fin avril). Si on n a pas cette date, il est intéressant d utiliser une ou des dates de l automne de l année précédente, car le colza est semé début septembre et sa croissance automnale, entre septembre et novembre, peut être importante, contrairement aux semis des céréales à paille d hiver (blé, orge ), qui ont lieu début novembre et qui ont une croissance très faible en novembre et décembre. Ainsi, une ou plusieurs images entre novembre et février peuvent être discriminantes pour la majorité des situations, sauf pour les parcelles de colzas à implantation tardive et/ou accidents de croissance automnale. 2.4.2.2 LES SOUS CLASSES Discrimination du Maïs et du Tournesol En 2006, nous avons obtenu des données de la chambre d agriculture indiquant des parcelles «potentielles» de Maïs ensilage : la seule indication est que l usage de l agriculteur est de cultiver régulièrement du Maïs ensilage. A partir de l observation des images et des profils spectraux et temporels des parcelles d ensilage ont pu être déterminées. Les confusions entre le Maïs et le Tournesol proviennent des parcelles de Maïs d ensilage dont le cycle phénologique est proche du tournesol et se retrouve classé en Tournesol et non en Maïs. Dans le RPG tous les types de Maïs sont confondus. Pour différencier le Maïs ensilage du Maïs grain (le Maïs d'ensilage se récolte plus tôt que le Maïs grain), il a été décidé de faire une sous classe de Maïs ensilage à partir d une analyse visuelle pour chaque parcelle, suivie d une analyse des courbes de réflectance en partageant les échantillons dont la récolte est en général fin août - début septembre. 26
Ce principe a été vérifié en 2007. Pour 2008 nous ne disposions pas d informations sur le Maïs ensilage (encours de création actuellement). L importance de la classe Maïs d ensilage a été découverte en cherchant des sous classes du Maïs. Mais le Maïs d ensilage n est pas une sous classe, c est une classe à part entière. Nous verrons l amélioration importante dans la classification obtenu par l ajout de cette classe. Maïs irrigué En 2007 une classe Maïs irrigué été ajoutée, car disponible dans le RPG plus détaillé (niveau 4). Les parcelles de Maïs non irrigué se mélangent beaucoup plus que la Maïs non irrigué avec les autres cultures d été, car plus hétérogènes et plus proches du Tournesol avec un NDVI moins élevé que le Maïs irrigué. Confusions du Sorgho avec les autres cultures d été En 2007, les résultats de la classification donnent plus de 90% de bien classés de Sorgho avec les échantillons complets (10 échantillons), obtenus à partir du RPG. Par contre, dès que l on utilise la moitié des échantillons pour l apprentissage et la vérification, le pourcentage de bien classés est très bas. Dans ce cas particulier de 2007, pour cette classe très hétérogène, le partage a réparti les dix échantillons en deux sous classes très distinctes (un échantillon sur deux). Plus une région est étendue plus il peut y avoir des disparités, et plus l hétérogénéité peut être grande dans les échantillons. On peut donc être en présence de deux phénomènes : l augmentation du nombre d échantillons qui lisse cette hétérogénéité, ou au contraire qui l augmente et donne des écart-types élevés qui impliquent des confusions avec les autres classes L objectif est de comprendre la dynamique qui anime cette culture afin de voir s il est possible d améliorer le taux de PCC, notamment en créant des sous-classes. Pour cela nous allons observer le comportement du sorgho en 2007 à partir de la moyenne des 10 échantillons ainsi qu à partir de chacune des parcelles. Il est intéressant de savoir, si l on peut déceler des sous classes lors de l apprentissage, et est-ce vrai pour toutes les années? Étude du comportement des 10 échantillons de sorgho de 2007 Les dix échantillons de sorgho de 2007 proviennent de la classe du RPG nommée «Toutes céréales», qui comprend du Blé dur et du Sorgho. Ce groupe a été scindé en deux. Les échantillons qui, visuellement, pouvaient être apparentés à des cultures d hiver ont été intégrés aux échantillons de Blé, les autres échantillons ayant des réponses spectrales de type culture d été, ont permis de créer une classe Sorgho. Les échantillons litigieux ont été abandonnés. Une classification avec le maximum de vraisemblance du logiciel ENVI est réalisée avec 50% des échantillons en apprentissage du RPG 2007 et les autres 50% utilisés pour la validation. Le PCC du Sorgho est très faible car il se mélange avec les autres cultures d été : Maïs, Tournesol et Soja dans une moindre mesure. Sur 6 échantillons de validation : 4 sont classés en maïs, 1 en tournesol et 1 seul en sorgho. Malgré les différences phénologiques observées sur les 10 échantillons, la moyenne en 2007 est cohérente, elle suit le profil du Maïs. Les courbes montrent que les réponses spectrales du Sorgho et du Maïs sont extrêmement proche surtout pour certains échantillons. Trois «types» de Sorgho apparaissent dans les courbes des profils temporels (figure 2.6) : 4 échantillons de Sorgho précoces (bleu), 5 échantillons de Sorgho tardif (violet et vert), dont 3 présentant une baisse du NDVI le 8 septembre (vert) et un échantillon de Sorgho particulier (orange). Finalement, le Sorgho a été séparé en deux sous classes : Sorgho «précoce» (n 1, 6, 9, 8, 10), Sorgho tardif (2, 3, 4, 5 et 7), ce qui a permis d obtenir de meilleurs résultats dans la classification. 27
Figure 2.6: Courbes de NDVI des dix échantillons de Sorgho 2007 Figure 2.7 : Courbes de NDVI des dix échantillons de Sorgho 07 comparées à la moyenne du NDVI de la totalité des échantillons de Maïs, Tournesol et Sorgho. (Formosat07\SorghoRpg07\sorgho_rpg07.ech_stats_type1_ndvi.xls) Comportement du sorgho par rapport aux autres cultures d été à partir des valeurs moyennes de NDVI des 3 cultures d été : Maïs, Sorgho et Tournesol, année par année pour les 3 années 2006, 2007 et 2008 Il faut vérifier si le Sorgho est hétérogène avec le RPG 2006, 2007 et les échantillons de 2008. En 2008 le taux de PCC, avec la classification est meilleur. En observant les profils des diverses cultures, (figure 2.8) on peut constater la variabilité de celles ci suivant les années. 28
Tournesol 2006/2007/2008 0,8 0,7 0,6 0,5 ndvi 0,4 0,3 0,2 0,1 0 2-févr. 9-févr. 16-févr. 23-févr. 2-mars 9-mars 16-mars 23-mars 30-mars 6-avr. 13-avr. 20-avr. 27-avr. 4-mai 11-mai 18-mai 25-mai 1-juin 8-juin 15-juin 22-juin 29-juin 6-juil. 13-juil. 20-juil. 27-juil. 3-août 10-août 17-août 24-août 31-août 7-sept. 14-sept. 21-sept. 28-sept. 5-oct. 12-oct. 19-oct. 26-oct. 2-nov. tournesol 2006 tournesol 2007 tournesol 2008 ndvi 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 Mais 2006/2007/2008 2-févr. 9-févr. 16-févr. 23-févr. 2-mars 9-mars 16-mars 23-mars 30-mars 6-avr. 13-avr. 20-avr. 27-avr. 4-mai 11-mai 18-mai 25-mai 1-juin 8-juin 15-juin 22-juin 29-juin 6-juil. 13-juil. 20-juil. 27-juil. 3-août 10-août 17-août 24-août 31-août 7-sept. 14-sept. 21-sept. 28-sept. 5-oct. 12-oct. 19-oct. 26-oct. 2-nov. mais 2006 mais 2007 mais 2008 Sorgho 2006/2007/2008 ndvi 0,900 0,800 0,700 0,600 0,500 0,400 0,300 0,200 0,100 0,000 2-févr. 9-févr. 16-févr. 23-févr. 2-mars 9-mars 16-mars 23-mars 30-mars 6-avr. 13-avr. 20-avr. 27-avr. 4-mai 11-mai 18-mai 25-mai 1-juin 8-juin 15-juin 22-juin 29-juin 6-juil. 13-juil. 20-juil. 27-juil. 3-août 10-août 17-août 24-août 31-août 7-sept. 14-sept. 21-sept. 28-sept. 5-oct. 12-oct. 19-oct. 26-oct. 2-nov. Sorgho 06 Sorgho 07 Sorgho 08 Figure 2.8 : Comportement du Maïs, Sorgho et du Tournesol en 2006, 2007 et 2008 avec le NDVI 29
En 2007 La courbe du NDVI des échantillons de Sorgho de 2007 est cohérente en tant que cultute d été par rapport aux autres années, ce qui indique que le Sorgho a été bien séparé des cultures d hiver dans les parcelles de la PAC (ilôts dans lesquels sont présentes plusieurs cultures). Maïs 2006/2007/2008 Tournesol 2006/2007/2008 20-avr. 30-mai 8-juin ndvi 19-juin 29-juin 2-juil. 8-juil. 17-juil. 31-juil. 10-août 21-août 6-sept. 9-sept. 25-sept. ndvi 6-oct. mais 2006 mais 2007 mais 2008 13-oct. 26-oct. 2-nov. 20-avr. 30-mai 8-juin 19-juin 29-juin 2-juil. 8-juil. 17-juil. 31-juil. 10-août 21-août 6-sept. 9-sept. 25-sept. 6-oct. 13-oct. 26-oct. tournesol 2006 tournesol 2007 tournesol 2008 2-nov. Sorgho 2006/2007/2008 Soja 2006/2007/2008 20-avr. 30-mai 8-juin 19-juin 29-juin 2-juil. 8-juil. 17-juil. 31-juil. 10-août 21-août 6-sept. 9-sept. ndvi 25-sept. 6-oct. 13-oct. 26-oct. 2-nov. ndvi Sorgho 06 Sorgho 07 Sorgho 08 20-avr. 30-mai 8-juin 19-juin 29-juin 2-juil. 8-juil. 17-juil. 31-juil. 10-août 21-août 6-sept. 9-sept. 25-sept. 6-oct. 13-oct. 26-oct. Soja 2006 Soja 2007 Soja 2008 2-nov. Figure 2.9 : Zoom sur le comportement du Mais, Soja, Sorgho.et du Tournesol en 2006, 2007 et 2008 (Valeurs moyennes des NDVI ) Les courbes montrent que les confusions sont très importantes entre le Sorgho et le Maïs, de façon moins importante avec le Tournesol. Ce qui corrobore les problèmes retrouvés dans la classification avec 50% des échantillons en apprentissage : 83% du Sorgho est classé en Maïs et 11% en Tournesol. Le Sorgho a un profil très proche de celui du Maïs : plateau entre août et septembre 07, avec un NDVI moins élevé pour 2007. Le début de croissance est comparable, mais, il s agit d une 30
moyenne, certains échantillons de Sorgho ont un profil identique à certains échantillons de Maïs. En 2008 L augmentation du NDVI pour le Sorgho est différente des autres cultures, le démarrage est plus tardif. Début juillet le NDVI du Sorgho est encore très faible (sol nu ou début de levée) alors que la phase de croissance du Maïs et du Tournesol est déjà entamée. Ce qui explique les meilleurs résultats trouvés en 2008 dans la classification. Le plateau observé de façon plus ou moins marquée en 2006 et 2007 est absent en 2008 tant pour le Maïs que pour le Sorgho. Le NDVI est très élevé pour le Tournesol. En juillet 07, le NDVI du Tournesol est moins élevé, il n y a pas de modifications pour le Maïs. Les profils (moyenne par classe) sont assez décalés. En 2006 Une fois le problème des confusions du Maïs réglé avec la nouvelle classe Maïs ensilage, les confusions restantes, les plus importantes, concernent les cultures d'été en particulier le Tournesol avec le Sorgho, Soja. Dans la classification, le Sorgho se mélange toujours un peu avec le Tournesol dans une moindre mesure qu en 2007. On a essayé d appliquer la même technique qu en 2007 : chercher des sous classes à partir des profils temporels. 1 iére méthode d obtention des sous classes : profil temporel des échantillons A partir de l observation des profils temporels du NDVI des échantillons, trois groupes distincts ont permis de créer trois sous classes, mais cela n a pas apporté d améliorations notables pour les confusions du sorgho dans la classification comme pour 2007. Sous classe PCC Tournesol (confusion) Maïs (confusion) Avec 3 groupes Sorgho 1 29.2% 62.63% 2.08% Sorgho II 2.29% 58.81% 36.18% Sorgho III 3.29% 94.72% 0% Avec 2 groupes Groupe A 39.78% 55.39% 1.68% Groupe B 2.29% 58.81% 36.18% Tableau 2.9 : sous classes de Sorgho avec les PPC 58.81 % et les confusions avec le Tournesol et le Maïs Une des difficultés est qu il y a très peu d'échantillons dans chaque groupe. Ainsi deux classes ont été regroupées 2 iéme méthode d obtention des sous classes : à partir d une classification non supervisée Une classification non supervisée a été réalisée avec les dates d été (juin à octobre), et un grand nombre de classes afin de séparer d éventuelles sous classes de Tournesol et de Sorgho (icmso06nonsup_ete_ndvi.cla). La réalisation d une matrice de correspondance entre la classification et les échantillons (rpg06_old24cl_v9.ech), permet de faire correspondre des classes de la classification non supervisée aux échantillons. La comparaison de cette classification avec les échantillons de Tournesol et de Sorgho, donne les classes dans lesquels ils se répartissent. Le Sorgho s est retrouvé réparti d abord en 3 classes majoritaires (23 échantillons au total), puis 2 sous classes, 2 d entre elles étant finalement très proches. Toutefois, ces classes ne correspondent pas aux groupes discriminés visuellement au moyen des courbes de profil. Le PCC n est pas 31
amélioré ne dépassant pas les 18% avec toujours les confusions avec le Tournesol et le Maïs. En résumé : Pour 2006, la création de sous classes n'arrange pas les confusions du Sorgho contrairement à 2007. Elles n ont donc pas été utilisées. Des fusions ont permis de pallier ce problème (chapitre 4). On peut déduire que le comportement du Sorgho est spécifique à l année 2007. Analyse des différentes courbes 2006, 2007, 2008 Les courbes de la figure 2.10 comparent des profils du NDVI 2006, 2007, 2008 pour les cultures d hiver et de printemps (Blé, Colza, Orge, Pois), pour les cultures d été ( Maïs, Tournesol, Sorgho, Soja) Les courbes (figure 2.11 et 2.12) présentent les profils des principales cultures de Blé, Colza, Maïs, Tournesol et Sorgho pour 2006, 2007, 2008. L axe des abcisses correpond à l echelle des dates. Suivant les années les dates ne sont pas identique. En 2008, les échantillons émanent des données collectées sur le terrain. Comme cela a déjà été énoncé l observation des courbes confirment la variation suivant les années et les dates saisonnières, de la croissance à la sénescence, souvent différentes d une année à l autre. Ceci complique l application de la méthode d interprétation automatique des classifications non supervisées mise au point, en ajoutant un degré d incertitude dans les résultats (voir ). D après l observation de l ensemble de ces courbes, et de celles du fascicule répertoriant tous les thèmes présent dans ce site (à consulter sur Stock 2), les meilleures dates pour discriminer : le Colza, avril est indispensable le Maïs ensilage dates de début septembre le Tournesol avec les canaux spectraux B2 et B3, pour les dates d été de début juillet jusqu à la récolte début octobre l Eucalyptus à partir du début de l automne D une façon générale les meilleures dates sont le mois d avril pour les cultures d hiver et de printemps, et la première moitié du mois d août pour les cultures d été. Le Sorgho, quelque soit les canaux spectraux et/ou temporels, a un profil très proche du Maïs. Ces observations seront vérifiées dans la classification. 2.4.2.1 LES INDICES Nous nommerons PIR le proche infra rouge, R la bande «rouge», V celle proche du «vert», B celle proche du «bleu» respectivement pour FORMOSAT b4, b3, b2, b1. La végétation L indice de végétation, le plus utilisé, est lié à l activité du couvert végétal, sensible à la quantité et la vigueur de la végétation : les pigments foliaires absorbent fortement le rayonnement dans le rouge (R) alors que le parenchyme lacuneux réfléchit une grande partie du rayonnement proche infrarouge (PIR). Ainsi en phase de développement d un couvert, la biomasse et les quantités de pigments augmentent, ce qui entraîne une hausse dans le proche infrarouge et une baisse dans le rouge. L inverse se produit en fin de cycle végétatif. Plusieurs indices, proportionnels à une activité chlorophyllienne active ont ainsi été mis au point parmi lesquels le plus connus est le NDVI : indice d'activité végétale appelé aussi indice de Tucker (en anglais, Normalized Difference Vegetation Index, abrév. NDVI) 32
NDVI = (PIR - R) / (PIR + R) dont les valeurs varient entre - 1 et + 1 La normalisation par la somme des 2 bandes tend à réduire effets d éclairement et de pente. Il permet ainsi une comparaison de la couverture végétale en relative indépendance du relief [Bariou et al, 1985 p511 ], mais il est sensible aux conditions atmosphériques. Cet indice nous a permis d améliorer la discrimination de certaines classes, principalement celles dont les valeurs sont faibles, comme l Eau, qui seront présentées dans la partie classification. En effet, les surfaces autres que la végétation ont des faibles valeurs dans les deux bandes : valeurs positives pour la végétation, valeurs proches de zéro pour les sols nus et valeurs négatives pour l eau. Il y en a bien d autres (TVI, VID ), mais ils n apportent pas plus d information pour notre cas. Il existe des indices de végétation avec compensation des effets de sol et des effets atmosphériques Indices de végétation corrigeant les effets atmosphériques Ces indices modifient le NDVI par des paramètres sensibles aux effets atmosphériques et certains compensent les deux effets (TSARVI). Citons en quelques uns : TVI, indice de végétation transformé : élimination des valeurs négatives, stabilisation de la variance TVI = racine de ( (PIR - R)/(PIR + R)+0.5 ) EVI, indice de végétation amélioré (Enhanced Vegetation Index) EVI =2.5 [(PIR - R) / (PIR + 6R - 7.5 B + 1)] ARVI (Atmospherically Resistant Vegetation Index) = (PIR - RB) / (PIR + RB) où RB = R - g(b - R) substitution du canal R par un canal hybride RB avec correction atmposphérique où g dépend de type d aérosols (valeur par défaut à 1) Indices de végétation avec compensation des effets de sol Ces indices sont le SAVI («soil-adjusted vegetation index»), le OSAVI («optimized soil-adjusted vegetation index»), le MSAVI («modified soil-adjusted vegetation index»), et le TSAVI («transformed soil-adjusted vegetation index») de même que les indices développés récemment MTV12 («modified triangular vegetation index») [C. Collet, R. Caloz]. Par exemple pour le SAVI (indice de végétation avec compensation des effets de sol) on ajoute au NDVI un paramètre L caractérisant le sol et son degré de couverture. SAVI = NDVI = (PIR - R) (1+L)/(PIR + R+L) L=1 pour une très faible densité de végétation L=0.5 pour une densité moyenne L=0.25 pour une forte densité Mais comme cela s applique à toute l image, dans notre ce n est pas très intéressant, sauf en compliquant énormément l application. Indice de stress hydrique (végétation) D autres indices donnent une indication sur le stress hydrique, mais ils nécessitent la présence d une bande MIR (TM, SPOT5) ou du thermique, donc inapplicable dans notre cas. Quelques exemples : Moisture Stress Index MSI = MIR / PIR 33
Normalized Difference Water Index NDWI = (R - MIR) / (R + MIR) Normalized Vegetation Moisture Index NVMI = (PIR MIR) / (PIR + MIR) Normalized Difference Thermal Index (NDTI) calculé avec les bandes du thermique Autres indices Pour la végétation d autres indices Indice de verdeur = V / (B+V+R) permet de différencier les classes d arbre des classes de bâti. Tasseled Cap, transformation orthogonale pour réduire la sensibilité à la contribution spectrale des sols, sans pouvoir l'éliminer complètement ; dans l espace orthogonal chaque axe devient porteur d'un indicateur décrivant l'état de la végétation, Autre indice de verdeur (greenness Végétation Index, GVI) issu de la transformation tasseled cap (Kauth and Thomas, 1976) GR4 = -b1(v) - b2(r) + b3(pir) +b4(pir) [Girard et Girard] Verdeur : différence entre les reflectances normalisées de la végétation dans l infrarouge et le visible servant à estimer la teneur en chlorophylle des végétaux (niveau de croissance d'une culture) Indice de jaunissement (yellowness YI) qui est un indice de flétrissement Nous ne les avons pas appliqués. Pour le sol L indice de brillance «prend en compte l'albédo des surfaces pour dissocier les couvertures végétalisées des étendues minérales des sols». Il traduit les changements de teintes des sols nus et des roches. Le passage des teintes sombres aux teintes claires s accompagne d une augmentation simultanée des valeurs radiométriques dans les deux canaux considérés PIR, R ou MIR. Cet indice varie de manière proportionnelle avec l'humidité et la rugosité du sol. Son calcul est la racine carrée de la somme des carrés du PIR et du R. L application principale est la pédologie. Cet indice donne la tendance générale de la courbe de réflectance, si elle a plutôt des fortes valeurs ou plutôt des faibles. Il est donc sensible au type de sol et à la végétation qui se développe dessus. Mais il dépend également fortement des ombres portées par le soleil, et donc de la saison. Il doit être utilisé en conséquence. Dans notre cas, cet indice a été calculé de façon à différencier plus aisément les cultures d'été des surfaces enherbées ; en effet, les cultures d'été ont une période de sol nu que les surfaces enherbées n'ont pas. Mais cela n a pas été concluant au regard des courbes de ces néo-canaux. Nous ne les avons donc pas utilisés dans la classification. Les tests ont été faits avec deux premières formules BSI (Brightness Soil Index) BSI = racine de (R² + PIR²) Il est sensible à la brillance du sol, reliée à son humidité et à la présence de sels en surface. Indice de brillance 2 = racine de (V 2 + R²) Indice de brillance 3 = racine de (V 2 + R² + PIR²) non testé Autres formulations : Normalized Difference Soil Index NDSI = (MIR - PIR) / (MIR + PIR) sensible à l humidité Qui est aussi appelé Normalized Vegetation Moisture Index NVMI (voir plus haut) 34
Indice de cuirasse IC = 3 * V - R - 100 Plus performant que l'indice de brillance pour différencier surfaces bâties et sols nus. Indice de couleur : b0= (R+V)/2 et (b0-b) / (b0+b) Normalement pour la reconnaissance des sols ferrugineux Dans notre cas, intéressant pour l Eau et le Bâti et les surfaces minérales, un peu le Colza. Mais au regard des résultats obtenus sur les courbes, l'indice n'a pas été utilisé dans les classifications. Indice de rougeur IR (Redness Index ou Indice ferrique) = (R - V)/(R +V) Ces indices sont fonction de la couleur des surfaces, c'est-à-dire si elle est plus rouge que verte. Il est surtout beaucoup plus sensible à la présence de matériaux de couleur rouge dans les sols (oxydes de fer) qu'à la végétation [ Escadafal R, Belghith A, Ben Moussa H.]. Ces deux indices ont été testés, ce dernier IR, paraissait le plus intéressant en termes de résultat des courbes spectrales pour différencier les cultures d'été et les surfaces enherbées, néanmoins avec les images de 2006, cela n a pas été concluant. Indice de Rougeur RIh, (teneur hématite) = R 2 /V 2, (Maderia 1992) Indice de coloration ICv = (R V)/2 Non testés Pour l eau (à titre d information) Indice de turbidité (Turbidity Index) Tl = R - PIR Indice pigmentaire Pl = V / R Indice de transparence (Clearness Index) Cl = V 2 / R [B. MOUGENOT et al] Cet indice permet de recenser la couverture d'un secteur par les algues jusqu'à une profondeur de 12m dans la zone infratidale (qualifie la zone côtière continuellement immergée et les espèces qui y vivent). Indice de texture Nous avons utilisé des images correspondant à un indice de texture : l hétérogénéité, obtenu par transformation locale, avec l écart type sur un voisinage 3*3 sur les canaux PIR. Ces néo-canaux n ont pas apporté d amélioration à la classification. Conclusion Les tests sur les indices n ont pas été faits systématiquement sur toutes les dates, comme avec B1, B2, B3, B4 et le NDVI, mes les premiers résultats n étant pas probant, nous n avons pas poursuivi, ce qui ne veut pas dire que cela serait intéressant de faire une étude exhaustive et plus complète. 35
NDVI 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 Profil temporel NDVI des cultures d'été en 2006 mais (grain et ensilage). tournesol. sorgho. soja. Mais ensilage (21 ech) Maïs grain (69 ech) 0,900 Profil temporel NDVI des cultures d'été en 2007 NDVI 0,800 0,700 0,600 0,500 0,400 0,300 0,200 0,100 0,000 23-févr. 20-avr. 30-mai 30-juin 7-juil. 4-août 11-août 8-sept. 15-sept. 13-oct. mais 2007 tournesol 2007 Soja 2007 Sorgho 07 Profil temporel NDVI des cultures d'été en 2008 NDVI 0,900 0,800 0,700 0,600 0,500 0,400 0,300 0,200 0,100 0,000 2-févr. 19-juin 7-juil. 31-juil. 21-août 25-sept. 6-oct. 10-oct. 26-oct. mais 2008 tournesol 2008 Soja 2008 Sorgho 08 Figure 2.10 : Profils temporels des cultures d été 2006, 2007, 2008 (NDVI) 36
0,8 Profil temporel NDVI des cultures d'hiver et de printemps en 2006 0,7 0,6 0,5 NDVI 0,4 0,3 0,2 0,1 0 ble. colza. orge. pois. Figure 2.11 : Exemple de profils temporels des cultures d hiver et de printemps de 2006 (NDVI) ndvi 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 Blé 2006/2007/2008 2-févr. 6-févr. 17-févr. 23-févr. 14-mars 20-avr. 27-mai 30-mai 5-juin 8-juin 14-juin 19-juin 23-juin 29-juin 30-juin 2-juil. 7-juil. 8-juil. 14-juil. ble 2006 ble 2007 ble 2008 17-juil. 20-juil. 31-juil. ndvi 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 Colza 2006/2007/2008 2-févr. 6-févr. 17-févr. 23-févr. 14-mars 20-avr. 27-mai 30-mai 5-juin 8-juin 14-juin 19-juin 23-juin 29-juin 30-juin 2-juil. 7-juil. 8-juil. 14-juil. 17-juil. 20-juil. 31-juil. colza 2006 colza 2007 colza 2008 Figure 2.12 : Exemple de profils temporels des cultures d hiver de 2006, 2007, 2008 (NDVI) 37
500 Maïs Moyenne des réflectances 400 300 200 100 0 11-févr. 17-févr. 23-févr. 14-mars 20-avr. 2-mai 27-mai 30-mai 5-juin 8-juin 14-juin 19-juin 23-juin 29-juin 30-juin 2-juil. 7-juil. 8-juil. 10-juil. 14-juil. 17-juil. 20-juil. 31-juil. 4-août 10-août 11-août 21-août 31-août 6-sept. 8-sept. 9-sept. 15-sept. 25-sept. 27-sept. 6-oct. 10-oct. 13-oct. 15-oct. 26-oct. 30-oct. 2-nov. 5-nov. 14-nov. 23-nov. B1 2006 B2 2006 B3 2006 B4 2006 B1 2007 B2 2007 B3 2007 B4 2007 B1 2008 B2 2008 B3 2008 B4 2008 500 Sorgho Moyenne des réflectances 400 300 200 100 0 11-févr. 17-févr. 23-févr. 14-mars 20-avr. 2-mai 27-mai 30-mai 5-juin 8-juin 14-juin 19-juin 23-juin 29-juin 30-juin 2-juil. 7-juil. 8-juil. 10-juil. 14-juil. 17-juil. 20-juil. 31-juil. 4-août 10-août 11-août 21-août 31-août 6-sept. 8-sept. 9-sept. 15-sept. 25-sept. 27-sept. 6-oct. 10-oct. 13-oct. 15-oct. 26-oct. 30-oct. 2-nov. 5-nov. 14-nov. 23-nov. B1 2006 B2 2006 B3 2006 B4 2006 B1 2007 B2 2007 B3 2007 B4 2007 B1 2008 B2 2008 B3 2008 B4 2008 500 Tournesol Moyenne des réflectances 400 300 200 100 0 11-févr. 17-févr. 23-févr. 14-mars 20-avr. 2-mai 27-mai 30-mai 5-juin 8-juin 14-juin 19-juin 23-juin 29-juin 30-juin 2-juil. 7-juil. 8-juil. 10-juil. 14-juil. 17-juil. 20-juil. 31-juil. 4-août 10-août 11-août 21-août 31-août 6-sept. 8-sept. 9-sept. 15-sept. 25-sept. 27-sept. 6-oct. 10-oct. 13-oct. 15-oct. 26-oct. 30-oct. 2-nov. 5-nov. 14-nov. 23-nov. B1 2006 B2 2006 B3 2006 B1 2006 B2 2006 B3 2006 B2 2007 B3 2007 Figure 2.13 : Profils temporels de cultures d été 2006, 2007, 2008 avec B1, B2, B3, B4 38
500 450 400 350 300 250 200 150 100 50 0 11-févr. 17-févr. 23-févr. 14-mars 20-avr. 2-mai 27-mai 30-mai 5-juin 8-juin 14-juin 19-juin 23-juin 29-juin 30-juin 2-juil. 7-juil. 8-juil. 10-juil. 14-juil. 17-juil. 20-juil. 31-juil. 4-août 10-août 11-août 21-août 31-août 6-sept. 8-sept. 9-sept. 15-sept. 25-sept. 27-sept. 6-oct. 10-oct. 13-oct. 15-oct. 26-oct. 30-oct. 2-nov. 5-nov. 14-nov. 23-nov. Moyenne des réflectances Blé B1 2006 B2 2006 B3 2006 B4 2006 B1 2007 B2 2007 B3 2007 B4 2007 B1 2008 B2 2008 B3 2008 B4 2008 Moyenne des réflectances 500 400 300 200 100 0 Colza 11-févr. 17-févr. 23-févr. 14-mars 20-avr. 2-mai 27-mai 30-mai 5-juin 8-juin 14-juin 19-juin 23-juin 29-juin 30-juin 2-juil. 7-juil. 8-juil. 10-juil. 14-juil. 17-juil. 20-juil. 31-juil. 4-août 10-août 11-août 21-août 31-août 6-sept. 8-sept. 9-sept. 15-sept. 25-sept. 27-sept. 6-oct. 10-oct. 13-oct. 15-oct. 26-oct. 30-oct. 2-nov. 5-nov. 14-nov. 23-nov. B1 2006 B2 2006 B3 2006 B4 2006 B1 2007 B2 2007 B3 2007 B4 2007 B1 2008 B2 2008 B3 2008 B4 2008 Figure 2.14 : Profils temporels des cultures d hiver 2006, 2007, 2008 avec B1, B2, B3, B4 et NDVI pour le Blé et Colza Les dates de juin à septembre très rapprochées montent l évolution des différentes cultures dété. Il est à noter qu avec les dates de début septembre on peut voir le Mais ensilage qui est récolté, alors qu aux dates précédentes, on ne pouvait le distinguer ces deux types de Maïs. Ceci est confirmé par les matrices de confusion. 39
En résumé La sélection des échantillons est déterminante et délicate pour obtenir une classification satisfaisante. Suivant les années les profils temporels des cultures sont variables Une telle superficie d étude engendre une grande variabilité des réponses, pour une même classe, due à la situation topographique et aux climats locaux (zones de plaines, de vallées, de coteaux, de piémont ) L exemple du Sorgho a permis de montrer qu une classe ayant peu d échantillons, mais qui présente un taux de variabilité important, est préjudiciable pour la mesure de validation de la classification avec la matrice de confusion. Les résultats sont très différents suivant que les tests sont réalisés sur l échantillonnage total, ou une partie des échantillons le choix des sous classes n est pas forcément le même d une année à l autre, celui-ci dépend des conditions de semis, climatique ; il donc difficile de reproduire d une année à l autre la même démarche. Dans le cas des vérités terrain, le seuil de segmentation doit être choisi avec minutie pour créer la collection d échantillons à l échelle du parcellaire, il est parfois nécessaire de considérer les polygones au cas par cas. L érosion des échantillons est un facteur important qui peut modifier la classification. Une érosion trop faible des échantillons peut prendre en compte par exemple les bordures de champs, les lisières de forêts, qui ne sont pas représentatives de la classe et entraînent une hétérogénéité trop importante des réponses. A l inverse, une érosion trop forte restreint l hétérogénéité offerte par la classe, par exemple pour les prairies qui ne sont pas forcément uniformes sur une même parcelle. Avril est indispensable pour discriminer le Colza, le Maïs ensilage est bien reconnu début septembre, l Eucalyptus à partir de début de l automne. Pour le Tournesol, les canaux spectraux B2 et B3 sont importants. Divers indices (hors NDVI) brillance, rougeur, texture ont été étudiés, mais leur utilisation n a pas été concluante. 40
3- ANALYSE DES IMAGES 2006 2007-2008 3.1- Analyse des images Formosat 2006 3.1.1 - Introduction Le diagramme ombrothermique (figure 3.1) regroupe les caractéristiques de la température moyenne, la pluviométrie et l évapotranspiration pour la zone sur l année 2006. Quand la courbe de la température passe au dessus de celle de la pluviométrie, le bilan en eau pour la culture est négatif (elle cède plus qu elle reçoit), il y a stress hydrique. Toulouse-Blagnac 2006 source Autan, METEO-France 100 90 80 70 60 50 40 30 20 10 0 janv- 06 févr- 06 mars- 06 avr- 06 mai- 06 juin- 06 juil- 06 août- 06 sept- 06 oct- 06 nov- 06 déc- 06 200 180 160 140 120 100 80 60 40 20 0 T, C P, mm E.T.P., mm Figure 3.1 : diagramme ombrothermique Toulouse 3.1.2 - Les étapes des traitements Les traitements ont été faits en 5 étapes : d abord avec les 5 images jusqu au mois de mai (6 février, 17 février, 14 mars, 2 mai, 27 mai) en ne conservant que les images sans ou avec très peu de nuages. trois autres images de juin viennent compléter la liste (5, 14, 29 juin), ces dernières images sont fournies en réflectance c'est-à-dire qu elles ont subi une correction atmosphérique par rapport aux précédentes (orthorectifiées et corrigées des effets atmosphériques par le CNES (16bits, entier court signé)). 41
puis s ajoute la série jusqu en septembre avec laquelle a été faite la première classification aboutie. Les dernières dates jusqu à novembre ont servi à compléter les signatures spectrales et faire l étude sur la période d automne. Les traitements ayant été fait par tranche, cela a compliqué cette étude. En 2009 les travaux ont été recommencés et réalisés avec la PAC graphique. Sur 48 dates 24 ont été utilisée pour l analyse des réponses spectrales, 17 dans la classification et l étude de la discrimination des classes avec les différentes combinaisons. Signatures spectrales avec : 6/02, 17/02, 14/3, 2/5, 27/5, 8/6 14/6 23/6, 29/6, 2/7, 8/7 14/7, 17/7, 20/7, 10/8, 31/8, 6/9, 9/9, 27/9, 15/10, 30/10, 2/11 (couverture nuageuse réduite) Pour l étude de la discrimination des classes avec les différentes combinaisons : 17/02, 14/03, 02/05, 27/05, 05/06, 08/06, 14/06, 23/06, 29/06, 02/07, 08/07, 14/07, 17/07, 20/07 10/08, 31/08, 06/09, 09/09. - Pour cette étude des échantillons sous les nuages ont dû être supprimés pour les dates suivantes : 06/02, 17/02, 02/05, 08/06. - Pour les dernières dates rajoutées d automne 27/09, 151/0, 30/10, 02/11, 05/11 (dates en Toa), on a dû refaire la même procédure de préparation des données qu au départ, et la taille initiale de ces images (4500 * 4000) a été gardée. Précédemment la partie inutile qui entoure les images avait été enlevée, ainsi la taille de l image raster des échantillons est différente (4008 *3666). - Pour l image du 10/15 une dizaine d échantillons sous les nuages ont dû être supprimés. Pour la classification : 14/03, 02/05, 27/05, 05/06, 14/06, 23/06, 02/07, 08/07, 14/07, 10/08, 31/08, 06/09, 09/09 Puis: 14/03, 02/05, 27/05, 05/06, 14/06, 23/06, 29/06, 02/07, 08/07, 14/07, 17/07, 07/20, 10/08, 31/08, 06/09, 09/09, 30/10 Pour la segmentation seulement 10 dates ont été choisies. 3.1.2.1 ETUDE DES REPONSES SPECTRALES L évolution des réponses spectrales est étudiée à partir des valeurs moyennes des réflectances associées à une classe, sur toute la durée des mesures, présenté sous forme de graphe. Elle permet de déterminer diverses propriétés des cultures et connaître ainsi le cycle des cultures. La végétation est composée de chlorophylle, pigment absorbant dans le rouge et le bleu et réflectant dans le vert (cette réflectance est constante) et le PIR. Une réflectance en B1 (bleu) et B3 (rouge) faible, correspond à un couvert végétal dense (absorption importante dans ces longueurs d ondes). Lorsque la végétation est peu couvrante, sa réponse spectrale est affectée par la réflectance du sol. On aura alors dans le rouge, une réflectance plus importante que dans le vert (voir figure de gauche) ce qui s explique par la différence entre les courbes de réflectances de la végétation et celle du sol. Dans le visible, la réflectance du sol croît avec la longueur d onde et varie en fonction de sa nature (humide, argileux, sec). Dans le proche infrarouge, l absorption des pigments est faible. La structure interne du feuillage et l arrangement des cellules sont responsables d une multitude de réflexion qui induit à B4 des réflectances fortes pour la végétation. Le moyen infrarouge (XS4 pour Spot) témoigne de la teneur en eau des végétaux. L évolution temporelle des courbes de réflectance informe donc sur les différentes étapes de la vie d une culture. Il est alors possible de déterminer quand celle-ci est en sol nu, en croissance, en sénescence ou récoltée. A titre d exemple considérons le cas du Maïs. Ces graphes existent pour toutes les cultures. 42
Cas du Maïs Les réponses spectrales de la figure 3.2 permettent de voir l état de croissance du Maïs, présenté dans le tableau 3.1, visualisé sur des imagettes aux différentes dates.(figure 3.3). Végétation composée de chlorophylle Absorbant dans le bleu et le rouge : réflectance en B1 et B3 faible couvert végétal dense Réflectant dans le vert et le PIR Végétation peu couvrante réponse spectrale affectée par celle du sol Signature spectrale 2006 du maïs 450 400 350 300 Réflectance 250 200 150 100 50 0 B1 B2 B3 B4 B1 B2 B3 B4 B1 B2 B3 B4 B1 B2 B3 B4 B1 B2 B3 B4 B1 B2 B3 B4 B1 B2 B3 B4 B1 B2 B3 B4 B1 B2 B3 B4 B1 B2 B3 B4 B1 B2 B3 B4 B1 B2 B3 B4 B1 B2 B3 B4 B1 B2 B3 B4 B1 B2 B3 B4 B1 B2 B3 B4 B1 B2 B3 B4 B1 B2 B3 B4 B1 B2 B3 B4 B1 B2 B3 B4 B1 B2 B3 B4 B1 B2 B3 B4 B1 B2 B3 B4 B1 B2 B3 B4 06-fev 17-fev 14- mars 2 mai 27-mai 05-juin 08-juin 14-juin 23-juin 29-juin 02-juil 08-juil 14-juil 17-juil 20-juil 10- août 31- août 06- sept 09- sept 27- sept 15-oct 30-oct 02-nov 05- nov Figure 3.2 : évolution des réponses spectrales du Maïs 14/03/2006 Inter cultures Courbe caractéristique d un sol nu. Le sol est couvert de chaumes 08/06/2006 Préparation de terres Réflectances plus élevées car le sol est travaillé : il est lisse Prêt pour le semis 23/06/2006 Croissance Le recouvrement du sol augmente. On remarque une absorption dans le rouge plus importante. Le sol est recouvert à environ 50%. 29/06/2006 Croissance On note une forte absorption dans le rouge qui témoigne d une forte activité végétale. Le recouvrement est d environ 80%. 02/07/2006 Croissance Le recouvrement est maximal. A partir de cette période, le maïs arrête sa croissance et rentre en floraison jusqu à fin août où l irrigation est arrêtée. 06/09/ 2006 Sénescence Le couvert végétal absorbe de moins en moins le rouge ce qui nous renseigne sur le début de la sénescence. Le maïs sera récolté à la fin du mois. Tableau 3.1 : description de la croissance de Maïs 43
14/03/2006 08/06/2006 23/06/2006 29/06/2006 14/07/2006 06/09/2006 2/11/2006 Classification Figure 3.3 : visualisation des stades phénologiques du maïs (en orange dans la classification) avec Formosat, près de la commune de St Hilaire au sud de Muret (Château le Galand, avec le parc de résineux rectangulaire au centre), bâti en rose 3.1.2.2 SIGNATURES TEMPORELLES ET EFFET DE L IRRIGATION A partir d une parcelle irriguée (parcelle 295, figure 3.4), on peut voir que dans cette parcelle, le Maïs a été semé plus tardivement (retard de croissance par rapport à l échantillon moyen). Des début juillet, il n y a plus de différence significative entre les deux. En proche infra rouge on a une baisse de la redescente des valeurs de reflectance, pour cause d humidité au 23/06, date de l irrigation, ce qui montre que l on peut suivre les périodes d irrigation. Avec le NDVI, cet effet n est pas visible, la pente de la courbe continue a croître, donc aucun il n y a effet direct observable sur le NDVI (figure 3.5). NDVI = PIR PIR + Rouge Rouge, soit avec FORMOSAT : NDVI = B4 B4 + B3 B3 44
6/02/2006 soja 06/02/06 295 maïs FORMOSAT Ech Maïs: suivi temporel phase de développement 27/05/06; 5/06/ 14/06 23/06 29/06/06; 2/07 8/07 14/07 20/07/06; 10/08 31/08/06; 3/09 9/09/06 450 400 350 17/07 Réflectance *10-3 300 250 200 5/06 23/06 2/07 150 100 50 0 27/05/2006 06/06/2006 16/06/2006 26/06/2006 06/07/2006 16/07/2006 26/07/2006 05/08/2006 15/08/2006 25/08/2006 04/09/2006 B4 295 B3 295 B2 295 B1 295 Ech Maïs B1moyenne Ech Maïs B2 moyenne Ech Maïs B3 moyenne Ech Maïs B4 moyenne 27/05 5/06 23/06 2/07 17/07 Figure 3.4 : comparaison des courbe temporelles d une parcelle de Maïs irrigué et avec un échantillon «moyen» 45
1 Légère baisse palier plateau 23/06 2/07 17/07 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 27/05/2006 03/06/2006 10/06/2006 17/06/2006 24/06/2006 01/07/2006 08/07/2006 15/07/2006 22/07/2006 29/07/2006 05/08/2006 12/08/2006 19/08/2006 26/08/2006 02/09/2006 09/09/2006 Maïs 295 Maïs Ech moyen Figure 3.5 : courbe du NDVI comparaison d une parcelle de Maïs irrigué et avec un échantillon moyen, irrigation : aucun effet direct observable sur le NDVI Suivi temporel Les séries temporelles complètes et mensuelles montrent l intérêt de la grande répétitivité. On peut ainsi détecter des événements importants concernant le fonctionnement de la plante. Dans la figure 3.6, on peut voir que lorsque l on a des dates mensuelles, la chute de la valeur montrée précédemment ne se voit pas. 400 400 350 350 300 300 Réflectance *10-3 250 200 SEMIS Recouvrement 0 100% 250 200 150 150 100 6/2 14/3 2/5 5/6 8/7 10/8 9/9 100 B4 Maïs mensuelle B4 Maïs série complète Figure 3.6 : réflectance dans le canal B4 (PIR) du Maïs Les courbes des réflectances des cultures d hiver (figure 3.7) montrent que les données FORMOSAT sont adaptées aux travaux sur les agrosystèmes, ce qui permet, en particulier, leur utilisation dans les modèles de fonctionnement. 46
500 450 400 350 Réflectance 10-3 300 250 200 150 100 50 0 06/02/06 21/02/06 08/03/06 23/03/06 07/04/06 22/04/06 07/05/06 22/05/06 06/06/06 21/06/06 06/07/06 21/07/06 05/08/06 20/08/06 04/09/06 B1; Blé B1; colza B1;orge B1;maïs B2; Blé B2;colza B2;orge B2;maïs B3; Blé B3; colza B3; orge B3;maïs B4; Blé B4; Colza B4; orge B4; maïs Figure 3.7 : suivi temporel, réflectances des cultures d hiver 3.2 Mesure de la qualité de discrimination des canaux spectraux et temporels - évolution spectrale et temporelle Chaque canal, chaque date n a pas le même pouvoir discriminant pour chaque culture. La lecture des signatures spectrales et des profils temporels donne une indication sur ce sujet. Le résultat de la classification, permet d obtenir le plan d occupation du sol. Mais, elle est aussi utilisée comme mesure de la qualité discriminatoire des bandes spectrales et temporelles des images. Le pouvoir discriminant des différentes combinaisons est mesuré par les matrices de confusion sur la base de l échantillonnage témoin. La précision globale de la classification est donnée par la Moyenne des Pourcentages des Pixels Correctement Classés (MPCC) et par le Kappa (estimateur de qualité qui tient compte des erreurs en lignes et en colonnes). Dans cette étude, nous nous intéressons surtout à la séparabilité des classes, ainsi, nous donnerons en général le MPCC. La méthodologie présentée au travers des exemples ci-après, est reproductible et a été appliquée dans un grand nombre de cas Les résultats globaux des matrices de confusion nous renseignent sur la qualité discriminatoire des différentes de dates. Ils sont analysés de façon globale, puis pour les principales cultures. 47
3.2.1 Recherche des meilleures dates discriminatoires : Création automatique des matrices de confusions de toutes les combinaisons de dates les pourcentages de bien classés (MPCC) sont donnés avec une seule date, puis en ajoutant chaque fois les dates. Ceci est fait tout d abord de manière globale, puis pour certaines cultures : le Blé, le Maïs, le Colza et le Tournesol. Un module de TITE permet de réaliser des matrices de confusion pour toutes les combinaisons de dates possibles, et permettant de choisir les meilleures combinaisons sur toutes les dates. sur 10 dates sur 19 dates 1023 combinaisons 524 287 combinaisons Pour 2006 la série chronologique étudiée est de 19 dates au départ, puis réduit à 18 dates en raison des défauts de la date du 06/02, ce qui fait un très grand nombre de données à gérer. Rappel : matrice de confusion, MPCC, Kappa La qualité de la classification est estimée par le biais de ces matrices de confusion, qui indiquent, pour chaque classe, les confusions apparues lors du processus de classification : a priori sur les échantillons d apprentissage et a posteriori sur les échantillons de vérification. La matrice de confusion offre une mesure quantitative de la qualité de l échantillonnage et de la séparabilité des classes. Les éléments diagonaux de la matrice représentent le pourcentage de pixels de la classe i, ayant effectivement été affectés à celle-ci, après classification (PCC (i,i) pourcentage de pixels correctement classés de la classe i). Les éléments non diagonaux Mc (i, j) correspondent le pourcentage de pixels de la classe i du référentiel (échantillons) ayant été affecté à la classe j dans l image classée. La moyenne de pixels correctement classés (overall accuracy) est également calculée ainsi que le coefficient Kappa (noté K). MPCC = 1/n Σ PCC (i, i) où n est le nombre de classes i=1 n n N Σ Mc(i,i) - Σ m.i m i. i =1 i =1 K = n N² - Σ m.i m i. i =1 où N est le nombre total de points. Ce coefficient a l'avantage de considérer tous les éléments de la matrice de confusion. Le PCC moyen (MPCC), overall accurracy en anglais, correspond à une mesure de la séparabilité des classes en fonction des divers canaux. Le coefficient Kappa est plutôt un estimateur de la précision d une classification qui tient compte des erreurs en ligne et en colonne (Congalton, 1991). Il permet une évaluation globale mais aussi au niveau de chaque classe. Il donne, de ce fait, une estimation plus précise de la qualité de la classification. 48
3.2.2 Meilleurs canaux pour la discrimination des classes : Pourcentages de biens classés globaux Nous donnerons ici quelques exemples, qui montrent que suivant les échantillons les meilleures combinaisons ne sont pas toujours les mêmes. Ces résultats prouvent bien qu avoir un résultat de classification supervisée excellent n est pas chose immédiate et que ces résultats sont très dépendants de l échantillonnage. Les résultats dans les graphiques ci-après donnent les pourcentages de bien classés globaux MPCC (overall accuracy en anglais) et le Kappa (voir précédent) avec diverses combinaisons : avec une seule date, puis avec les dates ajoutées chronologiquement. Ils sont présentés à partir de l échantillonnage complet, de l échantillonnage d apprentissage obtenu avec la moitié du jeu d échantillons complet, avec les échantillons de vérification (l autre moitié des échantillons). Les résultats les plus corrects statistiquement parlant, sont avec la vérification sur un jeu différent de l apprentissage. Toutefois, pour obtenir une classification plus précise, on utilise le jeu d échantillons complets pour l apprentissage. Des graphiques de PCC par type de cultures sont également donnés. Les graphiques de 2006 et 2007 sont obtenus à partir du RPG, et sont donnés également avec les échantillons issus des vérités terrain. 2008 est donné avec les vérités terrain. Un récapitulatif des résultats est donné en fin de ce paragraphe. 3.2.2.1 AVEC UNE SEULE DATE données 2006 Echantillons avec le RPG 80 Pourcentage moyen de pixels classés par date en 2006 Pourcentage de pixels bien classés 70 60 50 40 30 MPCC complet MPCC apprentissage MPCC verification MPCC RPG échantillons : 14-mars 02-mai 05-juin 14-juin 23-juin 29-juin 02-juil 08-juil 14-juil complet 55.41 55.23 53.26 54.16 52.20 52.55 53.77 52.95 54.90 apprentissage 57.23 59.11 54.82 56.5 53.42 54.45 55.23 54.52 56.29 vérification 51.08 48.98 49.02 48.43 48.54 47.67 46.9 50.05 52.21 MPCC échantillons : 17-juil 20-juil 10-août 31-août 06-sept 09-sept 27-sept 30-oct complet 55.22 55.89 54.50 51.61 51.72 49.95 47.56 45.39 apprentissage 55.96 56.48 54.49 52.47 53.66 51.96 52.21 48.36 vérification 52.02 52.37 50.05 46.76 44.98 44.15 42.24 52.37 49
Kappa échantillons 14-mars 02-mai 05-juin 14-juin 23-juin 29-juin 02-juil 08-juil 14 juil complet 34.58 36.43 32.02 33.34 45.26 46.25 45.03 43.98 44.77 apprentissage 36.09 38.85 33.09 35.7 45.2 47.16 45.13 44.53 44.26 vérification 30.71 32.88 28.44 27.59 44.53 43.42 39.87 42.33 41.52 Kappa échantillons 17 juil 20-juil 10-août 31-août 06-sept 09-sept 27-sept 30-oct complet 47.69 44.84 39.1 31.75 27.63 27.14 23.92 20.55 apprentissage 46.83 45.7 38.93 32.31 29.11 28.19 26.38 25.51 vérifications 40.88 34.41 27.11 23.83 23.61 20.88 40.88 17.92 Echantillons avec les vérités terrain 80 Pourcentage moyen de pixels bien classés par date - 2006 s s é cla n ie b e ls ix p s e d g e ta n e rc u o P 75 70 65 60 55 50 45 40 Vérité terrain : échantillon complet 17/02 14/03 02/05 27/05 05/06 08/06 14/06 23/06 29/06 MPCC 62.77 65.75 59.05 61.82 63.09 63.3 65.07 62.61 64.36 Kappa 56.49 59.10 49.52 43.56 49.64 51.47 56.03 61.69 64.17 dates 02/07 08/07 14/07 17/07 20/07 10/08 31/08 06/09 09/09 MPCC 63.07 61.85 65.34 64.57 63.33 63.71 60.51 58.50 57.07 Kappa 61.45 60.45 61.55 61.61 55.24 51.71 50.07 47.00 44.87 Pourcentage de biens classés par cultures (RPG) Pourcentage de pixels bien classés 100 80 60 40 20 0 Poucentage des pixels bien classés cultures d'hiver en 2006 ble complet ble verification colza complet colza verification orge complet orge verification pois complet pois verification 50
Pourcentage de pixels bien classés 100 90 80 70 60 50 40 30 20 10 0 Poucentage des pixels bien classés cultures d'été en 2006 mais complet mais verification tournesol complet tournesol verification sorgho complet sorgho verification soja complet soja verification données 2007 Echantillons avec le RPG Pourcentage de pixels bien classés 80 70 60 50 40 30 Pourcentage moyen de pixels classés par date en 2007 23 févr 20 avril 30 mai 30 juin 7 juil 4 août 11 août 08-Sep 15-Sep 13-Oct MPCC complet MPCC apprentissage MPCC verification 51
Echantillons avec les vérités terrain Pourcentage moyen de pixels bien classés par date - 2007 100 s é s c la n b ie 90 ls p i x e e s d e g ta e n u r c o P 80 70 60 50 40 échantillons d'apprentissage échantillons vérifications échantillons d'apprentissage + vérifications vérité terrain, échantillons : 23 février 20 avril 30 mai 30 juin 7 juillet 4 août 11 août 8 septembre 15 septembre MPCC complet 68.70 68.80 65.40 63.32 62.84 66.22 64.48 60.95 59.10 MPCC apprentissage 68.46 71.02 68.62 65.68 64.06 68.08 65.93 62.75 61.57 MPCC vérification 64.22 59.07 54.90 52.86 51.82 57.38 56.77 52.72 48.99 Kappa complet 58.79 57.37 53.07 51.83 57.28 59.15 55.87 42.59 42.48 Kappa apprentissage 59.98 58.39 56.19 54.99 58.90 60.35 54.94 46.90 46.74 Kappa vérification 56.92 54.84 51.00 41.33 47.68 50.02 46.62 35.57 34.70 Pourcentage de biens classés par cultures (RPG) Pourcentage de pixels bien classés 100 90 80 70 60 50 40 30 20 10 0 Poucentage des pixels bien classés cultures d'hiver en 2007 23 fev 20 avr 30 mai 30 juin 7 juil 4 août 11 août 08-sept 15-sept 13-oct ble complet ble verification colza complet colza verification orge complet orge verification pois complet pois verification 52
Pourcentage de pixels bien classés 90 80 70 60 50 40 30 20 10 0 Poucentage des pixels bien classés cultures d'été 2007 23 fev 20 avr 30 mai 30 juin 7 juil 4 août 11 août 08-Sep 15-Sep 13-Oct mais non irrigue complet mais non irrigue verification tournesol complet tournesol verification sorgho I complet sorgho I verification soja complet soja verification pourcentage de pixels bien classés 100 90 80 70 60 50 40 30 20 10 0 Poucentage des pixels bien classés bois 2007 23 fev 20 avr 30 mai 30 juin 7 juil 4 août 11 août 08-Sep 15-Sep 13-Oct feuillus. résineux. eucalyptus. peupliers. friche. 53
données 2008 avec les vérités terrain Pourcentage de pixels bien classés 80 70 60 50 40 30 Pourcentage moyen de pixels classés par date en 2008 11 fevr 19 juin 10 juil 31 juil 21 août 25-Sep 06-Oct 10-Oct 26-Oct MPCC complet MPCC apprentissage MPCC verification MPCC échantillons : 11 févr. 19 juin 10 juil. 31 juil. 21 août 25 sept 6 oct. 10 oct. 26 oct. complet 56.40 56.51 63.56 65.31 67.70 61.35 58.77 58.56 56.77 apprentissage 61.1 68.54 69.79 68.47 71.94 67.36 64.46 63.9 62.19 verification 44.87 54.75 49.31 57.28 59.81 50.65 46.89 49.69 47.64 Kappa échantillons : 11 févr. 19 juin 10 juil. 31 juil. 21 août 25 sept 6 oct. 10 oct. 26 oct. complet 46.01 56.51 57.53 67.60 63.87 43.60 43.18 44.90 44.14 apprentissage 53.17 62.92 66.06 71.4 68.37 51.9 50.28 51.44 51.51 verification 32.1 43.42 40.96 56.72 51.95 34.27 31.55 34.81 35.13 Analyse des courbes avec une seule date Comme toujours le MPCC sur l apprentissage donne les meilleurs résultats, la vérification étant faite sur les échantillons qui ont servi pour les calculs statistiques dans la classification. Le MPCC à partir des échantillons de vérification est plus faible. Toutefois, ce dernier devrait être le plus représentatif. Les résultats sont meilleurs avec les vérités terrain qu avec le RPG, les échantillons étaient moins nombreux plus ciblés, avec une variabilité moindre. Toutefois, lorsque par la suite la classification a été comparée au RPG, la matrice de confusion a présenté beaucoup de confusions avec l Orge (peu d échantillons au départ), avec le Sorgo, le Soja, absorbés par le Tournesol, qui est surreprésenté. Ceci montre la dépendance des échantillons sur le résultat de la classification. On peut observer que les dates d été, si elles sont seules, donnent les meilleurs résultats ; pour 2007 c est la date du 20 avril, ce qui confirme les conclusions du chapitre précédent sur les signatures temporelles. Les pourcentages de bien classés par culture montrent leur décroissance dès mi juillet pour les cultures d été, et leur croissance début août pour les cultures d hiver. Toutefois, si les classes sont mieux classées à certaines dates, cela n est qu à titre indicatif car, il faut considérer également les sur classements : une classe peut avoir un pourcentage élevé de bien classés, mais se substituer à d autres classes. Ceux-ci sont également donnés par le logiciel qui calcule toutes les combinaisons. Nous ne les avons pas présentés pour éviter trop de surcharge dans ce document. 54
3.2.2.2 MEILLEURS COMBINAISONS AVEC SUCCESSIVEMENT 2 DATES, 3 DATES, 4 DATES données 2006 Meilleures combinaisons de 2 dates 06 14/03, 14/07 14/03, 29/06 14/03, 02/07 14/03, 17/07 17/02, 14/07 MPCC vérité terrain échantillons complet 81.58 81.17 80.91 80.88 80.78 06/09, 02/05 20/07,14/03 31/08,02/05 09/09,02/05 20/07,02/05 MPCC RPG échantillons complet 72.32 72.27 72.15 72.09 72.08 10/08, 14/03 29/06,14/03 20/07,14/03 23/06,14/03 31/08,14/03 MPCC RPG échantillons vérification 64.52 63.61 63.26 63.04 63 Meilleures combinaisons de 3 dates 06 06/09, 29/06, 14/03 09/09, 29/06, 14/03 06/09, 14/07, 14/03 06/09, 20/07, 14/03 MPCC vérité terrain - échantillons complet 87.53 87.35 87.35 87.32 87.28 06/09, 29/06, 09/09, 29/06, 06/09, 14/07, 06/09, 20/07, MPCC RPG échantillons complet 14/03 14/03 4/03 14/07 80.58 80.42 80.39 80.38 80.36 31/08, 23/06, 06/09, 20/07, 06/09, 08/07, 31/08, 29/06, MPCC RPG échantillons de vérification 14/03 14/03 14/03 14/03 70.55 70.45 70.09 70.07 70.03 Meilleures combinaisons de 4 dates 06 02/05, 08/06 23/06, 10/08 14/03, 02/05 08/06, 09/09 14/03, 02/05 08/06, 06/09 02/05, 08/06 23/06, 31/08 06/09, 23/06, 14/03 06/09, 23/06, 14/03 06/09, 29/06, 14/03 02/05, 08/06 23/06, 06/09 MPCC vérité terrain échantillons complet 90.73 90.65 90.65 90.65 90.64 MPCC RPG échantillons complet 09/09, 29/06, 02/05, 14/03 06/09, 29/06, 02/05, 14/03 06/09, 14/07, 02/05, 14/03 09/09, 20/07, 02/05, 14/03 09/09, 14/07, 02/05, 14/03 84.64 84.6 84.56 84.53 84.5 30/10, 06/09, 30/10, 06/09, 30/10, 06/09, 30/10, 06/09, 30/10, 31/08, MPCC RPG échantillons de vérification 08/07, 14/03 14/07, 14/03 08/07, 05/06 20/07, 05/06 29/06, 14/03 72.41 72.24 72.22 72.14 72.12 Meilleures combinaisons de 5 dates 06 30/10, 06/09 14/07, 02/05 14/03 30/10, 06/09 29/06, 02/05 14/03 30/10, 06/09 02/07, 02/05 14/03 30/10, 06/09 17/07, 02/05 14/03 30/10, 06/09 20/07, 02/05 14/03 MPCC RPG échantillons complet 87.35 87.24 87.14 87.13 87.13 30/10, 06/09 30/10, 06/09 30/10, 06/09 30/10, 06/09 MPCC RPG échantillons de vérification 08/07, 05/06 14/07, 02/05 23/06, 14/06 10/08, 02/05 14/03 14/03 14/03 14/03 30/10, 06/09 17/07, 02/05 14/03 74.01 73.89 73.71 73.7 73.63 Commentaires sur les combinaisons de dates en 2006, les meilleures dates : Avec 2 dates, la date du 14 mars domine puis celle du 2 mai. Avec 3 dates, le 14 mars puis le 6 septembre et le 29 juin. Avec 4 dates, le 14 mars domine à 90% puis le 6 sept, le 2 mai et le 30 oct. Avec 5 dates, le 14 mars, le 6 septembre et le 30 octobre (100%), le 2 mai à 80%. 55
Combinaison de deux dates 82 81.5 Pourcentage des pixels bien classés 87.6 87.5 87.4 87.3 87.2 87.1 87 86.9 81 80.5 80 79.5 14/03--14/07 14/03--29/06 14/03--02/07 14/03--17/07 17/02--14/07 14/03--23/06 14/03--10/08 17/02--02/07 14/03--31/08 combinaisons de 3 dates 02/05--23/06 02/05--14/07 02/05--10/08 14/03--08/06 17/02--29/06 02/05--29/06 14/03--06/09 14/03--20/07 02/05--14/06 14/06--10/08 08/06--31/08 02/05--31/08 17/02--17/07 05/06--14/07 17/02--08/06 14/03--08/07 23/06--10/08 14/03--14/06 08/06--14/07 05/06--10/08 02/05--14/07 86.8 86.7 86.6 Ces courbes représentent les meilleures combinaisons de dates, classées par ordre décroissant de MPCC 56
Comparaison de quatre dates 90.8 90.7 pourcentage de pixels bien classés 90.6 90.5 90.4 90.3 90.2 90.1 90 02/05-08/06-23/06-10/08 02/05-08/06-23/06-31/08 14/03-02/05-08/06-09/09 14/03-02/05-08/06-06/09 02/50-08/06-23/06-06/09 02/05-08/06-29/06-31/08 92.5 92.45 02/05-08/06-29/06-06/09 17/02--02/05--/08/06--09/09 17/02--02/05--08/06--06/09 02/05-08/06-29/06-09/09 14/03-02/05-08/06-31/08 14/03-02/05-08/06-10/08 02/05-05/06-23-06/06/09 02/05-08/06-29/06-10/08 17/02-08/06-14/07-06/09 140/03-08/06-23/06-10/08 02/05-08/06-02/07-09/09 17/02--02/05--08/06--10/08 comparaison cinq dates 17/02--02/05--08/06--31/08 17/02-08/06-02/07-09/09 02/05-08/06-23/06-09/09 14/03-02/05-14/06-10/08 17/02-08/06-29/06-06/09 14/03-02/05-14/06-06/09 02/05-08/06-02/07-06/09 02/05-05/06-23/06-10/08 14/03-02/05-05/06-10/08 14/03-02/05-05/06-06/09 02/05-05/06-23/06-31/08 02/05-08/06-02/07-31/08 17/02-08/06-14/07-06/09 02/05-08/06-02/07-10/08 pourcentage de pixels bien classés 92.4 92.35 92.3 92.25 92.2 92.15 92.1 92.05 92 17/02-02/05-08/06-02/07-06/09 17/02-02/05-08/06-02/07-09/09 14/03-02/05-08/06-23/06-10/08 14/03-02/05-08/06-23/06-06/09 17/02-02/05-08/06-29/06-09/09 14/03-02/05-08/06-29/06-06/09 données 2007 Meilleures combinaisons de 2 dates 07 MPCC vérité terrain échantillons complet MPCC RPG échantillons complet MPCC vérité terrain échantillons d'apprentissage 17/02-02/05-08/06-23/06-06/09 17/02-02/05-08/06-23/06-09/09 17/02-02/05-08/06-14/07-09/09 14/03-02/05-08/06-02/07-09/09 17/02-02/05-08/06-29/06-06/09 17/02-02/05-08/06-23/06-10/08 14/03-02/05-08/06-29/06-09/09 14/03-02/05-08/06-23/06-09/09 14/03-02/05-08/06-29/06-31/08 17/02-02/05-08/06-14/07-06/09 17/02-02/05-08/06-20/07-09/09 17/02-02/05-08/06-23/06-31/08 14/03-02/05-08/06-02/07-06/09 17/02-02/05-08/06-02/07-31/08 17/02-02/05-08/06-29/06-31/08 14/03-02/05-08/06-29/06-10/08 14/03-02/05-08/06-14/07-09/09 14/03-02/05-08/06-23/06-31/08 17/02-02/05-08/06-29/06-10/08 14/03-02/05-08/06-02/07-31/08 14/03-02/05-08/06-14/07-06/09 14/03-02/05-08/06-08/07-09/09 17/02-02/05-08/06-08/07-09/09 14/03-02/05-08/06-20/07-09/09 17/02-02/05-08/06-02/07-10/08 14/03-02/05-08/06-02/07-10/08 20/04 30/06 23/02 30/06 20/04 04/08 20/04 07/07 20/04 15/09 84.28 82.73 82.54 82.32 81.94 11/08, 23/02 04/08, 23/02 30/06, 23/02 30/06, 20/04 13/10, 30/05 73.72 73.28 73.26 73.23 73.22 20/04 30/06 20/04 07/07 30/05 30/06 23/02 30/06 20/04 04/08 87.87 86.37 85.75 85.4 85.27 57
MPCC vérité terrain échantillons vérification MPCC RPG échantillons de vérification 20/04 08/09 23/02 11/08 23/02 08/09 23/02 20/04 23/02 15/09 63.74 63.36 62.77 61.86 61.72 11/08, 20/04 04/08, 20/04 08/09, 20/04 15/09, 20/04 07/07,20/04 66.96 65.68 65.14 64.54 64.45 Meilleures combinaisons de 3 dates 07 20/04, 30/05, 30/06 20/04, 30/06, 15/09 20/04, 30/06, 11/08 20/04, 30/06, 04/08 20/04, 30/06, 08/09 MPCC vérité terrain échantillons complet 87.92 87.78 87.77 87.65 87.62 MPCC RPG échantillons complet 20/04, 30/06, 20/04, 30/06, 23/02, 30/06, 20/04, 07/07, 23/02, 30/06, 13/10 15/09 15/09 13/10 13/10 82.82 82.5 82.41 82.27 82.14 MPCC vérité terrain échantillons 20/04, 30/05, 30/06 20/04, 30/06, 04/08 20/04, 30/06, 11/08 20/04, 30/06, 08/09 20/04, 30/06, 15/09 apprentissage 91.08 90.72 90.68 90.57 90.56 MPCC vérité terrain échantillons de 23/02, 30/05, 08/09 20/04, 08/09, 15/09 23/02, 30/06, 11/08 23/02, 30/05, 04/08 23/02, 08/09, 15/09 vérification 64.47 64.36 64.09 63.94 63.91 20/04, 11/08, 20/04, 04/08, 20/04, 30/05, 20/04, 30/05, 20/04, 07/07, MPCC RPG échantillons de vérification 15/09 15/09 15/09 13/10 15/09 72.13 71.8 71.46 71.35 71.21 Meilleures combinaisons de 4 dates 07 23/02, 30/05 30/06, 15/09 20/04, 30/05 30/06, 15/09 23/02, 30/05 30/06, 08/09 20/04, 30/05 30/06, 11/08 20/04, 30/05 30/06, 04/08 MPCC vérité terrain échantillons complets 90.48 90.41 90.35 90.34 90.28 MPCC RPG échantillons complets MPCC vérité terrain échantillons apprentissage MPCC vérité terrain échantillons de vérification MPCC RPG échantillons vérification 23/02, 20/04 30/06, 15/09 20/04, 30/06 04/08, 13/10 23/02, 30/05 30/06, 15/09 23/02, 20/04 30/06, 13/10 20/04, 30/06 11/08, 13/10 86.54 86.41 86.36 86.32 86.29 20/04, 30/05 23/02, 30/05 23/02, 30/05 20/04, 30/05 23/02, 20/04 30/06, 11/08 30/06, 11/08 30/06, 04/08 30/06, 04/08 30/06, 11/08 93.14 93.08 92.94 92.94 92.87 20/04, 30/05 20/04, 30/06 20/04, 30/05 20/04, 07/07 23/02, 30/05 11/08, 15/09 11/08, 15/09 04/08, 15/09 11/08, 15/09 11/08, 15/09 74.94 74.25 74.12 74.08 73.64 23/02, 20/04 20/04, 04/08 20/04, 04/08 23/02, 20/04 20/04, 04/08 08/09, 15/09 08/09, 15/09 11/08, 08/09 30/05, 04/08 11/08, 15/09 63.93 63.48 63.3 63.16 62.99 Meilleures combinaisons de 5 dates 07 MPCC RPG échantillons complets MPCC RPG échantillons de vérification 13/10, 11/08 30/06, 30/05 23/02 15/09, 11/08 30/06, 30/05 20/04 13/10, 11/08 30/06, 20/04 23/02 13/10, 15/09 30/06, 30/05 23/02 13/10, 08/09 30/06, 20/04 23/02 13/10, 04/08 30/06, 30/05 23/02 88.92 88.91 88.9 88.78 88.77 15/09, 11/08 15/09, 11/08 13/10, 15/09 04/08, 30/05 07/07, 30/05 11/08, 30/05 20/04 20/04 20/04 15/09, 08/09 11/08, 30/05 20/04 75.73 75.53 75.42 74.84 74.82 Cet exemple présente les divers jeux d échantillons : terrain RPG, complet apprentissage, vérification. Les meilleures combinaisons varient. Mais la date du 20/04 intervient pratiquement toujours, puis une date de mai, juin ou septembre Commentaires sur les combinaisons de dates en 2007, les meilleures dates : Avec 2 dates, le 23 février Avec 3 dates, le 20 avril Avec 4 dates, le 20 avril domine, puis le 23 février, le 15 sept et le 30 oct. Avec 5 dates, le 30 mai domine, puis le 11 août, le 13 oct, le 30 oct, le 15 sept et le 20 avril. 58
Données 2008, uniquement avec les vérités terrain Meilleures combinaisons de 2 dates 08 vérité terrain 31/07, 11/02 21/08, 19/06 21/08, 11/02 26/10, 10/07 10/10, 10/07 MPCC échantillons complet 82.08 81.63 81.56 81.46 81.25 MPCC échantillons de vérification 31/07 19/06 21/08 11/02 21/08 19/06 31/07 11/02 26/10 31/07 68.13 68.13 67.73 67.33 66.33 Meilleures combinaisons de 3 dates 08 vérité terrain MPCC échantillons complet MPCC échantillons de vérification ma 31/07, 19/06, 11/02 21/08, 10/07, 11/02 25/09, 31/07, 11/02 21/08, 19/06, 11/02 88.99 88.96 88.87 88.86 88.71 26/10, 31/07, 21/08, 31/07, 31/07, 19/06, 10/10, 31/07, 19/06 11/02 11/02 19/06 72.06 72.02 71.77 71.52 71.14 25/09, 10/07, 11/02 21/08, 31/07, 19/06 Meilleures combinaisons de 4 dates 08 vérité terrain 26/10, 31/07, 19/06, 11/02 26/10, 21/08, 19/06, 11/02 25/09, 31/07, 19/06, 11/02 26/10, 21/08, 10/07, 11/02 21/08, 31/07, 19/06, 11/02 MPCC échantillons complet 92.64 92.47 92.37 92.36 92.32 MPCC échantillons de vérification 10/10, 21/08, 31/07, 19/06 21/08, 31/07, 19/06, 11/02 10/10, 31/07, 19/06, 11/02 10/10, 21/08, 31/07, 11/02 26/10, 21/08, 31/07, 19/06 73.65 73.6 72.91 72.68 72.67 Meilleures combinaisons de 5 dates 08 vérité terrain MPCC échantillons complet MPCC échantillons de vérification 26/10, 21/08, 31/07, 19/06, 11/02 10/10, 21/08, 31/07, 19/06, 11/02 26/10, 21/08, 10/07, 19/06, 11/02 Commentaires sur les combinaisons de dates en 2008 10/10, 21/08, 10/07, 19/06, 11/02 06/10, 21/08, 10/07, 19/06, 11/02 25/09, 21/08, 10/07, 19/06, 11/02 94.21 94.16 94.07 94.03 93.99 26/10, 10/10, 06/10, 21/08, 26/10, 21/08, 21/08, 31/07, 31/07, 19/06, 31/07, 19/06, 19/06 11/02 11/02 26/10, 25/09, 21/08, 31/07, 19/06 75.23 73.77 73.31 73.28 73.07 Avec 2 dates : le 11 février, le 10 juillet et le 21 août Avec 3 dates : le 11 février et le 31 juillet puis le 19 juin. Avec 4 dates : le 11 février, 19 juin, 31 juillet et le 21 août Avec 5 dates : le 19 juin et le 21 août (100%), puis le 11 février et le 31 juillet (80%). Récapitulatif Le tableau montre les périodes qui paraissent donner de meilleurs résultats En 2006, le 14 mars est la date que l on retrouve dans pratiquement toutes les combinaisons, en 2007 c est le 20 avril et en 2008 le 11 février. En 2006, le 27 septembre n apparait jamais. 2006 2007 2008 2 dates mi-mars/début mai fin février/fin juin début février/début juillet-fin août 3 dates mi-mars/ fin juin/ début fin avril/fin juin/miseptembre début février/ fin juin /fin juillet septembre 4 dates mi-mars/début mai/début fin février/fin avril/ miseptembre/fin début février/fin juin/fin juillet/fin août septembre/fin octobre octobre 5 dates mi-mars/début mai/ début-mijuillet/début fin avril/ fin mai/début août/ début février/fin juin /fin juillet/fin septembre/fin mi-septembre/mi et fin août/ fin octobre octobre octobre/ Tableau 3.2 : combinaisons de dates qui donnent les meilleurs résultats, en fonction de leur nombre 59
Combinaisons en addition chronologique 2006 jusqu au 14/07/06 avec les vérités terrain 100 90 Pourcentage des pixels bien classés 80 70 60 50 40 17/02/06 17/02/06 14/03/06 17/02/06 14/03/06 02/05/06 17/02/06 14/03/06 02/05/06 27/05/06 17/02/06 14/03/06 02/05/06 27/05/06 05/06/06 17/02/06 14/03/06 02/05/06 27/05/06 05/06/06 08/06/06 17/02/06 14/03/06 02/05/06 27/05/06 05/06/06 08/06/07 14/06/06 17/02/06 14/03/06 02/05/06 27/05/06 05/06/06 08/06/07 14/06/06 23/06/06 17/02/06 14/03/06 02/05/06 27/05/06 05/06/06 08/06/07 14/06/06 23/06/06 29/06/06 17/02/06 14/03/06 02/05/06 27/05/06 05/06/06 08/06/07 14/06/06 23/06/06 29/06/06 02/07/06 17/02/06 14/03/06 02/05/06 27/05/06 05/06/06 08/06/07 14/06/06 23/06/06 29/06/06 02/07/06 08/07/06 17/02/06 14/03/06 02/05/06 27/05/06 05/06/06 08/06/07 14/06/06 23/06/06 29/06/06 02/07/06 08/07/06 14/07/06 Combinaisons en addition chronologique avec le choix des meilleures dates : changement de combinaisons à partir de 7 dates avec les vérités terrain 100 90 Pourcentage des pixels bien classés 80 70 60 50 40 17/02 17/02 14/03 17/02 14/03 02/05 17/02 14/03 02/05 27/05 17/02 14/03 02/05 27/05 08/06 17/02 14/03 02/05 27/05 08/06 23/06 17/02 14/03 02/05 27/05 08/06 23/06 02/07 17/02 14/03 02/05 27/05 08/06 23/06 02/07 14/07 17/02 14/03 02/05 27/05 08/06 23/06 02/07 14/07 10/08 17/02 14/03 02/05 27/05 08/06 23/06 02/07 14/07 10/08 31/08 17/02 14/03 02/05 27/05 08/06 23/06 02/07 14/07 10/08 31/08 06/09 17/02 14/03 02/05 27/05 08/06 23/06 02/07 14/07 10/08 31/08 06/09 09/09 MPCC 62.77 71.85 80.80 85.66 89.05 91.67 92.75 93.63 94.42 94.95 95.36 95.73 Kappa 56.49 67.97 79 83 86 89 90 92 93 94 94 95 60
Avec le RPG Pourcentage des pixels bien classés 100 90 80 70 60 50 40 14/3 14/03 02/0514/03 02/05 05/06 14/0302/0514/0302/0514/0302/05 05/0614/0605/0614/0605/0614/06 23/06 23/0629/06 MPCC échantillons complets MPCC échantillons de vérification données 2007 avec RPG 100 Pourcentage des pixels bien classés 90 80 70 60 50 40 23/02/07 23/02/07 20/04/07 23/02/07 20/04/07 30/05/07 23/02/07 20/04/07 30/05/07 30/06/07 MPCC échantillons complets 23/02/07 20/04/07 30/05/07 30/06/07 07/07/07 23/02/07 20/04/07 30/05/07 30/06/07 07/07/07 04/08/07 23/02/07 20/04/07 30/05/07 30/06/07 07/07/07 04/08/07 11/08/07 23/02/07 20/04/07 30/05/07 30/06/07 07/07/07 04/08/07 11/08/07 08/09/07 23/02/07 20/04/07 30/05/07 30/06/07 07/07/07 04/08/07 11/08/07 08/09/07 15/09/07 MPCC échantillons de vérification 23/02/07 20/04/07 30/05/07 30/06/07 07/07/07 04/08/07 11/08/07 08/09/07 15/09/07 13/10/07 61
données 2008 avec RPG 100 90 Pourcentage des pixels bien classés 80 70 60 50 40 11/02/08 11/02/08 19/06/08 11/02/08 19/06/08 10/07/08 11/02/08 19/06/08 10/07/08 31/07/08 11/02/08 19/06/08 10/07/08 31/07/08 21/08/08 11/02/08 19/06/08 10/07/08 31/07/08 21/08/08 25/09/08 11/02/08 19/06/08 10/07/08 31/07/08 21/08/08 25/09/08 06/10/08 11/02/08 19/06/08 10/07/08 31/07/08 21/08/08 25/09/08 06/10/08 10/10/08 11/02/08 19/06/08 10/07/08 31/07/08 21/08/08 25/09/08 06/10/08 10/10/08 26/10/08 MPCC échantillons complet MPCC échantillons de vérification Discriminations par classe Exemple de choix de classifications pour mieux discriminer certaines cultures et surfaces enherbées avec certaines dates, et qui donne le PCC le plus élevé pour la classe. Ces calculs sont donnés automatiquement par un logiciel. Blé Cultures d hiver Globalement le blé est mieux discriminé au mois de juin car ce mois apparait dans toutes les combinaisons de 2 ou plusieurs dates avec des pourcentages moyens de bien classés de 82% à 93%. Blé 1 date 2 dates 3 dates 4 dates 5 dates 2006 23/06 ; 82.5% 29/06, 05/06 ; 87.2% 17/07, 23/06, 17/07, 23/06, 05/06, 17/07, 23/06, 14/06, 05/06 ; 89.8% 14/03 ; 91.2% 05/06, 14/03 ; 92.3% 2007 20/04 ; 80.2% 30/06, 20/04 ; 85% 30/06, 30/05, 30/06, 30/05, 20/04, 08/09, 30/06, 30/05, 20/04 ; 89% 23/02 ; 91.4% 20/04, 23/02 ; 92.6% 2008 31/07 ; 69% 10/07, 19/06 ; 84.9% 10/07, 19/06, 31/07, 10/07, 19/06, 10/10, 31/07, 10/07, 11/02 ; 88.2% 11/02 ; 91.8% 19/06, 11/02 ; 93.7% 62
Colza Le colza est mieux discriminé en avril, comme cela a déjà été vérifié avec les profils temporels, mais aussi début juin de façon moindre. Colza 1 date 2 dates 3 dates 4 dates 5 dates 2006 05/06 ; 83.2% 30/10, 02/05 ; 87.6% 30/10, 05/06, 30/10, 23/06, 05/06, 30/10, 31/08, 23/06, 14/03 ; 91% 14/03 ; 92.7% 05/06, 14/03 ; 93.4% 2007 20/04 ; 94.4% 30/05, 20/04 ; 96.1% 13/10, 30/05, 13/10, 30/05, 20/04, 13/10, 30/06, 30/05, 20/04 ; 97.4% 23/02 ; 98.1% 20/04, 23/02 ; 98.5% 2008 10/07 ; 69% 31/07, 19/06 ; 88% 06/10, 19/06, 06/10, 31/07, 19/06, 06/10, 31/07, 10/07, 11/02 ; 94% 11/02 ; 97.5% 19/06, 11/02 ; 98.3% Orge L orge est difficile à discriminer du blé. Les dates préférables sont mai-début juin. Orge 1 date 2 dates 3 dates 4 dates 5 dates 2006 05/06 ; 62% 29/06, 05/06 ; 70.7% 29/06, 05/06, 06/09, 29/06, 05/06, 30/10, 09/09, 29/06, 14/03 ; 76.6% 14/03 ; 82% 05/06, 14/03 ; 84.5% 2007 30/05 ; 61.8% 30/06, 30/05 ; 77.4% 30/06, 30/05, 30/06, 30/05, 20/04, 13/10, 30/06, 30/05, 23/02 ; 85.1% 23/02 ; 88.7% 20/04, 23/02 ; 90.4% 2008 19/06 ; 78.8% 19/06, 11/02 ; 86.7% 21/08, 19/06, 06/10, 21/08, 19/06, 06/10, 21/08, 10/07, 11/02 ; 91.7% 11/02 ; 95.8% 19/06, 11/02 ; 96.9% Maïs Cultures d été Le maïs est mieux discriminé vers août-septembre. Maïs 1 date 2 dates 3 dates 4 dates 5 dates 2006 31/08 ; 88.3% 09/09, 31/08 ; 91.7% 09/09, 10/08, 30/10, 27/09, 09/09, 30/10, 09/09, 06/09, 14/06 ; 94.1% 31/08 ; 95.1% 10/08, 14/06 ; 96.1% 2007 08/09 ; 59.3% 13/10, 15/09 ; 76.2% 13/10, 08/09, 13/10, 15/09, 30/06, 13/10, 15/09, 08/09, 30/05 ; 88.5% 23/02 ; 93.1% 30/05, 23/02 ; 94.7% 2008 21/08 ; 79.1% 21/08, 10/07 ; 84.3% 26/10, 21/08, 26/10, 25/09, 21/08, 26/10, 25/09, 21/08, 10/07 ; 93% 10/07 ; 95.8% 10/07, 11/02 ; 97.9% Tournesol Le tournesol est mieux discriminé vers juillet-août mais ne présente pas de pourcentages de bien classés aussi élevés que les autres cultures d été. Sa discrimination est délicate. Tournesol 1 date 2 dates 3 dates 4 dates 5 dates 2006 02/07 ; 53.8% 10/08, 02/07 ; 82.4% 06/09, 10/08, 10/08, 02/07, 14/06, 06/09, 10/08, 14/07, 02/07 ; 87.4% 02/05 ; 90.3% 05/06, 02/05 ; 92.8% 2007 04/08 ; 57.3% 15/09, 04/08 ; 74.5% 15/09, 11/08, 13/10, 15/09, 11/08, 13/10, 15/09, 11/08, 30/06 ; 86.7% 30/06 ; 91.6% 30/06, 20/04 ; 94.1% 2008 21/08 ; 57.9% 06/10, 11/02 ; 76.5% 26/10, 31/07, 26/10, 21/08, 19/06, 26/10, 21/08, 31/07, 11/02 ; 91% 11/02 ; 94.3% 19/06, 11/02 ; 95.5% Sorgho Le sorgho est mieux discriminé en août, mais cela n empêche pas des confusions avec les autres cultures. Sorgho 1 date 2 dates 3 dates 4 dates 5 dates 2006 31/08 ; 53% 30/10, 31/08 ; 77.3% 30/10, 31/08, 30/10, 06/09, 10/08, 30/10, 06/09, 10/08, 17/07 ; 87.4% 14/06 ; 93.3% 14/07, 14/06 ; 95.2% 2007 20/04 ; 82.6% 15/09, 20/04 ; 89.1% 13/10, 11/08, 13/10, 15/09, 08/09, 13/10, 08/09, 11/08, 23/02 ; 93.1% 30/05 ; 95.6% 30/06, 30/05 ; 96.7% 2008 06/10 ; 89.2% 10/10, 19/06 ; 96% 10/10, 21/08, 10/10, 21/08, 19/06, 26/10, 10/10, 21/08, 11/02 ; 97.4% 11/02 ; 98.1% 31/07, 11/02 ; 98.7% 63
Soja Le soja est mieux discriminé vers août-septembre, comme le maïs. Soja 1 date 2 dates 3 dates 4 dates 5 dates 2006 30/10 ; 78.7% 06/09, 10/08 ; 86.5% 06/09, 10/08, 30/10, 06/09, 10/08, 30/10, 06/09, 10/08, 08/07 ; 92.2% 08/07 ; 93.7% 08/07, 05/06 ; 94.8% 2007 08/09 ; 44.7% 13/10, 08/09 ; 69.2% 13/10, 11/08, 13/10, 11/08, 07/07, 13/10, 15/09, 11/08, 30/06 ; 84.3% 23/02 ; 88.4% 30/06, 23/02 ; 90.5% 2008 21/08 ; 80.5% 25/09, 19/06, 93% 10/10, 25/09, 26/10, 25/09, 19/06, 26/10, 06/10, 25/09, 10/07 ; 95.7% 11/02 ; 97.5% 19/06, 11/02 ; 97.3% Jachères Surfaces enherbées Difficile à discriminer, des dates se détachent : le 14 mars en 2006, le 23 février en 2007 et début juillet en 2008. Jachère 1 date 2 dates 3 dates 4 dates 5 dates 2006 14/03 ; 22.2% 02/07, 14/03 ; 40.8% 02/07, 29/06, 27/09, 29/06, 14/06, 09/09, 02/07, 14/06, 14/03 ; 47.8% 14/03 ; 53.5% 02/05, 14/03 ; 59.3% 2007 23/02 ; 27.6% 08/09, 23/02 ; 28.1% 15/09, 08/09, 15/09, 08/09, 30/05, 15/09, 08/09, 30/05, 23/02 ; 37% 23/02 ; 43.5% 20/04, 23/02 ; 46.7% 2008 25/09 ; 73.7% 06/10, 19/06 ; 73.1% 06/10, 21/08, 10/10, 21/08, 10/07, 10/10, 25/09, 21/08, 10/07 ; 78.7% 19/06 ; 85.4% 10/07, 19/06 ; 88.7% Friches Même tendance que la jachère Friche 1 date 2 dates 3 dates 4 dates 5 dates 2006 02/05 ; 62.6% 09/09, 23/06 ; 72.4% 30/10, 29/06, 30/10, 09/09, 23/06, 30/10, 10/08, 20/07, 14/03 ; 78.4% 02/05 ; 81.7% 29/06, 14/03 ; 83% 2007 30/05 ; 54.6% 30/05, 20/04 ; 83.2% 15/09, 30/05, 15/09, 30/05, 20/04, 15/09, 07/07, 30/06, 20/04 ; 88.6% 23/02 ; 89.9% 30/05, 20/04 ; 91.4% 2008 19/06 ; 66.8% 10/07, 19/06 ; 81.6% 10/10, 10/07, 06/10, 31/07, 10/07, 06/10, 25/09, 31/07, 11/02 ; 86.5% 11/02 ; 88.1% 10/07, 11/02 ; 88.9% Prairies Même tendance que la jachère et la friche. Prairie temp. 1 date 2 dates 3 dates 4 dates 5 dates 2006 14/03 ; 28.8% 14/07, 14/03 ; 45.5% 23/06, 14/06, 02/07, 23/06, 14/06, 02/07, 29/06, 23/06, 14/03 ; 58% 14/03 ; 65.9% 14/06, 14/03 ; 72.1% 2007 11/08 ; 40.7% 11/08, 20/04; 57.9% 04/08, 30/06, 15/09, 04/08, 30/06, 15/09, 04/08, 30/06, 20/04 ; 66.7% 20/04 ; 72.7% 20/04, 23/02 ; 75.3% 2008 21/08 ; 47.9% 26/10, 31/07 ; 72.3% 26/10, 31/07, 26/10, 10/07, 19/06, 26/10, 31/07, 10/07, 19/06 ; 82.5% 11/02 ; 87% 19/06, 11/02 ; 90.3% Les surfaces enherbées ne se différencient pas vraiment, à aucune période précise de l année. 64
Dates où: IR = infra rouge le plus élevé NDVI = NDVI le plus élevé % de Bien Classés est le plus élevé 2006 17/02, 14/03, 02/05, 27/05, 05/06, 14/06, 23/06, 29/06, 02/07, 8/07, 14/07, 17/07, 20/07, 10/08, 31/08, 06/09, 09/09 2007 23/02, 20/04, 30/05, 30/06, 07/07, 11/08, 08/09, 15/09 2008 11/02, 19/06, 10/07, 37/07, 21/08, 25/09, 06/09, 10/10, 26/10 Blé IR 2 mai 20 avr Août??? NDVI 27 mai 20 avr 06 19/06 Manque mai et avril Creux vers fin mai 23/06, 29/06 20/04 colza IR 2 mai 20 avr NDVI 14/03 à 5/06 23/02 à 30/05 11/02 à 19/06 Mais plus faible car manque les meilleures dates % Bien Classés creux 30/06 2/05 à 05/06 20/04 à 30/05 tournesol IR 23/06 au 17/07 30/06, 7/07 10/07 31/07 NDVI 23/06 au 20/07 30/06, 7/07 % Bien Classés 23/06 au 10/08 20/04, 30/06 au 4/08 mais IR 2/07 au 10/08 30/06 au 8/06 NDVI 29/06 au 31/09 30/06 au 4/08 % Bien Classés 2/05, 8/07 au 31/08 30/05 au 11/08 sorgho IR 21/08-25/09 NDVI % Bien Classés soja IR 14/07 au 6/09 7/07au 8/09 NDVI 30/06 au 4/08 et 30/06 au 4/08 8/09 % Bien Classés 5/06 au 23/06, 23/02, 20/04, 4/08 31/08 au 09/09 11/08 Tableau 3.3 : dates les plus discriminantes en fonction du canal infrarouge (IR), le NDVI et les combinaisons donnant le meilleur pourcentage de bien classés 65
En résumé Suivant le jeu d échantillons utilisés les résultats de classification sont variables. En théorie, la classification est validée avec un jeu d échantillons indépendant, mais cela supprime des échantillons pour l apprentissage qui sont donc moins représentatif La meilleure solution, pour supprimer certaines confusions, est de choisir des sous classes pour la classification, puis les regrouper après la classification Chaque année est différente, les dates les plus discriminantes ne sont pas exactement les mêmes, suivant l année, les conditions climatiques, la croissance de la végétation varient Le choix des dates et les règles à appliquer ne peuvent qu être qu indicatives et pas toujours généralisables Pour obtenir les résultats ce n est pas la quantité des échantillons qui est la plus importante, mais leur représentativité Une classe peut être présente, mais non considérée, cas du Maïs ensilage, les pixels de cette classe étaient classés principalement en Tournesol Confirmation des résultats obtenus avec les courbes de réflectance, les meilleures dates pour discriminer : o le Maïs ensilage, ce sont les dates de début septembre o le Tournesol les dates d été de début juillet jusqu à la récolte début octobre o l Eucalyptus à partir du début de l automne Le mois d avril est très important pour la discrimination du Colza, mais également les cultures d hiver et de printemps, les feuillus. Si on n a pas avril, il est intéressant d avoir mars et éventuellement début mai, à défaut la combinaison mai, juin, ce qui a déjà été observé avec les images SPOT Fin d hiver - début printemps et fin de printemps avec début d été sont des périodes qui assurent un meilleur score dès qu ils participent à une combinaison (confirmé avec SPOT) Une date de fin d été ajoutée, assure l augmentation des MPCC, ainsi qu une date de fin de saison : septembre, octobre. Ces deux dates permettront de discriminer les cultures d été. Le Sorgho, quelque soit les canaux spectraux et/ou temporels, a un profil très proche du Maïs. D une façon générale pour les cultures d été les meilleures dates sont juillet - août 66
4 - CLASSIFICATIONS 4.1 Classifications non supervisées 2006 Ce type de classification permet d obtenir une carte d occupation du sol à partir d images satellites sans donnée de terrain, dans notre cas avec une modélisation du mécanisme de formation des régions de l image par un processus markovien de type ICM (iterative conditional mode). Il est en général difficile d interpréter une classification non supervisée, car elle donne beaucoup de sous classes. L affectation des couleurs est délicate, et suppose déjà la connaissance du terrain. Les classifications non supervisées 2006 donnent un ordre d idée du nombre, de la répartition et de la discrimination des classes. Nous avons pu avoir des résultats avant d avoir les données terrain. Plusieurs classifications ont été réalisées avec les images des mois de février, mars et mai (les images de juin n étant pas encore disponibles) : Classification avec 5 images (6 et 17 février, 14 mars, 2 et 27 mai) : présence de nuages sur la partie ouest de l image ; février présente une densité de nuages assez importante. Classification avec toutes les images par la méthode de fusion intégrée dans la classification : classification avec les 5 mêmes images en créant 4 lots ce qui permet d atténuer l influence des nuages. Des lots sont crées avec les images sans nuage (14 mars et 27 mai) et 3 autres lots avec les images avec des nuages. Ce traitement consiste à faire dans la classification non supervisée, pour chaque pixel des classifications séparées par lot puis l affectation finale est faite grâce à une technique de fusion. Ainsi l effet des nuages est minimisé : il y a moins de nuages dans la classification finale. Cette méthode permet d utiliser des dates qui ont quelques nuages. Classification avec les 2 images sans nuage. Il y a des confusions entre l eau et d autres classes, notamment les résineux. Afin d obtenir la classe Eau plus correcte, nous avons réalisé une classification non supervisée en utilisant seulement le canal PIR des 2 dates sans nuage. On obtient trois classes concernant l eau dont une, qui présente des confusions avec des cultures. Nous avons réalisé une fusion de ces deux classifications qui donne des résultats qui améliore la classe Eau, grâce aux deux classes bien discriminées. Ces classifications sont difficiles à interpréter. Les confusions sont : une partie de l eau de la Garonne avec des cultures des résineux avec les eucalyptus du bâti avec des classes type jachère ou friche Des cultures sont difficilement identifiables sans les données terrain S il y a un effet de pointillisme sur l image, il faut augmenter l importance des paramètres des contraintes markovienne 67
L arrivée de nouvelles dates : 05/06; 14/06; 23/06; 29/06 a permis de s abstraire du problème des nuages. Les dates retenues sont les 14 mars, 27 mai, 05 juin et 29 juin. La création de l'image de contours est obtenue par la segmentation (cf 3.3.4.4). Nous avons réalisé la classification non supervisée en introduisant ces contours, les résultats sont alors plus précis. Nous avons retenu 3 seuils de segmentation : 4, 6, 12, qui correspondent à des niveaux plus ou moins proches de la taille des parcelles, mais doivent également tenir compte d objets plus petits. Trois classifications ont donc été calculées avec les fichiers segmentés correspondants. Quelques différences entre les différents seuils de segmentation sont perceptibles au niveau des parcelles cultivées ou de la forêt. C est le seuil intermédaire 6 qui correspond le mieux aux classsements des divers objets contenus dans la cette scène. Les résultats présentent moins de confusions, notamment grâce à la présence de nouvelles dates. Classification avec toutes les dates par la méthode de fusion intégrée dans la classification : chaque groupe d image contenant certaines dates sont classés indépendamment puis fusionnées par diverses règles. Tout d abord avec 4 lots : 6 février, puis 17 février puis 02 mai puis 14 mars, 27 mai, 05 juin, 29 juin (icmso06_fm_fevajuin_4lots) - Confusion toujours de la classe des Résineux avec les pourtours de la Garonne et des bassins - Confusion toujours de la classe Eau des 3 grands lacs avec une classe appartenant aux Surfaces minérales - Les parcelles sont mieux "dessinées", moins de pixels isolés - Présence de petits nuages sur la partie sud-ouest de l'image et sur la partie nord-est (Toulouse) ce qui empêche d'exploiter l'image dans ces parties - Feuillus mieux définis que dans la classification sans lot Classification avec 3 lots (icmso06_fm_02030506_3lots) : 1 lot 6 février, 2 nd lot 02 mai, 3 ième lot 14 mars, 27 mai, 05 juin, 29 juin. - Moins de nuages sur la partie sud ouest de l'image - On a toujours les confusions précédentes (Résineux-Eau par exemple) Classification avec 4 images sans nuage (14 mars, 27 mai, 05-29 juin), les parcelles sont plus définies (mieux découpées). Les confusions sont : - entre lac et bâti et confusion de la Garonne avec parcelles de cultures ou de prairies (plus de confusion qu'avec 14 mars et 27 mai), l Eucalyptus (parcelle sous bois Sud) avec les Résineux et culture. - Blé ou Colza - Blé ou Colza ou Tournesol -Confusion entre eau (Garonne-bassins) et Résineux - Confusion Résineux et Eucalyptus Statistiques de classifications et reconnaissance spectrale La reconnaissance des classes d une classification non supervisée n est pas aisée, elle peut être visuelle à partir des courbes spectrales des valeurs moyennes des différentes classes. Nous avons mis au point un logiciel qui fait la reconnaissance automatique à partir des réponses spectrales et temporelles que l on reconnaît. 68
Des statistiques sont alors calculées pour chaque classe : moyenne, écart-type, minimum et maximum pour chacune des dates. Ainsi, il est possible de comparer les valeurs de chacune des classes avec des valeurs connues de classe. Pour les images Formosat de 2006, il n existe pas de comparaison possible avec des images antérieures de ce même satellite, la comparaison doit se faire avec des images Spot des années précédentes. Après un premier essai de comparaison visuelle non convaincant en se servant de la base de données SPOT de 2002 à 2005 on a décidé d utiliser la reconnaissance automatique. Pour obtenir des résultats cohérents, il faut normaliser les données de Formosat de 2006 avec les données SPOT afin de s affranchir des variabilités annuelles et de pouvoir rendre la comparaison des classes viable. L année 2002 a servi de référence, comme cela a été fait précédemment avec les années 2003, 2004, 2005. Figure 4.1 : Exemple de résultats intermédiaires - classification avec 4 images sans nuages (14 mars, 27 mai, 05 et 29 juin) en appliquant une segmentation au seuil 6 (coefficients de segmentation de 0,6) Normalisation des données Formosat pour la reconnaissance des classes La normalisation de ces données présente des difficultés en raison des différences entre les données Formosat et Spot. On doit tenir compte du fait que: - La zone couverte est moins étendue - La résolution de Formosat est de 8m, celle de Spot est de 20m - L image Spot a été rééchantillonée en 8m -Vérification de la superposition des images de Spot et Formosat. Ces opérations sont réalisées avec le logiciel ENVI (découpage des images de Spot à une taille similaire aux images de Formosat, Resize Data, Layer Stacking afin de passer les images de Spot de 69
20 m en 8 m : image de référence Formosat et l image commune des images Spot). Les images Spot en 8 m géoréférencées, sont alors comparables à celles de Formosat. Cependant la superposition des images des deux satellites n est pas suffisamment convenable pour la normalisation des données. Des points d amers ont été pris sur deux images le plus proche possible d un point de vue date. On peut alors réaliser une «registration image to image GCP s» avec l ensemble des images de Spot. Nous avons ainsi obtenu une nouvelle image commune avec 97 canaux de Spot en 8m superposable avec les images de Formosat. Les images de référence sont mars 2002, mai 2002, juin 2002, février 2005 (il n y a pas de données en février les années précédentes), les images à normaliser de Formosat 2006 sont 6 février, 14 mars, 27 mai, 14 juin Résultats de la reconnaissance L interprétaion s est avérée beaucoup plus difficile qu entre des images SPOT [Ducrot D et al 2009], beaucoup de classes étudiées ressemblent aux classes de l eau ou du bâti (qui est une classe avec une variabilité assez grande). Quelques cultures d été se distinguent (soja, maïs, sorgho). L expérience n a pas été poursuivie aprés l arrivée des autres dates, car disposant de vérités terrain, nous avons surtout étudiés les résultats des classifications supervisées. Mais des tests complets avec ajout chronologique de date seront présentés dans un autre rapport. 4.2 Classifications supervisées 2006 Les données FORMOSAT étant trés nombreuses, il est nécessaire de choisir les dates les plus performantes pour la classification grâce à l étude des meilleures combinaisons de dates (de 1 à 19 dates choisies en raison de leur qualité sur 49 date au total). Les premières classifications ont été faites avec les dates : 14/3, 2/5, 27/5, 5/6, 14/6, 23/6, 2/7, 8/7, 14/7, 10/8, 31/8, 9/9, 12 dates sur les 19 choisies. Une première série de classifications supervisées a été réalisée avec un nombre d échantillons réduit ce qui ne donnait pas de résultats convainquants : des confusions entre différentes cultures (Maïs, Tournesol notamment), on a importé quelques échantillons de 2005 (bois, surfaces minérales, eau) utilisés pour les images SPOT. une classification supervisée a été réalisée avec cette 2 ième série d échantillons (segmentation au seuil 4) (voir figure 4.2). La classification définitive a été réalisée avec les échantillons du RPG (voir ch 2) auxquels ont été rajouté les échantillons de Bâti, Forêt, Friches, Eau qui n appartiennent pas au RPG. Elle a été réalisée avec 17 dates : 14 mars, 2 mai, 27 mai, 5 juin, 14 juin, 23 juin, 29 juin, 2 juillet, 8 juillet, 14 juillet, 17 juillet, 20 juillet, 10 aout, 31 aout, 6 septembre, 9 septembre, 30 octobre (icmso06_echv9_sup20lab400_1). La première moitié des échantillons d apprentissage a servi à tester la qualité de la discrimination des différents canaux, la matrice de confusion étant alors réalisée sur l autre partie des échantillons conservés pour la vérification. Tous les tests qui permettent de choisir les bonnes combinaisons sont faits avec les matrices de confusions, les échantillons d apprentissage, les échantillons de vérifications. 70
Figure 4.2 : Classification supervisée avec les échantillons des vérités terrain (érosion 2), seuil 4 de segmentation avec 6 dates (mars, mai, juin, juillet, août, septembre) Mais grain non récolté 9/09/06 classification 2006 Mais grain orange clair et Mais ensilage orange foncé le Maïs ensilage est récolté à cette date Mais grain hétérogène Mais ensilage 15/09/07 classification 2007 Figure 4.3 : Exemple de classification en 2006 et 2007 sur la même zone, avec le RPG, pour distinguer le Maïs et le Maïs ensilage 71
On peut voir pour les mêmes parcelles, sur la figure 4.3, la présence de culture différente en 2006 et 2007 (rotation blé - tournesol) et le Maïs et Maïs ensilage qui sont très bien distingués. Sur Formosat (8m), on peut distinguer les haies qui apparaissent en général en un mélange de surface enherbées et bois, que l on peut retrouver dans la figure 4.4. Image du 09/09/06 avec des haies et la classification Figure 4.4 : les haies sur Formosat Figure 4.5 : zone arborée dans une parcelle de colza (27/05/06) et classification La figure 4.5 montre la précision des résultats, on peut voir la friche arbustive au milieu de la parcelle de Colza. Pour obtenir un résultat très correct la classification avec les 17 dates (icmso06_echv9_sup20lab400_all_1), est fusionnée avec une classification du NDVI seul de ces mêmes dates. Ainsi, les confusions que l on peut rencontrer avec l eau et des surfaces minérales sont améliorées. L indice de végétation NDVI permet la mise en évidence et la végétation chlorophyllienne (verte). La fusion entre deux classifications est un processus automatique. Avec moins d échantillons, uniquement ceux d apprentissage quelques autres classes sont améliorées : les bois, le Maïs, la Jachère, le Colza (icmso06_echv9_sup20lab400_ndvi_statverif_3) Remarque : une classification avec le NDVI seul, donne des résultats de PCC et MPCC inférieurs (tableau 4.1). Pour améliorer le Sorgho, on a fusionné avec une classification comportant les dates : 6 mai, 10 août, 31 août, 30 octobre, pour le Maïs les : 14 juin, 10 août, 6 septembre, et 9 septembre ; pour le Pois les : 14 mars, 14 juin, 23 juin, et 29 juin. En effet nous avons avec les combinaisons de dates suivantes : 6/05, 8/18, 8/31, 10/30, le Sorgho bien classé à 78,1% et améliore donc les cultures d été 6/14, 8/10, 9/06, 9/09, le Mais bien classé à 90.28 Avec les dates : 3/14, 6/14, 6/23, et 6/29, les mélanges récurrents du pois avec le tournesol et le blé sont améliorés en effet, le tournesol dans la classification de base (17 dates, RPG version 7), englobe 6.31% du mais, 5% du soja, 40,64 % du sorgho (peu d échantillons), 10% du pois et 4.21% 72
de la jachère. Après les fusionsles confusions sont : 5.61% pour le Sorgho, 0.35% pour le soja 0.58% pour la jachère. On peut observer que la classe Mais Ensilage est bien classée avec tous les échantillons (tableau 4.1 et 4.2), ce qui signifie que cette classe a une signature spectrale et temporelle qui est très différente des autres. 2006 Classification finale régularisée avec la segmentation Classification finale régularisée (principe filtre majoritaire) fusion pour améliorer sorgho mais et pois classif finale fusion 17 dates et NDVI 17 dates 17 dates + NDVI NDVI feuillus 98.01 98.01 98,01 97,92 97,92 98,21 96,63 résineux 98.16 98.16 98,16 98,21 98,2 97,64 96,51 eucalyptus 95.54 95.54 95,54 94,42 94,42 93,73 83,42 ble 96.32 96.00 95,6 95,54 95,48 95,26 84,71 colza 95.03 95.64 95,14 95,06 95,15 94,98 78,02 orge 94.03 92.80 92,3 92,15 92,14 91,48 74,98 mais 98.72 98.38 97,98 97,9 97,9 97,98 93,93 tournesol 98.00 97.87 97,61 98,22 98,28 97,5 89,85 sorgho 98.02 98.51 98,13 98,03 98,03 98,11 89,07 soja 98.01 98.31 97,98 97,89 97,88 98,15 91,64 pois 97.70 98.34 98,02 97,25 97,17 97,34 93,56 jachère/surfaces gel 77.38 75.45 74,95 74,58 74,58 76,23 45,02 friche 89.96 89.96 89,96 90,18 90,18 88,25 71,41 prairie temporaire 87.81 85.64 85,2 85,31 85,35 81,59 56,21 eau libre 99.73 99.73 99,73 99,53 99,29 99,58 96,25 lac 99.96 99.96 99,96 99,93 99,9 99,95 98,7 bâti dense 93.36 93.36 93,36 93,36 93,36 91,22 90,65 bâti industriel/surf minérale 92.06 92.06 92,06 90,33 89,18 91,49 80,66 gravières 99.87 99.87 99,87 99,84 99,83 99,86 93,14 peupliers 99.35 99.35 99,35 99,33 99,31 98,76 97,66 pré/prairie permanente 87.74 86.33 86,02 85,93 85,94 86,88 73,91 bâti diffus 98.67 98.67 98,67 98,76 98,57 90,67 86,57 surface minérale 97.80 97.80 97,8 97,58 97,58 97,58 95,16 mais ensilage 99.46 99.46 99,46 99,33 99,33 99,16 94,63 MPCC 95.45 95.22 95,04 94,86 94,79 94,23 85,51 Kappa 95.45 91.10 90,7 90,66 90,66 90,53 75,3 Tableau 4.1 : tableau des MPCC avec les différentes classifications et fusions calculé sur l échantillonnage complet (se lit de gauche à droite pour suivre les améliorations) Remarque : l opération de fusion entre les 17 dates et le NDVI ne donne pas le même résultat qu avec les 17 dates auxquelles le NDVI est ajouté lors de la classification. Le principe méthodologique est différent et permet de mieux intégrer les complémentarités des classes dans les différentes classifications. 73
2006 Classification finale régularisée avec la segmentation fusion pour améliorer sorgho mais et pois classif finale fusion 17 dates et NDVI 17 dates 17 dates + NDVI NDVI feuillus 95,13 95,01 82,84 82,7 88,73 86,78 résineux 96,93 96,91 88,34 83,72 96,34 82,93 eucalyptus 70,49 68,94 65,16 40,86 56,73 56,17 blé 95,92 93,8 90,97 96,62 96,15 84,89 colza 93,21 92,06 88,53 85,74 87,83 62,98 orge 53,71 52,33 50,23 47,26 45,9 43,71 mais 95,65 92,73 87,6 87,73 87,65 86,35 tournesol 89,54 88,58 90,52 94,85 93,07 85,13 sorgho 96,11 86,62 70,18 42,03 40,62 67,14 soja 95,32 95,42 94,6 93,91 92,53 82,63 pois 81,14 74,23 64,9 42,11 49,97 60,22 jachère/surfaces gel 59,21 59,55 64,97 71,43 75,54 43,3 friche 92,07 86,83 67,07 57,26 55,24 57,12 prairie temporaire 73,76 71,36 71,12 71,23 64,77 62,43 eau libre 99,13 99,09 96,9 90,37 96,92 95,76 lac 99,83 99,83 94,76 90,9 99,09 51,03 bâti dense 76,22 75,56 78,22 78,44 74,89 73,33 bâti industriel/surf minérale 92,72 92,72 83,23 91,77 90,19 70,89 gravières 99,93 99,93 91,33 91,41 99,26 77,74 peupliers 94,05 94,05 94,05 94,05 94,05 94,05 pre/prairie permanente 61,6 56,1 52,48 52,02 50,48 46,67 bati diffus 88,25 88,25 81,72 78,73 75,56 68,84 surface minerale 85,98 85,98 89,72 80,37 71,96 82,24 mais ensilage 99,85 99,17 91,58 86,21 85,11 91,16 MOYENNE 86,91 85,21 80,46 76,32 77,86 71,4 Kappa 81,61 79,57 77,44 79,23 79,82 66,51 Tableau 4.2 : MPCC avec les différentes classifications et fusions avec l échantillonnage d apprentissage calculées sur l échantillonnage de vérification La classification markovienne qui intègre la segmentation permet de faire une classification de type objet, de façon subtile afin d englober des petits. Mais, il reste quelques points isolés. Un filtrage est alors réalisé à partir de régions obtenues avec la segmentation qui donne le contour des parcelles. Une option permet d éviter un lissage trop important, ce qui évite la perte des objets linéaire comme les routes, les "haies et buissons" dans le parcellaire, chemins. Ce filtrage donne de meilleurs résultats qu un filtrage classique par le majoritaire. Comme on peut l observer dans le tableau 4.4 : les résultats sont différents suivant l échantillonnage, ils s améliorent lorsque que l échantillonnage contient plus d échantillons. Ceci montre l importance des échantillons dans les résultats de la classification. Rappelons qu il est important d avoir la classification avec l échantillonnage complet, mais 74
relativiser les résultats avec la matrice de confusion issue de la classification avec l échantillonnage d apprentissage calculée sur l échantillonnage de vérification. % d occupation Surface en ha 2006 EFFECTIFS Classification finale régularisée avec la segmentation 1 feuillus 581454 6.7 3721.306 2 résineux 70181 0.81 449.158 3 eucalyptus 14353 0.17 91.859 25 peupliers 8345 0.1 53.408 16 friche 461168 5.31 2951.475 15 jachère/surfaces gel 1200083 13.82 7680.531 17 prairie temporaire 674441 7.77 4316.422 28 pre/prairie permanente 525157 6.05 3361.005 4 blé 1398299 16.11 8949.114 7 orge 219322 2.53 1403.661 6 colza 178818 2.06 1144.435 12 pois 46558 0.54 297.971 8 mais 861050 9.92 5510.72 40 mais ensilage 49002 0.56 313.613 9 tournesol 932381 10.74 5967.238 10 sorgho 88075 1.01 563.68 11 soja 132183 1.52 845.971 18 eau libre 50983 0.59 326.291 19 lac 25473 0.29 163.027 24 gravières 61016 0.7 390.502 20 bâti dense 371691 4.28 2378.822 21 bâti industriel/surf minérale 68706 0.79 439.718 32 bâti diffus 641584 7.39 4106.138 38 surface minérale 21717 0.25 138.989 24 classes 8682040 100 55565.059 Tableau 4.3 : surface d occupation du sol avec la classification supervisée finale 75
2006 Echantillonnage complet pour l apprentissage et la vérification Apprentissage avec l échantillonnage complet et vérification avec l échantillonnage de vérification Apprentissage avec l échantillonnage d apprentissage et vérification avec l échantillonnage complet Apprentissage avec l échantillonnage d apprentissage et la vérification avec l échantillonnage de vérification feuillus 98,01 97,19 96,97 95,01 résineux 98,16 98,44 97,28 96,91 eucalyptus 95,54 96,28 86,82 68,94 blé 95,6 97,38 92,31 93,8 colza 95,14 94,49 93,31 92,06 orge 92,3 89,15 73,29 52,33 mais 97,98 97,64 94,22 92,73 tournesol 97,61 97,17 89,94 88,58 sorgho 98,13 98,14 90,6 86,62 soja 97,98 98,16 96,1 95,42 pois 98,02 96,63 87,05 74,23 jachère/surfaces gel 74,95 74,25 65,58 59,55 friche 89,96 94,35 84,58 86,83 prairie temporaire 85,2 82,73 79,23 71,36 eau libre 99,73 99,7 99,31 99,09 lac 99,96 99,99 99,88 99,83 bâti dense 93,36 91,33 80,15 75,56 bâti industriel/surf minérale 92,06 92,72 91,05 92,72 gravières 99,87 99,89 99,92 99,93 peupliers 99,35 97,62 98,44 94,05 pré/prairie permanente 86,02 82,01 74,79 56,1 bâti diffus 98,67 98,88 85,9 88,25 surface minérale 97,8 91,59 95,16 85,98 mais ensilage 99,46 99,53 98,35 99,17 MPCC 95,04 94,39 89,59 85,21 Kappa 90,7 90,21 83,81 79,57 Tableau 4.4 : tableau des MPCC avec une des classifications finales avec les différents échantillonnages 76
Figure 4.6 : classification supervisée finale 17 dates avec RPG 77
4.3 Classifications supervisées 2007 4.3.1 Comparaison de méthodes de classifications Les premières classifications ont été faites avec des vérités terrain. Des premiers tests ont été réalisés sur certaines images : 7 dates sans les nuages : 2007/02/23,2007/04/20, 2007/07/07, 2007/08/04, 2007/08/11, 2007/09/08, 2007/09/15. Nous avons comparé des méthodes de classifications supervisées dans les mêmes conditions, avec Envi selon les méthodes du maximum de vraisemblance et de la distance de Mahalanobis et avec le logiciel TITE avec la méthode Iterative Conditionnal Mode. La classification par la distance de Mahalanobis est un classificateur qui utilise les statistiques pour chaque classe. Elle est similaire à la classification par maximum de vraisemblance, mais suppose que les covariances entre classes soient égales. Par conséquent, c est une méthode plus rapide. Tous les pixels sont classés dans la classe des échantillons la plus proche par le calcul de la distance de Mahalanobis. MPCC= 78.36 % ; Coefficient Kappa = 0.76 Figure 4.7 : Image classée avec la distance de Mahalanobis La méthode ICM donne de meilleurs résultats que les deux autres, qui présentent un aspect persillé, car cette méthode tient compte de ses voisins (clique de Markov) dans la règle de décision. Avec Envi, la méthode du maximum de vraisemblance est plus performante que celle utilisant la distance de Mahalanobis. 78
Figure 4.8 : Image classée avec le maximum de vraisemblance MPCC = 90.38 % ; Coefficient Kappa = 0.89 Figure 4.9 : Image classée avec l ICM MPCC = 93.21% ; Kappa Coefficient = 0.92 79
Le grand nombre des données (9 dates de 4 canaux spectraux, donc 36 images) ne nous a pas permis d effectuer de façon acceptable, les classifications non supervisées K-means et ISODATA Image classée avec 9 dates (ICM) : 2007/02/23, 2007/04/20,2007/05/30, 2007/06/30, 2007/07/07, 2007/08/04, 2007/08/11, 2007/09/08, 2007/09/15 obtiennent comme résultats : MPCC= 95.1 ; Kappa=92.499 Image d avril Image de septembre Maïs ensilage classé en Tournesol avant l ajout des échantillons de Maïs ensilage Image classée avec les dates de février, avril, mai, juin avec les 9dates Figure 4.10 : Image classée avec l ICM avec 4 dates et 9dates Dans la figure 4.9 comme celle 4.4, on note les haies qui se distinguent bien (en vert comme les zones boisées) et la parcelle le Maïs ensilage, classées soit en Tournesol, soit en Maïs suivant les dates. 80
4.3.2 Classifications avec le RPG La classification définitive a été réalisée avec les échantillons du RPG (voir ch 2) auxquels ont été rajoutés les échantillons de Bâti, Forêt, Friches, Eau qui n appartiennent pas au RPG, comme pour 2006. Elle a été réalisée avec 9 dates : 23/02, 20/04, 20/05, 30/06, 07/07, 04,08, 11/08, 08/09, 15/09 (icmso06_echv9_sup20lab400_1). La première moitié des échantillons d apprentissage a servi à tester la qualité de la discrimination des différents canaux, la matrice de confusion étant alors réalisée sur l autre partie des échantillons conservés pour la vérification. Tous les tests qui permettent de choisir les bonnes combinaisons sont faits avec les échantillons d apprentissage, les matrices de confusions avec les échantillons de vérifications. Plusieurs classifications ont été testées avec les 9 dates, classification de base, avec les 9 dates +le NDVI pour chaque date, avec uniquement le NDVI. Une première fusion a été réalisée de la classification de base avec les 9 dates et avec celles les 9 dates plus le NDVI de ces dates. Une classification avec seulement 5 dates : 20/04, 30/05, 30/06, 11/08, 15/09 auxquelles le NDVI et les canaux B2 et B3 pour les 4 août et 8 septembre ont été ajoutés, combinaison choisi d après la lecture des courbes spectrales (voir ch3), et les résultats de MPCC (avec les échantillons de vérification). Quelque soient les conditions de vérifications, les résultats sont proches de ceux avec les 9 dates. Une fusion avec cette classification et la précédente a permis d améliorer le tournesol toujours problématique qui absorbe les autres classes d été. Les confusions avec ces autres classes sont diminuées. Nous rappelons que nous avons essayé d améliorer les résultats des cultures d hiver en ajoutant deux dates d automne, tentative non concluante. Les résultats, au demeurant, étaient très corrects sans cela. La classe la plus problématique reste l orge, difficile à discriminer surtout du Blé. Une autre difficulté est que les combinaisons de canaux qui améliorent les matrices de confusion pour certaines classes, avec l échantillonnage de vérification, ne sont pas forcément les mêmes avec l échantillonnage complet. 81
2007 amélioration avec la segmentation Avec amélioration du sorgho Fusion avec b2b3 fusion dates 9 et 9 dates + NDVI 9dates fusion 9 dates et NDVI 9 dates + NDVI 20/04, 30/05, 30/06, 11/08, 15/09, NDVI B2 et B3 pour 4/08 et 8/09 NDVI feuillus 98.42 98.42 98.25 98.25 98.25 98.45 97.33 95.22 résineux 98.02 98.02 98.02 97.98 97.98 97.82 96.72 92.6 eucalyptus 93.88 93.88 93.96 93.05 92.78 92.68 90.02 60 blé 95.98 95.03 95.03 95.02 95.02 93.77 91 82.67 colza 99.3 98.66 98.8 98.71 98.7 98.29 98.04 92.57 orge 95.95 93.82 93.83 93.9 93.9 93.14 85.78 76.24 mais irrigue 97.16 95.87 95.86 95.6 95.51 95.75 93.06 76.39 tournesol 98.24 97.81 97.8 98.1 98.1 97.58 96.44 84.76 sorgho I 98.73 97.61 97.57 97.47 97.47 97.39 97.05 91.72 soja 96.57 95.67 95.67 95.07 95.1 95.38 92.65 75.69 pois 99.55 99.3 99.3 99.31 99.35 98.9 98.06 96.44 jachère/surfaces gel 64.29 60.67 60.64 59.43 56.49 54.6 38.33 32.53 friche 92.14 92.14 92.19 92.05 92.05 91.35 92.05 77.14 prairie temporaire 78.93 78.47 78.47 78.39 73.72 77.98 74.04 41.34 eau libre 99.46 99.46 99.33 98.5 99.11 99.32 99.39 98.27 lac 99.83 99.83 99.82 99.39 99.64 99.82 99.8 97.43 bâti dense 90.98 90.98 90.98 90.98 91.06 87.45 86.63 76.87 bâti industriel 93.8 93.8 93.8 93.22 93.36 90.04 90.76 59.74 gravières 99.74 99.74 99.71 99.12 99.12 99.71 99.7 93.56 peupliers 99.05 99.05 98.99 98.95 99.01 98.17 98.46 97.9 pré/prairie permanente 84.6 82.89 82.86 82.72 82.75 84.4 80.66 67.56 bâti diffus 96.52 96.52 96.43 96.52 96.52 92.65 88.88 78.35 surface minérale 99.62 99.62 99.62 99.62 99.62 99.05 99.24 94.85 mais ensilage 98.77 98.77 98.77 98.73 98.76 98.62 98.21 96.58 sorgho II 99.95 99.45 99.45 99.08 99.08 99.42 98.33 95.74 mais non irrigue 92.97 93.58 93.58 92.58 92.58 91.87 89 52.22 MPCC 94.71 94.19 94.18 93.91 93.66 93.22 91.14 80.17 Kappa 94.71 89.28 89.27 89.01 88.36 88.04 83.48 71.4 Tableau 4.5 : tableau des MPCC avec les différentes classifications et fusions avec l échantillonnage complet (se lit de gauche à droite pour suivre les améliorations) Remarque : Comme pour 2006, l opération de fusion entre les 9 dates et le NDVI ne donne pas le même résultat qu avec les 9 dates auxquelles le NDVI est ajouté lors de la classification. Le principe méthodologique permet de mieux intégrer les complémentarités des différentes classes. 82
2007 9 dates + ndvi fusion 9 dates avec ndvi 9dates 9dates +dates hiver 06 ndvi feuillus 85.6 84,24 76,45 78.64 76,48 résineux 81.62 79,47 77,99 78.03 81,33 eucalyptus 87.23 87,18 87,12 87.12 84,38 ble 92.55 92,42 92,48 94.95 81,68 colza 94.62 95,86 95,65 96.4 89,26 orge 57.79 63,71 62,57 57.07 64,45 mais irrigue 93.42 89,1 90,47 92.68 80,13 tournesol 95.22 91,75 94,98 97.52 81,65 sorgho I 44.94 58,46 58,09 0.06 60,06 soja 71.15 68,15 63,99 71.95 65,11 pois 53.06 56,58 46,34 42.16 56,15 jachere/surfaces gel 60.1 57,72 62,93 66.75 38,16 friche 79.51 77,65 77,65 76.37 68,43 prairie temporaire 72.2 63,25 68,72 67.59 46,58 eau libre 99.19 98,98 97,65 98.09 98,26 lac 96.61 93,2 64,31 67.93 90,35 bati dense 71.11 71,78 70 74.89 73,78 bati industriel 88.29 90,82 91,14 94.62 62,03 gravieres 94.5 95,24 64,97 34.37 90,25 peupliers 93.65 93,25 93,25 93.06 93,85 pre/prairie permanente 71.96 68,81 69,01 73.96 35,57 bati diffus 88.2 82,77 82,96 78.46 75,66 surface minerale 85.14 86,49 86,04 83.33 80,18 mais ensilage 94.17 96,69 96,12 89.56 94,79 sorgho II 0 1,33 0 0 1,37 mais non irrigue 76.92 73,77 69,9 31.83 41,38 MPCC 78.03 77,64 74,65 70.28 69,67 Kappa 81.07 79,24 78,56 79.6 66,99 Tableau 4.6 : MPCC avec les différentes classifications et fusions avec l échantillonnage d apprentissage, calculés sur l échantillonnage de vérification 83
2007 % d occupation Classification finale régularisée avec la segmentation % d occupation Surface en ha 1 feuillus. 773323 8.28 4949.267 2 résineux. 75382 0.81 482.445 3 eucalyptus. 25093 0.27 160.595 25 peupliers. 9099 0.1 58.234 16 friche. 536867 5.75 3435.949 15 jachère/surfaces gel. 902790 9.66 5777.856 17 prairie temporaire. 743596 7.96 4759.014 28 pré/prairie permanente. 842565 9.02 5392.416 4 blé. 1601865 17.15 10251.936 7 orge. 305687 3.27 1956.397 6 colza. 310126 3.32 1984.806 12 pois. 51521 0.55 329.734 8 mais irrigue. 989764 10.59 6334.49 42 mais non irrigue. 30846 0.33 197.414 40 mais ensilage. 28822 0.31 184.461 9 tournesol. 671439 7.19 4297.21 10 sorgho I. 15451 0.17 98.886 41 sorgho II. 6977 0.07 44.653 11 soja. 106517 1.14 681.709 18 eau libre. 35198 0.38 225.267 19 lac. 27740 0.3 177.536 24 gravières. 61363 0.66 392.723 20 bâti dense. 464530 4.97 2972.992 21 bâti industriel. 28752 0.31 184.013 32 bâti diffus. 674456 7.22 4316.518 38 surface minérale. 22869 0.24 146.362 26 classes Total 9342638 100 59792.883 Tableau 4.7: surface d occupation du sol avec la classification supervisée finale Ci-dessous la matrice de confusion finale 84
Figure 4.11 : classification supervisée finale 9 dates avec RPG 85
bâti bâti feuil res eyc blé colza orge M irri tourn sor I soja pois jach friche prair eau lac diffus indus gravi peup pré bâti d surfm ensil Non Sor II irrig feuillus 98.42 0.15 0 0.01 0 0 0.13 0 0 0 0 0.05 1.12 0.02 0 0 0.02 0 0 0 0.04 0.04 0 0 0 0 résineux 1.44 98.02 0.3 0 0 0 0 0 0 0 0 0 0.01 0 0 0 0.01 0 0 0.05 0.09 0.07 0 0 0 0 eucalyptus 0.32 0.12 93.88 0 0 0 0 0.98 0 0 0 1.82 2.03 0.25 0 0 0.04 0 0 0 0.44 0.06 0 0 0 0.08 ble 0 0 0 95.98 0.01 0.77 0.07 0.53 0 0 0.02 0.75 0.11 0.96 0 0 0.09 0 0 0 0.48 0.08 0 0.06 0 0.09 colza 0 0 0 0 99.3 0 0.05 0.13 0 0 0.07 0.32 0 0.08 0 0 0 0 0 0 0.02 0.01 0 0 0 0 orge 0.01 0 0 1.3 0 95.95 0.16 0.02 0 0.04 0 1.04 0.1 0.92 0 0 0.1 0 0 0 0.3 0.06 0 0 0 0 mais irrigue 0 0 0 0 0.08 0 97.16 0.8 0.16 0.96 0 0.06 0 0 0 0 0.01 0 0 0 0.01 0.01 0 0.7 0 0.05 tournesol 0 0 0 0 0 0 0.68 98.24 0 0.34 0.05 0.45 0.03 0.01 0 0 0.08 0 0 0 0.04 0.04 0 0.03 0 0 sorgho I 0 0 0 0.05 0 0 0 0.02 98.73 0 0 0.85 0 0 0 0 0.29 0 0 0 0.02 0 0 0 0 0.02 soja 0 0 0 0 0.57 0.88 0 1.22 0 96.57 0 0.24 0 0.21 0 0 0.05 0 0 0 0.02 0 0.02 0 0 0.22 pois 0 0 0 0 0 0 0 0 0 0 99.55 0.22 0 0.2 0 0 0 0 0 0 0.01 0.01 0 0 0 0 jachere/surfas gel 0.02 0 0 0.38 0 0.7 0 3.06 0 0.01 0.03 64.29 13.4 10.75 0 0 0.09 0 0 0.03 5.86 0.12 0.04 0.07 0 1.14 friche 3.57 0 0 0.85 0 0 0.05 0 0 0 0 1.69 92.14 0.33 0 0 0.19 0 0 0 0.8 0.38 0 0 0 0 prairie temporaire 0.05 0 0 1.13 0.34 0.11 0.07 0.58 0 0 0.58 6.55 1.91 78.93 0 0 0.13 0 0 0 9.47 0.13 0 0 0 0 eau libre 0.1 0.01 0 0 0 0 0 0 0 0 0 0.02 0.01 0 99.46 0 0.17 0 0.02 0 0.04 0.17 0 0 0 0 lac 0 0 0 0.02 0 0 0 0.09 0 0 0 0.01 0 0.04 0 99.83 0.01 0 0 0 0 0 0 0 0 0 bati dense 0 0 0 0 0 0 0 0.08 0 0 0 0.08 0.08 0 0 0 90.98 0.41 0 0 0.08 6.81 1.48 0 0 0 bati industriel 0 0 0 0 0 0 0 0.14 0 0 0 0 0 0 0 0 1.88 93.8 0 0 0 1.73 2.45 0 0 0 gravieres 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.06 0 0.14 0.01 99.74 0 0 0 0.04 0 0 0 peupliers 0.67 0 0 0 0 0 0 0 0 0 0 0.02 0.08 0 0 0 0 0 0 99.05 0.13 0.04 0 0 0 0 pre/prairie permanente 0.36 0.01 0 0.24 0.04 0.03 0 0.03 0 0 0 1.49 1.99 10.04 0 0 0.31 0 0 0 84.6 0.36 0 0 0 0.48 bati diffus 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 3.48 0 0 0 0 96.52 0 0 0 0 surface minerale 0 0 0 0 0 0 0 0 0 0 0 0.19 0 0 0 0 0.19 0 0 0 0 0 99.62 0 0 0 mais ensilage 0 0 0 0.01 0 0.02 0.06 0.66 0 0.18 0 0.19 0 0.03 0 0 0.03 0 0 0 0.05 0.01 0 98.77 0 0.01 sorgho II 0 0 0 0 0 0 0.05 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 99.95 0 mais non irrigue 0.18 0 0 0 0 0 0.12 1.01 0 0 0 2.93 0.82 1.68 0 0 0 0 0 0 0.27 0 0 0 0 92.97 Surclassés Kappa par classe 6.73 0.3 0.3 3.98 1.04 2.51 1.44 9.37 0.16 1.53 0.75 19 21.69 25.54 0.06 0 7.29 0.43 0.02 0.09 18.17 10.13 4.04 0.85 0.00 0.08 98.37 98 93.83 94.58 99.26 95.73 96.65 98.09 98.73 96.48 99.54 61.18 91.98 77.51 99.45 99.83 90.96 93.79 99.74 99.05 83.58 96.52 99.62 98.74 99.95 92.94 86
4.4 Classifications supervisées 2008 Collectes terrain 2008 et travaux du sol Au cours de l'année 2008 : 14 sorties terrain ont permis le suivi de 650 parcelles. Environ 300 parcelles de cultures ont été revisitées pendant les 14 sorties. Ce suivi permet de minorer les erreurs au niveau de la prise d échantillons (certaines dates présentent des confusions entre des cultures) et de faire un suivi spécifique de l état de croissance de chaque parcelle et des travaux du sol. Pour les classifications 2008 : 501 parcelles sont retenues pour déterminer l'occupation du sol de 2008. 11 images Formosat réparties sur l année (pas d image entre le 11/02/08 et le 19/06/08) Voir tableau des échantillons (voir tableau 2.7 p27). Dates de prise de vue Qualité générale de l'image Images retenues pour la segmentation et la classification supervisée 1 Date sorties terrain 11/02/2008 Nuages dans la zone Centre-Ouest 19/06/2008 2 24/06/2008 26/06/2008 Nuages partie ouest Non utilisées pour classif 01/07/2008 OS 08 10/07/2008 3 17/07/2008 31/07/2008 4 27/08/2008 21/08/2008 5 29/08/2008 28/08/2008 Nuages éparpillés dans Non utilisées pour classif l image OS 08 19/09/2008 25/09/2008 6 29/09/2008 06/10/2008 7 09/10/2008 10/10/2008 8 20/10/2008 26/10/2008 9 31/10/2008 12/11/2008 09/12/2008 Tableau 4.8 : Dates des prises de vues des images Formosat 2008 et qualités des images, 9 dates retenues pour déterminer l Occupation du sol 2008 Classification Apres l étude des meilleures dates pour la discrimination des classes, la première classification supervisée (icmso08_4supab400.cla) a été réalisée avec 9 dates : 11/02/2008, 19/06/2008, 10/07/2008, 31/07/2008, 21/08/2008, 25/09/2008, 06/10/2008, 10/10/2008, 26/10/2008. Les dates du 26/06/2008, 28/08/2008 n ont pas été choisies à cause de nuages trop importants, de plus, ces dates sont très proches des autres dates utilisées. 87
L image de février contient quelques nuages, toutefois elle a été utilisée pour le colza, cette seule date permet de le discriminer, car on ne dispose pas vraiment de date de printemps. Nous avons vu qu avril est très important pour la discrimination de cette classe. La segmentation a utilisé 7 dates (seuil 9), sans les dates 6/10 et 26/10, qui, à cette période, ne représentent plus les parcelles de l année en cours, mais révèlent les cultures d hiver de l année suivante. Une classification avec les 9 dates sans le B1 a donné des plus faibles, ce qui indique que ce canal est nécessaire, d un apport toutefois peu élevé. Vérifications Sur le total des échantillons Sur les échantillons d apprentissage Sur les échantillons de vérification (statistique sur l apprentissage) Avec B1 sans B1 avec B1 Sans B1 avec B1 Sans B1 MPCC 96.19 95.95 97.97 97.62 70.54 70.05 Kappa 96.13 95.86 98.43 97.94 74.70 74.28 Tableau 4.9 : résultats des matrices de confusion sans B1 et avec B1 Pour la classification qui est markovienne le contexte sur ces images s est avéré important avec un grand nombre d image, ainsi, dans le calcul des probabilités, le coefficient pour les paramètres de contraintes spatiales est élevé (4.00), ce qui permet de tenir compte du voisinage de façon plus importante [Ducrot D.et al]. Les améliorations Plusieurs traitements ont permis d améliorer les résultats de la classification initiale. 1. Le Tournesol est confondu avec les autres cultures d été, principalement avec le Maïs. Le choix de dates pour le discriminer de façon plus efficace a été difficile, car aux dates présentes, les réponses spectrales sont similaires. La meilleure solution a été d ajouter une sous classe : le Tournesol tardif (classe 39). Les parcelles n 102, 105, 125, 267, 269, 812, 901, 902, 904, 905, 906, 924, 909 et 460 ont donné des échantillons de Tournesol tardif. Une sous classe avait déjà été adjointe : le Tournesol particulier qui est très hétérogène à certaines dates. Dans certaines diagonales de matrice de confusions les pourcentages de bien classés sont faibles pour cette classe, mais il ne se mélange qu avec le Tournesol, et l introduction de cette classe évite des mélanges du tournesol avec d autres cultures d été (voir chapitre 2). Une nouvelle image des échantillons a été crée avec ajout du Tournesol tardif (sofm08_4.ech). Deux jeux pour l apprentissage et la vérification sont obtenus grâce à la séparation de ces échantillons. Le Tournesol est mieux classé avec la prise en compte du Tournesol tardif, mais quelques confusions, qui n'existaient pas auparavant, sont générées au niveau du Sorgho ; auparavant les seules confusions étaient avec le Maïs. Globalement les résultats sont améliorés (icmso08_4supab400.cla) (tableau 4.11). 2. Une classification a été réalisée sans la date de février car des classes sous les nuages sont classées pour la plupart du temps en Bâti diffus ou industriel. Cette classification a été fusionnée avec la première classification (icmso08_4_supab400ssfev.cla). Ainsi, lorsque des pixels sont classés en Bâti diffus sur la première classification et dans des classes différentes sans la date de février, la classe Bâti diffus est remplacée par la classe de cette dernière classification. On a pu éliminer les nuages qui se confondent avec les surfaces minérales, toutefois certains pixels de la classe Bâti diffus ont basculé vers le Bâti dense (4.53%), (tableau 4.11), ce qui a 88
diminué le MPCC de 0.08%, mais globalement l image est plus correcte et la différence de définition entre ces deux classes n est pas stricte. Cette fusion de classifications a permis de garder l avantage d avoir la date de février, seule date de printemps, pour le Colza,. De plus, on note en février la présence de beaucoup de sols nus ce qui entraîne des confusions avec le Bâti, la fusion contribue donc à une amélioration supplémentaire. Les figures 4.12 montrent les nuages avec la classification des 9 dates (avec février) qui sont classés en Bâti, dans la forêt (à l intérieur du carré rouge), après la fusion de la classification sans février la forêt est à nouveau visible (a) (b) Figure 4.12 : première classification avec les 9 dates puis avec le ndvi ajouté, puis avec la fusion de l image sans février ( c) 3. Pour améliorer l Eau qui est parfois confondue avec les routes (voir rapports précédents avec SPOT), une fusion avec une image classée uniquement avec les canaux PIR et MIR permet de pallier ce problème. Ne possédant pas le MIR, La solution a été d ajouter les NDVIs aux autres canaux. 89
Ainsi, les classes Eau, Lac ou Gravière dans la classification précédente (icmso08_4supab400_fusssfev.cla) ont pu être améliorées grâce à l ajout du NDVI de chaque date aux autres bandes spectrales de Formosat(icmso08_4_ndvi_supab400), qui permet de mieux les distinguer, ainsi que le Blé qui présente parfois des confusions avec le Bâti (figure 4.13). Ces deux classifications ont été fusionnées, les classes Eau, Lac ou Gravière correspondent à la deuxième classification, ainsi que le Bâti pour le Blé. La classification avec l ajout du NDVI, n apportait pas, globalement, de meilleurs résultats, c est la fusion de ces deux classifications qui donne l amélioration (tableau 4.11). (a1) (b1) ( a2 ) ( b2 ) Figure 4.13 : (a) classification avec les 9 dates, (b) avec le NDVI ajouté ; (b1) des petits lacs apparaissent alors qu ils étaient classés en Bâti, (b2) le bord du lac cette année 2008 n est pas très rempli et sont classés en blé, ce qui est corrigé avec le NDVI ajouté, classé en surface minérale. 90
Bien classés 9 dates 9 dates + ndvi 9 dates 9 dates + ndvi 9 dates 9 dates + ndvi apprent ndvi apprent apprent total ndvi total total verif ndvi verif verif feuillus 98,43 98,53 96,08 96,9 96,51 94,7 76,95 78,77 68,68 résineux 97,17 96,65 97,32 96,82 96,55 96,79 86,08 90,02 84,84 eucalyptus 93,96 92,61 64,72 73,84 71,79 59 51,74 45,8 45,37 ble 99,02 99,03 87,08 96,28 97,25 71,05 85,37 89,66 66,08 colza 99,64 99,61 95,04 99,11 98,76 86,63 74,6 75,38 66,39 orge 98,85 98,55 95,1 97,41 97,39 76,09 2,19 2,24 3,78 mais 99,82 99,74 92,69 99,13 98,83 90,86 90,18 89,32 77,6 tournesol 99,64 99,26 74,62 96,91 96,64 72,61 99,01 98,88 82,04 sorgho 98,01 98,32 98,01 98,17 98,23 96,68 30,38 45,71 43,61 soja 97,62 98,12 93,97 97,42 97,33 94,26 95,98 95,45 92,04 jachere/surfaces gel 97,06 97,55 92,12 93,65 96,01 74,49 41,57 48,62 53,37 friche 94,07 91,86 62,2 91,64 92,25 71,96 66,8 62,53 47,25 prairie 94,78 95,6 85,46 92,61 92,46 76,64 78,52 76,98 69,4 eau libre 98,44 98,73 92,31 97,41 98,42 91,43 96,78 97,6 92,99 lac 99,79 99,96 96,84 99,68 99,82 94,1 30,32 82,33 77,79 bati dense 94,83 94,83 93,97 96,06 93,91 93,19 77,91 74,85 83,44 bati indus/surf mineral 98,61 98,61 88,89 98,2 97,12 88,49 96,27 94,78 80,6 gravieres 99,67 99,72 93,02 99,83 99,84 93,19 55,04 82,65 92,64 peupliers 98,28 98,56 97,65 97,87 98,02 96,84 97,42 97,02 98,41 bati diffus 100 100 91,07 97,46 96,38 87,5 98,78 98,48 87,8 biculture 96,57 96,11 89,37 95,47 95,23 76,78 41,05 42,48 45,58 tournesol particulier 96,92 96,92 98,24 96,91 97,77 95,37 59,27 58,99 91,85 surface minerale 100 99,37 96,54 99,82 98,9 93,96 95,18 92,54 76,32 tournesol tardif 100 100 99,91 100 99,95 98,81 65,69 56,78 47,96 MPCC 97,97 97,84 90,51 96,19 96,06 86,31 70,55 74,08 69,83 Kappa 98,43 98,43 89,93 96,13 96,18 82,69 74,7 78,05 66,11 Tableau 4.10 : comparaison des pourcentages de biens classés en fonction des échantillons d apprentissage (apprent) ou de vérification (verif) ou tous les échantillons rassemblés (total), avec le NDVI seul, le NDVI ajouté aux canaux de base, et avec les canaux de base seuls 4. Amélioration par un filtre sur les régions de la segmentation L application du filtre majoritaire avec la segmentation (lab2cla07) en fixant certaines classes : Feuillu, Eau, Bâti, Surfaces minérales, afin de protéger principalement les structures linéaires tel que les chemins, les haies, mais aussi la classe Feuillu et certains objets de type Friche, qui sont souvent en bordure de route ou de champs (icmso08_4supab4009lab.cla). 91
( a ) ( b ) Figure 4.14 : (a) classification non régularisée (b) régularisée, les parcelles sont très nette, mais également les contours, les routes sont conservées 5. Fusion pour distinguer plusieurs type de Bâti, Surface minérale, Routes, Haies avec la classification non supervisée. (icmso08nonsup_labok1.cla, icmso08_4supab400_fusssfevndvi_bati). La classification non supervisée qui utilise la segmentation présente des structures très nettes, les objets fins et linéaires sont bien dessinés, l introduction de ces objets dans la classification est un plus qui rend l image plus lisible et ajoute à son exactitude. Dans les figures (4.15) on peut voir l apport de la classification non supervisée qui détaille bien les villages, par exemple pour Auradé, on distingue bien les bordures végétales (talus, haies ) en vert clair, des rues et des maisons en différentes teintes de rose. Ces objets ne sont pas intégrés dans la classification supervisée, les échantillons étant trop fins. (a) composition colorée Formosat du 10 juillet 08 (b) classification régularisée (c) fusion avec la classification non supervisée pour le bâti 92
(d) composition colorée Formosat du 10 juillet 08 (e) classification régularisée (f) fusion avec la classification non supervisée pour le bâti Figure 4.15 : détail des différents types de Bâtis et Surfaces minérales fusion avec fusion 9 dates 9 dates 9 dates + 8 dates 9 dates %des bien classés finale 9 dates & NDVI avec 8 dates ndvi sans fev sans tournesol sans fev tardif feuillus. 97.88 97 97 96.9 96.51 96.4 97.07 résineux. 97.05 96.81 96.82 96.82 96.55 96.15 96.87 eucalyptus. 74.53 73.84 73.84 73.84 71.79 70.41 73.32 ble. 97.48 96.16 96.32 96.28 97.25 92.44 96.45 colza. 99.33 99.11 99.11 99.11 98.76 98.05 98.89 orge. 99.06 97.41 97.41 97.41 97.39 95.87 96.72 mais. 99.6 99.13 99.13 99.13 98.83 98.75 98.61 tournesol. 99.12 96.95 96.95 96.91 96.64 93.08 95.72 sorgho. 100 98.17 98.17 98.17 98.23 97.48 98.28 soja. 97.36 97.42 97.42 97.42 97.33 97.09 99.56 jachere/surfaces gel. 97.75 93.65 93.65 93.65 96.01 93.11 94.26 friche. 90.27 91.64 91.64 91.64 92.25 91.19 91.16 prairie. 95.16 92.76 92.76 92.61 92.46 88.73 92.89 eau libre. 99.73 99.73 97.47 97.41 98.42 97.28 97.49 lac. 99.95 99.95 99.71 99.68 99.82 99.68 99.68 bati dense. 96.06 96.06 96.06 96.06 93.91 94.98 96.77 bati industriel/surf minerale. 98.2 98.2 98.2 98.2 97.12 97.48 98.2 gravieres. 99.91 99.91 99.83 99.83 99.84 99.78 99.84 peupliers. 98.97 97.87 97.87 97.87 98.02 98.27 97.83 bati diffus. 95.47 95.11 95.11 97.46 96.38 95.29 98.01 biculture. 93.32 95.47 95.47 95.47 95.23 92.15 95.93 tournesol particulier. 100 96.91 96.91 96.91 97.77 96.74 97.26 surface minerale. 99.82 99.82 99.82 99.82 98.9 99.27 99.63 tournesol tardif. 100 100 100 100 99.95 99.95 MPCC 96.92 96.21 96.11 96.19 96.06 94.98 96.11 Kappa 97.23 96.23 96.16 96.13 96.18 94.31 95.99 Tableau 4.11: améliorations successives (se lit de droite à gauche) en fonction des étapes décrites précédemment Avec l échantillonnage de vérification, les résultats sont similaires pour le choix des combinaisons (avec des pourcentages plus faibles). 93
Le Bâtis diffus est ventilé vers plusieurs classes non supervisées qui détaillent cette classe, 0.54%, 2.36%, 18.66%, 37.14%, 12.32%,20.47%, 4.71%, 3.80% (pourcentages donnés à partir de la matrice de confusion sur cette classification). Lorsque l on regroupe tous les bâtis ensemble on obtient 100% de bien classés sur cette classe, ce qui fait progresser le MPCC. N des classes CLASSE EFFECTIFS FREQUENCES (%) SURFACE (Ha) 1 feuillus. 1139554 10.60 7293.146 2 résineux. 91045 0.85 582.688 3 eucalyptus. 51233 0.48 327.891 25 peupliers. 13180 0.12 84.352 4 ble. 2052063 19.09 13133.203 6 colza. 406601 3.78 2602.246 7 orge. 75663 0.70 484.243 8 mais. 1157195 10.77 7406.048 9 tournesol. 1127494 10.49 7215.962 37 tournesol particulier. 1462 0.01 9.357 39 tournesol tardif. 59277 0.55 379.373 10 sorgho. 7571 0.07 48.454 11 soja. 67138 0.62 429.683 36 biculture. 9930 0.09 63.552 15 jachere/surfaces gel. 532097 4.95 3405.421 16 friche. 608635 5.66 3895.264 17 prairie. 1231136 11.46 7879.270 18 eau libre. 65391 0.61 418.502 19 lac. 21075 0.20 134.880 24 gravières. 48177 0.45 308.333 20 bâti dense. 80711 0.75 516.550 bâti indus/surf 21 minérale 17429 0.16 111.546 32 bâti diffus. 1811745 16.86 11595.168 38 surface minérale. 71339 0.66 456.570 24 classes 10747141 100.00 68781.719 Tableau 4.12 : pourcentage et surface d occupation du sol par classes Ci dessous matrice de confusion de la classification finale MPCC (moyenne des pixels correctement classés = 96.92 % Kappa = 97.23% 94
Feuillus Résineux Eucalyptus blé colza orge mais tourne sol sorgho soja. jacher /surfg el friche. prairie. eau libre lac. bâti dense. bâti indus/ surf miner Gravieres. bâti diffus Peupliers. Biculture. Tournesol particu lier. surfac min erale tourne sol tardif feuillus. 97.88 0.13 0.01 0.00 0.00 0.00 0.13 0.00 0.00 0.00 0.00 1.41 0.40 0.00 0.00 0.00 0.00 0.00 0.01 0.03 0.00 0.00 résineux. 1.57 97.05 1.22 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.02 0.00 0.00 0.00 0.00 0.00 0.15 0.00 0.00 eucalyptus. 0.91 22.22 74.53 0.33 0.00 0.00 0.00 0.00 0.00 0.00 0.00 1.97 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.05 0.00 0.00 blé. 0.01 0.00 0.00 97.48 0.46 0.00 0.09 0.00 0.00 0.00 0.14 0.00 1.39 0.00 0.00 0.00 0.00 0.00 0.00 0.42 0.00 0.00 colza. 0.00 0.00 0.00 0.52 99.33 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.15 0.00 0.00 orge. 0.02 0.00 0.00 0.76 0.00 99.06 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.17 0.00 0.00 mais. 0.00 0.00 0.00 0.01 0.00 0.00 99.60 0.37 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.02 0.00 0.00 tournesol. 0.00 0.00 0.00 0.00 0.00 0.00 0.00 99.12 0.00 0.00 0.79 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.02 0.00 0.00 sorgho. 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 100.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 soja. 0.00 0.00 0.00 0.00 0.00 0.00 2.63 0.00 0.00 97.36 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.01 0.00 0.00 jachère/surfaces gel. 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 97.75 1.45 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.79 0.00 0.00 friche. 8.89 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 90.27 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.84 0.00 0.00 prairie. 0.00 0.00 0.00 0.16 0.12 0.00 0.00 0.00 0.00 0.00 0.39 3.44 95.16 0.00 0.00 0.00 0.00 0.00 0.00 0.74 0.00 0.00 eau libre. 0.10 0.00 0.01 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 99.73 0.00 0.02 0.00 0.00 0.00 0.12 0.00 0.00 lac. 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 99.95 0.02 0.00 0.00 0.00 0.03 0.00 0.00 bâti dense. 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 96.06 0.00 0.00 0.00 3.94 0.00 0.00 bâti indus/surf minérale 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 98.20 0.00 0.00 1.44 0.00 0.00 gravières. 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.07 0.00 0.01 0.00 99.91 0.00 0.01 0.00 0.00 peupliers. 0.90 0.00 0.02 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 98.97 0.11 0.00 0.00 bâti diffus. 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 4.53 0.00 0.00 0.00 95.47 0.00 0.00 biculture. 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 6.07 0.00 0.00 0.00 0.00 0.00 0.00 0.61 93.32 0.00 tournesol particulier. 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 100.00 surface minérale. 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.18 0.00 0.00 0.00 0.00 0.00 0.00 tournesol tardif. 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.01 0.00 0.00 0.00 0.00 0.00 0.01 0.00 0.00 0.07 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.02 0.00 0.00 0.00 0.00 0.00 0.36 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 99.82 0.00 0.00 100.00 Surclassés 12.39 22.34 1.26 1.77 0.58 0.00 2.85 0.37 0.00 0.00 1.32 8.27 7.86 0.08 0.00 4.76 0.00 0.00 0.01 9.65 0.00 0.00 0.40 0.07 Kappa par classes 97.55 96.87 73.86 96.88 99.29 99.03 99.52 99.06 100.00 97.27 97.71 90.18 94.91 99.72 99.95 96.05 98.20 99.91 98.95 95.45 93.26 100.00 99.82 100.00 95
4.5 Comparaison des données PAC Graphique avec les classifications FORMOSAT Dans les tableaux 4.13 à 4.15, nous avons comparé la PAC graphique complète en terme d occupation du sol avec les résultats de la classification sur les données FORMOSAT. Rappelons que la classification 2008 a été effectuée avec les échantillons collectés par le Cesbio, alors que les classifications de 2006 et 2007 l ont été avec le RPG. On constate que quelque soient les échantillons utilisés pour la classification les résultats des surfaces et pourcentages sont pratiquement similaires dans le RPG et la classification. Mais, en 2006 le Tournesol présente une surface plus importante dans la classification, ainsi qu en 2007 dans une moindre mesure. Notons que, certaines parcelles sont déclarées dans le RPG en surface de culture industrielle qui peut être du tournesol. Ainsi, nous n avons pas pu prendre en considération ces surfaces, ce qui explique en partie ces différences. Une autre explication peut provenir du fait que les cultures hétérogènes en fin de cycle (fin août) se retrouvent en Tournesol dans la classification. Cette classe est elle même pratiquement toujours hétérogène. Ceci favorise le regroupement de tout type d «objets» hétérogènes dans cette classe (figure 4.16). Les figures 4.17 et 4.18 montrent un exemple de parcelle hétérogène, qui peut être mal classée. En 2008, nous avons choisis 3 sous-classes de Tournesol qui est ainsi mieux classé, il englobe moins d autres objets. L orge est sous estimée en 2008, mais nous avions très peu d échantillons : des parcelles ont basculé en Blé ou Prairie. Figure 4.15 : Mais hétérogène (11/08/07) dont une partie ressort en Tournesol (malgré tous les traitements) PAC (RPG) FORMOSAT 2006 Surface ha % Surface ha % Différence FORMOSAT- PAC Blé +Sorgho 10015.32 17.98 10138.61 18.20 123.29 Orge 1408.20 2.53 1352.57 2.43-55.63 Colza 1171.26 2.10 1170.87 2.10-0.39 Mais 6590.38 11.83 6069.58 10.89-520.80 Tournesol 4719.28 8.47 5752.82 10.33 1033.54 Soja 757.59 1.36 820.17 1.47 62.58 Pois 316.93 0.57 316.35 0.57-0.58 Tableau 4.13: pourcentage et surface d occupation du sol par classes 96
PAC (RPG) FORMOSAT Différence FORMOSAT- PAC 2007 Surface ha % Surface ha % ha Blé +Sorgho 10615.35 17.75 10395.48 17.39-219.87 Orge 1891.67 3.16 1956.40 3.27 64.73 Colza 1877.07 3.14 1984.81 3.32 107.74 Mais 6501.63 10.87 6716.37 11.23 214.73 Tournesol 3665.70 6.13 4297.21 7.19 631.51 Soja 535.25 0.90 681.71 1.14 146.46 Pois 343.82 0.58 329.73 0.55-14.09 Tableau 4.14 : pourcentage et surface d occupation du sol par classes 2008 SURFACE (Ha) % PAC (RPG) FORMOSAT Différence FORMOSAT- PAC SURFACE (Ha) % ha Blé + Sorgho 14775.34 21.48 13181.657 19.16-1593.683 Colza 2729.47 3.96 2602.246 3.78-127.224 orge. 2305.55 3.35 484.243 0.70-1821.307 mais. 7458.52 10.84 7406.048 10.76-52.472 tournesol. 7782.68 11.31 7604.692 11.05-177.988 soja. 515.68 0.75 429.683 0.62-85.997 Tableau 4.15 : pourcentage et surface d occupation du sol par classes Figure 4.16 : Tournesol très hétérogène et présence d adventices (24 juin 2008) 97
Figure 4.17 : photo d une même parcelle de Maïs, hétérogène sur la partie supérieure de la photo et avec un développement moins important (17 juillet 2008) 4.6 Conclusion sur les classifications Les divers indices autre que le NDVI n on pas apporté d amélioration, le principe de fusion de classifications s avère plus efficace, car la complémentarité des canaux augmente la discrimination des classes dans le processus de la classification. Le nombre de dates étant important, des données supplémentaires ne sont pas toujours utiles, cela peut entrainer une diminution du taux de bien classés. Le choix des dates est important pour les cultures, ce qui prouve l avantage de la haute répétitivité Une culture délicate à discriminer est le Tournesol, qui est en général surestimé car il est confondu avec le Mais, le Sorgho et la Prairie dans une moindre mesure. La façon la plus efficace de le discriminer a été l utilisation de B2 et B3 seuls pour 2 dates (4 août, 8 septembre) combinées à 5 autres dates bien choisies 20/30, 5/04, 6/30, 11/8, 15/9 dans une classification et de fusionner cette classification avec la précédente. Certaines pratiques culturales, telles les cultures dérobées (c'est-à-dire deux cultures par année sur la même parcelle, culture intermédiaire à croissance différée) engendrent des confusions au niveau de la classification. Ceci est difficile à maîtriser, mais doit être considéré au regard de la réglementation qui préconise ces pièges à nitrates et qui diminuent l érosion des sols. Les objets fins comme certaines routes, chemins et haies se distinguent avec FORMOSAT La conclusion la plus importante est que l on ne peut reproduire systématiquement les mêmes combinaisons chaque année car : on n a pas forcément les mêmes dates, grande variabilité des résultats de classification suivant le jeu d échantillons RPG ou vérité terrain les pratiques culturales peuvent également varier pour des raisons très diverses climatologique, raison personnelle de l agriculteur 98
5 - ANALYSE DE PAYSAGE 5.1 Concepts et définitions L écologie du paysage s intéresse principalement à l évolution et à la dynamique de l hétérogénéité spatiale sous l action de l Homme, aux interactions et aux échanges entre paysages, à l influence de l hétérogénéité spatiale sur les processus biotiques et abiotiques (Risser et al. 1983). Cette discipline est fondée sur l étude des relations entre les processus écologiques et la structure spatiale du paysage (Burel et al. 1999). D après plusieurs études, le paysage possède des seuils critiques pour des variables environnementales comme la fragmentation de l habitat, le nombre ou la longueur des frontières ou encore la fréquence des perturbations, seuils au-delà desquels la réponse des processus écologiques peut s avérer drastique (Turner et al.1991). Urban et al définissent le paysage comme un système formé par une mosaïque de parcelles. L unité élémentaire du paysage (UEP) ou «patch» en anglais, est vue comme une aire homogène au sens écologique et constituée de pixels contigus, avec des frontières précises au sens physique ou biologique, bien que cela soit difficile à identifier dans la nature, car le passage d une unité à une autre se fait graduellement. Ce qui importe au niveau du paysage est la façon dont les UEPs sont connectées, on parlera de connectivité pour décrire leurs relations, en distinguant une connectivité structurale qui s'applique aux relations spatiales et une connectivité fonctionnelle pour tout ce qui a trait aux échanges entre éléments du paysage. Les recherches sur la mosaïque paysagère ont porté essentiellement sur les effets de taille et la forme des éléments (plus ils sont grands et compacts, moins ils sont soumis aux influences des éléments voisins). Un autre aspect concerne la mise en place des mosaïques paysagères, des facteurs qui régulent leurs évolutions ; il existe actuellement des méthodes permettant de mesurer la part de différents groupes de variables dans cette organisation. Parmi ces variables il y a celles qui ont trait au milieu physique, aux pratiques agricoles, qui sont elles-mêmes contraintes par les structures spatiales (distance à l'exploitation, taille des parcelles...). L'écologie du paysage n'a pas pour prétention de couvrir l'ensemble du champ de l'écologie ; elle intègre, par exemple les résultats obtenus à d'autres niveaux d'organisation, comme les éléments de la mosaïque paysagère (bois, champs, prairies...) ; elle amène généralement à voir que plusieurs niveaux d'organisation agissent simultanément sur un processus (l'érosion dépend des caractéristiques des parcelles mais également des flux d'eau venant d'autres parcelles, qui, eux, sont régulés par des fossés, talus, bandes herbeuses hors de l'espace cultivé). Cette démarche disciplinaire apparaît comme étant le moyen d'aborder les processus écologiques aux niveaux micro et mésorégionaux (ceux des systèmes agraires) et donc de pouvoir discuter avec d'autres disciplines (économie, sociologie) qui sont presque seules à travailler à ces niveaux. PAYSAGE Un paysage est une portion de surface terrestre à étudier. En général ce sera la surface que représente une image satellite, de plusieurs kilomètres carrés au sol, qui a été traitée afin de reconnaître à quelle classe chaque pixel appartient. Echelle des îlots : Un patch (ou UEP) correspond à un îlot qui est un ensemble de parcelles, agricoles ou autres, adjacentes. Ainsi, s il y a plusieurs parcelles de blé adjacentes, l ensemble de 99
ces parcelles forment l îlot, ce qui correspond à un ensemble connexe de pixels dans l image classée. LES CLASSES La valeur d un pixel sera affectée à une classe qui correspond à la nature de la surface qu il représente. Ces classes sont données par le thématicien qui connaît la région à étudier. La classification permet de passer d une image issue de la télédétection à une image classée. Les classes sont alors caractérisées par leur nom, ou leur indice dans l image classée. LES UNITES ÉLEMENTAIRES DU PAYSAGE (UEP) OU PATCHES Un patch est un ensemble de points connexes ayant la même classe. La frontière d un patch avec ses voisins défini le contour du patch. Le périmètre du patch est défini à partir de la frontière extérieure. La différence entre ces deux notions se fait dans le cas ou un patch comporte des trous. Prenons un exemple : une forêt avec une clairière. Ils constituent deux patches. Le périmètre de la forêt est de manière logique le périmètre extérieur. Le contour de la forêt donnera la somme du périmètre de la forêt et de celui de la clairière. Les deux indications qui en ressortent sont bien distinctes et peuvent mener à des études complémentaires. OBJECTIF L objectif est de caractériser le paysage (assemblage proportionné de classes d occupation du sol) à partir des UEPs décrites par leur nature (aire, périmètre, taille, densité,...), par leur forme (contour, indice de forme et dimension fractale), par divers indices relatifs à leur agencement dans l espace (distance entre éléments de la classe) et par rapport aux autres classes (juxtaposition et voisinage) à partir d images satellites de différentes résolutions (SPOT 20m, FORMOSAT 8m) et d une photographie aérienne (50cm). Cette partie vise en particulier à répondre à diverses questions concernant : o l intérêt des indices paysagers dans l analyse du paysage à partir de données satellites. o l analyse du paysage à différentes échelles à partir de satellites différents. o les descripteurs du paysage dans l analyse d un paysage urbain. 5.2 - Les images Les images SPOT (résolution 20 m et FORMOSAT (résolution 8m) ont été mise à la même résolution (logiciel ENVI Layer Stacking), c est à dire FORMOSAT à la résolution de SPOT, puis la partie de l image SPOT a été découpée sur l empreinte de FORMOSAT (figure 5.1 et 5.2). La zone commune aux deux images a été extraite. Une photographie aérienne de l'aire urbaine toulousaine, préalablement classée d'une résolution de 50 cm par pixel, a également été étudiée. La zone d étude se situe au sud est de Saint-Martin-du- Touch, village situé dans la zone étudiée (figure 5.3). Les dates pour SPOT et FORMOSAT sont respectivement 2004 et 2008, 4 années d intervalle, mais 2004 était la classification la plus intéressante, et 2008 la 1 ière terminée des images FORMOSAT. 100
Figure 5.1 : classification SPOT 2004 Figure 5.2 : classification FORMOSAT 2008 Figure 5.3 : Photographie aérienne classée d une zone urbaine près de Toulouse 5.3 Analyse de l hétérogénéité L étude de l hétérogénéité des classes présentes dans une image, constitue une information importante pour la caractérisation du paysage. L écologie du paysage s intéresse particulièrement à 101
l influence de l hétérogénéité spatiale sur les processus biotiques et abiotiques (le vivant et le non vivant tel que l air, la température). Les paysages sont par nature hétérogènes et soumis à une dépendance d échelle. Il est possible de faire varier l échelle de description du paysage par le biais de l image des contours issu de la segmentation dont les seuils varient, ce qui permet d observer le paysage à des niveaux différents. Une méthode de calcul de l hétérogénéité interne du paysage a été crée, par le biais de rapports qui l évalue à différents niveaux d observation suivant les variations des seuils de segmentation. On s intéresse plutôt à l hétérogénéité intra parcellaire. L hétérogénéité peut être mesurée sur plusieurs niveaux grâce au calcul de divers indices relatifs aux nombres de patchs correspondant aux îlots d une classe (ensemble connexe des pixels d une classe), ou à l aire de chaque classe, et aux nombres de segments, correspondant aux patchs de l image segmentée (les patchs de l image segmentée sont appelés segments pour les différencier de ceux issus d une classification), ceci à différents seuils de segmentation de chaque classes. Figure 5.4 : Exemple d images des contours correspondant aux patchs et de segmentation à deux seuils plus ou moins segmentés Un patch est dit hétérogène lorsque les éléments qui le composent ne sont pas radiométriquement proches, l hétérogénéité d une classe est dépendante de celle de ses patchs. Ainsi, une première façon de mesurer l hétérogénéité des classes d un paysage, consiste à étudier le nombre de segments qui la compose en ayant superposé les contours d une segmentation, ce nombre variant en fonction du seuil de la segmentation. Au premier abord, plus la valeur est élevée, plus la classe est hétérogène. Mais, la notion d hétérogénéité dépend du niveau d observation ; des classes peuvent être hétérogènes pour un niveau d observation fin alors qu elles seront homogènes à un niveau plus élevé. Un logiciel de TITE (CESBIO), permet de mesurer l hétérogénéité des classes d une image à tous les seuils de segmentation, avec plusieurs indices L indice qui représente le mieux l hétérogénéité au seuil i est le rapport du nombre de segments au seuil i sur le nombre de patchs de la classe. En effet, si une classe est composée de grands patchs et beaucoup de segments, elle est hétérogène. Alors qu une classe avec le même nombre de segments, mais des petits patchs est dispersées, mais homogène, peu de segments seront détectés à l intérieur du patch. Lorsque le seuil de segmentation est petit, l observation est très détaillée. A ce niveau, l hétérogénéité est en général élevée, étant donné le nombre de détails perçus. Lorsque le seuil augmente, les critères d homogénéité sont moins stricts, les segments s agrandissent et l hétérogénéité diminue, en même temps que la perception des détails. Dans un premier temps, l analyse de l hétérogénéité de l image classée de FORMOSAT, a été effectuée pour définir un seuil à partir de l indice le plus représentatif (nombre de segments au seuil i sur le nombre de patchs). L image a été régularisée au seuil 50, c'est-à-dire que les points isolés ont été supprimé, ceux-ci correspondant a des artéfacts pour le calcul des indices. 102
Hétérogénéité Nombre segments au seuil i/ Nbre patchs 8 7 6 5 4 3 2 1 0 seuil 1 seuil 3 seuil 5 seuil 7 seuil 9 seuil 11 seuil 13 seuil 15 seuil 17 seuil 19 seuil 21 seuil 23 seuil 25 seuil 27 seuil 29 seuil 31 seuil 33 seuil 35 seuil 37 seuil 39 seuil 41 seuil 43 seuil 45 seuil 47 seuil 49 feuillus resineux eucalyptus ble colza orge mais tournesol sorgho soja jachere friche prairie eau libre lac bati dense bati industriel gravieres peupliers bati lache biculture tournesol particulier surface minerale Figure 5.5 : comparaison des classes avec l image régularisée( au seuil 50) Les pentes des différentes courbes de variation de l indice, en fonction du seuil commencent à s affaiblir (tendent vers 0) pour des seuils entre 12 et 16 environ (figure 5.5). Cela signifie, que l indice varie peu, on a atteint une stabilité dans le degré d hétérogénéité, quelque soit le niveau d observation. Pour choisir le seuil pertinent pour l analyse de paysage, des tests ont été réalisé afin de comparer les résultats suivant le seuil (seuils 12, 15 et 18). Nombre d'ueps (patchs) 50000 40000 30000 20000 seuil 12 seuil 15 seuil 18 10000 0 feuillus resineux eucalyptus ble colza orge mais tournesol sorgho soja jachere friche prairie eau libre lac bati dense bati industriel gravieres peupliers bati lache biculture tournesol particulier surface minerale Figure 5.6 : Nombre de patchs de l image aux différents seuils (12, 15, et 18) 103
Indice de juxtaposition % 80 70 60 50 40 30 20 10 feuillus resineux eucalyptus ble colza orge mais tournesol sorgho soja jachere friche prairie eau libre lac bati dense bati industriel gravieres peupliers bati lache biculture tournesol particulier surface minerale Seuil 12 Seuil 15 Seuil 18 Figure 5.7 : Indice de juxtaposition (%) de l image FORMOSAT, aux différents seuils (12, 15 et 18) Les résultats obtenus ont permis de conclure qu il n y a presque pas de différence entre les seuils 12 à 18. Pour la suite de notre étude le seuil utilisé est 15. 5.4 Les descripteurs du paysage Chaque classe d occupation du sol est caractérisée par N «patchs» ou unités élémentaires du paysage, UEPs. Les descripteurs, caractéristiques et indices (calculs de forme, taille, ) sont calculés sur les UEPs, les classes, la région totale (image entière), ou des sous régions. Les descripteurs du paysage peuvent être scindés en plusieurs groupes caractérisant : La dimension de la classe La forme des UEPs La distribution et/ou la répartition des classes : leur agencement Le logiciel STATPAYS (CESBIO) permet de calculer divers indices de paysages par classes ou pour l image entière à partir d images classées et étiquetées, tels que ceux donnés par le logiciel «FRAGSTATS» (Mac Garigal et al. 1994), logiciel libre de caractérisation de paysage développé au Forest Science Department de l'université d'état de l'oregon, Corvallis, aux Etats-Unis. D autres caractéristiques spécifiques ont été développées. Chaque classe d occupation du sol est caractérisée par N «patchs» ou unités élémentaires du paysage, UEP. Les calculs de forme, de taille et des autres caractéristiques sont effectués pour chaque classe et au niveau de l image entière. Sans être expert, chacun peut observer une image et en donner une description linguistique, mais ceci reste très subjectif. La modélisation de ces observations doit tenir compte de la complexité, de la richesse et de l ambiguïté des représentations, ce qui les rend difficilement modélisable. L automatisation des processus du raisonnement est essentielle, pour modéliser la connaissance de l expert. Les approches du raisonnement automatique utilisé en intelligence artificielle fournissent un cadre pour la description du paysage, qui est si complexe. Comparaison des résultats avec SPOT et FORMOSAT Les graphiques de la figure 5.8 montrent beaucoup de différences sur l observation du paysage à ces deux niveaux : 104
Nombre de patchs : l image SPOT possède moins de patchs. La résolution spatiale de SPOT étant moins fine que FORMOSAT moins de détails sont perçus, plusieurs parcelles agricoles sont rassemblées en un îlot. L aire moyenne des patchs est plus grande pour SPOT que FORMOSAT. Ceci est une conséquence du paramètre précédent, puisque plusieurs patchs d une même culture sont rassemblés, cela agrandit la superficie de l îlot. La densité de patchs est plus élevée pour FORMOSAT que pour SPOT l indice de régularité est plus élevé pour SPOT que pour FORMOSAT. La densité de patchs se calcule par le rapport du nombre de patchs sur l aire totale, donc, si on a peu de patchs pour SPOT par rapport à FORMOSAT alors la densité de SPOT est moins élevée. La régularité, se calcule par le rapport de l aire des noyaux sur l aire de la classe, ce qui indique des formes plus régulières au niveau d observation de SPOT. l indice de morcellement Im, nous renseigne sur la façon dont les UEPs sont réparties dans l image (nombre d UEPs sur l aire de la classe, ce qui caractérise une hétérogénéité inter UEPs). Ainsi, si une classe possède beaucoup d UEPs par rapport à la surface de la classe, celle-ci est très morcelée. Pour une même surface, une classe non morcelée (indice de morcellement faible) a peu d UEPs, mais de grande taille. Par exemple, l Eucalyptus possède peu de patchs avec SPOT, beaucoup plus avec FORMOSAT, en raison de parcelles plus détaillées, et de la reconnaissance de très petites de parcelles, non visibles avec SPOT. La surface de cette classe est faible. Ainsi, elle est moins morcelée avec SPOT car l indice de morcellement faible. Densité de patchs Indice de morcellement N o m b re p a tc h s / A ire to ta le 80 70 60 50 40 30 20 10 0 fe u illu s re s ine u x Nombre patchs / Aire de la classe e u c al y ptu s b le 0,25 0,2 0,15 0,1 c o lz a 0,05 o rge 0 m a is to u rn e s o l s o r gh o s o ja ja c h e re p r air ie eau libre la c b ati den se G r av i ère Feuillu Résineux Eucalyptus Blé Colza Orge P e u p lie r Maïs Tournesol Sorgho Soja B â ti la c h e /M in é ral Jachère, friche Prairie Rivière Lac Bâti dense Gravière Peuplier Bâti lache/minéral Aire de la classe Hectares 18000 16000 14000 12000 10000 8000 6000 4000 2000 0 feuillus resineux eucalyptus ble colza orge mais tournesol sorgho soja jachere prairie eau libre lac bati dense Gravière Peuplier Bâti lache/minéral Pixels 4000 3500 3000 2500 2000 1500 1000 500 0 Feuillu Résineux Eucalyptus Blé Aire moyenne des patchs Colza Orge Maïs Tournesol Sorgho Soja Jachère, friche Prairie Rivière Lac Bâti dense Gravière Peuplier Bâti lache/minéral 105
Nombre d'ueps (patchs) Densité de patchs 60000 50000 40000 30000 20000 10000 0 N o m b re p a t c h s / A ire t o t a le 80 70 60 50 40 30 20 10 0 feuillus resineux eucalyptus ble colza orge mais tournesol sorgho soja jachere prairie eau libre lac bati dense Gravière Peuplier Bâti lache/minéral fe u illu s r e s ine u x e u c aly ptu s b le c o lz a o r ge m a is to u rn e s o l s o rgh o s o ja ja c h e re p r air ie eau libre la c bati dense G r av i ère P e u p lie r B â ti la c h e /M in é ral Indice de régularité Aire de la classe / Nombre patchs (%) 100 90 80 70 60 50 40 30 20 10 0 Feuillu Résineux Eucalyptus Blé Colza Orge Maïs Tournesol Sorgho Soja Jachère, friche Prairie Rivière Lac Bâti dense Gravière Peuplier Bâti lache/minéral 2 Indice de dimension fractale Indice de forme 1,8 1,6 1,4 1,2 1 0,8 feuillus resineux eucalyptus ble colza orge mais tournesol sorgho soja jachere prairie eau libre lac bati dense Gravière Peuplier Bâti lache/minéral 2 1,8 1,6 1,4 1,2 1 0,8 0,6 0,4 0,2 0 feuillus resineux eucalyptus ble colza orge mais tournesol sorgho soja jachere prairie eau libre lac bati dense Gravière Peuplier Bâti lache/minéral Figure 5.8 : Indice de paysages obtenus pour SPOT et FORMOSAT selon les classes d occupation du sol L indice de forme : un indice faible ( 1) indique une forme simple de patchs (cercle, carré ). Pour les images acquises par SPOT et FORMOSAT, cet indice varie de 1 à 1,61 (figure 5.8). A l échelle de l îlot paysager, un agencement de parcelles de forme simple pourra créer un îlot de forme plus complexe. Le graphique illustre bien cela puisque l indice de forme est plus élevé pour SPOT que pour FORMOSAT, or SPOT, comme on l a dit précédemment, rassemble plusieurs parcelles et crée des îlots qui seront de forme plus complexe. 106
L indice de dimension fractale, renseigne sur le caractère «sinueux» ou fractal du contour. Il sert à quantifier le degré d irrégularité. Il varie de 1 à 2. Dans le cas des images SPOT et FORMOSAT, il varie de 1 à 1,11 (figure 5.8). L Indice approche 1 pour des formes avec des périmètres très simples tels que les carrés, et approche 2 pour des formes avec des contours très tourmentées. Cet indice, confirme l augmentation de complexité de forme des UEPs pour l image acquise par SPOT (20m) (légère, car bien sur nous sommes toujours dans des milieux anthropisés). Résultats avec la zone urbaine (photographie aérienne) Cette zone, à l échelle d une photo aérienne (50cm par pixel), est semi urbaine, composée de pelouses, de routes, de bâtiments collectifs, de maisons, de bâtiments industriels, de terrain de tennis, de piscines, d ombres, d arbres, d espaces arborés, de bordures, de sols nus et de chemins. Occupation du sol : Le pourcentage d occupation des classes dans le territoire donne la mesure de leur représentativité dans le paysage. Quatre catégories sont distinguées par ordre décroissant de superficie : Classes très représentées : espace arboré, pelouse, route + bâtiments collectif (de 27.6% à 19.9%). Classes bien représentées : industrie + route + collectif, sol très nu + collectif, sol peu végétalisé, maison + bâtiments industriel + terrain tennis (de 6.4% à 4.2%). Classes peu représentées : maison individuelles + toit industriel rouge, ombre + arbre, ombre + maison, sol nu + maison, bâtiments industriels + arbre + piscine (de 2.7% à 1.1%). Classes très peu représentées : bordure + chemin, arbre + sol nu (de 1.07% à 0.17%). La description correspond à une zone avec majoritairement d espace vert souvent arboré, avec la présence importante de maison et de bâtiment collectifs, commerciaux ou industriel, puis viennent les zones résidentielles avec des maisons individuelles. Cette description issue des pourcentages d occupation du sol décrivent bien la figure 5.10. Occupation des sols % 30 25 20 15 10 5 0 pelouse route, bat collectif sol peu végétalisé maison, bat indus, terrain t... sol très nu, collectif bordure, chemin espace arboré ombre, maison sol nu+ maison arbre, sol nu maison, toit indus rouge ombre, arbre bat indus, arbre, piscine industrie, route, collectif pourcentage occupation Figure 5.9 : pourcentage d occupation du sol de la photographie aérienne. Indice de morcellement : l élément du paysage le plus morcelé correspond à la classe «arbres + sol nu», elle ne représente que très peu de surface, ainsi, plus éparpillée. L espace arboré et les pelouses ont un indice de morcellement très bas caractérisant une classe peu morcelée. On peut regrouper les classes en trois catégories : 107
Classes peu morcelées : espace arboré, pelouse, maison + bâtiments industriels + terrain tennis, route + bâtiments collectifs, sol peu végétalisé, ombre + arbre, maison + toit industriel rouge (de 0.001% à 0.004%), donc plus rassemblées. Classes moyennement morcelées : industrie + route + collectif, sol très nu + collectif, bordure + chemin, ombre + maison, sol nu + maison, bâtiment industriel + arbre + piscine (de 0.007% à 0.02%). Classe morcelée : arbre + sol nu (0.05%) Nombre patchs / Aire totale (pixel) 0,06 0,05 0,04 0,03 0,02 0,01 0 pelouse route, bat collectif sol peu végétalisé maison, bat indus, t... sol très nu, collectif bordure, chemin espace arboré Indice de morcellement ombre, maison sol nu+ maison arbre, sol nu maison, toit indus rouge ombre, arbre bat indus, arbre, piscine industrie, route, colle... Indice de morcellement Figure 5.10 : Indice de morcellement de la zone urbaine (photographie aérienne). Indice de régularité géométrique : Le rapport de la surface des noyaux sur la surface des UEPs est significatif d une forme convolutée. Ce rapport est toujours inférieur à 1. Dans notre cas il varie de 0,19 à 0,56 (figure 5.11). Plus la valeur est élevée et plus les UEPs ont une forme géométrique simple. Les classes «pelouse», «espace arboré», plus «naturelles» et les classes composites comme «maison, bâtiment industriel» ont des formes moins géométriques. Surface des noyaux / surface UEPs 0,6 0,5 0,4 0,3 0,2 0,1 0 pelouse route, bat collectif sol peu végétalisé sol très nu, collectif maison, bat indus, terrain... Indice de régularité géométrique bordure, chemin espace arboré ombre, maison sol nu+ maison arbre, sol nu maison, toit indus rouge ombre, arbre bat indus, arbre, piscine industrie, route, collectif Indice de régularité Figure 5.11 : Indice de régularité géométrique Indice de dimension fractale : L indice de dimension fractale varie de 1,13 à 1,29. Cette faible variation témoigne d une organisation paysagère anthropisée. La dimension fractale dans notre cas montre peu de formes découpées sur les contours sauf pour «route + bâtiments collectifs», «industrie + route + collectif». Elle montre que le paysage analysé est composé d éléments de forme plus ou moins géométriques de contours nets donc peu 108
fractals, sauf lorsqu il y a des routes ou chemins, plus sinueux. Indice de dimension fractale Dimension fractale 1,6 1,5 1,4 1,3 1,2 1,1 1 pelouse route, bat collectif sol peu végétalisé maison, bat indus, terrain t... sol très nu, collectif bordure, chemin espace arboré ombre, maison sol nu+ maison arbre, sol nu maison, toit indus rouge ombre, arbre bat indus, arbre, piscine industrie, route, collectif dim fract Figure 5.12: Dimension fractale Conclusion Cette étude, à partir de deux images satellites SPOT à 20m, FORMOSAT à 8m et d une photographie aérienne a permis d analyser l observation de la structure du paysage à différentes échelles. Les résultats montrent que la caractérisation du paysage est influencée par la résolution spatiale (20m, 8m et 50cm) des images. La différence d échelle a une influence sur l analyse de paysage, une résolution moins fine percevant moins de détails. La caractérisation du paysage varie en fonction du nombre de patchs, celui-ci diffère en fonction de la résolution du satellite. Ce nombre intervient dans une grande partie des indices du paysage. Le résultat de l analyse du paysage est donc différent du point de vue de FORMOSAT ou de SPOT. Toutefois certaines variations sont dues aux images qui ne sont pas prises la même année (2004 pour SPOT, 2008 pour FORMOSAT), il existe quelques changements dans l occupation du sol. L étude des caractéristiques paysagères en milieu urbanisé, à l échelle de photographies aériennes (50cm) permet de faire ressortir les différentes morphologies urbaines et la complexité d un paysage urbain. Ces caractéristiques obtenues par des calculs affinent la description du paysage et donne une mesure à des propriétés perçues visuellement. La mise en forme numérique du paysage voit son effet réducteur compensé par la capacité de la méthode à analyser de vastes étendues et à fournir des mesures objectives et quantifiées des paysages. Les statistiques sur l occupation du sol ont permis de quantifier l organisation de cette zone urbaine, qui est très végétalisée. Ainsi, la proportion de pelouses, dans le paysage s est avérée importante, par rapport aux maisons. Les espaces arborés qui paraissaient plus morcelés visuellement, ont un indice de morcellement modéré qui reflète plus la réalité. L aspect paysage urbain, donc anthropisé, est bien détecté grâce à l indice de dimension fractale. 109
6 - CONCLUSION Le projet SUD-OUEST s est orienté sur l analyse des images FORMOSAT actuellement pour les années 2006, 2007, 2008, qui est le prolongement naturel des travaux déjà effectués les années précédentes SPOT 2002, 2003, 2004, 2005. Grâce aux données en réflectance, nous avons pu interpréter les différents types de culture et leurs aspects cycliques. La finalité de l étude était de créer un plan d occupation du sol le plus fiable possible afin de le donner aux équipes qui l intègreront dans des modèles de prévisions pour l étude de l environnement. Exploitation des classifications Chaque année, à partir des classifications on peut étudier la dynamique de l occupation du sol, avoir des renseignements sur les évolutions que subit le paysage. En réalisant des bilans de carbone et d eau sur une parcelle d une classe, on peut en généralisant ce bilan à la région pour chaque classe, les intégrer dans des modèles d estimation des flux afin d envisager divers scénarios. Le carbone étant stocké dans les racines, il mettra un certain temps pour être libéré. En extrapolant ces résultats, on pourra suivre l évolution du fonctionnement des écosystèmes et mieux connaître des phénomènes comme le réchauffement climatique ou bien encore l effet de serre. Intérêt du multitemporel L intérêt du multitemporel a déjà été démontré dans les études précédentes avec les images SPOT. Avec les images FORMOSAT on a pu constater un ajustement plus précis au développement de la végétation. Donc, ces images montrent bien leur intérêt pour le suivi temporel de la végétation et pour l observation des pratiques culturales. Grâce à la résolution spatiale (8m), les détails sont bien visibles au niveau de tous les réseaux de communication, d eau. Mais, pour la classification, nous sommes tributaires des échantillons et des dates utilisées : les résultats des matrices de confusions montrent que suivant les échantillons et les dates les résultats peuvent être très différents. Il est difficile de déterminer une règle générale puisque l on est chaque année dans des situations différentes, certaines tendances se dégagent, par exemple pour le Colza, il faut le mois d avril, pour les cultures d été (voir chapitre 2), principalement le Maïs ensilage, début septembre. Rappelons quelques principes fondamentaux que se dégagent de cette étude et de l étude précédente avec les images SPOT : La sélection des échantillons est déterminante et délicate pour obtenir une classification supervisée satisfaisante. Suivant le jeu d échantillons utilisé les résultats de la classification sont variables. En théorie, la classification est validée avec un jeu d échantillons indépendant, mais cela supprime des échantillons pour l apprentissage qui sont donc moins représentatifs. Une telle superficie d étude engendre une grande variabilité des réponses, dues à la situation topographique et aux climats locaux (zones de plaines, de vallées, de coteaux, de piémont ). 110
L exemple du Sorgho a permis de montrer une classe ayant peu d échantillons, mais qui présente un taux de variabilité important, ce qui est préjudiciable pour la classification. Les résultats sont très différents suivant les tests sur l échantillonnage total, ou une partie des échantillons. La meilleure solution, quand le pourcentage de bien classés est faible, est de choisir des sous classes pour la classification, puis les regrouper après la classification. Le choix des sous classes n est pas forcément le même d une année à l autre, celui-ci dépend des conditions de semis, climatique ; il donc difficile de reproduire d une année à l autre la même démarche. L érosion des échantillons est un facteur important qui peut modifier la classification. Une érosion trop faible des échantillons peut prendre en compte par exemple les bordures de champs, les lisières de forêts, qui ne sont pas représentatives de la classe et entraînent une hétérogénéité trop importante des réponses. A l inverse, une érosion trop forte restreint l hétérogénéité offerte par la classe, par exemple pour les prairies qui ne sont pas forcément uniformes sur une même parcelle. Suivant les années les profils temporels des cultures sont variables. Le choix des dates et les règles à appliquer ne peuvent qu être très générales. 111
7 - BIBLIOGRAPHIE Bell E.J. (1974). Markov analysis of land use change an application to remotely sensed data.. Socio-Economic Planning Science 8:311-316. Besag J. (1986). On the statistical analysis of dirty pictures, Journal of the Royal Statistic Society, serie B 48(3):259-302. Bloch H.I, Maitre H. (1994). Fusion de données en traitement d images : modèles d information et décisions. Traitement du Signal 11(6):435-446. Bloch I. (1996). Information Combination Operators for Data Fusion: A Comparative Review with Classification» IEEE Systems, Man and Cybernetics : jan 1996 vol. 26, n 1, pp. 52-67 Bloch I. (1996). «Incertitude, imprécision et additivité en fusion de données : point de vue historique» Traitement du Signal 1996 vol. 13, n 4, pp. 267-288 Castañeda C., Ducrot D. (2009) Land cover mapping of wetland areas in an agricultural landscape using SAR and Landsat imagery Journal of Environmental Management Elsevier Ltd 6-5- 2009 vol 90 number 7 Special Issue ISSN 031-4797 Caloz R, Collet C. (2001) Précis de télédétection ; vol. 3 «Traitements numériques d'images de télédétection» Presses de l'université de Québec Descombes X., Mangin J., Pechersky., E., & Sigelle M., (1995), Fine Structure Preserving Markov model for image processing, SCIA'95, Uppsala, Sweden, pp.349--356 Ducrot D. 2005 «Méthodes d analyse et d interprétation d images de télédétection multi-sources - Extraction de caractéristiques du paysage» HDR 1ier décembre 2005 INP Toulouse Ducrot D. & Gouaux P. 2007 Paysage et Télédétection dans les processus écologiques : Caractérisation des paysages par télédétection, source d'indicateurs de leur fonctionnement poster et présentation JET Journées d Ecologie Fonctionnelle, Biarritz 19-22 mars 2007 Ducrot D.., Gouaux P., 2004 «Caractérisation des agro-systèmes de la plaine alluviale de la Garonne et des coteaux du Gers, mise en évidence de leurs changements au cours des vingt dernières années» colloque SFER (Société française d économie rurale) «les systèmes de production agricoles: performances, évolutions, perspectives" à l institut supérieur d'agriculture de Lille. 18-19 novembre 2004 Ducrot D. Ceshia E. Marais-Sicre C. 2009 «Détection des changements de l occupation du sol à partir d images de télédétection multi-temporelles conf. «Changement de paysage» Tunis juin 2009 Escadafal R, Belghith A, Ben Moussa H. 1994 «Indices spectraux pour la télédétection de la dégradation des milieux naturels en Tunisie aride. Actes du sixième Symposium International» «Mesures physiques et signatures spectrales en télédétection», Val d Isère, France, 1994 Fjørtoft R. (1999). Segmentation d images radar par détection de contours. Ph.D. thesis at the Institut National Polytechnique de Toulouse, France. Fjørtoft R., Sery F., Ducrot D., Lopes A., Lemaréchal C., Fortier C., Marthon P., & Cubero-Castan E. (1997) Segmentation, filtering and classification of SAR images. In Proceedings of VII Latin American Symposium on Remote sensing (SELPER 97), Venezuela, November 1997. Girard M.C. & Girard C.M. (1999). Traitement des données de télédétection. DUNOD Ed. Paris, pages 90 à 91 112
Idbraim S., Ducrot D. 2009 An unsupervised classification using a novel ICM method with constraints for land cover mapping from remote sensing imagery International Review on Computers and Software (IRECOS) - March 2009 Idbraim S., Mammass D., Aboutajdine D., Ducrot D. An automatic system for urban road extraction from satellite and aerial images WSEAS transaction on signal processing, Issue 10, Vol 4, pp. 563-572, ISSN: 1790-5022, October 2008. Idbraim S., Ducrot D., Mammass D., Aboutajdine D., Classification of remote sensing imagery by an ICM method with constraints: application in cartography of the land cover International Conference on Multimedia Computing and Systems ICMCS 09, Ouarzazate, Maroc, 02-04 Avril, 2009. Idbrahim S. 2009 «Méthodes d extraction de l information spatiale et de classification en imagerie de télédétection - Applications à la cartographie thématique de la région d Agadir (Maroc)». Thèse en cotutelle entre l université Paul Sabatier de Toulouse, France et l université Mohammed V-Agdal de Rabat Karoui M. S., Deville Y., Hosseini S., Ouamri A., Ducrot D. (2008) Contribution of non-negative matrix factorization to the classification of remote sensing images Proc. SPIE, Vol. 7109, October 2008 71090X ; DOI:10.1117/12.799749 Karoui M. S, Deville Y., Ouamri A., Ducrot D. 2009 improvement of remote sensing multispectral image classification by using independent component analysis conf. IEEE GRSS WHISPERS Workshop on Hyperspectral Image and Signal Processing - Evolution in remote Sensing (WHISPERS) Grenoble août 2009 Kristóf, D., Ducrot D., 2003, Integrated Method for Long-term Environmental Change Detection by Remote Sensing SPIE 10thInternational Symposium on Remote Sensing, 8-12 septembre 2003, Barcelone, Espagne. Publication «Remote Sensing for Agriculture, Ecosystems and Hydrology V» SPIE The International Society for Optical Engineering Lecerf R. 2008Suivi des changements d'occupation et d'utilisation des sols d'origine anthropique et climatique à l'échelle régionale par télédétection moyenne résolution ; Application à la Bretagne, Thèse Rennes, 16 Octobre 2008 Le Hégarat-Mascle S., Bloch I., Vidal-Madjar D. (1997). Application of Dempster-Shafer evidence theory to unsupervised classification in multisource remote sensing. IEEE Transactions on geoscience and remote sensing 35(4):1018-1031. Mougenot B., Cailleau D. 1996 «Identification par télédétection des sols dégradés d'un domaine sahélien au Niger Richard J.F. (1975). «Paysages, écosystème, environnement : une approche géographique». L espace géographique 2:81-92. Schistad Solberg Anne H, Taxt Torfinn,. Jain Anil K, (1996), Markov random fields models for Classification of multisource Satellite Imagery, IEEE Trans. On Geo. And Rem. Sesing, vol. 34. no. 1., 100-113, January 1996 Shafer G. (1976). A mathematical theory of evidence. Princeton University Press. Princeton, NJ. Smets P. (1988). Belief functions. In Non standard logics for automated reasoning, edited by Smets P., Mamdani A., Dubois D. & Prade H., Academic Press, London, pp. 253-286. Tourino Soto I. (2005) «Mise en relation de la cartographie du rendement avec la distribution spatiale de l'état de surface du sol observée par télédétection. Application dans un contexte d'agriculture de précision. Thèse INP Toulouse Turner M.G. (1987). Spatial Simulation of Landscapes Changes in Georgia: a Comparison of 3 113
Transition Models. Landscape Ecology 1:29-36. Turner M.G., O Neill R.V., Gardner R.H. & Milne B.T. (1989). Effects of changing spatial scale on the analysis of landscape pattern. Landscape Ecology 3 (3&4):153-162. Turner M.G. & Gardner R.H. (1991). Quantitative Methods in Landscape Ecology. Ecological Studies 82, New York, 307 pp. Urban D.L., O Neill R.V. & Shugart Jr. H.H. (1987). Landscape ecology: A hierarchical perpective can help scientist understand spatial patterns. BioScience 37:119-127 Rapport «Etude de la désertification au Mali par télédétection» Ducrot Danielle avec la participation de Pollara Christelle : Stagiaire, BIGEARD Guillaume, LACOMBE Gaëtan, POCQUET Mathieu : Bureau d étude Février 2008 «Protocole général d un système de classification de télédétection» D.Ducrot 2004 à 2009 Méthode de classification multi source, multitemporelle ICM - descriptif et améliorations Manuel d utilisation ENVI et IDL Ducrot D. Manuel d utilisation du logiciel TITE développé CESBIO télédétection» Ducrot D. Ducrot D., 2002, bibliothèque TITE, CESBIO. «Traitement d image de 114