Cartographie des concentrations de polluants atmosphériques sur la France à partir de données de modélisation et d'observation L. Malherbe, A. Ung, L. Létinois, INERIS Ch. de Fouquet, Centre de Géosciences, Mines ParisTech Groupe Spatial-Environnement, Paris, 7 décembre 009
Contexte Cartographie et surveillance réglementaire de la qualité de l air Les Etats membres doivent évaluer la qualité de l air sur l ensemble de leur territoire. Le public doit être informé quotidiennement sur les concentrations atmosphériques des principaux polluants réglementés et en temps utile, sur la zone de dépassement d une valeur limite réglementaire. La réalisation de rapports annuels sur la qualité de l air ambiant nécessite de constituer des historiques de pollution les plus précis possible.
3 3 Contexte Cartographie et surveillance réglementaire de la qualité de l air Mise en œuvre de modèles déterministes de chimie-transport Modélisation déterministe et méthodes géostatistiques sont associées pour établir des cartographies en accord avec : les principes de la dynamique et de la chimie ; les observations des stations de mesure au sol.
4 4 Contexte Application : PREV Air (www.prevair.org système opérationnel de prévision et de cartographie de la qualité de l air à différentes échelles spatiales (MEEDDM, INERIS, CNRS, METEO France, ADEME fondé sur des modèles déterministes tridimensionnels de chimie-transport (CHIMERE et MOCAGE. prévisions (J+0, J+, J+ et simulations (J- des concentrations d ozone, NO, PM0 et PM.5
5 5 Contexte PREV AIR, cartes analysées des concentrations horaires d ozone et des concentrations journalières de PM0 Correction en fonction des observations Modèle CHIMERE, résolution 0,5 x 0, Simulation pour J- résolution 0,5 x 0,
6 6 PREV AIR, cartes analysées Contexte Méthode de correction mise en œuvre depuis 003: krigeage des innovations 008-009: amélioration possible de la correction? étude de la variabilité temporelle et spatiale des concentrations simulées et observées comparaison de trois méthodes de correction spatiale: - krigeage des innovations - krigeage des observations avec CHIMERE en dérive externe - cokrigeage entre CHIMERE et les observations
7 7 Plan. Rappels théoriques sur les méthodes de krigeage en géostatistique multivariable. Application à la cartographie. Krigeage du résidu Krigeage avec dérive externe Cokrigeage. Mise en œuvre et comparaison des méthodes sur une période estivale Résultats, discussion (présentation ciblée sur l ozone
8 8 ère partie Estimation multivariable Krigeage du résidu de la régression Krigeage avec dérive externe Cokrigeage
9 9 Krigeage du résidu de la régression Modèle La moyenne de la variable Z est expliquée par une variable déterministe y, connue exhaustivement. On pose : Z(x = m(x + T(x = a y(x + b + T(x Hypothèse : E[ T(x ] = 0, d où E[Z(x] = a y(x + b
0 0 Modèle Krigeage du résidu de la régression La variable déterministe y est supposée connue - aux points expérimentaux x - aux nœuds de grille x j Le modèle Z(x = a y(x + b + T(x est remplacé par Z(x = m * (x + W(x = a * y(x + b * + W(x où a * et b * sont déterminés à partir des points expérimentaux, par exemple par moindres carrés. T : résidus «vrais», W : résidus expérimentaux Remarque : E[ W ] = 0, vérifiée sur les points expérimentaux
Estimation Krigeage du résidu de la régression Partant du modèle linéaire Z(x = a * y(x + b * + W(x Estimation de Z par l estimation des résidus W = Z - m, à partir des W calculés aux points expérimentaux, puis ajout de la moyenne m(x Détermination de la régression (z,y : (a *,b * Calcul des résidus expérimentaux w Calcul et ajustement du «variogramme des résidus» Krigeage (à moyenne inconnue des résidus W j aux nœuds de grille et calcul de la variance de krigeage σ KO ² (x j Z KO (x j = a * y(x j + b * + W KO (x j
Limites La mise en œuvre de la méthode est commode, mais Krigeage du résidu de la régression Les coefficients estimés a * et b * de la dérive sont sans biais, mais non optimaux. quel que soit le mode d estimation de a * et b *, le variogramme des résidus estimés est biaisé par rapport au variogramme des résidus «vrais». La variance d estimation de Z ne se réduit pas à celle des résidus W; tenir compte de l incertitude d estimation de la moyenne.
3 3 Application à la cartographie Krigeage du résidu de la régression Le krigeage des innovations : un cas particulier du krigeage du résidu de la régression Krigeage du résidu : Z(x = m * (x + W(x = a * y(x + b * + W(x Krigeage des innovations : Z(x,t 0 = CHIMERE(x,t 0 + W(x,t 0 hypothèses implicites : a*=; b*=0; non corrélation entre W et CHIMERE En un point de grille x j, à une heure t 0 Z KI (x j = CHIMERE(x j + W KO (x j Innovations expérimentales concentration mesurée à la station CHIMERE interpolé à la station
4 4 ère partie Estimation multivariable Krigeage du résidu de la régression Krigeage avec dérive externe Cokrigeage
5 5 Dans la dichotomie dérive + résidu Krigeage avec dérive externe Le modèle linéaire a été remplacé par Z(x = a y(x + b + T(x Z(x = a * y(x + b * + W(x Améliorations possibles? estimation optimale de a * et b *, tenant compte de la corrélation des résidus tenir compte de l incertitude sur la moyenne dans la variance de krigeage krigeage en voisinage glissant : adapter localement la relation entre Z et y
6 6 Modèle Krigeage avec dérive externe Comme précédemment, la variable déterministe y(x, connue exhaustivement sur tout le champ constitue une dérive, à une constante et à un facteur près : Dichotomie : Z(x = m(x + R(x avec m(x=a y(x+b mais sans fixer les coefficients a et b. Seule compte la linéarité de m(x par rapport à y(x. les résidus R(x sont inaccessibles, même aux points expérimentaux. leur variogramme n est pas directement accessible.
7 7 Estimation Krigeage avec dérive externe Estimation de la valeur ponctuelle de Z en un point de grille x j : combinaison linéaire: Z KDE j Z erreur de krigeage: Z * j Z j Z Z j non biais: E( E( Z E( Z j m m j ( a y b ( a y j b 0 quels que soient les coefficients inconnus a et b y y j
8 8 Estimation Krigeage avec dérive externe Optimalité: Var( Var Z Z j Var R R j C C j C jj Minimisation sous les deux contraintes précédentes: Var( 0 y y j système d équations Variance de krigeage: KDE Var( C jj C j 0 y j Le système et la variance de krigeage s expriment en variogramme, en remplaçant la covariance C par γ. Le système se généralise au cas d un résidu R intrinsèque (variogramme non borné.
9 9 Propriétés Krigeage avec dérive externe Interpolateur exact : en tout point expérimental, Z KDE (x =Z(x Les poids et la variance de krigeage ne dépendent pas des valeurs aux points expérimentaux, dépendent de la variable explicative aux points expérimentaux et au point à estimer. Le voisinage est unique ou glissant. Si localement (sur un voisinage, Z s écrit comme une fonction affine des données expérimentales : z(x = a y(x + b alors, d après les conditions de non biais : z KDE (x j = z(x = a y(x + b = a y(x j + b le krigeage en dérive externe conserve la même relation affine.
0 0 Krigeage avec dérive externe Quel modèle pour le variogramme du résidu?. Modélisation indirecte par validation croisée. Approximation : estimation non optimale d une dérive globale (par exemple : moindres carrés ; calcul et ajustement du variogramme des résidus associés
Application à la cartographie Krigeage avec dérive externe En un point de grille x j, à une heure t 0 : Krigeage des innovations : Z(x,t 0 = CHIMERE(x,t 0 + W(x,t 0 Krigeage avec CHIMERE en dérive externe : Z(x,t 0 = a.chimere(x,t 0 +b + R(x,t 0 En un point de grille x j, à une heure t 0 : Z KDE ( x j KDE Z avec la condition : CHIMERE ( x CHIMERE ( x j
ère partie Estimation multivariable Krigeage du résidu de la régression Krigeage avec dérive externe Cokrigeage
3 3 Cokrigeage Modèle Z, Z, deux variables aléatoires corrélées spatialement, connues sur deux ensembles de points S et S Modèle bivariable intrinsèque: Variogrammes simples: ii ( h i ( h E[ Z i ( x h Z i ( x] i, Variogramme croisé: ( h E Z ( x h Z ( x Z ( x h Z ( x
4 4 Cokrigeage Modèle Modèle de corrélation intrinsèque : toutes les structures simples et croisées sont proportionnelles. ij ( h b ( h i, j ij Modèle linéaire de corégionalisation Les variogrammes simples et croisés sont des combinaisons des mêmes structures. Exemple pour deux variables et deux structures: ( h ( h ( h b b b ( h ( h ( h ( h ( h ( h Ce qui correspond à la décomposition : Z ( x Z ( x Z ( x m Z ( x Z ( x Z ( x m b b b
5 5 Cokrigeage Estimation Estimation par cokrigeage de : Z, Z, Z -Z par une combinaison linéaire des données de Z et Z Exemple: estimation de Z (variable principale en un point de grille x j Z CK j S Z S Z avec: S S 0
6 6 Cokrigeage Application à la cartographie Observations Z = Z Simulation déterministe S = Z connue de façon dense Le cokrigeage de Z se ramène au krigeage du résidu de la régression linéaire de Z sur S si (et seulement si - la covariance croisée C SR (h est nulle, - la covariance croisée C ZS (h est proportionnelle à C S (h. Krigeage avec dérive externe : tient compte de l incertitude sur les coefficients de la régression, mais pose une hypothèse d indépendance, entre le résidu et S. Le modèle linéaire de corégionalisation permet de différencier la corrélation entre observations et simulations suivant les différentes composantes (échelles de variabilité spatiale.
7 7 Cokrigeage Application à la cartographie En un point de grille x j, à une heure t 0 : Krigeage des innovations : Z(x,t 0 = CHIMERE(x,t 0 + W(x,t 0 Krigeage avec CHIMERE en dérive externe : Z(x,t 0 = a.chimere(x,t 0 +b + R(x,t 0 Z KDE ( x j KDE Z avec : CHIMERE( x CHIMERE( x j Cokrigeage : Z( x Z ( x CHIMERE( x Z Z ( x ( x m Z ( x m Z CK ( x j S CK Z S CK CHIMERE ( x
8 8 e partie Mise en œuvre des 3 méthodes
9 9 Quelles données d observation? Mesures issues de stations de fond : - rurales - périurbaines, urbaines - industrielles, si pour le polluant considéré, elles se comportent comme des stations de fond Exemple PREV AIR ozone: sélection de stations de fond, considérées par les AASQA comme représentatives des phénomènes modélisés par CHIMERE vert: stations rurales bleu : stations périurbaines rouge : stations urbaines noir: stations industrielles/obs. spécifique
30 30 Données de modélisation Résolution spatiale: 0,5 x 0, Valeurs horaires (ozone Valeurs journalières (PM0 Grille d estimation 0,5 x 0, pour PREV AIR Éventuellement < 0, pour d autres applications
3 3 Déroulement des calculs. Récupération des données de CHIMERE. Récupération des données de mesure Base BASTER (temps quasi réel, mode opérationnel ou BDQA (mode évaluation 3. Interpolation de CHIMERE aux stations Ouverture de R, lancement du programme de krigeage
Concentrations estimées [µg/m 3 ] 3 3 4. Calcul des innovations expérimentales Krigeage des innovations 5. Calcul du variogramme expérimental des innovations Remarque: pour l ozone, les stations de fond situées en altitude ne sont pas prise en compte dans le calcul du variogramme. 6. Modélisation du variogramme Paramètres choisis : - Modèle exponentiel avec effet de pépite - Portée et palier ajustés automatiquement dans R Ex: 8/07/06 5h 7. Validation croisée
33 33 8. Krigeage ordinaire des innovations sur la grille Données d entrée: - Innovations aux stations Données de sortie: - Innovations sur la grille d estimation Remarque: réintroduction des stations de montagne en entrée du krigeage Krigeage des innovations 9. Estimation finale CHIMERE sur la grille d estimation : mod(x,t 0
Concentrations estimées [µg/m 3 ] 34 34 Krigeage des innovations 0. Evaluation complémentaire : estimation sur les stations qui n ont pas été utilisées en entrée du krigeage (exemple ozone: certaines stations périurbaines et urbaines, stations de trafic et comparaison aux mesures. Nuage de corrélation pour les stations de fond urbaines et périurbaines Ex: 8/07/06 5h
35 35 Krigeage avec dérive externe Quel modèle de variogramme? En première approximation: modèle ajusté sur le variogramme des résidus expérimentaux de la régression linéaire (globale entre les mesures et CHIMERE : R'( x *, t0 Z( x, t0 ( a CHIMERE( x, t0 b * Amélioration: modélisation non stationnaire indirecte
Concentrations estimées [µg/m 3 ] 36 36 Krigeage avec dérive externe 4. Calcul du variogramme expérimental des résidus Remarque: pour l ozone, les stations de fond situées en altitude ne sont pas prise en compte dans le calcul du variogramme Ex.: 8/07/06 5h 5. Modélisation du variogramme Paramètres choisis : - Modèle exponentiel avec effet de pépite - Portée et palier ajustés automatiquement dans R 6. Validation croisée Données d entrée : - Concentrations mesurées aux stations - CHIMERE interpolé aux stations Données de sortie: - Concentrations estimées en chaque station
37 37 Krigeage avec dérive externe 7. Krigeage avec dérive externe sur la grille Données d entrée: - Mesures de concentration aux stations - CHIMERE aux stations - CHIMERE sur la grille d estimation Données de sortie - Concentrations estimées sur la grille Remarque: réintroduction des stations de montagne en entrée du krigeage
Concentrations estimées [µg/m 3 ] 38 38 Krigeage avec dérive externe 8. Evaluation complémentaire : estimation sur les stations qui n ont pas été utilisées en entrée du krigeage (exemple ozone: certaines stations périurbaines et urbaines, stations de trafic et comparaison aux mesures. Ex.: 8/07/06 5h
39 39 Hypothèse de modèle linéaire de corégionalisation avec trois structures:, ( ( (, ( ( (, (, ( (, ( (, (, (, (, (, ( 0 0 0 0 0 0.mod 0 0 0 0 mod 0 0 0 0 t h t t t h t t h t h t t h t h t h t h t h t h pp GP pp GP pp GP Y Y Z Y Y Y Y Z : composante de grande portée : composante de petite portée : effet de pépite Y GP Y PP Cokrigeage Quel modèle bivariable?
Concentrations estimées [µg/m 3 ] 40 40 4. Calcul des variogrammes expérimentaux simples et croisé des observations et de CHIMERE Remarque: pour l ozone, les stations de fond situées en altitude ne sont pas prise en compte dans le calcul du variogramme 5. Modélisation du variogramme Paramètres choisis : - structures de petite (50 km et grande (50 à 80 km selon les heures du jour, avec effet de pépite - Paliers ajustés automatiquement dans R Cokrigeage Ex.: 8/07/06 5h 6. Validation croisée Données d entrée : - Concentrations mesurées aux stations - Simulation CHIMERE Données de sortie: - Concentrations estimées en chaque station
4 4 7. Cokrigeage ordinaire sur la grille Cokrigeage Données d entrée: - Mesures de concentration aux stations - Simulation CHIMERE (grille CHIMERE Données de sortie - Concentrations estimées sur la grille (grille d estimation Remarque: réintroduction des stations de montagne en entrée du krigeage
Concentrations estimées [µg/m 3 ] 4 4 8. Evaluation complémentaire : estimation sur les stations qui n ont pas été utilisées en entrée du krigeage (exemple ozone: certaines stations périurbaines et urbaines, stations de trafic et comparaison aux mesures. Cokrigeage Ex.: 8/07/06 5h
43 43 Le choix de ce modèle découle d une analyse approfondie des relations entre CHIMERE et les observations : dans le temps, station par station dans l espace Cokrigeage Constat : L hypothèse sous-jacente au krigeage des innovations n est pas toujours vérifiée Z(x,t CHIMERE(x,t + R(x,t Hypothèse de non corrélation Le variogramme des observations ne peut pas s écrire comme la somme du variogramme de CHIMERE et d un variogramme de résidu. Par exemple, le variogramme de CHIMERE recoupe parfois celui des observations ou encore, une structure est présente sur le variogramme de CHIMERE mais non pas sur celui des observations. Le variogramme croisé CHIMERE-Z est différent du variogramme de CHIMERE.
44 44 Cokrigeage 8h 5h Exemple: journée du 8/07/06
45 45 En général, la corrélation spatiale entre CHIMERE et les observations augmente en cours de journée puis diminue le soir. 8h Cokrigeage 5h 9h 8/07/06
46 46 En général, la précision d estimation augmente en cours de journée, elle est maximale dans l après-midi et diminue le soir. 9h h 5h Cokrigeage 9h 8/07/06 h Validation sur les stations urbaines et périurbaines non prises en compte dans le krigeage
47 47 Quel voisinage d estimation? Cokrigeage Cokrigeage colocalisé : On n utilise les données de la variable dense qu au point d estimation et aux points expérimentaux. Le cokrigeage colocalisé n est optimal que dans le cas d un modèle à résidu: Z(x=aS(x+b+R(x où R est sans corrélation spatiale avec S Cas général : On utilise toutes les données de la grille CHIMERE, dans un certain voisinage. Problème : à cause du temps de calcul, le voisinage de CHIMERE a dû être réduit par rapport au voisinage choisi pour les observations
48 48 Comparaison entre : le krigeage des innovations le krigeage des observations avec CHIMERE en dérive externe le cokrigeage Test sur deux périodes estivales en 005 et 006 Comparaison Exemple: scores sur le pic journalier, 8/07/06 4/08/06 Biais [µg/m 3 ] RMSE [µg/m 3 ] Erreur relative en valeur absolue [%] Corrélation Krigeage des innovations -0.47.9 7. 0.953 Krigeage avec dérive externe -0.86.50 7.0 0.956 Cokrigeage -0.97.77 7.09 0.954 Statistiques sur l ensemble des jours et des stations de validation périurbaines et urbaines
49 49 Comparaison CHIMERE CHIMERE + Krigeage des innovations Krigeage des obs. avec CHIMERE en dérive Cokrigeage entre les obs. et CHIMERE 8/07/06 4/08/06 Histogrammes des coefficients de corrélation modèle-mesure calculés en chaque station de validation (statistiques relatives au pic journalier
50 50 Comparaison CHIMERE CHIMERE + Krigeage des innovations Krigeage des obs. avec CHIMERE en dérive Cokrigeage entre les obs. et CHIMERE 8/07/06 4/08/06 Histogrammes des RMSE calculées en chaque station de validation (statistiques relatives au pic journalier
5 5 - Champ de correction : résultats comparables entre les méthodes dans le domaine contenant les stations Krigeage des innovations Krigeage avec CHIMERE en dérive Cokrigeage ordinaire
5 5 Conclusion Trois méthodes d efficacité comparable si l on s en tient aux scores. Krigeage avec dérive externe: il permet d ajuster localement la relation linéaire entre observations et CHIMERE. Modèle linéaire de corégionalisation entre CHIMERE et les observations : plus général que la décomposition dérive + résidu, permet de rendre compte des corrélations et différences de variabilité entre observations et CHIMERE aux différentes échelles spatiales (ou temporelles n améliore pas sensiblement la correction mais permet de mieux analyser les imperfections de CHIMERE; valide également pour les PM0. PM0, 0 octobre 007 Questions à examiner : choix du voisinage, en particulier dans le cokrigeage Question de l extrapolation (comparer les méthodes sur des stations étrangères en périphérie du domaine
53 53 Compléments Introduction de variables auxiliaires - Emissions - Taux d occupation du sol - Population - Altitude -
54 54 Krigeage avec dérive externe La ou les variables auxiliaires sélectionnées sont introduites comme dérives supplémentaires. Exemple: Hypothèse: Z( x, t0 a.mod( x, t0 a pop( x, t0 a3 alt( x, t0 b R'( x, t0 Estimation : Zˆ( x G, t Z( x 0 t 0, Compléments avec la condition: mod( x G, t0 mod( x, t0 pop( x G, t0 pop( x, t0 alt( xg, t0 alt( x, t0
55 55 Cokrigeage La ou les variables auxiliaires sélectionnées sont introduites en dérive externe des observations. Exemple: Hypothèses : Estimation : Zˆ( x G Z( x, t0 c pop( x, t0 c alt( x, t0 d R''( x, t0, t Modèle linéaire de corégionalisation entre R et CHIMERE 0 Z( x, t0 i i mod( x, t i 0 Compléments avec la condition: pop( x G, t0 pop( x, t0 alt( xg, t0 alt( x, t0