Marc Bocquet CEREA, École des Ponts ParisTech Université Paris-Est et INRIA
|
|
|
- Marie-Rose Paradis
- il y a 10 ans
- Total affichages :
Transcription
1 Construction optimale de réseaux de mesure: application à la surveillance des polluants aériens Notes de cours de l École Nationale Supérieure des Techniques Avancées ParisTech Révision 1.13 Marc Bocquet CEREA, École des Ponts ParisTech Université Paris-Est et INRIA Janvier janvier 2009
2 ii Construction optimale de réseaux de mesure
3 Table des matières Remerciements v 1 Généralités Pourquoi un réseau de mesure Optimalité des réseaux de mesure Capacité du réseau à estimer : méthodes d interpolation statistiques Généralités Un objectif récurrent : la capacité à interpoler Techniques d interpolation empiriques Bref aperçu de la technique de krigeage Mesure de l utilité d un réseau : trois approches différentes Les méthodes exploratoires : distance, remplissage Les méthodes historiquement liées à la régression Classification des critères Le théorème d équivalence de Kiefer-Wolfowitz Équivalence asymptotique des D- et G-optimalités Calcul des fonctions de sensibilité Les méthodes fondées sur le maximum d entropie Gain d information Lien avec l entropie Calcul de l information mutuelle de deux réseaux à partir d un modèle gaussien Exemple d application : surveillance des émanations d un site industriel Plan d expérience Modèle physique, interpolation et performance du réseau Choix secondaires Résultats Influence du critère sur la conception du réseau Influence de la physique : conditions météorologiques M. Bocquet
4 iv TABLE DES MATIÈRES Construction optimale de réseaux de mesure
5 Remerciements Merci à Yelva Roustan pour les figures des réseaux de mesure de la qualité de l air. Merci à Rachid Abida et Nikki Vercauteren pour de nombreuses discussions, et pour certaines figures. Merci également à Bruno Sportisse et Werner Müller, de l Institut für angewandte Statistik, Autriche, pour leur soutien et leur conseils. Merci à l Institut de Radioprotection et de Sûreté Nucléaire, dont le soutien financier a permis le lancement de l axe de recherche network design au CEREA, et en particulier à Olivier Isnard et Anne Mathieu, du service des situations d urgence et d organisation de la crise. Enfin merci aux élèves de l École Nationale des Techniques Avancées et aux élèves de l École Nationale des Ponts et Chaussées, pour avoir subi plusieurs réglages sur ce cours, pour lequel il n existe pas de manuel de référence. Le CEREA est un laboratoire commun Ecole des Ponts ParisTech / EDF R&D. Le groupe assimilation de données / modélisation inverse, auquel se rattache l activité network design est partie intégrante de l équipe-projet CLIME commune à l INRIA et l ENPC. Site web du CEREA : Page groupe assimilation de données du CEREA : fr.html. Site web de l auteur : M. Bocquet
6 vi Remerciements Construction optimale de réseaux de mesure
7 Chapitre 1 Généralités La mesure de la qualité de l air sur une région, c est-à-dire la mesure de concentration en polluants (par exemple à l échelle de l Île de France), s effectue principalement aux moyens de stations terrestres de mesure. Les polluants récurrents que l on souhaite analyser au moyen de ces stations sont l ozone (O 3 ), les oxydes d azote (NO et NO 2 ), le dioxyde de soufre (SO 2 ), le monoxyde de carbone (CO), les particules fines (les PM 10, plus petites que 10 µm et les PM 2.5, plus petites que 2.5 µm) et les composés organiques volatils (dérivés des hydrocarbures). Une spatialisation de l analyse de l état chimique de l air au niveau du sol est obtenue par un réseau de stations dispersées sur la zone à instrumenter. Sur la figure 1.1, sont représentées les stations automatiques de mesure des polluants utilisées par l agence AIRPARIF sur l Île de France [5]. Près de mesures de concentrations sont ainsi collectées quotidiennement [2]. La fréquence de ces mesures est horaire. AIRPARIF fait partie des associations agréées pour la surveillance de la qualité de l air (AASQUA) (il y en a une quarantaine), qui couvrent le territoire français (en particulier les agglomérations de plus de habitants). Le réseau des stations des AASQUA [4] est représenté sur la figure 1.2. Les mesures des stations du réseau des AASQUA sont collectées dans la base de données BDQA (Banque de données sur la qualité de l air), gérée par l ADEME. À l échelle européenne existe le réseau EMEP, représenté sur la figure 1.3. EMEP est le programme de coopération européenne pour la surveillance et l évaluation du transport à longue distance des polluants aériens. L ensemble des stations régionales des agences régionales des pays européens ainsi que le réseau EMEP forment un réseau permettant d abonder la base de données AIRBASE [6]. Le réseau correspondant est visualisé sur la figure Pourquoi un réseau de mesure Il est clair que la surveillance de la qualité de l air nécessite la constitution de réseaux de mesure. On peut invoquer plusieurs objectifs possibles pour ces réseaux : 1. Le contrôle de la qualité de l air, c est-à-dire le respect de certaines normes en concentrations qui ont été décrétées. 2. L activation des mesures d urgence rendue nécessaire par le dépassement de seuils critiques lors d épisodes de pollution aigus. M. Bocquet
8 2 Généralités 3. La surveillance à terme de l évolution des concentrations en polluants. En particulier il s agit d estimer l impact de mesures de réduction des émissions. 4. Constitution d une base de données, afin d alimenter en données la recherche amont : l étude de la sensibilité des concentrations de polluants à certains facteurs. D autres objectifs sont plus spécifiques : 1. Obtenir des données afin d établir des prévisions à court terme (de un à cinq jours), grâce à l assimilation de données. 2. Déterminer les concentrations représentatives dans les zones denses en population (impact sanitaire), ainsi que les pics de concentrations. 3. Déterminer les concentrations de fond de certaines espèces traces (métaux lourds, composés organiques volatils, polluants organiques persistants (POP)). 4. Déterminer le transport de polluants d une région à l autre (pollueur, pollué). 1.2 Optimalité des réseaux de mesure L optimalité de ces réseaux est un problème assez souvent occulté. Le réseau a pu se construire progressivement, sans plan d ensemble ni stratégie globale. Les motivations sociologiques et politiques ont pu dominer les décisions d implantation. On peut néanmoins s attendre à ce qu avec la rationalisation des réseaux et le coût financier élevé des stations et du traitement des données, la question prenne de l ampleur. Cependant qu entend-on par réseau optimal? La question est déterminante. En effet, un réseau est optimal pour un objectif assigné à un programme de surveillance permis par le réseau. Suivant l objectif, un même réseau sera satisfaisant ou ne le sera pas. Les critères d optimalité de l on peut en tirer résultent de la quantification de ces objectifs. Leur formalisation (attribution d un score numérique, un coût, à chaque réseau potentiel) est souvent ardue. Par exemple, il est naturel que la surveillance des concentrations près des zones denses en population et près des zones de forte émission soit prioritaire. (Il est clair que la répartition des stations sur la figure 1.1 suit plus ou moins, et par la force des choses, cette hiérarchisation.) Pour obtenir un critère numérique, il est donc nécessaire de quantifier ces hiérarchisations des priorités, ce qui n a rien d immédiat. Dans l exemple évoqué, des complications surviennent si l on prend conscience que la densité de population diffère entre jour et nuit, comme les émissions. Les critères les plus fréquents sont ceux qui permettent de remplir les objectifs (tels que ceux décrits plus haut) assignés au réseau de surveillance. Ces critères se focalisent sur les statistiques nécessairement mises en œuvre pour l interprétation des données fournies par le réseau. En effet pour remplir un ou plusieurs des objectifs sus-mentionnés, on devrait disposer d une carte continue en espace et en temps des champs de concentrations. Ce qui n est pas ce que fournit le réseau, parcimonieux par nature. De plus les mesures sont entachées d erreur, ce qui complique l estimation. Par conséquent, afin de remplir quelques uns des grands objectifs mentionnés ci-dessus, on doit s assurer que plusieurs conditions de nature statistiques soient remplies. On peut citer quelques exemples parmi d autres : 1. Les valeurs moyennes obtenues des données du réseau devraient pouvoir être estimées à une précision déterminée. Construction optimale de réseaux de mesure
9 1.2 Optimalité des réseaux de mesure 3 2. Les données recueillies doivent permettre l interpolation des concentrations en tout point du domaine et à une précision suffisante. 3. Les maxima locaux de concentrations doivent pouvoir être soit observés directement soit diagnostiqués à partir des données du réseau, autant que possible. 4. La mise en berne d une ou plusieurs stations doit avoir une influence limitée sur les performances du réseau. Ce type de critères pour un réseau a pour objectif la prévision spatiale, c est-à-dire, à un temps donné, reconstruire le champ de concentration au moyen des mesures collectées par le réseau. Lorsque l on dispose d un modèle fin de dispersion des polluants surveillés, de nouveaux enjeux peuvent apparaître. On peut notamment chercher à déterminer un ou plusieurs des paramètres du modèle, ou bien des champs de forçage. Il s agit donc d inverser des paramètres à l aide des données fournies par le réseau. On souhaite donc que le réseau fournissent des données telles que l erreur moyenne commise lors de l inversion soit réduite. En conséquence la première étape de la construction d un réseau de mesure consiste à : 1. se fixer les objectifs généraux du programme de surveillance attribué au réseau. 2. à définir les marges de tolérances pour les erreurs statistiques commises sur les observables lorsqu on utilise les données du réseau. M. Bocquet
10 4 Généralités Fig. 1.1 Disposition des stations de mesure utilisées par AIRPARIF, tiré du rapport d activité 2007 d AIRPARIF. Construction optimale de réseaux de mesure
11 1.2 Optimalité des réseaux de mesure 5 55 N 50 N 45 N 40 N 5 W 0 5 E 10 E 15 E 20 E Fig. 1.2 Disposition des stations de mesure utilisées par les AASQUA. 55 N 50 N 45 N 40 N 5 W 0 5 E 10 E 15 E 20 E Fig. 1.3 Disposition des stations de mesure utilisées par EMEP. M. Bocquet
12 6 Généralités 55 N 50 N 45 N 40 N 5 W 0 5 E 10 E 15 E 20 E Fig. 1.4 Disposition des stations de mesure utilisées par AIRBASE. Construction optimale de réseaux de mesure
13 Chapitre 2 Capacité du réseau à estimer : méthodes d interpolation statistiques Dans cette section, on montre comment on peut définir une fonction coût particulière pour un réseau de mesure. Les fonctions coût correspondent à autant de critères de rationalisation du réseau. De nombreux choix sont possibles et légitimes. On ne donnera donc ici que quelques exemples. L objectif étant ici de davantage détailler un choix parmi d autres. 2.1 Généralités On peut distinguer génériquement trois étapes successives dans la conception d une fonction d utilité pour un réseau : 1. Définir précisément ce que l on veut obtenir du réseau : moyenne, extrêmes, seuils d alerte, etc. Ces observables peuvent être distinctes des mesures directes sur le réseau. 2. Définir la manière (algorithme) d obtenir ces quantités à partir des mesures sur le réseau. 3. Proposer un critère quantitatif d évaluation de la performance du réseau au regard de son objectif défini à l étape qui précède. Il y a donc plusieurs choix successifs distincts à faire, lorsque l on souhaite parler d optimalité pour un réseau. Considérons donc un réseau de n emplacements potentiels de stations de mesure. Chaque station effectue une mesure de concentration d un polluant par intervalle de temps. Compte tenu ou non d un existant pour le réseau, on distingue plusieurs options : On peut chercher à réduire un réseau déjà existant (soucis efficacité/coût). On peut chercher à augmenter un réseau, notamment un réseau qui aura été construit au fur et à mesure (besoins croissants, apports financiers successifs). On peut vouloir créer un réseau à partir de rien. La troisième option (réseau ab nihilo) conduit à des difficultés, du fait de la complexité mathématique dans la résolution du problème. Elle est en pratique plus rare puisqu elle M. Bocquet
14 8 Capacité du réseau à estimer : méthodes d interpolation statistiques nécessite un investissement massif. Les deux premières options sont plus aisées à mettre en œuvre et sont rencontrées plus fréquemment. Mais ces deux premières approches conduisent à des formulations distinctes. En effet, pour rajouter un site à un réseau on recherchera une station dont les variances des mesures a priori est importante (par exemple la station de plus grande variances). Cela caractérise en effet une plus grande incertitude. Au contraire, pour ôter un site d un réseau existant, on cherchera à retirer un site de faible variance (par exemple la station de plus petite variance). 2.2 Un objectif récurrent : la capacité à interpoler On considère maintenant un cas intermédiaire où l on cherche à sélectionner un certain nombre de stations parmi une sélection de sites prédéterminés. On suppose l existence d un tel ensemble de sites potentiels, car il est, au moins du point de vue combinatoire, plus difficile d envisager de pouvoir positionner un site en tout point géographique (continuum de possibilité). On suppose que le coût d installation d une station est égal quelque soit l emplacement retenu. On dispose d un budget permettant d installer p stations, avec p n. Il s agit donc de choisir au mieux p des n emplacements potentiels. Les emplacements retenus seront dits instrumentés, alors que les n p autres seront non-instrumentés. Connaissant les mesures effectuées aux p sites instrumentés, on peut chercher estimer les concentrations aux n p sites non-instrumentés. Un critère objectif pour la constitution du réseau consiste à demander à ce que l erreur commise par l estimation sur les sites non-instrumentés soit la plus faible possible. Pour atteindre cet objectif, il faut être capable d estimer des valeurs de concentration en des sites extérieurs au réseau instrumenté, et d en estimer l erreur attachée de façon a priori. Il existe de nombreuses méthodes, plus ou moins empiriques, répondant à cet objectif Techniques d interpolation empiriques Parmi les plus simples, on compte : Le point le pus proche : se décline sous la forme des polygones de Thiessen (ou de Voronoi, ou de Dirichlet). Par exemple ces polygones sont définis par V i = {s = (x, y) : s s i s s j, i j}. La triangularisation (par exemple les triangles de Delaunay). Des combinaisons dont les pondérations sont liées à la distance aux points du réseau. La tendance (trend surface) Une méthode alternative issue de la géostatistique est le krigeage, méthode qui a pour vocation de répondre à cette question [3] : donner une estimation d un champ statistique en un point à partir de mesures spatialisées Bref aperçu de la technique de krigeage On note Z le vecteur des observations sur les p stations d un réseau potentiel G : Z T = (Z(s 1 ), Z(s 2 ),, Z(s p )), (2.1) Construction optimale de réseaux de mesure
15 2.2 Un objectif récurrent : la capacité à interpoler 9 où G est constitué des sites {s 1, s 2,, s p }. On note Y le vecteur des concentrations réelles sur les n p stations complémentaires du réseau G (ce réseau est noté U) : Y T = (Y (s p+1 ), Y (s p+2 ),, Y (s n )), (2.2) où U = {s p+1, s p+2,, s n }. Enfin on note Ŷ le vecteur des estimations pour les concentrations sur les sites de U. Comme l on cherche à déterminer une estimation sur plusieurs sites simultanément, la technique de krigeage porte le nom de cokrigeage. On cherche à obtenir une estimation sur U à partir des mesures sur G qui soit optimale dans un sens à définir. Pour cela, on va faire appel à l analyse dite BLUE, pour Best Linear Unbiased Estimator. On suppose qu il est possible de déduire Y à partir de Z à partir du modèle : Y = LZ + ǫ. (2.3) où L est une matrice (n p) p à déterminer. Cet Ansatz simple, mais néanmoins nontrivial, est un modèle de régression linéaire. ǫ mesure l erreur modèle commise. Y et Z sont vus comme des vecteurs aléatoires corrélés. Un estimateur est alors donné par Ŷ LZ. (2.4) On suppose que le modèle de régression est sans biais, c est-à-dire E[ǫ] = 0. Il en résulte que E[Ŷ ] = LE[Z]. Et de là : Y E[Y ] = L(Z E[Z]) + ǫ. (2.5) On note alors les écarts à la moyenne Y = Y E[Y ] et Z = Z E[Z]. On veut choisir L de sorte que l erreur commise par le modèle de régression soit la plus faible possible, en moyenne. Le critère d optimalité de l analyse BLUE consiste à demander que la variance de l estimateur soit minimale. On veut donc minimiser E [ Tr ( ǫǫ T)]. Or E [ Tr ( ǫǫ T)] ( =Tr E [( Y L Z)( Y L Z) T]) =Tr ( E [ Y Y T] + LE [ Z Z T] L LE [ Z Y T] E [ Y Z T] L T). (2.6) Pour poursuivre le raisonnement, il apparaît donc qu il faut se donner les matrices de covariances : des mesures effectuées sur les sites instrumentés Σ ZZ = E [ Z Z T], des mesures issues des sites instrumentés avec les mesures issues des sites noninstrumentés : Σ Y Z = E [ Y Z T]. On a aussi Σ ZY = E [ Z Y T] = Σ T Y Z. C est une information a priori, un modèle de nature statistique, qu il est nécessaire de se donner, sur lequel on reviendra ensuite. Au minimum de la fonctionnelle, la variation de Tr ( ǫǫ T) est nulle au premier ordre : 0 = Tr ( δǫǫ T + ǫδǫ T} = Tr ( δlσ ZZ L T + LΣ ZZ δl T δlσ ZY Σ Y Z δl T ) (2.7) soit encore 0 = 2Tr ( (LΣ ZZ Σ Y Z )δl T). Il en résulte que L = Σ Y Z Σ 1 ZZ. (2.8) M. Bocquet
16 10 Capacité du réseau à estimer : méthodes d interpolation statistiques La détermination de L achève la construction de l estimateur BLUE La valeur du minimum de l erreur moyenne vaut alors Ŷ = Σ Y Z Σ 1 ZZ Z. (2.9) E = min L E[ Tr ( ǫǫ T)] = Tr ( Σ Y Y Σ Y Z Σ 1 ZZ Σ ZY ). (2.10) Donc si le réseau instrumenté G est choisi, et si l on décide d utiliser la technique de krigeage issue de BLUE, alors il est possible de déterminer l erreur moyenne associée à ce choix. Un réseau optimal est donc une solution de la minimisation du critère E : G = argmin E(G). (2.11) G G varie sur toutes les configurations possibles de p stations parmi les n stations candidates. En général, le calcul a priori des matrice de covariances Σ XX, Σ XY se fonde sur des statistiques passées. Les géostatisticiens utilisent peu directement les matrices de covariances (ou corrélogrammes), mais considèrent un objet qui lui est indirectement lié, la semi-variance. Elle est de la forme γ(h) = 1 2 E [(Z(x) Z(x + h)) 2] (2.12) Cette définition insiste sur la séparation spatiale entre deux sites. En développant le carré, on comprend que la semi-variance peut s exprimer en fonction des éléments des matrices de covariance. Elle est préférée au corrélogramme car sa définition est plus générale (un semivariogramme peut être bien défini quand le corrélogramme associé peut ne pas exister). Il existe un certains nombre de modèles statistiques, dit modèle de semivariogramme qui fournissent une expression pour γ(h) Par exemple le modèle exponentiel est de la forme ( ( γ(h) = c 0 + c 1 exp h )), (2.13) a où c 0 est le paramètre dit effet de pépite, c + c 0 est le paramètre de palier, et a est la portée. Construction optimale de réseaux de mesure
17 2.2 Un objectif récurrent : la capacité à interpoler 11 R G Z Y U Fig. 2.1 Représentation symbolique du réseau total R, du réseau instrumenté G et du réseau non-instrumenté U. M. Bocquet
18 12 Capacité du réseau à estimer : méthodes d interpolation statistiques Construction optimale de réseaux de mesure
19 Chapitre 3 Mesure de l utilité d un réseau : trois approches différentes On présente ici trois approches couramment utilisées dans la construction optimale de réseaux, en particulier en science environnementale. Plus ou moins distinctement, ces trois démarches répondent toutes aux questions : utilité du réseau? critère d évaluation? 3.1 Les méthodes exploratoires : distance, remplissage La construction optimale d un réseau est aujourd hui considérablement aidée par la croissance vertigineuse de la puissance informatique. Néanmoins cela n a pas toujours été le cas. De plus il subsiste de très nombreuses applications, notamment en qualité de l air, où l utilisation du modèle a un coût numérique important et l utilisation de méthodes d optimisation reste difficile. C est pourquoi de nombreuses méthodes dites exploratoires ont été développées en ayant à l esprit l exigence de la simplicité. Ces méthodes sont donc généralement indépendantes de tout modèle explicite. On peut citer : La méthode de projection : il s agit de plaquer un réseau prédéfini où les stations sont disposées de façon figée sur le domaine que l on veut instrumenter (par example à l aide d une transformation conforme). Les méthodes stochastiques : on crée un réseau aléatoire dans le domaine par tirage. Ceci garantit une absence de biais dans la construction. En revanche, la méthode a contre elle qu il est presque toujours possible de construire un réseau déterministe légèrement plus performant en retouchant localement quelques stations. C est pourquoi elle n a que peu de faveurs. Elle peut cependant servir à initialiser un algorithme de construction. Les méthodes de remplissage : elles permettent comme les deux méthodes précédentes d engendrer facilement des réseaux ayant une très bonne couverture, mais la démarche est davantage raisonnée qu auparavant. On rapelle que G est le réseau des sites instrumentés alors que U est le réseau des sites non-instumentés. On considère ici plusieurs déclinaisons du concept : 1. La U-optimalité : pour tout réseau ξ n comportant n stations, il s agit de tester M. Bocquet
20 14 Mesure de l utilité d un réseau : trois approches différentes son uniformité sur le territoire à instrumenter en définissant l indicateur : ( ) 1/α 1 D(ξ n ) = (d(x, ξ n )) α, (3.1) U x U où d(x, ξ n ) est la distance du point x non-instrumenté au réseau, c est-à-dire d(x, ξ n ) = min x y. U est le nombre de sites non-instrumentés. On recherche y ξ n alors un réseau optimal ξn tel que ξ n = argmax ξ n D(ξ n ). (3.2) C est un cas particulier d une distance généralisée [16] ( ) 1/α 1 C α,β = (d β (x, ξ n )) α, (3.3) n avec x U d β (x, ξ n ) = 1 x u β n u ξ n 1/β. (3.4) Dans le cas présent D(ξ n ) correspond alors à la limite asymptotique β tend vers. 2. La S-optimalité : il s agit pour tout réseau ξ n comportant n stations de tester sa capacité à se répartir les uns par rapport aux autres de façon optimale : n D(ξ n ) = 1, (3.5) x ξ n (d(x, ξ n x)) où D(ξ n ) représente la moyenne harmonique des distances d un point du réseau aux autres points du réseau. On recherche alors un réseau optimal ξ n tel que ξ n = argmax ξ n D(ξ n ). (3.6) 3. Distance minimax : il ne s agit pas de tester l uniformité des points du réseau sur l ensemble du territoire à étudier mais de tester l étalement des points du réseau les uns par rapport aux autres. { } ξn = argmax ξn min x i x j. (3.7) x i,x j ξ n Ce critère correspond au cas limite lim α +,β C α,β. Sur la figure 3.1 est donné un exemple d application du critère minimax. 4. Algorithme du Cafetier : Cette technique s inspire la philosophie du maxmin, mais elle devient constructive. Selon cette technique, on ajoute chaque point du réseau l un après l autre. Lorsque l on cherche le (n + 1)-ème point du réseau, qui s ajoute par récurrence au réseau à n points précédemment construit, on utilise : } x (n+1) = argmax x Ω {min x i x. (3.8) x i ξ Construction optimale de réseaux de mesure
21 3.1 Les méthodes exploratoires : distance, remplissage Latitude (deg) Distance minimale du reseu Longitude (deg) iterations (X100) Fig. 3.1 On cherche à optimiser un réseau de 46 stations. 21 stations sont fixes et sont implantées (fictivement) près des sites nucléaires civils français (centrales nucléaires, usines de retraitement). Les losanges représentent les sites nucléaires, les grands disques les stations fixes. Reste donc 25 stations dont la distribution est à optimiser. Le critère étant purement géométrique, aucun modèle physique n intervient. À gauche est représenté un réseau proche de l optimalité. À droite est tracé l évolution du critère au fur et à mesure que l algorithme (basé sur des méthodes stochastiques) progresse. Ce résultat est liée à une étude menée avec l IRSN (projet Descartes). M. Bocquet
22 16 Mesure de l utilité d un réseau : trois approches différentes Une deuxième raison pour lesquels les réseaux exploratoires sont prisés est qu ils ne sont pas nécessairement plus mauvais que des réseaux construits sur des critères sophistiqués (confère [16]) sur la base de modèles statistiques ou de modèles numériques complexes déterministes. 3.2 Les méthodes historiquement liées à la régression A priori la théorie de la régression linéaire est assez éloignée de la construction optimale de réseau. C est pourtant de ce domaine qu ont émergé les premiers travaux sur l optimal design theory. Cette approche est développée dans les monographies [11, 8]. Le problème de la régression linéaire est le suivant. On considère une expérience dont les entrées sont les paramètres x 1, x 2,, x n, et dont les sorties sont les observations y 1, y 2,, y n. On dispose de p fonctions f j sur lesquelles on souhaite décomposer ce jeu de mesures : p y i = f j (x i )β j + ǫ i. (3.9) j=1 Les coefficients β j (j = 1,, p) sont à déterminer. Ils décident de la pondération de chacune des p fonctions de base f j, connues a priori. ǫ i représente l erreur commise sur la sortie y i. On suppose ces erreurs sans biais, décorrelées et homocédastiques d écart-type σ. On définit la matrice H = [f 1, f 2,, f p ] de taille n p : H = f 1 (x 1 ) f 2 (x 1 ) f p (x 1 ) f 1 (x 2 ) f 2 (x 2 ) f p (x 2 ).... f 1 (x n ) f 2 (x n ) f p (x n ) que l on peut récrire à l aide de n vecteurs colonnes h i (3.10) h i (x i ) = (f 1 (x i ), f 2 (x i ),, f p (x i )) T, (3.11) qui ne dépendent chacun que d une variable x i. On a ainsi H T = [h 1 (x 1 ), h 2 (x 2 ),, h n (x n )]. (3.12) Puisqu on peut distinguer les h i (x i ) par leur variable, on peut abandonner l indice i avec h(x i ). L idée sous-jacente est d introduire une dimension spatiale au problème. Les x i sont alors interprétés comme la (les) coordonnée(s) d un point x i. La solution normale du problème de régression y = Hβ + ǫ, (3.13) est donnée par β = (H T H) 1 H T y. (3.14) Elle s obtient par la minimisation du problème variationnel : J (β) = 1 2σ 2(y Hβ)T (y Hβ). (3.15) Construction optimale de réseaux de mesure
23 3.2 Les méthodes historiquement liées à la régression 17 H T H/σ 2 s identifie donc au Hessien du problème variationnel associé. Son inverse caractérise la variance du résultat, c est-à-dire l incertitude qui lui est associée. On cherche à réduire cette variance, en choisissant au mieux les points x 1, x 2,, x n. Comme les expressions mathématiques ne sont pas faciles à manipuler vues comme des fonctions de ces points, on introduit une mesure ξ(x) positive, définie sur le domaine Ω et normalisée : dξ(x) = 1, de sorte que Ω H T H = n i=1 h(x i )h T (x i ) = n dξ(x)h(x)h T (x). (3.16) Ω Ω est l espace des points sur lequel est défini la mesure, donc le réseau. En terme de distributions de Dirac ξ(x) = 1 n n i=1 δ(x x i). On note M(ξ) = Ω dξ(x)h(x)h T (x). (3.17) Cette matrice de taille p p est appelée matrice d information. En tant que Hessien (à un facteur constant près : H T H = nm(ξ)) du problème variationnel de régression associé, cette matrice caractérise la confiance que l on porte dans le résultat de la régression. Dans un sens à préciser, plus la norme de cette matrice est grande, plus grande sera la qualité du réseau sous-jacent, qui permettra la plus grande réduction d erreur Classification des critères Il existe une classification de critères que l on peut retenir pour optimiser ce réseau de points et qui se fonde sur la matrice d information M(ξ), dont l inverse est, rappelons-le, directement proportionnel à la variance de la régression linéaire. D-optimalité La D-optimalité : Le critère d optimalité a pour fonction coût Ψ{M(ξ)} = ln M(ξ). Le déterminant M(ξ) mesure le volume décrit par les directions principales de M(ξ), c est-à-dire le volume d un ellipsoïde de confiance, à niveau de confiance donné. Le réseau optimal est donc solution de ξ = argminψ{m(ξ)}. (3.18) ξ En termes de valeurs propres de M(ξ), le critère équivaut à minimiser i 1 λ i. A-optimalité La A-optimalité : Ψ{M(ξ)} = Tr(M 1 (ξ)). Ce critère correspond à la variance moyenne sur les paramètres. En terme de valeurs propres de M, il s agit de minimiser i 1 λ i. E-optimalité La E-optimalité : Ψ{M(ξ)} = max u =1 u T M 1 (ξ)u. En terme de valeurs propres de M, il s agit de minimiser le maximum des 1 λ i. M. Bocquet
24 18 Mesure de l utilité d un réseau : trois approches différentes G-optimalité La G-optimalité : Ψ{M(ξ)} = max x Ω d(x, ξ), où d(x, ξ) = h(x) T M(ξ) 1 h(x). Il est simple d en déduire que σ 2 d(x, ξ) est la variance de l erreur associée à la réponse estimée h(x) T β à la position x, de sorte que le critère de G-optimalité est celui qui minimise la variance maximale sur toutes les positions x. Comme β = (H T H) 1 H T y, on a y = H(H T H) 1 H T y, d où l on extrait la matrice d influence : A = H(H T H) 1 H T = 1 n h T (x 1 ) h T (x 2 ). h T (x n ) [ M(ξ) 1 h(x 1 ) h(x 2 ) h(x n ) ] (3.19) Et donc en terme de variables de position continues : A = dξ(x) dξ(x )h T (x)m(ξ) 1 h(x ). (3.20) Ω La matrice A, de taille n n, se décompose donc en des contributions dépendant des paires de point du réseau A(x, x ). Les scalaires d(x, ξ) s interprètent alors comme les contributions diagonales de la matrice d influence. La moyenne de d(x, ξ) sur tout le réseau est dξ d(x, ξ) = dξ Tr { M(ξ) 1 h(x)h(x) T} Ω Ω = Tr { M(ξ) 1 M(ξ) } (3.21) = Tr(I p ) = p. Ce qui implique qu il existe au moins un point x tel que d(x, ξ) p et qu il existe au moins un point x tel que d(x, ξ) p. Il en résulte aussi qu une configuration optimale est telle que d(x, ξ) = p uniformément Le théorème d équivalence de Kiefer-Wolfowitz Il est rarement pratique d optimiser la fonctionnelle Ψ{M(ξ)}. On préfère travailler sur la fonction de sensibilité de φ(x, ξ), qui est une sorte de dérivée de Ψ{M(ξ)}. Pour cela, on compare Ψ{M(ξ)} évaluée en la mesure ξ et Ψ{M(ξ )} évaluée en la mesure ξ = (1 α)ξ + αδ x. α est un paramètre tel que 0 < α < 1. δ x est une mesure de Dirac au point physique x. Autrement dit, on rajoute le point x au réseau. Il en résulte pour la matrice d information évaluée sur cette nouvelle mesure : La fonction de sensibilité φ est alors définie par M(ξ ) = (1 α)m(ξ) + αm(δ x ). (3.22) 1 φ(x, ξ) = lim α 0 α [Ψ {(1 α)m(ξ) + αm(δ x)} Ψ{M(ξ)}]. (3.23) Le théorème général d équivalence énonce alors que les trois conditions d optimalité suivantes sont équivalentes [12] : Construction optimale de réseaux de mesure
25 3.2 Les méthodes historiquement liées à la régression ξ minimise Ψ {M(ξ)}. 2. pour tout x, φ(x, ξ ) φ(x, ξ ) 0 atteint son minimum aux points appartenant au réseau optimum ξ, c est-à-dire aux points où la mesure ξ est strictement positive Équivalence asymptotique des D- et G-optimalités On considère un réseau ξ n, constitué de points x 1, x 2,, x n, et de poids 1/n associé à chacun. Ce réseau permet la mesure de y = Hβ + ǫ, avec les mêmes notations que précédemment. En particulier H T = [h(x 1 ), h(x 2 ),, h(x n )]. Le critère retenu pour juger du mérite du réseau est Ψ(M(ξ n )) = ln M(ξ n ) (c està-dire la D-optimalité). On considère alors une modification du réseau comme suit : ξ n+1 = n n + 1 ξ n + 1 n + 1 δ x (3.24) On a donc rajouté un point x au réseau, auquel on confère le même poids que tout les autres. On a alors H T n+1h n+1 = H T nh n + h(x)h(x) T. (3.25) Donc H T n+1h n+1 = H T nh n + h(x)h(x) T = H T nh n I + (H T nh n ) 1 h(x)h(x) T = H T nh n ( 1 + h(x) T (H T nh n ) 1 h(x) ) (3.26) En passant de la deuxième à la troisième ligne, on a utilisé le fait que pour deux matrices A et B de taille respective p n et n p, on a I p + AB = exp(ln I p + AB ) = exp(tr ln(i p + AB)) ( { }) ( { ( 1) k+1 }) = exp Tr (AB) k ( 1) k+1 = exp Tr (BA) k k k k=1 = exp(tr ln(i n + BA)) = I n + BA. k=1 (3.27) Comme H T nh n = nm(ξ n ), on a H T nh n = n p M(ξ n ), et ( Ψ(M(ξ n+1 )) p ln(n + 1) = Ψ(M(ξ n )) p lnn ln ) n ht (x)m(ξ n ) 1 h(x). (3.28) Et de là lim n [Ψ {M(ξ n+1)} Ψ {M(ξ n )}] = lim np ln n n = p d(x, ξ n ). { n + 1 n } { lim n ln 1 + n } d(x, ξ) n (3.29) Pour un grand réseau (n 1), cette limite doit être comprise comme la fonction de sensibilité (α = 1/n). Par conséquent, pour ce réseau, et lorsque n est grand : φ(x, ξ) = p d(x, ξ). (3.30) M. Bocquet
26 20 Mesure de l utilité d un réseau : trois approches différentes Pour que le réseau ξ soit optimal, cette fonction doit être positive pour tout x d après le théorème d équivalence. Il faut donc que d(x, ξ) p pour tout x. Or c est la condition de G-optimalité. Dans ce cas il y a donc équivalence entre la D-optimalité et la G-optimalité. Plus généralement, le théorème d équivalence (Kiefer-Wolfowitz), qui précède le théorème général d équivalence, affirme qu il y une équivalence entre ces deux optimalités pour des mesures ξ continues [13] Calcul des fonctions de sensibilité Incidemment, grâce à l exemple précédent, nous avons calculé la fonction de sensibilité associée au critère G, qui s exprime en terme des fonctions de réponse. Un calcul plus direct permet d obtenir Ψ {(1 α)m(ξ) +αm(δ x )} Ψ {M(ξ)} ce qui se traduit en = ln (1 α)m(ξ) + αm(δ x ) + ln M(ξ) = ln (1 α)m(ξ) ln I + α 1 α M 1 (ξ)h(x)h (x) + ln M(ξ) ( ) α ln(1 α) p Tr 1 α M 1 (ξ)h(x)h (x) pα αh (x)m 1 (ξ)h(x) α (p d(x, ξ)), (3.31) φ G (x, ξ) = p d(x, ξ). (3.32) On peut immédiatement utiliser conjointement ce résultat et le théorème général d équivalence pour montrer l équivalence des optimalités D et G. Ce type de calcul peut également être mené pour d autres critères. Prenons par exemple le cas du critère A : Ψ {(1 α)m(ξ) +αm(δ x )} Ψ {M(ξ)} =Tr [(1 α)m(ξ) + αm(δ x )] 1 Tr ( M 1 (ξ) ) ( =Tr ([(1 α)m(ξ)] 1 I + ce qui se traduit en α ) ) 1 1 α M 1 (ξ)m(δ x ) Tr ( M 1 (ξ) ) ) ( Tr [(1 α)m(ξ)] 1 α 1 α M 1 (ξ)h(x)h (x) + (1 α) 1 Tr ( M 1 (ξ) ) αh (x)m 2 (ξ)h(x) + αtr ( M 1 (ξ) ) ( α h (x)m 2 (ξ)h(x) + Tr ( M 1 (ξ) )), Tr ( M 1 (ξ) ) (3.33) φ A (x, ξ) = Tr ( M 1 (ξ) ) h (x)m 2 (ξ)h(x). (3.34) Construction optimale de réseaux de mesure
27 3.3 Les méthodes fondées sur le maximum d entropie Les méthodes fondées sur le maximum d entropie Plutôt que de chercheur à réduire l erreur d un réseau de mesure, on va ici chercher à maximiser l information que permet d obtenir ce réseau de mesure. La théorie de l information (initié par Shannon, suivant Boltzmann et Gibbs) attribue un contenu en information rigoureux à une densité de probabilité. En particulier, on sait calculer la différence de contenu en information entre deux densités, disons p(x) et q(x). Cette différence s exprime par la formule de Kullback-Leibler : K[p, q] = dx p(x)ln p(x) q(x). (3.35) K n est pas une distance au sens mathématique du terme ne serait-ce que parce que K[p, q] K[q, p] en général Gain d information Cette formule peut être appliquée au réseau instrumenté G, dont les observations suivent la densité de probabilité p(z). Les mesures sur les sites non-instrumentés suivent la densité p(y ). Le gain en information est donné par p(y Z) dy p(y Z)ln, (3.36) p(y ) où p(y ) est la connaissance a priori sur les mesures du réseau non-instrumenté, et p(y Z) est la connaissance a posteriori obtenu sur les sites non-instrumentés U à partir des mesures sur G. Ce gain (toujours positif ou nul) est calculé pour un jeu de données Z. Or on recherche la moyenne de l information apportée par le réseau. C est pourquoi la moyenne de l information sur Z doit être prise. On cherche alors à maximiser l information : dz p(z) dy p(y Z)ln p(y Z) p(y ). (3.37) Cette expression est en réalité symétrique pour les réseaux G et U. Il est en effet facile de constater qu elle peut être récrite I[Y, Z] = dy dz p(z, Y )ln p(z, Y ) p(y )p(z) = dy p(y ) dz p(z Y )ln p(z Y ) (3.38) p(z) C est l information mutuelle des réseaux [10]. Le point de vue est donc symétrique : c est aussi l information moyenne que pourrait apporter le réseau U sur le réseau G. Application à la construction ab nihilo d un réseau On considère un ensemble de sites potentiels R. On souhaite construire un réseau optimal G inclus dans R ( R = U + G.) On souhaite obtenir le réseau G qui prédise au mieux les mesures sur le reste des sites (non-instrumentés) U. Il s agit donc de maximiser I[Y, Z]. Cette construction a un défaut, puisqu elle ignore totalement l information brute apportée par le réseau G indépendamment de U. M. Bocquet
28 22 Mesure de l utilité d un réseau : trois approches différentes Lien avec l entropie L entropie, qui caractérise le désordre, le contraire de l information (mathématiquement son opposé), est définie comme H X [X] = dxp(x) ln p(x). (3.39) Il est aisé de voir que l information mutuelle Eq.(3.37) est égale à I[Y, Z] = H Y [Y ] E Z [H Y [Y Z]]. (3.40) Application à la construction ab nihilo d un réseau, bis On considère un ensemble de sites potentiels R. On souhaite construire un réseau optimal G inclus dans R ( R = U + G.) On souhaite obtenir le réseau G qui apporte le plus d information possible, non plus seulement sur les sites de U comme dans le cas d application précédent mais aussi sur G, donc en fait sur R. L ensemble des mesures prises sur les sites potentiels de R est noté par le vecteur aléatoire X. On souhaite minimiser la perte d information obtenue en passant de R à U (donc toujours maximiser l information obtenue). L information obtenue entre la situation où on ne dispose que d une information a priori sur X, p(x), et une situation ou de l information a été déduite sur X, à partir de mesures Z sur le réseau G et notée p(x Z) est : dy p(x Z)ln p(x Z). (3.41) p(x) Pour évaluer l information gagnée en moyenne, on doit moyenner sur les configurations Z, pondérées par leur densité p(z), soit dz p(z) dy p(x Z)ln p(x Z) p(y Z) = dzdy p(z)p(y Z) ln p(x) p(y Z)p(Z) (3.42) = dz p(z)lnp(z) = H Z (Z). On en conclut qu il est équivalent de maximiser l entropie associé au réseau recherché. Cette fois-ci le critère tient compte de l information lié au réseau instrumenté. On notera que ce raisonnement s applique directement à la réduction d un réseau R à U. Toutefois, cela ne peut être numériquement un bon critère, car il repose sur la manipulation d un grand réseau U, plutôt que sur le calcul de propriétés liées à un nombre de sites à retirer limité. Application à l extension d un réseau Supposons que le réseau des sites instrumentés G soit figé. On souhaite l agrandir en lui ajoutant plusieurs stations U prises parmi un ensemble de stations U. On veut alors maximiser l information obtenue grâce aux mesures des stations de U, compte tenu des informations obtenues du réseau préexistant G. On souhaite donc maximiser I[Y, Z]. Puisque G est figé, H Z [Z] est constant. Puisque I[Y [, Z] = H Z [Z] E Y HZ [Z Y ] ]. (3.43) Il est donc équivalent de minimiser l entropie conditionnelle E Y [H Z [Z Y ]]. Cette construction ne souffre pas de défaut de principe. Construction optimale de réseaux de mesure
29 3.3 Les méthodes fondées sur le maximum d entropie 23 Avec cette définition, on remarque que H Y,Z [Y, Z] = H Z [Z] + E Z [H Y [Y Z]] (3.44) On peut prouver cette formule directement par H Y,Z [Y, Z] = dzdy p(z, Y )lnp(z, Y ) = dzdy p(y Z)p(Z) ln p(y Z)p(Z) = dz p(z)lnp(z) dy p(y ) dz p(y Z)lnp(Y Z) (3.45) On en déduit donc que = H Z [Z] + E Z [H Y [Y Z]]. E Z [H Y [Y Z]] = H Y,Z [Y, Z] H Z [Z]. (3.46) qui peut être exploitée pour des calculs analytiques (notamment pour des variables analytiques gaussiennes). Application à la réduction d un réseau On cherche à réduire un réseau R, en éliminant les sites U et en retenant les sites G. On a vu qu une solution optimale du point de vue de l information, consiste à maximiser l entropie de G : H Z [Z]. Mais cela est incommode numériquement. Or on a vu que : H Z [Z] = H X [X] E Z [H Y [Y Z]]. (3.47) Comme l entropie du réseau initial est fixée, il est équivalent de minimiser l entropie conditionnelle E Z [H Y [Y Z]]. On verra notamment dans le cas gaussien que cette formule présente l avantage numérique de requérir des calculs dans l espace des sites de U et non de G comme précédemment. Application à la construction ab nihilo d un réseau On considère un ensemble de sites potentiels R. On souhaite construire un réseau optimal G à partir de ces sites tels que R = U + G. Quelque soit la répartition des sites potentiels entre les réseaux G et U, l entropie globale H Y,Z [Y, Z] associée au réseau R est constante. Donc maximiser H Y,Z [Y Z] est équivalent à maximiser H Z [Z]. Il est donc équivalent de maximiser l entropie associée aux mesures du réseau que l on veut instrumenter Calcul de l information mutuelle de deux réseaux à partir d un modèle gaussien On considère deux réseaux G et U, permettant les observations (vecteurs) Z et Y respectivement. Ces observations suivent un modèle statistique gaussien : ( ( )) ΣY p(y, Z) N 0, Y Σ Y Z (3.48) Σ ZY Σ ZZ M. Bocquet
30 24 Mesure de l utilité d un réseau : trois approches différentes L information mutuelle partagée par les deux réseaux (reprise de Eq.(3.38)) vaut I[Y, Z] = dy dz p(z, Y )ln p(z, Y ) p(y )p(z). (3.49) On déduit de Eq.(3.48) les densités marginales : p(y ) N(0, Σ Y Y ) et p(z) N(0, Σ ZZ ). (3.50) L information mutuelle se décompose en I[Y, Z] = dy dz p(z, Y )ln p(z, Y ) p(y )p(z) = dy dz p(z, Y )lnp(z, Y ) dy p(y )lnp(y ) dz p(z)lnp(z) (3.51) = H Y [Y ] + H Z [Z] H Y,Z [Y, Z]. On rappelle que l entropie s écrit H X [X] = dxp(x)lnp(x). Pour calculer l information mutuelle, il faut donc calculer l entropie des trois densités gaussiennes p(y, Z), p(x) et p(y ). Génériquement, considérons la distribution gaussienne normalisée ( N(0, P)) p(x) = 1 (2π) n/2 exp P n/2 ( 1 2 xt P 1 x Alors un calcul élémentaire d intégrale gaussienne donne : dx p(x)lnp(x) = dx p(x) { 12 xt P 1 x n2 ln(2π) 12 } ln P ), (3.52) = 1 2 Tr(I) n 2 ln(2π) 1 ln P 2 (3.53) = n 2 (1 + ln(2π)) 1 ln P 2 On en déduit donc pour le calcul de l information mutuelle que I[Y, Z] = 1 2 ln Σ Y Y 1 2 ln Σ ZZ ln Σ Y Y Σ ZY Σ Y Z Σ ZZ (3.54) Mais on a (utilisant la formule du déterminant d une matrice bloc) Σ Y Y Σ Y Z = Σ ZZ Σ Y Y Σ Y Z Σ 1 ZZ Σ ZY (3.55) et donc Σ ZY Σ ZZ I[Y, Z] = 1 2 ln I Σ Y ZΣ 1 ZZ Σ ZY Σ 1 Y Y. (3.56) Ce calcul est utile pour calculer à moindres frais l entropie H Y,Z [Y Z]. En effet E Z [H Y [Y Z]] = H Y [Y ] I[Y, Z]. (3.57) Construction optimale de réseaux de mesure
31 3.3 Les méthodes fondées sur le maximum d entropie 25 On en déduit donc que E Z [H Y [Y Z]] = n p (1 + ln(2π)) ln Σ Y Y Σ Y Z Σ 1 ZZ Σ ZY. (3.58) Ceci est à rapprocher du résultat Eq.(2.10). Par conséquent le critère fondé sur la maximisation de l entropie est proche de la D-optimalité. Il est équivalent dans le cas gaussien. Le critère fondé sur la variance minimum du type Eq.(2.11), est par opposition proche de l A-optimalité. M. Bocquet
32 26 Mesure de l utilité d un réseau : trois approches différentes Construction optimale de réseaux de mesure
33 Chapitre 4 Exemple d application : surveillance des émanations d un site industriel Dans cette section, on cherche à illustrer la construction optimale d un réseau de mesure sur un exemple simple mais non trivial. On s intéresse à la petite échelle (encore appelé champ proche). Il s agit de la surveillance dans un rayon de quelques centaines de mètres à quelques kilomètres autour d un site industriel (usine chimique, centrale nucléaire). Il est demandé de concevoir un réseau de mesure permettant la détection d un polluant en situation accidentelle. De plus le réseau doit permettre de reconstituer la carte du nuage de polluant, à partir d une méthode d interpolation adéquate. On dispose de la rose des vents locaux (distribution statistique de la direction et de l intensité du vent sur le site). Dans la suite, on supposera toutefois pour simplifier que l intensité du vent est fixe. On se placera dans deux cas de figures : vent modéré (3 m s 1 ) et vent fort (10 m s 1 ). De plus, on supposera que la distribution angulaire est soit uniforme, soit piquée sur une direction (vent dominant). 4.1 Plan d expérience Pour réaliser l expérience, on a besoin d un modèle numérique qui soit une représentation de la réalité des phénomènes physiques. On espère que l erreur modèle est faible, mais la simplicité du modèle est aussi un critère déterminant, car le modèle n est qu une des pièces du plan d expérience Modèle physique, interpolation et performance du réseau Le modèle physique de dispersion La dispersion du polluant sera représentée par un modèle gaussien. On suppose que le rejet atteint rapidement un régime permanent. Le système de coordonnées spatiales est choisi pour chaque accident de telle manière que Ox désigne la direction du vent, après rotation appropriée du système de coordonnées. On note u l intensité moyenne du vent. En un point (x, y, z), on note τ = x/u, le temps de transfert. Alors le modèle gaussien de M. Bocquet
34 28 Exemple d application : surveillance des émanations d un site industriel τ A h k h A z k z τ < 240 s s < τ < 3280 s s < τ < s s < τ < s s < τ < s τ > Tab. 4.1 Tableau des paramètres de turbulence servant au calcul des coefficients de Doury. Conditions de diffusion normales (gradient de température inférieur à 0.5 /100 m). Doury estime le champ de concentration par ) { 1 c(x, y, z) = exp ( y2 exp ( 2πσ h σ z 2σ 2 h où les coefficients de Doury (1976) sont donnés par ) (z h)2 2σz 2 + exp ( )} (z + h)2 2σz 2. (4.1) σ h = (A h τ) k h σ z = (A z τ) kz. (4.2) Les paramètres A h, A z, k h et k z sont lus dans le tableau h est la hauteur du rejet. Le premier facteur exponentiel décrit la diffusion transversale à l axe du panache gaussien. Les deux exponentielles présentes dans le dernier terme décrivent la diffusion verticale du panache et son rebond au sol (la deuxième exponentielle est obtenue par la méthode des images). Les figures 4.1 représentent des résultats d expériences réalisées dans la soufflerie de l École Centrale de Lyon sur une maquette du site de la centrale nucléaire du Bugey. Une source de traceur (un hydrocarbure qui autorise une mesure précise) est relâché à partir d une des enceintes. Des isocontours du champ de concentration au sol sont représentés. Le champ de concentration présente une forme similaire au champ engendré par un panache gaussien. Le modèle gaussien, aussi rudimentaire soit-il, reste donc un outil simple et efficace pour la dispersion en champ proche. Ceci justifie son utilisation dans ce chapitre. Fonctionnalité du réseau : interpolation du champ de concentration Comme méthode d interpolation, on retient le krigeage simple. On se contente d appliquer la technique décrite dans la section Critère d optimalité du réseau À partir des mesures Z sur les sites instrumentés, la méthode d interpolation prédit les concentrations Y prev sur les stations non-instrumentées de U. Ces concentrations sont comparées aux concentrations observées (par le modèle numérique, représentation de la réalité) Y obs. On retient ici trois critères pour mesurer cette différence. Le critère de norme l et de norme l 2 ( ) L = sup Ys prev Ys obs s U L 2 = ( 1 U s U Y prev s Y obs s 2 ) 1/2, (4.3) Construction optimale de réseaux de mesure
35 4.1 Plan d expérience 29 Fig. 4.1 Isocontours du champ de concentrations au sol du traceur rejeté par une des enceintes miniature de la maquette de la centrale du Bugey placée dans la veine de la soufflerie de l École Centrale de Lyon. Les deux images correspondent à une situation vent du Nord et une situation vent du Sud. où U est le cardinal de U, l ensemble des sites potentiels non-instrumentés, et le critère de biais fractionnel L FB = 2 Ys prev Ys obs U Ys prev + Y obs s U s. (4.4) Choix secondaires Nombre de points du réseau et nombre de configurations On cherche à construire un réseau de 60 stations. On considère un réseau potentiel de 120 stations réparties en cercles concentriques autour du site. Cette manière de procéder réduit considérablement le champ d investigation, puisque 120 sites sont concernés au lieu d un continuum de possibilités. Toutefois, ( l optimisation ) reste une opération combinatoirement très difficile puisque qu il y a réseaux distincts possibles. À l aide de la formule de Stirling, il est facile de montrer que lorque n est suffisament grand ( n n/2 ) 2 πn 2n. (4.5) Pour n = 120, on obtient environ configurations possibles! Seules des méthodes stochastiques permettent d explorer (relativement) efficacement ce vaste espace de configurations. On considérera aussi des cas où 20 stations sont à choisir sur un total de 40 sites potentiels (soit un total d environ configurations possibles). Algorithme d optimisation La méthode d optimisation que l on retient est le recuit simulé (simulated annealing en anglais [14]). Il s agit d une méthode stochastique développée en physique statistique M. Bocquet
36 30 Exemple d application : surveillance des émanations d un site industriel dans les années 80 et qui dérive de l algorithme de Métropolis (c est un algorithme de type Monte-Carlo). On part d un réseau donné possédant le nombre de stations voulu (ici 60). La capacité du réseau à interpoler le champ de concentration sur les 120 sites potentiels à partir des mesures effectuées sur les 60 sites instrumentés est ensuite notée. La note obtenue vaut E a. Elle mesure l écart entre les concentrations prédites et les concentrations observées. Donc plus la note est faible, meilleur est le réseau. Puis on choisit aléatoirement une station du réseau courant que l on va exclure et on choisit au hasard une station parmi les sites potentiels non instrumentés. On obtient donc un nouveau réseau qui possède toujours 60 stations. On peut alors noter ce nouveau réseau : E b. Alors si E b < E a, on accepte le nouveau réseau. si E b > E a, on accepte le nouveau réseau avec la probabilité e (E b E a)/t, sinon on le rejette et on revient au réseau précédent. e (E b E a)/t est un facteur de Boltzmann, où le paramètre T est interprété comme une mesure de la température du système. On itère alors le processus. Afin d amener le système d optimisation vers un réseau satisfaisant (de score le plus faible possible), on diminue progressivement la température T, au fur et à mesure des itérations. Il existe de nombreux schémas de refroidissement, prescrivant la décroissance de T. Des schémas de refroidissement populaires sont une décroissance exponentielle : T k = T 0 (T f /T 0 ) k, le schéma de Lundy : T k+1 = T k /(1 + at k ) En général, il n y a pas de garantie pour qu un tel algorithme converge, sauf si le système est refroidi très progressivement, par exemple de façon logarithmique (T k a/ln(b + k)). À cause du temps de calcul, c est rarement acceptable en pratique. C est pourquoi dans les conditions d utilisation usuelles du recuit simulé, il n y pas de garantie de convergence. Toutefois, l absence de convergence n exclut en rien que le réseau optimal ait été atteint au moins une fois, lors de l exploration stochastique, ou qu un réseau proche de l optimalité (c est-à-dire suffisant en pratique) ait été atteint. Un exemple de recuit simulé est donné sur la figure Résultats Influence du critère sur la conception du réseau Comme on peut le constater sur la figure 4.3, le choix du critère a une influence significative sur le réseau optimal. Cela est surtout visible sur la configuration de vent dominant. Selon que l on opte pour un critère construit sur la norme l, ou sur le biais fractionnnel les stations du réseau sont davantage positionnées en amont ou en aval du rejet typique! Le choix du critère peut donc, selon la physique, devenir crucial Influence de la physique : conditions météorologiques La physique qui sous-entend le problème (dispersion de polluants ou de radionucléides) est aussi cruciale dans la détermination du réseau. On l a remarqué sur la figure 4.3 pour deux distribution des vents très distinctes. Mais une telle sensibilité existe également lorsque l on fait varier d autres paramètres physiques, comme l intensité du vent (à distribution angulaire égale). Construction optimale de réseaux de mesure
37 4.2 Résultats 31 1 Norme l 2 du réseau 5e-12 2e-12 1e-12 Température e e+05 2e+05 Itérations acceptées 6e e+05 Itérations acceptées Fig. 4.2 Évolution de la note du réseau lors du recuit simulé. En insert est réprésenté la décroissance de la température qui suit un schéma de Lundy. On optimise un réseau de 60 stations pour 120 sites potentiels. Dans un premier cas le vent soufle à 3 m s 1. Le réseau optimal est alors dispersé afin de bien appréhender la dispersion transversale du panache (figure de gauche de 4.4). Dans un second cas le vent soufle à 10 m s 1. Le réseau optimal se densifie au plus près du site, de façon à ce que le panache, beaucoup plus fin, ne puisse échapper à la surveillance du réseau (figure de droite de 4.4). Erreur commise par le réseau optimal (vent fort) Sur la figure 4.5 est étudiée la réponse du réseau et du système qui en exploite les données (krigeage simple) sur un rejet spécifique sous un vent d intensité forte. Dans ce premier cas, le réseau est aussi dense que possible autour du site. Le vent est fort et le panache est fin. Il s agit donc d éviter que celui-ci ne passe entre les capteurs. Erreur commise par le réseau optimal (vent faible) Sur la figure 4.6 est étudiée la réponse du réseau et du système qui en exploite les données (krigeage simple) sur un rejet spécifique sous un vent d intensité faible. Dans ce deuxième cas, le panache est suffisament large pour que l algorithme tende vers un réseau plus relaché. Le panache sera toujours détecté et il s agit de l évaluer, au mieux. La zone intérieure au site industriel n est pas instrumentée. Les erreurs commises dans cette région par le krigeage simple ne sont pas pertinentes. M. Bocquet
38 32 Exemple d application : surveillance des émanations d un site industriel MM 20/ e-20 MM 20/ e LS 20/ e-20 LS 20/ e FB 20/ FB 20/ Fig. 4.3 Réseaux optimaux de 20 stations (représentées par des ) calculés sur une base de 40 sites potentiels (représentés par des +) disposés en cercles concentriques. La colonne de gauche correspond à une rose des vents dominée par un vent directionnel (vers la droite, direction 0 ). La colonne de droite correspond à une distribution angulaire uniforme. Le critère utilisé pour les réseaux de la première ligne est la norme l. Le critère utilisé pour les réseaux de la seconde ligne est la norme l 2. Le critère utilisé pour les réseaux de la troisième ligne est le bais fractionnel. Construction optimale de réseaux de mesure
39 4.2 Résultats 33 LS 60/ e-14 LS 60/ e Fig. 4.4 Réseaux optimaux de 60 stations (représentées par des ) calculés sur une base de 120 sites potentiels (représentés par des +) disposés en cercles concentriques. Le critère retenu est celui des moindres carrés (norme l 2 ). La figure de gauche correspond à un vent de distribution angulaire uniforme et de force 3 m s 1. La figure de droite correspond à un vent de distribution angulaire uniforme et de force 10 m s 1. M. Bocquet
40 34 Exemple d application : surveillance des émanations d un site industriel Fig. 4.5 On considère le réseau optimal de 60 stations (représentées par des +), construit sur une base des vents de vitesse 10 m s 1 (voir réseau de droite de la figure 4.4). On étudie la réponse du système d interpolation se fondant sur le réseau optimal à un rejet accidentel. En haut à gauche est représenté le rejet accidentel. En haut à droite est représenté le résultat du krigeage simple du champ de concentrations en utilisant les données du réseau optimal. Les figures du bas représentent les erreurs commises en fonction du point, pour un critère de type moindre carré (pour lequel le réseau est optimisé) et un critère de type biais fractionnel (pour lequel le réseau n est pas optimisé). Construction optimale de réseaux de mesure
41 4.2 Résultats Fig. 4.6 On considère le réseau optimal de 60 stations (représentées par des +), construit sur une base des vents de vitesse 3 m s 1 (voir réseau de gauche de la figure 4.4). On étudie la réponse du système d interpolation se fondant sur le réseau optimal à un rejet accidentel. En haut à gauche est représenté le rejet accidentel. En haut à droite est représenté le résultat du krigeage simple du champ de concentrations en utilisant les données du réseau optimal. Les figures du bas représentent les erreurs commises en fonction du point, pour un critère de type moindre carré (pour lequel le réseau est optimisé) et un critère de type biais fractionnel (pour lequel le réseau n est pas optimisé). Les distance sont en mètres. M. Bocquet
42 36 Exemple d application : surveillance des émanations d un site industriel Construction optimale de réseaux de mesure
43 Bibliographie [1] Munn, R. E. The Design of Air Quality Monitoring Networks. MacMillan Publishers Ltd, [2] Programme de Surveillance de la Qualité de l air, AIRPARIF, juillet Consultable sur [3] Wackernagel, H., Multivariate geostatistics, an introduction with applications, third edition. Springer, [4] Site de la fédération ATMO : [5] Site d air parif (qui regorge d informations synthétiques et claires sur la pollution atmosphérique urbaine et péri-urbaine) : [6] Site regroupant les données AIRBASE : eu/databases/airbase/ et aussi 6/12769/acpd \ p.pdf [7] Webster, R. and Oliver, M. A., Geostatistics for Environmental Scientists, Statistics in Practice, Series Editor Vic Barnett, Wiley, [8] Müller, W. G., Collecting Spatial Data : Optimum Design of Experiments for Random Fields, Springer-Verlag, [9] Bocquet, M., Introduction aux principes et méthodes de l assimilation de données en géophysique, Notes de cours de l ENSTA, [10] Cover, T. M. and Thomas, J. A., Elements of Information Theory, Wiley-Interscience, [11] Fedorov, V., V. and Hackel, P., Model-Oriented Design of Experiments, lecture notes in statistics, Springer-Verlag, [12] Kiefer, J. General equivalence theory for optimum designs (approximate theory), Annals of Statistics, 2, p , [13] Kiefer, J. and Wolfowitz, J., The equivalence of two extremal problems, Canad. J. Math., 14, p , [14] Kirkpatrick, S., Gelatt, C. D. and Vecchi, M., P. Optimization by Simulated Annealing, Science, Vol 220, Number 4598, pages , psu.edu/kirkpatrick83optimization.html [15] Quélo, D. Assimilation de données pour la qualité de l air, en particulier Annexe A. Thèse de doctorat de l École Nationale des Ponts et Chaussées, enpc.fr/cerea/fich/these Denis QUELO.pdf M. Bocquet
44 38 BIBLIOGRAPHIE [16] Nychka, D. and Saltzman, N. Design of air quality networks. Dans Case Studies in Environmental Statistics, eds. D. Nychka, W. Piegorsch and L.H. Cox, Lecture Notes in Statistics number 132, Springer Verlag, New York, pp.51-76, Construction optimale de réseaux de mesure
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers
Précision d un résultat et calculs d incertitudes
Précision d un résultat et calculs d incertitudes PSI* 2012-2013 Lycée Chaptal 3 Table des matières Table des matières 1. Présentation d un résultat numérique................................ 4 1.1 Notations.........................................................
CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)
CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un
Texte Agrégation limitée par diffusion interne
Page n 1. Texte Agrégation limitée par diffusion interne 1 Le phénomène observé Un fût de déchets radioactifs est enterré secrètement dans le Cantal. Au bout de quelques années, il devient poreux et laisse
Moments des variables aléatoires réelles
Chapter 6 Moments des variables aléatoires réelles Sommaire 6.1 Espérance des variables aléatoires réelles................................ 46 6.1.1 Définition et calcul........................................
Chapitre 2 Le problème de l unicité des solutions
Université Joseph Fourier UE MAT 127 Mathématiques année 2011-2012 Chapitre 2 Le problème de l unicité des solutions Ce que nous verrons dans ce chapitre : un exemple d équation différentielle y = f(y)
Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/
Recherche opérationnelle Les démonstrations et les exemples seront traités en cours Souad EL Bernoussi Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/ Table des matières 1 Programmation
MCMC et approximations en champ moyen pour les modèles de Markov
MCMC et approximations en champ moyen pour les modèles de Markov Gersende FORT LTCI CNRS - TELECOM ParisTech En collaboration avec Florence FORBES (Projet MISTIS, INRIA Rhône-Alpes). Basé sur l article:
Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé
Baccalauréat S ntilles-guyane 11 septembre 14 Corrigé EXERCICE 1 6 points Commun à tous les candidats Une entreprise de jouets en peluche souhaite commercialiser un nouveau produit et à cette fin, effectue
Simulation de variables aléatoires
Chapter 1 Simulation de variables aléatoires Références: [F] Fishman, A first course in Monte Carlo, chap 3. [B] Bouleau, Probabilités de l ingénieur, chap 4. [R] Rubinstein, Simulation and Monte Carlo
Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I
Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I Roxane Duroux 1 Cadre de l étude Cette étude s inscrit dans le cadre de recherche de doses pour des essais cliniques
Fonctions de plusieurs variables
Module : Analyse 03 Chapitre 00 : Fonctions de plusieurs variables Généralités et Rappels des notions topologiques dans : Qu est- ce que?: Mathématiquement, n étant un entier non nul, on définit comme
Exercices - Fonctions de plusieurs variables : corrigé. Pour commencer
Pour commencer Exercice 1 - Ensembles de définition - Première année - 1. Le logarithme est défini si x + y > 0. On trouve donc le demi-plan supérieur délimité par la droite d équation x + y = 0.. 1 xy
Programmation linéaire
1 Programmation linéaire 1. Le problème, un exemple. 2. Le cas b = 0 3. Théorème de dualité 4. L algorithme du simplexe 5. Problèmes équivalents 6. Complexité de l Algorithme 2 Position du problème Soit
INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES
INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES Dominique LAFFLY Maître de Conférences, Université de Pau Laboratoire Société Environnement Territoire UMR 5603 du CNRS et Université de Pau Domaine
Programmes des classes préparatoires aux Grandes Ecoles
Programmes des classes préparatoires aux Grandes Ecoles Filière : scientifique Voie : Biologie, chimie, physique et sciences de la Terre (BCPST) Discipline : Mathématiques Seconde année Préambule Programme
Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications
Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications A. Optimisation sans contrainte.... Généralités.... Condition nécessaire et condition suffisante
Relation entre deux variables : estimation de la corrélation linéaire
CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence
Principe de symétrisation pour la construction d un test adaptatif
Principe de symétrisation pour la construction d un test adaptatif Cécile Durot 1 & Yves Rozenholc 2 1 UFR SEGMI, Université Paris Ouest Nanterre La Défense, France, [email protected] 2 Université
Capacité d un canal Second Théorème de Shannon. Théorie de l information 1/34
Capacité d un canal Second Théorème de Shannon Théorie de l information 1/34 Plan du cours 1. Canaux discrets sans mémoire, exemples ; 2. Capacité ; 3. Canaux symétriques ; 4. Codage de canal ; 5. Second
3 Approximation de solutions d équations
3 Approximation de solutions d équations Une équation scalaire a la forme générale f(x) =0où f est une fonction de IR dans IR. Un système de n équations à n inconnues peut aussi se mettre sous une telle
Correction du Baccalauréat S Amérique du Nord mai 2007
Correction du Baccalauréat S Amérique du Nord mai 7 EXERCICE points. Le plan (P) a une pour équation cartésienne : x+y z+ =. Les coordonnées de H vérifient cette équation donc H appartient à (P) et A n
Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques.
14-3- 214 J.F.C. p. 1 I Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques. Exercice 1 Densité de probabilité. F { ln x si x ], 1] UN OVNI... On pose x R,
L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ
L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et
Méthodes de Simulation
Méthodes de Simulation JEAN-YVES TOURNERET Institut de recherche en informatique de Toulouse (IRIT) ENSEEIHT, Toulouse, France Peyresq06 p. 1/41 Remerciements Christian Robert : pour ses excellents transparents
Chapitre 3. Mesures stationnaires. et théorèmes de convergence
Chapitre 3 Mesures stationnaires et théorèmes de convergence Christiane Cocozza-Thivent, Université de Marne-la-Vallée p.1 I. Mesures stationnaires Christiane Cocozza-Thivent, Université de Marne-la-Vallée
La fonction exponentielle
DERNIÈRE IMPRESSION LE 2 novembre 204 à :07 La fonction exponentielle Table des matières La fonction exponentielle 2. Définition et théorèmes.......................... 2.2 Approche graphique de la fonction
Filtrage stochastique non linéaire par la théorie de représentation des martingales
Filtrage stochastique non linéaire par la théorie de représentation des martingales Adriana Climescu-Haulica Laboratoire de Modélisation et Calcul Institut d Informatique et Mathématiques Appliquées de
Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles
Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Valentin Patilea 1 Cesar Sanchez-sellero 2 Matthieu Saumard 3 1 CREST-ENSAI et IRMAR 2 USC Espagne 3 IRMAR-INSA
TSTI 2D CH X : Exemples de lois à densité 1
TSTI 2D CH X : Exemples de lois à densité I Loi uniforme sur ab ; ) Introduction Dans cette activité, on s intéresse à la modélisation du tirage au hasard d un nombre réel de l intervalle [0 ;], chacun
Quantification Scalaire et Prédictive
Quantification Scalaire et Prédictive Marco Cagnazzo Département Traitement du Signal et des Images TELECOM ParisTech 7 Décembre 2012 M. Cagnazzo Quantification Scalaire et Prédictive 1/64 Plan Introduction
$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU
$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU Fabien FIGUERES [email protected] 0RWVFOpV : Krigeage, plans d expériences space-filling, points de validations, calibration moteur. 5pVXPp Dans le
Probabilités III Introduction à l évaluation d options
Probabilités III Introduction à l évaluation d options Jacques Printems Promotion 2012 2013 1 Modèle à temps discret 2 Introduction aux modèles en temps continu Limite du modèle binomial lorsque N + Un
Correction du baccalauréat ES/L Métropole 20 juin 2014
Correction du baccalauréat ES/L Métropole 0 juin 014 Exercice 1 1. c.. c. 3. c. 4. d. 5. a. P A (B)=1 P A (B)=1 0,3=0,7 D après la formule des probabilités totales : P(B)=P(A B)+P(A B)=0,6 0,3+(1 0,6)
Baccalauréat ES/L Métropole La Réunion 13 septembre 2013 Corrigé
Baccalauréat S/L Métropole La Réunion 13 septembre 2013 Corrigé A. P. M.. P. XRCIC 1 Commun à tous les candidats Partie A 1. L arbre de probabilité correspondant aux données du problème est : 0,3 0,6 H
FONCTIONS DE PLUSIEURS VARIABLES (Outils Mathématiques 4)
FONCTIONS DE PLUSIEURS VARIABLES (Outils Mathématiques 4) Bernard Le Stum Université de Rennes 1 Version du 13 mars 2009 Table des matières 1 Fonctions partielles, courbes de niveau 1 2 Limites et continuité
I. Polynômes de Tchebychev
Première épreuve CCP filière MP I. Polynômes de Tchebychev ( ) 1.a) Tout réel θ vérifie cos(nθ) = Re ((cos θ + i sin θ) n ) = Re Cn k (cos θ) n k i k (sin θ) k Or i k est réel quand k est pair et imaginaire
Principes généraux de la modélisation de la dispersion atmosphérique
Principes généraux de la modélisation de la dispersion atmosphérique Rémy BOUET- DRA/PHDS/EDIS [email protected] //--12-05-2009 1 La modélisation : Les principes Modélisation en trois étapes : Caractériser
Baccalauréat ES Pondichéry 7 avril 2014 Corrigé
Baccalauréat ES Pondichéry 7 avril 204 Corrigé EXERCICE 4 points Commun à tous les candidats. Proposition fausse. La tangente T, passant par les points A et B d abscisses distinctes, a pour coefficient
La classification automatique de données quantitatives
La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations
Modélisation géostatistique des débits le long des cours d eau.
Modélisation géostatistique des débits le long des cours d eau. C. Bernard-Michel (actuellement à ) & C. de Fouquet MISTIS, INRIA Rhône-Alpes. 655 avenue de l Europe, 38334 SAINT ISMIER Cedex. Ecole des
3. Caractéristiques et fonctions d une v.a.
3. Caractéristiques et fonctions d une v.a. MTH2302D S. Le Digabel, École Polytechnique de Montréal H2015 (v2) MTH2302D: fonctions d une v.a. 1/32 Plan 1. Caractéristiques d une distribution 2. Fonctions
Continuité et dérivabilité d une fonction
DERNIÈRE IMPRESSIN LE 7 novembre 014 à 10:3 Continuité et dérivabilité d une fonction Table des matières 1 Continuité d une fonction 1.1 Limite finie en un point.......................... 1. Continuité
1 Complément sur la projection du nuage des individus
TP 0 : Analyse en composantes principales (II) Le but de ce TP est d approfondir nos connaissances concernant l analyse en composantes principales (ACP). Pour cela, on reprend les notations du précédent
Chapitre 1 Cinématique du point matériel
Chapitre 1 Cinématique du point matériel 7 1.1. Introduction 1.1.1. Domaine d étude Le programme de mécanique de math sup se limite à l étude de la mécanique classique. Sont exclus : la relativité et la
Cours d Analyse. Fonctions de plusieurs variables
Cours d Analyse Fonctions de plusieurs variables Licence 1ère année 2007/2008 Nicolas Prioux Université de Marne-la-Vallée Table des matières 1 Notions de géométrie dans l espace et fonctions à deux variables........
Modélisation et simulation
Modélisation et simulation p. 1/36 Modélisation et simulation INFO-F-305 Gianluca Bontempi Département d Informatique Boulevard de Triomphe - CP 212 http://www.ulb.ac.be/di Modélisation et simulation p.
Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes
de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes Zohra Guessoum 1 & Farida Hamrani 2 1 Lab. MSTD, Faculté de mathématique, USTHB, BP n 32, El Alia, Alger, Algérie,[email protected]
Actuariat I ACT2121. septième séance. Arthur Charpentier. Automne 2012. [email protected]. http ://freakonometrics.blog.free.
Actuariat I ACT2121 septième séance Arthur Charpentier [email protected] http ://freakonometrics.blog.free.fr/ Automne 2012 1 Exercice 1 En analysant le temps d attente X avant un certain événement
MESURE ET PRECISION. Il est clair que si le voltmètre mesure bien la tension U aux bornes de R, l ampèremètre, lui, mesure. R mes. mes. .
MESURE ET PRECISIO La détermination de la valeur d une grandeur G à partir des mesures expérimentales de grandeurs a et b dont elle dépend n a vraiment de sens que si elle est accompagnée de la précision
Exo7. Matrice d une application linéaire. Corrections d Arnaud Bodin.
Exo7 Matrice d une application linéaire Corrections d Arnaud odin. Exercice Soit R muni de la base canonique = ( i, j). Soit f : R R la projection sur l axe des abscisses R i parallèlement à R( i + j).
Le modèle de Black et Scholes
Le modèle de Black et Scholes Alexandre Popier février 21 1 Introduction : exemple très simple de modèle financier On considère un marché avec une seule action cotée, sur une période donnée T. Dans un
Correction de l examen de la première session
de l examen de la première session Julian Tugaut, Franck Licini, Didier Vincent Si vous trouvez des erreurs de Français ou de mathématiques ou bien si vous avez des questions et/ou des suggestions, envoyez-moi
Chapitre 3. Les distributions à deux variables
Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles
Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN
Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN Table des matières. Introduction....3 Mesures et incertitudes en sciences physiques
I. Introduction. 1. Objectifs. 2. Les options. a. Présentation du problème.
I. Introduction. 1. Objectifs. Le but de ces quelques séances est d introduire les outils mathématiques, plus précisément ceux de nature probabiliste, qui interviennent dans les modèles financiers ; nous
Probabilités sur un univers fini
[http://mp.cpgedupuydelome.fr] édité le 7 août 204 Enoncés Probabilités sur un univers fini Evènements et langage ensembliste A quelle condition sur (a, b, c, d) ]0, [ 4 existe-t-il une probabilité P sur
Fonctions de plusieurs variables, intégrales multiples, et intégrales dépendant d un paramètre
IUFM du Limousin 2009-10 PLC1 Mathématiques S. Vinatier Rappels de cours Fonctions de plusieurs variables, intégrales multiples, et intégrales dépendant d un paramètre 1 Fonctions de plusieurs variables
La demande Du consommateur. Contrainte budgétaire Préférences Choix optimal
La demande Du consommateur Contrainte budgétaire Préférences Choix optimal Plan du cours Préambule : Rationalité du consommateur I II III IV V La contrainte budgétaire Les préférences Le choix optimal
Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes.
Promotion X 004 COURS D ANALYSE DES STRUCTURES MÉCANIQUES PAR LA MÉTHODE DES ELEMENTS FINIS (MEC 568) contrôle non classant (7 mars 007, heures) Documents autorisés : polycopié ; documents et notes de
M2 IAD UE MODE Notes de cours (3)
M2 IAD UE MODE Notes de cours (3) Jean-Yves Jaffray Patrice Perny 16 mars 2006 ATTITUDE PAR RAPPORT AU RISQUE 1 Attitude par rapport au risque Nousn avons pas encore fait d hypothèse sur la structure de
Introduction à l étude des Corps Finis
Introduction à l étude des Corps Finis Robert Rolland (Résumé) 1 Introduction La structure de corps fini intervient dans divers domaines des mathématiques, en particulier dans la théorie de Galois sur
Introduction à l approche bootstrap
Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?
De même, le périmètre P d un cercle de rayon 1 vaut P = 2π (par définition de π). Mais, on peut démontrer (difficilement!) que
Introduction. On suppose connus les ensembles N (des entiers naturels), Z des entiers relatifs et Q (des nombres rationnels). On s est rendu compte, depuis l antiquité, que l on ne peut pas tout mesurer
3. Conditionnement P (B)
Conditionnement 16 3. Conditionnement Dans cette section, nous allons rappeler un certain nombre de définitions et de propriétés liées au problème du conditionnement, c est à dire à la prise en compte
Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé
Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé A. P. M. E. P. Exercice 1 5 points 1. Réponse d. : 1 e Le coefficient directeur de la tangente est négatif et n est manifestement pas 2e
Les indices à surplus constant
Les indices à surplus constant Une tentative de généralisation des indices à utilité constante On cherche ici en s inspirant des indices à utilité constante à définir un indice de prix de référence adapté
Fonctions de plusieurs variables
Maths MP Exercices Fonctions de plusieurs variables Les indications ne sont ici que pour être consultées après le T (pour les exercices non traités). Avant et pendant le T, tenez bon et n allez pas les
CAPTEURS - CHAINES DE MESURES
CAPTEURS - CHAINES DE MESURES Pierre BONNET Pierre Bonnet Master GSI - Capteurs Chaînes de Mesures 1 Plan du Cours Propriétés générales des capteurs Notion de mesure Notion de capteur: principes, classes,
EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG
Exploitations pédagogiques du tableur en STG Académie de Créteil 2006 1 EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG Commission inter-irem lycées techniques contact : [email protected] La maquette
Chapitre 2/ La fonction de consommation et la fonction d épargne
hapitre 2/ La fonction de consommation et la fonction d épargne I : La fonction de consommation keynésienne II : Validations et limites de la fonction de consommation keynésienne III : Le choix de consommation
Cerea. Centre d enseignement et de recherche en environnement atmosphérique
Cerea Centre d enseignement et de recherche en environnement atmosphérique Laboratoire commun École des Ponts ParisTech / EDF R&D Université Paris-Est Le Cerea : une cinquantaine de chercheurs sur trois
Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)
Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures) Eercice 1 (5 points) pour les candidats n ayant pas choisi la spécialité MATH Le tableau suivant donne l évolution du chiffre
Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé
Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé EXERCICE 1 5 points Commun à tous les candidats 1. Réponse c : ln(10)+2 ln ( 10e 2) = ln(10)+ln ( e 2) = ln(10)+2 2. Réponse b : n 13 0,7 n 0,01
Théorie et Codage de l Information (IF01) exercices 2013-2014. Paul Honeine Université de technologie de Troyes France
Théorie et Codage de l Information (IF01) exercices 2013-2014 Paul Honeine Université de technologie de Troyes France TD-1 Rappels de calculs de probabilités Exercice 1. On dispose d un jeu de 52 cartes
Optimisation, traitement d image et éclipse de Soleil
Kléber, PCSI1&3 014-015 I. Introduction 1/8 Optimisation, traitement d image et éclipse de Soleil Partie I Introduction Le 0 mars 015 a eu lieu en France une éclipse partielle de Soleil qu il était particulièrement
I - PUISSANCE D UN POINT PAR RAPPORT A UN CERCLE CERCLES ORTHOGONAUX POLES ET POLAIRES
I - PUISSANCE D UN POINT PAR RAPPORT A UN CERCLE CERCLES ORTHOGONAUX POLES ET POLAIRES Théorème - Définition Soit un cercle (O,R) et un point. Une droite passant par coupe le cercle en deux points A et
Chapitre 0 Introduction à la cinématique
Chapitre 0 Introduction à la cinématique Plan Vitesse, accélération Coordonnées polaires Exercices corrigés Vitesse, Accélération La cinématique est l étude du mouvement Elle suppose donc l existence à
BACCALAURÉAT GÉNÉRAL SESSION 2012 OBLIGATOIRE MATHÉMATIQUES. Série S. Durée de l épreuve : 4 heures Coefficient : 7 ENSEIGNEMENT OBLIGATOIRE
BACCALAURÉAT GÉNÉRAL SESSION 2012 MATHÉMATIQUES Série S Durée de l épreuve : 4 heures Coefficient : 7 ENSEIGNEMENT OBLIGATOIRE Les calculatrices électroniques de poche sont autorisées, conformément à la
Analyse de la vidéo. Chapitre 4.1 - La modélisation pour le suivi d objet. 10 mars 2015. Chapitre 4.1 - La modélisation d objet 1 / 57
Analyse de la vidéo Chapitre 4.1 - La modélisation pour le suivi d objet 10 mars 2015 Chapitre 4.1 - La modélisation d objet 1 / 57 La représentation d objets Plan de la présentation 1 La représentation
Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique
Objectifs Clustering On ne sait pas ce qu on veut trouver : on laisse l algorithme nous proposer un modèle. On pense qu il existe des similarités entre les exemples. Qui se ressemble s assemble p. /55
Limites finies en un point
8 Limites finies en un point Pour ce chapitre, sauf précision contraire, I désigne une partie non vide de R et f une fonction définie sur I et à valeurs réelles ou complees. Là encore, les fonctions usuelles,
Probabilités conditionnelles Exercices corrigés
Terminale S Probabilités conditionnelles Exercices corrigés Exercice : (solution Une compagnie d assurance automobile fait un bilan des frais d intervention, parmi ses dossiers d accidents de la circulation.
Probabilités sur un univers fini
[http://mp.cpgedupuydelome.fr] édité le 10 août 2015 Enoncés 1 Proailités sur un univers fini Evènements et langage ensemliste A quelle condition sur (a,, c, d) ]0, 1[ 4 existe-t-il une proailité P sur
Arithmétique binaire. Chapitre. 5.1 Notions. 5.1.1 Bit. 5.1.2 Mot
Chapitre 5 Arithmétique binaire L es codes sont manipulés au quotidien sans qu on s en rende compte, et leur compréhension est quasi instinctive. Le seul fait de lire fait appel au codage alphabétique,
Cours de Mécanique du point matériel
Cours de Mécanique du point matériel SMPC1 Module 1 : Mécanique 1 Session : Automne 2014 Prof. M. EL BAZ Cours de Mécanique du Point matériel Chapitre 1 : Complément Mathématique SMPC1 Chapitre 1: Rappels
Licence MASS 2000-2001. (Re-)Mise à niveau en Probabilités. Feuilles de 1 à 7
Feuilles de 1 à 7 Ces feuilles avec 25 exercices et quelques rappels historiques furent distribuées à des étudiants de troisième année, dans le cadre d un cours intensif sur deux semaines, en début d année,
Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels
Etab=MK3, Timbre=G430, TimbreDansAdresse=Vrai, Version=W2000/Charte7, VersionTravail=W2000/Charte7 Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels
Contents. 1 Introduction Objectifs des systèmes bonus-malus Système bonus-malus à classes Système bonus-malus : Principes
Université Claude Bernard Lyon 1 Institut de Science Financière et d Assurances Système Bonus-Malus Introduction & Applications SCILAB Julien Tomas Institut de Science Financière et d Assurances Laboratoire
Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés
Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour [email protected] Une grande partie des illustrations viennent
SOMMAIRE OPÉRATIONS COURANTES OPÉRATIONS D INVENTAIRE
SOMMAIRE OPÉRATIONS COURANTES OPÉRATIONS D INVENTAIRE 1 Factures de doit p. 9 Processus 1 2 Réductions sur factures de doit p. 11 Processus 1 3 Frais accessoires sur factures p. 13 Processus 1 4 Comptabilisation
FIMA, 7 juillet 2005
F. Corset 1 S. 2 1 LabSAD Université Pierre Mendes France 2 Département de Mathématiques Université de Franche-Comté FIMA, 7 juillet 2005 Plan de l exposé plus court chemin Origine du problème Modélisation
Méthodes de quadrature. Polytech Paris-UPMC. - p. 1/48
Méthodes de Polytech Paris-UPMC - p. 1/48 Polynôme d interpolation de Preuve et polynôme de Calcul de l erreur d interpolation Étude de la formule d erreur Autres méthodes - p. 2/48 Polynôme d interpolation
Contexte. Pour cela, elles doivent être très compliquées, c est-à-dire elles doivent être très différentes des fonctions simples,
Non-linéarité Contexte Pour permettre aux algorithmes de cryptographie d être sûrs, les fonctions booléennes qu ils utilisent ne doivent pas être inversées facilement. Pour cela, elles doivent être très
Introduction. I Étude rapide du réseau - Apprentissage. II Application à la reconnaissance des notes.
Introduction L'objectif de mon TIPE est la reconnaissance de sons ou de notes de musique à l'aide d'un réseau de neurones. Ce réseau doit être capable d'apprendre à distinguer les exemples présentés puis
Exercices - Polynômes : corrigé. Opérations sur les polynômes
Opérations sur les polynômes Exercice 1 - Carré - L1/Math Sup - Si P = Q est le carré d un polynôme, alors Q est nécessairement de degré, et son coefficient dominant est égal à 1. On peut donc écrire Q(X)
Travaux dirigés d introduction aux Probabilités
Travaux dirigés d introduction aux Probabilités - Dénombrement - - Probabilités Élémentaires - - Variables Aléatoires Discrètes - - Variables Aléatoires Continues - 1 - Dénombrement - Exercice 1 Combien
Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens
Chapitre 7 Statistique des échantillons gaussiens Le théorème central limite met en évidence le rôle majeur tenu par la loi gaussienne en modélisation stochastique. De ce fait, les modèles statistiques
Théorème du point fixe - Théorème de l inversion locale
Chapitre 7 Théorème du point fixe - Théorème de l inversion locale Dans ce chapitre et le suivant, on montre deux applications importantes de la notion de différentiabilité : le théorème de l inversion
Baccalauréat ES/L Amérique du Sud 21 novembre 2013
Baccalauréat ES/L Amérique du Sud 21 novembre 2013 A. P. M. E. P. EXERCICE 1 Commun à tous les candidats 5 points Une entreprise informatique produit et vend des clés USB. La vente de ces clés est réalisée
