Comparaison entre deux solveurs linéaires : direct et multigrille



Documents pareils
Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes.

Métriques de performance pour les algorithmes et programmes parallèles

Simulation du transport de polluant dans les nappes par un modèle à faible diffusion numérique

Résolution de systèmes linéaires par des méthodes directes

Formation à la C F D Computational Fluid Dynamics. Formation à la CFD, Ph Parnaudeau

MCMC et approximations en champ moyen pour les modèles de Markov

Rencontre sur la thématique du Calcul Haute Performance - 13 juin Better Match, Faster Innovation

Etude d un cas industriel : Optimisation de la modélisation de paramètre de production

Principe de symétrisation pour la construction d un test adaptatif

T.P. FLUENT. Cours Mécanique des Fluides. 24 février 2006 NAZIH MARZOUQY

Une application de méthodes inverses en astrophysique : l'analyse de l'histoire de la formation d'étoiles dans les galaxies

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Filtrage stochastique non linéaire par la théorie de représentation des martingales

Notice d Utilisation du logiciel Finite Element Method Magnetics version 3.4 auteur: David Meeker

Figure 3.1- Lancement du Gambit

Modélisation géostatistique des débits le long des cours d eau.

Modélisation 3D par le modèle de turbulence k-ε standard de la position de la tête sur la force de résistance rencontrée par les nageurs.

Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1

T. Gasc 1,2,3, F. De Vuyst 1, R. Motte 3, M. Peybernes 4, R. Poncet 5

ÉTUDE DE L EFFICACITÉ DE GÉOGRILLES POUR PRÉVENIR L EFFONDREMENT LOCAL D UNE CHAUSSÉE

Introduction à l approche bootstrap

Texte Agrégation limitée par diffusion interne

Equation LIDAR : exp 2 Equation RADAR :

ANALYSE NUMERIQUE ET OPTIMISATION. Une introduction à la modélisation mathématique et à la simulation numérique

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

Limitations of the Playstation 3 for High Performance Cluster Computing

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

Simulation du transport de matière par diffusion surfacique à l aide d une approche Level-Set

Définition et diffusion de signatures sémantiques dans les systèmes pair-à-pair

de calibration Master 2: Calibration de modèles: présentation et simulation d

Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services

Probabilités III Introduction à l évaluation d options

Résumé des communications des Intervenants

Contribution à l étude de l écoulement dans un milieu compressible

Modélisation prédictive et incertitudes. P. Pernot. Laboratoire de Chimie Physique, CNRS/U-PSUD, Orsay

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé

TSTI 2D CH X : Exemples de lois à densité 1

Simulation numérique d un stockage de déchets nucléaires en site géologique profond

Exercice : la frontière des portefeuilles optimaux sans actif certain

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION

Quantification Scalaire et Prédictive

Initiation au HPC - Généralités

Introduction à l analyse numérique : exemple du cloud computing

Table des matières. I Mise à niveau 11. Préface

Evaluation des performances de programmes parallèles haut niveau à base de squelettes

Les correcteurs accorderont une importance particulière à la rigueur des raisonnements et aux représentations graphiques demandées.

La fonction exponentielle

Modélisation et Simulation

Infrastructures Parallèles de Calcul

Projet IGGI. Infrastructure pour Grappe, Grille et Intranet. Fabrice Dupros. CASCIMODOT - Novembre Systèmes et Technologies de l Information

Loi binomiale Lois normales

Algorithmes pour la planification de mouvements en robotique non-holonome

Résolution d équations non linéaires

CSMA e Colloque National en Calcul des Structures Mai 2013

SUIVI CINETIQUE PAR SPECTROPHOTOMETRIE (CORRECTION)

Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH

3 Approximation de solutions d équations

Théories de champ moyen et convection à grande échelle

Qu est-ce qu un ordinateur quantique et à quoi pourrait-il servir?

Exemple d application en CFD : Coefficient de traînée d un cylindre

Chapitre 0 Introduction à la cinématique

Les équations différentielles

Les algorithmes de base du graphisme

Sujet 1 : Diagnostique du Syndrome de l apnée du sommeil par des techniques d analyse discriminante.

I Stabilité, Commandabilité et Observabilité Introduction Un exemple emprunté à la robotique Le plan Problème...

CAPTEURS - CHAINES DE MESURES

physicien diplômé EPFZ originaire de France présentée acceptée sur proposition Thèse no. 7178

INTRODUCTION A L ELECTRONIQUE NUMERIQUE ECHANTILLONNAGE ET QUANTIFICATION I. ARCHITECTURE DE L ELECRONIQUE NUMERIQUE

Chapitre 2 Le problème de l unicité des solutions

Les capitalistes sociaux sur Twitter : détection via des mesures de similarité


Happy birthday ZSet High performance computing dans ZSet

Évaluation de la régression bornée

K. Ammar, F. Bachoc, JM. Martinez. Séminaire ARISTOTE - 23 octobre Palaiseau

PROJET MODELE DE TAUX

Compte rendu de LA37 B, TP numéro 1. Evolution de la température et du degrée d'hydratation

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Programmes des classes préparatoires aux Grandes Ecoles

Le modèle de Black et Scholes

UNIVERSITE DES ANTILLES et DE LA GUYANE Campus de Fouillole BP Pointe-à-Pitre Cedex CONTRAT LE MASTER NOM DU DOMAINE STS

La Recherche du Point Optimum de Fonctionnement d un Générateur Photovoltaïque en Utilisant les Réseaux NEURO-FLOUS

TRAVAUX DE RECHERCHE DANS LE

BIG Data et R: opportunités et perspectives

TP 7 : oscillateur de torsion

Calculer avec Sage. Revision : 417 du 1 er juillet 2010

Rapport d activité. Mathieu Souchaud Juin 2007

Sécuristation du Cloud

Modélisation aléatoire en fiabilité des logiciels

Exemple PLS avec SAS

Résonance Magnétique Nucléaire : RMN

Julien MATHEVET Alexandre BOISSY GSID 4. Rapport RE09. Load Balancing et migration

Contributions à l expérimentation sur les systèmes distribués de grande taille

Module HVAC - fonctionnalités

Chapitre 3. Les distributions à deux variables

NON-LINEARITE ET RESEAUX NEURONAUX

ETUDE COMPARATIVE DES MODELISATIONS NUMERIQUE ET PHYSIQUE DE DIFFERENTS OUVRAGES D EVACUATION DES CRUES

Hétérogénéité pour atteindre une consommation énergétique proportionnelle dans les clouds

MESURE ET PRECISION. Il est clair que si le voltmètre mesure bien la tension U aux bornes de R, l ampèremètre, lui, mesure. R mes. mes. .

Simulation de variables aléatoires

Transcription:

Comparaison entre deux solveurs linéaires : direct et multigrille Anthony Beaudoin 1, Jean Raynald de Dreuzy 2 & Jocelyne Erhel 3 1 LMPG - Université du Havre - anthony.beaudoin@univ-lehavre.fr 2 Géosciences - Université de Rennes 1 - aupepin@univ-rennes1.fr 3 IRISA - INRIA de Rennes - joceylne.erhel@irisa.fr Abstract : Subsurface hydraulic properties are mainly governed by the heterogeneity of the porous medium considered. Our work aims at characterizing the asymptotic dispersion coefficients for highly heterogeneous permeability fields triggered by advection and constant local dispersion - diffusion. We have developped a fully parallel software for simulating flow and transport. We have compared two well known sparse linear solvers, based respectively on a multi frontal Cholesky factorization and an iterative structured multigrid method. We study the effect of various parameters : the system size, the number of processors and the degree of heterogeneity of the permeability field. Résumé : L hétérogénéité des formations géologiques induit une très forte variation des paramètres hydrauliques. Notre objectif est de caractériser les coefficients asymptotiques de la dispersion pour des champs de perméabilité hautement hétérogènes. Nous avons développé un logiciel complètement parallèlisé pour simuler l écoulement et le transport de solutés inertes soumis à de la convection et de la dispersion cinématique. Nous avons comparé deux solveurs de systèmes linéaires creux, basés respectivement sur une factorisation de Cholesky multi frontale et sur une méthode itérative multigrille structurée. Nous étudions les effets des différents paramètres, principalement la taille du système linéaire, le nombre de processeurs et le degré d hétérogénéité du champ de perméabilité. Key-words : sparse linear solvers, heterogeneous flux computations, macro dispersion 1 Introduction Les expériences menées dans une large gamme de milieux géologiques ont révélé des caractéristiques communes au transport de solutés tels que l effet de l hétérogénéité géologique, l augmentation de la dispersion avec l échelle et la lente convergence vers un régime asymptotique. La détermination de l effet de l hétérogénéité est un pré requis à la détermination des lois de transport et à l établissement des règles de changement d échelle (de l échelle de l observation géologiques à l échelle de la modélisation hydrologique). Les expériences de terrain étant limitées en taille et en résolution, ce sont les simulations numériques de type Monte-Carlo qui permettent de comprendre et de quantifier ces règles de changement d échelle. Numériquement, l enjeu est de résoudre les problèmes de flux et de transport sur un grand nombre de milieux de très grandes tailles avec une très bonne résolution aboutissant à des systèmes linéaires de plusieurs dizaines de millions d inconnues. Des progrès récents sur les solveurs parallèles et l architecture des calculateurs parallèles permettent de résoudre ces difficultés. Nous utilisons ces progrès pour développer un logiciel de calcul parallèle. Le calcul des flux revient à résoudre un système linéaire caractérisé par une matrice creuse symétrique définie positive. La résolution de ce système linéaire est obtenue en utilisant deux librairies. PSPASES et HYPRE sont deux librairies offrant respectivement un solveur parallèle basé sur une factorisation de Cholesky multi frontale et un solveur parallèle basé sur une méthode itérative multigrille struc- 1

turée. Nous étudions les effets de différents paramètres sur ces deux solveurs, principalement la taille du système linéaire, le nombre de processeurs et le degré d hétérogénéité du champ de perméabilité. Le papier est organisé de la manière suivante : nous décrivons d abord le modèle et nous réalisons ensuite des tests de performance. 2 Modèle physique et numérique Les simulations numériques Monte Carlo sont obtenues à partir de la répétition successive de quatre étapes : génération d un champ aléatoire de perméabilité, évaluation du champ eulérien écoulement, identification de la trajectoire des particules et détermination des moments statistiques (Salandin et al. (1998)). 2.1 Champ de perméabilité Le milieu poreux est supposé isotrope et caractérisé par une perméabilité aléatoire K (en m/s) qui suit une distribution logarithmique Y = ln(k), définie par une moyenne m y (en m/s) et une fonction de covariance C y : C y (r) = σ 2 y exp( r 2 /λ y ) (1) σy 2 et λ y désignent la variance et la longueur de corrélation. La longueur de corrélation λ y est comprise entre 0.1 m et 100 m (Tompson et al. (1998)); et la variance σy 2 entre 0 et 7 (Neuman et al. (1993)). r est un vecteur de séparation (en m) entre deux vecteurs positions X et X. Le champ de perméabilité est généré avec une simulation spectrale appelée FIM (Fourier Integral Method) (Yao (2004)). La simulation spectrale détermine la transformée de Fourier avec la librairie FFTW (Fast Fourier Transform in the West) (Frigo et al. (2005)) qui permet d évaluer une transformée de Fourier discrète sur un cluster de processeurs. 2.2 Champ d écoulement Etant permanent et sans sources ni puits, l écoulement est décrit en couplant l équation de conservation de masse avec la loi de Darcy : V = 0 avec V = K h (2) V et h désignent la vitesse de Darcy (en m/s) et la charge hydraulique (en m). Les équations d écoulement sont discrétisées sur une grille régulière en utilisant une méthode de volumes finis, permettant de conserver localement la masse et les flux sur les éléments. Pour les conditions aux limites, on impose une condition de Neumann h/ n = 0 sur les frontières supérieure et inférieure. Sur les autres frontières, on impose deux conditions de Dirichlet h = 0 et 1 m. Le système linéaire Ax = B est caractérisé par une matrice creuse A, définie positive et symétrique. La solution x est la charge hydraulique et le second membre B représente les conditions aux limites. Nous résolvons ce système avec la librairie HYPRE contenant un algorithme parallèle multigrille V-cycle (Falgout et al. (2005)) ou avec la librairie PSPASES contenant un algorithme parallèle de factorisation de Cholesky multi frontale (Gupta et al. (1999)). 2.3 Trajectoire des particules Nous considérons le cas de la migration d un soluté inerte dans un milieu poreux saturé. Cette migration est gouvernée par l advection, la diffusion moléculaire et la dispersion cinématique. 2

Pour simplifier l étude, les effets de la diffusion moléculaire et de la dispersion cinématique sont négligés dans un premier temps. Ce problème de transport est résolu en utilisant une méthode lagrangienne appelée méthode particulaire. Dans cette représentation lagrangienne, le problème de transport est résolu en déterminant la trajectoire de particules : dx i dt = U i (3) X i est le vecteur position de la particule P i. Cette méthode n introduit pas de diffusion numérique pour une convection pure. Pour l équation précédente, on utilise un schéma d Euler explicite d ordre 1. Le pas de temps dt (en secondes) est proportionnel au temps convectif, égale à la taille d une maille divisée par le minimum des vitesses calculées sur une maille. A l intérieur d une maille, la vitesse des particules est obtenue par une interpolation linéaire respectant la conservation de la masse (Pollock (1988)). Ce modèle Transport est facilement parallèlisable puisque les particules inertes n interagissent pas entre elles. La difficulté réside dans l accès à des données distribuées sur les processeurs. Gérant un sous domaine de la grille, chaque processeur calcule la trajectoire de la particule présentante dans son sous domaine. Il communique aux processeurs voisins les particules sortantes de son sous domaine par des opérations, send et recv, non bloquantes et assurées par la librairie MPI. 2.4 Moments statistiques Dans le cas d un soluté inerte, la théorie du transport montre que les moments de la concentration sont déterminés à partir des moments caractérisant la distribution des particules (Dentz (2000)). Une forme discrète de ces moments est donnée par : < x k (t) > j = 1 Np x i (t) k j (4) N p N p, j et i sont respectivement le nombre de particules injectées, le numéro de la simulation et le numéro de la particule injectée. k désigne l ordre du moment calculée (1 ou 2). x i (t) est l abscisse de la particule P i. Les coefficients de dispersion sont calculés en prenant la dérivée temporelle de ces moments : i=1 D L (t) = 1 M M j=1 d(< x 2 (t) > j < x(t) > 2 j) dt (5) M est le nombre de simulations réalisées. Pour obtenir la macro dispersion transversale, il suffit de remplacer L et x par T et y dans les expressions. 3 Tests numériques Nous étudions l effet de deux grandeurs physiques : la dimension du domaine L x et la variance σy 2. La dimension L x varie de 256 à 4096. La variance σy 2 est comprise entre 0,5 et 6. Tous les tests sont réalisés sur un cluster SUN composé de deux noeuds de 32 processeurs chacun. Chaque processeur est un bi-processeur AMD Opteron 2,2 Ghz avec 2 Go de RAM. Ce cluster est un élément de la ressource informatique GRID 5000 de l INRIA de Rennes. 3

Figure 1: Temps CPU (en secondes) en fonction du nombre de processeurs P pour des systèmes linéaires de tailles différentes (en rouge HYPRE et en bleu PSPASES). 3.1 Analyse des performances 3.1.1 Temps CPU parallèle Pour ces premiers tests de performance du logiciel, nous fixons la variance σ 2 y = 1 et la dimension 512 L x 2048. Le nombre de processeurs P varie entre 2 et 32. Les temps CPU (en secondes) sont représentés sur la figure fig. 1. Pour un domaine de petite taille, PSPASES est plus efficace que HYPRE quelque soit le nombre de processeurs. Pour un domaine de taille moyenne, les deux solveurs donnent des temps similaires pour un nombre donné de processeurs. Pour un nombre important de processeurs, PSPASES devient plus rapide. Pour des domaines de grande taille, HYPRE est le plus rapide avec peu de processeurs mais devient lent lorsqu on augmente le nombre de processeurs. Pour un domaine de grande taille, PSPASES est limité par l espace mémoire disponible sur les machines. 3.1.2 Accélération Nous avons également représenté sur la figure fig. 2 l accélération en fonction du nombre de processeurs P. Les données sont les mêmes que celles du test précédent. Comme PSPASES doit être exécuté sur un nombre minimum de 2 processeurs, l accélération est prise égale à 2T(2)/T(P) où T(P) est le temps (en secondes) avec P processeurs. L accélération augmente avec la taille du domaine parce que les deux solveurs semblent scalables. Cependant PSPASES a une meilleure efficacité que celle de HYPRE. Cela explique pourquoi les courbes des temps CPU se coupent (voir fig. 1). Pour PSPASES, nous avons également calculé l efficacité en évaluant le ratio R = (N1.5/(P T(P))), qui est approximativement proportionnel à l efficacité E = T(1)/PT(P). Nous observons que R reste constant lorsqu on augmente la taille du domaine en maintenant constant le ratio N/P. Cela montre que PSPASES est bien scalable. 3.2 Influence de l hétérogénéité Nous étudions maintenant l effet de très fortes hétérogénéités en variant la variance σ 2 y entre 0.5 et 6. Nous gardons la taille du système linéaire N et le nombre de processeurs P fixes. Sur la figure fig. 3 gauche, nous avons représenté le nombre de V cycles générés par le solveur HYPRE. Il augmente très rapidement de 10 à 1000. 1000 est la valeur limite imposée. Sur la figure fig. 3 droite, nous observons également une augmentation rapide du temps CPU (en secondes) pour HYPRE. Avec PSPASES, le temps CPU reste constant. Cela montre que la vari- 4

Figure 2: Accélération en fonction du nombre de processeurs P pour des systèmes linéaires de tailles différentes (en rouge HYPRE et en bleu PSPASES). Figure 3: Nombre de V-cycles (figure de gauche) et temps CPU (figure de droite) en fonction de la variance σy 2 (en rouge : HYPRE et en bleu : PSPASES). ance σ 2 y n a pas d effets sur la performance de PSPASES. Pour PSPASES, nous avons observé des résidus très faibles. Mais comme le nombre de conditionnement augmente avec la variance, nous pouvons nous attendre à une perte de précision sur la solution. Pour une variance croissante, la méthode multigrille est donc moins efficace que la méthode directe. Cependant la méthode directe nécessite des temps CPU et un espace mémoire plus importants. 4 Conclusion A l aide de ce logiciel parallèle, nous pouvons simuler l écoulement et le transport dans des milieux poreux 2D très fortement hétérogènes de très grande taille. Dans nos simulations, PSPASES apparaît être très efficace pour des domaines de tailles petites et moyennes alors que HYPRE est plus rapide pour des domaines de grandes tailles. HYPRE est très sensible au degré d hétérogénéité qui fait augmenter le nombre de conditionnement. HYPRE devient alors moins efficace que PSPASES pour des milieux fortement hétérogènes. Une étude plus approfondie est à réaliser pour mieux comprendre le comportement de ces deux solveurs. Ce logiciel va nous être très utile pour déterminer les paramètres de dispersion dans des milieux poreux hétérogènes. Cette étude est en cours. Nous souhaitons également programmer une extension 3D de ce logiciel et lancer des simulations Monte Carlo 3D sur différents clusters connectés sur une grille de calcul. 5

References Dentz M., Kinzelbach H., Attinger S., Kinzelbach W. 2000 Temporal behaviour of a solute cloud in a heterogeneous porous medium 1 : point-like injection. Water Resources Research 36 3591-3604 Falgout, R.D., Jones, J.E., Yang U.M. 2005 Pursuing scalability for hypre s conceptual interfaces. ACM Trans. Math. Softw. 31 326-350 Frigo, M., Johnson, S.G. 2005 The design and implementation of FFTW3. Proceedings of the IEEE 93 216-231 Gupta, A., Gustavson, F., Joshi, M., Karypis, G., Kumar, V.. 1999 PSPASES : An efficient and scalable parallel sparse direct solver. In parallel numerical computations with applications. T. Yang (ed.), Kluwer international series in engineering and computer science 515 Neuman, S.P., Orr, S. 1993 Prediction of steady state flow in nonuniform geologic media by contidional moments : exact nonlocal formalism, effective conductivities and weak approximation. Water Resources Research 29 341-364 Pollock, D.W. 1998 Semianalytical computation of path lines for finite difference models. Ground Water 26 743-750 Salandin, P., Fiorotto, V. 1998 Solute transport in highly heterogeneous aquifers Water Resources Research 39 Tompson, A., Falgout, R.D., Smith, S.G., Bosl, W.J., Ashby S.F. 1998 Analysis of subsurface contaminant migration and remediation using high performance computing. Advances in Water Resources 22 203-221 Yao, T. 2004 Reproduction of the mean, variance and variogram model in spectral simulation. Mathematical Geology 36 487-505 6