EDITION 2009 DOCUMENT DE SOUMISSION B. REaching Petascale for advanced fluid-structure transient DYNamics



Documents pareils
Journée Scientifique Onera

Systèmes de transport public guidés urbains de personnes

ÉdIteur officiel et fournisseur de ServIceS professionnels du LogIcIeL open Source ScILab

Journée Scientifique Onera

Avis de l IRSN sur la tenue en service des cuves des réacteurs de 900 MWe, aspect neutronique et thermohydraulique

Rapport d'analyse des besoins

Programme "Conception et simulation" COSINUS Edition Projet

En outre 2 PDD sont impliqués dans le développement de politiques locales destinées à favoriser l'insertion des personnes handicapées.

PC Check & Tuning 2010 Optimisez et accélérez rapidement et simplement les performances de votre PC!

Projet ANR. Bruno Capra - OXAND. 04/06/2015 CEOS.fr - Journée de restitution (Paris) B. CAPRA

DÉVELOPPEMENT INFONUAGIQUE - meilleures pratiques

ERP5. Gestion des Services Techniques des Collectivités Locales

Montrouge, le 9 février Centre national d équipement nucléaire (CNEN) EDF 97 avenue Pierre Brossolette MONTROUGE

Chapitre 1 : Introduction aux bases de données

ORACLE TUNING PACK 11G

SEP 2B juin 20. Guide méthodologique de calcul du coût d une prestation

ETUDE COMPARATIVE DES MODELISATIONS NUMERIQUE ET PHYSIQUE DE DIFFERENTS OUVRAGES D EVACUATION DES CRUES

UNION INTERNATIONALE DES TELECOMMUNICATIONS BUREAU DE DEVELOPPEMENT DES TELECOMMUNICATIONS

Baccalauréat technologique

Extrait du site de l'oseo (ex.anvar) Reste à déterminer les points incontournables

Nom-Projet MODELE PLAN DE MANAGEMENT DE PROJET

Développer une culture d efficience

Spécialité Sciences Mécaniques et Ingénierie

Service de réplication des données HP pour la gamme de disques Continuous Access P9000 XP

«Les projets collaboratifs pour les nuls»

Qu'est-ce que le BPM?

Les formations en cycle ingénieur

CAP CAMION A ASSISTANCE PNEUMATIQUE

ISTEX, vers des services innovants d accès à la connaissance

Démarches d urbanisation : réorganiser le Système d Information en structurant ses fonctions dans des blocs fonctionnels communicants.

Rapport d activité. Mathieu Souchaud Juin 2007

DOSSIER SOLUTION : CA RECOVERY MANAGEMENT

Contrôle interne et organisation comptable de l'entreprise

Conditions Particulières de Maintenance. Table des matières. Ref : CPM-1.2 du 08/06/2011

Chapitre 9 : Informatique décisionnelle

Introduction MOSS 2007

Collecter les 54 milliards d'euros de bénéfices issus des nouveaux usages de la donnée

Investissements d Avenir. Développement de l Economie Numérique

NORME INTERNATIONALE D AUDIT 260 COMMUNICATION DES QUESTIONS SOULEVÉES À L OCCASION DE L AUDIT AUX PERSONNES CONSTITUANT LE GOUVERNEMENT D'ENTREPRISE

AXES DE RECHERCHE - DOMAINE D'INTERET MAJEUR LOGICIELS ET SYSTEMES COMPLEXES

Fiche méthodologique Rédiger un cahier des charges

Annexe sur la maîtrise de la qualité

Module 0 : Présentation de Windows 2000

NOUVEAUTES de Microsoft Dynamics CRM 2011 REF FR 80342A

Gestion de la mobilité en entreprise (EMM, enterprise mobility management)

L'évolution de VISUAL MESSAGE CENTER Architecture et intégration

COMMANDE REF ADMIN-CS-540-CDD

Renforcez la flexibilité et la réactivité de votre entreprise Dotez votre entreprise d'un système de gestion des données de référence éprouvé

Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes.

Types de REA produites dans le cadre de la séquence pédagogique

Mastère spécialisé MS : «Ingénierie de l innovation et du produit nouveau

GESTION DE PROJET SÉANCE 2 : LES CYCLE DE VIE D'UN PROJET

Fascicule u7.05 : Impression de résultat pour visualisation

Rapport 2014 et demande pour Portage de Méso-NH sur Machines Massivement Parallèles du GENCI Projet 2015 : GENCI GEN1605 & CALMIP-P0121

BASE DE DONNÉES ORACLE 11G SUR LE SYSTÈME DE STOCKAGE PILLAR AXIOM. Livre blanc publié par Oracle Novembre 2007

Communiqué de Lancement

Dossier d'étude technique

REGIME D APPUI POUR L INNOVATION DUALE RAPID CAHIER DES CHARGES

ÉCONOMIE ET GESTION LYCÉES TECHNOLOGIQUE ET PROFESSIONNEL

Mécanicien(ne) Automaticien(ne)

REGIME D APPUI POUR L INNOVATION DUALE RAPID CAHIER DES CHARGES

Concours interne d ingénieur des systèmes d information et de communication. «Session 2010» Meilleure copie "étude de cas architecture et systèmes"

CA ARCserve Backup. Avantages. Vue d'ensemble. Pourquoi choisir CA

GENIE STATISTIQUE GESTION DES RISQUES ET INGENIERIE FINANCIERE MARKETING QUANTITATIF ET REVENUE MANAGEMENT

MS PROJECT Prise en main. Date: Mars Anère MSI. 12, rue Chabanais PARIS E mail : jcrussier@anere.com Site :

362 Aides aux partenariats d'innovation

Les entreprises qui adoptent les communications unifiées et la collaboration constatent de réels bénéfices

Investissements d avenir. Action : «Projets agricoles et agroalimentaires d avenir (P3A)»

portnox pour un contrôle amélioré des accès réseau Copyright 2008 Access Layers. Tous droits réservés.

FONDS UNIQUE INTERMINISTERIEL DE SOUTIEN AUX PROJETS DE RECHERCHE ET DEVELOPPEMENT COLLABORATIFS DES POLES DE COMPETITIVITE

Des solutions J2EE open source professionnelles adaptées à votre système d information d entreprise

Garantir une meilleure prestation de services et une expérience utilisateur optimale

MODELISATION UN ATELIER DE MODELISATION «RATIONAL ROSE»

TEXT MINING von 7

1 JBoss Entreprise Middleware

modélisation solide et dessin technique

Stratégie Open Source et Présentation du Centre de recherche et d innovation sur le logiciel libre

UNITE U 6.2 : PROJET TECHNIQUE OBJET DE L'EPREUVE.

Urbanisation des Systèmes d Information Architecture d Entreprise. 04 Architecture du SI : identifier et décrire les services, structurer le SI

Guide des déposants. Appel à projets générique 2014 relatif aux «Grands Défis Sociétaux» et au «Défi de tous les savoirs»

Mastère spécialisé. «Ingénierie de l innovation et du produit nouveau De l idée à la mise en marché»

GUIDE SUR L ASSISTANCE A LA MAÎTRISE D'OUVRAGE EN INFORMATIQUE

Présentations GTF. Point de vue d un utilisateur final. Durée de vie des ouvrages : Approche Prédictive, PerformantielLE et probabiliste

Suite NCR APTRA. La première plateforme logicielle libre-service financière au monde.

SERVICES INFORMATIQUES AUX ORGANISATIONS

Hélène CHEUTIN. Master 2 ISMAG

Analyse des trajectoires acceptables en approche de virage assistance aux conducteurs

Visite de presse. Le supercalculateur Tera - 10

Introduire un nouveau type de maille ou un nouvel élément de référence

Stages ISOFT : UNE SOCIETE INNOVANTE. Contact : Mme Lapedra, stage@isoft.fr

MAIDESC - KO 21 Novembre 2013 Etienne Wey Alexandre Boilley

SDLV120 - Absorption d'une onde de compression dans un barreau élastique

Pôle de compétitivité Aerospace Valley. Agilité et Confiance dans la filière aéronautique (2)

IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21

Questions et réponses

Conduite et Gestion de Projet - Cahier des charges

La solution IBM Rational pour une ALM Agile

Transcription:

Acronyme REPDYN Titre du projet en français Titre du projet en anglais Axe(s) thématique(s) Type de recherche Passage à l'échelle pour des calculs avancés en dynamique transitoire des fluides et des structures REaching Petascale for advanced fluid-structure transient DYNamics 1 2 3 Recherche Fondamentale Recherche Industrielle Développement Expérimental Aide totale demandée 640 366 Durée du projet 36 mois 1. CONTEXTE ET POSITIONNEMENT DU PROJET... 2 1.1. Contexte et enjeux économiques et sociétaux... 4 1.2. Positionnement du projet... 6 2. DESCRIPTION SCIENTIFIQUE ET TECHNIQUE... 8 2.1. État de l'art... 8 2.2. Objectifs et caractère ambitieux/novateur du projet...10 3. PROGRAMME SCIENTIFIQUE ET TECHNIQUE, ORGANISATION DU PROJET... 12 3.1. Programme scientifique et structuration du projet...12 3.2. Management du projet...14 3.3. Description des travaux par tâche...16 3.3.1 Tâche 1 : Passage à l'échelle pour des calculs de grande taille en dynamique des structures et en interaction fluide-structure 17 3.3.2 Tâche 2 : Couplage efficace de formulations différentes (continues, particulaires, discrètes) et passage à l'échelle 18 3.3.3 Tâche 3 : Extension du formalisme parallèle vers les architectures de pointes : parallélisme multi-niveaux, exploitation des GPUs 20 3.3.4 Tâche transverse : intégration dans la plateforme SALOME et gestion des grands volumes de données en entrée et en sortie (CEA + EDF) 21 1/42

3.3.5 Annexe : description des cas de simulation envisages pour l'evaluation des ameliorations apportees à EUROPLEXUS 22 3.4. Calendrier des tâches, livrables et jalons...26 4. STRATEGIE DE VALORISATION DES RESULTATS ET MODE DE PROTECTION ET D EXPLOITATION DES RESULTATS... 28 5. ORGANISATION DU PARTENARIAT... 29 5.1. Description, adéquation et complémentarité des partenaires...29 5.1.1 Description des partenaires 29 5.1.2 Pertinence du partenariat 35 5.1.3 Complémentarité des partenaires 36 5.2. Qualification du coordinateur du projet...36 6. JUSTIFICATION SCIENTIFIQUE DES MOYENS DEMANDES... 37 6.1. Partenaire 1 : CEA...37 6.2. Partenaire 2 : EDF...38 6.3. Partenaire 3 : LaMSID...38 6.4. Partenaire 4 : ONERA...38 6.5. Partenaire 5 : INRIA...39 6.6. Partenaire 6 : LaMCoS...40 7. ANNEXES... 41 7.1. Références bibliographiques...41 1. CONTEXTE ET POSITIONNEMENT DU PROJET La simulation numérique des situations accidentelles, telles que les accidents dans les réacteurs nucléaires ou les impacts de volatiles ou de glace sur le fuselage des engins aéronautiques, nécessite une puissance de calcul considérable pour pouvoir effectuer des prédictions réalistes de l évolution rapide de phénomènes physiques complexes sur des échelles de temps et d espace très différentes conjuguant des effets locaux et globaux. Il s agit de déterminer les nouvelles pratiques ou méthodes à même d'évaluer et de maîtriser les risques, pour relever les défis qui se posent dès aujourd hui. Les résultats du projet concernent l'ensemble des acteurs socio-économiques : industriels, investisseurs, ingénieurs, consultants, spécialistes de l'analyse de risque et de la sûreté de fonctionnement, autorités de tutelle, universitaires, chercheurs Ces derniers pourront utiliser les nouvelles approches proposées pour faire face à leurs enjeux, dans les principaux secteurs d activités : aérospatial, énergie, environnement, événements naturels et extrêmes, génie civil, mécanique... Le code de dynamique rapide EUROPLEXUS [R0], co-développé dans le cadre d un consortium de partenaires industriels et de recherche (CEA, EDF, ONERA, SAMTECH) et 2/42

utilisé pour des études de sûreté par AREVA et IRSN, permet de répondre aux besoins de calcul des conséquences des situations accidentelles, en proposant un grand nombre de modélisations physiques et numériques exclusives, notamment dans le domaine de l'interaction fluide-structure, qui le situent au meilleur niveau mondial et le distinguent de ses concurrents du marché. Récemment, de nouvelles fonctionnalités ont été introduites dans le logiciel, lui permettant de simuler des problématiques locales très complexes, telles que la perforation du béton armé par un projectile ou l'écoulement d'un fluide en dehors d'un réservoir se fragmentant sous impact. Ces fonctionnalités sont caractérisées par la cohabitation de formulations diverses au sein d'un même modèle, par exemple des éléments discrets et des éléments finis, ou des particules SPH et des éléments finis, ainsi que par la taille des jeux de données permettant de produire des calculs d'une précision satisfaisante, atteignant plusieurs millions d'entités à calculer sur plusieurs dizaines de milliers de cycles en temps. Le passage à l'échelle d'europlexus sur les supercalculateurs massivement parallèles devient ainsi un enjeu majeur pour l'avenir du logiciel et de la communauté de ses utilisateurs. EUROPLEXUS est doté dès à présent d'une structuration parallèle permettant son exécution sur des clusters à mémoires distribuées. L'objectif du présent projet est la levée des verrous algorithmiques empêchant le code de tirer parti efficacement des architectures proposant plusieurs centaines, voire plusieurs milliers d'unités de calcul. Il s'agit d'élaborer des stratégies de calculs innovantes et robustes pour assurer l'équilibrage de la charge en toutes circonstances, en particulier pour des simulations fortement non-linéaires, ce qui représente un défi d'envergure pour des codes proposant une telle diversité de formulation et un tel degré de couplage entre elles. Ceci représente clairement un domaine de recherche pour la communauté du calcul mécanique. Il est également prévu d'étendre les travaux de recherche algorithmique vers les architectures les plus récentes, dans une direction complémentaire au formalisme existant. Sont ainsi particulièrement concernées les machines composées d'un assemblage de nœuds multi-cœurs et dotés en sus éventuellement de co-processeurs de type GPU à même d'accélérer significativement le traitement de certaines tâches dédiées. Le contenu du projet le place naturellement dans le cadre de la recherche industrielle. L'extension du formalisme parallèle aux architectures de pointe contient toutefois des aspects de recherche amont, avec la définition de nouveaux algorithmes et méthodes qui pourront enrichir la communauté du calcul intensif au-delà de leur mise en œuvre applicative dans EUROPLEXUS. Le projet REPDYN fait suite au projet PADRE, proposé lors de l'appel à projets COSINUS 2008 et placé en deuxième position sur la liste complémentaire, sans être finalement financé. L un des changements importants par rapport à la proposition 2008 est la participation d équipes de l INRIA, spécialistes du calcul parallèle. 3/42

1.1. CONTEXTE ET ENJEUX ECONOMIQUES ET SOCIETAUX EUROPLEXUS est un code de simulation en dynamique rapide, propriété conjointe du CEA et du Centre Commun de Recherche (CCR) de la Commission Européenne, situé à Ispra (Italie). Il permet la réalisation d'études avancées en calculs de structure et en contexte d'interaction fluide-structure. Son développement est piloté dans le cadre d'un consortium créé en 2000, impliquant les deux propriétaires, et d'autres organismes, nommés partenaires majeurs. Ces partenaires majeurs ont accès à l'intégralité du code et peuvent être des établissements à vocation industrielle, à savoir EDF, ou à vocation de recherche, à savoir l'onera. Un éditeur de logiciel, Samtech SA, leader européen des éditeurs de logiciels généralistes, est également impliqué comme partenaire majeur dans le consortium en tant que dépositaire et distributeur d'une version commerciale d'europlexus. Une problématique liée aux performances du programme en termes de temps CPU a clairement été identifiée au sein du consortium au cours de ces dernières années, en l'absence d'un parallélisme efficace sur machines à mémoire distribuée avant 2007. Quantitativement, un facteur 10 en défaveur d'europlexus par rapport à la version parallèle de LS-DYNA a été mesuré en 2006 sur un cas de calcul de structure correspondant à une perte d'aube sur un turbopropulseur aéronautique. Cela a conduit les opérationnels en charge de ce calcul vers l'utilisation de LS-DYNA, malgré les incertitudes liées au traitement des contacts. Dans le même ordre d'idée, réaliser une campagne d'études paramétriques pour des modèles d'impact de projectile sur un bâtiment réacteur, demandée à EDF, est encore actuellement trop consommateur numériquement pour être mis en œuvre. Ceci a motivé le développement à partir de 2007 d'un algorithme de résolution destiné aux clusters à mémoire distribuée, dont la première version beta sortira au second semestre 2009. Ceci permettra de replacer EUROPLEXUS dans un domaine de performances compatibles avec les exigences industrielles actuelles. Cependant, l'effort doit être accentué pour réaliser le passage à l'échelle d'europlexus et lui permettre d'appréhender les simulations du futur. Celles-ci seront caractérisées par une modélisation spatiale de plus en plus fine, faisant intervenir plusieurs millions (voire dizaines de millions) de mailles ou de particules (voir la suite de ce paragraphe pour les modélisations envisagées), sur des échelles de temps de plus en plus longues, pour parvenir par exemple à suivre de manière réaliste la ruine complète d'une structure consécutive à un transitoire accidentel brutal. Ainsi, la simulation prédictive de la rupture et de la fragmentation multiple sous impact requiert une représentation d'une extrême précision pour reproduire la complexité physique des phénomènes locaux, aujourd'hui hors de portée des codes actuels. Ceci ne pourra être réalisé qu'en utilisant de manière intensive et efficace les dernières générations de calculateurs, tout en conservant la capacité de traiter rigoureusement les équations de la physique et de produire une solution de qualité. En plus de leur taille, les modèles du futur feront cohabiter des modélisations de nature très différentes, pour représenter des problématiques complexes telles que l'écoulement d'un fluide à l'extérieur d'un réservoir fragmenté sous impact, avec des particules pour 4/42

représenter le fluide, des particules d'une autre nature ou des éléments finis de coque pour représenter le réservoir et éventuellement des éléments finis massifs ou des éléments discrets pour représenter la cible impactée par le réservoir, susceptible également de se perforer. Cette diversité, associée au traitement nécessaire des connexions entre les formulations, engendre une demande significative en stratégies innovantes d algorithmique parallèle et d équilibrage de la charge en parallèle, qui représente le point clé pour tirer parti des supercalculateurs massivement parallèles. L'objectif du présent projet, regroupant le CEA, l'onera, EDF et le laboratoire associé LaMSID 1, l'inria, via le LIG 2, et le laboratoire LaMCoS 3 de l'insa Lyon, est donc de lever les verrous algorithmiques et techniques pour permettre le passage à l'échelle d'europlexus. Les architectures visées sont d'une part les clusters massivement parallèles, pouvant faire intervenir plusieurs milliers de processeurs, tels que les machines Platine au CCRT ou BlueGene, propriété d'edf R&D. D'autre part, on cherchera à faire évoluer l'algorithme de résolution du code pour tirer parti, en complément de l'approche à mémoire distribuée, des spécificités des nœuds de calcul modernes, se présentant comme des machines multi-cœurs de taille croissante et dotés éventuellement de co-processeurs de type GPU offrant une puissance de calcul considérable pour certaines tâches écrites en conséquence. Cette orientation vers les architectures les plus récentes ouvre un important spectre de recherche et développement, aussi bien théorique que pratique, dont l'envergure dépasse le cadre du seul code EUROPLEXUS et qui étend les retombées du projet à l'échelle de la communauté du calcul intensif pour des systèmes fortement couplés. Il est également fondamental de souligner qu'europlexus présente des spécificités fortes au niveau de son algorithme de résolution explicite par rapport aux codes concurrents, par exemple LS-DYNA ou RADIOSS. Le passage à l'échelle du programme ne doit pas se faire au détriment de ces spécificités, ce qui introduit par conséquent une importante part d'innovation. En particulier, les développements proposés prolongent une série d'optimisations effectuées sur la version séquentielle du programme dont les bénéfices doivent être valorisés par les avancées apportées par le projet dans le cadre du parallélisme intensif. Par ailleurs, une des richesses du système de pilotage de l'évolution d'europlexus par l'intermédiaire du consortium précité est la pluridisciplinarité des acteurs impliqués, notamment en ce qui concerne les domaines scientifiques d'utilisation du code. Ces domaines s'étendent des calculs de structures avec de multiples surfaces de contact, comme les chutes de colis de transport de matières radioactives pour le CEA, aux calculs d'écoulements complexes en interaction fluide-structure pour reproduire les accidents sur le 1 Laboratoire de Mécanique des Structures Industrielles Durables, UMR CNRS EDF 2832 2 Laboratoire d'informatique de Grenoble, UMR 5217 3 Laboratoire de Mécanique des Contacts et des Structures, UMR CNRS INSA Lyon 5259 5/42

circuit primaire d'un réacteur nucléaire pour EDF, en passant par des calculs de recherche sur des impacts balistiques sur un réservoir pour l'onera. Le projet proposé s'appuie donc sur le large potentiel d'application proposé par les différents partenaires pour définir un programme de développement validé au fur et à mesure par des mesures de performances quantitatives. A cette fin, des tests seront mis en œuvre sur des modèles scientifiquement significatifs et soigneusement sélectionnés pour valider les étapes majeures du développement. En matière de résultats attendus pour le projet, deux directions sont à envisager : une direction théorique, avec la production d'algorithmes novateurs validés aussi souvent que possible par des publications dans des revues à comité de lecture, une direction pratique, avec l'analyse rigoureuse et quantitative des performances parallèles d'europlexus sur des cas significatifs. Enfin, à l'initiative conjointe d'edf et du CEA, EUROPLEXUS est en cours d'intégration dans la plateforme SALOME 4, plateforme de développement générique de pré- et post-traitement et de couplage de codes pour la simulation. Le présent projet bénéficie dans ce cadre du soutien du Pôle de Compétitivité System@tic, porteur de la plateforme. L'environnement SALOME s'oriente logiquement vers les moyens de calcul parallèles. A ce titre, EUROPLEXUS supporte également l'outil de visualisation parallèle PARAVIEW 5, pour que les capacités d'exploitation des résultats du code suivent de manière cohérente ses capacités de résolution que ce projet propose d'étendre. 1.2. POSITIONNEMENT DU PROJET EUROPLEXUS est un outil de simulation à la structure très originale dans la communauté du calcul numérique en mécanique des structures et des fluides. Son développement est ouvert et permet la collaboration d'acteurs variés, prenant une place majeure dans l'industrie et la recherche française. Ce projet permet de contribuer à sa valorisation et sa pérennisation. De plus, le code se positionne comme un outil privilégié pour l'appréhension de problématiques complexes et novatrices dans le domaine de la dynamique transitoire des structures et des systèmes faisant intervenir l'interaction fluide-structure, par la flexibilité de développement qu'il offre aux partenaires du consortium, à la différence de codes du commerce. La composante Recherche & Développement du projet EUROPLEXUS fait de l'innovation un moteur majeur du développement du code, et le passage à l'échelle proposé par ce projet sur les moyens de calcul actuels et à venir ne fait pas exception. 4 SALOME 2, projet RNTL open-source labellisé par le ministère de l'economie, des Finances et de l'industrie 5 PARAVIEW, outil de visualisation open-source multi-plateformes en environnement parallèle à mémoire distribué - http://www.paraview.org/new/index.html 6/42

Par ailleurs, le projet repose, tout en la renforçant, sur une structure collaborative riche et fonctionnelle grâce au consortium en place depuis 2000, auquel s'ajoute le savoir-faire important de l'inria en matière d'algorithmique parallèle, ainsi que son potentiel d'innovation en direction des nouvelles architectures. Dans le cadre de l'appel à projet COSINUS, le projet REPDYN s'inscrit dans l'axe thématique 1, concernant le Calcul intensif et la Simulation, dans la catégorie 'Grands défis, passage à l'échelle pour les applications'. Les méthodes numériques concernées sont notamment : la gestion de modèles comprenant des modélisations continues, élémentaires ou particulaires, et discrètes en interaction, la prise en compte d'échelles de temps et d'espace très différentes au sein d'une même simulation, la gestion des connexions entre les différentes formulations et des liaisons cinématiques (contact unilatéral, interaction fluide-structure) à l'aide de multiplicateurs de Lagrange pour une précision maximale. En ce qui concerne la pertinence du projet par rapport aux projets concurrents, il est nécessaire d'insister sur la spécificité du développement parallèle pour un code tel qu'europlexus, mettant en jeu au sein d'une même simulation de nombreuses modélisations fluide et structures différentes, avec de multiples couplages cinématiques entre elles. Une telle richesse de modélisations fait que l'obtention d'une extensibilité compatible avec le calcul massivement parallèle pour un code de dynamique rapide dédié à la simulation des situations accidentelles, pour des problèmes couplées impliquant fluide et structure, est un domaine encore ouvert qui présente des difficultés que de nombreux programmes de simulation scientifique mono-modélisation ne rencontrent pas. En particulier, et sans déprécier les qualités des solveurs parallèles proposés par ces programmes, les grands codes de mécanique des fluides ne présentent pas la même diversité d'éléments, ni le même degré de couplage cinématique. La décomposition de domaine est alors plus aisée à réaliser et les liens entre les process restent locaux, là où des liaisons non-permanentes telles que les surfaces de contact, primordiales en dynamique rapide, conduisent à des liens au niveau global, bien plus difficiles à gérer en parallèle. Cette situation est encore plus avérée pour un code d'analyse statistique par Monte Carlo, qui correspond à une multitude de calculs découplés, naturellement compatible avec les architectures à grand nombre de CPU, pour ne parler que de programmes utilisés dans la communauté scientifique concernant les partenaires du projet REPDYN. Le présent projet n'est à ce titre en aucun cas un programme de développement sur des bases déjà existantes dans d'autres logiciels. Toutes les tâches de mise au point et de développement d'algorithmes parallèles citées au paragraphe suivant présentent un fort contenu d'innovation pour lever les verrous de l'exécution parallèle robuste et de l'équilibrage des charges empêchant aujourd'hui le véritable passage à l'échelle pour un code de la nature d'europlexus. 7/42

Précisions enfin qu'europlexus est un outil identifié au niveau européen, dans la mesure où le code est la copropriété du CEA et de la Commission Européenne, par l'intermédiaire du Centre Commun de Recherche d'ispra (Italie). 2. DESCRIPTION SCIENTIFIQUE ET TECHNIQUE 2.1. ÉTAT DE L'ART EUROPLEXUS s'appuie majoritairement sur la méthode des éléments finis pour discrétiser l'espace. Il comprend également des modélisations particulières telles que les volumes finis ou des méthodes sans maillage (particules SPH, éléments discrets), mieux adaptées au traitement de certains phénomènes spécifiques, comme la rupture et la multi-fragmentation. Au niveau de l'intégration temporelle, on sépare classiquement les grands codes de dynamique en deux catégories : les codes dits implicites et les codes dits explicites. Dans les deux cas, le temps continu est remplacé par une série de pas discrets. Pour un code implicite, la configuration du modèle au pas de temps courant est une inconnue, alors que pour un code explicite, il s'agit d'une donnée déduite des informations disponibles au pas de temps précédent. Classiquement, l'intégration implicite s'accompagne d'une résolution matricielle complexe, au bénéfice d'un choix arbitraire de la taille des pas de temps à utiliser. Au contraire, l'intégration explicite ne requiert aucune matrice, mais la prédiction explicite du déplacement conduit à une limitation sur la taille autorisée pour le pas de temps, sous peine d'une divergence des calculs par accumulation des erreurs de troncature. Le pas limite est estimé à partir de la taille des éléments et de la vitesse du son dans le matériau les composant. En dynamique rapide, le chargement et les conditions requièrent une finesse de description temporelle souvent comparable avec le pas maximum autorisé pour l'intégration. L'approche explicite est alors choisie, comme c'est le cas dans EUROPLEXUS. La structure vectorielle du problème à traiter est une caractéristique fondamentale à prendre en compte au moment de définir une stratégie parallèle. En effet, en l'absence de résolution matricielle d'ensemble, la majorité du temps nécessaire à la résolution est passé dans le calcul des forces internes dans les éléments à la fin de chaque pas de temps. Le point de départ pour une résolution parallèle consiste donc toujours à repartir les différents éléments sur les différents processeurs disponibles. Cette répartition peut être automatique, à la discrétion du compilateur, dans le cas d'un parallélisme à mémoire partagée, le modèle restant stocké en intégralité dans la mémoire. Au contraire, dans le cas d'un parallélisme à mémoire distribuée, le modèle doit être scindé en plusieurs sous-domaines, chacun étant affecté à un process. Il faut alors gérer les communications aux interfaces entre les sous-domaines. La décomposition du modèle initial en sous-domaines est de préférence effectuée par un procédé de découpage automatique avec pondération des éléments, en fonction de leur formulation ou de leur matériau, pour parvenir à un équilibrage satisfaisant de la charge entre les process. L'approche parallèle avec 8/42

décomposition de domaine automatique est utilisée dans les codes commerciaux les plus répandus, tels que LS-DYNA [R1] ou RADIOSS [R2]. Contrairement aux méthodes numériques dont le coût de résolution est concentré au niveau d'une inversion matricielle, il est moins aisé de définir une approche parallèle générale et extensible en dynamique explicite. Il faut prendre en compte les grandes variabilités dans la géométrie de la structure en cours de calcul, ce qui modifie notamment le coût de traitement des éléments finis, ainsi que la localisation et le nombre des liaisons de contact fréquemment utilisées. Parvenir dans ce contexte à une extensibilité permettant de profiter judicieusement des supercalculateurs à plusieurs milliers de processeurs représente un défi théorique majeur pour les codes de cette nature, qu'aucun acteur du marché n'a encore relevé. Nous pouvons à présent introduire une spécificité forte d'europlexus par rapport à ses principaux concurrents. Elle concerne le traitement des liaisons cinématiques, comme les liaisons de contact unilatéral évoquées dans le paragraphe précédent ou les liaisons pour l'interaction fluide-structure. Dans les codes précités, pour des raisons d'efficacité de résolution, ces liaisons sont traitées de manière simplifiée, soit par des méthodes de pénalisation, soit par des techniques maîtres-esclaves qui interdisent le couplage des liaisons entre elles. Ceci conduit à des limitations dans la modélisation ou à l'emploi de paramètres arbitraires difficiles à caler pour l'utilisateur. Au contraire, dans EUROPLEXUS, toutes les liaisons cinématiques, ainsi que les liaisons entre sous-domaines, sont traitées de manière exacte et couplée par l'intermédiaire de multiplicateurs de Lagrange [R3]. Le calcul des forces de liaison représente alors un problème additionnel qui demande une stratégie parallèle dédiée, en particulier pour les liaisons impliquant des nœuds répartis dans des process différents. Une deuxième spécificité majeure d'europlexus concerne la gestion de la limitation du pas de temps en explicite. Classiquement, la dimension du pas de temps est identique pour la totalité du modèle et elle est fixée par le plus petit élément. Ceci conduit fréquemment à un grand nombre de pas à effectuer pour parvenir au temps final de la simulation, avec de très nombreux éléments intégrés avec un pas bien inférieur à leur pas optimal. Le code propose alors une méthode originale de partitionnement spatial du pas de temps sur les éléments [R4] permettant d'intégrer chaque élément individuellement avec un pas proche de son pas optimal, conduisant à des gains substantiels en matière de temps de résolution en séquentiel. Cette approche doit être conservée à l'intérieur des sous-domaines dans le cadre parallèle avec mémoire distribuée. Elle doit également être prise en compte au moment de la décomposition en sous-domaines au niveau de la recherche d'un équilibre des charges optimal. Le traitement des liaisons cinématiques gérant la nature asynchrone de l'intégration temporelle sur les éléments est fonctionnelle dans la version actuelle du programme. Enfin, une troisième caractéristique définissant l'identité propre d'europlexus est son ouverture sur les méthodes sans maillage, aussi couramment appelées méthodes particulaires, pour des calculs complexes impliquant des jets fluides et des structures subissant de multiples fragmentations. Sont en particulier concernées les approches SPH 9/42

(Smooth Particle Hydrodynamics), aussi bien pour les fluides que pour les structures, et Eléments Discrets, pour la fracturation des matériaux de type béton armé sous impact. Au niveau de sa structure, EUROPLEXUS gère de longue date des calculs avec décomposition de domaines. Cette approche a tout d'abord été développée dans un cadre séquentiel pour permettre d'adopter des traitements différents d'un sous-domaine à l'autre (pas de temps différents [R5], résolution locale sur base modale, éventuellement en présence de rotations d'ensemble non-linéaires de grande amplitude [R6][R7]), toujours pour réduire le temps de résolution. La structure de données créée à cet effet a ensuite été réutilisée et enrichie pour la mise en œuvre de la version parallèle du programme pour machines à mémoire distribuée. Sa nature dynamique et évolutive permettra d'adapter aisément le code aux nouvelles méthodes de résolution parallèle prévue dans le projet REPDYN. Enfin, la réalisation de simulations à grande échelle avec des modèles particulaires se heurte à l absence d outil de génération de maillage approprié. Le support géométrique des méthodes particulaires est différent des maillages classiques utilisés pour des calculs par éléments finis ou volumes finis. Il se présente sous forme d une collection, ou un empilement, de particules rigides de forme géométrique simple (sphères de diamètre variable) assimilables à des éléments ponctuels sans connectivité mais avec un rayon d interaction donné. La fabrication de tels supports nécessite des algorithmes spécifiques qui sont absents des outils de maillage standard. Actuellement, les particules SPH pour les calculs EUROPLEXUS sont générées par des procédures semi-automatiques fastidieuses, alors que les supports nécessaires au éléments discrets sont fabriqués à l aide d une procédure complexe en MATLAB écrite par les chercheurs de l'institut Grenoble INP [R8]. EDF dispose d une version universitaire séquentielle non optimisée de cet outil et en a déjà préparé une version MATLAB auto-portante (évitant toute intervention manuelle), mais ses performances numériques empêchent le passage à des modèles de taille industrielle. Pour arriver à élaborer des modèles contenant plusieurs millions de particules pour des structures réelles, il est nécessaire de développer une version parallèle robuste de l'algorithme originel. 2.2. OBJECTIFS ET CARACTERE AMBITIEUX/NOVATEUR DU PROJET Conformément au paragraphe précédent, le contenu novateur du présent projet comporte plusieurs volets. Un premier volet regroupe les besoins de définition d'algorithmes parallèles innovants, selon deux directions, à partir d'une approche parallèle classique fondée sur une décomposition de domaine : le traitement parallèle de modèles de grande taille faisant cohabiter des modélisations différentes, aussi bien continues que discrètes. La problématique repose sur la gestion des couplages entre les formulations et sur l'équilibrage de la charge dans une situation de forte hétérogénéité des coûts élémentaires, 10/42

le traitement par multiplicateurs de Lagrange des liaisons cinématiques faisant intervenir des degrés de liberté répartis sur des process différents. Ces liaisons regroupent les couplages entre formulations évoquées ci-dessus, ainsi que des conditions additionnelles, comme le contact unilatéral entre éléments de structure contenus dans le modèle. Il s'agit de proposer une stratégie efficace et robuste d'identification des couplages éventuels entre les liaisons, puis une méthode de calcul des forces de liaisons couplées préservant l'extensibilité du solveur parallèle. Le second volet concerne l'extension du formalisme parallèle aux architectures de pointe. Plusieurs niveaux de parallélisme interviennent alors dans la résolution, avec un traitement classique entre les sous-domaines distribués sur les nœuds de clusters, un traitement local capable de tirer partie des multiples cœurs disponibles et finalement un traitement data parallèle à grain très fin adapté aux co-processeurs de type GPU [R9][R10][R11][R12][R13]. Les moyens de tirer profit des capacités locales des nœuds varieront probablement en fonction des formulations prises en compte par le programme, par exemple entre les éléments finis et les approches sans maillages (SPH ou éléments discrets). Ceci introduit à nouveau un besoin pour une série d'algorithmes performants. La question de l'équilibrage de la charge, éventuellement dynamique, aussi bien au niveau local que global entre les sousdomaines, est également encore un point-clé à ce niveau. Seules des solutions performantes apportées aux deux gammes de problèmes précitées permettront de tirer parti efficacement de machines de calcul à plusieurs centaines, voire milliers, d'unités de calcul. L'ambition du projet est de démontrer sur un cas représentatif un bénéfice significatif, en termes de speed-up absolu et d'extensibilité, obtenu pour EUROPLEXUS grâce à ce type d'architecture. Comme annoncé au 2.1, on sépare les objectifs du projet en deux classes. 1. La première classe concerne la qualité théorique des algorithmes parallèles produits dans le cadre du projet, et testés autant que possible sur des cas de grande taille avec EUROPLEXUS. Le premier critère d'évaluation logique de cette qualité est l'ensemble des publications qui seront réalisées sur ces algorithmes, aussi bien au niveau de leur nombre que de l'envergure des revues scientifiques dans lesquelles elles paraitront. Une seconde mesure de qualité est une évaluation quantitative de l'extensibilité obtenue lors du passage à l'échelle du code mettant en œuvre ces algorithmes. Cette extensibilité pourra être mesurée sur une ou plusieurs applications tests dans les phases de mise au point des méthodes. Les tests effectués avec une version d'europlexus dotée des nouveaux algorithmes dans leur version finalisée sur des exemples de taille industrielle seront considérés avec un intérêt majoré. 11/42

En dehors des mesures de qualité du parallélisme, il faut également souligner que le projet doit fournir une base de résultats permettant de délimiter clairement le domaine de performance du code et ainsi d'orienter judicieusement les utilisateurs et les développeurs après l'échéance du projet. 2. La seconde classe de produits du projet concerne la méthodologie de mise en œuvre pratique d'europlexus sur les architectures de pointe pour le calcul intensif. Elle se compose d'un retour d'expérience détaillé impliquant des cas significatifs au niveau des besoins des partenaires. Cela permettra d'éclairer durablement les choix à venir en matière de développement. De plus, un examen des moyens de génération de maillage, de mise en données et de gestion des sorties parallèles, avec potentiellement de grands volumes de données, sera proposé, en lien avec la plateforme SALOME. Notamment, l ambition du projet REPDYN est de développer et d intégrer dans la plate-forme SALOME une version parallèle en C/C++ d un algorithme de génération de maillage pour éléments discrets à partir d une version universitaire en MATLAB. 3. PROGRAMME SCIENTIFIQUE ET TECHNIQUE, ORGANISATION DU PROJET 3.1. PROGRAMME SCIENTIFIQUE ET STRUCTURATION DU PROJET Les contributions attendues des partenaires sont orientées selon deux axes de travail complémentaires : 1. Axe D : Définition et développement des algorithmes parallèles. a. Mise au point de la méthode de résolution de l'équilibre dynamique à chaque pas de temps de la simulation et de la stratégie d'équilibrage associée aux différentes modélisations traitées en parallèle dans le code, b. Activité de développement des fonctionnalités de résolution parallèle et de décomposition de domaine pondérée dans le code, c. Elaboration d une version parallèle de l'outil de génération des éléments discrets. 2. Axe E : Activité d'évaluation des performances et d'identification des faiblesses résiduelles du programme sur des cas de calcul représentatifs, correspondant aux besoins applicatifs des partenaires. La répartition des tâches suivant les deux axes proposés permet de tirer un profit maximal de la richesse du consortium et des spécificités des partenaires : les compétences en matière de développement parallèle de l'équipe EUROPLEXUS du CEA, propriétaire du code, et de l'inria, expert en algorithmique parallèle et porteur de nombreuses activités de recherche en optimisation pour les architectures 12/42

de pointe, sont mises à profit pour les tâches de mise au point de stratégies de calcul et de programmation, de même que les ressources de recherche au sujet des méthodes sans maillage disponibles au LaMCoS et à l'onera, dans le temps prévu pour le projet, les partenaires, industriel (EDF) et recherche (CEA, ONERA), fournissent des modèles représentatifs des problématiques complexes qu'ils sont amenés à traiter, et apportent leur compétence en matière de modélisation et de mise en œuvre du code. En tant que partenaires majeurs dans le consortium EUROPLEXUS disposant d'un accès complet au code source du programme, ils disposent également d'un recul appréciable en matière de développement et sont ainsi à même de faire remonter des observations pertinentes sur d'éventuels dysfonctionnements ou défauts d'optimisation dans l'algorithme du programme. Les deux axes de travail sont ensuite combinés au sein de trois tâches principales (cf. Figure 1). 1. Passage à l'échelle pour des calculs de grande taille en dynamique des structures et en interaction fluide-structure. 2. Couplage efficace de formulations différentes (continues, particulaires, discrètes) et passage à l'échelle. 3. Extension du formalisme parallèle vers les architectures de pointes : parallélisme multi-niveaux, exploitation des GPUs. A ces trois axes principaux s'ajoute une tâche transverse, intitulée : intégration dans la plateforme SALOME, génération efficace des modèles et gestion des grands volumes de données en entrée et en sortie. La tâche 1 s'appuie sur les fonctionnalités parallèles existantes d'europlexus pour identifier dans un premier temps par l'expérience numérique les freins au passage à l'échelle sur les clusters massivement parallèles : gestion de l'équilibrage de la charge, optimisation du traitement parallèle des liaisons cinématiques par multiplicateurs de Lagrange. La tâche 2 comporte initialement une tache de développement de nouveaux couplages entre formulations et parallélisation, qui peut être menée simultanément avec les travaux algorithmiques de la tâche 1. Le passage à échelle pour les modèles exploitant ces couplages tirera ensuite profit, en les adaptant, des algorithmes et méthodes proposés en tâche 1. La tâche 3 propose tout d'abord un volet de recherche avancée en méthodes parallèles multiniveaux orientées vers les architectures innovantes, caractérisées par des nœuds multi-cœurs, équipés potentiellement de GPUs. Les concepts mis au point seront ensuite intégrés à EUROPLEXUS et testés sur les modèles mis en œuvre dans les tâches 1 et 2. Dans le cadre de la tâche transverse, il s agit notamment de développer une version parallèle en C/C++ de l algorithme de fabrication de support géométrique pour éléments discrets et de l industrialiser en intégrant dans la plate-forme SALOME. Par ailleurs SALOME sera utilisée 13/42

comme plate-forme d accueil pour la mise en données et le post-traitement des différentes simulations prévues dans le cadre de REPDYN et décrites dans l annexe (3.3.5). Tâche 1 Tâche 2 Tâche 3 Evaluation version parallèle courante Développements pour passage à l'échelle Validation sur tests industriels Nouveaux couplages en parallèle Passage à l'échelle pour les nouvelles approches Validation sur tests industriels Nouveaux algorithmes parallèles multiniveaux Intégration dans EUROPLEXUS Reprise des tests des tâches 1 & 2 Gestion de la mise en données et de l'exploitation des résultats via la plateforme SALOME Tâche transverse Fig. 1 : Structure du projet REPDYN 3.2. MANAGEMENT DU PROJET Le code EUROPLEXUS est né en 2000 de la fusion entre les codes PLEXUS du CEA et PLEXIS-3C du CCR Ispra, après plus d'une décennie de développement conjoint des deux programmes. Son développement et son exploitation ont alors été confiés à un consortium impliquant les deux propriétaires et d'autres organismes, nommés partenaires majeurs. Ces derniers ont un accès complet au code source du programme et participent au processus de développement, via un atelier logiciel performant assurant la bonne collaboration de tous les intervenants. Le consortium EUROPLEXUS est doté d'un Comité Technique se réunissant deux fois par an pour assurer le suivi des projets de développements et des études en cours. Les partenaires industriels du présent projet appartiennent tous au consortium EUROPLEXUS. Le pilotage du projet bénéficie donc naturellement des procédures existantes pour la collaboration entre les équipes. Les différents interlocuteurs pour chaque équipe sont clairement identifiés, les relations sont stables et régulières. Au niveau technique, les partenaires impliqués dans les activités d'étude disposent à chaque instant, via un système 14/42

de sites miroir 6, de la dernière version du programme pour pouvoir suivre l'évolution des fonctionnalités. Les partenaires concernés par les tâches de programmation profitent également de la gestion de configuration et de co-développement avancée proposée par l'atelier. En ce qui concerne les partenaires INRIA et LaMCoS, ne disposant pas d'un site miroir, un site de développement sera installé dans les laboratoires concernés, selon une procédure déjà définie et fonctionnelle dans le cas du LaMCoS. Le site de développement propose un accès au code source limité au domaine de développement considéré, ainsi que toutes les procédures de compilation et d'édition de liens permettant de construire une version locale du programme. En ce qui concerne le pilotage proprement dit du projet REPDYN, le suivi sera réalisé par l'équipe de développement du CEA. Elle assurera la centralisation des informations sur l'avancement des tâches des différentes équipes, dans le cadre des réunions programmées du Comité Technique du consortium EUROPLEXUS, réunissant CEA, EDF et ONERA, et auxquelles les partenaires INRIA et LaMCoS seront invités. Ces réunions seront le lieu privilégié pour les discussions techniques et les décisions relatives à d'éventuelles difficultés. Par ailleurs, l'équipe pilote du CEA organisera naturellement des réunions supplémentaires, entre tout ou partie des partenaires, si le besoin s'en fait sentir, notamment dans le cadre de la collaboration technique à un niveau de détail incompatible avec les réunions du Comité. Il est également judicieux de souligner que le LaMCoS collabore de longue date avec le consortium EUROPLEXUS par l'intermédiaire de nombreuses thèses et que l'inria, par l'intermédiaire du LIG, est impliqué dans le projet ANR VULCAIN, auquel collabore le CEA et l'équipe d'edf R&D associée à EUROPLEXUS. Dans le cadre de VULCAIN, l INRIA travaille à la parallélisation, notamment sur GPU, d un code de mécanique granulaire et à son couplage avec EUROPLEXUS. Les tests de passage à l'échelle se feront sur les machines à grand nombre de processeurs du CCRT ou d'edf (BlueGene). Pour les développements orientés vers les architectures de pointe, l'inria dispose d'un parc de machines approprié et peut accéder, comme le CEA, aux ressources du CCRT. Le diagramme suivant récapitule l'implication des partenaires dans les différentes tâches (cf. 3.3) : 6 Site miroir : Le code source original du code EUROPLEXUS se trouve au CEA sur un site appelé Site Central. Une copie exacte de ce site est installée en local au CCR Ispra et chez chaque partenaire majeur. A chaque nouveau développement, le code source de référence sur le Site Central est soumis à une évolution, puis celle-ci est immédiatement et automatiquement reportée sur tous les sites miroir. Tous les sites testent individuellement, sur leur machine locale, la conformité du programme à partir de tests de non-régression pour identifier toute anomalie, et remontent leur diagnostic à tous les partenaires. 15/42

Partenaires TE CEA EDF & LaMSID ONERA INRIA LaMCoS E1.1 D1.1 E1.2 D1.2 E1.3 D2.1 D2.2 E2.1 D2.3 E2.2 D3.1 D3.2 E3.1 D4.1 Tab. 1 : Distribution des tâches élémentaires 3.3. DESCRIPTION DES TRAVAUX PAR TACHE Chaque tache principale se présente sous la forme d'un groupe de taches élémentaires (TE), reprises dans le tableau 1 du paragraphe précédent. 16/42

3.3.1 TACHE 1 : PASSAGE A L'ECHELLE POUR DES CALCULS DE GRANDE TAILLE EN DYNAMIQUE DES STRUCTURES ET EN INTERACTION FLUIDE-STRUCTURE EUROPLEXUS est doté au démarrage du projet d'un solveur parallèle destiné aux clusters (formalisme SPMD avec décomposition de domaine et interconnexion MPI), compatible avec la majorité des fonctionnalités relatives au calcul en dynamique des structures et en interaction fluide-structure. Ce solveur tient en particulier compte du traitement des liaisons par multiplicateurs de Lagrange, proposant une structure de données dynamique permettant de gérer les liaisons permanentes et non-permanentes (liaisons de contact unilatéral par exemple). L'identification des liaisons couplées impliquant plusieurs sous-domaines, ainsi que le calcul des multiplicateurs pour ces liaisons, qui requiert la résolution d'un système linéaire au niveau global, ont bénéficié d'un soin particulier au moment de la mise au point de l'algorithme parallèle existant. Il subsiste des réserves concernant le passage à l'échelle du code parallèle initial. Cela concerne notamment l'équilibrage de la charge de la boucle élémentaire pour chaque sousdomaine, faisant intervenir des éléments de types différents (éléments finis ou volumes finis), auxquels sont affectés des matériaux différents. Ce problème est en général traité à l'aide d'une pondération des entités au moment de la décomposition de domaine, approche suivie dans le cadre d'europlexus. Les méthodes de pondération, ainsi que les questions d'optimisation dynamique de la décomposition en cours de calcul, doivent toutefois être examinées en détail pour atteindre une efficacité compatible avec les machines massivement parallèles. La solution efficace et extensible du problème posé sur les liaisons cinématiques couplées entre les sous-domaines se présente également comme un verrou potentiel dans la version actuelle. Le processus actuel utilise en effet un processeur particulier pour réaliser les tâches globales d'identification des couplages et de construction de la matrice à résoudre, avant de lancer le calcul des multiplicateurs à l'aide d'un solveur distribué. Détail de la tâche TE - E1.1 Evaluation des performances de la version parallèle existante d'europlexus en calcul de structure et d'interaction fluide-structure Définition des tests industriels représentatifs (CEA + EDF + ONERA) : Chute de colis de transport (CEA), Simulation de l'essai MARA (CEA), Impact de projectile sur un bâtiment nucléaire (EDF), Blade shedding sur moteur d'hélicoptère (ONERA). Etat des lieux et analyse des verrous : Mise en œuvre des modèles et vérification des solutions, Mesures de performance et interprétations. 17/42

TE - D1.1 Définition d'algorithmes innovants pour lever les verrous Méthodes avancées de pilotage de la décomposition de domaine (CEA + INRIA) Identification robuste des poids, Possibilité d'équilibrage dynamique. Stratégie de traitement équilibré des liaisons cinématiques couplées (CEA + INRIA) Equilibrage de la tâche d'identification des couplages, Optimisation des communications pour la solution du système linéaire. TE - E1.2 JALON 1 : Passage des cas d'évaluation sélectionnés en tâche élémentaire E1.1 avec la version parallèle améliorée d'europlexus Identification des gains et des problèmes résiduels (CEA + ONERA + EDF + INRIA) TE - D1.2 Poursuite des travaux d'optimisation de la version parallèle à mémoire distribuée du code (CEA + INRIA) TE - E1.3 Suivi régulier des travaux d'optimisation à l'aide des cas d'évaluation (CEA + ONERA + EDF) 3.3.2 TACHE 2 : COUPLAGE EFFICACE DE FORMULATIONS DIFFERENTES (CONTINUES, PARTICULAIRES, DISCRETES) ET PASSAGE A L'ECHELLE Pour permettre la simulation de phénomènes physiques complexes, EUROPLEXUS a été doté récemment d'approches originales venant compléter le formalisme éléments finis et volumes finis existant. Il s'agit par exemple d'approches particulaires pour les structures massives et les coques, accompagnant l'approche SPH pour les fluides existant déjà dans le code et permettant le calcul du crash d'un réservoir, ou d'approches par éléments discrets, mises en œuvre pour la représentation de la perforation de structures en béton armé. Ces approches et leurs interactions avec les modélisations continues font l'objet de nombreux travaux de recherche menées directement avec EUROPLEXUS ou en lien avec le programme. Il s'agit en particulier de deux thèses en cours, l'une concernant les éléments discrets 7, l'autre 7 Thèse de J.Rousseau "Modélisation numérique du comportement dynamique de structures sous impact sévère avec un couplage éléments finis / éléments discrets", dirigée par L.Daudeville (3S-R Grenoble) et encadrée par S.Potapov (EDF-LaMSID), lancée en octobre 2007 18/42

les particules SPH étendues 8. La première de ces thèses est soutenue dans le cadre du projet VULCAIN (cf. 3.2) au niveau de son contenu théorique liée à la modélisation du béton armé. La problématique du coût numérique des éléments discrets a clairement été identifiée, de même que la nécessité du passage à l'échelle pour les modèles impliquant éléments discrets et éléments finis, ce qui justifie la poursuite des travaux dans le présent projet. La seconde thèse, comportant un important volet performances numériques et parallèlisme, pour parvenir à une mise en œuvre à l'échelle industrielle de simulations SPH complexes, était entièrement associée au projet PADRE proposé l'an passé, dans le cadre de la collaboration avec le LaMCoS. Lancée en octobre 2008 et financée sur fonds propres par le CEA et EDF, elle figure naturellement dans le projet REPDYN. En complément de ces travaux en cours, le LaMCoS travaille sur l'écriture de couplages innovants, pour représenter par exemple l'écoulement d'un fluide modélisé en SPH à travers des fissures modélisées par la méthode des éléments finis étendus dans une structure mince, ou encore la continuité cinématique par la méthode Arlequin entre une coque modélisée en SPH et une coque éléments finis. Toutes ces approches font intervenir des modélisations coûteuses, associées à de grande finesse de modélisation, ce qui justifie l'examen de leur traitement parallèle et du passage à l'échelle des modèles les utilisant : cela correspond à leur intégration dans le formalisme avec décomposition de domaines, puis la gestion des questions d'équilibrage de la charge qui leur sont propres. Détail de la tâche TE - D2.1 Mise au point de techniques de couplage innovantes entre formulation et intégration dans le formalisme parallèle d'europlexus Définition, programmation et intégration parallèle des algorithmes de couplage (CEA + LaMCoS) : Poursuite des travaux sur la modélisation de crash de réservoirs avec SPH fluide et coques, Interaction entre une fluide SPH et une structure mince fissurée, Modélisation couplée d'une coque par SPH et éléments finis. TE - D2.2 Passage à l'échelle pour les modèles couplés (éléments finis, volumes finis, particules SPH, éléments discrets) Adaptation des algorithmes à l'aide des méthodes développées en TE D1.1 (CEA + EDF-LaMSID + INRIA + LaMCoS) 8 Thèse de F. Caleyron "Simulation numérique SPH de fuites de fluide consécutive à la déchirure d un réservoir sous impact", dirigée par A. Combescure (professeur au LaMCoS) et encadrée par S. Potapov (EDF-LaMSID) et V. Faucher (CEA), lancement effectué en octobre 2008 19/42

TE - E2.1 Mise en œuvre de la version parallèle sur des cas industriels significatifs Définition des modèles (CEA + EDF-LaMSID + ONERA + LaMCoS) : Coup de bélier hydraulique après impact et pénétration d'un projectile balistique dans un caisson réservoir (ONERA), Perforation d une enceinte en béton armé (EDF-LaMSID), Crash et multi-fragmentation d'un réservoir (CEA + EDF + LaMCoS). Identification des performances et des verrous spécifiques restants (CEA + EDF-LaMSID + ONERA + LaMCoS + INRIA) TE - D2.3 Optimisation spécifique pour les modèles couplés pour lever les verrous Stratégie avancée pour l'équilibrage de la charge et la gestion des liaisons de couplage (CEA + INRIA) TE - E2.2 JALON 2 : Passage des cas d'évaluation sélectionnés en tâche élémentaire E2.1 avec la version parallèle améliorée d'europlexus Identification des améliorations et des problèmes (CEA + ONERA + EDF-LaMSID + LaMCoS) 3.3.3 TACHE 3 : EXTENSION DU FORMALISME PARALLELE VERS LES ARCHITECTURES DE POINTES : PARALLELISME MULTI-NIVEAUX, EXPLOITATION DES GPUS Les évolutions de la dernière décennie en matière d'architectures parallèles ont été marquées par la généralisation des machines parallèles sous la forme réseaux interconnectés (clusters), associées obligatoirement à un parallélisme à mémoire distribuée, le plus souvent à l'aide de la librairie de passage de messages MPI. C'est le formalisme retenu dans EUROPLEXUS. Cependant, l'avènement récent des processeurs multi-cœurs et les avancées prometteuses en matière de calcul scientifique sur processeurs graphiques (GPU) modifient en profondeur la nature des nœuds interconnectés dans un cluster, les éloignant largement de la simple unité de calcul séquentielle. Il devient ainsi judicieux de chercher à exploiter au mieux les spécificités locales des nœuds, tout en conservant l'approche SPMD avec MPI pour exécuter le programme sur plusieurs nœuds simultanément. On aboutit à un parallélisme à plusieurs niveaux, totalement complémentaire du parallélisme classique, qui reste pertinent au niveau le plus élevé entre les nœuds et se trouve enrichi de méthodes d'accélération au niveau local sur les nœuds. La mise en œuvre équilibrée de ce parallélisme innovant est un domaine de recherche actif dont l'inria est un moteur majeur. En ce qui concerne spécifiquement EUROPLEXUS, l'exploitation judicieuse des unités de calcul appartenant à un même nœud, en les exploitant à l'aide d'un seul sous-domaine dont le solveur local est optimisé, permet d'améliorer l'extensibilité du code en réduisant le 20/42

nombre de sous-domaines à mettre en œuvre pour un nombre donné d'unités de calcul, et en limitant ainsi les couplages cinématiques entre les domaines. Détail de la tâche TE - D3.1 Recherche avancée en algorithmique parallèle multi-niveaux Mise au point d'algorithmes innovants utilisant les nœuds multi-cœurs et les GPUs (INRIA). Analyse de l'équilibrage de la charge et stratégie d'optimisation en présence d'un parallélisme global à mémoire distribuée et d'un traitement accélérateur local (INRIA). Validation des approches avec des applications locales et/ou EUROPLEXUS. TE - D3.2 Intégration des concepts les plus prometteurs dans EUROPLEXUS Enrichissement du processus de solution local à un sous-domaine à l'aide des concepts de la TE précédente (CEA + INRIA) : Adaptation éventuelle de la structure de données, Evolution de la stratégie d'équilibrage de la charge. TE - E3.1 JALON 3 : Passage des cas d'évaluation sélectionnés avec la version parallèle multi-niveaux d'europlexus Identification des améliorations et des problèmes (CEA + ONERA + EDF-LaMSID + LaMCoS) 3.3.4 TACHE TRANSVERSE : INTEGRATION DANS LA PLATEFORME SALOME ET GESTION DES GRANDS VOLUMES DE DONNEES EN ENTREE ET EN SORTIE (CEA + EDF) Cette tache intervient en support de toutes les TE d'évaluation des performances et de mise en œuvre de modèles complexes de grande taille. La plateforme SALOME propose alors un environnement interactif et d'accès libre, facilitant la création des jeux de données, aussi bien au niveau de la géométrie, que du maillage ou des commandes EUROPLEXUS. Détail de la tâche TE D4.1 Mise en œuvre dans SALOME d un algorithme parallèle pour la génération des éléments discrets (LaMSID) Développement et intégration dans la plate-forme SALOME via un module indépendant d une version parallèle (parallélisation multithreading, multiprocesseur) en C/C++ d un algorithme de génération de maillage pour éléments discrets, à partir d une version universitaire en MATLAB, avec une mise en place d une sortie au format MED parallèle. JALON 4 : Livraison d'un outil intégré à la plateforme SALOME Démonstration des fonctionnalités sur la mise en donnée d'un modèle d'enceinte en 21/42

béton armé modélisée par éléments discrets (éventuellement couplés à des éléments finis) 3.3.5 ANNEXE : DESCRIPTION DES CAS DE SIMULATION ENVISAGES POUR L'EVALUATION DES AMELIORATIONS APPORTEES A EUROPLEXUS On présente dans cette annexe les calculs envisagés pour servir de support aux cas d'évaluation inscrits dans le projet. On se restreint dans la description des modèles à des informations conformes à d'éventuelles clauses de confidentialités qui leur seraient associées. De même, aucune information quantitative sur les résultats des calculs effectués n'est prévue dans le projet. Seuls les résultats en termes de performances seront produits. On vérifiera toutefois pour tous les cas que le calcul parallèle conduit aux mêmes résultats physiques que le calcul séquentiel de référence. Chute de colis de transport (CEA) Il s'agit d'évaluer la résistance au choc d'un colis destiné au transport de matière radioactive et soumis à une chute (cf. Figure 2). Ce colis comprend des capots de protection contenant du bois massif pour l'absorption d'énergie. Le modèle contient un nombre réduit d'éléments finis de structure, mais présente surtout un grand nombre de surfaces de contact et permet donc d'évaluer précisément la qualité du traitement parallèle des liaisons cinématiques non-permanentes, ce qui représente un point théorique délicat dans le projet. T = 0 ms T = 9 ms T = 18 ms (après rebond) Fig. 2 : Chute verticale d'un colis sur un plan rigide Représentation de la déformation plastique dans la direction des fibres du bois contenu dans le capot de protection. Simulation du Blade Shedding appliqué au cas d'un moteur complet d'hélicoptère TURBOMECA (ONERA) L'ONERA est impliqué dans un Projet de Recherche Concertée DYNA depuis 2005. L'objectif est de développer avec l'accord de TURBOMECA un modèle complet de moteur d'hélicoptère en vue de simuler le phénomène de Blade Shedding. Il s'agit, lors de la mise en survitesse du moteur, de rupture de pâles (à la suite d'une ingestion d oiseau, de glace, etc.), 22/42