Architectures Parallèles



Documents pareils
Initiation au HPC - Généralités

Systèmes et traitement parallèles

PROGRAMME DU CONCOURS DE RÉDACTEUR INFORMATICIEN

Introduction aux applications réparties

INF6500 : Structures des ordinateurs. Sylvain Martel - INF6500 1

Eléments d architecture des machines parallèles et distribuées

Etude d architecture de consolidation et virtualisation

Les environnements de calcul distribué

Exécution des instructions machine

Parallélisme et Répartition

Enseignant: Lamouchi Bassem Cours : Système à large échelle et Cloud Computing

Présentation d HyperV

Équilibrage Dynamique de Charge pour des Calculs Parallèles sur Cluster Linux - Une Évaluation de l Environnement AMPI.

1 LE L S S ERV R EURS Si 5

Architectures d implémentation de Click&DECiDE NSI

Limitations of the Playstation 3 for High Performance Cluster Computing

FAMILLE EMC VPLEX. Disponibilité continue et mobilité des données dans et entre les datacenters AVANTAGES

Rapport d activité. Mathieu Souchaud Juin 2007

VMWare Infrastructure 3

Vers l'orchestration de grilles de PC par les mécanismes de publicationsouscription

Module : Virtualisation à l aide du rôle Hyper-V

Architecture des ordinateurs

FAMILLE EMC VPLEX. Disponibilité continue et mobilité des données dans et entre les datacenters

Tout savoir sur le matériel informatique

Plan du cours. Autres modèles pour les applications réparties Introduction. Mode de travail. Introduction

Projet IGGI. Infrastructure pour Grappe, Grille et Intranet. Fabrice Dupros. CASCIMODOT - Novembre Systèmes et Technologies de l Information

La tête dans les nuages

Le point sur la gestion par catégorie

Unitt Zero Data Loss Service (ZDLS) La meilleure arme contre la perte de données

Windows serveur 2008 installer hyperv

Architecture des calculateurs

Microsoft Dynamics AX. Solutions flexibles avec la technologie Microsoft Dynamics AX Application Object Server

Conception des systèmes répartis

Windows 2000: W2K: Architecture. Introduction. W2K: amélioration du noyau. Gamme windows W2K pro: configuration.

CORBA haute performance

Présentation du déploiement des serveurs

TAI049 Utiliser la virtualisation en assistance et en dépannage informatique TABLE DES MATIERES

Introduction à l informatique temps réel Pierre-Yves Duval (cppm)

Qu est-ce que le «cloud computing»?

Éléments d'architecture des ordinateurs

Comprendre «le travail collaboratif»

en version SAN ou NAS

Chapitre 1 - Langages de description d architectures matérielles hybrides

vbladecenter S! tout-en-un en version SAN ou NAS

Spécifications détaillées

Infrastructures Parallèles de Calcul

ELP 304 : Électronique Numérique. Cours 1 Introduction

Communications performantes par passage de message entre machines virtuelles co-hébergées

WEA Un Gérant d'objets Persistants pour des environnements distribués

Leçon 1 : Les principaux composants d un ordinateur

NOTIONS DE RESEAUX INFORMATIQUES

THÈSE. pour obtenir le grade de. Spécialité : "Informatique : Systèmes et Communications"

3A-IIC - Parallélisme & Grid GRID : Définitions. GRID : Définitions. Stéphane Vialle. Stephane.Vialle@supelec.fr

Choix d'un serveur. Choix 1 : HP ProLiant DL380 G7 Base - Xeon E GHz

Citrix XenDesktop avec la technologie FlexCast. Citrix XenDesktop : la virtualisation des postes de travail pour tous.

Spécifications détaillées

Passage à l échelle d applications java distribuées auto-adaptatives

<Insert Picture Here> Exadata Storage Server et DB Machine V2

UNIVERSITÉ D ORLÉANS ÉCOLE DOCTORALE MIPTIS MATHÉMATIQUES, INFORMATIQUE, PHYSIQUE THÉORIQUE ET INGÉNIEURIE DES SYSTÈMES. THÈSE présentée par :

Architecture matérielle des systèmes informatiques

Conseils et astuces pour un déploiement réussi de la solution VMware Mirage

ERP Service Negoce. Pré-requis CEGID Business version sur Plate-forme Windows. Mise à jour Novembre 2009

Sur un ordinateur portable ou un All-in-One tactile, la plupart des éléments mentionnés précédemment sont regroupés. 10) 11)

Gestion de clusters de calcul avec Rocks

Définition. Caractéristiques. - Du partage des ressources : espace de stockage, imprimantes, lignes de communication.

Chapitre 4 : Les mémoires

Intervenant : Olivier Parcollet olivier.parcollet@semtao.fr Architecte Systèmes & Réseaux. RETOUR D EXPERIENCE Virtualisation à lasetao

LE SAN ET LE NAS : LE RESEAU AU SERVICE DES DONNEES

Systèmes Répartis. Pr. Slimane Bah, ing. PhD. Ecole Mohammadia d Ingénieurs. G. Informatique. Semaine Slimane.bah@emi.ac.ma

Cloud Computing : Utiliser Stratos comme PaaS privé sur un cloud Eucalyptus

Le cloud computing au service des applications cartographiques à haute disponibilité

Hyper-V et SC Virtual Machine Manager sous Windows Server 2008 R2

La continuité de service

Projet VDI le futur poste de travail

Le data center moderne virtualisé

<Insert Picture Here> Solaris pour la base de donnés Oracle

RESEAUX SAN iscsi VIRTUALISES :

HP 600PD TWR i G 4.0G 39 PC

10 tâches d administration simplifiées grâce à Windows Server 2008 R2. 1. Migration des systèmes virtuels sans interruption de service

Les utilisations des clusters dans les entreprises

1 Architecture du cœur ARM Cortex M3. Le cœur ARM Cortex M3 sera présenté en classe à partir des éléments suivants :

Business & High Technology

Cours des réseaux Informatiques ( )

Cours 13. RAID et SAN. 2004, Marc-André Léger

Quantification d incertitude et Tendances en HPC

Concours interne d ingénieur des systèmes d information et de communication. «Session 2010» Meilleure copie "étude de cas architecture et systèmes"

Introduction aux systèmes temps réel. Iulian Ober IRIT

1. Introduction à la distribution des traitements et des données

Windows Server Chapitre 1: Découvrir Windows Server 2008

La vidéosurveillance sur réseau qui surpasse vos attentes

NiceLabel pour Services Microsoft Windows Terminal Serveur et Citrix MetaFrame

Licence professionnelle Réseaux et Sécurité Projets tutorés

INTERSYSTEMS CACHÉ COMME ALTERNATIVE AUX BASES DE DONNÉES RÉSIDENTES EN MÉMOIRE

Clusters de PCs Linux

Les hyperviseurs leaders du marché qui ont fait leurs preuves en production

MODULE I1. Plan. Introduction. Introduction. Historique. Historique avant R&T 1ère année. Sylvain MERCHEZ

Bearstech. Datacenters écologiques ( green ) Salon THD Johan Charpentier. Bearstech Green Datacenters

Portage d applications sur le Cloud IaaS Portage d application

Wyse WSM. L informatique légère, économique, flexible et fiable. Wyse WSM. Tout ce que vous devez savoir. Cliquez ici

Réseau longue distance et application distribuée dans les grilles de calcul : étude et propositions pour une interaction efficace

Transcription:

Architectures Parallèles Cours pour Ingénieur Préparé par Dr. Olfa Hamdi-Larbi ola_ola79@yahoo.fr

Reçoit les signaux du contrôleur, cherche les données et les traite Instructions, Données à traiter et Données produites Cherche et décode les instructions Architectures Parallèles : Différents arrangements de ces trois composants 2

Taxonomie de Flynn Flot de Données Simple Multiple Flot d Instructions Simple Multiple SISD (Von Neumann) MISD (pipeline) SIMD (Vectorielle et cellulaire) MIMD (Multiprocesseur et Passage de Message) 3

Prend en compte la disposition de la mémoire 4

les processeurs sont synchronisés (pas de liberté temporelle) et ils exécutent la même instruction (pas de liberté spatiale) mais sur des données multiples. 5

SIMD Mémoire Distribuée Mémoire Partagée 6

Instructions Données N Données 0 le contrôleur pilote tout un tableau d unités processeur/mémoire au lieu d un processeur unique Instruction diffusée par le contrôleur : tous les processeurs l exécutent de manière parfaitement synchrone Exemples : Machines Systoliques et Cellulaires 7

Unautomate cellulaireconsiste en une grille régulière de «cellules» contenant chacune un «état» À chaque nouvelle unité de temps, les mêmes règles sont appliquées simultanément à toutes les cellules de la grille, produisant une nouvelle «génération» de cellules dépendant entièrement de la génération précédente. Automate Cellulaire bidimentionnel C C C C 8

Ont été très efficaces dans des problèmes de traitement d image 9

Début Fin Réduction C Diffusion P P S (Mémoire)... P S : Stockage C : Contrôleur P : Processeur Exemples : Machines Vectorielles 10

Définitions : machine multiprocesseurs Entre dans le cadre d une architecture SIMD Utilisation des unités fonctionnelles pipelines Comment fonctionne une machine vectorielle? 11

Principe du pipeline : les unités de traitement et de contrôle sont découpées en étages chargés d'une partie de l'opération à effectuer. des données peuvent être traitées à l'étage 2 pendant que d'autres sont traitées à l'étage 3. Le flot de données est continu. Dans la classification de Flynn, ces machines sont de type MISD, mais on peut considérer que l'effet pipeline est semblable à un effet «Multiple Donnés» en pratique, on classe les machines pipe-line avec les machines SIMD. 12

Exemple : Do i=1,n A(i)=B(i)*C(i) End do Le nombre d unités de temps Machine Scalaire :n*k Machine Vectorielle :n+k-1 13

14

Chaque Processeur dispose de son propre contrôleur. Les Processeurs exécutent des programmes différents de manière asynchrone. 15

16

P P P... S C S C S C 1 Réseau d interconnexion 2 N S : Stockage C : Contrôleur P : Processeur E/S les processeurs, les stockages et les contrôleurs sont multiples. Chaque nœud de traitement est capable de stocker et exécuter son propre programme sur ses propres données, de manière complètement indépendante et asynchrone avec tous les autres nœuds de traitement On a besoin d un réseau externe d'intercommunication entre les processeurs pour qu'ils puissent échanger des informations 17

18

C C C 1 P 1 P... 1 P Bus ou Réseau S : Stockage C : Contrôleur P : Processeur S (Mémoire) E/S Plusieurs copies du contrôleur/processeur avec une instance unique de la mémoire 19

SUN Fire [tm] 15K server SUN propose des serveurs équipés de 1 à 106 processeurs Prix de 4-5 million d euro

Avantages / Inconvénients? 20 21 Bis

C C C C 1 P 1 P... 1 P 1 P P S (Mémoire) P P S (Mémoire) P S : Stockage C : Contrôleur P : Processeur C C C C Réseau d interconnexion Combinaison de : - l avantage de la rapidité de communication inter-processeurs dans une machine à mémoire partagée, - l avantage du nombre élevé de processeurs de l architecture à mémoire distribuée plusieurs processeurs partageant une mémoire commune : nœud (grappe) l architecture à mémoire partagée en intra-nœud et l architecture à mémoire distribuée en inter-nœuds sont assemblées 22 E/S

23

24

Collection d ordinateurs autonomes (nœuds) connectés et travaillant ensemble comme une ressource unique et intégrée de calcul Nœud = système unique ou multiprocesseur Nœuds peuvent être sis dans le même local ou géographiquement séparés et connectés via un LAN Composants d un cluster : Plusieurs ordinateurs haute performance Systèmes d exploitation Réseaux/Switchs Haute Performance (Gigabit Ethernet et Myrinet) Cartes Interface Réseau Protocoles et Services de Communication rapides (Active et Fast Messages) Intergiciel Cluster Environnements et outils de programmation parallèle (compilateurs) PVM (Parallel Virtual Machine), MPI (Message Passing Interface) Applications (Séquentielles, parallèles ou distribuées) 25

Applications Parallèles Applications Séquentielles Environnements de programmation parallèle Intergiciel de Cluster (Image d un Système Unique et Infrastructure de Disponibilité) Station de travail PC Station de travail PC Station de travail PC Station de travail PC Log. Comm Log. Comm Log. Comm Log. Comm Couche Interface Rés. Couche Interface Rés. Couche Interface Rés. Couche Interface Rés. Réseau/Switch grande vitesse 26

Environnement informatique et de collaboration sans frontière Utilisation des cycles CPU durant lesquels les machines sont inactives pour exécuter une application unique «Push model» : coordinateur est responsable du partage du travail sur les différentes ressources Symétrique : un nœud de la grille peut être à la fois consommateur et producteur 27

28

SDGE, P2P, SV (Système volontaire), SCG (Système de calcul global) Environnements de développement et d exécution pour les applications sur Internet Extension du concept de vol de cycles à l échelle d Internet Machines volontaires qui se connectent à un serveur pour recevoir des tâches à exécuter «Pull model» : demandes périodiques au serveur du travail Non symétrique (nœuds volontaires fournissant les ressources informatiques aux projets, et non pas le contraire) Distributed.net, SETI@home, XtremWeb 29

P2P : Communication directe entre entités d un réseau sans passer par une autorité centrale Architecture décentralisée Nombre de ressources connectées très élevé (100 000 ressources) Ressources rarement parallèles Volatiles SDGE : centralisation GC : nombre de ressources connectées pas très élevé 30

31

Dispersion par une autorité centrale d un système d information sur des infrastructures prises en charge par un ou plusieurs prestataires Localisation géographique des ressources virtuellement illimitée Virtualisationde plateformes conçues d emblée pour être mutualisées au travers de vastes grilles de serveurs Exemples de plateformes : Amazon, Google, Microsoft,. 32

«multi-cœur» est employé pour décrire un processeur composé d'au moinsdeuxcœurs(ouunitésdecalcul)gravésauseindelamêmepuce multiplier la puissance grâce à une architecture parallèle. augmenter la puissance de calcul sans augmenter la fréquence d'horloge Les systèmes multiprocesseurs consomment beaucoup d'énergie et dégagent beaucoup de chaleur; La technologie multicœurs(multicore en anglais) permet d'assembler deux cœurs de processeurs côte-à-côte sur le silicium; une consommation etun dégagement de chaleurréduits 33

Types d architectures multicoeurs Mémoires caches des cœurs sont distinctes 34

Types d architectures multicoeurs Mémoire cache des cœurs est commune 35

Types d architectures multicoeurs Solution «prétendument» Quad-Core d Intel 36

Les programmes doivent être repensés, dans le cas contraire, ils utilisent seulement un des cœurs. Très peu de logiciels gèrent le bi-cœurs. Les logiciels ne sont pas conçus pour tirer le maximum de cette technologie. Les performances se détacheront nettement dans les applications gourmandes comme les jeux vidéo. Les quadri-cœurs, formés de 4 cœurs, sont entrain de remplacer les bi-cœurs, car le passage à cette architecture ne demande quasiment pas de modification logicielle. 37