Architectures Parallèles II. Taxonomie

Documents pareils
Initiation au HPC - Généralités

Parallélisme et Répartition

INF6500 : Structures des ordinateurs. Sylvain Martel - INF6500 1

Exécution des instructions machine

Eléments d architecture des machines parallèles et distribuées

NOTIONS DE RESEAUX INFORMATIQUES

Windows Internet Name Service (WINS)

PROGRAMME DU CONCOURS DE RÉDACTEUR INFORMATICIEN

Données Réparties. Thibault BERNARD.

Systèmes et traitement parallèles

Projet de Veille Technologique

Fonctionnement et performance des processeurs

Sanity Check. bgcolor mgcolor fgcolor

1 Architecture du cœur ARM Cortex M3. Le cœur ARM Cortex M3 sera présenté en classe à partir des éléments suivants :

Cours de Systèmes d Exploitation

ELP 304 : Électronique Numérique. Cours 1 Introduction

Conception de circuits numériques et architecture des ordinateurs

Eléments de spécification des systèmes temps réel Pierre-Yves Duval (cppm)

Ebauche Rapport finale

Chapitre 4 : Exclusion mutuelle

ARBRES BINAIRES DE RECHERCHE

Travail d évaluation personnelle UV valeur C : IRE. Planification de réseaux : Simulateur IT-GURU Academic Edition

Revue d article : Dynamic Replica Placement for Scalable Content Delivery

Le service IPv4 multicast pour les sites RAP

Conception des systèmes répartis

Chapitre 1 - Langages de description d architectures matérielles hybrides

Plan du Travail. 2014/2015 Cours TIC - 1ère année MI 30

SafeKit. Sommaire. Un livre blanc de Bull Evidian

Architecture des ordinateurs TD1 - Portes logiques et premiers circuits

Architecture des Ordinateurs. Partie II:

Améliorer les performances du site par l'utilisation de techniques de Web Mining

Fonctions Réseau et Télécom. Haute Disponibilité

Chapitre 10. Architectures des systèmes de gestion de bases de données

INTRODUCTION AUX SYSTEMES D EXPLOITATION. TD2 Exclusion mutuelle / Sémaphores

Dimensionnement Introduction

COTISATIONS VSNET 2015

Evaluation des performances de programmes parallèles haut niveau à base de squelettes

«clustering» et «load balancing» avec Zope et ZEO

Argument-fetching dataflow machine de G.R. Gao et J.B. Dennis (McGill, 1988) = machine dataflow sans flux de données

La continuité de service

Contributions à l expérimentation sur les systèmes distribués de grande taille

Cours 3 : L'ordinateur

FORMATION CN01a CITRIX NETSCALER

Leçon 1 : Les principaux composants d un ordinateur

Consolidation de stockage

Informatique Industrielle Année Architecture des ordinateurs Note de cours T.Dumartin

Les réseaux de campus. F. Nolot

CAS IT-Interceptor. Formation «Certificate of Advanced Studies»

1 Définition et présentation. 2 Le réseau Numéris. 3 Les services. 3.1 Les services Support (Bearer service) SYNTHESE

Pré-requis techniques

Sauvegarde collaborative entre pairs Ludovic Courtès LAAS-CNRS

Comprendre le Wi Fi. Patrick VINCENT

L'ELECTRONIQUE AU. Innov'Day PEP Bellignat 24 Avril 2014

Introduction aux algorithmes répartis

Big Data et Graphes : Quelques pistes de recherche

Introduction à l architecture des ordinateurs. Adrien Lebre Décembre 2007

Cours n 12. Technologies WAN 2nd partie

Programmation parallèle et distribuée

Rapport d activité. Mathieu Souchaud Juin 2007

10 problèmes de réseau courants que PRTG Network Monitor vous aide à résoudre

CH.3 SYSTÈMES D'EXPLOITATION

Chapitre VII : Principes des réseaux. Structure des réseaux Types de réseaux La communication Les protocoles de communication

BUILDING AUTOMATION Phoenix Contact dans les coulisses de l Opéra Garnier

Conception. Génie Logiciel. Renaud Marlet. LaBRI / INRIA (d'après A.-M. Hugues) màj 17/04/2007

Cahier des clauses techniques particulières

Un concept multi-centre de données traditionnel basé sur le DNS

//////////////////////////////////////////////////////////////////// Administration systèmes et réseaux

LE SAN ET LE NAS : LE RESEAU AU SERVICE DES DONNEES

NetCrunch 6. Superviser

Informatique Générale Les réseaux

Architecture des ordinateurs

Auditer une infrastructure Microsoft

Cours des réseaux Informatiques ( )

<Insert Picture Here> Solaris pour la base de donnés Oracle

Exemple de l'avionique

EMC Avamar : sauvegarde et restauration hautes performances pour un software-defined data center

Éléments d'architecture des ordinateurs

UNIVERSITÉ D ORLÉANS ÉCOLE DOCTORALE MIPTIS MATHÉMATIQUES, INFORMATIQUE, PHYSIQUE THÉORIQUE ET INGÉNIEURIE DES SYSTÈMES. THÈSE présentée par :

IV- Comment fonctionne un ordinateur?

Guide de connexion à. RENAULT SA et PSA PEUGEOT CITROËN. via ENX

Chapitre 2 : Systèmes radio mobiles et concepts cellulaires

Architecture des ordinateurs

Activité 1 : Création et Clonage d'une première machine virtuelle Linux OpenSuSE.

Programmation parallèle et distribuée

EP60.92 Projet d application pluridisciplinaire La chasse aux trésors

Système de vidéosurveillance Guide de configuration

Sommaire. Conduite de projet Méthode d analyse et de conception. Processus unifié. Objectifs d un processus de développement

Infrastructure RDS 2012

Architectures n-tiers Intergiciels à objets et services web

DG-ADAJ: Une plateforme Desktop Grid

Table des matières Chapitre 1 Virtualisation, enjeux et concepts Chapitre 2 Ligne de produit XEN

COMMANDER la puissance par MODULATION COMMUNIQUER

Tout savoir sur le matériel informatique

Groupe Eyrolles, 2004 ISBN :

Vous êtes bien à la bonne présentation, c est juste que je trouvais que le titre de cette présentation étais un peu long,

Catalogue & Programme des formations 2015

MARCHE PUBLIC CAHIER DES CLAUSES TECHNIQUES PARTICULIERES

25/08/2013. Vue Nagios. Vue Nagios. Le réseau du lycée

Transcription:

Architectures Parallèles II. Taxonomie

Histoire des architecture 2

Quatre Classifications des Machines Parallèles Flynn Kuck Treleaven Gajski

Allocation des Ressources Matérielles

Classification de Flynn

Classification de Kuck

Classification de Treleaven

Classification de Gajski Porte sur les Multiprocesseurs à Mémoire Partagée de type MIMD

L organisation de la Mémoire dans les Arch. // Mémoire commune Mémoire partagée

Taxinomie des Architectures

Machine séquentielle de Von Neumann

Réplication des Ressources Matérielles Processeur ALU Données Mémoire Communication réseau Contrôle Prgramme Contrôleur

Types d'architectures SIMD

Types d'architectures SIMD Les machines Pipe Line Extensions du modèle de Von Neumann où on a pipeliné l'unité d'exécution des instructions. Ceci permet de recouvrir le temps d'extraction des instructions. Les machines Vectorielles Extensions du modèle de Von Neumann où on a pipeliné l'unité Arithmétique et Logique. Ceci permet de recouvrir le temps d'exécution des instructions. Les machines VLIW possèdent plusieurs unités arithmétiques et Logiques en parallèle qui exécutent chacune une partie de l'instruction longue, fournie par l'unité de contrôle centralisée. Les machines Cellulaires ( Array Processors) machines à mémoire distribuée : chaque PE comprend une mémoire locale et une Unité arithmétique et logique

Principe du Pipe Line

Architecture Parallèle Plusieurs Niveaux de parallèlisme: Parallélisme au niveau du circuit Coprocesseur Multiprocesseur Multi ordinateur grille

Le Modèle SIMD Parallélisme matériel» : principe Seules les UT sont dupliquées; n ALUs au lieu d une avec un seul microcontroleur pour tous Traitement parallèle sur des données Une seule UC gère le séquencement du programme pour plusieurs UT; Toutes les UT fonctionnent en synchronisme et reçoivent les mêmes instructions en même temps; La même opération est appliquée à plusieurs données simultanément, puisque chaque UT calcule sur un flux de données différent. circuit spécifique données manipulées : vecteurs fonctionnement naturellement synchrone Classification traditionnelle : SIMD

Le Modèle SIMD: Architecture fonctionnelle Données Mémoire Données Instructions UTn UT1 Ordres UC

Fonctionnement d une machine SIMD: Exemple Parfor i:=0, 3 //for parallèle Y[i]=Y[i]+T[i] ; Endpar for Y[0] Y[1] Y[2] Y=Y+T T[0] T[1] T[2] ADD Y, Y, T Y[0] Y[1] Y[2] UT1 UT2 UT3 Mémoire du programme

Le Modèle Vectoriel MISD : principe Conserve la même structure, mais les UT et les UC sont découpés en étages; Un seul flux de données reçoit plusieurs traitement simultanément; Il ne s'agit pas de machines multiprocesseurs, mais le parallélisme se situe au niveau plus bas (au sein même du processeur)

Le Modèle Vectoriel MISD: Architecture fonctionnelle Données Mémoire Données Instructions Étage 1 UT Étage n UT Ordres UC1 UC n Processeur

Le Modèle Vectoriel MISD: Exemple x=0; Tant que la scène est filmée faire Ix=F(); Jx=N(Ix); // filtrage Kx=C(Jx); //compression d image S(Kx); //stocker l image x=x+1; fin faire

Le Modèle MIMD:principe L'architecture du processeur du modèle séquentiel est dupliquée; Chaque processeur est libre d'exécuter des instructions qui lui sont propres sur un flux de données qui lui est propre; Permet d'exécuter un programme différent sur tous les processeurs;

Le Modèle MIMD: Architecture Fonctionnelle Données Mémoire Données Instructions Données Instructions UT UC UT UC ProcesseurN Processeur1

Le Modèle MIMD: classification MIMD Fortement couplés Multiprocesseurs (mémoire partagée) Faiblement couplés Multicalculateurs (mémoire privée) Bus commutateur Bus (LAN) commutateur

Multiprocesseurs/ Multicalculateurs P P P M M M Réseau P P P M M M Mémoire partagée Réseau Mémoire privée

Multiprocesseurs à mémoire partagée : principe Les (N) processeurs accèdent à la même mémoire partagée qui doit se comporter comme une mémoire à N ports. La mémoire partagée est construite à partir de plusieurs composants mémoire; un réseau d'interconnexion relie les composants mémoire et les processeurs;

Multiprocesseurs à mémoire partagée : problèmes Un problème de type structurel: la latence des accès mémoire; Un problème de type fonctionnel: c'est la coordination des accès à une variable partagée

Multiprocesseurs à Bus : principe Un certains nombre d'uc sont connectés à un bus; La lecture (ou l'écriture) se fait en mettant l'adresse du mot mémoire sur le bus et en déclenchant le signal approprié (Lecture ou Ecriture);

Multiprocesseurs à Bus : caractéristique Simplicité de réalisation; Mécanisme de diffusion; Accès séquentiel: un seul processeur à la fois peut accéder au bus, et donc à la mémoire.

Multiprocesseurs à Bus : limites et solutions Limite: surcharge du bus dès qu'on atteint 4 ou 5 UC; Solution: ajouter une mémoire cache entre l'uc et le Bus: le cache conserve les mots mémoire auxquels on a récemment fait accès. tous les accès mémoire passent par le cache;

Multiprocesseurs à commutateurs : principe Construire 1 Multiprocesseur comportant plus de 64 Processeurs; Diviser la mémoire en Modules que l on relie aux processeurs (N): CROSSBAR switch: Matrice de commutateurs (NxN noeuds de commutateurs); OMEGA: basé sur les commutateurs 2x2 (Log2(N) commutateurs/étages).

Multiprocesseurs à commutateurs : Exemples Nœud de commutation Commutateur 2x2 Mémoires Processeurs Processeurs Mémoires CROSSBAR OMEGA

Multiprocesseurs à commutateurs: caractéristiques Matrices de commutateurs sont très chères; Les grands réseaux OMEGA sont à la fois lents et chers : Si N=1024, il y a 10 étages de commutateurs à franchir; Lecture ou écriture: multiplier par deux le temps de franchir le réseau;

Mémoire partagée : Problème de synchronisation Exemple: Do i=1,n Parfor j:=2, n 1 A[j]:=A[j]+A[j 1]+A[j+1]/3 EndPar for EndDo Solution: barrière de synchronisation entre EndPar et EndDo.

Barrière de synchronisation: Réalisation A partir d une variable partagée initialisée au nombre de processeurs à synchroniser; chaque processus qui atteint cette barrière: décrémente cette variable (protégée). se met en attente active sur cette variable; Lorsque la variable atteint 0, tous les processus se libèrent de l attente active.

Exclusion Mutuelle: réalisation Matérielles: Masquage d'interruptions; Instruction indivisible de consultation et de modification d'un mot mémoire: Test and Set (TAS) Logicielles: Attente active (Dekker, Dijkstra,..); Sémaphores, Moniteur,...

Multicalculateurs à mémoire privée: principe Chaque UC est directement reliée à sa propre mémoire locale. un réseau d'interconnexion gère les échanges entre UC. Contrairement aux Multiprocesseurs, le délai de transmission d'un message est long et le débit de transmission est faible.

Multicalculateurs à bus: principe/caractéristique La topologie est identique à celle d'un multiprocesseurs à bus; Les calculateurs peuvent être des stations de travail, reliées par un réseau Local d'entreprise (LAN); Le trafic est moins important que dans les Multiprocesseurs à bus (10 à100 Mbit/s au lieu de 300 Mbit/s et plus).

Multicalculateurs commutés : Exemples Treillis: implanté sur des cartes de circuits imprimés; adapté aux problèmes par nature bidimensionnels (théorie des graphes, traitement d image) Hypercube: cube à n dimensions: chaque sommet représente une UC, chaque arête représente une liaison entre deux UC; chaque UC possède n liaisons avec les autres UC. Adapté à l implémentation de plusieurs Algo. (Tri, permutation, etc ).