Systèmes et traitement parallèles



Documents pareils
Initiation au HPC - Généralités

Exécution des instructions machine

CH.3 SYSTÈMES D'EXPLOITATION

Eléments d architecture des machines parallèles et distribuées

Tout savoir sur le matériel informatique

Informatique UE 102. Jean-Yves Antoine. Architecture des ordinateurs et Algorithmique de base. UFR Sciences et Techniques Licence S&T 1ère année

Architecture des ordinateurs

TO4T Technologie des ordinateurs. Séance 1 Introduction aux technologies des ordinateurs

I.1- DÉFINITIONS ET NOTIONS DE BASE

Évaluation et implémentation des langages

INF6500 : Structures des ordinateurs. Sylvain Martel - INF6500 1

MODULE I1. Plan. Introduction. Introduction. Historique. Historique avant R&T 1ère année. Sylvain MERCHEZ

Architecture des ordinateurs

Architecture matérielle des systèmes informatiques

Exigences système Commercial & Digital Printing

Architecture des calculateurs

IFT1215 Introduction aux systèmes informatiques

HISTORIQUE DES SYSTEMES D'EXPLOITATION (S.E.)

ARCHITECTURE ET FONCTIONNEMENT

Architecture des Ordinateurs. Partie II:

Éléments de programmation et introduction à Java

PROGRAMME DU CONCOURS DE RÉDACTEUR INFORMATICIEN

Chapitre 1. Infrastructures distribuées : cluster, grilles et cloud. Grid and Cloud Computing

en version SAN ou NAS

vbladecenter S! tout-en-un en version SAN ou NAS

Équilibrage Dynamique de Charge pour des Calculs Parallèles sur Cluster Linux - Une Évaluation de l Environnement AMPI.

Fonctionnement et performance des processeurs

Architecture ordinateur. Organisation mémoire et Entrées/Sorties

Parallélisme et Répartition

Exigences système Commercial & Digital Printing

ELP 304 : Électronique Numérique. Cours 1 Introduction

Le Programme SYGADE SYGADE 5.2. Besoins en équipement, logiciels et formation. UNCTAD/GID/DMFAS/Misc.6/Rev.7

Conception de circuits numériques et architecture des ordinateurs

1 Architecture du cœur ARM Cortex M3. Le cœur ARM Cortex M3 sera présenté en classe à partir des éléments suivants :

Histoire de l Informatique

Les générations d'ordinateurs de 1945 à nos jours

GESTION DE LA MEMOIRE

Introduction aux systèmes temps réel. Iulian Ober IRIT

Les environnements de calcul distribué

Calcul scientifique précis et efficace sur le processeur CELL

UNIVERSITÉ D ORLÉANS ÉCOLE DOCTORALE MIPTIS MATHÉMATIQUES, INFORMATIQUE, PHYSIQUE THÉORIQUE ET INGÉNIEURIE DES SYSTÈMES. THÈSE présentée par :

Cours 3 : L'ordinateur

Chapitre 1 - Langages de description d architectures matérielles hybrides

IV- Comment fonctionne un ordinateur?

Les systèmes embarqués Introduction. Richard Grisel Professeur des Universités Université de Rouen Nacer Abouchi Professeur ESCPE Lyon

Quantification d incertitude et Tendances en HPC

GPA770 Microélectronique appliquée Exercices série A

Les clusters Linux. 4 août 2004 Benoît des Ligneris, Ph. D. benoit.des.ligneris@revolutionlinux.com. white-paper-cluster_fr.sxw, Version 74 Page 1

Informatique Industrielle Année Architecture des ordinateurs Note de cours T.Dumartin

Matériel & Logiciels (Hardware & Software)

TAI049 Utiliser la virtualisation en assistance et en dépannage informatique TABLE DES MATIERES

Parallélisme et bioinformatique

PIC : COURS ASSEMBLEUR

Structure et fonctionnement d'un ordinateur : hardware

Partie 1. Professeur : Haouati Abdelali. CPGE Lycée Omar Ibn Lkhattab - Meknès haouaticpge@gmail.com

Hiérarchie matériel dans le monde informatique. Architecture d ordinateur : introduction. Hiérarchie matériel dans le monde informatique

Parallélisme et bioinformatique

Informatique Générale

Machines virtuelles Cours 1 : Introduction

Sanity Check. bgcolor mgcolor fgcolor

Architecture des Ordinateurs Première partie. Licence d Informatique - IUP Miage - FIIFO

Multiprogrammation parallèle générique des méthodes de décomposition de domaine

Une histoire de la microélectronique

Cours Informatique 1. Monsieur SADOUNI Salheddine

Programmation C. Apprendre à développer des programmes simples dans le langage C

FAMILLE EMC VPLEX. Disponibilité continue et mobilité des données dans et entre les datacenters

Leçon 1 : Les principaux composants d un ordinateur

Etat des lieux comparatif dans le domaine des supercalculateurs

ORDONNANCEMENT CONJOINT DE TÂCHES ET DE MESSAGES DANS LES RÉSEAUX TEMPS RÉELS 4. QUELQUES EXEMPLES DU DYNAMISME ACTUEL DU TEMPS RÉEL

Systèmes d'exploitation des ordinateurs

FAMILLE EMC VPLEX. Disponibilité continue et mobilité des données dans et entre les datacenters AVANTAGES

DU BINAIRE AU MICROPROCESSEUR - D ANGELIS CIRCUITS CONFIGURABLES NOTION DE PROGRAMMATION

Une version javascript sera disponible directement dans le cours prochainement.

Chapitre 4 : Les mémoires

LOT 1 - ACQUISITION DE SERVEURS INFORMATIQUES LOT 2 - ACQUISITION DE 5 POSTES INFORMATIQUES

Sur un ordinateur portable ou un All-in-One tactile, la plupart des éléments mentionnés précédemment sont regroupés. 10) 11)

Prentice Hall, 2011 (ISBN )

Certificat d Approbation CEE de modèle d instrument de mesure Numéro : UK 2549 Révision 1

THEME 1 : L ORDINATEUR ET SON ENVIRONNEMENT. Objectifs

Diagrammes de Package, de déploiement et de composants UML

TD Architecture des ordinateurs. Jean-Luc Dekeyser

Configuration matérielle et logicielle requise et prérequis de formation pour le SYGADE 6

Support de cours système d exploitation

Windows 2000: W2K: Architecture. Introduction. W2K: amélioration du noyau. Gamme windows W2K pro: configuration.

Acquisition de matériels informatiques

THÈSE DEVANT L UNIVERSITÉ DE RENNES 1

CQP 112 Introduc/on à la programma/on. Thème 2 : Architecture d un système informa/que. Département d informa/que

Cours 1 : La compilation

Concept de machine virtuelle

Introduction à l Informatique licence 1 ère année Notes de Cours

Exigences système BauBit pro

Introduction à la Visualisation Scientifique

Conception des systèmes répartis

Éléments d'architecture des ordinateurs

GCOS 7 sur microprocesseur standard Diane Daniel POIRSON 14 octobre 2004 Matériels 64 / DPS 7 / DPS 7000 Architecture & Evolution - Daniel POIRSON 1

TEKLYNX SENTINEL S/5

Fiche technique CPU 315SN/PN (315-4PN33)

Exigences système Edition & Imprimeries de labeur

Transcription:

Systèmes et traitement parallèles Mohsine Eleuldj Département Génie Informatique, EMI eleuldj@emi.ac.ma 1

Système et traitement parallèle Objectif Etude des architectures parallèles Programmation des applications concurrentes (Java et MPI) Contenu Introduction au traitement parallèle Principe de traitement vectoriel et pipeline Systèmes multiprocesseurs Analyse et mesures de performance 2

Chapitre I Introduction au traitement parallèle Quelques applications parallèles Evolution de la densité d intégration Evolution des systèmes d ordinateurs Définition et niveaux Parallélisme dans un système monoprocesseur Structures des ordinateurs parallèles Classification de Flynn 3

Quelques applications parallèles Calcul parallèle : utilisation de ressources multiples simultanément (processeurs, RAM, Caches, DMA, ) Applications classiques : Prévision météorologique Réactions chimique et nucléaire (temps réel) Activités géologique et sismique Recherche biologique Simulation des circuits intégrés Applications commerciales : Moteur de recherche du Web Exploration minière (pétrole, ) Réalité virtuelle (simulation de vol d avion, entertainment industry, ) Environnement de travail collaboratif Big Data (données massives) 4

Evolution de la densité d intégration Processeur Année Transistors Technologie 4004 1970 2,3 K 6μm 8088 1980 29 K 3μm 80286 1983 134 K 2μm 80386 1985 275 K 2μm 80486 1989 1,2 M 1μm Pentium 1995 3,3M 350 nm PentiumPro 1996 5,5M 250 nm Pentium II 1997 7,5 M 180 nm Pentium III 1999 9,5 M 130 nm Pentium IV 2003 42 M 90 nm i7-3770k 2008 1,4 G 22 nm 5

Intel Core i7-3770k 3,4 GHz, 22 nm, 1,4 G transistors 6

Evolution des systèmes d ordinateurs (1/4) Générations d'ordinateurs sont déterminées par : Technologie de fabrication des composants Mode de traitement Langage de programmation Evolution des systèmes d'exploitation traitement par lot Multiprogrammation temps partagé Multitraitement Multithread 7

Evolution des systèmes d ordinateurs (2/4) Première génération : 1938-1953 relais électromécaniques comme organes de commutation tubes à vide arithmétique bit à bit (additionner à 1 bit) des nombres en virgule fixe langage machine binaire ENIAC, EDVAC (bell laboratoires) Deuxième génération : 1952-1963 : transistors et diodes circuits imprimés (800 transistors) mémoire à tore assembleur, FORmula TRANslation 1956, Algol (Algorithmic Langage) 1960, Cobol. (Common business oriented) 1959 traitement par lot TRADIC, IBM 1620 en 1960 8

Evolution des systèmes d ordinateurs (3/4) Troisième génération : 1962-1975 : SSI et MSI circuits imprimés multicouches compilateurs intelligents multiprogrammation (exécution simultanée des programmes et des E/S) IBM 360/91, Illiac IV, TI-ASC, Cyber-175, STAR-100 temps partagé mémoire virtuelle (mémoire principale, mémoire secondaire) Quatrième génération : 1972-1990: LSI et VLSI pour la logique et la mémoire langages pour la manipulation des scalaires et des vecteurs (Fortran étendu) compilateurs avec vectorisation machine vectorielle CRAY-1 (1976), Cyber-205 (1982) systèmes multiprocesseurs IBM370/168 MP et IBM3081 (1980), Cray X- MP(1983), MPP massively parrallel processor (1982 composé de 16K microprocesseurs. 9

Evolution des systèmes d ordinateurs (4/4) Cinquième génération : 1990-aujourd hui: VLSI, ULSI, WSI (1G processeurs) Processeur multicores Plusieurs niveux de mémoire cache (3 à 7) CRAY-2 (4 processeurs) plus de 1 GFlops NEC 5 GFlops et coûte 5 millions de dollars Mutithreading 10

Classement des superordinateurs (juin 2014) Rang Site Système Cores PFlops 1 2 3 4 5 National Super Computer Center in Guangzhou, China DOE/SC/Oak Ridge National Laboratory, United States DOE/NNSA/LLNL United States RIKEN Advanced Institute for Computational Science, Japan DOE/SC/Argonne National Laboratory, United States Tianhe-2 NUDT Titan - Cray XK7 Cray Inc. Sequoia IBM K computer Fujitsu Mira - BlueGene/Q, IBM 3 120 000 33,86 560 640 17,59 1 572 864 17,17 705 024 10,51 786 432 8,58 Référence : http://www.top500.org/lists/2014/06/ 11

Définition et niveaux Définition : Exploitation d'événements concurents dans le processus de traitement Concurence : parallélisme, simultaniété et pipeline Parallèlisme : événements se produisant pendant le même intervalle de temps Simultaniété : évenements se produisant dans le même instant Pipeline : événement se produisant pendant des intervalles de temps cheuvauchés Niveaux du traitement parallèle Travail ou programme (multiprogrammation, temps partagé, multitraitements) Tâche ou procédure (décomposition du programme) Inter-instruction (analyse de la dépendance des données) ---> vectorisation Intra-instruction (au niveau de la micro-programmation) ou du cablage De plus en plus le matériel remplace le logiciel : Miniaturisation et coût Vitesse (temps réel) Tolérance au pannes 12

Parallélisme dans un monoprocesseur Multiplicité des unités fonctionnelles (10 UAL dans le CDC-6600) Parallélisme et pipeline dans le CPU Chevauchement des opérations du CPU et d'e/s (canaux, DMA E/S prog.) Système de hiérarchie de mémoire (mémoire virtuelle) Equilibrage des tâches bornées par le calcul et celles bornée par les E/S. Multiprogrammation (chevauchement entre le CPU et les E/S), et le temps partagé (efficace en interactif ---> temps réel). Tous ces mécanismes sont propres aux systèmes d exploitation 13

Structures des ordinateurs parallèles Ordinateur pipeline parallélisme temporel Tableau d'ordinateurs parallélisme spatial Système multiprocesseurs asynchrone 14

Ordinateur pipeline Exemple du pipeline : Exécution d'une instruction. CI : Chercher l'instruction de la mémoire DI : Décoder l'instruction CO : Chercher les opérandes EO : Exécuter l'opération Instruction CI DI CO EO Problème : conflit d accès à la mémoire branchement et interruption Avantage : exécution de la même instruction plusieurs fois (traitement vectoriel) Ordinateurs pipeline : IBM3838, CRAY-1, CYBER-205. 15

Tableau d ordinateurs (mémoire distribuée) E/S UC PC MC ET1 ET2 ET3 ETn P M P M P M P M UC : Unité de Contrôle PC : processeur de contrôle MC : mémoire de contrôle ET : Elément de traitement P : processeur M : mémoire locale. Réseau d interconnexion Exemples : Illiac IV et MPP 16

Système multiprocesseurs (mémoire partagée) Canaux d E/S MM1 MM2 Réseau d interconnexion MM : module mémoire P : processeur ML : mémoire locale MMn P1 ML1 Pp MLp Réseau d interconnexion Exemples : S-1, IBM370/168MP, Cray X-MP et Cray-2. 17

Classification de Flynn En 1966 : basée sur la multiplicité du flot d'instructions et le flot de données SISD : Single Instruction Single Data Stream SIMD : Single Instruction Multiple Data Stream MISD : Multiple Instruction Single Data Stream MIMD : Multiple Instruction Multiple Data Stream. 18

Classification de Flynn : SISD FI FI FD UC P M UC : unité de contrôle P : unité de processeur M : module mémoire FI : flot d'instruction FD : flot de données Le systeme peut être pipeline et/ou avoir plus d'une unité fonctionnelle (VAX11/780 une seule unité, IBM370/168 plusieurs unités). 19

Classification de Flynn : SIMD P1 FD1 M1 UC FI P2. FD2 M2. FI Pn FDn Mm Systèmes qui ont une structure de tableaux d'ordinateurs (Illiac IV et MPP) 20

Classification de Flynn : MISD FI1 FI2 UC1 P1 FD UC2 P2.. M1 M2... Mm FIn UCn Pn FD FIn... FI2 FI1 Architecture ayant moins d intention et considérée comme impraticable par certains architectes 21

Classification de Flynn : MIMD FI1 UC1 FI1 P1 FD1 DSn M1 FI2 FIn UC2. UCn FI2 FIn P2. Pn FD2 FDn M2. Mm. Exemples : IBM 360/16 MP, Cray-2, IBM 3081/3084 et S-1 22