Parallélisation. Parallélisation. 1 Applications. 2 Historique. 3 Parallélisme au niveau du circuit. 4 Coprocesseur.



Documents pareils
Fonctionnement et performance des processeurs

Systèmes et traitement parallèles

Initiation au HPC - Généralités

CH.3 SYSTÈMES D'EXPLOITATION

Exigences système Commercial & Digital Printing

Exigences système Edition & Imprimeries de labeur

Architecture des ordinateurs

Eléments d architecture des machines parallèles et distribuées

Exécution des instructions machine

Architecture des Ordinateurs. Partie II:

Tout savoir sur le matériel informatique

Architecture des calculateurs

THÈSE. Pour obtenir le grade de. Spécialité : Informatique. Arrêté ministériel : 7 août Présentée et soutenue publiquement par.

Module : Virtualisation à l aide du rôle Hyper-V

Les environnements de calcul distribué

Guide du tri des cartes et circuits imprimés.

INF6500 : Structures des ordinateurs. Sylvain Martel - INF6500 1

Exigences système Edition & Imprimeries de labeur

Présentation d HyperV

Pour obtenir le grade de. Arrêté ministériel : 7 août Sylvain Genevès

Editeur de solutions innovantes C 3. Solution globale managée de communication et de téléphonie sur IP

UNIVERSITÉ D ORLÉANS ÉCOLE DOCTORALE MIPTIS MATHÉMATIQUES, INFORMATIQUE, PHYSIQUE THÉORIQUE ET INGÉNIEURIE DES SYSTÈMES. THÈSE présentée par :

Chapitre 4 : Les mémoires

MODULE I1. Plan. Introduction. Introduction. Historique. Historique avant R&T 1ère année. Sylvain MERCHEZ

PROGRAMME DU CONCOURS DE RÉDACTEUR INFORMATICIEN

Exigences système Commercial & Digital Printing

Runtime. Gestion de la réactivité des communications réseau. François Trahay Runtime, LaBRI sous la direction d'alexandre Denis Université Bordeaux I

Histoire de l Informatique

Outil d aide au choix Serveurs Lot 4 Marché Groupement de Recherche

Introduction à l architecture des ordinateurs. Adrien Lebre Décembre 2007

Métriques de performance pour les algorithmes et programmes parallèles

TAI049 Utiliser la virtualisation en assistance et en dépannage informatique TABLE DES MATIERES

Spécifications Techniques Générales. Techno Pole Internet. Lycée Djignabo / Ziguinchor

Informatique Industrielle Année Architecture des ordinateurs Note de cours T.Dumartin

Hiérarchie matériel dans le monde informatique. Architecture d ordinateur : introduction. Hiérarchie matériel dans le monde informatique

ARCHITECTURE ET FONCTIONNEMENT

Rapport d activité. Mathieu Souchaud Juin 2007

Une méthode de conception de systèmes sur puce

Architectures d implémentation de Click&DECiDE NSI

Contexte et motivations Les techniques envisagées Evolution des processus Conclusion

Les clusters Linux. 4 août 2004 Benoît des Ligneris, Ph. D. benoit.des.ligneris@revolutionlinux.com. white-paper-cluster_fr.sxw, Version 74 Page 1

Architecture matérielle des systèmes informatiques

GESTION DE LA MEMOIRE

Architecture ordinateur. Organisation mémoire et Entrées/Sorties

Conception des systèmes répartis

GPA770 Microélectronique appliquée Exercices série A

La continuité de service

Windows Server Chapitre 1: Découvrir Windows Server 2008

Vers du matériel libre

Xen. Quelques notes autour de Xen

Devis Fonctionnel N dossier : D1501

Quantification d incertitude et Tendances en HPC

Multiprogrammation parallèle générique des méthodes de décomposition de domaine

en version SAN ou NAS

Chapitre 1 - Langages de description d architectures matérielles hybrides

GCOS 7 sur microprocesseur standard Diane Daniel POIRSON 14 octobre 2004 Matériels 64 / DPS 7 / DPS 7000 Architecture & Evolution - Daniel POIRSON 1

Limitations of the Playstation 3 for High Performance Cluster Computing

Potentiels de la technologie FPGA dans la conception des systèmes. Avantages des FPGAs pour la conception de systèmes optimisés

Introduction aux systèmes temps réel. Iulian Ober IRIT

Matériel & Logiciels (Hardware & Software)

Segmentation d'images à l'aide d'agents sociaux : applications GPU

Protection de l Investissement Virtualisation, Efficacité énergétique

Chapitre 2 : Abstraction et Virtualisation

Intel Corporation Nicolas Biguet Business Development Manager Intel France

Tests de performance du matériel

Qu est ce qu une offre de Cloud?

Modules du DUT Informatique proposés pour des DCCE en 2014/2015

Contribution à la conception à base de composants logiciels d applications scientifiques parallèles.

1 Architecture du cœur ARM Cortex M3. Le cœur ARM Cortex M3 sera présenté en classe à partir des éléments suivants :

Rapport 2014 et demande pour Portage de Méso-NH sur Machines Massivement Parallèles du GENCI Projet 2015 : GENCI GEN1605 & CALMIP-P0121

LA VIRTUALISATION. Etude de la virtualisation, ses concepts et ses apports dans les infrastructures informatiques. 18/01/2010.

Concept de machine virtuelle

Alcatel-Lucent VitalQIP Appliance Manager

La vidéosurveillance sur réseau qui surpasse vos attentes

Virtualisation CITRIX, MICROSOFT, VMWARE OLIVIER D.

Configuration matérielle et logicielle requise et prérequis de formation pour le SYGADE 6

10 tâches d administration simplifiées grâce à Windows Server 2008 R2. 1. Migration des systèmes virtuels sans interruption de service

VMWare Infrastructure 3

Éléments d'architecture des ordinateurs

Systèmes d exploitation

Le Programme SYGADE SYGADE 5.2. Besoins en équipement, logiciels et formation. UNCTAD/GID/DMFAS/Misc.6/Rev.7

T. Gasc 1,2,3, F. De Vuyst 1, R. Motte 3, M. Peybernes 4, R. Poncet 5

Sauvegardes à l'observatoire Astronomique de Strasbourg

LYCEE : cycle de détermination (2nde) Technologie S INFORMER : Organiser l information Metttre en relation des informations de nature différente

Équilibrage Dynamique de Charge pour des Calculs Parallèles sur Cluster Linux - Une Évaluation de l Environnement AMPI.

Les avantages de la virtualisation sont multiples. On peut citer:

Chapitre V : La gestion de la mémoire. Hiérarchie de mémoires Objectifs Méthodes d'allocation Simulation de mémoire virtuelle Le mapping

Configuration système requise. pour les grandes et moyennes entreprises

TO4T Technologie des ordinateurs. Séance 1 Introduction aux technologies des ordinateurs

HISTORIQUE DES SYSTEMES D'EXPLOITATION (S.E.)

vbladecenter S! tout-en-un en version SAN ou NAS

Pour une première installation : suivre la procédure en page 5 à 9 Pour une mise à jour : suivre la procédure page 5, 6, 10 et 11

Club informatique Mont-Bruno Séances du 13 et du 29 octobre 2010 Présentateur : Réjean Côté

Microsoft Virtual Server, trucs et astuces avancés

I. Descriptif de l offre. L offre Sage 100 Entreprise Edition Entreprise

La carte à puce. Jean-Philippe Babau

Alchin Couderc Flambard TBSEID 2

Configuration système requise pour les grandes et moyennes entreprises

Linux embarqué: une alternative à Windows CE?

Transcription:

Parallélisation 1 Applications 2 Historique 3 Parallélisme au niveau du circuit 4 Coprocesseur 5 Multiprocesseur 6 Multi-ordinateur 7 grille (Université Bordeaux 1) Architecture de l Ordinateur 2007-2008 1 / 13

Applications Simulation numérique : expériences in silico Trop grandes : météorologie Trop petites : biologie, matériaux Trop dangereuses : maintenance nucléaire Trop couteuses : crash-tests, conception aéronautique Impossibles : climat, astrophysique A réaliser en réalité Serveurs traditionnels : Fichiers, Web, Vidéo, Base de données,... Serveurs de calcul : «on demand computing» Réalité virtuelle ou augmentée : médias, médical Peuvent consommer une puissance de calcul et demander une capacité mémoire supérieure à celle d un processeur (Université Bordeaux 1) Architecture de l Ordinateur 2007-2008 2 / 13

Les débuts du parallélisme Multiprogrammation notion de processus système Multics (65) toujours d actualité, au coeur des UNIX et de NT Programmation concurrente les coroutines(djikstra, 68) multiprogrammation à grain plus fin problèmes de synchronisation Parallélisme simulé pas de machine contenant réellement du parallélisme (Université Bordeaux 1) Architecture de l Ordinateur 2007-2008 3 / 13

Parallélisme matériel : première époque Processeurs vectoriels (Cray, 1976) circuit spécifique opérations arithmétiques élémentaires (+....) données manipulées : vecteurs calcule n additions en parallèle au lieu d une contient n ALUs au lieu d une avec un seul microcontroleur pour tous Traitement parallèle sur des données même opération sur un ensemble de données le parallélisme se fait sur les données (par opposition aux instructions) Parallélisme de données fonctionnement naturellement synchrone Classification traditionnelle SIMD : Single Instruction (flow) Multiple Data (Université Bordeaux 1) Architecture de l Ordinateur 2007-2008 4 / 13

Parallélisme matériel : seconde époque Fin des années 80 déclin des architectures tout-propriétaires exemple type : Cray avec le T3D (processeurs ALPHA, réseau haut débit propriétaire) déclin des architectures SIMD : nouveaux types d applications parallèles envisageables émergence de nouveaux modèles de programmation Orientés instructions Tendance actuelle processeurs standards + réseau standard (structure de grappes de machines) : pas trop cher architectures spécifiques (SGI Origin2000) : chers, offrent des fonctionnalités spécifiques tant matérielles que logicielles (Université Bordeaux 1) Architecture de l Ordinateur 2007-2008 5 / 13

Architecture Parallèle Plusieurs Niveaux de parallèlisme Parallélisme au niveau du circuit Coprocesseur Multiprocesseur Multi-ordinateur grille (Université Bordeaux 1) Architecture de l Ordinateur 2007-2008 6 / 13

Généralisation de la parallélisation d exécution d instructions On a vu le système du pipeline : plusieurs instructions simultanées en exécution décalée Approches complémentaires : Ajouter des unités (approche superscalaire) Unités de calculs, de commandes ou même pipeline complet Permettre l exécution complète ou partielle de plusieurs instructions en parallèle Exemple : AMD Athlon 64 : 3 UAL, 3 FPU et 3 unités de décodage d instructions Mettre plusieurs processeurs sur la même puce : Approche «multi-core» (Université Bordeaux 1) Architecture de l Ordinateur 2007-2008 7 / 13

Parallélisation Intérêts de l ajout d unités Peut faire plusieurs calculs/traitements en même temps Problèmes de l ajout d unité Nécessite plus de synchronisation entre unités Prend du temps Pas toujours pleine utilisation de toutes les unités Exemple : on n a pas forcément des séries de X additions en permanence même après réordonnancement Coût important en terme de transistors et de place Allongement des distances : temps de propagation Coût de fabrication plus important Au final : rarement plus de 2 ou 3 unités d un type (Université Bordeaux 1) Architecture de l Ordinateur 2007-2008 8 / 13

Calcul vectoriel Parallélisation Autre technique : Unités de calcul vectoriel Effectuer un même calcul avec plusieurs valeurs en parallèle (vecteur de 4, 2 ou 1 valeurs) Parallélisme SIMD : Single Instruction, Multiple Data : 11 + 32 21 43 72 86 + 34 86 59 12 Avantages Généralement plus simple et moins lourd de paralléliser En ayant une unité vectorielle avec vecteurs de taille X Que X unités complètes standard non vectorielles (Université Bordeaux 1) Architecture de l Ordinateur 2007-2008 9 / 13

Parallélisation : multi-core Mettre plusieurs coeurs de processeurs sur la même puce 2 cores dans les approches actuelles : dual-core Evolutions futures prévisibles : 4, 8... cores par die Utilité : faire du multi-processeur mais avec un seul Possibilité de multi-processeur sur des cartes mères ayant un seul support physique de processeur Au niveau logiciel, permet l exécution de threads en parallèle Plusieurs applications en parallèle Plusieurs threads d une même application (Université Bordeaux 1) Architecture de l Ordinateur 2007-2008 10 / 13

Parallélisation : multi-core 3 approches actuellement chez Intel/AMD: Intel Pentium D / XE : approche «basique» Deux processeurs entièrement dupliqués sur la même puce, avec chacun embarquant Unités de commande Unités de calculs Mémoire cache (niveaux L1 et L2) Chaque core communique directement et uniquement avec le chipset via le FSB Pb de performances pour communication entre 2 cores car on passe par le chipset Occupation inutile du FSB avec les communications entre les cores (Université Bordeaux 1) Architecture de l Ordinateur 2007-2008 11 / 13

Parallélisation : dual-core Approche AMD Athlon 64 X2 2 cores entièrement dupliqués également mais avec Un bus de communication interne au CPU très rapide entre les 2 cores Améliore les performances de communication entre les 2 cores Approche Intel Core 2 Duo Duplication des 2 cores mais avec un cache L2 commun Meilleure performance pour communication entre 2 cores On passe par le cache directement sans passer par un bus dédié ou le FSB (Université Bordeaux 1) Architecture de l Ordinateur 2007-2008 12 / 13

Parallélisation : dual-core Problème dans tous les cas Gérer la cohérence des données entre les caches et la mémoire centrale (Université Bordeaux 1) Architecture de l Ordinateur 2007-2008 13 / 13