Limitations of the Playstation 3 for High Performance Cluster Computing



Documents pareils
Contributions à l expérimentation sur les systèmes distribués de grande taille

Architecture des ordinateurs

Base de l'informatique. Généralité et Architecture Le système d'exploitation Les logiciels Le réseau et l'extérieur (WEB)

Partie théorique (20 points) :

Introduction à MATLAB R

Hubert & Bruno Lundi 12 octobre 2009 SAINT-QUENTIN (02)

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé

2. DIFFÉRENTS TYPES DE RÉSEAUX

Information. BASES LITTERAIRES Etre capable de répondre à une question du type «la valeur trouvée respecte t-elle le cahier des charges?

Exercices Corrigés Premières notions sur les espaces vectoriels

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

TAI049 Utiliser la virtualisation en assistance et en dépannage informatique TABLE DES MATIERES


Technologie de déduplication de Barracuda Backup. Livre blanc

Cours 13. RAID et SAN. 2004, Marc-André Léger

6 - Le système de gestion de fichiers F. Boyer, UJF-Laboratoire Lig, Fabienne.Boyer@imag.fr

Fourniture de matériels informatiques MARCHÉ N Cahier des Clauses Techniques Particulières

Concepts et systèmes de stockage

Programmation C. Apprendre à développer des programmes simples dans le langage C

e-novatic PRATIQUES, PLANIFICATION SUITE

Tsoft et Groupe Eyrolles, 2005, ISBN :

Portage d applications sur le Cloud IaaS Portage d application

Conception des systèmes répartis

Marché Public en procédure adaptée : Infrastructure Informatique régionale hébergée CAHIER DES CHARGES ET DES CLAUSES TECHNIQUES

Fonctions de plusieurs variables

Initiation au HPC - Généralités

Architecture des calculateurs

Cours Informatique 1. Monsieur SADOUNI Salheddine

ésylog, direction technique Esylog_PeerBackup outil de sauvegarde individuelle mails & fichiers personnels documentation technique

Introduction à l informatique temps réel Pierre-Yves Duval (cppm)

Architecture des ordinateurs

Calculer avec Sage. Revision : 417 du 1 er juillet 2010

Protection des données avec les solutions de stockage NETGEAR

Concours interne d ingénieur des systèmes d information et de communication. «Session 2010» Meilleure copie "étude de cas architecture et systèmes"

Gestion de mémoire secondaire F. Boyer, Laboratoire Sardes

Architecture des ordinateurs Introduction à l informatique

Présentation du module Base de données spatio-temporelles

Plan du cours. Autres modèles pour les applications réparties Introduction. Mode de travail. Introduction

Bases de données documentaires et distribuées Cours NFE04

Clusters de PCs Linux

EX4C Systèmes d exploitation. Séance 14 Structure des stockages de masse

Utilisation de matériels industriels avec des outils de virtualisation open source. Open Source dans le monde industriel

en version SAN ou NAS

Processus d Informatisation

Rapport 2014 et demande pour Portage de Méso-NH sur Machines Massivement Parallèles du GENCI Projet 2015 : GENCI GEN1605 & CALMIP-P0121

Choix d'un serveur. Choix 1 : HP ProLiant DL380 G7 Base - Xeon E GHz

Programmation parallèle et distribuée

Conception de réseaux de télécommunications : optimisation et expérimentations

vbladecenter S! tout-en-un en version SAN ou NAS

Optimisation multi-critère pour l allocation de ressources sur Clouds distribués avec prise en compte de l énergie

Physique quantique et physique statistique

Présentation et installation PCE-LOG V4 1-5

Système de stockage IBM XIV Storage System Description technique

Découverte de l ordinateur. Partie matérielle

Représentation des Nombres

Thomas Loubrieu (Ifremer) Small to Big Data Novembre 2013, Ifremer, Brest

Projet IGGI. Infrastructure pour Grappe, Grille et Intranet. Fabrice Dupros. CASCIMODOT - Novembre Systèmes et Technologies de l Information

Mathcad Ces capacités font de Mathcad l outil de calcul technique le plus utilisé au monde.

INTERSYSTEMS CACHÉ COMME ALTERNATIVE AUX BASES DE DONNÉES RÉSIDENTES EN MÉMOIRE

Agrégation de liens xdsl sur un réseau radio

Leçon 1 : Les principaux composants d un ordinateur

Université du Québec à Chicoutimi. Département d informatique et de mathématique. Plan de cours. Titre : Élément de programmation.

ELVITEC Sas Tél : Impasse Thomas Edison BP 69 Fax : Pertuis CEDEX Web : support@elvitec.

VMware vsphere 5 Préparation à la certification VMware Certified Professional 5 Data Center Virtualization (VCP5-DCV) - Examen VCP510

Comme chaque ligne de cache a 1024 bits. Le nombre de lignes de cache contenu dans chaque ensemble est:

Exigences système Edition & Imprimeries de labeur

Durée de L épreuve : 2 heures. Barème : Exercice n 4 : 1 ) 1 point 2 ) 2 points 3 ) 1 point

Analyse de la bande passante

Pré-requis techniques

Introduction à la Programmation Parallèle: MPI

Exigences système Edition & Imprimeries de labeur

Complexité. Licence Informatique - Semestre 2 - Algorithmique et Programmation

Communications performantes par passage de message entre machines virtuelles co-hébergées

Théorie et codage de l information

Rapport de certification ANSSI-CSPN-2011/14. Fonctionnalités de pare-feu de StoneGate Firewall/VPN build 8069

Ricco Rakotomalala R.R. Université Lyon 2

L intelligence intégrée et connectée au cœur de vos projets. Dossier de presse

Programmation parallèle et distribuée

L utilisation d un réseau de neurones pour optimiser la gestion d un firewall

Architecture Technique

Point sur la virtualisation

Technologie SDS (Software-Defined Storage) de DataCore

Toute personne souhaitant maîtriser les techniques liées à la conception de produits multimédia et à la création de sites Web.

datatale Boîtier Crypté 2.5-pouces pour disque dur Manuel d utilisation USB 2.0 AES 256 bit Rev.01

Évaluation et optimisation de requêtes

au Centre Inter-établissement pour les Services Réseaux Cédric GALLO

L ORDINATEUR. Les composants. La carte mère. Le processeur. Fréquence

«clustering» et «load balancing» avec Zope et ZEO

CESI Bases de données

NOTIONS DE RESEAUX INFORMATIQUES

Prérequis techniques pour l installation du logiciel Back-office de gestion commerciale WIN GSM en version ORACLE

Chapitre 5 : Flot maximal dans un graphe

Aspects théoriques et algorithmiques du calcul réparti L agglomération

Mes documents Sauvegardés

Éléments d'architecture des ordinateurs

Nouvellement recruté au sein de l entreprise STEpuzzle, Vous êtes stagiaire administrateur réseau et système.

Les liaisons SPI et I2C

Adopter une approche unifiée en matière d`accès aux applications

Transcription:

Introduction Plan Limitations of the Playstation 3 for High Performance Cluster Computing July 2007

Introduction Plan Introduction Intérêts de la PS3 : rapide et puissante bon marché L utiliser pour faire une grille de calcul performante?

Introduction Plan Grille de calcul Cell Cell Cell PS3 PS3 PS3 Cell PS3 Cell PS3 grille Cell PS3

Introduction Plan Plan 1 Architecture des composants Processeur Cell Playstation 3 Grille de calcul 2 Test de la grille Présentation Résultats théoriques Résultats expérimentaux

Architecture des composants Première partie I Architecture des composants

Architecture des composants Processeur Cell Architecture unite de calcul unite de calcul unite de calcul unite de calcul unite de calcul unite de calcul unite de calcul unite de calcul bus PowerPC Memoire I/O

Architecture des composants Processeur Cell Points forts Points forts : organisation de la mémoire transferts rapides grande fréquence contrôle total du développeur sur le matériel optimisations possibles

Architecture des composants Processeur Cell Points faibles Mais : le développeur doit respecter des contraintes strictes pour que le code soit optimisé organisation de la mémoire beaucoup de transferts ne convient pas à l algèbre linéaire creuse double précision très lente

Architecture des composants Processeur Cell Contraintes Contraintes de programmation : utiliser des opérations vectorielles aligner les données en mémoire masquer le coût des communications entre la mémoire partagée et les unités de calcul par le coût des calculs réutiliser au maximum les données du cache dérouler les boucles réduire le nombre de branchements

Architecture des composants Playstation 3 Architecture Matériel : un processeur Cell une mémoire de 256 Mo une carte Gigabit Ethernet et une carte graphique Logiciel : Game OS (hyperviseur) installé sur une unité de calcul Problèmes : accès au réseau ralenti carte graphique inaccessible une unité de calcul perdue (+1 pour Linux)

Architecture des composants Playstation 3 Architecture Matériel : un processeur Cell une mémoire de 256 Mo une carte Gigabit Ethernet et une carte graphique Logiciel : Game OS (hyperviseur) installé sur une unité de calcul Problèmes : accès au réseau ralenti carte graphique inaccessible une unité de calcul perdue (+1 pour Linux)

Architecture des composants Playstation 3 Points forts Points forts :?

Architecture des composants Playstation 3 Points faibles Points faibles : Game OS deux unités de calcul occupées mémoire insuffisante pour des calculs sur de grandes matrices

Architecture des composants Grille de calcul Grille de calcul Architecture : grille Protocole : MPI, avec des performances très diminuées dues à l hyperviseur (bande passante : 60%)

Test de la grille Deuxième partie II Test de la grille

Test de la grille Présentation Test et algorithme Test : produit de matrices denses Algorithme : stockage par blocs acyclique des matrices. À chaque étape i, on multiplie la i e colonne de A par la i e ligne de B. Deux cas : masquer le coût des communications par les calculs ou pas.

Test de la grille Présentation Test et algorithme Test : produit de matrices denses Algorithme : stockage par blocs acyclique des matrices. À chaque étape i, on multiplie la i e colonne de A par la i e ligne de B. Deux cas : masquer le coût des communications par les calculs ou pas.

Test de la grille Présentation Un petit dessin vaut mieux qu un long discours i d e f B i a ad ae af A b bd be bf c cd ce cf

Test de la grille Présentation Caractéristiques Caractéristiques : Donnée Notation Valeur Nombre de processeurs np 4 Taille d un vecteur (en octets) fpsize 4 Bande passante du réseau bw 600 Mb/s Performance maximale d une PS3 peak 25, 6 6 Gflop/s

Test de la grille Résultats théoriques Hypothèses Hypothèses du modèle : si plusieurs communications en même temps : même performance que lorsqu elles ont lieu séparément envoyer un message à n processeurs : même coût qu envoyer un message de longueur n à 1 processeur unités de calculs et bande passante utilisées avec leur performance maximale

Test de la grille Résultats théoriques Modèle calculs < communications calculs > communications

Test de la grille Résultats expérimentaux Une seule unité de calcul

Test de la grille Résultats expérimentaux Six unités de calcul

Test de la grille Le modèle est bon. La grille de calcul l est moins.

Test de la grille Une étude solide pour les personnes souhaitant utiliser une grille de calcul de PS3. Utiliser des PS3 ne semble pas être très performant... Problèmes rencontrés : Parfois, manque de précisions. Pas de comparaison avec d autres architectures.

Test de la grille Une étude solide pour les personnes souhaitant utiliser une grille de calcul de PS3. Utiliser des PS3 ne semble pas être très performant... Problèmes rencontrés : Parfois, manque de précisions. Pas de comparaison avec d autres architectures.

Test de la grille Des questions?