Comparaison entre une architecture matérielle dédiée et un GP-GPU pour l optimisation

Dimension: px
Commencer à balayer dès la page:

Download "Comparaison entre une architecture matérielle dédiée et un GP-GPU pour l optimisation"

Transcription

1 Comparaison entre une architecture matérielle dédiée et un GP-GPU pour l optimisation Université de Bretagne-Sud Lab-STICC, Lorient, France ROADeF Troyes, France Février /22

2 Objectifs Après 7 ans dans un labo d électronique, la RO a contribué à : optimiser la synthèse de haut niveau ordonnancement, affectation, allocation optimiser le placement des données en mémoire optimiser les chemins de données dans les NoC optimiser l utilisation des réseaux de capteurs Mais qu a fait l électronique pour la RO? 2/22

3 Objectifs Après 7 ans dans un labo d électronique, la RO a contribué à : optimiser la synthèse de haut niveau ordonnancement, affectation, allocation optimiser le placement des données en mémoire optimiser les chemins de données dans les NoC optimiser l utilisation des réseaux de capteurs Mais qu a fait l électronique pour la RO? L objectif de notre travail est de proposer une architecture matérielle dédiée à l optimisation afin d accélérer la résolution de ces problèmes 2/22

4 Motivations Jusqu où peut-on aller? les ordinateurs offrent de plus en plus de processeurs ils sont équipés de cartes GP-GPU puissantes les logiciels suivent le rythme en s adaptant 3/22

5 Motivations Jusqu où peut-on aller? les ordinateurs offrent de plus en plus de processeurs ils sont équipés de cartes GP-GPU puissantes les logiciels suivent le rythme en s adaptant Mais sait-on bien utiliser ces nouvelles puissances? sait-on bien programmer en parallèle? les cartes GP-GPU sont-elles faites pour ça? 3/22

6 Motivations Jusqu où peut-on aller? les ordinateurs offrent de plus en plus de processeurs ils sont équipés de cartes GP-GPU puissantes les logiciels suivent le rythme en s adaptant Mais sait-on bien utiliser ces nouvelles puissances? sait-on bien programmer en parallèle? les cartes GP-GPU sont-elles faites pour ça? Peut-on faire encore mieux avec une architecture dédiée? 3/22

7 de référence Le plus court chemin plus court chemin d un sommet vers tous les autres nombreux algorithmes disponibles bibliothèques gratuites facilement parallélisable applications en logistique noyau de plusieurs problèmes compliqués 4/22

8 Algorithme Algo retenu : Dijkstra version séquentielle BOOST avec liste d adjacence version séquentielle C++ avec représentation matricielle version parallèle C++ CUDA version parallèle VHDL 5/22

9 Instance from DIMACS challenge Description Rome99 Large portion of the directed road network of the city of Rome, Italy, from The graph contains 3,353 vertices and 8,870 arcs. Vertices correspond to intersections between roads and edges correspond to roads or road segments Source : University of Rome La Sapienza Auteurs : Gianni Storchi, Paolo Dell Olmo, Monica Gentili Date : March /22

10 Rome99 7/22

11 de test Algo séquentiel Algo parallèle PC standard Carte GP-GPU Sea of Vertexes 8/22

12 de test Algo séquentiel Algo parallèle PC standard Carte GP-GPU Sea of Vertexes 8/22

13 PC et Carte GP-GPU PC Standard Processeur : Intel Core 2 RAM : 4 Go Fréquence : 2GHz (et 1.33GHz) 3353 nœuds par processeur Carte GP-GPU Fabriquant : NVIDIA Modèle : GeForce GTX 570 Fréquence : 1.4 GHz 7 nœuds par processeur (480 processeurs) 9/22

14 Sea of Vertexes Le calculateur est conçu à partir de NoC sur FPGA FPGA (Field Programmable Gate Array) L acronyme FPGA (Field Programmable Gate Arrays) désigne un circuit intégré composé d un réseau de cellules programmables. Chaque cellule est capable de réaliser une fonction, choisie parmi plusieurs possibles. Les interconnexions sont également programmables 10/22

15 Sea of Vertexes (suite) Sea of Vertexes est une architecture mesh-2d simplex (communications à un seul sens à chaque top horloge) chaque processeur peut effectuer le calcul pour 1 ou plusieurs nœuds du graphe. Les calculs restent très simples il faut éviter les deadlocks 11/22

16 Mesh 2D full-duplex Une variante de Sea of Vertexes, mais idéale (sans deadlock) En full-duplex les communications sont bi-directionnelles les processeurs sont organisés en grille 2D chacun peut traiter un ou plusieurs nœuds 12/22

17 Plans d exérience Les tests sont réalisés avec les caractéristiques suivantes : Id. Nom Implémentation # proc nœuds/proc. Fréq. 1 BOOST Séquentielle, LA, C++ 1 tous 2.0 GHz 2 DIJMAT Séquentielle, MAT, C++ 1 tous 1.3 GHz 3 GP-GPU Parallèle, C++/CUDA GHz 4 SOV1 Parallèle, VHDL GHz 5 SOV840 Parallèle, VHDL GHz 6 MESH5 Parallèle, VHDL GHz 7 MESH21 Parallèle, VHDL GHz LA : liste d adjacence; MAT : Matrice 13/22

18 Résultats Détails temps de chargement des données pas inclus CPU représente le temps d exécution normalisé à 1GHz ratio est le facteur d accélération par rapport à BOOST Id. Nom CPU (ms) CPU ratio 1 BOOST DIJMAT GP-GPU SOV SOV MESH MESH /22

19 Analyse des résultats Organisation SOV et MESH sont organisés en grille X Y (1 processeur sert à communiquer avec l environnement) X : # colonnes Y : # lignes P : # processeurs réellement exploités V : # nœuds par processeur X Y P V /22

20 Evolution de la taille de la grille CPU (ms) SOV MESH Taille grille 16/22

21 Comparaison avec une liste triée Natural Sorted CPU (ms) Taille grille 17/22

22 Meilleure performance La meilleure performance est obtenue sur un Mesh avec 195 processeurs, 18 nœuds par processeurs et une liste des nœuds candidats triée à chaque fois Id. Nom CPU (ms) CPU ratio 1 BOOST DIJMAT GP-GPU SOV SOV MESH MESH MESH14* Les gains peuvent atteindre un ratio de 10 4 par rapport à une version séquentielle 18/22

23 Extensibilité Les résultats sont-ils extensibles? On test notre matériel sur une instance beaucoup plus large New York City Description Original instance of the DIMACS Challenge,with roads from New York city. The graph contains 264,346 vertices and 733,846 arcs 19/22

24 Résultats partiels BOOST est bon!!! Sur un graphe 100 fois plus grand, BOOST est seulement 10 fois plus lent...les densités ne sont pas identiques! Id. Nom proc. # nœuds/proc. CPU (ms) CPU ratio 1 BOOST 1 264, MESH2* 3 88, MESH3* 8 33, MESH4* 15 17, MESH5* 24 11, MESH6* 35 7, MESH7* 48 5, MESH8* 63 4, MESH9* 80 3, MESH10* 99 2, MESH11* 120 2, /22

25 s et perspectives s Une architecture dédiée est une solution envisageable + gains importants + extensibilité de la méthode difficultés d implémentation simulation nécessaire Perspectives il faut se comparer à une architecture multicœurs réaliser une implantation physique partitionner le graphe au mieux (k-partition) la RO au service de l électronique pour la RO 21/22

26 Visit our web site... Lorient Contact : 22/22

Plan : Master IM2P2 - Calcul Scientifique

Plan : Master IM2P2 - Calcul Scientifique Plan : Les systèmes HPC Typologie des systèmes : Machines Mémoire partagée Machines à Mémoire Distribuées Machine NUMA Exemples Architectures Processeurs HPC Processeurs scalaires, superscalaires, vectoriels

Plus en détail

Délégation GPU des perceptions agents : application aux boids de Reynolds

Délégation GPU des perceptions agents : application aux boids de Reynolds Délégation GPU des perceptions agents : application aux boids de Reynolds JFSMA 2015 LIRMM - Université de Montpellier - CNRS Emmanuel Hermellin, Fabien Michel {hermellin, fmichel}@lirmm.fr Mercredi 1

Plus en détail

Segmentation d'images à l'aide d'agents sociaux : applications GPU

Segmentation d'images à l'aide d'agents sociaux : applications GPU Segmentation d'images à l'aide d'agents sociaux : applications GPU Richard MOUSSA Laboratoire Bordelais de Recherche en Informatique (LaBRI) - UMR 5800 Université de Bordeaux - France Laboratoire de recherche

Plus en détail

MATÉRIEL GRAPHIQUE POUR LE CALCUL SCIENTIFIQUE. François Rousselle LISIC Image et Apprentissage OASIS

MATÉRIEL GRAPHIQUE POUR LE CALCUL SCIENTIFIQUE. François Rousselle LISIC Image et Apprentissage OASIS MATÉRIEL GRAPHIQUE POUR LE CALCUL SCIENTIFIQUE François Rousselle LISIC Image et Apprentissage OASIS Cadre BQR 2010 CGR LISIC LMPA : Réalisation d'une plateforme générique de calcul intensif pour cartes

Plus en détail

GPU, processeurs multi-coeurs et bio-informatique

GPU, processeurs multi-coeurs et bio-informatique GPU, processeurs multi-coeurs et bio-informatique Jean-Stéphane Varré jean-stephane.varre@lifl.fr Equipe BONSAI Université Lille 1 - LIFL -INRIA Qu est-ce que c est? Le processeur (CPU) La carte graphique

Plus en détail

Comment concevoir un ordinateur? Quelques questions à considérer

Comment concevoir un ordinateur? Quelques questions à considérer Comment concevoir un ordinateur? Quelques questions à considérer Unité d entrée Unité de traitement Unité de sortie Comment coder les données Entiers, réels, caractères Comment restituer les résultats

Plus en détail

Base de données en mémoire

Base de données en mémoire Base de données en mémoire Plan Bases de données relationnelles OnLine Analytical Processing Difficultés de l OLAP Calculs en mémoire Optimisations 1 Base de données relationnelle Introduction Date Exemple

Plus en détail

LES CONFIGURATIONS PC ASSEMBLEES PAR CNET INFORMATIQUE

LES CONFIGURATIONS PC ASSEMBLEES PAR CNET INFORMATIQUE LES CONFIGURATIONS PC ASSEMBLEES PAR CNET INFORMATIQUE Unités Centrales Machines Complètes Machines Gamer LES UNITES CENTRALES 399 Processeur AMD Atlhon X3 445 Chipset Vidéo AtI Radeon HD Disque Dur 320

Plus en détail

Les mémoires. B. Miramond M1 SIGE

Les mémoires. B. Miramond M1 SIGE Les mémoires B. Miramond M1 SIGE 2 types de mémoire RAM Random Access Memory Mémoire volatile Utilisation : Mémoire de travail de l ordinateur ROM Read Only Memory Conserve ses données sans alimentation

Plus en détail

Portage et optimisation d applications de traitement d images sur architecture Kalray Mppa-Manycore Journées de la Compilation

Portage et optimisation d applications de traitement d images sur architecture Kalray Mppa-Manycore Journées de la Compilation Portage et optimisation d applications traitement d images sur architecture Kalray Mppa-Manycore Journées la Compilation Pierre Guillou Centre recherche en informatique Mines ParisTech 4 décembre 2013

Plus en détail

Proposition d un plan d étude pour l option «informatique embarquée»

Proposition d un plan d étude pour l option «informatique embarquée» Proposition d un plan d étude pour l option «informatique embarquée» Motivation : L informatique embarquée est un sous ensemble de l informatique qui est en pleine croissance. Elle intègre plusieurs aspects

Plus en détail

Séminaire RGE REIMS 17 février 2011

Séminaire RGE REIMS 17 février 2011 Séminaire RGE REIMS 17 février 2011 ADACSYS Présentation des FPGA Agenda Spécificité et différences par rapport aux autres accélérateurs Nos atouts Applications Approche innovante Document confidentiel

Plus en détail

Formalisation et automatisation de YAO, générateur de code pour l assimilation variationnelle de données

Formalisation et automatisation de YAO, générateur de code pour l assimilation variationnelle de données Formalisation et automatisation de YAO, générateur de code pour l assimilation variationnelle de données Luigi NARDI sous la direction de Fouad BADRAN et Sylvie THIRIA LOCEAN : Laboratoire d Océanographie

Plus en détail

Technologies SOC (System On Chip) (Système sur une seule puce)

Technologies SOC (System On Chip) (Système sur une seule puce) Technologies SOC (System On Chip) (Système sur une seule puce) Pierre LERAY et Jacques WEISS Équipe de recherche ETSN Supélec Campus de Rennes février, 02 Technologies SoC ; P. Leray, J. Weiss 1 Évolution

Plus en détail

Initiation au HPC - Généralités

Initiation au HPC - Généralités Initiation au HPC - Généralités Éric Ramat et Julien Dehos Université du Littoral Côte d Opale M2 Informatique 2 septembre 2015 Éric Ramat et Julien Dehos Initiation au HPC - Généralités 1/49 Plan du cours

Plus en détail

Simulation des réseaux de capteurs sans fil de grande taille

Simulation des réseaux de capteurs sans fil de grande taille Simulation des réseaux de capteurs sans fil de grande taille Cheick-Tidjane KONE Directeurs: Francis LEPAGE Co-encadrant : Michael DAVID Journée thématique RGE Jeudi 3 juin 2010 Qu est-ce qu un réseau

Plus en détail

Algorithmes évolutionnaires sur. et GPU. Introduction : GPU et puissance calculatoire Principe du GPU : le pipeline

Algorithmes évolutionnaires sur. et GPU. Introduction : GPU et puissance calculatoire Principe du GPU : le pipeline Algorithmes évolutionnaires et GPU Introduction : GPU et puissance calculatoire Principe du GPU : le pipeline graphique Introduction au parallélisme de données Exemple de simulation Les langages de haut-niveau

Plus en détail

Les ordinateurs : de 1946 à aujourd hui

Les ordinateurs : de 1946 à aujourd hui : Introduction Daniel Etiemble de@lri.fr Les ordinateurs : de 1946 à aujourd hui ENIAC (1946) 19000 tubes 30 tonnes surface de 72 m 2 consomme 140 kilowatts. Horloge : 0 KHz. 330 multiplications/s Mon

Plus en détail

Diagrammes de Package, de déploiement et de composants UML

Diagrammes de Package, de déploiement et de composants UML labsticc.univ-brest.fr/pages_perso/babau/ Diagrammes de Package, de déploiement et de composants UML Jean-Philippe Babau Département Informatique, UFR Sciences, Laboratoire Lab-STICC 2 1 Plan Description

Plus en détail

T E C S O F T 775,00 TTC 645,83 HT

T E C S O F T 775,00 TTC 645,83 HT Chipset INTEL HM86 Processeur INTEL PENTIUM 3550 2,2 Ghz 4 Go mémoire DDRIII Ecran LED 15.6 WIDE 1366*768 Carte Vidéo intégré INTEL HD4600 2 ports USB 3.0, 2 port USB 2.0 Poids 2,2 Kg Dimensions 374 X

Plus en détail

Quoi de neuf en contrôle/commande et systèmes embarqués (RIO, WSN...)?

Quoi de neuf en contrôle/commande et systèmes embarqués (RIO, WSN...)? Quoi de neuf en contrôle/commande et systèmes embarqués (RIO, WSN...)? Mathieu PACE National Instruments, Ingénieur d applications L architecture RIO se développe Processeur FPGA E/S E/S E/S personnalisées

Plus en détail

ELP 304 : Électronique Numérique. Cours 1 Introduction

ELP 304 : Électronique Numérique. Cours 1 Introduction ELP 304 : Électronique Numérique Cours 1 Introduction Catherine Douillard Dépt Électronique Les systèmes numériques : généralités (I) En électronique numérique, le codage des informations utilise deux

Plus en détail

france.ni.com Journée technique Du contrôle d instruments au banc de test

france.ni.com Journée technique Du contrôle d instruments au banc de test Journée technique Du contrôle d instruments au banc de test Processeur, FPGA, GPU : quelle approche est la mieux adaptée au traitement de données National Instruments France Au programme Les différents

Plus en détail

Hiérarchie matériel dans le monde informatique. Architecture d ordinateur : introduction. Hiérarchie matériel dans le monde informatique

Hiérarchie matériel dans le monde informatique. Architecture d ordinateur : introduction. Hiérarchie matériel dans le monde informatique Architecture d ordinateur : introduction Dimitri Galayko Introduction à l informatique, cours 1 partie 2 Septembre 2014 Association d interrupteurs: fonctions arithmétiques élémentaires Elément «NON» Elément

Plus en détail

Les portables 15 pouces

Les portables 15 pouces Les portables 15 pouces Processeur Intel Core I5-5200U 2.2GHz 4 Go DDR3L - 1 To - Lecteur & graveur DVD DL Graphique Nvidia GeForce GTX 950M 4 Go DDR3 Ethernet, Wifi ac, Bluetooth 4.0 Ecran 15.6 pouces

Plus en détail

Solveurs linéaires sur GPU pour la simulation d'écoulement en milieux poreux

Solveurs linéaires sur GPU pour la simulation d'écoulement en milieux poreux CO 2 maîtrisé Carburants diversifiés Véhicules économes Raffinage propre Réserves prolongées Solveurs linéaires sur GPU pour la simulation d'écoulement en milieux poreux J-M. Gratien,, M. Hacene, T. Guignon

Plus en détail

Info0804. Cours 6. Optimisation combinatoire : Applications et compléments

Info0804. Cours 6. Optimisation combinatoire : Applications et compléments Recherche Opérationnelle Optimisation combinatoire : Applications et compléments Pierre Delisle Université de Reims Champagne-Ardenne Département de Mathématiques et Informatique 17 février 2014 Plan de

Plus en détail

Trier des tableaux en C++ : efficacité du std::sort (STL) et tris paramétrés

Trier des tableaux en C++ : efficacité du std::sort (STL) et tris paramétrés Trier des tableaux en C++ : efficacité du std::sort (STL) et tris paramétrés Hélène Toussaint, juillet 2014 Sommaire 1. Efficacité du std::sort... 1 1.1. Conditions expérimentales... 1 1.2. Tableaux de

Plus en détail

Implémentation Matérielle des Services d un RTOS sur Circuit Reconfigurable

Implémentation Matérielle des Services d un RTOS sur Circuit Reconfigurable Implémentation Matérielle des Services d un RTOS sur Circuit Reconfigurable Pierre Olivier*, Jalil Boukhobza*, Jean-Philippe Babau +, Damien Picard +, Stéphane Rubini + *Lab-STICC, + LISyC, Université

Plus en détail

L ordinateur et ses périphériques

L ordinateur et ses périphériques L ordinateur et ses périphériques Nom : Prénom : TP MPI n 1 Classe : Objectifs : Connaître l architecture d un ordinateur. Mettre en place le vocabulaire décrivant un ordinateur Introduction : Pour fonctionner,

Plus en détail

Quels outils libres pour le FPGA? Quand le monde du logiciel rencontre celui du matériel

Quels outils libres pour le FPGA? Quand le monde du logiciel rencontre celui du matériel Quels outils libres pour le FPGA? Quand le monde du logiciel rencontre celui du matériel Soft Hard 11 juillet 2011 RMLL 2011 : Quels Logiciels Libres pour le FPGA 2 Qui suis-je? Membre d'armadeus Project

Plus en détail

Rencontre sur la thématique du Calcul Haute Performance - 13 juin 2012. Better Match, Faster Innovation

Rencontre sur la thématique du Calcul Haute Performance - 13 juin 2012. Better Match, Faster Innovation Better Match, Faster Innovation Rencontre sur la thématique du Calcul Haute Performance - 13 juin 2012 Meeting on the theme of High Performance Computing TABLE DES MATIÈRES Qu est ce qu un imatch? STI

Plus en détail

L ARCHITECTURE D UN ORDINATEUR. Page 1

L ARCHITECTURE D UN ORDINATEUR. Page 1 L ARCHITECTURE D UN ORDINATEUR Page 1 Page 2 SOMMAIRE I) Définition II) Boîtier a) Format b) Refroidissement III) Alimentation IV) Carte Mère V) Chipset VI)BIOS VII)Microprocesseur a)qu est ce que c est

Plus en détail

CALCULS PARALLÈLES ET APPLICATIONS LA VISION PAR ORDINATEUR AU CEA LIST, QUELS CHOIX ARCHITECTURAUX?

CALCULS PARALLÈLES ET APPLICATIONS LA VISION PAR ORDINATEUR AU CEA LIST, QUELS CHOIX ARCHITECTURAUX? CALCULS PARALLÈLES ET APPLICATIONS LA VISION PAR ORDINATEUR AU CEA LIST, QUELS CHOIX ARCHITECTURAUX? LABORATOIRE DE VISION ET INGÉNIERIE DES CONTENUS (LVIC) Fusion multimedia : extraction multimodale d

Plus en détail

Architecture des ordinateurs

Architecture des ordinateurs Décoder la relation entre l architecture et les applications Violaine Louvet, Institut Camille Jordan CNRS & Université Lyon 1 Ecole «Découverte du Calcul» 2013 1 / 61 Simulation numérique... Physique

Plus en détail

Outil d aide au choix Serveurs Lot 4 Marché Groupement de Recherche

Outil d aide au choix Serveurs Lot 4 Marché Groupement de Recherche Outil d aide au choix Serveurs Lot 4 Marché Groupement de Recherche Serveurs DELL PowerEdge Tour Rack standard R310 T110II Rack de calcul Lames R815 M610 R410 R910 M620 R415 R510 T620 R620 R720/R720xd

Plus en détail

Informatique légale : FPGA vs. GPU

Informatique légale : FPGA vs. GPU Informatique légale : FPGA vs. GPU Sylvain Collange, Yoginder S. Dandass, Marc Daumas et David Defour 03/06/2008 Problématiques Analyse de disque dur Recherche de contenu illégal connu Y compris dans des

Plus en détail

Comment un ordinateur fonctionne Processeur

Comment un ordinateur fonctionne Processeur Comment un ordinateur fonctionne Processeur Les processeurs Cerveau de l ordinateur Règle flux d information par intermédiaire du bus Détermine puissance de l ordi (486, Pentium, ) Vitesse définit par

Plus en détail

Scalable Distributed Reasoning using MapReduce

Scalable Distributed Reasoning using MapReduce Scalable Distributed Reasoning using MapReduce Jacopo Urbani, Spyros Kotoulas, Eyal Oren, et Frank van Harmelen Department of Computer Science, Vrije Universiteit Amsterdam, the Netherlands International

Plus en détail

! Vous aurez pris connaissance de l'évolution. ! Vous comprendrez pourquoi on utilise le binaire en. ! Vous serez capable de construire un circuit

! Vous aurez pris connaissance de l'évolution. ! Vous comprendrez pourquoi on utilise le binaire en. ! Vous serez capable de construire un circuit Architecture élémentaire Un cours d architecture pour des informaticiens Samy Meftali Samy.meftali@lifl.fr Bureau 224. Bâtiment M3 extension Sans architecture pas d informatique Comprendre comment çà marche

Plus en détail

A1-1 TP3 Gmsh et partitionnement de maillage

A1-1 TP3 Gmsh et partitionnement de maillage A1-1 TP3 Gmsh et partitionnement de maillage Nicolas Kielbasiewicz 23 septembre 2013 1 Introduction à Gmsh Sous Windows et Mac OS, Gmsh est une application native. Sous Linux, il se lance en ligne de commande,

Plus en détail

Introduction au maillage pour le calcul scientifique

Introduction au maillage pour le calcul scientifique Introduction au maillage pour le calcul scientifique CEA DAM Île-de-France, Bruyères-le-Châtel franck.ledoux@cea.fr Présentation adaptée du tutorial de Steve Owen, Sandia National Laboratories, Albuquerque,

Plus en détail

Données Réparties. Thibault BERNARD. thibault.bernard@univ-reims.fr

Données Réparties. Thibault BERNARD. thibault.bernard@univ-reims.fr Données Réparties Thibault BERNARD thibault.bernard@univ-reims.fr Sommaire Introduction Gestion de la concurrence Reprise après panne Gestion des données dupliquées Sommaire Introduction Gestion de la

Plus en détail

Construction d un chemin Hamiltonien unique et robuste descripteur d un maillage

Construction d un chemin Hamiltonien unique et robuste descripteur d un maillage Construction d un chemin Hamiltonien unique et robuste descripteur d un maillage V. Itier 1,2, W. Puech 1, G. Gesquière 3, J.P. Pedeboy 2 and G. Subsol 1 LIRMM UMR 5506 CNRS, University of Montpellier

Plus en détail

Parallélisme et Répartition

Parallélisme et Répartition Parallélisme et Répartition Master Info Françoise Baude Université de Nice Sophia-Antipolis UFR Sciences Département Informatique baude@unice.fr web du cours : deptinfo.unice.fr/~baude Septembre 2009 Chapitre

Plus en détail

GELE5340 Circuits ITGÉ (VLSI) Chapitre 1: Introduction

GELE5340 Circuits ITGÉ (VLSI) Chapitre 1: Introduction GELE5340 Circuits ITGÉ (VLSI) Chapitre 1: Introduction Contenu du cours Introduction aux circuits intégrés Dispositifs CMOS, processus de fabrication. Inverseurs CMOS et portes logiques. Délai de propagation,

Plus en détail

Contrôle Non Destructif : Implantation d'algorithmes sur GPU et multi-coeurs. Gilles Rougeron CEA/LIST Département Imagerie Simulation et Contrôle

Contrôle Non Destructif : Implantation d'algorithmes sur GPU et multi-coeurs. Gilles Rougeron CEA/LIST Département Imagerie Simulation et Contrôle Contrôle Non Destructif : Implantation d'algorithmes sur GPU et multi-coeurs Gilles Rougeron CEA/LIST Département Imagerie Simulation et Contrôle 1 CEA R & D for Nuclear Energy 5 000 people Nuclear systems

Plus en détail

Programmation parallèle et distribuée

Programmation parallèle et distribuée Programmation parallèle et distribuée (GIF-4104/7104) 5a - (hiver 2015) Marc Parizeau, Département de génie électrique et de génie informatique Plan Données massives («big data») Architecture Hadoop distribution

Plus en détail

RAPPORT DE STAGE Calcul parallèle sur GPU

RAPPORT DE STAGE Calcul parallèle sur GPU Université Joseph Fourier Département Licence Sciences & Technologie RAPPORT DE STAGE Calcul parallèle sur GPU D Aguanno Carlotta Laboratoire d accueil : INRIA Directeur du laboratoire : GROS Patrick Responsable

Plus en détail

PCP TP01 Été 2015. Table des matières

PCP TP01 Été 2015. Table des matières PCP TP0 Été 205 Table des matières PCP Travail pratique 0... 2 Illustration exemple canonique... 2 Le travail demandé... 3 Objectif général et objectifs spécifiques... 5 Consignes générales... 6 Quoi remettre...

Plus en détail

Programmation Système des Multicœurs

Programmation Système des Multicœurs Évolution de la puissance des machines Programmation Système des Multicœurs Gaël Thomas gael.thomas@lip6.fr Accélération Évolution Traditionnelle des mono-processeurs Université Pierre et Marie Curie Master

Plus en détail

Circuits VLSI programmables

Circuits VLSI programmables Circuits VLSI programmables Alain GUYOT TIMA TIMA Techniques de l'informatique et de la Microélectronique pour l'architecture. Unité associée au C.N.R.S. n B0706 Circuits programmables 1 Du Micro au Micron

Plus en détail

Communications performantes par passage de message entre machines virtuelles co-hébergées

Communications performantes par passage de message entre machines virtuelles co-hébergées Communications performantes par passage de message entre machines virtuelles co-hébergées François Diakhaté1,2 1 CEA/DAM Île de France 2 INRIA Bordeaux Sud Ouest, équipe RUNTIME Renpar 2009 1 Plan Introduction

Plus en détail

Demande d attribution de ressources informatiques. Sur le Centre de Calculs Interactifs de l Université de Nice Sophia-Antipolis

Demande d attribution de ressources informatiques. Sur le Centre de Calculs Interactifs de l Université de Nice Sophia-Antipolis Demande d attribution de ressources informatiques Sur le Centre de Calculs Interactifs de l Université de Nice Sophia-Antipolis Titre du projet : Nom du laboratoire : Nom de l établissement hébergeur :

Plus en détail

Gestion de Projet Informatique 2000-2010 Rapport de Planification

Gestion de Projet Informatique 2000-2010 Rapport de Planification Gestion de Projet Informatique 2000-2010 Rapport de Planification DUBUC XAVIER Première année du grade de master en sciences informatiques Faculté des Sciences, Université de Mons Av. du champ de Mars

Plus en détail

Chap. 2 - Structure d un ordinateur

Chap. 2 - Structure d un ordinateur Architecture des ordinateurs Michèle Courant S2-27 octobre 2004 Chap. 2 - Structure d un ordinateur 2.1 Processeur ou unité centrale (CPU) 2.1.1 Organisation du CPU 2.1.2 Exécution d une instruction 2.1.3

Plus en détail

Conception des Systèmes Numériques et Mixtes

Conception des Systèmes Numériques et Mixtes Conception des Systèmes Numériques et Mixtes Daniela Dragomirescu 1,2, Michael Kraemer 1,2, Marie-Line Boy 3, Philippe Bourdeau d Aguerre 3 1 - Université de Toulouse : INSA Toulouse, 135 Av. de Rangueil

Plus en détail

Chap. I : Architecture de base d un ordinateur

Chap. I : Architecture de base d un ordinateur UMR 7030 - Université Paris 13 - Institut Galilée Cours Architecture et Système Dans cette partie, nous décrivons rapidement l architecture de base d un ordinateur et les principes de son fonctionnement.

Plus en détail

Comparaison de MPI, OpenMP et MPI+OpenMP sur un nœud multiprocesseur multicœurs AMD à mémoire partagée.

Comparaison de MPI, OpenMP et MPI+OpenMP sur un nœud multiprocesseur multicœurs AMD à mémoire partagée. RenPar 19 / SympA 13 / CFSE 7 Toulouse, France, du 9 au 11 septembre 2009 Comparaison de MPI, OpenMP et MPI+OpenMP sur un nœud multiprocesseur multicœurs AMD à mémoire partagée. Khaled Hamidouche, Franck

Plus en détail

Leçon 1 : Les principaux composants d un ordinateur

Leçon 1 : Les principaux composants d un ordinateur Chapitre 2 Architecture d un ordinateur Leçon 1 : Les principaux composants d un ordinateur Les objectifs : o Identifier les principaux composants d un micro-ordinateur. o Connaître les caractéristiques

Plus en détail

Eternelle question, mais attention aux arnaques Question qui est souvent mise en premier plan => ce n est pas une bonne idée

Eternelle question, mais attention aux arnaques Question qui est souvent mise en premier plan => ce n est pas une bonne idée Son PC portable 1 2 Eternelle question, mais attention aux arnaques Question qui est souvent mise en premier plan => ce n est pas une bonne idée Analysons d abord vos besoins Ensuite on n y reviendra 3

Plus en détail

Principes généraux régissant l accès aux locaux et ressources informatiques de l ISIMA

Principes généraux régissant l accès aux locaux et ressources informatiques de l ISIMA 2013/2014 Principes généraux régissant l accès aux locaux et ressources informatiques de l ISIMA q PRINCIPES : Les horaires d ouverture de l Ecole vont de 7h30 à 18h30 du lundi au jeudi, et de 7h30 à 17h45

Plus en détail

Limitations of the PlayStation 3 for High Performance Cluster Computing

Limitations of the PlayStation 3 for High Performance Cluster Computing Master d Informatique Fondamentale École Normale Supérieure Lyon Calcul matriciel haute performance Chantal KELLER Limitations of the PlayStation 3 for High Performance Cluster Computing Alfredo Buttari,

Plus en détail

Contributions à l expérimentation sur les systèmes distribués de grande taille

Contributions à l expérimentation sur les systèmes distribués de grande taille Contributions à l expérimentation sur les systèmes distribués de grande taille Lucas Nussbaum Soutenance de thèse 4 décembre 2008 Lucas Nussbaum Expérimentation sur les systèmes distribués 1 / 49 Contexte

Plus en détail

Les capitalistes sociaux sur Twitter : détection via des mesures de similarité

Les capitalistes sociaux sur Twitter : détection via des mesures de similarité Les capitalistes sociaux sur Twitter : détection via des mesures de similarité Nicolas Dugué, Anthony Perez LIFO - Université d Orléans rue Léonard de Vinci B.P. 6759 F-45067 ORLEANS Cedex 2 FRANCE RÉSUMÉ.

Plus en détail

& collaborative workspace. the new multitouch CONNECT & SHARE COLLABORATE BETTER & DECIDE FASTER CREATE & INNOVATE SAVE & TAKE THE DATA WITH YOU

& collaborative workspace. the new multitouch CONNECT & SHARE COLLABORATE BETTER & DECIDE FASTER CREATE & INNOVATE SAVE & TAKE THE DATA WITH YOU CONNECT & SHARE COLLABORATE BETTER & DECIDE FASTER SAVE & TAKE THE DATA WITH YOU CREATE & INNOVATE the new multitouch & collaborative workspace O1 Connect & Share O2 Create & Innovate O3 Collaborate better

Plus en détail

Conception et Intégration de Systèmes Critiques

Conception et Intégration de Systèmes Critiques Conception et Intégration de Systèmes Critiques 15 12 18 Non 50 et S initier aux méthodes le développement de projet (plan de développement, intégration, gestion de configuration, agilité) Criticité temporelle

Plus en détail

Aspects théoriques et algorithmiques du calcul réparti L agglomération

Aspects théoriques et algorithmiques du calcul réparti L agglomération Aspects théoriques et algorithmiques du calcul réparti L agglomération Patrick CIARLET Enseignant-Chercheur UMA patrick.ciarlet@ensta-paristech.fr Françoise LAMOUR franc.lamour@gmail.com Aspects théoriques

Plus en détail

Kick-off ANR Compass

Kick-off ANR Compass Kick-off ANR Compass Contribution MDLS Pierre Kestener CEA-Saclay, DSM, France Maison de la Simulation Meudon, 14 mars 2013 1 / 10 La Maison de la Simulation Laboratoire de recherche pluridisciplinaire

Plus en détail

TAI049 Utiliser la virtualisation en assistance et en dépannage informatique TABLE DES MATIERES

TAI049 Utiliser la virtualisation en assistance et en dépannage informatique TABLE DES MATIERES TAI049 Utiliser la virtualisation en assistance et en dépannage informatique TABLE DES MATIERES 1 DECOUVERTE DE LA VIRTUALISATION... 2 1.1 1.2 CONCEPTS, PRINCIPES...2 UTILISATION...2 1.2.1 Formation...2

Plus en détail

Les données massives à Calcul Québec

Les données massives à Calcul Québec Les données massives à Calcul Québec Marc Parizeau, professeur et directeur scientifique de Calcul Québec Plan Calcul Québec / Calcul Canada Les outils et les services disponibles Un outil en particulier

Plus en détail

Aspects théoriques et algorithmiques du calcul réparti L agglomération

Aspects théoriques et algorithmiques du calcul réparti L agglomération Aspects théoriques et algorithmiques du calcul réparti L agglomération Patrick CIARLET Enseignant-Chercheur UMA patrick.ciarlet@ensta-paristech.fr Françoise LAMOUR franc.lamour@gmail.com Aspects théoriques

Plus en détail

Conception et microprocesseurs

Conception et microprocesseurs Electronique embarquée Conception et microprocesseurs Richard Grisel Professeur des Universités Université de Rouen Conception et microprocesseurs Architectures et composants: Logiciel; Matériel. Test

Plus en détail

ParMat : Parallélisation pour la simulation des Matériaux.

ParMat : Parallélisation pour la simulation des Matériaux. : Parallélisation pour la simulation des Matériaux. G. Bencteux (EDF) 3 septembre 2008 Outline 1 2 Un algorithme d ordre N pour les calculs ab initio (DFT/HF) 3 Simulation du dommage d irradiation par

Plus en détail

Runtime. Gestion de la réactivité des communications réseau. François Trahay Runtime, LaBRI sous la direction d'alexandre Denis Université Bordeaux I

Runtime. Gestion de la réactivité des communications réseau. François Trahay Runtime, LaBRI sous la direction d'alexandre Denis Université Bordeaux I Runtime Gestion de la réactivité des communications réseau François Trahay Runtime, LaBRI sous la direction d'alexandre Denis Université Bordeaux I 1 Le calcul hautes performances La tendance actuelle

Plus en détail

Etude d Algorithmes Parallèles de Data Mining

Etude d Algorithmes Parallèles de Data Mining REPUBLIQUE TUNISIENNE MINISTERE DE L ENSEIGNEMENT SUPERIEUR, DE LA TECHNOLOGIE ET DE LA RECHERCHE SCIENTIFIQUE UNIVERSITE DE TUNIS ELMANAR FACULTE DES SCIENCES DE TUNIS DEPARTEMENT DES SCIENCES DE L INFORMATIQUE

Plus en détail

SYSTEMES ELECTRONIQUES SYSTEMES INFORMATIQUES. http://www-master.ufr-info-p6.jussieu.fr/lmd/specialite/sesi/

SYSTEMES ELECTRONIQUES SYSTEMES INFORMATIQUES. http://www-master.ufr-info-p6.jussieu.fr/lmd/specialite/sesi/ http://www-master.ufr-info-p6.jussieu.fr/lmd/specialite/sesi/ SYSTEMES ELECTRONIQUES & SYSTEMES INFORMATIQUES RESPONSABLES: Julien Denoulet: julien.denoulet@upmc.fr Jean-Lou Desbarbieux: jean-lou.desbarbieux@upmc.fr

Plus en détail

Tests de performance du matériel

Tests de performance du matériel 3 Tests de performance du matériel Après toute la théorie du dernier chapitre, vous vous demandez certainement quelles sont les performances réelles de votre propre système. En fait, il y a plusieurs raisons

Plus en détail

Practice HPC. Retour d expérience Xeon PHI. Février 2012. Damien DUBUC Expert HPC software. 28/03/2013 ANEO Tous droits réservés 1

Practice HPC. Retour d expérience Xeon PHI. Février 2012. Damien DUBUC Expert HPC software. 28/03/2013 ANEO Tous droits réservés 1 Retour d expérience Xeon PHI Damien DUBUC Expert HPC software Février 2012 28/03/2013 ANEO Tous droits réservés 1 Quel est notre rôle? Présenter o Gérer un portefeuille clients nécessitant des optimisations

Plus en détail

Portage de l architecture sécurisée CryptoPage sur un microprocesseur x86

Portage de l architecture sécurisée CryptoPage sur un microprocesseur x86 Portage de l architecture sécurisée CryptoPage sur un microprocesseur x86 Guillaume Duc Ronan Keryell Département Informatique École Nationale Supérieure des Télécommunications de Bretagne Symposium en

Plus en détail

Evaluation des performances de programmes parallèles haut niveau à base de squelettes

Evaluation des performances de programmes parallèles haut niveau à base de squelettes Evaluation des performances de programmes parallèles haut niveau à base de squelettes Enhancing the Performance Predictability of Grid Applications with Patterns and Process Algebras A. Benoit, M. Cole,

Plus en détail

RESUME DESCRIPTIF DE LA CERTIFICATION (FICHE OPERATIONNELLE METIERS)

RESUME DESCRIPTIF DE LA CERTIFICATION (FICHE OPERATIONNELLE METIERS) RESUME DESCRIPTIF DE LA CERTIFICATION (FICHE OPERATIONNELLE METIERS) Intitulé (cadre 1) DUT Génie électrique et informatique industrielle (GEII) 3 Parcours possibles : Automatismes et Réseaux Locaux Energies

Plus en détail

Chap. I : Architecture de base d un ordinateur

Chap. I : Architecture de base d un ordinateur UMR 7030 - Université Paris 13 - Institut Galilée Cours Architecture et Système Dans cette partie, nous décrivons rapidement l architecture de base d un ordinateur et les principes de son fonctionnement.

Plus en détail

HAUTE PERFORMANCE DE CALCUL

HAUTE PERFORMANCE DE CALCUL Journées d études 2010 Modélisation actif-passif & HAUTE PERFORMANCE DE CALCUL FRACTALES 0 Journées d études 2010 Sommaire Projet SIGMA 1 ère partie 1.! Le printemps des modèles Applications Haute Performance

Plus en détail

Algorithme de recherche locale pour la résolution d un problème réel de tournées d inventaires

Algorithme de recherche locale pour la résolution d un problème réel de tournées d inventaires Algorithme de recherche locale pour la résolution d un problème réel de tournées d inventaires Thierry Benoist Frédéric Gardi Antoine Jeanjean Bouygues e-lab, Paris { tbenoist, fgardi, ajeanjean }@bouygues.com

Plus en détail

Architecture des Ordinateurs. Partie II:

Architecture des Ordinateurs. Partie II: Architecture des Ordinateurs Partie II: Le port Floppy permet le raccordement du lecteur de disquette àla carte mère. Remarque: Le lecteur de disquette a disparu il y a plus de 6 ans, son port suivra.

Plus en détail

cluster pour l Enseignement Universitaire et la Recherche

cluster pour l Enseignement Universitaire et la Recherche cluster pour l Enseignement Universitaire et la Recherche Université de Nice Sophia-Antipolis 22 janvier 2013 Université de Nice Sophia-Antipolis cluster pour l Enseignement Universitaire et la Recherche

Plus en détail

Architecture des calculateurs

Architecture des calculateurs Chapitre 1 Architecture des calculateurs 1.1 Introduction Ce paragraphe n a pas la prétention de présenter un cours d informatique. D une manière générale, seuls les caractéristiques architecturales qui

Plus en détail

PORTABLE GAMING ULTRABLADE

PORTABLE GAMING ULTRABLADE Finesse et Performances Chipset Graphique GTX 760M, 21mm d épaisseur PORTABLE GAMING ULTRABLADE 01. Présentation Rapide Portable Gaming Ultrablade Epaisseur de 21mm seulement Le Portable Gamer 14» P34G

Plus en détail

Choisir le bon ordinateur. et la bonne imprimante en 2013. avec. Les prix bas, la confiance en plus

Choisir le bon ordinateur. et la bonne imprimante en 2013. avec. Les prix bas, la confiance en plus Choisir le bon ordinateur et la bonne imprimante en 2013 avec Les prix bas, la confiance en plus Comment bien choisir son laptop et son imprimante en 2013? Tour d horizon des nouveautés et des critères

Plus en détail

Évaluation des routages pour les réseaux haute-performance. 26 Novembre 2013 Matthieu Pérotin

Évaluation des routages pour les réseaux haute-performance. 26 Novembre 2013 Matthieu Pérotin Évaluation des routages pour les réseaux haute-performance 26 Novembre 2013 Matthieu Pérotin Plan Introduction Fabriques haute-performance Routage Évaluation hors-ligne Évaluation en-ligne Perspectives

Plus en détail

Vers une implantation générique validée expérimentalement des domaines abstraits?

Vers une implantation générique validée expérimentalement des domaines abstraits? Vers une implantation générique validée expérimentalement des domaines abstraits? Duong NGUYEN, CRI/ENSMP APRON - Kickoff Meeting Paris 28 Octobre 2004 Partie 1 Introduction 1 Contexte Analyse statique

Plus en détail

ADÉQUATION ALGORITHME-ARCHITECTURE APPLIQUÉE AUX CIRCUITS RECONFIGURABLES

ADÉQUATION ALGORITHME-ARCHITECTURE APPLIQUÉE AUX CIRCUITS RECONFIGURABLES ADÉQUATION ALGORITHME-ARCHITECTURE APPLIQUÉE AUX CIRCUITS RECONFIGURABLES AILTON F. DIAS, MOHAMED AKIL, CHRISTOPHE LAVARENNE, YVES SOREL CNEN/CDTN Divisão de Computação e Informação, CP 941-012-970 Belo

Plus en détail

Rétablissement d un réseau cellulaire après un désastre

Rétablissement d un réseau cellulaire après un désastre Rétablissement d un réseau cellulaire après un désastre Anaïs Vergne avec Laurent Decreusefond, Ian Flint, et Philippe Martins Journées MAS 2014 29 août 2014 Rétablissement d un réseau cellulaire après

Plus en détail

Big Graph Data Forum Teratec 2013

Big Graph Data Forum Teratec 2013 Big Graph Data Forum Teratec 2013 MFG Labs 35 rue de Châteaudun 75009 Paris, France www.mfglabs.com twitter: @mfg_labs Julien Laugel MFG Labs julien.laugel@mfglabs.com @roolio SOMMAIRE MFG Labs Contexte

Plus en détail

Optimisation multi-critère pour l allocation de ressources sur Clouds distribués avec prise en compte de l énergie

Optimisation multi-critère pour l allocation de ressources sur Clouds distribués avec prise en compte de l énergie Optimisation multi-critère pour l allocation de ressources sur Clouds distribués avec prise en compte de l énergie 1 Présenté par: Yacine KESSACI Encadrement : N. MELAB E-G. TALBI 31/05/2011 Plan 2 Motivation

Plus en détail

Structure de base d un ordinateur

Structure de base d un ordinateur Structure de base d un ordinateur 1-Définition de l ordinateur L ordinateur est un appareil électronique programmable qui traite automatiquement les informations. Il est constitué de l unité centrale et

Plus en détail

Les systèmes embarqués

Les systèmes embarqués Unité IFS (Interface) Les systèmes embarqués Architecture des systèmes à processeur Etienne Messerli Le 17 février 2015 p 1 Ordinateur Système UNIVERSEL de traitement de l'information "binaire" Utilisé

Plus en détail

Choisir le bon ordinateur. et la bonne imprimante en 2013. avec. Les prix bas, la confiance en plus

Choisir le bon ordinateur. et la bonne imprimante en 2013. avec. Les prix bas, la confiance en plus Choisir le bon ordinateur et la bonne imprimante en 2013 avec Les prix bas, la confiance en plus Comment bien choisir son laptop et son imprimante en 2013? Tour d horizon des nouveautés et des critères

Plus en détail

L ORDINATEUR. AUDIOVISUEL MULTIMEDIA Corrigé TD 1. BAC Pro SEN. L ORDINATEUR Page 1

L ORDINATEUR. AUDIOVISUEL MULTIMEDIA Corrigé TD 1. BAC Pro SEN. L ORDINATEUR Page 1 L ORDINATEUR 1 / Voici une liste de liens vers différents types de matériels. Pour chacun de ces matériels, vous devez déterminer : Le nom du matériel. Le type de matériel (unité centrale ou périphérique

Plus en détail