Exemple: le processeur MIPS

Documents pareils
Exécution des instructions machine

Tout savoir sur le matériel informatique

Fonctionnement et performance des processeurs

Systèmes et traitement parallèles

Initiation au HPC - Généralités

Rappels d architecture

Architecture des Ordinateurs. Partie II:

Matériel & Logiciels (Hardware & Software)

MODULE I1. Plan. Introduction. Introduction. Historique. Historique avant R&T 1ère année. Sylvain MERCHEZ

THEME 1 : L ORDINATEUR ET SON ENVIRONNEMENT. Objectifs

Informatique Industrielle Année Architecture des ordinateurs Note de cours T.Dumartin

Conception de circuits numériques et architecture des ordinateurs

Assembleur. Faculté I&C, André Maurer, Claude Petitpierre

1 Architecture du cœur ARM Cortex M3. Le cœur ARM Cortex M3 sera présenté en classe à partir des éléments suivants :

Architecture des calculateurs

Compilation (INF 564)

Tests de performance du matériel

Chapitre 4 : Les mémoires

Architecture des ordinateurs

Comme chaque ligne de cache a 1024 bits. Le nombre de lignes de cache contenu dans chaque ensemble est:

Mesure de performances. [Architecture des ordinateurs, Hennessy & Patterson, 1996]

Structure de base d un ordinateur

Hiérarchie matériel dans le monde informatique. Architecture d ordinateur : introduction. Hiérarchie matériel dans le monde informatique

TAI049 Utiliser la virtualisation en assistance et en dépannage informatique TABLE DES MATIERES

Partie 1. Professeur : Haouati Abdelali. CPGE Lycée Omar Ibn Lkhattab - Meknès haouaticpge@gmail.com

Introduction à l architecture des ordinateurs. Adrien Lebre Décembre 2007

Eléments d architecture des machines parallèles et distribuées

Architecture ordinateur. Organisation mémoire et Entrées/Sorties

Webinar ORACLE LE LICENSING ORACLE Quel type de licensing choisir?

ERP Service Negoce. Pré-requis CEGID Business version sur Plate-forme Windows. Mise à jour Novembre 2009

Cours Informatique 1. Monsieur SADOUNI Salheddine

ARCHITECTURE ET FONCTIONNEMENT

THÈSE. Pour obtenir le grade de. Spécialité : Informatique. Arrêté ministériel : 7 août Présentée et soutenue publiquement par.

Concept de machine virtuelle

Parallélisme et Répartition

Architecture des ordinateurs

Touch PC tébis: L écran tactile pour le montage encastré et en paroi creuse

Intel Corporation Nicolas Biguet Business Development Manager Intel France

Exigences système Commercial & Digital Printing

Virtualisation CITRIX, MICROSOFT, VMWARE OLIVIER D.

CM2 L architecture MIPS32

CUOMO PC Route d Oron Lausanne 021/

Communications performantes par passage de message entre machines virtuelles co-hébergées

Vers du matériel libre

Module M1 Elément 2 : Informatique 1 (I1)

Big Data. Cyril Amsellem Consultant avant-vente. 16 juin Talend

LA RECONNAISSANCE VOCALE INTEGREE

Structure et fonctionnement d'un ordinateur : hardware

Procédure d installation pour WinEUR PROCÉDURE D INSTALLATION POUR WINEUR. Copyright GIT SA 2015 Page 1/16

ASR1 TD7 : Un microprocesseur RISC 16 bits

Hubert & Bruno Lundi 12 octobre 2009 SAINT-QUENTIN (02)

WinReporter Guide de démarrage rapide. Version 4

Jeu d instructions NIOS II

Exigences système Edition & Imprimeries de labeur

GCOS 7 sur microprocesseur standard Diane Daniel POIRSON 14 octobre 2004 Matériels 64 / DPS 7 / DPS 7000 Architecture & Evolution - Daniel POIRSON 1

Configuration système requise pour les grandes et moyennes entreprises

Cours 3 : L'ordinateur

Pour obtenir le grade de. Arrêté ministériel : 7 août Sylvain Genevès

Worry-FreeTM. Business Security Éditions Standard et Advanced. Administrator s Guide. Configuration minimale requise

INF6500 : Structures des ordinateurs. Sylvain Martel - INF6500 1

Partie 7 : Gestion de la mémoire

Leçon 1 : Les principaux composants d un ordinateur

Traduction binaire dynamique de l extension SIMD Néon de l ARMv7 dans Qemu

On distingue deux grandes catégories de mémoires : mémoire centrale (appelée également mémoire interne)

La mémoire. Un ordinateur. L'octet. Le bit

Potentiels de la technologie FPGA dans la conception des systèmes. Avantages des FPGAs pour la conception de systèmes optimisés

Architecture des Ordinateurs Première partie. Licence d Informatique - IUP Miage - FIIFO

DU BINAIRE AU MICROPROCESSEUR - D ANGELIS CIRCUITS CONFIGURABLES NOTION DE PROGRAMMATION

Histoire de l Informatique

FICHE PRODUIT 360 SPEECHMAGIC SDK

Base de l'informatique. Généralité et Architecture Le système d'exploitation Les logiciels Le réseau et l'extérieur (WEB)

Printer Administration Utility 4.2

Requis techniques EMu. Document Version 3 EMu version 4.3

Solutions de gestion de la sécurité Livre blanc

Configuration système requise. pour les grandes et moyennes entreprises

ELP 304 : Électronique Numérique. Cours 1 Introduction

ORACLE EXADATA DATABASE MACHINE X2-8

StruxureWare Power Monitoring v7.0. La nouvelle génération en matière de logiciel de gestion complète d énergie

Protection de l Investissement Virtualisation, Efficacité énergétique

Qu est ce qu un un serveur?

Les offres exclusives Belgacom ICT Agent

ORACLE EXADATA DATABASE MACHINE X2-2

Prérequis techniques pour l installation du logiciel Back-office de gestion commerciale WIN GSM en version ORACLE

Electron S.R.L. SERIE B46 - SYSTEMES DIDACTIQUES DE TELEPHONIE

Sanity Check. bgcolor mgcolor fgcolor

Choix d'un serveur. Choix 1 : HP ProLiant DL380 G7 Base - Xeon E GHz

Sommaire. Systèmes d Exploitation Intégration Sage 100 Sage CRM Disponibilité Client Bases de données... 3

Prentice Hall, 2011 (ISBN )

Spécifications du logiciel. Mise à jour : 24 février 2011 Nombre total de pages : 7

Sur un ordinateur portable ou un All-in-One tactile, la plupart des éléments mentionnés précédemment sont regroupés. 10) 11)

Le Network File System de Sun (NFS)

Evaluation des performances de programmes parallèles haut niveau à base de squelettes

Fax sur IP. Panorama

Une méthode de conception de systèmes sur puce

Protection des données avec les solutions de stockage NETGEAR

Document de formation pour une solution complète d automatisation Totally Integrated Automation (T I A)

Editeur de solutions innovantes C 3. Solution globale managée de communication et de téléphonie sur IP

Manuel d utilisation Logiciel (Communications Utility)

Le Programme SYGADE SYGADE 5.2. Besoins en équipement, logiciels et formation. UNCTAD/GID/DMFAS/Misc.6/Rev.7

Guide de l administrateur système ABBYY. Recognition Server 2.0

Transcription:

Exécution des instructions machine Exemple: le processeur MIPS add a, b, c a = b + c type d'opération (mnémonique) destination du résultat lw a, addr opérandes sources a = mem[addr] adresse (donnée, instruction suivante) j addr goto addr Page 2

Le processeur MIPS possède 32 registres Les opérations arithmétiques et logiques se font toujours entre registres Les seules instructions qui utilisent la mémoire comme opérande sont lw (load) et sw (store) La façon de donner l'adresse d'un opérande est appelée le mode d'adressage. Le processeur MIPS connaît cinq modes d'adressage: registre immédiat direct ou absolu indirect déplacement ou relatif Page 3 Exemples des modes d'adressage: registre: add $s0,$s1,$s2 immédiat: add $s0,$s1,123 direct ou absolu: add $s0,$s1,(1234) indirect: add $s0,$s1,($s2) déplacement ou relatif: add $s0,$s1,123($s2) s0=s1+s2 s0=s1+123 s0=s1+mem[1234] s0=s1+mem[s2] s0=s1+mem[s2+123] Page 4

Repertoire d'instructions Instructions arithmétiques et logiques Page 5 Instructions de comparaison Page 6

Instructions de saut conditionnel Page 7 Instructions de saut inconditionnel Page 8

Instructions d'accès à la mémoire Page 9 Registres Page 10

Exécution temporelle des instructions Toute instruction d'un processeur est exécutée en trois phases: fetch: lecture de l'instruction en mémoire, à l'adresse donnée par le PC. L'instruction est stockée dans le registre IR decode: identification de l'instruction execute: exécution des opérations nécessaires à l'instruction En général, l'exécution de chaque phase de l'instruction demande au moins un cycle d'horloge. La phase execute peut demander plus d'un cycle, en fonction de la complexité de l'instruction: si une instruction de déplacement peut se faire en un seul cycle, une instruction de division a besoin de plusieurs dizaines de cycles Page 11 Les vitesses d'horloge des processeurs actuels vont de plusieurs mégahertz (MHz) à plusieurs gigahertz (GHz) pour les plus récents Il n'y a pas beaucoup de sens à comparer les performances de deux processeurs en comparant seulement les vitesses d'horloge. En effet, pour des familles différentes, la quantité de travail effectuée en un cycle peut être très différente. Il est plus réaliste de mesurer la performance en comparant les temps d'exécution pour un même programme. Les programmes utilisés pour effectuer ces mesures sont appelés benchmarks L'ensemble de benchmarks le plus utilisé commercialement est le SPEC (Standard Performance Evaluation Corporation) Page 12

Une augmentation de performance sans augmentation de la vitesse d'horloge est obtenue grâce au pipeline Dans un processeur sans pipeline, l'exécution d'une instruction ne commence pas avant la fin d'exécution de l'instruction précédente t t+1 t+2 t+3 t+4 t+5 i i+1 FE DE EX FE DE EX Page 13 Dans un processeur à pipeline, à la fin de chaque phase démarre l'exécution d'une nouvelle instruction t t+1 t+2 t+3 t+4 t+5 i i+1 i+2 i+3 FE DE EX FE DE EX FE DE EX FE DE EX Page 14

Le pipeline peut être vu comme un premier pas vers le parallélisme. Toutefois, le vrai parallélisme est atteint seulement avec plus d'une unité de traitement Les processeurs superscalaires peuvent chercher plusieurs instructions à la fois, exécutées en parallèle par plusieurs unités de traitement Dans les systèmes multiprocesseurs, plusieurs séquences d'instructions sont exécutées en parallèle sur différents ensembles de données: c'est les architectures MIMD (multiple-instruction stream, multiple-data stream) appelées ainsi par opposition aux traditionnelles SISD (single-instruction stream, single-data stream) Un autre type de parallélisme est obtenu avec l'architecture SIMD (single-instruction stream, multiple-data stream), où plusieurs unités de traitement exécutent en parallèle la même séquence d'instructions, mais chacune sur son propre ensemble de données Page 15 Processeurs actuels (28.08.06) Alpha 21364 EV-78+ IBM Power5+ Sun UltraSPARC IV+ Fujitsu SPARC64 V HP PA-8900 MIPS R16000 Architecture 64-bit 2x64-bit 2x64-bit 64-bit 2x64-bit 64-bit Fréquence (GHz) 1.3 2.3 1.8 2.16 1.1 0.7 Superscalaire 4 8 4 4 4 4 Pipeline 9 17 14 10 9 6 Désordre (instr) 80 200 0 112 56 48 Technologie 0.18-7 0.09-10 0.09-9 0.09-10 0.13-7 0.11-7 Taille (mm 2 ) 397 245 335 294 304 110 Transistors (M) 135 276 295 400 300 7.2 Consommation (W) 155 100 90 65 103 17 Cache (I/D/L2) 64K/64K/1.75M 64K/32K/1.92M 64K/64K/2M 128K/128K/4M 1.5M/1.5M/64M 32K/32K SPECint2000b 904 1820 1300 1501 950 560 SPECfp2000b 1279 3369 1800 2094 930 580 Page 16

Intel Xeon 5160 Intel Pentium 965 AMD Opteron 256 AMD Opteron 285 Itanium 2 9050 Architecture 2x32/64-bit 2x32/64-bit 32/64-bit 2x32/64-bit 2x64-bit Fréquence (GHz) 3.03 3.73 3 2.6 1.6 Superscalaire 4 3 3 3 6 Pipeline 14 31 11 11 8 Désordre (instr) 96 126 72 72 0 Technologie 0.065-8 0.065-8 0.09-10 0.09-9 0.09-7 Taille (mm 2 ) 143 162 115 199 596 Transistors (M) 291 376 114 233 1.72K Consommation (W) 80 130 95 95 104 Cache (I/D/L2/L3) 32K/32K/4M 12K/16K/2M 64K/64K/1M 64K/64K/1M 16K/16K/1M/12M SPECint2000b 1556 1870 1942 1592 1474 SPECfp2000b 1694 2232 2260 1927 3017 Page 17 Systèmes embarqués Page 18

Page 19 Page 20

Communication La communication entre le processeur et les dispositifs d'entrée/sortie se fait normalement par le biais d'un dispositif appelé un contrôleur Le contrôleur réalise la conversion des messages entre le processeur et le périphérique, afin de respecter les formats propres à chaque dispositif périphérique contrôleur CPU bus mémoire Page 21 La communication entre le processeur et le contrôleur se fait de la même manière qu'avec la mémoire: une instruction similaire au STORE envoie une chaîne de bits au contrôleur et une instruction similaire au LOAD envoie une chaîne de bits au processeur Chaque contrôleur possède un ensemble d'adresses réservées, appelées ports Certains contrôleurs peuvent accéder directement à la mémoire, sans passer par le processeur: ce type d'accès est appelé DMA (Direct Memory Access) Par exemple, pour lire un secteur d'un disque, le processeur peut envoyer une demande au contrôleur, qui se charge de la tâche pendant que le processeur exécute d'autres opérations Page 22

La communication avec un périphérique est en général à double sens. Un processeur, par exemple, produit des données beaucoup plus rapidement qu'une imprimante n'est capable de les traiter: afin de ne pas perdre des données, il est donc important pour le processeur de connaître l'état de l'imprimante avant chaque envoi Le dialogue entre le périphérique et le processeur, via le contrôleur, utilise un mot de status, généré par le périphérique et stocké dans le contrôleur Page 23 La vitesse de transmission de l'information est mesurée en bits par seconde (bps) Il y a deux grands types de trajectoires de communication: la parallèle et la sérielle. Dans la communication parallèle, plusieurs bits sont transférés en même temps, chacun sur une ligne séparée Dans la communication sérielle, on transfère un seul bit à la fois. Cette technique est plus lente, mais demande une implémentation plus simple (donc, moins chère) Un exemple bien connu de communication sérielle est l'utilisation des modems (modulateur-démodulateur) pour transférer de l'information via des lignes téléphoniques. Les chaînes de bits sont d'abord transformées en tonalités pour être transférées par la ligne téléphonique et, ensuite, à leur destination, ces tonalités sont de nouveau transformées en chaînes de bits Page 24