Doctorante: Junyan TAN Directeur: Frédéric ROUSSEAU (TIMA Grenoble) Co-directrice: Virginie FRESSE (LaHC Saint Etienne)



Documents pareils
Architecture des ordinateurs

Vers du matériel libre

PROGRAMME DU CONCOURS DE RÉDACTEUR INFORMATICIEN

Architecture des calculateurs

Hiérarchie matériel dans le monde informatique. Architecture d ordinateur : introduction. Hiérarchie matériel dans le monde informatique

Fiche technique CPU 315SN/PN (315-4PN33)

Initiation au HPC - Généralités

Séminaire RGE REIMS 17 février 2011

Thème 3 Conception et vérification d architectures de systèmes sur puce

Choix d'un serveur. Choix 1 : HP ProLiant DL380 G7 Base - Xeon E GHz

Conception et Intégration de Systèmes Critiques

Systèmes et traitement parallèles

Potentiels de la technologie FPGA dans la conception des systèmes. Avantages des FPGAs pour la conception de systèmes optimisés

Quoi de neuf en contrôle/commande et systèmes embarqués (RIO, WSN...)?

Choisir le bon ordinateur. et la bonne imprimante en avec. Les prix bas, la confiance en plus

Evolution de l infrastructure transport

NOTIONS DE RESEAUX INFORMATIQUES

Les tablettes. Présentation tablettes Descriptif Fournisseurs Caractéristiques Comparatifs Conseils Perspectives Démonstration

Liste de prix PC Portables SAMSUNG Mars 2011 v1.1

Plan du Travail. 2014/2015 Cours TIC - 1ère année MI 30

Les réseaux de campus. F. Nolot

*Offre limitée au stock disponible - Prix affichés basés sur une TVA française de 19.6%.

Cours des réseaux Informatiques ( )

TEMPÉRATURE DE SURFACE D'UNE ÉTOILE

Options indispensables, fortement conseillées pour démarrer sans soucis

Procédures de tests en réflectométrie. Septembre 2013

Eternelle question, mais attention aux arnaques Question qui est souvent mise en premier plan => ce n est pas une bonne idée

Comme chaque ligne de cache a 1024 bits. Le nombre de lignes de cache contenu dans chaque ensemble est:

Application à l astrophysique ACTIVITE

Service de VPN de niveau 3 sur RENATER (L3VPN MPLS)

Architecture des Ordinateurs. Partie II:

Téléinformatique et télématique. Revenons aux définitions

Travaux pratiques : collecte et analyse de données NetFlow

Modélisation de la Reconfiguration Dynamique appliquée à un décodeur LDPC Non Binaire

GPA770 Microélectronique appliquée Exercices série A

Segmentation d'images à l'aide d'agents sociaux : applications GPU

«SESSION 2009» RESEAUX DE TELECOMMUNICATIONS ET EQUIPEMENTS ASSOCIES. Durée : 2 h 00 (Coef. 3)

Infrastructures Parallèles de Calcul

Chapitre VII : Principes des réseaux. Structure des réseaux Types de réseaux La communication Les protocoles de communication

Protection de l Investissement Virtualisation, Efficacité énergétique

PROGRAMME DETAILLE. Parcours en première année en apprentissage. Travail personnel CC + ET réseaux

escan Entreprise Edititon Specialist Computer Distribution

2. DIFFÉRENTS TYPES DE RÉSEAUX

Train & Métro. Solutions de communication WiFi durcies pour applications ferroviaires au sol et en embarqué

Sur un ordinateur portable ou un All-in-One tactile, la plupart des éléments mentionnés précédemment sont regroupés. 10) 11)

Symphony. Procédures d installation : Mise à jour vers une version plus récente

Creation de Contenus Numériques pour

MICROSENS. Module Bridge Ethernet / Fast Ethernet. fiber optic solutions. Description. Construction

Les Réseaux sans fils : IEEE F. Nolot

2. Couche physique (Couche 1 OSI et TCP/IP)

Groupe Eyrolles, 2000, 2004, ISBN :

Fiche technique CPU 314SC/DPM (314-6CG13)

ROUTEURS CISCO, PERFECTIONNEMENT

Microsoft Virtual Server, trucs et astuces avancés

Dossier table tactile - 11/04/2010

WinReporter Guide de démarrage rapide. Version 4

Spectrophotomètres. Spectrophotomètres modèle Les spectrophotomètres Série 67 : 3 modèles uniques

LA COUCHE PHYSIQUE EST LA COUCHE par laquelle l information est effectivemnt transmise.

Limitations of the Playstation 3 for High Performance Cluster Computing

Robot WIFIBOT Lab V3. 4 roues motrices

Nicolas ZERBIB CORNING

TP 2: LES SPECTRES, MESSAGES DE LA LUMIERE

NFC EMV MODÈLE : TABLETTE ELO PRIX DE LISTE DE BASE (USD) : $

A. Elmrabti. To cite this version: HAL Id: tel

Module : Virtualisation à l aide du rôle Hyper-V

Introduction. Adresses

Travaux pratiques : configuration de la traduction d adresses de port (PAT)

Métriques de performance pour les algorithmes et programmes parallèles

Matrice HP Autonomie des PC Portables Grand Public

Journée Utiliateurs Nouvelles du Pôle ID (Informatique) Pierre Neyron, LIG/CNRS

THÈSE DEVANT L UNIVERSITÉ DE RENNES 1

Retour d expérience en Astrophysique : utilisation du Cloud IaaS pour le traitement de données des missions spatiales

Boîte à outils OfficeScan

Chapitre 02. La lumière des étoiles. Exercices :

TD : Codage des images

Parallélisme et Répartition

Architecture matérielle des systèmes informatiques

Console de supervision en temps réel du réseau de capteurs sans fil Beanair

Mise en pratique : Etude de spectres

Réseaux grande distance

DEVIS MATERIEL INFORMATIQUE MAIRIE DE CAZERES

Découvrez les Nouveautés Février 2010 du Catalogue PC Pack PRO

Système d'impression multifonction numérique couleur grand format RICOH. Copieur Imprimante Scanner RICOH MP CW2200SP. N&B 3,4 ppm Couleur 1,1 ppm

Implémentation Matérielle des Services d un RTOS sur Circuit Reconfigurable

Robot WIFIBOT Lab V4. Lab V4.

Chapitre 4 : Les mémoires

Intel Corporation Nicolas Biguet Business Development Manager Intel France

Chapitre 1 Le routage statique

PRESENTATION AT270 JUILLET 2012

Une méthode de conception de systèmes sur puce

MODULE I1. Plan. Introduction. Introduction. Historique. Historique avant R&T 1ère année. Sylvain MERCHEZ

Achats ordinateurs avec liste des prix 3 ème trimestre Optiplex 780 DT (Bureau)

SIGAMM/CRIMSON COMMISSION UTILISATEUR du 05/12/2014

Modélisation et simulation des performances de nœuds de routage optique dans les réseaux dorsaux hybrides

Technicien Supérieur de Support en Informatique

RESEAUX TCP/IP: NOTIONS AVANCEES. Preparé par Alberto EscuderoPascual

TAI049 Utiliser la virtualisation en assistance et en dépannage informatique TABLE DES MATIERES

JKW-IP. Mettez votre intercom vidéo en ligne.

Logiciel d administration réseau ProSAFE. En résumé NMS300

Transcription:

Vers une architecture NoC pour l application d imagerie multi spectrale Doctorante: Junyan TAN Directeur: Frédéric OUSSEAU (TIMA Grenoble) Co-directrice: Virginie FESSE (LaHC Saint Etienne) Allocation de recherche égion hône Alpes 1

1. Imagerie multi spectrale : application à l authentification 1.1 Images monochromes, couleurs, multi spectrales Imagerie monochrome (ou niveau de gris) : une seule bande spectrale. Imagerie couleur : trois images spectrales rouge, verte et bleu qui constituent les trois composantes de l image couleur. Imagerie multi spectrale : multi-composantes, plusieurs images spectrales chacune correspondant à une bande spectrale. Du monochrome au multi spectral 2

1. Imagerie multi spectrale : application à l authentification 1.2 Pourquoi l imagerie multi spectrale Permet une définition plus précise de la lumière acquise et un accès à des caractéristiques non visibles à l œil nu. L ajout de bandes spectrales permet donc d augmenter le pouvoir discriminant des données acquises. Discrimination de feuilles : image couleur des deux feuilles(a), spectre moyen de chaque feuille (b), images spectrales à 550nm (c), à 775nm (d). 3

1. Imagerie multi spectrale : application à l authentification 1.3 Applications d imagerie multi spectrale Applications d imagerie multi spectrale dans différents dffé domaines : econnaissance et authentification (œuvres d art, aérienne, timbre poste ) Détection (mines, défauts dans les matériaux aéronautiques ) Imagerie satellitaire (mesures des flux de chaleur, observation des types de la terre, de l espace ) Biologie og et médical (végétale, cellulaire, e, immunohistochimie, cancérologie ) Images spectrales avec 13 longueurs d ondes pour l authentification de Mona Lisa Images reconstruites de la Voie Lactée en différentes bandes spectrales. 4

1. Imagerie Multi spectrale : application à l authentification 1.4 Authentification d œuvres d art 5

2. Positionnement du problème Difficultés : Complexité des calculs Quantité de données élevée pour calcul et mémorisation L image est un ensemble de milliers de fenêtres. L image est acquise en milliers de longueurs d onde par la caméra multispectrale. Algorithme dynamique Différents algorithmes GFC MS exécutés en fonction WMS de la forme des spectres Mv Contraintes de temps fortement variables en fonction de l expérimentation. Spécifications des caméras multi-spectrales Marque éférence Nb de CCD Longueur d'onde(nm) Vitesse d acquisition Taille de donnée FluxData FD-1665 3 400-1000 15 fps 8, 16, 24 bit Quest innovations Condor-1000 MS-5 5 400-1000 150 fps 8 ou 10 bits/pixel 6

Sommaire 1. Algorithme imagerie multi spectrale 1.1 Images monochromes, couleurs, multi spectrales 1.2 Pourquoi l imagerie multi-spectrale 1.3 Applications d imagerie multi spectrale 1.4 Authentification d œuvres d art 2. Positionnement du problème 3. Implantation d algorithmes sur CPU et GPU 3.1 Implantation sur CPU 3.2 Implantation sur GPU 3.3 Conclusion 4. Vers une architecture autour d un NoC (Network On Chip) 4.1 Architecture de NoC 4.2 NoCs sur FPGA actuels 4.3 NoC HEMES 5. Implantation de NoC sur multi FPGA 5.1 Spécifications d implantation multi FPGA 5.2 Méthode d implantation 5.3 Implantation NoC Hermes sur multi FPGA 6. Conclusion et perspectives 7

3. Implantation d algorithmes sur CPU et GPU Les spécifications choisies pour notre application de reconnaissance et d authentification d œuvres d art : Nombre de régions par longueur d onde = 2 000 Nombre de longueurs d onde = 992 Taille de la fenêtre (pour calculer la moyenne) = 64x64 pixels Taille de pixel = 16 bits 3.1 Implantation sur CPU Les spécifications du CPU utilisé sont les suivantes : AMD Athlon64x2 Dual Core Processeur 4800+ 2,5GHz, 2,00G de AM Total Moyenne (64x64) Accès aux fichiers (lectureet écriture) Distance multi spectrale Temps d exécution (sec) 5.654 0.234 5.42 0.05 Temps d exécution sur un processeur (pour une région) soit 3 heures (3 heures 8minutes 24secondes) pour les 2000 régions. 8

3. Implantation d algorithmes sur CPU et GPU 3.1 Implantation sur GPU GPU : des microprocesseurs présents sur les cartes graphiques au sein d un ordinateur ou d une console de jeux vidéo. GTX280 Nvidia Geforce Possède 30 multiprocesseurs (MP) Chaque multiprocesseur intègre 8 processeurs (parallélisme de données dans un MP) Programmation en langage C standard (CUDA) Une mémoire 2D cache de texture en lecture pour chaque couple de multiprocesseurs Grande bande passante mémoire Calculs en virgule flottante 9

3. Implantation d algorithmes sur CPU et GPU Les spécifications choisies pour notre application de reconnaissance et d authentification d œuvre d art : Nombre de régions par longueur d onde donde = 2 000. Nombre de longueurs d onde = 992 (choisi à partir de l architecture du GPU). Tailles de la fenêtre (pour calculer la moyenne) = 1x1, 2x2, 4x4, 8x8, 16x16, 32x32, 64x64. Till Taille de pixel = 16 bits 3.2 Implantation sur GPU La plateforme de GPU utilisée dans notre cas est GTX280 Nvidia Geforce. Les spécifications éifi sont tles suivantes : 240 processeurs Horloge 576MHz 1GB DD3 mémoire partagée Le temps total d exécution pour les 2000 régions et des fenêtres 64x64 est de 4 minutes 42 secondes. Temps d exécution sur une région 10

3. Implantation d algorithmes sur CPU et GPU 3.2 Implantation sur GPU Difficultés: Adapter code C à CUDA Paralléliser 992 calculs de longueurs donde d onde sur 32 processeurs, chaque processeur exécutant la même tâche. Organisation des mémoires pour stocker les données à traiter. Code non-dynamique pour les changements de paramètres des différentes applications d imagerie multi spectrale. Portage du code (450 lignes) en 2 heures 30. 11

3. Implantation d algorithmes sur CPU et GPU 3.3 Conclusion Architectures t CPU et GPU ne conviennent pas : Aux contraintes temps réel spécifiées. Aux caractéristiques variables des caméras multispectrales. Aux besoins de mémorisation des données. A la faible consommation. A la portabilité et limitation des E/S pour garantir le processus d authentification. A la variabilité de l algorithme. D où la proposition p d une architecture dédiée sur FPGA pour l implantation de l algorithme d imagerie multi spectrale. 12

4. Vers une architecture autour d un NoC Architecture contenant des processeurs, des blocs IP, des composants de mémorisations, des interfaces E/S. Tous ces blocs sont connectés via une architecture de communication de type NoC. 4.1 Architecture de NoC (Network On Chip) Les Network Interface (NI, Interface réseau) ou Network Adapter (NA, adaptateur réseau) Les routeurs Les liens qui relient les routeurs entre eux ou les routeurs aux NI Les unités de traitement /Mémoire Les NoCs permettent une extensibilité et flexibilité de l architecture, une variabilité des données transférées à haut débit. 13

4. Vers une architecture autour d un NoC 4.2 NoCs sur FPGA actuels NoC Topologie Mode de communication Algorithme de routage XY HEMES 2D maillée Packet switching/wormhole h (déterministe, i t partiellement t adaptif) NoC de l IMEC 2D tore Packet switching/wormhole XY (déterministe) SOCIN/ASoC 2D maillée ou torus Packet switching/wormhole XY (déterministe) HIBI Bus hiérarchique Circuit switching, Packet switching/wormhole Algorithme de type déterministe PNoC custom Circuit switching Algorithme de type déterministe MBoC 1D, 2D maillée Circuit switching Algorithme de type déterministe Extended Mesh 2D maillée étendue Packet switching/wormhole Algorithme de type déterministe Lee H,G custom, point à point Packet switching Algorithme de type déterministe Le NoC Hermes est utilisé comme architecture de communication pour l application. La famille de FPGA choisie est XILINX. 14

4. Vers une architecture autour d un NoC 4.3 NoC Hermes Nom : Hermès Origine : Faculté d informatique PUCS, Porto Alegre, Brésil Topologie : 2D-maillée Acheminement des données : Packet Switching / Wormhole Algorithme de routage : Algorithme XY NoC hermes 3x3 15

4. Vers une architecture autour d un NoC 4.3 Implantation du NoC Hermes sur FPGA Taille de NoC hermes limitée à 6x6 sans blocs IP sur carte FPGA Xilinx Virtex-5: nécessité d utiliser une plateforme multi FPGA pour notre application 16

5. Implantation de NoC sur multi FPGA 5.1 Spécifications d implantation multi FPGA FPGA FPGA Découpage de l architecture et répartition sur plusieurs FPGA Intégration de liens d interconnexion pour la communication inter FPGA Abdellah-Medjadji Kouadri-Mostéfaoui, Benaoumeur Senouci, Frédéric Pétrot Scalable Multi-FPGA Platform for Networks-On-Chip Emulation ASAP'07 17

5. Implantation de NoC sur multi FPGA 52Méthoded implantation 5.2 d Découpage de l architecture et répartition sur plusieurs FPGA Plusieurs solutions de partitionnements existent. Séparation des unités de traitement et du réseau. Solution inadaptée (NoC 6x6 sur Virtex 5: 2450 IOBs ) Découpage du réseau sur multi FPGA. Solution choisie Intégration de liens d interconnexion pour la communication inter FPGA Plusieurs types d interconnexion se présentent : série, parallèle, La solution choisie => liaison série très haut débit (ocketio) 18

5. Implantation de NoC sur multi FPGA 5.2 Méthode d implantation Interface ocketio ocketio transceivers : une interface de communication série présentée par la famille de FPGA Xilinx. Deux sous-réseaux : PMA (Physical Media Attachment) PCA (Physical Coding Sub Layer) 19

5. Implantation de NoC sur multi FPGA 5.3 Implantation NoC Hermes sur multi FPGA FPGA Xilinx Virtex-5 platform ML506 possède deux ports ocketio (Aurora) Cas 1: Nombre de liens entre routeurs coupé <= Nombre de Aurora 1 lien = 1 ocket IO Aurora Aurora Aurora Aurora La génération automatique de l architecture consiste à remplacer le lien entre les deux routeurs par le bloc IP d aurora + adaptateur1. 20

5.Implantation de NoC sur multi FPGA 5.3 Implantation NoC Hermes sur multi FPGA Cas 2: Nombre de liens entre routeurs coupé > Nombre de Aurora Multiplexage des routeurs vers un ocket IO. Adapta ateur Auror ra Auror ra Adapta teur Adaptate eur Aurora Aurora Adaptate eur Génération automatique de l architecture consiste à remplacer le lien entre les deux routeurs par le bloc IP d aurora + adaptateur2 (intégrant multiplexeur dédié, FIFOs, démultiplexeur ). 21

6. Conclusion et perspectives Les applications d imagerie multi spectrales sont des applications dynamiques traitant une quantité importante de données qu il est nécessaire d organiser pour répondre à des contraintes temps réel. Les plateformes GPU et CPU ne correspondent pas à nos besoins, d où doù la nécessité de proposer des plateformes de prototypage multi-fpga. Ces plateformes sont basées sur des architectures NoC pour la communication des données intra FPGA et des ocketio pour la communication inter-fpga. Les NoCs actuels implantés sur FPGA ne satisfont pas à nos besoins, la génération automatique du NoC nécessitera des adaptations (ID sources ) 22