Séminaire RGE REIMS 17 février 2011



Documents pareils
Potentiels de la technologie FPGA dans la conception des systèmes. Avantages des FPGAs pour la conception de systèmes optimisés

Architecture des ordinateurs

Introduction au pricing d option en finance

Quoi de neuf en contrôle/commande et systèmes embarqués (RIO, WSN...)?

Initiation au HPC - Généralités

Implémentation Matérielle des Services d un RTOS sur Circuit Reconfigurable

Hiérarchie matériel dans le monde informatique. Architecture d ordinateur : introduction. Hiérarchie matériel dans le monde informatique

MATHS FINANCIERES. Projet OMEGA

TP1 Méthodes de Monte Carlo et techniques de réduction de variance, application au pricing d options

Vidyo : une maquette pour la visioconférence sur le poste de travail

Probabilités III Introduction à l évaluation d options

Architecture des calculateurs

Info0804. Cours 6. Optimisation combinatoire : Applications et compléments

Vers du matériel libre

Robot WIFIBOT Lab V3. 4 roues motrices

Architecture des Ordinateurs. Partie II:

2015 // des formations. programme. Retrouvez toutes ces informations sur enseirb-matmeca.bordeaux-inp.fr

Règles et paramètres d'exploitation de Caparmor 2 au 11/12/2009. Pôle de Calcul Intensif pour la mer, 11 Decembre 2009

Débouchés professionnels

un nouvel œil pour l analyse de mouvement

Segmentation d'images à l'aide d'agents sociaux : applications GPU

Conception et Intégration de Systèmes Critiques

CAHIER DES CHARGES D IMPLANTATION

RPVA. le cloud privé dédié aux avocats. le plus grand réseau VPN certifié Technologie française

Contrôle Non Destructif : Implantation d'algorithmes sur GPU et multi-coeurs. Gilles Rougeron CEA/LIST Département Imagerie Simulation et Contrôle

Mesure de performances. [Architecture des ordinateurs, Hennessy & Patterson, 1996]

Développez votre e-commerce avec WebSphere Commerce

COLLEGE ADRIEN CERNEAU

Conférence sur les microcontroleurs.

Notions d IPMI et retour. Ecole d électronique numérique Fréjus 28 novembre 2012 Nicolas LETENDRE

Théorie Financière 8 P. rod i u t its dé dérivés

Infrastructures Parallèles de Calcul


Modélisation des interfaces matériel/logiciel

Sur un ordinateur portable ou un All-in-One tactile, la plupart des éléments mentionnés précédemment sont regroupés. 10) 11)

THÈSE DEVANT L UNIVERSITÉ DE RENNES 1

Les systèmes embarqués Introduction. Richard Grisel Professeur des Universités Université de Rouen Nacer Abouchi Professeur ESCPE Lyon

ADÉQUATION ALGORITHME-ARCHITECTURE APPLIQUÉE AUX CIRCUITS RECONFIGURABLES

Exécution des instructions machine

Quantification d incertitude et Tendances en HPC

Retour sur les déploiements eduroam et Fédération Éducation/Recherche

NOTIONS DE RESEAUX INFORMATIQUES

Haka : un langage orienté réseaux et sécurité

Rapport 2014 et demande pour Portage de Méso-NH sur Machines Massivement Parallèles du GENCI Projet 2015 : GENCI GEN1605 & CALMIP-P0121

Cours 3 : L'ordinateur

MAC-TC: programmation d un plate forme DSP-FPGA

Big Data. Cyril Amsellem Consultant avant-vente. 16 juin Talend

Options et Volatilité (introduction)

HP 600PD TWR i G 4.0G 39 PC

Des solutions J2EE open source professionnelles adaptées à votre système d information d entreprise

On distingue deux grandes catégories de mémoires : mémoire centrale (appelée également mémoire interne)

Spécifications détaillées

En disposant d un outil simple, rapide à déployer, diminuant les tâches redondantes

UNIVERSITE HASSAN II DE CASABLANCA. FACULTE DES SCIENCES & TECHNIQUES MOHAMMEDIA Département Génie Electrique

Ordinateur portable Latitude E5410

Thème 3 Conception et vérification d architectures de systèmes sur puce

Introduction à l Informatique licence 1 ère année Notes de Cours

Tests de performance du matériel

Rapport d activité. Mathieu Souchaud Juin 2007

MATHÉMATIQUES ET APPLICATIONS

Spécifications Techniques Générales. Techno Pole Internet. Lycée Djignabo / Ziguinchor

Choix d'un serveur. Choix 1 : HP ProLiant DL380 G7 Base - Xeon E GHz

ASR1 TD7 : Un microprocesseur RISC 16 bits

ViSaGe. Virtualisation du Stockage dans les Grilles. Informatiques. RenPar 16, 6-8 Avril 2005 Thiebolt François

Quantification des Risques

PFE. Gestion de portefeuille électronique par carte à puce. Equipe N 16 Projet N 98. «Sujet non industriel proposé par les élèves»

Chapitre 4 : Les mémoires

Creation de Contenus Numériques pour

Mon Sommaire. INEO.VPdfdf. Sécurisations des accès nomades

Communications performantes par passage de message entre machines virtuelles co-hébergées

QUESTIONS D ENTRETIENS EN FINANCE DE MARCHE

PRESENTATION RESSOURCES. Christian Dupaty BTS Systèmes Numériques Lycée Fourcade Gardanne Académie d Aix Marseille

CORBA haute performance

Grid 5000 : Administration d une infrastructure distribuée et développement d outils de déploiement et d isolation réseau

Introduction à l architecture des ordinateurs. Adrien Lebre Décembre 2007

Conception de circuits numériques et architecture des ordinateurs

GPA770 Microélectronique appliquée Exercices série A

11 Février 2014 Paris nidays.fr. france.ni.com

INGENIERIE DES SYSTEMES INFORMATIQUES - PARCOURS : MOBILITE ET CLOUD COMPUTING

Fastilog, votre outil de gestion des activités du personnel

La copie sur support papier à usage privé est autorisée conformément à l article L122-5 du Code de la Propriété Intellectuelle.

Migration d un serveur Windows Server 2008 vers un serveur Windows Server 2012

Modélisation et simulation

Atelier A6 : Editeurs de Logiciels, comment construire votre écosystème avec les Partenaires Revendeurs IBM?

Étudier. collaborer. partager. avec les solutions Toshiba L É COLE N UMÉRIQUE T OSHIBA. * Environnement Numérique de Travail

CRM PERFORMANCE CONTACT

HPC by OVH.COM. Le bon calcul pour l innovation OVH.COM

Spécifications détaillées

Digitalisation de l Industrie Bancaire

Caractéristiques principales:

Eric Bertrand 08/11/06 Maître de conférence 1

L intelligence intégrée et connectée au cœur de vos projets. Dossier de presse

VOIP. QoS SIP TOPOLOGIE DU RÉSEAU

Intel Corporation Nicolas Biguet Business Development Manager Intel France

Introduction. René J. Chevance

Le signal GPS. Les horloges atomiques à bord des satellites GPS produisent une fréquence fondamentale f o = Mhz

MODULE I1. Plan. Introduction. Introduction. Historique. Historique avant R&T 1ère année. Sylvain MERCHEZ

Transcription:

Séminaire RGE REIMS 17 février 2011

ADACSYS Présentation des FPGA Agenda Spécificité et différences par rapport aux autres accélérateurs Nos atouts Applications Approche innovante Document confidentiel février 2011 2

ADACSYS Jeune entreprise innovante créée en 2008 4 fondateurs, 5 salariés Lauréate Nationale du Ministère de la Recherche et du Développement en 2006 et 2008 Membre du pôle de compétitivité SYSTEM@TIC Document confidentiel février 2011 3

Activité Notre expertise porte sur : Les solutions électroniques massivement parallèles d accélération de calcul multi-fpga Les solutions de vérification matérielle des systèmes électroniques complexes Notre mission : Rendre accessible des solutions d accélération de calcul en termes de retour sur investissement et de simplicité d utilisation pour réduire le Timeto-Market de vos produits. Document confidentiel février 2011 4

Equipe Erik Hochapfel CEO 14 années dans l industrie électronique dont 10 chez Mentor Graphics Fabrice Plateau CFO +17 années dans la finance, le conseil et la gestion de projets Pascal Remy CTO 16 années dans l industrie électronique dont 10 chez Mentor Graphics Ventes Erik Hochapfel Architecte logiciel Erik Hochapfel architecte matériel OF 14 années dans l industrie électronique don t 12 chez Mentor Graphics Sarah Basset Ingénieur R&D matériel & logiciel Développement produits financiers Master en électronique Sylvain Darras Ingénieur R&D logiciel Thèse en informatique Linlin Zhang Ingénieur R&D matériel Thèse en électronique Document confidentiel février 2011 5

ADACSYS Présentation des FPGA Agenda Spécificité et différences par rapport aux autres accélérateurs Nos atouts Applications Approche innovante Document confidentiel février 2011 6

FPGA : des accélérateurs Comment un FPGA qui fonctionne à 100 MHz -150 MHz est plus performant qu un quadri-cœur à 3 GHz? 100 MHz 150 MHz MHz 3 GHz Document confidentiel février 2011 7

FPGA FPGA (Field Programmable Gate Array) : circuit digital composé de : bloc de logique reprogrammable (LUT) réseau d interconnexion reconfigurable bloc de mémoires entrées sorties liens séries rapides (serdes) Power PC Document confidentiel février 2011 8

Modèles de programmation Programmation d un FPGA Von Neumann = distribution temporelle FPGA = distribution spatiale Block mémoire Block logique et arithmétique Interconnexion le configurer pour un traitement spécifique Document confidentiel février 2011 9

ADACSYS Présentation des FPGA Agenda Différences et spécificités par rapport aux autres accélérateurs Nos atouts Applications Approche innovante Document confidentiel février 2011 10

Pourquoi la logique reconfigurable est + rapide qu un processeur 2 y = Ax + Bx + C CPU : Distribution temporelle FPGA : Distribution spatiale t1 = x t2 = t1 * A t2 = t2 + B t2 = t2 * t1 y = t2 + C t1 t2 A B C x A * * * + B C + Y Document confidentiel février 2011 11

Forces des FPGA Parallélisme à grain fin Les FPGA contiennent des milliers de blocs de calcul indépendants (LUT, DSP) Accès mémoires concurrentielles Les FPGA contiennent jusqu à 500 blocs mémoires indépendants et configurables Communication à grain fin rapide communication intra-fpga à faible latence Reconfigurabilité programmé pour le traitement Document confidentiel février 2011 12

CPU Intel Core i7 CPU Facile à programmer Facile à debugger Peu efficace (mauvais partout!) Gflops/Watt faible Scalabilité moyenne Document confidentiel février 2011 13

GPU CUDA Fermi : 512 cores Performance élevée Mémoire partagée Architecture figée Effort de programmation Debbugage moyen Scalabilité réduite, nécessite des CPU Document confidentiel février 2011 14

FPGA Très performant sur certaines problématiques Faible consommation 5W-10W Excellent rapport GFlops/Watt Très forte scalabilité Difficile à programmer Difficile à debugger Document confidentiel février 2011 15

Historiquement : monde embarqué HPC : mode accélérateur Application Utilisation du FPGA API API API API HPC : mode autonome Application API Document confidentiel février 2011 16

ADACSYS Présentation des FPGA Agenda Spécificité et différences par rapport aux autres accélérateurs Nos atouts Applications Approche innovante Document confidentiel février 2011 17

Expertise CPU FPGA Applicatifs métiers Multi-FPGA T1 T2 T3 T4 T5 Traitement séquentiel Traitement parallèle Middleware logiciel Réseau d interconnexion Logiciels bas niveau internes : - traitements internes (transformations) - interfaces matériel/logiciel - interfaces métier (API) Document confidentiel février 2011 Réseau de communication FPGAs Mémoires 18 18

AVA-Soft : outil propriétaire de mise au point sur FPGA GUI : génération des fichiers de programmation GUI : debug sur FPGA Document confidentiel février 2011 19

ADACSYS Présentation des FPGA Agenda Spécificité et différences par rapport aux autres accélérateurs Nos atouts Applications Approche innovante Document confidentiel février 2011 20

Génération de nombres aléatoires programmation de séquences binaires aléatoires (de distribution uniforme, normale ou autre). débit des générateurs de nombres aléatoires Document confidentiel février 2011 21

Méthodes de Monte-Carlo Méthodes statistiques s appuyant sur un grand nombre de nombres aléatoires permettant de déterminer une valeur numérique. Exemples : Calcul de surface, d intégrales calcul de prix d option valorisation de portefeuille Document confidentiel février 2011 22

Qu est-ce qu une option? Contrat avec possibilité d acheter ou de vendre un actif à une date et un prix préétablis Calcul financier : Option Actifs : Actions, matières premières, denrées, Maturité : Date de la possibilité d exécution du contrat Prix d exercice : prix de vente ou d achat de l actif à la maturité Volatilité : facteur de risque d instabilité de l action Document confidentiel février 2011 23

Calcul financier : L algorithme de Black et Scholes Pour couvrir un risque dans le futur, il faut couvrir un risque infinitésimal tous les jours Le calcul de Black et Scholes dst = µsdt + σsdz, z Є N(0,1) Pour déterminer le sous-jacent St Sous-jacent St : Projection du prix de l actif au moment de l exécution du contrat Payoff : Plus-value du souscripteur de l option d achat Résolution équation différentielle méthode de Monte-Carlo Document confidentiel février 2011 24

Calcul financier : évaluation d actifs Calcul stochastique de type Monte Carlo pour le calcul de l évolution du prix d une option jusqu à son exercice. Black et Scholes associé à Monte-Carlo : St = S(t-1) * exp( R + SD * alea) delta_t = Maturity / Number of Monte- Carlo Points R = (rate 0.5 * volatility²) * (delta_t) SD = volatility * sqrt(delta_t) 92 87 82 77 72 67 1 51 101 151 201 251 301 351 401 451 501 scénario 1 scénario 2 scénario 3 scénario 4 scénario 5 scénario 6 scénario 7 scénario 8 scénario 9 scénario 10 scénario 11 scénario 12 scénario 13 scénario 14 scénario 15 Document confidentiel février 2011 25

Problématiques de Low Latency Trading Final Customer Market Feed Feed Handler Data Distributor Final Customer 1 à 2 millions de messages 50 à 100K messages Final Customer Problématiques Low Latency Trading : Accès rapide à des données financières arrivant de diverses places boursières reparties tout autour du monde. Chaque élément de la chaîne de transmission de l information doit avoir la célérité maximale (fibres optiques pour les câbles de transmission d information,..) et utilisation d un protocole de compression très performant car adapté à la problématique (FastFix). Document confidentiel février 2011 26

1/Ecoute 3/Décodage 4/Filtrage 1/Ecoute 2/Contrôle Perte Data 5/Empaquetage Feed Handler Market Feed A Market Feed B Données du marché filtrées Contrôle, Compteurs : Volume IN, Volume Out, Erreurs,.. Document confidentiel février 2011 27

ADACSYS Présentation des FPGA Agenda Spécificité et différences par rapport aux autres accélérateurs Nos atouts Applications Approche innovante Document confidentiel février 2011 28

AAA et DSL Pour ouvrir la puissance de calcul des FPGA, l approche est de proposer suivant les problématiques : Une API logicielle d accès transparent au FPGA Une architecture dédiée et optimisée pour la problématique Prise en charge de l intégration matérielle sur FPGA Un espace de programmation haut niveau pour programmer une partie du FPGA Document confidentiel février 2011 29

DSL et banque de modules de calcul Banque de modules de calcul Code haut niveau + x - sqrt exp class MAC : public Operator { public: // The constructor MAC(Target* target): Operator(target) { setname("mac"); // Set up the IO signals addinput ("X", 64); addinput ("Y", 32); addinput ("Z", 32); addoutput("r", 64); vhdl << declare("t", 64) << "<= Y * Z;" << endl; vhdl << "R <= X + T;" << endl; } // the destructor MAC() {} Monte-Carlo Black & Scholes Option Pricing Implémentation matérielle du code logiciel Monte-Carlo Black & Scholes Option Pricing - Monte-Carlo Black & Scholes Option Pricing + /2 Document confidentiel février 2011 30

Framework Cœur métier DSL : accélération financière DSL DSL language Gen aléa X Monte carlo Monte carlo Monte carlo ADACSYS BS BS BS CLIENT (...) // vhdl << declare("t", 64) << " <= Y * Z;" << endl; IntMultiplier *my_mult = new IntMultiplier(target, 32, 32); oplist.push_back(my_mult); inportmap (my_mult, "X", "Y"); // formal, actual inportmap (my_mult, "Y", "Z"); outportmap (my_mult, "R","T"); vhdl << instance(my_mult, "my_mult"); name // advance to the cycle of the result synccyclefromsignal("t"); // pipelined operators do not have a register on the output nextcycle(); // vhdl << "R <= X + T;" << endl; IntAdder *my_adder = new IntAdder(target, 64); oplist.push_back(my_adder); inportmap (my_adder, "X", "X"); inportmap (my_adder, "Y", "T"); inportmapcst(my_adder, "Cin", "0"); -- carry in outportmap (my_adder, "R","RR"); vhdl << instance(my_adder, "my_add"); // advance to the cycle of the result synccyclefromsignal("rr"); vhdl << "R <= RR;" << endl; (...) Document confidentiel février 2011 31

AAA : accélération financière CTRL Gen aléa X MC MC MC BS BS BS Connexion rapide Dispatch CTRL X MC MC MC Gen aléa BS BS BS CTRL Gen aléa CARTE PCB MC BS Document confidentiel février 2011 32 X MC BS MC BS

4 Go DDR3 4 Go DDR3 4 Go DDR3 4 Go DDR3 4 Go DDR3 4 Go DDR3 4 Go DDR3 4 Go DDR3 AAA : accès aux bases de données Architecture dédiée aux accès bases de données Principe : lever la contrainte d accès aux mémoires 4 Go DDR3 4 Go DDR3 CTRL #0 CTRL #n-1 PCI/USB/ Ethernet dispatch Power PC CTRL #1 CTRL #n 4 Go DDR3 4 Go DDR3 Document confidentiel février 2011 33

Conclusion Pour utiliser les FPGA comme accélérateur de calcul Problématique adaptée au portage sur FPGA Investissement en temps pour le développement de briques de base Pour gagner Des kilowatts De la climatisation Accès à des calculs temps réels Document confidentiel février 2011 34

Conclusion Relative Performance 256 64 16 4 1 0.25 Parallelisation Clock Rate Initial Design FPGA GPU CPU Hour Day Week Month Design-time Year Document confidentiel février 2011 35

Questions Nous vous remercions de votre attention Document confidentiel février 2011 36

Contact Sarah Basset Ingénieur R&D Hardware/Software Erik Hochapfel Président ADACSYS 7 rue de la Croix Martre 91120 Palaiseau sarah.basset@adacsys.com 01 69 19 72 72 06 29 62 06 27 erik.hochapfel@adacsys.com Document confidentiel février 2011 37