Multicœurs et Manycœurs

Dimension: px
Commencer à balayer dès la page:

Download "Multicœurs et Manycœurs"

Transcription

1 CRI 2013 Multicœurs et Manycœurs Une Analyse de la Performance et l Efficacité Énergétique d une Application Irrégulière Márcio Castro * Emilio Francesquini * + Thomas Messi Nguélé * - Jean-François Méhaut * x * Nanosim - Laboratoire Informatique de Grenoble Université de Grenoble, France FirstName.LastName@imag.fr + Institute of Mathematics and Statistics Université de São Paulo, Brésil - LIRIMA-UMMISCO, Département d Informatique, Université de Yaoundé 1, Cameroun x CEA/DRT/LETI, France RÉSUMÉ. Les études sur la performance et l efficacité énergétique sont nombreuses dans le cas des multicœurs mais rares dans le cas des manycœurs. Contrairement à ces études, dans cet article, nous analysons un problème NP-complet irrégulier bien connu, le problème du voyageur de commerce. Nous étudions deux aspects de cette application sur un processeur multicœur et un processeur manycœur: d abord l adaptation du code à un manycœur (MPPA-256), puis l analyse des performances de calcul et la consommation d énergie. Nos résultats montrent que les applications capables d utiliser pleinement les ressources d un manycœur peuvent avoir de meilleures performances comparées à celles d un processeur généraliste tout en consumant environ 10 fois moins d énergie. ABSTRACT. Research on the performance and the energy efficiency of numerical kernels on multicores are common but studies in the context of manycores are scarce. Unlike these works, in this paper we analyze a well-known irregular NP-complete problem, the Travelling-Salesman Problem (TSP). We investigate two aspects of the application on multi and manycore processors. First we concentrate on the adaptation of the application to a manycore (the MPPA-256 processor) then we analyze its performance and energy consumption. Our results show that applications able to fully use the resources of a manycore can have better performance than a general purpose processor and at the same time consume 10 times less energy. MOTS-CLÉS : Processeurs Multicœurs, Processeurs Manycœurs, Performance de calcul, Efficacité Énergetique, TSP KEYWORDS : Multicore Processors, Manycore Processors, Performance, Energy Efficiency, TSP

2 1. Introduction La demande en processeurs de plus en plus performants pousse les fabricants de puces à combiner les approches telles que l augmentation de la taille des caches, du parallélisme d instructions et de la fréquence des processeurs. Cependant, ces approches semblent avoir atteint un point où elles ne suffisent plus pour maintenir la croissance de la performance prédite par la loi de Moore et attendue par les consommateurs [6]. Une augmentation exponentielle de la puissance consommée liée à une augmentation linéaire de la fréquence d horloge [2] et une grande complexité de conception des nouveaux processeurs a changé le cours du développement de ces nouveaux processeurs. La puissance consommée est devenue un aspect essentiel pour le développement des systèmes à petite et grande échelle. Ceci peut justifier les études actuelles sur l usage de processeurs de faible puissance dans la prochaine génération des systèmes HPC. Par exemple, le projet européen Mont-Blanc a été créé pour évaluer l usage de ces types de composants dans un environnement HPC [8]. Bien que n offrant pas les mêmes performances de calcul que leurs homologues généralistes, ces multicœurs de faible puissance offrent généralement de meilleurs résultats quand on compare l énergie dépensée pour trouver une solution (energy-to-solution). Les processeurs parallèles actuels vont même encore plus loin, avec des centaines voire des milliers de cœurs, tout en ayant une consommation efficace d énergie. Certains de ces manycœurs comme Tilera Tile-Gx [12] et Kalray MPPA-256 [3] ont des cœurs autonomes qui supportent le modèle d exécution threads POSIX (PThreads) et pouvant ainsi faire la parallélisation des données et des tâches. Ceci peut faciliter le passage d une application parallèle des multicœurs aux manycœurs, car plusieurs applications parallèles développées pour les multicœurs s appuient sur ce modèle. Par contre, les GPUs (General Processing Units) suivent une autre approche basée sur le modèle SIMD (Single Instruction, Multiple Data) qui s appuie sur des APIs comme CUDA et OpenCL. Un effort considérable peut donc être nécessaire pour adapter le code parallèle développé d un multicœur vers un GPU. Les recherches sur l efficacité énergétique et les performances de calcul des processeurs généralistes et des processeurs de faible puissance sont assez fréquentes [9, 11]. Cependant, dans le cadre de ces travaux, nous nous intéressons à l analyse du passage des multicœurs aux manycœurs en utilisant un problème irrégulier et NP-complet bien connu : le problème du voyageur de commerce. Avec une instance assez grande (20 villes), sa solution peut être parallélisée et faire usage d un nombre arbitraire de threads assurant l utilisation complète des plates-formes choisies. Bien que ce problème soit très parallélisable, il soulève des questions importantes liées au déséquilibre de charge et à l irrégularité. Le reste de cet article est organisé comme suit. La Section 2 décrit les plates-formes évaluées. Une description de haut niveau du problème choisi ainsi que ses algorithmes sont présentés dans la Section 3. Ensuite, la Section 4 aborde les défis rencontrés lors du passage des multicœurs au manycœur MPPA-256. La Section 5 présente les évaluations de perfomance de calcul et d efficacité énergétique. Enfin, nous discutons des travaux connexes dans la Section 6 et concluons dans la Section Plates-formes Dans cette étude nous avons utilisé deux plate-formes. La première est composée d un processeur multicœur généraliste et la deuxième est composée d une puce manycœur à basse consommation. Nous les présentons ci-dessous.

3 Xeon E5. Le processeur Intel Xeon E5 est un processeur x bit. Dans cette étude, nous avons utilisé une puce Xeon E Sandy Bridge-EP, qui dispose de 8 cœurs (16 threads avec l Hyper-Threading activé) cadencée à 2.40GHz. Chaque cœur dispose de deux caches L1 (un d intructions de 32Ko et autre de données de 32 Ko) et d un cache L2 de 256Ko. Tous les 8 cœurs partagent un cache L3 de 20 Mo et la plateforme a 32 Go de mémoire DDR3. MPPA-256. Le MPPA-256 [1, 3] est un processeur manycœur développé par Kalray qui intègre 256 cœurs utilisateurs et 32 cœurs système dans une technologie CMOS de 28nm. Ces cœurs sont répartis sur 16 clusters de calcul et 4 sous-systèmes d E/S (cluster d E/S) qui communiquent à travers deux NoCs (Networks-on-Chip) de données et de controle. Figure 1. Une vue simplifiée de l architecture du MPPA-256. La Figure 1 montre l architecture générale du MPPA-256. Il possède deux types de cœurs : PE (Processing Elements) et RM (Resource Managers). Les PEs et les RMs sont regroupés au sein des clusters de calcul et les clusters d E/S. Chaque cluster de calcul comporte 16 PEs, 1 RM et une mémoire locale partagée de 2 Mo. Les applications parallèles s exécutant sur MPPA-256 suivent habituellement le modèle maître/esclaves. Le processus maître fonctionne sur un RM du cluster d E/S et il est responsable de la création des processus esclaves. Ces processus sont ensuite exécutés sur des clusters de calcul et chaque processus peut créer jusqu à 16 threads POSIX, un pour chaque PE. 3. Étude de Cas : Le Problème du Voyageur de Commerce Le problème du voyageur de commerce (Traveling-Salesman Problem, TSP), consiste à trouver l itinéraire d un voyageur de commerce qui doit se déplacer dans n villes. Un tel itinéraire doit être le plus court possible, passant une seule fois dans chaque ville et se terminer par la ville d origine. C est un problème NP-complet très bien étudié. Le TSP pourrait être modélisé avec un graphe non orienté complet G = (V, E), V = n où chaque arête (i, j) E a un coût c(i, j) 0 représentant la distance entre les villes i et j. Le but est de trouver un cycle hamiltonien avec un coût minimal. Il existe plusieurs approches de la résolution de ce problème [5]. Ici, nous utilisons un algorithme de force brute exact, basé sur une heuristique très simple.

4 Algorithme séquentiel. La version séquentielle de l algorithme est basée sur la méthode de séparation et d évaluation (branch and bound). Cet algorithme prend en entrée le nombre de villes, et une matrice de coût, et retourne la longueur du chemin minimal (min_path). Il a une complexité de O(n!) dans le pire des cas. Il n explore pas les chemins plus long que le meilleur chemin déjà rencontré, il écarte donc les branches inutiles. Cette technique d élagage améliore considérablement les performances de l algorithme mais introduit également des irrégularités dans l espace de recherche. La profondeur de la recherche nécessaire pour parcourir une des branches dépend de l ordre dans lequel les branches ont été fouillées. Algorithme multi-threadé. Ici, on a créé une file d attente de tâches (branches de recherche) à partir de laquelle chaque thread prend les tâches à exécuter. La génération des tâches se fait de manière séquentielle car le temps nécessaire pour le faire est négligeable. Dès qu un thread se retrouve sans tâche, il prend une nouvelle tâche dans la file d attente. Le nombre de tâches qui doivent être générées change en fonction du nombre de threads et est défini par le paramètre max_hops (le nombre minimum de niveaux de l arbre de recherche). Le nombre total t(l, n) de tâches en fonction des niveaux l et des n villes peut être déterminé par la relation de récurrence suivante : l [0, n[, t(l, n) = 1 si l = 0 et t(l, n) = t(l 1, n) (n l) sinon. Algorithme distribué. Cet algorithme reçoit comme paramètre supplémentaire le nombre de postes n_postes à utiliser. Pour chaque poste, n_threads threads sont créés, donc on a un total de n_threads n_postes threads. Dans chaque poste, l exécution est similaire à celle du cas multi-threadé. La seule différence est que, lorsque le min_path est mise à jour dans un poste, cette mise à jour est diffusée à tous les autres postes afin qu ils puissent aussi l utiliser pour optimiser leur exécution. À la fin de l exécution, un des postes imprime la solution. Chaque poste poste_id ne travaille que sur les tâches qui lui ont été assignées. Pour ce faire, nous définissons le nombre de tâches (regroupées en partitions) par poste. Lorsque les postes sont à court de tâches, ils demandent d autres partitions au poste maître. Pour réduire le nombre de communications, le poste maître envoie des partitions de taille décroissante à chaque demande [7]. En effet, comme les tailles des tâches sont irrégulières, la distribution d un nombre de plus en plus petit de partitions vers la fin de l exécution pourrait réduire le déséquilibre de charge entre les postes. Dans ce cas, pour chaque demande, le poste maître envoie un ensemble de partitions S et le poste poste_id travaille sur des tâches telles que task_index mod n_partitions S. Comme la génération des tâches se fait au niveau local, la quantité de données transférées peut être minimisée. 4. Adaptation du TSP à une Plate-forme Manycœur Nous avons présenté dans la section 3 un aperçu des algorithmes de résolution du TSP. Toutefois, les différences architecturales entre les plates-formes multicœur et manycœur nous obligent à faire des adaptations du code. Dans cette section, nous discutons des adaptations effectuées avec le cas particulier du manycœur MPPA-256. La bibliothèque Pthreads est installée sur les deux plates-formes testées. Dans la version multi-threadé du code, min_path est implémenté en utilisant une variable partagée qui est accessible par tous les threads. Les opérations d écriture sur cette variable (c.a.d. quand un thread trouve un chemin plus court) sont protégées par un verrou pour éviter les situations de compétition. Contrairement aux opérations d écriture sur cette variable, les opérations de lecture ne sont pas protégées pour que le parallélisme ne soit pas limité.

5 Malheureusement, cette solution n est pas appropriée à la plate-forme MPPA-256, car les PEs ne possèdent pas des mémoires caches cohérentes. La prise de verrou par le PE qui réalise la mise à jour de min_path a comme effet secondaire l invalidation de sa mémoire cache. Toutefois, les lignes de cache des autres PEs du même cluster qui stockent cette variable ne sont pas invalidées. Ainsi, les threads s exécutant sur les autres PEs utilisent l ancienne valeur stockée dans min_path pendant une longue période de temps et perdent du temps sur des branches stériles de l arbre de recherche. Pour corriger cela, nous avons utilisé des instructions spécifiques de la plate-forme ( builtin_k1_lwu et builtin_k1_swu) qui permettent un accès direct à la mémoire locale du cluster, contournant ainsi la mémoire cache. Ce mode de lecture coûte nettement plus cher que d utiliser la valeur stockée dans les caches (l accès à la mémoire locale coûte 8 cycles alors que l accès à la mémoire cache coûte 2 cycles). Toutefois, l amélioration des performances due à un bon élagage de l arbre de recherche l emporte largement sur ce coût supplémentaire. Du fait de la non existence d une mémoire globale partagée entre clusters de calcul, nous avons utilisé la version distribuée du TSP. Les échanges de messages asynchrones entre clusters prennent la forme d opérations d écriture sur une mémoire distante. En raison du temps nécessaire pour diffuser une nouvelle valeur de min_path, certains threads peuvent utiliser une valeur erronée pour un laps de temps jusqu à ce que l émission soit terminée. 5. Résultats Expérimentaux Dans cette section, nous présentons l évaluation des performances de calcul et de l - efficacité énergétique des plates-formes lors de l exécution des versions parallèles et distribuées du TSP. Nous commençons par présenter notre méthodologie de mesure ainsi que les métriques utilisées pour analyser les résultats (Section 5.1). Ensuite, nous comparons les performances énergétiques et de calcul des processeurs (Section 5.2) Méthodologie de Mesure Nous utilisons deux indicateurs pour comparer les performances énergétiques et de calcul des deux processeurs : time-to-solution et energy-to-solution. La métrique timeto-solution désigne le temps passé pour trouver une solution à un problème donné. Dans notre cas, il s agit du temps global d exécution du TSP parallèle/distribuée. La métrique energy-to-solution est la quantité d énergie dépensée pour parvenir à résoudre un problème. Elle peut être calculée en multipliant la puissance moyenne (en watts) consommée lors de l exécution de l application par la métrique time-to-solution. La puissance consommée par chaque processeur a été obtenue en utilisant deux approches bien similaires. Le Xeon E5 a une microarchitecture Intel Sandy Bridge, qui a des capteurs d énergie RAPL (Running Average Power Limit). Cela nous permet de mesurer la consommation d énergie au niveau des composants du processeur à travers des registres spécifiques de la machine (en anglais Machine-Specific Registers, MSRs). Nous avons utilisé cette approche pour obtenir la consommation d énergie de l ensemble du package CPU, c.a.d., l ensemble des cœurs et la mémoire cache. La puissance moyenne consommée par le Xeon E5 a été de 68,6W. Les mesures de puissance à l aide de cette approche sont très précises, comme indiqué dans [10, 4]. De même, le MPPA-256 comporte des capteurs pour mesurer la puissance électrique consommée de la puce entière, c.a.d., 16 clusters de calcul ainsi que les 4 sous-systèmes de clusters d E/S. La puissance moyenne consommée par le MPPA-256 a été de 10.7W

6 En ce qui concerne la pile logicielle, nous avons compilé le TSP avec le même compilateur (GCC 4.7) sur les deux plates-formes. Cependant, MPPA-256 propose une version modifiée de GCC pour construire les binaires pour sa plate-forme spécifique. En outre, les systèmes d exploitation installés sur les deux plates-formes sont différents : le système Linux v.30 est installé sur la plate-forme Xeon E5 alors que MPPA-256 gère deux systèmes d exploitation différents. Le RTEMS (Real Time Executive for Multiprocessor System) 1 fonctionne sur les clusters d E/S, et le NodeOS (un système d exploitation propriétaire développé par Kalray) fonctionne sur le RM de chaque cluster de calcul. Nous avons également défini deux tailles de problème pour le TSP : un petit (16 villes) et un grand (20 villes). Nous avons utilisé une petite taille de problème lors de l exécution du TSP avec un nombre de threads réduit pour obtenir les résultats dans un délai raisonnable. Dans toutes les expériences, nous avons utilisé la même instance du problème afin de garantir le même chemin d exécution entre les différentes plates-formes. Chaque expérience a été répétée au moins 20 fois pour garantir un niveau de confiance de 95% Résultats Les performances énergétiques des processeurs Xeon E5 et MPPA-256 peuvent varier considérablement selon le nombre de threads utilisés (Figure 2a). Nous avons mesuré la métrique energy-to-solution entre le processeur Xeon E5 et un cluster du MPPA-256, en faisant varier le nombre de threads de 1 à 16 avec une petite taille de problème (16 villes). Bien que le processeur Xeon E5 ait seulement 8 cœurs physiques, il dispose de la technologie Hyper-Threading (HT), qui double le nombre de cœurs logiques, permettant l exécution de 16 threads simultanément. Figure 2. Performances et efficacité énergétique des processeurs Xeon E5 et MPPA-256. Nous avons remarqué que Xeon E5 surpasse un cluster MPPA-256 sur un faible nombre de threads (il a consommé 90% et 11% moins d énergie avec un et deux cœurs, respectivement). Pour plus de 8 threads, cependant, un cluster MPPA-256 surpasse le Xeon E5, consommant jusqu à 40% moins d énergie avec 16 threads. Cela est dû au fait que 1. RTEMS est disponible sur

7 la puissance consommée par le Xeon E5 augmente considérablement avec le nombre de cœurs utilisés (de 27W à 68,6W) alors que la puissance consommée par un seul cluster MPPA-256 est resté pratiquement inchangée (de 4,1W à 4,6W). Cela signifie que les applications parallèles s exécutant sur MPPA-256 doivent exploiter la totalité des cœurs afin de parvenir à une meilleure performance énergétique. La Figure 2b compare à la fois les métriques time-to-solution (axe de droite) et energyto-solution (axe de gauche) sur les deux processeurs. Dans ces expériences, nous avons exécuté le TSP avec une grande taille de problème et nous avons utilisé tous les cœurs de chaque processeur. Étonnamment, le TSP s exécute 1,6x plus vite sur MPPA-256. Même si la fréquence d horloge des PEs de MPPA-256 est bien inférieure à celle des cœurs Xeon E5, ce processeur embarqué réalise une meilleure performance. Cela est dû à la caractéristique inhérente de notre mise en oeuvre de TSP. Comme nous l avons déjà dit à la Section 3, il y a peu d échanges de messages entre les postes dans l algorithme distribué. La diffusion entre les clusters a été implémentée en utilisant les messages asynchrones à travers le NoC, ce qui se traduit par une absence de contention. On a pu constater aussi que le processeur MPPA-256 consomme moins d énergie que Xeon E5 pour résoudre le même problème. Dans nos expériences, le processeur MPPA-256 a montré la meilleur energy-to-solution, réduisant la consommation d énergie de Xeon E5 d environ 90%. 6. Travaux connexes E. Totoni et al. [13] comparent la puissance et la performance du processeur SCC (Single-Chip Cloud Computer) d Intel aux autres types de CPUs et GPUs. E. Padoin et al [9] comparent le processeur dual-core ARM Cortex-A9 1.0GHz de Texas Instruments à deux multiprocesseurs : un composé de deux processeurs quad-core 2,4 GHz Intel Xeon E5 et l autre composé de quatre processeurs Xeon X7 de 8 cœurs 2,0 GHz. En utilisant une approche légèrement différente, Aubry et al. [1] ont comparé la performance d un processeur Intel Corei avec le MPPA-256. Leurs résultats montrent que les performances de ce processeur traditionnel va de pair avec la performance du MPPA-256 tout en fournissant un meilleur rendement énergétique de 6,4x. Contrairement aux travaux précédents, nous avons mis l accent sur le passage des multicœurs aux manycœurs avec un un problème irrégulier (TSP). Nous avons souligné quelques questions de programmation qui doivent être prises en compte lors du développement d applications parallèles sur les manycœurs. 7. Conclusion et perspectives Les processeurs manycœurs comme le MPPA-256 semblent être la tendance dans le développement des processeurs plus rapides et énergétiquement efficaces. Étant composé de plusieurs cœurs de performances limitées, l utilisation efficace d un processeur embarqué manycœur exige des adaptations du code de l application afin que ce code puisse utiliser efficacement l ensemble de la puce. Ces modifications ne sont pas triviales. Avec le MPPA-256, ceci est par exemple dû à l absence d un espace mémoire adressable globalement et à l absence des mémoires cache cohérentes. Pour une application assez parallelisable comme le TSP, nous avons montré que le MPPA-256 peut être très compétitif, même si cette application est irrégulière. Nos résultats montrent que ce processeur manycœur a une très bonne performance comparée à un

8 processeur multicœeur généraliste très utilisé (Intel Xeon E5) tout en offrant un meilleur rendement énergétique ( 10x). En perspective, nous comptons évaluer les performances de ce processeur avec une application ayant beaucoup de communications et beaucoup de zone séquentielles dans le code. Nous planifions aussi de comparer les performances de MPPA-256 avec d autres processeurs embarqués et optimisés pour l efficacité énergétique. Enfin, nous envisageons une comparation des performances de calcul et de la consommation énergetique de ces processeurs avec des outils de plus haut niveau tels que MPI et OpenCL. 8. Bibliographie [1] Pascal Aubry, Pierre-Edouard Beaucamps, and F. Blanc et. al. Extended Cyclostatic Dataflow Program Compilation and Execution for an Integrated Manycore Processor. In International Conference on Computational Science (ICCS), volume 18, pages , Barcelona, Spain, Elsevier. [2] D.M. Brooks, P. Bose, and S.E. Schuster et. al. Power-Aware Microarchitecture : Design and Modeling Challenges for Next-Generation Microprocessors. IEEE Micro, 20(6) :26 44, [3] Benoît Dupont de Dinechin, Pierre Guironnet de Massasa, and G. Lagera et. al. A Distributed Run-Time Environment for the Kalray MPPA-256 Integrated Manycore Processor. In Intl. Conference on Computational Science (ICCS), volume 18, pages , Barcelona, Spain, Elsevier. [4] Marcus Hähnel, Björn Döbel, Marcus Völp, and Hermann Härtig. Measuring Energy Consumption for Short Code Paths Using RAPL. ACM Sigmetrics Performance Evaluation Review, 40(3) :13 17, [5] Gilbert Laporte. The Traveling Salesman Problem : An Overview of Exact and Approximate Algorithms. European Journal of Operational Research, 59(2) : , June [6] James Larus. Spending Moore s Dividend. Communications of the ACM, 52 :62 69, [7] Li, Hui et. al. Locality and Loop Scheduling on NUMA Multiprocessors. In International Conference on Parallel Processing (ICPP), volume 2, pages , Syracuse, USA, IEEE Computer Society. [8] N. Rajovic et. al. The Low-Power Architecture Approach Towards Exascale Computing. In Workshop on Scalable Algorithms for Large-Scale Systems (ScalA), pages 1 2, New York, USA, ACM. [9] Edson Luiz Padoin, Daniel Alfonso G. de Oliveira, Pedro Velho, and Philippe Navaux. Timeto-Solution and Energy-to-Solution : A Comparison between ARM and Xeon. In Workshop on Applications for Multi-Core Architectures (WAMCA), pages 48 53, New York, USA, IEEE Computer Society. [10] Efraim Rotem, Alon Naveh, Avinash Ananthakrishnan, and E. Weissmann et al. Power- Management Architecture of the Intel Microarchitecture Code-Named Sandy Bridge. IEEE Micro, 32(2) :20 27, [11] Luka Stanisic, Brice Videau, Johan Cronsioe, and A. Degomme et al. Performance Analysis of HPC Applications on Low-Power Embedded Platforms. In Design, Automation & Test in Europe (DATE), pages , Grenoble, France, IEEE Computer Society. [12] Tilera Corporation. TILE-Gx Processor Family, June [13] Ehsan Totoni and B. Behzad et. al. Comparing the Power and Performance of Intel s SCC to State-of-the-Art CPUs and GPUs. In IEEE Intl. Symposium on Performance Analysis of Systems and Software (ISPASS), pages 78 87, New Brunswick, Canada, IEEE Computer Society.

T. Gasc 1,2,3, F. De Vuyst 1, R. Motte 3, M. Peybernes 4, R. Poncet 5

T. Gasc 1,2,3, F. De Vuyst 1, R. Motte 3, M. Peybernes 4, R. Poncet 5 Modélisation de la performance et optimisation d un algorithme hydrodynamique de type Lagrange-Projection sur processeurs multi-cœurs T. Gasc 1,2,3, F. De Vuyst 1, R. Motte 3, M. Peybernes 4, R. Poncet

Plus en détail

Métriques de performance pour les algorithmes et programmes parallèles

Métriques de performance pour les algorithmes et programmes parallèles Métriques de performance pour les algorithmes et programmes parallèles 11 18 nov. 2002 Cette section est basée tout d abord sur la référence suivante (manuel suggéré mais non obligatoire) : R. Miller and

Plus en détail

Hétérogénéité pour atteindre une consommation énergétique proportionnelle dans les clouds

Hétérogénéité pour atteindre une consommation énergétique proportionnelle dans les clouds Hétérogénéité pour atteindre une consommation énergétique proportionnelle dans les clouds Mardi Laurent Lefèvre LIP Inria/ENS Lyon Jean-Marc Pierson, Georges Da Costa, Patricia Stolf IRIT Toulouse Hétérogénéité

Plus en détail

Info0804. Cours 6. Optimisation combinatoire : Applications et compléments

Info0804. Cours 6. Optimisation combinatoire : Applications et compléments Recherche Opérationnelle Optimisation combinatoire : Applications et compléments Pierre Delisle Université de Reims Champagne-Ardenne Département de Mathématiques et Informatique 17 février 2014 Plan de

Plus en détail

High Performance by Exploiting Information Locality through Reverse Computing. Mouad Bahi

High Performance by Exploiting Information Locality through Reverse Computing. Mouad Bahi Thèse High Performance by Exploiting Information Locality through Reverse Computing Présentée et soutenue publiquement le 21 décembre 2011 par Mouad Bahi pour l obtention du Doctorat de l université Paris-Sud

Plus en détail

Exemples de problèmes et d applications. INF6953 Exemples de problèmes 1

Exemples de problèmes et d applications. INF6953 Exemples de problèmes 1 Exemples de problèmes et d applications INF6953 Exemples de problèmes Sommaire Quelques domaines d application Quelques problèmes réels Allocation de fréquences dans les réseaux radio-mobiles Affectation

Plus en détail

Architecture des ordinateurs

Architecture des ordinateurs Décoder la relation entre l architecture et les applications Violaine Louvet, Institut Camille Jordan CNRS & Université Lyon 1 Ecole «Découverte du Calcul» 2013 1 / 61 Simulation numérique... Physique

Plus en détail

Ordonnancement sous contraintes de Qualité de Service dans les Clouds

Ordonnancement sous contraintes de Qualité de Service dans les Clouds Ordonnancement sous contraintes de Qualité de Service dans les Clouds GUÉROUT Tom DA COSTA Georges (SEPIA) MONTEIL Thierry (SARA) 05/12/2014 1 Contexte CLOUD COMPUTING Contexte : Environnement de Cloud

Plus en détail

Segmentation d'images à l'aide d'agents sociaux : applications GPU

Segmentation d'images à l'aide d'agents sociaux : applications GPU Segmentation d'images à l'aide d'agents sociaux : applications GPU Richard MOUSSA Laboratoire Bordelais de Recherche en Informatique (LaBRI) - UMR 5800 Université de Bordeaux - France Laboratoire de recherche

Plus en détail

Big Data et Graphes : Quelques pistes de recherche

Big Data et Graphes : Quelques pistes de recherche Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de Lyon/Université Claude Bernard Lyon 1/Université

Plus en détail

Optimisation multi-critère pour l allocation de ressources sur Clouds distribués avec prise en compte de l énergie

Optimisation multi-critère pour l allocation de ressources sur Clouds distribués avec prise en compte de l énergie Optimisation multi-critère pour l allocation de ressources sur Clouds distribués avec prise en compte de l énergie 1 Présenté par: Yacine KESSACI Encadrement : N. MELAB E-G. TALBI 31/05/2011 Plan 2 Motivation

Plus en détail

Rapport 2014 et demande pour 2015. Portage de Méso-NH sur Machines Massivement Parallèles du GENCI Projet 2015 : GENCI GEN1605 & CALMIP-P0121

Rapport 2014 et demande pour 2015. Portage de Méso-NH sur Machines Massivement Parallèles du GENCI Projet 2015 : GENCI GEN1605 & CALMIP-P0121 Rapport 2014 et demande pour 2015 Portage de Méso-NH sur Machines Massivement Parallèles du GENCI Projet 2015 : GENCI GEN1605 & CALMIP-P0121 Rappel sur Méso-NH : Modélisation à moyenne échelle de l atmosphère

Plus en détail

IRL : Simulation distribuée pour les systèmes embarqués

IRL : Simulation distribuée pour les systèmes embarqués IRL : Simulation distribuée pour les systèmes embarqués Yassine El Khadiri, 2 ème année Ensimag, Grenoble INP Matthieu Moy, Verimag Denis Becker, Verimag 19 mai 2015 1 Table des matières 1 MPI et la sérialisation

Plus en détail

Génération de code binaire pour application multimedia : une approche au vol

Génération de code binaire pour application multimedia : une approche au vol Génération de binaire pour application multimedia : une approche au vol http://hpbcg.org/ Henri-Pierre Charles Université de Versailles Saint-Quentin en Yvelines 3 Octobre 2009 Présentation Présentation

Plus en détail

Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services

Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services 69 Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services M. Bakhouya, J. Gaber et A. Koukam Laboratoire Systèmes et Transports SeT Université de Technologie de Belfort-Montbéliard

Plus en détail

Initiation au HPC - Généralités

Initiation au HPC - Généralités Initiation au HPC - Généralités Éric Ramat et Julien Dehos Université du Littoral Côte d Opale M2 Informatique 2 septembre 2015 Éric Ramat et Julien Dehos Initiation au HPC - Généralités 1/49 Plan du cours

Plus en détail

Tests de performance du matériel

Tests de performance du matériel 3 Tests de performance du matériel Après toute la théorie du dernier chapitre, vous vous demandez certainement quelles sont les performances réelles de votre propre système. En fait, il y a plusieurs raisons

Plus en détail

Big Data et Graphes : Quelques pistes de recherche

Big Data et Graphes : Quelques pistes de recherche Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci http://liris.cnrs.fr/hamamache.kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de

Plus en détail

Retours d expériences et perspectives sur les aspects énergétiques

Retours d expériences et perspectives sur les aspects énergétiques Retour d expériences Retours d expériences et perspectives sur les aspects énergétiques d un mesocentre (Grenoble) GreenDays@Luxembourg CIMENT, LIG 28-29 Janvier 2013 Bruno Bzeznik Retour d expériences

Plus en détail

Journée Utiliateurs 2015. Nouvelles du Pôle ID (Informatique) Pierre Neyron, LIG/CNRS

Journée Utiliateurs 2015. Nouvelles du Pôle ID (Informatique) Pierre Neyron, LIG/CNRS Journée Utiliateurs 2015 Nouvelles du Pôle ID (Informatique) Pierre Neyron, LIG/CNRS 1 Pôle ID, Grid'5000 Ciment Une proximité des platesformes Autres sites G5K Grenoble + CIMENT Pôle ID = «Digitalis»

Plus en détail

Contrôle Non Destructif : Implantation d'algorithmes sur GPU et multi-coeurs. Gilles Rougeron CEA/LIST Département Imagerie Simulation et Contrôle

Contrôle Non Destructif : Implantation d'algorithmes sur GPU et multi-coeurs. Gilles Rougeron CEA/LIST Département Imagerie Simulation et Contrôle Contrôle Non Destructif : Implantation d'algorithmes sur GPU et multi-coeurs Gilles Rougeron CEA/LIST Département Imagerie Simulation et Contrôle 1 CEA R & D for Nuclear Energy 5 000 people Nuclear systems

Plus en détail

BIG Data et R: opportunités et perspectives

BIG Data et R: opportunités et perspectives BIG Data et R: opportunités et perspectives Guati Rizlane 1 & Hicham Hajji 2 1 Ecole Nationale de Commerce et de Gestion de Casablanca, Maroc, rguati@gmail.com 2 Ecole des Sciences Géomatiques, IAV Rabat,

Plus en détail

Comment reproduire les résultats de l article : POP-Java : Parallélisme et distribution orienté objet

Comment reproduire les résultats de l article : POP-Java : Parallélisme et distribution orienté objet Comment reproduire les résultats de l article : POP-Java : Parallélisme et distribution orienté objet Beat Wolf 1, Pierre Kuonen 1, Thomas Dandekar 2 1 icosys, Haute École Spécialisée de Suisse occidentale,

Plus en détail

Quantification d incertitude et Tendances en HPC

Quantification d incertitude et Tendances en HPC Quantification d incertitude et Tendances en HPC Laurence Viry E cole de Physique des Houches 7 Mai 2014 Laurence Viry Tendances en HPC 7 Mai 2014 1 / 47 Contents 1 Mode lisation, simulation et quantification

Plus en détail

Système de stockage IBM XIV Storage System Description technique

Système de stockage IBM XIV Storage System Description technique Système de stockage IBM XIV Storage System Description technique Système de stockage IBM XIV Storage System Le stockage réinventé Performance Le système IBM XIV Storage System constitue une solution de

Plus en détail

Nouvelles propositions pour la résolution exacte du problème de sac à dos bi-objectif unidimensionnel en variables binaires

Nouvelles propositions pour la résolution exacte du problème de sac à dos bi-objectif unidimensionnel en variables binaires Nouvelles propositions pour la résolution exacte du problème de sac à dos bi-objectif unidimensionnel en variables binaires Julien Jorge, Xavier Gandibleux Laboratoire d Informatique de Nantes Atlantique

Plus en détail

Programmation C. Apprendre à développer des programmes simples dans le langage C

Programmation C. Apprendre à développer des programmes simples dans le langage C Programmation C Apprendre à développer des programmes simples dans le langage C Notes de cours sont disponibles sur http://astro.u-strasbg.fr/scyon/stusm (attention les majuscules sont importantes) Modalités

Plus en détail

Résolvez vos problèmes d énergie dédiée à l informatique

Résolvez vos problèmes d énergie dédiée à l informatique Résolvez vos problèmes d énergie dédiée à l informatique GRÂCE À UNE SOLUTION ENERGY SMART DE DELL Surmonter les défis énergétiques des datacenters Les responsables informatiques ont un problème urgent

Plus en détail

THÈSE DE DOCTORAT DE L UNIVERSITÉ PIERRE ET MARIE CURIE

THÈSE DE DOCTORAT DE L UNIVERSITÉ PIERRE ET MARIE CURIE THÈSE DE DOCTORAT DE L UNIVERSITÉ PIERRE ET MARIE CURIE Spécialité Informatique École Doctorale Informatique, Télécommunication et Électronique Présenté par Ghassan ALMALESS Pour obtenir le grade de DOCTEUR

Plus en détail

en version SAN ou NAS

en version SAN ou NAS tout-en-un en version SAN ou NAS Quand avez-vous besoin de virtualisation? Les opportunités de mettre en place des solutions de virtualisation sont nombreuses, quelque soit la taille de l'entreprise. Parmi

Plus en détail

Mesure et modélisation de l énergie logicielle

Mesure et modélisation de l énergie logicielle Mesure et modélisation de l énergie logicielle Adel Noureddine, Romain Rouvoy, Lionel Seinturier Green Days @ Lille 29 novembre 2013 Plan Contexte! Problèmes et limitations! Mesure énergétique des logiciels

Plus en détail

THÈSE. Pour obtenir le grade de. Spécialité : Informatique. Arrêté ministériel : 7 août 2006. Présentée et soutenue publiquement par.

THÈSE. Pour obtenir le grade de. Spécialité : Informatique. Arrêté ministériel : 7 août 2006. Présentée et soutenue publiquement par. THÈSE Pour obtenir le grade de DOCTEUR DE L UNIVERSITÉ DE GRENOBLE Spécialité : Informatique Arrêté ministériel : 7 août 2006 Présentée et soutenue publiquement par Fabien GAUD le 02 Décembre 2010 ÉTUDE

Plus en détail

Une dérivation du paradigme de réécriture de multiensembles pour l'architecture de processeur graphique GPU

Une dérivation du paradigme de réécriture de multiensembles pour l'architecture de processeur graphique GPU Une dérivation du paradigme de réécriture de multiensembles pour l'architecture de processeur graphique GPU Gabriel Antoine Louis Paillard Ce travail a eu le soutien de la CAPES, agence brésilienne pour

Plus en détail

GCOS 7 sur microprocesseur standard Diane Daniel POIRSON 14 octobre 2004 Matériels 64 / DPS 7 / DPS 7000 Architecture & Evolution - Daniel POIRSON 1

GCOS 7 sur microprocesseur standard Diane Daniel POIRSON 14 octobre 2004 Matériels 64 / DPS 7 / DPS 7000 Architecture & Evolution - Daniel POIRSON 1 sur microprocesseur standard Diane Daniel POIRSON 14 octobre 2004 Matériels 64 / DPS 7 / DPS 7000 Architecture & Evolution - Daniel POIRSON 1 Pourquoi aller vers les processeurs standard? Considérations

Plus en détail

Application de K-means à la définition du nombre de VM optimal dans un cloud

Application de K-means à la définition du nombre de VM optimal dans un cloud Application de K-means à la définition du nombre de VM optimal dans un cloud EGC 2012 : Atelier Fouille de données complexes : complexité liée aux données multiples et massives (31 janvier - 3 février

Plus en détail

Protection de l Investissement Virtualisation, Efficacité énergétique

Protection de l Investissement Virtualisation, Efficacité énergétique Protection de l Investissement Virtualisation, Efficacité énergétique Conférence IDC France Secteur Public Les technologies au service de l efficacité publique 8 Avril 2008 AMD, Fabricant de Processeurs

Plus en détail

Les mésocentres HPC àportée de clic des utilisateurs industriels

Les mésocentres HPC àportée de clic des utilisateurs industriels Les mésocentres HPC àportée de clic des utilisateurs industriels Université de Reims Champagne-Ardenne (URCA) Centre de Calcul ROMEO Multidisciplinary university more than 22 000 students a wide initial

Plus en détail

Solution A La Gestion Des Objets Java Pour Des Systèmes Embarqués

Solution A La Gestion Des Objets Java Pour Des Systèmes Embarqués International Journal of Engineering Research and Development e-issn: 2278-067X, p-issn: 2278-800X, www.ijerd.com Volume 7, Issue 5 (June 2013), PP.99-103 Solution A La Gestion Des Objets Java Pour Des

Plus en détail

SUGARCRM Sugar Open Source Guide d Installation de French SugarCRM Open Source Version 4.2

SUGARCRM Sugar Open Source Guide d Installation de French SugarCRM Open Source Version 4.2 SUGARCRM Sugar Open Source Guide d Installation de French SugarCRM Open Source Version 4.2 Version 1.0.5 Mentions légales Mentions légales Ce document est susceptible de modification à tout moment sans

Plus en détail

APX et VCE, Modèle d industrialisation de l intégration et du déploiement. Olivier BERNARD, VCE

APX et VCE, Modèle d industrialisation de l intégration et du déploiement. Olivier BERNARD, VCE APX et VCE, Modèle d industrialisation de l intégration et du déploiement Olivier BERNARD, VCE Généralisation des réseaux, suprématie d IP Consumérisation des terminaux informatiques Evolution vers une

Plus en détail

Rencontre sur la thématique du Calcul Haute Performance - 13 juin 2012. Better Match, Faster Innovation

Rencontre sur la thématique du Calcul Haute Performance - 13 juin 2012. Better Match, Faster Innovation Better Match, Faster Innovation Rencontre sur la thématique du Calcul Haute Performance - 13 juin 2012 Meeting on the theme of High Performance Computing TABLE DES MATIÈRES Qu est ce qu un imatch? STI

Plus en détail

IBM Tivoli Monitoring, version 6.1

IBM Tivoli Monitoring, version 6.1 Superviser et administrer à partir d une unique console l ensemble de vos ressources, plates-formes et applications. IBM Tivoli Monitoring, version 6.1 Points forts! Surveillez de façon proactive les éléments

Plus en détail

Multiprogrammation parallèle générique des méthodes de décomposition de domaine

Multiprogrammation parallèle générique des méthodes de décomposition de domaine Multiprogrammation parallèle générique des méthodes de décomposition de domaine Andréa Schwertner-Charão To cite this version: Andréa Schwertner-Charão. Multiprogrammation parallèle générique des méthodes

Plus en détail

Rapport de stage Master 2

Rapport de stage Master 2 Rapport de stage Master 2 Informatique Haute Performance et Simulation, 2 ème année Ecole Centrale Paris Accélération des méthodes statistiques sur GPU Auteur : CHAI Anchen. Responsables: Joel Falcou et

Plus en détail

physicien diplômé EPFZ originaire de France présentée acceptée sur proposition Thèse no. 7178

physicien diplômé EPFZ originaire de France présentée acceptée sur proposition Thèse no. 7178 Thèse no. 7178 PROBLEMES D'OPTIMISATION DANS LES SYSTEMES DE CHAUFFAGE A DISTANCE présentée à l'ecole POLYTECHNIQUE FEDERALE DE ZURICH pour l'obtention du titre de Docteur es sciences naturelles par Alain

Plus en détail

A. Elmrabti. To cite this version: HAL Id: tel-00568999 https://tel.archives-ouvertes.fr/tel-00568999

A. Elmrabti. To cite this version: HAL Id: tel-00568999 https://tel.archives-ouvertes.fr/tel-00568999 Méthodes et outils de génération de code pour les plateformes multi-cœurs fondés sur la représentation de haut niveau des applications et des architectures A. Elmrabti To cite this version: A. Elmrabti.

Plus en détail

Licence Sciences et Technologies Examen janvier 2010

Licence Sciences et Technologies Examen janvier 2010 Université de Provence Introduction à l Informatique Licence Sciences et Technologies Examen janvier 2010 Année 2009-10 Aucun document n est autorisé Les exercices peuvent être traités dans le désordre.

Plus en détail

Mesurer la consommation électrique des serveurs dans les data-centers: besoins & challenges Code-Watchers!

Mesurer la consommation électrique des serveurs dans les data-centers: besoins & challenges Code-Watchers! Mesurer la consommation électrique des serveurs dans les data-centers: besoins & challenges Code-Watchers! Laurent Lefèvre Inria - laurent.lefevre @ inria.fr M. Diouri, J.-P. Gelas, O. Gluck, A.-C. Orgerie,

Plus en détail

Leçon 1 : Les principaux composants d un ordinateur

Leçon 1 : Les principaux composants d un ordinateur Chapitre 2 Architecture d un ordinateur Leçon 1 : Les principaux composants d un ordinateur Les objectifs : o Identifier les principaux composants d un micro-ordinateur. o Connaître les caractéristiques

Plus en détail

Architecture des calculateurs

Architecture des calculateurs Formation en Calcul Scientifique - LEM2I Architecture des calculateurs Violaine Louvet 1 1 Institut Camille jordan - CNRS 12-13/09/2011 Introduction Décoder la relation entre l architecture et les applications

Plus en détail

PACKZ System Requirements. Version: 2015-05-27. Version: 2015-05-27 Copyright 2015, PACKZ Software GmbH. 1

PACKZ System Requirements. Version: 2015-05-27. Version: 2015-05-27 Copyright 2015, PACKZ Software GmbH. 1 PACKZ System Requirements Version: 2015-05-27 Copyright 2015, PACKZ Software GmbH. All rights reserved.this manual may not be copied, photocopied, reproduced, translated, or converted to any electronic

Plus en détail

Vers l'orchestration de grilles de PC par les mécanismes de publicationsouscription

Vers l'orchestration de grilles de PC par les mécanismes de publicationsouscription Vers l'orchestration de grilles de PC par les mécanismes de publicationsouscription Présentée par Leila Abidi Sous la direction de Mohamed Jemni & Christophe Cérin Plan Contexte Problématique Objectifs

Plus en détail

Windows Server 2008. Chapitre 1: Découvrir Windows Server 2008

Windows Server 2008. Chapitre 1: Découvrir Windows Server 2008 Windows Server 2008 Chapitre 1: Découvrir Windows Server 2008 Objectives Identifier les caractéristiques de chaque édition de Windows Server 2008 Identifier les caractéristiques généraux de Windows Server

Plus en détail

Eléments d architecture des machines parallèles et distribuées

Eléments d architecture des machines parallèles et distribuées M2-RISE - Systèmes distribués et grille Eléments d architecture des machines parallèles et distribuées Stéphane Vialle Stephane.Vialle@supelec.fr http://www.metz.supelec.fr/~vialle Notions d architecture

Plus en détail

GRIDKIT: Pluggable Overlay Networks for Grid Computing

GRIDKIT: Pluggable Overlay Networks for Grid Computing GRIDKIT: Pluggable Overlay Networks for Grid Computing Paul Grace, Geoff Coulson, Gordon Blair, Laurent Mathy, Wai Kit Yeung, Wei Cai, David Duce, Chris Cooper Computing Department, Lascaster University

Plus en détail

vbladecenter S! tout-en-un en version SAN ou NAS

vbladecenter S! tout-en-un en version SAN ou NAS vbladecenter S! tout-en-un en version SAN ou NAS Quand avez-vous besoin de virtualisation? Les opportunités de mettre en place des solutions de virtualisation sont nombreuses, quelque soit la taille de

Plus en détail

Performances de la programmation multi-thread

Performances de la programmation multi-thread UFR Sciences et techniques de Franche-Comté Projet semestriel 2ème année de Master Informatique Performances de la programmation multi-thread Auteur(s) : Beuque Eric Moutenet Cyril Tuteur(s) : Philippe

Plus en détail

«clustering» et «load balancing» avec Zope et ZEO

«clustering» et «load balancing» avec Zope et ZEO IN53 Printemps 2003 «clustering» et «load balancing» avec Zope et ZEO Professeur : M. Mignot Etudiants : Boureliou Sylvain et Meyer Pierre Sommaire Introduction...3 1. Présentation générale de ZEO...4

Plus en détail

THÈSE. présentée à TÉLÉCOM PARISTECH. pour obtenir le grade de. DOCTEUR de TÉLÉCOM PARISTECH. Mention Informatique et Réseaux. par.

THÈSE. présentée à TÉLÉCOM PARISTECH. pour obtenir le grade de. DOCTEUR de TÉLÉCOM PARISTECH. Mention Informatique et Réseaux. par. École Doctorale d Informatique, Télécommunications et Électronique de Paris THÈSE présentée à TÉLÉCOM PARISTECH pour obtenir le grade de DOCTEUR de TÉLÉCOM PARISTECH Mention Informatique et Réseaux par

Plus en détail

Proposition de méthode d implémentation d ITIL

Proposition de méthode d implémentation d ITIL Proposition de méthode d implémentation d ITIL Said Sebaaoui (*) - Mohamed Lamrini (*) - Laila El Abbadi (**) (*) : Laboratoire Informatique et Modélisation (LIM), Faculté des Sciences Dhar el Mahraz,

Plus en détail

Limitations of the Playstation 3 for High Performance Cluster Computing

Limitations of the Playstation 3 for High Performance Cluster Computing Introduction Plan Limitations of the Playstation 3 for High Performance Cluster Computing July 2007 Introduction Plan Introduction Intérêts de la PS3 : rapide et puissante bon marché L utiliser pour faire

Plus en détail

Comme chaque ligne de cache a 1024 bits. Le nombre de lignes de cache contenu dans chaque ensemble est:

Comme chaque ligne de cache a 1024 bits. Le nombre de lignes de cache contenu dans chaque ensemble est: Travaux Pratiques 3. IFT 1002/IFT 1005. Structure Interne des Ordinateurs. Département d'informatique et de génie logiciel. Université Laval. Hiver 2012. Prof : Bui Minh Duc. Tous les exercices sont indépendants.

Plus en détail

Chapitre 1. Infrastructures distribuées : cluster, grilles et cloud. Grid and Cloud Computing

Chapitre 1. Infrastructures distribuées : cluster, grilles et cloud. Grid and Cloud Computing Chapitre 1. Infrastructures distribuées : cluster, grilles et cloud Grid and Cloud Computing Problématique Besoins de calcul croissants Simulations d'expériences coûteuses ou dangereuses Résolution de

Plus en détail

Objectifs du cours d aujourd hui. Informatique II : Cours d introduction à l informatique et à la programmation objet. Complexité d un problème (2)

Objectifs du cours d aujourd hui. Informatique II : Cours d introduction à l informatique et à la programmation objet. Complexité d un problème (2) Objectifs du cours d aujourd hui Informatique II : Cours d introduction à l informatique et à la programmation objet Complexité des problèmes Introduire la notion de complexité d un problème Présenter

Plus en détail

1 Architecture du cœur ARM Cortex M3. Le cœur ARM Cortex M3 sera présenté en classe à partir des éléments suivants :

1 Architecture du cœur ARM Cortex M3. Le cœur ARM Cortex M3 sera présenté en classe à partir des éléments suivants : GIF-3002 SMI et Architecture du microprocesseur Ce cours discute de l impact du design du microprocesseur sur le système entier. Il présente d abord l architecture du cœur ARM Cortex M3. Ensuite, le cours

Plus en détail

Une méthode d apprentissage pour la composition de services web

Une méthode d apprentissage pour la composition de services web Une méthode d apprentissage pour la composition de services web Soufiene Lajmi * Chirine Ghedira ** Khaled Ghedira * * Laboratoire SOIE (ENSI) University of Manouba, Manouba 2010, Tunisia Soufiene.lajmi@ensi.rnu.tn,

Plus en détail

ERP Service Negoce. Pré-requis CEGID Business version 2008. sur Plate-forme Windows. Mise à jour Novembre 2009

ERP Service Negoce. Pré-requis CEGID Business version 2008. sur Plate-forme Windows. Mise à jour Novembre 2009 ERP Service Negoce Pré-requis CEGID Business version 2008 sur Plate-forme Windows Mise à jour Novembre 2009 Service d'assistance Téléphonique 0 825 070 025 Pré-requis Sommaire 1. PREAMBULE... 3 Précision

Plus en détail

Etude d architecture de consolidation et virtualisation

Etude d architecture de consolidation et virtualisation BOUILLAUD Martin Stagiaire BTS Services Informatiques aux Organisations Janvier 2015 Etude d architecture de consolidation et virtualisation Projet : DDPP Table des matières 1. Objet du projet... 3 2.

Plus en détail

Communications collectives et ordonnancement en régime permanent pour plates-formes hétérogènes

Communications collectives et ordonnancement en régime permanent pour plates-formes hétérogènes Loris MARCHAL Laboratoire de l Informatique du Parallélisme Équipe Graal Communications collectives et ordonnancement en régime permanent pour plates-formes hétérogènes Thèse réalisée sous la direction

Plus en détail

Communications performantes par passage de message entre machines virtuelles co-hébergées

Communications performantes par passage de message entre machines virtuelles co-hébergées Communications performantes par passage de message entre machines virtuelles co-hébergées François Diakhaté1,2 1 CEA/DAM Île de France 2 INRIA Bordeaux Sud Ouest, équipe RUNTIME Renpar 2009 1 Plan Introduction

Plus en détail

Les clusters Linux. 4 août 2004 Benoît des Ligneris, Ph. D. benoit.des.ligneris@revolutionlinux.com. white-paper-cluster_fr.sxw, Version 74 Page 1

Les clusters Linux. 4 août 2004 Benoît des Ligneris, Ph. D. benoit.des.ligneris@revolutionlinux.com. white-paper-cluster_fr.sxw, Version 74 Page 1 Les clusters Linux 4 août 2004 Benoît des Ligneris, Ph. D. benoit.des.ligneris@revolutionlinux.com white-paper-cluster_fr.sxw, Version 74 Page 1 Table des matières Introduction....2 Haute performance (High

Plus en détail

Implémentation Matérielle des Services d un RTOS sur Circuit Reconfigurable

Implémentation Matérielle des Services d un RTOS sur Circuit Reconfigurable Implémentation Matérielle des Services d un RTOS sur Circuit Reconfigurable Pierre Olivier*, Jalil Boukhobza*, Jean-Philippe Babau +, Damien Picard +, Stéphane Rubini + *Lab-STICC, + LISyC, Université

Plus en détail

Technologie de déduplication de Barracuda Backup. Livre blanc

Technologie de déduplication de Barracuda Backup. Livre blanc Technologie de déduplication de Barracuda Backup Livre blanc Résumé Les technologies de protection des données jouent un rôle essentiel au sein des entreprises et ce, quelle que soit leur taille. Toutefois,

Plus en détail

Quoi de neuf en contrôle/commande et systèmes embarqués (RIO, WSN...)?

Quoi de neuf en contrôle/commande et systèmes embarqués (RIO, WSN...)? Quoi de neuf en contrôle/commande et systèmes embarqués (RIO, WSN...)? Mathieu PACE National Instruments, Ingénieur d applications L architecture RIO se développe Processeur FPGA E/S E/S E/S personnalisées

Plus en détail

Choix d'un serveur. Choix 1 : HP ProLiant DL380 G7 Base - Xeon E5649 2.53 GHz

Choix d'un serveur. Choix 1 : HP ProLiant DL380 G7 Base - Xeon E5649 2.53 GHz Choix d'un serveur Vous êtes responsable informatique d'une entreprise. Vous devez faire un choix pour l'achat d'un nouveau serveur. Votre prestataire informatique vous propose les choix ci-dessous Vous

Plus en détail

Infrastructures Parallèles de Calcul

Infrastructures Parallèles de Calcul Infrastructures Parallèles de Calcul Clusters Grids Clouds Stéphane Genaud 11/02/2011 Stéphane Genaud () 11/02/2011 1 / 8 Clusters - Grids - Clouds Clusters : assemblage de PCs + interconnexion rapide

Plus en détail

Logiciel Libre Cours 3 Fondements: Génie Logiciel

Logiciel Libre Cours 3 Fondements: Génie Logiciel Logiciel Libre Cours 3 Fondements: Génie Logiciel Stefano Zacchiroli zack@pps.univ-paris-diderot.fr Laboratoire PPS, Université Paris Diderot 2013 2014 URL http://upsilon.cc/zack/teaching/1314/freesoftware/

Plus en détail

Conditions : stage indemnisé, aide au logement possible, transport CEA en Ile-de-France gratuit.

Conditions : stage indemnisé, aide au logement possible, transport CEA en Ile-de-France gratuit. Proposition de stage de BAC+4 ou BAC+5 Pro ou Recherche Etude comparative des outils de vérification d'algorithmes parallèles Logiciels (LSL), localisé à Palaiseau (Essonne), développe les outils d'aide

Plus en détail

Monitoring continu et gestion optimale des performances énergétiques des bâtiments

Monitoring continu et gestion optimale des performances énergétiques des bâtiments Monitoring continu et gestion optimale des performances énergétiques des bâtiments Alexandre Nassiopoulos et al. Journée d inauguration de Sense-City, 23/03/2015 Croissance de la demande énergétique et

Plus en détail

Nouvelles propositions pour la résolution exacte du sac à dos multi-objectif unidimensionnel en variables binaires

Nouvelles propositions pour la résolution exacte du sac à dos multi-objectif unidimensionnel en variables binaires Nouvelles propositions pour la résolution exacte du sac à dos multi-objectif unidimensionnel en variables binaires Julien Jorge julien.jorge@univ-nantes.fr Laboratoire d Informatique de Nantes Atlantique,

Plus en détail

VIII- Circuits séquentiels. Mémoires

VIII- Circuits séquentiels. Mémoires 1 VIII- Circuits séquentiels. Mémoires Maintenant le temps va intervenir. Nous avions déjà indiqué que la traversée d une porte ne se faisait pas instantanément et qu il fallait en tenir compte, notamment

Plus en détail

Equilibrage de charge pour les grilles de calcul : classe des tâches dépendantes et indépendantes.

Equilibrage de charge pour les grilles de calcul : classe des tâches dépendantes et indépendantes. Equilibrage de charge pour les grilles de calcul : classe des tâches dépendantes et indépendantes. Meriem Meddeber 1 et Belabbas Yagoubi 2 1 Université de Mascara, Faculté des sciences, Département des

Plus en détail

Équilibrage Dynamique de Charge pour des Calculs Parallèles sur Cluster Linux - Une Évaluation de l Environnement AMPI.

Équilibrage Dynamique de Charge pour des Calculs Parallèles sur Cluster Linux - Une Évaluation de l Environnement AMPI. Facultés Universitaires Notre-Dame de la Paix, Namur Institut d Informatique Année académique 2003-2004 Équilibrage Dynamique de Charge pour des Calculs Parallèles sur Cluster Linux - Une Évaluation de

Plus en détail

TRANSFORM IT + BUSINESS + YOURSELF

TRANSFORM IT + BUSINESS + YOURSELF TRANSFORM IT + BUSINESS + YOURSELF Copyright 2012 EMC Corporation. All rights reserved. 2 Vos environnements SAP sont complexes et couteux : pensez «replatforming» TRANSFORM IT+ BUSINESS + YOURSELF Alexandre

Plus en détail

Version de novembre 2012, valable jusqu en avril 2013

Version de novembre 2012, valable jusqu en avril 2013 Pré requis techniques pour l installation du logiciel complet de gestion commerciale WIN GSM en version hyper File en configuration Windows Terminal Serveur Version de novembre 2012, valable jusqu en avril

Plus en détail

<Insert Picture Here> Solaris pour la base de donnés Oracle

<Insert Picture Here> Solaris pour la base de donnés Oracle Solaris pour la base de donnés Oracle Alain Chéreau Oracle Solution Center Agenda Compilateurs Mémoire pour la SGA Parallélisme RAC Flash Cache Compilateurs

Plus en détail

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R Yves Aragon, David Haziza & Anne Ruiz-Gazen GREMAQ, UMR CNRS 5604, Université des Sciences

Plus en détail

Intel Corporation Nicolas Biguet Business Development Manager Intel France

Intel Corporation Nicolas Biguet Business Development Manager Intel France Les serveurs pour l Entreprise Intel Corporation Nicolas Biguet Business Development Manager Intel France 1 Les orientations stratégiques Clients Réseaux Serveurs Fournir les les éléments de de base des

Plus en détail

Méthodologie de conception pour la virtualisation et le déploiement d applications parallèles sur plateforme reconfigurable matériellement

Méthodologie de conception pour la virtualisation et le déploiement d applications parallèles sur plateforme reconfigurable matériellement Méthodologie de conception pour la virtualisation et le déploiement d applications parallèles sur plateforme reconfigurable matériellement Soutenance de thèse du 24 octobre 2012 Clément Foucher En présence

Plus en détail

MapReduce. Malo Jaffré, Pablo Rauzy. 16 avril 2010 ENS. Malo Jaffré, Pablo Rauzy (ENS) MapReduce 16 avril 2010 1 / 15

MapReduce. Malo Jaffré, Pablo Rauzy. 16 avril 2010 ENS. Malo Jaffré, Pablo Rauzy (ENS) MapReduce 16 avril 2010 1 / 15 MapReduce Malo Jaffré, Pablo Rauzy ENS 16 avril 2010 Malo Jaffré, Pablo Rauzy (ENS) MapReduce 16 avril 2010 1 / 15 Qu est ce que c est? Conceptuellement Données MapReduce est un framework de calcul distribué

Plus en détail

Outil d aide au choix Serveurs Lot 4 Marché Groupement de Recherche

Outil d aide au choix Serveurs Lot 4 Marché Groupement de Recherche Outil d aide au choix Serveurs Lot 4 Marché Groupement de Recherche Serveurs DELL PowerEdge Tour Rack standard R310 T110II Rack de calcul Lames R815 M610 R410 R910 M620 R415 R510 T620 R620 R720/R720xd

Plus en détail

Elasticité logicielle pour optimiser l empreinte énergétique

Elasticité logicielle pour optimiser l empreinte énergétique Ecole des Mines de Nantes Elasticité logicielle pour optimiser l empreinte énergétique Thomas Ledoux (équipe Ascola, INRIA-EMN, LINA) direction des études décembre 2010 page 1 Relation logiciel empreinte

Plus en détail

Déterminer le Nombre de licences pour V-locity 4

Déterminer le Nombre de licences pour V-locity 4 Déterminer le Nombre de licences pour V-locity 4 Table des matières 1. INTRODUCTION 2 2. DETERMINER LE NOMBRE DE LICENCES V-LOCITY POUR VMWARE ESX/ESXI 3 3. DETERMINER LE NOMBRE DE LICENCES V-LOCITY POUR

Plus en détail

Présentation de la Grille EGEE

Présentation de la Grille EGEE Présentation de la Grille EGEE Introduction aux grilles La grille EGEE Exemples d applications en physique des particules et en sciences de la vie Le cercle vertueux Conclusion Guy Wormser Directeur de

Plus en détail

Plan de cours ADM 992C Page 1. École des sciences de la gestion Département de management et technologie Université du Québec à Montréal

Plan de cours ADM 992C Page 1. École des sciences de la gestion Département de management et technologie Université du Québec à Montréal Plan de cours ADM 992C Page 1 École des sciences de la gestion Département de management et technologie Université du Québec à Montréal ADM-992C LES TECHNOLOGIES D'AIDE À LA PRISE DE DÉCISION DANS LES

Plus en détail

Hiérarchie matériel dans le monde informatique. Architecture d ordinateur : introduction. Hiérarchie matériel dans le monde informatique

Hiérarchie matériel dans le monde informatique. Architecture d ordinateur : introduction. Hiérarchie matériel dans le monde informatique Architecture d ordinateur : introduction Dimitri Galayko Introduction à l informatique, cours 1 partie 2 Septembre 2014 Association d interrupteurs: fonctions arithmétiques élémentaires Elément «NON» Elément

Plus en détail

Configuration système requise pour les grandes et moyennes entreprises

Configuration système requise pour les grandes et moyennes entreprises Configuration système requise pour les grandes et moyennes entreprises Trend Micro Incorporated se réserve le droit de modifier sans préavis ce document et les produits décrits dans ce document. Avant

Plus en détail

TBR. Postes de travail virtualisés : IBM simplifie la gestion de l infrastructure avec ses serveurs System x Août 2013

TBR. Postes de travail virtualisés : IBM simplifie la gestion de l infrastructure avec ses serveurs System x Août 2013 Postes de travail virtualisés : IBM simplifie la gestion de l infrastructure avec ses serveurs System x Août 2013 TBR T E C H N O L O G Y B U S I N E S S R E S E AR C H, I N C. 1 TBR IBM Nurture Stream

Plus en détail

Rapport d activité. Mathieu Souchaud Juin 2007

Rapport d activité. Mathieu Souchaud Juin 2007 Rapport d activité Mathieu Souchaud Juin 2007 Ce document fait la synthèse des réalisations accomplies durant les sept premiers mois de ma mission (de novembre 2006 à juin 2007) au sein de l équipe ScAlApplix

Plus en détail