Rapport de stage Master 2

Dimension: px
Commencer à balayer dès la page:

Download "Rapport de stage Master 2"

Transcription

1 Rapport de stage Master 2 Informatique Haute Performance et Simulation, 2 ème année Ecole Centrale Paris Accélération des méthodes statistiques sur GPU Auteur : CHAI Anchen. Responsables: Joel Falcou et Christophe Genolini Laboratoire: LRI Du 01/04/2014 au 30/09/2014 1

2 Remerciements Je voudrais remercier Joel Falcou et Christophe Genolini, mes tuteurs du stage, de m avoir aidé avec beaucoup de patience pendant mon stage. Ils ont toujours encouragé ma créativité et m ont fait confiance sur mon travail. Je remercie également monsieur Antoine, thésard de deuxième années à LRI, pour ses aides concernant mon stage. Enfin, je voudrais remercier toutes les personnes de l équipe «parsys» pour leur accueil et leur bienveillance pendant mon stage. 2

3 Sommaire 1. Introduction: Statistique et informatique R++, the Next Step Parallélisme Méthodologie générale de notre travail Méthodes statistiques Bootstrap Imputation multiple... 7 Partie 2 : Méthode Bootstrap Description détaillée Cas univarié Cas multivarié Comparaison des deux cas Expérience effectuée Résultat et performance Conclusion Partie 3 : Imputation Multiple Description détaillée Modèle de régression linéaire Expérience effectuée Résultats et performance Conclusion Conclusion Contribution du stage Bilan d apport du stage Bibliographie Annexe

4 1. Introduction 1.1 Statistique et informatique Depuis dizaine années, l analyse statistique est de plus en plus utilisée dans beaucoup de domaines. La statistique comprend souvent quatre parties : la collecte des données, le traitement des données collectées, l interprétation des données et enfin la présentation. Aujourd hui il n est plus rare d avoir besoin de traiter et interpréter des données comportant des millions d individus ou de variables. Le coût de temps des méthodes d analyse devient donc un facteur limitant. L arrivé des ordinateurs a profondément modifiée l utilisation des méthodes statistiques. Il existe deux types de logiciels qui permettent de faire l analyse statistique: les logiciel métier(r, SAS, SPSS...) sont souvent conçus par statisticiens et sont plus facile à utiliser par les statisticiens. L inconvénient de ce genre de logiciel est la performance. Le temps de réponse est souvent long. D un autre côté, les logiciels conçus par des informaticiens (Matlab, C/C++, Fortran...) sont plus performants au niveau de calcul, mais ils manquent d APIs de haut niveau pour les statisticiens. Ils sont donc très peu utilisés par les statisticiens. 1.2 R++, the Next Step L objectif du projet R++, the Next Step est de produire un logiciel statistique de haute performance qui proposera les fonctionnalités des logiciels métiers tout en profitant des techniques informatiques moderne. Ce projet s articule autour de trois axes : a) Parallélisme : Aujourd hui, il existe de plus en plus de sources de parallélisme dans le domaine informatique: extension SIMD, multi-cœur, les architectures récentes comme GPU et le Xeon Phi. Le challenge est donc de développer des modèles de programmations parallèles qui s adaptent bien à ces sources. 4

5 b) Big data : La taille de données devient aujourd hui un facteur limitant pour les logiciels statistiques (ils sont généralement bloqué autour du giga). Des techniques utilisant les bases de données(oracle ou PostGRES) ou encore plus moderne, le framework «Hadoop» permettent d aller au-delà. c) Interface homme-machine : Les logiciels statistiques actuels maquent souvent l interface graphique interactive. L objectif de cet axe est de développer une interface graphique qui facilite l interaction homme-machine. Dans ce stage, nous nous sommes intéressés au premier axe, la parallélisation des méthodes statistiques. Nous nous sommes concentré sur deux méthodes particulièrement utilisées et couteuses en temps : le Bootstrap et les Imputations Multiples. 1.3 Parallélisme Le parallélisme consiste à implémenter des programmes utilisant plusieurs processeurs permettant de traiter des informations de manière simultanée. Ces techniques ont pour objectif de réaliser le plus grand nombre d opérations en un temps le plus petit possible.il existe 3 types de sources principales de parallélisme: a) SIMD(Single Instruction Multiple Data) : la même instruction est appliquée simultanément à plusieurs données pour obtenir plusieurs résultats en même temps.c est typiquement le cas des processeurs vectoriels. b) Multi-cœur: un processeur possède plusieurs cœurs physiques travaillant en parallèle. Chaque cœur physique comprend toutes les fonctionnalités nécessaires à exécuter un programme de façon autonome. c) Many-cœur: ce sont des architectures massivement parallèle, par exemple GPU ou Xeon Phi. Elles permettent de traiter efficacement de nombreuses tâches simultanées. Aujourd hui, le parallélisme est exploré dans de nombreux logiciels. Beaucoup de bibliothèques numériques ou noyaux de calcul ont été développés pour exploiter différentes sources parallèles, par exemple BLAS, LAPACK..., qui sont largement utilisés dans différents domaines. 5

6 Dans ce stage, nous nous sommes concentré sur l implémentation parallèle sur GPU. Pourquoi nous nous intéressons le plus à GPU? Premièrement, GPU n est pas cher qui ont déjà été utilisés comme coprocesseurs pour un grand nombre d application. GPU est une unité de calcul massivement parallèle qui nous permet de traiter efficacement de nombreuses tâches simultanées. Deuxièmement, il existe de nombreuse bibliothèques numériques de haute performance sur GPU. Par exemple, curand(cuda Random Number Generation library)[nv10] réalise la génération des nombres aléatoires de haute qualité. Troisièmement, GPU sont largement utilisés actuellement, même dans un ordinateur portable, GPU sont souvent intégrés comme un élément standard. 1.4 Méthodologie générale de notre travail L objectif du stage est d étudier les performances du parallélisme appliqué aux méthodes statistiques. La qualité des résultats de certaines méthodes (généralement non déterministes) dépend du nombre de tentatives effectués pour trouver la solution. Cela signifie que pour obtenir des résultats intéressant, il faut faire un grand nombre d itérations, le plus grand nombre possible. Dans ce genre de cas, le coût en temps devient donc un facteur limitant. D où l importance la parallélisation des méthodes. Pour étudier la parallélisation, nous avons choisi deux méthodes statistiques modernes, très utilisées et assez coûteuses en temps : le Bootstrap et les Imputation multiple. Nous avons implémenté ces méthodes sur différentes architectures (Multicœur, GPU). Ensuite nous avons mesuré les temps d exécution avec différentes tailles de données. Enfin, nous avons comparéles versions classiques et parallèles, en C et en R[r12]. 6

7 1.5 Méthodes statistiques Bootstrap En statistique, bootstrap est une technique permettant de faire de l inférence statistique à partir d un nombre limité d observation. Bootstrap est une méthode très utilisée dans le domaine statistique mais assez coûteux, qui est la troisieme fonction que nous voulons paralléliser dans R[tm14]. Du point de vu de l informatique, un grand nombre de rééchantillonnage indépendants sont requis, ce qui nous permet de penser que le parallélisme permettra effectivement un gain de temps. Il existe plusieurs packages parallèles de bootstrap, la liste(non exhaustif) est présentée ici : 1) Le package parallèle dans R. Les fonctions standards dans R, par exemple, boot(), bootstrap(), nous permettent de paralléliser bootstrap explicitement : boot(..., parallel=c( no, multicore, snow ) ) ou bootstrap(..., parallel=c( no, multicore, snow )). L option multicore permet d exécuter bootstrap en plusieurs processeurs en même temps. L option snow qui nous permet d exécuter bootstrap dans un cluster de machine. 2) Le package SPRINT[jh08](Simple Paralle R interface) qui nous permet de profiter de plusieurs nœuds en utilisant l interface MPI(Message Passing Interface)[sm98] Imputation multiple En statistique, l imputation consiste à remplacer des données manquantes par des valeurs de substitution. Afin de réduire le bruit due à l imputation, Rubin(1987) a développé une méthode appelé l imputation multiple[ru91]. L idée de cette méthode est d effectuer plusieurs imputations sur le même ensemble de données. Chaque ensemble de données imputées est ensuite analysée séparément. Le résultat final est la moyenne des résultats des analyses. 7

8 Imputation multiple est une méthode très utilisée à analyser des valeurs manquantes aléatoirement, mais c est aussi une méthode très coûteuse en temps d exécution. Partie 2 : Méthode Bootstrap 2.1 Description détaillée Le bootstrap est une méthode permettant de calculer l intervalle de confiance d une statistique S lorsque les méthodes classiques (paramétriques) ne le permettent pas. Différentes méthodes de bootstrap existent, mais elles font toutes appels à un processus de 4 étapes : 1) A partir d une population initiale de taille N, un échantillon de taille N, obtenu par tirage avec remise,est constitué. 2) La statistique S i est calculée sur l échantillon i 3) Les étapes 1) et 2) sont répétées M fois 4) Les M statistiques S i permettent de calculer l intervalle de confiance de S. Nous pouvons le voir, le processus de bootstrap est assez simple. Malheureusement, la fiabilité du résultat dépend grandement du nombre déchantillonages effectués M. Quand nous augmentons M, la précision du bootstrap augmente. En résumé, plus M est grand, meilleure sera la qualité de l intervalle. Mais d un point de vue informatique, plus M et N sont grands, plus de puissance de calcul nécessaire est importante. D où l intérêt d optimiser le Bootstrap avec l architecture parallèle récente : GPU(Graphics Processing Unit). 8

9 2.1.1 Cas univarié Nous considérons une population initial de taille N ne contenant qu une seule variable. Nous voulons effectuer M échantillonnages, donc nous avons besoin de faire N tirages par rééchantillonnage. Le nombre total de tirage que nous allons effectuer est M*N. Ensuite nous pourrons calculer la statistique qui nous intéressent pour chaque échantillon. Notons fla fonction qui calcule indice statistique. Les calculs dont nous avons besoin sont : 1) N*M fois de tirage avec remise pour construire M rééchantillonnages 2) M fois d appels de fonction f() pour calculer l indice statistique Cas multivarié Supposons que nous avons n variables dépendantes et chaque variable a N observations dans l échantillon initial. Maintenant, la population initiale est une matrice de n lignes et N colonne. Chaque colonne est une variable. Puisque ces n variables sont dépendantes entre eux, nous ne pouvons pas faire les tirages indépendamment pour chaque variable. Donc nous avons toujours besoin de faire N tirages pour construire un échantillon, mais cette fois nous tirons une ligne à chaque tirage. Ensuite nous appelons f() pour chaque variable. Finalement tous les calculs dont nous avons besoin sont : 1) N*M fois de tirage de colonne pour construire M échantillon 2) n*m fois d appels de fonction f() 9

10 2.1.3 Comparaison des deux cas Si nous comparons le cas univarié et multivarié, nous pouvons constater que dans la méthode Bootstrap, le nombre de tirages ne dépend pas du nombre de variables, il dépend du nombre d individus N et du nombre d échantillonnage M. Par contre, le nombre d appel de f est décidé par le nombre de variablen et le nombre d échantillonnage M. Maintenant pour analyser quantitativement les deux cas, j introduis ici une métrique à les évaluer : la densité de calcul P qui est définit par le nombre de calcul par rapport au nombre total des éléments dans l échantillon initial. Pour le cas univarié : P = N M+M N Pour le cas multivarié : P = N M+n M N n =M + M N où M : nombre d échantillonnage désiré n : nombre de variable N : nombre d observation = M n + M N Nous pouvons observer que si le nombre d observation N reste constant, la densité de calcul de Bootstrap diminue lorsque le nombre de variable n augmente. Cela signifie que un peu de variable mais beaucoup d observations sera le cas optimal à paralléliser. Nous nous concentrerons donc au cas extrême : univariable dans la partie suivante. 10

11 2.2 Expérience effectuée Dans ce rapport, nous allons étudier la performance de bootstrap sur différents architecture : mono-cœur, multi-cœurs et GPU. Nous allons comparer le temps d exécution de bootstrap avec les implémentations sur R, C/C++ et CUDA(GPU) Benchmark : L échantillon initial que nous allons utiliser ici sont des nombres flottants générés aléatoirement entre 0 et 100. Sa taille varie de 1*100 jusqu à 1*10^6. Nous cherchons à estimer le moyen de cet échantillon. Nous fixons le nombre de répétition M est 1000 fois Les processeurs utilisés : CPU : Intel Xeon GPU : Tesla C2050, 3GB, 1.15GHz Multi-cœur : 12 cœurs Intel Xeon Compilateur utilisé : gcc version Résultat et performance Dans cette partie, nous allons comparer les performances des différentes implémentations de bootstrap : 1) L implémentation manuelle avec R sur CPU(mono-cœur) sans utilisant des bibliothèques extérieurs(c, C++...) 2) La fonction standard de R : boot() avec des bibliothèques extérieurs(mean(x)) 3) L implémentation avec C/C++ sur CPU(mono-coeur) 4) L implémentation avec CUDA sur GPU 5) L implémentation sur multi-coeurs en utilisant OpenMP. Dans le tableau suivant, MC_N signifie que nous profitons de N cœurs simultanément. 11

12 2.3.1 L accélération par rapport à l implémentation séquentielle CPU : Speedup Size R Boot() CPU GPU MC_6 MC_8 MC_10 MC_12 1*10^ *10^ *10^ *10^ *10^ Nous prenons ici l implémentation séquentielle sur CPU comme la référence,donc la colonne de CPU est toujours 1 dans le tableau. Quand la valeur dans ce tableau est inférieur à 1, c est-à-dire que la version est plus lente que CPU et qu il n y pas d accélération. Nous pouvons constater que l implémentation manuelle sur R est toujours 25 fois(1/0.04) plus lente que l implémentation sur CPU et la fonction standard boot() est plus rapide que R mais plus lente que GPU et multi-cœur. Ensuite nous pouvons trouver que GPU va gagner un gain à partir de taille 1*10^4. L accélération augmente quand la taille élargi. Nous obtenons un gain de 8.81 à 1*10^6 sur GPU. Nous avons toujours une accélération sur multi-cœur à partir de taille 1*10^3 et maintenant nous nous intéressons à la comparaison des performances de GPU avec le multi-cœur. Vous pouvez trouver aussi le tableau du temps d exécution réel de chaque implémentation de bootstrap dans l annexe. 12

13 Selon la courbe ou l histogramme au dessus, nous pouvons constater que l accélération de GPU est entre 10 cœur et 12 cœur à partir de taille 1*10^5. Cela signifie que quand nous avons assez de données à traiter, la performance de bootstrap sur GPU est meilleur qu un processeur de 10 cœurs. 13

14 2.4 Conclusion En conclusion, nous pouvons bien profiter de parallélisation sur GPU pour bootstrap quand nous avons assez de données dans l échantillonnage original. La performance de GPU est comparable avec un processeur de 10 cœurs. Mais la performance de certain résultats de GPU n est pas très optimale. En fait, cette limitation vient de deux aspects : a) Le temps de transfert de données entre GPU et CPU n est pas négligeable, donc quand nous n avons pas assez de calcul à faire, cette partie est assez élevée par rapport au tempstotal. b) L accès à la mémoire globale de GPU est couteux(souvent cycles d horloge). Sachant que pour construire les rééchantillonnages dans bootstrap, nous avons besoin de faire de nombreuse fois de tirage qui demande d accéder la mémoire globale de manière très aléatoire. La conséquence de ce genre de l accès est de nombreuse de défauts de cache potentiels qui est un facteur important pour bootstrap. Partie 3 : Imputation Multiple 3.1 Description détaillée L Imputation multiple est une méthode statistique introduite par Rubin à Les étapes principales de l imputation multiple sont les suivantes : a) Choisir un modèle qui prédit toutes les données manquantes à partir de toute les autres informationsutilisables, par exemple, régression linéaire, régression logistique ou modèle non-linéaire... b) Utiliser le modèle choisi à créer un ensemble de données complet c) Faire l analyse statistique de cet ensemble de données complet et enregistrer les statistiques que nous cherchons(moyenne, ecart type... ) d) Répéter les étapes b) et c) (selon les auteurs, 3 à 5 fois suffisent) e) Faire l analyse finale pour l ensemble de ces répétitions Le dessin suivant montre le processus global de l imputation multiple. 14

15 Dans ce rapport, nous avons utilisé le modèle de régression linéaire pour faire l inférence des données manquantes Modèle de régression linéaire En statistique, un modèle de régression linéaire[cm91] est un modèle de régression d une variable expliquée sur une ou plusieurs variables explicatives. Dans ce modèle, nous faisons l hypothèse que la dépendance de variable expliquée et les variables explicatives est linéaire. La formule mathématique pour exprimer la relation entre une variable y et un vecteur de variables x est : (3.1) Où y est la variable expliquée, le vecteur x est l ensemble des variables explicatives. u désigne le terme d erreur aléatoire. Le vecteur ß est le paramètre que nous cherchons pour pouvoir faire l inférence les données manquantes. En fait, il existe plusieurs méthodes mathématiques pour estimer Le vecteur ß. Nous avons choisi la méthode OLS(ordinary least squares) pour résoudre cette équation. La formule mathématique est : 15

16 D où : (3.2) Sachant que trouver l inverse d une matrice est assez coûteux(o(n^3))], nous transformons cette formule en : (X T X)ß = X T y (3.3) En ce cas là, nous avons besoin de résoudre le système linéaire A*ß = Y, d où A est (X T X) et Y est (X T y). Une fois que nous trouvons ß, nous pouvons ensuite exprimer la variable expliquée y par le vecteur X qui nous permet d inférer les valeurs manquantes de y par l équation 3.1. Donc, l implémentation réelle de l imputation multiple est la suivante : 1) Initialiser toutes les valeurs manquantes. Si une valeur est manquantes, nous la réplaçons aléatoirement par une des valeurs possibles. Cela conduit a un jeu de donnée complet. 2) Appliquer le modèle de régression linéaire pour la première variable à qui il manque des valeurs. Nous remplaçons les valeurs manquantes initiales par les nouvelles valeurs qui sont trouvées par l équation 3.1 3) Ensuite nous faisons une deuxième régression linéaire pour deuxième variable à qui il manque des valeurs. Nous remplaçons les valeurs manquantes initiales par les nouvelles valeurs. Et ainsi de suite, jusqu à nous ayons traité toutes les variables à qui manquent des valeurs 4) Répéter 1), 2), 3) M fois 3.2 Expérience effectuée Dans ce rapport, nous allons étudier la performance de l imputation multiple sur 16

17 différents architectures : mono-cœur, multi-cœur et GPU Benchmark : Les Benchmarks effectués sont des matrices dont le nombre de variable varie de 10^2 jusqu à 10^3 et dont le nombre d observation de chaque variable varie de 10^3 jusqu à 10^6. Les valeurs de matrice sont des nombres flottants générés arbitrairement entre 0 et 100. Pour chaque taille de matrice, nous ajoutons 10% de valeurs manquantes et nous appliquons 5 imputations Les processeurs utilisés : CPU : Intel Xeon GPU : Tesla C2050, 3GB, 1.15GHz Multi-cœur : 12 cœurs Intel Xeon Compilateur utilisé : gcc version Résultats et performance Dans cette partie, nous allons comparer les performances des différentes implémentations de l imputation multiple: 1) L implémentation utilisant la fonction standard mice() dans R : 2) L implémentation sequentielle en C/C++ avec bibliothèque Blas[bl02] et Lapack[an99] 3) L implémentation GPU avec la bibliothèque Magma[do14] 4) L implémentation multi-cœur avec bibliothèque MKL[intel05] et Lapack, Dans le tableau suivant, MC_N signifie que nous profitons de N cœurs simultanément L accélération par rapport à l implémentation CPU 17

18 Speedup Size Mice() CPU GPU MC_4 MC_6 MC_8 MC_10 MC_12 10*10^ *10^ *10^ *10^ Speedup Size Mice() CPU GPU MC_4 MC_6 MC_8 MC_10 MC_12 100*10^ *10^ *10^ *10^ * Vous pouvez trouver aussi le tableau du temps d exécution réel de chaque implémentation de l imputation multiple dans l annexe. Nous prenons ici l implémentation CPU comme la référence, donc la colonne de CPU dans le tableau est toujours 1. Puisque à partir de taille 1000*10^4, l exécution de fonction mice() est trop longue(> 100h), la mesure donc s arrête à 1000*

19 Comme nous avons prévu, l exécution de l imputation multiple sous R est assez coûteuse aux grandes tailles. Nous pouvons observer que quand la taille passe de 100*10^5 à 100*10^6, la fonction mice() est un peu près 100 fois plus lente(annexe 2). Mais pour CPU, GPU ou multi-cœur, le facteur est normalement 10. Cela signifie encore une fois que l overhead de R pour les problèmes de grandes tailles est assez élevé. Ensuite, la performance de GPU est toujours la meilleur à partir de 100*10^4. Puisque il existe des calculs assez intensifs dans cette méthode, par exemple la multiplication matricielle, résoudre le système linéaire... Donc l imputation multiple est une méthode très adaptée à GPU, l accélération est meilleur qu un processeur de 12 cœurs quand nous avons 100 variables à traiter. Maintenant nous nous intéressons à la comparaison des performances de GPU avec le multi-cœur. Nous prenons ici l implémentation de CPU comme référence : 1) 10 variables: 19

20 2) 100 variables 20

21 Maintenant plus clairement, pour les tailles petite(10 variables), la performance de GPU n est pas très optimale par rapport à laquelle de multi-cœur, mais quand nous augmentons le nombre de variables à 100, nous trouvons que GPU est plus rapide que multi-cœur à partir de 100*10^ Conclusion En conclusion, GPU est un bon choix pour accélérer l imputation multiple quand la taille de problème est grande. Mais pour les petites tailles, l implémentation séquentielle sur CPU est suffisante. En ce moment-là, nous n avons pas besoin d utiliser un GPU ou multi-cœur. 21

22 4. Conclusion 4.1 Contribution du stage Pendant 6 mois de stage, nous avons étudié le parallélisme potentiel des méthodes statistiques modernes. Nous avons implémenté ces méthodes sur différentes architectures avec des bibliothèques de haute performance. Avoir effectué les benchmarks sur différentes tailles de problème, nous avons montré que la parallélisation est un moyen faisable pour réduire le temps d exécution des méthodes statistiques intensives. Nous avons utilisé l implémentation CPU comme références à bien montrer que l overhead de R est très élevé quand la taille de problème devient grande. Nous trouvons que ce genre de logiciel métier ne peut plus satisfaire les besoins du statisticien pour traiter des millions de données efficacement aujourd hui. Cela confirme la motivation de notre projet dont l objectif est de produire un logiciel statistique adapté à Big data. De plus, pendant ce stage, nous avons comparé expérimentalement les performances de multi-cœur et GPU en fonction de tailles. Nous avons montré que la performance de GPU est meilleur qu un processeur de 12 cœurs quand il y a assez de données. 22

23 4.2 Bilan d apport du stage D abord, j ai appris deux méthodes statistiques très utilisée dans le domaine médical : Bootstrap et Imputation Multiple. Ce stage m a permis de découvrir le parallélisme potentiel de statistique et d appliquer GPGPU dans le domaine statistique. Pour pouvoir étudier et comparer la performance de différentes architectures, j ai utilisé beaucoup de bibliothèques à exploiter la parallélisation, par exemple, CURAND,Thrust, Blas, MKL, Magma... Ensuite, pendant ce stage, j ai eu la chance à connaître comment utiliser le logiciel R pour traiter et analyser des problèmes statistiques. J ai mesuré le temps d exécution de chaque méthode sous R et les ai utilisé à comparer avec GPU et multi-cœur. Enfin, ce stage était un stage multidisciplinaire, j ai eu la chance de travailler avec des statisticiens, informaticiens et des experts de compilation, qui me permettait d élargir mes connaissances dans différents domaines et d augmenter mon niveau de communication et collaboration. 23

24 Bibliographie [r12] R Core Team, R: A Language and Environment for Statistical Computing. R Foundation for Statistical Computing, Vienna, Austria, ISBN , [nv10] Nvidia, C. U. D. A. (2010). Curand library. [tm14] Sloan, T. M., Piotrowski, M., Forster, T., & Ghazal, P. (2014). Parallel Optimisation of Bootstrapping in R. arxiv preprint arxiv: [jh08] Hill, J., Hambley, M., Forster, T., Mewissen, M., Sloan, T. M., Scharinger, F.,... & Ghazal, P. (2008). SPRINT: A new parallel framework for R. BMC bioinformatics, 9(1), 558. [sm98] Snir, M. (Ed.). (1998). MPI--the Complete Reference: The MPI core (Vol. 1). MIT press. [ru91] Rubin, D. B., & Schenker, N. (1991). Multiple imputation in health are databases: An overview and some applications. Statistics in medicine, 10(4), [cm91] Charles Manski, «Regression», Journal of Economic Literature, vol. 29,n o 1, mars 1991, p [bl02] Blackford, L. S., Petitet, A., Pozo, R., Remington, K., Whaley, R. C., Demmel, J.,... & Lumsdaine, A. (2002). An updated set of basic linear algebra subprograms (BLAS). ACM Transactions on Mathematical Software, 28(2), [an99] Anderson, E., Bai, Z., Bischof, C., Blackford, S., Demmel, J., Dongarra, J.,... & Sorensen, D. (1999). LAPACK Users' guide (Vol. 9). Siam. [do14] Dongarra, J., Gates, M., Haidar, A., Kurzak, J., Luszczek, P., Tomov, S., Yamazaki, I."Accelerating Numerical Dense Linear Algebra Calculations with GPUs," Numerical Calculations with GPUs, Volodymyr Kindratenko, eds., eds. Springer International Publishing, pp. 3-28, July, [intel05] Intel, M. K. L. (2005). Intel math kernel library, linear solvers basics. 24

25 Annexe 1. Le temps d exécution de bootstrap (en seconde) Size Time R Boot() CPU GPU MC_6 MC_8 MC_10 MC_12 1*10^ *10^ *10^ *10^ *10^

26 2. Le temps d exécution de l imputation multiple(en seconde) Size Time Mice() CPU GPU MC_4 MC_6 MC_8 MC_10 MC_12 10*10^ *10^ *10^ *10^ Size Time Mice() CPU GPU MC_4 MC_6 MC_8 MC_10 MC_12 100*10^ *10^ *10^ *10^ (>50H) * (>22H)

Rappels, SISD, SIMD. Calculateurs hybrides (GPU-OpenCL) Rappels, MIMD mémoire partagée. Rappels, MIMD mémoire partagée. Rappels... SISD,...

Rappels, SISD, SIMD. Calculateurs hybrides (GPU-OpenCL) Rappels, MIMD mémoire partagée. Rappels, MIMD mémoire partagée. Rappels... SISD,... Rappels, SISD, SIMD Calculateurs hybrides (GPU-OpenCL) Rappels... SISD,... SIMD Formation d Ingénieurs de l Institut Galiléee MACS 3 Philippe d Anfray Philippe.d-Anfray@cea.fr CEA DSM 2013-2014 SISD :

Plus en détail

RAPPORT DE STAGE Calcul parallèle sur GPU

RAPPORT DE STAGE Calcul parallèle sur GPU Université Joseph Fourier Département Licence Sciences & Technologie RAPPORT DE STAGE Calcul parallèle sur GPU D Aguanno Carlotta Laboratoire d accueil : INRIA Directeur du laboratoire : GROS Patrick Responsable

Plus en détail

MODELE D UN RAPPORT DE STAGE DE BAC PRO ELECTROTECHNIQUE

MODELE D UN RAPPORT DE STAGE DE BAC PRO ELECTROTECHNIQUE MODELE D UN RAPPORT DE STAGE DE BAC PRO ELECTROTECHNIQUE [Prénom Nom] Rapport sur le stage effectué du [date] au [date] Dans la Société : [NOM DE LA SOCIETE : Logo de la société] à [Ville] [Intitulé du

Plus en détail

Comparaison entre une architecture matérielle dédiée et un GP-GPU pour l optimisation

Comparaison entre une architecture matérielle dédiée et un GP-GPU pour l optimisation Comparaison entre une architecture matérielle dédiée et un GP-GPU pour l optimisation Université de Bretagne-Sud Lab-STICC, Lorient, France ROADeF Troyes, France 13-15 Février 2013 1/22 Objectifs Après

Plus en détail

Architecture des ordinateurs. Optimisation : pipeline. Pipeline (I) Pipeline (II) Exemple simplifié : Instructions de type R

Architecture des ordinateurs. Optimisation : pipeline. Pipeline (I) Pipeline (II) Exemple simplifié : Instructions de type R Architecture des ordinateurs Licence Informatique - Université de Provence Jean-Marc Talbot Optimisation : pipeline jtalbot@cmi.univ-mrs.fr L3 Informatique - Université de Provence () Architecture des

Plus en détail

CHAMPION Matthieu Modèles de Marché en Visual Basic ESILV S04 S6. Sommaire... 1. Introduction... 2

CHAMPION Matthieu Modèles de Marché en Visual Basic ESILV S04 S6. Sommaire... 1. Introduction... 2 Sommaire Sommaire... 1 Introduction... 2 1 Trois différentes techniques de pricing... 3 1.1 Le modèle de Cox Ross Rubinstein... 3 1.2 Le modèle de Black & Scholes... 8 1.3 Méthode de Monte Carlo.... 1

Plus en détail

Programmation multigpu OpenMP versus MPI

Programmation multigpu OpenMP versus MPI 17 février 2011 Gabriel Noaje Programmation multigpu OpenMP versus OpenMP 1 Programmation multigpu OpenMP versus MPI Gabriel Noaje, Michaël Krajecki, Christophe Jaillet gabriel.noaje@univ-reims.fr Équipe

Plus en détail

Problématique des accès mémoires irréguliers causés par les maillages non structurés :

Problématique des accès mémoires irréguliers causés par les maillages non structurés : Problématique des accès mémoires irréguliers causés par les maillages non structurés :! étude comparative entre les machines massivement multicoeurs et les GPU Loïc Maréchal / INRIA! LJLL, Demi-Journée

Plus en détail

GPU, processeurs multi-coeurs et bio-informatique

GPU, processeurs multi-coeurs et bio-informatique GPU, processeurs multi-coeurs et bio-informatique Jean-Stéphane Varré jean-stephane.varre@lifl.fr Equipe BONSAI Université Lille 1 - LIFL -INRIA Qu est-ce que c est? Le processeur (CPU) La carte graphique

Plus en détail

Architecture des calculateurs

Architecture des calculateurs Chapitre 1 Architecture des calculateurs 1.1 Introduction Ce paragraphe n a pas la prétention de présenter un cours d informatique. D une manière générale, seuls les caractéristiques architecturales qui

Plus en détail

Analyse des textures en temps réel exploitant une architecture parallèle multi-coeurs et GPU

Analyse des textures en temps réel exploitant une architecture parallèle multi-coeurs et GPU Analyse des textures en temps réel exploitant une architecture parallèle multi-coeurs et GPU Moulay Akhloufi, MScA, MBA (moulay.akhloufi@crvi.ca ) Gilles Champagne (gilles.champagne@crvi.ca) Mario Jr Laframboise

Plus en détail

Plan : Master IM2P2 - Calcul Scientifique

Plan : Master IM2P2 - Calcul Scientifique Plan : Les systèmes HPC Typologie des systèmes : Machines Mémoire partagée Machines à Mémoire Distribuées Machine NUMA Exemples Architectures Processeurs HPC Processeurs scalaires, superscalaires, vectoriels

Plus en détail

Xeon Phi au CRIHAN. Patrick BOUSQUET-MÉLOU (pbm@crihan.fr) 16 Juin 2015

Xeon Phi au CRIHAN. Patrick BOUSQUET-MÉLOU (pbm@crihan.fr) 16 Juin 2015 Xeon Phi au CRIHAN Patrick BOUSQUET-MÉLOU (pbm@crihan.fr) 16 Juin 2015 Objectifs Veille technologique architecture many-core Se former pour préparer les utilisateurs au Xeon Phi «Knights Landing» (2016)

Plus en détail

ELECTRONIQUE INDUSTRIELLE (243.06) OPTION ÉLECTRODYNAMIQUE Principe des micro-ordinateur (243-834-92) Présenté par Steve Dionne.

ELECTRONIQUE INDUSTRIELLE (243.06) OPTION ÉLECTRODYNAMIQUE Principe des micro-ordinateur (243-834-92) Présenté par Steve Dionne. ELECTRONIQUE INDUSTRIELLE (243.06) OPTION ÉLECTRODYNAMIQUE Principe des micro-ordinateur (243-834-92) Présenté par Steve Dionne À Mario Michaud Remis le 10 septembre automne 2002 Table des matière : Description

Plus en détail

Faire des simulations au DMS

Faire des simulations au DMS (lorsque l on est statisticien) P. Lafaye de Micheaux 1 1 Département de Mathématiques et de Statistique Université de Montréal Séminaire midi, 2010 Plan de la présentation 1 Motivation/Objectif 2 3 C/C++

Plus en détail

Solveur linéaire sur GPU

Solveur linéaire sur GPU Thomas JOST 1 Sylvain CONTASSOT-VIVIER 1,2 Stéphane VIALLE 1,3 1 Équipe AlGorille, LORIA 2 Université Henri Poincaré Nancy 1 3 Équipe IMS Supélec (Metz) 1 Introduction 2 Contraintes et algorithmes Structure

Plus en détail

Chapitre 3 : INFERENCE

Chapitre 3 : INFERENCE Chapitre 3 : INFERENCE 3.1 L ÉCHANTILLONNAGE 3.1.1 Introduction 3.1.2 L échantillonnage aléatoire 3.1.3 Estimation ponctuelle 3.1.4 Distributions d échantillonnage 3.1.5 Intervalles de probabilité L échantillonnage

Plus en détail

Analyse et mesure de performances du calcul distribué

Analyse et mesure de performances du calcul distribué Analyse et mesure de performances du calcul distribué Mohsine Eleuldj Département Génie Informatique, EMI eleuldj@emi.ac.ma CruCID Workshop, EMI, Rabat, 5 au 7 juillet 1999 Motivation Types d applications

Plus en détail

Parallélisme. Cours 1

Parallélisme. Cours 1 Parallélisme Cours 1 TD : 20% - TP : 30% - Examen : 50% Feuille A4 manuscrite (pas de photocopie) Fabrice.Huet@etu.unice.fr (prendre rdv par mail pr le contacter) A quoi sert le parallélisme? Augmenter

Plus en détail

Limitations of the Playstation 3 for High Performance Cluster Computing

Limitations of the Playstation 3 for High Performance Cluster Computing Introduction Plan Limitations of the Playstation 3 for High Performance Cluster Computing July 2007 Introduction Plan Introduction Intérêts de la PS3 : rapide et puissante bon marché L utiliser pour faire

Plus en détail

INSTALLATION ET CONFIGURATION POUR LA PROGRAMMATION

INSTALLATION ET CONFIGURATION POUR LA PROGRAMMATION INSTALLATION ET CONFIGURATION POUR LA PROGRAMMATION PARALLELES SOUS WINDOWS I. PREPARATION DE L ENVIRONNEMENT Tous d abord il va vous falloir télécharger quelques logiciels afin de pouvoir commencer à

Plus en détail

Enoncé des travaux pratiques. du cours OpenMP

Enoncé des travaux pratiques. du cours OpenMP Enoncé des travaux pratiques Enoncé des travaux pratiques du cours OpenMP Enoncé des travaux pratiques : description Description Les travaux pratiques se dérouleront sur les nœuds vargas (grappes de 35

Plus en détail

Analyse de la variance à deux facteurs

Analyse de la variance à deux facteurs 1 1 IRMA, Université Louis Pasteur Strasbourg, France Master 1 Psychologie du développement 06-10-2008 Contexte Nous nous proposons d analyser l influence du temps et de trois espèces ligneuses d arbre

Plus en détail

Architectures Parallèles

Architectures Parallèles Architectures Parallèles Cours pour Ingénieur Préparé par Dr. Olfa Hamdi-Larbi ola_ola79@yahoo.fr Reçoit les signaux du contrôleur, cherche les données et les traite Instructions, Données à traiter et

Plus en détail

TP3 : Tests de performance des MV

TP3 : Tests de performance des MV Ecole informatique IN2P3 2014 : Maîtriser le Cloud TP Dev : portage d applications sur le Cloud TP3 : Tests de performance des MV Cécile Cavet cecile.cavet at apc.univ-paris7.fr Centre François Arago (FACe),

Plus en détail

Introduction à la programmation GPU. P. Fortin UPMC / LIP6 ANR TaMaDi 27/10/2010

Introduction à la programmation GPU. P. Fortin UPMC / LIP6 ANR TaMaDi 27/10/2010 Introduction à la programmation GPU P. Fortin UPMC / LIP6 ANR TaMaDi 27/10/2010 Les processeurs graphiques (GPU) GPU : Graphics Processing Unit GPGPU : General Purpose computation on Graphics Processing

Plus en détail

LOAD PROFILING : ESTIMATION D UNE COURBE DE CONSOMMATION ET PRECISION D ESTIMATION

LOAD PROFILING : ESTIMATION D UNE COURBE DE CONSOMMATION ET PRECISION D ESTIMATION LOAD PROFILING : ESTIMATION D UNE COURBE DE CONSOMMATION ET PRECISION D ESTIMATION Olivier Chaouy EDF R&D 1, avenue du Général de Gaulle - 92141 Clamart Cedex - France olivier.chaouy@edf.fr Résumé : Le

Plus en détail

Programmation efficace des multicœurs Application a la visualisation scientifique

Programmation efficace des multicœurs Application a la visualisation scientifique Programmation efficace des multicœurs Application a la visualisation scientifique Marc Tchiboukdjian Doctorant 3e me anne e Jean-Philippe Nomine Encadrant CEA Vincent Danjean Directeur de the se Bruno

Plus en détail

Délégation GPU des perceptions agents : application aux boids de Reynolds

Délégation GPU des perceptions agents : application aux boids de Reynolds Délégation GPU des perceptions agents : application aux boids de Reynolds JFSMA 2015 LIRMM - Université de Montpellier - CNRS Emmanuel Hermellin, Fabien Michel {hermellin, fmichel}@lirmm.fr Mercredi 1

Plus en détail

Rapport d activité. Mathieu Souchaud Juin 2007

Rapport d activité. Mathieu Souchaud Juin 2007 Rapport d activité Mathieu Souchaud Juin 2007 Ce document fait la synthèse des réalisations accomplies durant les sept premiers mois de ma mission (de novembre 2006 à juin 2007) au sein de l équipe ScAlApplix

Plus en détail

Mises en relief. Information supplémentaire relative au sujet traité. Souligne un point important à ne pas négliger.

Mises en relief. Information supplémentaire relative au sujet traité. Souligne un point important à ne pas négliger. Cet ouvrage est fondé sur les notes d un cours dispensé pendant quelques années à l Institut universitaire de technologie de Grenoble 2, au sein du Département statistique et informatique décisionnelle

Plus en détail

Kick-off ANR Compass

Kick-off ANR Compass Kick-off ANR Compass Contribution MDLS Pierre Kestener CEA-Saclay, DSM, France Maison de la Simulation Meudon, 14 mars 2013 1 / 10 La Maison de la Simulation Laboratoire de recherche pluridisciplinaire

Plus en détail

Implémentation et Benchmark. d une régression linéaire en RMR2

Implémentation et Benchmark. d une régression linéaire en RMR2 Add intelligence to data Anne Gayet Directrice Datamining Implémentation et Benchmark d une régression linéaire en RMR2 16 janvier 2014 Rendez-vous SFdS: : Méthodes et logiciels Données massives (big data)

Plus en détail

Les données massives à Calcul Québec

Les données massives à Calcul Québec Les données massives à Calcul Québec Marc Parizeau, professeur et directeur scientifique de Calcul Québec Plan Calcul Québec / Calcul Canada Les outils et les services disponibles Un outil en particulier

Plus en détail

Présentation CaSciModOT Performances et Architectures

Présentation CaSciModOT Performances et Architectures Présentation CaSciModOT Performances et Architectures Code parallèle : Un peu de théorie Architectures variables : C(n,p)? Quel code? Quelle architecture? Structure d un code : partie parallèle / séquentielle

Plus en détail

LES SOLUTIONS MES HUMAINES METTENT EN AVANT LES INDIVIDUS

LES SOLUTIONS MES HUMAINES METTENT EN AVANT LES INDIVIDUS LIVRE BLANC LES SOLUTIONS MES HUMAINES METTENT EN AVANT LES INDIVIDUS Une collaboration entre homme et machine LIVRE BLANC LES SOLUTIONS MES HUMAINES METTENT EN AVANT LES INDIVIDUS 2 A PROPOS Les hommes

Plus en détail

Utilisation du logiciel OpMat Ce logiciel effectue des opérations élémentaires sur les lignes d une matrice avec des entrées rationnelles

Utilisation du logiciel OpMat Ce logiciel effectue des opérations élémentaires sur les lignes d une matrice avec des entrées rationnelles Utilisation du logiciel OpMat Ce logiciel effectue des opérations élémentaires sur les lignes d une matrice avec des entrées rationnelles Michel Bouchard, enseignant retraité, Département de mathématiques,

Plus en détail

MMA - Projet Capacity Planning LOUVEL Cédric. Annexe 1

MMA - Projet Capacity Planning LOUVEL Cédric. Annexe 1 Annexe 1 Résumé Gestion Capacity Planning Alternance réalisée du 08 Septembre 2014 au 19 juin 2015 aux MMA Résumé : Ma collaboration au sein de la production informatique MMA s est traduite par une intégration

Plus en détail

Comment mesurer les temps de calcul de vos programmes? Bonne pratique et pièges à éviter

Comment mesurer les temps de calcul de vos programmes? Bonne pratique et pièges à éviter Comment mesurer les temps de calcul de vos programmes? Bonne pratique et pièges à éviter Caroline Prodhon (carolineprodhon@hotmail.com) Philippe Lacomme (placomme@isima.fr) Ren Libo (ren@isima.fr) Remerciements

Plus en détail

6GEI500 Signaux et systèmes. Laboratoire #2

6GEI500 Signaux et systèmes. Laboratoire #2 6GEI500 Signaux et systèmes Laboratoire #2 Analyse en fréquences avec MATLAB Automne 2009. Objectifs Se familiariser avec l analyse en fréquences avec MATLAB Explorer le phénomène de Gibbs Faire une analyse

Plus en détail

Arithmétique des corps finis dans la bibliothèque LinBox

Arithmétique des corps finis dans la bibliothèque LinBox Arithmétique des corps finis dans la bibliothèque LinBox Pascal Giorgi & Gilles Villard Équipe Arénaire Laboratoire de l informa tique du parallélisme ENS lyon - CNRS - INRIA Introduction Il existe déjà

Plus en détail

SCI03 - Analyse de données expérimentales

SCI03 - Analyse de données expérimentales SCI03 - Analyse de données expérimentales Introduction à la statistique Thierry Denœux 1 1 Université de Technologie de Compiègne tél : 44 96 tdenoeux@hds.utc.fr Automne 2014 Qu est ce que la statistique?

Plus en détail

Chap. 2 - Structure d un ordinateur

Chap. 2 - Structure d un ordinateur Architecture des ordinateurs Michèle Courant S2-27 octobre 2004 Chap. 2 - Structure d un ordinateur 2.1 Processeur ou unité centrale (CPU) 2.1.1 Organisation du CPU 2.1.2 Exécution d une instruction 2.1.3

Plus en détail

2. Optimisation de l'exponentiation modulaire

2. Optimisation de l'exponentiation modulaire Timing attack et hyperthreading Les processeurs modernes sont de plus en plus compliqués et difficiles à mettre en œuvre. Qu en est il de la sécurité des implémentations? Peut on exploiter les avancées

Plus en détail

Communications performantes par passage de message entre machines virtuelles co-hébergées

Communications performantes par passage de message entre machines virtuelles co-hébergées Communications performantes par passage de message entre machines virtuelles co-hébergées François Diakhaté1,2 1 CEA/DAM Île de France 2 INRIA Bordeaux Sud Ouest, équipe RUNTIME Renpar 2009 1 Plan Introduction

Plus en détail

MATHÉMATIQUES FINANCIÈRES I

MATHÉMATIQUES FINANCIÈRES I MATHÉMATIQUES FINANCIÈRES I Deuxième cours Rappel: Intérêt Rappel: Intérêt Fonction de capitalisation 1 Rappel: Intérêt Fonction de capitalisation Fonction d accumulation Rappel: Intérêt Fonction de capitalisation

Plus en détail

Une dérivation du paradigme de réécriture de multiensembles pour l'architecture de processeur graphique GPU

Une dérivation du paradigme de réécriture de multiensembles pour l'architecture de processeur graphique GPU Une dérivation du paradigme de réécriture de multiensembles pour l'architecture de processeur graphique GPU Gabriel Antoine Louis Paillard Ce travail a eu le soutien de la CAPES, agence brésilienne pour

Plus en détail

Fabien DONIUS, Nicolas GRILL, Chérine KAMEL, Selim MILED - Ing1 Gr4 ANALYSE MATHEMATIQUE GOLAY (24,12,8) Les codes correcteurs d erreur

Fabien DONIUS, Nicolas GRILL, Chérine KAMEL, Selim MILED - Ing1 Gr4 ANALYSE MATHEMATIQUE GOLAY (24,12,8) Les codes correcteurs d erreur Fabien DONIUS, Nicolas GRILL, Chérine KAMEL, Selim MILED - Ing1 Gr4 ANALYSE MATHEMATIQUE GOLAY (24,12,8) Les codes correcteurs d erreur 2 I. Génération des matrices : Le code de Golay, comme le code de

Plus en détail

11. Tests d hypothèses (partie 1/2)

11. Tests d hypothèses (partie 1/2) 11. Tests d hypothèses (partie 1/2) MTH2302D S. Le Digabel, École Polytechnique de Montréal H2015 (v1) MTH2302D: tests d hypothèses 1/30 Plan 1. Introduction 2. Hypothèses et erreurs 3. Tests d hypothèses

Plus en détail

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p. STATISTIQUE THÉORIQUE ET APPLIQUÉE Tome 2 Inférence statistique à une et à deux dimensions Pierre Dagnelie TABLE DES MATIÈRES Bruxelles, De Boeck, 2011, 736 p. ISBN 978-2-8041-6336-5 De Boeck Services,

Plus en détail

Développement de méthodes multi-grilles dans le cadre de l intéraction pastille/gaine

Développement de méthodes multi-grilles dans le cadre de l intéraction pastille/gaine Développement de méthodes multi-grilles dans le cadre de l intéraction pastille/gaine January 25, 2011 Ce n est le bon chemin que si la flèche vise le coeur, R.Hauser Intéraction Pastille/Gaine Fonctionnement

Plus en détail

Les Microprocesseurs partie2

Les Microprocesseurs partie2 Université Constantine 2 Abdelhamid Mehri Faculté des NTIC Département MI Electronique des Composants & Systèmes Les Microprocesseurs partie2 Cours de L1 - TRONC COMMUN DOMAINE MATHEMATIQUES INFORMATIQUE

Plus en détail

Développement itératif, évolutif et agile

Développement itératif, évolutif et agile Document Développement itératif, évolutif et agile Auteur Nicoleta SERGI Version 1.0 Date de sortie 23/11/2007 1. Processus Unifié Développement itératif, évolutif et agile Contrairement au cycle de vie

Plus en détail

Introduction à l approche bootstrap

Introduction à l approche bootstrap Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?

Plus en détail

Évaluation et implémentation des langages

Évaluation et implémentation des langages Évaluation et implémentation des langages Les langages de programmation et le processus de programmation Critères de conception et d évaluation des langages de programmation Les fondations de l implémentation

Plus en détail

Evolution des technologies de calcul intensif vers les systèmes multi-cœurs et accélérateurs

Evolution des technologies de calcul intensif vers les systèmes multi-cœurs et accélérateurs Evolution des technologies de calcul intensif vers les systèmes multi-cœurs et accélérateurs Marc Mendez-Bermond Expert solutions HPC Programme Contexte Technologies Evolutions 2 Confidentiel Research

Plus en détail

Analyse de performance et optimisation. David Geldreich (DREAM)

Analyse de performance et optimisation. David Geldreich (DREAM) Analyse de performance et optimisation David Geldreich (DREAM) Plan de l exposé Analyse de performance Outils Optimisation Démonstrations Analyse de performance Pas d optimisation sans analyse de performance

Plus en détail

Comment améliorer les performances de vos applications LabVIEW

Comment améliorer les performances de vos applications LabVIEW Comment améliorer les performances de vos applications LabVIEW Antoine PALLADINI Responsable de Projets ARCALE france.ni.com ARCALE propose des prestations dans les domaines du test et mesure et de l embarqué

Plus en détail

Etude d Algorithmes Parallèles de Data Mining

Etude d Algorithmes Parallèles de Data Mining REPUBLIQUE TUNISIENNE MINISTERE DE L ENSEIGNEMENT SUPERIEUR, DE LA TECHNOLOGIE ET DE LA RECHERCHE SCIENTIFIQUE UNIVERSITE DE TUNIS ELMANAR FACULTE DES SCIENCES DE TUNIS DEPARTEMENT DES SCIENCES DE L INFORMATIQUE

Plus en détail

Le voyageur de commerce

Le voyageur de commerce Université de Strasbourg UFR Maths-Informatique Licence 3 - Semestre 6 Le voyageur de commerce Jonathan HAEHNEL & Marc PAPILLON Strasbourg, le 3 mai 2012 Table des matières 1 Etat des lieux 4 1.1 Fonctionnalités..............................

Plus en détail

Rapport de stage. Création d un site web. Stage du 20/01/2013 au 21/02/2013

Rapport de stage. Création d un site web. Stage du 20/01/2013 au 21/02/2013 Rapport de stage Création d un site web Stage du 20/01/2013 au 21/02/2013 Auteur : Antoine Luczak Tuteur professionnel : M. Tison Tuteur scolaire : Mme Girondon Année scolaire : 2013/2014 1 Table des matières

Plus en détail

Activité 1 : échantillonnage

Activité 1 : échantillonnage Activité échantillonnage, intervalle de fluctuation, prise de décision (à partir d un même thème) Les trois activités qui suivent s inspirent du document «ressources pour la classe de première générale

Plus en détail

Maarch Framework 3 - Maarch. Tests de charge. Professional Services. http://www.maarch.fr. 11, bd du Sud Est 92000 Nanterre

Maarch Framework 3 - Maarch. Tests de charge. Professional Services. http://www.maarch.fr. 11, bd du Sud Est 92000 Nanterre Maarch Professional Services 11, bd du Sud Est 92000 Nanterre Tel : +33 1 47 24 51 59 Fax : +33 1 47 24 54 08 Maarch Framework 3 - Maarch PS anime le développement d un produit d archivage open source

Plus en détail

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures) CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un

Plus en détail

MÉTHODES ET STATISTIQUES POUR LIRE UN ARTICLE

MÉTHODES ET STATISTIQUES POUR LIRE UN ARTICLE MÉTHODES ET STATISTIQUES POUR LIRE UN ARTICLE Forum HH 05.02.2013 Ghislaine Gagnon Unité HPCI Qualitatif ou quantitatif? Les 2 méthodes peuvent être utilisées séparément ou en conjonction - le qualitatif

Plus en détail

Projet informatique «Voyageur de commerce» Résolution approchée par algorithme génétique du problème du voyageur de commerce

Projet informatique «Voyageur de commerce» Résolution approchée par algorithme génétique du problème du voyageur de commerce Année 2007-2008 Projet informatique «Voyageur de commerce» Résolution approchée par algorithme génétique du problème du voyageur de commerce B. Monsuez Projet informatique «Voyageur de commerce» Résolution

Plus en détail

Chapitre VI Échantillonages et simulations

Chapitre VI Échantillonages et simulations Chapitre VI Commentaires : Récursivement, les commentaires ne sont pas à l attention des élèves.. Fluctuation d échantillonnage Définition : En statistiques, un échantillon de taille n est la liste des

Plus en détail

Elma m l a ki i Haj a a j r a Alla a Tao a uf u i f q B ur u kkad a i i Sal a ma m n a e n e Be B n e a n b a d b en e b n i b i Il I ham

Elma m l a ki i Haj a a j r a Alla a Tao a uf u i f q B ur u kkad a i i Sal a ma m n a e n e Be B n e a n b a d b en e b n i b i Il I ham Exposé: la technique de simulation MONTE-CARLO Présenté par : Elmalki Hajar Bourkkadi Salmane Alla Taoufiq Benabdenbi Ilham Encadré par : Prof. Mohamed El Merouani Le plan Introduction Définition Approche

Plus en détail

Solveurs linéaires sur GPU pour la simulation d'écoulement en milieux poreux

Solveurs linéaires sur GPU pour la simulation d'écoulement en milieux poreux CO 2 maîtrisé Carburants diversifiés Véhicules économes Raffinage propre Réserves prolongées Solveurs linéaires sur GPU pour la simulation d'écoulement en milieux poreux J-M. Gratien,, M. Hacene, T. Guignon

Plus en détail

Initiation au HPC - Généralités

Initiation au HPC - Généralités Initiation au HPC - Généralités Éric Ramat et Julien Dehos Université du Littoral Côte d Opale M2 Informatique 2 septembre 2015 Éric Ramat et Julien Dehos Initiation au HPC - Généralités 1/49 Plan du cours

Plus en détail

Encryptions, compression et partitionnement des données

Encryptions, compression et partitionnement des données Encryptions, compression et partitionnement des données Version 1.0 Grégory CASANOVA 2 Compression, encryption et partitionnement des données Sommaire 1 Introduction... 3 2 Encryption transparente des

Plus en détail

V ERSION EXPERIMENTALE

V ERSION EXPERIMENTALE V ERSION EXPERIMENTALE Cette version de Sipina v 3.0 n est pas, et ne sera jamais, définitive, elle sert d outil de recherche, elle a plus une vocation d outil d expérimentation que de logiciel dédié au

Plus en détail

Historique. Évolution des systèmes d exploitation (à travers les âges)

Historique. Évolution des systèmes d exploitation (à travers les âges) Historique Évolution des systèmes d exploitation (à travers les âges) Historique L histoire des systèmes d exploitation permet de dégager des concepts de base que l on retrouve dans les systèmes actuels

Plus en détail

LOGICIEL version pro Nouvelle version 2.0

LOGICIEL version pro Nouvelle version 2.0 LOGICIEL version pro Nouvelle version 2.0 Présentation : Avec le logiciel CHEVALENOR vous aurez l outil indispensable pour analyser et pour bien gérer vos mises sur les pronostiques quinté+ du site http://www.lechevalenor.fr/.

Plus en détail

CPU ou UCT. Le processeur est une unité d exécution, plus précisément appelée unité centrale de traitement (désignée en franç.

CPU ou UCT. Le processeur est une unité d exécution, plus précisément appelée unité centrale de traitement (désignée en franç. CPU ou UCT Processor (data processing) Le processeur est une unité d exécution, plus précisément appelée unité centrale de traitement (désignée en franç.par UCT, en ang. CPU (Central Processing Unit) CPU+mémoire

Plus en détail

Mémoire virtuelle. Généralités

Mémoire virtuelle. Généralités Mémoire virtuelle Généralités La pagination pure - Conversion d adresses virtuelles en adresses physiques - Table des pages à plusieurs niveau et table inversée - Algorithmes de remplacement de page -

Plus en détail

ETNA Projet de Fin d Étude 2005-2007 RimElse Cahier des charges. c Copyleft 2006, ELSE Team

ETNA Projet de Fin d Étude 2005-2007 RimElse Cahier des charges. c Copyleft 2006, ELSE Team ETNA Projet de Fin d Étude 2005-2007 RimElse Cahier des charges c Copyleft 2006, ELSE Team 18 avril 2006 Table des matières 1 Introduction 2 2 Présentation du projet 3 2.1 Une distribution Évolulable..................

Plus en détail

Introduction aux systèmes d exploitation

Introduction aux systèmes d exploitation Introduction aux systèmes d exploitation Le système d exploitation est un ensemble de logiciels qui pilotent la partie matérielle d un ordinateur. Les principales ressources gérées par un système d exploitation

Plus en détail

Système. Introduction aux systèmes informatiques

Système. Introduction aux systèmes informatiques Introduction aux systèmes informatiques Système Un système est une collection organisée d'objets qui interagissent pour former un tout Objets = composants du système Des interconnexions (liens) entre les

Plus en détail

Didacticiel - Etudes de cas. Montrer l utilisation de la macro complémentaire TANAGRA.XLA dans le tableur EXCEL.

Didacticiel - Etudes de cas. Montrer l utilisation de la macro complémentaire TANAGRA.XLA dans le tableur EXCEL. Objectif Montrer l utilisation de la macro complémentaire TANAGRA.XLA dans le tableur EXCEL. De nombreux utilisateurs s appuient sur EXCEL pour la gestion de leurs données. C est un outil relativement

Plus en détail

Etude et mise en oeuvre de PREEMPT-RT et Xenomai sur cible DSP Blackfin BF537

Etude et mise en oeuvre de PREEMPT-RT et Xenomai sur cible DSP Blackfin BF537 ENSEIRB-MATMECA Rapport de projet avancé 3 ème année électronique Etude et mise en oeuvre de PREEMPT-RT et Xenomai sur cible DSP Blackfin BF537 Etudiants : Alexandre Braconnier Axel Chevalier Jean-Marc

Plus en détail

Protocole d étude de l évaluation des résultats des centres de FIV 2011 1. -Activité 2011-

Protocole d étude de l évaluation des résultats des centres de FIV 2011 1. -Activité 2011- Protocole d étude Evaluation des résultats des centres de FIV -Activité 2011- Contexte Depuis 2005, l Agence de la biomédecine a pour mission de suivre et d évaluer les activités cliniques et biologiques

Plus en détail

Plus De Cartouches 2013/2014

Plus De Cartouches 2013/2014 Plus De Cartouches 2013/2014 Page 1 SOMMAIRE INTRODUCTION ET PRESENTATION...3 MISSIONS...4 LE CONTEXTE DES MISSIONS...4 LES OBJECTIFS...4 LES CONTRAINTES...5 REALISATIONS...6 CHOIX EFFECTUÉS...6 RÉSULTATS...10

Plus en détail

L EXPLORATEUR DE DONNEES «DATA EXPLORER»

L EXPLORATEUR DE DONNEES «DATA EXPLORER» L EXPLORATEUR DE DONNEES «DATA EXPLORER» Avec l arrivée de l explorateur de données dans SAS Enterprise Guide, vous allez pouvoir explorer le contenu de vos sources de données sans les ajouter à votre

Plus en détail

Support avancé pour les entreprises. 4èmes journées mésocentres 20/21 Septembre 2011

Support avancé pour les entreprises. 4èmes journées mésocentres 20/21 Septembre 2011 Support avancé pour les entreprises 4èmes journées mésocentres 20/21 Septembre 2011 Patrick BOUSQUET-MÉLOU CRIHAN - Centre de Ressources Informatiques de Haute-Normandie Introduction Pôle Régional de Modélisation

Plus en détail

Cours et applications

Cours et applications MANAGEMENT SUP Cours et applications 3 e édition Farouk Hémici Mira Bounab Dunod, Paris, 2012 ISBN 978-2-10-058279-2 Table des matières Introduction 1 1 Les techniques de prévision : ajustements linéaires

Plus en détail

Conditions d application des méthodes statistiques paramétriques :

Conditions d application des méthodes statistiques paramétriques : Conditions d application des méthodes statistiques paramétriques : applications sur ordinateur GLELE KAKAÏ R., SODJINOU E., FONTON N. Cotonou, Décembre 006 Conditions d application des méthodes statistiques

Plus en détail

Méthodes de Monte-Carlo Simulation de grandeurs aléatoires

Méthodes de Monte-Carlo Simulation de grandeurs aléatoires Méthodes de Monte-Carlo Simulation de grandeurs aléatoires Master Modélisation et Simulation / ENSTA TD 1 2012-2013 Les méthodes dites de Monte-Carlo consistent en des simulations expérimentales de problèmes

Plus en détail

ENSEIRB-MATMECA PG-113 2014. TP6: Optimisation au sens des moindres carrés

ENSEIRB-MATMECA PG-113 2014. TP6: Optimisation au sens des moindres carrés ENSEIRB-MATMECA PG-113 014 TP6: Optimisation au sens des moindres carrés Le but de ce TP est d implémenter une technique de recalage d images qui utilise une méthode vue en cours d analyse numérique :

Plus en détail

Introduction à Rcommander

Introduction à Rcommander Introduction à Rcommander Pauline Scherdel Septembre 2014 Table des matières 1 Introduction à Rcmdr sous R 2 2 Interagir avec R 3 3 Installer et charger le package Rcmdr sous R 3 4 Importation des données

Plus en détail

Poker. A rendre pour le 25 avril

Poker. A rendre pour le 25 avril Poker A rendre pour le 25 avril 0 Avant propos 0.1 Notation Les parties sans * sont obligatoires (ne rendez pas un projet qui ne contient pas toutes les fonctions sans *). Celles avec (*) sont moins faciles

Plus en détail

Introduction au cours STA 102 Analyse des données : Méthodes explicatives

Introduction au cours STA 102 Analyse des données : Méthodes explicatives Analyse des données - Méthodes explicatives (STA102) Introduction au cours STA 102 Analyse des données : Méthodes explicatives Giorgio Russolillo giorgio.russolillo@cnam.fr Infos et support du cours Slide

Plus en détail

CREER UNE BASE DE DONNEES ACCESS AVEC DAO (étape par étape)

CREER UNE BASE DE DONNEES ACCESS AVEC DAO (étape par étape) CREER UNE BASE DE DONNEES ACCESS AVEC DAO (étape par étape) NIVEAU : PREMIERE RENCONTRE AVEC VB INITIES/EXPERIMENTES Pré requis pour comprendre ce tutorial : - Connaître les principales commandes de VB

Plus en détail

Le bootstrap expliqué par l exemple

Le bootstrap expliqué par l exemple Le bootstrap expliqué par l exemple 1 Le bootstrap expliqué par l exemple 1. Les concepts du bootstrap 2. Des variantes adaptées au contexte 3. Comparaison des différentes méthodes 4. Les cas sensibles

Plus en détail

6761 Validation de la conformité 21.03.2007

6761 Validation de la conformité 21.03.2007 6761 Validation de la conformité 21.03.2007 Peter DAEHNE 1 Tests de stress Les tests de stress permettent d étudier le comportement du logiciel lorsque celui-ci est mis dans des situations extrêmes, aux

Plus en détail

Primitives Cours maths Terminale S

Primitives Cours maths Terminale S Primitives Cours maths Terminale S Dans ce module est introduite la notion de primitive d une fonction sur un intervalle. On définit cette notion puis on montre qu une fonction admet une infinité de primitives

Plus en détail

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

NOTE SUR LA MODELISATION DU RISQUE D INFLATION NOTE SUR LA MODELISATION DU RISQUE D INFLATION 1/ RESUME DE L ANALYSE Cette étude a pour objectif de modéliser l écart entre deux indices d inflation afin d appréhender le risque à très long terme qui

Plus en détail

I] ETUDE STATISTIQUES SIMPLE

I] ETUDE STATISTIQUES SIMPLE INTRODUCTION Scilab (contraction de Scientific Laboratory) est un logiciel libre, développé à l'inria Rocquencourt. C'est un environnement de calcul numérique qui permet d'effectuer rapidement toutes les

Plus en détail

Modèles à Événements Discrets. Réseaux de Petri Stochastiques

Modèles à Événements Discrets. Réseaux de Petri Stochastiques Modèles à Événements Discrets Réseaux de Petri Stochastiques Table des matières 1 Chaînes de Markov Définition formelle Idée générale Discrete Time Markov Chains Continuous Time Markov Chains Propriétés

Plus en détail