ETUDE ET IMPLÉMENTATION D UNE CACHE L2 POUR MOBICENTS JSLEE



Documents pareils
Cloud Computing : Utiliser Stratos comme PaaS privé sur un cloud Eucalyptus

Cloud Computing Maîtrisez la plate-forme AWS - Amazon Web Services

Bonjour. Yohan PARENT, Cyprien FORTINA, Maxime LEMAUX, Hyacinthe CARTIAUX

Le cloud computing au service des applications cartographiques à haute disponibilité

CNAM Déploiement d une application avec EC2 ( Cloud Amazon ) Auteur : Thierry Kauffmann Paris, Décembre 2010

Cloud Computing : Généralités & Concepts de base

Chapitre 4: Introduction au Cloud computing

Systèmes Répartis. Pr. Slimane Bah, ing. PhD. Ecole Mohammadia d Ingénieurs. G. Informatique. Semaine Slimane.bah@emi.ac.ma

LES SOLUTIONS OPEN SOURCE RED HAT

Cloud et SOA La présence du Cloud révolutionne-t-elle l approche SOA?

Défi Cloud Computing

Informatique en nuage Cloud Computing. G. Urvoy-Keller

Notre Catalogue des Formations IT / 2015

Université de Liège Faculté des Sciences Appliquées Institut Montefiore ETUDE DES FRAMEWORK DISTRIBUÉS DE GRILLES DE DONNÉES

et Groupe Eyrolles, 2006, ISBN :

Technologies du Web. Ludovic DENOYER - ludovic.denoyer@lip6.fr. Février 2014 UPMC

La tête dans les nuages

Vers l'orchestration de grilles de PC par les mécanismes de publicationsouscription

EMC Forum EMC ViPR et ECS : présentation des services software-defined

Cloud Computing, Fondamentaux, Usage et solutions

Technologie SDS (Software-Defined Storage) de DataCore

FAMILLE EMC VPLEX. Disponibilité continue et mobilité des données dans et entre les datacenters

Anatomie d'un cloud IaaS Représentation simplifiée

<Insert Picture Here> Maintenir le cap avec Oracle WebLogic Server

25 septembre Migration des accès au Registre national en protocole X.25 vers le protocole TCP/IP, pour les utilisateurs du Registre national

Offre formation Big Data Analytics

Hébergement MMI SEMESTRE 4

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

Change the game with smart innovation

FAMILLE EMC VPLEX. Disponibilité continue et mobilité des données dans et entre les datacenters AVANTAGES

Dix bonnes raisons de choisir ExpressCluster en environnement virtualisé

CA Automation Suite for Data Centers

L écosystème Hadoop Nicolas Thiébaud Tuesday, July 2, 13

Orchestrer son cloud OpenStack avec Heat

Cloud Computing. Introduction. ! Explosion du nombre et du volume de données

Ecole Mohammadia d Ingénieurs Systèmes Répartis Pr. Slimane Bah, ing. PhD G. Informatique Semaine 24

Catalogue des Formations Techniques

Séminaire Partenaires Esri France 7-8 juin Paris Cloud Computing Stratégie Esri

IBM Tivoli Monitoring, version 6.1

OpenStack, l Infrastructure as a Service libre

Offres de stages 2011/2012

Concours interne d ingénieur des systèmes d information et de communication. «Session 2010» Meilleure copie "étude de cas architecture et systèmes"

Introduction aux applications réparties

Open Source Job Scheduler. Installation(s)

Consolidation. Grid Infrastructure avec la 11gR2

Le 09 et 10 Décembre 09

FAMILLE EMC RECOVERPOINT

Les environnements de calcul distribué

Pour les entreprises de taille moyenne. Descriptif Produit Oracle Real Application Clusters (RAC)

CloudBees AnyCloud : Valeur, Architecture et Technologie cloud pour l entreprise

Fusion : l interopérabilité chez Oracle

Didier RIGOLI. Freelance, services IT: Architecture et design, Gestion de projets, Management Opérationnel.

Stephan Hadinger, Sr. Mgr Solutions Architecture, AWS. Salon du Big Data 11 mars 2015

Comment promouvoir le Cloud dans l'entreprise?

+ = OpenStack Presentation. Raphaël Ferreira - enovance. Credits : Thanks to the OpenStack Guys 1

Séminaire Partenaires Esri France 6 et 7 juin 2012 Paris. ArcGIS et le Cloud. Gaëtan LAVENU

Groupe de Discussion Big Data Aperçu des technologies et applications. Stéphane MOUTON

Jean-Philippe Paquette

Business & High Technology

Cloud computing Architectures, services et risques

Plan 1/9/2013. Génération et exploitation de données. CEP et applications. Flux de données et notifications. Traitement des flux Implémentation

NOUS VOS PROJETS DE SAUVEGARDE SOLUTIONS SDS

Contributions à l expérimentation sur les systèmes distribués de grande taille

HÉBERGEMENT CLOUD & SERVICES MANAGÉS

CQP ADMINISTRATEUR DE BASES DE DONNÉES (ABD)

Master Génie des Systèmes Industriels

Programme détaillé. Administrateur de Base de Données Oracle - SQLServer - MySQL. Objectifs de la formation. Les métiers

Section I: Le Contexte du DATA CENTER Pourquoi l AGILITE est Nécessaire dans le DataCenter

SafeKit. Sommaire. Un livre blanc de Bull Evidian

NBS System et Zend Technologies Découvrez la scalabilité sans limite pour vos applications PHP grâce au Zend Cloud

Mettez les évolutions technologiques au service de vos objectifs métier

Drupal : Optimisation des performances

AVRIL Au delà de Hadoop. Panorama des solutions NoSQL

2011 et 2012 Arrow ECS. Partenaire Distribution EMEA. de l année

Oracle Maximum Availability Architecture

Optimisation WAN de classe Centre de Données

CA 2011 M. +40% de croissance 7. agences en France. Paris Lyon Nantes Bordeaux Montpellier Aix en Provence

1 JBoss Entreprise Middleware

Les technologies du Big Data

Chapitre 1. Infrastructures distribuées : cluster, grilles et cloud. Grid and Cloud Computing

Compte Rendu d intégration d application

Cours 13. RAID et SAN. 2004, Marc-André Léger

CA ARCserve r16 devance Symantec Backup Exec 2012

DU RÉSEAU AU BIG DATA UNE OFFRE GLOBALE DE GESTION DE LA DONNÉE. Bruno Fleisch - Responsable Produits Tarik Hakkou Responsable du pôle «Data»

Expérience de la mise en place s une solution de gestion de capacité pour supporter la migration des Datacenter

EXALOGIC ELASTIC CLOUD MANAGEMENT

DES SAUVEGARDES ET DES RESTAURATIONS DE DONNEES SANS CONTRAINTES DE LIEU NI DE TEMPS

Le Cloud: Mythe ou Réalité?

JOnAS 5. Serveur d application d

Cartographie des solutions BigData

ManageEngine IT360 : Gestion de l'informatique de l'entreprise

SQL Server Installation Center et SQL Server Management Studio

L'automatisation open source pour SI complexes

IBM Systems & Technology Recentrer l informatique sur l innovation plutôt que sur la maintenance

Nos stages s'adressent à tous ceux qui ont besoin d'acquérir des bases, une mise à niveau ou un perfectionnement dans les thèmes suivants :

MapReduce. Malo Jaffré, Pablo Rauzy. 16 avril 2010 ENS. Malo Jaffré, Pablo Rauzy (ENS) MapReduce 16 avril / 15

FOURNIR UN SERVICE DE BASE DE DONNÉES FLEXIBLE. Database as a Service (DBaaS)

Bull, un catalogue de service particulier pour répondre aux environnements complexes

Petit Déjeuner Pépinière du Logiciel Libre. 25 juin 2008

Les participants repartiront de cette formation en ayant une vision claire de la stratégie et de l éventuelle mise en œuvre d un Big Data.

Transcription:

Mémoires 2010-2011 www.euranova.eu MÉMOIRES ETUDE ET IMPLÉMENTATION D UNE CACHE L2 POUR MOBICENTS JSLEE Contexte : Aujourd hui la plupart des serveurs d application JEE utilise des niveaux de cache L1 L2 pour permettre un déploiement en cluster plus aisé et ainsi supporter une montée en charge importante. Différents frameworks peuvent être utilisés à cette fin, citons par exemple JBoss cache, INFINISPAN et Terracotta. Mobicents JSLEE est quant à lui un serveur d application JAVA open source orienté message et temps réel implémenté par Red Hat dans le cadre de la Communication Media Platform. Le but de cette plateforme est de pouvoir créer, déployer, et gérer des services et applications qui intègrent la voix, la vidéo et les données sur les réseaux IP et de communications. Figure 1 The Mobicents communication platform [1] La dernière version de Mobicents propose une clusterisation du serveur mais pas encore un niveau de cache pour les accès en base de données, ce qui crée un important goulot d étranglement lors de la montée en charge. Contribution : Le but de ce mémoire est d étudier (1) le container JSLEE de Red Hat et plus particulièrement l accès aux bases de données à travers les profiles, (2) les systèmes de caches distribués, (3) de proposer une architecture de cache L2 et enfin (4) d implémenter un prototype. Organisation: ce mémoire est organisé par l ULB en collaboration avec Euranova R&D. L étudiant sera accompagné par l équipe d Euranova R&D mais également par les contacts auprès de l équipe d ingénierie de Mobicents. 1/7

ETUDE ET COMPARAISON DES BASES DE DONNEES ELASTIQUES SUR CLOUD : UN MYTHE? Contexte : Aujourd hui, le cloud computing est certainement un des sujets les plus à la mode. En effet, il promet une évolution élastique de nos serveurs d applications juste par quelques simples clics sur l interface de management en y ajoutant dynamiquement de nouvelles machines virtuelles. Mais le cloud est il vraiment élastique pour tout type d applications, y compris celles qui possèdent d importantes quantités de données? Amazon propose différentes formules de stockage de données sur EC2 : les Elastic Blocs Storage (EBS) et les fichiers S3. Ces solutions n offrent pas une grande flexibilité : EBS requiert des backups dont l interruption de service n est pas contrôlée (verrous pendant les fenêtres de backup), de plus les EBS ne peuvent être montés que pour un seul nœud, ce qui expose un single point of faillure. S3 sont des systèmes de fichiers de stockage qui offrent le stockage de données via des Webservices, ce qui implique un temps de latence important surtout lorsque les écritures sont fréquentes. Depuis quelques mois d autres vendeurs arrivent sur le cloud d Amazon, mais sont ils plus élastiques et sur quelles architectures reposent ils? Figure 2 The databases on the cloud [2] Que faire lorsque l ont veut déployer différents serveurs d applications sur plusieurs nœuds EC2 partageant la même base de données? Quels types d architecture devrons nous mettre en œuvre? 2/7

Contribution : L objectif du mémoire est (1) d étudier et de décrire les différentes solutions de stockage offertes par Amazon EC2, Oracle et Mysql d un point de vue architecturale, (2) de déterminer leurs nature élastiques, (3) de les replacer dans un contexte d un cluster de serveurs d application, et enfin (4) de proposer une architecture d exposition de données sur un cluster de nœuds virtuels. Organisation: ce mémoire est organisé par l ULB en collaboration avec Euranova R&D. L étudiant sera accompagné par l équipe d Euranova R&D. 3/7

MEDIA PLATFORM ON EUCALYPTUS CLOUD Contexte : La plupart des vendeurs de serveurs d applications propose aujourd hui une image Amazon afin d utiliser leurs produits sur un cloud. D autres serveurs d'applications open source, pour la plupart, n ont pas encore été portés sur ce type d infrastructure. C est le cas de Mobicents JSLEE, un serveur d application JAVA open source orienté message et temps réel implémenté par Red Hat dans le cadre de sa Communication Media Platform. Le but de cette plateforme est de pouvoir créer, déployer, et gérer des services et applications qui intègrent la voix, vidéo et données sur les réseaux IP et de communications. Eucalyptus est l une des implémentations de cloud open source les plus connues. Eucalyptus compte déjà comme utilisateurs, la NASA, Lilly Pharma et il est à la base de l'entreprise cloud fourni par la distribution Ubuntu. Le caractère open source du framework nous permet, non seulement d étudier l architecture cloud, mais aussi d expérimenter la migration sur le cloud de certains serveurs d applications depuis l intérieur. Figure 3 The Eucalyptus cloud and cluster architecture. Contribution : L objectif du mémoire est (1) d étudier et de décrire en détail l architecture d Eucalyptus basée sur son grid, (2) de proposer l architecture nécessaire à la migration de la média platform JSLEE sur Eucalyptus, en tenant comptes des aspects de clusterisation et enfin (3) d implémenter un prototype d un serveur JSLEE sur Eucalyptus. 4/7

Organisation: ce mémoire est organisé par l ULB en collaboration avec Euranova R&D. L étudiant sera accompagné par l équipe d Euranova R&D. 5/7

ETUDE ET IMPLEMENTATION D UN ORDONNANCEUR DE JOBS SUR GRID Contexte : Les grilles de calculs (grids) sont aujourd hui utilisées dans différents domaines (bancaire, pharmaceutique, biologie moléculaire, physique appliquée, etc.). Pour suivre cette tendance, Red Hat propose un framework MRG (Messaging, Real Time, Grid), dont la partie grid est implémentée par le projet Condor, un projet open source développé par l université du Wisconsin [4]. Dans le cadre d implémentations de projets spécifiques nous avons besoins de localiser certaines données sur des nœuds particuliers du grid. C est typiquement le cas lorsque de grandes quantités de données doivent être utilisées par les jobs. Les données sont alors distribuées sur des nœuds particuliers de la grille. Dès lors nous devons étendre la politique de distribution de jobs en tenant compte de la localisation de ces données, ce que ne fait pas l ordonnanceur de Condor. Figure 4 BOINC Project: utilisation de Condor [5]. Contribution : L objectif du mémoire est (1) d étudier et de décrire l architecture du projet Condor, (2) d étudier les politiques de distribution de jobs et l implementation de l ordonnanceur, (3) étendre l algorithme de distribution en tenant compte de la localisation des données et enfin (4) de proposer un prototype et de le déployer sur une grille condor. Organisation: ce mémoire est organisé par l ULB en collaboration avec Euranova R&D. L étudiant sera accompagné par l équipe d Euranova R&D. [1] http://code.google.com/p/mobicents/ [2] http://www.cloudbzz.com/wp content/uploads/2009/07/screenhunter_0194.jpg [3] The Eucalyptus web site, http://open.eucalyptus.com [4] University of Wisconsin, http://www.wisc.edu/ 6/7

[5] Description du projet BOINC, http://ditwww.epfl.ch/sic/sa/spip/publications/spip.php?article928 STAGES: ETUDE DES «CONTINOUS QUERIES» : FROM ACADEMIC TO BUSINESS Les architectures de types EDA (Event Driven Architecture) tentent de fournir aux entreprises une réaction en temps réel de l infrastructure informatique aux contextes de l entreprise. Pour cela, ce type d architecture nécessite la mise en place de moteurs d inférence capablent de détecter des motifs d événements. De plus, le support de requêtes temporelles permet une corrélation d événements en fonction du temps. Plusieurs vendeurs comme Tibco (Tibco Business event et Tibco Event Driven SOA) ou Oracle (Aqualogic, Oracle CEP) se sont déjà positionné sur ce type de marché. Cependant, un problème demeure : être capable de pouvoir interroger, à chaque nouvel événement une base de données historiques afin d en inférer une reconnaissance de motif. Cette problématique est plus connue sous le nom de «continous queries». Pourtant un certain nombre de recherches universitaires aborde ce problème et y apporte des solutions. Le but de ce stage est de déterminer la distance qui sépare les recherches scientifiques dans ce domaine des implémentations fournies aujourd hui par les acteurs du marché (Tibco, Orcale, IBM). Le stagiaire devra dresser un état de l art du continuous querry à travers les recherches académiques menées dans ce domaine. Ensuite il devra analyser trois vendeurs (Orcacle/Bea, Tibco, Coral8), en se concentrant sur le continous query et plus particulièrement au sein des moteurs d inférence, afin de déterminer si les implémentations actuelles peuvent être améliorées. BENCHMARK DES SYSTEMES DE CACHES L2 DISTRIBUES Avec l avènement des serveurs d application JEE, il y a quelques années, la résistance à la montée en charge est devenue un élément critique du moment. La solution mise en avant par les vendeurs est la mise en réseau (cluster) de ces serveurs. Ce qui pose un important problème pour les applications dites Statefull, c'est à dire qui maintiennent un état, comme une session http par exemple, mais aussi pour les applications accédant à une base de données. C est pourquoi les systèmes de cache de nivaux 2 sont apparus. Le but de ce stage est d étudier et de comparer deux Frameworks de caches L2 distribués: INFINISPAN de Red Hat et Terracotta. Le stagiaire définira un banc d essais avec une base de données centralisée contenant d une part un schéma simple et quelques millions de tuples et d autre part un cluster d application sur différentes machines devant accéder en lecture et écriture à ces données. L objectif du stage est de décrire les architectures et les mécanismes de ces caches distribués mais aussi d établir un benchmark de comparaison. 7/7