Euranova R&D Euranova est une société Belge constituée depuis le 1er Septembre 2008. Sa vision est simple: «Être un incubateur technologique focalisé sur l utilisation pragmatique des connaissances». Les activités de recherche sont associées à des voies technologiques et à des opportunités concrètes sur le court, moyen et long terme. Euranova découple la gestion de carrière de la relation client en s appuyant notamment sur une perception entrepreneuriale de la carrière. Objet du document Nous proposons ici des mémoires dans notre département Recherche & Développement. L étudiant travaillera en collaboration avec les ingénieurs de recherche et sera amené à partager ses travaux à travers l outil de gestion de la connaissance utilisé en interne par Euranova. Contenu + Implémentation d un moteur CEP distribué haute performance sur Hadoop et Hbase...2 Approche dirigée par les modèles pour la génération d une chorégraphie distribuée à partir d un processus d orchestration BPMN...4 Etude des framework distribués de grilles de données en vue d une solution de stockage élastique dans le cloud...6 Moteur de recommendation : développement d une approche de confiance pour les services temps réel des réseaux sociaux...8 Etude et Implémentation d une architecture EDA pour le suivi en temps réel de patients d unités de soins intensifs...9 Déploiement d une infrastructure de réseau de senseurs pour des applications de détection de contexte temps-réel...11 1/13
IMPLÉMENTATION D UN MOTEUR CEP DISTRIBUÉ HAUTE PERFORMANCE SUR HADOOP ET HBASE Contexte : Les applications de détection de contexte en temps réel ont vu le jour dans les systèmes d analyse financier d observation des bourses d échange afin de reconnaître une situation particulière nécessitant une action (ordre de vente, achat, etc...). Ce type d application s est rapidement répandu à la détection de fraude, à la surveillance des réseaux et maintenant à la gestion dynamique des processus d entreprise en fonction du contexte. La détection de contexte en temps réel est rendue possible par les architectures orientées événements et par les moteurs CEP (Complex Event Procesing). Ces moteurs sont basés sur des systèmes de corrélation de données sur une StreamDB (structure de stockage dédiée à l écriture de données immutables). Illustration 1: AOL Advertising runs one of the largest online ad serving operations, serving billions of impressions each month to hundreds of millions of people [1] Aujourd hui, certaines recherches tendent à utiliser ces moteurs CEP pour la prédiction en temps réel de comportements (prédiction de consommateurs, gestion du trafic automobile d une ville, suivi de banc de baleines, etc...). Cependant, les règles et les quantités de données nécessaires sont immenses et pas du tout adaptées aux StreamDB des moteurs CEP. 2/13
D un autre côté, les architectures développées dans le monde du cloud et du web sont dévouées à ce seul but : offir une capacité de processing de données distribuée et élastique. Des framework de MapReduce comme Hadoop, des structures de données NoSQL comme HBase pour du processing distribué de grandes quantités de données sont aujourd hui disponibles en open source. Ces technologies sont utilisées entre autres par de grand noms comme FACEBOOK, AOL et Yahoo!. Contribution : l objectif du mémoire est (1) d étudier les architecture des moteurs CEP, (2) d étudier les framework Hadoop et HBase, (3) de proposer une architecture de moteur CEP distribué en utilisant le framework Hadoop et les techniques d analyse temps réel des réseaux sociaux, et enfin (4) d implémenter un prototype. Organisation : ce mémoire est organisé par l ULB en collaboration avec Euranova R&D. L étudiant sera accompagné par l équipe d Euranova R&D. 3/13
APPROCHE DIRIGÉE PAR LES MODÈLES POUR LA GÉNÉRATION D UNE CHORÉGRAPHIE DISTRIBUÉE À PARTIR D UN PROCESSUS D ORCHESTRATION BPMN Contexte : Les applications de gestion et d exécution de processus d entreprises sont devenues un des plus importants piliers des infrastructures informatiques. Les entreprises peuvent y modéliser leurs processus d exécution et ainsi entièrement scripter leurs logiques métier. Cette approche est devenue si importante et si attractive pour les gestionnaires d infrastructures qu ils voudraient la voire étendue à d autres systèmes soumis à des contraintes de performances et de charge beaucoup plus importantes que les simples infrastructures d entreprise. Dans ce cas, le principal problème vient de l aspect central du moteur d exécution de processus. En effet, ces moteurs sont alors soumis à toute la charge et deviennent un goulot d étranglement. D un autre côté, les architecture orientées événements (EDA) mettent en avant des patterns d architecture pour la conception de systèmes d information distribués et de haute performance. L idée développée pour ce mémoire n est pas de migrer le moteur d exécution de service dans une EDA mais bien de transformer le process en ensemble de chorégraphies distribuées. Une chorégraphie se limitera donc à l interaction entre deux services et des messages qu ils échangent. Illustration 2: le but de ce mémoire est de transformer un processus centralisé en ensemble d interactions distribuées. Nous proposons d implémenter une transformation de modèle permettant de générer l ensemble des éléments nécessaires à l exécution distribuée du processus au sein d une architecture EDA. 4/13
Pour ce faire, l étudiant partira d un méta-modèle EMF représentant un process BPMN. Contribution : l objectif du mémoire est (1) d étudier les architectures EDA, (2) d étudier les modèles de BPM, (3) de proposer une architecture distribuée d exécution de Business process, (4) d implémenter une transformation de modèle pour la générations des éléments nécessaire à l exécution distribuée et enfin (5) d implémenter un prototype. Organisation : ce mémoire est organisé par l ULB en collaboration avec Euranova R&D. L étudiant sera accompagné par l équipe d Euranova R&D. 5/13
ETUDE DES FRAMEWORK DISTRIBUÉS DE GRILLES DE DONNÉES EN VUE D UNE SOLUTION DE STOCKAGE ÉLASTIQUE DANS LE CLOUD Contexte : Aujourd hui, le cloud computing est certainement encore un des sujets les plus à la mode. En effet, il promet une évolution élastique de nos serveurs d applications juste par quelques simples clics sur l interface de management en y ajoutant dynamiquement de nouvelles machines virtuelles. A travers un mémoire de l année passée nous avions posé la question de l élasticité du cloud pour les applications, y compris celles qui possèdent une importante quantité de données. Une des réponses proposées étaient les nouvelles structures de données NoSQL et leurs déploiements dans les infrastructures clouds. Une autre solution est aujourd hui mise en avant par les vendeurs IT : les grilles de données. Le concept se veut proche des grilles de calculs (grid) mais pour les données. Néanmoins, ce type de grilles est-il vraiment adapté au cloud et aux infrastructures élastiques? Peut-on vraiment les utiliser pour de très grandes quantités de données? Illustration 3: la grille de données de TIBCO. 6/13
Contribution : L objectif du mémoire est (1) de comparer les architectures des grilles de données de TIBCO ActiveSpace, EU DataGrid et INFINISPAN, (2) de proposer un ensemble de tests pour l évaluation de la performance et de l'élasticité, (3) d implémenter ce test dans le laboratoire d Euranova, et enfin (4) d en conclure leur utilisation potentielle dans les infrastructures cloud. Organisation : ce mémoire est organisé par l ULB en collaboration avec Euranova R&D. L étudiant sera accompagné par l équipe d Euranova R&D. 7/13
MOTEUR DE RECOMMENDATION : DÉVELOPPEMENT D UNE APPROCHE DE CONFIANCE POUR LES SERVICES TEMPS RÉEL DES RÉSEAUX SOCIAUX Contexte : Le succès des réseaux sociaux n est plus à présenter, ils font désormais part du paysage des outils de communication. L avènement des mobiles et PDA permettant d accéder à ces réseaux depuis n importe quel endroit donne naissance à tout un nouvel éventail de services de collaboration entre personnes d un même réseau mais ne se connaissant par forcément (Pervasive Social Networking [3]). Un certain nombre de recherches se sont posées sur la problématique de la confiance entre personnes d un même réseau en développant de nouveaux concepts [4,5,6] ou en adaptant des existants comme le personal page rank. Illustration 4: les pervasive SN service permettent de réunir des personnes ne se connaissant pas mais ayant un but commun. Nous proposons au mémorant d implémenter un prototype d algorithme de recommandation et de confiance pour un service de social car sharing. Contribution : L objectif du mémoire est (1) d étudier les algorithmes de recommandation sociaux, (2) d étudier les méthodes de confiance dans les réseaux sociaux, (3) de choisir une méthode pertinente à implémenter, et enfin (4) d implémenter un prototype sur un réseau social test crée à partir d IMDB. Organisation : ce mémoire est organisé par l ULB en collaboration avec Euranova R&D. L étudiant sera accompagné par l équipe d Euranova R&D. 8/13
ETUDE ET IMPLÉMENTATION D UNE ARCHITECTURE EDA POUR LE SUIVI EN TEMPS RÉEL DE PATIENTS D UNITÉS DE SOINS INTENSIFS Contexte : L aide à la décision informatisée est une science en pleine croissance que l on retrouve dans différents secteurs mais pas encore dans tous. En effet, dans les unités de soins intensifs, les capteurs qui mesurent en temps réel l état des patients envoient une grande quantité de données aux médecins, comme la pression sanguine, le taux de créatine, le taux d anticorps, etc... Aujourd hui il n existe pas d infrastructures automatisées permettant de collecter l ensemble de ces événements afin d en inférer une situation devant requérir l intervention des équipes médicales. Des équipes de recherches se sont attaquées au problème et ont proposé des solutions basées sur le serveur d application temps réel JAIN SLEE et un ESB [7]. Ce prototype permet d implémenter des logiques de surveillance pouvant détecter des situations problématiques pour un patient. Cependant cette architecture n est pas la solution idéale, principalement pour trois raisons : Le container JSLEE doit maintenir une session state full par patient, ce qui pourrait être un frein à la montée en charge pour supporter un grand nombre de patients, Nécessite d implémenter la logique de détection en JAVA, nous ne pouvons donc pas utiliser de Domain Specific Languages (DSL) accessibles au monde médicale pour générer les règles, L architecture n est pas évolutive ex : Comment coupler des données contextuelles temps réel, comme la présence d un spécialiste, la présence d une infermière, ou d autres données, aux logiques de détection de problèmes? Illustration 5: The EDA used for the real time patient monitoring. 9/13
L année dernière nous avons proposé un mémoire sur ce sujet en collaboration avec l unité des soins intensifs du centre hospitalier de Mouscron. L expérience s est révélée être un succès pour l équipe médicale qui propose la continuation du mémoire sur un autre cas d utilisation à savoir l assistance informatique des patients mécaniquement ventilés. Contribution : L objectif du mémoire est (1) d étudier, via une série d interviews de médecins d unités des soins intensifs, les différents paramètres de surveillance des patients ainsi que quelques règles simples de détection de problèmes, (2) d étudier les architectures orientées événements et un moteur CEP en particulier, (3) de proposer une architecture EDA, et enfin (4) d implémenter un prototype EDA supportant 50 instances de simulateurs de patients ayant chacun des scénarios de tests XML. Organisation: ce mémoire est organisé par l ULB en collaboration avec Euranova R&D. L étudiant sera accompagné par l équipe d Euranova R&D. 10/13
DÉPLOIEMENT D UNE INFRASTRUCTURE DE RÉSEAU DE SENSEURS POUR DES APPLICATIONS DE DÉTECTION DE CONTEXTE TEMPS-RÉEL Contexte : L internet des objets (Internet of Things, IoT) et l internet des services (Internet of Services, IoS) sont probablement les plus importants domaines de recherche européen dans la définition du Future Internet. L alliance d un réseau de things pouvant communiquer, collaborer et envoyer de l information avec un réseau de services pouvant s adapter, s assembler et se configurer en fonction de l objectif à atteindre représente une réelle évolution en terme de développement de services et de paradigme de programmation. Dans ce mémoire, nous proposons l implémentation d un cas d utilisation montrant l usage conjoint d un réseau de senseurs et d une application de détection de contexte temps réel pour de la publicité ciblée. Les équipes R&D européennes de notre partenaire, équipementier télécom multinational, ont développé un prototype supportant un cas d utilisation de détection de contexte temps réel appliqué à la publicité ciblée et profilée. Illustration 6: exemple de business case à implémenter. L étudiant et l équipe d encadrement académique seront autorisés à réutiliser intégralement le 11/13
prototype afin de l étendre physiquement à l aide d un réseau de senseurs ZigBee. L idée est d équiper un feu de signalisation avec un senseur et un écran LCD et d autre part une voiture (Lego) avec un senseur capable de déclarer son identité. Lorsque la voiture arrivera au feu rouge, elle se déclarera, ce qui produira un événement sur le réseau. Un service écoutant ces événements sera capable de corréler la présence du conducteur à une série d autres événements, ce qui pourra potentiellement conduire à l affichage d un message publicitaire ciblé sur l écran du feu de signalisation. Illustration 7: illustration du cas d utilisation à implémenter. Notons que ce mémoire devra faire l objet d un Non disclosure agreement (NDA) sur le cas d utilisation métier, l architecture logicielle de service et le code source existant partagé avec l étudiant. L entièreté de la contribution de l étudiant sur la partie senseur sera elle tout à fait publique. Contribution : L objectif du mémoire est (1) d étudier les réseaux de senseurs et les protocoles de communication développés par le service OPERA, (2) d étudier les normes standards de communication, en cours de développement, entre les véhicules et l infrastructure routière, (3) de proposer une architecture de réseau de senseurs pour le cas d utilisation envisagé, (4) d intégrer ces senseurs à l application de détection de contexte temps réel qui sera partagé avec l étudiant. Organisation: ce mémoire est organisé par l ULB (J-M Dricot, OPERA) en collaboration avec Euranova R&D. L étudiant sera accompagné par l équipe d Euranova R&D. 12/13
Références [1] Cloud ERA, http://www.cloudera.com/blog/2011/02/an-emerging-data-managementarchitectural-pattern-behind-interactive-web-application/ [2] TIBCO ActiveSpace grid data. [3] SB Mokhtar and al, A middleware service for pervasive social networking, in M-PAC '09 Proceedings of the International Workshop on Middleware for Pervasive Mobile and Embedded Computing, ACM New York, NY, USA.2009 [4] R. Guha, R. Kumar, P. Raghavan, and A. Tomkins.Propagation of trust and distrust. In Proc. of the 13th ACM International Conference on World Wide Web,2004. [5] M. Dell'Amico and L. Capra. SOFIA: Social Filtering for Robust Recommendations. In Proc. of Joint itrust and PST Conferences on Privacy, Trust management and Security, 2008. [6] D. Quercia, S. Hailes, and L. Capra. Lightweight Distributed Trust Propagation. In Proc. of the 7th IEEE International Conference on Data Mining, 2007. [7] Van Den Bossche B. and al., Design of a JAIN SLEE/ESB-based platform for routing medical data in the ICU, in Computer methods and programs in biomedicine 91 (2008) 265 277 Ghent (BEL) University 13/13