Méthodologie de mise en oeuvre de workflows scientifiques



Documents pareils
Urbanisation de système d'information. PLM 6 (Product Lifecycle Management) Collaboration et partage d'informations

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY

Le pilotage des collaborations et l interopérabilité des systèmes d information Vers une démarche intégrée

Mineure Architectures Orientées Services SOA Business Process Modeling (BPM) Mineure SOA. Business Process Modeling (BPM)

Hervé Couturier EVP, SAP Technology Development

Business Process Management

Business Process Modeling (BPM)

Workflow et Service Oriented Architecture (SOA)

Intelligence Economique - Business Intelligence

WEB15 IBM Software for Business Process Management. un offre complète et modulaire. Alain DARMON consultant avant-vente BPM

SysFera. Benjamin Depardon

Business Process Design Max Pauron

Le Guide Pratique des Processus Métiers

Lamia Oukid, Ounas Asfari, Fadila Bentayeb, Nadjia Benblidia, Omar Boussaid. 14 Juin 2013

Le moteur de workflow JBPM

Exécution de processus

Mineure Architectures Orientées Services SOA Exécution de processus. Mineure SOA. Exécution de processus

Exécution de processus

eframe pour optimiser les reportings métiers et réglementaires

Business Process Execution Language

DataEXchanger. Echangez en toute simplicité. Atelier Dex Etat des lieux Dex X. Présentation DEX X

Architecture d'entreprise : Guide Pratique de l'architecture Logique

Objectif : Passer de l analyse métier et fonctionnelle à la définition des applications qui

Iyad Alshabani SysCom - CReSTIC Université de Reims 17/02/2011 1

E-Biothon : Une plate-forme pour accélérer les recherches en biologie, santé et environnement.

Information & Content Management IDC FRANCE

Retour d expériences avec UML

Une méthode d apprentissage pour la composition de services web

Urbanisme du Système d Information et EAI

CNAM cours NFE107 : Urbanisation et architecture des SI Xavier Godefroy, Rapport sur le BPM, mai Le BPM

Information utiles. webpage : Google+ : digiusto/

NOVA BPM. «Première solution BPM intégr. Pierre Vignéras Bull R&D

Mercredi 15 Janvier 2014

Ne cherchez plus, soyez informés! Robert van Kommer

Synergies entre Artisan Studio et outils PLM

Spécificités, Applications et Outils

Le Processus RUP. H. Kadima. Tester. Analyst. Performance Engineer. Database Administrator. Release Engineer. Project Leader. Designer / Developer

Cours de Génie Logiciel

openarchitectureware & transformation de modèle Yannick Lizzi Architecte Logiciel itemis France Mail: lizzi@itemis.de

IBM Business Process Manager

Séminaire Gestion Incidents & Problèmes

L Orchestration de Services Web avec Orchestra. Goulven Le Jeune Orchestra Project Manager

Performances. Gestion des serveurs (2/2) Clustering. Grid Computing

RTDS G3. Emmanuel Gaudin

Reza MADANI Manager et Consultant Indépendant Stratégie, organisation, management et transformation de systèmes d information

Plateforme WikiJob spécifications

PROGRAMME DU CONCOURS DE RÉDACTEUR INFORMATICIEN

Conception, architecture et urbanisation des systèmes d information

BASE. Vous avez alors accès à un ensemble de fonctionnalités explicitées ci-dessous :

La Geo-Business Intelligence selon GALIGEO avec 26/10/2005 1

Workflow/DataWarehouse/DataMining LORIA - Université d automne Informatique décisionnelle - L. Mirtain 1

Postes à pourvoir 2015

LA GOUVERNANCE, OU COMMENT RAPPROCHER LES ÉQUIPES DE DÉVELOPPEMENT ET D INFRASTRUCTURE

Laboratoire 4 Développement d un système intelligent

1/15. Jean Bernard CRAMPES Daniel VIELLE

Je découvre Lina Maintenance

Conduite de projets informatiques Développement, analyse et pilotage (2ième édition)

pythonocc: une plateforme de développement agile d applications CAO.

Galigeo Location Intelligence Solutions Galigeo Solution

Mise en place d'une chaîne de production raster multi-échelles

Visual Paradigm Contraintes inter-associations

Débuter avec EXPRESS. Alain Plantec. 1 Schema 2

Génie logiciel (Un aperçu)

DESCRIPTIF DE MODULE S5 GSI

L exploitation des rapports de vérifications réglementaires : quels enjeux, quelle solution?

Identification de nouveaux membres dans des familles d'interleukines

Rendez-vous la liberté avec Rational Quality Manager

Annonces internes. Sonatrach recherche pour sa DC Informatique et Système d Information :

Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours

Mobilité et Soutien Logistique des SDIS Vers plus d efficience et d agilité

Sommaire. Introduction La technologie ebxml EDI conventionnels versus ebxml Web Services et ebxml Acteurs de l ebxml Conclusion

Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION

ANNEXE 2 DESCRIPTION DU CONTENU DE L OFFRE BUSINESS INFORMATION AND ANALYSIS PACKAGE

ANTICIPEZ ET PRENEZ LES BONNES DÉCISIONS POUR VOTRE ENTREPRISE

Université de Bangui. Modélisons en UML

Introduction au Data-Mining

Pentaho Business Analytics Intégrer > Explorer > Prévoir

SQL Parser XML Xquery : Approche de détection des injections SQL

Les processus métiers : concepts, modèles et systèmes

Anticiper. Définir. mesurer. optimiser DE GAMMA - ARCOLE RH DE GAMMA. arcole rh. Gestion de la Paie et des Ressources Humaines

et les Systèmes Multidimensionnels

Le génie logiciel. maintenance de logiciels.

BI2B est un cabinet de conseil expert en Corporate Performance Management QUI SOMMES-NOUS?

Livret de Stages 2014 / 2015

IFT2255 : Génie logiciel

Les Entrepôts de Données

Déjeuner EIM Enterprise Information Management. Mardi 16 novembre 2010 Restaurant l Amourette Montreuil Thomas Dechilly CTO Sollan

Master Informatique Aix-Marseille Université

Le groupe et l actionnariat 10 M 30 M 2. Editique, GED, Archivage. Intégration, Infogérance, Développement

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)

Concepts clés associés aux outils logiciels, exemples

Identification du module

Informatique. epims : un LIMS pour la gestion des données de spectrométrie de masse TECHNOLOGIE APPLIQUÉE

Gérez efficacement vos flux d entreprises.

$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU

Catalogue des formations Edition 2015

Magister en Informatique

OPEN DATA : CHALLENGES ET PERSPECTIVES D ENTREPOSAGE

SQL Server 2012 et SQL Server 2014

Transcription:

Méthodologie de mise en oeuvre de workflows scientifiques Yuan Lin yuan.lin@supagro.inra.fr UMR MISTEA INRA, SupAgro, Montpellier!2

Contexte & Objectif Divers domaines scientifiques Ressources existantes disponibles Partage et mutualisation Connaissance / expertise Hétérogénéité, complexité Processus de validation d expérience Automatisation, réutilisation!3

Plan Vision générale Différentes phases! Perspectives + Conclusion!4

Vision générale Un environnement d expérimentation de workflow intégré dans une plateforme de partage et de mutualisation Utilisateurs Plateforme de partage et de mutualisation Composants fonctionnels Librairies services... Interface graphique Gestion de ressources Moteur de recherche Workflow Base de données des méta-données Référentiels de traitements Référentiels de données!5

MDWeb!6

Notions de workflow The automation of a business process, in whole or part, during which documents, informations or tasks are passed from one participant to another for action, according to a set of procedural rules. (WFMC) A scientific workflow attempts to capture a series of analytical steps, which describe the design process of computational experiments. [Adam 2008] Workflows are activities involving the coordinated execution of multiple tasks performed by different processing entities. [Rusinkiewicz 1995] Les données en entrée Sous tâche Sous tâche Sous tâche Sous tâche Les données en sortie!7

Notions de workflow The automation of a business process, in whole or part, during which documents, informations or tasks are passed from one participant to another for action, according to a set of procedural rules. (WFMC) A scientific workflow attempts to capture a series of analytical steps, which describe the design process of computational experiments. [Adam 2008] Workflows are activities involving the coordinated execution of multiple tasks performed by different processing entities. [Rusinkiewicz 1995] Les données en entrée Sous tâche Sous tâche Traitement global Sous tâche Sous tâche Les données en sortie Focus : Workflow Scientifique!7

Notions de workflow Workflow scientifique!= Business process Critères Scientifique Business Objectif Spécifique, propre à un individu " ou une équipe limitée Entreprise, " organisation importante Données Traitements Volumineuses, complexes, " souvent onéreuses Nombreux, disponibles sous diverses versions, paramétrables, " autonomes du point de vue exécution De faible volume, structures simples Stéréotypés, propriétaires Acteurs Peu d intervention Interventions importantes Exécution Modèles Environnement Type orchestration, exécution centralisée, parallèles, pas à pas Relativement simples, data-driven Plateforme complète avec " gestion de ressources, " de workflows et d expertise!8 Type chorégraphie, " contrôle humain Complexes, contrôle drivers, controldriven Environnement spécifique pour les développeurs, standard pour les utilisateurs

Vision usage Les étapes Planification Instanciation Exécution Point d'un protocolede vue utilisateur scientifique Utilisateur Abstrait MOF Conformité Méta modèle Conformité Modèle Conformité Concret Instance, objets!9

Vision usage!10

Phase 1 Expertise > Abstrait métier Jour Température Montpellier 1 2 3 4 12 11 9 18 Comment? Mois Mai Moyenne??? 5 13 6 6-1 -!11

Phase 1 Expertise > Abstrait métier Source Résultat Relevé page page de températures Étapes intermédiaires page page Moyenne!11

Phase 1 Expertise > Abstrait métier Source Intermédiaire Résultat Relevé page page de températures?? page page Somme page page Cardinalité?? page page Moyenne!11

Phase 1 Expertise > Abstrait métier Source Intermédiaire Résultat Calculer la somme page page Somme Relevé page page de températures Diviser page page Moyenne Calculer la cardinalité page page Cardinalité!11

Phase 1 Expertise > Abstrait métier Source Intermédiaire Résultat Calculer la somme page page Somme Relevé page page de températures Diviser page page Moyenne Calculer la cardinalité page page Cardinalité!11 Orienté donnée

Phase 1 Expertise > Abstrait métier Etat de l art (UML, BPEL, Taverna, Kepler, etc.)"! Notre proposition (Langage graphique associé)"! Traitement Donnée Port Lien!! Exemple! Traitement atomique Traitement composite page Donnée Donnée Donnée [ Condition ]! Protein page sequence! Similarity search Visualization Tree reconstruction page Image page Tree!12

Phase 2 Abstrait métier > Instancié Modèle abstrait Visualization page Image Protein page sequence Similarity search Tree reconstruction page Tree Blastp tblastn...... BioNJ NJ PhyML...... - Organisation des ressources pour la recherche et la localisation!13

Phase 2 Abstrait métier > Instancié Modèle abstrait Visualization page Image Protein page sequence Similarity search Tree reconstruction page Tree Modèle instancié Logo page Image Protein sequences page (Data1, Fasta) Blastp Valide? - Organisation des ressources pour la recherche et la localisation - Validation du modèle concret obtenu!13 PhyML page Tree

Phase 2 Abstrait métier > Instancié Le contexte de travail Catégorie de données Catégorie de traitements Sous-catégorie 1 de données... Sous-catégorie n de données Sous-catégorie 1 de traitements Sous-catégorie n de traitements Sous-catégorie x de données Sous-catégorie y de données Description traitement concret 1 Description traitement concret 2 Description traitement concret 3 Description traitement concret 4 Description page page Donnée concrète 1 Description page page Donnée concrète 2 Description page page Donnée concrète 3 Description page page Donnée concrète 4 Format 1 Format 2 Format 3 - Ontologie du domaine! - Enregistrer dans la base de connaissances!14

Phase 2 Abstrait métier > Instancié Pair-wise alignment Similarity search (Alignment) Multiple alignment Expertise Biological processes Distance matrix Tree reconstruction Maximum likelihood Visualization Process categories Blastp Interactive tblastn Clustalw selection BioNJ NJ PhyML Logo Concrete processes Biological data Protein sequence Pairs of sequences Protein data bank Collection Nucleic data bank Multiple alignment Phylogenetic tree Image Data categories page Data1 page Data2 page Data3 page Data4 page Data5 page Data6 page Data7 Concrete data Fasta xml MultiFasta Clustal Newick Jpeg Data formats!15

Phase 2 Abstrait métier > Instancié Pair-wise alignment Similarity search (Alignment) Multiple alignment Expertise Biological processes Distance matrix Tree reconstruction Maximum likelihood Visualization Process categories Blastp Interactive tblastn Clustalw selection BioNJ NJ PhyML Logo Concrete processes Protein page Protein sequence sequence Pairs of sequences Biological data Similarity search Collection Protein data bank Nucleic data bank Multiple alignment Visualization Tree reconstruction Phylogenetic tree page Image page ImageTree Data categories page Data1 page Data2 page Data3 page Data4 page Data5 page Data6 page Data7 Concrete data Fasta xml MultiFasta Clustal Newick Jpeg Data formats!15

Phase 2 Abstrait métier > Instancié Pair-wise alignment Similarity search (Alignment) Multiple alignment Expertise Biological processes Distance matrix Tree reconstruction Maximum likelihood Visualization Process categories Blastp Interactive tblastn Clustalw selection BioNJ NJ PhyML Logo Concrete processes Protein page Protein sequence sequence Pairs of sequences Biological data Similarity search Collection Protein data bank Nucleic data bank Multiple alignment Visualization Tree reconstruction Phylogenetic tree page Image page ImageTree Data categories page Data1 page Data2 page Data3 page Data4 page Data5 page Data6 page Data7 Concrete data Fasta xml MultiFasta Clustal Newick Jpeg Data formats!15

Phase 2 Abstrait métier > Instancié Pair-wise alignment Similarity search (Alignment) Multiple alignment Expertise Biological processes Distance matrix Tree reconstruction Maximum likelihood Visualization Process categories Blastp Interactive tblastn Clustalw selection BioNJ NJ PhyML Logo Concrete processes Protein page Protein sequence sequence page Data1 Protein Fasta sequences page (Data1, Fasta) Pairs of sequences page Data2 xml page Data3 Biological data Similarity search Collection Protein data bank Blastp Nucleic data bank Data4 page Data5 page MultiFasta!15 Multiple alignment Clustal Visualization Tree reconstruction Phylogenetic tree Logo PhyML Data6 page Newick page Image ImageTree Data7 page page Image page Jpeg Tree page Data categories Concrete data Data formats

Phase 2 Abstrait métier > Instancié Logo page Image Protein sequences page (Data1, Fasta) Blastp PhyML page Tree Valide? La validité des compositions entre : - Blastp et Logo - Blastp et PhyML!16

Phase 2 Abstrait métier > Instancié Pair-wise alignment Similarity search (Alignment) Multiple alignment Expertise Biological processes Distance matrix Tree reconstruction Maximum likelihood Visualization Process categories Blastp Interactive tblastn Clustalw selection BioNJ NJ PhyML ref. FO Logo Concrete processes f. FO ref. DC Protein sequence ref. DC ref. FO ref. DC Pairs of sequences ref. FO ref. DC Protein data bank Biological data Collection ref. DC Nucleic data bank ref. DC ref. FO Multiple alignment ref. FO ref. DC ref. DC Phylogenetic tree ref. DC ref. FO ref. DC Image ref. FO Data categories page Data1 page Data2 page Data3 page Data4 ref. FO page Data5 page Data6 ref. FO page Data7 Concrete data Fasta xml MultiFasta!17 Clustal Newick Jpeg Data formats

Perspectives Contexte de travail + Ontologie du domaine Apprentissage (Case-based reasoning) amélioration des résultats de composition extraction des fragments réutilisables

Phase 3 (en cours) Instancié > Exécutable Choix de paradigme d exécution (locale/distribuée) Transformation des modèles Configuration / optimisation Traçabilité et reproductibilité (log, stockage/archivage)!19

Conclusion Construction de workflows basée sur la réutilisation des ressources et des connaissances Validation dans divers domaines scientifiques (télédétection, bio, hydrologie, astrophysique, climatologie) Assistance de construction de workflow!20

Validation Les domaines concernés : biologie, risque, télédétection, etc."! Pré-traitement Catégories de traitements pour télédétecteurs Traitement! Sélection de bande Filtrage Classification supervisée Classification non supervisée!! Ajout de bande Construction de néo-canal Correction géométrique Correction + Calage Normalisation Réseau de neurones SVM Correction radiométrique absolue Parallélépipédique Max de vraisemblance! Invariant Matching histogramme Obtention luminance Obtention réflectance Post-traitement Obtention réflectance T.O.A Analyse comparative Cartographie Booléenne Transition Raster Vecteur!21

Merci beaucoup yuan.lin@supagro.inra.fr!22