L'analyse de séquences de protéines sur une grille de ressources informatiques Protein analysis and GRID computing

Dimension: px
Commencer à balayer dès la page:

Download "L'analyse de séquences de protéines sur une grille de ressources informatiques Protein analysis and GRID computing"

Transcription

1 L analyse C. JOBIM Blanchet, 2002 de protéines C. Combet sur une et G. grille Deléage de ressources informatiques Résumé L'analyse de séquences de protéines sur une grille de ressources informatiques Protein analysis and GRID computing Christophe Blanchet * Christophe COMBET Gilbert Deléage Pôle BioInformatique de Lyon IBCP-CNRS/UCBL UMR 5086, 7 passage du Vercors, Lyon France GlaxoSmithKline R&D 10 Rte de l'aéroport, 1215 Geneva 15 Suisse Courriel : {Christophe.Blanchet,Gilbert.Deléage}@ibcp.fr, cxc21115@gsk.com A l'heure actuelle, de nombreux programmes de séquençage de génomes complets d organismes (Homme, Souris, végétaux, etc.) produisent de très grandes quantités de séquences. Ces données nouvelles en grande quantité et dont la croissance est exponentielle posent deux problèmes majeurs: leur stockage et leur utilisation. Nous essayons d apporter une réponse à ces deux contraintes : tout d abord à travers notre portail Web NPS@ (network Protein Sequence Analysis ; part «protéine» du Pôle BioInformatique de Lyon-PBIL) ; et ensuite à travers notre participation au projet européen DataGrid. Ce projet a pour objectif la mise en place d une grille informatique de ressources de calcul et de stockage pour l analyse des données scientifiques. L application bioinformatique développée au laboratoire dans le cadre de DataGrid est le portail Web d analyse de séquences de protéines GPS@ (Grid Protein Sequence Analysis). Ce portail a pour objectifs d évaluer et de proposer des solutions pour résoudre les contraintes spécifiques à l utilisation d algorithmes bioinformatiques dans un contexte de grille. Mots-clés : Protéine, séquence, grille informatique, DataGrid, portail Web. 1 Introduction A l'heure actuelle, de nombreux programmes de séquençage de génomes complets d organismes (Homme, Souris, végétaux, etc.) produisent de très grandes quantités de séquences. Ces données nouvelles en grande quantité et dont la croissance est exponentielle posent deux problèmes majeurs: leur stockage et leur utilisation. Nous essayons de répondre à la seconde problématique en proposant depuis 1998, au sein du Pole BioInformatique de Lyon (PBIL), un serveur Web d'analyse de séquences de protéine (NPS@-Network Protein Sequence Analysis, couplés à des logiciels d'analyse bioinformatique disposant de fonctions client-serveur (MPSA, AnTheProt). Ce serveur, mis gratuitement à la disposition des biologistes, leur propose une interface conviviale et efficace à l'utilisation chainée et à l'analyse des résultats de nombreuses méthodes d'analyse de séquences de protéine (BLAST, FastA, ClustalW, Proscan, Pattinprot, SOPMA, PHD,...) appliquées sur des données personnelles ou sur celles de banques internationales (SWISS-PROT, EMBL, PDB,...). Cependant, la demande en ressources informatiques (CPU, mémoire, disques,...) de certaines méthodes est très importante, de plus les méthodes disponibles sur NPS@, bien que nombreuses, ne sont pas exhaustives. Le concept de grille de calcul permettrait de pallier à ces limitations en proposant de réunir et de faire coopérer des ressources informatiques de calcul, de stockages et d'algorithmes dispersées géographiquement. Le projet DataGrid est un projet européen (5ème PCRD) de trois ans ( ) visant à installer, développer et expérimenter une technologie de grille de calcul et de stockage sur des infrastructures de réseau à très haut débit au bénéfice d applications scientifiques. Les objectifs du serveur GPS@ (Grid Protein Sequence Analysis) sont d'évaluer et de résoudre les contraintes d'utilisation d'algorithmes bioinformatiques dans un contexte de grille de calcul et de stockage. 2 NPS@: serveur Web d analyse de séquence de protéines Nous avons mis en ligne le serveur NPS@ [1,2] (Network Protein en avril Le serveur NPS@, dans sa version 2, regroupe 24 méthodes d analyse de séquences de protéines. Ces méthodes sont intégrées en une seule interface Web pour une efficacité accrue. Ce serveur Web est la partie «protéine» du serveur du Pôle BioInformatique de Lyon [3] (PBIL). Le PBIL est une réalisation conjointe entre le Laboratoire de Bioinformatique et RMN Structurales (LBRS Pr Gilbert Deléage IBCP CNRS/UCBL UMR 5086) et le JOBIM

2 C. Blanchet, C. Combet et G. Deléage laboratoire de Biométrie, Biologie Evolutive (BBE Pr Christian Gautier CNRS/UCBL UMR 5558). Il fut créé en janvier Ressources bioinformatiques disponibles Algorithmes bioinformatiques Les algorithmes disponibles sur notre serveur couvrent plusieurs champs de l analyse de séquences de protéine (figure 1) : - Recherche de similitude : BLAST [4], PSI-BLAST, FASTA [5] et SSEARCH [6] - Recherche de sites et signatures fonctionnelles : ProScan et PattInProt [21] - Alignements multiples : Clustal W [7] et MultAlin [8] - Prédictions de structures secondaires : SOPMA [9], MLRC, HNN, PHD [10,11], Predator, DSC, Simpa 96 [12,13], GOR 1-2 et 4 [14], etc. - Consensus secondaire - Prédictions de profils physico-chimiques - Diverses méthodes : prédiction de structures «coiled-coil», de motif hélice-tour-hélice,etc. Fig. 1 : Page d accueil du serveur Web NPS@ Banques de données biologiques De la même manière, nous proposons un accès sur un ensemble de banques internationales de données biologiques : - SWISSPROT [15], SP-TrEMBL, TrEMBL [15,16], banque non-redondante - Bacillus subtilis (CDS) - Protein Data Bank (PDB) en version complète et en version 25% et 95% d homologie. - PROSITE [17] 290 JOBIM 2002

3 L analyse de protéines sur une grille de ressources informatiques La maintenance des banques de données est réalisée sur le serveur par un mécanisme automatique mis en place par C. Geourjon. Les mises à jour sont obtenues depuis les sites de références de ces banques comme l Institut Suisse de Bionformatique [18] (SIB) ou l Institut Européen de Bioinformatique [19](EBI). L utilisateur peut ainsi effectuer ses analyses avec les dernières versions de ces banques sans avoir à se soucier de leur maintenance. 2.2 Intégration Un des objectifs principaux de la réalisation de NPS@ a été de fournir aux biologistes qui ne sont pas rompus aux techniques informatiques un outil puissant d analyse. Notamment, toutes les méthodes disponibles sur NPS@ sont interconnectées. Ainsi les séquences obtenues lors d une recherche de similarité avec BLAST, FASTA ou PattInProt peuvent être automatiquement alignées avec Clustal W ou Multalin. Ensuite, des prédictions de structure secondaire et leur consensus peuvent être incorporés à l alignement multiple. Le biologiste n a le plus souvent qu à suivre les liens hypertextes ou cliquer sur les boutons de choix. Un accent particulier a été mis sur l abstraction des formats bioinformatiques nombreux et différents : que ce soient pour les données en entrée mais également en sortie d un algorithme donné. Pour l utilisateur de NPS@, le transfert de données entre différents algorithmes se résume à un clic sur un lien hypertexte dans une page de résultats d une méthodes. Et ce clic l amène sur une nouvelle page de soumission des données à une autre méthode qui prendra les résultats précédents comme données à analyser. De la même manière de nombreux liens hypertextes sont proposés pour obtenir des détails supplémentaires sur certaines données à partir des sites Web originaux. Ces sites sont ceux des banques de séquences mondiales : SWISS-PROT, SP-TrEMBL, PDB, GenBank, Mais ce sont également d autres banques de données comme Medline, Prosite ou SCOP. De plus, afin de proposer un environnement complet entre tous nos outils, la majorité des résultats obtenus sur NPS@ peuvent être transférés à une session du logiciel MPSA [20,21] ou AnTheProt [22] sur la machine locale. Le biologiste clique sur le lien hypertexte intitulé «View data in MPSA». Un mécanisme basé sur MIME et le sous-type original «application/x-mpsa» ouvre une session locale de MPSA avec les données transmises depuis le serveur. 2.3 Statistiques d utilisation Le serveur NPS@ traite en moyenne requêtes par jour, et à dépassé les de requêtes traitées en février Elles se répartissent de façon relativement équitable entre la France, le reste de l Europe, les Etats-Unis et le reste du monde comme le montre la figure 2. Le site NPS@ est référencé par de nombreux sites Web internationaux comme par exemple ExPaSy [23], RCSB [33] et InfoBiogen [24] % 20% Annuelles Cumulées 22% 26% France Europe (hors France) USA Reste du monde Fig. 2 : Statistiques d utilisation de NPS@ (14 février 2002) 2.4 Limitations actuelles dues au matériel Cependant, le serveur NPS@ subit des limitations importantes de la part de l infrastructure matérielle qui l héberge. NPS@ fonctionne actuellement sur un ordinateur quadriprocesseur i386 sous RedHat 7.2. Afin de ne JOBIM

4 C. Blanchet, C. Combet et G. Deléage pas écrouler la machine et d obtenir des temps de réponses satisfaisant pour l ensemble des utilisateurs, différentes limitations ont dues être mises en places : Restriction à l utilisation des grandes banques de séquences (SwissProt, SP-TrEMBL, TrEMBL, Nr). Pas de génomes et leur banque CDS associée Restriction de la taille des données soumises à analyse : par exemple pour l alignement multiple avec CLUSTAL W, le biologiste ne pourra aligner plus de 50 séquence. Restriction des méthodes disponibles suivant le contexte : par exemple lors de l insertion de prédictions de structures secondaires dans un alignement multiple, le biologiste ne pourra pas utiliser toutes les méthodes : seules les 10 moins gourmandes seront disponibles. Ce qui peut tout de même représenter 500 calculs pour un alignement de 50 séquences. Restriction des requêtes automatiques et massives depuis les autres portails et méta-serveurs bioinformatiques : nous sommes obligés de limiter notre service ASP (Application Service Providing) pour la BioInformatique. 3 DataGrid : infrastructure de grille de ressources informatiques «European DataGrid» [25] (EDG) est un projet financé par la communauté européenne. Son objectif est de mettre en place une grille de ressources de calcul et de stockage pour l analyse des données issues des expérimentations scientifiques. Cette grille veut être capable de répondre aux attentes des sciences de la prochaine génération. En effet celles-ci nécessiteront le partage et la coopération de ressources pour l analyse de très grands jeux de données produits et stockés par de nombreux laboratoires appartenant à plusieurs institutions. 3.1 Le concept de «grille de ressources informatiques» Une grille de ressources informatiques concerne la mutualisation de ressources dispersées géographiquement [32]. Ces ressources peuvent être de différentes natures : puissance de calcul, espace de stockage, interface utilisateur, gestionnaire de ressources, etc. Une grille est constituée de nœuds reliés entre eux par un maillage réseau généralement à haut-débit, qu il soit de production (Renater et GEANT pour DataGRID) ou expérimental (réseau VTHD pour e-toile et l ACI-GRID en France). Un nœud propose à la communauté de la grille différentes ressources parmi celles citées. Les utilisateurs se connecte à la grille en souscrivant un abonnement et paient les ressources utilisées comme nous le faisont tous pour le courant électrique. En effet, comme nous branchons nos appareils électriques sur le réseau EDF et consommons l électricité produite par les centrales, nous pourrons brancher nos ordinateurs sur DataGRID et consommer de la puissance de calcul et de l espace de stockage fournis par les centres informatiques. 292 JOBIM 2002

5 L analyse de protéines sur une grille de ressources informatiques 3.2 Les partenaires du projet Fig. 3 : Etat des ressources disponibles sur la grille expérimentale européenne DataGRID Les partenaires du projet DataGRID regroupe différents établissements de recherche européens (CERN, CNRS-France, ESA/ESRIN, INFN-Italie, NIKHEF-Pays-Bas, PPARC-GB) et des industriels (. Les participants appartiennent aux différents domaines de l informatique, de la physique des hautes énergie, de la biologie et du domaine biomédical, de l astrophysique, etc. La grille actuelle (figure 3, Testbed 1 mars 2002) réunit de nombreuses ressources très diverses, allant de la ferme de quelques CPU (e.g. IBCP-PBIL, Lyon ; LCP-In2p3, Clermont-Ferrant) à des ensembles de plusieurs centaines de CPU et plusieurs centaines de Go de disque (e.g. Centre de Calcul de l In2p3, Lyon ; CERN, Genève). 3.3 Les groupes de travail Le projet est structuré en groupes de travail (WP pour «WorkPackage», tableau 1) qui se voient assignés un champ d application précis : «middleware», infrastructure, applications et gestion du projet. Middleware Infrastructure Applications Management Work Package 1 Grid Work Scheduling 2 Grid Data Management 3 Grid Monitoring Services 4 Fabric Management 5 Mass Storage Management 6 Testbed and Demonstrators 7 Network Services 8 HEP Applications 9 Earth Observation Applications 10 Biology Applications 11 Dissemination 12 Project Management Tab. 1 : Les groupes de travail de DataGrid Fig. 4 Organisation des WorkPackages Ces différents groupes de travail interagissent suivant un schéma qui est détaillé dans la figure 4 : JOBIM

6 C. Blanchet, C. Combet et G. Deléage - Les WPs «middleware» ont en charge les développements logiciels des composants de la grille. Ils réaliseront les logiciels qui serviront d interface entre les technologies logiciels réseaux actuelles et les technologies logicielles des applications scientifiques. - Les WPs d infrastructure intègrent les développements logiciels du «middleware», et sont responsables de l interaction avec les infrastructures réseaux (Renater [26], GEANT [27], etc.). Ils ont la responsabilité de la mise en oeuvre, du test et du «monitoring» des différentes versions de la grille. - Les WPs de gestion du projet coordonnent les actions administratives et les rencontres d échange liées au projet (réunion de travail, présentations, revue de la Communauté Européenne). Il sont également chargés de faire connaître le projet aux différents acteurs nationaux académiques et industriels. - Les WPs des applications comprennent les disciplines de l observation de la Terre, de la Physique des Hautes Energies et de la Biologie. Le projet DataGrid a débuté en janvier 2001 et se terminera en décembre Il a donc 13 mois d existence à la date d écriture de cet article. Les développements réalisés dans le cadre du projet DataGrid par les différents WPs du «middleware» ont pour résultats la réalisation d un nouveau «toolkit» EDG, pour «European DataGrid, basé sur Globus [28], et il l améliore par l apport de différents outils pour une architecture de grille : gestion des réseaux, gestion des ressources disponibles de calculs et de stockage, gestion des accès, sécurité des données et des matériels, etc. 3.4 Le WP10 : «Applications biologiques» Nous participons aux applications biologiques de DataGrid regroupées au sein du WP10 [29,30]. Elles comprennent des applications d imagerie biomédicale, de bioinformatique moléculaire et de parasitologie. Le WP10 se distingue des autres applications par des contraintes propres au monde de la bioinformatique parmi lesquelles on peut citer l interactivité et la gestion des banques de données. En effet l interactivité de l accès aux données est fondamentale dans le domaine de l imagerie médicale, et à un degré moindre dans le domaine de l analyse moléculaire. Cette notion n a pas de raison d être dans les applications de la physique ou le traitement des données se fait en fonction des ressources disponibles sans contrainte de temps de réponses. De la même manière, les banques de données biologiques ont un besoin fort de mise à jour régulière, voire quotidienne. Se pose alors la question de la cohérence des données et de la synchronisation des versions de ces données sur la grille. A la différence, les physiciens ont pour l instant des données de plus grandes tailles que celle de la Biologie, mais par contre qui n évoluent pas après leur obtention. 4 GPS@: un portail DataGrid pour la bioinformatique des protéines 4.1 La problématique des grilles de calculs appliquées à l analyse de séquences de protéine Dans le cadre de la bioinformatique moléculaire, la majorité des analyses repose sur la soumission de données issues de banques de données ou d expérimentation à des algorithmes validés afin d extraire de nouvelles informations. Les données étant de plus en plus nombreuses, de grandes tailles et de types différents, leurs analyses sont de plus en plus coûteuses d un point de vue informatique. De plus les méthodes, elles-mêmes, sont de plus en plus complexes et donc coûteuses en ressources informatiques. Une grille de ressources informatiques peut répondre à plusieurs problématiques en Biologie : - un portail Web pour des milliers de biologistes soumettant autant de requêtes de calcul de façon concommittante, la grille doit dans ce cas répartir la charge de ces milliers de processus sur les nœuds disponibles, - un serveur d algorithmes pour des bioinformaticiens soumettant un très grand nombre de processus en un seul «run», ce cas se rapproche du précédent avec pour différence que les données résultats devront être rapatriées en un seul point du réseau (en autant de points qu il y a d utilisateurs pour le cas précédent), - un serveur d algorithmes pour des bioinformaticiens soumettant un faible nombre de processus voire un seul nécessitant de très grands calculs. Dans ce cas la grille permet de faire du calcul distribué à travers des mécanisme proches de MPI mais adaptés à une hiérarchie forte des nœuds, - un serveur de banques de données biologiques, en assurant la mise à jour et la cohérence de ces banques sur les différents nœuds. 294 JOBIM 2002

7 L analyse de protéines sur une grille de ressources informatiques 4.2 Etudes réalisées dans Le portail Web (1) (Grid Protein Sequence Analysis) en tant que point d entrée sur une grille de bioinformatique moléculaire a pour objectif d étudier la «gridification» du modèle d intégration des algorithmes de NPS@. Le portail GPS@ peut répondre aux problématiques de portail Web pour des milliers d utilisateurs ou de serveur d algorithmes biologiques pour des bioinformaticiens telles que définies dans le chapitre précédent. La gridification d un portail Web comme GPS@ a plusieurs contraintes : - cohérence et la synchronisation des banques de données (séquences, motifs, structures, ), notamment lors de leur mise à jour - différence des modèles algorithmiques des méthodes disponibles (tableau 2) - interactivité des analyses - sécurité des données lors des transferts et des calculs - authentification : le biologiste ou bioinformaticien connecté au portail Web n est pas l utilisateur réel. Le portail agit comme un fournisseur de service et est identifié comme tel sur la grille Gridification de NPS@ L objectif de GPS@ est de fournir aux biologistes la même interface Web que NPS@ afin que l apport de la grille ne se traduisent pas par un «chamboulement» des outils utilisés quotidiennement. Considérons tout d abord une requête sur le portail Web NPS@ (figure 5). Le biologiste se connecte à l aide de son navigateur favori (Netscape, Opéra, Internet Explorer, ), remplit les différents champs de la requête d analyse de séquences de protéines, puis soumet la requête au serveur. Son navigateur envoie les paramètres de la méthode au serveur Web qui réceptionnent les données envoyées par le navigateur du biologiste et les transmet à nos scriptsceux-ci récupèrent ces données et leur font subir différents traitements propres à l analyse demandée : vérification et formatage des données, validation des paramètres. Enfin, le script correspondant à l analyse lance l exécution du calcul de la méthode sur les données suivant les paramètres de l utilisateur. Une fois le processus terminé, nos scripts récupèrent les résultats bruts de la méthode, les mettent en forme de pages Web ou d images adéquates ; et les envoient au navigateur du biologiste par le mécanisme inverse. Fig. 5 : Requête Web avec ressources locales Fig. 6 : Requête Web avec ressources distribuées Dans GPS@, la gridification est réalisée au moment du lancement par le serveur des calculs des méthodes bioinformatiques sur la machine hôte. Le serveur GPS@ invoque, pour sa part, les mécanismes du «middleware» de DataGrid (EDG) pour lancer ses calculs (figure 6) Processus de soumission d un calcul dans GPS@ Le serveur GPS@ s authentifie auprès de la grille et fait une demande de calcul auprès du «Resource Broker» (figure 7). Pour ce faire il lui indique les programmes et les données bioinformatiques à utilisés. Les données sont propagées sur les différents nœuds avec espaces de stockage «Storage Element», et les programmes sont alors envoyés sur la grille aux différents nœuds disponibles «Compute Element». Lorsque le calcul est terminé, un état est indiqué à GPS@ ainsi que le chemin d accès aux résultats. GPS@ récupèrent alors ces données et les met en forme pour une visualisation Web par le Biologiste. (1) future adresse : JOBIM

8 C. Blanchet, C. Combet et G. Deléage Fig. 7 : Mécanisme de soumission d un calcul sur DataGRID Suivant les méthodes d analyses bioinformatiques, le mécanisme de soumission du calcul diffère sur quelques points. 4.3 Applications aux différents algorithmes de GPS@ sur DataGRID Les méthodes disponibles sur le serveur NPS@ pour l analyse de séquences de protéine peuvent être classées en 4 catégories suivant 2 critères : la taille des données à analyser et la complexité des calculs (tableau 2). Les grandes tailles des données concernent par exemple les méthodes qui analysent ou basent une partie de leur analyse sur des banques de séquences ou des génomes complets. La complexité des calculs est quant à elle due à l emploi ou non d heuristiques dans les algorithmes considérés. Complexité des calculs Faible Grande Taille des données traitées Faible Grande certaines prédictions de structures BLAST secondaires (GOR, DPM, Homologue, ) ProScan (motifs protéiques) prédictions de profils physico-chimiques etc. etc. alignements multiples avec CLUSTAL FASTA, SSEARCH W ou Multalin PattInProt (motifs protéiques) etc. prédictions de structures secondaires (SOPMA, PHD, ) CLUSTAL W (génomes complets). etc. Tab. 2 : Différenciation des algorithmes de NPS@ suivant la taille des données analysées et la complexité de l analyse. Les conséquences pour l emploi de ces méthodes sur une grille informatique sont très diverses : cela va du cas où de nombreux petits processus traitant une petite taille de données pourront être répartis individuellement sur les différents nœuds de la grille (différentes prédictions appliquées à une base de séquences); au cas ou un seul processus traitant des données de grande taille (alignement multiple de génomes). Le cas le plus simple est celui d une méthode avec peu de données en entrée et en sortie mais répétée en un grand nombre d occurrences indépendantes. Dans ce cas les données seront transférées suivant des mécanismes de type «sandbox». Par exemble lorsque le biologiste désire insérer dans un alignement multiple de plusieurs centaines de séquences, des prédiction de structures secondaire comme DPM, GOR1-2 et 4, ou SIMPA 96, des prédictions de profils physico-chimiques ou de motif «hélice-tour-hélice». D autres méthodes, compatibles avec la soumission en sous-processus indépendants, peuvent avoir des fichiers de grandes tailles comme données d entrée. Ces données sont généralement des banques de séquences aux différents formats bioinformatiques. Du fait de leur taille, ces données nécessitent des transferts plus 296 JOBIM 2002

9 L analyse de protéines sur une grille de ressources informatiques complexe du type «replica catalog». Ce mécanisme sera également invoqué pour la récupération des fichiers résultats qui peuvent également atteindre une grande taille : par exemple le traitement de SWISSPROT contre elle-même avec BLAST produit plus de 2 Go de données à rapatrier à l issue d un temps de calcul conséquent (tableau 3). Type de calcul Matériel de test Taille des calculs Durée de calcul Machine monocpu SwissProt vs SwissProt 8, BLAST[31] 228 heures (estimation) Local Machine SMP quadriprocesseur SwissProt vs SwissProt (IBCP-Lyon) 8, BLAST[31] 49 heures Ferme de 100 CPU SwissProt vs SwissProt (CC In2p3-Lyon) 8, BLAST[31] 3 heures Grille DataGRID Tesbed séq. vs Yeast DB (Revue Européenne [34], 1 er 0, BLAST mars 2002) 4 minutes Tab. 3 : Temps de calcul obtenus pour des études avec BLAST Le troisième grand type d algorithme est celui qui produit un seul processus de grande taille. Ce processus doit alors être réparti sur la grille avec des mécanisme du type MPI, avec passage de messages entre les différentes sous-instances du processus. C est le cas par exemple d un alignement multiple de plusieurs génomes avec CLUSTAL W ou d une recherche de motifs protéiques très dégénérés avec PattInProt sur une grande banque de séquences comme TrEMBL. A cette problématique s ajoute bien souvent celle de la gestion des données de grandes tailles en entrée et/ou sortie comme évoqué dans le paragraphe précédent. 5 Conclusion Les objectifs du serveur GPS@ (Grid Protein Sequence Analysis) sont d'évaluer et de résoudre les contraintes d'utilisation d'algorithmes bioinformatiques dans un contexte de grille de calcul et de stockage. Les algorithmes concernés (BLAST, ClustalW, GOR4,...) sont ceux utilisés massivement dans l'analyse à grande échelle de séquences de protéine afin d'extraire les informations des données brutes issues de nombreuses expérimentations (dont les programmes de séquençage de génomes). Leurs applications sont par exemple l'annotation des données, leur incorporation dans les bases de données existantes ou la construction de nouvelles banques, des analyses à vocation thérapeutique et pharmaceutique, etc. Le modèle de GPS@ combine différents challenges de la Bioinformatique Moléculaire avec notamment la distribution et la cohérence des grandes banques de données entres les sites bioinformatiques et la diversité des algorithmes bioinformatiques pour leur modèles de calculs (batch ou MPI). Le développement de GPS@ permettra de dépasser les limitations actuelles de NPS@ grâce aux ressources informatiques alors accessibles. GPS@ permettra par exemple de réaliser de plus grands alignements multiples et de pouvoir insérer dans l alignement des prédictions de structures secondaires suivant l ensemble des méthodes disponibles. Une autre amélioration concernera le nombre des banques des données disponibles et les requêtes portant sur plusieurs banques simultanémént. Ces études sont actuellement en cours dans le cadre du projet European DataGrid qui se terminera fin Mais elles pourront également être rattachées à d autres projets de grille de ressources informatiques en cours comme l ACI-GRID (projet GriPPS), e-toile (RNTL) sur VTHD (RNRT) ; ou à venir par exemple dans le cadre du 6 e PCRD. Références [1] NPS@: Network Protein Sequence Analysis, [2] NPS@: Network Protein Sequence Analysis. Combet C., Blanchet C., Geourjon C. et Deléage G. Tibs, 2000, 25, [3] PBIL - Pôle BioInformatique de Lyon, [4] Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ (1990) Basic local alignment search tool. J. Mol. Biol. 215, [5] Pearson WR, Lipman DJ (1988) Improved tools for biological sequence comparison. Proc. Natl. Acad. Sci. USA 85, [6] Smith TF, Waterman MS (1981) Identification of common molecular subsequences. J. Mol. Biol. 147, JOBIM

10 C. Blanchet, C. Combet et G. Deléage [7] Thompson JD, Higgins DG, Gibson TJ (1994) CLUSTAL W: improving the sensitivity of progressive multiple sequence alignment through sequence weighting, position-specific gap penalties and weight matrix choice. Nucleic Acids Res. 22, [8] Corpet F (1988) Multiple sequence alignment with hierarchical clustering. Nucl. Acids Res. 16, [9] Geourjon C, Deléage G (1995) SOPMA: significant improvements in protein secondary structure prediction by consensus prediction from multiple alignments. Comput. Appl. Biosci. 11, [10] Rost B, Sander C (1994) Combining evolutionary information and neural networks to predict protein secondary structure. Proteins 19, [11] Rost B (1996). PHD : predicting one-dimensional protein structure by profile-based neural networks. Methods Enzymol. 266, [12] Levin, JM (1997) Exploring the limits of nearest neighbour secondary structure prediction. Prot. Eng. 7, [13] Donnelly D, Overington JP, Blundell TL (1994) The prediction and orientation of a helices from sequence alignments: then comined use of environment-dependent substituion tables, Fourier transform methods and helix capping rules. Prot. Eng. 7, [14] Garnier J, Gibrat J-F, Robson B (1996) GOR method for predicting protein secondary structure from amino acid sequence. Methods Enzymol. 266, [15] Bairoch A, Apweiler R (1999) The SWISS PROT protein sequence data bank and its supplement TrEMBL in Nucleic Acids Res. 27, [16] Stoesser G, Tuli MA, Lopez R, Sterk P (1999) the EMBL nucleotide sequence database. Nucleic Acids Res. 27, [17] Hofmann K, Bucher P, Falquet L, Bairoch A (1999), The PROSITE database, its status in Nucleic. Acids Res. 27, [18] SIB Swiss Institute of Bioinformatics, [19] EBI European Bioinformatics Institute, [20] MPSA: Integrated System for Multiple Protein Sequence Analysis with client/server capabilities?. Blanchet C., Combet C., Geourjon C. et Deléage G. Bioinformatics, 2000, 16, [21] Blanchet (C.) Logiciel MPSA et ressources bioinformatiques client-serveur Web dédiées à l analyse de séquences de protéine, thèse de doctorat, Ecole Doctorale Interdisciplinaire Sciences-Santé (EDISS - UCBLyon 1), [22] Deléage G, Clerc FF, Roux B, Gautheron DC (1988) ANTHEPROT : a package for protein sequence analysis using a microcomputer. Comput Applic Biosci. 4, [23] ExPASy - Expert Protein Analysis System, [24] InfoBioGen, [25] EDG - European DataGrid project, [26] Renater - Réseau National de Télécommunications pour la Technologie, l'enseignement et la Recherche, [27] GEANT, [28] the GLOBUS Project, [29] DataGrid WorkPackage 10, [30] DataGrid WP10 Deliverable 10.2, D10_ pdf [31] Legré (Y.), Météry (R.) et Vernet (G.), DataGrid WP10 meeting 6, 2001 [32] IAN FOSTER AND CARL KESSELMAN, The Grid: Blueprint for a New Computing Infrastructure, édité par Ian Foster et Carl Kesselman, [33] RCSB - Research Collaboratory for Structural Bioinformatics, [34] DataGRID, Bilan de la 1 e Revue Européenne JOBIM 2002

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST.

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST. La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST. Gaël Le Mahec - p. 1/12 L algorithme BLAST. Basic Local Alignment Search Tool est un algorithme de recherche

Plus en détail

Introduction aux bases de données: application en biologie

Introduction aux bases de données: application en biologie Introduction aux bases de données: application en biologie D. Puthier 1 1 ERM206/Technologies Avancées pour le Génome et la Clinique, http://tagc.univ-mrs.fr/staff/puthier, puthier@tagc.univ-mrs.fr ESIL,

Plus en détail

Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments»

Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments» Master In silico Drug Design Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments» 30NU01IS INITIATION A LA PROGRAMMATION (6 ECTS) Responsables : D. MESTIVIER,

Plus en détail

3A-IIC - Parallélisme & Grid GRID : Définitions. GRID : Définitions. Stéphane Vialle. Stephane.Vialle@supelec.fr http://www.metz.supelec.

3A-IIC - Parallélisme & Grid GRID : Définitions. GRID : Définitions. Stéphane Vialle. Stephane.Vialle@supelec.fr http://www.metz.supelec. 3A-IIC - Parallélisme & Grid Stéphane Vialle Stephane.Vialle@supelec.fr http://www.metz.supelec.fr/~vialle Principes et Objectifs Evolution Leçons du passé Composition d une Grille Exemple d utilisation

Plus en détail

Extraction d information des bases de séquences biologiques avec R

Extraction d information des bases de séquences biologiques avec R Extraction d information des bases de séquences biologiques avec R 21 novembre 2006 Résumé Le module seqinr fournit des fonctions pour extraire et manipuler des séquences d intérêt (nucléotidiques et protéiques)

Plus en détail

Architecture de la grille

Architecture de la grille 1 2 Diversité des applications et des utilisateurs (profile, nombre,...) supposent des solutions différentes architectures différentes avec des services communs Services de base authentification: établir

Plus en détail

Big data et sciences du Vivant L'exemple du séquençage haut débit

Big data et sciences du Vivant L'exemple du séquençage haut débit Big data et sciences du Vivant L'exemple du séquençage haut débit C. Gaspin, C. Hoede, C. Klopp, D. Laborie, J. Mariette, C. Noirot, MS. Trotard bioinfo@genopole.toulouse.inra.fr INRA - MIAT - Plate-forme

Plus en détail

MABioVis. Bio-informatique et la

MABioVis. Bio-informatique et la MABioVis Modèles et Algorithmes pour la Bio-informatique et la Visualisation Visite ENS Cachan 5 janvier 2011 MABioVis G GUY MELANÇON (PR UFR Maths Info / EPI GRAVITE) (là, maintenant) - MABioVis DAVID

Plus en détail

La fédération des infrastructures cloud

La fédération des infrastructures cloud La fédération des infrastructures cloud Ecole IN2P3 : Maîtriser le cloud Charles LOOMIS (LAL) 4 juillet 2014 Questions importantes Est-ce que la fédération des ressources est nécessaire? Si oui, comment

Plus en détail

Grid Technology. ActiveMQ pour le grand collisionneur de hadrons (LHC) Lionel Cons Grid Technology Group Information Technology Department

Grid Technology. ActiveMQ pour le grand collisionneur de hadrons (LHC) Lionel Cons Grid Technology Group Information Technology Department DB GT CF Grid ActiveMQ pour le grand collisionneur de hadrons (LHC) Lionel Cons Grid Group Information Department Journée de la communauté FUSE, Paris, 2010 CERN IT Department CH-1211 Geneva 23 Switzerland

Plus en détail

e-biogenouest CNRS UMR 6074 IRISA-INRIA / Plateforme de Bioinformatique GenOuest yvan.le_bras@irisa.fr Programme fédérateur Biogenouest co-financé

e-biogenouest CNRS UMR 6074 IRISA-INRIA / Plateforme de Bioinformatique GenOuest yvan.le_bras@irisa.fr Programme fédérateur Biogenouest co-financé e-biogenouest Coordinateur : Olivier Collin Animateur : Yvan Le Bras CNRS UMR 6074 IRISA-INRIA / Plateforme de Bioinformatique GenOuest yvan.le_bras@irisa.fr Programme fédérateur Biogenouest co-financé

Plus en détail

Comment reproduire les résultats de l article : POP-Java : Parallélisme et distribution orienté objet

Comment reproduire les résultats de l article : POP-Java : Parallélisme et distribution orienté objet Comment reproduire les résultats de l article : POP-Java : Parallélisme et distribution orienté objet Beat Wolf 1, Pierre Kuonen 1, Thomas Dandekar 2 1 icosys, Haute École Spécialisée de Suisse occidentale,

Plus en détail

Tutoriel Cloud IFB - Initiation -

Tutoriel Cloud IFB - Initiation - Tutoriel Cloud IFB - Initiation - Christophe BLANCHET Institut Français de Bioinformatique - IFB French Institute of Bioinformatics - ELIXIR-FR CNRS UMS3601 - Gif-sur-Yvette - FRANCE Ecole Cumulo NumBio

Plus en détail

Les mésocentres HPC àportée de clic des utilisateurs industriels

Les mésocentres HPC àportée de clic des utilisateurs industriels Les mésocentres HPC àportée de clic des utilisateurs industriels Université de Reims Champagne-Ardenne (URCA) Centre de Calcul ROMEO Multidisciplinary university more than 22 000 students a wide initial

Plus en détail

parée e avec C. Germain, B. Kegl et M. Jouvin CS de l Université Paris Sud

parée e avec C. Germain, B. Kegl et M. Jouvin CS de l Université Paris Sud Présentation prépar parée e avec C. Germain, B. Kegl et M. Jouvin CS de l Université Paris Sud (pré)histoire de la Grille Paris Sudn1 Les besoins de la communauté HEP La collaboration physiciens/informaticiens

Plus en détail

APX et VCE, Modèle d industrialisation de l intégration et du déploiement. Olivier BERNARD, VCE

APX et VCE, Modèle d industrialisation de l intégration et du déploiement. Olivier BERNARD, VCE APX et VCE, Modèle d industrialisation de l intégration et du déploiement Olivier BERNARD, VCE Généralisation des réseaux, suprématie d IP Consumérisation des terminaux informatiques Evolution vers une

Plus en détail

Présentation de la Grille EGEE

Présentation de la Grille EGEE Présentation de la Grille EGEE Introduction aux grilles La grille EGEE Exemples d applications en physique des particules et en sciences de la vie Le cercle vertueux Conclusion Guy Wormser Directeur de

Plus en détail

Perl Orienté Objet BioPerl There is more than one way to do it

Perl Orienté Objet BioPerl There is more than one way to do it Perl Orienté Objet BioPerl There is more than one way to do it Bérénice Batut, berenice.batut@udamail.fr DUT Génie Biologique Option Bioinformatique Année 2014-2015 Perl Orienté Objet - BioPerl Rappels

Plus en détail

E-Biothon : Une plate-forme pour accélérer les recherches en biologie, santé et environnement.

E-Biothon : Une plate-forme pour accélérer les recherches en biologie, santé et environnement. E-Biothon : Une plate-forme pour accélérer les recherches en biologie, santé et environnement. N.Bard, S.Boin, F.Bothorel, P.Collinet, M.Daydé, B. Depardon, F. Desprez, M.Flé, A.Franc, J.-F. Gibrat, D.

Plus en détail

Charte d'utilisation des infrastructures de la plate-forme bioinformatique Genotoul

Charte d'utilisation des infrastructures de la plate-forme bioinformatique Genotoul Page 1/5 Objet de la modification Tableau des modifications Création du document 06/2014 Interdiction de lancer tout traitement de données sur les serveurs frontaux et purge du work sans préavis si fichiers

Plus en détail

Numérique. Mon Université. www.univ-paris-diderot.fr

Numérique. Mon Université. www.univ-paris-diderot.fr 9 Mon Université Numérique L université Paris Diderot met à votre disposition un Environnement Numérique de Travail appelé «Portail ENT». Il vous donne accès, via un point d'entrée unique et sécurisé,

Plus en détail

Base de données bibliographiques Pubmed-Medline

Base de données bibliographiques Pubmed-Medline Chapitre 1 ; Domaine 1 ; Documentation ; Champs référentiels 1.1.1, 1.1.2 et 1.1.3 Base de données bibliographiques Pubmed-Medline D r Patrick Deschamps,, 30 mai 2007 PLAN C2i métiers de la santé Introduction

Plus en détail

La sécurité dans les grilles

La sécurité dans les grilles La sécurité dans les grilles Yves Denneulin Laboratoire ID/IMAG Plan Introduction les dangers dont il faut se protéger Les propriétés à assurer Les bases de la sécurité Protocoles cryptographiques Utilisation

Plus en détail

Chapitre 1. Infrastructures distribuées : cluster, grilles et cloud. Grid and Cloud Computing

Chapitre 1. Infrastructures distribuées : cluster, grilles et cloud. Grid and Cloud Computing Chapitre 1. Infrastructures distribuées : cluster, grilles et cloud Grid and Cloud Computing Problématique Besoins de calcul croissants Simulations d'expériences coûteuses ou dangereuses Résolution de

Plus en détail

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY Yvan Le Bras yvan.le_bras@irisa.fr Cyril Monjeaud, Mathieu Bahin, Claudia Hériveau, Olivier Quenez, Olivier Sallou, Aurélien Roult, Olivier

Plus en détail

Evaluation des performances de programmes parallèles haut niveau à base de squelettes

Evaluation des performances de programmes parallèles haut niveau à base de squelettes Evaluation des performances de programmes parallèles haut niveau à base de squelettes Enhancing the Performance Predictability of Grid Applications with Patterns and Process Algebras A. Benoit, M. Cole,

Plus en détail

Le Ro le Hyper V Troisie me Partie Haute disponibilite des machines virtuelles

Le Ro le Hyper V Troisie me Partie Haute disponibilite des machines virtuelles Le Ro le Hyper V Troisie me Partie Haute disponibilite des machines virtuelles Microsoft France Division DPE Table des matières Présentation... 2 Objectifs... 2 Pré requis... 2 Quelles sont les principales

Plus en détail

Authentification, Sécurisation, & Tracking de vos équipements et produits

Authentification, Sécurisation, & Tracking de vos équipements et produits Authentification, Sécurisation, & Tracking de vos équipements et produits La sécurisation de vos produits par l implémentation d une solution fiable, économique et performante Sommaire 1. L intérêt de

Plus en détail

SysFera. Benjamin Depardon

SysFera. Benjamin Depardon SysFera Passage d applications en SaaS Benjamin Depardon CTO@SysFera SysFera Technologie 2001 Création 2010 Spin Off INRIA Direction par un consortium d investisseurs 12 personnes 75% en R&D Implantation

Plus en détail

Chapitre 2. Cluster de calcul (Torque / Maui) Grid and Cloud Computing

Chapitre 2. Cluster de calcul (Torque / Maui) Grid and Cloud Computing Chapitre 2. Cluster de calcul (Torque / Maui) Grid and Cloud Computing 2. Cluster de calcul (Torque/Maui) Batch/Job Scheduler Gestion automatique d'une séries de jobs Interface de définition des jobs et

Plus en détail

Galaxy Training days. Liste des sessions disponibles : http://bioinfo.genotoul.fr. Les formateurs :

Galaxy Training days. Liste des sessions disponibles : http://bioinfo.genotoul.fr. Les formateurs : -- 1 -- Galaxy Training days Durée / Programme : 3 journées. Galaxy : First step. Galaxy : Reads alignment and SNP calling. Galaxy : RNAseq alignment and transcripts assemblies. Public : Personnes souhaitant

Plus en détail

FOURNIR UN SERVICE DE BASE DE DONNÉES FLEXIBLE. Database as a Service (DBaaS)

FOURNIR UN SERVICE DE BASE DE DONNÉES FLEXIBLE. Database as a Service (DBaaS) FOURNIR UN SERVICE DE BASE DE DONNÉES FLEXIBLE Database as a Service (DBaaS) 1 The following is intended to outline our general product direction. It is intended for information purposes only, and may

Plus en détail

Big Data et Graphes : Quelques pistes de recherche

Big Data et Graphes : Quelques pistes de recherche Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de Lyon/Université Claude Bernard Lyon 1/Université

Plus en détail

Systèmes informatiques

Systèmes informatiques Systèmes informatiques Collège Lionel-Groulx Procédures et informations (Session automne 2013 Enseignantes et enseignants) DITIC Août 2013 Table des matières Connexion au réseau... 4 Récupération de fichiers

Plus en détail

StratusLab : Le projet et sa distribution cloud

StratusLab : Le projet et sa distribution cloud StratusLab : Le projet et sa distribution cloud M. Airaj C. Loomis (CNRS/LAL) Université Lille I 17 Mai 2010 StratusLab is co-funded by the European Community s Seventh Framework Programme (Capacities)

Plus en détail

Initiation à Internet Médiathèque de Bussy Saint-Georges. Le Cloud

Initiation à Internet Médiathèque de Bussy Saint-Georges. Le Cloud Le Cloud : Le Cloud : SOMMAIRE : I PRÉSENTATION DU SERVICE... PAGES 3-7 1.1 - Onedrive : Pour quoi faire?.. Page 3 1.2 - Définition de Wikipedia... Page 4 1.3 - Caractéristiques... Page 5 1.4 - Espace

Plus en détail

DG-ADAJ: Une plateforme Desktop Grid

DG-ADAJ: Une plateforme Desktop Grid DG-ADAJ: Une plateforme pour Desktop Grid Olejnik Richard, Bernard Toursel Université des Sciences et Technologies de Lille Laboratoire d Informatique Fondamentale de Lille (LIFL UMR CNRS 8022) Bât M3

Plus en détail

Formation continue. Ensae-Ensai Formation Continue (Cepe)

Formation continue. Ensae-Ensai Formation Continue (Cepe) CertifiCat de data scientist Formation continue Ensae-Ensai Formation Continue (Cepe) CertifiCat de data scientist La demande de data scientists est croissante mais peu de formations existent. Ce certificat

Plus en détail

Business Intelligence avec SQL Server 2012

Business Intelligence avec SQL Server 2012 Editions ENI Business Intelligence avec SQL Server 2012 Maîtrisez les concepts et réalisez un système décisionnel Collection Solutions Informatiques Extrait Alimenter l'entrepôt de données avec SSIS Business

Plus en détail

Grid5000 aujourd'hui : Architecture & utilisation

Grid5000 aujourd'hui : Architecture & utilisation 1 Grid5000 aujourd'hui : Architecture & utilisation aurelien.dumez@labri.fr 11 octobre 2005 Contexte 2 Grid5000 est : Une plateforme expérimentale pour le grid computing Ouverte à de nombreux thèmes de

Plus en détail

ApiCrypt - Réception des résultats de biologie

ApiCrypt - Réception des résultats de biologie ApiCrypt - Réception des résultats de biologie ApiCrypt vous permet de recevoir, de manière sécurisée, les résultats de laboratoire ou lettres de confrères dans AlmaPro. Vous devez préalablement vous abonner

Plus en détail

Archivage intermédiaire de données Scientifiques ISAAC Information Scientifique Archivée Au Cines

Archivage intermédiaire de données Scientifiques ISAAC Information Scientifique Archivée Au Cines Archivage intermédiaire de données Scientifiques ISAAC Information Scientifique Archivée Au Cines Constat Enquête auprès des laboratoires de recherche Besoin d information sur les enjeux de l'archivage

Plus en détail

Tropimed Guide d'installation

Tropimed Guide d'installation Tropimed Guide d'installation 1. A propos de ce guide... 2 2. Configurations matérielles et logicielles requises... 2 2.1 Configuration Windows... 2 2.2 Configuration MacOs... 2 2.3 Configuration requise

Plus en détail

Modèle de cahier des charges pour un appel d offres relatif à une solution de gestion des processus métier (BPM)

Modèle de cahier des charges pour un appel d offres relatif à une solution de gestion des processus métier (BPM) LA BOITE A OUTILS DE L ACHETEUR DE BPM Modèle de cahier des charges pour un appel d offres relatif à une solution de gestion des processus métier (BPM) La boîte à outils de l acheteur de solution BPM -

Plus en détail

Contrat d accompagnement de projet

Contrat d accompagnement de projet Page : 1 /8 Intitulé du Projet: Acronyme: Coordonnées des intervenants Pour le Laboratoire de recherche Intitulé: Adresse: Responsable d'équipe : email: Tel : + Responsable Projet : email Tel : + Pour

Plus en détail

Les Biolangages. Thierry Lecroq. Université de Rouen FRANCE. university-logo. Thierry Lecroq (Univ. Rouen) MB2 2008 2009 1 / 16

Les Biolangages. Thierry Lecroq. Université de Rouen FRANCE. university-logo. Thierry Lecroq (Univ. Rouen) MB2 2008 2009 1 / 16 Les Biolangages Thierry Lecroq Université de Rouen FRANCE 2008 2009 Thierry Lecroq (Univ. Rouen) MB2 2008 2009 1 / 16 BioPerl Ensemble de modules Perl Utilise la programmation objet L objectif est de mettre

Plus en détail

Mise en oeuvre d un Serveur de CD AXIS StorPoint

Mise en oeuvre d un Serveur de CD AXIS StorPoint Ministère de l'education Nationale - Académie de Grenoble - Région Rhône-Alpes C entre A cadémique de R essources et de M aintenance I nformatique Le 07/02/03 Equipements - Assistance - Maintenance Code

Plus en détail

Thales Services, des systèmes d information plus sûrs, plus intelligents www.thalesgroup.com

Thales Services, des systèmes d information plus sûrs, plus intelligents www.thalesgroup.com , des systèmes d information plus sûrs, plus intelligents www.thalesgroup.com Thales, leader mondial des hautes technologies Systèmes de transport, Espace, Avionique, Opérations aériennes, Défense terrestre,

Plus en détail

Les Entrepôts de Données

Les Entrepôts de Données Les Entrepôts de Données Grégory Bonnet Abdel-Illah Mouaddib GREYC Dépt Dépt informatique :: GREYC Dépt Dépt informatique :: Cours Cours SIR SIR Systèmes d information décisionnels Nouvelles générations

Plus en détail

Cours 420-123-LG : Administration de réseaux et sécurité informatique. Dans les Paramètres Système onglet Processeur, le bouton "Activer PAE/NX"

Cours 420-123-LG : Administration de réseaux et sécurité informatique. Dans les Paramètres Système onglet Processeur, le bouton Activer PAE/NX Laboratoire 02 Installation de Windows Server 2008 R2 Standard Edition Précision concernant les équipes de travail Afin de rationaliser les équipements disponibles au niveau du laboratoire, les équipes

Plus en détail

Séminaire Partenaires Esri France 7-8 juin 2011 - Paris Cloud Computing Stratégie Esri

Séminaire Partenaires Esri France 7-8 juin 2011 - Paris Cloud Computing Stratégie Esri Séminaire Partenaires Esri France 7-8 juin 2011 - Paris Cloud Computing Stratégie Esri Gaëtan LAVENU Plan de la présentation Evolution des architectures SIG Qu'est ce que le Cloud Computing? ArcGIS et

Plus en détail

Le réseau Internet. Christian.Fondrat@dsi.univ-paris5.fr

Le réseau Internet. Christian.Fondrat@dsi.univ-paris5.fr Le réseau Internet Christian.Fondrat@dsi.univ-paris5.fr Un réseau Définition : Un réseau est un ensemble d ordinateurs connectés et qui communiquent entre eux. Classification : Réseau local (LAN = Local

Plus en détail

Vers une fédération de Cloud Académique dans France Grilles J. Pansanel pour le groupe FG-Cloud (M. Airaj, C. Cavet, V. Hamar, M. Jouvin, C.

Vers une fédération de Cloud Académique dans France Grilles J. Pansanel pour le groupe FG-Cloud (M. Airaj, C. Cavet, V. Hamar, M. Jouvin, C. Vers une fédération de Cloud Académique dans France Grilles J. Pansanel pour le groupe FG-Cloud (M. Airaj, C. Cavet, V. Hamar, M. Jouvin, C. Loomis, A. Lopez Garcia, G. Mathieu, V. Mendez, J. Pansanel,

Plus en détail

SQL Server Installation Center et SQL Server Management Studio

SQL Server Installation Center et SQL Server Management Studio SQL Server Installation Center et SQL Server Management Studio Version 1.0 Grégory CASANOVA 2 SQL Server Installation Center et SQL Server Management Studio [03/07/09] Sommaire 1 Installation de SQL Server

Plus en détail

Qu est-ce que le «cloud computing»?

Qu est-ce que le «cloud computing»? Qu est-ce que le «cloud computing»? Par Morand Studer eleven Octobre 2011 Qu est-ce que le «cloud computing»? - Morand Studer eleven Octobre 2011 www.eleven.fr 1 Aujourd hui, la démocratisation de l informatique

Plus en détail

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation Base de données S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Présentation du module Contenu général Notion de bases de données Fondements / Conception Utilisation :

Plus en détail

Exploiter les statistiques d utilisation de SQL Server 2008 R2 Reporting Services

Exploiter les statistiques d utilisation de SQL Server 2008 R2 Reporting Services Exploiter les statistiques d utilisation de SQL Server 2008 R2 Reporting Services Nous verrons dans cet article comment exploiter simplement les données de Log de SQL Server 2008 R2 Reporting Services

Plus en détail

Plan du cours. Incarnations/applications du Grid Computing. Super-calcul virtuel

Plan du cours. Incarnations/applications du Grid Computing. Super-calcul virtuel Plan du cours Les grilles informatiques : concepts et infrastructures La grille nationale Grid5000 Modèles de programmation et intergiciels pour le grilles Etude de cas : Globus, MPICH-G2 et GridRPC Taxinomie

Plus en détail

La base de données dans ArtemiS SUITE

La base de données dans ArtemiS SUITE 08/14 Vous préférez passer votre temps à analyser vos données plutôt qu à chercher un fichier? La base de données d ArtemiS SUITE vous permet d administrer et d organiser confortablement vos données et

Plus en détail

Projet ViSaGe : implémentation de l administration et du monitoring de ViSaGe (Virtualisation du Stockage appliquée aux Grilles informatiques)

Projet ViSaGe : implémentation de l administration et du monitoring de ViSaGe (Virtualisation du Stockage appliquée aux Grilles informatiques) RenPar 18/ SympA 2008 / CFSE 6 / JC 2008 Fribourg en Suisse, 11 au 13 février 2008 Projet ViSaGe : implémentation de l administration et du monitoring de ViSaGe (Virtualisation du Stockage appliquée aux

Plus en détail

Big Data et Graphes : Quelques pistes de recherche

Big Data et Graphes : Quelques pistes de recherche Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci http://liris.cnrs.fr/hamamache.kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de

Plus en détail

ViSaGe. Virtualisation du Stockage dans les Grilles. Informatiques. RenPar 16, 6-8 Avril 2005 Thiebolt François thiebolt@irit.fr

ViSaGe. Virtualisation du Stockage dans les Grilles. Informatiques. RenPar 16, 6-8 Avril 2005 Thiebolt François thiebolt@irit.fr 1 ViSaGe Virtualisation du Stockage dans les Grilles Informatiques RenPar 16, 6-8 Avril 2005 Thiebolt François thiebolt@irit.fr IRIT Projet RNTL labellisé pré-compétitif Solution ViSaGe ViSaGe Accès transparent

Plus en détail

Conclusions de la 9ème réunion du Groupe Consultatif du SYGADE

Conclusions de la 9ème réunion du Groupe Consultatif du SYGADE Conclusions de la 9ème réunion du Groupe Consultatif du SYGADE Le Groupe consultatif du SYGADE soumet à l'attention du Secrétaire général de la CNUCED les conclusions suivantes formulées lors de sa 9ième

Plus en détail

ORACLE 10g Découvrez les nouveautés. Jeudi 17 Mars Séminaire DELL/INTEL/ORACLE

ORACLE 10g Découvrez les nouveautés. Jeudi 17 Mars Séminaire DELL/INTEL/ORACLE ORACLE 10g Découvrez les nouveautés Jeudi 17 Mars Séminaire DELL/INTEL/ORACLE Le Grid Computing d Entreprise Pourquoi aujourd hui? Principes et définitions appliqués au système d information Guy Ernoul,

Plus en détail

de gestion de stock Inventaire, achats

de gestion de stock Inventaire, achats Solution complète de gestion de stock Inventaire, achats et ventes Http://www.eg-software.com/f/ GESTION DES STOCKS ET INVENTAIRE ANALYSE DES VENTES (MENU) SORTIE AUTOMATIQUE DU STOCK BASÉE SUR LES VENTES

Plus en détail

Architectures en couches pour applications web Rappel : Architecture en couches

Architectures en couches pour applications web Rappel : Architecture en couches Rappel : Architecture en couches Une architecture en couches aide à gérer la complexité : 7 Application 6 Presentation 5 Session Application Les couches hautes dépendent des couches basses 4 Transport

Plus en détail

AA-SO5 KIDA/GSOV/VAMDC

AA-SO5 KIDA/GSOV/VAMDC AA-SO5 Centres de traitement et d archivage de données KIDA - 2 mars 2015 AA-SO5 KIDA/GSOV/VAMDC Contexte général L observation des molécules dans le milieu interstellaire, mais aussi dans les atmosphères

Plus en détail

VISIOCONFÉRENCE AVEC RENATER

VISIOCONFÉRENCE AVEC RENATER VISIOCONFÉRENCE AVEC RENATER Mode d emploi à destination des utilisateurs de visioconférence Eric Marcon, Pascal Padolus, Stéphane Traissac 07/05/2015 Les opinions émises par les auteurs sont personnelles

Plus en détail

PASS v2.0 : solution d authentification unique basée sur les composants Shibboleth Service Provider v2.5.1 et Identity Provider v2.3.

PASS v2.0 : solution d authentification unique basée sur les composants Shibboleth Service Provider v2.5.1 et Identity Provider v2.3. PREM IE R M IN IS T R E Secrétariat général de la défense et de la sécurité nationale Agence nationale de la sécurité des systèmes d information PASS v2.0 : solution d authentification unique basée sur

Plus en détail

Calcul Haute Performance & Données

Calcul Haute Performance & Données Calcul Haute Performance & Données Plan de l exposé CALMIP : news Evolution Matérielle Evolution des systèmes de calcul (CALMIP) Evolution Applicative Modélisation et Calcul haute performance Calcul haute

Plus en détail

Un exemple de cloud au LUPM : Stratuslab

Un exemple de cloud au LUPM : Stratuslab Un exemple de cloud au LUPM : Stratuslab Plan de la présentation Le cloud : une idée nouvelle? La boîte à outils du cloud Les différents types de cloud (Iaas, Paas, Saas) Présentation de Stratuslab Démonstration

Plus en détail

IBM Tivoli Monitoring, version 6.1

IBM Tivoli Monitoring, version 6.1 Superviser et administrer à partir d une unique console l ensemble de vos ressources, plates-formes et applications. IBM Tivoli Monitoring, version 6.1 Points forts! Surveillez de façon proactive les éléments

Plus en détail

ES Enterprise Solutions

ES Enterprise Solutions Strategic Media Technologies ES Enterprise Solutions Plateforme centralisée de collaboration en ligne www.dalim.com accès total au contenu indépendamment du lieu et fuseau horaire. N importe quand et n

Plus en détail

SPECIFICATION ET DESCRIPTION DU MULTICAST FIABLE DANS ETOILE

SPECIFICATION ET DESCRIPTION DU MULTICAST FIABLE DANS ETOILE page 1 / 10 Date : 19 décembre 2002 Origine : INRIA RESO Dossier : MULTICAST Titre : SPECIFICATION ET DESCRIPTION DU MULTICAST FIABLE DANS E Référence : Multicast version 0 État : DRAFT VERSIONS SUCCESSIVES

Plus en détail

GUIDE D UTILISATION DU PORTAIL FAMILLE S E J. Mairie/SEJE/CG 1 Guide d utilisation du portail famille

GUIDE D UTILISATION DU PORTAIL FAMILLE S E J. Mairie/SEJE/CG 1 Guide d utilisation du portail famille GUIDE D UTILISATION DU PORTAIL FAMILLE S E J E Mairie/SEJE/CG 1 Guide d utilisation du portail famille Accueil Mon compte Mes enfants Relevé de compte Boite de réception Liste des demandes Deconnexion

Plus en détail

Mendeley, pour gérer sa bibliographie et la partager. Patricia Volland-Nail

Mendeley, pour gérer sa bibliographie et la partager. Patricia Volland-Nail Mendeley, pour gérer sa bibliographie et la partager Patricia Volland-Nail Avertissement Ce diaporama est le support d une formation qui a été dispensée à l URFIST de Bordeaux le 29 Novembre 2013 Il nécessite

Plus en détail

Avec sauvegardez sans y penser, partagez et bougez, vos données vous suivent! Retrouvez tous vos services du cloud pro en cliquant ici.

Avec sauvegardez sans y penser, partagez et bougez, vos données vous suivent! Retrouvez tous vos services du cloud pro en cliquant ici. Avec sauvegardez sans y penser, partagez et bougez, vos données vous suivent! Retrouvez tous vos services du cloud pro en cliquant ici. SUGARSYNC VOUS ACCOMPAGNE À TOUT MOMENT DANS LA GESTION DE VOS DONNÉES

Plus en détail

Middleware et services de la grille

Middleware et services de la grille 1 2 La vision EGEE (Enabling Grids for E-sciencE) Création d une infrastructure Grid à travers l Europe, qui implique les réseaux de recherches scientifiques actuelle et futur Offrir à la communauté des

Plus en détail

MEDLINE BANQUE DE DONNÉES EN MÉDECINE INTERFACE PUBMED INITIATION

MEDLINE BANQUE DE DONNÉES EN MÉDECINE INTERFACE PUBMED INITIATION MEDLINE BANQUE DE DONNÉES EN MÉDECINE INTERFACE PUBMED INITIATION document préparé par : CSSS-IUGS SERVICE DE BIBLIOTHÈQUE Janvier 2008 INTRODUCTION Medline est une banque de données bibliographique produite

Plus en détail

Cloud Computing : quels intérêts et quelles solutions pour les développeurs?

Cloud Computing : quels intérêts et quelles solutions pour les développeurs? Cloud Computing : quels intérêts et quelles solutions pour les développeurs? Jérôme PANSANEL Directeur technique France Grilles JDEV 2015 BORDEAUX Sommaire Cloud Computing

Plus en détail

Rapport de certification

Rapport de certification Rapport de certification Memory Arrays avec Memory Gateways Version 5.5.2 Préparé par : Le Centre de la sécurité des télécommunications à titre d organisme de certification dans le cadre du Schéma canadien

Plus en détail

Tableau Online Sécurité dans le cloud

Tableau Online Sécurité dans le cloud Tableau Online Sécurité dans le cloud Auteur : Ellie Fields Ellie Fields, directrice principale du marketing produits, Tableau Software Juin 2013 p.2 Tableau est conscient que les données font partie des

Plus en détail

Virtual Data Center d Interoute. Prenez la main sur votre Cloud.

Virtual Data Center d Interoute. Prenez la main sur votre Cloud. Virtual Data Center d Interoute. Prenez la main sur votre Cloud. Faites évoluer vos ressources informatiques à la demande Choisissez la localisation d hébergement de vos données en Europe Le réseau européen

Plus en détail

Installation Client (licence réseau) de IBM SPSS Modeler 14.2

Installation Client (licence réseau) de IBM SPSS Modeler 14.2 Installation Client (licence réseau) de IBM SPSS Modeler 14.2 Les instructions suivantes permettent d installer IBM SPSS Modeler Client version 14.2 en utilisant un licence réseau. Ce présent document

Plus en détail

! Séquence et structure des macromolécules. " Séquences protéiques (UniProt) " Séquences nucléotidiques (EMBL / ENA, Genbank, DDBJ)

! Séquence et structure des macromolécules.  Séquences protéiques (UniProt)  Séquences nucléotidiques (EMBL / ENA, Genbank, DDBJ) Introduction à la Bioinformatique Introduction! Les bases de données jouent un rôle crucial dans l organisation des connaissances biologiques.! Nous proposons ici un tour rapide des principales bases de

Plus en détail

Directives pour les fournisseurs concernant:

Directives pour les fournisseurs concernant: Directives pour les fournisseurs concernant: La demande d une modification de compte Table des Matières 3 INTRODUCTION 4 12 19 DEMANDE D UNE MODIFICATION DE COMPTE - IDENTITÉ DEMANDE D UNE MODIFICATION

Plus en détail

Les journées SQL Server 2013

Les journées SQL Server 2013 Les journées SQL Server 2013 Un événement organisé par GUSS Les journées SQL Server 2013 SharePoint pour le DBA SQL Configuration, haute disponibilité et performances David Barbarin Patrick Guimonet Un

Plus en détail

«L utilisation d un intranet permet-il la mise en place d un travail collaboratif et/ou coopératifs? Pour quelles compétences?»

«L utilisation d un intranet permet-il la mise en place d un travail collaboratif et/ou coopératifs? Pour quelles compétences?» «L utilisation d un intranet permet-il la mise en place d un travail collaboratif et/ou coopératifs? Pour quelles compétences?» Introduction Le travail que nous présentons ici repose sur une expérience

Plus en détail

Contenu de la version 3.4 C I V I L N E T A D M I N I S T R A T I O N

Contenu de la version 3.4 C I V I L N E T A D M I N I S T R A T I O N Contenu de la version 3.4 C I V I L N E T A D M I N I S T R A T I O N Table des matières 1 CIVIL NET ADMINISTRATION GESTION DES APPLICATIONS... 3 1.1 AMELIORATIONS... 3 1.2 CORRECTIONS... 6 2 CIVIL NET

Plus en détail

IIS, c est quoi? Installation de IIS Gestion de base de IIS Méthodes d authentification. Edy Joachim,

IIS, c est quoi? Installation de IIS Gestion de base de IIS Méthodes d authentification. Edy Joachim, IIS, c est quoi? Historique de IIS Installation de IIS Gestion de base de IIS Méthodes d authentification Edy Joachim, Internet Information Services, c est quoi? Internet Information Services (IIS) 7.5

Plus en détail

Bibliographie Introduction à la bioinformatique

Bibliographie Introduction à la bioinformatique Bibliographie Introduction à la bioinformatique 5. Les bases de données biologiques, SQL et la programmation Python/C++ Zvelebil et Baum, Understanding bioinformatics Beighley, Head First SQL Chari, A

Plus en détail

Performances. Gestion des serveurs (2/2) Clustering. Grid Computing

Performances. Gestion des serveurs (2/2) Clustering. Grid Computing Présentation d Oracle 10g Chapitre VII Présentation d ORACLE 10g 7.1 Nouvelles fonctionnalités 7.2 Architecture d Oracle 10g 7.3 Outils annexes 7.4 Conclusions 7.1 Nouvelles fonctionnalités Gestion des

Plus en détail

RC SOFT. SaaS RC SOFT. / solution de gestion à la demande RC SOFT OUTILS D'ANALYSE ACCESSIBILITÉ GESTION DE LA TVA SAISIE & DONNÉES ÉDITIONS & EXPORT

RC SOFT. SaaS RC SOFT. / solution de gestion à la demande RC SOFT OUTILS D'ANALYSE ACCESSIBILITÉ GESTION DE LA TVA SAISIE & DONNÉES ÉDITIONS & EXPORT C O M P TA B I L I T É Le module - Comptabilité permet de tenir l ensemble de votre comptabilité, de la saisie d écritures au bilan. Vous pouvez partager l ensemble des données avec vos collaborateurs

Plus en détail

Que signifie être membre du Programme de l OMS pour la pharmacovigilance internationale

Que signifie être membre du Programme de l OMS pour la pharmacovigilance internationale Que signifie être membre du Programme de l OMS pour la pharmacovigilance internationale Historique Le Programme de l OMS pour la pharmacovigilance internationale a été mis sur pied en 1968 suite au désastre

Plus en détail

Formation continue BNF // Programme des cours 2015

Formation continue BNF // Programme des cours 2015 Formation continue BNF // Programme des cours 2015 Du 03 septembre 2015 Août Molecular Biology // Widely used methods in research laboratories Introduction and history / Principles, methods and applications

Plus en détail

Rapport de certification

Rapport de certification Rapport de certification NetApp Data ONTAP v8.1.1 7-Mode Préparé par : le Centre de la sécurité des télécommunications Canada à titre d organisme de certification dans le cadre du Schéma canadien d évaluation

Plus en détail

Infrastructures de recherche: Positions de la France dans Horizon 2020

Infrastructures de recherche: Positions de la France dans Horizon 2020 Infrastructures de recherche: Positions de la France dans Horizon 2020 Jean Pierre CAMINADE Département des Grandes Infrastructures de recherche MESR/DGRI/DGIR B3 7 Novembre 2013 1 1 Appels infrastructures

Plus en détail

Sage Déclarations Sociales

Sage Déclarations Sociales Sage Déclarations Sociales Recueil d informations techniques Décembre 2011 2011 Sage R&D Paie PME 1 Sommaire Avertissements 3 Introduction 4 Particularités de Microsoft Windows et Microsoft SQL Server...

Plus en détail