Compte-rendu réunion WP Mardi 30/06/2015 de 10h à 16h30

Dimension: px
Commencer à balayer dès la page:

Download "Compte-rendu réunion WP 2.7.2 Mardi 30/06/2015 de 10h à 16h30"

Transcription

1 Compte-rendu réunion WP Mardi 30/06/2015 de 10h à 16h30 Organisateurs/Coordinateurs: Guy Perrière et Claudine Médigue Participants (22) GENOSCOPE : Sébastien Faye, Quentin Cadarec, Eric Pelletier MICROSCOPE : Stéphane Cruveiller, Marine Séjourné, Alexandra Calteau, Claudine Médigue PRABI : Christine Oger, Jean François Taly, Guy Perrière PACA_Bioinfo : Damien Desmarais, Olivier Poirot CBiB : Aurélien Barre LIRMM : Vincent Lefart, Anne-Muriel Chifolleau MetaGenoPolis : Nicolas Pons, Ndeye Aram, Amine Ghozlane INRIA/Irisa: Dominique Lavenier, Gaetan Benoit MIGALE: Jean François Gibrat GeneOuest/Roscoff: Christophe Caron (après midi) Introduction Tour de table Contenu de la journée (C. Médigue) Exposé 1 Metagenomics: Building a taxonomic markers collection Jean François Taly (PRABI) Au cours de la première tranche de CDD accordée par France Génomique, François Bartolo (IE) et Clément Lionnet (étudiant M1) ont développé un prototype de pipeline d assignation taxonomique qui a été présenté au cours de la réunion de l année dernière. Ces développements ont constitué le point de départ des travaux de l actuel CDD, Jean-François Taly. Dans un premier temps, présentation de lebibi QBPP, un système d identification taxonomique dédié aux bactéries et aux archées et fondé sur l utilisation de critères phylogénétiques ( Ce système permet de construire des phylogénies «à la volée» à partir de différents marqueurs (ARNr 16S, rpob, reca, etc.) et il s affranchit donc de l utilisation d une banque de données contenant des séquences préalignées. Les étapes sont : i) une recherche de similarité au moyen de BLAST ; ii) la récupération d un sous-ensemble de séquences homologues puis leur alignement au moyen de MAFFT ; iii) la construction d une phylogénie au moyen de FastTree. Le séquence requête est affectée à la séquence ou au groupe de séquences le plus proche du point de vue de la distance patristique (Diapo. 5). Il est possible d utiliser le service sur données provenant d un séquenceur de type MiSeq (7 sec. pour une identification, les accès disques constituant la partie limitante du processus). Objectif du travail Construction d une base de données de référence qui soit représentative de la diversité taxonomique des procaryotes puis utilisation des développements déjà réalisés qui seront encapsulés dans Galaxy. Une bonne assignation taxonomique dépend en effet 1

2 de la représentativité de la base de données utilisée. Une base de départ peut être représentée par la banque taxonomique du NCBI. Le problème est que le code de nomenclature utilisé par le NCBI contient un certain nombre d erreurs ou d incohérences. Le bilan, en termes d espèces recensées, est de pour les bactéries, (seulement) 533 pour les archées et pour les eucaryotes! Par ailleurs, le problème avec les séquences provenant de GenBank est qu une proportion importante d entre elles contiennent des annotations erronées, en particulier au niveau taxonomique. C est ainsi qu une séquence annotée comme appartenant au genre Streptococcus dans GenBank s est en fait avérée provenir d un Psychrobacter selon lebibi QBPP. Pour indiquer les problèmes éventuels, GenBank utilise le tag UNVERIFIED au niveau du nom d espèce / de souche. Le caractère permanent des erreurs d annotations taxonomique est en particulier lié au fait que seules les personnes ayant effectué le dépôt d une séquence dans GenBank ont le droit d effectuer des corrections et ceci depuis la mise en place de cette collection. Une solution est d utiliser la banque RefSeq dans laquelle les erreurs d assignation sont corrigées et ou une séquence représentative pour chaque type de souche est définie. Le problème est que RefSeq ne couve qu une petite partie des séquences de GenBank. Mise en place d une banque de données d ARNr 16S Pour l instant, les différentes banques d ARNr 16S utilisée par lebibi QBPP sont mises à jour tous les six mois et l objectif est de parvenir à automatiser suffisamment le processus afin d avoir une MàJ par semaine. En effet, lebibi QBPP utilise non pas une mais plusieurs banques construites en fonction de la «stringence» taxonomique. La banque la plus stringente contient ainsi une seule séquence (séquence «type») par espèce. Dans le pipeline de construction en cours de développement, les séquences sont sélectionnées dans GenBank et RefSeq à l aide du système ACNUC. Le programme CD-HIT est ensuite utilisé en deux temps pour : i) effectuer une déréplication des séquences ; puis ii) pour construire des clusters à 80 %. Les séquences de chaque cluster sont ensuite alignées avec MAFFT et un arbre est construit avec FastTree. Chaque arbre est ensuite parsé afin de créer des groupes. Un nœud de l arbre constitue un groupe si la médiane des distances patristiques séparant les différentes feuilles de l arbre est < 0,01 (distance GTR+ 4 ) et si le support alrt > 0,90. Dans le cas de séquences qui ne se placent dans aucun groupe, l hypothèse la plus parcimonieuse est que ce sont des erreurs de séquençage. Exemple : Streptococcus agalactiae, séquence JX qui «part à l ouest» car annotation du taxon erronée (il s agit en fait d une Psychrobacter). Conclusions Perspectives Il faut désormais en théorie moins d une nuit pour mettre à jour la base de données de taxonomie. D un autre côté, les annotations ne sont pas toujours mises à jour aussi régulièrement (besoin de développer une procédure automatique). Il est envisagé d utiliser le cloud IFB pour réaliser une partie des calculs car le cluster n est pas approprié du fait de la façon dont sont gérées les files d attente. Enfin, il reste de nombreux problèmes concernant la taxonomie du NCBI pour les eucaryotes (notamment chez les champignons). 2

3 Exposé 2 Assignation taxonomique et détection de chimères dans les données génomiques complexes et les métagénomes: prototype d'un outil interactif Damien Desmarais (IGS/PACA-Bioinfo) Développement d un outil de fouille de données métagénomique permettant de détecter des chimères afin de corriger les erreurs d assignation taxonomique. Problématique Porte sur l analyse de données de séquençage de cellules uniques bruitées et de métagénomes. Dans le premier cas, exemple d une séquence de virus géant du lac Washington aux USA faussement annotée comme une séquence d archée. Pipeline et interface graphique Suit une description du pipeline de traitement des données permettant d effectuer une assignation taxonomique sur l ensemble des contigs analysés pour application aux microbiomes environnementaux. A partir des contigs : i) prédiction de gènes avec MetaGeneMark, ou l option «Virus» de GeneMark ; ii) recherche de similarités avec BLASTP ; iii) assignation taxonomique. Le pipeline est écrit écrit en Perl, avec de nombreuses bibliothèques appelées et des liens entre les langages de programmation utilisés pour les différentes briques. Utilisation du format SVG pour les graphiques. Sont ensuite présentées des captures d écran montrant les différentes étapes de la réalisation d une analyse. Question : pourquoi passer par la séquence protéique pour faire de l assignation taxonomique (plus rapide MAIS moins sensible que le nucléique)? Conclusions Le traitement des données prend 25 min pour annoter les 505 ORFs. Réflexion en cours pour la mise à disposition de ce service : TGCC ou Cloud IFB? Uniquement en local? Exposé 3 Simka: méthode rapide pour estimer la similarité entre de nombreux échantillons métagénomiques Gaëtan Benoit (IRISA, ANR Hydrogen) Le point de départ de Simka c est une matrice de similarité entre deux échantillons métagénomiques: un clustering est présenté sous forme de dendogramme pour voir quel échantillon est proche de quel autre. TARA : 200 sites plusieurs profondeurs 4000 échantillons au total. Problématique Comment estimer la similarité entre deux échantillons à partir de l ensemble des lectures de chaque métagénome? Avec 100 millions de lectures une approche de type BLAST mettrait des mois pour calculer l intersection. L outil, publié en 2014, utilise sur les k-mer et calcul les intersection en quelques heures. La taille des mots utilisés doit être k 30 au minimum pour que ce soit pertinent. Simka Le programme utilise une fonction basée sur les k-mers partagés et les mesures de similarités proposées sont la Jaccard similarity et l abondance based Jaccard similarity. Pour le comptage des k-mers sur N échantillons, utilisation de KMC2 (Deorowicz et al., 2014). Puis mesure de présence absence en transformant en 3

4 booléen. Le test sur 21 échantillons de TARA nécessite 4h de calcul avec Simka (valeur pour la présence/absence de k-mers et pour l abondance des k-mers). Questions Problème de validation car on ne sait pas vraiment quels résultats on doit avoir. Tout ce que l on sait pour l instant est que ça colle en général avec ce que l on connaît des échantillons (leur provenance?) Une possibilité serait de passer par des simulations. Les seuils sont très stringent donc on voit des parties très fortes du signal. Beaucoup de configurations ont été testées au niveau de la longueur des k-mers (on retrouve partout des k-mers de trop petites tailles). Comparaison des matrices : pas de formules mathématiques pour l instant c est visuel. Simka tourne au CCRT. Remarque sur le fait que la bibliothèque GATB est aussi très efficace. Perspectives Quelques k-mers par read devraient suffire pour avoir les mêmes résultats. Exposé 4 BigData accelerated computing in R : an application in metagenomics Ndeye Aram GAYE (MetaGenoPolis) Qu est-ce que le big data? Cette appellation, à la fois ambiguë et vague, implique des concepts variés touchant au volume, la vélocité (fréquence de production), la variété, la véracité, la complexité. Il existe des solutions aussi bien au niveau matériel (tout ce qui touche au High Performance Computing HPC) que logiciel (Message Passing Interface MPI, Hadoop, Spark). Les données en génomique sont désormais du big data. Un exemple : une matrice de comptage sur un catalogue de gènes peut comprendre gènes et 1000 ou plus individus et 3000 échantillons de ce type peuvent être produits par an, soit 200 Tb de données. Pour traiter les données de génomique, il existe des bibliothèques R, qui est un langage répandu et relativement facile à utiliser mais qui est interprété et donc lent. La bibliothèque MetaOMiner a ainsi été développée à MetaGenoPolis. Cette bibliothèque comprend deux niveaux : un pour le préprocessing (normalisation, etc) et un pour le processing (comptage de gènes, clustering, etc.) des données. Les demandes des utilisateurs, sont donc de faire des analyses big data sous R sans changer les habitudes, mais ce langage n est pas fait pour ça! Une première solution trouvée pour répondre aux besoins des utilisateurs a consisté en le développement d un langage de programmation spécifique au domaine de la métagénomique : DSL. Par ailleurs, mise en place du projet Mach (Massive calculations on heterogeneous systems). Il s agit d un projet européen de trois ans dont l objectif est de transformer du code R en binaire exécutable. Plusieurs cibles architecturales sont envisagées (Clusters de calcul, Cloud computing, etc.) Parmi les développements en cours figure la mise en place de la bibliothèque R Megapack, codée en C. Par ailleurs, la bibliothèque PARConnector permet de faire du HPC facilement via la soumission à un scheduler. Enfin, la bibliothèque gpustat est consacrée à la distribution des données sur des systèmes à base de GPU. 4

5 Exposé 5 Développements bioinformatiques pour l'analyse de données métagénomiques AMALGAM, vers un outil d'assemblage automatique Stéphane Cruveiller et Marine Séjourné (LABGeM/PF MicroScope) Tout d abord un point est fait sur le pipeline DIGEST déjà présenté en L objectif de ce pipeline est de compléter les gènes partiels (soit 56 %) du catalogue du microbiome intestinal humain à partir des données de séquence de capture. Un rappel est effectué sur la stratégie de séquençage par capture ainsi que sur la stratégie d analyse du pipeline développé (Diapos. 7 à 10). Suit une présentation des résultats obtenus à l issue du départ du premier CDD (Arnaud Felten). L analyse de sept individus (sur les 50 de départ) a permis de compléter plus de deux millions de gènes du catalogue soit 25 % des gènes initialement incomplets. Le pipeline est fonctionnel, déployé au CCRT, et disponible à la communauté. L analyse des 43 individus restants devrait être réalisée dans le courant de l année Travailler aussi avec les assemblages initiaux aussi pour s affranchir des chimères. La deuxième partie de l exposé est tout d abord consacrée à la présentation d un état de l art sur les assembleurs de génomes et de métagénomes. A la première place en termes de nombre de citations, on trouve Velvet et son complémentaire MetaVelvet, dédié aux métagénomes (trois publication en 2008, 2012 et 2015). En deuxième position se trouve ABySS (publication en 2009). Lorsque l on regarde les approches utilisées par les différents programmes il apparaît que l assemblage brut des données de métagénomes est très difficile car les données sont hétérogènes. Suit une présentation d AMALGAM (Automatic MicrobiAL Genome Assembler), un pipeline développé au LABGeM et basé sur l assembleur commercial Newbler de 454 Roche LifeSciences). Ce système permet d améliorer la finition du génome grâce à l utilisation de l outil GapCloser provenant de la bibliothèque SOAP. Qui plus est, il permet de réaliser des statistiques d assemblage via QUAST (Quality Assessment Tool for Genome Assemblies). Une comparaison de ABySS et Newbler montre que ce dernier est plus long mais propose des résultats nettement meilleurs. Le problème est que Newbler est un produit commercial. Pour finir la plateforme SynBioWatch dédiée à la détection détecter et l identification des agents pathogènes dans un échantillon métagénomique est présentée. Cette plateforme permet non seulement de faire de l assignation taxonomique mais aussi de détecter des gènes de résistance aux antibiotiques et de virulence et/ou des toxines. SynBioWatch a été déployée au sein du cloud IFB sous la forme d une Machine Virtuelle. Exposé 6 Méthodes d analyses à grande échelle des métatranscriptomes eucaryotes dans le projet TARA Océans Quentin Carradec (Genoscope) L approche métatranscriptome permet d assembler les données de séquence plus facilement, et la prédiction de gènes n est pas nécessaire. Le but de l analyse présentée consiste en la création d un catalogue d unigènes (beaucoup de gènes sont fractionnés). Une fois ce catalogue établit, on calcule les occurrences des unigènes pour avoir une idée de l abondance de chaque gène par échantillon. 5

6 Analyse de quatre stations marines avec concentration en chlorophylle différente qui ont montré l existence d une corrélation avec taux de fer dans l eau. Au total, assemblage de 7,9 milliards de lectures en 16 millions de contigs ayant permis l identification de 9,4 millions d unigènes dont 19 % seulement possèdent un match dans Pfam. Pour étudier l impact du fer sur la prolifération d un stramenopile, analyse d une espèce donnée (Pelagomonas calceolata) dont on a trois transcriptomes de référence. Etude des fonctions Pfam moins exprimées dans la station avant bloom (absence de fer) que pendant le bloom (présence de fer). Les fonctions impliquées dans la photosynthèse mais aussi dans la production d acides aminés et la traduction ont ainsi des activités plus important pendant le bloom. Une fonction est par contre plus exprimée avant le bloom que pendant, il s agit du gène de flavodoxine impliquée dans la photosynthèse (tout comme la ferredoxine, mais l enzyme n utilise pas de fer comme co-facteur). L organisme utilise la ferredoxine quand il y en a dans le milieu, c est-à-dire pendant le bloom. La glycolyse est également impactée ce qui montre une adaption de P. calceolata à l absence de fer. Perspectives Faire ce genre d analyse sur l ensemble des échantillons de toutes les stations afin d avoir une description globale du transcriptome des eucaryotes présent dans les métagénomes des stations séquencées. Quid des 80% de données qui n ont pas de match Pfam? pour Eric l exploitation des données avec les modules de KEGG pose des problèmes lié à la taille des fragments. Exposé 7 Travaux et problématiques en métagénomique bactérienne au CBiB Aurélien Barre (CBiB) Trois thématiques en métagénomique sont abordées dans le groupe : Virus de plantes (classsification), Santé (CHU de bordeaux pour la polyartrite rhumatoïde) et paléométagénomique. Les questions posées sont classiques en métagénomique : i) obtention de listes d espèces ; ii) comparaison d échantillons ; et iii) fonctionnement du milieu (établissement d un catalogue de gènes). Classification Question du déterminisme de la polyartrite rhumatoïde en terme de phylogénie (existe-t il un déséquilibre des populations bactériennes responsables de l inflammation?) Analyses d échantillons métagénomiques avec des patients sains et des malades puis, en fonction de la population bactérienne, détermination du traitement approprié. La classification des lectures se fait en utilisant la la banque GreenGenes et le système Tango (phases 1 et 2) puis utilisation d un autre outil pour passer dans l espace de nommage du NCBI. Une alternative est l utilisation du système Phylosift qui fait de l assignation taxonomique après un mapping réalisé au moyen de BWA (phase 3). Utilisation de Cytoscape pour intégrer les résultats d analyse et effectuer une représentation sous forme de graphes d espèces sur-représentées chez les malades => est ce que cela peut expliquer l apparition de la maladie? (travail en cours) Pour l analyse comparative, utilisation du pipeline d origine canadienne MetagenAssist. 6

7 Un workflow éventuellement intégrable sous Galaxy est également en cours de développement. Ce workflow serait dans l esprit de MetagenAssist mais il servirait également à effectuer des assignations taxonomiques et permettrait de visualiser les résultats d une phylogénie. Métagénomique Fonctionnelle Projet Biomines avec IFP Energie Nouvelles. L objectif de ce projet est de déterminer un bioprocess (i.e., un ensemble d enzymes) permettant de produire du bioéthanol. Test de la bibliothèque R mmnet (microbiome metabolic network) intégrée dans Bioconductor qui utilise les données KEGG ainsi que les prédictions enzymatiques issues de de MG-RAST pour constuire les réseaux qui peuvent être ensuite comparés. L annotation fonctionnelle est faite en réalisant des prédictions d ORF sur les lectures au moyen de FragGeneScan (remarque de GP sur le fait que Glimmer-MG a une bien meilleure sensibilité que FragGeneScan, aujourd hui obsolète). Les moyens de calcul utilisés sont ceux du CBiB, c est-à-dire le mésocentre de calcul intensif Aquitaine. Exposé 8 Technologies de séquençage et stratégies d'assemblage de novo Faye Sebastien (Genoscope, WP 2.3) L exposé commence par une présentation des différents paramètres pouvant jouer sur le degré de difficulté des analyses (complexité du génome, technologie de séquençage, méthode d assemblage, etc.) La complexité d un génome est estimée par comptage des k-mers pour déterminer : i) ceux qui sont très répétés ; ii) ceux qui sont «uniques» ; et iii) ceux qui sont rares du fait d erreurs de séquençage. Une fois que l on a une idée de la complexité des données on peut choisir la méthode d assemblage (algorithme glouton, OLC ou graphes de de Bruijn). Suit une discussion sur l utilisation et l intégration de méthodes de séquençage permettant d obtenir des lectures longues : PacBio reads (85% identité). Moleculo qualité top (95% identité). Nanopore (longues lectures mais qualité très médiocre). Un assemblage avec des lectures longues est presque indispensable dans le cas de génomes «complexes». Pour des génomes non complexes la technologie de séquençage «short read» est largement suffisante pour obtenir un assemblage solide avec une approche type de Bruijn. Discussion : école d été en métagénomique Présentation par GP d un projet d école d été 2016 sur l analyse de données métagénomique. L appel à projet d écoles thématiques lancé par l INEE et relayé par le GdR de Génomique Environnementale est passé, mais il faudrait tout de même mettre en place cette école le plus rapidement possible car les besoins sont vraiment importants (essentiellement au niveau pratique). Existant Tour d horizon de quelques formations/workshops en Europe et dans le monde : 7

8 Formation de l EBI organisée par Rob Finn ( La prochaine édition se tient en septembre 2015 et les diapositives des conférenciers et des travaux pratiques sont disponibles sur le site. Workshop du TGAC, plus basé sur des exposés que des exercices pratiques ( Canadian Bioinformatics Workshop Series : voir site du CBW ( Bilan : peu de «training» mais pas mal de workshops avec exposés sur l état de l art. GP mentionne la sortie du livre «La Métagénomique» aux éditions Quae ( qui pourrait donner quelques idées d intervenants dans la future école. Lieu Proposition initiale d organisation à Evry/Paris par GP. Contre-propositions d organisation en résidentiel. Nicolas Pons a une adresse pas chère et Christophe Caron a aussi testé deux adresses : Organisation Oléron ( o Les + : super site (vélo, salles très pratique, piscine, mer pas loin, etc.) Accueil vraiment de qualité (souplesse, etc.). Repas standard mais option dîner ++. Il faut y aller en mai / juin / septembre / octobre. o Les : connexion internet moyenne. Nantes : devis joint de 14 k pour trois jours. o Les + : réseau internet 100 Mbps symétrique ; repas et cadre ; desserte de Nantes ; hôtel + salle sur le même campus. o Les : peut-être le côté hôtel (moins chaleureux que le site d'oléron par exemple même si le cadre est vraiment pas mal). Partie théorique : en amphi pour pouvoir être nombreux. Partie pratique : 30 personnes environ. Pour permettre aux personnes de n assister qu à la partie théorique, il faudra rassembler les exposés sur deux jours, puis passer à la pratique sur les deux derniers jours. Dates et durée En 2016, JOBIM se déreoulera du 28 au 30 juin à Lyon et il faut donc éviter d organiser l école aux alentours de cette date, ceci d autant plus que la coupe d Europe de football se déroulera en France durant le printemps 2016! Proposition d une durée de quatre jours, allant de lundi midi au vendredi midi. La date approximative serait début septembre. Choix des thématiques Nous devons échanger par mail au cours de l automne 2015 afin de définir des thématiques précises sans essayer de tout couvrir. Deux grands domaines : analyses de tag / analyse globale. Une fois les thèmes définis, il faudra établir une liste d intervenants et procéder à leur invitation le plus rapidement possible. 8

9 Public visé Cette formation doit pouvoir permettre aux personnes y assistant de traiter par la suite des jeux de données en taille «réelle» (c est-à-dire de très grande taille) ce qui semble proscrire l emploi d un outil comme Galaxy. Du fait de ce prérequis, le public visé serait donc plutôt constitué de bioinformaticiens. Actions/décisions Les personnes ayant des informations pour une organisation en résidentielle envoient un mail à CM et GP pour pouvoir décider rapidement du lieu d organisation. CM s occupe de rassembler les informations sur le financement de cette école (via l IFB et France Génomique et éventuellement les tutelles). GP initie un premier mail pour décider des thématiques à aborder et avoir une liste d intervenants étrangers à inviter + intervenants de notre réseau à solliciter. Ce premier canevas d organisation permettra de faire circuler un doodle (au minimum aux intervenants identifiés) afin de statuer rapidement sur les dates auxquelles cette école devrait être organisée. Compte-rendu rédigé par C. Médigue et G. Perrière 9

Analyse des données de séquençage massif par des méthodes phylogénétiques

Analyse des données de séquençage massif par des méthodes phylogénétiques Analyse des données de séquençage massif par des méthodes phylogénétiques Roux S., Taib N., Mangot J.F., Hugoni M., Mary I., Ravet V., Bronner G., Enault F., Debroas D. Équipe Microbiologie de l'environnement

Plus en détail

Big data et sciences du Vivant L'exemple du séquençage haut débit

Big data et sciences du Vivant L'exemple du séquençage haut débit Big data et sciences du Vivant L'exemple du séquençage haut débit C. Gaspin, C. Hoede, C. Klopp, D. Laborie, J. Mariette, C. Noirot, MS. Trotard bioinfo@genopole.toulouse.inra.fr INRA - MIAT - Plate-forme

Plus en détail

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY Yvan Le Bras yvan.le_bras@irisa.fr Cyril Monjeaud, Mathieu Bahin, Claudia Hériveau, Olivier Quenez, Olivier Sallou, Aurélien Roult, Olivier

Plus en détail

Mise en place de serveurs Galaxy dans le cadre du réseau CATI BBRIC

Mise en place de serveurs Galaxy dans le cadre du réseau CATI BBRIC Mise en place de serveurs Galaxy dans le cadre du réseau CATI BBRIC {Sebastien.Carrere, Ludovic.Legrand,Jerome.Gouzy}@toulouse.inra.fr {Fabrice.Legeai,Anthony.Bretaudeau}@rennes.inra.fr CATI BBRIC 35 bioinformaticiens

Plus en détail

e-biogenouest CNRS UMR 6074 IRISA-INRIA / Plateforme de Bioinformatique GenOuest yvan.le_bras@irisa.fr Programme fédérateur Biogenouest co-financé

e-biogenouest CNRS UMR 6074 IRISA-INRIA / Plateforme de Bioinformatique GenOuest yvan.le_bras@irisa.fr Programme fédérateur Biogenouest co-financé e-biogenouest Coordinateur : Olivier Collin Animateur : Yvan Le Bras CNRS UMR 6074 IRISA-INRIA / Plateforme de Bioinformatique GenOuest yvan.le_bras@irisa.fr Programme fédérateur Biogenouest co-financé

Plus en détail

DÉFIS DU SÉQUENÇAGE NOUVELLE GÉNÉRATION

DÉFIS DU SÉQUENÇAGE NOUVELLE GÉNÉRATION DÉFIS DU SÉQUENÇAGE NOUVELLE GÉNÉRATION PRINCIPES DE BASE SUR LES DONNEES ET LE CALCUL HAUTE PERFORMANCE Lois de Gray sur l ingénierie des données 1 : Les calculs scientifiques traitent des volumes considérables

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Gilles Gasso, Stéphane Canu INSA Rouen -Département ASI Laboratoire LITIS 8 septembre 205. Ce cours est librement inspiré du cours DM de Alain Rakotomamonjy Gilles Gasso, Stéphane

Plus en détail

Master de Bioinformatique et Biologie des Systèmes Toulouse http://m2pbioinfo.biotoul.fr Responsable : Pr. Gwennaele Fichant

Master de Bioinformatique et Biologie des Systèmes Toulouse http://m2pbioinfo.biotoul.fr Responsable : Pr. Gwennaele Fichant Master de Bioinformatique et Biologie des Systèmes Toulouse http://m2pbioinfo.biotoul.fr Responsable : Pr. Gwennaele Fichant Parcours: Master 1 : Bioinformatique et biologie des Systèmes dans le Master

Plus en détail

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique Objectifs Clustering On ne sait pas ce qu on veut trouver : on laisse l algorithme nous proposer un modèle. On pense qu il existe des similarités entre les exemples. Qui se ressemble s assemble p. /55

Plus en détail

Introduction aux bases de données: application en biologie

Introduction aux bases de données: application en biologie Introduction aux bases de données: application en biologie D. Puthier 1 1 ERM206/Technologies Avancées pour le Génome et la Clinique, http://tagc.univ-mrs.fr/staff/puthier, puthier@tagc.univ-mrs.fr ESIL,

Plus en détail

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems

Plus en détail

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST.

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST. La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST. Gaël Le Mahec - p. 1/12 L algorithme BLAST. Basic Local Alignment Search Tool est un algorithme de recherche

Plus en détail

Big Data: développement, rôle des ARS?? Laurent Tréluyer, ARS Ile de France Alain Livartowski Institut Curie Paris 01/12/2014

Big Data: développement, rôle des ARS?? Laurent Tréluyer, ARS Ile de France Alain Livartowski Institut Curie Paris 01/12/2014 Big Data: développement, rôle des ARS?? Laurent Tréluyer, ARS Ile de France Alain Livartowski Institut Curie Paris 01/12/2014 1 Classiquement, le Big Data se définit autour des 3 V : Volume, Variété et

Plus en détail

E-BIOGENOUEST, VERS UN ENVIRONNEMENT VIRTUEL DE RECHERCHE (VRE) ORIENTÉ SCIENCES DE LA VIE? Intervenant(s) : Yvan Le Bras, Olivier Collin

E-BIOGENOUEST, VERS UN ENVIRONNEMENT VIRTUEL DE RECHERCHE (VRE) ORIENTÉ SCIENCES DE LA VIE? Intervenant(s) : Yvan Le Bras, Olivier Collin E-BIOGENOUEST, VERS UN ENVIRONNEMENT VIRTUEL DE RECHERCHE (VRE) ORIENTÉ SCIENCES DE LA VIE? Intervenant(s) : Yvan Le Bras, Olivier Collin E-BIOGENOUEST Programme fédérateur Biogenouest co-financé par les

Plus en détail

Comment reproduire les résultats de l article : POP-Java : Parallélisme et distribution orienté objet

Comment reproduire les résultats de l article : POP-Java : Parallélisme et distribution orienté objet Comment reproduire les résultats de l article : POP-Java : Parallélisme et distribution orienté objet Beat Wolf 1, Pierre Kuonen 1, Thomas Dandekar 2 1 icosys, Haute École Spécialisée de Suisse occidentale,

Plus en détail

données en connaissance et en actions?

données en connaissance et en actions? 1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)

Plus en détail

GénoToul 2010, Hôtel de Région Midi Pyrénées, Toulouse, 10 décembre 2010

GénoToul 2010, Hôtel de Région Midi Pyrénées, Toulouse, 10 décembre 2010 GénoToul 2010, Hôtel de Région Midi Pyrénées, Toulouse, 10 décembre 2010 Analyse de la diversité moléculaire des régions génomiques de 30 gènes du développement méristématique dans une core collection

Plus en détail

Big Data et Graphes : Quelques pistes de recherche

Big Data et Graphes : Quelques pistes de recherche Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de Lyon/Université Claude Bernard Lyon 1/Université

Plus en détail

OBJECTIFS. Une démarche E-science

OBJECTIFS. Une démarche E-science E-BIOGENOUEST Programme fédérateur Biogenouest co-financé par les Régions Bretagne et Pays de la Loire 24 mois Lancé depuis Mai 2012 Porteur : Olivier Collin (IRISA) Animateur : Yvan Le Bras (IRISA) OBJECTIFS

Plus en détail

Identification de nouveaux membres dans des familles d'interleukines

Identification de nouveaux membres dans des familles d'interleukines Identification de nouveaux membres dans des familles d'interleukines Nicolas Beaume Jérôme Mickolajczak Gérard Ramstein Yannick Jacques 1ère partie : Définition de la problématique Les familles de gènes

Plus en détail

1993 2013 : l IDRIS a vingt ans!

1993 2013 : l IDRIS a vingt ans! Décembre 2013 1993 2013 : l IDRIS a vingt ans! Vingt ans au service de ses utilisateurs et de toutes les communautés scientifiques employant la simulation numérique. Ces vingt années, ainsi que le rappelle

Plus en détail

SysFera. Benjamin Depardon

SysFera. Benjamin Depardon SysFera Passage d applications en SaaS Benjamin Depardon CTO@SysFera SysFera Technologie 2001 Création 2010 Spin Off INRIA Direction par un consortium d investisseurs 12 personnes 75% en R&D Implantation

Plus en détail

Galaxy Training days. Liste des sessions disponibles : http://bioinfo.genotoul.fr. Les formateurs :

Galaxy Training days. Liste des sessions disponibles : http://bioinfo.genotoul.fr. Les formateurs : -- 1 -- Galaxy Training days Durée / Programme : 3 journées. Galaxy : First step. Galaxy : Reads alignment and SNP calling. Galaxy : RNAseq alignment and transcripts assemblies. Public : Personnes souhaitant

Plus en détail

E-Biothon : Une plate-forme pour accélérer les recherches en biologie, santé et environnement.

E-Biothon : Une plate-forme pour accélérer les recherches en biologie, santé et environnement. E-Biothon : Une plate-forme pour accélérer les recherches en biologie, santé et environnement. N.Bard, S.Boin, F.Bothorel, P.Collinet, M.Daydé, B. Depardon, F. Desprez, M.Flé, A.Franc, J.-F. Gibrat, D.

Plus en détail

Travaux pratiques avec RapidMiner

Travaux pratiques avec RapidMiner Travaux pratiques avec RapidMiner Master Informatique de Paris 6 Spécialité IAD Parcours EDOW Module Algorithmes pour la Fouille de Données Janvier 2012 Prise en main Généralités RapidMiner est un logiciel

Plus en détail

Formation continue. Ensae-Ensai Formation Continue (Cepe)

Formation continue. Ensae-Ensai Formation Continue (Cepe) CertifiCat de data scientist Formation continue Ensae-Ensai Formation Continue (Cepe) CertifiCat de data scientist La demande de data scientists est croissante mais peu de formations existent. Ce certificat

Plus en détail

Compte-rendu re union Campus AAR 3 mars 2015

Compte-rendu re union Campus AAR 3 mars 2015 Compte-rendu re union Campus AAR 3 mars 2015 Table des matières Liste d actions... 2 I. Environnement d analyse : INA, Armadillo... 3 a. Connexion de l outil INA avec API Armadillo... 3 b. Outil d analyse

Plus en détail

Intrants médicamenteux en agriculture et en santé : les écosystèmes microbiens sont-ils un problème ou une solution?

Intrants médicamenteux en agriculture et en santé : les écosystèmes microbiens sont-ils un problème ou une solution? Les Rencontres de l Inra au Salon de l agriculture Intrants médicamenteux en agriculture et en santé : les écosystèmes microbiens sont-ils un problème ou une solution? Lundi 23 février 2015 Programme 14h30

Plus en détail

Indexmed : Le big data en écologie? Pas encore disent certains. Pas si sûr! Avec IndexMed. Relevons ce challenge!

Indexmed : Le big data en écologie? Pas encore disent certains. Pas si sûr! Avec IndexMed. Relevons ce challenge! Indexmed : Le big data en écologie? Pas encore disent certains Pas si sûr! Avec IndexMed Relevons ce challenge! Origine du consortium L état des lieux (source : séminaire Allenvie, séminaire Indexmed1)

Plus en détail

Big Data et Graphes : Quelques pistes de recherche

Big Data et Graphes : Quelques pistes de recherche Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci http://liris.cnrs.fr/hamamache.kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de

Plus en détail

Eco-système calcul et données

Eco-système calcul et données Eco-système calcul et données M. Daydé Dr du Comité d'orientation pour le Calcul Intensif (COCIN) Délégué Scientifique INS2I en charge HPC / Grille / Cloud Calcul / données : un enjeu stratégique Calcul

Plus en détail

Les défis statistiques du Big Data

Les défis statistiques du Big Data Les défis statistiques du Big Data Anne-Sophie Charest Professeure adjointe au département de mathématiques et statistique, Université Laval 29 avril 2014 Colloque ITIS - Big Data et Open Data au cœur

Plus en détail

Dr E. CHEVRET UE2.1 2013-2014. Aperçu général sur l architecture et les fonctions cellulaires

Dr E. CHEVRET UE2.1 2013-2014. Aperçu général sur l architecture et les fonctions cellulaires Aperçu général sur l architecture et les fonctions cellulaires I. Introduction II. Les microscopes 1. Le microscope optique 2. Le microscope à fluorescence 3. Le microscope confocal 4. Le microscope électronique

Plus en détail

Semestre HPC. Violaine Louvet. Institut Camille Jordan - CNRS louvet@math.univ-lyon1.fr. Labex MILyon, Printemps 2016

Semestre HPC. Violaine Louvet. Institut Camille Jordan - CNRS louvet@math.univ-lyon1.fr. Labex MILyon, Printemps 2016 Semestre HPC Violaine Louvet Institut Camille Jordan - CNRS louvet@math.univ-lyon1.fr Labex MILyon, Printemps 2016 V. Louvet (ICJ) Semestre HPC Printemps 2016 1 / 9 Présentation du semestre Modélisation

Plus en détail

Indexmed : Le big data en écologie? Pas encore disent certains. Pas si sûr! Avec IndexMed. Relevons ce challenge!

Indexmed : Le big data en écologie? Pas encore disent certains. Pas si sûr! Avec IndexMed. Relevons ce challenge! Indexmed : Le big data en écologie? Pas encore disent certains Pas si sûr! Avec IndexMed Relevons ce challenge! Origine du consortium L état des lieux (source : séminaire Allenvie, séminaire Indexmed1)

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme

Plus en détail

Tests de SlipStream sur les plateformes StratusLab@LAL et OpenStack@CC-IN2P3 : vers la. Vers la fédération du Cloud computing

Tests de SlipStream sur les plateformes StratusLab@LAL et OpenStack@CC-IN2P3 : vers la. Vers la fédération du Cloud computing Tests de sur les plateformes StratusLab@LAL et OpenStack@CC-IN2P3 : vers la fédération du Cloud computing Cécile Cavet1 & Charles Loomis2 (1) Centre François Arago, Laboratoire, Université Paris Diderot,

Plus en détail

Les participants repartiront de cette formation en ayant une vision claire de la stratégie et de l éventuelle mise en œuvre d un Big Data.

Les participants repartiront de cette formation en ayant une vision claire de la stratégie et de l éventuelle mise en œuvre d un Big Data. Big Data De la stratégie à la mise en oeuvre Description : La formation a pour objet de brosser sans concession le tableau du Big Data. Les participants repartiront de cette formation en ayant une vision

Plus en détail

Brochure Datacenter. www.novell.com. Novell Cloud Manager. Création et gestion d un cloud privé. (Faire du cloud une réalité)

Brochure Datacenter. www.novell.com. Novell Cloud Manager. Création et gestion d un cloud privé. (Faire du cloud une réalité) Brochure Datacenter Novell Cloud Manager Création et gestion d un cloud privé (Faire du cloud une réalité) Novell Cloud Manager : le moyen le plus simple de créer et gérer votre cloud WorkloadIQ est notre

Plus en détail

CHAPITRE 3 LA SYNTHESE DES PROTEINES

CHAPITRE 3 LA SYNTHESE DES PROTEINES CHAITRE 3 LA SYNTHESE DES ROTEINES On sait qu un gène détient dans sa séquence nucléotidique, l information permettant la synthèse d un polypeptide. Ce dernier caractérisé par sa séquence d acides aminés

Plus en détail

METTRE LE NUMÉRIQUE AU SERVICE D UN NOUVEAU MODÈLE DE BIBLIOTHÈQUE

METTRE LE NUMÉRIQUE AU SERVICE D UN NOUVEAU MODÈLE DE BIBLIOTHÈQUE 1 METTRE LE NUMÉRIQUE AU SERVICE D UN NOUVEAU MODÈLE DE BIBLIOTHÈQUE Architectures Numériques d'informations. Usages, Contenus et Technologies. Paris, 2 juillet 2010 L emprunteur se fait rare 2 Evolution

Plus en détail

Entreprise et Big Data

Entreprise et Big Data Entreprise et Big Data Christophe Favart Chef Architecte, SAP Advanced Development, Business Information Technology Public Juin 2013 Agenda SAP Données d Entreprise Big Data en entreprise Solutions SAP

Plus en détail

Gènes Diffusion - EPIC 2010

Gènes Diffusion - EPIC 2010 Gènes Diffusion - EPIC 2010 1. Contexte. 2. Notion de génétique animale. 3. Profil de l équipe plateforme. 4. Type et gestion des données biologiques. 5. Environnement Matériel et Logiciel. 6. Analyses

Plus en détail

GESTION D UNE BASE BIBLIOGRAPHIQUE

GESTION D UNE BASE BIBLIOGRAPHIQUE GESTION D UNE BASE BIBLIOGRAPHIQUE BTS Bioanalyses et contrôles Gil Voge Lycée Louise Michel, Grenoble Base de données (BD ou DB, database) Ensemble de données relatif à un domaine particulier des connaissances

Plus en détail

MABioVis. Bio-informatique et la

MABioVis. Bio-informatique et la MABioVis Modèles et Algorithmes pour la Bio-informatique et la Visualisation Visite ENS Cachan 5 janvier 2011 MABioVis G GUY MELANÇON (PR UFR Maths Info / EPI GRAVITE) (là, maintenant) - MABioVis DAVID

Plus en détail

Big Graph Data Forum Teratec 2013

Big Graph Data Forum Teratec 2013 Big Graph Data Forum Teratec 2013 MFG Labs 35 rue de Châteaudun 75009 Paris, France www.mfglabs.com twitter: @mfg_labs Julien Laugel MFG Labs julien.laugel@mfglabs.com @roolio SOMMAIRE MFG Labs Contexte

Plus en détail

Manuel des bonnes pratiques avec CATIA V.5

Manuel des bonnes pratiques avec CATIA V.5 2009 Manuel des bonnes pratiques avec CATIA V.5 Pour aller plus loin dans la maîtrise de l outil CAO Ce document a pour objectif de donner des méthodologies et règles de travail qui permettent de mener

Plus en détail

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI 1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage

Plus en détail

GUIDE DU PARTICIPANT HACKATH YON

GUIDE DU PARTICIPANT HACKATH YON GUIDE DU PARTICIPANT HACKATH YON 2 3 4 OCTOBRE 2015 2 4 Concours de développement à La Roche-sur-Yon. CENTRE DE RESSOURCES EN INNOVATION LA ROCHE-SUR-YON Autour des énergies de demain! LE CONCOURS HACKATH

Plus en détail

Stages 2014-2015 ISOFT : UNE SOCIETE INNOVANTE. Contact : Mme Lapedra, stage@isoft.fr

Stages 2014-2015 ISOFT : UNE SOCIETE INNOVANTE. Contact : Mme Lapedra, stage@isoft.fr Stages 2014-2015 ISOFT : UNE SOCIETE INNOVANTE Contact : Mme Lapedra, stage@isoft.fr ISoft, éditeur de logiciels, est spécialisé dans l informatique décisionnelle et l analyse de données. Son expertise

Plus en détail

COURS SYRRES RÉSEAUX SOCIAUX INTRODUCTION. Jean-Loup Guillaume

COURS SYRRES RÉSEAUX SOCIAUX INTRODUCTION. Jean-Loup Guillaume COURS SYRRES RÉSEAUX SOCIAUX INTRODUCTION Jean-Loup Guillaume Le cours Enseignant : Jean-Loup Guillaume équipe Complex Network Page du cours : http://jlguillaume.free.fr/www/teaching-syrres.php Évaluation

Plus en détail

Limitations of the Playstation 3 for High Performance Cluster Computing

Limitations of the Playstation 3 for High Performance Cluster Computing Introduction Plan Limitations of the Playstation 3 for High Performance Cluster Computing July 2007 Introduction Plan Introduction Intérêts de la PS3 : rapide et puissante bon marché L utiliser pour faire

Plus en détail

L alternative, c est malin 1. Comment faire plein de choses pour pas cher sur MacIntosh

L alternative, c est malin 1. Comment faire plein de choses pour pas cher sur MacIntosh L alternative, c est malin 1 ou Comment faire plein de choses pour pas cher sur MacIntosh (Les logiciels : Pages et Keynote de la suite iwork) (Jean Aboudarham 2006) 1 Merci à François Béranger pour qui

Plus en détail

LIVRE BLANC Décembre 2014

LIVRE BLANC Décembre 2014 PARSING MATCHING EQUALITY SEARCH LIVRE BLANC Décembre 2014 Introduction L analyse des tendances du marché de l emploi correspond à l évidence à une nécessité, surtout en période de tension comme depuis

Plus en détail

Evaluation des performances de programmes parallèles haut niveau à base de squelettes

Evaluation des performances de programmes parallèles haut niveau à base de squelettes Evaluation des performances de programmes parallèles haut niveau à base de squelettes Enhancing the Performance Predictability of Grid Applications with Patterns and Process Algebras A. Benoit, M. Cole,

Plus en détail

Incertitude et variabilité : la nécessité de les intégrer dans les modèles

Incertitude et variabilité : la nécessité de les intégrer dans les modèles Incertitude et variabilité : la nécessité de les intégrer dans les modèles M. L. Delignette-Muller Laboratoire de Biométrie et Biologie Evolutive VetAgro Sup - Université de Lyon - CNRS UMR 5558 24 novembre

Plus en détail

Big data : vers une nouvelle science des risques?

Big data : vers une nouvelle science des risques? Big data : vers une nouvelle science des risques? Serge Abiteboul INRIA et ENS Cachan Conseil national du numérique et Académie des sciences Big data et science des risques 1 Organisation Big data en bref

Plus en détail

Thomas Loubrieu (Ifremer) Small to Big Data. http://wwz.ifremer.fr/bigdata. 26 Novembre 2013, Ifremer, Brest

Thomas Loubrieu (Ifremer) Small to Big Data. http://wwz.ifremer.fr/bigdata. 26 Novembre 2013, Ifremer, Brest Thomas Loubrieu (Ifremer) Small to Big Data 26 Novembre 2013, Ifremer, Brest http://wwz.ifremer.fr/bigdata Small to Big data IFREMER/IDM/ISI T. Loubrieu Résumé A partir d'expériences en gestion de données

Plus en détail

Le Futur de la Visualisation d Information. Jean-Daniel Fekete Projet in situ INRIA Futurs

Le Futur de la Visualisation d Information. Jean-Daniel Fekete Projet in situ INRIA Futurs Le Futur de la Visualisation d Information Jean-Daniel Fekete Projet in situ INRIA Futurs La visualisation d information 1.Présentation 2.Bilan 3.Perspectives Visualisation : 3 domaines Visualisation scientifique

Plus en détail

Jean-François Boulicaut & Mohand-Saïd Hacid

Jean-François Boulicaut & Mohand-Saïd Hacid e siècle! Jean-François Boulicaut & Mohand-Saïd Hacid http://liris.cnrs.fr/~jboulica http://liris.cnrs.fr/mohand-said.hacid Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205

Plus en détail

Module Analyse de Génomes 2011-2012 Master 2 module FMBS 326 Immunoinformatique

Module Analyse de Génomes 2011-2012 Master 2 module FMBS 326 Immunoinformatique Module Analyse de Génomes 2011-2012 Master 2 module FMBS 326 Immunoinformatique Planning du Module : Date Heure Salle 12/12 9h-12h TD info TA1Z bat 25 13h-17h TD info TA1Z bat 25 13/12 9h-12h TD info TA1Z

Plus en détail

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

5. Matériaux en contact avec l eau

5. Matériaux en contact avec l eau Monitoring de la qualité Microbiologique de l eau potable dans les réseaux de distributions Intérêt de l utilisation d un kit de mesure rapide de la flore totale UTLISATIONS 1. Surveillance de Réseau mixte

Plus en détail

UE Programmation Impérative Licence 2ème Année 2014 2015

UE Programmation Impérative Licence 2ème Année 2014 2015 UE Programmation Impérative Licence 2 ème Année 2014 2015 Informations pratiques Équipe Pédagogique Florence Cloppet Neilze Dorta Nicolas Loménie prenom.nom@mi.parisdescartes.fr 2 Programmation Impérative

Plus en détail

Analyse des risques points critiques pour leur maîtrise (HACCP)

Analyse des risques points critiques pour leur maîtrise (HACCP) 59 Chapitre 11 Analyse des risques points critiques pour leur maîtrise (HACCP) 11.1 PRINCIPES DE BASE DE L HACCP... 59 11.2 APPLICATION DES PRINCIPES HACCP À LA PURIFICATION DES MOLLUSQUES BIVALVES...

Plus en détail

Systèmes et algorithmes répartis

Systèmes et algorithmes répartis Systèmes et algorithmes répartis Tolérance aux fautes Philippe Quéinnec Département Informatique et Mathématiques Appliquées ENSEEIHT 4 novembre 2014 Systèmes et algorithmes répartis V 1 / 45 plan 1 Sûreté

Plus en détail

Séquence 4. Comment expliquer la localisation des séismes et des volcans à la surface du globe?

Séquence 4. Comment expliquer la localisation des séismes et des volcans à la surface du globe? Sommaire Séquence 4 Tu as constaté que les séismes et les éruptions volcaniques se déroulaient toujours aux mêmes endroits. Tu vas maintenant chercher à expliquer ce phénomène. Problématique : Comment

Plus en détail

Utilisation de l ingénierie des modèles pour la conception collaborative de produits mécaniques

Utilisation de l ingénierie des modèles pour la conception collaborative de produits mécaniques Utilisation de l ingénierie des modèles pour la conception collaborative de produits mécaniques Mathias Kleiner Laboratoire des Sciences de l Information et des Systèmes (LSIS) - UMR CNRS 7296 Projet Ingenierie

Plus en détail

CRT Nord - Centre de Ressources Technologiques Programmes de 5 ème : «HABITAT et OUVRAGES»

CRT Nord - Centre de Ressources Technologiques Programmes de 5 ème : «HABITAT et OUVRAGES» CRT Nord - Centre de Ressources Technologiques Programmes de 5 ème : «HABITAT et OUVRAGES» Equipes des professeurs de technologie : - Jean-Michel BOICHOT - Olivier CAURETTE - Guillaume DODEMAND - Matthieu

Plus en détail

Conserver les Big Data, source de valeur pour demain

Conserver les Big Data, source de valeur pour demain Le potentiel et les défis du Big Data UIMM Mardi 2 et mercredi 3 juillet 2013 56 avenue de Wagram 75017 PARIS Conserver les Big Data, source de valeur pour demain Définir les Big Data Les Big Data à travers

Plus en détail

Webinar EBG Nouvelles perspectives d'exploitation des données clients avec le big data

Webinar EBG Nouvelles perspectives d'exploitation des données clients avec le big data Webinar EBG Nouvelles perspectives d'exploitation des données clients avec le big data Approches & opportunités face aux enjeux de volume, variété et vélocité France, 2012-2014 28 mars 2013 Ce document

Plus en détail

Détection et prise en charge de la résistance aux antirétroviraux

Détection et prise en charge de la résistance aux antirétroviraux Détection et prise en charge de la résistance aux antirétroviraux Jean Ruelle, PhD AIDS Reference Laboratory, UCLouvain, Bruxelles Corata 2011, Namur, 10 juin 2011 Laboratoires de référence SIDA (Belgique)

Plus en détail

ECOLE NATIONALE SUPERIEURE DE COGNITIQUE. Paul Bui- Quang & Joachim Yerusalmi 03/01/2011

ECOLE NATIONALE SUPERIEURE DE COGNITIQUE. Paul Bui- Quang & Joachim Yerusalmi 03/01/2011 ECOLE NATIONALE SUPERIEURE DE COGNITIQUE Projet ARLIU Paul Bui- Quang & Joachim Yerusalmi 03/01/2011 urs. Ce rapport contient ainsi la menées sur des utilisateurs afin de corréler les indicateurs que propose

Plus en détail

Retour d expérience en Astrophysique : utilisation du Cloud IaaS pour le traitement de données des missions spatiales

Retour d expérience en Astrophysique : utilisation du Cloud IaaS pour le traitement de données des missions spatiales Retour d expérience en Astrophysique : utilisation du Cloud IaaS pour le traitement de données des missions spatiales Cécile Cavet cecile.cavet at apc.univ-paris7.fr Centre François Arago (FACe), Laboratoire

Plus en détail

En fin d activité, vous transformerez le fichier D4_Nom_Prenom en fichier pdf avant de l envoyer à votre enseignant/moniteur.

En fin d activité, vous transformerez le fichier D4_Nom_Prenom en fichier pdf avant de l envoyer à votre enseignant/moniteur. Epreuves pratique du C2i Enoncé de l Activité 4 pour la validation des compétences du domaine D4 du C2i «Organiser la recherche d informations à l ère du numérique» CONTEXTE L objectif de cette activité

Plus en détail

Big data et données géospatiales : Enjeux et défis pour la géomatique. Thierry Badard, PhD, ing. jr Centre de Recherche en Géomatique

Big data et données géospatiales : Enjeux et défis pour la géomatique. Thierry Badard, PhD, ing. jr Centre de Recherche en Géomatique Big data et données géospatiales : Enjeux et défis pour la géomatique Thierry Badard, PhD, ing. jr Centre de Recherche en Géomatique Événement 25e anniversaire du CRG Université Laval, Qc, Canada 08 mai

Plus en détail

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée. ANALYSE 5 points Exercice 1 : Léonie souhaite acheter un lecteur MP3. Le prix affiché (49 ) dépasse largement la somme dont elle dispose. Elle décide donc d économiser régulièrement. Elle a relevé qu elle

Plus en détail

La surveillance réseau des Clouds privés

La surveillance réseau des Clouds privés La surveillance réseau des Clouds privés Livre blanc Auteurs : Dirk Paessler, CEO de Paessler AG Gerald Schoch, Rédactrice technique de Paessler AG Publication : Mai 2011 Mise à jour : Février 2015 PAGE

Plus en détail

Environmental Research and Innovation ( ERIN )

Environmental Research and Innovation ( ERIN ) DÉpartEment RDI Environmental Research and Innovation ( ERIN ) Le département «Environmental Research and Innovation» (ERIN) du LIST élabore des stratégies, des technologies et des outils visant à mieux

Plus en détail

Tutoriel Cloud IFB - Initiation -

Tutoriel Cloud IFB - Initiation - Tutoriel Cloud IFB - Initiation - Christophe BLANCHET Institut Français de Bioinformatique - IFB French Institute of Bioinformatics - ELIXIR-FR CNRS UMS3601 - Gif-sur-Yvette - FRANCE Ecole Cumulo NumBio

Plus en détail

Sujet 1 : Diagnostique du Syndrome de l apnée du sommeil par des techniques d analyse discriminante.

Sujet 1 : Diagnostique du Syndrome de l apnée du sommeil par des techniques d analyse discriminante. Sujet 1 : Diagnostique du Syndrome de l apnée du sommeil par des techniques d analyse discriminante. Objectifs et formulation du sujet Le syndrome de l apnée du sommeil (SAS) est un problème de santé publique

Plus en détail

Infrastructure de calcul du CRRI

Infrastructure de calcul du CRRI Infrastructure de calcul du CRRI Types d'infrastructures de calcul Calcul Intensif (High Performance Computing) Tâches fortement couplées (codes vectoriels / parallèles) Supercalculateurs, SMP, clusters,

Plus en détail

Entrepôt de données 1. Introduction

Entrepôt de données 1. Introduction Entrepôt de données 1 (data warehouse) Introduction 1 Présentation Le concept d entrepôt de données a été formalisé pour la première fois en 1990 par Bill Inmon. Il s agissait de constituer une base de

Plus en détail

Les mésocentres HPC àportée de clic des utilisateurs industriels

Les mésocentres HPC àportée de clic des utilisateurs industriels Les mésocentres HPC àportée de clic des utilisateurs industriels Université de Reims Champagne-Ardenne (URCA) Centre de Calcul ROMEO Multidisciplinary university more than 22 000 students a wide initial

Plus en détail

Quality Awareness in Data Management and Mining

Quality Awareness in Data Management and Mining /40 Quality Awareness in Data Management and Mining Laure BERTI-ÉQUILLE Soutenance pour l Habilitation à Diriger de Recherches IRISA - Université de Rennes 1 25 Juin 2007 2/52 Activités Problématique Gestion

Plus en détail

Note de cadrage du PEPI MACS Mathématiques Appliquées & Calcul Scientifique

Note de cadrage du PEPI MACS Mathématiques Appliquées & Calcul Scientifique Note de cadrage du PEPI MACS Mathématiques Appliquées & Calcul Scientifique Périmètre Le périmètre du PEPI concerne les méthodes et outils utilisés pour le traitement informatisé des données scientifiques.

Plus en détail

Apprentissage Automatique

Apprentissage Automatique Apprentissage Automatique Introduction-I jean-francois.bonastre@univ-avignon.fr www.lia.univ-avignon.fr Définition? (Wikipedia) L'apprentissage automatique (machine-learning en anglais) est un des champs

Plus en détail

Annexe commune aux séries ES, L et S : boîtes et quantiles

Annexe commune aux séries ES, L et S : boîtes et quantiles Annexe commune aux séries ES, L et S : boîtes et quantiles Quantiles En statistique, pour toute série numérique de données à valeurs dans un intervalle I, on définit la fonction quantile Q, de [,1] dans

Plus en détail

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com Intelligence Artificielle et Systèmes Multi-Agents Badr Benmammar bbm@badr-benmammar.com Plan La première partie : L intelligence artificielle (IA) Définition de l intelligence artificielle (IA) Domaines

Plus en détail

4.2 Unités d enseignement du M1

4.2 Unités d enseignement du M1 88 CHAPITRE 4. DESCRIPTION DES UNITÉS D ENSEIGNEMENT 4.2 Unités d enseignement du M1 Tous les cours sont de 6 ECTS. Modélisation, optimisation et complexité des algorithmes (code RCP106) Objectif : Présenter

Plus en détail

LES OUTILS D ALIMENTATION DU REFERENTIEL DE DB-MAIN

LES OUTILS D ALIMENTATION DU REFERENTIEL DE DB-MAIN LES OUTILS D ALIMENTATION DU REFERENTIEL DE DB-MAIN Les contenues de ce document sont la propriété exclusive de la société REVER. Ils ne sont transmis qu à titre d information et ne peuvent en aucun cas

Plus en détail

BIG DATA une évolution, une révolution, une promesse pour le diagnostic

BIG DATA une évolution, une révolution, une promesse pour le diagnostic Journées One Health d Ile-de-France BIG DATA une évolution, une révolution, une promesse pour le diagnostic 27 novembre 2014 de 13h30 à 17h30 Amphithéâtre 3 du Campus Centre UPEC Le séminaire sera suivi

Plus en détail

Grandes lignes ASTRÉE. Logiciels critiques. Outils de certification classiques. Inspection manuelle. Definition. Test

Grandes lignes ASTRÉE. Logiciels critiques. Outils de certification classiques. Inspection manuelle. Definition. Test Grandes lignes Analyseur Statique de logiciels Temps RÉel Embarqués École Polytechnique École Normale Supérieure Mercredi 18 juillet 2005 1 Présentation d 2 Cadre théorique de l interprétation abstraite

Plus en détail

Bases de données des mutations

Bases de données des mutations Bases de données des mutations CFMDB CFTR2 CFTR-France / Registre Corinne THEZE, Corinne BAREIL Laboratoire de génétique moléculaire Montpellier Atelier Muco, Lille, 25-27 septembre 2014 Accès libre http://www.genet.sickkids.on.ca/app

Plus en détail

Le BigData, aussi par et pour les PMEs

Le BigData, aussi par et pour les PMEs Parole d expert Le BigData, aussi par et pour les PMEs Stéphane MOUTON, CETIC Département Software and Services Technologies Avec le soutien de : LIEGE CREATIVE Le Big Data, aussi par et pour les PMEs

Plus en détail

Portage d applications sur le Cloud IaaS Portage d application

Portage d applications sur le Cloud IaaS Portage d application s sur le Cloud IaaS Cécile Cavet cecile.cavet at apc.univ-paris7.fr Centre François Arago (FACe), Laboratoire AstroParticule et Cosmologie (APC), LabEx UnivEarthS APC, Univ. Paris Diderot, CNRS/IN2P3,

Plus en détail

Réunion du réseau de génétique du Département EFPA

Réunion du réseau de génétique du Département EFPA 17 19 novembre 2014 Centre INRA de Nancy Lorraine Programme Lundi 17 novembre Salle Tilleul 13:00 Bus pour l'inra depuis la gare de Nancy 14:00 14:30 Introduction de la réunion tour de table 14:30 14:45

Plus en détail

INF6304 Interfaces Intelligentes

INF6304 Interfaces Intelligentes INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie

Plus en détail

Mémo technique MODELES GENERIQUES DE SCORE DE CREDIT ou Le scoring de crédit «prêt à l emploi»

Mémo technique MODELES GENERIQUES DE SCORE DE CREDIT ou Le scoring de crédit «prêt à l emploi» Mémo technique MODELES GENERIQUES DE SCORE DE CREDIT ou Le scoring de crédit «prêt à l emploi» 46, rue de la Tour 75116 Paris tél. (33) 01 73 00 55 00 fax (33) 01 73 00 55 01 www.softcomputing.com Sommaire

Plus en détail

Les nouvelles tendances de la bureautique

Les nouvelles tendances de la bureautique Reference Les nouvelles tendances de la bureautique Carrefour des Assistantes 2011 Hélène TELLITOCCI Christine LOURDELET Cegos, le partenaire formation le plus proche de l assistante 100 formations inter-entreprises

Plus en détail