PRÉSENTATION DE LA BIOINFORMATIQUE

Dimension: px
Commencer à balayer dès la page:

Download "PRÉSENTATION DE LA BIOINFORMATIQUE"

Transcription

1 PRÉSENTATION DE LA BIOINFORMATIQUE O. Collin CNRS IRISA GenOuest 7 octobre 2013 Warming session Poser le décor pour les 3 jours Mise en évidence et mise en relation des éléments clés Réflexions sur quelques points importants Tour de table Nom Activité Attente vis-à-vis de cette session d introduction 1

2 INTRODUCTION Définition Wikipedia Concepts et techniques nécessaires à l interprétation informatique de l information biologique Champ de recherche multi-disciplinaire Volet recherche (élaboration de nouvelles méthodes) et volet service (analyse de données assurée par/sur les plates-formes). 2

3 Histoire de la bioinformatique Intimement liée à la Biologie Moléculaire Mais également aux progrès en traitement de l information Evolution de la bio-informatique Ouzounis. Rise and demise of bioinformatics? Promise and progress. PLoS Comput Biol (2012) vol. 8 (4) pp. e

4 LE PAYSAGE DE LA BIOINFORMATIQUE Acteurs de la bioinformatique Bioinformatics Internship Bioinformatics Postdoc Bioinformatics Analyst (I, II, III) Senior Bioinformatics Analyst Bioinformatics Analyst Programmer (I, II, III) Bioinformatics Developer Senior Bioinformatics Developer Bioinformatician (I, II, III) Bioinformatics Expert Bioinformatics Systems Administrator Bioinformatics Research Fellow Bioinformatics Research Assistant Bioinformatics Research Associate Bioinformatics Scientist (Researcher) Bioinformatics Senior (Staff) Scientist Bioinformatics Project Manager Director (Head) of Bioinformatics 4

5 Acteurs de la bioinformatique Bio-informaticien Informaticien Biologiste Bio-analyste Bio-informaticien Administrateur système Produit les données pour réponde à une question biologique Analyse les données produites en amont Développe de nouvelles méthodes ou de nouveaux outils Développeur logiciel Installe les outils pour l analyse et maintient les systèmes de calcul Acteurs de la bioinformatique Bio-informaticien Informaticien Biologiste R Bio-analyste I Bio-informaticien R Administrateur système I Produit les données pour réponde à une question biologique Analyse les données produites en amont Développe de nouvelles méthodes ou de nouveaux outils Développeur logiciel I Installe les outils pour l analyse et maintient les systèmes de calcul 5

6 La bioinformatique à l IRISA/INRIA Symbiose : un centre de ressources en bio-informatique Deux équipes de recherche (Dyliss et Genscale) Une plate-forme bio-informatique : GenOuest Profiter du savoir-faire et de l infrastructure d un centre de recherche en informatique. Une association unique en France Mission/vocation Recherche en informatique Plate-forme bioinformatique Recherche en Biologie 6

7 Soutien recherche Services Calcul, Développement Hébergement, Formations Transfert technologique Infrastructure Puissance de calcul, logithèque Stockage Banques de données mises à jour Rôle central et fédérateur Développements technologiques GRISBI genocloud genocluster BioMAJ Grille Cloud Calcul Cluster Biologie intégrative BioWIC SeqCrawler Données e-biogenouest Workflows BioSide Ontologies Metadonnées Collaboratif Portail Galaxy EMME ADT INRIA MobyleNet Web services Elgg OpenLDAP Hubzero Opal Toolkit 7

8 GenOuest Plate-forme bioinformatique Puissance de calcul Stockage Banques Hébergement Formations Un environnement bioinformatique complet GenOuest en chiffres 2 clusters : 500 CPUs Stockage : 60 To + 20 To + 60 To 150 logiciels 82 banques (5,5 To) 250 utilisateurs authentifiés jobs par mois en ingénieurs (développeurs, bioanalystes, sysadmins) Certifiée ISO9001:2008 depuis

9 Environnement Données Logiciel Interface Calcul Environnement Données Logiciel Interface Utilisateur Calcul Machines 9

10 Environnement Banques BioMAJ Données Logiciel Interface Ligne cde Mobyle Utilisateur Calcul Galaxy PHP DRMAA Machines Environnement Banques BioMAJ Données Logiciel Interface Ligne cde Mobyle Utilisateur Calcul Galaxy PHP DRMAA Machines 10

11 Qu est-ce qu un environnement bioinformatique? Quelque chose qui offre la possibilité d analyser ses données Données digitales Environnement informatique Système d exploitation Outils et données de référence Possibilité de développer de nouveaux outils Question biologique Données Résultats «Bio» «Bioinfo» «Info» 11

12 CONTEXTE Un contexte pas facile mais palpitant Contexte Foisonnement de logiciels et de ressources en bioinformatique Bio-Linux 7 (nov 2012) : plus de 500 logiciels Nucleic Acids Research Database Issue 2013 : 1512 bases répertoriées par NAR (Nucl. Acids Res. (1 January 2013)41 (D1): D1- D7.doi: /nar/gks1297) Bioinformatics links directory ( outils 12

13 Contexte Kahn. On the future of genomic data. Science (2011) vol. 331 (6018) pp Comment affronter ces problèmes? Connaître des logiciels de base Connaître des banques généralistes et leur mode d interrogation Automatisation des traitements pour lutter contre l afflux de données Connaissances d un environnement adapté (Windows pas forcément adapté) Evoluer au sein d un réseau de compétences Les problèmes sont trop compliqués pour être affrontés seul(e). 13

14 CONCEPTS Concepts Analyse de données avec l outil bioinformatique Enchaînement de programmes Données Résultats Données P1 Sortie 1 Entrée n Pn Résultats Paramètres P1 Paramètres Pn 14

15 Concepts Données Données P1 Sortie 1 Entrée n Pn Résultats Résultats Problèmes d utilisation Enchaînement de programmes : savoir quels programmes utiliser Format des données : outils de conversion Manipulation de fichiers : compliqué si beaucoup de données Automatisation : scripting ou développement Données : séquences, bases, banques 15

16 FORMATS DE SÉQUENCES Une jungle de formats Formats «originels» Issus des banques de séquences : GenBank, EMBL, SwissProt, PDB, etc. Formats liés aux outils Staden, Fasta, Phylip, etc. Formats enrichis Génome : GFF Nouveaux formats liés aux NGS BED SAMs 16

17 Formats «originels» GenBank Conçu pour être lisible et pour proposer différentes informations sur la séquence : annotations, bibliographie. Format texte Identifiants // à la fin de l enregistrement 17

18 Formats liés à un outil Packages : Staden, GCG Suite logicielle : Phylip Programme alignement : ClustalW Outil de conversion est indispensable : seqret de la suite Emboss GFF3 Annotations génomiques Format tabulé 9 colonnes 18

19 GFF3 : Generic Feature Format 3 ##gff-version 3 ##sequence-region ctg ctg123. gene ID=gene00001;Name=EDEN ctg123. TF_binding_site Parent=gene00001 ctg123. mrna ID=mRNA00001;Parent=gene00001 ctg123. mrna ID=mRNA00002;Parent=gene00001 ctg123. mrna ID=mRNA00003;Parent=gene00001 ctg123. exon Parent=mRNA00003 ctg123. exon Parent=mRNA00001,mRNA00002 ctg123. exon Parent=mRNA00001,mRNA00003 ctg123. exon Parent=mRNA00001,mRNA00002,mRNA00003 ctg123. exon Parent=mRNA00001,mRNA00002,mRNA00003 ctg123. CDS ID=cds00001;Parent=mRNA00001 ctg123. CDS ID=cds00001;Parent=mRNA00001 BED Annotations génomiques Développé pour le Genome Browser UCSC 3 champs impératifs 9 champs optionnels 19

20 BED browser position chr7: browser hide all track name="itemrgbdemo" description="item RGB demonstration" visibility=2 itemrgb="on" chr Pos ,0,0 chr Pos ,0,0 chr Pos ,0,0 chr Pos ,0,0 chr Neg ,0,255 chr Neg ,0,255 chr Neg ,0,255 chr Pos ,0,0 chr Neg ,0,255 SAM : Sequence Alignment/Map Format pour alignement des reads Proposé dans le cadre des 1000 génomes Format tabulé Sa forme indexée = BAM Li et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics (2009) vol. 25 (16) pp

21 Conclusion sur formats Grande diversité Evolution constante Besoin de convertisseurs BANQUES 21

22 Bases et banques Quantité croissante des banques : 1380 env. NAR : Multiplicité des bases (et des formats) : défi pour l intégration des données Hétérogénéité des données Hétérogénéité de structure des bases Certains champs ou propriétés non interrogeables Métabanques Evolution , , ,00 Entries , , , , , , , , ,00 0,00 Entries , , , ,00 Base Pairs Entries Feb 1986 Mar 1988 Mar 1990 Jun 1992 Feb 1994 Aug 1995 Feb 1997 Aug 1998 Apr 2000 Oct 2001 Apr 2003 Oct 2004 Apr 2006 Oct 2007 Apr 2009 Oct 2010 Apr ,00 Aug 1986 Dec 1988 Sep 1991 Dec 1993 Oct 1995 Aug 1997 Aug 1999 Jun 2001 Apr 2003 Feb 2005 Dec 2006 Oct 2008 Aug 2010 GenBank : 560 Go 22

23 Typologie des banques Banque généraliste : GenBank SwissProt Banque spécialisée :organisme MGD Mouse Genome Database FlyBase Banque spécialisée : thème InterPro EPD eukaryotic promoter database Banque spécialisée : métabolisme KEGG EcoCyc Banque spécialisée :interactions DIP BIND Banque spécialisée : famille PKR: protein kinase resource RNA 16S 23

24 Difficultés Le souci principal est l hétérogénéité des données: hétérogénéité des données hétérogénéité de structure des bases Certains champs ne sont pas interrogeables. Percolation Une séquence : «Putative dinosaur genomic DNA, partial sequence» XXU41319 ctattcctta attaatgtct acatggctat ttttaatgtt attactgttt gtcactataa aaaaacgctc atttgagaca atactgacat taactgcttc aacttctacg cacggaactt ttaattaaat tagcacagga atgttaaatt taatanacaa aaggttattt cgctgtatga taaaaaaaac c Résultats : Score E Sequences producing significant alignments: (bits) Value gi gb U XXU41319 Putative dinosaur genomic D e-82 gi gb U Escherichia coli K-12 MG1655 compl e-66 gi dbj D E.coli genomic DNA, Kohara clone # e-66 gi dbj D E.coli genomic DNA, Kohara clone # e-66 gi gb AE Escherichia coli O157:H7, comple e-59 gi dbj BA Escherichia coli O157:H7 DNA, c e-59 gi emb AL Human DNA sequence from clone gi gb AE Zymomonas mobilis subsp. mobilis gi emb AL HSJ636L22 Human DNA sequence fr gi emb AL Zebrafish DNA sequence from cl gi emb AL HSJ365I19 Human DNA sequence fro gi emb CR Human DNA sequence from clone R gi emb BX Human DNA sequence from clone R

25 Effet silo et autres Les banques de données biologiques intègrent les données par domaine (verticalement) mais pas entre les domaines (horizontalement). Ce qui est un obstacle à l intégration des données est également un obstacle à la soumission des données bases de données répertoriées dans NAR Database Issue. Plus facile d obtenir des crédits pour monter une nouvelle base que pour la maintenir. Merali et Giles. Databases in peril. Nature (2005) vol. 435 (7045) pp

26 Synthèse DONNÉES EXPÉRIMENTALES 26

27 Meta-données Organiser la connaissance pour exploiter au mieux les données. (une méta-donnée concerne un ensemble de données) Permettent de pérenniser les données Ce sont aussi des données qu il faudra traiter comme telles (production, gestion, protection, etc.) Métadonnée Description Qui, quoi, comment Structure Organisation des fichiers de données pour constituer un ensemble cohérent. Identifiant Localisation et identification garantie par l unicité de l id Données Admin Aspects techniques (formats de fichiers), provenance, gestion des droits. 27

28 Ontologies Une ontologie est une spécification explicite d une conceptualisation (Gruber 1993) Conceptualisation : vision abstraite et simplifiée du monde Une description des concepts et des relations entre les éléments constituants cette vision abstraite du monde. Permet le partage et la réutilisation des connaissances grâce à un langage commun Classifier les données et les informations Ontologies in Life Science In life sciences, there is a strong need for semantic interoperability of data OBO ontologies (Open Biomedical Ontologies) Each ontology is specialized in a subdomain: anatomy, sequences, chemicals, processes, etc. Each ontology is built independantly but designed to interoperate No conceptual integration (even if the covered domains are connected from a scientific point of view) Need for an upper level ontology 28

29 Alignements Analyse de séquences Alignement Recherche dans les banques Comparaison de séquences Découverte de motifs Etc. Etape pivot dans les workflows bioinformatiques 29

30 Alignements Alignement global Algorithme Needleman et Wunsch Utile pour les séquences homologues Chaque base (ou résidu) d'une séquence doit être appariée avec une autre base (ou résidu) ou bien avec un espace (gap) Alignement local Algorithme Smith et Waterman Capable de trouver des domaines ou des motifs même quand les séquences n'ont que très peu de similarité Trouve le meilleur segment d'appariement entre deux séquences sans utiliser pour cela toutes les bases (ou résidus) de la séquence Needleman-Wunsch Propose un alignement mathématiquement optimal Exigeant en calcul : le remplissage de la matrice est proportionnel à MN Séquences de 100 résidus : Séquences de 200 résidus :

31 Smith-Waterman Algorithme Smith et Waterman Capable de trouver des domaines ou des motifs même quand les séquences n'ont que très peu de similarité Trouve le meilleur segment d'appariement entre deux séquences sans utiliser pour cela toutes les bases (ou résidus) de la séquence Qualité des alignements Landan et Graur. Heads or tails: a simple reliability check for multiple sequence alignments. Mol Biol Evol (2007) vol. 24 (6) pp

32 Balibase Un outil de test des programmes d alignement de séquences Oxbench, Prefab, SABmark Utilisation Edgar et Batzoglou. Multiple sequence alignment. Curr Opin Struct Biol (2006) vol. 16 (3) pp

33 Similarité/Homologie Si 2 séquences sont très similaires, on considère qu elles sont homologues. Homologie est une propriété binaire (homologue/non homologue) Protéine: 25-30% d identité -> homologie DNA : 70% d identité -> homologie Impact struct primaire/struct secondaire > 30% identité -> structure 3D est conservée Mais pas toujours Alignements multiples Progressif: ajout des séquences une à une Iteratif: raffinage de l alignement jusqu à obtention d un optimal Thompson, J. D., F. Plewniak and O. Poch. "A Comprehensive Comparison of Multiple Sequence Alignment Programs." Nucleic Acids Res 27, no. 13 (1999):

34 Exemple : Muscle Edgar, Robert C. "Muscle: Multiple Sequence Alignment With High Accuracy and High Throughput." Nucleic Acids Res 32, no. 5 (2004): Alignement multiple 34

35 Synthèse Recherche dans banques Outils de recherche Fasta Ssearch Blast 35

36 Blast Basic Local Alignment Seach Tool Idée : Si deux séquences sont similaires, elles doivent posséder des mots exacts en commun On cherche donc ces mots exacts (graines) et on étend l alignement La recherche des mots exacts accélère le processus de recherche. Blastn ADN/ADN Mapping oligonucléotides, EST, répétitions. Identification transcripts. Blastp Prot/Prot Identification régions communes entre protéines. Collecte de protéines pour analyse Blastx Prot/Nuc Découverte de gènes codants dans des génomes Tblastn Nuc/Nuc Identification des transcripts pour une protéine. Mapper une protéine sur de l ADN génomique Tblastx Nuc/Nuc Prédiction de gènes inter-espèces. Recherche de gènes ayant échappé aux recherches standard. 36

37 Fonctionnement de Blast Il utilise une heuristique pour éliminer les séquences non pertinentes afin de réduire les temps de recherche. Le programme cherche au début des mots de longueur fixée W (3 acides aminés ou 11 nucléotides) donnant un score T après comparaison avec une matrice de substitution. Les mots trouvés sont ensuite allongés dans les deux directions afin de trouver un alignement dont le score dépasse le score seuil S. Les paramètres W et T sont fixés par l'utilisateur. ml 37

38 Rappel SW : algorithme précis Blast : approximatif Utilisation de Blast en local Téléchargement des binaires Banques pré-formatées Utilitaire formatdb Requête Fichier fasta Formatdb Blastall Banque «blastable» Résultats 38

39 Alignements et scores Problème de l établissement des scores: utilisation de matrices pour les protéines PAM (Point Accepted Mutation), Dayhoff BLOSUM (BLOck Scoring Matrix), Henikoff BLOSUM meilleure pour des alignements locaux PAM Margaret Dayhoff 1978 PAM: Point Accepted Mutation Analyse d alignement de séquences proches (+ de 74% d identité) Probabilité de substitution PAM1 = 1% de divergence PAM40 = 40% de divergence Biais car protéines très proches 39

40 Blosum62 Produite à partir d alignement de protéines identiques à 62% Blosum * : si * grandit alors distance diminue (contrairement à PAM) 40

41 Score avec Blosum Autres matrices 41

42 Motifs et profils Alignements de séquences : Représentation par séquence consensus Représentation par signature/motif Représentation par profil Exemple : PROSITE, BLOCKS Pour un alignement, pour chaque colonne on précise la fréquence de chaque résidu Motif ADLGAVFALCDRYFQ SDVGPRSCFCERFYQ ADLGRTQNRCDRYYQ ADIGQPHSLCERYFQ [AS]-D-[IVL]-G-x4-{PG}-C-[DE]-R-[FY]2-Q 42

43 Bases de motifs ser/prints/index.php home.php Profils L utilisation des profils est une méthode très sensible pour découvrir des relations entre séquences très distantes. Par rapport aux méthodes conventionnelles de comparaison de séquences, on n utilise pas qu une seule séquence pour la requête mais un profil élaboré à partir d une famille de séquences. Information d un profil : résidu / position positions importantes (hautement conservée) régions d insertion Cette description est basé sur un système de scores dépendant des positions. On conserve ainsi l information sur le degré de conservation pour différentes positions de l alignement. 43

44 Recherche/découverte de motifs Pattern matching ou recherche de motifs Le motif est connu On part d un motif, résultats = séquences contenant le motif Appariement avec des séquences. Pattern discovery ou découverte de motifs Le motif est inconnu On part de séquences, résultats = motifs contenu dans les séquences Alignement de séquences. Expressivité Niveaux de complexité très différents dans la définition des motifs : Précis, non ambigüe, ex : codon start, site de restriction, etc. Flous, complexes, ex : motif lié à des familles protéiques, les TFBS, etc. Le motif sera alors écrit de différentes façons... 44

45 Expressivité Complexité des structures primaires très inégale en acides nucléiques (alphabet de 4 lettres) et acides aminés (20 lettres) Structure primaire souvent suffisante pour les motifs protéiques pour caractériser un site biologiquement actif même s il est ambigu à certaines positions. La recherche par similarité dans les banques fonctionne bien pour identifier des motifs protéiques conservés. Par contre la faible complexité des motifs nucléiques fait que la définition en terme de structure primaire est souvent insuffisante. Il y a souvent besoin de plus d'informations pour décrire ces motifs : utilisation des représentations de motifs les plus expressives Motifs nucléiques T A A C T A T A A T G G G C Séquence consensus 45

46 Motifs nucléiques Motif (séquence) consensus Utilisation du code IUPAC [TCG] [ATG] [AC] C [AT] [AT] [AT] [ATC] [ATG] [AT] G G [TCG] [AC] Motifs nucléiques Pour mieux voir la conservation des colonnes de l alignement avec WebLOGO. 31/05/

47 PWM et PSSM PWM : Position Weight Matrix = Table de fréquence PSSM : Position Specific Matrix = Profil prend en compte les différentes fréquences des bases pour chaque position. définit la probabilité d'apparition des bases pour chaque position du motif Utilisées dans les banques Transfac ou Jaspar. 47

48 07/10/2013 Bioinformatique structurale 48

49 Objectif Méthodes Outils Initiation d une classification et d une modélisation Vérifier l aptitude d une séquence à présenter un repliement connu, identification homologies structurales éloignées Construction d un modèle grâce à une homologie avec des structures déjà connues Vérification de l exactitude du modèle par rapport à la séquence Prédiction de structure secondaire JPred, Predict-Protein Threading 3D-PSSM, PhD, 123D+ Modélisation par homologie Vérification du modèle Modeller, SWISS-MODEL VERIFY-3D, PROCHECK, WHAT IF Prédire une structure 3D à partir de la séquence (car pas d homologue) Modélisation ab-initio ROSETTA, RAMP Structure secondaire Hélice alpha Feuillet bêta Boucle (loop) Coil 49

50 Prédiction structure IIaire Méthodes statistiques Probabilité pour qu un résidu soit dans la structure secondaire considérée. Méthode Chou-Fasman Méthodes stats + informations additionnelles Propriétés physico-chimiques des résidus Méthodes d apprentissage Réseaux de neurones 50

51 Penser aux protéines désordonnées N adoptent pas de structure à l état natif Adoptent une structure avec leur ligand 51

52 Structure tertiaire Ab initio (forget it) Détermination de la structure par threading Détermination de la structure par homologie 52

53 Threading Utilisation de bibliothèques de repliement SCOP, CATH PDB : structures structures différentes Nombre de nouveaux repliements identifiés dans SCOP Rouge : nombre total Bleu : nouveaux 53

54 Homologie Un bon alignement est le point de départ 54

55 Automatisation 55

56 Bien identifier les choses mes séquences Fichier nomfichier effacefichier() deplacefichier() Séquence nomsequence formatsequence analysesequence() Système d'exploitation Unix, Windows, MacOS Programme bioinformatique 56

57 Démarche 1 Savoir ce qu'on veut faire : - enchaînement des traitements Savoir ce qu'on peut faire : - lire les documentations (RTFM ;-) Connaître les programmes - utilisation de la ligne de commande - connaissance des paramètres Savoir se débrouiller dans un environnement non graphique - commande du DOS - shell Unix - connaître un éditeur Expérimenter et déboguer à petite échelle Démarche 2 Savoir ce qu'on veut faire : enchaînement des traitements Savoir ce qu'on peut faire : lire les documentations (RTFM ;-) Connaître les programmes connaissance des paramètres Utiliser un portail et des workflows 57

58 Workflow Objectifs du workflow scientifique Automatiser les tâches répétitives de gestion et d analyse des données Quelques actions fréquemment trouvées dans les workflows Accès aux données, planification, génération, transformation, aggrégation, analyse, visualisation Conception, test, partage, déploiement, exécution, reutilisation Workflows scientifiques Transformation de données Caractéristiques des données: volume, complexité, heterogenéité Caractère distribué Du calcul Des données Intégration des données, des outils et des analyses 58

59 Besoins Outils de conception pour des utilisateurs finaux Facilité Interface simple d emplois qui masque les opérations complexes Réutilisabilité des workflows Suffisamment générique pour servir différentes communautés mais suffisamment spécifique pour bien servir un domaine. Utilisable par un expert également : possibilités d extension Enregistement et publication des données et des résultats ainsi que les workflows : traçabilité et provenance Propriétés Détection d erreurs et récupération sur erreur Journalisation pour chaque workflow Permettre la gestion des données et leur intégration Permettre en temps réel de vérifier l état des workflows ainsi que leur mise à jour Visualisation Accès aux données grâce à des metadonnées Certification, confiance, sécurité 59

60 Interface utilisateur Evite l apprentissage d un langage de programmation Représentation visuelle des tâches du workflow Permet de suivre l exécution du workflow Permet d interagir avec le workflow Permet le partage des workflows GESTION DE PROJET BIOINFORMATIQUE 60

61 Généralités Projet Une tâche devant être réalisée avec des ressources limitées en un temps donné Un objectif bien précis Des ressources Un délai Projet bioinformatique Visualiser le projet Décomposer Ressources à affecter Boîte à outils 61

62 Visualiser le projet Avoir une vue d ensemble du projet pour pouvoir le subdiviser en tâches ou groupes de tâches élémentaires Mindmapping : cartes heuristiques Exemple : Logiciel gratuit Freemind Utilisation de gestionnaires de projet Diagrammes de Gantt Décomposer le projet Décomposer le projet en tâches Plus facile à gérer Pipelines élémentaires Input > Traitement > Output > Extraction de connaissance Penser au contrôle qualité 62

63 Identifier et affecter les ressources Affecter une ressource à chaque tâche Ressource = RH Ressource = équipement Ressource = Logiciel Boîte à outils logicielle Construire sa boîte à outil logicielle Programmes Scripts Penser «générique» et réutilisation Organiser son environnement 63

64 Avantage du mode gestion de projet Eviter de se noyer Conserver le cap Référence intéressante : Noble, W. S. A quick guide to organizing computational biology projects. PLoS computational biology 5, e (2009). Référence amusante CONCLUSION 64

65 Conclusion La biologie évolue La bio-informatique devient un outil Les projets deviennent de plus en plus ambitieux Il faut intégrer la bioinformatique au cœur des projets Références Understanding bioinformatics Zvelebil & Baum Garland Science Publishing

Introduction aux bases de données: application en biologie

Introduction aux bases de données: application en biologie Introduction aux bases de données: application en biologie D. Puthier 1 1 ERM206/Technologies Avancées pour le Génome et la Clinique, http://tagc.univ-mrs.fr/staff/puthier, puthier@tagc.univ-mrs.fr ESIL,

Plus en détail

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY Yvan Le Bras yvan.le_bras@irisa.fr Cyril Monjeaud, Mathieu Bahin, Claudia Hériveau, Olivier Quenez, Olivier Sallou, Aurélien Roult, Olivier

Plus en détail

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST.

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST. La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST. Gaël Le Mahec - p. 1/12 L algorithme BLAST. Basic Local Alignment Search Tool est un algorithme de recherche

Plus en détail

Big data et sciences du Vivant L'exemple du séquençage haut débit

Big data et sciences du Vivant L'exemple du séquençage haut débit Big data et sciences du Vivant L'exemple du séquençage haut débit C. Gaspin, C. Hoede, C. Klopp, D. Laborie, J. Mariette, C. Noirot, MS. Trotard bioinfo@genopole.toulouse.inra.fr INRA - MIAT - Plate-forme

Plus en détail

EMME : un environnement de gestion des métadonnées expérimentales

EMME : un environnement de gestion des métadonnées expérimentales EMME : un environnement de gestion des métadonnées expérimentales Basé sur l'utilisation d'isa Infrastructure Cyril Monjeaud Ingénieur sur la plate-forme GenOuest, Rennes PLAN Introduction ISA Infrastructure

Plus en détail

e-biogenouest CNRS UMR 6074 IRISA-INRIA / Plateforme de Bioinformatique GenOuest yvan.le_bras@irisa.fr Programme fédérateur Biogenouest co-financé

e-biogenouest CNRS UMR 6074 IRISA-INRIA / Plateforme de Bioinformatique GenOuest yvan.le_bras@irisa.fr Programme fédérateur Biogenouest co-financé e-biogenouest Coordinateur : Olivier Collin Animateur : Yvan Le Bras CNRS UMR 6074 IRISA-INRIA / Plateforme de Bioinformatique GenOuest yvan.le_bras@irisa.fr Programme fédérateur Biogenouest co-financé

Plus en détail

E-BIOGENOUEST, VERS UN ENVIRONNEMENT VIRTUEL DE RECHERCHE (VRE) ORIENTÉ SCIENCES DE LA VIE? Intervenant(s) : Yvan Le Bras, Olivier Collin

E-BIOGENOUEST, VERS UN ENVIRONNEMENT VIRTUEL DE RECHERCHE (VRE) ORIENTÉ SCIENCES DE LA VIE? Intervenant(s) : Yvan Le Bras, Olivier Collin E-BIOGENOUEST, VERS UN ENVIRONNEMENT VIRTUEL DE RECHERCHE (VRE) ORIENTÉ SCIENCES DE LA VIE? Intervenant(s) : Yvan Le Bras, Olivier Collin E-BIOGENOUEST Programme fédérateur Biogenouest co-financé par les

Plus en détail

Comment reproduire les résultats de l article : POP-Java : Parallélisme et distribution orienté objet

Comment reproduire les résultats de l article : POP-Java : Parallélisme et distribution orienté objet Comment reproduire les résultats de l article : POP-Java : Parallélisme et distribution orienté objet Beat Wolf 1, Pierre Kuonen 1, Thomas Dandekar 2 1 icosys, Haute École Spécialisée de Suisse occidentale,

Plus en détail

Qu'est-ce que c'est??

Qu'est-ce que c'est?? Mobyle 1.0 Hervé Ménager, Vivek Gopalan, Bertrand Néron, Sandrine Larroudé, Julien Maupetit, Adrien Saladin, Pierre Tuffery, Yentram Huyen, Bernard Caudron Qu'est-ce que c'est?? A quoi ça ressemble? Un

Plus en détail

MABioVis. Bio-informatique et la

MABioVis. Bio-informatique et la MABioVis Modèles et Algorithmes pour la Bio-informatique et la Visualisation Visite ENS Cachan 5 janvier 2011 MABioVis G GUY MELANÇON (PR UFR Maths Info / EPI GRAVITE) (là, maintenant) - MABioVis DAVID

Plus en détail

Mise en place de serveurs Galaxy dans le cadre du réseau CATI BBRIC

Mise en place de serveurs Galaxy dans le cadre du réseau CATI BBRIC Mise en place de serveurs Galaxy dans le cadre du réseau CATI BBRIC {Sebastien.Carrere, Ludovic.Legrand,Jerome.Gouzy}@toulouse.inra.fr {Fabrice.Legeai,Anthony.Bretaudeau}@rennes.inra.fr CATI BBRIC 35 bioinformaticiens

Plus en détail

! Séquence et structure des macromolécules. " Séquences protéiques (UniProt) " Séquences nucléotidiques (EMBL / ENA, Genbank, DDBJ)

! Séquence et structure des macromolécules.  Séquences protéiques (UniProt)  Séquences nucléotidiques (EMBL / ENA, Genbank, DDBJ) Introduction à la Bioinformatique Introduction! Les bases de données jouent un rôle crucial dans l organisation des connaissances biologiques.! Nous proposons ici un tour rapide des principales bases de

Plus en détail

OBJECTIFS. Une démarche E-science

OBJECTIFS. Une démarche E-science E-BIOGENOUEST Programme fédérateur Biogenouest co-financé par les Régions Bretagne et Pays de la Loire 24 mois Lancé depuis Mai 2012 Porteur : Olivier Collin (IRISA) Animateur : Yvan Le Bras (IRISA) OBJECTIFS

Plus en détail

SysFera. Benjamin Depardon

SysFera. Benjamin Depardon SysFera Passage d applications en SaaS Benjamin Depardon CTO@SysFera SysFera Technologie 2001 Création 2010 Spin Off INRIA Direction par un consortium d investisseurs 12 personnes 75% en R&D Implantation

Plus en détail

Formavie 2010. 2 Différentes versions du format PDB...3. 3 Les champs dans les fichiers PDB...4. 4 Le champ «ATOM»...5. 6 Limites du format PDB...

Formavie 2010. 2 Différentes versions du format PDB...3. 3 Les champs dans les fichiers PDB...4. 4 Le champ «ATOM»...5. 6 Limites du format PDB... Formavie 2010 Les fichiers PDB Les fichiers PDB contiennent les informations qui vont permettre à des logiciels de visualisation moléculaire (ex : RasTop ou Jmol) d afficher les molécules. Un fichier au

Plus en détail

Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments»

Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments» Master In silico Drug Design Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments» 30NU01IS INITIATION A LA PROGRAMMATION (6 ECTS) Responsables : D. MESTIVIER,

Plus en détail

Module Analyse de Génomes 2011-2012 Master 2 module FMBS 326 Immunoinformatique

Module Analyse de Génomes 2011-2012 Master 2 module FMBS 326 Immunoinformatique Module Analyse de Génomes 2011-2012 Master 2 module FMBS 326 Immunoinformatique Planning du Module : Date Heure Salle 12/12 9h-12h TD info TA1Z bat 25 13h-17h TD info TA1Z bat 25 13/12 9h-12h TD info TA1Z

Plus en détail

Les Biolangages. Thierry Lecroq. Université de Rouen FRANCE. university-logo. Thierry Lecroq (Univ. Rouen) MB2 2008 2009 1 / 16

Les Biolangages. Thierry Lecroq. Université de Rouen FRANCE. university-logo. Thierry Lecroq (Univ. Rouen) MB2 2008 2009 1 / 16 Les Biolangages Thierry Lecroq Université de Rouen FRANCE 2008 2009 Thierry Lecroq (Univ. Rouen) MB2 2008 2009 1 / 16 BioPerl Ensemble de modules Perl Utilise la programmation objet L objectif est de mettre

Plus en détail

Formation Cloudera Data Analyst Utiliser Pig, Hive et Impala avec Hadoop

Formation Cloudera Data Analyst Utiliser Pig, Hive et Impala avec Hadoop Passez au niveau supérieur en termes de connaissance grâce à la formation Data Analyst de Cloudera. Public Durée Objectifs Analystes de données, business analysts, développeurs et administrateurs qui ont

Plus en détail

Perl Orienté Objet BioPerl There is more than one way to do it

Perl Orienté Objet BioPerl There is more than one way to do it Perl Orienté Objet BioPerl There is more than one way to do it Bérénice Batut, berenice.batut@udamail.fr DUT Génie Biologique Option Bioinformatique Année 2014-2015 Perl Orienté Objet - BioPerl Rappels

Plus en détail

Galaxy Training days. Liste des sessions disponibles : http://bioinfo.genotoul.fr. Les formateurs :

Galaxy Training days. Liste des sessions disponibles : http://bioinfo.genotoul.fr. Les formateurs : -- 1 -- Galaxy Training days Durée / Programme : 3 journées. Galaxy : First step. Galaxy : Reads alignment and SNP calling. Galaxy : RNAseq alignment and transcripts assemblies. Public : Personnes souhaitant

Plus en détail

Business Intelligence

Business Intelligence avec Excel, Power BI et Office 365 Téléchargement www.editions-eni.fr.fr Jean-Pierre GIRARDOT Table des matières 1 Avant-propos A. À qui s adresse ce livre?..................................................

Plus en détail

Vérifier la qualité de vos applications logicielle de manière continue

Vérifier la qualité de vos applications logicielle de manière continue IBM Software Group Vérifier la qualité de vos applications logicielle de manière continue Arnaud Bouzy Kamel Moulaoui 2004 IBM Corporation Agenda Analyse de code Test Fonctionnel Test de Performance Questions

Plus en détail

Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION

Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION Classe de terminale de la série Sciences et Technologie du Management et de la Gestion Préambule Présentation Les technologies de l information

Plus en détail

Performances. Gestion des serveurs (2/2) Clustering. Grid Computing

Performances. Gestion des serveurs (2/2) Clustering. Grid Computing Présentation d Oracle 10g Chapitre VII Présentation d ORACLE 10g 7.1 Nouvelles fonctionnalités 7.2 Architecture d Oracle 10g 7.3 Outils annexes 7.4 Conclusions 7.1 Nouvelles fonctionnalités Gestion des

Plus en détail

Prédiction de la structure d une

Prédiction de la structure d une Prédiction de la structure d une protéine Soluscience Guillaume Chakroun guillaume chakroun@hotmail.com Copyright c 2004 Guillaume Chakroun TABLE DES MATIÈRES Table des matières 1 Les structures protéiques

Plus en détail

Métiers - informatique et Internet Jobs - IT and Internet

Métiers - informatique et Internet Jobs - IT and Internet Métiers - informatique et Internet Jobs - IT and Internet Le tableau ci-dessous, qui sera enrichi progressivement, donne la correspondance entre les termes français et les termes anglais utilisés pour

Plus en détail

Transformation IT de l entreprise ANALYTIQUE: L ÈRE WATSON

Transformation IT de l entreprise ANALYTIQUE: L ÈRE WATSON Transformation IT de l entreprise ANALYTIQUE: L ÈRE WATSON L analytique joue un rôle désormais primordial dans la réussite d une entreprise. Les pouvoirs qu elle délivre sont incontestables, cependant

Plus en détail

Introduc)on à Ensembl/ Biomart : Par)e pra)que

Introduc)on à Ensembl/ Biomart : Par)e pra)que Introduc)on à Ensembl/ Biomart : Par)e pra)que Stéphanie Le Gras Jean Muller NAVIGUER DANS ENSEMBL : PARTIE PRATIQUE 2 Naviga)on dans Ensembl : Pra)que Exercice 1 1.a. Quelle est la version de l assemblage

Plus en détail

Base de données bibliographiques Pubmed-Medline

Base de données bibliographiques Pubmed-Medline Chapitre 1 ; Domaine 1 ; Documentation ; Champs référentiels 1.1.1, 1.1.2 et 1.1.3 Base de données bibliographiques Pubmed-Medline D r Patrick Deschamps,, 30 mai 2007 PLAN C2i métiers de la santé Introduction

Plus en détail

Business Intelligence avec Excel, Power BI et Office 365

Business Intelligence avec Excel, Power BI et Office 365 Avant-propos A. À qui s adresse ce livre? 9 1. Pourquoi à chaque manager? 9 2. Pourquoi à tout informaticien impliqué dans des projets «BI» 9 B. Obtention des données sources 10 C. Objectif du livre 10

Plus en détail

1-Introduction 2. 2-Installation de JBPM 3. 2-JBPM en action.7

1-Introduction 2. 2-Installation de JBPM 3. 2-JBPM en action.7 Sommaire 1-Introduction 2 1-1- BPM (Business Process Management)..2 1-2 J-Boss JBPM 2 2-Installation de JBPM 3 2-1 Architecture de JOBSS JBPM 3 2-2 Installation du moteur JBoss JBPM et le serveur d application

Plus en détail

TRAVAUX DE RECHERCHE DANS LE

TRAVAUX DE RECHERCHE DANS LE TRAVAUX DE RECHERCHE DANS LE DOMAINE DE L'EXPLOITATION DES DONNÉES ET DES DOCUMENTS 1 Journée technologique " Solutions de maintenance prévisionnelle adaptées à la production Josiane Mothe, FREMIT, IRIT

Plus en détail

Les termes du cloud CUMULO NUMBIO 2015 O. COLLIN

Les termes du cloud CUMULO NUMBIO 2015 O. COLLIN Les termes du cloud CUMULO NUMBIO 2015 O. COLLIN Agenda Pe$t glossaire du cloud : termes qui seront u$lisés lors de ce5e école Virtualisa$on CMP Environnement Bioinforma$que Linux Comment les machines

Plus en détail

Le Processus RUP. H. Kadima. Tester. Analyst. Performance Engineer. Database Administrator. Release Engineer. Project Leader. Designer / Developer

Le Processus RUP. H. Kadima. Tester. Analyst. Performance Engineer. Database Administrator. Release Engineer. Project Leader. Designer / Developer Le Processus RUP Database Administrator Project Leader H. Kadima Performance Engineer Release Engineer Analyst Designer / Developer Tester Table des matières 1. De l artisanat à l industrialisation de

Plus en détail

Limitations of the Playstation 3 for High Performance Cluster Computing

Limitations of the Playstation 3 for High Performance Cluster Computing Introduction Plan Limitations of the Playstation 3 for High Performance Cluster Computing July 2007 Introduction Plan Introduction Intérêts de la PS3 : rapide et puissante bon marché L utiliser pour faire

Plus en détail

Services à la recherche: Data Management et HPC *

Services à la recherche: Data Management et HPC * Services à la recherche: Data Management et HPC * Pierre-Yves Burgi et Jean-François Rossignol Division informatique (DINF) * HPC = High-Performance Computing Réunion CIF Sciences du 6.12.11 1/19 Contenu

Plus en détail

e-science : perspectives et opportunités pour de nouvelles pratiques de la recherche en informatique et mathématiques appliquées

e-science : perspectives et opportunités pour de nouvelles pratiques de la recherche en informatique et mathématiques appliquées Emilie MANON, Joanna JANIK, Gabrielle FELTIN e-science : perspectives et opportunités pour de nouvelles pratiques de la recherche en informatique et mathématiques appliquées 1 Introduction : La recherche

Plus en détail

Problématiques de recherche. Figure Research Agenda for service-oriented computing

Problématiques de recherche. Figure Research Agenda for service-oriented computing Problématiques de recherche 90 Figure Research Agenda for service-oriented computing Conférences dans le domaine ICWS (International Conference on Web Services) Web services specifications and enhancements

Plus en détail

Eco-système calcul et données

Eco-système calcul et données Eco-système calcul et données M. Daydé Dr du Comité d'orientation pour le Calcul Intensif (COCIN) Délégué Scientifique INS2I en charge HPC / Grille / Cloud Calcul / données : un enjeu stratégique Calcul

Plus en détail

Le nouveau visage de la Dataviz dans MicroStrategy 10

Le nouveau visage de la Dataviz dans MicroStrategy 10 Le nouveau visage de la Dataviz dans MicroStrategy 10 Pour la première fois, MicroStrategy 10 offre une plateforme analytique qui combine une expérience utilisateur facile et agréable, et des capacités

Plus en détail

données en connaissance et en actions?

données en connaissance et en actions? 1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)

Plus en détail

Présentation du module Base de données spatio-temporelles

Présentation du module Base de données spatio-temporelles Présentation du module Base de données spatio-temporelles S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Partie 1 : Notion de bases de données (12,5h ) Enjeux et principes

Plus en détail

Accélérer la transformation de vos nouveaux modèles assurances

Accélérer la transformation de vos nouveaux modèles assurances Accélérer la transformation de vos nouveaux modèles assurances Enjeux critiques des systèmes de distribution Assurance Etude Accenture Assurances 2020 4 axes d amélioration : Articuler le SI Assurance

Plus en détail

Pentaho Business Analytics Intégrer > Explorer > Prévoir

Pentaho Business Analytics Intégrer > Explorer > Prévoir Pentaho Business Analytics Intégrer > Explorer > Prévoir Pentaho lie étroitement intégration de données et analytique. En effet, les services informatiques et les utilisateurs métiers peuvent accéder aux

Plus en détail

Détection et prise en charge de la résistance aux antirétroviraux

Détection et prise en charge de la résistance aux antirétroviraux Détection et prise en charge de la résistance aux antirétroviraux Jean Ruelle, PhD AIDS Reference Laboratory, UCLouvain, Bruxelles Corata 2011, Namur, 10 juin 2011 Laboratoires de référence SIDA (Belgique)

Plus en détail

CHAPITRE 3 LA SYNTHESE DES PROTEINES

CHAPITRE 3 LA SYNTHESE DES PROTEINES CHAITRE 3 LA SYNTHESE DES ROTEINES On sait qu un gène détient dans sa séquence nucléotidique, l information permettant la synthèse d un polypeptide. Ce dernier caractérisé par sa séquence d acides aminés

Plus en détail

Spécificités, Applications et Outils

Spécificités, Applications et Outils Spécificités, Applications et Outils Ricco Rakotomalala Université Lumière Lyon 2 Laboratoire ERIC Laboratoire ERIC 1 Ricco Rakotomalala ricco.rakotomalala@univ-lyon2.fr http://chirouble.univ-lyon2.fr/~ricco/data-mining

Plus en détail

Valorisez vos actifs logiciels avec Rational Asset Manager. Jean-Michel Athané, Certified IT Specialist IBM Rational Software

Valorisez vos actifs logiciels avec Rational Asset Manager. Jean-Michel Athané, Certified IT Specialist IBM Rational Software Valorisez vos actifs logiciels avec Rational Asset Manager Jean-Michel Athané, Certified IT Specialist IBM Rational Software 13 Qu est-ce qu un actif logiciel (Software Asset)? Un asset est une collection

Plus en détail

Les bases de données transcriptionnelles en ligne

Les bases de données transcriptionnelles en ligne Les bases de données transcriptionnelles en ligne Différents concepts en régulation transcriptionnelle sites de fixation - in vitro/vivo? - quelle technique? - degré de confiance? facteur de transcription

Plus en détail

Extraction d information des bases de séquences biologiques avec R

Extraction d information des bases de séquences biologiques avec R Extraction d information des bases de séquences biologiques avec R 21 novembre 2006 Résumé Le module seqinr fournit des fonctions pour extraire et manipuler des séquences d intérêt (nucléotidiques et protéiques)

Plus en détail

1 Description générale de VISFIELD

1 Description générale de VISFIELD Guide d utilisation du logiciel VISFIELD Yann FRAIGNEAU LIMSI-CNRS, Bâtiment 508, BP 133 F-91403 Orsay cedex, France 11 décembre 2012 1 Description générale de VISFIELD VISFIELD est un programme écrit

Plus en détail

MODELISATION UN ATELIER DE MODELISATION «RATIONAL ROSE»

MODELISATION UN ATELIER DE MODELISATION «RATIONAL ROSE» MODELISATION UN ATELIER DE MODELISATION «RATIONAL ROSE» Du cours Modélisation Semi -Formelle de Système d Information Du Professeur Jean-Pierre GIRAUDIN Décembre. 2002 1 Table de matière Partie 1...2 1.1

Plus en détail

L art d ordonnancer. avec JobScheduler. François BAYART

L art d ordonnancer. avec JobScheduler. François BAYART L art d ordonnancer avec JobScheduler François BAYART 30 Octobre 2010 [1] 234567 introduction Introduction Qui suis-je? François Bayart consultant système en solution libre et propriétaire Redhat (1996),

Plus en détail

Sage 100 CRM Guide de l Import Plus avec Talend Version 8. Mise à jour : 2015 version 8

Sage 100 CRM Guide de l Import Plus avec Talend Version 8. Mise à jour : 2015 version 8 Sage 100 CRM Guide de l Import Plus avec Talend Version 8 Mise à jour : 2015 version 8 Composition du progiciel Votre progiciel est composé d un boîtier de rangement comprenant : le cédérom sur lequel

Plus en détail

Présentation du PL/SQL

Présentation du PL/SQL I Présentation du PL/ Copyright Oracle Corporation, 1998. All rights reserved. Objectifs du Cours A la fin de ce chapitre, vous saurez : Décrire l intéret du PL/ Décrire l utilisation du PL/ pour le développeur

Plus en détail

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique Objectifs Clustering On ne sait pas ce qu on veut trouver : on laisse l algorithme nous proposer un modèle. On pense qu il existe des similarités entre les exemples. Qui se ressemble s assemble p. /55

Plus en détail

FILIÈRE TRAVAIL COLLABORATIF

FILIÈRE TRAVAIL COLLABORATIF FILIÈRE TRAVAIL COLLABORATIF 89 MICROSOFT EXCHANGE SQL Server... /... TRAVAIL COLLABORATIF Introduction à l installation et à la gestion d Exchange Server 2007 Durée 3 jours MS5909 Gérer la sécurité de

Plus en détail

Messagerie & Groupeware. augmentez l expertise de votre capital humain

Messagerie & Groupeware. augmentez l expertise de votre capital humain Messagerie & Groupeware augmentez l expertise de votre capital humain OUTLOOK 2010* Etude des fonctionnalités d un logiciel de messagerie Tout public 1 journée MG01 Maîtrise de l environnement Windows

Plus en détail

E-Biothon : Une plate-forme pour accélérer les recherches en biologie, santé et environnement.

E-Biothon : Une plate-forme pour accélérer les recherches en biologie, santé et environnement. E-Biothon : Une plate-forme pour accélérer les recherches en biologie, santé et environnement. N.Bard, S.Boin, F.Bothorel, P.Collinet, M.Daydé, B. Depardon, F. Desprez, M.Flé, A.Franc, J.-F. Gibrat, D.

Plus en détail

Pilot4IT Tableaux de Bord Agréger et consolider l ensemble de vos indicateurs dans un même portail.

Pilot4IT Tableaux de Bord Agréger et consolider l ensemble de vos indicateurs dans un même portail. Pilot4IT Tableaux de Bord Agréger et consolider l ensemble de vos indicateurs dans un même portail. Comment exploiter au mieux l ensemble de vos indicateurs? Avec la solution agile Pilot4IT Tableau de

Plus en détail

Table des matières PRESENTATION DU LANGAGE DS2 ET DE SES APPLICATIONS. Introduction

Table des matières PRESENTATION DU LANGAGE DS2 ET DE SES APPLICATIONS. Introduction PRESENTATION DU LANGAGE DS2 ET DE SES APPLICATIONS Depuis SAS 9.2 TS2M3, SAS propose un nouveau langage de programmation permettant de créer et gérer des tables SAS : le DS2 («Data Step 2»). Ces nouveautés

Plus en détail

Quels apprentissages info-documentaires au collège?

Quels apprentissages info-documentaires au collège? Quels apprentissages info-documentaires au collège? Quel cadre? Quels apprentissages associés? 1983 : Éducation aux médias (EAM) 1986 : Initiation à la recherche documentaire (IRD) 2003 : Information-Documentation

Plus en détail

AGROBASE : un système de gestion de données expérimentales

AGROBASE : un système de gestion de données expérimentales AGROBASE : un système de gestion de données expérimentales Daniel Wallach, Jean-Pierre RELLIER To cite this version: Daniel Wallach, Jean-Pierre RELLIER. AGROBASE : un système de gestion de données expérimentales.

Plus en détail

La carte, le territoire et l'explorateur où est la visualisation? Jean-Daniel Fekete Equipe-projet AVIZ INRIA Jean-Daniel.Fekete@inria.fr www.aviz.

La carte, le territoire et l'explorateur où est la visualisation? Jean-Daniel Fekete Equipe-projet AVIZ INRIA Jean-Daniel.Fekete@inria.fr www.aviz. La carte, le territoire et l'explorateur où est la visualisation? Jean-Daniel Fekete Equipe-projet AVIZ INRIA Jean-Daniel.Fekete@inria.fr www.aviz.fr Quelques exemples 1 La campagne de Russie de Napoléon

Plus en détail

Ingénieur R&D en bio-informatique

Ingénieur R&D en bio-informatique Ingénieur R&D en bio-informatique Spécialisé Bases De Données 33 ans, Célibataire. Biologie & Informatique gabriel.chandesris[at]laposte.net {06 56 41 97 37} Use the bipper! http://gabriel.chandesris.free.fr/

Plus en détail

Identification de nouveaux membres dans des familles d'interleukines

Identification de nouveaux membres dans des familles d'interleukines Identification de nouveaux membres dans des familles d'interleukines Nicolas Beaume Jérôme Mickolajczak Gérard Ramstein Yannick Jacques 1ère partie : Définition de la problématique Les familles de gènes

Plus en détail

Introduction à ORACLE WAREHOUSE BUILDER Cédric du Mouza

Introduction à ORACLE WAREHOUSE BUILDER Cédric du Mouza Introduction à ORACLE WAREHOUSE BUILDER Cédric du Mouza Avant de commencer à travailler avec le produit, il est nécessaire de comprendre, à un haut niveau, les problèmes en réponse desquels l outil a été

Plus en détail

Migration du pack office 2003. Planification, préparation, déploiement et formation

Migration du pack office 2003. Planification, préparation, déploiement et formation Migration du pack office 2003 Planification, préparation, déploiement et formation Planification : Comment s y prendre pour assurer au mieux la migration? Deux solutions : La première solution consiste

Plus en détail

Samson BISARO Christian MAILLARD

Samson BISARO Christian MAILLARD Une solution d authentification unifiée dans un réseau hétérogène Arnaud ANTONELLI Samson BISARO Christian MAILLARD 1 Sommaire État des lieux en 1999 Objectifs Composants du projet État des lieux en 2005

Plus en détail

Les technologies du Big Data

Les technologies du Big Data Les technologies du Big Data PRÉSENTÉ AU 40 E CONGRÈS DE L ASSOCIATION DES ÉCONOMISTES QUÉBÉCOIS PAR TOM LANDRY, CONSEILLER SENIOR LE 20 MAI 2015 WWW.CRIM.CA TECHNOLOGIES: DES DONNÉES JUSQU'À L UTILISATEUR

Plus en détail

Les Eléments clés du projet

Les Eléments clés du projet THE GLOBAL LEADER IN CLOUD BI & CPM Les Eléments clés du projet 1 THE GLOBAL LEADER IN CLOUD BI & CPM Les Eléments clés du projet Périmètre fonctionnel 2 Le Core Model Le point central de constitution

Plus en détail

ÉdIteur officiel et fournisseur de ServIceS professionnels du LogIcIeL open Source ScILab

ÉdIteur officiel et fournisseur de ServIceS professionnels du LogIcIeL open Source ScILab ÉdIteur officiel et fournisseur de ServIceS professionnels du LogIcIeL open Source ScILab notre compétence d'éditeur à votre service créée en juin 2010, Scilab enterprises propose services et support autour

Plus en détail

REQUEA. v 1.0.0 PD 20 mars 2008. Mouvements d arrivée / départ de personnels Description produit

REQUEA. v 1.0.0 PD 20 mars 2008. Mouvements d arrivée / départ de personnels Description produit v 1.0.0 PD 20 mars 2008 Mouvements d arrivée / départ de personnels Description produit Fonctionnalités L application Gestion des mouvements d arrivée / départ de Requea permet la gestion collaborative

Plus en détail

GMIN206 Info. Biologique et Outils bioinformatiques. Elodie Cassan

GMIN206 Info. Biologique et Outils bioinformatiques. Elodie Cassan M Bioinformatique, Connaissances et Données Année 24-25 GMIN206 Info. Biologique et Outils bioinformatiques Banques de données biologiques (3h de Cours +,5h de TD + 4h de TP) Elodie Cassan Anne-Muriel

Plus en détail

Bibliographie Introduction à la bioinformatique

Bibliographie Introduction à la bioinformatique Bibliographie Introduction à la bioinformatique 5. Les bases de données biologiques, SQL et la programmation Python/C++ Zvelebil et Baum, Understanding bioinformatics Beighley, Head First SQL Chari, A

Plus en détail

Programmation C. Apprendre à développer des programmes simples dans le langage C

Programmation C. Apprendre à développer des programmes simples dans le langage C Programmation C Apprendre à développer des programmes simples dans le langage C Notes de cours sont disponibles sur http://astro.u-strasbg.fr/scyon/stusm (attention les majuscules sont importantes) Modalités

Plus en détail

Master CCI. Compétences Complémentaires en Informatique. Livret de l étudiant

Master CCI. Compétences Complémentaires en Informatique. Livret de l étudiant Master CCI Compétences Complémentaires en Informatique Livret de l étudiant 2014 2015 Master CCI Le Master CCI (Compétences Complémentaires en Informatique) permet à des étudiants de niveau M1 ou M2 dans

Plus en détail

Catalogue des formations Edition 2015

Catalogue des formations Edition 2015 Antidot - Formations Catalogue des formations Edition 2015 : catalogue_formation_2015 Révision du 06.01.2015 Sommaire!!"##$%&'( )! $*$+,(-'(."##'+.'&( /!,'.0+"1"2%'( /!!."3'( /! $(3&"3"!(-4(5(.$,$1"24'(-'!(6"&#$,%"+!(7('-%,%"+()89:(;(

Plus en détail

Catalogue Formation «Vanilla»

Catalogue Formation «Vanilla» Catalogue Formation «Vanilla» Date : octobre 2009 Table des matières Liste des Formations...2 Contenu des formations...3 Vanilla FastTrack...3 Vanilla Architecture...5 Enterprise Services...6 BIPortail...7

Plus en détail

BIG DATA en Sciences et Industries de l Environnement

BIG DATA en Sciences et Industries de l Environnement BIG DATA en Sciences et Industries de l Environnement François Royer www.datasio.com 21 mars 2012 FR Big Data Congress, Paris 2012 1/23 Transport terrestre Traçabilité Océanographie Transport aérien Télémétrie

Plus en détail

Tutoriel Cloud IFB - Initiation -

Tutoriel Cloud IFB - Initiation - Tutoriel Cloud IFB - Initiation - Christophe BLANCHET Institut Français de Bioinformatique - IFB French Institute of Bioinformatics - ELIXIR-FR CNRS UMS3601 - Gif-sur-Yvette - FRANCE Ecole Cumulo NumBio

Plus en détail

Ricco Rakotomalala http://eric.univ-lyon2.fr/~ricco/cours/cours_programmation_r.html. R.R. Université Lyon 2

Ricco Rakotomalala http://eric.univ-lyon2.fr/~ricco/cours/cours_programmation_r.html. R.R. Université Lyon 2 Ricco Rakotomalala http://eric.univ-lyon2.fr/~ricco/cours/cours_programmation_r.html 1 Plan de présentation 1. L écosystème Hadoop 2. Principe de programmation MapReduce 3. Programmation des fonctions

Plus en détail

Support de TD ArcGIS 10.1. Introduction à l automatisation et au développement avec ArcGIS 10.1 JEAN-MARC GILLIOT 2014-2015. 3 e année ingénieur

Support de TD ArcGIS 10.1. Introduction à l automatisation et au développement avec ArcGIS 10.1 JEAN-MARC GILLIOT 2014-2015. 3 e année ingénieur JEAN-MARC GILLIOT 2014-2015 Durée 1,5 heures Introduction à l automatisation et au développement avec ArcGIS 10.1 3 e année ingénieur Support de TD ArcGIS 10.1 Grande école européenne d'ingénieurs et de

Plus en détail

INITIATION AU LANGAGE C SUR PIC DE MICROSHIP

INITIATION AU LANGAGE C SUR PIC DE MICROSHIP COURS PROGRAMMATION INITIATION AU LANGAGE C SUR MICROCONTROLEUR PIC page 1 / 7 INITIATION AU LANGAGE C SUR PIC DE MICROSHIP I. Historique du langage C 1972 : naissance du C dans les laboratoires BELL par

Plus en détail

SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...)

SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...) Avant-propos 1. À qui s'adresse ce livre? 15 2. Pré-requis 15 3. Objectifs du livre 16 4. Notations 17 Introduction à la Business Intelligence 1. Du transactionnel au décisionnel 19 2. Business Intelligence

Plus en détail

SOCLE COMMUN: LA CULTURE SCIENTIFIQUE ET TECHNOLOGIQUE. alain salvadori IA IPR Sciences de la vie et de la Terre 2009-2010 ALAIN SALVADORI IA-IPR SVT

SOCLE COMMUN: LA CULTURE SCIENTIFIQUE ET TECHNOLOGIQUE. alain salvadori IA IPR Sciences de la vie et de la Terre 2009-2010 ALAIN SALVADORI IA-IPR SVT SOCLE COMMUN: LA CULTURE SCIENTIFIQUE ET TECHNOLOGIQUE alain salvadori IA IPR Sciences de la vie et de la Terre 2009-2010 ALAIN SALVADORI IA-IPR SVT SOCLE COMMUN ET PROGRAMMES La référence pour la rédaction

Plus en détail

Les mésocentres HPC àportée de clic des utilisateurs industriels

Les mésocentres HPC àportée de clic des utilisateurs industriels Les mésocentres HPC àportée de clic des utilisateurs industriels Université de Reims Champagne-Ardenne (URCA) Centre de Calcul ROMEO Multidisciplinary university more than 22 000 students a wide initial

Plus en détail

#BigData Dossier de presse Mai 2014

#BigData Dossier de presse Mai 2014 #BigData Dossier de presse Mai 2014 La valeur du Big Data pour l entreprise Comment permettre l avènement d une culture de la donnée pour tous? Dans un monde porté par la mobilité et le Cloud, non seulement

Plus en détail

Les BRMS Business Rules Management System. Groupe GENITECH

Les BRMS Business Rules Management System. Groupe GENITECH Les BRMS Business Rules Management System 1 Présentations Emmanuel Bonnet ebonnet (at) genigraph.fr Responsable Dpt Conseil Consultant, Expert BRMS Formateur IBM/Ilog JRules / JBoss Rules Génigraph SSII

Plus en détail

Master Informatique Aix-Marseille Université

Master Informatique Aix-Marseille Université Aix-Marseille Université http://masterinfo.univ-mrs.fr/ Département Informatique et Interactions UFR Sciences Laboratoire d Informatique Fondamentale Laboratoire des Sciences de l Information et des Systèmes

Plus en détail

Hervé Couturier EVP, SAP Technology Development

Hervé Couturier EVP, SAP Technology Development Hervé Couturier EVP, SAP Technology Development Hervé Biausser Directeur de l Ecole Centrale Paris Bernard Liautaud Fondateur de Business Objects Questions à: Hervé Couturier Hervé Biausser Bernard Liautaud

Plus en détail

Principes. 2A-SI 3 Prog. réseau et systèmes distribués 3. 3 Programmation en CORBA. Programmation en Corba. Stéphane Vialle

Principes. 2A-SI 3 Prog. réseau et systèmes distribués 3. 3 Programmation en CORBA. Programmation en Corba. Stéphane Vialle 2A-SI 3 Prog. réseau et systèmes distribués 3. 3 Programmation en CORBA Stéphane Vialle Stephane.Vialle@supelec.fr http://www.metz.supelec.fr/~vialle 1 Principes 2 Architecture 3 4 Aperçu d utilisation

Plus en détail

D une part, elles ne peuvent faire table rase de la richesse contenue dans leur système d information.

D une part, elles ne peuvent faire table rase de la richesse contenue dans leur système d information. PACBASE «Interrogez le passé, il répondra présent.». Le Module e-business Les entreprises doivent aujourd hui relever un triple défi. D une part, elles ne peuvent faire table rase de la richesse contenue

Plus en détail

Jean-François Boulicaut & Mohand-Saïd Hacid

Jean-François Boulicaut & Mohand-Saïd Hacid e siècle! Jean-François Boulicaut & Mohand-Saïd Hacid http://liris.cnrs.fr/~jboulica http://liris.cnrs.fr/mohand-said.hacid Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205

Plus en détail

Guide d'installation rapide TFM-560X YO.13

Guide d'installation rapide TFM-560X YO.13 Guide d'installation rapide TFM-560X YO.13 Table of Contents Français 1 1. Avant de commencer 1 2. Procéder à l'installation 2 Troubleshooting 6 Version 06.08.2011 16. Select Install the software automatically

Plus en détail

2011 Hakim Benameurlaine 1

2011 Hakim Benameurlaine 1 Table des matières 1 UTILISATION DES OUTILS DE REQUÊTES... 2 1.1 Bases de données SQL Server... 2 1.2 Éditions de SQL Server... 3 1.3 Les outils de SQL Server... 4 2011 Hakim Benameurlaine 1 1 UTILISATION

Plus en détail

ES Enterprise Solutions

ES Enterprise Solutions Strategic Media Technologies ES Enterprise Solutions Plateforme centralisée de collaboration en ligne www.dalim.com accès total au contenu indépendamment du lieu et fuseau horaire. N importe quand et n

Plus en détail

fourniture de ressources à tous les terminaux en tant que services

fourniture de ressources à tous les terminaux en tant que services Au-delà de l infrastructure VDI : fourniture de ressources à tous les terminaux en tant que services Edouard Lorrain 5 juin 2014 2014 VMware Inc. Tous droits réservés. Sommaire 1 Évoluez vers le Cloud

Plus en détail

Cours Base de données relationnelles. M. Boughanem, IUP STRI

Cours Base de données relationnelles. M. Boughanem, IUP STRI Cours Base de données relationnelles 1 Plan 1. Notions de base 2. Modèle relationnel 3. SQL 2 Notions de base (1) Définition intuitive : une base de données est un ensemble d informations, (fichiers),

Plus en détail