Intégration de Sources de Données Génomiques du Web

Dimension: px
Commencer à balayer dès la page:

Download "Intégration de Sources de Données Génomiques du Web"

Transcription

1 Intégration de Sources de Données Génomiques du Web Christine Froidevaux, Sarah Cohen Boulakia {chris, LRI, CNRS UMRS 8623, Bât 490, Université Paris-Sud, Orsay Cedex 1 Introduction La nécessité en bioinformatique de recourir à un nombre toujours croissant (plusieurs milliers aujourd'hui) d'outils disponibles sur le Web et de banques de données génomiques -elles-mêmes toujours plus volumineuses-, rend urgent le besoin d'aider l'utilisateur par des procédures automatiques. C'est le thème de workshops internationaux tels que le 5ème Annual Bio-Ontologies Meeting qui porte sur le Semantic Web of Bioinformatics Resources. Cette automatisation devrait aboutir à une véritable coopération entre le biologiste et la machine, pour une recherche plus ecace des informations et une meilleure exploitation des résultats. Cela suppose, d'une part, de rendre le contenu des sources génomiques du Web compréhensible à la fois par une machine et par un humain, et d'autre part, de pouvoir combiner les informations provenant de diérentes banques. Le premier point est habituellement résolu par la création de terminologies (langage partagé destiné à la communication) et d'ontologies (description de la signication des termes), tandis que le second concerne le problème de l'intégration de sources hétérogènes et réparties. Nous donnons dans la section 2 un bref panorama des diérents types de banques génomiques disponibles sur le Web. Nous exposons ensuite dans la section 3 les diérents niveaux d'hétérogénéité à prendre en compte pour une bonne intégration des sources. Dans la section 4, nous évoquons la nécessité de concevoir des ontologies et présentons brièvement les solutions actuelles en termes de systèmes d'intégration. Nous concluons en dégageant les dés qui restent à relever pour obtenir un véritable Web Sémantique de ressources en bioinformatique. 2 Banques de données génomiques Dans la recherche médicale, les banques sont interrogées de façon hebdomadaire pour chercher, par exemple, des informations sur les gènes qui peuvent être associés à certaines tumeurs cancéreuses. Plus globalement, les laboratoires sont aujourd'hui amenés à interroger les banques du Web pour analyser leurs résultats expérimentaux en y recherchant des données proches des leurs. Ces banques génomiques sont extrêmement variées au niveau de leur contenu. Les données biologiques de base sont les informations relatives aux gènes et aux protéines. Elles sont récoltées auprès de grands laboratoires de séquençage qui fournissent à certaines banques des fiches d'annotation. Celles-ci contiennent les séquences du gène ou de la protéine découverts -suite de lettres alphabétiques caractérisant le gène ou la protéine-, les noms donnés à ceux-ci par le laboratoire, leur localisation dans la cellule, mais aussi et surtout, des commentaires sur ces données, comme la fonction biologique putative d'une protéine ou encore les maladies pouvant être impliquées par un gène. Ces données sont rassemblées dans des banques dites de séquences ou encore généralistes : Swiss-Prot 1, GenBank 2, DDBJ (DNA Data Bank of Japan) 3, EMBL (European Bioinformatics Ins- 1 http :// 2 http :// 3 http ://

2 titute, Nucleotide Sequence Database) 4 qui sont massivement utilisées. Néanmoins, le génomiste doit interroger d'autres banques plus spécialisées pour obtenir des informations plus précises ou pour confronter entre elles les informations récupérées de diverses sources. Notons aussi que selon le domaine d'activité ou de recherche du génomiste, il n'interrogera pas les mêmes banques. Les informations présentes sur les diérentes banques génomiques publiques sont de diérents types, elles peuvent concerner : certaines caractéristiques des protéines ou des gènes telles que la localisation du gène dans la cellule : LocusLink 5, la structure 3D de la protéine : Protein Data Bank (PDB) 6 et Molecular Modeling DataBase (MMDB) 7 ou encore sa fonction biologique. On trouve dans ce dernier cas des banques de données contenant uniquement des protéines dont la fonction biologique appartient à une famille précise : par exemple la banque Enzyme 8 (ne contient que des protéines dont la fonction est enzymatique). Ces informations sont par ailleurs souvent présentées sous la forme de schémas ou de graphiques interactifs; certains phénotypes (manifestation apparente d'un ensemble de gènes : trait morphologique, syndrome clinique...) ou plus précisément certaines maladies génétiques (souvent chez l'homme) : Online Mendelian Inheritance in Man (OMIM) 9 ; certaines espèces particulières ou familles d'espèces : FlyBase 10, Reptilia 11, Saccharomyces Genome Database (SGD) 12, Mouse Genome Database (MGD) 13 ; les publications médicales (banques d'abstracts) : Medline, PubMed 14. Le génomiste qui souhaite obtenir des informations de ces banques doit les interroger une à une, puis recouper les données récupérées, faire la part des redondances et des complémentarités des informations et gérer les éventuelles incohérences. 3 Problèmes d'intégration L'intégration a pour objectif d'assurer à l'utilisateur un accès à des sources multiples, réparties et hétérogènes, essentiellement accessibles par le Web, à travers une interface unique (accès transparent). On va s'intéresser plus particulièrement, dans cette section, au caractère hétérogène des sources génomiques à intégrer, en mettant en évidence les diérents niveaux d'hétérogénéité. L' hétérogénéité syntaxique se manifeste tout d'abord au niveau des formats pour décrire le contenu de sources. On trouve souvent le format ASN.1 (notation formelle pour décrire les données transmises lors de protocoles d'échanges), (e.g. Entrez), mais aussi des formats plus standard tels que XML (e.g. GenBank). A noter que les banques proposent souvent diérents formats d'exportation de leurs données. Cette hétérogénéité de formats est accompagnée par une diversité des modèles de données : relationnel (e.g. Swiss-Prot), objet (e.g. GUS) ou semi-structuré (e.g. GenBank). L'hétérogénéité sémantique recouvre plusieurs aspects. Elle concerne en premier lieu le focus. Chaque base se focalise sur un type d'objet biologique (e.g., le focus de Swiss-Prot est la protéine, celui de GenBank le gène, celui de PDB la structure 3D de la protéine). Par ailleurs, comme le souligne B. Eckman [15], les sources de données peuvent diérer dans leur représentation des concepts clés. Ainsi "GenBank représente un gène comme une annotation sur une séquence [un gène est vu comme une 4 http :// 5 http :// 6 http :// 7 http :// 8 http :// 9 http :// 10 http ://ybase.bio.indiana.edu/ 11 http :// uetz/livingreptiles.html 12 http ://genome- 13 http :// 14 http ://

3 séquence qui le caractérise et sur laquelle on a des informations -les annotations-] tandis que MGD représente un gène comme un locus qui confère un phénotype" [un gène est vu comme une portion de chromosome -locus- qui peut être lié à un caractère morphologique observable ou à un syndrome clinique chez un individu -phénotype-]. Ensuite, selon les bases, une même information n'est pas représentée avec le même niveau de détail : certaines bases sont généralistes (e.g. Swiss-Prot sur les protéines en général) tandis que d'autres sont plus spécialisées (e.g. SGD sur les protéines de la levure). Le dernier aspect de l'hétérogénéité sémantique est relatif à la diversité des modes de désignation des entités. Diérents vocabulaires sont utilisés pour annoter les séquences et la conance accordée à ces annotations est rarement totale (mais le degré de conance accordé n'est pas toujours mentionné). Par ailleurs, il existe pour une même entité (protéine, gène) plusieurs noms, et ce, à l'intérieur d'une même banque. On retrouve cette variabilité du nom à travers les bases et les espèces. Le nom d'une entité peut dépendre de la maladie à laquelle elle est liée ou de son inventeur etc. C'est uniquement en comparant les séquences de deux entités, que l'on peut savoir si ces deux entités sont en fait un même objet biologique. Une autre forme d'hétérogénéité provient des langages de requêtes. Souvent les langages sont de simples formulaires (combinaisons de mots à chercher dans un texte), dans le cas de portails ou de simples banques de données. Mais on peut aussi trouver des langages structurés tels que SQL (Discovery Link, Genopage [6]) ou OQL (GUS, Kleisli, IGD-GID). Mentionnons aussi la diversité des protocoles de rapatriement des données : CGI/http ou FTP etc. Une dernière forme d'hétérogénéité concerne les outils proposés par le Web. Parmi ceux-ci, on trouve des outils de recherche textuelle et des algorithmes de comparaison de séquences tels que BLAST (Basic Local Alignment Search Tool), FASTA 15, [17] ou LASSAP 16. Toutes les banques ne proposent pas les mêmes variantes pour ces outils (heuristiques diérentes par exemple). 4 État de l'art 4.1 Eléments de standardisation Le besoin de recourir à des ontologies pour capturer les notions biologiques présentes à travers le Web et pour pouvoir traiter de façon automatique des annotations généralement écrites en langage naturel s'est fait rapidement sentir, conduisant à de nombreuses ontologies. Des consortiums ont alors vu le jour [11], en vue d'établir une terminologie pour décrire les données et des hiérarchies pour classier les concepts. Ainsi, le souci de standardisation de l'attribution de noms est pris en compte par le consortium HGNC (HUGO Gene Nomenclature Committee) [23] qui propose une terminologie particulière pour les nouvelles séquences. Le projet GO (Gene Ontology) 17 vise à fournir un ensemble structuré de vocabulaires pour des domaines biologiques spéciques permettant de décrire des produits de gènes (protéines ou ARNs) dans un organisme donné. Il a donné naissance à trois ontologies respectivement consacrées aux fonctions moléculaires, aux processus biologiques et aux composants cellulaires. Il est à noter que Gene Ontology est de plus en plus utilisée par la communauté des biologistes. Des propositions pour permettre à la communauté biologique de spécier et d'échanger des ontologies ont aussi vu le jour. Mentionnons tout particulièrement le standard OIL [16] qui est un langage à la conuence de XML, RDF, des Logiques de Descriptions et des langages de frame. 15 http :// 16 http ://bioweb.pasteur.fr/seqenal/interfaces/lassap.html 17 http ://

4 4.2 Systèmes d'intégration Depuis quelques années, de nombreuses solutions au problème de l'hétérogénéité des sources génomiques et à leur intégration ont été proposées. Certaines suivent une approche "non matérialisée" dans laquelle les données restent au niveau des sources : ce sont des portails, APIs, médiateurs ou bases de données fédérées. D'autres suivent une approche "entrepôt" (Datawarehouse) dans laquelle les données sont extraites des diérentes sources et combinées dans un schéma global. Grosso modo, l'approche non matérialisée est bien adaptée à l'ajout ou au retrait de sources et aux mises à jour de données, tandis que l'approche entrepôt permet un accès direct, rapide aux données en permettant d'en rester propriétaire. Nous présentons d'abord les projets qui suivent l'approche "non matérialisée" en les classant par niveau d'intégration croissant, puis les projets qui suivent l'approche "entrepôt". Dans l'approche "non matérialisée", on distingue tout d'abord des plate-formes qui orent la possibilité d'accéder à plusieurs sources, telles que [1] [21] et des portails dans lesquels est regroupé sur un même site Web l'accès à diverses banques. Ainsi, les banques de données du NCBI sont toutes accessibles par le portail Entrez. De même, ExPASy construit autour de Swiss-Prot accède à un ensemble de banques. SRS (Sequence Retrieval System) [24] (de l'ebi) est un portail qui semble évoluer aujourd'hui vers un réel système d'intégration. Il est basé sur un modèle objet et permet d'interroger 130 banques biologiques de façon uniforme par mots clés. L'originalité et la puissance de ce portail vient du fait qu'il propose à ses utilisateurs de naviguer à travers les bases comme dans un réseau, en combinant les index des bases et en exploitant leurs références croisées. Il se développe aussi des sites Web dans lesquels sont rassemblées des données issues de plusieurs banques permettant à l'utilisateur d'avoir des informations regroupées sous la forme de ches simples et synthétiques. GeneCard est un site dédié au regroupement d'informations sur les gènes liés à des maladies humaines. Certains projets d'intégration proposent, non seulement une unication des formats, mais aussi des modèles de données comme K2/Kleisli [12], [13] et DiscoveryLink [19]. K2/Kleisli [12], [13], projet de l'université de Pennsylvanie, est une API qui permet d'interroger un ensemble de sources de données génomiques en utilisant un unique langage de requêtes, OQL, avec un modèle de données objet. Le projet DiscoveryLink [19] est lui plus récent et propose la mise en forme des sources sous un schéma relationnel, leur interrogation en SQL et l'intégration d'une dizaine d'applications bioinformatiques. D'autres projets proposent une intégration qui va jusqu'au niveau sémantique, comme par exemple, ABCKB [9], P/FDM [20], [5] et TAMBIS [3]. ABCKB est une base de connaissances très spécialisée contenant des données relatives à une famille de protéines (les transporteurs ABC) développée à l'université de Marseille. P/FDM, [5] et TAMBIS proposent tous les trois une architecture de médiateur. P/FDM est un projet de l'université d'aberdeen qui est encore à l'état de prototype; il est basé sur un modèle fonctionnel; il gère ses requêtes à partir du langage Prolog et permet l'accès aux sources via CORBA. Le projet d'intégration de O. Boucelma et Z. Lacroix [5] a choisi le modèle semi-structuré et propose une description des sources les unes par rapport aux autres, l'interrogation des sources se faisant par un langage de requêtes proche de XQuery. De façon indéniable, ce projet a pour atouts majeurs la prise en compte de l'intégration des outils biologiques et de l' optimisation des plans de requêtes. TAMBIS est un projet de l'université de Manchester basé sur la construction d'une ontologie complète des concepts biologiques apparaissant dans les banques génomiques (TaO). Ces concepts sont classés de façon automatique grâce à l'utilisation d'une logique de description : GRAIL. Il propose un accès transparent aux bases (l'utilisateur n'a pas à citer les bases qu'il souhaite interroger) et son langage de requêtes est simple, fondé sur le vocabulaire induit par l'ontologie.

5 D'autres systèmes suivent une approche de type bases de données fédérées comme TINet [15] et [10] de Cheung et al.. D'autres projets encore suivent une approche multi-agent comme IGD- GID. TINet suit le modèle objet OPM, propose un langage de requêtes proche de SQL et ore aussi la possibilité de stocker les résultats des opérations bioinformatiques (coûteuses) eectuées sur les données (BLAST...). IGD-GID [8] est un projet très original fondé sur la notion de réseau d'agents, orant, dans une version objet, une totale modularité et exibilité quant au choix des formats, des modèles de données ou encore des langages de requêtes. Enn, citons aussi le projet [22] de l'université de Washington qui propose une approche intéressante avec la construction d'un schéma de haut niveau de type entité-association pour intégrer les données des banques du NCBI en se basant sur les références croisées des banques. Il propose de les interroger par des requêtes simples sous forme d'expressions de chemin. Dans l'approche entrepôt, on retrouve diérents modèles de données. Les projets GUS [12] et GEDAW [18] sont construits sur un modèle objet, le projet BioMolQuest [7] sur un modèle relationnel et grna [4] sur un modèle semi-structuré. GUS [12] est un entrepôt construit à l'université de Pennsylvanie qui prend en compte le besoin d'avoir systématiquement accès à l'origine des données (notamment dans le cas d'informations obtenues par manipulation de données expérimentales, on garde trace de l'algorithme qui a été utilisé), mais aussi le fait d'historiser les données. GEDAW [18] est un entrepôt développé à l'irisa de Rennes qui est spécialisé dans les données du transcriptome hépatique. BioMolQuest [7] propose un langage de requêtes simple : ensemble de formulaires adaptés aux requêtes les plus fréquemment posées. Son approche est relativement originale au sens où c'est le seul entrepôt qui exploite les références croisées des banques de données. 5 Conclusion Les diérents systèmes brièvement présentés ont de plus en plus le souci de prendre en compte les liens entre les diérentes bases. Ils résolvent tous le problème de l'hétérogénéité syntaxique et orent à un degré plus ou moins élevé une intégration sémantique. Mais résoudre les problèmes d'hétérogénéité n'est pas le seul dé à relever. Comme souligné par S. Davidson dès 1995 [14], [13], le système d'intégration doit être réactif aux changements des sources en traitant à la fois les mises à jour des schémas et les mises à jour des données. Ce point est crucial pour les banques de données génomiques car les sources évoluent très vite. (On peut même envisager de capturer les transformations de schémas dans un langage déclaratif de haut niveau). Par ailleurs, le choix d'une architecture, matérialisée ou non, peut être guidé par des soucis d'ecacité et de sécurité des transactions. Le besoin d'obtenir des techniques d'optimisation des requêtes adéquates est réel, eu égard au grand volume des données. En raison des problèmes de compétition entre laboratoires, il importe aussi pour chacun de ne pas dévoiler ses sujets de recherche (essentiellement, les gènes auxquels il s'intéresse). Pouvoir travailler en local est alors un avantage précieux. Cela entraîne cependant l'existence d'un certain nombre de bases de données secondaires, rendant l'intégration plus dicile, en l'absence de standardisation pour la représentation des données. Par ailleurs, il est souhaitable de garder l'historique des données et de garder trace de la source d'où elles proviennent. En outre, on a vu la nécessité d'intégrer des outils qui peuvent être vus comme des sources [15], [5]. Au-delà de ces outils, il peut être utile aussi d'intégrer des chaînes de traitements, lors d'applications ciblées. Ainsi, le projet européen HKIS [2] vise à concevoir une architecture d'intégration qui prenne en compte à la fois des données privées - biologiques (données de transcriptome) ou médicales (ches cliniques de patients) - et des banques publiques (GenBank), le tout combiné avec une formalisation des scénarios d'analyse des données du transcriptome des tumeurs cancéreuses. La variété et la richesse des problèmes liés à l'interrogation des diérentes banques et ressources pour la génomique font de la bioinformatique un domaine tout à fait pertinent pour l'étude du Web

6 Sémantique en général. De plus, les solutions qui commencent à émerger sont tout à fait prometteuses et pourraient s'appliquer à d'autres domaines. Références [1] GENOSTAR (web site). http :// [2] HKIS : Integrated Software Platform For Biological and Biomedical Data Processing in Cancerology. European Institute of Oncology of Milan, Institut Curie, Isoft, LRI, Research Center for Bioinformatics of the University of Ulm. [3] P. G. Backer, C. Goble, S. Bechhofer, N. W. Paton, R. Stevens, and A. Brass. An ontology for bioinformatics applications. Bioinformatics, Vol. 15, Num. 6, pp , [4] S. S. Bhouwmick, P. Cruz, and A. V. Laud. Warehousing and Querying Biological Data using grna. Bioinformatics Workshop, ISMIS, [5] O. Boucelma and Z. Lacroix. Mediation-based Integration of Heterogeneous Biological Ressources. Bioinformatics Workshop, ISMIS, [6] S. Cohen Boulakia, Ch. Froidevaux, E. Waller, and B. Labedan. Genopage : A database of all protein modules encoded by completely sequenced genomes. Actes de JOBIM, pp , [7] Y. V. Bukhman and J. Skolnick. BiomolQuest : integrated database-based retrieval of protein structural and functional information. Bioinformatics, Vol. 17, Num. 5, pp , [8] E. Burger, J. Link, and O. Ritter. A Multi-Agent Architecture for the Integration of Genomic Information. First Int. Workshop on Intelligent Information integration, KI'97, [9] J. Chabalier, C. Capponi, Y. Quentin, and G. Fichant. A knowledge base for integrated biological systems developed under AROM. Bioinformatics Workshop, ISMIS, [10] K. Cheung, P. M. Nadkarni, and D. Shin. A metadata approach to query interoperation between molecular biology databases. Bioinformatics, Vol. 14, Num. 6, pp , [11] The Gene Ontology Consortium. Gene Ontology : tool for the unication of biology. Nature Genetics, Vol. 25 pp , [12] S. B. Davidson, J. Crabtree, B. Runk, J. Schug, V. Tannen, G.C. Overton, and C.J. Stoeckert. K2/Kleisli and GUS : Experiments in Integrated Access to Genomic Data Sources. IBM Systems Journal, Vol.40, Num. 2, pp , [13] S. B. Davidson, H. Liefke, and L. Wong. Creating and Maintaining Curated View Databases. Knowledge Discovery and Data Mining in biological Databases, [14] S.B. Davidson, C. Overton, and P. Buneman. Challenges in Integrating Biological Data Sources. Journal of Comp. Biology, Vol.2, Num 4, pp , [15] B. Eckman, A. Kosky, and L. Laroco. Extending traditional query-based integration approaches for functional characterization of post-genomic data. Bioinformatics, Vol. 17, pp , [16] D. Fensel, I. Horrocks, F. van Harmelen, S. Decker, M. Erdmann, and M. C. A. Klein. OIL in a Nutshell. Knowledge Acquisition, Modeling and Management, pp. 1-16, [17] E. Glemet and J.-J. Codani. LASSAP : a LArge Scale Sequence comparison Package. Bioinformatics, Vol. 13, Num. 2, , [18] E. Guerin, F. Moussouni, B. Courselaud, and O. Loréal. Modélisation d'un entrepôt de données dédié à l'analyse du transcriptome hépatique. Actes de JOBIM, pp , [19] L. Haas, P.Schwarz, P. Kodali, E. Koltar, J. Rice, and W. Swope. DiscoveryLink : A system for integrated access to life sciences data sources. IBM Syst. J., Vol.40, Num.2, pp , [20] G. Kemp, N. Angelopoulos, and P. Gray. A schema-based approach to building a bioinformatics database federation. IEEE Int. Symposium on Bio-Informatics and Biomedical Engineering, BIBE 2000, pp 13-20, [21] C. Médigue, F. Rechenmann, A. Danchin, and A. Viari. Imagene : an integrated computer environnement for sequence annotation and analysis. Bioinformatics, Vol. 15 Num. 1, pp. 2-15, [22] P. Mork, A. Halevy, and P. Tarczy-Hornoch. A Model for Data Integration Systems of Biomedical Data Applied to Online Genetic Databases. Symp. of the Am. Medical Informatics Assoc., [23] H.M. Wain, R.C. Lovering, E.A. Bruford, M.J. Lush, M.W. Wright, and S. Povey. Guidelines for Human Gene Nomenclature. Genomics, Vol. 79, Num. 4, pp , [24] E. M. Zdobnov, R. Lopez, R. Apweiler, and T. Etzold. The EBI SRS server - recent developments. Bioinformatics, Vol. 18, Num. 2, pp , 2002.

Introduction aux bases de données: application en biologie

Introduction aux bases de données: application en biologie Introduction aux bases de données: application en biologie D. Puthier 1 1 ERM206/Technologies Avancées pour le Génome et la Clinique, http://tagc.univ-mrs.fr/staff/puthier, puthier@tagc.univ-mrs.fr ESIL,

Plus en détail

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST.

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST. La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST. Gaël Le Mahec - p. 1/12 L algorithme BLAST. Basic Local Alignment Search Tool est un algorithme de recherche

Plus en détail

Architectures d'intégration de données

Architectures d'intégration de données Architectures d'intégration de données Dan VODISLAV Université de Cergy-ontoise Master Informatique M1 Cours IED lan Intégration de données Objectifs, principes, caractéristiques Architectures type d'intégration

Plus en détail

Base de données bibliographiques Pubmed-Medline

Base de données bibliographiques Pubmed-Medline Chapitre 1 ; Domaine 1 ; Documentation ; Champs référentiels 1.1.1, 1.1.2 et 1.1.3 Base de données bibliographiques Pubmed-Medline D r Patrick Deschamps,, 30 mai 2007 PLAN C2i métiers de la santé Introduction

Plus en détail

présentée DEVANT L UNIVERSITÉ DE RENNES 1 pour obtenir le grade de : DOCTEUR DE L UNIVERSITÉ DE RENNES 1 PAR Emilie GUÉRIN TITRE DE LA THÈSE :

présentée DEVANT L UNIVERSITÉ DE RENNES 1 pour obtenir le grade de : DOCTEUR DE L UNIVERSITÉ DE RENNES 1 PAR Emilie GUÉRIN TITRE DE LA THÈSE : N Ordre de la Thèse 3282 THÈSE présentée DEVANT L UNIVERSITÉ DE RENNES 1 pour obtenir le grade de : DOCTEUR DE L UNIVERSITÉ DE RENNES 1 Mention : BIOLOGIE PAR Emilie GUÉRIN Équipe d accueil : École Doctorale

Plus en détail

Intégration de données hétérogènes et réparties. Anne Doucet Anne.Doucet@lip6.fr

Intégration de données hétérogènes et réparties. Anne Doucet Anne.Doucet@lip6.fr Intégration de données hétérogènes et réparties Anne Doucet Anne.Doucet@lip6.fr 1 Plan Intégration de données Architectures d intégration Approche matérialisée Approche virtuelle Médiateurs Conception

Plus en détail

Problématiques de recherche. Figure Research Agenda for service-oriented computing

Problématiques de recherche. Figure Research Agenda for service-oriented computing Problématiques de recherche 90 Figure Research Agenda for service-oriented computing Conférences dans le domaine ICWS (International Conference on Web Services) Web services specifications and enhancements

Plus en détail

Je catalogue, tu FRBRises, il/elle googlise. L évolution des catalogues et les bibliothécaires Vendredi 29 mars 2013 Manufacture des tabacs

Je catalogue, tu FRBRises, il/elle googlise. L évolution des catalogues et les bibliothécaires Vendredi 29 mars 2013 Manufacture des tabacs Je catalogue, tu FRBRises, il/elle googlise. L évolution des catalogues et les bibliothécaires Vendredi 29 mars 2013 Manufacture des tabacs Journée organisée par le CRFCB Midi-Pyrénées / Languedoc-Roussillon

Plus en détail

Business Intelligence : Informatique Décisionnelle

Business Intelligence : Informatique Décisionnelle Business Intelligence : Informatique Décisionnelle On appelle «aide à la décision», «décisionnel», ou encore «business intelligence», un ensemble de solutions informatiques permettant l analyse des données

Plus en détail

Informatique Médicale & Ingénierie des Connaissances Pour la e-santé

Informatique Médicale & Ingénierie des Connaissances Pour la e-santé Li ics Laboratoire d Informatique Médicaleet d Ingénierie des Connaissances en e-santé Projet de création d une UMR Inserm Université Pierre et Marie Curie, Université Paris Nord Informatique Médicale

Plus en détail

et les Systèmes Multidimensionnels

et les Systèmes Multidimensionnels Le Data Warehouse et les Systèmes Multidimensionnels 1 1. Définition d un Datawarehouse (DW) Le Datawarehouse est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées

Plus en détail

Entrepôt de données 1. Introduction

Entrepôt de données 1. Introduction Entrepôt de données 1 (data warehouse) Introduction 1 Présentation Le concept d entrepôt de données a été formalisé pour la première fois en 1990 par Bill Inmon. Il s agissait de constituer une base de

Plus en détail

Initiation aux bases de données (SGBD) Walter RUDAMETKIN

Initiation aux bases de données (SGBD) Walter RUDAMETKIN Initiation aux bases de données (SGBD) Walter RUDAMETKIN Bureau F011 Walter.Rudametkin@polytech-lille.fr Moi Je suis étranger J'ai un accent Je me trompe beaucoup en français (et en info, et en math, et...)

Plus en détail

Qu'est-ce que le BPM?

Qu'est-ce que le BPM? Qu'est-ce que le BPM? Le BPM (Business Process Management) n'est pas seulement une technologie mais, dans les grandes lignes, une discipline de gestion d'entreprise qui s'occupe des procédures contribuant

Plus en détail

Bases de données avancées Introduction

Bases de données avancées Introduction Bases de données avancées Introduction Dan VODISLAV Université de Cergy-Pontoise Master Informatique M1 Cours BDA Plan Objectifs et contenu du cours Rappels BD relationnelles Bibliographie Cours BDA (UCP/M1)

Plus en détail

Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe

Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe Karima Dhouib, Sylvie Després Faiez Gargouri ISET - Sfax Tunisie, BP : 88A Elbustan ; Sfax karima.dhouib@isets.rnu.tn,

Plus en détail

Une Architecture Basée Agents Mobiles Pour la Recherche D'information dans des Sources Hétérogènes et Réparties

Une Architecture Basée Agents Mobiles Pour la Recherche D'information dans des Sources Hétérogènes et Réparties Une Architecture Basée Agents Mobiles Pour la Recherche D'information dans des Sources Hétérogènes et Réparties Nadia Ben Seghir 1, Okba Kazar 1 1 Département D'informatique, Université de Biskra, 07000,

Plus en détail

Master de Bioinformatique et Biologie des Systèmes Toulouse http://m2pbioinfo.biotoul.fr Responsable : Pr. Gwennaele Fichant

Master de Bioinformatique et Biologie des Systèmes Toulouse http://m2pbioinfo.biotoul.fr Responsable : Pr. Gwennaele Fichant Master de Bioinformatique et Biologie des Systèmes Toulouse http://m2pbioinfo.biotoul.fr Responsable : Pr. Gwennaele Fichant Parcours: Master 1 : Bioinformatique et biologie des Systèmes dans le Master

Plus en détail

Les Biolangages. Thierry Lecroq. Université de Rouen FRANCE. university-logo. Thierry Lecroq (Univ. Rouen) MB2 2008 2009 1 / 16

Les Biolangages. Thierry Lecroq. Université de Rouen FRANCE. university-logo. Thierry Lecroq (Univ. Rouen) MB2 2008 2009 1 / 16 Les Biolangages Thierry Lecroq Université de Rouen FRANCE 2008 2009 Thierry Lecroq (Univ. Rouen) MB2 2008 2009 1 / 16 BioPerl Ensemble de modules Perl Utilise la programmation objet L objectif est de mettre

Plus en détail

Big data et sciences du Vivant L'exemple du séquençage haut débit

Big data et sciences du Vivant L'exemple du séquençage haut débit Big data et sciences du Vivant L'exemple du séquençage haut débit C. Gaspin, C. Hoede, C. Klopp, D. Laborie, J. Mariette, C. Noirot, MS. Trotard bioinfo@genopole.toulouse.inra.fr INRA - MIAT - Plate-forme

Plus en détail

Cours Bases de données

Cours Bases de données Informations sur le cours Cours Bases de données 9 (10) séances de 3h Polycopié (Cours + TD/TP) 3 année (MISI) Antoine Cornuéjols www.lri.fr/~antoine antoine.cornuejols@agroparistech.fr Transparents Disponibles

Plus en détail

Présentation générale du projet data.bnf.fr

Présentation générale du projet data.bnf.fr Présentation générale du projet data.bnf.fr La Bibliothèque nationale a mis en œuvre un nouveau projet, qui a pour but de rendre ses données plus utiles sur le web. Ceci nécessite de transformer données

Plus en détail

Le "tout fichier" Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique

Le tout fichier Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique Introduction à l informatique : Information automatisée Le premier ordinateur Définition disque dure, mémoire, carte mémoire, carte mère etc Architecture d un ordinateur Les constructeurs leader du marché

Plus en détail

Chapitre 1 : Introduction aux bases de données

Chapitre 1 : Introduction aux bases de données Chapitre 1 : Introduction aux bases de données Les Bases de Données occupent aujourd'hui une place de plus en plus importante dans les systèmes informatiques. Les Systèmes de Gestion de Bases de Données

Plus en détail

Présentations personnelles. filière IL

Présentations personnelles. filière IL Présentations personnelles filière IL Résumé Liste de sujets de présentations personnelles. Chaque présentation aborde un sujet particulier, l'objectif étant que la lecture du rapport ainsi que l'écoute

Plus en détail

Indexmed : Le big data en écologie? Pas encore disent certains. Pas si sûr! Avec IndexMed. Relevons ce challenge!

Indexmed : Le big data en écologie? Pas encore disent certains. Pas si sûr! Avec IndexMed. Relevons ce challenge! Indexmed : Le big data en écologie? Pas encore disent certains Pas si sûr! Avec IndexMed Relevons ce challenge! Origine du consortium L état des lieux (source : séminaire Allenvie, séminaire Indexmed1)

Plus en détail

Alimenter un entrepôt de données par des données issues de services web. Une approche médiation pour le prototype DaWeS

Alimenter un entrepôt de données par des données issues de services web. Une approche médiation pour le prototype DaWeS Alimenter un entrepôt de données par des données issues de services web. Une approche médiation pour le prototype DaWeS John Samuel LIMOS (Laboratoire d Informatique, de Modélisation et d Optimisation

Plus en détail

Bases de Données. Stella MARC-ZWECKER. stella@unistra.u-strasbg.fr. Maître de conférences Dpt. Informatique - UdS

Bases de Données. Stella MARC-ZWECKER. stella@unistra.u-strasbg.fr. Maître de conférences Dpt. Informatique - UdS Bases de Données Stella MARC-ZWECKER Maître de conférences Dpt. Informatique - UdS stella@unistra.u-strasbg.fr 1 Plan du cours 1. Introduction aux BD et aux SGBD Objectifs, fonctionnalités et évolutions

Plus en détail

Indexmed : Le big data en écologie? Pas encore disent certains. Pas si sûr! Avec IndexMed. Relevons ce challenge!

Indexmed : Le big data en écologie? Pas encore disent certains. Pas si sûr! Avec IndexMed. Relevons ce challenge! Indexmed : Le big data en écologie? Pas encore disent certains Pas si sûr! Avec IndexMed Relevons ce challenge! Origine du consortium L état des lieux (source : séminaire Allenvie, séminaire Indexmed1)

Plus en détail

Dafoe Présentation de la plate-forme UIMA

Dafoe Présentation de la plate-forme UIMA Laboratoire d Informatique de l université Paris-Nord (UMR CNRS 7030) Institut Galilée - Université Paris-Nord 99, avenue Jean-Baptiste Clément 93430 Villetaneuse, France 11 juillet 2007 Plates-formes

Plus en détail

Bases de données Outils de gestion

Bases de données Outils de gestion 11/03/2010 Bases de données Outils de gestion Mise en place d outils pour gérer, stocker et utiliser les informations d une recherche biomédicale ent réalisé par L. QUINQUIS d épidémiologie et de biostatistique

Plus en détail

MABioVis. Bio-informatique et la

MABioVis. Bio-informatique et la MABioVis Modèles et Algorithmes pour la Bio-informatique et la Visualisation Visite ENS Cachan 5 janvier 2011 MABioVis G GUY MELANÇON (PR UFR Maths Info / EPI GRAVITE) (là, maintenant) - MABioVis DAVID

Plus en détail

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY Yvan Le Bras yvan.le_bras@irisa.fr Cyril Monjeaud, Mathieu Bahin, Claudia Hériveau, Olivier Quenez, Olivier Sallou, Aurélien Roult, Olivier

Plus en détail

Prise en main du BusinessObjects XI R2 Service Pack 2/ Productivity Pack

Prise en main du BusinessObjects XI R2 Service Pack 2/ Productivity Pack Prise en main du BusinessObjects XI R2 Service Pack 2/ Productivity Pack A propos de ce guide A propos de ce guide Ce guide contient des informations de prise en main du BusinessObjects XI R2 Service Pack

Plus en détail

Introduction à la B.I. Avec SQL Server 2008

Introduction à la B.I. Avec SQL Server 2008 Introduction à la B.I. Avec SQL Server 2008 Version 1.0 VALENTIN Pauline 2 Introduction à la B.I. avec SQL Server 2008 Sommaire 1 Présentation de la B.I. et SQL Server 2008... 3 1.1 Présentation rapide

Plus en détail

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation Base de données S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Présentation du module Contenu général Notion de bases de données Fondements / Conception Utilisation :

Plus en détail

Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services

Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services 69 Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services M. Bakhouya, J. Gaber et A. Koukam Laboratoire Systèmes et Transports SeT Université de Technologie de Belfort-Montbéliard

Plus en détail

Mise en place d une plateforme de gestion de matériels biologiques : quels avantages pour les chercheurs?

Mise en place d une plateforme de gestion de matériels biologiques : quels avantages pour les chercheurs? Mise en place d une plateforme de gestion de matériels biologiques : quels avantages pour les chercheurs? Dr Xavier Manival, Laboratoire IMoPA, CR, CNRS Françoise Tisserand-Bedri, Documentaliste, Inist-CNRS

Plus en détail

Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments»

Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments» Master In silico Drug Design Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments» 30NU01IS INITIATION A LA PROGRAMMATION (6 ECTS) Responsables : D. MESTIVIER,

Plus en détail

Extraction d information des bases de séquences biologiques avec R

Extraction d information des bases de séquences biologiques avec R Extraction d information des bases de séquences biologiques avec R 21 novembre 2006 Résumé Le module seqinr fournit des fonctions pour extraire et manipuler des séquences d intérêt (nucléotidiques et protéiques)

Plus en détail

En synthèse. HVR pour garantir les échanges sensibles de l'entreprise

En synthèse. HVR pour garantir les échanges sensibles de l'entreprise En synthèse HVR pour garantir les échanges sensibles de l'entreprise Le logiciel HVR fournit des solutions pour résoudre les problèmes clés de l'entreprise dans les domaines suivants : Haute Disponibilité

Plus en détail

Bases de Données Avancées

Bases de Données Avancées 1/26 Bases de Données Avancées DataWareHouse Thierry Hamon Bureau H202 - Institut Galilée Tél. : 33 1.48.38.35.53 Bureau 150 LIM&BIO EA 3969 Université Paris 13 - UFR Léonard de Vinci 74, rue Marcel Cachin,

Plus en détail

Cours Base de données relationnelles. M. Boughanem, IUP STRI

Cours Base de données relationnelles. M. Boughanem, IUP STRI Cours Base de données relationnelles 1 Plan 1. Notions de base 2. Modèle relationnel 3. SQL 2 Notions de base (1) Définition intuitive : une base de données est un ensemble d informations, (fichiers),

Plus en détail

IBM Software Big Data. Plateforme IBM Big Data

IBM Software Big Data. Plateforme IBM Big Data IBM Software Big Data 2 Points clés Aide les utilisateurs à explorer de grands volumes de données complexes Permet de rationaliser le processus de développement d'applications impliquant de grands volumes

Plus en détail

Résumé CONCEPTEUR, INTEGRATEUR, OPERATEUR DE SYSTEMES CRITIQUES

Résumé CONCEPTEUR, INTEGRATEUR, OPERATEUR DE SYSTEMES CRITIQUES Aristote ----- Cloud Interopérabilité Retour d'expérience L A F O R C E D E L I N N O V A T I O N Résumé Les systèmes d'information logistique (SIL) sont des outils qui amènent des gains de productivité

Plus en détail

Oracle Fusion Middleware Concepts Guide 11g Release 1 (11.1.1) Figure 1-1 Architecture Middleware

Oracle Fusion Middleware Concepts Guide 11g Release 1 (11.1.1) Figure 1-1 Architecture Middleware 1 Introduction Ce chapitre décrit Oracle Fusion Middleware. Il comprend : o Qu'est-ce que Middleware o Les fonction de Middleware o L'architecture de conception Middleware o L'architecture orientée services

Plus en détail

Une méthode d apprentissage pour la composition de services web

Une méthode d apprentissage pour la composition de services web Une méthode d apprentissage pour la composition de services web Soufiene Lajmi * Chirine Ghedira ** Khaled Ghedira * * Laboratoire SOIE (ENSI) University of Manouba, Manouba 2010, Tunisia Soufiene.lajmi@ensi.rnu.tn,

Plus en détail

Bases de données et outils bioinformatiques utiles en génétique

Bases de données et outils bioinformatiques utiles en génétique Bases de données et outils bioinformatiques utiles en génétique Collège National des Enseignants et Praticiens de Génétique Médicale C. Beroud Date de création du document 2010-2011 Table des matières

Plus en détail

Intégration des connaissances en neurosciences dans un environnement multi-centrique

Intégration des connaissances en neurosciences dans un environnement multi-centrique Intégration des connaissances en neurosciences dans un environnement multi-centrique Alban Gaignard, Johan Montagnat I3S, UMR 6070 CNRS, Université de Nice Sophia Antipolis alban.gaignard@i3s.unice.fr

Plus en détail

Information utiles. cinzia.digiusto@gmail.com. webpage : Google+ : http://www.ibisc.univ-evry.fr/ digiusto/

Information utiles. cinzia.digiusto@gmail.com. webpage : Google+ : http://www.ibisc.univ-evry.fr/ digiusto/ Systèmes de gestion de bases de données Introduction Université d Evry Val d Essonne, IBISC utiles email : cinzia.digiusto@gmail.com webpage : http://www.ibisc.univ-evry.fr/ digiusto/ Google+ : https://plus.google.com/u/0/b/103572780965897723237/

Plus en détail

ARCHIVAGE DES BASES DE

ARCHIVAGE DES BASES DE ARCHIVAGE DES BASES DE DONNEES ARNAUD HULSTAERT ET GRÉGORY OGONOWSKI MANAGEMENT SUMMARY SECTION RECHERCHE 04/2013 1. Introduction La croissance continue des volumes de données stockés dans les bases de

Plus en détail

Ecole des Hautes Etudes Commerciales HEC Alger. par Amina GACEM. Module Informatique 1ière Année Master Sciences Commerciales

Ecole des Hautes Etudes Commerciales HEC Alger. par Amina GACEM. Module Informatique 1ière Année Master Sciences Commerciales Ecole des Hautes Etudes Commerciales HEC Alger Évolution des SGBDs par Amina GACEM Module Informatique 1ière Année Master Sciences Commerciales Evolution des SGBDs Pour toute remarque, question, commentaire

Plus en détail

Projet : Réalisation d une base de. données. Sujet : Gestion des ressources humaines. Logiciel : Microsoft Access

Projet : Réalisation d une base de. données. Sujet : Gestion des ressources humaines. Logiciel : Microsoft Access Projet : Réalisation d une base de données Sujet : Gestion des ressources humaines Logiciel : Microsoft Access Encadré par : M. Mohamed Saïd ZERRADSAHLI Réalisé par : Ben Abdelmoumen Ibtissam Challaoui

Plus en détail

Module Analyse de Génomes 2011-2012 Master 2 module FMBS 326 Immunoinformatique

Module Analyse de Génomes 2011-2012 Master 2 module FMBS 326 Immunoinformatique Module Analyse de Génomes 2011-2012 Master 2 module FMBS 326 Immunoinformatique Planning du Module : Date Heure Salle 12/12 9h-12h TD info TA1Z bat 25 13h-17h TD info TA1Z bat 25 13/12 9h-12h TD info TA1Z

Plus en détail

THOT - Extraction de données et de schémas d un SGBD

THOT - Extraction de données et de schémas d un SGBD THOT - Extraction de données et de schémas d un SGBD Pierre-Jean DOUSSET (France), Benoît ALBAREIL (France) pj@miningdb.com, benoit@miningdb.com Mots clefs : Fouille d information, base de données, système

Plus en détail

Présentation du module Base de données spatio-temporelles

Présentation du module Base de données spatio-temporelles Présentation du module Base de données spatio-temporelles S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Partie 1 : Notion de bases de données (12,5h ) Enjeux et principes

Plus en détail

CHAPITRE 3 LA SYNTHESE DES PROTEINES

CHAPITRE 3 LA SYNTHESE DES PROTEINES CHAITRE 3 LA SYNTHESE DES ROTEINES On sait qu un gène détient dans sa séquence nucléotidique, l information permettant la synthèse d un polypeptide. Ce dernier caractérisé par sa séquence d acides aminés

Plus en détail

COMMUNICATEUR BLISS COMMANDE PAR UN SENSEUR DE POSITION DE L'OEIL

COMMUNICATEUR BLISS COMMANDE PAR UN SENSEUR DE POSITION DE L'OEIL COMMUNICATEUR BLISS COMMANDE PAR UN SENSEUR DE POSITION DE L'OEIL J. TICHON(1) (2), J.-M. TOULOTTE(1), G. TREHOU (1), H. DE ROP (2) 1. INTRODUCTION Notre objectif est de réaliser des systèmes de communication

Plus en détail

e-biogenouest CNRS UMR 6074 IRISA-INRIA / Plateforme de Bioinformatique GenOuest yvan.le_bras@irisa.fr Programme fédérateur Biogenouest co-financé

e-biogenouest CNRS UMR 6074 IRISA-INRIA / Plateforme de Bioinformatique GenOuest yvan.le_bras@irisa.fr Programme fédérateur Biogenouest co-financé e-biogenouest Coordinateur : Olivier Collin Animateur : Yvan Le Bras CNRS UMR 6074 IRISA-INRIA / Plateforme de Bioinformatique GenOuest yvan.le_bras@irisa.fr Programme fédérateur Biogenouest co-financé

Plus en détail

Utilisation de l ingénierie des modèles pour la conception collaborative de produits mécaniques

Utilisation de l ingénierie des modèles pour la conception collaborative de produits mécaniques Utilisation de l ingénierie des modèles pour la conception collaborative de produits mécaniques Mathias Kleiner Laboratoire des Sciences de l Information et des Systèmes (LSIS) - UMR CNRS 7296 Projet Ingenierie

Plus en détail

Enterprise Intégration

Enterprise Intégration Enterprise Intégration Intégration des données L'intégration de données des grandes entreprises, nationales ou multinationales est un vrai cassetête à gérer. L'approche et l'architecture de HVR est très

Plus en détail

Hervé Couturier EVP, SAP Technology Development

Hervé Couturier EVP, SAP Technology Development Hervé Couturier EVP, SAP Technology Development Hervé Biausser Directeur de l Ecole Centrale Paris Bernard Liautaud Fondateur de Business Objects Questions à: Hervé Couturier Hervé Biausser Bernard Liautaud

Plus en détail

BD réparties. Bases de Données Réparties. SGBD réparti. Paramètres à considérer

BD réparties. Bases de Données Réparties. SGBD réparti. Paramètres à considérer Bases de Données Réparties Définition Architectures Outils d interface SGBD Réplication SGBD répartis hétérogènes BD réparties Principe : BD locales, accès locaux rapides accès aux autres SGBD du réseau

Plus en détail

Alphonse Carlier, Intelligence Économique et Knowledge Management, AFNOR Éditions, 2012.

Alphonse Carlier, Intelligence Économique et Knowledge Management, AFNOR Éditions, 2012. 1 Du même auteur chez le même éditeur Alphonse Carlier, Intelligence Économique et Knowledge Management, AFNOR Éditions, 2012. AFNOR 2013 Couverture : création AFNOR Éditions Crédit photo 2011 Fotolia

Plus en détail

Bases de données Cours 1 : Généralités sur les bases de données

Bases de données Cours 1 : Généralités sur les bases de données Cours 1 : Généralités sur les bases de données POLYTECH Université d Aix-Marseille odile.papini@univ-amu.fr http://odile.papini.perso.esil.univmed.fr/sources/bd.html Plan du cours 1 1 Qu est ce qu une

Plus en détail

UNIV. LA ROCHELLE (IUT) Référence GALAXIE : 4099

UNIV. LA ROCHELLE (IUT) Référence GALAXIE : 4099 UNIV. LA ROCHELLE (IUT) Référence GALAXIE : 4099 Numéro dans le SI local : 0135 Référence GESUP : Corps : Professeur des universités Article : 46-1 Chaire : Non Section 1 : 27-Informatique Section 2 :

Plus en détail

Quality Awareness in Data Management and Mining

Quality Awareness in Data Management and Mining /40 Quality Awareness in Data Management and Mining Laure BERTI-ÉQUILLE Soutenance pour l Habilitation à Diriger de Recherches IRISA - Université de Rennes 1 25 Juin 2007 2/52 Activités Problématique Gestion

Plus en détail

Introduction aux Bases de Données

Introduction aux Bases de Données Introduction aux Bases de Données I. Bases de données I. Bases de données Les besoins Qu est ce qu un SGBD, une BD Architecture d un SGBD Cycle de vie Plan du cours Exemples classiques d'applications BD

Plus en détail

Conditions : stage indemnisé, aide au logement possible, transport CEA en Ile-de-France gratuit.

Conditions : stage indemnisé, aide au logement possible, transport CEA en Ile-de-France gratuit. Proposition de stage de BAC+4 ou BAC+5 Pro ou Recherche Etude comparative des outils de vérification d'algorithmes parallèles Logiciels (LSL), localisé à Palaiseau (Essonne), développe les outils d'aide

Plus en détail

Intelligence Economique - Business Intelligence

Intelligence Economique - Business Intelligence Intelligence Economique - Business Intelligence Notion de Business Intelligence Dès qu'il y a une entreprise, il y a implicitement intelligence économique (tout comme il y a du marketing) : quelle produit

Plus en détail

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles) SGBDR Systèmes de Gestion de Bases de Données (Relationnelles) Plan Approches Les tâches du SGBD Les transactions Approche 1 Systèmes traditionnels basés sur des fichiers Application 1 Gestion clients

Plus en détail

Utiliser Access ou Excel pour gérer vos données

Utiliser Access ou Excel pour gérer vos données Page 1 of 5 Microsoft Office Access Utiliser Access ou Excel pour gérer vos données S'applique à : Microsoft Office Access 2007 Masquer tout Les programmes de feuilles de calcul automatisées, tels que

Plus en détail

Évolution de schémas dans les entrepôts de données mise à jour de hiérarchies de dimension pour la personnalisation des analyses

Évolution de schémas dans les entrepôts de données mise à jour de hiérarchies de dimension pour la personnalisation des analyses Évolution de schémas dans les entrepôts de données mise à jour de hiérarchies de dimension pour la personnalisation des analyses Thèse présentée par Cécile FAVRE pour obtenir le titre de Docteur en Informatique

Plus en détail

! Séquence et structure des macromolécules. " Séquences protéiques (UniProt) " Séquences nucléotidiques (EMBL / ENA, Genbank, DDBJ)

! Séquence et structure des macromolécules.  Séquences protéiques (UniProt)  Séquences nucléotidiques (EMBL / ENA, Genbank, DDBJ) Introduction à la Bioinformatique Introduction! Les bases de données jouent un rôle crucial dans l organisation des connaissances biologiques.! Nous proposons ici un tour rapide des principales bases de

Plus en détail

OASIS www.oasis-open.org/committees/xacml/docs/docs.shtml Date de publication

OASIS www.oasis-open.org/committees/xacml/docs/docs.shtml Date de publication Statut du Committee Working Draft document Titre XACML Language Proposal, version 0.8 (XACML : XML Access Control Markup Language) Langage de balisage du contrôle d'accès Mot clé Attestation et sécurité

Plus en détail

Bases de données pour la recherche : quels enjeux et quel rôle pour les patients?

Bases de données pour la recherche : quels enjeux et quel rôle pour les patients? Bases de données pour la recherche : quels enjeux et quel rôle pour les patients? Paul Landais Université Montpellier 1 Responsable de la Banque Nationale de Données Maladies Rares (BNDMR) Co-coordonnateur

Plus en détail

basée sur le cours de Bertrand Legal, maître de conférences à l ENSEIRB www.enseirb.fr/~legal Olivier Augereau Formation UML

basée sur le cours de Bertrand Legal, maître de conférences à l ENSEIRB www.enseirb.fr/~legal Olivier Augereau Formation UML basée sur le cours de Bertrand Legal, maître de conférences à l ENSEIRB www.enseirb.fr/~legal Olivier Augereau Formation UML http://olivier-augereau.com Sommaire Introduction I) Les bases II) Les diagrammes

Plus en détail

Architecture d'entreprise : Guide Pratique de l'architecture Logique

Architecture d'entreprise : Guide Pratique de l'architecture Logique Guides Pratiques Objecteering Architecture d'entreprise : Guide Pratique de l'architecture Logique Auteur : Version : 1.0 Copyright : Softeam Equipe Conseil Softeam Supervisée par Philippe Desfray Softeam

Plus en détail

Bases de Données. Plan

Bases de Données. Plan Université Mohammed V- Agdal Ecole Mohammadia d'ingénieurs Rabat Bases de Données Mr N.EL FADDOULI 2014-2015 Plan Généralités: Définition de Bases de Données Le modèle relationnel Algèbre relationnelle

Plus en détail

IFT2255 : Génie logiciel

IFT2255 : Génie logiciel IFT2255 : Génie logiciel Chapitre 6 - Analyse orientée objets Section 1. Introduction à UML Julie Vachon et Houari Sahraoui 6.1. Introduction à UML 1. Vers une approche orientée objet 2. Introduction ti

Plus en détail

Programme «Analyste Programmeur» Diplôme d état : «Développeur Informatique» Homologué au niveau III (Bac+2) (JO N 176 du 1 août 2003) (34 semaines)

Programme «Analyste Programmeur» Diplôme d état : «Développeur Informatique» Homologué au niveau III (Bac+2) (JO N 176 du 1 août 2003) (34 semaines) Programme «Analyste Programmeur» Diplôme d état : «Développeur Informatique» Homologué au niveau III (Bac+2) (JO N 176 du 1 août 2003) (34 semaines) Module 1 : Programmer une application informatique Durée

Plus en détail

DOSSIER SOLUTION CA ERwin Modeling. Comment gérer la complexité des données et améliorer l agilité métier?

DOSSIER SOLUTION CA ERwin Modeling. Comment gérer la complexité des données et améliorer l agilité métier? DOSSIER SOLUTION CA ERwin Modeling Comment gérer la complexité des données et améliorer l agilité métier? CA ERwin Modeling fournit une vue centralisée des définitions de données clés afin de mieux comprendre

Plus en détail

UE 8 Systèmes d information de gestion Le programme

UE 8 Systèmes d information de gestion Le programme UE 8 Systèmes d information de gestion Le programme Légende : Modifications de l arrêté du 8 mars 2010 Suppressions de l arrêté du 8 mars 2010 Partie inchangée par rapport au programme antérieur Indications

Plus en détail

Les nouvelles architectures des SI : Etat de l Art

Les nouvelles architectures des SI : Etat de l Art Les nouvelles architectures des SI : Etat de l Art Objectif Mesurer concrètement les apports des nouvelles applications SI. Être capable d'évaluer l'accroissement de la complexité des applications. Prendre

Plus en détail

Thierry DELZESCAUX. «biopicsel» group, URA CNRS-CEA 2210 Service MIRCen, I²BM, CEA Fontenay-aux-Roses, France. Thierry.Delzescaux@cea.

Thierry DELZESCAUX. «biopicsel» group, URA CNRS-CEA 2210 Service MIRCen, I²BM, CEA Fontenay-aux-Roses, France. Thierry.Delzescaux@cea. Thierry DELZESCAUX «biopicsel» group, URA CNRS-CEA 2210 Service MIRCen, I²BM, CEA Fontenay-aux-Roses, France Thierry.Delzescaux@cea.fr Thierry DELZESCAUX Ingénieur chercheur CEA Experience Since 2008:

Plus en détail

Business Intelligence avec SQL Server 2012

Business Intelligence avec SQL Server 2012 Editions ENI Business Intelligence avec SQL Server 2012 Maîtrisez les concepts et réalisez un système décisionnel Collection Solutions Informatiques Extrait Alimenter l'entrepôt de données avec SSIS Business

Plus en détail

Gènes Diffusion - EPIC 2010

Gènes Diffusion - EPIC 2010 Gènes Diffusion - EPIC 2010 1. Contexte. 2. Notion de génétique animale. 3. Profil de l équipe plateforme. 4. Type et gestion des données biologiques. 5. Environnement Matériel et Logiciel. 6. Analyses

Plus en détail

IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21

IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21 IODAA de l 1nf0rmation à la Décision par l Analyse et l Apprentissage IODAA Informations générales 2 Un monde nouveau Des données numériques partout en croissance prodigieuse Comment en extraire des connaissances

Plus en détail

Stages 2014-2015 ISOFT : UNE SOCIETE INNOVANTE. Contact : Mme Lapedra, stage@isoft.fr

Stages 2014-2015 ISOFT : UNE SOCIETE INNOVANTE. Contact : Mme Lapedra, stage@isoft.fr Stages 2014-2015 ISOFT : UNE SOCIETE INNOVANTE Contact : Mme Lapedra, stage@isoft.fr ISoft, éditeur de logiciels, est spécialisé dans l informatique décisionnelle et l analyse de données. Son expertise

Plus en détail

CURRICULUM VITAE. Informations Personnelles

CURRICULUM VITAE. Informations Personnelles CURRICULUM VITAE Informations Personnelles NOM: BOURAS PRENOM : Zine-Eddine STRUCTURE DE RATTACHEMENT: Département de Mathématiques et d Informatique Ecole Préparatoire aux Sciences et Techniques Annaba

Plus en détail

Mise en place de serveurs Galaxy dans le cadre du réseau CATI BBRIC

Mise en place de serveurs Galaxy dans le cadre du réseau CATI BBRIC Mise en place de serveurs Galaxy dans le cadre du réseau CATI BBRIC {Sebastien.Carrere, Ludovic.Legrand,Jerome.Gouzy}@toulouse.inra.fr {Fabrice.Legeai,Anthony.Bretaudeau}@rennes.inra.fr CATI BBRIC 35 bioinformaticiens

Plus en détail

Gestion collaborative de documents

Gestion collaborative de documents Gestion collaborative de documents ANT box, le logiciel qui simplifie votre GED Les organisations (entreprises, collectivités, associations...) génèrent chaque jour des millions de documents, e-mails,

Plus en détail

Gestion des bases de données

Gestion des bases de données Gestion des bases de données DU Chef de Projet en Recherche Clinique 23/11/2012 Fabrice GOURMELON URC/CIC Necker - Cochin 2 A. Qu est-ce qu une donnée? B. Qu est-ce qu une base de données? C. Définition

Plus en détail

Business Intelligence avec Excel, Power BI et Office 365

Business Intelligence avec Excel, Power BI et Office 365 Avant-propos A. À qui s adresse ce livre? 9 1. Pourquoi à chaque manager? 9 2. Pourquoi à tout informaticien impliqué dans des projets «BI» 9 B. Obtention des données sources 10 C. Objectif du livre 10

Plus en détail

Méthodes de développement

Méthodes de développement 1 / 9 Méthodes de développement Méthodes agiles 1 - Introduction... 2 2 -Le manifeste agile et les méthodes agiles... 2 2.1 Le manifeste agile... 2 2.2 Les méthodes agiles... 3 3 - Caractéristiques communes

Plus en détail

Big Data: développement, rôle des ARS?? Laurent Tréluyer, ARS Ile de France Alain Livartowski Institut Curie Paris 01/12/2014

Big Data: développement, rôle des ARS?? Laurent Tréluyer, ARS Ile de France Alain Livartowski Institut Curie Paris 01/12/2014 Big Data: développement, rôle des ARS?? Laurent Tréluyer, ARS Ile de France Alain Livartowski Institut Curie Paris 01/12/2014 1 Classiquement, le Big Data se définit autour des 3 V : Volume, Variété et

Plus en détail