Mise en place d une solution automatique de stockage et de visualisation de données de capture des interactions chromatiniennes à l échelle génomique

Dimension: px
Commencer à balayer dès la page:

Download "Mise en place d une solution automatique de stockage et de visualisation de données de capture des interactions chromatiniennes à l échelle génomique"

Transcription

1 Rapport de stage de deuxième année de DUT Génie Biologique option Bioinformatique Mise en place d une solution automatique de stockage et de visualisation de données de capture des interactions chromatiniennes à l échelle génomique Institut de Génétique Humaine CNRS UPR , Rue de la Cardonille Montpellier Equipe Chromatine et Biologie Cellulaire (Responsable : Giacomo Cavalli) Mylène SIMON 2 ème année de DUT Génie Biologique option Bioinformatique Université d Auvergne Institut Universitaire de Technologie de Clermont-Ferrand Site d Aurillac, Département Génie Biologique Année universitaire Stage effectué du 01 avril au 30 juillet 2010 et encadré par M. Aubin THOMAS (IE)

2

3 Remerciements Tout d abord, je tiens à remercier Giacomo CAVALLI, responsable du département «Dynamique du Génome» et de l équipe «Chromatine et Biologie Cellulaire» de l IGH, de m avoir donné l opportunité d effectuer mon stage au sein de l IGH et d avoir pris sur son temps pour m expliquer les sujets de recherche de l équipe. Je remercie Aubin THOMAS, ingénieur d étude de l équipe «Chromatine et Biologie Cellulaire», mon maître de stage, pour sa disponibilité de tous les instants, sa sympathie, toutes les connaissances qu il a partagées avec moi et l aide qu il m a apportée tout au long du stage et lors de la rédaction de ce rapport. Je tiens également à remercier tous les membres de l équipe «Chromatine et Biologie Cellulaire» pour leur accueil et les réponses qu ils ont pu fournir à mes questions concernant leurs sujets de recherche, et plus particulièrement Thomas SEXTON, chargé de projet 3C, pour son aide lors de la rédaction de ce rapport. Je remercie aussi l ensemble des personnes travaillant dans le bureau bioinformatique de l IGH, pour leur accueil et leur bonne humeur quotidienne. Enfin, je tiens à remercier Helmut MICHELS, spécialiste en informatique au Max Planck Institute et créateur de la librairie graphique Dislin, pour ses réponses rapides à mes s et pour n avoir pas hésité à modifier sa librairie pour résoudre mon problème.

4

5 Résumé Les recherches menées au sein du laboratoire «Chromatine et Biologie cellulaire» de l Institut de Génétique Humaine de Montpellier sont principalement consacrées à l étude des phénomènes épigénétiques. L épigénétique correspond aux changements héritables dans l expression des gènes qui ne sont pas dus à des modifications dans la séquence d ADN. Deux principaux groupes de protéines sont impliqués dans ces phénomènes : les protéines Polycomb (ou PcG), qui inhibent l expression des gènes, et les protéines trithorax (ou trxg), qui au contraire activent l expression des gènes. Dans le cadre de ces recherches, plusieurs techniques expérimentales sont utilisées, ce qui génère un grand nombre de données génomiques. Le projet CavGenTools a pour but de proposer un ensemble de services et d applications web permettant d intégrer et de visualiser l ensemble de ces données. C est dans ce contexte que les programmes SMIF et PMIF ont été développés. Le logiciel SMIF permet l enregistrement automatique des données d expériences de mesure d interactions chromatiniennes et de fixation de protéines sur l ADN. L application PMIF, quant à elle, permet de visualiser en ligne ces données sous la forme de graphiques personnalisables, de manière simple et rapide.

6

7 Abstract The research conducted in the "Chromatin and Cell Biology laboratory at the Institute of Human Genetics in Montpellier is mainly devoted to studying epigenetics phenomena. Epigenetics refers to heritable changes in the expression of genes that are not due to changes in DNA sequence. Two main groups of proteins are involved in these phenomena: the Polycomb proteins (or PcG), which inhibit the gene expression, and the trithorax proteins (or trxg), which instead activate gene expression. Through this research, several experimental techniques are used and produce a lot of genome-wide data. The aim of the CavGenTools project is to provide a set of web services and applications to integrate and visualize all these data. It is in this context that the programs SMIF and PMIF have been developed. The SMIF software permits the automatic storage of data from experiments measuring chromatin interactions and proteins binding profiles on DNA. The PMIF application allows swift and simple visualization of the data online in the form of customizable graphics.

8

9 Sommaire Introduction... 1 I) Contexte du stage... 2 I.1) La structure d accueil... 2 I.1.1.) Le CNRS... 2 I.1.2) L Institut de Génétique Humaine... 2 I.1.3) L équipe Chromatine et Biologie Cellulaire... 2 I.2) Le contexte biologique... 3 I.2.1) Les techniques utilisées pour l obtention des données : séquençage à haut débit et techniques expérimentales... 3 I.2.2) Le projet CavGenTools... 4 I.2.3) Evolution du sujet de stage... 5 II) Organisation du stage... 6 II.1) Gestion globale du projet... 6 II.1.1) Définition d un cahier des charges pour les programmes... 6 II.1.2) Utilisation d un gestionnaire de projet... 7 II.1.3) Suivi du projet... 8 II.2) Méthode de programmation... 8 II.2.1) Rappel sur les techniques de programmation... 8 II.2.2) Extreme programming et cycles de développement courts... 9 III) Choix techniques III.1) Stockage des données III.1.1) Choix d une solution de stockage III.1.2) Prétraitement des données III.1.3) Enregistrement des données III.2) Programme de visualisation PMIF III.2.1) Langage de programmation III.2.2) Structuration du programme III.2.2.1) Les patrons de conception III.2.2.2) MVC III.2.2.3) Stratégie III.2.3) Libraires utilisées III.2.3.1) Xerces III.2.3.2) MySQL III.2.3.3) Dislin IV) Résultats IV.1) Exemple d application du programme PMIF IV.1.1) Protéines du groupe Polycomb et du groupe trithorax IV.1.2) L utilisation de PMIF pour illustrer le lien entre les méthylations de l histone H3 et les protéines du PcG IV.2) Discussion Conclusion Bibliographie Table des sigles et des abréviations Glossaire Table des figures et des tableaux Annexes

10

11

12

13 Introduction La génétique* a montré que l expression des gènes* et donc le phénotype d un individu (c'est-à-dire les caractéristiques qui lui sont propres) dépendaient de l enchaînement des nucléotides* constituants la molécule d ADN*. Cependant, depuis quelques années, certains chercheurs ont découvert que des changements dans l expression des gènes pouvaient apparaître sans qu il y ait de modifications dans la séquence de l ADN. C est ce que l on appelle des processus d épigénétique. L équipe «Biologie Cellulaire et Chromatine» de l Institut de Génétique Humaine de Montpellier (CNRS-UPR 1142) s intéresse particulièrement à ces phénomènes. Pour cela, les chercheurs de cette équipe emploient différentes techniques expérimentales produisant un grand nombre de données qu il est nécessaire de stocker et de traiter pour en extraire les informations recherchées. C est au sein de cette équipe, sous la tutelle d Aubin THOMAS, ingénieur bioinformaticien, que j ai réalisé mon stage. Celui-ci a consisté en la mise en place d une solution automatique de stockage et de visualisation de certaines des données expérimentales de l équipe. Ce rapport présente le travail que j ai réalisé sur machine au cours de ces quatre mois de stage au sein de cet institut. Tout d abord, nous aborderons dans une première partie le contexte et le sujet du stage, pour ensuite nous intéresser à la manière dont le projet a été conduit, tant au niveau de la gestion du temps que de la méthode de programmation. Une troisième partie sera consacrée à la description et à la justification des différents choix techniques qui ont été faits tout au long du stage. Enfin, nous nous pencherons dans une dernière partie sur les résultats obtenus. 1

14 Figure 1 : Organigramme de l'équipe "Chromatine et Biologie Cellulaire" Source : Adaptation de l'organigramme réalisé par Anna DELEST (membre de l'équipe)

15 I) Contexte du stage I.1) La structure d accueil I.1.1.) Le CNRS Le Centre National de la Recherche Scientifique, ou CNRS [5], a été créé le 19 octobre C est un organisme public français de recherche scientifique placé sous la tutelle du Ministère de l Enseignement supérieur et de la Recherche. Il est classé comme établissement public à caractère scientifique et technologique et est le principal organisme de recherche pluridisciplinaire en France. La recherche au sein du CNRS s étend à l ensemble des domaines scientifiques, technologiques et sociétaux, couvrant ainsi la totalité des champs scientifiques (mathématiques, chimie, physique nucléaire, sciences du vivant, sciences humaines et sociales, sciences de la planète et de l Univers, etc.). I.1.2) L Institut de Génétique Humaine L Institut de Génétique Humaine, ou IGH [6], est une unité propre de recherche du CNRS (UPR 1142) située à Montpellier et dirigée par Alain BUCHETON. L'objectif de l'igh est de mener des recherches fondamentales de haut niveau et de lier ces recherches à l étude des pathologies, afin de mieux comprendre, diagnostiquer et traiter certaines pathologies humaines. Les trois départements scientifiques de l'igh, correspondants aux trois principaux axes de recherches sont : le département «Dynamique du Génome» (responsable : Giacomo CAVALLI), le département «Génétique et Développement» (responsable : Martine SIMONELIG), et le département «Pathologies Moléculaires et Cellulaires» (responsable : Sylvain LEHMANN). I.1.3) L équipe Chromatine et Biologie Cellulaire L équipe «Chromatine et Biologie Cellulaire» fait partie des dix équipes de recherche du département «Dynamique du Génome» et est dirigée par Giacomo 2

16 Figure 2 : HiSeq 2000, le séquenceur utilisé par le laboratoire Source :

17 CAVALLI, le responsable de ce département (voir figure 1). Les recherches menées au sein de cette équipe concernent principalement les phénomènes d épigénétique [7], c està-dire les processus d hérédité réversibles qui ne sont pas fondés sur des changements dans la séquence d ADN. Les chercheurs s intéressent plus particulièrement à deux groupes de protéines, Polycomb (PcG) et trithorax (trxg). Les protéines du PcG inhibent ou répriment l expression des gènes du développement dès le stade embryonnaire, tandis que celles du trxg les accentuent. Le but de ces recherches est de comprendre comment ces deux groupes de protéines mettent en place l équilibre du réseau d expression des gènes dès les premiers stades de l embryon, en étudiant les mécanismes moléculaires impliqués dans ces processus. Pour cela, l équipe utilise différentes techniques et approches relevant de la biologie cellulaire, moléculaire et du développement, ainsi que de la génomique et de la bioinformatique. Cette équipe est composée de chercheurs, ingénieurs d études, doctorants, post-doctorants, étudiants et stagiaires et est «internationale», puisque sur les dix-sept personnes actuellement présentes, huit sont des scientifiques étrangers. I.2) Le contexte biologique I.2.1) Les techniques utilisées pour l obtention des données : séquençage à haut débit et techniques expérimentales Le séquençage à haut débit [8] est une technique permettant de connaître la composition en nucléotides du matériel génétique étudié, et cela par une analyse massive de courts fragments d ADN de 36, 72 ou 108 nucléotides* (technologie Illumina [9], voir figure 2 et annexe 1). Ces fragments (ou oligonucléotides) séquencés sont ensuite alignés sur un génome* de référence, afin de connaître la localisation physique du matériel génétique étudié. Les principales techniques expérimentales utilisées par l équipe sont : La 3C [10] : La technique de 3C permet de capturer de part et d autre les régions interagissant entre elles sur un même chromosome* ou entre plusieurs chromosomes. Une première étape consiste en la capture des sites de liaison entre chromosomes, et la deuxième étape de séquençage et d alignement permet de déterminer les positions de part et d autre des interactions (voir annexe 2). 3

18

19 La ChIP-Seq [11] : Les méthodes de ChIP-Seq permettent d étudier les sites de fixation de protéines sur l ADN. La première étape de ChIP capture les séquences ADN liées à ces protéines par immuno-précipitation de la chromatine. L étape de séquençage et d alignement permet de connaître les sites de fixation et leurs proportions (voir annexe 3). La ChIP-on-chip [12] : Cette technique permet de déterminer la localisation de protéines d intérêt et correspond à une immuno-précipitation de la chromatine (ou ChIP) dont les fragments obtenus sont analysés sur une puce ADN (voir annexe 4). Le RNA-seq [13], ou «WTSS» pour Whole Transcriptome Shotgun Sequencing : Cette technique permet de mesurer le niveau d expression des gènes en analysant la population totale des transcrits exprimés dans un type cellulaire donné grâce au séquençage à très haut débit. I.2.2) Le projet CavGenTools L équipe «Chromatine et Biologie cellulaire» produit et étudie un grand nombre de données de différentes natures. Les trois principaux types de données sont : Les données de mesures d interactions chromatiniennes dans le noyau : elles sont obtenues grâce à la technique de 3C. Les données de localisations des protéines régulatrices des différents mécanismes étudiées par l équipe : elles sont obtenues grâces à des techniques d immuno-précipitation telles que la ChIP-on-chip et la ChIP-seq, Ces deux techniques permettent d étudier des protéines interagissant avec l ADN. Les données de niveaux d expression des gènes dans différents tissus et différentes conditions : elles sont obtenues grâce à des techniques de puces à ADN [14] et de RNA-seq, ou «WTSS» pour Whole Transcriptome Shotgun Sequencing. Le projet CavGenTools est issu du désir de l équipe «Chromatine et Biologie Cellulaire» de proposer un ensemble de services et d applications web permettant de visualiser l ensemble des données qu elle génère et étudie. Actuellement, une 4

20

21 application web permettant de visualiser les données obtenues par la ChIP-on-chip (localisations des protéines régulatrices sur l ADN) est disponible. A terme, le but est de mettre en place la visualisation des autres types de données (3C, ChIP-seq, puces à ADN et RNA-seq) par un ensemble de webservices*. I.2.3) Evolution du sujet de stage A l origine, le sujet de stage a été formulé de cette manière : «Mise en place d une solution automatique de stockage et de visualisation de données de capture des interactions chromatiniennes à l échelle génomique.» Le stage s inscrivait dans la mise en place de la partie 3C du projet CavGenTools. Deux grandes étapes se dégagent de ce sujet : La création d un programme permettant un enregistrement automatisé et facilité des données de 3C et des informations liées à ces données (telles que l organisme, le tissu, les conditions, le type de données, ) dans la base de données déjà disponible. Cela implique également de définir des règles d enregistrement pour ce programme (paramètres obligatoires, fichiers de configuration à remplir par l utilisateur, gestion des erreurs par le programme, etc.). La création d un programme permettant la visualisation des données de 3C sous la forme de graphiques, dont le fond et la forme dépendent des choix de l utilisateur du programme. Pour cela, il est nécessaire de déterminer, en concertation avec les biologistes impliqués dans le projet, de quelle manière les données à visualiser seront choisies par les utilisateurs et quels sont les types de visualisation à proposer. Au vu de l avancement rapide du projet, il a été convenu que je réalise également deux programmes similaires à ceux conçus pour les données de 3C, adaptés pour permettre l enregistrement et la visualisation des données de ChIP-seq. Deux ensembles de programmes ont donc été créés : SMIF, qui permet l enregistrement des données de 3C et de ChIP-Seq, et PMIF, qui permet la visualisation des données de 3C et de ChIP-Seq. 5

22

23 II) Organisation du stage II.1) Gestion globale du projet II.1.1) Définition d un cahier des charges pour les programmes Les programmes développés au cours du stage ont pour but de répondre à un besoin des chercheurs de l équipe et de certains biologistes de pouvoir visualiser les données générées et étudiées dans le laboratoire, de manière simple et accessible de n importe quel ordinateur relié à internet. Cela implique de prendre en compte les préférences des chercheurs de l équipe ainsi que certaines contraintes, et de bien définir celles-ci avant de commencer à développer les programmes. Ces différents aspects ont été discutés avec les principales personnes impliquées dans le projet, c'est-à-dire Aubin THOMAS, mon maître de stage, Thomas SEXTON, le chargé de projet 3C, et Giacomo CAVALLI, le responsable de l équipe. Pour cela, des réunions ont été organisées, au cours desquelles j ai pu présenter de manière argumentée les différents choix faits pour le développement du programme. Les personnes impliquées dans le projet ont ainsi pu connaître et comprendre ces choix, les valider la plupart du temps mais également remettre en cause ceux qui ne leur convenaient pas. Cette démarche a permis de définir un cadre pour le développement du programme, et de fixer les objectifs à atteindre, en prenant en compte les besoins et préférences des biologistes ainsi que les contraintes techniques. Ces discussions ont conduit à l'élaboration d un cahier des charges pour chaque programme, rédigés par mes soins en collaboration avec Aubin THOMAS. Ces documents développent les points suivants : L objectif général du programme Les contraintes techniques à prendre en compte Le cadre du programme o Les paramètres obligatoires passés en arguments du programme o Les fichiers de configuration à remplir par l utilisateur o La gestion des erreurs Un échéancier des résultats et un planning des futures réunions Pour le programme d enregistrement des données SMIF : o Le format du fichier contenant les données à enregistrer 6

24 Figure 3 : Copie d'écran du gestionnaire de projet Source :

25 o Le support d enregistrement des données o La structuration des données o Les vérifications permettant de ne pas enregistrer deux fois la même série de données o Les champs obligatoires et facultatifs dans les fichiers de configuration à remplir par l utilisateur Pour le programme de visualisation des données PMIF : o Les différents types de visualisation des données (voir annexe 5) o La récupération des données à visualiser o Les différentes techniques statistiques utilisées pour la génération des graphiques o Les formats et tailles d images proposés à l utilisateur o Les couleurs utilisées II.1.2) Utilisation d un gestionnaire de projet Pour faciliter la planification et la gestion du travail et permettre une meilleure visibilité de l avancement du projet pour les personnes y étant impliquées, une application web de gestion de projet, adaptée du programme Redmine [15], a été utilisée. Ce logiciel a pour particularité d être conçu pour la gestion de projets scientifiques en laboratoire. Il permet de gérer simultanément plusieurs projets, pouvant contenir euxmêmes plusieurs sous projets. Le gestionnaire de projet offre la possibilité de créer des tâches de différentes natures («à faire», bug, demande d informations, bibliographie, installation, etc.), de les affecter à un utilisateur et de pouvoir suivre leur évolution. Il est également possible de déposer des documents, classés par catégories (documentation technique, manuel d utilisation, code, résultats, ), de publier des annonces, de participer à un forum de discussion et de créer des pages wiki*. A chaque étape du stage, des tâches détaillées ont été créées permettant de définir des objectifs concrets à court terme correspondants aux différentes étapes du développement des programmes (voir figure 3). Pour chaque tâche réalisée, un rapport décrivant le travail effectué et les résultats obtenus est disponible dans le gestionnaire de tâches. Des exemples des graphiques obtenus ont également été déposés régulièrement, afin de permettre aux chercheurs de visualiser les résultats obtenus et l avancement du projet de manière plus concrète. 7

26

27 II.1.3) Suivi du projet Le gestionnaire de projet en ligne a permis de faciliter le suivi du projet, car le suivi de la réalisation des tâches y est aisé, grâce à l ajout possible de documents, de commentaires et de nouvelles demandes. De plus, tout au long du stage, des réunions hebdomadaires ont été faites avec mon maître de stage, Aubin THOMAS, me permettant de lui présenter mon avancement dans le projet, pour qu il puisse vérifier mes travaux et les corriger si nécessaire, et nous permettant de discuter de certains aspects techniques et du déroulement de la suite du stage, en définissant de nouveaux objectifs pour la semaine suivante. Des réunions moins formelles et de plus courte durée ont également eu lieu régulièrement en cas de besoin d explications ou de précisions complémentaires. Enfin, les besoins des biologistes étant en constante évolution, des réunions ont été tenues à certaines étapes clés du stage, permettant de présenter l avancement du projet et les résultats obtenus, et ainsi de discuter des préférences des biologistes et, si besoin, de mettre à jour le cahier des charges. Ces réunions se faisaient en présence du responsable de l équipe Giacomo CAVALLI, du chargé de projet 3C Thomas SEXTON, de mon maître de stage Aubin THOMAS, de moi-même, et parfois également du chargé de bio-analyse de domaines chromatiniens Benjamin LEBLANC. II.2) Méthode de programmation Afin de développer les programmes de manière plus efficace et pour qu ils soient plus faciles à modifier, il a été décidé de respecter une méthode de programmation* fréquemment utilisée par les développeurs* de logiciels, l extreme programming [16]. II.2.1) Rappel sur les techniques de programmation Les techniques de programmation correspondent à des méthodologies qui ont été conçues par des professionnels de l informatique pour le développement de logiciels. 8

28 Tableau I : Détails des cycles de programmation des applications SMIF et PMIF Source personnelle Cycle Tâche Détail Période - Prétraitement des données Développement de la - Analyse de la structure de la base de partie enregistrement données 02/04/10-1 automatique des - Choix du langage et des librairies 10/05/10 données de 3C du utilisés programme SMIF -Programmation + tests Développement du type de visualisation 0 (type test) pour les données de 3C du programme PMIF Développement du type de visualisation 1 pour les données de 3C du programme PMIF Développement du type de visualisation 2 pour les données de 3C du programme PMIF Développement du type de visualisation 3 pour les données de 3C du programme PMIF Développement de la partie enregistrement automatique des données de 3C du programme SMIF Développement des types de visualisation 0 (type test), 1 et 2 pour les données de ChIP-Seq du programme PMIF Intégration du programme PMIF sur le serveur de l équipe - Conception de la structure du programme (définition des classes, utilisation des patrons de conception, ) - Définition du type 0 (résultats sous la forme d un fichier texte) - Programmation + tests - Définition du type 1 (graphique simple de type XY, une seule couleur) - Choix de la librairie graphique - Programmation + tests - Définition du type 2 (graphique simple de type XY, plusieurs couleurs) - Choix de la palette de couleur - Programmation + tests - Définition du type 3 (graphique de type histogramme) - Programmation + tests - Ajout de nouvelles tables dans la base de données - Programmation (adaptation de la partie développée pour les données de 3C) + tests - Définition du type 1 (graphique de type profile, deux couleurs) - Définition du type 2 (graphique de type profile, trois couleurs) - Choix de la palette de couleur - Programmation (adaptation de la partie développée pour les données de 3C) + tests - Installation des librairies sur le serveur - Création de la nouvelle commande de compilation 10/05/10-14/05/10 10/05/10-26/05/10 27/05/10-09/06/10 10/06/10-16/06/10 10/06/10-12/06/10 10/06/10-07/07/10 08/07/10-16/07/10

29 Elles représentent pour les programmeurs un modèle utilisé pour structurer, planifier et contrôler le processus de développement d un logiciel. II.2.2) Extreme programming et cycles de développement courts L extreme programming est «une méthode agile de gestion de projet informatique adaptée aux équipes réduites avec des besoins changeants» [16]. Cela signifie que c est une méthode de développement de logiciel où le client (ici le biologiste) est impliqué au maximum, ce qui permet d être très réactif à ses demandes et ainsi d obtenir de sa part une réelle satisfaction vis-à-vis du produit créé. Cela implique l application de principes simples poussés à l extrême et impose une véritable discipline et une rigueur dans la programmation. L extreme programming repose sur des cycles de développement courts (quelques semaines) permettant de développer le logiciel par étapes, en commençant par la partie la plus basique et en rajoutant au fur et à mesure de nouvelles fonctionnalités. Chaque cycle comporte quatre grandes étapes : une phase d exploration qui détermine quelles fonctionnalités seront développées durant ce cycle, une phase de conversion du travail à effectuer en tâches précises et concrètes et de définition des tests à effectuer, une phase de développement et des tests, et une phase de présentation du produit au client. L un des aspects importants de cette technique est le travail en binôme : une personne travaille sur le code* à écrire, et une autre lui suggère de nouvelles possibilités et tente de déceler les éventuelles erreurs. Cette technique a été suivie durant la conception des programmes SMIF et PMIF, car elle permet de développer les programmes par étapes, en garantissant la stabilité et la validation du programme à la fin de chacune d entre elles. Elle permet également de garder une certaine flexibilité, ce qui assure une meilleure réactivité en cas de changements à apporter. Ainsi, les programmes ont été développés en respectant le rythme de cycles de développement de quelques semaines (voir tableau I). A chaque cycle correspondait un objectif précis à atteindre défini au début du cycle. Chacun de ces cycles comportait une phase de développement de la nouvelle fonctionnalité, une 9

30 Figure 4 : Schéma simplifié de la base de données Source personnelle

31 phase de tests et une phase de rédaction de rapport de programmation. Une fois l objectif atteint et les résultats validés par les personnes impliquées dans le projet, un nouvel objectif était défini, démarrant ainsi un nouveau cycle de développement. Plusieurs cycles ont également été effectués en parallèle, lorsque leurs réalisations n étaient pas dépendantes. III) Choix techniques III.1) Stockage des données III.1.1) Choix d une solution de stockage Les données expérimentales obtenues grâce aux technologies 3C et ChIP-Seq sont d abord stockées sous la forme de fichiers texte. Bien que ces fichiers respectent une organisation et une certaine mise en forme, ce mode de stockage n est pas pratique. En effet, il ne permet pas les croisements entre les données et l usage multi-utilisateurs (l utilisation des données par plusieurs utilisateurs simultanément). De plus, il n est pas possible de sélectionner de manière simple et rapide des données d intérêt se trouvant parmi toutes les autres. Il existe pour cela une solution de stockage plus structurée et qui permet de manipuler les données beaucoup plus facilement : les bases de données [17] (voir annexe 6 et figure 4). Une base de données est un dispositif informatique permettant de stocker des données de manière structurée et adaptée à l usage que l on souhaite en faire. Les données sont enregistrées dans des «tables», qui sont les équivalents de tableaux ayant chacun une structure propre. Ce type de structuration des données permet de d effectuer des requêtes*, dans le but de sélectionner certaines données en appliquant des filtres. Par exemple, dans le cas des données de l équipe, il est possible de ne sélectionner que les données qui correspondent à un domaine sur un chromosome précis, ou à une expérience particulière, etc. L un des avantages importants d une base de données est qu elle peut être «répartie», c'est-à-dire enregistrée sur une machine distante (par exemple un serveur*) et accessible par réseau*. 10

32 Tableau II : Exemple d application du programme de pré-traitement des données (les deux extraits ont été choisis aléatoirement dans les fichiers) Avant, à chaque ligne du fichier : o Des informations concernant l expérience o Le nom du premier chromosome impliqué dans l interaction o La position de l interaction sur ce premier chromosome o Le brin (sens (+) ou antisens (-)) de ce premier chromosome impliqué dans l interaction o Le nom du deuxième chromosome impliqué dans l interaction o o La position de l interaction sur ce deuxième chromosome Le brin (sens (+) ou antisens (-)) de ce deuxième chromosome impliqué dans l interaction Après, à chaque ligne du fichier : o Le nom du premier chromosome impliqué dans les interactions o La position de la région sur ce premier chromosome impliquée dans les interactions o Le nom du deuxième chromosome impliqué dans les interactions o La position de la région sur ce deuxième chromosome impliquée dans les interactions o Le nombre d interactions retrouvées entre ces deux régions Source personnelle Etat Avant prétraitement Après prétraitement Extraits des fichiers HWI-EAS387_0001:3:62:60:946#0 3L L 84 + HWI-EAS387_0001:3:47:1346:307#0 3L L HWI-EAS387_0001:3:38:94:557#0 3R L HWI-EAS387_0001:3:26:294:133#0 X L HWI-EAS387_0001:3:75:1479:437#0 3L L HWI-EAS387_0001:3:10:1016:1810#0 3R L HWI-EAS387_0001:3:44:1069:452#0 3L L HWI-EAS387_0001:3:58:581:904#0 3L L HWI-EAS387_0001:3:29:271:806#0 3L 508-2L HWI-EAS387_0001:3:58:1550:17#0 3L L L L L L L L L L L L L L L L L L L L L L

33 Pour utiliser et gérer des bases de données, il est nécessaire d utiliser un logiciel appelé SGBD pour Système de Gestion de Bases de Données. Il existe de nombreux logiciels de ce type, les plus connus étant Microsoft Access, Microsoft SQL server, Oracle, MySQL [18] ou encore PostgreSQL. Chacun de ces logiciels possède des avantages et des inconvénients, ainsi que des caractéristiques techniques particulières (telles que la compatibilité avec le système d exploitation* de la machine) qui sont à prendre en considération lors du choix du SGBD qui va être utilisé. Pour la base de données devant contenir les données expérimentales de l équipe, nous avons opté pour le logiciel MySQL. En effet, celui-ci est compatible avec les systèmes d exploitation Unix* présents sur les serveurs utilisés par l équipe, est performant et stable et présente l avantage d être gratuit. III.1.2) Prétraitement des données Les données expérimentales obtenues grâce à la technologie 3C, qui correspondent à des données d interactions chromosomiques, sont enregistrées sous forme de fichiers texte au format suivant : à chaque ligne correspond une interaction, celle-ci étant représentée par ses positions sur les deux chromosomes impliqués dans l interaction, et des informations complémentaires. Il a été décidé de traiter ces données avant de les enregistrer dans la base de données, afin de ne conserver de réduire le volume des données et de ne conserver que celles étant nécessaires pour la visualisation. Pour cela, un programme a été créé, permettant d organiser les données en «fenêtres» de 1000 pb et supprimer les informations non indispensables. Cette taille de 1000 pb a été choisie car les fragments capturés pour être séquencés faisaient de 400 à 800 pb de long. Pour chaque position d interaction, la marge est donc de 800 pb maximum, ce qui signifie que la position est sûre à 800 pb près. Le nouveau fichier texte créé par ce programme contient, à chaque ligne, un couple fenêtre 1/fenêtre 2 et le nombre d interactions entre les régions représentées par ces deux fenêtres (voir tableau II). Ce programme a été créé en langage Perl [19], car ce langage permet de créer des applications traitant efficacement des fichiers texte de manière relativement simple et rapide. Les données expérimentales obtenues grâce à la technologie ChIP-Seq, quant à elles, sont issues d expériences visant à mesurer la fixation de protéines sur les 11

34

35 chromosomes. L échantillonnage des valeurs est d une fréquence de 10 pb et, comme les fragments séquencés ont une taille de 200 pb, la précision est de 200 pb. Ces données sont également stockées sous la forme de fichiers texte. Chaque fichier correspond à une expérience précise (mesure de la fixation d une protéine particulière sur un groupe d individus) et, à chaque ligne correspond une valeur obtenue à une position particulière d un chromosome. Malgré le volume important de ces données expérimentales, il a été décidé de ne pas les réorganiser en «fenêtres» comme cela a été le cas pour les données obtenues grâce à la technologie 3C. En effet, l un des principaux avantages de la technologie ChIP-Seq est de générer des données précises, et il est important de garder cette précision pour obtenir une visualisation la plus juste possible. III.1.3) Enregistrement des données En raison du volume important de données expérimentales à enregistrer dans la base de données, il n était pas envisageable de les insérer une par une manuellement. Il a donc été nécessaire de créer une solution automatique d enregistrement des données, le programme SMIF. Après concertation avec mon maître de stage, Aubin THOMAS, c est également le langage Perl qui a été choisi pour réaliser ce logiciel d enregistrement automatique dans la base de données. En effet, comme dit précédemment, ce langage permet de créer des programmes qui traitent efficacement et rapidement les fichiers, et il existe une librairie* spécialisée, DBI [20], qui permet d assurer la communication entre un programme Perl et une base de données MySQL. Cette librairie contient toute une série de fonctions* permettant de se connecter à la base de données, d insérer des données, d effectuer des requêtes de sélections, etc. Une autre librairie, appelée YAML [21], a également été utilisée pour lire les fichiers de type YAML [22] (voir annexe 7), qui contenaient les informations relatives à chaque lot de données insérées dans la base de données (ces informations étant également enregistrées dans la base de données et reliées aux données expérimentales). 12

36

37 III.2) Programme de visualisation PMIF III.2.1) Langage de programmation Il fallait choisir un langage de programmation pour le programme de visualisation PMIF qui possède les avantages suivants : rapidité d exécution : le programme devant s intégrer dans un jeu de webservices accessibles par Internet, il est nécessaire qu il s exécute rapidement pour ne pas entraîner trop d attente pour les utilisateurs, consommation de mémoire* minimisée : le volume des données à traiter étant très important, les calculs à effectuer le sont également, ce qui peut entraîner une consommation d espace mémoire critique (une consommation de mémoire supérieure à l espace disponible engendre des problèmes lors de l exécution du programme), langage orienté objet : afin de faciliter la programmation et la reprise du code, le langage doit être orienté objet pour permettre la création de classes* et d objets* (voir annexe 8), un nombre important de librairies compatibles avec le langage : le programme doit traiter des fichiers de type XML [23] [24] et YAML, interagir avec des bases de données, générer des graphiques, il est donc utile d utiliser des librairies riches permettant de ne pas réécrire certaines fonctions déjà existantes. De plus, il était nécessaire d opter pour un langage connu et maîtrisé par mon maître de stage, Aubin THOMAS, car c est lui qui assurera la maintenance et les mises à jour du programme après la fin du stage. Au vu de tous ces critères, il a été convenu d utiliser le langage C++ [1] [25] pour l écriture du programme, un langage compilé* rapide et performant, qui permet la programmation orientée objet et pour lequel de nombreuses librairies ont été développées. III.2.2) Structuration du programme Afin de faciliter la maintenance et la reprise du code par un autre programmeur, nous avons choisi de structurer le programme en suivant des modèles de structuration de code appelés patrons de conception [26]. 13

38 Figure 5 : Schéma simplifié du modèle MVC Source :

Présentation du module Base de données spatio-temporelles

Présentation du module Base de données spatio-temporelles Présentation du module Base de données spatio-temporelles S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Partie 1 : Notion de bases de données (12,5h ) Enjeux et principes

Plus en détail

Introduction aux bases de données: application en biologie

Introduction aux bases de données: application en biologie Introduction aux bases de données: application en biologie D. Puthier 1 1 ERM206/Technologies Avancées pour le Génome et la Clinique, http://tagc.univ-mrs.fr/staff/puthier, puthier@tagc.univ-mrs.fr ESIL,

Plus en détail

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation Base de données S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Présentation du module Contenu général Notion de bases de données Fondements / Conception Utilisation :

Plus en détail

CHAPITRE 3 LA SYNTHESE DES PROTEINES

CHAPITRE 3 LA SYNTHESE DES PROTEINES CHAITRE 3 LA SYNTHESE DES ROTEINES On sait qu un gène détient dans sa séquence nucléotidique, l information permettant la synthèse d un polypeptide. Ce dernier caractérisé par sa séquence d acides aminés

Plus en détail

Créer le schéma relationnel d une base de données ACCESS

Créer le schéma relationnel d une base de données ACCESS Utilisation du SGBD ACCESS Polycopié réalisé par Chihab Hanachi et Jean-Marc Thévenin Créer le schéma relationnel d une base de données ACCESS GENERALITES SUR ACCESS... 1 A PROPOS DE L UTILISATION D ACCESS...

Plus en détail

Master CCI. Compétences Complémentaires en Informatique. Livret de l étudiant

Master CCI. Compétences Complémentaires en Informatique. Livret de l étudiant Master CCI Compétences Complémentaires en Informatique Livret de l étudiant 2014 2015 Master CCI Le Master CCI (Compétences Complémentaires en Informatique) permet à des étudiants de niveau M1 ou M2 dans

Plus en détail

Communiqué de Lancement

Communiqué de Lancement Direction du Marketing Produits Sage - Division Mid Market Communiqué de Lancement Rapprochement Bancaire 1000 Produit : Rapprochement Bancaire 1000 Bases de Données : Oracle - MS/SQL Server Microsoft

Plus en détail

LIVRE BLANC Pratiques recommandées pour l utilisation de Diskeeper sur les réseaux SAN (Storage Area Networks)

LIVRE BLANC Pratiques recommandées pour l utilisation de Diskeeper sur les réseaux SAN (Storage Area Networks) LIVRE BLANC Pratiques recommandées pour l utilisation de Diskeeper sur les réseaux SAN (Storage Area Networks) Think Faster. [Pensez plus vite] Visitez Condusiv.com RECOMMANDATIONS D UTILISATION DE DISKEEPER

Plus en détail

Gènes Diffusion - EPIC 2010

Gènes Diffusion - EPIC 2010 Gènes Diffusion - EPIC 2010 1. Contexte. 2. Notion de génétique animale. 3. Profil de l équipe plateforme. 4. Type et gestion des données biologiques. 5. Environnement Matériel et Logiciel. 6. Analyses

Plus en détail

IBM Tivoli Monitoring, version 6.1

IBM Tivoli Monitoring, version 6.1 Superviser et administrer à partir d une unique console l ensemble de vos ressources, plates-formes et applications. IBM Tivoli Monitoring, version 6.1 Points forts! Surveillez de façon proactive les éléments

Plus en détail

Rapport de Stage Christopher Chedeau 2 au 26 Juin 2009

Rapport de Stage Christopher Chedeau 2 au 26 Juin 2009 Rapport de Stage Christopher Chedeau 2 au 26 Juin 2009 «Web. De l intégration de pages statiques HTML à un CMS, à la dynamisation d un site grâce au Javascript et l utilisation de nouvelles technologies

Plus en détail

Cours Base de données relationnelles. M. Boughanem, IUP STRI

Cours Base de données relationnelles. M. Boughanem, IUP STRI Cours Base de données relationnelles 1 Plan 1. Notions de base 2. Modèle relationnel 3. SQL 2 Notions de base (1) Définition intuitive : une base de données est un ensemble d informations, (fichiers),

Plus en détail

Migration du pack office 2003. Planification, préparation, déploiement et formation

Migration du pack office 2003. Planification, préparation, déploiement et formation Migration du pack office 2003 Planification, préparation, déploiement et formation Planification : Comment s y prendre pour assurer au mieux la migration? Deux solutions : La première solution consiste

Plus en détail

Jedox rafraîchit les rapports du fabricant de boissons MBG

Jedox rafraîchit les rapports du fabricant de boissons MBG Jedox rafraîchit les rapports du fabricant de boissons MBG «Nous pouvons désormais réaliser plus efficacement notre reporting et la planifi cation de nos ventes grâce à Jedox, et avons même soif de plus

Plus en détail

Projet 2. Gestion des services enseignants CENTRE D ENSEIGNEMENT ET DE RECHERCHE EN INFORMATIQUE. G r o u p e :

Projet 2. Gestion des services enseignants CENTRE D ENSEIGNEMENT ET DE RECHERCHE EN INFORMATIQUE. G r o u p e : CENTRE D ENSEIGNEMENT ET DE RECHERCHE EN INFORMATIQUE Projet 2 Gestion des services enseignants G r o u p e : B E L G H I T Y a s m i n e S A N C H E Z - D U B R O N T Y u r i f e r M O N T A Z E R S i

Plus en détail

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY Yvan Le Bras yvan.le_bras@irisa.fr Cyril Monjeaud, Mathieu Bahin, Claudia Hériveau, Olivier Quenez, Olivier Sallou, Aurélien Roult, Olivier

Plus en détail

Faculté des sciences de gestion et sciences économiques BASE DE DONNEES

Faculté des sciences de gestion et sciences économiques BASE DE DONNEES BASE DE DONNEES La plupart des entreprises possèdent des bases de données informatiques contenant des informations essentielles à leur fonctionnement. Ces informations concernent ses clients, ses produits,

Plus en détail

KIELA CONSULTING. Microsoft Office Open Office Windows - Internet. Formation sur mesure

KIELA CONSULTING. Microsoft Office Open Office Windows - Internet. Formation sur mesure KIELA CONSULTING Microsoft Office Open Office Windows - Internet Formation sur mesure Bureautique L outil informatique et la bureautique sont devenus quasiment incontournables quelque soit votre métier

Plus en détail

Ingénieur R&D en bio-informatique

Ingénieur R&D en bio-informatique Ingénieur R&D en bio-informatique Spécialisé Bases De Données 33 ans, Célibataire. Biologie & Informatique gabriel.chandesris[at]laposte.net {06 56 41 97 37} Use the bipper! http://gabriel.chandesris.free.fr/

Plus en détail

Brique BDL Gestion de Projet Logiciel

Brique BDL Gestion de Projet Logiciel Brique BDL Gestion de Projet Logiciel Processus de développement pratiqué à l'enst Sylvie.Vignes@enst.fr url:http://www.infres.enst.fr/~vignes/bdl Poly: Computer elective project F.Gasperoni Brique BDL

Plus en détail

Jade. Projet Intelligence Artificielle «Devine à quoi je pense»

Jade. Projet Intelligence Artificielle «Devine à quoi je pense» Jade Projet Intelligence Artificielle «Devine à quoi je pense» Réalisé par Djénéba Djikiné, Alexandre Bernard et Julien Lafont EPSI CSII2-2011 TABLE DES MATIÈRES 1. Analyse du besoin a. Cahier des charges

Plus en détail

Développement itératif, évolutif et agile

Développement itératif, évolutif et agile Document Développement itératif, évolutif et agile Auteur Nicoleta SERGI Version 1.0 Date de sortie 23/11/2007 1. Processus Unifié Développement itératif, évolutif et agile Contrairement au cycle de vie

Plus en détail

ASA-Advanced Solutions Accelerator. Solution pour la gestion des données des laboratoires et des plateformes de service

ASA-Advanced Solutions Accelerator. Solution pour la gestion des données des laboratoires et des plateformes de service ASA-Advanced Solutions Accelerator Partenaire informatique des Laboratoires de Recherche 100lims Solution pour la gestion des données des laboratoires et des plateformes de service Parce que vous cherchez

Plus en détail

11 Février 2014 Paris nidays.fr. ni.com

11 Février 2014 Paris nidays.fr. ni.com 11 Février 2014 Paris nidays.fr 1 Choisir la bonne architecture logicielle pour automatiser les systèmes de test Jérémy Charavet Ingénieur d Applications, National Instruments France Une architecture logicielle

Plus en détail

Évaluation et implémentation des langages

Évaluation et implémentation des langages Évaluation et implémentation des langages Les langages de programmation et le processus de programmation Critères de conception et d évaluation des langages de programmation Les fondations de l implémentation

Plus en détail

TUTORIEL Qualit Eval. Introduction :

TUTORIEL Qualit Eval. Introduction : TUTORIEL Qualit Eval Introduction : Qualit Eval est à la fois un logiciel et un référentiel d évaluation de la qualité des prestations en établissements pour Personnes Agées. Notre outil a été spécifiquement

Plus en détail

Introduction à la B.I. Avec SQL Server 2008

Introduction à la B.I. Avec SQL Server 2008 Introduction à la B.I. Avec SQL Server 2008 Version 1.0 VALENTIN Pauline 2 Introduction à la B.I. avec SQL Server 2008 Sommaire 1 Présentation de la B.I. et SQL Server 2008... 3 1.1 Présentation rapide

Plus en détail

Plateforme de capture et d analyse de sites Web AspirWeb

Plateforme de capture et d analyse de sites Web AspirWeb Projet Java ESIAL 2A 2009-2010 Plateforme de capture et d analyse de sites Web AspirWeb 1. Contexte Ce projet de deuxième année permet d approfondir par la pratique les méthodes et techniques acquises

Plus en détail

Tutoriel XBNE Connexion à un environnement XBMC distant

Tutoriel XBNE Connexion à un environnement XBMC distant Tutoriel XBNE Connexion à un environnement XBMC distant 1. Introduction... 3 2. Quelques notions d informatique... 4 2.1 Réseau informatique... 4 2.1.1 Adresse ip... 4 2.1.2 Fixer l adresse ip d un équipement...

Plus en détail

Gestion du parc informatique matériel et logiciel de l Ensicaen. Rapport de projet. Spécialité Informatique 2 e année. SAKHI Taoufik SIFAOUI Mohammed

Gestion du parc informatique matériel et logiciel de l Ensicaen. Rapport de projet. Spécialité Informatique 2 e année. SAKHI Taoufik SIFAOUI Mohammed 6, bd maréchal Juin F-14050 Caen cedex 4 Spécialité Informatique 2 e année Rapport de projet Gestion du parc informatique matériel et logiciel de l Ensicaen SAKHI Taoufik SIFAOUI Mohammed Suivi ENSICAEN

Plus en détail

Rapport de stage. Création d un site web. Stage du 20/01/2013 au 21/02/2013

Rapport de stage. Création d un site web. Stage du 20/01/2013 au 21/02/2013 Rapport de stage Création d un site web Stage du 20/01/2013 au 21/02/2013 Auteur : Antoine Luczak Tuteur professionnel : M. Tison Tuteur scolaire : Mme Girondon Année scolaire : 2013/2014 1 Table des matières

Plus en détail

FICHE PRODUIT COREYE CACHE Architecture technique En bref Plateforme Clients Web Coreye Cache applicative Références Principe de fonctionnement

FICHE PRODUIT COREYE CACHE Architecture technique En bref Plateforme Clients Web Coreye Cache applicative Références Principe de fonctionnement COREYE CACHE Solution d absorption de charge pour une disponibilité et une performance optimales des applications Web En bref Architecture technique La plateforme Coreye Cache délivre la majeure partie

Plus en détail

COMMENT LIRE UN DEVIS DE CREATION DE SITE WEB?

COMMENT LIRE UN DEVIS DE CREATION DE SITE WEB? COMMENT LIRE UN DEVIS DE CREATION DE SITE WEB? Lorraine En matière de création ou de refonte d un site Internet, il apparaît souvent difficile de faire un choix parmi les propositions qui font suite à

Plus en détail

Stage Ingénieur en développement logiciel/modélisation 3D

Stage Ingénieur en développement logiciel/modélisation 3D Ingénieur en développement logiciel/modélisation 3D Schlumberger recrute un(e) stagiaire ingénieur en modélisation 3D pour la plate-forme Petrel. Vous serez intégré(e) au sein d une équipe innovante, Petrel

Plus en détail

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles) SGBDR Systèmes de Gestion de Bases de Données (Relationnelles) Plan Approches Les tâches du SGBD Les transactions Approche 1 Systèmes traditionnels basés sur des fichiers Application 1 Gestion clients

Plus en détail

IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21

IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21 IODAA de l 1nf0rmation à la Décision par l Analyse et l Apprentissage IODAA Informations générales 2 Un monde nouveau Des données numériques partout en croissance prodigieuse Comment en extraire des connaissances

Plus en détail

http://mondomaine.com/dossier : seul le dossier dossier sera cherché, tous les sousdomaines

http://mondomaine.com/dossier : seul le dossier dossier sera cherché, tous les sousdomaines Principales fonctionnalités de l outil Le coeur du service suivre les variations de position d un mot-clé associé à une URL sur un moteur de recherche (Google - Bing - Yahoo) dans une locale (association

Plus en détail

S8 - INFORMATIQUE COMMERCIALE

S8 - INFORMATIQUE COMMERCIALE S8 - INFORMATIQUE COMMERCIALE Les savoirs de l Informatique Commerciale doivent être abordés en relation avec les autres savoirs (S4 à S7). Les objectifs généraux sont : o de sensibiliser les étudiants

Plus en détail

Appendice 2. (normative) Structure de niveau supérieur, texte de base identique, termes et définitions de base communs

Appendice 2. (normative) Structure de niveau supérieur, texte de base identique, termes et définitions de base communs Appendice 2 (normative) Structure de niveau supérieur, texte de base identique, termes et définitions de base communs NOTE Dans les propositions de Texte identique, XXX désigne un qualificatif de norme

Plus en détail

Armand PY-PATINEC 2010

Armand PY-PATINEC 2010 Armand PY-PATINEC 2010 EPREUVE PRATIQUE : TABLEAU SYNOPTIQUE Activités Inventaire de bières et de leur lieu de fabrication Gestion des clients pour un programme de facturation Emploi du ruban de l interface

Plus en détail

les techniques d'extraction, les formulaires et intégration dans un site WEB

les techniques d'extraction, les formulaires et intégration dans un site WEB les techniques d'extraction, les formulaires et intégration dans un site WEB Edyta Bellouni MSHS-T, UMS838 Plan L extraction des données pour un site en ligne Architecture et techniques Les différents

Plus en détail

BONPRIX. Contexte et problématique : Les problèmes rencontrés :

BONPRIX. Contexte et problématique : Les problèmes rencontrés : BONPRIX BONPRIX fait communiquer en temps réel ses applications RPG Power i au moyen de Web Services avec le logiciel Strategi webservices Contexte et problématique : Bonprix est une société de vente à

Plus en détail

Stages 2014-2015 ISOFT : UNE SOCIETE INNOVANTE. Contact : Mme Lapedra, stage@isoft.fr

Stages 2014-2015 ISOFT : UNE SOCIETE INNOVANTE. Contact : Mme Lapedra, stage@isoft.fr Stages 2014-2015 ISOFT : UNE SOCIETE INNOVANTE Contact : Mme Lapedra, stage@isoft.fr ISoft, éditeur de logiciels, est spécialisé dans l informatique décisionnelle et l analyse de données. Son expertise

Plus en détail

Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments»

Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments» Master In silico Drug Design Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments» 30NU01IS INITIATION A LA PROGRAMMATION (6 ECTS) Responsables : D. MESTIVIER,

Plus en détail

SUGARCRM MODULE RAPPORTS

SUGARCRM MODULE RAPPORTS SUGARCRM MODULE RAPPORTS Référence document : SYNOLIA_Support_SugarCRM_Module_Rapports_v1.0.docx Version document : 1.0 Date version : 2 octobre 2012 Etat du document : En cours de rédaction Emetteur/Rédacteur

Plus en détail

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST.

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST. La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST. Gaël Le Mahec - p. 1/12 L algorithme BLAST. Basic Local Alignment Search Tool est un algorithme de recherche

Plus en détail

Master de Bioinformatique et Biologie des Systèmes Toulouse http://m2pbioinfo.biotoul.fr Responsable : Pr. Gwennaele Fichant

Master de Bioinformatique et Biologie des Systèmes Toulouse http://m2pbioinfo.biotoul.fr Responsable : Pr. Gwennaele Fichant Master de Bioinformatique et Biologie des Systèmes Toulouse http://m2pbioinfo.biotoul.fr Responsable : Pr. Gwennaele Fichant Parcours: Master 1 : Bioinformatique et biologie des Systèmes dans le Master

Plus en détail

Séquencer une application

Séquencer une application Séquencer une application Pour ma part, j'utilise Vmware workstation pour créer les packages. Je configure une VM sous Windows Xp Pro Sp2 : 1. Mise du Pc dans le domaine 2. Installation du séquenceur 3.

Plus en détail

La problématique de la Préservation des Bases de Données. Olivier ROUCHON CINES Groupe PIN Jeudi 7 Octobre

La problématique de la Préservation des Bases de Données. Olivier ROUCHON CINES Groupe PIN Jeudi 7 Octobre La problématique de la Préservation des Bases de Données Olivier ROUCHON CINES Groupe PIN Jeudi 7 Octobre Définition des bases de données Terme du langage courant base de données Utilisé pour désigner

Plus en détail

INF 1250 INTRODUCTION AUX BASES DE DONNÉES. Guide d étude

INF 1250 INTRODUCTION AUX BASES DE DONNÉES. Guide d étude INF 1250 INTRODUCTION AUX BASES DE DONNÉES Guide d étude Sous la direction de Olga Mariño Télé-université Montréal (Québec) 2011 INF 1250 Introduction aux bases de données 2 INTRODUCTION Le Guide d étude

Plus en détail

Microsoft Office system 2007 16 Février 2006

Microsoft Office system 2007 16 Février 2006 Microsoft Office system 2007 16 Février 2006 Attendu d ici la fin de l année 2006, Microsoft Office system 2007 inclut des applications, serveurs et services innovants et perfectionnés. Il a été conçu

Plus en détail

Objet du document. Version document : 1.00

Objet du document. Version document : 1.00 Version document : 1.00 Objet du document Les dix points de cet article constituent les règles à connaitre pour intégrer une application au sein d AppliDis. Le site des Experts Systancia comporte également

Plus en détail

Introduction MOSS 2007

Introduction MOSS 2007 Introduction MOSS 2007 Z 2 Chapitre 01 Introduction à MOSS 2007 v. 1.0 Sommaire 1 SharePoint : Découverte... 3 1.1 Introduction... 3 1.2 Ce que vous gagnez à utiliser SharePoint... 3 1.3 Dans quel cas

Plus en détail

Plateforme WikiJob spécifications

Plateforme WikiJob spécifications Plateforme WikiJob spécifications WikiJob 1. Introduction Ce document présente une vision générale des spécifications de la plateforme Internet WikiJob 1, axée sur une vision de multiples processus de

Plus en détail

SIO-SISR : Projet GSB. LOT 1 : Evaluation d un logiciel d inventaire et de gestion de parc. BTS Services Informatiques aux Organisations 1 ère année

SIO-SISR : Projet GSB. LOT 1 : Evaluation d un logiciel d inventaire et de gestion de parc. BTS Services Informatiques aux Organisations 1 ère année SIO BTS Services Informatiques aux Organisations 1 ère année LOT 1 : Evaluation d un logiciel d inventaire et de gestion de parc Objectifs : LOT 1 : Evaluation d un logiciel d inventaire et de gestion

Plus en détail

MYXTRACTION. 2009 La Business Intelligence en temps réel

MYXTRACTION. 2009 La Business Intelligence en temps réel MYXTRACTION 2009 La Business Intelligence en temps réel Administration Qui sommes nous? Administration et management des profils Connecteurs Base des données Gestion des variables et catégories de variables

Plus en détail

PRIMAVERA P6 ENTERPRISE PROJECT PORTFOLIO MANAGEMENT WEB SERVICES

PRIMAVERA P6 ENTERPRISE PROJECT PORTFOLIO MANAGEMENT WEB SERVICES PRIMAVERA P6 ENTERPRISE PROJECT PORTFOLIO MANAGEMENT WEB SERVICES DÉCOUVREZ DES POSSIBILITÉS ILLIMITÉES GRÂCE A L INTÉGRATION À DES SYSTÈMES D ENTREPRISE EXISTANTS FONCTIONNALITÉS Connectivité des systèmes

Plus en détail

Mon métier, mon parcours

Mon métier, mon parcours Mon métier, mon parcours Anthony, ingénieur d études diplômé d un Master Réseaux, application documentaire, ingénierie et sécurité Les métiers de l Informatique Le domaine Sciences, Technologies, Santé

Plus en détail

Les bases de données Page 1 / 8

Les bases de données Page 1 / 8 Les bases de données Page 1 / 8 Sommaire 1 Définitions... 1 2 Historique... 2 2.1 L'organisation en fichier... 2 2.2 L'apparition des SGBD... 2 2.3 Les SGBD relationnels... 3 2.4 Les bases de données objet...

Plus en détail

DEMANDE D INFORMATION RFI (Request for information)

DEMANDE D INFORMATION RFI (Request for information) DOD SEICAM RFI Demande d information EVDEC Réf. : RFI_EVDEC- GT5_Outil_reporting_BI_v4.doc Page 1/11 DEMANDE D INFORMATION RFI (Request for information) OUTIL INTÉGRÉ DE REPORTING ET D ANALYSE DÉCISIONNELLE

Plus en détail

ESPACE COLLABORATIF SHAREPOINT

ESPACE COLLABORATIF SHAREPOINT Conseil de l Europe Service des Technologies de l Information ESPACE COLLABORATIF SHAREPOINT DOSSIER D UTILISATEUR 1/33 Sommaire 1. Présentation de SharePoint... 3 1.1. Connexion... 4 2. Les listes...

Plus en détail

C ) Détail volets A, B, C, D et E. Hypothèses (facteurs externes au projet) Sources de vérification. Actions Objectifs Méthode, résultats

C ) Détail volets A, B, C, D et E. Hypothèses (facteurs externes au projet) Sources de vérification. Actions Objectifs Méthode, résultats C ) Détail volets A, B, C, D et E Actions Objectifs Méthode, résultats VOLET A : JUMELAGE DE 18 MOIS Rapports d avancement du projet. Réorganisation de l administration fiscale Rapports des voyages d étude.

Plus en détail

Formation Tutorée A Distance (FTAD) en BUREAUTIQUE

Formation Tutorée A Distance (FTAD) en BUREAUTIQUE Durée : 20 heures (Sur 2 mois maximum) Positionnement et parcours individuel de formation. Plate-forme de formation incluant cours, exercices et évaluation en ligne, disponibles 24 H/24, 7 j/7. 4 cours

Plus en détail

Note de synthèse. Développement web sur le CMS Prestashop. Stage du 17 mai au 25 juin 2010. Entreprise decoratzia.com 15 rue Erlanger 75016 - Paris

Note de synthèse. Développement web sur le CMS Prestashop. Stage du 17 mai au 25 juin 2010. Entreprise decoratzia.com 15 rue Erlanger 75016 - Paris BENCHETRIT Michaël BTS IG 2 ème année Brevet de Technicien Supérieur Informatique de Gestion Option : Développeur d applications Session 2011 Note de synthèse Développement web sur le CMS Prestashop Stage

Plus en détail

INSTITUT LIMAYRAC. enseignement supérieur Toulouse. Vincent de Prato BTS Informatique de Gestion. Option Administrateur de Réseaux Locaux

INSTITUT LIMAYRAC. enseignement supérieur Toulouse. Vincent de Prato BTS Informatique de Gestion. Option Administrateur de Réseaux Locaux INSTITUT LIMAYRAC enseignement supérieur Toulouse Vincent de Prato BTS Informatique de Gestion Option Administrateur de Réseaux Locaux Note de Synthèse Vincent de Prato BTS Informatique de Gestion 2009

Plus en détail

Forthcoming Database

Forthcoming Database DISS.ETH NO. 15802 Forthcoming Database A Framework Approach for Data Visualization Applications A dissertation submitted to the SWISS FEDERAL INSTITUTE OF TECHNOLOGY ZURICH for the degree of Doctor of

Plus en détail

Bases de données cours 1

Bases de données cours 1 Bases de données cours 1 Introduction Catalin Dima Objectifs du cours Modèle relationnel et logique des bases de données. Langage SQL. Conception de bases de données. SQL et PHP. Cours essentiel pour votre

Plus en détail

Introduction 3. GIMI Gestion des demandes d intervention 5

Introduction 3. GIMI Gestion des demandes d intervention 5 SOMMAIRE Gestion Help Desk de - parc Service Desk Introduction 3 GIMI Gestion des demandes d intervention 5 1 Schéma de principe et description des rôles 6 2 Principe de fonctionnement 8 Interface Demandeur

Plus en détail

Termes de référence pour le recrutement d un Assistant pour la gestion des bases de données

Termes de référence pour le recrutement d un Assistant pour la gestion des bases de données Conseil Ouest et Centre Africain pour la Recherche et le Développement Agricoles West and Central African Council for Agricultural Research and Development Termes de référence pour le recrutement d un

Plus en détail

Gestion Projet. Cours 3. Le cycle de vie

Gestion Projet. Cours 3. Le cycle de vie Gestion Projet Cours 3 Le cycle de vie Sommaire Généralités 3 Séquentiel 7 Itératif/Incrémental 17 Extreme Programming 22 Que choisir? 29 Etats Transverse 33 Cours 3 2006-2007 2 Généralités Cours 3 2006-2007

Plus en détail

OPTION SCIENCES BELLE-ISLE-EN-TERRE

OPTION SCIENCES BELLE-ISLE-EN-TERRE Serge Combet Professeur Mathématiques Collège de Belle-Isle-En-Terre OPTION SCIENCES BELLE-ISLE-EN-TERRE 2011-2012 Mathématiques & Informatique Sommaire I. Introduction... 5 II. Choix des logiciels...

Plus en détail

Cursus Sage ERP X3 Outils & Développement. Le parcours pédagogique Sage ERP X3 Outils et Développement

Cursus Sage ERP X3 Outils & Développement. Le parcours pédagogique Sage ERP X3 Outils et Développement Cursus Outils & Développement Vous êtes Consultant, Chef de Projets, Directeur des Systèmes d Information, Directeur Administratif et Financier, Optez pour les «formations Produits» Nous vous proposons

Plus en détail

GESTION D UNE BASE BIBLIOGRAPHIQUE

GESTION D UNE BASE BIBLIOGRAPHIQUE GESTION D UNE BASE BIBLIOGRAPHIQUE BTS Bioanalyses et contrôles Gil Voge Lycée Louise Michel, Grenoble Base de données (BD ou DB, database) Ensemble de données relatif à un domaine particulier des connaissances

Plus en détail

Rédiger et administrer un questionnaire

Rédiger et administrer un questionnaire Rédiger et administrer un questionnaire Ce document constitue une adaptation, en traduction libre, de deux brochures distinctes : l une produite par l American Statistical Association (Designing a Questionnaire),

Plus en détail

Merise. Introduction

Merise. Introduction Merise Introduction MERISE:= Méthode d Etude et de Réalisation Informatique pour les Systèmes d Entreprise Méthode d Analyse et de Conception : Analyse: Etude du problème Etudier le système existant Comprendre

Plus en détail

Compte-rendu re union Campus AAR 3 mars 2015

Compte-rendu re union Campus AAR 3 mars 2015 Compte-rendu re union Campus AAR 3 mars 2015 Table des matières Liste d actions... 2 I. Environnement d analyse : INA, Armadillo... 3 a. Connexion de l outil INA avec API Armadillo... 3 b. Outil d analyse

Plus en détail

Les bonnes pratiques d un PMO

Les bonnes pratiques d un PMO Livre Blanc Oracle Avril 2009 Les bonnes pratiques d un PMO Un plan évolutif pour construire et améliorer votre Bureau des Projets Une construction progressive La première étape consiste à déterminer les

Plus en détail

Prestations de conseil en SRM (Storage Ressource Management)

Prestations de conseil en SRM (Storage Ressource Management) Prestations de conseil en SRM (Storage Ressource Management) Sommaire 1 BUTS DE LA PRESTATION 2 PRESENTATION DE LA PRESTATION 3 3 3 ETAPE 1 : ELEMENTS TECHNIQUES SUR LESQUELS S APPUIE LA PRESTATION DE

Plus en détail

imvision System Manager

imvision System Manager SYSTIMAX Solutions imvision System Manager Logiciel de Gestion de l Infrastructure www.commscope.com imvision System Manager Vision imvision System Manager peut vous donner une vue complète de votre infrastructure

Plus en détail

Une plateforme logicielle pour une gestion colorimétrique globale

Une plateforme logicielle pour une gestion colorimétrique globale Une plateforme logicielle pour une gestion colorimétrique globale Colibri Le système de gestion des couleurs Colibri aide les propriétaires de marques, les entreprises de gestion de marques, les concepteurs,

Plus en détail

Maîtriser l'utilisation des outils bureautiques. Maîtriser le logiciel de traitement de texte - Word. Maitriser le logiciel tableur - Excel

Maîtriser l'utilisation des outils bureautiques. Maîtriser le logiciel de traitement de texte - Word. Maitriser le logiciel tableur - Excel Itinéraire de formation LES OUTILS BUREAUTIQUES Domaine ITINERAIRE THEMATIQUE But Maîtriser l'utilisation des outils bureautiques Maîtriser le logiciel de traitement de texte - Word Word 2003 niveau I

Plus en détail

LANGAGUE JAVA. Public Développeurs souhaitant étendre leur panel de langages de programmation

LANGAGUE JAVA. Public Développeurs souhaitant étendre leur panel de langages de programmation ING 01 LANGAGUE JAVA Durée : 21 heures 1090 HT / jour Dates : à définir en 2012 Concevoir et développer des programmes en langage Java Comprendre le fonctionnement de la machine virtuelle S approprier

Plus en détail

GROUPE DE TRAVAIL «ARTICLE 29» SUR LA PROTECTION DES DONNÉES

GROUPE DE TRAVAIL «ARTICLE 29» SUR LA PROTECTION DES DONNÉES GROUPE DE TRAVAIL «ARTICLE 29» SUR LA PROTECTION DES DONNÉES 00727/12/FR WP 192 Avis 02/2012 sur la reconnaissance faciale dans le cadre des services en ligne et mobiles Adopté le 22 mars 2012 Le groupe

Plus en détail

IBM Tivoli Compliance Insight Manager

IBM Tivoli Compliance Insight Manager Simplifier les audits sur la sécurité et surveiller les activités des utilisateurs privilégiés au moyen d un tableau de bord permettant de contrôler la conformité aux exigences de sécurité IBM Points forts

Plus en détail

Formation. Module WEB 4.1. Support de cours

Formation. Module WEB 4.1. Support de cours Formation Module WEB 4.1 Support de cours Rédacteur Date de rédaction F.CHEA 08/02/2012 Les informations contenues dans ce document pourront faire l'objet de modifications sans préavis Sauf mention contraire,

Plus en détail

Guide du mémoire de fin d études

Guide du mémoire de fin d études Guide du mémoire de fin d études à destination des enseignants et des étudiants Septembre 2011 AVERTISSEMENT Ce document rassemble les dispositions réglementaires d une part, le cadre des dispositions

Plus en détail

basée sur le cours de Bertrand Legal, maître de conférences à l ENSEIRB www.enseirb.fr/~legal Olivier Augereau Formation UML

basée sur le cours de Bertrand Legal, maître de conférences à l ENSEIRB www.enseirb.fr/~legal Olivier Augereau Formation UML basée sur le cours de Bertrand Legal, maître de conférences à l ENSEIRB www.enseirb.fr/~legal Olivier Augereau Formation UML http://olivier-augereau.com Sommaire Introduction I) Les bases II) Les diagrammes

Plus en détail

Optimisez vos processus informatiques, maximisez le taux de rendement de vos actifs et améliorez les niveaux de service

Optimisez vos processus informatiques, maximisez le taux de rendement de vos actifs et améliorez les niveaux de service Solutions de gestion des actifs et services Au service de vos objectifs d entreprise Optimisez vos processus informatiques, maximisez le taux de rendement de vos actifs et améliorez les niveaux de service

Plus en détail

Prenez le PLM express

Prenez le PLM express BTS CIM (1) Prenez le PLM express BENOîT DONY [1] Les logiciels de PLM (Product Lifecycle Management) permettent la gestion des données techniques d un produit tout au long de son cycle de vie. Autrefois

Plus en détail

GESTION DE PROJET. www.ziggourat.com - Tél : 01 44 61 96 00 N enregistrement formation : 11752861675

GESTION DE PROJET. www.ziggourat.com - Tél : 01 44 61 96 00 N enregistrement formation : 11752861675 GESTION DE PROJET www.ziggourat.com - Tél : 01 44 61 96 00 N enregistrement formation : 11752861675 Introduction à la Gestion de Projet... 3 Management de Projet... 4 Gestion de Projet informatique...

Plus en détail

BTS MANAGEMENT DES UNITES COMMERCIALES GUIDE DU TUTEUR

BTS MANAGEMENT DES UNITES COMMERCIALES GUIDE DU TUTEUR BTS MANAGEMENT DES UNITES COMMERCIALES GUIDE DU TUTEUR Vous êtes tuteur d un étudiant en BTS management des unités commerciales. Ce guide vous est destiné : il facilite votre préparation de l arrivée du

Plus en détail

Bases de données Cours 1 : Généralités sur les bases de données

Bases de données Cours 1 : Généralités sur les bases de données Cours 1 : Généralités sur les bases de données POLYTECH Université d Aix-Marseille odile.papini@univ-amu.fr http://odile.papini.perso.esil.univmed.fr/sources/bd.html Plan du cours 1 1 Qu est ce qu une

Plus en détail

D une part, elles ne peuvent faire table rase de la richesse contenue dans leur système d information.

D une part, elles ne peuvent faire table rase de la richesse contenue dans leur système d information. PACBASE «Interrogez le passé, il répondra présent.». Le Module e-business Les entreprises doivent aujourd hui relever un triple défi. D une part, elles ne peuvent faire table rase de la richesse contenue

Plus en détail

Big data et sciences du Vivant L'exemple du séquençage haut débit

Big data et sciences du Vivant L'exemple du séquençage haut débit Big data et sciences du Vivant L'exemple du séquençage haut débit C. Gaspin, C. Hoede, C. Klopp, D. Laborie, J. Mariette, C. Noirot, MS. Trotard bioinfo@genopole.toulouse.inra.fr INRA - MIAT - Plate-forme

Plus en détail

WEB15 IBM Software for Business Process Management. un offre complète et modulaire. Alain DARMON consultant avant-vente BPM alain.darmon@fr.ibm.

WEB15 IBM Software for Business Process Management. un offre complète et modulaire. Alain DARMON consultant avant-vente BPM alain.darmon@fr.ibm. WEB15 IBM Software for Business Process Management un offre complète et modulaire Alain DARMON consultant avant-vente BPM alain.darmon@fr.ibm.com Claude Perrin ECM Client Technical Professional Manager

Plus en détail

UE 8 Systèmes d information de gestion Le programme

UE 8 Systèmes d information de gestion Le programme UE 8 Systèmes d information de gestion Le programme Légende : Modifications de l arrêté du 8 mars 2010 Suppressions de l arrêté du 8 mars 2010 Partie inchangée par rapport au programme antérieur Indications

Plus en détail

Sybase PowerAMC 16. Guide des nouvelles fonctionnalités générales. www.sybase.fr/poweramc DOCUMENTATION

Sybase PowerAMC 16. Guide des nouvelles fonctionnalités générales. www.sybase.fr/poweramc DOCUMENTATION Sybase PowerAMC 16 Guide des nouvelles fonctionnalités générales DOCUMENTATION 2 2 www.sybase.fr/poweramc A propos de PowerAMC 16 PowerAMC est une solution de modélisation d'entreprise graphique qui prend

Plus en détail

Bien programmer. en Java 7. 10 000 ex. couleur. Avec plus de 50 études de cas et des comparaisons avec C++ et C# Emmanuel Puybaret.

Bien programmer. en Java 7. 10 000 ex. couleur. Avec plus de 50 études de cas et des comparaisons avec C++ et C# Emmanuel Puybaret. Bien programmer en Java 7 Avec plus de 50 études de cas et des comparaisons avec C++ et C# Plus de 10 000 ex. vendus! Édition en couleur Emmanuel Puybaret, ISBN : 978-2-212-12974-8 chapitre1 Présentation

Plus en détail