Mise en place d une solution automatique de stockage et de visualisation de données de capture des interactions chromatiniennes à l échelle génomique

Dimension: px
Commencer à balayer dès la page:

Download "Mise en place d une solution automatique de stockage et de visualisation de données de capture des interactions chromatiniennes à l échelle génomique"

Transcription

1 Rapport de stage de deuxième année de DUT Génie Biologique option Bioinformatique Mise en place d une solution automatique de stockage et de visualisation de données de capture des interactions chromatiniennes à l échelle génomique Institut de Génétique Humaine CNRS UPR , Rue de la Cardonille Montpellier Equipe Chromatine et Biologie Cellulaire (Responsable : Giacomo Cavalli) Mylène SIMON 2 ème année de DUT Génie Biologique option Bioinformatique Université d Auvergne Institut Universitaire de Technologie de Clermont-Ferrand Site d Aurillac, Département Génie Biologique Année universitaire Stage effectué du 01 avril au 30 juillet 2010 et encadré par M. Aubin THOMAS (IE)

2

3 Remerciements Tout d abord, je tiens à remercier Giacomo CAVALLI, responsable du département «Dynamique du Génome» et de l équipe «Chromatine et Biologie Cellulaire» de l IGH, de m avoir donné l opportunité d effectuer mon stage au sein de l IGH et d avoir pris sur son temps pour m expliquer les sujets de recherche de l équipe. Je remercie Aubin THOMAS, ingénieur d étude de l équipe «Chromatine et Biologie Cellulaire», mon maître de stage, pour sa disponibilité de tous les instants, sa sympathie, toutes les connaissances qu il a partagées avec moi et l aide qu il m a apportée tout au long du stage et lors de la rédaction de ce rapport. Je tiens également à remercier tous les membres de l équipe «Chromatine et Biologie Cellulaire» pour leur accueil et les réponses qu ils ont pu fournir à mes questions concernant leurs sujets de recherche, et plus particulièrement Thomas SEXTON, chargé de projet 3C, pour son aide lors de la rédaction de ce rapport. Je remercie aussi l ensemble des personnes travaillant dans le bureau bioinformatique de l IGH, pour leur accueil et leur bonne humeur quotidienne. Enfin, je tiens à remercier Helmut MICHELS, spécialiste en informatique au Max Planck Institute et créateur de la librairie graphique Dislin, pour ses réponses rapides à mes s et pour n avoir pas hésité à modifier sa librairie pour résoudre mon problème.

4

5 Résumé Les recherches menées au sein du laboratoire «Chromatine et Biologie cellulaire» de l Institut de Génétique Humaine de Montpellier sont principalement consacrées à l étude des phénomènes épigénétiques. L épigénétique correspond aux changements héritables dans l expression des gènes qui ne sont pas dus à des modifications dans la séquence d ADN. Deux principaux groupes de protéines sont impliqués dans ces phénomènes : les protéines Polycomb (ou PcG), qui inhibent l expression des gènes, et les protéines trithorax (ou trxg), qui au contraire activent l expression des gènes. Dans le cadre de ces recherches, plusieurs techniques expérimentales sont utilisées, ce qui génère un grand nombre de données génomiques. Le projet CavGenTools a pour but de proposer un ensemble de services et d applications web permettant d intégrer et de visualiser l ensemble de ces données. C est dans ce contexte que les programmes SMIF et PMIF ont été développés. Le logiciel SMIF permet l enregistrement automatique des données d expériences de mesure d interactions chromatiniennes et de fixation de protéines sur l ADN. L application PMIF, quant à elle, permet de visualiser en ligne ces données sous la forme de graphiques personnalisables, de manière simple et rapide.

6

7 Abstract The research conducted in the "Chromatin and Cell Biology laboratory at the Institute of Human Genetics in Montpellier is mainly devoted to studying epigenetics phenomena. Epigenetics refers to heritable changes in the expression of genes that are not due to changes in DNA sequence. Two main groups of proteins are involved in these phenomena: the Polycomb proteins (or PcG), which inhibit the gene expression, and the trithorax proteins (or trxg), which instead activate gene expression. Through this research, several experimental techniques are used and produce a lot of genome-wide data. The aim of the CavGenTools project is to provide a set of web services and applications to integrate and visualize all these data. It is in this context that the programs SMIF and PMIF have been developed. The SMIF software permits the automatic storage of data from experiments measuring chromatin interactions and proteins binding profiles on DNA. The PMIF application allows swift and simple visualization of the data online in the form of customizable graphics.

8

9 Sommaire Introduction... 1 I) Contexte du stage... 2 I.1) La structure d accueil... 2 I.1.1.) Le CNRS... 2 I.1.2) L Institut de Génétique Humaine... 2 I.1.3) L équipe Chromatine et Biologie Cellulaire... 2 I.2) Le contexte biologique... 3 I.2.1) Les techniques utilisées pour l obtention des données : séquençage à haut débit et techniques expérimentales... 3 I.2.2) Le projet CavGenTools... 4 I.2.3) Evolution du sujet de stage... 5 II) Organisation du stage... 6 II.1) Gestion globale du projet... 6 II.1.1) Définition d un cahier des charges pour les programmes... 6 II.1.2) Utilisation d un gestionnaire de projet... 7 II.1.3) Suivi du projet... 8 II.2) Méthode de programmation... 8 II.2.1) Rappel sur les techniques de programmation... 8 II.2.2) Extreme programming et cycles de développement courts... 9 III) Choix techniques III.1) Stockage des données III.1.1) Choix d une solution de stockage III.1.2) Prétraitement des données III.1.3) Enregistrement des données III.2) Programme de visualisation PMIF III.2.1) Langage de programmation III.2.2) Structuration du programme III.2.2.1) Les patrons de conception III.2.2.2) MVC III.2.2.3) Stratégie III.2.3) Libraires utilisées III.2.3.1) Xerces III.2.3.2) MySQL III.2.3.3) Dislin IV) Résultats IV.1) Exemple d application du programme PMIF IV.1.1) Protéines du groupe Polycomb et du groupe trithorax IV.1.2) L utilisation de PMIF pour illustrer le lien entre les méthylations de l histone H3 et les protéines du PcG IV.2) Discussion Conclusion Bibliographie Table des sigles et des abréviations Glossaire Table des figures et des tableaux Annexes

10

11

12

13 Introduction La génétique* a montré que l expression des gènes* et donc le phénotype d un individu (c'est-à-dire les caractéristiques qui lui sont propres) dépendaient de l enchaînement des nucléotides* constituants la molécule d ADN*. Cependant, depuis quelques années, certains chercheurs ont découvert que des changements dans l expression des gènes pouvaient apparaître sans qu il y ait de modifications dans la séquence de l ADN. C est ce que l on appelle des processus d épigénétique. L équipe «Biologie Cellulaire et Chromatine» de l Institut de Génétique Humaine de Montpellier (CNRS-UPR 1142) s intéresse particulièrement à ces phénomènes. Pour cela, les chercheurs de cette équipe emploient différentes techniques expérimentales produisant un grand nombre de données qu il est nécessaire de stocker et de traiter pour en extraire les informations recherchées. C est au sein de cette équipe, sous la tutelle d Aubin THOMAS, ingénieur bioinformaticien, que j ai réalisé mon stage. Celui-ci a consisté en la mise en place d une solution automatique de stockage et de visualisation de certaines des données expérimentales de l équipe. Ce rapport présente le travail que j ai réalisé sur machine au cours de ces quatre mois de stage au sein de cet institut. Tout d abord, nous aborderons dans une première partie le contexte et le sujet du stage, pour ensuite nous intéresser à la manière dont le projet a été conduit, tant au niveau de la gestion du temps que de la méthode de programmation. Une troisième partie sera consacrée à la description et à la justification des différents choix techniques qui ont été faits tout au long du stage. Enfin, nous nous pencherons dans une dernière partie sur les résultats obtenus. 1

14 Figure 1 : Organigramme de l'équipe "Chromatine et Biologie Cellulaire" Source : Adaptation de l'organigramme réalisé par Anna DELEST (membre de l'équipe)

15 I) Contexte du stage I.1) La structure d accueil I.1.1.) Le CNRS Le Centre National de la Recherche Scientifique, ou CNRS [5], a été créé le 19 octobre C est un organisme public français de recherche scientifique placé sous la tutelle du Ministère de l Enseignement supérieur et de la Recherche. Il est classé comme établissement public à caractère scientifique et technologique et est le principal organisme de recherche pluridisciplinaire en France. La recherche au sein du CNRS s étend à l ensemble des domaines scientifiques, technologiques et sociétaux, couvrant ainsi la totalité des champs scientifiques (mathématiques, chimie, physique nucléaire, sciences du vivant, sciences humaines et sociales, sciences de la planète et de l Univers, etc.). I.1.2) L Institut de Génétique Humaine L Institut de Génétique Humaine, ou IGH [6], est une unité propre de recherche du CNRS (UPR 1142) située à Montpellier et dirigée par Alain BUCHETON. L'objectif de l'igh est de mener des recherches fondamentales de haut niveau et de lier ces recherches à l étude des pathologies, afin de mieux comprendre, diagnostiquer et traiter certaines pathologies humaines. Les trois départements scientifiques de l'igh, correspondants aux trois principaux axes de recherches sont : le département «Dynamique du Génome» (responsable : Giacomo CAVALLI), le département «Génétique et Développement» (responsable : Martine SIMONELIG), et le département «Pathologies Moléculaires et Cellulaires» (responsable : Sylvain LEHMANN). I.1.3) L équipe Chromatine et Biologie Cellulaire L équipe «Chromatine et Biologie Cellulaire» fait partie des dix équipes de recherche du département «Dynamique du Génome» et est dirigée par Giacomo 2

16 Figure 2 : HiSeq 2000, le séquenceur utilisé par le laboratoire Source :

17 CAVALLI, le responsable de ce département (voir figure 1). Les recherches menées au sein de cette équipe concernent principalement les phénomènes d épigénétique [7], c està-dire les processus d hérédité réversibles qui ne sont pas fondés sur des changements dans la séquence d ADN. Les chercheurs s intéressent plus particulièrement à deux groupes de protéines, Polycomb (PcG) et trithorax (trxg). Les protéines du PcG inhibent ou répriment l expression des gènes du développement dès le stade embryonnaire, tandis que celles du trxg les accentuent. Le but de ces recherches est de comprendre comment ces deux groupes de protéines mettent en place l équilibre du réseau d expression des gènes dès les premiers stades de l embryon, en étudiant les mécanismes moléculaires impliqués dans ces processus. Pour cela, l équipe utilise différentes techniques et approches relevant de la biologie cellulaire, moléculaire et du développement, ainsi que de la génomique et de la bioinformatique. Cette équipe est composée de chercheurs, ingénieurs d études, doctorants, post-doctorants, étudiants et stagiaires et est «internationale», puisque sur les dix-sept personnes actuellement présentes, huit sont des scientifiques étrangers. I.2) Le contexte biologique I.2.1) Les techniques utilisées pour l obtention des données : séquençage à haut débit et techniques expérimentales Le séquençage à haut débit [8] est une technique permettant de connaître la composition en nucléotides du matériel génétique étudié, et cela par une analyse massive de courts fragments d ADN de 36, 72 ou 108 nucléotides* (technologie Illumina [9], voir figure 2 et annexe 1). Ces fragments (ou oligonucléotides) séquencés sont ensuite alignés sur un génome* de référence, afin de connaître la localisation physique du matériel génétique étudié. Les principales techniques expérimentales utilisées par l équipe sont : La 3C [10] : La technique de 3C permet de capturer de part et d autre les régions interagissant entre elles sur un même chromosome* ou entre plusieurs chromosomes. Une première étape consiste en la capture des sites de liaison entre chromosomes, et la deuxième étape de séquençage et d alignement permet de déterminer les positions de part et d autre des interactions (voir annexe 2). 3

18

19 La ChIP-Seq [11] : Les méthodes de ChIP-Seq permettent d étudier les sites de fixation de protéines sur l ADN. La première étape de ChIP capture les séquences ADN liées à ces protéines par immuno-précipitation de la chromatine. L étape de séquençage et d alignement permet de connaître les sites de fixation et leurs proportions (voir annexe 3). La ChIP-on-chip [12] : Cette technique permet de déterminer la localisation de protéines d intérêt et correspond à une immuno-précipitation de la chromatine (ou ChIP) dont les fragments obtenus sont analysés sur une puce ADN (voir annexe 4). Le RNA-seq [13], ou «WTSS» pour Whole Transcriptome Shotgun Sequencing : Cette technique permet de mesurer le niveau d expression des gènes en analysant la population totale des transcrits exprimés dans un type cellulaire donné grâce au séquençage à très haut débit. I.2.2) Le projet CavGenTools L équipe «Chromatine et Biologie cellulaire» produit et étudie un grand nombre de données de différentes natures. Les trois principaux types de données sont : Les données de mesures d interactions chromatiniennes dans le noyau : elles sont obtenues grâce à la technique de 3C. Les données de localisations des protéines régulatrices des différents mécanismes étudiées par l équipe : elles sont obtenues grâces à des techniques d immuno-précipitation telles que la ChIP-on-chip et la ChIP-seq, Ces deux techniques permettent d étudier des protéines interagissant avec l ADN. Les données de niveaux d expression des gènes dans différents tissus et différentes conditions : elles sont obtenues grâce à des techniques de puces à ADN [14] et de RNA-seq, ou «WTSS» pour Whole Transcriptome Shotgun Sequencing. Le projet CavGenTools est issu du désir de l équipe «Chromatine et Biologie Cellulaire» de proposer un ensemble de services et d applications web permettant de visualiser l ensemble des données qu elle génère et étudie. Actuellement, une 4

20

21 application web permettant de visualiser les données obtenues par la ChIP-on-chip (localisations des protéines régulatrices sur l ADN) est disponible. A terme, le but est de mettre en place la visualisation des autres types de données (3C, ChIP-seq, puces à ADN et RNA-seq) par un ensemble de webservices*. I.2.3) Evolution du sujet de stage A l origine, le sujet de stage a été formulé de cette manière : «Mise en place d une solution automatique de stockage et de visualisation de données de capture des interactions chromatiniennes à l échelle génomique.» Le stage s inscrivait dans la mise en place de la partie 3C du projet CavGenTools. Deux grandes étapes se dégagent de ce sujet : La création d un programme permettant un enregistrement automatisé et facilité des données de 3C et des informations liées à ces données (telles que l organisme, le tissu, les conditions, le type de données, ) dans la base de données déjà disponible. Cela implique également de définir des règles d enregistrement pour ce programme (paramètres obligatoires, fichiers de configuration à remplir par l utilisateur, gestion des erreurs par le programme, etc.). La création d un programme permettant la visualisation des données de 3C sous la forme de graphiques, dont le fond et la forme dépendent des choix de l utilisateur du programme. Pour cela, il est nécessaire de déterminer, en concertation avec les biologistes impliqués dans le projet, de quelle manière les données à visualiser seront choisies par les utilisateurs et quels sont les types de visualisation à proposer. Au vu de l avancement rapide du projet, il a été convenu que je réalise également deux programmes similaires à ceux conçus pour les données de 3C, adaptés pour permettre l enregistrement et la visualisation des données de ChIP-seq. Deux ensembles de programmes ont donc été créés : SMIF, qui permet l enregistrement des données de 3C et de ChIP-Seq, et PMIF, qui permet la visualisation des données de 3C et de ChIP-Seq. 5

22

23 II) Organisation du stage II.1) Gestion globale du projet II.1.1) Définition d un cahier des charges pour les programmes Les programmes développés au cours du stage ont pour but de répondre à un besoin des chercheurs de l équipe et de certains biologistes de pouvoir visualiser les données générées et étudiées dans le laboratoire, de manière simple et accessible de n importe quel ordinateur relié à internet. Cela implique de prendre en compte les préférences des chercheurs de l équipe ainsi que certaines contraintes, et de bien définir celles-ci avant de commencer à développer les programmes. Ces différents aspects ont été discutés avec les principales personnes impliquées dans le projet, c'est-à-dire Aubin THOMAS, mon maître de stage, Thomas SEXTON, le chargé de projet 3C, et Giacomo CAVALLI, le responsable de l équipe. Pour cela, des réunions ont été organisées, au cours desquelles j ai pu présenter de manière argumentée les différents choix faits pour le développement du programme. Les personnes impliquées dans le projet ont ainsi pu connaître et comprendre ces choix, les valider la plupart du temps mais également remettre en cause ceux qui ne leur convenaient pas. Cette démarche a permis de définir un cadre pour le développement du programme, et de fixer les objectifs à atteindre, en prenant en compte les besoins et préférences des biologistes ainsi que les contraintes techniques. Ces discussions ont conduit à l'élaboration d un cahier des charges pour chaque programme, rédigés par mes soins en collaboration avec Aubin THOMAS. Ces documents développent les points suivants : L objectif général du programme Les contraintes techniques à prendre en compte Le cadre du programme o Les paramètres obligatoires passés en arguments du programme o Les fichiers de configuration à remplir par l utilisateur o La gestion des erreurs Un échéancier des résultats et un planning des futures réunions Pour le programme d enregistrement des données SMIF : o Le format du fichier contenant les données à enregistrer 6

24 Figure 3 : Copie d'écran du gestionnaire de projet Source :

25 o Le support d enregistrement des données o La structuration des données o Les vérifications permettant de ne pas enregistrer deux fois la même série de données o Les champs obligatoires et facultatifs dans les fichiers de configuration à remplir par l utilisateur Pour le programme de visualisation des données PMIF : o Les différents types de visualisation des données (voir annexe 5) o La récupération des données à visualiser o Les différentes techniques statistiques utilisées pour la génération des graphiques o Les formats et tailles d images proposés à l utilisateur o Les couleurs utilisées II.1.2) Utilisation d un gestionnaire de projet Pour faciliter la planification et la gestion du travail et permettre une meilleure visibilité de l avancement du projet pour les personnes y étant impliquées, une application web de gestion de projet, adaptée du programme Redmine [15], a été utilisée. Ce logiciel a pour particularité d être conçu pour la gestion de projets scientifiques en laboratoire. Il permet de gérer simultanément plusieurs projets, pouvant contenir euxmêmes plusieurs sous projets. Le gestionnaire de projet offre la possibilité de créer des tâches de différentes natures («à faire», bug, demande d informations, bibliographie, installation, etc.), de les affecter à un utilisateur et de pouvoir suivre leur évolution. Il est également possible de déposer des documents, classés par catégories (documentation technique, manuel d utilisation, code, résultats, ), de publier des annonces, de participer à un forum de discussion et de créer des pages wiki*. A chaque étape du stage, des tâches détaillées ont été créées permettant de définir des objectifs concrets à court terme correspondants aux différentes étapes du développement des programmes (voir figure 3). Pour chaque tâche réalisée, un rapport décrivant le travail effectué et les résultats obtenus est disponible dans le gestionnaire de tâches. Des exemples des graphiques obtenus ont également été déposés régulièrement, afin de permettre aux chercheurs de visualiser les résultats obtenus et l avancement du projet de manière plus concrète. 7

26

27 II.1.3) Suivi du projet Le gestionnaire de projet en ligne a permis de faciliter le suivi du projet, car le suivi de la réalisation des tâches y est aisé, grâce à l ajout possible de documents, de commentaires et de nouvelles demandes. De plus, tout au long du stage, des réunions hebdomadaires ont été faites avec mon maître de stage, Aubin THOMAS, me permettant de lui présenter mon avancement dans le projet, pour qu il puisse vérifier mes travaux et les corriger si nécessaire, et nous permettant de discuter de certains aspects techniques et du déroulement de la suite du stage, en définissant de nouveaux objectifs pour la semaine suivante. Des réunions moins formelles et de plus courte durée ont également eu lieu régulièrement en cas de besoin d explications ou de précisions complémentaires. Enfin, les besoins des biologistes étant en constante évolution, des réunions ont été tenues à certaines étapes clés du stage, permettant de présenter l avancement du projet et les résultats obtenus, et ainsi de discuter des préférences des biologistes et, si besoin, de mettre à jour le cahier des charges. Ces réunions se faisaient en présence du responsable de l équipe Giacomo CAVALLI, du chargé de projet 3C Thomas SEXTON, de mon maître de stage Aubin THOMAS, de moi-même, et parfois également du chargé de bio-analyse de domaines chromatiniens Benjamin LEBLANC. II.2) Méthode de programmation Afin de développer les programmes de manière plus efficace et pour qu ils soient plus faciles à modifier, il a été décidé de respecter une méthode de programmation* fréquemment utilisée par les développeurs* de logiciels, l extreme programming [16]. II.2.1) Rappel sur les techniques de programmation Les techniques de programmation correspondent à des méthodologies qui ont été conçues par des professionnels de l informatique pour le développement de logiciels. 8

28 Tableau I : Détails des cycles de programmation des applications SMIF et PMIF Source personnelle Cycle Tâche Détail Période - Prétraitement des données Développement de la - Analyse de la structure de la base de partie enregistrement données 02/04/10-1 automatique des - Choix du langage et des librairies 10/05/10 données de 3C du utilisés programme SMIF -Programmation + tests Développement du type de visualisation 0 (type test) pour les données de 3C du programme PMIF Développement du type de visualisation 1 pour les données de 3C du programme PMIF Développement du type de visualisation 2 pour les données de 3C du programme PMIF Développement du type de visualisation 3 pour les données de 3C du programme PMIF Développement de la partie enregistrement automatique des données de 3C du programme SMIF Développement des types de visualisation 0 (type test), 1 et 2 pour les données de ChIP-Seq du programme PMIF Intégration du programme PMIF sur le serveur de l équipe - Conception de la structure du programme (définition des classes, utilisation des patrons de conception, ) - Définition du type 0 (résultats sous la forme d un fichier texte) - Programmation + tests - Définition du type 1 (graphique simple de type XY, une seule couleur) - Choix de la librairie graphique - Programmation + tests - Définition du type 2 (graphique simple de type XY, plusieurs couleurs) - Choix de la palette de couleur - Programmation + tests - Définition du type 3 (graphique de type histogramme) - Programmation + tests - Ajout de nouvelles tables dans la base de données - Programmation (adaptation de la partie développée pour les données de 3C) + tests - Définition du type 1 (graphique de type profile, deux couleurs) - Définition du type 2 (graphique de type profile, trois couleurs) - Choix de la palette de couleur - Programmation (adaptation de la partie développée pour les données de 3C) + tests - Installation des librairies sur le serveur - Création de la nouvelle commande de compilation 10/05/10-14/05/10 10/05/10-26/05/10 27/05/10-09/06/10 10/06/10-16/06/10 10/06/10-12/06/10 10/06/10-07/07/10 08/07/10-16/07/10

29 Elles représentent pour les programmeurs un modèle utilisé pour structurer, planifier et contrôler le processus de développement d un logiciel. II.2.2) Extreme programming et cycles de développement courts L extreme programming est «une méthode agile de gestion de projet informatique adaptée aux équipes réduites avec des besoins changeants» [16]. Cela signifie que c est une méthode de développement de logiciel où le client (ici le biologiste) est impliqué au maximum, ce qui permet d être très réactif à ses demandes et ainsi d obtenir de sa part une réelle satisfaction vis-à-vis du produit créé. Cela implique l application de principes simples poussés à l extrême et impose une véritable discipline et une rigueur dans la programmation. L extreme programming repose sur des cycles de développement courts (quelques semaines) permettant de développer le logiciel par étapes, en commençant par la partie la plus basique et en rajoutant au fur et à mesure de nouvelles fonctionnalités. Chaque cycle comporte quatre grandes étapes : une phase d exploration qui détermine quelles fonctionnalités seront développées durant ce cycle, une phase de conversion du travail à effectuer en tâches précises et concrètes et de définition des tests à effectuer, une phase de développement et des tests, et une phase de présentation du produit au client. L un des aspects importants de cette technique est le travail en binôme : une personne travaille sur le code* à écrire, et une autre lui suggère de nouvelles possibilités et tente de déceler les éventuelles erreurs. Cette technique a été suivie durant la conception des programmes SMIF et PMIF, car elle permet de développer les programmes par étapes, en garantissant la stabilité et la validation du programme à la fin de chacune d entre elles. Elle permet également de garder une certaine flexibilité, ce qui assure une meilleure réactivité en cas de changements à apporter. Ainsi, les programmes ont été développés en respectant le rythme de cycles de développement de quelques semaines (voir tableau I). A chaque cycle correspondait un objectif précis à atteindre défini au début du cycle. Chacun de ces cycles comportait une phase de développement de la nouvelle fonctionnalité, une 9

30 Figure 4 : Schéma simplifié de la base de données Source personnelle

31 phase de tests et une phase de rédaction de rapport de programmation. Une fois l objectif atteint et les résultats validés par les personnes impliquées dans le projet, un nouvel objectif était défini, démarrant ainsi un nouveau cycle de développement. Plusieurs cycles ont également été effectués en parallèle, lorsque leurs réalisations n étaient pas dépendantes. III) Choix techniques III.1) Stockage des données III.1.1) Choix d une solution de stockage Les données expérimentales obtenues grâce aux technologies 3C et ChIP-Seq sont d abord stockées sous la forme de fichiers texte. Bien que ces fichiers respectent une organisation et une certaine mise en forme, ce mode de stockage n est pas pratique. En effet, il ne permet pas les croisements entre les données et l usage multi-utilisateurs (l utilisation des données par plusieurs utilisateurs simultanément). De plus, il n est pas possible de sélectionner de manière simple et rapide des données d intérêt se trouvant parmi toutes les autres. Il existe pour cela une solution de stockage plus structurée et qui permet de manipuler les données beaucoup plus facilement : les bases de données [17] (voir annexe 6 et figure 4). Une base de données est un dispositif informatique permettant de stocker des données de manière structurée et adaptée à l usage que l on souhaite en faire. Les données sont enregistrées dans des «tables», qui sont les équivalents de tableaux ayant chacun une structure propre. Ce type de structuration des données permet de d effectuer des requêtes*, dans le but de sélectionner certaines données en appliquant des filtres. Par exemple, dans le cas des données de l équipe, il est possible de ne sélectionner que les données qui correspondent à un domaine sur un chromosome précis, ou à une expérience particulière, etc. L un des avantages importants d une base de données est qu elle peut être «répartie», c'est-à-dire enregistrée sur une machine distante (par exemple un serveur*) et accessible par réseau*. 10

32 Tableau II : Exemple d application du programme de pré-traitement des données (les deux extraits ont été choisis aléatoirement dans les fichiers) Avant, à chaque ligne du fichier : o Des informations concernant l expérience o Le nom du premier chromosome impliqué dans l interaction o La position de l interaction sur ce premier chromosome o Le brin (sens (+) ou antisens (-)) de ce premier chromosome impliqué dans l interaction o Le nom du deuxième chromosome impliqué dans l interaction o o La position de l interaction sur ce deuxième chromosome Le brin (sens (+) ou antisens (-)) de ce deuxième chromosome impliqué dans l interaction Après, à chaque ligne du fichier : o Le nom du premier chromosome impliqué dans les interactions o La position de la région sur ce premier chromosome impliquée dans les interactions o Le nom du deuxième chromosome impliqué dans les interactions o La position de la région sur ce deuxième chromosome impliquée dans les interactions o Le nombre d interactions retrouvées entre ces deux régions Source personnelle Etat Avant prétraitement Après prétraitement Extraits des fichiers HWI-EAS387_0001:3:62:60:946#0 3L L 84 + HWI-EAS387_0001:3:47:1346:307#0 3L L HWI-EAS387_0001:3:38:94:557#0 3R L HWI-EAS387_0001:3:26:294:133#0 X L HWI-EAS387_0001:3:75:1479:437#0 3L L HWI-EAS387_0001:3:10:1016:1810#0 3R L HWI-EAS387_0001:3:44:1069:452#0 3L L HWI-EAS387_0001:3:58:581:904#0 3L L HWI-EAS387_0001:3:29:271:806#0 3L 508-2L HWI-EAS387_0001:3:58:1550:17#0 3L L L L L L L L L L L L L L L L L L L L L L

33 Pour utiliser et gérer des bases de données, il est nécessaire d utiliser un logiciel appelé SGBD pour Système de Gestion de Bases de Données. Il existe de nombreux logiciels de ce type, les plus connus étant Microsoft Access, Microsoft SQL server, Oracle, MySQL [18] ou encore PostgreSQL. Chacun de ces logiciels possède des avantages et des inconvénients, ainsi que des caractéristiques techniques particulières (telles que la compatibilité avec le système d exploitation* de la machine) qui sont à prendre en considération lors du choix du SGBD qui va être utilisé. Pour la base de données devant contenir les données expérimentales de l équipe, nous avons opté pour le logiciel MySQL. En effet, celui-ci est compatible avec les systèmes d exploitation Unix* présents sur les serveurs utilisés par l équipe, est performant et stable et présente l avantage d être gratuit. III.1.2) Prétraitement des données Les données expérimentales obtenues grâce à la technologie 3C, qui correspondent à des données d interactions chromosomiques, sont enregistrées sous forme de fichiers texte au format suivant : à chaque ligne correspond une interaction, celle-ci étant représentée par ses positions sur les deux chromosomes impliqués dans l interaction, et des informations complémentaires. Il a été décidé de traiter ces données avant de les enregistrer dans la base de données, afin de ne conserver de réduire le volume des données et de ne conserver que celles étant nécessaires pour la visualisation. Pour cela, un programme a été créé, permettant d organiser les données en «fenêtres» de 1000 pb et supprimer les informations non indispensables. Cette taille de 1000 pb a été choisie car les fragments capturés pour être séquencés faisaient de 400 à 800 pb de long. Pour chaque position d interaction, la marge est donc de 800 pb maximum, ce qui signifie que la position est sûre à 800 pb près. Le nouveau fichier texte créé par ce programme contient, à chaque ligne, un couple fenêtre 1/fenêtre 2 et le nombre d interactions entre les régions représentées par ces deux fenêtres (voir tableau II). Ce programme a été créé en langage Perl [19], car ce langage permet de créer des applications traitant efficacement des fichiers texte de manière relativement simple et rapide. Les données expérimentales obtenues grâce à la technologie ChIP-Seq, quant à elles, sont issues d expériences visant à mesurer la fixation de protéines sur les 11

34

35 chromosomes. L échantillonnage des valeurs est d une fréquence de 10 pb et, comme les fragments séquencés ont une taille de 200 pb, la précision est de 200 pb. Ces données sont également stockées sous la forme de fichiers texte. Chaque fichier correspond à une expérience précise (mesure de la fixation d une protéine particulière sur un groupe d individus) et, à chaque ligne correspond une valeur obtenue à une position particulière d un chromosome. Malgré le volume important de ces données expérimentales, il a été décidé de ne pas les réorganiser en «fenêtres» comme cela a été le cas pour les données obtenues grâce à la technologie 3C. En effet, l un des principaux avantages de la technologie ChIP-Seq est de générer des données précises, et il est important de garder cette précision pour obtenir une visualisation la plus juste possible. III.1.3) Enregistrement des données En raison du volume important de données expérimentales à enregistrer dans la base de données, il n était pas envisageable de les insérer une par une manuellement. Il a donc été nécessaire de créer une solution automatique d enregistrement des données, le programme SMIF. Après concertation avec mon maître de stage, Aubin THOMAS, c est également le langage Perl qui a été choisi pour réaliser ce logiciel d enregistrement automatique dans la base de données. En effet, comme dit précédemment, ce langage permet de créer des programmes qui traitent efficacement et rapidement les fichiers, et il existe une librairie* spécialisée, DBI [20], qui permet d assurer la communication entre un programme Perl et une base de données MySQL. Cette librairie contient toute une série de fonctions* permettant de se connecter à la base de données, d insérer des données, d effectuer des requêtes de sélections, etc. Une autre librairie, appelée YAML [21], a également été utilisée pour lire les fichiers de type YAML [22] (voir annexe 7), qui contenaient les informations relatives à chaque lot de données insérées dans la base de données (ces informations étant également enregistrées dans la base de données et reliées aux données expérimentales). 12

36

37 III.2) Programme de visualisation PMIF III.2.1) Langage de programmation Il fallait choisir un langage de programmation pour le programme de visualisation PMIF qui possède les avantages suivants : rapidité d exécution : le programme devant s intégrer dans un jeu de webservices accessibles par Internet, il est nécessaire qu il s exécute rapidement pour ne pas entraîner trop d attente pour les utilisateurs, consommation de mémoire* minimisée : le volume des données à traiter étant très important, les calculs à effectuer le sont également, ce qui peut entraîner une consommation d espace mémoire critique (une consommation de mémoire supérieure à l espace disponible engendre des problèmes lors de l exécution du programme), langage orienté objet : afin de faciliter la programmation et la reprise du code, le langage doit être orienté objet pour permettre la création de classes* et d objets* (voir annexe 8), un nombre important de librairies compatibles avec le langage : le programme doit traiter des fichiers de type XML [23] [24] et YAML, interagir avec des bases de données, générer des graphiques, il est donc utile d utiliser des librairies riches permettant de ne pas réécrire certaines fonctions déjà existantes. De plus, il était nécessaire d opter pour un langage connu et maîtrisé par mon maître de stage, Aubin THOMAS, car c est lui qui assurera la maintenance et les mises à jour du programme après la fin du stage. Au vu de tous ces critères, il a été convenu d utiliser le langage C++ [1] [25] pour l écriture du programme, un langage compilé* rapide et performant, qui permet la programmation orientée objet et pour lequel de nombreuses librairies ont été développées. III.2.2) Structuration du programme Afin de faciliter la maintenance et la reprise du code par un autre programmeur, nous avons choisi de structurer le programme en suivant des modèles de structuration de code appelés patrons de conception [26]. 13

38 Figure 5 : Schéma simplifié du modèle MVC Source :

Atelier 5/11/2013. Structure de la chromatine et marques épigénétiques

Atelier 5/11/2013. Structure de la chromatine et marques épigénétiques Atelier 5/11/2013 Structure de la chromatine et marques épigénétiques La chromatine ADN ADN + Histones = Nucleosome ADN + Protéines + ARNs = Chromatine Niveau extrême de condensation = Chromosome métaphasique

Plus en détail

Cahier des charges. Jonathan HAEHNEL. Université de Strasbourg IUT Robert Schuman

Cahier des charges. Jonathan HAEHNEL. Université de Strasbourg IUT Robert Schuman Université de Strasbourg IUT Robert Schuman Maître de stage : Nicolas Lachiche Tuteur universitaire : Marie-Paule Muller Cahier des charges Jonathan HAEHNEL Strasbourg, le 6 mai 2011 Table des matières

Plus en détail

Influence du nombre de réplicats dans une analyse différentielle de données RNAseq

Influence du nombre de réplicats dans une analyse différentielle de données RNAseq Influence du nombre de réplicats dans une analyse différentielle de données RNAseq Statisticiens: Sophie Lamarre Steve Van Ginkel Sébastien Déjean - Magali San Cristobal Matthieu Vignes Biologistes: Stéphane

Plus en détail

Université Bordeaux Segalen - PACES 2012-2013 ED UE9s Avril 2013

Université Bordeaux Segalen - PACES 2012-2013 ED UE9s Avril 2013 Sélectionner les propositions exactes Université Bordeaux Segalen - PACES 2012-2013 ED UE9s Avril 2013 QCM 1 La plupart des techniques de biologie moléculaire repose sur le principe de complémentarité

Plus en détail

Séquençage. Bérénice Batut, berenice.batut@udamail.fr. DUT Génie Biologique Option Bioinformatique Année 2014-2015

Séquençage. Bérénice Batut, berenice.batut@udamail.fr. DUT Génie Biologique Option Bioinformatique Année 2014-2015 Séquençage Bérénice Batut, berenice.batut@udamail.fr DUT Génie Biologique Option Bioinformatique Année 2014-2015 Séquençage Séquençage ADN Détermination de l ordre d enchainement des nucléotides d un fragment

Plus en détail

Présentation du module Base de données spatio-temporelles

Présentation du module Base de données spatio-temporelles Présentation du module Base de données spatio-temporelles S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Partie 1 : Notion de bases de données (12,5h ) Enjeux et principes

Plus en détail

Conception assistée par ordinateur de molécules thérapeutiques

Conception assistée par ordinateur de molécules thérapeutiques Conception assistée par ordinateur de molécules thérapeutiques D. Gilis Bioinformatique génomique et structurale Faculté des sciences appliquées Université Libre de Bruxelles Objectif: illustrer en quoi

Plus en détail

Introduction aux bases de données: application en biologie

Introduction aux bases de données: application en biologie Introduction aux bases de données: application en biologie D. Puthier 1 1 ERM206/Technologies Avancées pour le Génome et la Clinique, http://tagc.univ-mrs.fr/staff/puthier, puthier@tagc.univ-mrs.fr ESIL,

Plus en détail

Obtention de données génétiques à grande échelle

Obtention de données génétiques à grande échelle Obtention de données génétiques à grande échelle Stéphanie FERREIRA Ph.D. Campus de l Institut Pasteur de Lille 1, rue du Professeur Calmette 59000 LILLE Tel : 03 20 87 71 53 Fax : 03 20 87 72 64 contact@genoscreen.fr

Plus en détail

Outils de gestion des ressources biologiques

Outils de gestion des ressources biologiques Le Cahier des Techniques de l INRA 2015 (84) N 1 Outils de gestion des ressources biologiques Frédéric Sanchez 1 *, Tou Cheu Xiong 1 Résumé. Les recherches en biologie génèrent un grand nombre d échantillons

Plus en détail

Lier un site de liaison d'un facteur de transcription et son gène cible

Lier un site de liaison d'un facteur de transcription et son gène cible Berder 2013 : Corrélation, causalité et régulation en biologie Lier un site de liaison d'un facteur de transcription et son gène cible Laurent M. SACHS (sachs@mnhn.fr) Laboratoire Evolution des Régulations

Plus en détail

Créer le schéma relationnel d une base de données ACCESS

Créer le schéma relationnel d une base de données ACCESS Utilisation du SGBD ACCESS Polycopié réalisé par Chihab Hanachi et Jean-Marc Thévenin Créer le schéma relationnel d une base de données ACCESS GENERALITES SUR ACCESS... 1 A PROPOS DE L UTILISATION D ACCESS...

Plus en détail

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation Base de données S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Présentation du module Contenu général Notion de bases de données Fondements / Conception Utilisation :

Plus en détail

CHAPITRE 3 LA SYNTHESE DES PROTEINES

CHAPITRE 3 LA SYNTHESE DES PROTEINES CHAITRE 3 LA SYNTHESE DES ROTEINES On sait qu un gène détient dans sa séquence nucléotidique, l information permettant la synthèse d un polypeptide. Ce dernier caractérisé par sa séquence d acides aminés

Plus en détail

Master CCI. Compétences Complémentaires en Informatique. Livret de l étudiant

Master CCI. Compétences Complémentaires en Informatique. Livret de l étudiant Master CCI Compétences Complémentaires en Informatique Livret de l étudiant 2014 2015 Master CCI Le Master CCI (Compétences Complémentaires en Informatique) permet à des étudiants de niveau M1 ou M2 dans

Plus en détail

IBM Tivoli Monitoring, version 6.1

IBM Tivoli Monitoring, version 6.1 Superviser et administrer à partir d une unique console l ensemble de vos ressources, plates-formes et applications. IBM Tivoli Monitoring, version 6.1 Points forts! Surveillez de façon proactive les éléments

Plus en détail

Le séquençage haut-débit

Le séquençage haut-débit Nouveaux outils en biologie Le séquençage haut-débit DES d hématologie 16 janvier 2015 Paris Alice Marceau-Renaut Laboratoire d hématologie CHRU Lille NGS = Next-Generation Sequencing Whole-genome Whole-exome

Plus en détail

Cours Base de données relationnelles. M. Boughanem, IUP STRI

Cours Base de données relationnelles. M. Boughanem, IUP STRI Cours Base de données relationnelles 1 Plan 1. Notions de base 2. Modèle relationnel 3. SQL 2 Notions de base (1) Définition intuitive : une base de données est un ensemble d informations, (fichiers),

Plus en détail

Architecture Logicielle

Architecture Logicielle Architecture Logicielle Chapitre 3: UML pour la description et la documentation d une architecture logicielle Année universitaire 2013/2014 Semestre 1 Rappel L architecture d un programme ou d un système

Plus en détail

[Résumé: Intégration d un contrôle automatisé dans une station de test électrique]

[Résumé: Intégration d un contrôle automatisé dans une station de test électrique] SEPTEMBRE 2013 INSA de Strasbourg Génie électrique : Option énergie Par : Adnane BOUKHEFFA Tuteur Institutionnel : M. Guy STURTZER Réalisé au sein du Groupe Legrand 290 Avenue de Colmar, Strasbourg 67100

Plus en détail

IBM Tivoli Monitoring

IBM Tivoli Monitoring Surveiller et gérer les ressources vitales et les mesures sur diverses plates-formes à partir d une seule console IBM Tivoli Monitoring Points forts Surveille de manière proactive Aide à réduire les coûts

Plus en détail

Projet 2. Gestion des services enseignants CENTRE D ENSEIGNEMENT ET DE RECHERCHE EN INFORMATIQUE. G r o u p e :

Projet 2. Gestion des services enseignants CENTRE D ENSEIGNEMENT ET DE RECHERCHE EN INFORMATIQUE. G r o u p e : CENTRE D ENSEIGNEMENT ET DE RECHERCHE EN INFORMATIQUE Projet 2 Gestion des services enseignants G r o u p e : B E L G H I T Y a s m i n e S A N C H E Z - D U B R O N T Y u r i f e r M O N T A Z E R S i

Plus en détail

Etude de la lysine acetyl transferase PCAF dans le développement du diabète et de l'obésité.

Etude de la lysine acetyl transferase PCAF dans le développement du diabète et de l'obésité. Etude de la lysine acetyl transferase PCAF dans le développement du diabète et de l'obésité. Tuteur : Jean-Sébastien Annicotte EGID CNRS UMR8199 Faculté de Médecine-Pôle Recherche, 2eme étage Bd J. Leclercq

Plus en détail

Génotypage et Séquençage. Pierre Mournet

Génotypage et Séquençage. Pierre Mournet Génotypage et Séquençage Pierre Mournet Plan Séquençage/Génotypage Classique (usat, Sanger) Séquençage NGS (Next Generation Sequencing) Séquenceur Préparation Pré-NGS Exemple 1 NGS Exemple 2 NGS Génotypage

Plus en détail

KIELA CONSULTING. Microsoft Office Open Office Windows - Internet. Formation sur mesure

KIELA CONSULTING. Microsoft Office Open Office Windows - Internet. Formation sur mesure KIELA CONSULTING Microsoft Office Open Office Windows - Internet Formation sur mesure Bureautique L outil informatique et la bureautique sont devenus quasiment incontournables quelque soit votre métier

Plus en détail

LIVRE BLANC Pratiques recommandées pour l utilisation de Diskeeper sur les réseaux SAN (Storage Area Networks)

LIVRE BLANC Pratiques recommandées pour l utilisation de Diskeeper sur les réseaux SAN (Storage Area Networks) LIVRE BLANC Pratiques recommandées pour l utilisation de Diskeeper sur les réseaux SAN (Storage Area Networks) Think Faster. [Pensez plus vite] Visitez Condusiv.com RECOMMANDATIONS D UTILISATION DE DISKEEPER

Plus en détail

Marc DELPECH. CORATA La Rochelle le 21 mai 2008

Marc DELPECH. CORATA La Rochelle le 21 mai 2008 Marc DELPECH CORATA La Rochelle le 21 mai 2008 En 24 ans les progrès ont été considérables Premières utilisation des techniques de génétique moléculaire en diagnostic : 1984 Une palette de techniques très

Plus en détail

À qui s adresse ce livre? Suppléments web. Remerciements

À qui s adresse ce livre? Suppléments web. Remerciements Avant propos Le marché de la géolocalisation est en pleine effervescence, comme le prouve l annonce de lancement par Facebook, en août 2010, de son service Places, qui permet de partager sa position géographique

Plus en détail

Bionformatique. D. Puthier Inserm U1090 Polytech Biotech III, 2014

Bionformatique. D. Puthier Inserm U1090 Polytech Biotech III, 2014 Bionformatique D. Puthier Inserm U1090 Polytech Biotech III, 2014 L informatique est omniprésente dans notre sociéte. La biologie ne fait pas exception Bioinformatique? Utiliser l information numérisée

Plus en détail

Jedox rafraîchit les rapports du fabricant de boissons MBG

Jedox rafraîchit les rapports du fabricant de boissons MBG Jedox rafraîchit les rapports du fabricant de boissons MBG «Nous pouvons désormais réaliser plus efficacement notre reporting et la planifi cation de nos ventes grâce à Jedox, et avons même soif de plus

Plus en détail

Gènes Diffusion - EPIC 2010

Gènes Diffusion - EPIC 2010 Gènes Diffusion - EPIC 2010 1. Contexte. 2. Notion de génétique animale. 3. Profil de l équipe plateforme. 4. Type et gestion des données biologiques. 5. Environnement Matériel et Logiciel. 6. Analyses

Plus en détail

Bilan de thèse à mi-parcours

Bilan de thèse à mi-parcours Bilan de thèse à mi-parcours Benjamin Lévy 26 mars 2012 Introduction La thèse de doctorat d informatique (école doctorale 130, EDITE) dont le titre officiel est le suivant : Avatars capables d écoute,

Plus en détail

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY Yvan Le Bras yvan.le_bras@irisa.fr Cyril Monjeaud, Mathieu Bahin, Claudia Hériveau, Olivier Quenez, Olivier Sallou, Aurélien Roult, Olivier

Plus en détail

Brique BDL Gestion de Projet Logiciel

Brique BDL Gestion de Projet Logiciel Brique BDL Gestion de Projet Logiciel Processus de développement pratiqué à l'enst Sylvie.Vignes@enst.fr url:http://www.infres.enst.fr/~vignes/bdl Poly: Computer elective project F.Gasperoni Brique BDL

Plus en détail

Présentation du module. Base de données spatio-temporelles. Exemple. Introduction Exemple. Plan. Plan

Présentation du module. Base de données spatio-temporelles. Exemple. Introduction Exemple. Plan. Plan Base de données spatio-temporelles S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Présentation du module Contenu général Partie 1 : Notion de bases de données (Conception

Plus en détail

Rapport de Stage Christopher Chedeau 2 au 26 Juin 2009

Rapport de Stage Christopher Chedeau 2 au 26 Juin 2009 Rapport de Stage Christopher Chedeau 2 au 26 Juin 2009 «Web. De l intégration de pages statiques HTML à un CMS, à la dynamisation d un site grâce au Javascript et l utilisation de nouvelles technologies

Plus en détail

RNAseq et NGS. Adriana Alberti Karine Labadie

RNAseq et NGS. Adriana Alberti Karine Labadie RNAseq et NGS Séquençage et Diversité LES ORGANISMES EUCARYOTES animaux plantes champignons protistes BACTERIES ARCHEES VIRUS METAGENOMES LES SOURCES ADN GENOMIQUE ARN / cdna AMPLICONS BACs ET FOSMIDES

Plus en détail

Plateforme de capture et d analyse de sites Web AspirWeb

Plateforme de capture et d analyse de sites Web AspirWeb Projet Java ESIAL 2A 2009-2010 Plateforme de capture et d analyse de sites Web AspirWeb 1. Contexte Ce projet de deuxième année permet d approfondir par la pratique les méthodes et techniques acquises

Plus en détail

Gestion du parc informatique matériel et logiciel de l Ensicaen. Rapport de projet. Spécialité Informatique 2 e année. SAKHI Taoufik SIFAOUI Mohammed

Gestion du parc informatique matériel et logiciel de l Ensicaen. Rapport de projet. Spécialité Informatique 2 e année. SAKHI Taoufik SIFAOUI Mohammed 6, bd maréchal Juin F-14050 Caen cedex 4 Spécialité Informatique 2 e année Rapport de projet Gestion du parc informatique matériel et logiciel de l Ensicaen SAKHI Taoufik SIFAOUI Mohammed Suivi ENSICAEN

Plus en détail

Ingénieur R&D en bio-informatique

Ingénieur R&D en bio-informatique Ingénieur R&D en bio-informatique Spécialisé Bases De Données 33 ans, Célibataire. Biologie & Informatique gabriel.chandesris[at]laposte.net {06 56 41 97 37} Use the bipper! http://gabriel.chandesris.free.fr/

Plus en détail

Journée de formation Bioinformatique (24 nov. 2005)

Journée de formation Bioinformatique (24 nov. 2005) Centre Intégré de Bioinformatique de Lille Journée de formation Bioinformatique (24 nov. 2005) "Stockage, gestion et analyse des données de transcriptomiques issues d'expériences de puces à ADN par l'utilisation

Plus en détail

Migration du pack office 2003. Planification, préparation, déploiement et formation

Migration du pack office 2003. Planification, préparation, déploiement et formation Migration du pack office 2003 Planification, préparation, déploiement et formation Planification : Comment s y prendre pour assurer au mieux la migration? Deux solutions : La première solution consiste

Plus en détail

IBM Tivoli Service Desk

IBM Tivoli Service Desk Déployer des services de qualité tout en maîtrisant les coûts IBM Tivoli Service Desk Points forts Rationalise la gestion des problèmes et des incidents afin de permettre la restauration rapide et économique

Plus en détail

11 Février 2014 Paris nidays.fr. ni.com

11 Février 2014 Paris nidays.fr. ni.com 11 Février 2014 Paris nidays.fr 1 Choisir la bonne architecture logicielle pour automatiser les systèmes de test Jérémy Charavet Ingénieur d Applications, National Instruments France Une architecture logicielle

Plus en détail

ASA-Advanced Solutions Accelerator. Solution pour la gestion des données des laboratoires et des plateformes de service

ASA-Advanced Solutions Accelerator. Solution pour la gestion des données des laboratoires et des plateformes de service ASA-Advanced Solutions Accelerator Partenaire informatique des Laboratoires de Recherche 100lims Solution pour la gestion des données des laboratoires et des plateformes de service Parce que vous cherchez

Plus en détail

Sommaire. Première partie Les concepts de base

Sommaire. Première partie Les concepts de base Sommaire Préface à la troisième édition... Préface à la deuxième édition... Avant-propos à la troisième édition... Avant-propos à la deuxième édition... Avant-propos à la première édition... XV XVII XIX

Plus en détail

Développement itératif, évolutif et agile

Développement itératif, évolutif et agile Document Développement itératif, évolutif et agile Auteur Nicoleta SERGI Version 1.0 Date de sortie 23/11/2007 1. Processus Unifié Développement itératif, évolutif et agile Contrairement au cycle de vie

Plus en détail

Application Smartphone pour les élèves ingénieurs du réseau Polytech

Application Smartphone pour les élèves ingénieurs du réseau Polytech CAHIER DES CHARGES Application Smartphone pour les élèves ingénieurs du réseau Polytech auteur : Communication Externe validé par : Présidence 1/14 Annexe : Acronymes FEDERP : BDE : Fédération des Elèves

Plus en détail

NVU, Notepad++ (ou le bloc-note), MySQL, PhpMyAdmin. HTML, PHP, cas d utilisation, maquettage, programmation connaissances en HTML, PHP et SQL

NVU, Notepad++ (ou le bloc-note), MySQL, PhpMyAdmin. HTML, PHP, cas d utilisation, maquettage, programmation connaissances en HTML, PHP et SQL Prise en main de NVU et Notepad++ (conception d application web avec PHP et MySql) Propriétés Intitulé long Formation concernée Matière Présentation Description Conception de pages web dynamiques à l aide

Plus en détail

Généralités sur les bases de données

Généralités sur les bases de données Généralités sur les bases de données Qu est-ce donc qu une base de données? Que peut-on attendre d un système de gestion de bases de données? Que peut-on faire avec une base de données? 1 Des données?

Plus en détail

Chef de projet ou expert systèmes informatiques, réseaux et télécom E1C23

Chef de projet ou expert systèmes informatiques, réseaux et télécom E1C23 Chef de projet ou expert systèmes informatiques, réseaux et télécom E1C23 Systèmes informatiques, réseaux et télécommunications - IR Spécialité - Responsable plateforme de calcul Domaine d application

Plus en détail

L évolution de l automatisation.

L évolution de l automatisation. Gestion automatisée de la qualité Livre blanc Octobre 2009 L évolution de l automatisation. Etude de l évolution de l automatisation dans la gestion de la qualité des logiciels Page 2 Sommaire 2 Introduction

Plus en détail

Calendrier prévisionnel 07 Septembre 2015 Tarif HT 350 000FCFA

Calendrier prévisionnel 07 Septembre 2015 Tarif HT 350 000FCFA FORMATIONS 2015 2016 GOUVERNANCE SI Nos formations Types de formation Nos sessions de formations s adresse à tous les professionnels. Deux types de formations vous sont proposés: - séminaires de formations

Plus en détail

Faculté des sciences de gestion et sciences économiques BASE DE DONNEES

Faculté des sciences de gestion et sciences économiques BASE DE DONNEES BASE DE DONNEES La plupart des entreprises possèdent des bases de données informatiques contenant des informations essentielles à leur fonctionnement. Ces informations concernent ses clients, ses produits,

Plus en détail

Communiqué de Lancement

Communiqué de Lancement Direction du Marketing Produits Sage - Division Mid Market Communiqué de Lancement Rapprochement Bancaire 1000 Produit : Rapprochement Bancaire 1000 Bases de Données : Oracle - MS/SQL Server Microsoft

Plus en détail

http://mondomaine.com/dossier : seul le dossier dossier sera cherché, tous les sousdomaines

http://mondomaine.com/dossier : seul le dossier dossier sera cherché, tous les sousdomaines Principales fonctionnalités de l outil Le coeur du service suivre les variations de position d un mot-clé associé à une URL sur un moteur de recherche (Google - Bing - Yahoo) dans une locale (association

Plus en détail

POPULATION D ADN COMPLEXE - ADN génomique ou - copie d ARNm = CDNA

POPULATION D ADN COMPLEXE - ADN génomique ou - copie d ARNm = CDNA POPULATION D ADN COMPLEXE - ADN génomique ou - copie d ARNm = CDNA Amplification spécifique Détection spécifique Clonage dans des vecteurs Amplification in vitro PCR Hybridation moléculaire - hôte cellulaire

Plus en détail

FICHE PRODUIT COREYE CACHE Architecture technique En bref Plateforme Clients Web Coreye Cache applicative Références Principe de fonctionnement

FICHE PRODUIT COREYE CACHE Architecture technique En bref Plateforme Clients Web Coreye Cache applicative Références Principe de fonctionnement COREYE CACHE Solution d absorption de charge pour une disponibilité et une performance optimales des applications Web En bref Architecture technique La plateforme Coreye Cache délivre la majeure partie

Plus en détail

Département Informatique 5ème année 2008-2009. Cahier des Charges

Département Informatique 5ème année 2008-2009. Cahier des Charges École Polytechnique de l Université de Tours 64, Avenue Jean Portalis 37200 TOURS, FRANCE Tél. +33 (0)2 47 36 14 14 Fax +33 (0)2 47 36 14 22 www.polytech.univ-tours.fr Département Informatique 5ème année

Plus en détail

IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21

IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21 IODAA de l 1nf0rmation à la Décision par l Analyse et l Apprentissage IODAA Informations générales 2 Un monde nouveau Des données numériques partout en croissance prodigieuse Comment en extraire des connaissances

Plus en détail

Rapport de stage. Création d un site web. Stage du 20/01/2013 au 21/02/2013

Rapport de stage. Création d un site web. Stage du 20/01/2013 au 21/02/2013 Rapport de stage Création d un site web Stage du 20/01/2013 au 21/02/2013 Auteur : Antoine Luczak Tuteur professionnel : M. Tison Tuteur scolaire : Mme Girondon Année scolaire : 2013/2014 1 Table des matières

Plus en détail

Jade. Projet Intelligence Artificielle «Devine à quoi je pense»

Jade. Projet Intelligence Artificielle «Devine à quoi je pense» Jade Projet Intelligence Artificielle «Devine à quoi je pense» Réalisé par Djénéba Djikiné, Alexandre Bernard et Julien Lafont EPSI CSII2-2011 TABLE DES MATIÈRES 1. Analyse du besoin a. Cahier des charges

Plus en détail

D1.2 Management (MGMT) Exploiting the Cloud to make sensor data collection scalable

D1.2 Management (MGMT) Exploiting the Cloud to make sensor data collection scalable Projet de fin d'études [E] 2012-2013 D1.2 Management (MGMT) Exploiting the Cloud to make sensor data collection scalable Participants : Robin Monjo, robinmonjo@gmail.com, SI5 / Architecture Logicielle

Plus en détail

les techniques d'extraction, les formulaires et intégration dans un site WEB

les techniques d'extraction, les formulaires et intégration dans un site WEB les techniques d'extraction, les formulaires et intégration dans un site WEB Edyta Bellouni MSHS-T, UMS838 Plan L extraction des données pour un site en ligne Architecture et techniques Les différents

Plus en détail

TUTORIEL Qualit Eval. Introduction :

TUTORIEL Qualit Eval. Introduction : TUTORIEL Qualit Eval Introduction : Qualit Eval est à la fois un logiciel et un référentiel d évaluation de la qualité des prestations en établissements pour Personnes Agées. Notre outil a été spécifiquement

Plus en détail

Tutoriel XBNE Connexion à un environnement XBMC distant

Tutoriel XBNE Connexion à un environnement XBMC distant Tutoriel XBNE Connexion à un environnement XBMC distant 1. Introduction... 3 2. Quelques notions d informatique... 4 2.1 Réseau informatique... 4 2.1.1 Adresse ip... 4 2.1.2 Fixer l adresse ip d un équipement...

Plus en détail

Rapport de certification

Rapport de certification Rapport de certification Préparé par : Le Centre de la sécurité des télécommunications à titre d organisme de certification dans le cadre du Schéma canadien d évaluation et de certification selon les critères

Plus en détail

Introduction à la B.I. Avec SQL Server 2008

Introduction à la B.I. Avec SQL Server 2008 Introduction à la B.I. Avec SQL Server 2008 Version 1.0 VALENTIN Pauline 2 Introduction à la B.I. avec SQL Server 2008 Sommaire 1 Présentation de la B.I. et SQL Server 2008... 3 1.1 Présentation rapide

Plus en détail

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles) SGBDR Systèmes de Gestion de Bases de Données (Relationnelles) Plan Approches Les tâches du SGBD Les transactions Approche 1 Systèmes traditionnels basés sur des fichiers Application 1 Gestion clients

Plus en détail

SIO-SISR : Projet GSB. LOT 1 : Evaluation d un logiciel d inventaire et de gestion de parc. BTS Services Informatiques aux Organisations 1 ère année

SIO-SISR : Projet GSB. LOT 1 : Evaluation d un logiciel d inventaire et de gestion de parc. BTS Services Informatiques aux Organisations 1 ère année SIO BTS Services Informatiques aux Organisations 1 ère année LOT 1 : Evaluation d un logiciel d inventaire et de gestion de parc Objectifs : LOT 1 : Evaluation d un logiciel d inventaire et de gestion

Plus en détail

Stage Ingénieur en développement logiciel/modélisation 3D

Stage Ingénieur en développement logiciel/modélisation 3D Ingénieur en développement logiciel/modélisation 3D Schlumberger recrute un(e) stagiaire ingénieur en modélisation 3D pour la plate-forme Petrel. Vous serez intégré(e) au sein d une équipe innovante, Petrel

Plus en détail

COMMENT LIRE UN DEVIS DE CREATION DE SITE WEB?

COMMENT LIRE UN DEVIS DE CREATION DE SITE WEB? COMMENT LIRE UN DEVIS DE CREATION DE SITE WEB? Lorraine En matière de création ou de refonte d un site Internet, il apparaît souvent difficile de faire un choix parmi les propositions qui font suite à

Plus en détail

CTE Éditeur de classification arborescente pour spécifications du cas de test

CTE Éditeur de classification arborescente pour spécifications du cas de test Tessy Test d intégration et unitaire dynamique automatisé pour des applications embarquées CTE Éditeur de classification arborescente pour spécifications du cas de test Le meilleur outil de test unitaire

Plus en détail

Analyses bioinformatiques pour le PCIM

Analyses bioinformatiques pour le PCIM Analyses bioinformatiques pour le PCIM Journée de rencontre des utilisateurs du Pôle de calcul intensif pour la mer 17 janvier 2014 La bioinfo, késaco? Approche in silico de la biologie L'organisation,

Plus en détail

Mon métier, mon parcours

Mon métier, mon parcours Mon métier, mon parcours Anthony, ingénieur d études diplômé d un Master Réseaux, application documentaire, ingénierie et sécurité Les métiers de l Informatique Le domaine Sciences, Technologies, Santé

Plus en détail

FICHE D ACTIVITE N 4 : APPLICATION SMARTPHONE DE GESTION DE FRAIS (ANDROID)

FICHE D ACTIVITE N 4 : APPLICATION SMARTPHONE DE GESTION DE FRAIS (ANDROID) FICHE D ACTIVITE N 4 : APPLICATION SMARTPHONE DE GESTION DE FRAIS (ANDROID) Table des matières I. Pôle de compétences concernées... 3 II. Circonstance et contexte... 3 III. Situation professionnelle et

Plus en détail

Évaluation et implémentation des langages

Évaluation et implémentation des langages Évaluation et implémentation des langages Les langages de programmation et le processus de programmation Critères de conception et d évaluation des langages de programmation Les fondations de l implémentation

Plus en détail

15 septembre 2010. Démo #2 MySQL Séquençage

15 septembre 2010. Démo #2 MySQL Séquençage 15 septembre 2010 Démo #2 MySQL Séquençage SQL et MySQL SQL: structured query language langage pour manipuler des données dans des bases de données relationnelles MySQL: Implantation de SQL Ajout à SQL

Plus en détail

Cahier de texte de la classe 1 ère 4 - SVT

Cahier de texte de la classe 1 ère 4 - SVT Cahier de texte de la classe 1 ère 4 - SVT DATE SEQUENCE lundi 12 : revoir la fiche méthodologique «utiliser le microscope optique» (disponible sur le site du lycée) Lundi 12 1 er contact avec les élèves.

Plus en détail

Thèmes : Ateliers Bureautiques F2+ dans le cadre du DIF

Thèmes : Ateliers Bureautiques F2+ dans le cadre du DIF Thèmes : Ateliers Bureautiques F2+ dans le cadre du DIF Prise en main de l outil micro / Word / Excel / Internet : 20 h Perfectionnement de l outil micro : Word / Excel / Internet : 20 h Perfectionnement

Plus en détail

Armand PY-PATINEC 2010

Armand PY-PATINEC 2010 Armand PY-PATINEC 2010 EPREUVE PRATIQUE : TABLEAU SYNOPTIQUE Activités Inventaire de bières et de leur lieu de fabrication Gestion des clients pour un programme de facturation Emploi du ruban de l interface

Plus en détail

GESTION D UNE BASE BIBLIOGRAPHIQUE

GESTION D UNE BASE BIBLIOGRAPHIQUE GESTION D UNE BASE BIBLIOGRAPHIQUE BTS Bioanalyses et contrôles Gil Voge Lycée Louise Michel, Grenoble Base de données (BD ou DB, database) Ensemble de données relatif à un domaine particulier des connaissances

Plus en détail

DAEU- cours de Sciences de la Nature et de la Vie- Marie Claire Garnier

DAEU- cours de Sciences de la Nature et de la Vie- Marie Claire Garnier Partie 3 : génétique Chapitre 1 : la transmission d un caractère au cours de la reproduction sexuée Rappel : la reproduction sexuée comprend 2 phénomènes fondamentaux successifs : La méiose lors de la

Plus en détail

DEMANDE D INFORMATION RFI (Request for information)

DEMANDE D INFORMATION RFI (Request for information) DOD SEICAM RFI Demande d information EVDEC Réf. : RFI_EVDEC- GT5_Outil_reporting_BI_v4.doc Page 1/11 DEMANDE D INFORMATION RFI (Request for information) OUTIL INTÉGRÉ DE REPORTING ET D ANALYSE DÉCISIONNELLE

Plus en détail

Institut Français de Bioinformatique (IFB) : mettre en place une infrastructure informatique dédiée aux sciences de la vie

Institut Français de Bioinformatique (IFB) : mettre en place une infrastructure informatique dédiée aux sciences de la vie 1 / 1 Institut Français de Bioinformatique (IFB) : mettre en place une infrastructure informatique dédiée aux sciences de la vie J-F. Gibrat Unité Mathématique, Informatique et Génome, INRA, Jouy-en-Josas

Plus en détail

Introduction. Pourquoi ce livre? À qui s adresse ce livre?

Introduction. Pourquoi ce livre? À qui s adresse ce livre? Introduction Bien que récente, la solution e-commerce Magento s est imposée très rapidement, grâce à ses fonctionnalités innovantes et la qualité de son architecture. Elle est le socle de plusieurs dizaines

Plus en détail

Les besoins de la communauté des sciences de la vie en termes d infrastructure informatique

Les besoins de la communauté des sciences de la vie en termes d infrastructure informatique 1 / 31 Les besoins de la communauté des sciences de la vie en termes d infrastructure informatique J-F. Gibrat Unité Mathématique, Informatique et Génome, INRA, Jouy-en-Josas Séminaire IDRIS, Orsay, 14

Plus en détail

IMA promotion 2009. Rapport de stage de première année. Stage industriel au Crédit du Nord

IMA promotion 2009. Rapport de stage de première année. Stage industriel au Crédit du Nord DUBRULLE Alain ENSEEIHT IMA promotion 2009 Rapport de stage de première année Stage industriel au Crédit du Nord Sommaire Présentation de l entreprise Le Crédit du Nord 3 La Direction des Systèmes d'information

Plus en détail

Les transactions étendues et quelques Frameworks qui les supportent.

Les transactions étendues et quelques Frameworks qui les supportent. Les transactions étendues et quelques Frameworks qui les supportent. Christophe Ponsen cponsen@info.fundp.ac.be Institut d Informatique, Université de Namur Résumé Les transactions étendues posent de nombreux

Plus en détail

Gestion du serveur WHS 2011

Gestion du serveur WHS 2011 Chapitre 15 Gestion du serveur WHS 2011 Les principales commandes Windows Home Server 2011 reprend l ergonomie de Windows 7 et intègre les principales commandes de Windows Server 2008 R2. Les commandes

Plus en détail

Utilitaire d importation et d exportation de données pour NewWayService 4

Utilitaire d importation et d exportation de données pour NewWayService 4 Utilitaire d importation et d exportation de données pour NewWayService 4 Copyright 1996-2009 OroLogic Inc. http://www.orologic.com Révision 4.01 Table des matières I Table des matières Introduction à

Plus en détail

Médecine 4P Prédictive, Préventive, Personnalisée, Participative Les enjeux

Médecine 4P Prédictive, Préventive, Personnalisée, Participative Les enjeux Médecine 4P Prédictive, Préventive, Personnalisée, Participative Les enjeux Unité Inserm UMR 1087-CNRS UMR 6291 Hervé Le Marec Evolution de la médecine et de la recherche biomédicale développement de traitements

Plus en détail

BONPRIX. Contexte et problématique : Les problèmes rencontrés :

BONPRIX. Contexte et problématique : Les problèmes rencontrés : BONPRIX BONPRIX fait communiquer en temps réel ses applications RPG Power i au moyen de Web Services avec le logiciel Strategi webservices Contexte et problématique : Bonprix est une société de vente à

Plus en détail

Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments»

Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments» Master In silico Drug Design Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments» 30NU01IS INITIATION A LA PROGRAMMATION (6 ECTS) Responsables : D. MESTIVIER,

Plus en détail

DOCUMENTATION ASSOCIEE A UN PROJET LOGICIEL

DOCUMENTATION ASSOCIEE A UN PROJET LOGICIEL DOCUMENTATION ASSOCIEE A UN PROJET LOGICIEL 31 août 2004 Plate-Forme Opérationnelle de modélisation INRA ACTA ICTA http://www.modelia.org FICHE DU DOCUMENT 10 mai 04 N.Rousse - : Création : version de

Plus en détail

INF 1250 INTRODUCTION AUX BASES DE DONNÉES. Guide d étude

INF 1250 INTRODUCTION AUX BASES DE DONNÉES. Guide d étude INF 1250 INTRODUCTION AUX BASES DE DONNÉES Guide d étude Sous la direction de Olga Mariño Télé-université Montréal (Québec) 2011 INF 1250 Introduction aux bases de données 2 INTRODUCTION Le Guide d étude

Plus en détail

Recueil des Fiches Concepteurs : Mise en œuvre d un site SharePoint 2013 Juin 2015

Recueil des Fiches Concepteurs : Mise en œuvre d un site SharePoint 2013 Juin 2015 Recueil des s s : Mise en œuvre d un site SharePoint 2013 Juin 2015 Ce document décrit le paramétrage pour la mise en œuvre des fonctionnalités standard de Microsoft SharePoint 2013. NADAP et SharePoint

Plus en détail

Stages 2014-2015 ISOFT : UNE SOCIETE INNOVANTE. Contact : Mme Lapedra, stage@isoft.fr

Stages 2014-2015 ISOFT : UNE SOCIETE INNOVANTE. Contact : Mme Lapedra, stage@isoft.fr Stages 2014-2015 ISOFT : UNE SOCIETE INNOVANTE Contact : Mme Lapedra, stage@isoft.fr ISoft, éditeur de logiciels, est spécialisé dans l informatique décisionnelle et l analyse de données. Son expertise

Plus en détail

Bioinformatique en génomique évolutive

Bioinformatique en génomique évolutive Bioinformatique en génomique évolutive Elsa Petit Parcours 1997-2000: Ecole d Ingénieurs des Travaux Agricoles, Bordeaux Option pathologie végétale Eté 1999: Iowa State University, Prévision de l anthracnose

Plus en détail