Mise en place d une solution automatique de stockage et de visualisation de données de capture des interactions chromatiniennes à l échelle génomique

Dimension: px
Commencer à balayer dès la page:

Download "Mise en place d une solution automatique de stockage et de visualisation de données de capture des interactions chromatiniennes à l échelle génomique"

Transcription

1 Rapport de stage de deuxième année de DUT Génie Biologique option Bioinformatique Mise en place d une solution automatique de stockage et de visualisation de données de capture des interactions chromatiniennes à l échelle génomique Institut de Génétique Humaine CNRS UPR , Rue de la Cardonille Montpellier Equipe Chromatine et Biologie Cellulaire (Responsable : Giacomo Cavalli) Mylène SIMON 2 ème année de DUT Génie Biologique option Bioinformatique Université d Auvergne Institut Universitaire de Technologie de Clermont-Ferrand Site d Aurillac, Département Génie Biologique Année universitaire Stage effectué du 01 avril au 30 juillet 2010 et encadré par M. Aubin THOMAS (IE)

2

3 Remerciements Tout d abord, je tiens à remercier Giacomo CAVALLI, responsable du département «Dynamique du Génome» et de l équipe «Chromatine et Biologie Cellulaire» de l IGH, de m avoir donné l opportunité d effectuer mon stage au sein de l IGH et d avoir pris sur son temps pour m expliquer les sujets de recherche de l équipe. Je remercie Aubin THOMAS, ingénieur d étude de l équipe «Chromatine et Biologie Cellulaire», mon maître de stage, pour sa disponibilité de tous les instants, sa sympathie, toutes les connaissances qu il a partagées avec moi et l aide qu il m a apportée tout au long du stage et lors de la rédaction de ce rapport. Je tiens également à remercier tous les membres de l équipe «Chromatine et Biologie Cellulaire» pour leur accueil et les réponses qu ils ont pu fournir à mes questions concernant leurs sujets de recherche, et plus particulièrement Thomas SEXTON, chargé de projet 3C, pour son aide lors de la rédaction de ce rapport. Je remercie aussi l ensemble des personnes travaillant dans le bureau bioinformatique de l IGH, pour leur accueil et leur bonne humeur quotidienne. Enfin, je tiens à remercier Helmut MICHELS, spécialiste en informatique au Max Planck Institute et créateur de la librairie graphique Dislin, pour ses réponses rapides à mes s et pour n avoir pas hésité à modifier sa librairie pour résoudre mon problème.

4

5 Résumé Les recherches menées au sein du laboratoire «Chromatine et Biologie cellulaire» de l Institut de Génétique Humaine de Montpellier sont principalement consacrées à l étude des phénomènes épigénétiques. L épigénétique correspond aux changements héritables dans l expression des gènes qui ne sont pas dus à des modifications dans la séquence d ADN. Deux principaux groupes de protéines sont impliqués dans ces phénomènes : les protéines Polycomb (ou PcG), qui inhibent l expression des gènes, et les protéines trithorax (ou trxg), qui au contraire activent l expression des gènes. Dans le cadre de ces recherches, plusieurs techniques expérimentales sont utilisées, ce qui génère un grand nombre de données génomiques. Le projet CavGenTools a pour but de proposer un ensemble de services et d applications web permettant d intégrer et de visualiser l ensemble de ces données. C est dans ce contexte que les programmes SMIF et PMIF ont été développés. Le logiciel SMIF permet l enregistrement automatique des données d expériences de mesure d interactions chromatiniennes et de fixation de protéines sur l ADN. L application PMIF, quant à elle, permet de visualiser en ligne ces données sous la forme de graphiques personnalisables, de manière simple et rapide.

6

7 Abstract The research conducted in the "Chromatin and Cell Biology laboratory at the Institute of Human Genetics in Montpellier is mainly devoted to studying epigenetics phenomena. Epigenetics refers to heritable changes in the expression of genes that are not due to changes in DNA sequence. Two main groups of proteins are involved in these phenomena: the Polycomb proteins (or PcG), which inhibit the gene expression, and the trithorax proteins (or trxg), which instead activate gene expression. Through this research, several experimental techniques are used and produce a lot of genome-wide data. The aim of the CavGenTools project is to provide a set of web services and applications to integrate and visualize all these data. It is in this context that the programs SMIF and PMIF have been developed. The SMIF software permits the automatic storage of data from experiments measuring chromatin interactions and proteins binding profiles on DNA. The PMIF application allows swift and simple visualization of the data online in the form of customizable graphics.

8

9 Sommaire Introduction... 1 I) Contexte du stage... 2 I.1) La structure d accueil... 2 I.1.1.) Le CNRS... 2 I.1.2) L Institut de Génétique Humaine... 2 I.1.3) L équipe Chromatine et Biologie Cellulaire... 2 I.2) Le contexte biologique... 3 I.2.1) Les techniques utilisées pour l obtention des données : séquençage à haut débit et techniques expérimentales... 3 I.2.2) Le projet CavGenTools... 4 I.2.3) Evolution du sujet de stage... 5 II) Organisation du stage... 6 II.1) Gestion globale du projet... 6 II.1.1) Définition d un cahier des charges pour les programmes... 6 II.1.2) Utilisation d un gestionnaire de projet... 7 II.1.3) Suivi du projet... 8 II.2) Méthode de programmation... 8 II.2.1) Rappel sur les techniques de programmation... 8 II.2.2) Extreme programming et cycles de développement courts... 9 III) Choix techniques III.1) Stockage des données III.1.1) Choix d une solution de stockage III.1.2) Prétraitement des données III.1.3) Enregistrement des données III.2) Programme de visualisation PMIF III.2.1) Langage de programmation III.2.2) Structuration du programme III.2.2.1) Les patrons de conception III.2.2.2) MVC III.2.2.3) Stratégie III.2.3) Libraires utilisées III.2.3.1) Xerces III.2.3.2) MySQL III.2.3.3) Dislin IV) Résultats IV.1) Exemple d application du programme PMIF IV.1.1) Protéines du groupe Polycomb et du groupe trithorax IV.1.2) L utilisation de PMIF pour illustrer le lien entre les méthylations de l histone H3 et les protéines du PcG IV.2) Discussion Conclusion Bibliographie Table des sigles et des abréviations Glossaire Table des figures et des tableaux Annexes

10

11

12

13 Introduction La génétique* a montré que l expression des gènes* et donc le phénotype d un individu (c'est-à-dire les caractéristiques qui lui sont propres) dépendaient de l enchaînement des nucléotides* constituants la molécule d ADN*. Cependant, depuis quelques années, certains chercheurs ont découvert que des changements dans l expression des gènes pouvaient apparaître sans qu il y ait de modifications dans la séquence de l ADN. C est ce que l on appelle des processus d épigénétique. L équipe «Biologie Cellulaire et Chromatine» de l Institut de Génétique Humaine de Montpellier (CNRS-UPR 1142) s intéresse particulièrement à ces phénomènes. Pour cela, les chercheurs de cette équipe emploient différentes techniques expérimentales produisant un grand nombre de données qu il est nécessaire de stocker et de traiter pour en extraire les informations recherchées. C est au sein de cette équipe, sous la tutelle d Aubin THOMAS, ingénieur bioinformaticien, que j ai réalisé mon stage. Celui-ci a consisté en la mise en place d une solution automatique de stockage et de visualisation de certaines des données expérimentales de l équipe. Ce rapport présente le travail que j ai réalisé sur machine au cours de ces quatre mois de stage au sein de cet institut. Tout d abord, nous aborderons dans une première partie le contexte et le sujet du stage, pour ensuite nous intéresser à la manière dont le projet a été conduit, tant au niveau de la gestion du temps que de la méthode de programmation. Une troisième partie sera consacrée à la description et à la justification des différents choix techniques qui ont été faits tout au long du stage. Enfin, nous nous pencherons dans une dernière partie sur les résultats obtenus. 1

14 Figure 1 : Organigramme de l'équipe "Chromatine et Biologie Cellulaire" Source : Adaptation de l'organigramme réalisé par Anna DELEST (membre de l'équipe)

15 I) Contexte du stage I.1) La structure d accueil I.1.1.) Le CNRS Le Centre National de la Recherche Scientifique, ou CNRS [5], a été créé le 19 octobre C est un organisme public français de recherche scientifique placé sous la tutelle du Ministère de l Enseignement supérieur et de la Recherche. Il est classé comme établissement public à caractère scientifique et technologique et est le principal organisme de recherche pluridisciplinaire en France. La recherche au sein du CNRS s étend à l ensemble des domaines scientifiques, technologiques et sociétaux, couvrant ainsi la totalité des champs scientifiques (mathématiques, chimie, physique nucléaire, sciences du vivant, sciences humaines et sociales, sciences de la planète et de l Univers, etc.). I.1.2) L Institut de Génétique Humaine L Institut de Génétique Humaine, ou IGH [6], est une unité propre de recherche du CNRS (UPR 1142) située à Montpellier et dirigée par Alain BUCHETON. L'objectif de l'igh est de mener des recherches fondamentales de haut niveau et de lier ces recherches à l étude des pathologies, afin de mieux comprendre, diagnostiquer et traiter certaines pathologies humaines. Les trois départements scientifiques de l'igh, correspondants aux trois principaux axes de recherches sont : le département «Dynamique du Génome» (responsable : Giacomo CAVALLI), le département «Génétique et Développement» (responsable : Martine SIMONELIG), et le département «Pathologies Moléculaires et Cellulaires» (responsable : Sylvain LEHMANN). I.1.3) L équipe Chromatine et Biologie Cellulaire L équipe «Chromatine et Biologie Cellulaire» fait partie des dix équipes de recherche du département «Dynamique du Génome» et est dirigée par Giacomo 2

16 Figure 2 : HiSeq 2000, le séquenceur utilisé par le laboratoire Source :

17 CAVALLI, le responsable de ce département (voir figure 1). Les recherches menées au sein de cette équipe concernent principalement les phénomènes d épigénétique [7], c està-dire les processus d hérédité réversibles qui ne sont pas fondés sur des changements dans la séquence d ADN. Les chercheurs s intéressent plus particulièrement à deux groupes de protéines, Polycomb (PcG) et trithorax (trxg). Les protéines du PcG inhibent ou répriment l expression des gènes du développement dès le stade embryonnaire, tandis que celles du trxg les accentuent. Le but de ces recherches est de comprendre comment ces deux groupes de protéines mettent en place l équilibre du réseau d expression des gènes dès les premiers stades de l embryon, en étudiant les mécanismes moléculaires impliqués dans ces processus. Pour cela, l équipe utilise différentes techniques et approches relevant de la biologie cellulaire, moléculaire et du développement, ainsi que de la génomique et de la bioinformatique. Cette équipe est composée de chercheurs, ingénieurs d études, doctorants, post-doctorants, étudiants et stagiaires et est «internationale», puisque sur les dix-sept personnes actuellement présentes, huit sont des scientifiques étrangers. I.2) Le contexte biologique I.2.1) Les techniques utilisées pour l obtention des données : séquençage à haut débit et techniques expérimentales Le séquençage à haut débit [8] est une technique permettant de connaître la composition en nucléotides du matériel génétique étudié, et cela par une analyse massive de courts fragments d ADN de 36, 72 ou 108 nucléotides* (technologie Illumina [9], voir figure 2 et annexe 1). Ces fragments (ou oligonucléotides) séquencés sont ensuite alignés sur un génome* de référence, afin de connaître la localisation physique du matériel génétique étudié. Les principales techniques expérimentales utilisées par l équipe sont : La 3C [10] : La technique de 3C permet de capturer de part et d autre les régions interagissant entre elles sur un même chromosome* ou entre plusieurs chromosomes. Une première étape consiste en la capture des sites de liaison entre chromosomes, et la deuxième étape de séquençage et d alignement permet de déterminer les positions de part et d autre des interactions (voir annexe 2). 3

18

19 La ChIP-Seq [11] : Les méthodes de ChIP-Seq permettent d étudier les sites de fixation de protéines sur l ADN. La première étape de ChIP capture les séquences ADN liées à ces protéines par immuno-précipitation de la chromatine. L étape de séquençage et d alignement permet de connaître les sites de fixation et leurs proportions (voir annexe 3). La ChIP-on-chip [12] : Cette technique permet de déterminer la localisation de protéines d intérêt et correspond à une immuno-précipitation de la chromatine (ou ChIP) dont les fragments obtenus sont analysés sur une puce ADN (voir annexe 4). Le RNA-seq [13], ou «WTSS» pour Whole Transcriptome Shotgun Sequencing : Cette technique permet de mesurer le niveau d expression des gènes en analysant la population totale des transcrits exprimés dans un type cellulaire donné grâce au séquençage à très haut débit. I.2.2) Le projet CavGenTools L équipe «Chromatine et Biologie cellulaire» produit et étudie un grand nombre de données de différentes natures. Les trois principaux types de données sont : Les données de mesures d interactions chromatiniennes dans le noyau : elles sont obtenues grâce à la technique de 3C. Les données de localisations des protéines régulatrices des différents mécanismes étudiées par l équipe : elles sont obtenues grâces à des techniques d immuno-précipitation telles que la ChIP-on-chip et la ChIP-seq, Ces deux techniques permettent d étudier des protéines interagissant avec l ADN. Les données de niveaux d expression des gènes dans différents tissus et différentes conditions : elles sont obtenues grâce à des techniques de puces à ADN [14] et de RNA-seq, ou «WTSS» pour Whole Transcriptome Shotgun Sequencing. Le projet CavGenTools est issu du désir de l équipe «Chromatine et Biologie Cellulaire» de proposer un ensemble de services et d applications web permettant de visualiser l ensemble des données qu elle génère et étudie. Actuellement, une 4

20

21 application web permettant de visualiser les données obtenues par la ChIP-on-chip (localisations des protéines régulatrices sur l ADN) est disponible. A terme, le but est de mettre en place la visualisation des autres types de données (3C, ChIP-seq, puces à ADN et RNA-seq) par un ensemble de webservices*. I.2.3) Evolution du sujet de stage A l origine, le sujet de stage a été formulé de cette manière : «Mise en place d une solution automatique de stockage et de visualisation de données de capture des interactions chromatiniennes à l échelle génomique.» Le stage s inscrivait dans la mise en place de la partie 3C du projet CavGenTools. Deux grandes étapes se dégagent de ce sujet : La création d un programme permettant un enregistrement automatisé et facilité des données de 3C et des informations liées à ces données (telles que l organisme, le tissu, les conditions, le type de données, ) dans la base de données déjà disponible. Cela implique également de définir des règles d enregistrement pour ce programme (paramètres obligatoires, fichiers de configuration à remplir par l utilisateur, gestion des erreurs par le programme, etc.). La création d un programme permettant la visualisation des données de 3C sous la forme de graphiques, dont le fond et la forme dépendent des choix de l utilisateur du programme. Pour cela, il est nécessaire de déterminer, en concertation avec les biologistes impliqués dans le projet, de quelle manière les données à visualiser seront choisies par les utilisateurs et quels sont les types de visualisation à proposer. Au vu de l avancement rapide du projet, il a été convenu que je réalise également deux programmes similaires à ceux conçus pour les données de 3C, adaptés pour permettre l enregistrement et la visualisation des données de ChIP-seq. Deux ensembles de programmes ont donc été créés : SMIF, qui permet l enregistrement des données de 3C et de ChIP-Seq, et PMIF, qui permet la visualisation des données de 3C et de ChIP-Seq. 5

22

23 II) Organisation du stage II.1) Gestion globale du projet II.1.1) Définition d un cahier des charges pour les programmes Les programmes développés au cours du stage ont pour but de répondre à un besoin des chercheurs de l équipe et de certains biologistes de pouvoir visualiser les données générées et étudiées dans le laboratoire, de manière simple et accessible de n importe quel ordinateur relié à internet. Cela implique de prendre en compte les préférences des chercheurs de l équipe ainsi que certaines contraintes, et de bien définir celles-ci avant de commencer à développer les programmes. Ces différents aspects ont été discutés avec les principales personnes impliquées dans le projet, c'est-à-dire Aubin THOMAS, mon maître de stage, Thomas SEXTON, le chargé de projet 3C, et Giacomo CAVALLI, le responsable de l équipe. Pour cela, des réunions ont été organisées, au cours desquelles j ai pu présenter de manière argumentée les différents choix faits pour le développement du programme. Les personnes impliquées dans le projet ont ainsi pu connaître et comprendre ces choix, les valider la plupart du temps mais également remettre en cause ceux qui ne leur convenaient pas. Cette démarche a permis de définir un cadre pour le développement du programme, et de fixer les objectifs à atteindre, en prenant en compte les besoins et préférences des biologistes ainsi que les contraintes techniques. Ces discussions ont conduit à l'élaboration d un cahier des charges pour chaque programme, rédigés par mes soins en collaboration avec Aubin THOMAS. Ces documents développent les points suivants : L objectif général du programme Les contraintes techniques à prendre en compte Le cadre du programme o Les paramètres obligatoires passés en arguments du programme o Les fichiers de configuration à remplir par l utilisateur o La gestion des erreurs Un échéancier des résultats et un planning des futures réunions Pour le programme d enregistrement des données SMIF : o Le format du fichier contenant les données à enregistrer 6

24 Figure 3 : Copie d'écran du gestionnaire de projet Source :

25 o Le support d enregistrement des données o La structuration des données o Les vérifications permettant de ne pas enregistrer deux fois la même série de données o Les champs obligatoires et facultatifs dans les fichiers de configuration à remplir par l utilisateur Pour le programme de visualisation des données PMIF : o Les différents types de visualisation des données (voir annexe 5) o La récupération des données à visualiser o Les différentes techniques statistiques utilisées pour la génération des graphiques o Les formats et tailles d images proposés à l utilisateur o Les couleurs utilisées II.1.2) Utilisation d un gestionnaire de projet Pour faciliter la planification et la gestion du travail et permettre une meilleure visibilité de l avancement du projet pour les personnes y étant impliquées, une application web de gestion de projet, adaptée du programme Redmine [15], a été utilisée. Ce logiciel a pour particularité d être conçu pour la gestion de projets scientifiques en laboratoire. Il permet de gérer simultanément plusieurs projets, pouvant contenir euxmêmes plusieurs sous projets. Le gestionnaire de projet offre la possibilité de créer des tâches de différentes natures («à faire», bug, demande d informations, bibliographie, installation, etc.), de les affecter à un utilisateur et de pouvoir suivre leur évolution. Il est également possible de déposer des documents, classés par catégories (documentation technique, manuel d utilisation, code, résultats, ), de publier des annonces, de participer à un forum de discussion et de créer des pages wiki*. A chaque étape du stage, des tâches détaillées ont été créées permettant de définir des objectifs concrets à court terme correspondants aux différentes étapes du développement des programmes (voir figure 3). Pour chaque tâche réalisée, un rapport décrivant le travail effectué et les résultats obtenus est disponible dans le gestionnaire de tâches. Des exemples des graphiques obtenus ont également été déposés régulièrement, afin de permettre aux chercheurs de visualiser les résultats obtenus et l avancement du projet de manière plus concrète. 7

26

27 II.1.3) Suivi du projet Le gestionnaire de projet en ligne a permis de faciliter le suivi du projet, car le suivi de la réalisation des tâches y est aisé, grâce à l ajout possible de documents, de commentaires et de nouvelles demandes. De plus, tout au long du stage, des réunions hebdomadaires ont été faites avec mon maître de stage, Aubin THOMAS, me permettant de lui présenter mon avancement dans le projet, pour qu il puisse vérifier mes travaux et les corriger si nécessaire, et nous permettant de discuter de certains aspects techniques et du déroulement de la suite du stage, en définissant de nouveaux objectifs pour la semaine suivante. Des réunions moins formelles et de plus courte durée ont également eu lieu régulièrement en cas de besoin d explications ou de précisions complémentaires. Enfin, les besoins des biologistes étant en constante évolution, des réunions ont été tenues à certaines étapes clés du stage, permettant de présenter l avancement du projet et les résultats obtenus, et ainsi de discuter des préférences des biologistes et, si besoin, de mettre à jour le cahier des charges. Ces réunions se faisaient en présence du responsable de l équipe Giacomo CAVALLI, du chargé de projet 3C Thomas SEXTON, de mon maître de stage Aubin THOMAS, de moi-même, et parfois également du chargé de bio-analyse de domaines chromatiniens Benjamin LEBLANC. II.2) Méthode de programmation Afin de développer les programmes de manière plus efficace et pour qu ils soient plus faciles à modifier, il a été décidé de respecter une méthode de programmation* fréquemment utilisée par les développeurs* de logiciels, l extreme programming [16]. II.2.1) Rappel sur les techniques de programmation Les techniques de programmation correspondent à des méthodologies qui ont été conçues par des professionnels de l informatique pour le développement de logiciels. 8

28 Tableau I : Détails des cycles de programmation des applications SMIF et PMIF Source personnelle Cycle Tâche Détail Période - Prétraitement des données Développement de la - Analyse de la structure de la base de partie enregistrement données 02/04/10-1 automatique des - Choix du langage et des librairies 10/05/10 données de 3C du utilisés programme SMIF -Programmation + tests Développement du type de visualisation 0 (type test) pour les données de 3C du programme PMIF Développement du type de visualisation 1 pour les données de 3C du programme PMIF Développement du type de visualisation 2 pour les données de 3C du programme PMIF Développement du type de visualisation 3 pour les données de 3C du programme PMIF Développement de la partie enregistrement automatique des données de 3C du programme SMIF Développement des types de visualisation 0 (type test), 1 et 2 pour les données de ChIP-Seq du programme PMIF Intégration du programme PMIF sur le serveur de l équipe - Conception de la structure du programme (définition des classes, utilisation des patrons de conception, ) - Définition du type 0 (résultats sous la forme d un fichier texte) - Programmation + tests - Définition du type 1 (graphique simple de type XY, une seule couleur) - Choix de la librairie graphique - Programmation + tests - Définition du type 2 (graphique simple de type XY, plusieurs couleurs) - Choix de la palette de couleur - Programmation + tests - Définition du type 3 (graphique de type histogramme) - Programmation + tests - Ajout de nouvelles tables dans la base de données - Programmation (adaptation de la partie développée pour les données de 3C) + tests - Définition du type 1 (graphique de type profile, deux couleurs) - Définition du type 2 (graphique de type profile, trois couleurs) - Choix de la palette de couleur - Programmation (adaptation de la partie développée pour les données de 3C) + tests - Installation des librairies sur le serveur - Création de la nouvelle commande de compilation 10/05/10-14/05/10 10/05/10-26/05/10 27/05/10-09/06/10 10/06/10-16/06/10 10/06/10-12/06/10 10/06/10-07/07/10 08/07/10-16/07/10

29 Elles représentent pour les programmeurs un modèle utilisé pour structurer, planifier et contrôler le processus de développement d un logiciel. II.2.2) Extreme programming et cycles de développement courts L extreme programming est «une méthode agile de gestion de projet informatique adaptée aux équipes réduites avec des besoins changeants» [16]. Cela signifie que c est une méthode de développement de logiciel où le client (ici le biologiste) est impliqué au maximum, ce qui permet d être très réactif à ses demandes et ainsi d obtenir de sa part une réelle satisfaction vis-à-vis du produit créé. Cela implique l application de principes simples poussés à l extrême et impose une véritable discipline et une rigueur dans la programmation. L extreme programming repose sur des cycles de développement courts (quelques semaines) permettant de développer le logiciel par étapes, en commençant par la partie la plus basique et en rajoutant au fur et à mesure de nouvelles fonctionnalités. Chaque cycle comporte quatre grandes étapes : une phase d exploration qui détermine quelles fonctionnalités seront développées durant ce cycle, une phase de conversion du travail à effectuer en tâches précises et concrètes et de définition des tests à effectuer, une phase de développement et des tests, et une phase de présentation du produit au client. L un des aspects importants de cette technique est le travail en binôme : une personne travaille sur le code* à écrire, et une autre lui suggère de nouvelles possibilités et tente de déceler les éventuelles erreurs. Cette technique a été suivie durant la conception des programmes SMIF et PMIF, car elle permet de développer les programmes par étapes, en garantissant la stabilité et la validation du programme à la fin de chacune d entre elles. Elle permet également de garder une certaine flexibilité, ce qui assure une meilleure réactivité en cas de changements à apporter. Ainsi, les programmes ont été développés en respectant le rythme de cycles de développement de quelques semaines (voir tableau I). A chaque cycle correspondait un objectif précis à atteindre défini au début du cycle. Chacun de ces cycles comportait une phase de développement de la nouvelle fonctionnalité, une 9

30 Figure 4 : Schéma simplifié de la base de données Source personnelle

31 phase de tests et une phase de rédaction de rapport de programmation. Une fois l objectif atteint et les résultats validés par les personnes impliquées dans le projet, un nouvel objectif était défini, démarrant ainsi un nouveau cycle de développement. Plusieurs cycles ont également été effectués en parallèle, lorsque leurs réalisations n étaient pas dépendantes. III) Choix techniques III.1) Stockage des données III.1.1) Choix d une solution de stockage Les données expérimentales obtenues grâce aux technologies 3C et ChIP-Seq sont d abord stockées sous la forme de fichiers texte. Bien que ces fichiers respectent une organisation et une certaine mise en forme, ce mode de stockage n est pas pratique. En effet, il ne permet pas les croisements entre les données et l usage multi-utilisateurs (l utilisation des données par plusieurs utilisateurs simultanément). De plus, il n est pas possible de sélectionner de manière simple et rapide des données d intérêt se trouvant parmi toutes les autres. Il existe pour cela une solution de stockage plus structurée et qui permet de manipuler les données beaucoup plus facilement : les bases de données [17] (voir annexe 6 et figure 4). Une base de données est un dispositif informatique permettant de stocker des données de manière structurée et adaptée à l usage que l on souhaite en faire. Les données sont enregistrées dans des «tables», qui sont les équivalents de tableaux ayant chacun une structure propre. Ce type de structuration des données permet de d effectuer des requêtes*, dans le but de sélectionner certaines données en appliquant des filtres. Par exemple, dans le cas des données de l équipe, il est possible de ne sélectionner que les données qui correspondent à un domaine sur un chromosome précis, ou à une expérience particulière, etc. L un des avantages importants d une base de données est qu elle peut être «répartie», c'est-à-dire enregistrée sur une machine distante (par exemple un serveur*) et accessible par réseau*. 10

32 Tableau II : Exemple d application du programme de pré-traitement des données (les deux extraits ont été choisis aléatoirement dans les fichiers) Avant, à chaque ligne du fichier : o Des informations concernant l expérience o Le nom du premier chromosome impliqué dans l interaction o La position de l interaction sur ce premier chromosome o Le brin (sens (+) ou antisens (-)) de ce premier chromosome impliqué dans l interaction o Le nom du deuxième chromosome impliqué dans l interaction o o La position de l interaction sur ce deuxième chromosome Le brin (sens (+) ou antisens (-)) de ce deuxième chromosome impliqué dans l interaction Après, à chaque ligne du fichier : o Le nom du premier chromosome impliqué dans les interactions o La position de la région sur ce premier chromosome impliquée dans les interactions o Le nom du deuxième chromosome impliqué dans les interactions o La position de la région sur ce deuxième chromosome impliquée dans les interactions o Le nombre d interactions retrouvées entre ces deux régions Source personnelle Etat Avant prétraitement Après prétraitement Extraits des fichiers HWI-EAS387_0001:3:62:60:946#0 3L L 84 + HWI-EAS387_0001:3:47:1346:307#0 3L L HWI-EAS387_0001:3:38:94:557#0 3R L HWI-EAS387_0001:3:26:294:133#0 X L HWI-EAS387_0001:3:75:1479:437#0 3L L HWI-EAS387_0001:3:10:1016:1810#0 3R L HWI-EAS387_0001:3:44:1069:452#0 3L L HWI-EAS387_0001:3:58:581:904#0 3L L HWI-EAS387_0001:3:29:271:806#0 3L 508-2L HWI-EAS387_0001:3:58:1550:17#0 3L L L L L L L L L L L L L L L L L L L L L L

33 Pour utiliser et gérer des bases de données, il est nécessaire d utiliser un logiciel appelé SGBD pour Système de Gestion de Bases de Données. Il existe de nombreux logiciels de ce type, les plus connus étant Microsoft Access, Microsoft SQL server, Oracle, MySQL [18] ou encore PostgreSQL. Chacun de ces logiciels possède des avantages et des inconvénients, ainsi que des caractéristiques techniques particulières (telles que la compatibilité avec le système d exploitation* de la machine) qui sont à prendre en considération lors du choix du SGBD qui va être utilisé. Pour la base de données devant contenir les données expérimentales de l équipe, nous avons opté pour le logiciel MySQL. En effet, celui-ci est compatible avec les systèmes d exploitation Unix* présents sur les serveurs utilisés par l équipe, est performant et stable et présente l avantage d être gratuit. III.1.2) Prétraitement des données Les données expérimentales obtenues grâce à la technologie 3C, qui correspondent à des données d interactions chromosomiques, sont enregistrées sous forme de fichiers texte au format suivant : à chaque ligne correspond une interaction, celle-ci étant représentée par ses positions sur les deux chromosomes impliqués dans l interaction, et des informations complémentaires. Il a été décidé de traiter ces données avant de les enregistrer dans la base de données, afin de ne conserver de réduire le volume des données et de ne conserver que celles étant nécessaires pour la visualisation. Pour cela, un programme a été créé, permettant d organiser les données en «fenêtres» de 1000 pb et supprimer les informations non indispensables. Cette taille de 1000 pb a été choisie car les fragments capturés pour être séquencés faisaient de 400 à 800 pb de long. Pour chaque position d interaction, la marge est donc de 800 pb maximum, ce qui signifie que la position est sûre à 800 pb près. Le nouveau fichier texte créé par ce programme contient, à chaque ligne, un couple fenêtre 1/fenêtre 2 et le nombre d interactions entre les régions représentées par ces deux fenêtres (voir tableau II). Ce programme a été créé en langage Perl [19], car ce langage permet de créer des applications traitant efficacement des fichiers texte de manière relativement simple et rapide. Les données expérimentales obtenues grâce à la technologie ChIP-Seq, quant à elles, sont issues d expériences visant à mesurer la fixation de protéines sur les 11

34

35 chromosomes. L échantillonnage des valeurs est d une fréquence de 10 pb et, comme les fragments séquencés ont une taille de 200 pb, la précision est de 200 pb. Ces données sont également stockées sous la forme de fichiers texte. Chaque fichier correspond à une expérience précise (mesure de la fixation d une protéine particulière sur un groupe d individus) et, à chaque ligne correspond une valeur obtenue à une position particulière d un chromosome. Malgré le volume important de ces données expérimentales, il a été décidé de ne pas les réorganiser en «fenêtres» comme cela a été le cas pour les données obtenues grâce à la technologie 3C. En effet, l un des principaux avantages de la technologie ChIP-Seq est de générer des données précises, et il est important de garder cette précision pour obtenir une visualisation la plus juste possible. III.1.3) Enregistrement des données En raison du volume important de données expérimentales à enregistrer dans la base de données, il n était pas envisageable de les insérer une par une manuellement. Il a donc été nécessaire de créer une solution automatique d enregistrement des données, le programme SMIF. Après concertation avec mon maître de stage, Aubin THOMAS, c est également le langage Perl qui a été choisi pour réaliser ce logiciel d enregistrement automatique dans la base de données. En effet, comme dit précédemment, ce langage permet de créer des programmes qui traitent efficacement et rapidement les fichiers, et il existe une librairie* spécialisée, DBI [20], qui permet d assurer la communication entre un programme Perl et une base de données MySQL. Cette librairie contient toute une série de fonctions* permettant de se connecter à la base de données, d insérer des données, d effectuer des requêtes de sélections, etc. Une autre librairie, appelée YAML [21], a également été utilisée pour lire les fichiers de type YAML [22] (voir annexe 7), qui contenaient les informations relatives à chaque lot de données insérées dans la base de données (ces informations étant également enregistrées dans la base de données et reliées aux données expérimentales). 12

36

37 III.2) Programme de visualisation PMIF III.2.1) Langage de programmation Il fallait choisir un langage de programmation pour le programme de visualisation PMIF qui possède les avantages suivants : rapidité d exécution : le programme devant s intégrer dans un jeu de webservices accessibles par Internet, il est nécessaire qu il s exécute rapidement pour ne pas entraîner trop d attente pour les utilisateurs, consommation de mémoire* minimisée : le volume des données à traiter étant très important, les calculs à effectuer le sont également, ce qui peut entraîner une consommation d espace mémoire critique (une consommation de mémoire supérieure à l espace disponible engendre des problèmes lors de l exécution du programme), langage orienté objet : afin de faciliter la programmation et la reprise du code, le langage doit être orienté objet pour permettre la création de classes* et d objets* (voir annexe 8), un nombre important de librairies compatibles avec le langage : le programme doit traiter des fichiers de type XML [23] [24] et YAML, interagir avec des bases de données, générer des graphiques, il est donc utile d utiliser des librairies riches permettant de ne pas réécrire certaines fonctions déjà existantes. De plus, il était nécessaire d opter pour un langage connu et maîtrisé par mon maître de stage, Aubin THOMAS, car c est lui qui assurera la maintenance et les mises à jour du programme après la fin du stage. Au vu de tous ces critères, il a été convenu d utiliser le langage C++ [1] [25] pour l écriture du programme, un langage compilé* rapide et performant, qui permet la programmation orientée objet et pour lequel de nombreuses librairies ont été développées. III.2.2) Structuration du programme Afin de faciliter la maintenance et la reprise du code par un autre programmeur, nous avons choisi de structurer le programme en suivant des modèles de structuration de code appelés patrons de conception [26]. 13

38 Figure 5 : Schéma simplifié du modèle MVC Source :

Atelier 5/11/2013. Structure de la chromatine et marques épigénétiques

Atelier 5/11/2013. Structure de la chromatine et marques épigénétiques Atelier 5/11/2013 Structure de la chromatine et marques épigénétiques La chromatine ADN ADN + Histones = Nucleosome ADN + Protéines + ARNs = Chromatine Niveau extrême de condensation = Chromosome métaphasique

Plus en détail

Cahier des charges. Jonathan HAEHNEL. Université de Strasbourg IUT Robert Schuman

Cahier des charges. Jonathan HAEHNEL. Université de Strasbourg IUT Robert Schuman Université de Strasbourg IUT Robert Schuman Maître de stage : Nicolas Lachiche Tuteur universitaire : Marie-Paule Muller Cahier des charges Jonathan HAEHNEL Strasbourg, le 6 mai 2011 Table des matières

Plus en détail

Influence du nombre de réplicats dans une analyse différentielle de données RNAseq

Influence du nombre de réplicats dans une analyse différentielle de données RNAseq Influence du nombre de réplicats dans une analyse différentielle de données RNAseq Statisticiens: Sophie Lamarre Steve Van Ginkel Sébastien Déjean - Magali San Cristobal Matthieu Vignes Biologistes: Stéphane

Plus en détail

Professeur-superviseur Alain April

Professeur-superviseur Alain April RAPPORT TECHNIQUE PRÉSENTÉ À L ÉCOLE DE TECHNOLOGIE SUPÉRIEURE DANS LE CADRE DU COURS LOG792 PROJET DE FIN D ÉTUDES EN GÉNIE LOGICIEL PHP PROJECT TRACKER GESTIONNAIRE DE PROJECT LOGICIEL LOUIS-ALEXANDRE

Plus en détail

SOMMAIRE. I. Introduction 02. II. Glossaire 03 a. Glossaire technique 03 b. Glossaire fonctionnel 04

SOMMAIRE. I. Introduction 02. II. Glossaire 03 a. Glossaire technique 03 b. Glossaire fonctionnel 04 SOMMAIRE I. Introduction 02 II. Glossaire 03 a. Glossaire technique 03 b. Glossaire fonctionnel 04 III. Présentation de l'association 05 a. Présentation juridique et géographique 05 b. Présentation de

Plus en détail

RAPPORT DE STAGE Calcul parallèle sur GPU

RAPPORT DE STAGE Calcul parallèle sur GPU Université Joseph Fourier Département Licence Sciences & Technologie RAPPORT DE STAGE Calcul parallèle sur GPU D Aguanno Carlotta Laboratoire d accueil : INRIA Directeur du laboratoire : GROS Patrick Responsable

Plus en détail

Objectifs. Maîtriser. Pratiquer

Objectifs. Maîtriser. Pratiquer 1 Bases de Données Objectifs Maîtriser les concepts d un SGBD relationnel Les modèles de représentations de données Les modèles de représentations de données La conception d une base de données Pratiquer

Plus en détail

Institut Paul Hankar

Institut Paul Hankar BES WEBDESIGNER ACTIVITE En utilisant des outils informatiques, le web designer réalise des éléments graphiques fixes ou animés, en 2 ou 3 dimensions, en respectant le schéma de navigation du site et sa

Plus en détail

Outils de gestion des ressources biologiques

Outils de gestion des ressources biologiques Le Cahier des Techniques de l INRA 2015 (84) N 1 Outils de gestion des ressources biologiques Frédéric Sanchez 1 *, Tou Cheu Xiong 1 Résumé. Les recherches en biologie génèrent un grand nombre d échantillons

Plus en détail

LIVRE BLANC Pratiques recommandées pour l utilisation de Diskeeper sur les réseaux SAN (Storage Area Networks)

LIVRE BLANC Pratiques recommandées pour l utilisation de Diskeeper sur les réseaux SAN (Storage Area Networks) LIVRE BLANC Pratiques recommandées pour l utilisation de Diskeeper sur les réseaux SAN (Storage Area Networks) Think Faster. [Pensez plus vite] Visitez Condusiv.com RECOMMANDATIONS D UTILISATION DE DISKEEPER

Plus en détail

RAPPORT DE MISSION GUADELOUPE DU 13 AU 26 MARS 2010 Mise en place du système d information CASBAN Base de données et application Ressources

RAPPORT DE MISSION GUADELOUPE DU 13 AU 26 MARS 2010 Mise en place du système d information CASBAN Base de données et application Ressources RAPPORT DE MISSION GUADELOUPE DU 13 AU 26 MARS 2010 Mise en place du système d information CASBAN Base de données et application Ressources Génétiques Bananes et Gestion du programme d Amélioration Jacquemoud

Plus en détail

IBM Tivoli Monitoring

IBM Tivoli Monitoring Surveiller et gérer les ressources vitales et les mesures sur diverses plates-formes à partir d une seule console IBM Tivoli Monitoring Points forts Surveille de manière proactive Aide à réduire les coûts

Plus en détail

Compte-Rendu SDL. «Reprise de l application de gestion de listes de présences des alternants»

Compte-Rendu SDL. «Reprise de l application de gestion de listes de présences des alternants» Compte-Rendu SDL Auteurs : BOUTROUILLE Alexis BAILLEUL Pierre Tuteur : Ioan Marius Bilasco «Reprise de l application de gestion de listes de présences des alternants» Master MIAGE 1 Année 2012/2013 1 Remerciements

Plus en détail

Résumé de thèse de David Kieffer. Titre : Études Bio-informatiques et statistiques des mécanismes de l infidélité de la transcription.

Résumé de thèse de David Kieffer. Titre : Études Bio-informatiques et statistiques des mécanismes de l infidélité de la transcription. Résumé de thèse de David Kieffer Titre : Études Bio-informatiques et statistiques des mécanismes de l infidélité de la transcription. Dans le cadre de la lutte contre le cancer, l'entreprise Genclis (Genomic

Plus en détail

Gestion du parc informatique matériel et logiciel de l Ensicaen. Rapport de projet. Spécialité Informatique 2 e année. SAKHI Taoufik SIFAOUI Mohammed

Gestion du parc informatique matériel et logiciel de l Ensicaen. Rapport de projet. Spécialité Informatique 2 e année. SAKHI Taoufik SIFAOUI Mohammed 6, bd maréchal Juin F-14050 Caen cedex 4 Spécialité Informatique 2 e année Rapport de projet Gestion du parc informatique matériel et logiciel de l Ensicaen SAKHI Taoufik SIFAOUI Mohammed Suivi ENSICAEN

Plus en détail

Présentation du module Base de données spatio-temporelles

Présentation du module Base de données spatio-temporelles Présentation du module Base de données spatio-temporelles S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Partie 1 : Notion de bases de données (12,5h ) Enjeux et principes

Plus en détail

Cumulo Numbio 2015. La révolution next-generation sequencing et les enjeux de l'expansion de la bioinformatique pour les biologistes.

Cumulo Numbio 2015. La révolution next-generation sequencing et les enjeux de l'expansion de la bioinformatique pour les biologistes. Cumulo Numbio 2015 La révolution next-generation sequencing et les enjeux de l'expansion de la bioinformatique pour les biologistes. Human genome sequence June 26th 2000: official announcement of the completion

Plus en détail

Projet Java/C# -> «BeloteTime» - CNAM 1 ère Année Groupe : Cédric Leclinche Valentin Metz Jacky Petrazoller Mathieu Uffler.

Projet Java/C# -> «BeloteTime» - CNAM 1 ère Année Groupe : Cédric Leclinche Valentin Metz Jacky Petrazoller Mathieu Uffler. Projet Java/C# -> «BeloteTime» - CNAM 1 ère Année Groupe : Cédric Leclinche Valentin Metz Jacky Petrazoller Mathieu Uffler BeloteTime Page 1 Sommaire Contenu Introduction... 3 Gestion de Projet... 4 Démarche

Plus en détail

Les templates. Chapitre 7. 1. Principes et généralités

Les templates. Chapitre 7. 1. Principes et généralités 351 Chapitre 7 Les templates 1. Principes et généralités Les templates Nous utilisons le mot anglais de template, car il est communément utilisé, répandu, et compris dans ce contexte par les professionnels.

Plus en détail

Team Foundation Server Côté chef de projet

Team Foundation Server Côté chef de projet Team Foundation Server Côté chef de projet Version 1.0 Z Sylvain Lieu Franck Boisgibault 2 Chapitre 03 - Partie chef de projet Sommaire 1 Introduction... 3 2 Rôles et groupes... 4 2.1 Groupes par défaut...

Plus en détail

Applications orientées données (NSY135)

Applications orientées données (NSY135) Applications orientées données (NSY135) 2 Applications Web Dynamiques Auteurs: Raphaël Fournier-S niehotta et Philippe Rigaux (philippe.rigaux@cnam.fr,fournier@cnam.fr) Département d informatique Conservatoire

Plus en détail

Introduction aux bases de données: application en biologie

Introduction aux bases de données: application en biologie Introduction aux bases de données: application en biologie D. Puthier 1 1 ERM206/Technologies Avancées pour le Génome et la Clinique, http://tagc.univ-mrs.fr/staff/puthier, puthier@tagc.univ-mrs.fr ESIL,

Plus en détail

Gestion du serveur WHS 2011

Gestion du serveur WHS 2011 Chapitre 15 Gestion du serveur WHS 2011 Les principales commandes Windows Home Server 2011 reprend l ergonomie de Windows 7 et intègre les principales commandes de Windows Server 2008 R2. Les commandes

Plus en détail

Le génie Logiciel (suite)

Le génie Logiciel (suite) Le génie Logiciel (suite) Lors du cours précédent, on a étudié différents cycles de vie, dont la cascade, ou la spirale. Analyse des besoins L analyse des besoins est une étape menant à l élaboration de

Plus en détail

LES OUTILS DE LA GESTION DE PROJET

LES OUTILS DE LA GESTION DE PROJET LES OUTILS DE LA GESTION DE PROJET PROJET : «ensemble des actions à entreprendre afin de répondre à un besoin défini dans des délais fixés». Délimité dans le temps avec un début et une fin, mobilisant

Plus en détail

11 Février 2014 Paris nidays.fr. ni.com

11 Février 2014 Paris nidays.fr. ni.com 11 Février 2014 Paris nidays.fr 1 Choisir la bonne architecture logicielle pour automatiser les systèmes de test Jérémy Charavet Ingénieur d Applications, National Instruments France Une architecture logicielle

Plus en détail

Projet 2. Gestion des services enseignants CENTRE D ENSEIGNEMENT ET DE RECHERCHE EN INFORMATIQUE. G r o u p e :

Projet 2. Gestion des services enseignants CENTRE D ENSEIGNEMENT ET DE RECHERCHE EN INFORMATIQUE. G r o u p e : CENTRE D ENSEIGNEMENT ET DE RECHERCHE EN INFORMATIQUE Projet 2 Gestion des services enseignants G r o u p e : B E L G H I T Y a s m i n e S A N C H E Z - D U B R O N T Y u r i f e r M O N T A Z E R S i

Plus en détail

Annexe 4 Programmes des classes préparatoires aux Grandes Ecoles

Annexe 4 Programmes des classes préparatoires aux Grandes Ecoles Annexe 4 Programmes des classes préparatoires aux Grandes Ecoles Filière : scientifique Voie : Technologie et biologie (TB) Discipline : Informatique Première et seconde années Programme d informatique

Plus en détail

Joomla : un système de gestion de contenu

Joomla : un système de gestion de contenu CHAPITRE 2 Joomla : un système de gestion de contenu Si SGC est l abréviation française pour système de gestion de contenu, l abréviation CMS de l anglais Content Management System est le terme le plus

Plus en détail

Guillaume SOLDERA (B guillaume.soldera@serli.fr) SERLI Informatique Bull OW2 Consortium. Comparatif Choco/Drools dans le cadre du projet JASMINe

Guillaume SOLDERA (B guillaume.soldera@serli.fr) SERLI Informatique Bull OW2 Consortium. Comparatif Choco/Drools dans le cadre du projet JASMINe Guillaume SOLDERA (B guillaume.soldera@serli.fr) SERLI Informatique Bull OW2 Consortium dans le cadre du projet JASMINe Avril 2008 Table des matières 1 Introduction 3 1.1 Rappel sur JASMINe.......................................

Plus en détail

Plateforme de capture et d analyse de sites Web AspirWeb

Plateforme de capture et d analyse de sites Web AspirWeb Projet Java ESIAL 2A 2009-2010 Plateforme de capture et d analyse de sites Web AspirWeb 1. Contexte Ce projet de deuxième année permet d approfondir par la pratique les méthodes et techniques acquises

Plus en détail

DataEncoder Guide Utilisateur

DataEncoder Guide Utilisateur DataEncoder Guide Utilisateur Document révision 04 Copyright 2011 ISLOG Network. Tout droit réservé. Historique de version Date Auteur Description Document Version 05/09/08 M Chamley Version initiale 00

Plus en détail

Installation Client (licence de site) de IBM SPSS Modeler 14.2

Installation Client (licence de site) de IBM SPSS Modeler 14.2 Installation Client (licence de site) de IBM SPSS Modeler 14.2 Les instructions suivantes permettent d installer IBM SPSS Modeler Client version 14.2 en utilisant un licence de site. Ce présent document

Plus en détail

Calendrier prévisionnel 07 Septembre 2015 Tarif HT 350 000FCFA

Calendrier prévisionnel 07 Septembre 2015 Tarif HT 350 000FCFA FORMATIONS 2015 2016 GOUVERNANCE SI Nos formations Types de formation Nos sessions de formations s adresse à tous les professionnels. Deux types de formations vous sont proposés: - séminaires de formations

Plus en détail

PRODUCTION DE JEUX DE DONNÉES ANONYMISÉES

PRODUCTION DE JEUX DE DONNÉES ANONYMISÉES PRODUCTION DE JEUX DE DONNÉES ANONYMISÉES Les contenus de ce document sont la propriété exclusive de la société REVER. Ils ne sont transmis qu à titre d information et ne peuvent en aucun cas être considérés

Plus en détail

CONDUITE & GESTION DE PROJET

CONDUITE & GESTION DE PROJET LES THEMES DU PROGRAMME PEDAGOGIQUE CONDUITE & GESTION DE PROJET Techniques de gestion de projets Connaître le rôle d un chef de projet dans la conduite de projet. Les méthodes, les techniques et les outils

Plus en détail

Cours Base de données relationnelles. M. Boughanem, IUP STRI

Cours Base de données relationnelles. M. Boughanem, IUP STRI Cours Base de données relationnelles 1 Plan 1. Notions de base 2. Modèle relationnel 3. SQL 2 Notions de base (1) Définition intuitive : une base de données est un ensemble d informations, (fichiers),

Plus en détail

CTE Éditeur de classification arborescente pour spécifications du cas de test

CTE Éditeur de classification arborescente pour spécifications du cas de test Tessy Test d intégration et unitaire dynamique automatisé pour des applications embarquées CTE Éditeur de classification arborescente pour spécifications du cas de test Le meilleur outil de test unitaire

Plus en détail

Gestion d une flotte de robots Configuration et ordre de missions

Gestion d une flotte de robots Configuration et ordre de missions Document Rapport Version Version 1.0 Date 25/03/2008 Auteur Ahmed RADOUA M1 SET Gestion d une flotte de robots Configuration et ordre de missions INSSET UPJV 1 ième année de MASTER Spécialité : (Année

Plus en détail

Découvrez la gestion collaborative multi-projet grâce à la. solution Project EPM

Découvrez la gestion collaborative multi-projet grâce à la. solution Project EPM Découvrez la gestion collaborative multi-projet grâce à la solution Project EPM Project EPM 2007 est la solution de gestion de projets collaborative de Microsoft. Issue d une longue expérience dans le

Plus en détail

Transit NXT. Traduction et localisation contextuelles. L ergonomie et l innovation fonctionnelle au service de la productivité

Transit NXT. Traduction et localisation contextuelles. L ergonomie et l innovation fonctionnelle au service de la productivité Transit NXT Traduction et localisation contextuelles L ergonomie et l innovation fonctionnelle au service de la productivité STAR Group Your single-source provider for corporate product communication Transit

Plus en détail

Obtention de données génétiques à grande échelle

Obtention de données génétiques à grande échelle Obtention de données génétiques à grande échelle Stéphanie FERREIRA Ph.D. Campus de l Institut Pasteur de Lille 1, rue du Professeur Calmette 59000 LILLE Tel : 03 20 87 71 53 Fax : 03 20 87 72 64 contact@genoscreen.fr

Plus en détail

Conception de la base de données

Conception de la base de données Rapport T.E.R HLIN405 Conception de la base de données des projets de licence deuxième et troisième année Réalisé par Achraf Tajani Cvete Maceski Mohamed Bareche Sous l encadrement de Christian Retoré

Plus en détail

Dream Report. Dream Report vs Reporting Services

Dream Report. Dream Report vs Reporting Services Dream Report Dream Report vs Reporting Services Date : Mars 2015 A propos de Dream Report Dream Report est le 1 er logiciel d édition de rapport prêt à l emploi offrant aux utilisateurs la possibilité

Plus en détail

Présentation de Microsoft PowerPoint 2010

Présentation de Microsoft PowerPoint 2010 Université du Havre UFR des Sciences et Techniques Date : 26/08/2012 Version : 1.0 Nombre de pages : 27 COURS Microsoft Office 2010 Titre du document Présentation de Microsoft PowerPoint 2010 Noms Dates

Plus en détail

S8 - INFORMATIQUE COMMERCIALE

S8 - INFORMATIQUE COMMERCIALE S8 - INFORMATIQUE COMMERCIALE Les savoirs de l Informatique Commerciale doivent être abordés en relation avec les autres savoirs (S4 à S7). Les objectifs généraux sont : o de sensibiliser les étudiants

Plus en détail

Gestion de bases de données bibliographiques

Gestion de bases de données bibliographiques Gestion de bases de données bibliographiques Création et gestion d une base de données bibliographiques Création de rapports (bibliographies dans un traitement de texte) 1. Installer l extension Zotero

Plus en détail

SONDY : une plateforme open-source d analyse et de fouille pour les réseaux sociaux en ligne

SONDY : une plateforme open-source d analyse et de fouille pour les réseaux sociaux en ligne SONDY : une plateforme open-source d analyse et de fouille pour les réseaux sociaux en ligne Adrien GUILLE, C. Favre, Djamel Abdelkader Zighed To cite this version: Adrien GUILLE, C. Favre, Djamel Abdelkader

Plus en détail

Systèmes de Gestion de Contenu

Systèmes de Gestion de Contenu Introduction à SPIP Master 1 CAWEB Page 1/1 SPIP http://demo.spip.org/ SPIP (acronyme récursif de «Système de Publication pour l Internet Spip») est l'un des logiciels libres de gestion de contenu parmi

Plus en détail

france.ni.com Journée technique Du contrôle d instruments au banc de test

france.ni.com Journée technique Du contrôle d instruments au banc de test Journée technique Du contrôle d instruments au banc de test Quelles approches pour analyser vos données, Excel, LabVIEW, fichiers scripts, NI DIAdem National Instruments France Industries et applications

Plus en détail

NVU, Notepad++ (ou le bloc-note), MySQL, PhpMyAdmin. HTML, PHP, cas d utilisation, maquettage, programmation connaissances en HTML, PHP et SQL

NVU, Notepad++ (ou le bloc-note), MySQL, PhpMyAdmin. HTML, PHP, cas d utilisation, maquettage, programmation connaissances en HTML, PHP et SQL Prise en main de NVU et Notepad++ (conception d application web avec PHP et MySql) Propriétés Intitulé long Formation concernée Matière Présentation Description Conception de pages web dynamiques à l aide

Plus en détail

201-8F4-ST Mathématiques appliquées à l informatique

201-8F4-ST Mathématiques appliquées à l informatique DESCRIPTION DES COURS DE FORMATION SPÉCIFIQUE TECHNIQUES DE L INFORMATIQUE (420.A0) 201-8F4-ST Mathématiques appliquées à l informatique Préalable : Mathématique TS ou SN 5 e ou équivalent Ce cours a pour

Plus en détail

Guide de démarrage rapide de WinReporter

Guide de démarrage rapide de WinReporter Guide de démarrage rapide de WinReporter Pour plus d information à propos de WinReporter, vous pouvez contacter IS Decisions à : Tél : +33 (0)5.59.41.42.20 (Heure française : GMT +1) Fax : +33 (0)5.59.41.42.21

Plus en détail

Séquençage. Bérénice Batut, berenice.batut@udamail.fr. DUT Génie Biologique Option Bioinformatique Année 2014-2015

Séquençage. Bérénice Batut, berenice.batut@udamail.fr. DUT Génie Biologique Option Bioinformatique Année 2014-2015 Séquençage Bérénice Batut, berenice.batut@udamail.fr DUT Génie Biologique Option Bioinformatique Année 2014-2015 Séquençage Séquençage ADN Détermination de l ordre d enchainement des nucléotides d un fragment

Plus en détail

ETNA Projet de Fin d Étude 2005-2007 RimElse Cahier des charges. c Copyleft 2006, ELSE Team

ETNA Projet de Fin d Étude 2005-2007 RimElse Cahier des charges. c Copyleft 2006, ELSE Team ETNA Projet de Fin d Étude 2005-2007 RimElse Cahier des charges c Copyleft 2006, ELSE Team 18 avril 2006 Table des matières 1 Introduction 2 2 Présentation du projet 3 2.1 Une distribution Évolulable..................

Plus en détail

Introduction 3. GIMI Gestion des demandes d intervention 5

Introduction 3. GIMI Gestion des demandes d intervention 5 SOMMAIRE Gestion Help Desk de - parc Service Desk Introduction 3 GIMI Gestion des demandes d intervention 5 1 Schéma de principe et description des rôles 6 2 Principe de fonctionnement 8 Interface Demandeur

Plus en détail

SchoolPoint Manuel utilisateur

SchoolPoint Manuel utilisateur SchoolPoint Manuel utilisateur SchoolPoint - manuel d utilisation 1 Table des matières Présentation de SchoolPoint... 3 Accès au serveur...3 Interface de travail...4 Profil... 4 Echange de news... 4 SkyDrive...

Plus en détail

Généralités sur les bases de données

Généralités sur les bases de données Généralités sur les bases de données Qu est-ce donc qu une base de données? Que peut-on attendre d un système de gestion de bases de données? Que peut-on faire avec une base de données? 1 Des données?

Plus en détail

Formation Tutorée A Distance (FTAD) en BUREAUTIQUE

Formation Tutorée A Distance (FTAD) en BUREAUTIQUE Durée : 20 heures (Sur 2 mois maximum) Positionnement et parcours individuel de formation. Plate-forme de formation incluant cours, exercices et évaluation en ligne, disponibles 24 H/24, 7 j/7. 4 cours

Plus en détail

Conception assistée par ordinateur de molécules thérapeutiques

Conception assistée par ordinateur de molécules thérapeutiques Conception assistée par ordinateur de molécules thérapeutiques D. Gilis Bioinformatique génomique et structurale Faculté des sciences appliquées Université Libre de Bruxelles Objectif: illustrer en quoi

Plus en détail

Club photo / Maxime Storn

Club photo / Maxime Storn Club photo / Maxime Storn Introduction Logiciel Logiciel de gestion de références bibliographiques Libre et open-source Traduit en 30 langues Extension destinée à Mozilla Firefox Compatible avec Microsoft

Plus en détail

Installation Client (licence réseau) de IBM SPSS Modeler 14.2

Installation Client (licence réseau) de IBM SPSS Modeler 14.2 Installation Client (licence réseau) de IBM SPSS Modeler 14.2 Les instructions suivantes permettent d installer IBM SPSS Modeler Client version 14.2 en utilisant un licence réseau. Ce présent document

Plus en détail

Master CCI. Compétences Complémentaires en Informatique. Livret de l étudiant

Master CCI. Compétences Complémentaires en Informatique. Livret de l étudiant Master CCI Compétences Complémentaires en Informatique Livret de l étudiant 2014 2015 Master CCI Le Master CCI (Compétences Complémentaires en Informatique) permet à des étudiants de niveau M1 ou M2 dans

Plus en détail

Évaluation et implémentation des langages

Évaluation et implémentation des langages Évaluation et implémentation des langages Les langages de programmation et le processus de programmation Critères de conception et d évaluation des langages de programmation Les fondations de l implémentation

Plus en détail

IBM Tivoli Monitoring, version 6.1

IBM Tivoli Monitoring, version 6.1 Superviser et administrer à partir d une unique console l ensemble de vos ressources, plates-formes et applications. IBM Tivoli Monitoring, version 6.1 Points forts! Surveillez de façon proactive les éléments

Plus en détail

D1.2 Management (MGMT) Exploiting the Cloud to make sensor data collection scalable

D1.2 Management (MGMT) Exploiting the Cloud to make sensor data collection scalable Projet de fin d'études [E] 2012-2013 D1.2 Management (MGMT) Exploiting the Cloud to make sensor data collection scalable Participants : Robin Monjo, robinmonjo@gmail.com, SI5 / Architecture Logicielle

Plus en détail

Annexe 4 Programmes des classes préparatoires aux Grandes Ecoles

Annexe 4 Programmes des classes préparatoires aux Grandes Ecoles Annexe 4 Programmes des classes préparatoires aux Grandes Ecoles Filière : scientifique Voie : Biologie, chimie, physique et sciences de la Terre (BCPST) Discipline : Informatique Première et seconde années

Plus en détail

Créer le schéma relationnel d une base de données ACCESS

Créer le schéma relationnel d une base de données ACCESS Utilisation du SGBD ACCESS Polycopié réalisé par Chihab Hanachi et Jean-Marc Thévenin Créer le schéma relationnel d une base de données ACCESS GENERALITES SUR ACCESS... 1 A PROPOS DE L UTILISATION D ACCESS...

Plus en détail

Morgan Beau Nicolas Courazier

Morgan Beau Nicolas Courazier EPSI - 2010 Rapport projet IA Conception et mise en œuvre d un générateur de systèmes experts Morgan Beau Sommaire Cahier des charges 3 Présentation générale 4 Analyse et modélisation 6 Le moteur d inférence

Plus en détail

Recueil des Fiches Concepteurs : Mise en œuvre d un site SharePoint 2013 Juin 2015

Recueil des Fiches Concepteurs : Mise en œuvre d un site SharePoint 2013 Juin 2015 Recueil des s s : Mise en œuvre d un site SharePoint 2013 Juin 2015 Ce document décrit le paramétrage pour la mise en œuvre des fonctionnalités standard de Microsoft SharePoint 2013. NADAP et SharePoint

Plus en détail

[Résumé: Intégration d un contrôle automatisé dans une station de test électrique]

[Résumé: Intégration d un contrôle automatisé dans une station de test électrique] SEPTEMBRE 2013 INSA de Strasbourg Génie électrique : Option énergie Par : Adnane BOUKHEFFA Tuteur Institutionnel : M. Guy STURTZER Réalisé au sein du Groupe Legrand 290 Avenue de Colmar, Strasbourg 67100

Plus en détail

Le service pack 6 (SP6) est le dernier disponible pour visual studio 6. Ce dernier devrait être maintenu par Microsoft jusqu en 2008.

Le service pack 6 (SP6) est le dernier disponible pour visual studio 6. Ce dernier devrait être maintenu par Microsoft jusqu en 2008. 1 CONCEPT DE BASE 1.1 Visual Basic 6 1.1.1 Pour quoi faire? VB est un langage de type RAD : «Rapid Application Development». Il permet de créer des applications rapidement grâce à une conception simple

Plus en détail

Etude et mise en oeuvre de PREEMPT-RT et Xenomai sur cible DSP Blackfin BF537

Etude et mise en oeuvre de PREEMPT-RT et Xenomai sur cible DSP Blackfin BF537 ENSEIRB-MATMECA Rapport de projet avancé 3 ème année électronique Etude et mise en oeuvre de PREEMPT-RT et Xenomai sur cible DSP Blackfin BF537 Etudiants : Alexandre Braconnier Axel Chevalier Jean-Marc

Plus en détail

CAHIER DES SPECIFICATIONS FONCTIONNELLES

CAHIER DES SPECIFICATIONS FONCTIONNELLES 2010/2011 INSTITUT SUP GALILEE CAHIER DES SPECIFICATIONS FONCTIONNELLES IHM XML O.N.E.R.A. Institut Sup Galilée O.N.E.R.A. Page 2 Sommaire I. Description du sujet... 4 II. Outils utilisés... 4 III. Description

Plus en détail

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation Base de données S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Présentation du module Contenu général Notion de bases de données Fondements / Conception Utilisation :

Plus en détail

TD séance n 2c Mise à jour des Systèmes

TD séance n 2c Mise à jour des Systèmes 1 Gestion des Logiciels 1.1 Introduction sur les logiciels Un logiciel est un programme nécessaire au fonctionnement d'un ordinateur (logiciel système) ou au traitement de données (logiciel applicatif).

Plus en détail

SIO-SISR : Projet GSB. LOT 1 : Evaluation d un logiciel d inventaire et de gestion de parc. BTS Services Informatiques aux Organisations 1 ère année

SIO-SISR : Projet GSB. LOT 1 : Evaluation d un logiciel d inventaire et de gestion de parc. BTS Services Informatiques aux Organisations 1 ère année SIO BTS Services Informatiques aux Organisations 1 ère année LOT 1 : Evaluation d un logiciel d inventaire et de gestion de parc Objectifs : LOT 1 : Evaluation d un logiciel d inventaire et de gestion

Plus en détail

L Edition Pilotée XL

L Edition Pilotée XL L Edition Pilotée XL Piloter son activité, une nécessité Processus décisionnel: «Exploiter les données de l entreprise dans le but de faciliter la prise de décision» Etre informé en permanence sur l état

Plus en détail

Programmation orientée objet et technologies Web

Programmation orientée objet et technologies Web Programmation orientée objet et technologies Web LEA.3N, version 2012 Information : (514) 376-1620, poste 7388 Programme de formation Type de sanction Attestation d études collégiales permettant de cumuler

Plus en détail

BIEN DÉMARRER AVEC OFFICE 2010

BIEN DÉMARRER AVEC OFFICE 2010 CHAPITRE 1 BIEN DÉMARRER AVEC OFFICE 2010 Connaître tous les outils d Office 2010... 13 Découvrir quelques nouveautés... 15 Découvrir le site internet d Office 2010... 18 Installer et activer le logiciel...

Plus en détail

INDUSTRIALISATION ET RATIONALISATION

INDUSTRIALISATION ET RATIONALISATION INDUSTRIALISATION ET RATIONALISATION A. LA PROBLEMATIQUE La mission de toute production informatique est de délivrer le service attendu par les utilisateurs. Ce service se compose de résultats de traitements

Plus en détail

INF2015 Développement de logiciels dans un environnement Agile. Examen final 24 avril 2014 17:30 à 20:30

INF2015 Développement de logiciels dans un environnement Agile. Examen final 24 avril 2014 17:30 à 20:30 Examen final 24 avril 2014 17:30 à 20:30 Nom, prénom : Code permanent : Répondez directement sur le questionnaire. Question #1 5% Qu'est-ce qu'un test de régression? Question #2 5% Selon extreme Programming,

Plus en détail

Développement itératif, évolutif et agile

Développement itératif, évolutif et agile Document Développement itératif, évolutif et agile Auteur Nicoleta SERGI Version 1.0 Date de sortie 23/11/2007 1. Processus Unifié Développement itératif, évolutif et agile Contrairement au cycle de vie

Plus en détail

Architecture intégrée d un système de visualisation cartographique des statistiques de pêche

Architecture intégrée d un système de visualisation cartographique des statistiques de pêche Architecture intégrée d un système de visualisation cartographique des statistiques de pêche (G. Domalain, M. Gras, P. Morand, C. Campaore) 1. Les attendus de la représentation cartographique dans le système

Plus en détail

PROJET D INFORMATISATION DE LA GESTION DES ABSENCES EN STARTER

PROJET D INFORMATISATION DE LA GESTION DES ABSENCES EN STARTER Année 2008/2009 PROJET D INFORMATISATION DE LA GESTION DES ABSENCES EN STARTER Licence Professionnelle Système informatique et logiciel Responsable du projet : Françoise GREFFIER SOMMAIRE I. PRESENTATION

Plus en détail

Université Bordeaux Segalen - PACES 2012-2013 ED UE9s Avril 2013

Université Bordeaux Segalen - PACES 2012-2013 ED UE9s Avril 2013 Sélectionner les propositions exactes Université Bordeaux Segalen - PACES 2012-2013 ED UE9s Avril 2013 QCM 1 La plupart des techniques de biologie moléculaire repose sur le principe de complémentarité

Plus en détail

White Paper - Livre Blanc

White Paper - Livre Blanc White Paper - Livre Blanc Développement d applications de supervision des systèmes d information Avec LoriotPro Vous disposez d un environnement informatique hétérogène et vous souhaitez à partir d une

Plus en détail

Structure en couches des systèmes informatiques

Structure en couches des systèmes informatiques Structure en couches des systèmes informatiques Vue simplifiée d un système informatique Ce que le simple utilisateur perçoit «à première vue» d un système informatique : Le boîtier (tour, desktop ou portable)

Plus en détail

Démarrez le Lecteur Windows Media

Démarrez le Lecteur Windows Media Le Lecteur Windows Media vous permet de rechercher et lire des fichiers multimédias numériques stockés sur votre ordinateur, de lire des CD et des DVD, ainsi que d afficher en continu du contenu multimédia

Plus en détail

OMI TP 2 : Outils numériques pour l apprentissage

OMI TP 2 : Outils numériques pour l apprentissage OMI TP 2 : Outils numériques pour l apprentissage Introduction aux Google Docs Google Documents permet de créer, stocker dans l internet et partager facilement des documents. Des outils collaboratifs permettent

Plus en détail

Projet Web. Tim Burton. Refonte complète du site de Tim Burton en utilisant les dernières technologies du web : HTML 5 / CSS 3 / JavaScript...

Projet Web. Tim Burton. Refonte complète du site de Tim Burton en utilisant les dernières technologies du web : HTML 5 / CSS 3 / JavaScript... Projet Web Tim Burton Refonte complète du site de Tim Burton en utilisant les dernières technologies du web : HTML 5 / CSS 3 / JavaScript... Par Omar EDDASSER L3 ISC parcours MIAGE Sous l enseignement

Plus en détail

Une plateforme adaptative pour la FOAD (Formation Ouverte et à Distance)

Une plateforme adaptative pour la FOAD (Formation Ouverte et à Distance) Une plateforme adaptative pour la FOAD (Formation Ouverte et à Distance) Bernard CAUSSE IUT de Bayonne Pays Basque Laboratoire d Informatique de l UPPA 3 Avenue Darrigrand 64100 Bayonne France Résumé Présentation

Plus en détail

Brique BDL Gestion de Projet Logiciel

Brique BDL Gestion de Projet Logiciel Brique BDL Gestion de Projet Logiciel Processus de développement pratiqué à l'enst Sylvie.Vignes@enst.fr url:http://www.infres.enst.fr/~vignes/bdl Poly: Computer elective project F.Gasperoni Brique BDL

Plus en détail

Rapport de méthodologie:

Rapport de méthodologie: Rapport de méthodologie: "Laboratoire on chip/lab-on-chip/loc" REMARQUE : La méthode employée est en tout point similaire à celle utilisée en groupe. Contents Rapport de méthodologie:... 1 "Laboratoire

Plus en détail

Migration du pack office 2003. Planification, préparation, déploiement et formation

Migration du pack office 2003. Planification, préparation, déploiement et formation Migration du pack office 2003 Planification, préparation, déploiement et formation Planification : Comment s y prendre pour assurer au mieux la migration? Deux solutions : La première solution consiste

Plus en détail

Biologie Cellulaire & Biologie Moléculaire

Biologie Cellulaire & Biologie Moléculaire Biologie Cellulaire & Biologie Moléculaire Cours n 5 : Mercredi 17 septembre 14h- 16h Chap. II Chromosome, épigénéfque, réparafon, domaines régulateurs L3 UE 5.2 EP1 2014-2015 99 Variabilité de lecture

Plus en détail

PROPOSITION D UNE FORMATION CONTINUE POUR LES PERSONNELS DES ETABLISSEMENTS D ENSEIGNEMENT SUPERIEUR

PROPOSITION D UNE FORMATION CONTINUE POUR LES PERSONNELS DES ETABLISSEMENTS D ENSEIGNEMENT SUPERIEUR PROPOSITION D UNE FORMATION CONTINUE POUR LES PERSONNELS DES ETABLISSEMENTS D ENSEIGNEMENT SUPERIEUR Mise en œuvre rapide de chaînes d acquisition / transmission du signal à l aide d un système «on chip»

Plus en détail