TP 1 : FOUILLE D ARN

Documents pareils
Leslie REGAD ; Gaëlle LELANDAIS. leslie.regad@univ- paris- diderot.fr ; gaelle.lelandais@univ- paris- diderot.fr

Combinaison de modèles phylogénétiques et longitudinaux pour l analyse des séquences biologiques : reconstruction de HMM profils ancestraux

CHAPITRE 3 LA SYNTHESE DES PROTEINES

PARTIE I Compte pour 75 %

Séquence 2. L expression du patrimoine génétique. Sommaire

CENTRE INTERNATIONAL D ETUDES SUPERIEURES EN SCIENCES AGRONOMIQUES MONTPELLIER SUPAGRO THESE. Pour obtenir le grade de

Insulinothérapie et diabète de type 1

Détermination du besoin en protéines de la canette mulard en phase de démarrage :

Tableau récapitulatif : composition nutritionnelle de la spiruline

Bases moléculaires des mutations Marc Jeanpierre

Univers Vivant Révision. Notions STE

NUTRINEAL MC PD4 MONOGRAPHIE. Solution d acides aminés à 1,1 % pour la dialyse péritonéale. Solution pour dialyse péritonéale

Production de Protéines d Organismes Unicellulaires Cultivés sur Corn Steep Liquor et Evaluation Nutritionnelle de la Biomasse

TD DOSAGE DE PROTEINES ET ELECTROPHORESE : PARTIE THÉORIQUE BST1 SVT

DOSSIER SCIENTIFIQUE DE L IFN N 9 LES PROTEINES

Séquence 1. Glycémie et diabète. Sommaire

VI- Expression du génome

OBJECTIFS. Savoir identifier les différents domaines des ondes électromagnétiques.

THEME 2. LE SPORT CHAP 1. MESURER LA MATIERE: LA MOLE

Détection des duplications en tandem au niveau nucléique à l'aide de la théorie des flots

CHAPITRE III /Glycémie-Diabète/ Le Diabète

Analyse d échantillons alimentaires pour la présence d organismes génétiquement modifiés

Activité physique et produits dérivés du soja : intérêts dans la prise en charge du stress oxydant associé au diabète de type 1

Journée SITG, Genève 15 octobre Nicolas Lachance-Bernard M.ATDR Doctorant, Laboratoire de systèmes d information géographique

SECTEUR 4 - Métiers de la santé et de l hygiène

EXERCICE II. SYNTHÈSE D UN ANESTHÉSIQUE : LA BENZOCAÏNE (9 points)

Partie Observer : Ondes et matière CHAP 04-ACT/DOC Analyse spectrale : Spectroscopies IR et RMN

NOTICE SIMPLIFIEE ER-A280F. I Initialisation avec Remise à Zéro de la caisse : ENTER PASSWORD ER-A280V. Ver1.02

Conventions d écriture et outils de mise au point

AVERTISSEMENT PREALABLE

CAHIER DES CLAUSES TECHNIQUES PARTICULIERES (CCTP)

TRAVAUX PRATIQUESDE BIOCHIMIE L1

2 C est quoi la chimie?

Concours. Annales corrigées. 17 sujets d annales. Épreuves d admission

Exercices sur le thème II : Les savons

Etude théorique de Processus de Processus Photophysiques dans des Protéines Fluorescentes

Formavie Différentes versions du format PDB Les champs dans les fichiers PDB Le champ «ATOM» Limites du format PDB...

BTS BAT 1 Notions élémentaires de chimie 1

GUIDE COMPLET SUR LES PROTÉINES COMMENT SÉLECTIONNER VOS PROTÉINES ET QUAND LES CONSOMMER. v3.0

TP N 3 La composition chimique du vivant

Contrôle de l'expression génétique :

Respiration Mitochondriale

Langage et Concepts de Programmation Objet. 1 Attributs et Méthodes d instance ou de classe. Travaux Dirigés no2

Des besoins du nouveau-né à son alimentation lactée

1. Structure d un programme C. 2. Commentaire: /*..texte */ On utilise aussi le commentaire du C++ qui est valable pour C: 3.

INITIATION AU LANGAGE JAVA

Physique Chimie. Utiliser les langages scientifiques à l écrit et à l oral pour interpréter les formules chimiques

Perl Orienté Objet BioPerl There is more than one way to do it

Anne Tasso. Java. Le livre de. premier langage. 10 e édition. Avec 109 exercices corrigés. Groupe Eyrolles, , ISBN :

voies de signalisation

BACCALAURÉAT GÉNÉRAL PHYSIQUE-CHIMIE

1 ère Partie : Concepts de Base

L universalité et la variabilité de l ADN

SCIENCES PHYSIQUES. Durée : 3 heures. L usage d une calculatrice est interdit pour cette épreuve. CHIMIE

Une introduction à Java

Connectiques et Utilisation d un disque dur multimédia MMEMUP

Les Différents types de Requêtes dans Access

ANALYSE SPECTRALE. monochromateur

COUSIN Fabien KERGOURLAY Gilles. 19 octobre de l hôte par les. Master 2 MFA Responsable : UE Incidence des paramètres environnementaux

Séquence 4. La nature du vivant. Sommaire. 1. L unité structurale et chimique du vivant. 2. L ADN, support de l information génétique

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST.

ACIDES BASES. Chap.5 SPIESS

Séquencer une application

Cours d Algorithmique-Programmation 2 e partie (IAP2): programmation 24 octobre 2007impérative 1 / 44 et. structures de données simples

EXERCİCE N 1 : «Synthèse de l éthanamide» (7 pts)

BREVET D ÉTUDES PROFESSIONNELLES AGRICOLES SUJET

Biotechnologies en 27 fiches

AUVRAY Clément (168187) HOMBERGER Alexandre (186897) GLADE. Langages, outils et méthodes pour la programmation avancée Page 1 sur 12

TD de Biochimie 4 : Coloration.

TP1 : Initiation à Java et Eclipse

Besoin en thréonine du porc en finition

Langage et Concepts de ProgrammationOrientée-Objet 1 / 40

Cours 1 : Introduction. Langages objets. but du module. contrôle des connaissances. Pourquoi Java? présentation du module. Présentation de Java

Prénom : Matricule : Sigle et titre du cours Groupe Trimestre INF1101 Algorithmes et structures de données Tous H2004. Loc Jeudi 29/4/2004

4 ème PHYSIQUE-CHIMIE TRIMESTRE 1. Sylvie LAMY Agrégée de Mathématiques Diplômée de l École Polytechnique. PROGRAMME 2008 (v2.4)

Sommaire. Séquence 2. La pression des gaz. Séance 1. Séance 2. Séance 3 Peut-on comprimer de l eau? Séance 4 Je fais le point sur la séquence 2

Gestion distribuée (par sockets) de banque en Java

BAC BLANC SCIENCES PHYSIQUES. Durée : 3 heures 30

Séquence 5 Réaction chimique par échange de protons et contrôle de la qualité par dosage

Objets et Programmation. origine des langages orientés-objet

Contrôle de l'expression génétique : Les régulations post-transcriptionnelles

Influence du milieu d étude sur l activité (suite) Inhibition et activation

as Architecture des Systèmes d Information

Information utiles. webpage : Google+ : digiusto/

École Polytechnique de Montréal. Département de Génie Informatique et Génie Logiciel. Cours INF2610. Contrôle périodique.

Pour signifier qu'une classe fille hérite d'une classe mère, on utilise le mot clé extends class fille extends mère

A Spirit of Quality. Le système Qualité de Carbagas

Identification de nouveaux membres dans des familles d'interleukines

Production d une protéine recombinante

CHAPITRE VI : HYBRIDATION GEOMETRIE DES MOLECULES

Université de Montréal. Développement d outils pour l analyse de données de ChIP-seq et l identification des facteurs de transcription

leurs produits respectifs, et production d'anticorps spécinques. Mémoire présenté Département de biochimie Université Laval

Enseignement secondaire

ACTIVITÉ DE PROGRAMMATION

TP1. Outils Java Eléments de correction

Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments»

Module http MMS AllMySMS.com Manuel d intégration

La base de données XML exist. A. Belaïd

2 Comment fonctionne un ordinateur, dans les grandes lignes

Transcription:

TP 1 : FOUILLE D ARN Introduction Pour le premier tp, vous allez construire des classes permettant la manipulation de chaîne d ARN (acide ribonucléique). Les objectifs du tp sont : L utilisation de l héritage. Plus particulièrement, vous devrez implémenter une classe qui hérite de la classe ArrayList. La construction de commentaire d entête de méthode. Dans les sections suivantes, nous allons décrire les interactions que votre logiciel devra offrir, les valeurs qu il devra évaluer, les sorties qu il va produire, les points qui serviront à évaluer votre travail et les modalités de remise de votre projet. Interactions Voici les différentes étapes d interaction que votre logiciel doit suivre : 1. Demander une chaîne d ARN. 2. Valider cette chaîne. 3. Afficher des métriques. 4. Demander une requête de recherche. 5. Valider la requête. 6. Afficher les résultats de cette requête. 7. Le programme se termine. Aux étapes 2 et 5, si un élément est invalide, un message d erreur descriptif est affiché et le programme se termine immédiatement. 1 : DEMANDER UNE CHAÎNE D ARN. Votre logiciel va demander à l utilisateur d entrées une chaîne d ARN. L utilisateur devra utiliser le clavier afin d entrées une suite de caractères. Pour cette étape, vous ne pouvez pas utiliser la classe Clavier vu au cours inf1120. Un exemple de lecture au clavier est disponible sur le site du cours. 2 : VALIDER CETTE CHAÎNE. La chaîne de caractères entrée par l utilisateur doit être composée exclusivement de caractère majuscule. De plus, seuls les caractères A, C, G et U sont acceptés. La chaîne doit contenir au moins 6 caractères et le nombre de caractères entrés doit être un multiple de 3. Si au moins une de ces règles n est pas vérifiée, alors un message d erreur est affiché en utilisant l appel de méthode suivant :

System.err.println( "Votre message ici." ); Ensuite le programme se termine en utilisant l appel de méthode suivant : System.exit( n ); Remplacez le n par une valeur entière qui n est pas zéro (0). 3 : AFFICHER DES MÉTRIQUES. Ensuite, votre logiciel doit afficher des métriques décrivant l ARN. Un ARN est composé de Nucléotides. Voici une courte description des nucléotides que nous utilisons. Nucléotide Les nucléotides sont des molécules de base pour la construction d ARN. Nous allons utiliser quatre nucléotides : l adénine (A), la cytosine (C), la guanine (G) et l uracile (U). Ces molécules sont composées d atomes de carbone, d hydrogène, d oxygène et d azote. Elles ont aussi une masse molaire (g/mol). Le tableau suivant donne le nombre d atomes que contient chaque nucléotide avec sa masse molaire : Nucléotide Nbr de carbone Nbr d hydrogène Nbr d azote Nbr d oxygène Masse molaire A 5 5 5 0 135.13 C 4 5 3 1 111.10 G 5 5 5 1 151.13 U 4 4 2 2 112.09 Votre logiciel devra calculer le nombre total de chaque type d atome que contient l ARN entré par l utilisateur. Il devra aussi calculer la masse molaire totale pour l ARN. Par exemple, l ARN ACGUGC contient 27 atomes de carbone, 29 atomes d hydrogène, 23 atomes d azote, 6 atomes d oxygène et à une masse molaire de 771.68 g/mol. Votre logiciel va ensuite afficher ces valeurs. 4 : DEMANDE UNE REQUÊTE DE RECHERCHE. À cette étape, le logiciel demande une requête de recherche à l utilisateur. La requête est lue au clavier, comme à l étape 1. Cette requête indique ce que l utilisateur veut trouver dans la chaîne d ARN. 5 : VALIDER LA REQUÊTE. Il y a deux types de requêtes possibles, le logiciel doit reconnaitre le type de requête en analysant les caractères entrés : a) L utilisateur entre un des mots suivant (la case est importante) : Ala, Arg, Asn, Asp, Cys, Glu, Gln, Gly, His, Ile, Leu, Lys, Met, Phe, Pro, Pyl, Sec, Ser, Thr, Trp, Tyr, Val. Dans ce cas, l utilisateur recherche un acide aminé dans l ARN.

b) L utilisateur entre une suite de lettre majuscule. Dans ce cas, il doit entrer un nombre de lettres divisible par 3 et qui soit plus grand que zéro (0). Seules les lettres suivantes sont permises : A, B, C, D, G, H, K, M, N, R, S, U, V, W, Y. Dans ce cas l utilisateur recherche une suite de nucléotides dans l ARN. S il y a une erreur dans la requête, alors un message d erreur pertinent est affiché et le programme se termine. 6 : AFFICHER LES RÉSULTATS DE CETTE REQUÊTE. Le logiciel doit ensuite parcourir l ARN pour trouver toutes les occurrences de l élément demandé par l utilisateur. Vous devez afficher la position du premier nucléotide de chaque occurrence. Le premier nucléotide d une chaîne d ARN est à la position 1. a) Pour le premier type de requête, votre logiciel doit trouver les occurrences de l acide aminé demandé. Un acide aminé est représenté par une (1) à six (6) instances de suites de trois (3) nucléotides. Acide aminé Dans une chaîne de nucléotide (ARN), les éléments sont divisés en séquence de trois appelé codon. Chaque codon représente un acide aminé protéinogène. La table suivante contient les 22 acides aminés possibles avec les différentes séquences qu ils représentent. représentés par plusieurs séquences. Remarquez que certains acides aminés sont Abréviation Codon(s) Nom Ala GCU, GCC, GCA, GCG Alanine Arg CGU, CGC, CGA, CGG, AGA, AGG Arginine Asn AAU, AAC Asparagine Asp GAU, GAC Aspartate Cys UGU, UGC Cystéine Glu GAA, GAG Glutamate Gln CAA, CAG Glutami ne Gly GGU, GGC, GGA, GGG Glycine His CAU, CAC Histidine Ile AUU, AUC, AUA Isoleucine Leu UUA, UUG, CUU, CUC, CUA, CUG Leucine Lys AAA, AAG Lysine Met AUG Méthionine Phe UUU, UUC Phénylalanine Pro CCU, CCC, CCA, CCG Proline Pyl UAG Pyrrolysine Sec UGA Sélénocystéine Ser UCU, UCC, UCA, UCG, AGU, AGC Sérine Thr ACU, ACC, ACA, ACG Thréonine Trp UGG Tryptophane Tyr UAU, UAC Tyrosine Val GUU, GUC, GUA, GUG Valine

Par exemple, l ARN ACGUCUUGCAGUGUU contient l acide aminé Ser aux positions 4 et 10. Il est à remarquer que les résultats possibles ne peuvent être trouvés qu à tous les trois (3) nucléotides. b) Pour le second type de requête, votre logiciel doit trouver les occurrences d une sous-séquence d ARN. Comme pour la première requête, les résultats possibles ne peuvent être trouvés qu à tous les trois (3) nucléotides. Certaines lettres de la requête représentent un ensemble de nucléotides. Dans ce cas, le nucléotide présent dans l ARN doit corresponde à un des nucléotides de l ensemble. Codes IUPAC L IUPAC (Union Internationale de Chimie Pure et Appliquée) a défini des codes pour regrouper des ensembles de nucléotides. Par exemple, la lettre R représente un ensemble contenant une adénine et une guanine. La table suivante contient ces codes avec leur ensemble. Code Ensemble Nom R {A, G} Purine Y {C, U} Pyrimidine S {C, G} Strong W {A, U} Weak K {G, U} Keto M {A, C} Amino B {C, G, U} Not A D {A, G, U} Not C H {A, C, U} Not G V {A, C, G} Not U N {A, C, G, U} Any 7 : LE PROGRAMME SE TERMINE. Le programme termine normalement. 1. Le tp est à faire seul ou en équipe de deux. Directives 2. Votre code doit contenir une classe qui hérite de la classe ArrayList. 3. Commentaire : a. Commentez l entête de chaque classe et méthode. Ces commentaires doivent contenir la description de la méthode et le rôle de ces paramètres. b. Une ligne contient soit un commentaire, soit du code, pas les deux. c. Utilisez des noms d identificateur significatif. d. Utilisez le français.

4. Code : a. Pas de goto, continue. b. Les break ne peuvent apparaitre que dans les switch. c. Un seul return par méthode. 5. Indentez votre code. Assurez-vous que l indentation est faite avec des espaces. Remise Remettre le tp par l entremise de Moodle. Placez vos fichiers *.java dans un dossier compressé de Window, vous devez remettre l archive. Le tp est à remettre avant le 12 octobre 23 :59. Évaluation Fonctionnalité (7 pts) : des tests partiels vous seront remis. Un test plus complet sera appliqué à votre tp. Structure (2 pt) : veillez à utiliser correctement le mécanisme d héritage et de méthode. Lisibilité (2 pts) : commentaire, indentation et noms d identificateur significatif.