DEA BBSG. Examen d Informatique Décembre 2000



Documents pareils
Perl Orienté Objet BioPerl There is more than one way to do it

Algorithmique et Programmation, IMA

1/24. I passer d un problème exprimé en français à la réalisation d un. I expressions arithmétiques. I structures de contrôle (tests, boucles)

Le prototype de la fonction main()

Programme awk------introduction rapide

TP1 - Prise en main de l environnement Unix.

Introduction au langage C

Arguments d un programme

Exonet : sauvegarde automatisée d une base de données

Compilation (INF 564)


3IS - Système d'exploitation linux - Programmation système

AWS avancé. Surveiller votre utilisation d EC2

Présentation du langage et premières fonctions

Les structures de données. Rajae El Ouazzani

Éléments d informatique Cours 3 La programmation structurée en langage C L instruction de contrôle if

Initiation à la programmation en Python

Java Licence Professionnelle CISII,

EPREUVE PRATIQUE DES TECHNIQUES INFORMATIQUES ACTIVITE N 1. Thème de l activité : Configuration d un firewall

TP Bases de données réparties

Cours d algorithmique pour la classe de 2nde

Outils pour la pratique

Introduction à la présentation graphique avec xmgrace

Introduction à R. Florence Yerly. Dept. de mathématiques, Université de Fribourg (CH) SP 2011

Programmation système de commandes en C

TP, première séquence d exercices.

Programmation système en C/C++

Cours Programmation Système

STAGE IREM 0- Premiers pas en Python

Compression Compression par dictionnaires

1 Lecture de fichiers

INTRODUCTION A JAVA. Fichier en langage machine Exécutable

Unix/Linux I. 1 ere année DUT. Université marne la vallée

Mon premier rpm. 7 juin Avant de commencer RPM URPMI RPMBUILD... 2

TP 1. Prise en main du langage Python

TP 1 Prise en main de l environnement Unix

MS SQL Express 2005 Sauvegarde des données

Les chaînes de caractères

CHAPITRE 3 LA SYNTHESE DES PROTEINES

Cours de C. Petits secrets du C & programmation avancée. Sébastien Paumier

27/11/12 Nature. SDK Python et Java pour le développement de services ACCORD Module(s)

Langage Perl. Introduction & Retour d'expérience. Journée du 30/11/ S. Gallina - GEPV - 1/42

Utilisation d objets : String et ArrayList

1. Structure d un programme C. 2. Commentaire: /*..texte */ On utilise aussi le commentaire du C++ qui est valable pour C: 3.

TD3: tableaux avancées, première classe et chaînes

ACTIVITÉ DE PROGRAMMATION

Initiation à l algorithmique

TRAVAUX PRATIQUES Programmation Système Langage C / Système UNIX. 2 e année Génie Informatique

La Voix sur IP. Études des solutions logicielles. Open Source

1 Définition et Appel d une fonction. V. Phan Luong. Cours 4 : Fonctions

GMIN206 Info. Biologique et Outils bioinformatiques. Elodie Cassan

Module BDWEB. Maîtrise d informatique Cours 9 - Xquery. Anne Doucet. anne.doucet@lip6.fr

Gestion de stock pour un magasin

Les structures. Chapitre 3

Singapore Schools Green Mark Scheme on Indoor Air Quality

L informatique en BCPST

Cours Bases de données 2ème année IUT

Module Analyse de Génomes Master 2 module FMBS 326 Immunoinformatique

COMPARAISONDESLANGAGESC, C++, JAVA ET

Compléments de documentation Scilab : affichage de texte et formatage de nombres

Projet de programmation (IK3) : TP n 1 Correction

IN Cours 1. 1 Informatique, calculateurs. 2 Un premier programme en C

Django et PostgreSQL sous la charge

Cours d Algorithmique-Programmation 2 e partie (IAP2): programmation 24 octobre 2007impérative 1 / 44 et. structures de données simples

Cours 1. I- Généralités sur R II- Les fonctions de R et autres objets III-Les vecteurs

Bases de programmation. Cours 5. Structurer les données

Argument-fetching dataflow machine de G.R. Gao et J.B. Dennis (McGill, 1988) = machine dataflow sans flux de données

Rappel. Analyse de Données Structurées - Cours 12. Un langage avec des déclaration locales. Exemple d'un programme

Cours 4 : Agrégats et GROUP BY

Création et développement d une base de données sur le VIH

Performance web. Mesurer. Analyser. Optimiser. Benjamin Lampérier - Benoît Goyheneche. RMLL Beauvais. 8 Juillet 2015

Request Tracker pour les Nuls. Yves Agostini - YVESAGO

Les arbres binaires de recherche

Le Langage C Version 1.2 c 2002 Florence HENRY Observatoire de Paris Université de Versailles florence.henry@obspm.fr

Vue d ensemble de Windows PowerShell

École Polytechnique de Montréal. Département de Génie Informatique et Génie Logiciel. Cours INF2610. Contrôle périodique.

Recherche dans un tableau

Programmation Classique en langage C

Configuration des notifications de messagerie avec les scripts pour les alertes IDS avec le CiscoWorks Monitoring Center for Security

SHERLOCK 7. Version du 01/09/09 JAVASCRIPT 1.5

Gestion mémoire et Représentation intermédiaire

Cours Informatique Master STEP

Cours 14 Les fichiers

Corrigé des TD 1 à 5

Bases de SQL. Hacks 1-6 CHAPITRE UN

Machines virtuelles fonctionnelles (suite) Compilation ML Java

Solutions du chapitre 4

MISE A NIVEAU INFORMATIQUE LANGAGE C - EXEMPLES DE PROGRAMMES. Université Paris Dauphine IUP Génie Mathématique et Informatique 2 ème année

Module : Informatique Générale 1. Les commandes MS-DOS

Programmation système I Les entrées/sorties

# let rec concat l1 l2 = match l1 with [] -> l2 x::l 1 -> x::(concat l 1 l2);; val concat : a list -> a list -> a list = <fun>

Programmation C. Apprendre à développer des programmes simples dans le langage C

Chap III : Les tableaux

RETHINKING JACQUES ELLUL AND THE TECHNOLOGICAL SOCIETY IN THE 21ST CENTURY REPENSER JACQUES ELLUL ET LA SOCIETE TECHNICIENNE AU 21EME SIECLE

Cours 6 : Tubes anonymes et nommés

Langage Éric Guérin 5 octobre 2010

2 Comment fonctionne un ordinateur, dans les grandes lignes

1 Introduction - Qu est-ce que le logiciel R?

Transcription:

DEA BBSG. Examen d Informatique Décembre 2000 Durée: 2 heures Documents autorisés Daniel GAUTHERET Denis THIEFFRY 1. (2 pt) Donnez une commande Unix permettant de trouver dans un fichier de séquence au format Fasta les occurrences de l expression Prosite suivante : C-x(2)-C-x-[DE]-x(5)-[HN]-[FY]-x(4)-C-x(2)-C-x(2)-F-F-x-R Note sur la syntaxe Prosite: parenthèses = nombre de répétitions ; crochets = choix ; «x» = résidu indéterminé ; tirets = séparateurs. On ignorera le problème des sauts de ligne. 2. (5 pt) Indentifiez parmi les commandes Unix et Perl suivantes celles qui comportent une erreur. Corrigez l erreur. a. if ($rep!= /(oui non)/) {print recommencez ; b. print le fichier %f n existe pas\n ; c. cp ~gauthere/fichier1 d. if ($x = 3) {$a = $a + 7; e. rm r../temp/* f. ls l > toto g. while (ligne = <F>) { h. $thisentry =~ /^LOCUS\s+(\w+); i. print FOUT $libnum, "\t", $library, "\n"; j. $options.= @ARGV[$i]; 3. (6 pt) Considérez le programme Perl en annexe 1. a. Quelle est la fonction de la partie de code marquée «1»? b. Quelle est la fonction de la partie de code marquée «2»? c. A quoi sert la variable $totnt? d. A quoi sert la variable $Aprop? e. A quoi sert le programme?

2 f. Quel serait la sortie du programme si on lui fournit en argument le fichier de l Annexe 2? Note : L expression «$x =~ tr/y/y/» est utilisée ici pour renvoyer le nombre d occurrences de y dans $x. 4. (4 pt) Le fragment de programme Perl en Annexe 3 lit et affiche les séquences d un fichier Fasta. Transformez-le pour lire des séquences au format «GENBANK». Un exemple de format Genbank est fourni en Annexe 4. 5. (3 pt) La variable $seq est une chaîne de caractères contenant une séquence nucléotidique de taille quelconque. Réalisez une Boucle Perl permettant de parcourir cette séquence codon par codon et de stocker les codons dans un tableau @codons. On utilisera la fonction substr pour parcourir la séquence et on admettra que le premier codon débute en position zéro. (la commande substr ($s, x, y) renvoie la sous chaîne de $s à partir de la position x sur une longueur y)

3 ANNEXE 1 #!/usr/bin/perl 1 2 if ($#ARGV!= 0) { print "Programme <Fichier sequence Fasta> \n"; exit; open(f, $ARGV[0]) die ("\"$ARGV[0]\" introuvable\n"); while ($line = <F>){ if ($line =~ /^>/) { $totseq++; else{ chop $line; $line =~ tr/[\s]//d; $line =~ tr/[a-z]/[a-z]/; $line =~ tr/[t]/[u]/; $seq = $line; $l = length ($seq); $totnt += $l; $Acnt += $seq =~ tr/a/a/; $Ucnt += $seq =~ tr/u/u/; $Gcnt += $seq =~ tr/g/g/; $Ccnt += $seq =~ tr/c/c/; $Ncnt += $seq =~ tr/n/n/; $base_nonn= $Acnt + $Ucnt + $Gcnt + $Ccnt; $Aprop = $Acnt / $base_nonn * 100; $Uprop = $Ucnt / $base_nonn * 100; $Gprop = $Gcnt / $base_nonn * 100; $Cprop = $Ccnt / $base_nonn * 100; $Nprop = $Ncnt / $totnt * 100; print "Totseq totnt moy-nt A U G C N\n"; printf ("%5d %7d %5d %5.1f %5.1f %5.1f %5.1f %5.1f\n", $totseq, $totnt, $totnt/$totseq, $Aprop, $Uprop, $Gprop, $Cprop, $Nprop); ANNEXE 2 >seq 1 AAAGGGAAACCC >seq 2 GGGAAAAAACCC

4 Annexe 3 $line = <F>; while ($line) { if ($line =~ /^>/) { $name = $line; $seq = ""; while (($line = <F>) && ($line!~ /^>/)) { chop $line; $seq.= $line; print $name; print $seq; else { $line = <F>;

5 Annexe 4 Séquence au format Genbank. Plusieurs enregistrements de ce type peuvent se trouver à la suite dans le même fichier. LOCUS AF299079 1052 bp DNA BCT 22-OCT-2000 DEFINITION Bartonella henselae elongation factor EF-Tu (tuf) gene, partial cds. ACCESSION AF299079 VERSION AF299079.1 GI:10945626 KEYWORDS. SOURCE Bartonella henselae. ORGANISM Bartonella henselae Bacteria; Proteobacteria; alpha subdivision; Rhizobiaceae group; Bartonellaceae; Bartonella. REFERENCE 1 (bases 1 to 1052) AUTHORS Chow,V.T.K., Yeo,W., Soong,P.L. and Nasirudeen,A.M.A. TITLE Sequence and Evolutionary Characterization of the Elongation Factor Tu Gene in Bartonella henselae JOURNAL Unpublished REFERENCE 2 (bases 1 to 1052) AUTHORS Chow,V.T.K., Yeo,W., Soong,P.L. and Nasirudeen,A.M.A. TITLE Direct Submission JOURNAL Submitted (24-AUG-2000) Microbiology, National University of Singapore, 5 Science Drive 2, Singapore 117597, Singapore FEATURES Location/Qualifiers source 1..1052 /organism="bartonella henselae" /strain="atcc49882" /db_xref="taxon:38323" /db_xref="atcc:49882" gene <1..>1052 /gene="tuf" CDS <1..>1052 /gene="tuf" /note="mediates elongation of amino acid chain during protein synthesis" /codon_start=1 /transl_table=11 /product="elongation factor EF-Tu" /protein_id="aag24621.1" /db_xref="gi:10945627" /translation="gtighvdhgktsltaaitkyfgefkaydqidaapeerargitis TAHVEYETEKRHYAHVDCPGHADYVKNMITGAAQMDGAILVVSAADGPMPQTREHILL ARQVGVPAIVVFLNKVDQVDDAELLELVELEVRELLSKYDFPGDDIPIVKGSALAALE DKDKSIGEDAVRLLMSEVDNYIPTPERPVDQPFLMPIEDVFSISGRGTVVTGRVERGV IKVGEEVEIIGIRPTSKTTVTGVEMFRKLLDQGQAGDNIGALLRGIDREGIERGQVLA KPASVTPHTRFKAEAYILTKDEGGRHTPFFTNYRPQFYFRTTDVTGIVTLPEGTEMVM PGDNVAMDVSLIVPIA" BASE COUNT 253 a 178 c 292 g 329 t ORIGIN 1 ggtacgattg gtcacgttga ccatgggaag acctcgttga cggcagcgat tacgaaatat 61 tttggtgaat ttaaggccta tgaccaaatt gatgcagcgc ctgaggagcg tgcacgtgga 121 attactattt ctacagcgca tgttgaatat gaaacagaga agcggcatta tgcacatgtt 181 gattgtccag gtcacgcgga ttatgtgaag aacatgatca cgggcgcggc gcaaatggat 241 ggtgcgattt tggttgtttc agctgctgat ggtccgatgc ctcaaacacg tgagcatatt 301 cttcttgccc gtcaggttgg tgttccagcg attgttgttt ttcttaataa ggttgatcag 361 gttgatgatg ctgagctttt ggagcttgtt gagcttgaag ttcgggagtt attgtcgaaa 421 tatgattttc caggagacga tattccgatc gttaaaggtt ctgctttggc agcgcttgaa 481 gataaagata aaagcattgg tgaagatgcg gttcgtcttt tgatgagtga agttgataat 541 tatataccga cgcctgaacg tcctgttgat cagccgtttt tgatgccaat tgaagatgtt 601 ttttcgattt cgggtcgtgg aactgttgtg acgggtcgtg ttgagcgtgg tgttattaag 661 gttggtgaag aagttgagat tatcggcatt cgtccaactt ctaagacaac agttacaggg 721 gttgaaatgt tccgcaagct tttagatcag gggcaagcgg gtgataatat tggagcgctg 781 cttcgtggta ttgatcgtga agggattgag cgtggacaag ttttggcgaa gcctgcttcg 841 gttacacctc atacgagatt taaagcagag gcttacattt tgacgaaaga tgaaggtggt 901 cgtcatactc catttttcac gaattatcgt cctcagtttt atttccgtac tacggatgta 961 acgggaattg ttacgcttcc agaaggtaca gagatggtta tgcctggtga taatgttgct 1021 atggatgtct ctctgattgt tccaattgcc at //