Outils de la Bioinformatique M1 GENIOMHE/ M1 BS Comparaison de séquences 2 à 2

Documents pareils
La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST.

Big data et sciences du Vivant L'exemple du séquençage haut débit

Module Analyse de Génomes Master 2 module FMBS 326 Immunoinformatique

INFORMATION VOYAGEURS

Sujet 4: Programmation stochastique propriétés de fonction de recours

Les Français et le chauffage. Résultats de l étude menée

Reconstruction de bâtiments en 3D à partir de nuages de points LIDAR

TD 1 - Structures de Traits et Unification

RapidMiner. Data Mining. 1 Introduction. 2 Prise en main. Master Maths Finances 2010/ Présentation. 1.2 Ressources

Optimisation Discrète

Perl Orienté Objet BioPerl There is more than one way to do it

Travaux pratiques avec RapidMiner

LE MODELE CONCEPTUEL DE DONNEES

L indice de SEN, outil de mesure de l équité des systèmes éducatifs. Une comparaison à l échelle européenne

Analyse de la vidéo. Chapitre La modélisation pour le suivi d objet. 10 mars Chapitre La modélisation d objet 1 / 57

MON GUIDE POUR MON RAPPORT

SDLS08 - Modes propres d'une plaque carrée calculés sur base réduite

Identification de nouveaux membres dans des familles d'interleukines

Comment reproduire les résultats de l article : POP-Java : Parallélisme et distribution orienté objet

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Plus courts chemins, programmation dynamique

Comparer des surfaces suivant leur aire en utilisant leurs propriétés géométriques Découverte et manipulation

Mise à jour Comptabilité intermédiaire - Analyse théorique et pratique, Questions, exercices, problèmes, cas.

Triangles isométriques Triangles semblables

Les activités de lutte. à l école primaire. - Inspections de l Education Nationale de Vichy 1 et 2 -

La programmation linéaire : une introduction. Qu est-ce qu un programme linéaire? Terminologie. Écriture mathématique

Algorithmique avec Algobox

Réglementés d électricité

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

J ai des idées pourquoi plagier?! Campagne de sensibilisation sur le plagiat

PRISE EN MAIN D ILLUSTRATOR

MODE D EMPLOI WORDPRESS

Booster votre activité de transformation verrière!

Création d un site Internet

Exemples de problèmes et d applications. INF6953 Exemples de problèmes 1

Donner les limites de validité de la relation obtenue.

LES OUTILS D ALIMENTATION DU REFERENTIEL DE DB-MAIN

La Clé informatique. Formation Excel XP Aide-mémoire

PRISE EN MAIN DU SPECTROPHOTOMETRE UV-VISIBLE SHIMADZU U.V. 240

Détection des duplications en tandem au niveau nucléique à l'aide de la théorie des flots

ESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring

Burkina Faso Profil pays EPT 2014

1 les caractères des êtres humains.

MÉTHODE Investir en bourse avec Isiotrade. " Hier est derrière. Demain est un mystère. Ce qui compte, c est ce que l'on fait dans l instant.

ANALYSE CATIA V5. 14/02/2011 Daniel Geffroy IUT GMP Le Mans

PRISE EN MAIN D UN TABLEUR. Version OPEN OFFICE

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007

isrs 7 Améliorer la performance Sécurité, Environnement et Opérationnelle

Prezi. Table des matières

Ordonnancement. N: nains de jardin. X: peinture extérieure. E: électricité T: toit. M: murs. F: fondations CHAPTER 1

Monitoring & Support

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé

EXTENSION WORDPRESS. Contact Form 7. Proposé par :

Représenter un pays : la carte de France

CS 01 D/B2I/ CONSULTATION ET TRANSMISSION DE L INFORMA-

Les concepts de base, l organisation des données

Table des matières. Comment utiliser efficacement cet ouvrage pour en obtenir les meilleurs résultats?... 5

Stockage ou pas stockage?

Algorithmes sur les mots (séquences)

enquête pour les fautes sur le fond, ce qui est graves pour une encyclopédie.

IMMUNOLOGIE. La spécificité des immunoglobulines et des récepteurs T. Informations scientifiques

Ecole maternelle Polangis (dite Jougla) (Cat.: 4 - Type : R - effectif : 287 )

Apprenez à Créer une campagne.

Information génétique

Programme de formation Photoshop : Initiation 24 heures de formation (3 jours) 1/2

MICRO-INFORMATIQUE DÉFINITION DU DOMAINE D'EXAMEN BASE DE DONNÉES CONSULTATION INF

Comment insérer une image de fond?

[FORMATIONS] IRDECOF

Groupe Eyrolles, 2003, ISBN : X

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Les conseils et les procédures pour utiliser divers programmes francophones avec de l'hébreu

Danielle D Amour, inf. Ph.D. IUFRS 24 février 2011

Animateur Numérique de Territoire

Devises. Dernière modification le 9 janvier 2009 Page 1 de 6

MESUREZ L'IMPACT DE VOS CAMPAGNES!

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://

Analyse des trajectoires acceptables en approche de virage assistance aux conducteurs

La NP-complétude. Johanne Cohen. PRISM/CNRS, Versailles, France.

Formation Pédagogique 3h

Monitoring d un Datacenter du concept à la réalisation

Assistance médicale à la procréation. Informations pour les couples donneurs. Le don. d embryons

Projet ISN - dossier réalisé par Randrianarimanana Stéphanie. Titre du projet : Site de rencontre. le nom de notre site de rencontre : Linkymeet

Algorithmique répartie

GOL502 Industries de services

Mise en place d une solution automatique de stockage et de visualisation de données de capture des interactions chromatiniennes à l échelle génomique

Nobody s Unpredictable

SYNERGYTEK. Logiciel de gestion de la production sur mesure

I - PUISSANCE D UN POINT PAR RAPPORT A UN CERCLE CERCLES ORTHOGONAUX POLES ET POLAIRES

Baccalauréat S Asie 19 juin 2014 Corrigé

QUICK START RF Monitor 4.3-1

Exprimez-vous lors du choix de vos pneus:

Gestion de la relation client : l expérience du Crédit du Nord

Le Test d évaluation de français De la Chambre de commerce et d industrie de Paris

Matériel & Logiciels (Hardware & Software)

MONTE ESCALIERS ALPHA L INNOVATION AU SERVICE DU CONFORT.

GMIN206 Info. Biologique et Outils bioinformatiques. Elodie Cassan

Chapitre 2 Le problème de l unicité des solutions

Un exemple avec WORKSPACE d'interwrite

Transcription:

Outils de la Bioinformatique M1 ENIOMHE/ M1 BS omparaison de séquences 2 à 2 Exercice 1 : omparaison visuelle de séquences avec ot Plot Les séquences suivantes sont à comparer : Séquence_1 Séquence_2 1.1) ot Plot simple omparer les séquences 1 et 2 avec un ot Plot simple (taille de fenêtre=1 ; score-seuil=1). Utiliser la matrice ci-dessous. Est-ce qu une similitude de séquence apparaît? 1.2) ot Plot avec taille de fenêtre et score-seuil omparer les séquences 1 et 2 avec un ot Plot simple (taille de fenêtre=3 ; score-seuil=2). Utiliser la matrice ci-dessous. Est-ce qu une similitude de séquence apparaît?

1.3) Un outil simple permettant de repérer des similarités : le dot plot Repérez les similarités existant entre la séquence nucléotidique de l hémoglobine alpha humaine (n accession enbank dans «orenucleotide»: N_000006 et rechercher le gène «HB2» ) et celle de la souris (n accession enbank : V00714) otmatcher à l institut Pasteur : http://bioweb.pasteur.fr/seqanal/interfaces/dotmatcher.html Ou : http://emboss.bioinformatics.nl/cgi-bin/emboss/dotmatcher Ou : http://bioinfo.hku.hk/cgi-bin/emboss.pl?_action=input&_app=dotmatcher ttention à bien choisir la matrice qui correspond à l N (ENFULL par défaut). ans «advanced section», les paramètres par défaut sont : une taille de fenêtre=16 et un seuil pour le score de 23. Ou : YSS : http://bioinfo.lifl.fr/yass/ Les gènes de type alpha sont regroupés sur un chromosome (le chromosome numéro 16), les gènes de type bêta sur un autre (le chromosome numéro 11). - ans le groupe alpha, le gène qui code pour la chaîne embryonnaire zêta z précède les deux gènes des chaînes a qui sont des composants des hémoglobines foetales et des hémoglobines adultes. - ans le groupe bêta, le gène de la chaîne embryonnaire epsilon e est suivi par les deux gènes des chaînes foetales g puis par les deux gènes des chaînes adultes d et b. La séquence des gènes de la globine humaine le long des chromosomes correspond à l'ordre dans lequel ils sont exprimés au cours du développement. 1.4) Récupérez les séquences protéiques de l hémoglobine alpha de l homme et de la souris (en vous servant des annotations au niveau des séquences N). Repérez les similarités existant entre la séquence protéique de l hémoglobine alpha humaine et celle de la souris à l aide de otmatcher. Utilisez la matrice BLOSUM62 en paramètre. ue concluez-vous? Exercice 2 : Scores d alignements 2 à 2. 2.1) Scores d alignement N a) vec la matrice de scores de substitutions suivante calculer les scores des alignements 1, 2 et 3. Le score pour un gap est de -1,5. 1.0-0.9-0.9-0.5-0.9 1.0-0.5-0.9-0.9-0.5 1.0-0.9-0.5-0.9-0.9 1.0 Seq1 : Seq_HB2_Homo_sapiens : une partie de la séquence du gène codant pour la globine-alpha chez homo sapiens. Seq2 : Seq_HB-Peromyscus_maniculatus : une partie de la séquence du gène codant pour la globinealpha chez Peromyscus maniculatus. Seq3 : Seq_HB2_Mus_musculus : une partie de la séquence du gène codant pour la globine-alpha chez Mus musculus. lignement 1 : Seq1 ---- Seq2 lignement 2 : Seq1 --- Seq3 -- lignement 3 : Seq2 Seq3 ---

b) Les scores optimaux sont ils ici minimums ou maximums? c) uelles séquences sont les plus semblables d après les scores obtenus? 2.2) Scores d alignement protéique a) Voici page suivante la matrice de scores de substitutions protéiques PM250. vec une telle matrice, les scores des alignements seront-ils optimaux lorsqu ils sont minimum ou maximum? b) vec la matrice d alignement PM250, calculer les scores des alignements page suivante (séquences protéiques correspondant à la signature conservée de différentes transposases) : lignement 1 : lignement 2 : lignement 3 : RNENNLIRYFPK RNENNLIRYIPK RNENFNLLREFIPK RNENFNLLREFIPK RENNLLRYLPK RNENNLIRYIPK

Exercice 3 : Reconstructions d alignements à partir de chemins Soient les séquences N suivantes : Séquence 1 : Séquence 2 : Voici ci-dessous une matrice construite pour comparer 2 séquences N. X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X 1) Reconstruisez les 2 alignements spécifiés par les chemins vert et bleu. 2) En utilisant la matrice unitaire et un score de gap de -1, calculer les scores des 2 chemins. 3) En utilisant la matrice unitaire et un score d ouverture de gap de -3 et d élongation de -0.5, calculer les scores des 2 chemins. ommenter les résultats.

Exercice 4 : lignement avec programmation dynamique de Needleman et Wunch ligner les 2 séquences et par programmation dynamique en utilisant les paramètres suivants : lignez à la main selon l algorithme de Needleman & Wunsch - Matrice de substitution g x,y = 0 si X = Y g x,y = 2 si X Y - ontribution aux brèches w = 3 - ondition initiales : 00 = P 00 = 00 = 0 0 1 2 3 4 5 6 7 P P P P P P P P _ 0 P _ 1 P 2 P 3 P 4 P 5 P 6 P 7 P