Outils de la Bioinformatique M1 ENIOMHE/ M1 BS omparaison de séquences 2 à 2 Exercice 1 : omparaison visuelle de séquences avec ot Plot Les séquences suivantes sont à comparer : Séquence_1 Séquence_2 1.1) ot Plot simple omparer les séquences 1 et 2 avec un ot Plot simple (taille de fenêtre=1 ; score-seuil=1). Utiliser la matrice ci-dessous. Est-ce qu une similitude de séquence apparaît? 1.2) ot Plot avec taille de fenêtre et score-seuil omparer les séquences 1 et 2 avec un ot Plot simple (taille de fenêtre=3 ; score-seuil=2). Utiliser la matrice ci-dessous. Est-ce qu une similitude de séquence apparaît?
1.3) Un outil simple permettant de repérer des similarités : le dot plot Repérez les similarités existant entre la séquence nucléotidique de l hémoglobine alpha humaine (n accession enbank dans «orenucleotide»: N_000006 et rechercher le gène «HB2» ) et celle de la souris (n accession enbank : V00714) otmatcher à l institut Pasteur : http://bioweb.pasteur.fr/seqanal/interfaces/dotmatcher.html Ou : http://emboss.bioinformatics.nl/cgi-bin/emboss/dotmatcher Ou : http://bioinfo.hku.hk/cgi-bin/emboss.pl?_action=input&_app=dotmatcher ttention à bien choisir la matrice qui correspond à l N (ENFULL par défaut). ans «advanced section», les paramètres par défaut sont : une taille de fenêtre=16 et un seuil pour le score de 23. Ou : YSS : http://bioinfo.lifl.fr/yass/ Les gènes de type alpha sont regroupés sur un chromosome (le chromosome numéro 16), les gènes de type bêta sur un autre (le chromosome numéro 11). - ans le groupe alpha, le gène qui code pour la chaîne embryonnaire zêta z précède les deux gènes des chaînes a qui sont des composants des hémoglobines foetales et des hémoglobines adultes. - ans le groupe bêta, le gène de la chaîne embryonnaire epsilon e est suivi par les deux gènes des chaînes foetales g puis par les deux gènes des chaînes adultes d et b. La séquence des gènes de la globine humaine le long des chromosomes correspond à l'ordre dans lequel ils sont exprimés au cours du développement. 1.4) Récupérez les séquences protéiques de l hémoglobine alpha de l homme et de la souris (en vous servant des annotations au niveau des séquences N). Repérez les similarités existant entre la séquence protéique de l hémoglobine alpha humaine et celle de la souris à l aide de otmatcher. Utilisez la matrice BLOSUM62 en paramètre. ue concluez-vous? Exercice 2 : Scores d alignements 2 à 2. 2.1) Scores d alignement N a) vec la matrice de scores de substitutions suivante calculer les scores des alignements 1, 2 et 3. Le score pour un gap est de -1,5. 1.0-0.9-0.9-0.5-0.9 1.0-0.5-0.9-0.9-0.5 1.0-0.9-0.5-0.9-0.9 1.0 Seq1 : Seq_HB2_Homo_sapiens : une partie de la séquence du gène codant pour la globine-alpha chez homo sapiens. Seq2 : Seq_HB-Peromyscus_maniculatus : une partie de la séquence du gène codant pour la globinealpha chez Peromyscus maniculatus. Seq3 : Seq_HB2_Mus_musculus : une partie de la séquence du gène codant pour la globine-alpha chez Mus musculus. lignement 1 : Seq1 ---- Seq2 lignement 2 : Seq1 --- Seq3 -- lignement 3 : Seq2 Seq3 ---
b) Les scores optimaux sont ils ici minimums ou maximums? c) uelles séquences sont les plus semblables d après les scores obtenus? 2.2) Scores d alignement protéique a) Voici page suivante la matrice de scores de substitutions protéiques PM250. vec une telle matrice, les scores des alignements seront-ils optimaux lorsqu ils sont minimum ou maximum? b) vec la matrice d alignement PM250, calculer les scores des alignements page suivante (séquences protéiques correspondant à la signature conservée de différentes transposases) : lignement 1 : lignement 2 : lignement 3 : RNENNLIRYFPK RNENNLIRYIPK RNENFNLLREFIPK RNENFNLLREFIPK RENNLLRYLPK RNENNLIRYIPK
Exercice 3 : Reconstructions d alignements à partir de chemins Soient les séquences N suivantes : Séquence 1 : Séquence 2 : Voici ci-dessous une matrice construite pour comparer 2 séquences N. X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X 1) Reconstruisez les 2 alignements spécifiés par les chemins vert et bleu. 2) En utilisant la matrice unitaire et un score de gap de -1, calculer les scores des 2 chemins. 3) En utilisant la matrice unitaire et un score d ouverture de gap de -3 et d élongation de -0.5, calculer les scores des 2 chemins. ommenter les résultats.
Exercice 4 : lignement avec programmation dynamique de Needleman et Wunch ligner les 2 séquences et par programmation dynamique en utilisant les paramètres suivants : lignez à la main selon l algorithme de Needleman & Wunsch - Matrice de substitution g x,y = 0 si X = Y g x,y = 2 si X Y - ontribution aux brèches w = 3 - ondition initiales : 00 = P 00 = 00 = 0 0 1 2 3 4 5 6 7 P P P P P P P P _ 0 P _ 1 P 2 P 3 P 4 P 5 P 6 P 7 P