Comparaison et alignement. de séquences 2 LV348 -BI. Sophie Pasek

Save this PDF as:
 WORD  PNG  TXT  JPG

Dimension: px
Commencer à balayer dès la page:

Download "Comparaison et alignement. de séquences 2 LV348 -BI. sophie.pasek@upmc.fr. Sophie Pasek"

Transcription

1 Comparaison et alignement de séquences 2 LV348 -BI Sophie Pasek

2 Comment comparer une séquence contre une banque?

3 Comparaison séquence/banque Pourquoi? : Réunir un échantillon taxonomique (homologues) pour faire une phylogénie Annoter un génome nouvellement séquencé (fonctions putatives) Étudier une famille (consensus, domaines) Vocabulaire : Séquence à rechercher = Query Séquence de la banque = Subject

4 Comparaison séquence/banque Comment? Forcément, on cherche du local! SW = algorithme exacte qui donne l'alignement optimal Si on cherchait pour chaque «Subject» son alignement optimal avec la «Query» et puis on classe par Z-score décroissant Problème : Si 1 alignement SW prend 15 ms Banque SwissProt (> entrées) prend 2h => Trop lent! Il faut trouver des heuristiques

5 Blast: Basic Local Alignement Search Tool Altschul & al., 1990 BLAST : est une heuristique qui recherche dans une banque les séquences (Subject) présentant une bonne similarité locale avec une séquence requête (Query) assigne un score et une espérance à chaque couple Query- Subject optimise le temps de recherche au détriment de la sensibilité et de la précision de l'alignement BLAST n'est pas un programme d'alignement optimal de séquences!

6 Blast: Basic Local Alignement Search Tool 3 grandes étapes : 1) Identifier les k-mots «similaires» w de taille k pour les an, k=10 ou 11 / pour les aa, k=3 ou 4 2) a) Etendre l'alignement (sans indel) de chaque côté de w tant que le score cumulé est M (seuil fixé) => HSPs = High Scoring Segment Pairs b) Eventuellement rassembler les HSPs 3) Evaluation statistique des segments similaires obtenus

7 Blast: étape 1 Indexation de la banque (parcours 1 seule fois la banque!) Banque : >PrSub1 EKFKAAMLLKSDTRCLGYRNVCKEG >PrSub2 YYDDVGLLCEKADTRALMAQFVPPL >PrSub3 SACILSTVNHSILKKSVHCLGYRSV

8 Blast: étape 1 Indexation de la banque (parcours 1 seule fois la banque!) Banque : Index : >PrSub1 EKFKAAMLLKSDTRCLGYRNVCKEG >PrSub2 YYDDVGLLCEKADTRALMAQFVPPL >PrSub3 SACILSTVNHSILKKSVHCLGYRSV EKFKA PrSub1 1

9 Blast: étape 1 Indexation de la banque (parcours 1 seule fois la banque!) Banque : Index : >PrSub1 EKFKAAMLLKSDTRCLGYRNVCKEG >PrSub2 YYDDVGLLCEKADTRALMAQFVPPL >PrSub3 SACILSTVNHSILKKSVHCLGYRSV EKFKA PrSub1 1 KFKAA PrSub1 2

10 Blast: étape 1 Indexation de la banque (parcours 1 seule fois la banque!) Banque : Index : >PrSub1 EKFKAAMLLKSDTRCLGYRNVCKEG >PrSub2 YYDDVGLLCEKADTRALMAQFVPPL >PrSub3 SACILSTVNHSILKKSVHCLGYRSV EKFKA PrSub1 1 KFKAA PrSub1 2 FKAAM PrSub1 3

11 Blast: étape 1 Indexation de la banque (parcours 1 seule fois la banque!) Banque : Index : >PrSub1 EKFKAAMLLKSDTRCLGYRNVCKEG >PrSub2 YYDDVGLLCEKADTRALMAQFVPPL >PrSub3 SACILSTVNHSILKKSVHCLGYRSV EKFKA PrSub1 1 KFKAA PrSub1 2 FKAAM PrSub1 3 CLGYR PrSub1 15

12 Blast: étape 1 Indexation de la banque (parcours 1 seule fois la banque!) Banque : Index : >PrSub1 EKFKAAMLLKSDTRCLGYRNVCKEG >PrSub2 YYDDVGLLCEKADTRALMAQFVPPL >PrSub3 SACILSTVNHSILKKSVHCLGYRSV EKFKA PrSub1 1 KFKAA PrSub1 2 FKAAM PrSub1 3 CLGYR PrSub CLGYR PrSub1 15 PrSub

13 Blast: étape 1 Indexation de la banque (parcours 1 seule fois la banque!) Index : Index trié : EKFKA PrSub1 1 KFKAA PrSub1 2 FKAAM PrSub1 3 CLGYR PrSub Tri CLGYR PrSub1 15 PrSub Le tri de l'index ainsi créé (table de hachage) optimise le temps de recherche AAMLL PrSub1 5 ACILS PrSub CILST PrSub3 3 CLGYR PrSub1 15 PrSub3 19 DDVGL PrSub2 3 DTRAL PrSub2 13 DTRCL PrSub KSDTR PrSub1 10 KSVHC PrSub3 15 etc.

14 Blast: étape 1 Recherche des mots de la Query dans l'index de la banque Query Index trié : >ProtQ SKCDKSDTRALLAQYIPSTVNHPIL AAMLL PrSub1 5 ACILS PrSub CILST PrSub3 3 CLGYR PrSub1 15 PrSub3 19 DDVGL PrSub2 3 DTRAL PrSub2 13 DTRCL PrSub KSDTR PrSub1 10 KSVHC PrSub3 15 etc.

15 Blast: étape 1 Recherche des mots de la Query dans l'index de la banque Query Index trié : >ProtQ SKCDKSDTRALLAQYIPSTVNHPIL SKCDK => 0 AAMLL PrSub1 5 ACILS PrSub CILST PrSub3 3 CLGYR PrSub1 15 PrSub3 19 DDVGL PrSub2 3 DTRAL PrSub2 13 DTRCL PrSub KSDTR PrSub1 10 KSVHC PrSub3 15 etc.

16 Blast: étape 1 Recherche des mots de la Query dans l'index de la banque Query Index trié : >ProtQ SKCDKSDTRALLAQYIPSTVNHPIL SKCDK => 0 KCDKS => 0 AAMLL PrSub1 5 ACILS PrSub CILST PrSub3 3 CLGYR PrSub1 15 PrSub3 19 DDVGL PrSub2 3 DTRAL PrSub2 13 DTRCL PrSub KSDTR PrSub1 10 KSVHC PrSub3 15 etc.

17 Blast: étape 1 Recherche des mots de la Query dans l'index de la banque Query Index trié : >ProtQ SKCDKSDTRALLAQYIPSTVNHPIL SKCDK => 0 KCDKS => 0 CDKSD => 0 AAMLL PrSub1 5 ACILS PrSub CILST PrSub3 3 CLGYR PrSub1 15 PrSub3 19 DDVGL PrSub2 3 DTRAL PrSub2 13 DTRCL PrSub KSDTR PrSub1 10 KSVHC PrSub3 15 etc.

18 Blast: étape 1 Recherche des mots de la Query dans l'index de la banque Query Index trié : >ProtQ SKCDKSDTRALLAQYIPSTVNHPIL SKCDK => 0 KCDKS => 0 CDKSD => 0 DKSDT => 0 AAMLL PrSub1 5 ACILS PrSub CILST PrSub3 3 CLGYR PrSub1 15 PrSub3 19 DDVGL PrSub2 3 DTRAL PrSub2 13 DTRCL PrSub KSDTR PrSub1 10 KSVHC PrSub3 15 etc.

19 Blast: étape 1 Recherche des mots de la Query dans l'index de la banque Query Index trié : >ProtQ SKCDKSDTRALLAQYIPSTVNHPIL SKCDK => 0 KCDKS => 0 CDKSD => 0 DKSDT => 0 KSDTR => PrSub1 10 AAMLL PrSub1 5 ACILS PrSub CILST PrSub3 3 CLGYR PrSub1 15 PrSub3 19 DDVGL PrSub2 3 DTRAL PrSub2 13 DTRCL PrSub KSDTR PrSub1 10 KSVHC PrSub3 15 etc.

20 Blast: étape 1 Recherche des mots de la Query dans l'index de la banque Query Index trié : >ProtQ SKCDKSDTRALLAQYIPSTVNHPIL SKCDK => 0 KCDKS => 0 CDKSD => 0 DKSDT => 0 KSDTR => PrSub1 10 SDTRA => 0 AAMLL PrSub1 5 ACILS PrSub CILST PrSub3 3 CLGYR PrSub1 15 PrSub3 19 DDVGL PrSub2 3 DTRAL PrSub2 13 DTRCL PrSub KSDTR PrSub1 10 KSVHC PrSub3 15 etc.

21 Blast: étape 1 Recherche des mots de la Query dans l'index de la banque Query Index trié : >ProtQ SKCDKSDTRALLAQYIPSTVNHPIL SKCDK => 0 KCDKS => 0 CDKSD => 0 DKSDT => 0 KSDTR => PrSub1 10 SDTRA => 0 DTRAL => PrSub2 13 AAMLL PrSub1 5 ACILS PrSub CILST PrSub3 3 CLGYR PrSub1 15 PrSub3 19 DDVGL PrSub2 3 DTRAL PrSub2 13 DTRCL PrSub KSDTR PrSub1 10 KSVHC PrSub3 15 etc.

22 Blast: étape 1 Recherche des mots de la Query dans l'index de la banque Query Index trié : >ProtQ SKCDKSDTRALLAQYIPSTVNHPIL SKCDK => 0 KCDKS => 0 CDKSD => 0 DKSDT => 0 KSDTR => PrSub1 10 SDTRA => 0 DTRAL => PrSub2 13 TRALL => 0 Etc. AAMLL PrSub1 5 ACILS PrSub CILST PrSub3 3 CLGYR PrSub1 15 PrSub3 19 DDVGL PrSub2 3 DTRAL PrSub2 13 DTRCL PrSub KSDTR PrSub1 10 KSVHC PrSub3 15 etc.

23 Blast: étape 1 Identification des k-mots «approximatifs» au lieu d'exiger k aa identiques successifs Score des k-mots T Exemple : DTRAL, T = 5 D T R A L S= = 11 => OK D V R H I D T R A L S= = -9 => NON M A T R G D T R A L S= = 8 => OK E S K S M D T R A L S= = 24 => OK D T R A L

24 Blast: étape 1 Identification des k-mots «approximatifs» au lieu d'exiger k aa identiques successifs Score des k-mots T Au lieu d'écrire dans l'index : DTRAL PrSub2 13 On pré-calcule les mots approximatifs, et on écrit : DTRAL PrSub DVRHI PrSub ESKSM PrSub (tous les 5-mots de score T) => Beaucoup de lignes d'index par mot de la banque Construction de l'index lente Recherche dans l'index longue => Sauf si k est petit!

25 Blast: étape 2 Extension de l'alignement (sans indel) => HSPs Mots «similaires» de taille k=4 (en aa) MGLSDGEWHLVLNVWGKVETDLAGHGQEVLIRLFKSHPETLEKFDKFKHLKSEDDMRRSEDLRKHGNTVLTAL. :... ::..:.. :.. ::.:.: : : MVADAVAKVCGSEAIKANLRRSWGVLSADIEATGLMLMSNLFTLRPDTKTYFTRLGDVQKGKANSKLRGHAITLTYAL Score (Blosum 30) = 72, ici MSP (Maximum Scoring Pair ) Extension du segment tant que S M (seuil fixé) MGLSDGEWHLVLNVWGKVETDLAGHGQEVLIRLFKSHPETLEKFDKFKHLKSEDDMRRSEDLRKHGNTVLTAL. :... ::..:.. :.. ::.:.: : : MVADAVAKVCGSEAIKANLRRSWGVLSADIEATGLMLMSNLFTLRPDTKTYFTRLGDVQKGKANSKLRGHAITLTYAL Score (Blosum 30) = 52, ici HSP (High Scoring Pair) Etc.

26 Blast: étape 2 Recherche des HSPs = High Scoring Pairs Basé sur l'idée que : En général, l'alignement optimal contient plusieurs HSPs dont sûrement la MSP (= Maximal Scoring Pair). Une HSP contient au moins un k-mot de score > T

27 Blast: étape 3 Significativité du score des HSPs Quelle est la probabilité ( p-value ) d obtenir par hasard les HSPs effectivement obtenus? Soit P(S) = e -λs la probabilité d'obtenir une HSP de score S On définit l'espérance E telle que : E-value = K B *l Q *e -λs où K B dépend de la taille et de la composition de la banque l Q = taille séquence Query => La E-value représente le nombre de HSPs de score S attendues au hasard dans la banque

28 Blast: étape 3 Significativité du score des HSPs La E-value représente le nombre de HSPs de score S attendu au hasard dans la banque E-value = 3 signifie «si je comparais ma séquence à une banque aléatoire de même taille et de même composition que la banque initiale, je m attendrais à trouver 3 alignements de score S» => pas significatif Plus la Evalue est petite, plus la similarité est pertinente (non due au hasard) Cette E-value dépend : De la matrice de substitution (=> S et taille des HSPs) De la taille et de la composition de la banque

29 Blast: étape 3 Significativité du score des HSPs Score S dépend des scores des différents Matchs (cf matrice de substitution) Les valeurs de cette matrice (log-odds) fondée sur l'hypothèse d'indépendance entre les différentes positions (chaque aa de la séquence) Ceci est faux pour les régions répétées des séquences => fausse la E-value Solution : masquer les séquences

30 Blast: étape 3 Masquer les séquences répétées Principe : filtrer la séquence Query en masquant les régions répétées Exemple : >sp P04156 PRIO_HUMAN Major prion protein OS=Homo sapiens GN=PRNP PE=1 SV=1 MANLGCWMLVLFVATWSDLGLCKKRPKPGGWNTGGSRYPGQGSPGGNRYPPQGGGGWGQP HGGGWGQPHGGGWGQPHGGGWGQPHGGGWGQGGGTHSQWNKPSKPKTNMKHMAGAAAAGA VVGGLGGYMLGSAMSRPIIHFGSDYEDRYYRENMHRYPNQVYYRPMDEYSNQNNFVHDCV NITIKQHTVTTTTKGENFTETDVKMMERVVEQMCITQYERESQAYYQRGSSMVLFSSPPV ILLISFLIFLIVGC Devient : >sp P04156 PRIO_HUMAN Major prion protein OS=Homo sapiens GN=PRNP PE=1 SV=1 MANLGCWMLVLFVATWSDLGLCKKRPKPGGWNTGGSRYPGQGSPGGNRYXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXTHSQWNKPSKPKTNMKHMXXXXXXXX XXXXXXXXXXXXXXXRPIIHFGSDYEDRYYRENMHRYPNQVYYRPMDEYSNQNNFVHDCV NITIKQHXXXXXXXXXXXXXXDVKMMERVVEQMCITQYERESQAYYQRGSSMVLFSXXXX XXXXXXXXXXXXX

31 Blast Masquer les séquences répétées Programmes distincts selon nature des séquences traitées : BLASTN séquence nucléique contre base nucléique BLASTP séquence protéique contre base protéique BLASTX séquence nucléique traduite en 6 phases contre base protéique TBLASTN séquence protéique contre base nucléique traduite en 6 phases Et d'autres Wu-blast, Psi-blast, etc.

32 Fasta / FastP Ancêtre de Blast = Fasta.

33 Fasta : Pearson & Lipman, PNAS 1988 A) Recherche des mots identiques de taille l k (matchs successifs joints si distance < seuil) B) Sur la base des 10 meilleurs, re-calcul du score avec PAM250, raccourcissement => Zones de + haut score = «initial region» C) Jonction des régions par alignement avec gap selon seuil D) Alignement NWS des couples Subject-Query sélectionnés autour de ces régions A C B D

34 Fasta : Pearson & Lipman, PNAS 1988 Significativité du score des alignments Basée sur la calcul d'un Z-score : Distribution de Score d'alignements «dus au hasard» => moyenne (m) et écart-type (e) Calcul du Z-score : Z = S-m/e => Comme déjà vu pour l'alignement 2 à 2 (Nws et SW).

35 Retour à la Génomique comparative On sait identifier des gènes qui se ressemblent Que peuvent me dire ces gènes sur l'histoire évolutive des génomes? => Homologie (orthologie/paralogie) et synténie

36 Gène et Homologie Rappel des définitions Des gènes homologues sont issus d un gène ancestral commun: Les gènes issus d un gène ancestral commun par héritage vertical sont dits orthologues. Par définition il existe donc au plus un orthologue par génome pour chaque gène considéré. Si ces gènes ont évolués par duplication l un de l autre ils sont dits paralogues

37 Gène et Homologie Exemple orthologues ORTHOLOGIE ORTHOLOGIE

38 Gène et Homologie Exemple paralogues ORTHOLOGIE PARALOGIE ORTHOLOGIE

39 Gène et Homologie Divergence + Fluidité ORTHOLOGUES? PARALOGUES?

40 Gène et Transfert horizontal

41 Retour à la Génomique comparative La similarité ne permet pas à elle seule d'établir des liens d'homologie!

42 Gènes et Orthologie Méthode du BBH Deux gènes a et b (codant pour des protéines pa et pb) appartenant respectivement aux génomes des organismes A et B sont dits en BBH si et seulement: Le meilleur hit blast de pb chez A est pa Le meilleur hit blast de pa chez B est pb Critères supplémentaires : Hit blast < 10^-6 taille(pa)=taille(pb) Taille alignement = taille des protéines

43 Gènes et Orthologie Méthode BBH Espèce A Espèce B a 1 b1 a 2 b2 a 3 b3 a 4 b4 a 5 b5 b6 a 2 et b 1 sont orthologues

44 BBH «Multi-Espèces» Exemple BBH en «étoile» pour 3 espèces Espèce A Espèce B Espèce C a 1 a 2 a 3 a 4 a 5 b1 b2 b3 b4 b5 c 1 c 2 c 3 c 4 b6 PIVOT a 2, b 1 et c 1 sont orthologues pour le BBH en «étoile»

45 BBH «Multi-Espèces» Exemple BBH en «clique» pour 3 espèces Espèce A Espèce B Espèce C a 1 a 2 a 3 a 4 a 5 b1 b2 b3 b4 b5 c 1 c 2 c 3 c 4 b6 a 2, b 1 et c 1 ne sont pas orthologues pour le BBH en «clique» => BBH en «clique» coûteux et très contraignant

46 La synténie

47 Synténie de Gènes Définition Ensemble de segments génomiques appartenant à différents génomes partageant «pratiquement» les mêmes gènes Ces segments témoignent d une conservation locale du voisinage génomique pouvant être affectée par quelques réarrangements (orientation, duplication, insertion, fusion, etc.)

48 Synténie de Gènes 1ère approche : le dotplot 2 isolats de Clostridium difficile Colinéarité = Synténie

49 Synténie de Gènes Exemple Gène : G1 G2 G3 G4 G5 G6 G7 Espèce 1 Espèce 2 Espèce 3 Espèce 4 Espèce 5 Espèce 6 Note: avant la détection des synténies, il faut définir les liens d orthologie. Ici, les gènes d une même couleur ont été identifiés (via le «BBH» par exemple) comme étant orthologues

50 Synténie de Gènes Définition gene team (Raffinot et al., 2004) u, a et w sont en synténie sur X et Z à un gap près X f u a w Y z a x y Z u x a a w

51 Synténie de Gènes Intérêts de la synténie La détection de synténies permet d identifier des gènes susceptibles d être fonctionnellement liés et/ou d interagir (opérons, clusters de gènes) La synténie permet également d évaluer et d identifier les réarrangements affectant les génomes tels que les transpositions, délétions, insertions, inversions, fusions et fissions (mesure phylogénétique, étude de la dynamique/fluidité des génomes)

52 Exemple Fluidité des génomes A B Inversion autour du terminus B

53 Exemple Caractérisation des zones conservées: les synténies B Gènes orthologues : B2

54

55 Exemple Cas réel

56 Synténie de Gènes Macro-synténie, Micro-synténie Micro-synténie: ensemble de segments génomiques appartenant à différents génomes partageant «pratiquement» les mêmes gènes Macro-synténie: deux gènes «côte à côte» sur le chromosome d une espèce sont sur le même chromosome dans une autre espèce

57 Homme / Souris

58

59 Jaillon et al., Nature, 2004

Comparaison et alignement de séquences 2

Comparaison et alignement de séquences 2 Comparaison et alignement de séquences 2 LV348 -BI Sophie Pasek sophie.pasek@upmc.fr Comment comparer une séquence contre une banque? Comparaison séquence/banque Pourquoi? : Réunir un échantillon taxonomique

Plus en détail

Plan. Comparaison de 2 séquences. Dotplot, alignement optimal Recherche de similarité. Alignement multiple. Phylogénie moléculaire

Plan. Comparaison de 2 séquences. Dotplot, alignement optimal Recherche de similarité. Alignement multiple. Phylogénie moléculaire Plan 1 Banques de données 2 Comparaison de 2 séquences Dotplot, alignement optimal Recherche de similarité 3 Alignement multiple l 4 Phylogénie moléculaire Recherche de similarité 1 séquence (Query) comparée

Plus en détail

Recherche par similarité dans les banques/bases de données La suite Blast (Basic Local Alignment Search Tool)

Recherche par similarité dans les banques/bases de données La suite Blast (Basic Local Alignment Search Tool) Recherche par similarité dans les banques/bases de données La suite Blast (Basic Local Alignment Search Tool) A A C T G G T A A C C G A G C T A C G G T C C G Algorithme de Blast (version 1) (Altschul et

Plus en détail

TD Bioinformatique : Sequence Alignment. Pourquoi faire une recherche par similarité?

TD Bioinformatique : Sequence Alignment. Pourquoi faire une recherche par similarité? TD Bioinformatique : Sequence lignment Pourquoi faire une recherche par similarité? - Savoir si ma séquence ressemble à d'autres déjà connues. - Trouver toutes les séquences d'une même famille. - Rechercher

Plus en détail

Algorithmes pour la comparaison de séquences II

Algorithmes pour la comparaison de séquences II Algorithmes pour la comparaison de séquences II Hélène TOUZET touzet@lifl.fr Equipe Bioinfo Master recherche informatique www.lifl.fr/~touzet/masterrecherche.html Pourquoi comparer des séquences? Puisque

Plus en détail

Bioinformatique appliquée. Cours 4 BLAST. idée. lire un résultat de Blast. la famille Blast

Bioinformatique appliquée. Cours 4 BLAST. idée. lire un résultat de Blast. la famille Blast Bioinformatique appliquée Cours 4 BLAST idée lire un résultat de Blast la famille Blast -1- "quelle est la similarité entre ces 2 séquences? et donc: est-ce que ces deux séquences sont homologues?" "existe-t-il

Plus en détail

Scores d alignement Matrices de substitution. J.S. Bernardes/H. Richard

Scores d alignement Matrices de substitution. J.S. Bernardes/H. Richard Scores d alignement Matrices de substitution J.S. Bernardes/H. Richard Score d'un alignement Score alignement = Σ scores événements élémentaires (Match, Mismatch, Indel) Amélioration du modèle : pénalité

Plus en détail

Alignement de séquences (2/2)

Alignement de séquences (2/2) Alignement de séquences (2/2) Observation à l aide de l outil graphique : le dotplot. Simple, visuel, Très informatif : Permet de repérer une similarité globale Permet de repérer des similarités locales

Plus en détail

Analyse in silico de génomes, protéomes et transcriptomes. «Génomique comparative» V.2012.1. Protocole TD

Analyse in silico de génomes, protéomes et transcriptomes. «Génomique comparative» V.2012.1. Protocole TD Magistère Biotechnologies Analyse in silico de génomes, protéomes et transcriptomes «Génomique comparative» V.2012.1 Protocole TD Notes : Scripts et données sur : http://rna.igmors.u-psud.fr/gautheret/cours/analinsilico

Plus en détail

AutoGRAPH Un serveur pour automatiser et visualiser la comparaison de génomes: Application à l identification de nouveaux gènes chez le chien.

AutoGRAPH Un serveur pour automatiser et visualiser la comparaison de génomes: Application à l identification de nouveaux gènes chez le chien. AutoGRAPH Un serveur pour automatiser et visualiser la comparaison de génomes: Application à l identification de nouveaux gènes chez le chien. Thomas DERRIEN CNRS-UMR6061 Génétique et Développement Université

Plus en détail

Initiation à la Bioinformatique

Initiation à la Bioinformatique Université d Alexandrie Initiation à la Bioinformatique Basic Local Alignment Search Tool BLAST Université d Alexandrie AUF Auteur(s): Mohamed GAD 2009/2010 Auteur(s) : Mohamed GAD Professeur à l institut

Plus en détail

Introduction à l annotation de séquences

Introduction à l annotation de séquences Introduction à l annotation de séquences - Université de Lille 1-2 eme Semestre But de l annotation de séquences Les séquences nucléiques : Détecter la présence de gènes Trouver la structure des gènes

Plus en détail

Modélisation de la structure 3D des protéines

Modélisation de la structure 3D des protéines Modélisation de la structure 3D des protéines We are drowning in data and starving for knowledge -R.D. Roger Unité Mathématique Informatique et Génome Séminaire AGENAE, Seignosse-le-Pénon, 20-21 mai 2003

Plus en détail

Corrigé Contrôle terminal : Bioanalyse (EL6BIOFM) 6 mai 2014

Corrigé Contrôle terminal : Bioanalyse (EL6BIOFM) 6 mai 2014 Corrigé Contrôle terminal : Bioanalyse (EL6BIOFM) 6 mai 2014 Exercice 1 (4,5 points) 1. Donner la définition de l acronyme BLAST. (0,5 pt) : Basic Local Alignment Search Tool 2. Expliquer les principes

Plus en détail

INTRODUCTION À LA BIO-INFORMATIQUE

INTRODUCTION À LA BIO-INFORMATIQUE Biologie moléculaire-2016 1 INTRODUCTION À LA BIO-INFORMATIQUE Dans cette section, on désire vous donner une introduction sur l utilisation du site web du National Center for Biotechnology Information

Plus en détail

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST.

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST. La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST. Gaël Le Mahec - p. 1/12 L algorithme BLAST. Basic Local Alignment Search Tool est un algorithme de recherche

Plus en détail

Lancer FASTA et BLAST en ligne de commande

Lancer FASTA et BLAST en ligne de commande Lancer FASTA et BLAST en ligne de commande V.2006.1 http://www.esil.univ-mrs.fr/~dgaut/cours Daniel Gautheret ESIL, Université de la Méditerranée Fasta Article original: Lipman and Pearson (1985) Science

Plus en détail

Sommaire. A) Méthode de contrôle manuel des résultats produits par GLADX

Sommaire. A) Méthode de contrôle manuel des résultats produits par GLADX Sommaire Définitions et abréviations Résumé Introduction I. Matériel II. Méthode A) Méthode de contrôle manuel des résultats produits par GLADX B) Comparaison des résultats de l outil GLADX avec les résultats

Plus en détail

Transformée de Burrows-Wheeler et mapping de données RNA-seq

Transformée de Burrows-Wheeler et mapping de données RNA-seq Transformée de Burrows-Wheeler et mapping de données RNA-seq MAPPI, journée indexation 6 juin 2011 Introduction Indexation But : Recherche rapide d'une information dans de grands volumes de données Indexation

Plus en détail

Corrigé du TD1. Exercice 1:

Corrigé du TD1. Exercice 1: Corrigé du TD1 Exercice 1: le but était d'aligner des séquences à la main et de compter les substitutions entre acides aminés observées. Le résultat se trouve à cette adresse: http://tagc.univ-mrs.fr/herrmann/bio6/displaymatrix.php

Plus en détail

BIO6: Bioinformatique appliquée Correction du TD3

BIO6: Bioinformatique appliquée Correction du TD3 BIO6: Bioinformatique appliquée Correction du TD3 Exercice 1 : programmation dynamique voir le site web indiqué dans le TD pour corriger l'exercice Exercice 2 : similarité de séquence et distance évolutive

Plus en détail

Recherche d homologies

Recherche d homologies Recherche d homologies Soluscience Guillaume Chakroun guillaume chakroun@hotmail.com Copyright c 2004 Guillaume Chakroun TABLE DES MATIÈRES Table des matières 1 Introduction 4 2 Les systèmes de scores

Plus en détail

Introduction à la bioinformatique

Introduction à la bioinformatique Faculté des Sciences - Rabat Laboratoire de Microbiologie et Biologie Moléculaire -------------------------------------- Université Mohamed V - Agdal Faculté des Sciences B.P. 1014 - Rabat - MAROC TD Biologie

Plus en détail

Étude de la biodiversité fongique à l aide de techniques de pyroséquençage

Étude de la biodiversité fongique à l aide de techniques de pyroséquençage Étude de la biodiversité fongique à l aide de techniques de pyroséquençage Biodiversité fongique Biodiversité: diversité spécifique d une communauté écologique, correspondant au nombre d espèces et à leur

Plus en détail

Initiation à la Bioinformatique Daniel Gautheret ESIL, Université de la Méditerranée

Initiation à la Bioinformatique Daniel Gautheret ESIL, Université de la Méditerranée Initiation à la Bioinformatique Daniel Gautheret ESIL, Université de la Méditerranée V.2004.4 http://www.esil.univ-mrs.fr/~dgaut/cours Bioinformatique Deux définitions possibles Applications de l informatique

Plus en détail

Familles de gènes. Nadia El-Mabrouk

Familles de gènes. Nadia El-Mabrouk Familles de gènes Nadia El-Mabrouk Les gènes Parties codantes de l ADN Unités de base de l héridité. Une fois les gènes identifiés, ils doivent être annotés pour leur fonction. Familles de gènes Des gènes

Plus en détail

Bases de données documentaires et distribuées Cours NFE04

Bases de données documentaires et distribuées Cours NFE04 Bases de données documentaires et distribuées Cours NFE04 Introduction a la recherche d information Auteurs : Raphaël Fournier-S niehotta, Philippe Rigaux, Nicolas Travers prénom.nom@cnam.fr Département

Plus en détail

Heuristiques pour l alignement et la recherche dans les banques de données biologiques

Heuristiques pour l alignement et la recherche dans les banques de données biologiques Heuristiques pour l alignement et la recherche dans les banques de données biologiques Plan I. Introduction II. Matrices de substitutions: PAM, BLOSUM III. Algorithmes de Filtrage Basés sur la recherche

Plus en détail

VI. Domaines protéiques

VI. Domaines protéiques Chapitre 1 Structure des protéines I. Rappels Définitions II. La Protein Data Bank (PDB) III. Angles dièdres et diagramme de ramachandran IV. Structures secondaires V. Structures supersecondaires VI. Domaines

Plus en détail

Calcul intensif en Bioinformatique

Calcul intensif en Bioinformatique Calcul intensif en Bioinformatique Réalisations en génétique et génomique évolutives Pôle Rhône Alpin de BioInformatique (PRABI) Laboratoire de Biologie et Biométrie Evolutives (LBBE) Contexte De plus

Plus en détail

Détection exhaustive des gènes orthologues entre deux génomes complets

Détection exhaustive des gènes orthologues entre deux génomes complets Détection exhaustive des gènes orthologues entre deux génomes complets GTGC - 12 octobre 2006 Claire Guillet, Laurent Guéguen et Laurent Duret Laboratoire de Biométrie et Biologie Evolutive - Lyon 1 Problématique

Plus en détail

Identification de nouveaux membres dans des familles d'interleukines

Identification de nouveaux membres dans des familles d'interleukines Identification de nouveaux membres dans des familles d'interleukines Nicolas Beaume Jérôme Mickolajczak Gérard Ramstein Yannick Jacques 1ère partie : Définition de la problématique Les familles de gènes

Plus en détail

TD2 : Histoire évolutive de la famille GH15 des glucosides hydrolases

TD2 : Histoire évolutive de la famille GH15 des glucosides hydrolases Master 1 :: module BBSG1.2.1 "Bioinformatique" :: année 2006/2007 TD2 : Histoire évolutive de la famille GH15 des glucosides hydrolases Encadrants: Emmanuel Talla (talla@ibsm.cnrs-mrs.fr) & Céline Brochier-Armanet

Plus en détail

Examen de Génomique et Protéomique Fonctionnelle M2 BBSG (Mastères Recherche et Pro) 2 février 2006 Durée 3h. Partie1. Génomique fonctionnelle

Examen de Génomique et Protéomique Fonctionnelle M2 BBSG (Mastères Recherche et Pro) 2 février 2006 Durée 3h. Partie1. Génomique fonctionnelle Examen de Génomique et Protéomique Fonctionnelle M2 BBSG (Mastères Recherche et Pro) 2 février 2006 Durée 3h L examen comporte deux parties, l une axée sur la génomique fonctionnelle et l autre sur la

Plus en détail

Prédiction de gènes. Cours de présentation des outils bio-informatiques pour la localisation puis l'étude des gènes. Equipe Bonsai (2014)

Prédiction de gènes. Cours de présentation des outils bio-informatiques pour la localisation puis l'étude des gènes. Equipe Bonsai (2014) Prédiction de gènes Cours de présentation des outils bio-informatiques pour la localisation puis l'étude des gènes Equipe Bonsai (2014) La localisation des gènes C'est la première étape pour interpréter

Plus en détail

AVL Liban La Bioinformatique. Bioinformatique

AVL Liban La Bioinformatique. Bioinformatique AVL Liban 2011 La Sami Khuri Department of Computer Science San José State University San José, California, USA sami.khuri@sjsu.edu www.cs.sjsu.edu/faculty/khuri Sami Khuri sami.khuri@sjsu.edu Qu est-ce

Plus en détail

HMSN206 - Partie Alignement

HMSN206 - Partie Alignement M1 Bioinformatique, Connaissances et Données Master Sciences et Numérique pour la Santé Année 2016-2017 HMSN206 - Partie Alignement Partie I-2 : Matrices de scores, BLAST, FASTA Anne-Muriel Arigon Chifolleau

Plus en détail

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Le Data Mining au service du Scoring ou notation statistique des emprunteurs! France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative

Plus en détail

Fiche technique : étudier les protéines avec UniProt

Fiche technique : étudier les protéines avec UniProt Fiche technique : étudier les protéines avec UniProt http://www.uniprot.org/ Objectifs : ce site en ligne «UniProt», pour Universal Protein Resource, permet d étudier les protéines dans un cadre évolutionniste.

Plus en détail

Différences entre Homme et singes?

Différences entre Homme et singes? Différences entre Homme et singes? Différences entre Homme et singes? Apparition de l œil? Apparition du vol? Apparition des hémoglobines? Molécule d hémoglobine HEME Chaîne polypeptidique de type 2 Chaîne

Plus en détail

Chapitre VI Échantillonages et simulations

Chapitre VI Échantillonages et simulations Chapitre VI Commentaires : Récursivement, les commentaires ne sont pas à l attention des élèves.. Fluctuation d échantillonnage Définition : En statistiques, un échantillon de taille n est la liste des

Plus en détail

BIN 1002: INTÉGRATION BIOSCIENCES/INFORMATIQUE

BIN 1002: INTÉGRATION BIOSCIENCES/INFORMATIQUE BIN 1002: INTÉGRATION BIOSCIENCES/INFORMATIQUE Plan de Cours Automne 2015 Professeurs: Sylvie Hamel, Département d Informatique et de Recherche Opérationnelle Guillaume Lettre, Institut de Cardiologie

Plus en détail

Distance et classification. Cours 4: Traitement du signal et reconnaissance de forme

Distance et classification. Cours 4: Traitement du signal et reconnaissance de forme Distance et classification Cours 4: Traitement du signal et reconnaissance de forme Plan Introduction Pré-traitement Segmentation d images Morphologie mathématique Extraction de caractéristiques Classification

Plus en détail

Savoir Faire Excel Niveau 2. 5 novembre 2007 Naomi Yamaguchi naomi.yamaguchi@univ-paris3.fr

Savoir Faire Excel Niveau 2. 5 novembre 2007 Naomi Yamaguchi naomi.yamaguchi@univ-paris3.fr Savoir Faire Excel Niveau 2 5 novembre 2007 Naomi Yamaguchi naomi.yamaguchi@univ-paris3.fr Ce qu on sait faire Entrer et recopier des données numériques Les fonctions de base (somme, moyenne, nb, si) Faire

Plus en détail

Apprentissage d automates sur les protéines

Apprentissage d automates sur les protéines Apprentissage d automates sur les protéines Approche par fusion de fragments significativement similaires (Jobim 04) François Coste, Goulven Kerbellec, Boris Idmont, Daniel Fredouille Christian Delamarche

Plus en détail

Phylogénomique : introduction

Phylogénomique : introduction Phylogénomique : introduction Les limites des phylogénies basées sur un seul gène Résolution limitée (erreur stochastique) La phylogénie du gène peut être différente de la phylogénie des espèces à cause

Plus en détail

Classe de 3ème. Effectif partiel n Effectif total N

Classe de 3ème. Effectif partiel n Effectif total N Classe de 3ème Chapitre 2 Statistiques. 1. Quelques rappels. Une série statistique est composée de valeurs. Le nombre de fois où une valeur est répétée s'appelle l'effectif partiel de cette valeur. La

Plus en détail

TD 3 Recherche de similarités dans une banque de séquences

TD 3 Recherche de similarités dans une banque de séquences Module LV348 Version enseignant TD 3 page 1/7 TD 3 Recherche de similarités dans une banque de séquences Revu dernièrement par Mathilde Carpentier, Cyril Gallut et Joël Pothier Version du 30 mars 2012

Plus en détail

Recherche de similarités au moyen de BLAST

Recherche de similarités au moyen de BLAST Recherche de similarités au moyen de BLAST Guy Perrière Laboratoire de Biométrie et Biologie Évolutive UMR CNRS 5558 Université Claude Bernard Lyon 1 http://pbil.univ-lyon1.fr/members/perriere/cours/m1/

Plus en détail

L'apport de l'étude des génomes : les innovations génétiques.

L'apport de l'étude des génomes : les innovations génétiques. Introduction : L'apport de l'étude des génomes : les innovations génétiques. Au sein du vivant, les espèces se différencient les unes des autres par l existence de gènes différents. Au sein d une espèce,

Plus en détail

Programmes de comparaison de banques de données

Programmes de comparaison de banques de données Programmes decomparaison debanquesdedonnées FASTA introduction Programmesdecomparaisonde2séquencestroplongs Méthodesheuristiques But:filtrerparétapessuccessiveslesséquences «intéressantes» Etablissementd'unscorepourclasserlesmeilleuressimilitudes

Plus en détail

Optimisation Combinatoire (Méthodes approchées) II. Recherche Locale simple (Les bases)

Optimisation Combinatoire (Méthodes approchées) II. Recherche Locale simple (Les bases) Optimisation Combinatoire (Méthodes approchées) II. Recherche Locale simple (Les bases) Heuristique Constructive Itérativement, ajoute de nouvelles composantes à une solution partielle candidate Espace

Plus en détail

Deuxième partie. Calcul de fréquences de génotypes multilocus dans des pédigrees complexes XXVII

Deuxième partie. Calcul de fréquences de génotypes multilocus dans des pédigrees complexes XXVII Deuxième partie Calcul de fréquences de génotypes multilocus dans des pédigrees complexes XXVII Présentation Les programmes informatiques MDM et grafgen L analyse de schémas de construction de génotypes

Plus en détail

Bioinformatique Appliquée Recherche de similitudes

Bioinformatique Appliquée Recherche de similitudes Besoin d'accélérer la recherche de similitude dans une banque Bioinformatique Appliquée Recherche de similitudes La recherche de similitude permet de comparer une séquence appelée requête (query) à une

Plus en détail

Data Mining : la classification non supervisée

Data Mining : la classification non supervisée Data Mining : la classification non supervisée Clustering : une affaire de distance. Etude préliminaire. Valeurs discrètes. Soient les deux individus suivants correspondant à des séquences ADN : X = AGGGTGGC

Plus en détail

Outils de la Bioinformatique M1 GENIOMHE/ M1 BS Comparaison de séquences 2 à 2

Outils de la Bioinformatique M1 GENIOMHE/ M1 BS Comparaison de séquences 2 à 2 Outils de la Bioinformatique M1 ENIOMHE/ M1 BS omparaison de séquences 2 à 2 Exercice 1 : omparaison visuelle de séquences avec ot Plot Les séquences suivantes sont à comparer : Séquence_1 Séquence_2 1.1)

Plus en détail

Initiation à la phylogénie moléculaire. Jean-François Dufayard Équipe "Intégration des Données"

Initiation à la phylogénie moléculaire. Jean-François Dufayard Équipe Intégration des Données Initiation à la phylogénie moléculaire Jean-François Dufayard Équipe "Intégration des Données" Famille de gènes? Ou "Il était une fois la phylogénie"...?? Il était une fois la phylogénie Histoire évolutive

Plus en détail

Principe des tests statistiques

Principe des tests statistiques Principe des tests statistiques Jean Vaillant Un test de signification est une procédure permettant de choisir parmi deux hypothèses celles la plus probable au vu des observations effectuées à partir d

Plus en détail

Première STMG1 2014-2015 progression. - 1. Séquence : Proportion d une sous population dans une population.

Première STMG1 2014-2015 progression. - 1. Séquence : Proportion d une sous population dans une population. Première STMG1 2014-2015 progression. - 1 Table des matières Fil rouge. 3 Axes du programme. 3 Séquence : Proportion d une sous population dans une population. 3 Information chiffrée : connaître et exploiter

Plus en détail

Bioinformatique BTV Alignement de Séquences

Bioinformatique BTV Alignement de Séquences 1 / 60 Bioinformatique BTV Alignement de Séquences Jean-Michel Richer jean-michel.richer@univ-angers.fr http://www.info.univ-angers.fr/pub/richer Juillet 2008 2 / 60 Plan Plan 1 Rappels 2 Alignement multiple

Plus en détail

TD5 : Prédiction de la structure tridimensionnelle d une protéine Modélisation moléculaire

TD5 : Prédiction de la structure tridimensionnelle d une protéine Modélisation moléculaire TD5 : Prédiction de la structure tridimensionnelle d une protéine Modélisation moléculaire Vous aurez besoin des programmes suivant : d un éditeur de séquence d un visualiseur de structure 3D (PyMOL) Avant-propos

Plus en détail

Homéoallèles. Analyse différentielle. Normalisation. NGS Transcriptomique Python R. Blé RNA-seq

Homéoallèles. Analyse différentielle. Normalisation. NGS Transcriptomique Python R. Blé RNA-seq Présenté par Xi LIU ATCGCGCTAGCTGGTGTATCGCATCGCGCTAGCTGGTGTATCGCGCTAGCTGGTGTATCGCGCTAGCCTGGTGTATCGCCATCGCGCTAGCTGGCGCTAGCTGAATCGCGCATATG 17 Septembre 2013 Homéoallèles Génome Normalisation Analyse différentielle

Plus en détail

Épreuve de mathématiques Terminale ES 200 minutes

Épreuve de mathématiques Terminale ES 200 minutes Examen 2 Épreuve de mathématiques Terminale ES 200 minutes L usage de la calculatrice programmable est autorisé. La bonne présentation de la copie est de rigueur. Cet examen comporte 7 pages et 5 exercices.

Plus en détail

Atelier «Très Haute Résolution Spatiale» Outils pour la reconnaissance des formes

Atelier «Très Haute Résolution Spatiale» Outils pour la reconnaissance des formes CNES Paris - 22/05/2003 Atelier «Très Haute Résolution Spatiale» Outils pour la reconnaissance des formes Michel DHOME LASMEA UMR 6602CNRS/UBP Clermont-Ferrand Etat de l art (communauté vision artificielle)

Plus en détail

Introduction à l analyse statistique et bioinformatique des puces à ADN

Introduction à l analyse statistique et bioinformatique des puces à ADN Formation INSERM 10 février 2004 Introduction à l analyse statistique et bioinformatique des puces à ADN Gaëlle Lelandais lelandais@biologie.ens.fr 1 Première Partie Analyse d une puce à ADN : Le recherche

Plus en détail

Annotation de séquences génomiques Exemple d une région du chromosome 1 de riz autour du gène qsh1 (Os_1:36429001..36558000)

Annotation de séquences génomiques Exemple d une région du chromosome 1 de riz autour du gène qsh1 (Os_1:36429001..36558000) Annotation de séquences génomiques Exemple d une région du chromosome 1 de riz autour du gène qsh1 (Os_1:36429001..36558000) II) Annotation de gènes codant des protéines 1) Objectif du TD L objectif du

Plus en détail

Le mot «algorithme» vient du nom de l auteur persan Al-Khuwarizmi (né vers 780 - mort vers 850) Une définition: «un algorithme est une suite finie de

Le mot «algorithme» vient du nom de l auteur persan Al-Khuwarizmi (né vers 780 - mort vers 850) Une définition: «un algorithme est une suite finie de Le mot «algorithme» vient du nom de l auteur persan Al-Khuwarizmi (né vers 780 - mort vers 850) Une définition: «un algorithme est une suite finie de règles à appliquer dans un ordre déterminé à un nombre

Plus en détail

Méthodologie d échantillonnage et Échantillonneur ASDE

Méthodologie d échantillonnage et Échantillonneur ASDE Méthodologie d échantillonnage et Échantillonneur ASDE Par Michel Rochon L énoncé suivant définit de façon générale la méthodologie utilisée par Échantillonneur ASDE pour tirer des échantillons téléphoniques.

Plus en détail

Alignement d une séquence avec une banque. Thierry Lecroq Université de Rouen 1

Alignement d une séquence avec une banque. Thierry Lecroq Université de Rouen 1 Alignement d une séquence avec une banque 1 Problématique générale Localiser des alignements significatifs entre une séquence requête x dans une banque de p séquences Y = {y 0,y 1,,y p 1 }. La solution

Plus en détail

Heuristique et métaheuristique. 8. Optimisation combinatoire et métaheuristiques. Optimisation combinatoire. Problème du voyageur de commerce

Heuristique et métaheuristique. 8. Optimisation combinatoire et métaheuristiques. Optimisation combinatoire. Problème du voyageur de commerce Heuristique et métaheuristique IFT1575 Modèles de recherche opérationnelle (RO) 8. Optimisation combinatoire et métaheuristiques Un algorithme heuristique permet d identifier au moins une solution réalisable

Plus en détail

Projet informatique «Voyageur de commerce» Résolution approchée par algorithme génétique du problème du voyageur de commerce

Projet informatique «Voyageur de commerce» Résolution approchée par algorithme génétique du problème du voyageur de commerce Année 2007-2008 Projet informatique «Voyageur de commerce» Résolution approchée par algorithme génétique du problème du voyageur de commerce B. Monsuez Projet informatique «Voyageur de commerce» Résolution

Plus en détail

Exercices : Probabilités

Exercices : Probabilités Exercices : Probabilités Partie : Probabilités Exercice Dans un univers, on donne deux événements et incompatibles tels que =0, et =0,7. Calculer,, et. Exercice Un dé (à faces) est truqué de la façon suivante

Plus en détail

Séquençage haut débit 5 mars 26 mars (14h) C. Gaspin, C. Klopp, J. Mariette & G. Salin

Séquençage haut débit 5 mars 26 mars (14h) C. Gaspin, C. Klopp, J. Mariette & G. Salin Séquençage haut débit 5 mars 26 mars (14h) C. Gaspin, C. Klopp, J. Mariette & G. Salin Plan de la session Bioinformatique & séquençage haut débit Date Intervenant (s) Libellé 05/03 G. Salin Introduction

Plus en détail

La synténie : Définition. Co-localisation intra génome. Co-localisation intra génome

La synténie : Définition. Co-localisation intra génome. Co-localisation intra génome La synténie : Définition Groupe de gènes dont le voisinage et l organisation sont conservés sur plusieurs génomes La synténie se caractérise par types de relations : définition(s), détection, intérêt en

Plus en détail

IN 101 - Cours 05. 7 octobre 2011. Un problème concret Recherche de collisions

IN 101 - Cours 05. 7 octobre 2011. Un problème concret Recherche de collisions Un problème concret Recherche de collisions IN 101 - Cours 05 7 octobre 2011 Le paradoxe des anniversaires dit que 365 élèves sont suffisants (en moyenne) pour avoir une collision d anniversaire, deux

Plus en détail

I. Cas de l équiprobabilité

I. Cas de l équiprobabilité I. Cas de l équiprobabilité Enoncé : On lance deux dés. L un est noir et l autre est blanc. Calculer les probabilités suivantes : A «Obtenir exactement un as» «Obtenir au moins un as» C «Obtenir au plus

Plus en détail

Master IAD Module PS. Reconnaissance de la parole (suite) Modèles de Markov et bases de données. Gaël RICHARD Février 2008

Master IAD Module PS. Reconnaissance de la parole (suite) Modèles de Markov et bases de données. Gaël RICHARD Février 2008 Master IAD Module PS Reconnaissance de la parole (suite) Modèles de Markov et bases de données Gaël RICHARD Février 2008 1 Reconnaissance de la parole Introduction Approches pour la reconnaissance vocale

Plus en détail

Recherche de parenté entre les vertébrés

Recherche de parenté entre les vertébrés 1 CHAPITRE A Recherche de parenté entre les vertébrés 2 Chapitre A : Recherche de parentés entre les êtres vivants Tous les êtres vivants présentent des structures cellulaires et un fonctionnement commun

Plus en détail

Fida KHATER & Abdoulaziz MOUSSA 03 mars 2012 - Journée Portes Ouvertes à l'um2

Fida KHATER & Abdoulaziz MOUSSA 03 mars 2012 - Journée Portes Ouvertes à l'um2 DEVELOPPEMENT D UNE INTERFACE GRAPHIQUE : LOCAL WEB GUI FOR BLAST (LWBG), POUR LES TRAITEMENTS DE DONNEES BIOLOGIQUES Fida KHATER & Abdoulaziz MOUSSA 03 mars 2012 - Journée Portes Ouvertes à l'um2 Plan

Plus en détail

Prof.É.D.Taillard. Classification automatique @Prof. E. Taillard 1 EIVD, Informatique logiciel, 4 e semestre

Prof.É.D.Taillard. Classification automatique @Prof. E. Taillard 1 EIVD, Informatique logiciel, 4 e semestre INFORMATIQUE ORIENTATION LOGICIELS CLASSIFICATION AUTOMATIQUE Prof.É.D.Taillard Classification automatique @Prof. E. Taillard EIVD, Informatique logiciel, 4 e semestre CLASSIFICATION AUTOMATIQUE But :

Plus en détail

Problème: si les tableaux que l'on trie sont déjà à peu près triés, l'algorithme n'est pas efficace.

Problème: si les tableaux que l'on trie sont déjà à peu près triés, l'algorithme n'est pas efficace. Traonmilin Yann traonmil@enst.fr MOD Algorithmique Probabiliste 1. Deux exemples 1.1. Quicksort randomisé. Dans l'algorithme de tri classique Quicksort, le pivot est choisi au début du tableau puis on

Plus en détail

Saisie de données. Dans ce chapitre

Saisie de données. Dans ce chapitre 3 Saisie de données Dans ce chapitre Éditer et mettre en forme les cellules........................ 32 Copier et déplacer les cellules............................ 38 Remplir les cellules avec des séries

Plus en détail

Rapport. TME2 - Problème d affectation multi-agents

Rapport. TME2 - Problème d affectation multi-agents Rapport TME2 - Problème d affectation multi-agents Auteurs : Encadrant : Lan Zhou Safia Kedad-Sidhoum Minh Viet Le Plan I. Problème :... 2 II. Question 1 - Formulation linéaire du problème :... 2 III.

Plus en détail

SUGARCRM MODULE RAPPORTS

SUGARCRM MODULE RAPPORTS SUGARCRM MODULE RAPPORTS Référence document : SYNOLIA_Support_SugarCRM_Module_Rapports_v1.0.docx Version document : 1.0 Date version : 2 octobre 2012 Etat du document : En cours de rédaction Emetteur/Rédacteur

Plus en détail

Méthodes et algorithmes pour le séquençage

Méthodes et algorithmes pour le séquençage Méthodes et algorithmes pour le séquençage Jérémie MARY http://www.lri.fr/~mary La comparaison de séquences Distance d'édition Selon ce concept, le bon alignement est celui qui minimise les opérations

Plus en détail

choisir H 1 quand H 0 est vraie - fausse alarme

choisir H 1 quand H 0 est vraie - fausse alarme étection et Estimation GEL-64943 Hiver 5 Tests Neyman-Pearson Règles de Bayes: coûts connus min π R ( ) + ( π ) R ( ) { } Règles Minimax: coûts connus min max R ( ), R ( ) Règles Neyman Pearson: coûts

Plus en détail

Master 1 de Psychologie du Travail et des Organisations : Recueil et analyse des données - Corrigés des T.D. ( 2014/2015) -

Master 1 de Psychologie du Travail et des Organisations : Recueil et analyse des données - Corrigés des T.D. ( 2014/2015) - Dominique Ferrieux - Université Paul Valéry - Montpellier III Master de Psychologie du Travail et des Organisations : Recueil et analyse des données - Corrigés des T.D. ( /) - Deuxième partie : Plans :

Plus en détail

Sommaire. Chapitre 1 Variables et vecteurs aléatoires... 5. Chapitre 2 Variables aléatoires à densité... 65

Sommaire. Chapitre 1 Variables et vecteurs aléatoires... 5. Chapitre 2 Variables aléatoires à densité... 65 Sommaire Chapitre 1 Variables et vecteurs aléatoires............... 5 A. Généralités sur les variables aléatoires réelles.................... 6 B. Séries doubles..................................... 9

Plus en détail

ESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring

ESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring ESSEC Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring Les méthodes d évaluation du risque de crédit pour les PME et les ménages Caractéristiques Comme les montants des crédits et des

Plus en détail

Comparaison et alignement. de séquences LV348 -BI. Sophie Pasek

Comparaison et alignement. de séquences LV348 -BI. Sophie Pasek Comparaison et alignement de séquences LV348 -BI Sophie Pasek sophie.pasek@upmc.fr Comment comparer deux séquences? Le Dot-Plot Tableau indexé par les caractères des deux séquences Identité : Non Identité:

Plus en détail

Guide de prise en mains rapide

Guide de prise en mains rapide 1. Introduction Guide de prise en mains rapide 1.1. Principe de manipulation Pour effectuer l'ensemble de vos commandes dans SIMILIS, vous pouvez agir indifféremment de trois façons : soit utiliser les

Plus en détail

LES FAMILLES MULTIGÉNIQUES : L'EXEMPLE DES CHAÎNES DE L'HÉMOGLOBINE

LES FAMILLES MULTIGÉNIQUES : L'EXEMPLE DES CHAÎNES DE L'HÉMOGLOBINE Fiche sujet-élève Les similitudes entre gènes sont interprétées comme le résultat d une ou plusieurs duplications d un gène ancestral. Des molécules homologues appartiennent à la même famille multigénique

Plus en détail

Clermont Ferrand - Janvier 2003

Clermont Ferrand - Janvier 2003 DISDAMIN: Algorithmes de Data Mining Distribués Valerie FIOLET (1,2) - Bernard TOURSEL (1) 1 Equipe PALOMA - LIFL - USTL - LILLE (FRANCE) 2 Service Informatique - UMH - MONS (BELGIUM) Clermont Ferrand

Plus en détail

Architecture des Systèmes d Information Architecture des Systèmes d Information

Architecture des Systèmes d Information Architecture des Systèmes d Information Plan... Tableaux et tris I3 - Algorithmique et programmation 1 Rappels Nicol Delestre 2 Tableaux à n dimensions 3 Initiation aux tris Tableaux - v2.0.1 1 / 27 Tableaux - v2.0.1 2 / 27 Rappels : tableau

Plus en détail

Contrôle objet du modèle AROME avec le logiciel MODE développé au NCAR

Contrôle objet du modèle AROME avec le logiciel MODE développé au NCAR Toulouse le 08 Octobre 2014 Contrôle objet du modèle AROME avec le logiciel MODE développé au NCAR Travail réalisé par RAZAGUI Abdelhak sous la direction de Joël STEIN Période du 13 septembre au 11 Octobre

Plus en détail

Introduction. Alignement multiple = Alignement simultané de plusieurs séquences (Nt ou Prot)

Introduction. Alignement multiple = Alignement simultané de plusieurs séquences (Nt ou Prot) Introduction Alignement multiple = Alignement simultané de plusieurs séquences (Nt ou Prot) Outil essentiel pour : Signatures protéiques Homologie avec une famille de protéines particulière Structure secondaire

Plus en détail

Résolution d équations non linéaires

Résolution d équations non linéaires Analyse Numérique Résolution d équations non linéaires Said EL HAJJI et Touria GHEMIRES Université Mohammed V - Agdal. Faculté des Sciences Département de Mathématiques. Laboratoire de Mathématiques, Informatique

Plus en détail

PROBABILITÉS CONDITIONNELLES

PROBABILITÉS CONDITIONNELLES PROBABILITÉS ONDITIONNELLES Exercice 01 On considère une roue partagée en 15 secteurs angulaires numérotés de 1 à 15. es secteurs sont de différentes couleurs. On fait tourner la roue qui s'arrête sur

Plus en détail

TS. 2012/2013. Lycée Prévert. Corrigé du contrôle n 3. Durée : 3 heures. Mardi 20/11/12

TS. 2012/2013. Lycée Prévert. Corrigé du contrôle n 3. Durée : 3 heures. Mardi 20/11/12 TS. 01/013. Lycée Prévert. Corrigé du contrôle n 3. Durée : 3 heures. Mardi 0/11/1 Exercice 1 : ( 6,5 pts) Première partie : Démonstration à rédiger { Démontrer que si ( ) et (v n ) sont deux suites telles

Plus en détail

Cours de Master Recherche

Cours de Master Recherche Cours de Master Recherche Spécialité CODE : Résolution de problèmes combinatoires Christine Solnon LIRIS, UMR 5205 CNRS / Université Lyon 1 2007 Rappel du plan du cours 1 - Introduction Qu est-ce qu un

Plus en détail