Comparaison et alignement de séquences 2

Save this PDF as:
 WORD  PNG  TXT  JPG

Dimension: px
Commencer à balayer dès la page:

Download "Comparaison et alignement de séquences 2"

Transcription

1 Comparaison et alignement de séquences 2 LV348 -BI Sophie Pasek

2 Comment comparer une séquence contre une banque?

3 Comparaison séquence/banque Pourquoi? : Réunir un échantillon taxonomique (homologues) pour faire une phylogénie Annoter un génome nouvellement séquencé (fonctions putatives) Étudier une famille (consensus, domaines) Vocabulaire : Séquence à rechercher = Query Séquence de la banque = Subject

4 Comparaison séquence/banque Comment? Forcément, on cherche du local! SW = algorithme exacte qui donne l'alignement optimal Si on cherchait pour chaque «Subject» son alignement optimal avec la «Query» et puis on classe par Z-score décroissant Problème : Si 1 alignement SW prend 15 ms Banque SwissProt (> entrées) prend 2h => Trop lent! Il faut trouver des heuristiques

5 Blast: Basic Local Alignement Search Tool Altschul & al., 1990 BLAST : est une heuristique qui recherche dans une banque les séquences (Subject) présentant une bonne similarité locale avec une séquence requête (Query) assigne un score et une espérance à chaque couple Query- Subject optimise le temps de recherche au détriment de la sensibilité et de la précision de l'alignement BLAST n'est pas un programme d'alignement optimal de séquences!

6 Blast: Basic Local Alignement Search Tool 3 grandes étapes : 1) Identifier les k-mots «similaires» w de taille k pour les an, k=10 ou 11 / pour les aa, k=3 ou 4 2) a) Etendre l'alignement (sans indel) de chaque côté de w tant que le score cumulé est M (seuil fixé) => HSPs = High Scoring Segment Pairs b) Eventuellement rassembler les HSPs 3) Evaluation statistique des segments similaires obtenus

7 Blast: étape 1 Indexation de la banque (parcours 1 seule fois la banque!) Banque : >PrSub1 EKFKAAMLLKSDTRCLGYRNVCKEG >PrSub2 YYDDVGLLCEKADTRALMAQFVPPL >PrSub3 SACILSTVNHSILKKSVHCLGYRSV

8 Blast: étape 1 Indexation de la banque (parcours 1 seule fois la banque!) Banque : k=5 Index : >PrSub1 EKFKAAMLLKSDTRCLGYRNVCKEG >PrSub2 YYDDVGLLCEKADTRALMAQFVPPL >PrSub3 SACILSTVNHSILKKSVHCLGYRSV EKFKA PrSub1 1

9 Blast: étape 1 Indexation de la banque (parcours 1 seule fois la banque!) Banque : k=5 Index : >PrSub1 EKFKAAMLLKSDTRCLGYRNVCKEG >PrSub2 YYDDVGLLCEKADTRALMAQFVPPL >PrSub3 SACILSTVNHSILKKSVHCLGYRSV EKFKA PrSub1 1 KFKAA PrSub1 2

10 Blast: étape 1 Indexation de la banque (parcours 1 seule fois la banque!) Banque : k=5 Index : >PrSub1 EKFKAAMLLKSDTRCLGYRNVCKEG >PrSub2 YYDDVGLLCEKADTRALMAQFVPPL >PrSub3 SACILSTVNHSILKKSVHCLGYRSV EKFKA PrSub1 1 KFKAA PrSub1 2 FKAAM PrSub1 3

11 Blast: étape 1 Indexation de la banque (parcours 1 seule fois la banque!) Banque : k=5 Index : >PrSub1 EKFKAAMLLKSDTRCLGYRNVCKEG >PrSub2 YYDDVGLLCEKADTRALMAQFVPPL >PrSub3 SACILSTVNHSILKKSVHCLGYRSV EKFKA PrSub1 1 KFKAA PrSub1 2 FKAAM PrSub1 3 CLGYR PrSub1 15

12 Blast: étape 1 Indexation de la banque (parcours 1 seule fois la banque!) Banque : k=5 Index : >PrSub1 EKFKAAMLLKSDTRCLGYRNVCKEG >PrSub2 YYDDVGLLCEKADTRALMAQFVPPL >PrSub3 SACILSTVNHSILKKSVHCLGYRSV EKFKA PrSub1 1 KFKAA PrSub1 2 FKAAM PrSub1 3 CLGYR PrSub CLGYR PrSub1 15 PrSub

13 Blast: étape 1 Indexation de la banque (parcours 1 seule fois la banque!) Index : EKFKA PrSub1 1 KFKAA PrSub1 2 Tri FKAAM PrSub1 3 CLGYR PrSub CLGYR PrSub1 15 PrSub Le tri de l'index ainsi créé (table de hachage) optimise le temps de recherche Index trié : AAMLL PrSub1 5 ACILS PrSub CILST PrSub3 3 CLGYR PrSub1 15 PrSub3 19 DDVGL PrSub2 3 DTRAL PrSub2 13 DTRCL PrSub KSDTR PrSub1 10 KSVHC PrSub3 15 etc.

14 Blast: étape 1 Recherche des mots de la Query dans l'index de la banque Query k=5 Index trié : >ProtQ SKCDKSDTRALLAQYIPSTVNHPIL AAMLL PrSub1 5 ACILS PrSub CILST PrSub3 3 CLGYR PrSub1 15 PrSub3 19 DDVGL PrSub2 3 DTRAL PrSub2 13 DTRCL PrSub KSDTR PrSub1 10 KSVHC PrSub3 15 etc.

15 Blast: étape 1 Recherche des mots de la Query dans l'index de la banque Query k=5 Index trié : >ProtQ SKCDKSDTRALLAQYIPSTVNHPIL SKCDK => 0 AAMLL PrSub1 5 ACILS PrSub CILST PrSub3 3 CLGYR PrSub1 15 PrSub3 19 DDVGL PrSub2 3 DTRAL PrSub2 13 DTRCL PrSub KSDTR PrSub1 10 KSVHC PrSub3 15 etc.

16 Blast: étape 1 Recherche des mots de la Query dans l'index de la banque Query >ProtQ SKCDKSDTRALLAQYIPSTVNHPIL SKCDK => 0 KCDKS => 0 Index trié : AAMLL PrSub1 5 ACILS PrSub CILST PrSub3 3 CLGYR PrSub1 15 PrSub3 19 DDVGL PrSub2 3 DTRAL PrSub2 13 DTRCL PrSub KSDTR PrSub1 10 KSVHC PrSub3 15 etc.

17 Blast: étape 1 Recherche des mots de la Query dans l'index de la banque Query >ProtQ SKCDKSDTRALLAQYIPSTVNHPIL SKCDK => 0 KCDKS => 0 CDKSD => 0 Index trié : AAMLL PrSub1 5 ACILS PrSub CILST PrSub3 3 CLGYR PrSub1 15 PrSub3 19 DDVGL PrSub2 3 DTRAL PrSub2 13 DTRCL PrSub KSDTR PrSub1 10 KSVHC PrSub3 15 etc.

18 Blast: étape 1 Recherche des mots de la Query dans l'index de la banque Query >ProtQ SKCDKSDTRALLAQYIPSTVNHPIL SKCDK => 0 KCDKS => 0 CDKSD => 0 DKSDT => 0 Index trié : AAMLL PrSub1 5 ACILS PrSub CILST PrSub3 3 CLGYR PrSub1 15 PrSub3 19 DDVGL PrSub2 3 DTRAL PrSub2 13 DTRCL PrSub KSDTR PrSub1 10 KSVHC PrSub3 15 etc.

19 Blast: étape 1 Recherche des mots de la Query dans l'index de la banque Query Index trié : >ProtQ SKCDKSDTRALLAQYIPSTVNHPIL SKCDK => 0 KCDKS => 0 CDKSD => 0 DKSDT => 0 KSDTR => PrSub1 10 AAMLL PrSub1 5 ACILS PrSub CILST PrSub3 3 CLGYR PrSub1 15 PrSub3 19 DDVGL PrSub2 3 DTRAL PrSub2 13 DTRCL PrSub KSDTR PrSub1 10 KSVHC PrSub3 15 etc. SKCDKSDTRALLAQYIPSTVNHPIL EKFKAAMLLKSDTRCLGYRNVCKEG

20 Blast: étape 1 Recherche des mots de la Query dans l'index de la banque Query >ProtQ SKCDKSDTRALLAQYIPSTVNHPIL SKCDK => 0 KCDKS => 0 CDKSD => 0 DKSDT => 0 KSDTR => PrSub1 10 SDTRA => 0 Index trié : AAMLL PrSub1 5 ACILS PrSub CILST PrSub3 3 CLGYR PrSub1 15 PrSub3 19 DDVGL PrSub2 3 DTRAL PrSub2 13 DTRCL PrSub KSDTR PrSub1 10 KSVHC PrSub3 15 etc.

21 Blast: étape 1 Recherche des mots de la Query dans l'index de la banque Query >ProtQ SKCDKSDTRALLAQYIPSTVNHPIL SKCDK => 0 KCDKS => 0 CDKSD => 0 DKSDT => 0 KSDTR => PrSub1 10 SDTRA => 0 DTRAL => PrSub2 13 Index trié : AAMLL PrSub1 5 ACILS PrSub CILST PrSub3 3 CLGYR PrSub1 15 PrSub3 19 DDVGL PrSub2 3 DTRAL PrSub2 13 DTRCL PrSub KSDTR PrSub1 10 KSVHC PrSub3 15 etc.

22 Blast: étape 1 Recherche des mots de la Query dans l'index de la banque Query Index trié : >ProtQ SKCDKSDTRALLAQYIPSTVNHPIL SKCDK => 0 KCDKS => 0 CDKSD => 0 DKSDT => 0 KSDTR => PrSub1 10 SDTRA => 0 DTRAL => PrSub2 13 TRALL => 0 Etc. SKCDKSDTRALLAQYIPSTVNHPIL YYDDVGLLCEKADTRALMAQFVPPL AAMLL PrSub1 5 ACILS PrSub CILST PrSub3 3 CLGYR PrSub1 15 PrSub3 19 DDVGL PrSub2 3 DTRAL PrSub2 13 DTRCL PrSub KSDTR PrSub1 10 KSVHC PrSub3 15 etc.

23 Blast: étape 2 Extension de l'alignement (sans indel) => HSPs Mots «similaires» de taille k=5 (en aa) L ProtQ PrSub1 SKCDKSDTRALLAQYIPSTVNHPIL EKFKAAMLLKSDTRCLGYRNVCKEG Extension du segment tant que S M (seuil fixé) ProtQ PrSub1 SKCDKSDTRALLAQYIPSTVNHPIL EKFKAAMLLKSDTRCLGYRNVCKEG

24 Blast: Comment améliorer les première et deuxième étapes?

25 Blast: étape 1 Identification des k-mots «approximatifs» au lieu d'exiger k aa identiques successifs Score des k-mots T Exemple : DTRAL, T = 5 D T R A L D V R H I D T R A L M A T R G D T R A L E S K S M D T R A L D T R A L S= = 11 => OK S= = -9 => NON S= = 8 => OK S= = 24 => OK

26 Blast: étape 1 Identification des k-mots «approximatifs» au lieu d'exiger k aa identiques successifs Score des k-mots T Au lieu d'écrire dans l'index : DTRAL PrSub2 13 On pré-calcule les mots approximatifs, et on écrit : DTRAL PrSub DVRHI PrSub ESKSM PrSub (tous les 5-mots de score T) => Beaucoup de lignes d'index par mot de la banque Construction de l'index lente Recherche dans l'index longue => Sauf si k est petit!

27 Blast: étape 2 On applique un double- critère: les séquences doivent partager 2 petits mots (au lieu d'un grand) Query Subject Query Subject trouver 2 paires de mots "voisins" PKV (s >= T) à égale distance d dans les 2 séquences (d<40)

28 Blast: étape 2 vérifier que l'on peut étendre ces amorces pour obtenir des alignements sans gaps de score s>t Query Subject faire l'alignement local Smith & Waterman

29 Blast: étape 2 Recherche des HSPs = High Scoring Pairs Basé sur l'idée que : En général, l'alignement optimal contient plusieurs HSPs dont sûrement la MSP (= Maximal Scoring Pair). Une HSP contient au moins un k-mot de score > T

30 Blast: étape 3 Significativité du score des HSPs Quelle est la probabilité ( p-value ) d obtenir par hasard les HSPs effectivement obtenus? Soit P(S) = e -λs la probabilité d'obtenir une HSP de score S On définit l'espérance E telle que : E-value = K B *l Q *e -λs où K B dépend de la taille et de la composition de la banque l Q = taille séquence Query => La E-value représente le nombre de HSPs de score S attendues au hasard dans la banque

31 Blast: étape 3 Significativité du score des HSPs La E-value représente le nombre de HSPs de score S attendu au hasard dans la banque E-value = 3 signifie «si je comparais ma séquence à une banque aléatoire de même taille et de même composition que la banque initiale, je m attendrais à trouver 3 alignements de score S» => pas significatif Plus la Evalue est petite, plus la similarité est pertinente (non due au hasard) Cette E-value dépend : De la matrice de substitution (=> S et taille des HSPs) De la taille et de la composition de la banque

32 Blast: étape 3 Significativité du score des HSPs Score S dépend des scores des différents Matchs (cf matrice de substitution) Les valeurs de cette matrice (log-odds) fondée sur l'hypothèse d'indépendance entre les différentes positions (chaque aa de la séquence) Ceci est faux pour les régions répétées des séquences => fausse la E-value Solution : masquer les séquences

33 Blast vs. Smith-Waterman

34 La famille Blast Tblastn

35 Fasta / FastP Ancêtre de Blast = Fasta.

36 Fasta : Pearson & Lipman, PNAS 1988 A) Recherche des mots identiques de taille l k (matchs successifs joints si distance < seuil) B) Sur la base des 10 meilleurs, re-calcul du score avec PAM250, raccourcissement => Zones de + haut score = «initial region» C) Jonction des régions par alignement avec gap selon seuil D) Alignement NWS des couples Subject-Query sélectionnés autour de ces régions A C B D

37 Fasta : Pearson & Lipman, PNAS 1988 Significativité du score des alignements Basée sur la calcul d'un Z-score : Distribution de Score d'alignements «dus au hasard» => moyenne (m) et écart-type (e) Calcul du Z-score : Z = S-m/e => Comme déjà vu pour l'alignement 2 à 2 (Nws et SW).

38 Retour à la Génomique comparative On sait identifier des gènes qui se ressemblent Que peuvent me dire ces gènes sur l'histoire évolutive des génomes? => Homologie (orthologie/paralogie) et synténie

39 Gène et Homologie Rappel des définitions Des gènes homologues sont issus d un gène ancestral commun: Les gènes issus d un gène ancestral commun par héritage vertical sont dits orthologues. Par définition il existe donc au plus un orthologue par génome pour chaque gène considéré. Si ces gènes ont évolués par duplication l un de l autre ils sont dits paralogues

40 Gène et Homologie Exemple orthologues ORTHOLOGIE ORTHOLOGIE

41 Gène et Homologie Exemple paralogues ORTHOLOGIE PARALOGIE ORTHOLOGIE

42 Gène et Homologie Divergence + Fluidité ORTHOLOGUES? PARALOGUES?

43 Gène et Transfert horizontal

44 Retour à la Génomique comparative La similarité ne permet pas à elle seule d'établir des liens d'homologie!

45 Gènes et Orthologie Méthode du BBH Deux gènes a et b (codant pour des protéines pa et pb) appartenant respectivement aux génomes des organismes A et B sont dits en BBH si et seulement: Le meilleur hit blast de pb chez A est pa Le meilleur hit blast de pa chez B est pb Critères supplémentaires : Hit blast < 10^-6 taille(pa)=taille(pb) Taille alignement = taille des protéines

46 Gènes et Orthologie Méthode BBH Espèce A Espèce B a 1 a 2 a 3 a 4 a 5 b 1 b 2 b 3 b 4 b 5 b 6 a 2 et b 1 sont orthologues

47 BBH «Multi-Espèces» Exemple BBH en «étoile» pour 3 espèces Espèce A Espèce B Espèce C a 1 a 2 b 1 b 2 c 1 c 2 a 3 a 4 b 3 b 4 c 3 c 4 a 5 b 5 b 6 PIVOT a 2, b 1 et c 1 sont orthologues pour le BBH en «étoile»

48 BBH «Multi-Espèces» Exemple BBH en «clique» pour 3 espèces Espèce A Espèce B Espèce C a 1 a 2 b 1 b 2 c 1 c 2 a 3 a 4 b 3 b 4 c 3 c 4 a 5 b 5 b 6 a 2, b 1 et c 1 ne sont pas orthologues pour le BBH en «clique» => BBH en «clique» coûteux et très contraignant

49 La synténie

50 Synténie de Gènes Définition Ensemble de segments génomiques appartenant à différents génomes partageant «pratiquement» les mêmes gènes Ces segments témoignent d une conservation locale du voisinage génomique pouvant être affectée par quelques réarrangements (orientation, duplication, insertion, fusion, etc.)

51 Synténie de Gènes 1ère approche : le dotplot 2 isolats de Clostridium difficile Colinéarité = Synténie

52 Synténie de Gènes Exemple Gène : G1 G2 G3 G4 G5 G6 G7 Espèce 1 Espèce 2 Espèce 3 Espèce 4 Espèce 5 Espèce 6 Note: avant la détection des synténies, il faut définir les liens d orthologie. Ici, les gènes d une même couleur ont été identifiés (via le «BBH» par exemple) comme étant orthologues

53 Synténie de Gènes Définition gene team (Raffinot et al., 2004) X Y Z u, a et w sont en synténie sur X et Z à un gap près f u a w z a x y u x a a w

54 Synténie de Gènes Intérêts de la synténie La détection de synténies permet d identifier des gènes susceptibles d être fonctionnellement liés et/ou d interagir (opérons, clusters de gènes) La synténie permet également d évaluer et d identifier les réarrangements affectant les génomes tels que les transpositions, délétions, insertions, inversions, fusions et fissions (mesure phylogénétique, étude de la dynamique/fluidité des génomes)

55 Exemple Fluidité des génomes A B Inversion autour du terminus B

56 Exemple Caractérisation des zones conservées: les synténies B Gènes orthologues : B2

57 Exemple Caractérisation des zones conservées: les synténies B Gènes orthologues : B2

58 Exemple Cas réel (Eisen et al., Genome Biology, 2000)

59 Exemple Cas réel

60 Synténie de Gènes Macro-synténie, Micro-synténie Micro-synténie: ensemble de segments génomiques appartenant à différents génomes partageant «pratiquement» les mêmes gènes Macro-synténie: deux gènes «côte à côte» sur le chromosome d une espèce sont sur le même chromosome dans une autre espèce

61 Homme / Mouse

62

63 Jaillon et al., Nature, 2004

Comparaison et alignement. de séquences 2 LV348 -BI. sophie.pasek@upmc.fr. Sophie Pasek

Comparaison et alignement. de séquences 2 LV348 -BI. sophie.pasek@upmc.fr. Sophie Pasek Comparaison et alignement de séquences 2 LV348 -BI Sophie Pasek sophie.pasek@upmc.fr Comment comparer une séquence contre une banque? Comparaison séquence/banque Pourquoi? : Réunir un échantillon taxonomique

Plus en détail

Plan. Comparaison de 2 séquences. Dotplot, alignement optimal Recherche de similarité. Alignement multiple. Phylogénie moléculaire

Plan. Comparaison de 2 séquences. Dotplot, alignement optimal Recherche de similarité. Alignement multiple. Phylogénie moléculaire Plan 1 Banques de données 2 Comparaison de 2 séquences Dotplot, alignement optimal Recherche de similarité 3 Alignement multiple l 4 Phylogénie moléculaire Recherche de similarité 1 séquence (Query) comparée

Plus en détail

Recherche par similarité dans les banques/bases de données La suite Blast (Basic Local Alignment Search Tool)

Recherche par similarité dans les banques/bases de données La suite Blast (Basic Local Alignment Search Tool) Recherche par similarité dans les banques/bases de données La suite Blast (Basic Local Alignment Search Tool) A A C T G G T A A C C G A G C T A C G G T C C G Algorithme de Blast (version 1) (Altschul et

Plus en détail

TD Bioinformatique : Sequence Alignment. Pourquoi faire une recherche par similarité?

TD Bioinformatique : Sequence Alignment. Pourquoi faire une recherche par similarité? TD Bioinformatique : Sequence lignment Pourquoi faire une recherche par similarité? - Savoir si ma séquence ressemble à d'autres déjà connues. - Trouver toutes les séquences d'une même famille. - Rechercher

Plus en détail

Scores d alignement Matrices de substitution. J.S. Bernardes/H. Richard

Scores d alignement Matrices de substitution. J.S. Bernardes/H. Richard Scores d alignement Matrices de substitution J.S. Bernardes/H. Richard Score d'un alignement Score alignement = Σ scores événements élémentaires (Match, Mismatch, Indel) Amélioration du modèle : pénalité

Plus en détail

Analyse in silico de génomes, protéomes et transcriptomes. «Génomique comparative» V.2012.1. Protocole TD

Analyse in silico de génomes, protéomes et transcriptomes. «Génomique comparative» V.2012.1. Protocole TD Magistère Biotechnologies Analyse in silico de génomes, protéomes et transcriptomes «Génomique comparative» V.2012.1 Protocole TD Notes : Scripts et données sur : http://rna.igmors.u-psud.fr/gautheret/cours/analinsilico

Plus en détail

Bioinformatique appliquée. Cours 4 BLAST. idée. lire un résultat de Blast. la famille Blast

Bioinformatique appliquée. Cours 4 BLAST. idée. lire un résultat de Blast. la famille Blast Bioinformatique appliquée Cours 4 BLAST idée lire un résultat de Blast la famille Blast -1- "quelle est la similarité entre ces 2 séquences? et donc: est-ce que ces deux séquences sont homologues?" "existe-t-il

Plus en détail

Algorithmes pour la comparaison de séquences II

Algorithmes pour la comparaison de séquences II Algorithmes pour la comparaison de séquences II Hélène TOUZET touzet@lifl.fr Equipe Bioinfo Master recherche informatique www.lifl.fr/~touzet/masterrecherche.html Pourquoi comparer des séquences? Puisque

Plus en détail

Alignement de séquences (2/2)

Alignement de séquences (2/2) Alignement de séquences (2/2) Observation à l aide de l outil graphique : le dotplot. Simple, visuel, Très informatif : Permet de repérer une similarité globale Permet de repérer des similarités locales

Plus en détail

AutoGRAPH Un serveur pour automatiser et visualiser la comparaison de génomes: Application à l identification de nouveaux gènes chez le chien.

AutoGRAPH Un serveur pour automatiser et visualiser la comparaison de génomes: Application à l identification de nouveaux gènes chez le chien. AutoGRAPH Un serveur pour automatiser et visualiser la comparaison de génomes: Application à l identification de nouveaux gènes chez le chien. Thomas DERRIEN CNRS-UMR6061 Génétique et Développement Université

Plus en détail

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST.

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST. La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST. Gaël Le Mahec - p. 1/12 L algorithme BLAST. Basic Local Alignment Search Tool est un algorithme de recherche

Plus en détail

Modélisation de la structure 3D des protéines

Modélisation de la structure 3D des protéines Modélisation de la structure 3D des protéines We are drowning in data and starving for knowledge -R.D. Roger Unité Mathématique Informatique et Génome Séminaire AGENAE, Seignosse-le-Pénon, 20-21 mai 2003

Plus en détail

Initiation à la Bioinformatique

Initiation à la Bioinformatique Université d Alexandrie Initiation à la Bioinformatique Basic Local Alignment Search Tool BLAST Université d Alexandrie AUF Auteur(s): Mohamed GAD 2009/2010 Auteur(s) : Mohamed GAD Professeur à l institut

Plus en détail

Introduction à l annotation de séquences

Introduction à l annotation de séquences Introduction à l annotation de séquences - Université de Lille 1-2 eme Semestre But de l annotation de séquences Les séquences nucléiques : Détecter la présence de gènes Trouver la structure des gènes

Plus en détail

Corrigé Contrôle terminal : Bioanalyse (EL6BIOFM) 6 mai 2014

Corrigé Contrôle terminal : Bioanalyse (EL6BIOFM) 6 mai 2014 Corrigé Contrôle terminal : Bioanalyse (EL6BIOFM) 6 mai 2014 Exercice 1 (4,5 points) 1. Donner la définition de l acronyme BLAST. (0,5 pt) : Basic Local Alignment Search Tool 2. Expliquer les principes

Plus en détail

Corrigé du TD1. Exercice 1:

Corrigé du TD1. Exercice 1: Corrigé du TD1 Exercice 1: le but était d'aligner des séquences à la main et de compter les substitutions entre acides aminés observées. Le résultat se trouve à cette adresse: http://tagc.univ-mrs.fr/herrmann/bio6/displaymatrix.php

Plus en détail

Étude de la biodiversité fongique à l aide de techniques de pyroséquençage

Étude de la biodiversité fongique à l aide de techniques de pyroséquençage Étude de la biodiversité fongique à l aide de techniques de pyroséquençage Biodiversité fongique Biodiversité: diversité spécifique d une communauté écologique, correspondant au nombre d espèces et à leur

Plus en détail

Familles de gènes. Nadia El-Mabrouk

Familles de gènes. Nadia El-Mabrouk Familles de gènes Nadia El-Mabrouk Les gènes Parties codantes de l ADN Unités de base de l héridité. Une fois les gènes identifiés, ils doivent être annotés pour leur fonction. Familles de gènes Des gènes

Plus en détail

INTRODUCTION À LA BIO-INFORMATIQUE

INTRODUCTION À LA BIO-INFORMATIQUE Biologie moléculaire-2016 1 INTRODUCTION À LA BIO-INFORMATIQUE Dans cette section, on désire vous donner une introduction sur l utilisation du site web du National Center for Biotechnology Information

Plus en détail

Apprentissage d automates sur les protéines

Apprentissage d automates sur les protéines Apprentissage d automates sur les protéines Approche par fusion de fragments significativement similaires (Jobim 04) François Coste, Goulven Kerbellec, Boris Idmont, Daniel Fredouille Christian Delamarche

Plus en détail

Sommaire. A) Méthode de contrôle manuel des résultats produits par GLADX

Sommaire. A) Méthode de contrôle manuel des résultats produits par GLADX Sommaire Définitions et abréviations Résumé Introduction I. Matériel II. Méthode A) Méthode de contrôle manuel des résultats produits par GLADX B) Comparaison des résultats de l outil GLADX avec les résultats

Plus en détail

Lancer FASTA et BLAST en ligne de commande

Lancer FASTA et BLAST en ligne de commande Lancer FASTA et BLAST en ligne de commande V.2006.1 http://www.esil.univ-mrs.fr/~dgaut/cours Daniel Gautheret ESIL, Université de la Méditerranée Fasta Article original: Lipman and Pearson (1985) Science

Plus en détail

Recherche d homologies

Recherche d homologies Recherche d homologies Soluscience Guillaume Chakroun guillaume chakroun@hotmail.com Copyright c 2004 Guillaume Chakroun TABLE DES MATIÈRES Table des matières 1 Introduction 4 2 Les systèmes de scores

Plus en détail

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Le Data Mining au service du Scoring ou notation statistique des emprunteurs! France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative

Plus en détail

Bases de données documentaires et distribuées Cours NFE04

Bases de données documentaires et distribuées Cours NFE04 Bases de données documentaires et distribuées Cours NFE04 Introduction a la recherche d information Auteurs : Raphaël Fournier-S niehotta, Philippe Rigaux, Nicolas Travers prénom.nom@cnam.fr Département

Plus en détail

Transformée de Burrows-Wheeler et mapping de données RNA-seq

Transformée de Burrows-Wheeler et mapping de données RNA-seq Transformée de Burrows-Wheeler et mapping de données RNA-seq MAPPI, journée indexation 6 juin 2011 Introduction Indexation But : Recherche rapide d'une information dans de grands volumes de données Indexation

Plus en détail

Optimisation Combinatoire (Méthodes approchées) II. Recherche Locale simple (Les bases)

Optimisation Combinatoire (Méthodes approchées) II. Recherche Locale simple (Les bases) Optimisation Combinatoire (Méthodes approchées) II. Recherche Locale simple (Les bases) Heuristique Constructive Itérativement, ajoute de nouvelles composantes à une solution partielle candidate Espace

Plus en détail

BIN 1002: INTÉGRATION BIOSCIENCES/INFORMATIQUE

BIN 1002: INTÉGRATION BIOSCIENCES/INFORMATIQUE BIN 1002: INTÉGRATION BIOSCIENCES/INFORMATIQUE Plan de Cours Automne 2015 Professeurs: Sylvie Hamel, Département d Informatique et de Recherche Opérationnelle Guillaume Lettre, Institut de Cardiologie

Plus en détail

Distance et classification. Cours 4: Traitement du signal et reconnaissance de forme

Distance et classification. Cours 4: Traitement du signal et reconnaissance de forme Distance et classification Cours 4: Traitement du signal et reconnaissance de forme Plan Introduction Pré-traitement Segmentation d images Morphologie mathématique Extraction de caractéristiques Classification

Plus en détail

Calcul intensif en Bioinformatique

Calcul intensif en Bioinformatique Calcul intensif en Bioinformatique Réalisations en génétique et génomique évolutives Pôle Rhône Alpin de BioInformatique (PRABI) Laboratoire de Biologie et Biométrie Evolutives (LBBE) Contexte De plus

Plus en détail

TD2 : Histoire évolutive de la famille GH15 des glucosides hydrolases

TD2 : Histoire évolutive de la famille GH15 des glucosides hydrolases Master 1 :: module BBSG1.2.1 "Bioinformatique" :: année 2006/2007 TD2 : Histoire évolutive de la famille GH15 des glucosides hydrolases Encadrants: Emmanuel Talla (talla@ibsm.cnrs-mrs.fr) & Céline Brochier-Armanet

Plus en détail

Chapitre VI Échantillonages et simulations

Chapitre VI Échantillonages et simulations Chapitre VI Commentaires : Récursivement, les commentaires ne sont pas à l attention des élèves.. Fluctuation d échantillonnage Définition : En statistiques, un échantillon de taille n est la liste des

Plus en détail

VI. Domaines protéiques

VI. Domaines protéiques Chapitre 1 Structure des protéines I. Rappels Définitions II. La Protein Data Bank (PDB) III. Angles dièdres et diagramme de ramachandran IV. Structures secondaires V. Structures supersecondaires VI. Domaines

Plus en détail

BIO6: Bioinformatique appliquée Correction du TD3

BIO6: Bioinformatique appliquée Correction du TD3 BIO6: Bioinformatique appliquée Correction du TD3 Exercice 1 : programmation dynamique voir le site web indiqué dans le TD pour corriger l'exercice Exercice 2 : similarité de séquence et distance évolutive

Plus en détail

Épreuve de mathématiques Terminale ES 200 minutes

Épreuve de mathématiques Terminale ES 200 minutes Examen 2 Épreuve de mathématiques Terminale ES 200 minutes L usage de la calculatrice programmable est autorisé. La bonne présentation de la copie est de rigueur. Cet examen comporte 7 pages et 5 exercices.

Plus en détail

Deuxième partie. Calcul de fréquences de génotypes multilocus dans des pédigrees complexes XXVII

Deuxième partie. Calcul de fréquences de génotypes multilocus dans des pédigrees complexes XXVII Deuxième partie Calcul de fréquences de génotypes multilocus dans des pédigrees complexes XXVII Présentation Les programmes informatiques MDM et grafgen L analyse de schémas de construction de génotypes

Plus en détail

I. Cas de l équiprobabilité

I. Cas de l équiprobabilité I. Cas de l équiprobabilité Enoncé : On lance deux dés. L un est noir et l autre est blanc. Calculer les probabilités suivantes : A «Obtenir exactement un as» «Obtenir au moins un as» C «Obtenir au plus

Plus en détail

Heuristiques pour l alignement et la recherche dans les banques de données biologiques

Heuristiques pour l alignement et la recherche dans les banques de données biologiques Heuristiques pour l alignement et la recherche dans les banques de données biologiques Plan I. Introduction II. Matrices de substitutions: PAM, BLOSUM III. Algorithmes de Filtrage Basés sur la recherche

Plus en détail

Détection exhaustive des gènes orthologues entre deux génomes complets

Détection exhaustive des gènes orthologues entre deux génomes complets Détection exhaustive des gènes orthologues entre deux génomes complets GTGC - 12 octobre 2006 Claire Guillet, Laurent Guéguen et Laurent Duret Laboratoire de Biométrie et Biologie Evolutive - Lyon 1 Problématique

Plus en détail

Classe de 3ème. Effectif partiel n Effectif total N

Classe de 3ème. Effectif partiel n Effectif total N Classe de 3ème Chapitre 2 Statistiques. 1. Quelques rappels. Une série statistique est composée de valeurs. Le nombre de fois où une valeur est répétée s'appelle l'effectif partiel de cette valeur. La

Plus en détail

Initiation à la phylogénie moléculaire. Jean-François Dufayard Équipe "Intégration des Données"

Initiation à la phylogénie moléculaire. Jean-François Dufayard Équipe Intégration des Données Initiation à la phylogénie moléculaire Jean-François Dufayard Équipe "Intégration des Données" Famille de gènes? Ou "Il était une fois la phylogénie"...?? Il était une fois la phylogénie Histoire évolutive

Plus en détail

Problème: si les tableaux que l'on trie sont déjà à peu près triés, l'algorithme n'est pas efficace.

Problème: si les tableaux que l'on trie sont déjà à peu près triés, l'algorithme n'est pas efficace. Traonmilin Yann traonmil@enst.fr MOD Algorithmique Probabiliste 1. Deux exemples 1.1. Quicksort randomisé. Dans l'algorithme de tri classique Quicksort, le pivot est choisi au début du tableau puis on

Plus en détail

L'apport de l'étude des génomes : les innovations génétiques.

L'apport de l'étude des génomes : les innovations génétiques. Introduction : L'apport de l'étude des génomes : les innovations génétiques. Au sein du vivant, les espèces se différencient les unes des autres par l existence de gènes différents. Au sein d une espèce,

Plus en détail

La synténie : Définition. Co-localisation intra génome. Co-localisation intra génome

La synténie : Définition. Co-localisation intra génome. Co-localisation intra génome La synténie : Définition Groupe de gènes dont le voisinage et l organisation sont conservés sur plusieurs génomes La synténie se caractérise par types de relations : définition(s), détection, intérêt en

Plus en détail

Différences entre Homme et singes?

Différences entre Homme et singes? Différences entre Homme et singes? Différences entre Homme et singes? Apparition de l œil? Apparition du vol? Apparition des hémoglobines? Molécule d hémoglobine HEME Chaîne polypeptidique de type 2 Chaîne

Plus en détail

Projet informatique «Voyageur de commerce» Résolution approchée par algorithme génétique du problème du voyageur de commerce

Projet informatique «Voyageur de commerce» Résolution approchée par algorithme génétique du problème du voyageur de commerce Année 2007-2008 Projet informatique «Voyageur de commerce» Résolution approchée par algorithme génétique du problème du voyageur de commerce B. Monsuez Projet informatique «Voyageur de commerce» Résolution

Plus en détail

Introduction à la bioinformatique

Introduction à la bioinformatique Faculté des Sciences - Rabat Laboratoire de Microbiologie et Biologie Moléculaire -------------------------------------- Université Mohamed V - Agdal Faculté des Sciences B.P. 1014 - Rabat - MAROC TD Biologie

Plus en détail

Fiche technique : étudier les protéines avec UniProt

Fiche technique : étudier les protéines avec UniProt Fiche technique : étudier les protéines avec UniProt http://www.uniprot.org/ Objectifs : ce site en ligne «UniProt», pour Universal Protein Resource, permet d étudier les protéines dans un cadre évolutionniste.

Plus en détail

TD 3 Recherche de similarités dans une banque de séquences

TD 3 Recherche de similarités dans une banque de séquences Module LV348 Version enseignant TD 3 page 1/7 TD 3 Recherche de similarités dans une banque de séquences Revu dernièrement par Mathilde Carpentier, Cyril Gallut et Joël Pothier Version du 30 mars 2012

Plus en détail

Le mot «algorithme» vient du nom de l auteur persan Al-Khuwarizmi (né vers 780 - mort vers 850) Une définition: «un algorithme est une suite finie de

Le mot «algorithme» vient du nom de l auteur persan Al-Khuwarizmi (né vers 780 - mort vers 850) Une définition: «un algorithme est une suite finie de Le mot «algorithme» vient du nom de l auteur persan Al-Khuwarizmi (né vers 780 - mort vers 850) Une définition: «un algorithme est une suite finie de règles à appliquer dans un ordre déterminé à un nombre

Plus en détail

Principe des tests statistiques

Principe des tests statistiques Principe des tests statistiques Jean Vaillant Un test de signification est une procédure permettant de choisir parmi deux hypothèses celles la plus probable au vu des observations effectuées à partir d

Plus en détail

Première STMG1 2014-2015 progression. - 1. Séquence : Proportion d une sous population dans une population.

Première STMG1 2014-2015 progression. - 1. Séquence : Proportion d une sous population dans une population. Première STMG1 2014-2015 progression. - 1 Table des matières Fil rouge. 3 Axes du programme. 3 Séquence : Proportion d une sous population dans une population. 3 Information chiffrée : connaître et exploiter

Plus en détail

Examen de Génomique et Protéomique Fonctionnelle M2 BBSG (Mastères Recherche et Pro) 2 février 2006 Durée 3h. Partie1. Génomique fonctionnelle

Examen de Génomique et Protéomique Fonctionnelle M2 BBSG (Mastères Recherche et Pro) 2 février 2006 Durée 3h. Partie1. Génomique fonctionnelle Examen de Génomique et Protéomique Fonctionnelle M2 BBSG (Mastères Recherche et Pro) 2 février 2006 Durée 3h L examen comporte deux parties, l une axée sur la génomique fonctionnelle et l autre sur la

Plus en détail

Heuristique et métaheuristique. 8. Optimisation combinatoire et métaheuristiques. Optimisation combinatoire. Problème du voyageur de commerce

Heuristique et métaheuristique. 8. Optimisation combinatoire et métaheuristiques. Optimisation combinatoire. Problème du voyageur de commerce Heuristique et métaheuristique IFT1575 Modèles de recherche opérationnelle (RO) 8. Optimisation combinatoire et métaheuristiques Un algorithme heuristique permet d identifier au moins une solution réalisable

Plus en détail

Atelier «Très Haute Résolution Spatiale» Outils pour la reconnaissance des formes

Atelier «Très Haute Résolution Spatiale» Outils pour la reconnaissance des formes CNES Paris - 22/05/2003 Atelier «Très Haute Résolution Spatiale» Outils pour la reconnaissance des formes Michel DHOME LASMEA UMR 6602CNRS/UBP Clermont-Ferrand Etat de l art (communauté vision artificielle)

Plus en détail

Introduction. Alignement multiple = Alignement simultané de plusieurs séquences (Nt ou Prot)

Introduction. Alignement multiple = Alignement simultané de plusieurs séquences (Nt ou Prot) Introduction Alignement multiple = Alignement simultané de plusieurs séquences (Nt ou Prot) Outil essentiel pour : Signatures protéiques Homologie avec une famille de protéines particulière Structure secondaire

Plus en détail

IN 101 - Cours 05. 7 octobre 2011. Un problème concret Recherche de collisions

IN 101 - Cours 05. 7 octobre 2011. Un problème concret Recherche de collisions Un problème concret Recherche de collisions IN 101 - Cours 05 7 octobre 2011 Le paradoxe des anniversaires dit que 365 élèves sont suffisants (en moyenne) pour avoir une collision d anniversaire, deux

Plus en détail

TS. 2012/2013. Lycée Prévert. Corrigé du contrôle n 3. Durée : 3 heures. Mardi 20/11/12

TS. 2012/2013. Lycée Prévert. Corrigé du contrôle n 3. Durée : 3 heures. Mardi 20/11/12 TS. 01/013. Lycée Prévert. Corrigé du contrôle n 3. Durée : 3 heures. Mardi 0/11/1 Exercice 1 : ( 6,5 pts) Première partie : Démonstration à rédiger { Démontrer que si ( ) et (v n ) sont deux suites telles

Plus en détail

Introduction à l analyse statistique et bioinformatique des puces à ADN

Introduction à l analyse statistique et bioinformatique des puces à ADN Formation INSERM 10 février 2004 Introduction à l analyse statistique et bioinformatique des puces à ADN Gaëlle Lelandais lelandais@biologie.ens.fr 1 Première Partie Analyse d une puce à ADN : Le recherche

Plus en détail

Identification de nouveaux membres dans des familles d'interleukines

Identification de nouveaux membres dans des familles d'interleukines Identification de nouveaux membres dans des familles d'interleukines Nicolas Beaume Jérôme Mickolajczak Gérard Ramstein Yannick Jacques 1ère partie : Définition de la problématique Les familles de gènes

Plus en détail

Prof.É.D.Taillard. Classification automatique @Prof. E. Taillard 1 EIVD, Informatique logiciel, 4 e semestre

Prof.É.D.Taillard. Classification automatique @Prof. E. Taillard 1 EIVD, Informatique logiciel, 4 e semestre INFORMATIQUE ORIENTATION LOGICIELS CLASSIFICATION AUTOMATIQUE Prof.É.D.Taillard Classification automatique @Prof. E. Taillard EIVD, Informatique logiciel, 4 e semestre CLASSIFICATION AUTOMATIQUE But :

Plus en détail

Savoir Faire Excel Niveau 2. 5 novembre 2007 Naomi Yamaguchi naomi.yamaguchi@univ-paris3.fr

Savoir Faire Excel Niveau 2. 5 novembre 2007 Naomi Yamaguchi naomi.yamaguchi@univ-paris3.fr Savoir Faire Excel Niveau 2 5 novembre 2007 Naomi Yamaguchi naomi.yamaguchi@univ-paris3.fr Ce qu on sait faire Entrer et recopier des données numériques Les fonctions de base (somme, moyenne, nb, si) Faire

Plus en détail

Bioinformatique BTV Alignement de Séquences

Bioinformatique BTV Alignement de Séquences 1 / 60 Bioinformatique BTV Alignement de Séquences Jean-Michel Richer jean-michel.richer@univ-angers.fr http://www.info.univ-angers.fr/pub/richer Juillet 2008 2 / 60 Plan Plan 1 Rappels 2 Alignement multiple

Plus en détail

Séquençage haut débit 5 mars 26 mars (14h) C. Gaspin, C. Klopp, J. Mariette & G. Salin

Séquençage haut débit 5 mars 26 mars (14h) C. Gaspin, C. Klopp, J. Mariette & G. Salin Séquençage haut débit 5 mars 26 mars (14h) C. Gaspin, C. Klopp, J. Mariette & G. Salin Plan de la session Bioinformatique & séquençage haut débit Date Intervenant (s) Libellé 05/03 G. Salin Introduction

Plus en détail

Méthodologie d échantillonnage et Échantillonneur ASDE

Méthodologie d échantillonnage et Échantillonneur ASDE Méthodologie d échantillonnage et Échantillonneur ASDE Par Michel Rochon L énoncé suivant définit de façon générale la méthodologie utilisée par Échantillonneur ASDE pour tirer des échantillons téléphoniques.

Plus en détail

Phylogénomique : introduction

Phylogénomique : introduction Phylogénomique : introduction Les limites des phylogénies basées sur un seul gène Résolution limitée (erreur stochastique) La phylogénie du gène peut être différente de la phylogénie des espèces à cause

Plus en détail

Initiation à la Bioinformatique Daniel Gautheret ESIL, Université de la Méditerranée

Initiation à la Bioinformatique Daniel Gautheret ESIL, Université de la Méditerranée Initiation à la Bioinformatique Daniel Gautheret ESIL, Université de la Méditerranée V.2004.4 http://www.esil.univ-mrs.fr/~dgaut/cours Bioinformatique Deux définitions possibles Applications de l informatique

Plus en détail

Homéoallèles. Analyse différentielle. Normalisation. NGS Transcriptomique Python R. Blé RNA-seq

Homéoallèles. Analyse différentielle. Normalisation. NGS Transcriptomique Python R. Blé RNA-seq Présenté par Xi LIU ATCGCGCTAGCTGGTGTATCGCATCGCGCTAGCTGGTGTATCGCGCTAGCTGGTGTATCGCGCTAGCCTGGTGTATCGCCATCGCGCTAGCTGGCGCTAGCTGAATCGCGCATATG 17 Septembre 2013 Homéoallèles Génome Normalisation Analyse différentielle

Plus en détail

Master 1 de Psychologie du Travail et des Organisations : Recueil et analyse des données - Corrigés des T.D. ( 2014/2015) -

Master 1 de Psychologie du Travail et des Organisations : Recueil et analyse des données - Corrigés des T.D. ( 2014/2015) - Dominique Ferrieux - Université Paul Valéry - Montpellier III Master de Psychologie du Travail et des Organisations : Recueil et analyse des données - Corrigés des T.D. ( /) - Deuxième partie : Plans :

Plus en détail

Exercices : Probabilités

Exercices : Probabilités Exercices : Probabilités Partie : Probabilités Exercice Dans un univers, on donne deux événements et incompatibles tels que =0, et =0,7. Calculer,, et. Exercice Un dé (à faces) est truqué de la façon suivante

Plus en détail

Algorithmes probabilistes. Références: Fundamentals of Algortihms de Gilles Brassard et Paul Bratley Note de cours de Pierre McKenzie

Algorithmes probabilistes. Références: Fundamentals of Algortihms de Gilles Brassard et Paul Bratley Note de cours de Pierre McKenzie Algorithmes probabilistes Références: Fundamentals of Algortihms de Gilles Brassard et Paul Bratley Note de cours de Pierre McKenzie Mise en contexte: Indices: Vous êtes à la recherche d un trésor légendaire

Plus en détail

HMSN206 - Partie Alignement

HMSN206 - Partie Alignement M1 Bioinformatique, Connaissances et Données Master Sciences et Numérique pour la Santé Année 2016-2017 HMSN206 - Partie Alignement Partie I-2 : Matrices de scores, BLAST, FASTA Anne-Muriel Arigon Chifolleau

Plus en détail

Master IAD Module PS. Reconnaissance de la parole (suite) Modèles de Markov et bases de données. Gaël RICHARD Février 2008

Master IAD Module PS. Reconnaissance de la parole (suite) Modèles de Markov et bases de données. Gaël RICHARD Février 2008 Master IAD Module PS Reconnaissance de la parole (suite) Modèles de Markov et bases de données Gaël RICHARD Février 2008 1 Reconnaissance de la parole Introduction Approches pour la reconnaissance vocale

Plus en détail

PROBABILITÉS CONDITIONNELLES

PROBABILITÉS CONDITIONNELLES PROBABILITÉS ONDITIONNELLES Exercice 01 On considère une roue partagée en 15 secteurs angulaires numérotés de 1 à 15. es secteurs sont de différentes couleurs. On fait tourner la roue qui s'arrête sur

Plus en détail

Cours de Master Recherche

Cours de Master Recherche Cours de Master Recherche Spécialité CODE : Résolution de problèmes combinatoires Christine Solnon LIRIS, UMR 5205 CNRS / Université Lyon 1 2007 Rappel du plan du cours 1 - Introduction Qu est-ce qu un

Plus en détail

Codage Compression d images

Codage Compression d images Codage Compression d images E. Jeandel Emmanuel.Jeandel at lif.univ-mrs.fr E. Jeandel, Lif CodageCompression d images 1/1 Une image Une image est un tableau de w h pixels, chaque pixel étant représenté

Plus en détail

FONCTION DE DEMANDE : REVENU ET PRIX

FONCTION DE DEMANDE : REVENU ET PRIX FONCTION DE DEMANDE : REVENU ET PRIX 1. L effet d une variation du revenu. Les lois d Engel a. Conditions du raisonnement : prix et goûts inchangés, variation du revenu (statique comparative) b. Partie

Plus en détail

Sommaire. Chapitre 1 Variables et vecteurs aléatoires... 5. Chapitre 2 Variables aléatoires à densité... 65

Sommaire. Chapitre 1 Variables et vecteurs aléatoires... 5. Chapitre 2 Variables aléatoires à densité... 65 Sommaire Chapitre 1 Variables et vecteurs aléatoires............... 5 A. Généralités sur les variables aléatoires réelles.................... 6 B. Séries doubles..................................... 9

Plus en détail

Rapport. TME2 - Problème d affectation multi-agents

Rapport. TME2 - Problème d affectation multi-agents Rapport TME2 - Problème d affectation multi-agents Auteurs : Encadrant : Lan Zhou Safia Kedad-Sidhoum Minh Viet Le Plan I. Problème :... 2 II. Question 1 - Formulation linéaire du problème :... 2 III.

Plus en détail

Calcul élémentaire des probabilités

Calcul élémentaire des probabilités Myriam Maumy-Bertrand 1 et Thomas Delzant 1 1 IRMA, Université Louis Pasteur Strasbourg, France Licence 1ère Année 16-02-2006 Sommaire Variables aléatoires. Exemple 1. (Jeu d argent) Exemple 2. Loi de

Plus en détail

Comment Gérer le Complexe? Avoir une vision globale

Comment Gérer le Complexe? Avoir une vision globale LE PROJET Comment Gérer le Complexe? Avoir une vision globale Approche logique et systémique Etapes et outils Décomposer le problème en éléments simples (la S. F. T.) décomposer le projet en sousensembles

Plus en détail

Saisie de données. Dans ce chapitre

Saisie de données. Dans ce chapitre 3 Saisie de données Dans ce chapitre Éditer et mettre en forme les cellules........................ 32 Copier et déplacer les cellules............................ 38 Remplir les cellules avec des séries

Plus en détail

Comparaison et alignement. de séquences LV348 -BI. Sophie Pasek

Comparaison et alignement. de séquences LV348 -BI. Sophie Pasek Comparaison et alignement de séquences LV348 -BI Sophie Pasek sophie.pasek@upmc.fr Comment comparer deux séquences? Le Dot-Plot Tableau indexé par les caractères des deux séquences Identité : Non Identité:

Plus en détail

Utilisation des diagrammes de Voronoï et des algorithmes génétiques pour l'étude des complexes protéine-protéine.

Utilisation des diagrammes de Voronoï et des algorithmes génétiques pour l'étude des complexes protéine-protéine. Utilisation des diagrammes de Voronoï et des algorithmes génétiques pour l'étude des complexes protéine-protéine. Anne Poupon Biologie et Bioinformatique des Systèmes de Signalisation INRA - Nouzilly France

Plus en détail

ESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring

ESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring ESSEC Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring Les méthodes d évaluation du risque de crédit pour les PME et les ménages Caractéristiques Comme les montants des crédits et des

Plus en détail

choisir H 1 quand H 0 est vraie - fausse alarme

choisir H 1 quand H 0 est vraie - fausse alarme étection et Estimation GEL-64943 Hiver 5 Tests Neyman-Pearson Règles de Bayes: coûts connus min π R ( ) + ( π ) R ( ) { } Règles Minimax: coûts connus min max R ( ), R ( ) Règles Neyman Pearson: coûts

Plus en détail

Méthodes Statistiques Appliquées à la Qualité et à la Gestion des Risques - Le Contrôle Statistique

Méthodes Statistiques Appliquées à la Qualité et à la Gestion des Risques - Le Contrôle Statistique Méthodes Statistiques Appliquées à la Qualité et à la Gestion des Risques - Le Contrôle Statistique Jean Gaudart Laboratoire d Enseignement et de Recherche sur le Traitement de l Information Médicale jean.gaudart@univmed.fr

Plus en détail

Introduction à l analyse quantitative

Introduction à l analyse quantitative Introduction à l analyse quantitative Vue d ensemble du webinaire Le webinaire sera enregistré. Les diapositives et tous les autres documents seront envoyés aux participants après la séance. La séance

Plus en détail

Data Mining : la classification non supervisée

Data Mining : la classification non supervisée Data Mining : la classification non supervisée Clustering : une affaire de distance. Etude préliminaire. Valeurs discrètes. Soient les deux individus suivants correspondant à des séquences ADN : X = AGGGTGGC

Plus en détail

Que faire en algorithmique en classe de seconde? ElHassan FADILI Lycée Salvador Allende

Que faire en algorithmique en classe de seconde? ElHassan FADILI Lycée Salvador Allende Que faire en algorithmique en classe de seconde? BEGIN Que dit le programme? Algorithmique (objectifs pour le lycée) La démarche algorithmique est, depuis les origines, une composante essentielle de l

Plus en détail

Architecture des Systèmes d Information Architecture des Systèmes d Information

Architecture des Systèmes d Information Architecture des Systèmes d Information Plan... Tableaux et tris I3 - Algorithmique et programmation 1 Rappels Nicol Delestre 2 Tableaux à n dimensions 3 Initiation aux tris Tableaux - v2.0.1 1 / 27 Tableaux - v2.0.1 2 / 27 Rappels : tableau

Plus en détail

Contrôle objet du modèle AROME avec le logiciel MODE développé au NCAR

Contrôle objet du modèle AROME avec le logiciel MODE développé au NCAR Toulouse le 08 Octobre 2014 Contrôle objet du modèle AROME avec le logiciel MODE développé au NCAR Travail réalisé par RAZAGUI Abdelhak sous la direction de Joël STEIN Période du 13 septembre au 11 Octobre

Plus en détail

Bioinformatique Appliquée Recherche de similitudes

Bioinformatique Appliquée Recherche de similitudes Besoin d'accélérer la recherche de similitude dans une banque Bioinformatique Appliquée Recherche de similitudes La recherche de similitude permet de comparer une séquence appelée requête (query) à une

Plus en détail

Travaux Dirigés de Probabilités - Statistiques, TD 4. Lois limites ; estimation.

Travaux Dirigés de Probabilités - Statistiques, TD 4. Lois limites ; estimation. Travaux Dirigés de Probabilités - Statistiques, TD 4 Lois limites ; estimation. Exercice 1. Trois machines, A, B, C fournissent respectivement 50%, 30%, 20% de la production d une usine. Les pourcentages

Plus en détail

Introduction à la programmation en variables entières Cours 3

Introduction à la programmation en variables entières Cours 3 Introduction à la programmation en variables entières Cours 3 F. Clautiaux francois.clautiaux@math.u-bordeaux1.fr Université Bordeaux 1 Bât A33 - Bur 272 Sommaire Notion d heuristique Les algorithmes gloutons

Plus en détail

Activité 1 : échantillonnage

Activité 1 : échantillonnage Activité échantillonnage, intervalle de fluctuation, prise de décision (à partir d un même thème) Les trois activités qui suivent s inspirent du document «ressources pour la classe de première générale

Plus en détail

BIOINFORMATIQUE APPLIQUEE (BI4U2) EXAMEN DE SECONDE SESSION JUIN 2013

BIOINFORMATIQUE APPLIQUEE (BI4U2) EXAMEN DE SECONDE SESSION JUIN 2013 Année universitaire 2012/2013 Site : X Luminy X St-Charles o St-Jérôme o Cht-Gombert o Aix-Montperrin o Aubagne-SATIS Sujet session de : o 1 er semestre - o 2 ème semestre - X Session 2 Examen de : X L1/L2/oL3

Plus en détail

Méthodes et algorithmes pour le séquençage

Méthodes et algorithmes pour le séquençage Méthodes et algorithmes pour le séquençage Jérémie MARY http://www.lri.fr/~mary La comparaison de séquences Distance d'édition Selon ce concept, le bon alignement est celui qui minimise les opérations

Plus en détail

AVL Liban La Bioinformatique. Bioinformatique

AVL Liban La Bioinformatique. Bioinformatique AVL Liban 2011 La Sami Khuri Department of Computer Science San José State University San José, California, USA sami.khuri@sjsu.edu www.cs.sjsu.edu/faculty/khuri Sami Khuri sami.khuri@sjsu.edu Qu est-ce

Plus en détail

Étapes du développement et de l utilisation d un modèle de simulation

Étapes du développement et de l utilisation d un modèle de simulation Étapes du développement et de l utilisation d un modèle de simulation Étapes du développement et de l utilisation d un modèle de simulation Formulation du problème Cueillette et analyse de données Conception

Plus en détail