Bibliographie Introduction à la bioinformatique

Dimension: px
Commencer à balayer dès la page:

Download "Bibliographie Introduction à la bioinformatique"

Transcription

1 om enaerts, Bibliographie ntroduction à la bioinformatique. l analyse des séquences par paires et la programmation dynamique onday ebruary om enaerts, Zvelebil et Baum, Understanding bioinformatics ormen et al, ntroduction to lgorithms open course ware usfield, lgorithms on strings, trees and sequences rof.. onze, O- Bases de données et analyse de séquences macromoléculaires onday ebruary om enaerts, Objectifs ourquoi l alignement? omme expliqué au début, étant donné l explosion de l information génétique, comment peut-on remplacer la connaissance des séquences par la connaissance biologique? omprendre les notions d identité, de similarité et d homologie Être capable d expliquer la notion d un alignement optimal xpliquer les matrices de substitutions omprendre la différence entre l alignement global et local xpliquer les principes de la programmation dynamique xpliquer les solutions pour et omprendre la relation entre et l alignement des séquences xpliquer les différences entre la pénalité linéaire et affine our détecter si ces séquences d acides aminés sont des homologues, il faut qu on fasse une comparaison entre eux. omprendre comment on peut trouver des alignements sous-optimales Être capable de développer tous les algorithmes onday ebruary onday ebruary

2 om enaerts, a difficulté e problème est que les gènes ou protéines (= séquences) ont changé pendant l évolution substitution U U mise à place et/ou suppression U U indels es modifications pourraient cacher une similarité fondamentale om enaerts, ourquoi la similarité maximale? i on a deux gènes ou protéines qui viennent du même ancêtre commun, on veut que les nucléotides ou acides aminés qui font parti de l ancêtre commun soient bien alignés U U U U--- Évolution divergente -U ----U olution : chercher l alignement qui produit la similarité maximale a meilleure façon pour retrouver ce résultat est de chercher la similarité maximale entre les séquences onday ebruary onday ebruary om enaerts, om enaerts, uelques définitions l identité e niveau d identité est la fraction des résidus qui sont identiques dans les deux séquences l identité entre des séquences aléatoires n est jamais %!!! imilarité eux résidus sont similaires si leur substitution n a aucun effet sur la fonctionnalité e niveau de similarité est la fraction des résidus qui sont similaires U ---U omologie a similarité entre deux séquences est dérivée d un ancêtre commun ttention!!! omologie implique un ancêtre commun, en même temps, ça pourrait aussi suggérer une structure ou fonction similaire ais ça n est pas toujours le cas: utation pourrait produire des séquences similaires mais avec des fonctions différentes On a besoin d information additionnelle pour confirmer l homologie ou l y a des protéines avec les mêmes fonctions mais qui ont des séquences différentes ou deux séquences pourraient être similaires mais n ont pas un ancêtre commun Évolution convergente onday ebruary 7 onday ebruary 8

3 om enaerts, om enaerts, ttention!!! Un score quantitatif omme il est difficile de connaître l'ancêtre commun, un alignement n est qu une hypothèse On a besoin d une méthode quantitative qui prenne en compte l aspect évolutifs pour vérifier la qualité d un alignement omologie est une relation binaire = deux séquences sont des homologues ou ne le sont pas l est plus facile de détecter l homologie entre deux séquences d acides aminés qu entre deux séquences de nucléotides. il y a une plus grande probabilité de trouver un alignement entre deux nucléotides aléatoirement qu entre deux acides aminés. a code génétique est redondant. a fonction d un gène est définie par la structure de la protéine idée est que la méthode quantitative donne un score plus élevé aux alignements de séquences qui sont dérivées d un ancêtre commun par rapport aux séquences qui sont choisies aléatoirement alignement exact obtient le meilleur score = l alignement optimal our l instant on n a pas trouvé une méthode quantitative qui utilise un modèle exact de l évolution On n a pas la garantie que le meilleur score donne l alignement exact On utilise les méthodes pour quantifier des alignements qui déterminent la similarité (X) et la différence () entre les séquences. onday ebruary 9 onday ebruary om enaerts, imilarité basée sur l identité e dot plot est une méthode qui montre la similarité entre deux séquences graphiquement les points rouges sont des résidus qui s assortissent les points roses sur les deux cotés de la diagonale centrale montrent où on peut trouver les mêmes résidus dans d autres positions de la séquence. onday ebruary un dot est ajouté quand les deux positions s'assortissent interruption dans la diagonale montre où on peut retrouver les indels haque ligne diagonale montre une sous-séquence alignée om enaerts, onday ebruary imilarité basée sur l identité es dot plots sont utilisé pour identifier des répétitions au sein de la séquence uman B UniprotB/wissport 87

4 om enaerts, imilarité basée sur l identité es dot plots sont utilisés pour identifier des répétitions au sein de la séquence om enaerts, imilarité basée sur l identité eulement important de trouver les configurations significatives es dot plots ont des problèmes avec bruit de fonds eulement besoin de trouver les configurations significatives bruit de fonds = tous les résidus assortis sont visualisé fenêtres superposantes aille = 9 ntroduction d un filtre: Une fenêtre superposante (avec une certaine taille) dans laquelle il faut avoir un nombre minimal d associations identiques ait par otlet uman B UniprotB/wissport 87 fenêtres superposantes aille = ait par otlet onday ebruary onday ebruary om enaerts, om enaerts, dentité et similarité atrices de substitution ans l analyse précédente, on utilise un score d identité : On donne quand les deux parties s assortissent et un score de autrement uelques soucis: haque acide aminé pourrait être remplacé par un autre avec les mêmes caractéristiques biochimiques ans ce cas, l évolution pourrait avoir accepté le remplacement ertains acides aminés sont importants pour la stabilité de la protéine Évolution n'acceptera jamais que ces acides aminés sont remplacés Un score de similarité tient compte de ces soucis e score total pour une séquence est obtenu en additionnant les scores par paires u moins % de similarité total est nécessaire onne des scores de similarités entre toutes les pairs d acides aminés haque score est le taux entre la probabilité qu une paire d acides aminés s assortissent par homologie et la probabilité qu ils s assortissent aléatoirement es meilleurs matrices étaient créées en utilisant des groupes de séquences homologues obtenues à partir d espèces différentes eux exemples: (. ayhoff et al (978) model of evolutionary change in proteins. n tlas of protein sequence and structure ol, o suppl, p.) BOU (. enikoff et al (99) mino acid substitution matrices from protein blocks. roc atl cad ci U 89:999) onday ebruary onday ebruary

5 om enaerts, om enaerts, atrices de substitution atrices de substitution es matrices, crée par argaret ayhoff, donnent un score de substitution entre les acides aminés a matrice était créé en utilisant des vraies séquences similaires (~8%) es valeurs positives (négatives) représentent des mutations acceptées (défavorables) ugmente la confiance sur l alignement et assure que le nombre de mutations entre deux séquences est limité a diagonale représente la conservation U U 7 9 e but était de déterminer la relation évolutive entre les acides aminés onday ebruary 7 om enaerts, onday ebruary 8 om enaerts, atrices de substitution atrices de substitution l y a plusieurs de ces matrices, chacunes reflétant une différence dans le nombre de substitutions acceptées BOU est déterminée en utilisant des blocs d acides aminés bien conservés dans des protéines : différences de % de mutations par séquence : différences de % de mutations par séquence : différences de % de mutations par séquence (plusieurs mutations par positions) e est une indication de l'identité entre les séquences qui étaient utilisées pour la construction de la matrice es nouveaux sont arrivés : 9 (Jones et al (99) omp pp Biosci 8:78) onday ebruary BOU 9 onday ebruary

6 om enaerts, om enaerts, sn sp ln lu ly is le eu ys yr al er hr rp et he ro ydrophobic romatic olar Basic cidic B Z X * 7 7 ydrophobic romatic olar Basic cidic es substitutions au sein des groupes d acides aminés sont favorables onday ebruary om enaerts, yr al 7 rp er 8 hr he 7 ro ys uelques substitutions sont neutre 9 et le eu is 8 lu B Z X * ly la rg sn sp ys ln lu ly is le eu ys et he ro er hr rp yr al ln eulement un ensemble limité de substitutions sont favorable sp 9 ys sn la nalyse de BOU rg ys B Z X * la la rg sn sp ys ln lu ly is le eu ys et he ro er hr rp yr al rg nalyse de BOU B Z X * onday ebruary om enaerts, onday ebruary is le eu ys et yr al hr rp B Z X * ydrophobic romatic olar Basic cidic onday ebruary 7 al ly yr lu 7 rp ln er ys hr he 7 ro et 8 ys eu 7 is le 9 ly ln lu ys 8 sp B Z X * sn la rg sn sp ys ln lu ly is le eu ys et he ro er hr rp yr al la nalyse de BOU rg 9 er he ro sp ydrophobic romatic olar Basic cidic sn B Z X * la la rg sn sp ys ln lu ly is le eu ys et he ro er hr rp yr al rg nalyse de BOU B Z X *

7 om enaerts, om enaerts, atrices de substitution es espaces (gaps) uelles matrices est-ce qu on doit utiliser???? e numéro de indique la divergence entre les séquences et le numéro de BOU indique le pourcentage d identité es séquences homologues ont souvent une longueur différente U U -U ----U our l évaluation des séquences similaires on a besoin d une matrice qui donne des valeurs hautes pour les assortiments identiques : BOU 8 ou i on veut aligner ces séquences on devrait introduire des espaces pour les insertions et les suppressions a matrice est choisie en utilisant le taux de conservation prévue entre les séquences qu on veut aligner On fait la différence entre le début d un espace (pénalité de au ) ou l extension d un espace existant (penalité de -. au ) onday ebruary onday ebruary om enaerts, om enaerts, Un exemple Un exemple calculates a global alignment of two sequences version.u lease cite: yers and iller, BO (989) :7 unknown 98 bp 98 aa vs. unknown 9 bp 9 aa using matrix file: /usr/molbio/share/fasta/blosum.mat, gap open/ ext: /.% identity in aa overlap;!! lobal score: unknow ::.::. :.:: :. :..: ::::.:.....:.:...:. ::.:.. unknow calculates a global alignment of two sequences version.u lease cite: yers and iller, BO (989) :7 98 bp 98 aa vs. B 9 bp 9 aa using matrix file: /usr/molbio/share/fasta/blosum8.mat, gap open/ext: /.% identity in 8 aa overlap;!! lobal score: ::.::. : :: : : :: ::::.:....:.:...:. ::.:. B unknow :..:.:...::.::.. : :: unknow (BOU, début de l espace =, l extension de l espace = ) _form.html : : : :.: :...::.:: ::.. : :: B (BOU 8, début de l espace =, l extension de l espace = ) _form.html onday ebruary 7 onday ebruary 8

8 om enaerts, Un exemple om enaerts, es différents types d alignement l y a deux grandes classes d alignement calculates a global alignment of two sequences version.u lease cite: yers and iller, BO (989) :7 98 bp 98 aa vs. B 9 bp 9 aa using matrix file: /usr/molbio/share/fasta/pam.mat, gap open/ext: /.% identity in aa overlap;!! lobal score: 9 ::.::. :.:: : :. : ::::.:......:.:....:. ::.:.. : B : : :.: :...::.:: ::... : :: B (, début de l espace =, l extension de l espace = ) _form.html l alignement global : l alignement entre des séquences complètes ntéressant pour la comparaison entre des séquences relatées l alignement local : l alignement des régions conservées au sein des protéines pour la détection des domaines ou des motifs communs onday ebruary 9 onday ebruary om enaerts, a programmation dynamique a méthode la plus efficace pour trouver un alignement optimal est la programmation dynamique () omme le divide-and-conquer, est une méthode pour la conception des algorithmes es transparants suivantes donnent une explication de en utilisant quelques exemples a sous-séquence la plus longue (ongest common subsequence) ou a distance d édition (dit distance) ou près est utilisé pour la construction d un algorithme d alignement. om enaerts, xemple : e problème : tant données deux séquences x[..m] et y[..n], trouvez une des sous-séquences les plus longues qui fait partie des deux séquences il est possible que plusieurs solutions existent onday ebruary onday ebruary

9 om enaerts, om enaerts, xemple : xemple : e problème : tant données deux séquences x[..m] et y[..n], trouvez une des sous-séquences les plus longues qui fait partie des deux séquences il est possible que plusieurs solutions existent e problème : tant données deux séquences x[..m] et y[..n], trouvez une des sous-séquences les plus longues qui fait partie des deux séquences il est possible que plusieurs solutions existent x : B B B y : B B uelles sont les plus longues sousséquences qu on pourrait trouver au sein de x et y? x : B B B y : B B uelles sont les plus longues sousséquences qu on pourrait trouver au sein de x et y? BB, BB, BB = (x,y) xprime une relation entre x et y onday ebruary onday ebruary om enaerts, om enaerts, xemple : xemple : e problème : tant données deux séquences x[..m] et y[..n], trouvez une des sous-séquences les plus longues qui fait partie des deux séquences il est possible que plusieurs solutions existent Une approche est de vérifier toutes les sous-séquences de x pour voir s ils font aussi partie de y = méthode approfondie emps d'exécution? x : B B B y : B B uelles sont les plus longues sousséquences qu on pourrait trouver au sein de x et y? BB, BB, BB = (x,y) xprime une relation entre x et y omment résoudre ce problème? onday ebruary onday ebruary

10 om enaerts, om enaerts, xemple : Une approche est de vérifier toutes les sous-séquences de x pour voir s ils font aussi partie de y = méthode approfondie emps d'exécution?. ombien de temps est exigé pour vérifier qu une sous-séquence de x fait aussi partie d une séquence y? Obliger d aller jusqu au bout de la séquence y : O(n) par sousséquence xemple : Une approche est de vérifier toutes les sous-séquences de x pour voir s ils font aussi partie de y = méthode approfondie emps d'exécution?. ombien de temps est exigé pour vérifier qu une sous-séquence de x fait aussi partie d une séquence y? Obliger d aller jusqu au bout de la séquence y : O(n) par sousséquence. ombien de sous-séquences différentes font partie de la séquence x? haque sous-séquence est représentée par un vecteur de bits (/). l y a m vecteurs x : B B B v : v : onday ebruary onday ebruary om enaerts, om enaerts, xemple : Une approche est de vérifier toutes les sous-séquences de x pour voir s ils font aussi partie de y = méthode approfondie emps d'exécution? le total de en fait O(n m ) = exponentielle = lent. ombien de temps est exigé pour vérifier qu une sous-séquence de x fait aussi partie d une séquence y? Obliger d aller jusqu au bout de la séquence y : O(n) par sousséquence xemple : our trouver une solution moins lente, on introduit une simplification. ombien de sous-séquences différentes font partie de la séquence x? haque sous-séquence est représentée par un vecteur de bits (/). l y a m vecteurs x : B B B v : v : onday ebruary onday ebruary

11 om enaerts, om enaerts, xemple : xemple : our trouver une solution moins lente, on introduit une simplification. u lieu de chercher le, essayez de trouver la longueur s = la longueur de la séquence s our trouver une solution moins lente, on introduit une simplification. u lieu de chercher le, essayez de trouver la longueur s = la longueur de la séquence s. près, étendez l algorithme pour trouver le onday ebruary onday ebruary om enaerts, om enaerts, xemple : our trouver une solution moins lente, on introduit une simplification. u lieu de chercher le, essayez de trouver la longueur s = la longueur de la séquence s xemple : idée est de résoudre le problème pour les séquences x [..m] et y[..n] (longueur m et n) en utilisant les préfixes de longueur m en n. près, étendez l algorithme pour trouver le pproche : Utilisez les préfixes des séquences x et y c[i,j] = (x[..i],y[..j]) c[m,n] = (x[..m],y[..n]) le préfixe i d une séquence x est x[..i] onday ebruary onday ebruary

12 om enaerts, om enaerts, xemple : idée est de résoudre le problème pour les séquences x [..m] et y[..n] (longueur m et n) en utilisant les préfixes de longueur m en n aractéristique de a sous-structure optimale on dit qu un problème a une sous-structure optimale si la solution optimale pour le problème contient des solutions optimales pour les sous-problèmes du problème global xemple : idée est de résoudre le problème pour les séquences x [..m] et y[..n] (longueur m et n) en utilisant les préfixes de longueur m en n aractéristique de a sous-structure optimale on dit qu un problème a une sous-structure optimale si la solution optimale pour le problème contient des solutions optimales pour les sous-problèmes du problème global e problème a des sous-structures optimales i z[..k]=(x[..m],y[..n]), chaque préfixe de z est un d un préfixe de x et un préfixe de y onday ebruary onday ebruary om enaerts, om enaerts, xemple : xemple : idée est de résoudre le problème pour les séquences x [..m] et y[..n] (longueur m et n) en utilisant les préfixes de longueur m en n idée est de résoudre le problème pour les séquences x [..m] et y[..n] (longueur m et n) en utilisant les préfixes de longueur m en n c[m,n]=k et z[..k]=(x[..m],y[..n]) c[m,n]=k et z[..k]=(x[..m],y[..n]). uand x[m]=y[n], z[k]=x[m]=y[n] et z[..k] est un de x[..m] et y[..n] onday ebruary onday ebruary

13 om enaerts, om enaerts, xemple : idée est de résoudre le problème pour les séquences x [..m] et y[..n] (longueur m et n) en utilisant les préfixes de longueur m en n c[m,n]=k et z[..k]=(x[..m],y[..n]) xemple : idée est de résoudre le problème pour les séquences x [..m] et y[..n] (longueur m et n) en utilisant les préfixes de longueur m en n c[m,n]=k et z[..k]=(x[..m],y[..n]). uand x[m]=y[n], z[k]=x[m]=y[n] et z[..k] est un de x[..m] et y[..n] reuve i z[k]! x[m], on peut ajouter x[m] au z[..k] et on obtient un de longueur k+... contradiction! parce que on a dit que k est la longueur maximum. l reste à montrer que z[..k] est un de x[..m] et y[..m]. upposons qu il existe une w qui est plus longue que z[..k]. arce que x[m]=y[n] on peut ajouter x[m] au w, qui est maintenant un de x [..m] et y[..n].. contradiction! on a trouvé une qui est plus longue que z onday ebruary onday ebruary 7 om enaerts, om enaerts, xemple : xemple : idée est de résoudre le problème pour les séquences x [..m] et y[..n] (longueur m et n) en utilisant les préfixes de longueur m en n idée est de résoudre le problème pour les séquences x [..m] et y[..n] (longueur m et n) en utilisant les préfixes de longueur m en n c[m,n]=k et z[..k]=(x[..m],y[..n]) c[m,n]=k et z[..k]=(x[..m],y[..n]). uand x[m]!y[n], z[k]!x[m] implique que z[..k] est un de x[..m] et y[..n] si x[m] n est pas le dernier élément de la séquence z[..k], on doit vérifier si x[m]=y[n]. uand x[m]!y[n], z[k]!x[m] implique que z[..k] est un de x[..m] et y[..n] si x[m] n est pas le dernier élément de la séquence z[..k], on doit vérifier si x[m]=y[n]. uand x[m]!y[n], z[k]!y[n] implique que z[..k] est un de x[..m] et y[..n] si y[n] n est pas le dernier élément de la séquence z[..k], on doit vérifier si x[m]=y[n] onday ebruary 7 onday ebruary 7

14 om enaerts, om enaerts, xemple : 7 xemple : 7 Utilisant ces trois observations on peut définir un algorithme récursif pour résoudre le problème du Utilisant ces trois observations on peut définir un algorithme récursif pour résoudre le problème du c[i,j] = { si i= et j= c[i,j]+ si i,j> et x[i]=y[j] max{c[i,j],c[i,j]} si i,j> et x[i]!y[j] c[i,j] = { si i= et j= c[i,j]+ si i,j> et x[i]=y[j] max{c[i,j],c[i,j]} si i,j> et x[i]!y[j] (x,y,i,j) if (x[i] == y[j]) then c[i,j] (x,y,i,j) + else c[i,j] max {(x,y,i,j), (x,y,i,j)} return c[i,j] onday ebruary 8 onday ebruary 8 om enaerts, om enaerts, xemple : 8 xemple : 9 emps d'exécution? ans le pire des cas, l algorithme doit toujours prendre le branchement else du code emps d'exécution? ans le pire des cas, l algorithme doit toujours prendre le branchement else du code m= et n= m= et n= ombre de noeuds est aussi exponentiel ais le même sous-problème est résolu plusieurs fois!!! onday ebruary 9 onday ebruary

15 om enaerts, om enaerts, xemple : xemple : aractéristique de ous-problèmes superposants Une solution récursive contient un nombre limitée de sous-problèmes distincts répétés beaucoup de fois aractéristique de ous-problèmes superposants Une solution récursive contient un nombre limitée de sous-problèmes distincts répétés beaucoup de fois e nombre de sous-problèmes différents de pour deux séquences de longueur m et n est mn i un problème a les deux caractéristiques (sous-structure optimale et sous-problèmes superposants), le pourrait être utilisé pour la création d un algorithme onday ebruary onday ebruary om enaerts, om enaerts, xemple : xemple : emoization ( ): uand une solution pour un sousproblème est calculé, enregistrez-le dans un tableau emoization ( ): uand une solution pour un sousproblème est calculé, enregistrez-le dans un tableau es appels ultérieurs au vont vérifier le tableau pour éviter qu on refasse le même travail es appels ultérieurs au vont vérifier le tableau pour éviter qu on refasse le même travail (x,y,i,j) if (c[i,j] == ) //i le travail n est déjà fait, fais le if (x[i] == y[j]) then c[i,j] (x,y,i,j) + else c[i,j] max {(x,y,i,j), (x,y,i,j)} return c[i,j] onday ebruary onday ebruary

16 om enaerts, om enaerts, xemple : emoization ( ): uand une solution pour un sousproblème est calculé, enregistrez-le dans un tableau es appels ultérieurs au vont vérifier le tableau pour éviter qu on refasse le même travail xemple : a solution précédente est construite utilisant une approche top-down. On pourrait aussi construire la solution en utilisant une approche bottom-up (x,y,i,j) if (c[i,j] == ) //i le travail n est déjà fait, fais le if (x[i] == y[j]) then c[i,j] (x,y,i,j) + else c[i,j] max {(x,y,i,j), (x,y,i,j)} return c[i,j] emps d'exécution? ombre de calculations est mn : O(mn) émoire? O(mn) c[i,j] = { si i= et j= c[i,j]+ si i,j> et x[i]=y[j] max{c[i,j],c[i,j]} si i,j> et x[i]!y[j] onday ebruary onday ebruary om enaerts, om enaerts, xemple : xemple : a solution précédente est construite utilisant une approche top-down. On pourrait aussi construire la solution en utilisant une approche bottom-up a solution précédente est construite utilisant une approche top-down. On pourrait aussi construire la solution en utilisant une approche bottom-up emps d'exécution? O(mn) c[i,j] = { si i= et j= c[i,j]+ si i,j> et x[i]=y[j] max{c[i,j],c[i,j]} si i,j> et x[i]!y[j] c[i,j] = { si i= et j= c[i,j]+ si i,j> et x[i]=y[j] max{c[i,j],c[i,j]} si i,j> et x[i]!y[j] onday ebruary onday ebruary

17 om enaerts, om enaerts, xemple : a solution précédente est construite utilisant une approche top-down. On pourrait aussi construire la solution en utilisant une approche bottom-up emps d'exécution? O(mn) émoire? O(mn) xemple : a solution précédente est construite utilisant une approche top-down. On pourrait aussi construire la solution en utilisant une approche bottom-up Utilise une matrice additionnel pour enregistrer l origine rouver le en retournant sur trace vers le début onday ebruary onday ebruary 7 om enaerts, om enaerts, xemple : xemple : (x,y,m,n) for i to m do c[i,] bt[i,] for j to n do c[,j] bt[i,] for i to m do for j to n do if(x[i]==y[j]) then c[i,j] c[i,j]+ bt[i,j] else c[i,j] max{c[i,j],c[i,j]} bt[i,] (argmax{c[i,j],c[i,j]}==? ; } return c e problème : alculer la distance d éditions () entre deux chaînes de caractères, avec une transcription d édition optimale (edit transcript) qui décrit la transformation entre les deux strings opérations de transformation : (insertion), (suppression), (remplacement) et (les deux caractères sont les mêmes) x[..7] : vintner y[..7] : writers v intner wri t ers es opérations sont faites sur la première chaîne de caractères vintner wri t ers onday ebruary 8 onday ebruary 9

18 om enaerts, om enaerts, xemple : xemple : éfinition : une chaîne utilisant des caractères de l alphabet {,,,} qui décrit la transformation d une chaîne de caractères vers une autre est une transcription d édition des deux chaînes de caractères evensthein distance éfinition : a distance d édition entre deux chaînes de caractères est définie comme le nombre minimum d opérations d ensemble {,,} nécessaire pour transformer la première chaîne de caractères en la deuxième a transcription liée à la distance d édition est la transcription optimale st-ce que le problème de contient les caractéristiques typiques d un problème qui pourrait être résolu par? a sous-structure optimale? es sous-problèmes superposants? les deux chaînes sont x[..m] et y[..n] (i,j) est la fonction de la distance d édition entre les chaînes x [..i] et y[..j] our les chaînes x et y de longueur m et n respectivement, le nombre de sous problèmes est mn onday ebruary onday ebruary om enaerts, om enaerts, xemple : xemple : a relation récursive : (i,)=i parce que on a besoin de i suppressions pour changer i caractères de x en caractères de y { i si i> et j= (i,j) = j si i= et j> min{(i,j)+,(i,j)+, (i,j)+t(i,j)} si i,j> et si x[i]=y[j], t(i,j) = autrement t(i,j)= a relation récursive : (i,)=i parce que on a besoin de i suppressions pour changer i caractères de x en caractères de y { i si i> et j= (i,j) = j si i= et j> min{(i,j)+,(i,j)+, (i,j)+t(i,j)} si i,j> et si x[i]=y[j], t(i,j) = autrement t(i,j)= omme le problème de l, on peut utiliser une approche bottom-up pour calculer la distance d édition omme le problème de l, on peut utiliser une approche bottom-up pour calculer la distance d édition onday ebruary onday ebruary

19 om enaerts, om enaerts, xemple : xemple : a relation récursive : (i,)=i parce que on a besoin de i suppressions pour changer i caractères de x en caractères de y { i si i> et j= (i,j) = j si i= et j> min{(i,j)+,(i,j)+, (i,j)+t(i,j)} si i,j> et si x[i]=y[j], t(i,j) = autrement t(i,j)= e retour arrière solutions v intner wri t ers vintner wri t ers vintner writ ers a distance d édition est : On a besoin d un minimum de caractères de l ensemble {,,} pour la transformation onday ebruary onday ebruary om enaerts, om enaerts, Objectifs alignement global omprendre les notions d identité, de similarité et d homologie Être capable d expliquer la notion d un alignement optimal xpliquer les matrices de substitutions omprendre la différence entre l alignement global et local xpliquer les principes de la programmation dynamique xpliquer les solutions pour et omprendre la relation entre et l alignement des séquences xpliquer les différences entre la pénalité linéaire et affine omprendre comment on peut trouver des alignements sous-optimales Être capable de développer tous les algorithmes e problème de la est équivalent au problème d alignement calculates a global alignment of two sequences version.u lease cite: yers and iller, BO (989) :7 unknown 98 bp 98 aa vs. unknown 9 bp 9 aa using matrix file: /usr/molbio/share/fasta/blosum.mat, gap open/ ext: /.% identity in aa overlap;!! lobal score: unknow ::.::. :.:: :. :..: ::::.:.....:.:...:. ::.:.. unknow unknow :..:.:...::.::.. : :: unknow eux caractères différents dans un alignement sont des replacements dans une transcription d édition Un espace dans la première chaîne d un alignement est une insertion dans la deuxième chaîne Un espace dans la deuxième chaîne d un alignement est une suppression du caractère opposant dans la première chaîne onday ebruary onday ebruary 7

20 om enaerts, om enaerts, alignement global alignement global pénalité g est -8 e algorithme pour l alignement était proposé par aul eedleman et hristian unsch en 97 uand la pénalité est trop haute, on n obtient pas des espaces dans l alignement algorithme de eedleman et unsch cherche l alignement qui donne la plus grande similarité, ce qui est équivalent à chercher la transcription minimale en (i,j) = { ig jg si i> et j= si i= et j> BOU est utilisé pour la fonction t(i,j) max{(i,j)+g,(i,j)+g, (i,j)+t(i,j)} si i,j>, t(i,j)=ub[x[i],y[j]] et g (<) est la pénalité pour des espaces (gap penalty) onday ebruary pénalité g est 8 om enaerts, onday ebruary 9 om enaerts, alignement global alignement global outes les méthodes précédentes utilisent une pénalité linéaire pour les espaces dans l alignement alignement semiglobal aintenant les pénalités pour les positions (i,) en (,j) sont. On enlève l obligation que les séquences doivent s aligner au début et fin de la matrice. pénalité g est -8 g(ngap) = -ngap linear gap penalty On pourrait aussi différencier entre la pénalité pour le début d un espace (gap open) et l augmentation d une espace (gap extend) g(ngap) = --(ngap) ffine gap penalty omment est-ce qu on doit adapter l algorithme? e retour arrière commence à la position dans la dernière ligne avec la plus haute valeur onday ebruary onday ebruary

21 om enaerts, om enaerts, alignement global st-ce qu on commence ou on étend l espace? (i,j) est le maximum de toutes ces possibilités alignement global 7 On peux adapter l algorithme précédente de sorte qu on obtiens un temps d exécution O(mn) (i,j) - (i,j) =max{(i,j)- (i,j) - (i,j) =max{(i,j) - (i,j)+t(i,j) (i,j) =max{ (i,j) (i,j) On enregistre trois éléments par position de la matrice :, et { (i,j)+t(i,j) (i,j) =max [(i-ngap,j)+g(ngap)]"ngap"i [(i,j -ngap)+g(ngap)]"ngap"j e temps d'exécution est O(mn ) onday ebruary onday ebruary om enaerts, om enaerts, alignement local alignement local arfois on veut seulement trouver des parties qui sont similaires entre des séquences mith et aterman ont proposé une méthode qui ressemble fortement aux méthodes précédentes a relation de récurrence de mith et aterman adaptée au pénalité affine (i,j)+t(i,j) (i,j) =max [(i-ngap,j)+g(ngap)]"ngap"i [(i,j -ngap)+g(ngap)]"ngap"j { uand un alignement des caractères donne un score négative, il est remplacé par et les valeurs de (i,) et (,j) sont aussi comme dans l alignement semiglobal mith and aterman (98) dentification of common molecular subsequences J ol Biol 7:997 e retour arrière commence à la position avec la plus haute valeur dans la matrice onday ebruary onday ebruary

22 om enaerts, om enaerts, alignement local pénalité linéaire avec g = -8 alignement local es alignements sous-optimales donnent de l information sur des autres répétions dans les deux séquences (par exemple des protéines avec plusieurs domaines) BOU est utilisé pour la fonction t(i,j) près la séquence avec le plus haut score ait été trouvée, on met toutes les valeurs qui appartiennent à ce chemin à zéro On recalcule les éléments de la matrice dans le voisinage du chemin optimal pénalité linéaire avec = eulement les éléments en dessous sont affectés par cette modification On ne recalcule plus pour les éléments qui ne changent plus pénalité linéaire avec g = onday ebruary onday ebruary 7 om enaerts, alignement local xemple fait par omparison of: ()./wwwtmp/.9..seq B bp (B)./wwwtmp/.9..seq B 7 bp using matrix file: /usr/molbio/share/fasta/blosum.mat (/), gap-open/ext: / (limit)..% identity in aa overlap (7:9); score: (): B B B B B B : ::: :..:. ::..:. :.::....:.:....:..:.:::... : :. :. : ::.::.. :.::.:::::.::. :.:.... : :.... :: : ::.: :::.:... es protéines alignent sur la combinaison de - et aussi entre le de B et le deuxième de B!.7% identity in aa overlap (:); score: 87 (): B B :. ::.::. :. :...:...:. :..:... : : ::.:::: onday ebruary 8

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST.

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST. La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST. Gaël Le Mahec - p. 1/12 L algorithme BLAST. Basic Local Alignment Search Tool est un algorithme de recherche

Plus en détail

Plus courts chemins, programmation dynamique

Plus courts chemins, programmation dynamique 1 Plus courts chemins, programmation dynamique 1. Plus courts chemins à partir d un sommet 2. Plus courts chemins entre tous les sommets 3. Semi-anneau 4. Programmation dynamique 5. Applications à la bio-informatique

Plus en détail

Resolution limit in community detection

Resolution limit in community detection Introduction Plan 2006 Introduction Plan Introduction Introduction Plan Introduction Point de départ : un graphe et des sous-graphes. But : quantifier le fait que les sous-graphes choisis sont des modules.

Plus en détail

Chapitre 7. Récurrences

Chapitre 7. Récurrences Chapitre 7 Récurrences 333 Plan 1. Introduction 2. Applications 3. Classification des récurrences 4. Résolution de récurrences 5. Résumé et comparaisons Lectures conseillées : I MCS, chapitre 20. I Rosen,

Plus en détail

Arbres binaires de recherche

Arbres binaires de recherche 1 arbre des comparaisons 2 recherche dichotomique l'arbre est recalculé à chaque recherche 2 5 3 4 7 9 1 6 1 2 3 4 5 6 7 9 10 conserver la structure d'arbre au lieu de la reconstruire arbre binaire de

Plus en détail

CHAPITRE 5. Stratégies Mixtes

CHAPITRE 5. Stratégies Mixtes CHAPITRE 5 Stratégies Mixtes Un des problèmes inhérents au concept d équilibre de Nash en stratégies pures est que pour certains jeux, de tels équilibres n existent pas. P.ex.le jeu de Pierre, Papier,

Plus en détail

Programmation linéaire

Programmation linéaire 1 Programmation linéaire 1. Le problème, un exemple. 2. Le cas b = 0 3. Théorème de dualité 4. L algorithme du simplexe 5. Problèmes équivalents 6. Complexité de l Algorithme 2 Position du problème Soit

Plus en détail

Chapitre 0 Introduction à la cinématique

Chapitre 0 Introduction à la cinématique Chapitre 0 Introduction à la cinématique Plan Vitesse, accélération Coordonnées polaires Exercices corrigés Vitesse, Accélération La cinématique est l étude du mouvement Elle suppose donc l existence à

Plus en détail

Résolution de systèmes linéaires par des méthodes directes

Résolution de systèmes linéaires par des méthodes directes Résolution de systèmes linéaires par des méthodes directes J. Erhel Janvier 2014 1 Inverse d une matrice carrée et systèmes linéaires Ce paragraphe a pour objet les matrices carrées et les systèmes linéaires.

Plus en détail

4 Exemples de problèmes MapReduce incrémentaux

4 Exemples de problèmes MapReduce incrémentaux 4 Exemples de problèmes MapReduce incrémentaux 1 / 32 Calcul des plus courtes distances à un noeud d un graphe Calcul des plus courts chemins entre toutes les paires de noeuds d un graphe Algorithme PageRank

Plus en détail

Perl Orienté Objet BioPerl There is more than one way to do it

Perl Orienté Objet BioPerl There is more than one way to do it Perl Orienté Objet BioPerl There is more than one way to do it Bérénice Batut, berenice.batut@udamail.fr DUT Génie Biologique Option Bioinformatique Année 2014-2015 Perl Orienté Objet - BioPerl Rappels

Plus en détail

Identification de nouveaux membres dans des familles d'interleukines

Identification de nouveaux membres dans des familles d'interleukines Identification de nouveaux membres dans des familles d'interleukines Nicolas Beaume Jérôme Mickolajczak Gérard Ramstein Yannick Jacques 1ère partie : Définition de la problématique Les familles de gènes

Plus en détail

Représentation d un entier en base b

Représentation d un entier en base b Représentation d un entier en base b 13 octobre 2012 1 Prérequis Les bases de la programmation en langage sont supposées avoir été travaillées L écriture en base b d un entier est ainsi défini à partir

Plus en détail

TOUT CE QU IL FAUT SAVOIR POUR LE BREVET

TOUT CE QU IL FAUT SAVOIR POUR LE BREVET TOUT E QU IL FUT SVOIR POUR LE REVET NUMERIQUE / FONTIONS eci n est qu un rappel de tout ce qu il faut savoir en maths pour le brevet. I- Opérations sur les nombres et les fractions : Les priorités par

Plus en détail

Master IAD Module PS. Reconnaissance de la parole (suite) Alignement temporel et Programmation dynamique. Gaël RICHARD Février 2008

Master IAD Module PS. Reconnaissance de la parole (suite) Alignement temporel et Programmation dynamique. Gaël RICHARD Février 2008 Master IAD Module PS Reconnaissance de la parole (suite) Alignement temporel et Programmation dynamique Gaël RICHARD Février 2008 1 Reconnaissance de la parole Introduction Approches pour la reconnaissance

Plus en détail

Reconstruction de bâtiments en 3D à partir de nuages de points LIDAR

Reconstruction de bâtiments en 3D à partir de nuages de points LIDAR Reconstruction de bâtiments en 3D à partir de nuages de points LIDAR Mickaël Bergem 25 juin 2014 Maillages et applications 1 Table des matières Introduction 3 1 La modélisation numérique de milieux urbains

Plus en détail

MABioVis. Bio-informatique et la

MABioVis. Bio-informatique et la MABioVis Modèles et Algorithmes pour la Bio-informatique et la Visualisation Visite ENS Cachan 5 janvier 2011 MABioVis G GUY MELANÇON (PR UFR Maths Info / EPI GRAVITE) (là, maintenant) - MABioVis DAVID

Plus en détail

EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG

EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG Exploitations pédagogiques du tableur en STG Académie de Créteil 2006 1 EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG Commission inter-irem lycées techniques contact : dutarte@club-internet.fr La maquette

Plus en détail

Compléments de documentation Scilab : affichage de texte et formatage de nombres

Compléments de documentation Scilab : affichage de texte et formatage de nombres Université des Sciences et Technologies de Lille U.F.R. de Mathématiques Pures et Appliquées Agrégation externe Année 2002-2003 Compléments de documentation Scilab : affichage de texte et formatage de

Plus en détail

EPREUVE OPTIONNELLE d INFORMATIQUE CORRIGE

EPREUVE OPTIONNELLE d INFORMATIQUE CORRIGE EPREUVE OPTIONNELLE d INFORMATIQUE CORRIGE QCM Remarque : - A une question correspond au moins 1 réponse juste - Cocher la ou les bonnes réponses Barème : - Une bonne réponse = +1 - Pas de réponse = 0

Plus en détail

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique Objectifs Clustering On ne sait pas ce qu on veut trouver : on laisse l algorithme nous proposer un modèle. On pense qu il existe des similarités entre les exemples. Qui se ressemble s assemble p. /55

Plus en détail

# let rec concat l1 l2 = match l1 with [] -> l2 x::l 1 -> x::(concat l 1 l2);; val concat : a list -> a list -> a list = <fun>

# let rec concat l1 l2 = match l1 with [] -> l2 x::l 1 -> x::(concat l 1 l2);; val concat : a list -> a list -> a list = <fun> 94 Programmation en OCaml 5.4.8. Concaténation de deux listes Définissons maintenant la fonction concat qui met bout à bout deux listes. Ainsi, si l1 et l2 sont deux listes quelconques, concat l1 l2 constitue

Plus en détail

Les nombres entiers. Durée suggérée: 3 semaines

Les nombres entiers. Durée suggérée: 3 semaines Les nombres entiers Durée suggérée: 3 semaines Aperçu du module Orientation et contexte Pourquoi est-ce important? Dans le présent module, les élèves multiplieront et diviseront des nombres entiers concrètement,

Plus en détail

Quantification Scalaire et Prédictive

Quantification Scalaire et Prédictive Quantification Scalaire et Prédictive Marco Cagnazzo Département Traitement du Signal et des Images TELECOM ParisTech 7 Décembre 2012 M. Cagnazzo Quantification Scalaire et Prédictive 1/64 Plan Introduction

Plus en détail

INF6304 Interfaces Intelligentes

INF6304 Interfaces Intelligentes INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie

Plus en détail

Grandes lignes ASTRÉE. Logiciels critiques. Outils de certification classiques. Inspection manuelle. Definition. Test

Grandes lignes ASTRÉE. Logiciels critiques. Outils de certification classiques. Inspection manuelle. Definition. Test Grandes lignes Analyseur Statique de logiciels Temps RÉel Embarqués École Polytechnique École Normale Supérieure Mercredi 18 juillet 2005 1 Présentation d 2 Cadre théorique de l interprétation abstraite

Plus en détail

Algorithmes sur les mots (séquences)

Algorithmes sur les mots (séquences) Introduction Algorithmes sur les mots (séquences) Algorithmes sur les mots (textes, séquences, chines de crctères) Nomreuses pplictions : ses de données iliogrphiques ioinformtique (séquences de iomolécules)

Plus en détail

CHAPITRE 3 LA SYNTHESE DES PROTEINES

CHAPITRE 3 LA SYNTHESE DES PROTEINES CHAITRE 3 LA SYNTHESE DES ROTEINES On sait qu un gène détient dans sa séquence nucléotidique, l information permettant la synthèse d un polypeptide. Ce dernier caractérisé par sa séquence d acides aminés

Plus en détail

données en connaissance et en actions?

données en connaissance et en actions? 1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)

Plus en détail

Fonctions de plusieurs variables

Fonctions de plusieurs variables Module : Analyse 03 Chapitre 00 : Fonctions de plusieurs variables Généralités et Rappels des notions topologiques dans : Qu est- ce que?: Mathématiquement, n étant un entier non nul, on définit comme

Plus en détail

Objets Combinatoires élementaires

Objets Combinatoires élementaires Objets Combinatoires élementaires 0-0 Permutations Arrangements Permutations pour un multi-ensemble mots sous-ensemble à k éléments (Problème du choix) Compositions LE2I 04 1 Permutations Supposons que

Plus en détail

Chapitre 5 : Flot maximal dans un graphe

Chapitre 5 : Flot maximal dans un graphe Graphes et RO TELECOM Nancy A Chapitre 5 : Flot maximal dans un graphe J.-F. Scheid 1 Plan du chapitre I. Définitions 1 Graphe Graphe valué 3 Représentation d un graphe (matrice d incidence, matrice d

Plus en détail

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1 Christophe CANDILLIER Cours de DataMining mars 2004 age 1 1. Introduction 2. rocessus du DataMining 3. Analyse des données en DataMining 4. Analyse en Ligne OLA 5. Logiciels 6. Bibliographie Christophe

Plus en détail

Calcul matriciel. Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes.

Calcul matriciel. Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes. 1 Définitions, notations Calcul matriciel Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes. On utilise aussi la notation m n pour le

Plus en détail

4G2. Triangles et parallèles

4G2. Triangles et parallèles 4G2 Triangles et parallèles ST- QU TU T SOUVINS? 1) On te donne une droite (d) et un point n'appartenant pas à cette droite. vec une équerre et une règle non graduée, sais-tu construire la parallèle à

Plus en détail

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/ Recherche opérationnelle Les démonstrations et les exemples seront traités en cours Souad EL Bernoussi Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/ Table des matières 1 Programmation

Plus en détail

Nouvelles propositions pour la résolution exacte du sac à dos multi-objectif unidimensionnel en variables binaires

Nouvelles propositions pour la résolution exacte du sac à dos multi-objectif unidimensionnel en variables binaires Nouvelles propositions pour la résolution exacte du sac à dos multi-objectif unidimensionnel en variables binaires Julien Jorge julien.jorge@univ-nantes.fr Laboratoire d Informatique de Nantes Atlantique,

Plus en détail

Exemples de problèmes et d applications. INF6953 Exemples de problèmes 1

Exemples de problèmes et d applications. INF6953 Exemples de problèmes 1 Exemples de problèmes et d applications INF6953 Exemples de problèmes Sommaire Quelques domaines d application Quelques problèmes réels Allocation de fréquences dans les réseaux radio-mobiles Affectation

Plus en détail

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc) 87 FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc) Dans le cadre de la réforme pédagogique et de l intérêt que porte le Ministère de l Éducation

Plus en détail

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes.

Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes. Promotion X 004 COURS D ANALYSE DES STRUCTURES MÉCANIQUES PAR LA MÉTHODE DES ELEMENTS FINIS (MEC 568) contrôle non classant (7 mars 007, heures) Documents autorisés : polycopié ; documents et notes de

Plus en détail

Chafa Azzedine - Faculté de Physique U.S.T.H.B 1

Chafa Azzedine - Faculté de Physique U.S.T.H.B 1 Chafa Azzedine - Faculté de Physique U.S.T.H.B 1 Définition: La cinématique est une branche de la mécanique qui étudie les mouements des corps dans l espace en fonction du temps indépendamment des causes

Plus en détail

Travaux pratiques. Compression en codage de Huffman. 1.3. Organisation d un projet de programmation

Travaux pratiques. Compression en codage de Huffman. 1.3. Organisation d un projet de programmation Université de Savoie Module ETRS711 Travaux pratiques Compression en codage de Huffman 1. Organisation du projet 1.1. Objectifs Le but de ce projet est d'écrire un programme permettant de compresser des

Plus en détail

Séquence 6. Mais ces espèces pour autant ne sont pas identiques et parfois d ailleurs ne se ressemblent pas vraiment.

Séquence 6. Mais ces espèces pour autant ne sont pas identiques et parfois d ailleurs ne se ressemblent pas vraiment. Sommaire Séquence 6 Nous avons vu dans les séances précédentes qu au cours des temps géologiques des espèces différentes se sont succédé, leur apparition et leur disparition étant le résultat de modifications

Plus en détail

Les structures de données. Rajae El Ouazzani

Les structures de données. Rajae El Ouazzani Les structures de données Rajae El Ouazzani Les arbres 2 1- Définition de l arborescence Une arborescence est une collection de nœuds reliés entre eux par des arcs. La collection peut être vide, cad l

Plus en détail

Transmission d informations sur le réseau électrique

Transmission d informations sur le réseau électrique Transmission d informations sur le réseau électrique Introduction Remarques Toutes les questions en italique devront être préparées par écrit avant la séance du TP. Les préparations seront ramassées en

Plus en détail

Eteindre. les. lumières MATH EN JEAN 2013-2014. Mme BACHOC. Elèves de seconde, première et terminale scientifiques :

Eteindre. les. lumières MATH EN JEAN 2013-2014. Mme BACHOC. Elèves de seconde, première et terminale scientifiques : MTH EN JEN 2013-2014 Elèves de seconde, première et terminale scientifiques : Lycée Michel Montaigne : HERITEL ôme T S POLLOZE Hélène 1 S SOK Sophie 1 S Eteindre Lycée Sud Médoc : ROSIO Gauthier 2 nd PELGE

Plus en détail

Examen Médian - 1 heure 30

Examen Médian - 1 heure 30 NF01 - Automne 2014 Examen Médian - 1 heure 30 Polycopié papier autorisé, autres documents interdits Calculatrices, téléphones, traducteurs et ordinateurs interdits! Utilisez trois copies séparées, une

Plus en détail

VI. Tests non paramétriques sur un échantillon

VI. Tests non paramétriques sur un échantillon VI. Tests non paramétriques sur un échantillon Le modèle n est pas un modèle paramétrique «TESTS du CHI-DEUX» : VI.1. Test d ajustement à une loi donnée VI.. Test d indépendance de deux facteurs 96 Différentes

Plus en détail

Gnuplot. Chapitre 3. 3.1 Lancer Gnuplot. 3.2 Options des graphes

Gnuplot. Chapitre 3. 3.1 Lancer Gnuplot. 3.2 Options des graphes Chapitre 3 Gnuplot Le langage C ne permet pas directement de dessiner des courbes et de tracer des plots. Il faut pour cela stocker résultats dans des fichier, et, dans un deuxième temps utiliser un autre

Plus en détail

Capacité d un canal Second Théorème de Shannon. Théorie de l information 1/34

Capacité d un canal Second Théorème de Shannon. Théorie de l information 1/34 Capacité d un canal Second Théorème de Shannon Théorie de l information 1/34 Plan du cours 1. Canaux discrets sans mémoire, exemples ; 2. Capacité ; 3. Canaux symétriques ; 4. Codage de canal ; 5. Second

Plus en détail

Big data et sciences du Vivant L'exemple du séquençage haut débit

Big data et sciences du Vivant L'exemple du séquençage haut débit Big data et sciences du Vivant L'exemple du séquençage haut débit C. Gaspin, C. Hoede, C. Klopp, D. Laborie, J. Mariette, C. Noirot, MS. Trotard bioinfo@genopole.toulouse.inra.fr INRA - MIAT - Plate-forme

Plus en détail

Introduction. I Étude rapide du réseau - Apprentissage. II Application à la reconnaissance des notes.

Introduction. I Étude rapide du réseau - Apprentissage. II Application à la reconnaissance des notes. Introduction L'objectif de mon TIPE est la reconnaissance de sons ou de notes de musique à l'aide d'un réseau de neurones. Ce réseau doit être capable d'apprendre à distinguer les exemples présentés puis

Plus en détail

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION Bruno Saussereau Laboratoire de Mathématiques de Besançon Université de Franche-Comté Travail en commun

Plus en détail

LES TYPES DE DONNÉES DU LANGAGE PASCAL

LES TYPES DE DONNÉES DU LANGAGE PASCAL LES TYPES DE DONNÉES DU LANGAGE PASCAL 75 LES TYPES DE DONNÉES DU LANGAGE PASCAL CHAPITRE 4 OBJECTIFS PRÉSENTER LES NOTIONS D ÉTIQUETTE, DE CONS- TANTE ET DE IABLE DANS LE CONTEXTE DU LAN- GAGE PASCAL.

Plus en détail

Rappels sur les suites - Algorithme

Rappels sur les suites - Algorithme DERNIÈRE IMPRESSION LE 14 septembre 2015 à 12:36 Rappels sur les suites - Algorithme Table des matières 1 Suite : généralités 2 1.1 Déition................................. 2 1.2 Exemples de suites............................

Plus en détail

Définitions. Numéro à préciser. (Durée : )

Définitions. Numéro à préciser. (Durée : ) Numéro à préciser (Durée : ) On étudie dans ce problème l ordre lexicographique pour les mots sur un alphabet fini et plusieurs constructions des cycles de De Bruijn. Les trois parties sont largement indépendantes.

Plus en détail

Limitations of the Playstation 3 for High Performance Cluster Computing

Limitations of the Playstation 3 for High Performance Cluster Computing Introduction Plan Limitations of the Playstation 3 for High Performance Cluster Computing July 2007 Introduction Plan Introduction Intérêts de la PS3 : rapide et puissante bon marché L utiliser pour faire

Plus en détail

Théorie et codage de l information

Théorie et codage de l information Théorie et codage de l information Les codes linéaires - Chapitre 6 - Principe Définition d un code linéaire Soient p un nombre premier et s est un entier positif. Il existe un unique corps de taille q

Plus en détail

Correction du baccalauréat S Liban juin 2007

Correction du baccalauréat S Liban juin 2007 Correction du baccalauréat S Liban juin 07 Exercice. a. Signe de lnx lnx) : on fait un tableau de signes : x 0 e + ln x 0 + + lnx + + 0 lnx lnx) 0 + 0 b. On afx) gx) lnx lnx) lnx lnx). On déduit du tableau

Plus en détail

Principe de symétrisation pour la construction d un test adaptatif

Principe de symétrisation pour la construction d un test adaptatif Principe de symétrisation pour la construction d un test adaptatif Cécile Durot 1 & Yves Rozenholc 2 1 UFR SEGMI, Université Paris Ouest Nanterre La Défense, France, cecile.durot@gmail.com 2 Université

Plus en détail

Bases de programmation. Cours 5. Structurer les données

Bases de programmation. Cours 5. Structurer les données Bases de programmation. Cours 5. Structurer les données Pierre Boudes 1 er décembre 2014 This work is licensed under the Creative Commons Attribution-NonCommercial-ShareAlike 3.0 License. Types char et

Plus en détail

Donner les limites de validité de la relation obtenue.

Donner les limites de validité de la relation obtenue. olutions! ours! - Multiplicateur 0 e s alculer en fonction de. Donner les limites de validité de la relation obtenue. Quelle est la valeur supérieure de? Quel est le rôle de 0? - Multiplicateur e 0 s alculer

Plus en détail

GUIDE Excel (version débutante) Version 2013

GUIDE Excel (version débutante) Version 2013 Table des matières GUIDE Excel (version débutante) Version 2013 1. Créer un nouveau document Excel... 3 2. Modifier un document Excel... 3 3. La fenêtre Excel... 4 4. Les rubans... 4 5. Saisir du texte

Plus en détail

Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT

Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT Ces exercices portent sur les items 2, 3 et 5 du programme d informatique des classes préparatoires,

Plus en détail

Mathcad 15.0. Ces capacités font de Mathcad l outil de calcul technique le plus utilisé au monde.

Mathcad 15.0. Ces capacités font de Mathcad l outil de calcul technique le plus utilisé au monde. Mathcad 15.0 Création et documentation de calculs techniques Grâce à Mathcad, plus de 250 000 professionnels dans le monde peuvent effectuer, documenter, gérer et partager des calculs et des tâches de

Plus en détail

Jade. Projet Intelligence Artificielle «Devine à quoi je pense»

Jade. Projet Intelligence Artificielle «Devine à quoi je pense» Jade Projet Intelligence Artificielle «Devine à quoi je pense» Réalisé par Djénéba Djikiné, Alexandre Bernard et Julien Lafont EPSI CSII2-2011 TABLE DES MATIÈRES 1. Analyse du besoin a. Cahier des charges

Plus en détail

TEPZZ 568448A_T EP 2 568 448 A1 (19) (11) EP 2 568 448 A1 (12) DEMANDE DE BREVET EUROPEEN. (51) Int Cl.: G07F 7/08 (2006.01) G06K 19/077 (2006.

TEPZZ 568448A_T EP 2 568 448 A1 (19) (11) EP 2 568 448 A1 (12) DEMANDE DE BREVET EUROPEEN. (51) Int Cl.: G07F 7/08 (2006.01) G06K 19/077 (2006. (19) TEPZZ 68448A_T (11) EP 2 68 448 A1 (12) DEMANDE DE BREVET EUROPEEN (43) Date de publication: 13.03.2013 Bulletin 2013/11 (1) Int Cl.: G07F 7/08 (2006.01) G06K 19/077 (2006.01) (21) Numéro de dépôt:

Plus en détail

Objectifs du cours d aujourd hui. Informatique II : Cours d introduction à l informatique et à la programmation objet. Complexité d un problème (2)

Objectifs du cours d aujourd hui. Informatique II : Cours d introduction à l informatique et à la programmation objet. Complexité d un problème (2) Objectifs du cours d aujourd hui Informatique II : Cours d introduction à l informatique et à la programmation objet Complexité des problèmes Introduire la notion de complexité d un problème Présenter

Plus en détail

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée. ANALYSE 5 points Exercice 1 : Léonie souhaite acheter un lecteur MP3. Le prix affiché (49 ) dépasse largement la somme dont elle dispose. Elle décide donc d économiser régulièrement. Elle a relevé qu elle

Plus en détail

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé Baccalauréat S ntilles-guyane 11 septembre 14 Corrigé EXERCICE 1 6 points Commun à tous les candidats Une entreprise de jouets en peluche souhaite commercialiser un nouveau produit et à cette fin, effectue

Plus en détail

LES MÉTHODES DE POINT INTÉRIEUR 1

LES MÉTHODES DE POINT INTÉRIEUR 1 Chapitre XIII LES MÉTHODES DE POINT INTÉRIEUR 1 XIII.1 Introduction Nous débutons par un rappel de la formulation standard d un problème d optimisation 2 linéaire et donnons un bref aperçu des différences

Plus en détail

Filtres passe-bas. On utilise les filtres passe-bas pour réduire l amplitude des composantes de fréquences supérieures à la celle de la coupure.

Filtres passe-bas. On utilise les filtres passe-bas pour réduire l amplitude des composantes de fréquences supérieures à la celle de la coupure. Filtres passe-bas Ce court document expose les principes des filtres passe-bas, leurs caractéristiques en fréquence et leurs principales topologies. Les éléments de contenu sont : Définition du filtre

Plus en détail

Les algorithmes de base du graphisme

Les algorithmes de base du graphisme Les algorithmes de base du graphisme Table des matières 1 Traçage 2 1.1 Segments de droites......................... 2 1.1.1 Algorithmes simples.................... 3 1.1.2 Algorithmes de Bresenham (1965).............

Plus en détail

INITIATION AU LANGAGE C SUR PIC DE MICROSHIP

INITIATION AU LANGAGE C SUR PIC DE MICROSHIP COURS PROGRAMMATION INITIATION AU LANGAGE C SUR MICROCONTROLEUR PIC page 1 / 7 INITIATION AU LANGAGE C SUR PIC DE MICROSHIP I. Historique du langage C 1972 : naissance du C dans les laboratoires BELL par

Plus en détail

Cryptographie. Cours 3/8 - Chiffrement asymétrique

Cryptographie. Cours 3/8 - Chiffrement asymétrique Cryptographie Cours 3/8 - Chiffrement asymétrique Plan du cours Différents types de cryptographie Cryptographie à clé publique Motivation Applications, caractéristiques Exemples: ElGamal, RSA Faiblesses,

Plus en détail

Évaluation de la régression bornée

Évaluation de la régression bornée Thierry Foucart UMR 6086, Université de Poitiers, S P 2 M I, bd 3 téléport 2 BP 179, 86960 Futuroscope, Cedex FRANCE Résumé. le modèle linéaire est très fréquemment utilisé en statistique et particulièrement

Plus en détail

Compression Compression par dictionnaires

Compression Compression par dictionnaires Compression Compression par dictionnaires E. Jeandel Emmanuel.Jeandel at lif.univ-mrs.fr E. Jeandel, Lif CompressionCompression par dictionnaires 1/25 Compression par dictionnaire Principe : Avoir une

Plus en détail

Triangles isométriques Triangles semblables

Triangles isométriques Triangles semblables Triangles isométriques Triangles semblables Les transformations du plan ont permis de dégager des propriétés de figures superposables. Le théorème de Thalès a permis de s initier aux notions de réduction

Plus en détail

Résolution d équations non linéaires

Résolution d équations non linéaires Analyse Numérique Résolution d équations non linéaires Said EL HAJJI et Touria GHEMIRES Université Mohammed V - Agdal. Faculté des Sciences Département de Mathématiques. Laboratoire de Mathématiques, Informatique

Plus en détail

Leica Application Suite

Leica Application Suite Leica Application Suite Macro Editor et Macro Runner (Éditeur de macros et Exécuteur de macros) Personnalisées et automatisées 2 Les instructions peuvent être momentanément suspendues» de manière optionnelle

Plus en détail

Utilisation d informations visuelles dynamiques en asservissement visuel Armel Crétual IRISA, projet TEMIS puis VISTA L asservissement visuel géométrique Principe : Réalisation d une tâche robotique par

Plus en détail

Optimisation de la compression fractale D images basée sur les réseaux de neurones

Optimisation de la compression fractale D images basée sur les réseaux de neurones Optimisation de la compression fractale D images basée sur les réseaux de neurones D r BOUKELIF Aoued Communication Networks,Architectures and Mutimedia laboratory University of S.B.A aoued@hotmail.com

Plus en détail

Programmation linéaire

Programmation linéaire Programmation linéaire DIDIER MAQUIN Ecole Nationale Supérieure d Electricité et de Mécanique Institut National Polytechnique de Lorraine Mathématiques discrètes cours de 2ème année Programmation linéaire

Plus en détail

Enseignement secondaire technique

Enseignement secondaire technique Enseignement secondaire technique Régime technique Division technique générale Cycle moyen Informatique 11TG Nombre de leçons: 2.0 Nombre minimal de devoirs: - Langue véhiculaire: / Remarque générale:

Plus en détail

Logiciel Libre Cours 3 Fondements: Génie Logiciel

Logiciel Libre Cours 3 Fondements: Génie Logiciel Logiciel Libre Cours 3 Fondements: Génie Logiciel Stefano Zacchiroli zack@pps.univ-paris-diderot.fr Laboratoire PPS, Université Paris Diderot 2013 2014 URL http://upsilon.cc/zack/teaching/1314/freesoftware/

Plus en détail

Pourquoi l apprentissage?

Pourquoi l apprentissage? Pourquoi l apprentissage? Les SE sont basés sur la possibilité d extraire la connaissance d un expert sous forme de règles. Dépend fortement de la capacité à extraire et formaliser ces connaissances. Apprentissage

Plus en détail

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications A. Optimisation sans contrainte.... Généralités.... Condition nécessaire et condition suffisante

Plus en détail

Correction de l examen de la première session

Correction de l examen de la première session de l examen de la première session Julian Tugaut, Franck Licini, Didier Vincent Si vous trouvez des erreurs de Français ou de mathématiques ou bien si vous avez des questions et/ou des suggestions, envoyez-moi

Plus en détail

UE Programmation Impérative Licence 2ème Année 2014 2015

UE Programmation Impérative Licence 2ème Année 2014 2015 UE Programmation Impérative Licence 2 ème Année 2014 2015 Informations pratiques Équipe Pédagogique Florence Cloppet Neilze Dorta Nicolas Loménie prenom.nom@mi.parisdescartes.fr 2 Programmation Impérative

Plus en détail

Cours 02 : Problème général de la programmation linéaire

Cours 02 : Problème général de la programmation linéaire Cours 02 : Problème général de la programmation linéaire Cours 02 : Problème général de la Programmation Linéaire. 5 . Introduction Un programme linéaire s'écrit sous la forme suivante. MinZ(ou maxw) =

Plus en détail

Baccalauréat L spécialité, Métropole et Réunion, 19 juin 2009 Corrigé.

Baccalauréat L spécialité, Métropole et Réunion, 19 juin 2009 Corrigé. Baccalauréat L spécialité, Métropole et Réunion, 19 juin 2009 Corrigé. L usage d une calculatrice est autorisé Durée : 3heures Deux annexes sont à rendre avec la copie. Exercice 1 5 points 1_ Soit f la

Plus en détail

Exo7. Calculs de déterminants. Fiche corrigée par Arnaud Bodin. Exercice 1 Calculer les déterminants des matrices suivantes : Exercice 2.

Exo7. Calculs de déterminants. Fiche corrigée par Arnaud Bodin. Exercice 1 Calculer les déterminants des matrices suivantes : Exercice 2. Eo7 Calculs de déterminants Fiche corrigée par Arnaud Bodin Eercice Calculer les déterminants des matrices suivantes : Correction Vidéo ( ) 0 6 7 3 4 5 8 4 5 6 0 3 4 5 5 6 7 0 3 5 4 3 0 3 0 0 3 0 0 0 3

Plus en détail

Differential Synchronization

Differential Synchronization Differential Synchronization Neil Fraser Google 2009 BENA Pierrick CLEMENT Lucien DIARRA Thiemoko 2 Plan Introduction Stratégies de synchronisation Synchronisation différentielle Vue d ensemble Dual Shadow

Plus en détail

CONCOURS DE L AGRÉGATION INTERNE «ÉCONOMIE ET GESTION» SESSION 2015 SECONDE ÉPREUVE

CONCOURS DE L AGRÉGATION INTERNE «ÉCONOMIE ET GESTION» SESSION 2015 SECONDE ÉPREUVE CONCOURS DE L AGRÉGATION INTERNE «ÉCONOMIE ET GESTION» SESSION 2015 SECONDE ÉPREUVE Épreuve de cas pratique dans la spécialité correspondant à l'option choisie par le candidat Option D Durée de préparation

Plus en détail

L évaluation de la performance de la communication media

L évaluation de la performance de la communication media L évaluation de la performance de la communication media Pascal ROOS Enseignant en BTS Management des Unités Commerciales Lycée Edmond Rostand, Saint Ouen l Aumône (95) «Je sais qu un dollar de publicité

Plus en détail

Modélisation et Simulation

Modélisation et Simulation Cours de modélisation et simulation p. 1/64 Modélisation et Simulation G. Bontempi Département d Informatique Boulevard de Triomphe - CP 212 http://www.ulb.ac.be/di Cours de modélisation et simulation

Plus en détail

6. Hachage. Accès aux données d'une table avec un temps constant Utilisation d'une fonction pour le calcul d'adresses

6. Hachage. Accès aux données d'une table avec un temps constant Utilisation d'une fonction pour le calcul d'adresses 6. Hachage Accès aux données d'une table avec un temps constant Utilisation d'une fonction pour le calcul d'adresses PLAN Définition Fonctions de Hachage Méthodes de résolution de collisions Estimation

Plus en détail

Utilisation du site de retours Lexibook

Utilisation du site de retours Lexibook 1 Utilisation du site de retours Lexibook Se connecter au site 2 Remplir une demande de retour 3 Soumettre une demande de retour 4 Sauvegarder une demande de retour 4 Vérifier la validation d une demande

Plus en détail