Scores d alignement Matrices de substitution. J.S. Bernardes/H. Richard
|
|
- Gautier Larouche
- il y a 6 ans
- Total affichages :
Transcription
1 Scores d alignement Matrices de substitution J.S. Bernardes/H. Richard
2 Score d'un alignement Score alignement = Σ scores événements élémentaires (Match, Mismatch, Indel) Amélioration du modèle : pénalité linéaire des gaps (gap open et gap extend) Amélioration du modèle : les matrices de substitution (= Mismatch) => toutes les substitutions ne sont pas équivalentes et donc pénalisées différemment
3 Les matrices de substitution des acides nucléiques Alphabet à 4 lettres : A,C,G,T Matrice identité => pas d'amélioration du modèle, non adapté à l'évolution des séq nucléiques Matrice transition/transvertion => pénalise davantage les transversions (purines <=> pyrimidines) que les transitions (pur <=> pur, pyr <=> pyr) A C G T A C G T A C G T A C G T
4 Les matrices de substitution des acides aminés Au cours de l évolution: Des acides aminés sont remplacés «préférentiellement» par d autres Ils possèdent par exemple des propriétés physico-chimiques proches Des acides aminés sont plus conservés que d autres Ils sont par exemple essentiels dans la structure 3D des protéines (comme Tryptophane/W/Trp)
5 Les matrices de substitution des acides aminés Matrices basées sur les propriétés physico-chimique des aa o matrices d'hydrophobicité o matrices des structures secondaires o matrices basées sur comparaisons de protéines partagent la même structure 3-D Matrices basées sur les substitutions entre aa au cours de l'évolution Les «log odds» : Sij = log [ qij / (pi.pj) ] qij = probabilité de la substitution i vers j pi = probabilité normalisée d apparition du résidu i pj = probabilité normalisée d apparition du résidu j
6 Matrix Blosum exemple A! B! B! C! A! C! A! C! B! B! A! C! A! B! A! B! A! C! C! A! B! C! B! C! A ={A,B,C}! Fréquence de chaque pair de aa pour chaque colonne k k fii=! k fij=! Ou ni est le nombre d observations du residue i dans la colonne k
7 Fréquence de chaque pair de aa pour chaque colonne k A! B! B! C! A! C! A! C! B! B! A! C! A! B! A! B! A! C! C! A! B! C! B! C! k fii=! k fij=! Premiere colonne k=1 AA 3 AB 0 AC 3 BB 0 BC 0 CC 0
8 Matrix Blosum exemple A! B! B! C! A! C! A! C! B! B! A! C! A! B! A! B! A! C! C! A! B! C! B! C! k fii=! k fij=! A ={A,B,C}! k=1 k=2 k=3 k=4 k=5 k=6 AA AB AC BB BC CC
9 Somme des fréquences de chaque pair pour toutes les colonnes A! B! B! C! A! C! fij=! k fij! A! C! B! B! A! C! A! B! A! B! A! C! C! A! B! C! B! C! k fii=! k fij=! k=1 k=2 k=3 k=4 k=5 k=6 fij AA AB AC BB BC CC
10 Normalise pour avoir la somme 1 T=! T=! 6*4*(4-1) 2 = 36 k=1 k=2 k=3 k=4 k=5 k=6 fij AA AB AC BB BC CC
11 Normalisé pour avoir une somme 1 T=! 36 f k=1 k=2 k=3 k=4 k=5 k=6 fij qij AA AB AC BB BC CC
12 Calcul du dénominateur pi Sij = log [ qij / (pi.pj) ] pa = qaa+ (qab + qac)/2 pa = ( )/2 = k=1 k=2 k=3 k=4 k=5 k=6 fij qij AA pb = 0.33 pc = AB AC BB BC CC
13 Calcul du dénominateur pi Sij = log [ qij / (eij) ] eij = pi 2 eij = 2pipj si i=j si i!= j pa = pb = 0.33 SAA = log [ qaa / (eaa) ] SAA = log [ 0.16 / (pa) 2 ] qij pc = SAB= log [ qab / 2(pA*pB) ] AA 0.16 A B C AB 0.22 A 0,599! AC 0.11 B 0,036! 0,36! BB 0.14 C -0.94! -0,422! 0,85! BC 0.16 CC 0.19
14 Les matrices de substitution des acides aminés Pénalités des Substitutions : Sij > 0 <=> remplacement considéré fréquent Sij < 0 <=> remplacement rare, peu probable entre protéines homologues
15 Les matrices de substitution des acides aminés Les matrices sont construites à partir de l'observation des fréquences de substitution entre séquences «apparentées» o Estimer le taux de substitution sur des positions conservées. Matrices PAM = Point Accepted Mutation (Dayhoff 1979) Matrices BLOSUM = BLOcks SUbstitution Matrix (Henikoff & Henikoff 1992)
16 Les matrices BLOSUM A partir de Blocs = alignement multiple local sans insertiondélétion pour une famille de protéines Calcul des scores Sij = log [ qij / (pi.pj) ] ~2000 blocs, 500 familles de protéines
17 Les matrices BLOSUM Regroupement des séquences au sein de leur bloc Regroupement en fonction d un seuil d identité Seuil = 80% <=> BLOSUM80 Seuil = 60% <=> BLOSUM60 Calcul des scores par cluster => diminue la redondance liée au nombre de paires identiques (sur-représentation de certaines séquences par exemple)
18 BLOSUM 62
19 Alignement des deux séquences protéiques RDISLVKNAGI et RNILVSDAKNVGI avec «BLOSUM 62» Correspondance et Substitution: cf. BLOSUM, Indel: -5 RDISLV---KNAGI RNI-LVSDAKNVGI Score = = 19
20 Les matrices PAM (Point Accepted Mutations) Deux séquences S1 et S2 sont à une unité PAM si plusieurs mutations ponctuelles ont transformé S1 en S2 avec en moyenne une mutation pour 100 aa. Idée: Dériver les matrices pour PAM-1 o On extrapole avec un modèle de mutation pour les distances plus longues.
21 Les matrices PAM Basées sur alignement multiple global de séquences très similaires (>85% identité), mutations dites acceptées car ne changent pas significativement la fonction de la protéine. 1) alignement de séquences (71 familles de protéines (1300 séquences)) 2) Comptage des substitutions sur un arbre phylogénétique des séquences A ij 3) Calcul mutabilité : m i = Σ j A ij /f i (pour chaque aa i, f i fréquence d'apparition) 4) Calcul des scores R ij =M ij /f i avec M ij =m i A ij /Σ i A ij et Normalisation tq ΣR ij =1 => matrices de mutation MDM-1 (Mutation Data Matrix) 5) Extrapolation pour séquences plus éloignées MDM-n = (MDM-1)^n (PAM-1 = 1 mutation acceptée pour 100 résidus) 6) Transformation en matrice «log odds» : PAM-n = log(ndm-n)
22 Matrice PAM Point Accepted Mutation Extrapolation «1àn» basée sur hypothèse forte que le «taux de mutation» est constant et équiprobable sur toute la longueur des séquences et au cours du temps néglige les différences mutations courtes / mutations longues PAM-1 fait environ 1 million d années d évolution Biais d échantillonnage : 1978 : ensemble des séquences pas représentatif (1300 séquences, 71 familles) 1992 : réactualisation : séquences, familles
23 PAM 10
24 Matrices PAM Choix de la matrice N en fonction de l évolution supposée des séquences Plus «N» est élevé, plus la matrice est adaptée à la comparaison de séquences divergentes Si la divergence n est pas connue (ce qui est généralement le cas), il faut faire plusieurs essais PAM-n n est pas n différences pour 100 aa. un aa peut être substitué plusieurs fois En général on utilise PAM-250
25 Matrice BLOSUM Choix de la matrice N en fonction du pourcentage d identité supposé des séquences Plus «N» est élevé, plus la matrice est adaptée à la comparaison de séquences de forte identité Si l identité n est pas connue (ce qui est généralement le cas), faire plusieurs essais
26 Quelle matrice de score utiliser? «Faible divergence/forte identité» : PAM 40 ou BLOSUM 80 «Moyenne divergence/moyenne identité»: PAM 120 ou BLOSUM 62 «Forte divergence/faible identité» : PAM 250 ou BLOSUM 45 Il n y a pas de matrice parfaite!
27 PAM et BLOSUM Hypothèse circulaire: o On utilise un alignement de séquence pour décider comment mettre en place la fonction de score. PAM: séquences très proches (plus sûr à aligner) BLOSUM: en pratique plusieurs (3) itérations d alignement sont faites Distance d évolution: o o PAM extrapole à partir d une distance courte BLOSUM estime avec une étape de regroupement à un % de similarité fixé
28 Significativité d un alignement
29 Significativité d un alignement Imaginons qu on aligne!vivalasvegas!!vivada-v--is! avec un score de 2 (match =+1, mismatch/gap = -1) Est ce que le score obtenu veut dire qu il y a une relation entre les deux séquences? o Est ce que la valeur est significativement plus grande qu attendu par hasard?
30 Significativité d un alignement Quel serait le score si on alignait deux séquences aléatoires? Génération de plusieurs séquences de même composition o Combien de fois observe-t-on une séquence avec le même score? o P-valeur de l alignement Ici 2 cas parmi 1000 simulations Distribution of Alignment Scores over 1000 Random Permutations
31 Retour a eyeless/pax score de l alignement : 437 (matrice PAM50) Quelle p-valeur? histogramme avec 1000 simulations human HSGVNQLGGVFVNGRPLPDSTRQKIVELAHSGARPCDISRILQVSNGCVSKILGRYYETGSIRPRA fly HSGVNQLGGVFVGGRPLPDSTRQKIVELAHSGARPCDISRILQVSNGCVSKILGRYYETGSIRPRA human IGGSKPRVATPEVVSKIAQYKRECPSIFAWEIRDRLLSEGVCTNDNIPSVSSINRVLRNLASEK-QQ fly IGGSKPRVATAEVVSKISQYKRECPSIFAWEIRDRLLQENVCTNDNIPSVSSINRVLRNLAAQKEQQ
32 Comment comparer une séquence contre une banque?
33 Comparaison séquence/banque Pourquoi? o o o Réunir un échantillon taxonomique (homologues) pour faire une phylogénie Annoter un génome nouvellement séquencé (fonctions putatives) Étudier une famille (consensus, domaines) Vocabulaire : o o Séquence à rechercher = Query Séquence de la banque = Subject
34 Comparaison séquence / banque Comment? o Forcément, on cherche des alignements locaux! o SW = algorithme exact qui donne l'alignement optimal Si on cherchait pour chaque «Subject» son alignement optimal avec la «Query» et puis on classerait par score Problème : o o Si 1 alignement SW prend 15 ms Banque SwissProt (> entrées) prend 2h => Trop lent! Il faut trouver des heuristiques, indexer les séquences
35 BLAST: Basic Local Alignement Search Tool BLAST : o o o Altschul & al., 1990 est une heuristique qui recherche dans une banque les séquences (Subject) présentant une bonne similarité locale avec une séquence requête (Query) Assigne un score et une espérance à chaque couple Query-Subject Optimise le temps de recherche au détriment de la sensibilité et de la précision de l'alignement BLAST n'est pas un programme d'alignement optimal de séquences!
36 Blast : Basic Local Alignment Search Tool 3 grandes étapes : 1. Identifier les k-mots «similaires» w de taille k pour les nuc, k=10 ou 11 / pour les aa, k=3 ou 4 2. Création des High Scoring Segment Pairs (HSPs) a) Etendre l'alignement (sans indel) de chaque côté de w tant que le score cumulé est M (seuil fixé) => HSPs b) Eventuellement rassembler les HSPs 3. Evaluation statistique des segments similaires obtenus
37 Blast: étape 0 Indexation de la banque (parcours 1 seule fois la banque!) Banque : >PrSub1 EKFKAAMLLKSDTRCLGYRNVCKEG >PrSub2 YYDDVGLLCEKADTRALMAQFVPPL >PrSub3 SACILSTVNHSILKKSVHCLGYRSV
38 Blast: étape 0 Indexation de la banque (parcours 1 seule fois la banque!) Banque : k=5 Index : >PrSub1 EKFKAAMLLKSDTRCLGYRNVCKEG >PrSub2 YYDDVGLLCEKADTRALMAQFVPPL >PrSub3 SACILSTVNHSILKKSVHCLGYRSV EKFKA PrSub1 1
39 Blast: étape 0 Indexation de la banque (parcours 1 seule fois la banque!) Banque : k=5 Index : >PrSub1 EKFKAAMLLKSDTRCLGYRNVCKEG >PrSub2 YYDDVGLLCEKADTRALMAQFVPPL >PrSub3 SACILSTVNHSILKKSVHCLGYRSV EKFKA PrSub1 1 KFKAA PrSub1 2
40 Blast: étape 0 Indexation de la banque (parcours 1 seule fois la banque!) Banque : k=5 Index : >PrSub1 EKFKAAMLLKSDTRCLGYRNVCKEG >PrSub2 YYDDVGLLCEKADTRALMAQFVPPL >PrSub3 SACILSTVNHSILKKSVHCLGYRSV EKFKA PrSub1 1 KFKAA PrSub1 2 FKAAM PrSub1 3
41 Blast: étape 0 Indexation de la banque (parcours 1 seule fois la banque!) Banque : k=5 Index : >PrSub1 EKFKAAMLLKSDTRCLGYRNVCKEG >PrSub2 YYDDVGLLCEKADTRALMAQFVPPL >PrSub3 SACILSTVNHSILKKSVHCLGYRSV EKFKA PrSub1 1 KFKAA PrSub1 2 FKAAM PrSub1 3 CLGYR PrSub1 15
42 Blast: étape 0 Indexation de la banque (parcours 1 seule fois la banque!) Banque : k=5 Index : >PrSub1 EKFKAAMLLKSDTRCLGYRNVCKEG >PrSub2 YYDDVGLLCEKADTRALMAQFVPPL >PrSub3 SACILSTVNHSILKKSVHCLGYRSV EKFKA PrSub1 1 KFKAA PrSub1 2 FKAAM PrSub CLGYR PrSub1 15 PrSub
43 Blast: étape 0 Indexation de la banque (parcours 1 seule fois la banque!) Index : EKFKA PrSub1 1 KFKAA PrSub1 2 Tri FKAAM PrSub1 3 CLGYR PrSub CLGYR PrSub1 15 PrSub Le tri de l'index ainsi créé (table de hachage) optimise le temps de recherche Index trié : AAMLL PrSub1 5 ACILS PrSub CILST PrSub3 3 CLGYR PrSub1 15 PrSub3 19 DDVGL PrSub2 3 DTRAL PrSub2 13 DTRCL PrSub KSDTR PrSub1 10 KSVHC PrSub3 15 etc.
44 Blast: étape 1 Recherche des mots de la Query dans l'index de la banque Query k=5 Index trié : >ProtQ SKCDKSDTRALLAQYIPSTVNHPIL AAMLL PrSub1 5 ACILS PrSub CILST PrSub3 3 CLGYR PrSub1 15 PrSub3 19 DDVGL PrSub2 3 DTRAL PrSub2 13 DTRCL PrSub KSDTR PrSub1 10 KSVHC PrSub3 15 etc.
45 Blast: étape 1 Recherche des mots de la Query dans l'index de la banque Query k=5 Index trié : >ProtQ SKCDKSDTRALLAQYIPSTVNHPIL SKCDK => 0 AAMLL PrSub1 5 ACILS PrSub CILST PrSub3 3 CLGYR PrSub1 15 PrSub3 19 DDVGL PrSub2 3 DTRAL PrSub2 13 DTRCL PrSub KSDTR PrSub1 10 KSVHC PrSub3 15 etc.
46 Blast: étape 1 Recherche des mots de la Query dans l'index de la banque Query >ProtQ SKCDKSDTRALLAQYIPSTVNHPIL SKCDK => 0 KCDKS => 0 Index trié : AAMLL PrSub1 5 ACILS PrSub CILST PrSub3 3 CLGYR PrSub1 15 PrSub3 19 DDVGL PrSub2 3 DTRAL PrSub2 13 DTRCL PrSub KSDTR PrSub1 10 KSVHC PrSub3 15 etc.
47 Blast: étape 1 Recherche des mots de la Query dans l'index de la banque Query >ProtQ SKCDKSDTRALLAQYIPSTVNHPIL SKCDK => 0 KCDKS => 0 Index trié : AAMLL PrSub1 5 ACILS PrSub CILST PrSub3 3 CLGYR PrSub1 15 PrSub3 19 DDVGL PrSub2 3 DTRAL PrSub2 13 DTRCL PrSub KSDTR PrSub1 10 KSVHC PrSub3 15 etc.
48 Blast: étape 1 Recherche des mots de la Query dans l'index de la banque Query >ProtQ SKCDKSDTRALLAQYIPSTVNHPIL SKCDK => 0 KCDKS => 0 CDKSD => 0 Index trié : AAMLL PrSub1 5 ACILS PrSub CILST PrSub3 3 CLGYR PrSub1 15 PrSub3 19 DDVGL PrSub2 3 DTRAL PrSub2 13 DTRCL PrSub KSDTR PrSub1 10 KSVHC PrSub3 15 etc.
49 Blast: étape 1 Recherche des mots de la Query dans l'index de la banque Query >ProtQ SKCDKSDTRALLAQYIPSTVNHPIL SKCDK => 0 KCDKS => 0 CDKSD => 0 DKSDT => 0 Index trié : AAMLL PrSub1 5 ACILS PrSub CILST PrSub3 3 CLGYR PrSub1 15 PrSub3 19 DDVGL PrSub2 3 DTRAL PrSub2 13 DTRCL PrSub KSDTR PrSub1 10 KSVHC PrSub3 15 etc.
50 Blast: étape 1 Recherche des mots de la Query dans l'index de la banque Query >ProtQ SKCDKSDTRALLAQYIPSTVNHPIL SKCDK => 0 KCDKS => 0 CDKSD => 0 DKSDT => 0 KSDTR => PrSub1 10 SKCDKSDTRALLAQYIPSTVNHPIL EKFKAAMLLKSDTRCLGYRNVCKEG Index trié : AAMLL PrSub1 5 ACILS PrSub CILST PrSub3 3 CLGYR PrSub1 15 PrSub3 19 DDVGL PrSub2 3 DTRAL PrSub2 13 DTRCL PrSub KSDTR PrSub1 10 KSVHC PrSub3 15 etc.
51 Blast: étape 1 Recherche des mots de la Query dans l'index de la banque Query >ProtQ SKCDKSDTRALLAQYIPSTVNHPIL SKCDK => 0 KCDKS => 0 CDKSD => 0 DKSDT => 0 KSDTR => PrSub1 10 SDTRA => 0 Index trié : AAMLL PrSub1 5 ACILS PrSub CILST PrSub3 3 CLGYR PrSub1 15 PrSub3 19 DDVGL PrSub2 3 DTRAL PrSub2 13 DTRCL PrSub KSDTR PrSub1 10 KSVHC PrSub3 15 etc.
52 Blast: étape 1 Recherche des mots de la Query dans l'index de la banque Query >ProtQ SKCDKSDTRALLAQYIPSTVNHPIL SKCDK => 0 KCDKS => 0 CDKSD => 0 DKSDT => 0 KSDTR => PrSub1 10 SDTRA => 0 DTRAL => PrSub2 13 SKCDKSDTRALLAQYIPSTVNHPIL YYDDVGLLCEKADTRALMAQFVPPL Index trié : AAMLL PrSub1 5 ACILS PrSub CILST PrSub3 3 CLGYR PrSub1 15 PrSub3 19 DDVGL PrSub2 3 DTRAL PrSub2 13 DTRCL PrSub KSDTR PrSub1 10 KSVHC PrSub3 15 etc.
53 Blast: étape 2 Extension de l'alignement (sans indel) => HSPs Mots «similaires» de taille k=5 (en aa) L ProtQ PrSub1 SKCDKSDTRALLAQYIPSTVNHPIL EKFKAAMLLKSDTRCLGYRNVCKEG Extension du segment tant que S M (seuil fixé) ProtQ PrSub1 SKCDKSDTRALLAQYIPSTVNHPIL EKFKAAMLLKSDTRCLGYRNVCKEG ProtQ PrSub1 SKCDKSDTRALLAQYIPST AMLLKSDTRCLGYRNVCKE
54 Blast: Comment améliorer la première et la deuxième étape?
55 Blast: étape 1 Identification des k-mots «approximatifs» au lieu d'exiger k aa identiques successifs Score des k-mots T Exemple : DTRAL, T = 5 D T R A L D V R H I S= = 11 => OK D T R A L S= = -9 => NON M A T R G D T R A L S= = 8 => OK E S K S M D T R A L S= = 24 => OK D T R A L
56 Blast: étape 1 Identification des k-mots «approximatifs» au lieu d'exiger k aa identiques successifs Score des k-mots T Au lieu d'écrire dans l'index : DTRAL PrSub2 13 On pré-calcule les mots approximatifs, et on écrit : DTRAL PrSub DVRHI PrSub ESKSM PrSub (tous les 5-mots de score T) => Beaucoup de lignes d'index par mot de la banque Construction de l'index lente Recherche dans l'index longue => Sauf si k est petit!
57 Blast: étape 2 l On applique un double- critère: les séquences doivent partager 2 petits mots (au lieu d'un grand) Query Subject Query Subject trouver 2 paires de mots "voisins" PKV (s >= T) à égale distance d dans les 2 séquences (d<40)
58 Blast: étape 2 l vérifier que l'on peut étendre ces amorces pour obtenir des alignements sans gaps de score s>t Query Subject l faire l'alignement local Smith & Waterman
59 Blast: étape 3 Calcul des scores Quelle est la probabilité ( p-value ) d obtenir par hasard les HSPs effectivement obtenus? On peut approximer la probabilité d'obtenir une HSP de score S avec P(S) = e -λs On définit l'espérance E telle que : E-value = K B *l Q *e -λs où K B dépend de la taille et de la composition de la banque l Q = taille séquence Query => La E-value représente le nombre de HSPs de score S attendues au hasard dans la banque
60 Blast: étape 3 Significativité du score des HSPs La E-value représente le nombre de HSPs de score S attendu au hasard dans la banque E-value = 3 signifie «si je comparais ma séquence à une banque aléatoire de même taille et de même composition que la banque initiale, je m attendrais à trouver 3 alignements de score S» => pas significatif Plus la Evalue est petite, plus la similarité est pertinente (non due au hasard) Cette E-value dépend : Ø De la matrice de substitution (=> S et taille des HSPs) Ø De la taille et de la composition de la banque
61 BLAST : les différentes versions On veut en général masquer les séquences répétées Programmes distincts selon la nature des séquences traitées : BLASTN séquence nucléique contre base nucléique BLASTP séquence protéique contre base protéique BLASTX séquence nucléique traduite en 6 phases contre base protéique TBLASTN séquence protéique contre base nucléique traduite en 6 phases Et d'autres options/ En particulier Wu-blast, Psi-blast, etc.
62 BLAST always uses the same substitution matrix to find scores. However, a position-specific score matrix (PSSM) is more suitable. PSSM Q of a query sequence Q is a matrix (Nx20), where N is the size of Q and 20 are amino acids. PSSM Q elements contains the frequency of a amino acid in some position of query sequence. Frequencies are calculated from multiple alignments of sequences. Question: What are the differences between a substitution matrix and a position-specific scoring matrix? To answer at this question look at the scoring value for Serine residue at the positions 210 and 216. They are different.
63 Why? Serine has the different functions at the these positions. The substitutions of serine in the active site are very rare and, consequently, the costs for mutations are different. However, in a substitution matrix the scoring value of amino acids are independent of a position in a sequence.
64 PSI-BLAST - Position-Specific Iterative BLAST Query sequence 1st iteration seq1 seq2 PSSM 1 seqn seq1 seq2 PSSM 2 2nd iteration Sequence database seqm 3th iteration seq1 seq2 PSSM 2 seqm Convergence
65 1 st iteration Run the default BLAST by using the default substitution matrix (BLOSUM62) and the query sequence Q 1. Build the MSA 1 from the best sequences found. Build the PSSM 1 from MSA 1. 2 nd iteration Compare Q 1 with database sequences by using a modified BLAST version, that is, the default substitution matrix is replaced with the PSSM 1. Build a new MSA 2 from the best sequences found. Build the PSSM 2 from MSA 2. Stop if PSSM 1 = PSSM 2 3 th iteration (if not stopped) Compare Q 1 with database sequences by using PSSM 2. Build a new MSA 3 from the best sequences found. Build the PSSM 3 from MSA 3. Stop if PSSM 2 = PSSM 3
66 BLAST et associés BLAST permet de faire des recherches de séquences (query) contre une base de donnée (subject) o Heuristique de début d alignement Psi-BLAST permet de détecter des homologies lointaines o apprend avec les alignements successifs les positions importantes de la séquence query
La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST.
La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST. Gaël Le Mahec - p. 1/12 L algorithme BLAST. Basic Local Alignment Search Tool est un algorithme de recherche
Plus en détailBig data et sciences du Vivant L'exemple du séquençage haut débit
Big data et sciences du Vivant L'exemple du séquençage haut débit C. Gaspin, C. Hoede, C. Klopp, D. Laborie, J. Mariette, C. Noirot, MS. Trotard bioinfo@genopole.toulouse.inra.fr INRA - MIAT - Plate-forme
Plus en détailIdentification de nouveaux membres dans des familles d'interleukines
Identification de nouveaux membres dans des familles d'interleukines Nicolas Beaume Jérôme Mickolajczak Gérard Ramstein Yannick Jacques 1ère partie : Définition de la problématique Les familles de gènes
Plus en détailExo7. Calculs de déterminants. Fiche corrigée par Arnaud Bodin. Exercice 1 Calculer les déterminants des matrices suivantes : Exercice 2.
Eo7 Calculs de déterminants Fiche corrigée par Arnaud Bodin Eercice Calculer les déterminants des matrices suivantes : Correction Vidéo ( ) 0 6 7 3 4 5 8 4 5 6 0 3 4 5 5 6 7 0 3 5 4 3 0 3 0 0 3 0 0 0 3
Plus en détailI. Programmation I. 1 Ecrire un programme en Scilab traduisant l organigramme montré ci-après (on pourra utiliser les annexes):
Master Chimie Fondamentale et Appliquée : spécialité «Ingénierie Chimique» Examen «Programmation, Simulation des procédés» avril 2008a Nom : Prénom : groupe TD : I. Programmation I. 1 Ecrire un programme
Plus en détailFace Recognition Performance: Man vs. Machine
1 Face Recognition Performance: Man vs. Machine Andy Adler Systems and Computer Engineering Carleton University, Ottawa, Canada Are these the same person? 2 3 Same person? Yes I have just demonstrated
Plus en détailDéfinitions. Numéro à préciser. (Durée : )
Numéro à préciser (Durée : ) On étudie dans ce problème l ordre lexicographique pour les mots sur un alphabet fini et plusieurs constructions des cycles de De Bruijn. Les trois parties sont largement indépendantes.
Plus en détailIntroduc)on à Ensembl/ Biomart : Par)e pra)que
Introduc)on à Ensembl/ Biomart : Par)e pra)que Stéphanie Le Gras Jean Muller NAVIGUER DANS ENSEMBL : PARTIE PRATIQUE 2 Naviga)on dans Ensembl : Pra)que Exercice 1 1.a. Quelle est la version de l assemblage
Plus en détailPerl Orienté Objet BioPerl There is more than one way to do it
Perl Orienté Objet BioPerl There is more than one way to do it Bérénice Batut, berenice.batut@udamail.fr DUT Génie Biologique Option Bioinformatique Année 2014-2015 Perl Orienté Objet - BioPerl Rappels
Plus en détailLimitations of the Playstation 3 for High Performance Cluster Computing
Introduction Plan Limitations of the Playstation 3 for High Performance Cluster Computing July 2007 Introduction Plan Introduction Intérêts de la PS3 : rapide et puissante bon marché L utiliser pour faire
Plus en détailEXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG
Exploitations pédagogiques du tableur en STG Académie de Créteil 2006 1 EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG Commission inter-irem lycées techniques contact : dutarte@club-internet.fr La maquette
Plus en détailProject 1 Experimenting with Simple Network Management Tools. ping, traceout, and Wireshark (formerly Ethereal)
Project 1 Experimenting with Simple Network Management Tools ping, traceout, and Wireshark (formerly Ethereal) (A) (25%) Use the ping utility to determine reach-ability of several computers. To run a ping
Plus en détailMise en place d un système de cabotage maritime au sud ouest de l Ocean Indien. 10 Septembre 2012
Mise en place d un système de cabotage maritime au sud ouest de l Ocean Indien 10 Septembre 2012 Les défis de la chaine de la logistique du transport maritime Danielle T.Y WONG Director Logistics Performance
Plus en détailMapReduce. Malo Jaffré, Pablo Rauzy. 16 avril 2010 ENS. Malo Jaffré, Pablo Rauzy (ENS) MapReduce 16 avril 2010 1 / 15
MapReduce Malo Jaffré, Pablo Rauzy ENS 16 avril 2010 Malo Jaffré, Pablo Rauzy (ENS) MapReduce 16 avril 2010 1 / 15 Qu est ce que c est? Conceptuellement Données MapReduce est un framework de calcul distribué
Plus en détailPrincipe de symétrisation pour la construction d un test adaptatif
Principe de symétrisation pour la construction d un test adaptatif Cécile Durot 1 & Yves Rozenholc 2 1 UFR SEGMI, Université Paris Ouest Nanterre La Défense, France, cecile.durot@gmail.com 2 Université
Plus en détailPlus courts chemins, programmation dynamique
1 Plus courts chemins, programmation dynamique 1. Plus courts chemins à partir d un sommet 2. Plus courts chemins entre tous les sommets 3. Semi-anneau 4. Programmation dynamique 5. Applications à la bio-informatique
Plus en détailTABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie
PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats Pierre Dagnelie TABLE DES MATIÈRES 2012 Presses agronomiques de Gembloux pressesagro.gembloux@ulg.ac.be www.pressesagro.be
Plus en détailGuide d'installation rapide TFM-560X YO.13
Guide d'installation rapide TFM-560X YO.13 Table of Contents Français 1 1. Avant de commencer 1 2. Procéder à l'installation 2 Troubleshooting 6 Version 06.08.2011 16. Select Install the software automatically
Plus en détailInitiation à la programmation en Python
I-Conventions Initiation à la programmation en Python Nom : Prénom : Une commande Python sera écrite en caractère gras. Exemples : print 'Bonjour' max=input("nombre maximum autorisé :") Le résultat de
Plus en détailAPPENDIX 6 BONUS RING FORMAT
#4 EN FRANÇAIS CI-DESSOUS Preamble and Justification This motion is being presented to the membership as an alternative format for clubs to use to encourage increased entries, both in areas where the exhibitor
Plus en détailPost-processing of multimodel hydrological forecasts for the Baskatong catchment
+ Post-processing of multimodel hydrological forecasts for the Baskatong catchment Fabian Tito Arandia Martinez Marie-Amélie Boucher Jocelyn Gaudet Maria-Helena Ramos + Context n Master degree subject:
Plus en détailCorrigé des TD 1 à 5
Corrigé des TD 1 à 5 1 Premier Contact 1.1 Somme des n premiers entiers 1 (* Somme des n premiers entiers *) 2 program somme_entiers; n, i, somme: integer; 8 (* saisie du nombre n *) write( Saisissez un
Plus en détailLe signal GPS. Les horloges atomiques à bord des satellites GPS produisent une fréquence fondamentale f o = 10.23 Mhz
Le signal GPS Les horloges atomiques à bord des satellites GPS produisent une fréquence fondamentale f o = 10.23 Mhz Deux signaux en sont dérivés: L1 (fo x 154) = 1.57542 GHz, longueur d onde = 19.0 cm
Plus en détailCOMMANDES SQL... 2 COMMANDES DE DEFINITION DE DONNEES... 2
SQL Sommaire : COMMANDES SQL... 2 COMMANDES DE DEFINITION DE DONNEES... 2 COMMANDES DE MANIPULATION DE DONNEES... 2 COMMANDES DE CONTROLE TRANSACTIONNEL... 2 COMMANDES DE REQUETE DE DONNEES... 2 COMMANDES
Plus en détailM2-Images. Rendu Temps Réel - OpenGL 4 et compute shaders. J.C. Iehl. December 18, 2013
Rendu Temps Réel - OpenGL 4 et compute shaders December 18, 2013 résumé des épisodes précédents... création des objets opengl, organisation des données, configuration du pipeline, draw,... opengl 4.3 :
Plus en détailTP11 - Administration/Tuning
TP11 - Administration/Tuning MIAGE #3-2006/2007 January 9, 2007 1 Architecture physique d une base Oracle 1.1 La structure physique Une base de données Oracle est composé de fichiers (au sens du système
Plus en détailOptimisation Combinatoire (Méthodes approchées) II. Recherche Locale simple (Les bases)
Optimisation Combinatoire (Méthodes approchées) II. Recherche Locale simple (Les bases) Heuristique Constructive Itérativement, ajoute de nouvelles composantes à une solution partielle candidate Espace
Plus en détailProbabilités. I Petits rappels sur le vocabulaire des ensembles 2 I.1 Définitions... 2 I.2 Propriétés... 2
Probabilités Table des matières I Petits rappels sur le vocabulaire des ensembles 2 I.1 s................................................... 2 I.2 Propriétés...................................................
Plus en détail1 Modélisation d être mauvais payeur
1 Modélisation d être mauvais payeur 1.1 Description Cet exercice est très largement inspiré d un document que M. Grégoire de Lassence de la société SAS m a transmis. Il est intitulé Guide de démarrage
Plus en détailBNP Paribas Personal Finance
BNP Paribas Personal Finance Financially fragile loan holder prevention program CUSTOMERS IN DIFFICULTY: QUICKER IDENTIFICATION MEANS BETTER SUPPORT Brussels, December 12th 2014 Why BNPP PF has developed
Plus en détailphysicien diplômé EPFZ originaire de France présentée acceptée sur proposition Thèse no. 7178
Thèse no. 7178 PROBLEMES D'OPTIMISATION DANS LES SYSTEMES DE CHAUFFAGE A DISTANCE présentée à l'ecole POLYTECHNIQUE FEDERALE DE ZURICH pour l'obtention du titre de Docteur es sciences naturelles par Alain
Plus en détailLES DECIMALES DE π BERNARD EGGER
LES DECIMALES DE π BERNARD EGGER La génération de suites de nombres pseudo aléatoires est un enjeu essentiel pour la simulation. Si comme le dit B Ycard dans le cours écrit pour le logiciel SEL, «Paradoxalement,
Plus en détailEncryptions, compression et partitionnement des données
Encryptions, compression et partitionnement des données Version 1.0 Grégory CASANOVA 2 Compression, encryption et partitionnement des données Sommaire 1 Introduction... 3 2 Encryption transparente des
Plus en détailGrégoire de Lassence. Copyright 2006, SAS Institute Inc. All rights reserved.
Grégoire de Lassence 1 Grégoire de Lassence Responsable Pédagogie et Recherche Département Académique Tel : +33 1 60 62 12 19 gregoire.delassence@fra.sas.com http://www.sas.com/france/academic SAS dans
Plus en détailPerformances. Gestion des serveurs (2/2) Clustering. Grid Computing
Présentation d Oracle 10g Chapitre VII Présentation d ORACLE 10g 7.1 Nouvelles fonctionnalités 7.2 Architecture d Oracle 10g 7.3 Outils annexes 7.4 Conclusions 7.1 Nouvelles fonctionnalités Gestion des
Plus en détailHow to Login to Career Page
How to Login to Career Page BASF Canada July 2013 To view this instruction manual in French, please scroll down to page 16 1 Job Postings How to Login/Create your Profile/Sign Up for Job Posting Notifications
Plus en détailL impact des délais de paiement et des solutions appropriées. Dominique Geenens Intrum Justitia
L impact des délais de paiement et des solutions appropriées Dominique Geenens Intrum Justitia Groupe Intrum Justitia Leader du marché en gestion de crédit Entreprise européenne dynamique avec siège principal
Plus en détailProbabilités sur un univers fini
[http://mp.cpgedupuydelome.fr] édité le 7 août 204 Enoncés Probabilités sur un univers fini Evènements et langage ensembliste A quelle condition sur (a, b, c, d) ]0, [ 4 existe-t-il une probabilité P sur
Plus en détailEditing and managing Systems engineering processes at Snecma
Editing and managing Systems engineering processes at Snecma Atego workshop 2014-04-03 Ce document et les informations qu il contient sont la propriété de Ils ne doivent pas être copiés ni communiqués
Plus en détailObjectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique
Objectifs Clustering On ne sait pas ce qu on veut trouver : on laisse l algorithme nous proposer un modèle. On pense qu il existe des similarités entre les exemples. Qui se ressemble s assemble p. /55
Plus en détailCLIM/GTP/27/8 ANNEX III/ANNEXE III. Category 1 New indications/ 1 re catégorie Nouvelles indications
ANNEX III/ANNEXE III PROPOSALS FOR CHANGES TO THE NINTH EDITION OF THE NICE CLASSIFICATION CONCERNING AMUSEMENT APPARATUS OR APPARATUS FOR GAMES/ PROPOSITIONS DE CHANGEMENTS À APPORTER À LA NEUVIÈME ÉDITION
Plus en détailComment Créer une Base de Données Ab Initio
Comment Créer une Base de Données Ab Initio Diffusé par Le Projet Documentation OpenOffice.org Table des Matières 1. Création de la Source de Données...3 2. Ajout de Tables dans une Source de Données...3
Plus en détailThe assessment of professional/vocational skills Le bilan de compétences professionnelles
The assessment of professional/vocational skills Le bilan de compétences professionnelles 03/06/13 WHAT? QUOI? Subject Sujet The assessment of professional/vocational skills (3 hours) Bilan de compétences
Plus en détailScénarios économiques en assurance
Motivation et plan du cours Galea & Associés ISFA - Université Lyon 1 ptherond@galea-associes.eu pierre@therond.fr 18 octobre 2013 Motivation Les nouveaux référentiels prudentiel et d'information nancière
Plus en détailAGROBASE : un système de gestion de données expérimentales
AGROBASE : un système de gestion de données expérimentales Daniel Wallach, Jean-Pierre RELLIER To cite this version: Daniel Wallach, Jean-Pierre RELLIER. AGROBASE : un système de gestion de données expérimentales.
Plus en détailL exclusion mutuelle distribuée
L exclusion mutuelle distribuée L algorithme de L Amport L algorithme est basé sur 2 concepts : L estampillage des messages La distribution d une file d attente sur l ensemble des sites du système distribué
Plus en détailLES GENERATEURS DE NOMBRES ALEATOIRES
LES GENERATEURS DE NOMBRES ALEATOIRES 1 Ce travail a deux objectifs : ====================================================================== 1. Comprendre ce que font les générateurs de nombres aléatoires
Plus en détailBig Data et Graphes : Quelques pistes de recherche
Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci http://liris.cnrs.fr/hamamache.kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de
Plus en détailLa solution idéale de personnalisation interactive sur internet
FACTORY121 Product Configurator (summary) La solution idéale de personnalisation interactive sur internet FACTORY121 cité comme référence en «Mass Customization» au MIT et sur «mass-customization.de» Specifications
Plus en détailTier 1 / Tier 2 relations: Are the roles changing?
Tier 1 / Tier 2 relations: Are the roles changing? Alexandre Loire A.L.F.A Project Manager July, 5th 2007 1. Changes to roles in customer/supplier relations a - Distribution Channels Activities End customer
Plus en détailQuick Start Guide This guide is intended to get you started with Rational ClearCase or Rational ClearCase MultiSite.
Rational ClearCase or ClearCase MultiSite Version 7.0.1 Quick Start Guide This guide is intended to get you started with Rational ClearCase or Rational ClearCase MultiSite. Product Overview IBM Rational
Plus en détailInstructions Mozilla Thunderbird Page 1
Instructions Mozilla Thunderbird Page 1 Instructions Mozilla Thunderbird Ce manuel est écrit pour les utilisateurs qui font déjà configurer un compte de courrier électronique dans Mozilla Thunderbird et
Plus en détailComprendre l impact de l utilisation des réseaux sociaux en entreprise SYNTHESE DES RESULTATS : EUROPE ET FRANCE
Comprendre l impact de l utilisation des réseaux sociaux en entreprise SYNTHESE DES RESULTATS : EUROPE ET FRANCE 1 Objectifs de l étude Comprendre l impact des réseaux sociaux externes ( Facebook, LinkedIn,
Plus en détailBases de données réparties: Fragmentation et allocation
Pourquoi une base de données distribuée? Bibliographie Patrick Valduriez, S. Ceri, Guiseppe Delagatti Bases de données réparties: Fragmentation et allocation 1 - Introduction inventés à la fin des années
Plus en détailChristophe CANDILLIER Cours de DataMining mars 2004 Page 1
Christophe CANDILLIER Cours de DataMining mars 2004 age 1 1. Introduction 2. rocessus du DataMining 3. Analyse des données en DataMining 4. Analyse en Ligne OLA 5. Logiciels 6. Bibliographie Christophe
Plus en détailMCMC et approximations en champ moyen pour les modèles de Markov
MCMC et approximations en champ moyen pour les modèles de Markov Gersende FORT LTCI CNRS - TELECOM ParisTech En collaboration avec Florence FORBES (Projet MISTIS, INRIA Rhône-Alpes). Basé sur l article:
Plus en détailProgrammation parallèle et distribuée
Programmation parallèle et distribuée (GIF-4104/7104) 5a - (hiver 2015) Marc Parizeau, Département de génie électrique et de génie informatique Plan Données massives («big data») Architecture Hadoop distribution
Plus en détailIntroduction à MapReduce/Hadoop et Spark
1 / 36 Introduction à MapReduce/Hadoop et Spark Certificat Big Data Ludovic Denoyer et Sylvain Lamprier UPMC Plan 2 / 36 Contexte 3 / 36 Contexte 4 / 36 Data driven science: le 4e paradigme (Jim Gray -
Plus en détailTable des matières PRESENTATION DU LANGAGE DS2 ET DE SES APPLICATIONS. Introduction
PRESENTATION DU LANGAGE DS2 ET DE SES APPLICATIONS Depuis SAS 9.2 TS2M3, SAS propose un nouveau langage de programmation permettant de créer et gérer des tables SAS : le DS2 («Data Step 2»). Ces nouveautés
Plus en détailComment Accéder à des Bases de Données MySQL avec Windows lorqu'elles sont sur un Serveur Linux
Comment Accéder à des Bases de Données MySQL avec Windows lorqu'elles sont sur un Serveur Linux Distribué par Le Projet Documentation d'openoffice.org Table of Contents 1) Préambule...3 2) Télécharger
Plus en détailESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring
ESSEC Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring Les méthodes d évaluation du risque de crédit pour les PME et les ménages Caractéristiques Comme les montants des crédits et des
Plus en détailVI. Tests non paramétriques sur un échantillon
VI. Tests non paramétriques sur un échantillon Le modèle n est pas un modèle paramétrique «TESTS du CHI-DEUX» : VI.1. Test d ajustement à une loi donnée VI.. Test d indépendance de deux facteurs 96 Différentes
Plus en détailProbabilité. Table des matières. 1 Loi de probabilité 2 1.1 Conditions préalables... 2 1.2 Définitions... 2 1.3 Loi équirépartie...
1 Probabilité Table des matières 1 Loi de probabilité 2 1.1 Conditions préalables........................... 2 1.2 Définitions................................. 2 1.3 Loi équirépartie..............................
Plus en détailDécouverte du tableur CellSheet
Découverte du tableur CellSheet l application pour TI-83 Plus et TI-84 Plus. Réalisé par Guy Juge Professeur de mathématiques et formateur IUFM de l académie de Caen Pour l équipe des formateurs T 3 Teachers
Plus en détailSujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes.
Promotion X 004 COURS D ANALYSE DES STRUCTURES MÉCANIQUES PAR LA MÉTHODE DES ELEMENTS FINIS (MEC 568) contrôle non classant (7 mars 007, heures) Documents autorisés : polycopié ; documents et notes de
Plus en détailContexte. Pour cela, elles doivent être très compliquées, c est-à-dire elles doivent être très différentes des fonctions simples,
Non-linéarité Contexte Pour permettre aux algorithmes de cryptographie d être sûrs, les fonctions booléennes qu ils utilisent ne doivent pas être inversées facilement. Pour cela, elles doivent être très
Plus en détailt 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :
Terminale STSS 2 012 2 013 Pourcentages Synthèse 1) Définition : Calculer t % d'un nombre, c'est multiplier ce nombre par t 100. 2) Exemples de calcul : a) Calcul d un pourcentage : Un article coûtant
Plus en détailL offre décisionnel IBM. Patrick COOLS Spécialiste Business Intelligence
L offre décisionnel IBM Patrick COOLS Spécialiste Business Intelligence Le marché du Business Intelligence L enjeux actuel des entreprises : devenir plus «agiles» Elargir les marchés tout en maintenant
Plus en détailINF6304 Interfaces Intelligentes
INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie
Plus en détailModule Analyse de Génomes 2011-2012 Master 2 module FMBS 326 Immunoinformatique
Module Analyse de Génomes 2011-2012 Master 2 module FMBS 326 Immunoinformatique Planning du Module : Date Heure Salle 12/12 9h-12h TD info TA1Z bat 25 13h-17h TD info TA1Z bat 25 13/12 9h-12h TD info TA1Z
Plus en détailIDENTITÉ DE L ÉTUDIANT / APPLICANT INFORMATION
vice Direction des Partenariats Internationaux Pôle Mobilités Prrogrramme de bourrses Intterrnattiionalles en Mastterr (MIEM) Intterrnattiionall Mastterr Schollarrshiip Prrogrramme Sorrbonne Parriis Ciitté
Plus en détail1/24. I passer d un problème exprimé en français à la réalisation d un. I expressions arithmétiques. I structures de contrôle (tests, boucles)
1/4 Objectif de ce cours /4 Objectifs de ce cours Introduction au langage C - Cours Girardot/Roelens Septembre 013 Du problème au programme I passer d un problème exprimé en français à la réalisation d
Plus en détailJean-François Boulicaut & Mohand-Saïd Hacid
e siècle! Jean-François Boulicaut & Mohand-Saïd Hacid http://liris.cnrs.fr/~jboulica http://liris.cnrs.fr/mohand-said.hacid Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205
Plus en détailCryptographie. Cours 3/8 - Chiffrement asymétrique
Cryptographie Cours 3/8 - Chiffrement asymétrique Plan du cours Différents types de cryptographie Cryptographie à clé publique Motivation Applications, caractéristiques Exemples: ElGamal, RSA Faiblesses,
Plus en détailAnalyse de la variance Comparaison de plusieurs moyennes
Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction
Plus en détailRésolution d équations non linéaires
Analyse Numérique Résolution d équations non linéaires Said EL HAJJI et Touria GHEMIRES Université Mohammed V - Agdal. Faculté des Sciences Département de Mathématiques. Laboratoire de Mathématiques, Informatique
Plus en détailCapacité d un canal Second Théorème de Shannon. Théorie de l information 1/34
Capacité d un canal Second Théorème de Shannon Théorie de l information 1/34 Plan du cours 1. Canaux discrets sans mémoire, exemples ; 2. Capacité ; 3. Canaux symétriques ; 4. Codage de canal ; 5. Second
Plus en détailÉvaluation et optimisation de requêtes
Évaluation et optimisation de requêtes Serge Abiteboul à partir de tranparents de Philippe Rigaux, Dauphine INRIA Saclay April 3, 2008 Serge (INRIA Saclay) Évaluation et optimisation de requêtes April
Plus en détailConnaître la version de SharePoint installée
Connaître la version de SharePoint installée Comment savoir la version de SharePoint en cours Dans le cadre de la maintenance de plusieurs fermes SharePoint, il est indispensable de connaître les versions
Plus en détailIntroduction aux SGBDR
1 Introduction aux SGBDR Pour optimiser une base Oracle, il est important d avoir une idée de la manière dont elle fonctionne. La connaissance des éléments sous-jacents à son fonctionnement permet de mieux
Plus en détailData Mining. Vincent Augusto 2012-2013. École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto.
des des Data Mining Vincent Augusto École Nationale Supérieure des Mines de Saint-Étienne 2012-2013 1/65 des des 1 2 des des 3 4 Post-traitement 5 représentation : 6 2/65 des des Définition générale Le
Plus en détailCorrigé du baccalauréat S Pondichéry 12 avril 2007
Corrigé du baccalauréat S Pondichéry 1 avril 7 EXERCICE 1 Commun à tous les candidats 4 points 1 a Les vecteurs AB et AC ont pour coordonnées AB ; ; ) et AC 1 ; 4 ; 1) Ils ne sont manifestement pas colinéaires
Plus en détailSpécificités, Applications et Outils
Spécificités, Applications et Outils Ricco Rakotomalala Université Lumière Lyon 2 Laboratoire ERIC Laboratoire ERIC 1 Ricco Rakotomalala ricco.rakotomalala@univ-lyon2.fr http://chirouble.univ-lyon2.fr/~ricco/data-mining
Plus en détailEnoncé et corrigé du brevet des collèges dans les académies d Aix- Marseille, Montpellier, Nice Corse et Toulouse en 2000. Énoncé.
Enoncé et corrigé du brevet des collèges dans les académies d Aix- Marseille, Montpellier, Nice Corse et Toulouse en 2000. Énoncé. I- ACTIVITES NUMERIQUES (12 points) Exercice 1 (3 points) On considère
Plus en détailhttp://mondomaine.com/dossier : seul le dossier dossier sera cherché, tous les sousdomaines
Principales fonctionnalités de l outil Le coeur du service suivre les variations de position d un mot-clé associé à une URL sur un moteur de recherche (Google - Bing - Yahoo) dans une locale (association
Plus en détailIPSAS 32 «Service concession arrangements» (SCA) Marie-Pierre Cordier Baudouin Griton, IPSAS Board
IPSAS 32 «Service concession arrangements» (SCA) Marie-Pierre Cordier Baudouin Griton, IPSAS Board 1 L élaboration de la norme IPSAS 32 Objectif : traitement comptable des «service concession arrangements»
Plus en détailSoit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.
ANALYSE 5 points Exercice 1 : Léonie souhaite acheter un lecteur MP3. Le prix affiché (49 ) dépasse largement la somme dont elle dispose. Elle décide donc d économiser régulièrement. Elle a relevé qu elle
Plus en détailApplication des courbes ROC à l analyse des facteurs pronostiques binaires
Application des courbes ROC à l analyse des facteurs pronostiques binaires Combescure C (1), Perneger TV (1), Weber DC (2), Daurès J P (3), Foucher Y (4) (1) Service d épidémiologie clinique et Centre
Plus en détailFORMULAIRE DE STATISTIQUES
FORMULAIRE DE STATISTIQUES I. STATISTIQUES DESCRIPTIVES Moyenne arithmétique Remarque: population: m xμ; échantillon: Mx 1 Somme des carrés des écarts "# FR MOYENNE(série) MOYENNE(série) NL GEMIDDELDE(série)
Plus en détail«Rénovation des curricula de l enseignement supérieur - Kazakhstan»
ESHA «Création de 4 Ecoles Supérieures Hôtelières d'application» R323_esha_FT_FF_sup_kaza_fr R323 : Fiche technique «formation des enseignants du supérieur» «Rénovation des curricula de l enseignement
Plus en détailDétection et prise en charge de la résistance aux antirétroviraux
Détection et prise en charge de la résistance aux antirétroviraux Jean Ruelle, PhD AIDS Reference Laboratory, UCLouvain, Bruxelles Corata 2011, Namur, 10 juin 2011 Laboratoires de référence SIDA (Belgique)
Plus en détailEPREUVE OPTIONNELLE d INFORMATIQUE CORRIGE
EPREUVE OPTIONNELLE d INFORMATIQUE CORRIGE QCM Remarque : - A une question correspond au moins 1 réponse juste - Cocher la ou les bonnes réponses Barème : - Une bonne réponse = +1 - Pas de réponse = 0
Plus en détailLOGO. Module «Big Data» Extraction de Connaissances à partir de Données. Claudia MARINICA MCF, ETIS UCP/ENSEA/CNRS Claudia.Marinica@u-cergy.
Module «Big Data» Extraction de Connaissances à partir de Données Claudia MARINICA MCF, ETIS UCP/ENSEA/CNRS Claudia.Marinica@u-cergy.fr 14 Janvier 2015 Pourquoi l extraction de connaissances à partir de
Plus en détailChess Arbiter Pro (version Dames) Notice d utilisation
Chess Arbiter Pro (version Dames) Notice d utilisation Notice traduite et adaptée avec le concours de la Fédération Française de Jeu de Dames (FFJD) Aug2013 version 2.0 1 Tables des matières 1. CARACTERISTIQUES
Plus en détailSurveillance de Scripts LUA et de réception d EVENT. avec LoriotPro Extended & Broadcast Edition
Surveillance de Scripts LUA et de réception d EVENT avec LoriotPro Extended & Broadcast Edition L objectif de ce document est de présenter une solution de surveillance de processus LUA au sein de la solution
Plus en détailI. COORDONNÉES PERSONNELLES / PERSONAL DATA
DOSSIER DE CANDIDATUREAPPLICATION FORM 2012 Please tick the admission session of your choice FévrierFebruary SeptembreSeptember MASTER OF ART (Mention the subject) MASTER OF SCIENCE (Mention the subject)
Plus en détailPréleveur d'échantillons d eau automatique ELECTRO-MAGNUM /AQUAMAX 1 & 2 / SERVOTOP
Préleveur d'échantillons d eau automatique ELECTRO-MAGNUM /AQUAMAX 1 & 2 / SERVOTOP Paramétrage du thermostat digital de réfrigération Modèle avec sonde NTC depuis début 2009 (4 touches en dessous de l'afficheur)
Plus en détailL ABC de l acquisition de petites entreprises
L ABC de l acquisition de petites entreprises Bienvenue Séries d acquisition de petites entreprises Comment aborder le sujet. Comment vendre aux petites entreprises. Accroître la connaissance des produits
Plus en détailUTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY
UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY Yvan Le Bras yvan.le_bras@irisa.fr Cyril Monjeaud, Mathieu Bahin, Claudia Hériveau, Olivier Quenez, Olivier Sallou, Aurélien Roult, Olivier
Plus en détail