«Algorithmes pour le séquençage haut débit»

Dimension: px
Commencer à balayer dès la page:

Download "«Algorithmes pour le séquençage haut débit»"

Transcription

1 Loïk LE DRÉAU Master 2 de Recherche en Informatique Supelec, Rennes Étude bibliographique : «Algorithmes pour le séquençage haut débit» Janvier 2010 Encadrant : Dominique LAVENIER Équipe : Symbiose Laboratoire : IRISA, Rennes 1

2 Table des matières 1 Introduction Notions importantes La bio-informatique Éléments de génétique Le séquençage du génome Les séquenceurs L'assemblage Les algorithmes d'assemblage La correction d'erreur Les algorithmes La parallélisation Conclusion

3 1 Introduction Ce document présente une étude bibliographique en préambule au stage de fin d'étude de Master recherche. Celui-ci porte sur les «Algorithmes parallèles pour le séquençage haut débit». Ce travail sera effectué au sein de l'équipe Symbiose de l'irisa. Le séquençage évoqué est celui du génome ; les algorithmes auront pour objectif de corriger les erreurs en sortie des séquenceurs. La construction d'algorithmes parallèles de qualité sera la priorité du stage. Dans un premier temps l'étude ce portera sur la bio-informatique et par extension la génétique afin de présenter le cadre de travail. Puis, cet exposé présentera une définition du séquençage du génome ainsi qu'un historique des différents séquenceurs qui ont été ou sont utilisés. Afin de préciser ce que les algorithmes de correction d'erreur auront à traiter ; il sera présenté l'étape d'assemblage qui utilisera les séquences corrigées, ce qui complètera le rôle des algorithmes. Dans une dernière partie, nous feront un point sur les différents algorithmes de correction d'erreurs existants. Enfin, nous conclurons avec les pistes qui pourraient être suivies pour les améliorer. 3

4 2 Notions importantes 2.1 La bio-informatique La biologie est un domaine de recherche très vaste et complexe. Il est donc nécessaire pour le biologiste de faire appel à des scientifiques de domaine différents afin de l'aider dans sa compréhension du vivant. La collaboration de biologiste, informaticien, mathématicien et physicien, est la base de la bio-informatique. Les fruits de cette association sont la modélisation de l'évolution d'une population animale, en passant par la modélisation moléculaire, l'analyse du génome et le séquençage du génome. La bioinformatique est aussi nommée «biologie in silico», par analogie avec in vitro ou in vivo. Dans ce document, nous allons nous intéresser au séquençage du génome. De ce fait, quelques rappels de génétique sont nécessaires. 2.2 Éléments de génétique Tous le monde a entendu un jour parler de génétique par des mots comme hérédité, clonage, ADN ou maladie génétique. La génétique a pour objectif de comprendre les mécanismes cachés derrière ces mots. Le point autour duquel ce domaine gravite est le support de l'information génétique. Pour la compréhension de l'exposé il est important de savoir où il ce trouve et comment il est codé. Comme vous le savez sûrement, une cellule est l'unité du vivant à l'exception des virus. Elle donne une structure, une fonction et permet la multiplication de tout être vivant. Dans le cas des organismes multicellulaires, les cellules fonctionnent de manière autonomes tout en restant coordonnées. Les cellules de même type sont réunies en tissus, eux-mêmes réunis en organes. Le matériel génétique est contenu dans le noyau de la cellule quand il existe. Le matériel génétique se présente sous la forme de longs filaments appelés ADN. Il est parfois regroupé en chromosome. ADN ou acide désoxyribonucléique est constitué de deux chaînes de nucléotides entrelacés prenant la forme d'une double hélice. Figure 1: Localisation de l'adn 4

5 Il existe quatre nucléotides différenciés grâce à la base azotée située au bout de celui-ci. Ceci constitue un alphabet composé des lettres A, T, G et C. L'ADN ne sort pas du noyau. Des complexes protéiques copient donc l'adn en un brin d'arn. L'information est la même, seul les T deviennent des U. Puis l'arn est traduit en protéine. Chaque triplet de lettres est mis en correspondance avec un acide aminé. Le code génétique est la table d'association des triplets de lettres avec les acides aminés [14]. Le génome est l'ensemble des séquences d'adn d'un individu. Il est constitué de séquences qui sont traduites en ARN puis en protéine : les gènes et d'autres qui sont «silencieuses». Sa taille varie fortement selon l'organisme étudié. Les mammifères ont un génome de l'ordre de plusieurs milliards de paires de bases (pb). Figure 2: Le code génétique Virus Bactéries Eucaryotes Organisme Taille du génome (Mpb) Nb de gènes estimés Virus de la grippe 0,013 Mimivirus (virus géant) 1, Mycoplasma pneumoniae (la plus petite bactérie) 0, Escherichia coli 4, Encephalitozoon cuniculi (parasite) 2, Homo sapiens Souris Maïs Amoeba dubia (le plus grand génome) Tableau 1: Taille du génome de quelques organismes 5

6 3 Le séquençage du génome Le séquençage du génome permet de convertir l'information chimique de l'adn en une autre visible par un être humain ou un ordinateur. Cette conversion permettra l'analyse du génome d'un individu [12]. La première séquence d'adn déterminée par Wu et Taylor en 1971 était seulement composé d'une douzaine de bases. La méthode qu'ils ont utilisée ne pouvait pas être utilisée à grande échelle. Ensuite, la méthode du séquençage par addition et soustraction permit à Sanger et al. de séquencer les 5386 pb du génome du phage XΦ 174 en 1977a. Ce sont les débuts du séquençage avant l'arrivée des séquenceurs plus performants [15]. 3.1 Les séquenceurs Dans cette section nous allons faire un petit tour d'horizon des séquenceurs qui ont été utilisés par les chercheurs. La première méthode a avoir été utilisée de manière intensive fut développée par Allan Maxam et Walter Gilbert en Cette méthode chimique consiste à marquer radioactivement un bout de la chaîne d'adn et de détruire successivement chaque base azotée. Quatre solutions différentes sont utilisées pour pour différencier la destruction d'une des bases et le résultat peut être lu par une autoradiographie sur gel. Cette méthode a été utilisée de manière intensive jusqu'en Les raisons de son abandon sont tout d'abord la haute toxicité des substances employées ainsi que le manque l'automatisation [13]. Aussi créée en 1977b, la méthode de Sanger et al dite «par terminaison de chaîne» est très différente de la première dans son principe. Cette méthode consiste à modifier le complexe enzymatique intervenant dans la réplication de l'adn de telle façon à arrêter la chaîne dès qu'il se retrouve face à une base donnée. L'expérience est réalisée pour les quatre bases azotées. Les résultats des expériences sont disposés dans quatre pistes d'une plaque à électrophorèse, afin de lire les résultats. La méthode de Sanger se prête facilement à l'automatisation du séquençage ce qui explique qu'elle soit la base de la plupart des séquenceurs utilisés aujourd'hui. Il est intéressant de noter que Walter Gilbert et Fredérick Sanger ont reçu le prix Nobel de chimie en 1980 «pour leurs contributions concernant la détermination des séquences de bases des acides nucléiques». La méthode de Sanger a été automatisée en 1987 (Prober et al.) grâce à l'utilisation de marqueurs fluorescents et d'un système de détection. La fluorescence et la préparation automatique des milieux réactionnaires est la base des séquenceurs les plus utilisés jusqu'à aujourd'hui. Cette avancée a trois avantages majeurs. Le premier est l'utilisation d'une seule piste sur la plaque d'électrophorèse. Cela permet un gain de place mais aussi l'absence de biais du à une différence entre les pistes. Le deuxième avantage est que les résultats sont lisibles par une machine. Le dernier avantage a été apporté par l'introduction d'une nouvelle génération de machines. Mullikan et McMurray ont remplacé l'électrophorèse par une séparation capillaire réduisant ainsi le nombre d'opérations manuelles et augmentant le débit [12][13]. Aujourd'hui, les séquenceurs de deuxième génération peuvent traiter des milliard de paire de base par cycle de fonctionnement. Trois des technologies en concurrence sont 454 de roche, Solexa de Illumina et SOLiD de Abi. Elles ont été introduites sur le marché 6

7 respectivement en 2005, 2006 et Les méthodes qu'elles utilisent sont différentes et beaucoup moins coûteuses et plus fiables que les méthodes existantes précédemment. Le séquenceur utilisé dans le laboratoire sera un Solexa. Il produit des petites séquences de 25 à 35 pb (augmentée à 75/100 avec la nouvelle génération) en très grand nombre. Les petites séquences ne sont pas l'idéal si l'on veut faire de l'assemblage. D'où la nécessité de corriger les erreurs avant cette étape [16]. 3.2 L'assemblage L'étape d'assemblage consiste à reconstituer la séquence entière de d'adn à partir des séquences produites par un séquenceur. Il existe deux catégories d'assemblage l'une comparative avec une séquence d'adn de référence et l'autre dite «de novo» pour le séquençage sans référence. Nous allons nous intéresser à la deuxième catégorie et plus précisément l'assemblage «de novo» avec des séquences courtes. Celle-ci nécessite d'avoir séquencé plusieurs fois le brin d'adn afin de trouver des correspondances Les algorithmes d'assemblage Les algorithmes permettant l'assemblage des séquences sont réparties en plusieurs classes, les principales sont les algorithmes gloutons, Overlap-Layout- Concensus et De Bruijne. Pour chaque classe nous allons présenter ses caractéristiques ainsi que quelques algorithmes les composant. Les Algorithmes gloutons Un algorithme glouton fait à chacune de ses étapes un choix qui est localement optimal, dans l'espoir d'obtenir un résultat final optimal global. Il n'y a pas de retour arrière dans ces algorithmes. Dans beaucoup de cas, il explore totalement l'espace des possibilités. Bien souvent les algorithmes gloutons ne peuvent pas passer à l'échelle. Une heuristique gloutonne est un algorithme qui ne fait pas toujours des choix optimaux dans le but de converger rapidement. L'algorithme SSAKE 3.0 La préparation de l'algorithme consiste en une normalisation et une organisation des séquences. Puis il sélectionne la séquence la plus redondante pour être la séquence de référence : «seed» Chaque itération procède de la manière suivante : Énumération des préfixes possibles pour un chevauchement parfait minimum (fixé par un paramètre) avec le «seed» Recherche des séquences dans un arbre des préfixes Consensus entre les séquences pour le choix des trois lettres suivantes au chevauchement (le choix des lettres est indépendant) Ajout des lettres au «seed» Fin lorsque toutes les possibilités ont été parcourues 7

8 Dans le cas de l'assemblage, les algorithmes gloutons sont les plus simples et les plus intuitifs. SSAKE, VCAKE et SHARCGS sont trois de ces algorithmes. VCAKE se distingue de SSAKE par le fait que le consensus est fait sur un mot de k lettres (k-mers) et pas sur trois lettres indépendantes. SHARCGS publié par Dohm et al [4] en 2007 suit le processus de SSAKE. Mais, avant la phase d'assemblage il effectue une mise à l'écart de toutes les séquences erronées. De plus, l'algorithme est moins sensible aux répétitions dans le génome que SSAKE et est bien adapté à l'assemblage «de novo» de short reads (séquences de moins de 120pb). Overlap-Layout-Consensus (OLC) Ces algorithmes sont partis du constat que les séquences fournies à un assembleur peuvent être représentées comme un graphe. Les noeuds représentent chaque séquence et les arcs le chevauchement (overlap) entre deux séquences. Le problème de l'assemblage consiste donc à trouver un chemin qui passera une fois par chaque noeud. Un tel chemin est dit hamiltonien. Le domaine de la théorie des graphes permet donc de résoudre les problèmes d'assemblage. L'étape «Overlap» de l'algorithme consiste à calculer les chevauchements et à constituer le graphe. L'étape de «Layout» permet, grâce à la théorie des graphes, d'éliminer les informations redondantes dans l'ensemble des séquences. Enfin le «Consensus» effectue l'alignement de toutes les séquences du génome tout en admettant quelques alignements imparfaits soumis à un vote majoritaire [17]. Figure 3: Overlap-Layout-Consensus [18] Le principal problème des algorithmes OLC est qu'ils sont plutôt sensibles aux séquences se répétant dans le génome. En effet l'algorithme ne va pas prendre en considération celles-ci à cause de l'opération de layout qui va souvent supprimer les répétitions. EDENA est un algorithme OLC publié par Hernandez et al. [5]. Son objectif est de produire un résultat correct sans demander des ressources matérielles aussi conséquentes que les algorithmes gloutons. EDENA peut assembler de «H. acinonychis» en moins de 20 minutes alors que SSAKE met 18 heures et SHARCGS 8 heures. 8

9 Recherche de chemin eulérien L'idée de base de ces algorithmes est la construction d'un automate de tous les enchaînements de k-mer possibles dans les séquences, ce qu'on appelle un automate de «De Bruijn». Un chemin eulérien doit passer une et une seule fois dans chaque arc de l'automate. Après la construction de l'automate on recherche un chemin eulérien dans l'automate. L'automate et le chemin sont recalculés itérativement avec d'introduction d'une contrainte d'enchaînement observée dans une séquence ce qui revient à rechercher le super-chemin euclidien [17]. En 2001 Pevzner et al. sont les premiers à présenter un algorithme basé sur la recherche du super-chemin. La méthode permet de trouver une solution aux problèmes rencontrés par les algorithmes OLC dû aux répétitions de séquence génomique. Leur approche est la base du projet EULER [6][11]. EULER a ensuite été raffiné par Chaisson et Pevzner en 2007 avec l'assembleur EULER-SR [2] de telle façon à gérer plus facilement les short reads. En 2009, Simpson et al. [9] ont créé AbySS. Un assembleur pouvant être exécuté de manière parallèle sur une machine permettant un gain important de temps d'exécution. Butler et al. présentent en 2008 une nouvelle méthode d'assemblage appelée ALLPATHS [1]. Celle-ci a été pensée de telle manière à s'adapter au microreads (séquences de petites tailles : 25-50pb) des séquenceurs tel que Solexa ou SOLiD. Les auteurs considèrent que le calcul de l'overlap entre les microreads n'est pas approprié. Ils proposent de une indexation numérique des k-mer pour limiter le nombre de ces opérations. 4 La correction d'erreur Lors de l'assemblage du génome les erreurs faites par les séquenceurs posent problème. La solution est soit de les prendre en compte lors de l'assemblage (consensus), soit de faire des un pré-traitement capables de les corriger [11]. Un des avantages de la deuxième solution est qu'il permet de faciliter l'exécution des algorithmes d'assemblage. Tout d'abord, nous allons faire une présentation de quelques méthodes permettant la correction d'erreurs. Ensuite, nous évoquerons la parallélisation et de ses avantages. 4.1 Les méthodes L'un des critères qui est souvent retenu pour savoir si une séquence est correcte est le nombre de fois qu'elle apparaît dans l'ensemble des séquences. L'argument est que les brins sont clonés et coupés aléatoirement avant le séquençage pour pouvoir avoir des correspondances. Donc une séquence se retrouvant plusieurs fois a plus de chances d'être bonne. Ce critère est utilisé dans plusieurs algorithmes d'assemblage et de correction d'erreurs. Le premier critère peut laisser passer quelques erreurs même si c'est rare. L'assembleur SHARCGS utilise un second critère basé sur le fait qu'une séquence erronée à très peu de chances de trouver une autre séquence la complétant. Le premier critère peut suffire à lui seul à condition de régler les paramètres de celui-ci. Un paramètre est le nombre à partir duquel on considère la séquence correcte. Et le second est la longueur des séquences que l'on va observer. ECINDEL (pré-processing de EULER) autorise les deux paramètres contrairement au protocole SHRAP [10] qui considère les séquences entières. Francis YL Chin et al. [3] proposent un algorithme permettant de calculer les valeurs optimales des paramètres. 9

10 L'article de Pavel A. Pevzner et al. [7] est intéressant et permet d'illustrer la méthode ECINDEL. Ils réussissent à obtenir de bons résultats en faisant une élimination des orphelins suivie d'un alignement des spectres (Voir ci-dessous). Ensuite ils expliquent qu'il y a toujours un compromis à faire entre la correction d'erreur et la corruption de données et qu'il est préférable d'éliminer une ambiguïté pour l'assemblage que l'inverse. Une des difficultés dans la correction d'erreurs est de différencier une erreur d'une répétition avec peu de changements. La méthode de Pavel A. Pevzner et al. [7] Soit s une chaîne issu du séquençage du génome G. Un l-uplet est dit solide s'il est contenu dans plus de M chaînes et faible sinon. M est un paramètre du programme. Soit T une collection de l-uplets appelé le spectre. Une chaîne s est dite une T-chaine si tous ses l-uplets appartiennent à T. Soit Sp g le spectre des l-uplets solides de l'ensemble des s. Spectral Alignement Problem (SAP) Sachant une chaîne s et un spectre T, résoudre un SAP est trouver le nombre minimum de mutations à faire pour transformer s en une T-chaîne. La programmation dynamique peut permettre la résolution d'un SAP. Un SAP peut-être utilisé pour la correction d'erreur ssi le nombre de mutation n'est pas trop important. La méthode procède par alignement successif des chaînes sur le spectre Sp g. Sp g est recalculée à chaque itération. Cette méthode a permis d'éliminer un nombre important d'erreurs dans un projet séquençage d'une bactérie, mais ne prend pas bien en compte certaines spécificités de l'assemblage. Les auteurs expliquent une autre méthode de correction d'erreurs. Par exemple le nombre maximum d'erreurs dans une séquence n'est pas prise en compte. Soit S={s 1, s 2,..., s n } l'ensemble des chaînes issues du séquençage de G et l un entier. Le spectre de S est S l contenant les l-uplets de s 1, s 2,..., s n et des chaînes inversées de s 1, s 2,..., s n. Soit Δ une majoration du nombre d'erreurs dans chaque chaîne. Error correction problem Sachant S, Δ et l, on fait au maximum Δ corrections dans une chaîne de S tout en minimisant la taille de S l. Une erreur dans une chaîne entraîne 2l l-uplets erronés (2d si l'erreur se trouve une distance d de la fin de la chaîne et d < l). Une approche gloutonne peut trouver une correction dans la chaîne s qui réduit la taille de S l par 2l (ou 2d). Une autre approche est l'élimination des orphelins. Un orphelin est un l-uplet ayant une faible occurrence (inférieure à M), il n'a qu'une chaîne voisine (un caractère de différence) et que la voisine ai une occurrence plus forte qu'elle. L'élimination des orphelins gloutonne commence à corriger les positions orphelines (là où l'orphelin diffère du voisin) qui réduisent de 2l la taille de S l. Ensuite la condition 2l est relâché par la soustraction d'un coefficient δ. Jia Zheng et al. [11] ont apporté l'idée de prendre en compte une estimation de la couverture de séquence dans la correction d'erreurs. 10

11 La méthode ECINDEL à été reprise par Jonathan Butler et al. [1] pour leur algorithme ALLPATHS. Ils ont effectué une sorte de boosting en utilisant plusieurs longueurs k de chaînes différentes. Les séquences solides sont désignées à l'unanimité et les erreurs sont corrigées selon leurs résultats pour chaque k. 4.2 La parallélisation Depuis un moment on a pu voir un changement sur le marché du matériel informatique. En effet, avant les années 2000 on assistait à une surenchère sur la fréquence dans les processeurs et maintenant c'est la course à la parallélisation massive. Les constructeurs ont vu qu'ils seraient arrivés à une limite en terme de fréquence et de dispersion de chaleur. Le moyen de contourner ces limites est la parallélisation des calculs. Une adaptation des algorithmes séquentiels est nécessaire afin de bénéficier du gain de performance. La programmation parallèle existait déjà avec les FPGA et les MasPar. Le développement des outils de programmation sur FPGA comme Handel-C et surtout la croissance phénoménale de la puissance des cartes graphiques a réellement fait émerger le domaine du parallélisme. Grâce au CUDA et aux autres langages de programmation sur carte graphique on est enfin capable de faire fonctionner des algorithmes très gourmands sur des PC de bureau pour un coup minime comparé aux super calculateurs qui étaient nécessaires. C'est pourquoi l'assemblage du génome et par extension la correction d'erreur doit être portée sur GPU ou au moins parallélisée. Dans le descriptif des assembleurs j'ai parlé de AbySS comme étant un algorithme parallèle. Il a été implémenté en C++ et utilise le passage de message pour la communication parallèle. La partie distribuée est le graphe de Bruijn dans lequel les noeuds sont des agents distribués s'envoyant des messages. Haixiang Shi et al. [8] présentent un algorithme de correction d'erreurs implémenté en CUDA. Il est basé sur la résolution du SAP et se divise en deux parties l'une gérant le vote des chaînes et l'autre décide de l'action à faire. Le «speedup» minimum obtenu est de 10 par rapport à la méthode utilisée par EULER-SR. Ce qui commence à être intéressant surtout que la précision est de plus de 98 %. L'algorithme parallèle en CUDA [8] Soit R les n séquences de longueur L issues du séquenceur et r i l'une d'elle. Soit T m,l (R) le spectre de R où m est le seuil de «solidité»(voir méthode de Pevzner) et l la longueur des l-uplets. Il est nécessaire que l'on puisse accéder concurrentiellement à T m,l (R). La première partie de l'algorithme consiste à lancer dans n thread un vote pour chacune des séquences. Ce vote sert à marquer les erreurs par rapport au spectre, c-à-d la position et la «bonne» lettre donnée par le spectre. C'est un vote par une mutation simple donc deux erreurs trop proches ne seront pas bien détectés. La deuxième partie lancée de la même manière que la première prend en entrée le vote. Dans un premier temps il calcule le maximum des votes et le couple (position, lettre) obtenant la majorité des suffrages. Si le maximum est nul il renvoie la séquence non modifiée. Si tous les l-uplets de r i appartiennent à T m,l (R) alors on corrige r i. Sinon, on taille ou l'on supprime r i. 11

12 5 Conclusion Cette présente bibliographie nous a permis de mettre d'aborder la bio-informatique et de mieux cerner le cadre et les objectifs du stage. Afin de débuter le stage dans les meilleures conditions, une phase de lecture de code et d'apprentissage du CUDA ou un autre langage, s'imposera. Nous avons pu voir que la plupart des travaux concernant le séquencage, l'assemblage et la correction d'erreurs sont récents. Des avancés sont encore possibles. Si on regarde de près on peut voir que les algorithmes d'assemblage suivent les générations des séquenceurs. La conséquence a été la production d'un bon nombre d'articles adaptant les anciennes méthodes à la baisse de la longueur des séquences. Mais maintenant que les séquenceurs recommencent à augmenter la taille des séquences, d'autres pistes s'ouvrent comme la parallélisation des algorithmes. Le point de départ du stage sera la méthode utilisée par H. Shi et al. [8]. Concrètement, nous allons implémenter la méthode et l'évaluer par une étude empirique complémentaire. L'étude se portera sur le paramétrage à l'image de l'article de F. Chin et al. [3]. L'objectif sera savoir si leur méthode de calcul des paramètres peut être appliquée. Ensuite, nous pensons que la puissance de la carte graphique suffit à créer un boosting de plusieurs méthodes de correction. Pour finir, nous chercherons à créer un nouvel algorithme parallèle. 12

13 Les articles Références Les livres [1] J. Butler, I. MacCallum, M. Kleber, I. A. Shlyakhter, M. K. Belmonte, E. S. Lander, C. Nusbaum, and D. B. Jaffe, (2008) «ALLPATHS: De novo assembly of whole-genome shotgun microreads», Genome Res 18: [2] M. J. Chaisson and P. A. Pevzner, (2008) «Short read fragment assembly of bacterial genomes», Genome Res 18: [3] F. Chin, H. Leung, W. Li, and S. Yiu, (2009) «Finding optimal threshold for correction error reads in DNA assembling», BMC Bioinformatics 10(Suppl 1): S15 [4] J. C. Dohm, C. Lottaz, T. Borodina, and H. Himmelbauer, (2007) «SHARCGS, a fast and highly accurate short-read assembly algorithm for de novo genomic sequencing», Genome Res 17: [5] D. Hernandez, P. François, L. Farinelli, M. Østerås, and J. Schrenzel, (March 10, 2008) «De novo bacterial genome sequencing: Millions of very short reads assembled on a desktop computer», Genome Res. published online [6] P. A. Pevzner, H. Tang and M. S. Waterman, (2001) «An Eulerian path approach to DNA fragment assembly» Proc. Natl. Acad. Sci. 98: [7] P. A. Pevzner, H. Tang, M. S. Waterman, (April, 2001) «A new approach to fragment assembly in DNA sequencing», Proceedings of the fifth annual international conference on Computational biology, p , April 22-25, 2001, Montreal, Quebec, Canada [doi> / ] [8] H. Shi, B. Schmidt, W. Liu, and W. M. Wittig, (2009) «Accelerating error correction in high-throughput short-read dna sequencing data with CUDA», IPDPS '09: Proceedings of the IEEE International Symposium on Parallel\&Distributed Processing, pp [9] J. T. Simpson, K. Wong, S. D. Jackman, J. E. Schein, S. J.M. Jones, and I. Birol, (2009) «ABySS: A parallel assembler for short read sequence data», Genome Res 19: [10] A. Sundquist, M. Ronaghi, M. Tang, P. A. Pevzner, S. Batzoglou, (2007) «Whole-Genome Sequencing and Assembly with High-Throughput, Short-Read Technologies», PLoS ONE 2(5): e484. [doi> /journal.pone ] [11] J. Zheng, H Waileong et H. Tang, (2007) «An improved algorithme for error correction of reads in DNA fragment assembly» ReComb [12] T.A. Brown «Génomes» aux éditions Flammarion [13] Griffiths, Miller, Suzuki, Lewontin, et Gelbart «Introduction à l'analyse génétique» aux éditions DeBoeck Université [14] MO. Monchicourt «Les enquêtes : Le génome séquencé» aux éditions Platypus press [15] Primrose, Twyman et Old «Principes de génie génétique» aux éditions De Boeck Les présentations [16] MC. Le Paslier, (2009) «Les outils de séquençage / re-séquençage», Colloque EPGV [17] J. Nicolas (2004«Assemblage ciblé de séquences : un problème d optimisation d actualité» présentation pour l'équipe Symbiose, Irisa [18] W. Qi, (April,2009) «Genome Sequence Assembly», COST 13

CHAPITRE 3 LA SYNTHESE DES PROTEINES

CHAPITRE 3 LA SYNTHESE DES PROTEINES CHAITRE 3 LA SYNTHESE DES ROTEINES On sait qu un gène détient dans sa séquence nucléotidique, l information permettant la synthèse d un polypeptide. Ce dernier caractérisé par sa séquence d acides aminés

Plus en détail

Ebauche Rapport finale

Ebauche Rapport finale Ebauche Rapport finale Sommaire : 1 - Introduction au C.D.N. 2 - Définition de la problématique 3 - Etat de l'art : Présentatio de 3 Topologies streaming p2p 1) INTRODUCTION au C.D.N. La croissance rapide

Plus en détail

Big data et sciences du Vivant L'exemple du séquençage haut débit

Big data et sciences du Vivant L'exemple du séquençage haut débit Big data et sciences du Vivant L'exemple du séquençage haut débit C. Gaspin, C. Hoede, C. Klopp, D. Laborie, J. Mariette, C. Noirot, MS. Trotard bioinfo@genopole.toulouse.inra.fr INRA - MIAT - Plate-forme

Plus en détail

3: Clonage d un gène dans un plasmide

3: Clonage d un gène dans un plasmide 3: Clonage d un gène dans un plasmide Le clonage moléculaire est une des bases du génie génétique. Il consiste à insérer un fragment d'adn (dénommé insert) dans un vecteur approprié comme un plasmide par

Plus en détail

Chapitre 1 I:\ Soyez courageux!

Chapitre 1 I:\ Soyez courageux! Chapitre 1 I:\ Soyez courageux! Pour ne rien vous cacher, le langage d'assembleur (souvent désigné sous le terme "Assembleur", bien que ce soit un abus de langage, puisque "Assembleur" désigne le logiciel

Plus en détail

Chapitre 1 : Introduction aux bases de données

Chapitre 1 : Introduction aux bases de données Chapitre 1 : Introduction aux bases de données Les Bases de Données occupent aujourd'hui une place de plus en plus importante dans les systèmes informatiques. Les Systèmes de Gestion de Bases de Données

Plus en détail

LE PROBLEME DU PLUS COURT CHEMIN

LE PROBLEME DU PLUS COURT CHEMIN LE PROBLEME DU PLUS COURT CHEMIN Dans cette leçon nous définissons le modèle de plus court chemin, présentons des exemples d'application et proposons un algorithme de résolution dans le cas où les longueurs

Plus en détail

POLITIQUE DE BIOSÉCURITÉ

POLITIQUE DE BIOSÉCURITÉ Date d entrée en vigueur: Mai 2006 Remplace/amende: VRS-52/s/o Origine: Vice-rectorat aux services Numéro de référence: VPS-52 DÉFINITION Une substance biologique dangereuse se définit comme un organisme

Plus en détail

Introduction. I Étude rapide du réseau - Apprentissage. II Application à la reconnaissance des notes.

Introduction. I Étude rapide du réseau - Apprentissage. II Application à la reconnaissance des notes. Introduction L'objectif de mon TIPE est la reconnaissance de sons ou de notes de musique à l'aide d'un réseau de neurones. Ce réseau doit être capable d'apprendre à distinguer les exemples présentés puis

Plus en détail

DÉFIS DU SÉQUENÇAGE NOUVELLE GÉNÉRATION

DÉFIS DU SÉQUENÇAGE NOUVELLE GÉNÉRATION DÉFIS DU SÉQUENÇAGE NOUVELLE GÉNÉRATION PRINCIPES DE BASE SUR LES DONNEES ET LE CALCUL HAUTE PERFORMANCE Lois de Gray sur l ingénierie des données 1 : Les calculs scientifiques traitent des volumes considérables

Plus en détail

Algorithmes de recherche

Algorithmes de recherche Algorithmes de recherche 1 Résolution de problèmes par recherche On représente un problème par un espace d'états (arbre/graphe). Chaque état est une conguration possible du problème. Résoudre le problème

Plus en détail

Guide de configuration de SQL Server pour BusinessObjects Planning

Guide de configuration de SQL Server pour BusinessObjects Planning Guide de configuration de SQL Server pour BusinessObjects Planning BusinessObjects Planning XI Release 2 Copyright 2007 Business Objects. Tous droits réservés. Business Objects est propriétaire des brevets

Plus en détail

LA MITOSE CUEEP - USTL DÉPARTEMENT SCIENCES BAHIJA DELATTRE

LA MITOSE CUEEP - USTL DÉPARTEMENT SCIENCES BAHIJA DELATTRE Biologie LA MITOSE CUEEP - USTL DÉPARTEMENT SCIENCES BAHIJA DELATTRE Février 2006 I. L'INTRODUCTION Chaque cellule d'un organisme supérieur provient de la multiplication d'une cellule préexistante (cellule

Plus en détail

Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments»

Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments» Master In silico Drug Design Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments» 30NU01IS INITIATION A LA PROGRAMMATION (6 ECTS) Responsables : D. MESTIVIER,

Plus en détail

Atelier Transversal AT11. Activité «Fourmis» Pierre Chauvet. pierre.chauvet@uco.fr

Atelier Transversal AT11. Activité «Fourmis» Pierre Chauvet. pierre.chauvet@uco.fr Atelier Transversal AT11 Activité «Fourmis» Pierre Chauvet pierre.chauvet@uco.fr Ant : un algorithme inspiré de l éthologie L éthologie Etude scientifique des comportements animaux, avec une perspective

Plus en détail

UEO11 COURS/TD 1. nombres entiers et réels codés en mémoire centrale. Caractères alphabétiques et caractères spéciaux.

UEO11 COURS/TD 1. nombres entiers et réels codés en mémoire centrale. Caractères alphabétiques et caractères spéciaux. UEO11 COURS/TD 1 Contenu du semestre Cours et TDs sont intégrés L objectif de ce cours équivalent a 6h de cours, 10h de TD et 8h de TP est le suivant : - initiation à l algorithmique - notions de bases

Plus en détail

Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN

Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN Table des matières. Introduction....3 Mesures et incertitudes en sciences physiques

Plus en détail

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY Yvan Le Bras yvan.le_bras@irisa.fr Cyril Monjeaud, Mathieu Bahin, Claudia Hériveau, Olivier Quenez, Olivier Sallou, Aurélien Roult, Olivier

Plus en détail

Application 1- VBA : Test de comportements d'investissements

Application 1- VBA : Test de comportements d'investissements Application 1- VBA : Test de comportements d'investissements Notions mobilisées Chapitres 1 à 5 du cours - Exemple de récupération de cours en ligne 1ère approche des objets (feuilles et classeurs). Corps

Plus en détail

Pourquoi l apprentissage?

Pourquoi l apprentissage? Pourquoi l apprentissage? Les SE sont basés sur la possibilité d extraire la connaissance d un expert sous forme de règles. Dépend fortement de la capacité à extraire et formaliser ces connaissances. Apprentissage

Plus en détail

modélisation solide et dessin technique

modélisation solide et dessin technique CHAPITRE 1 modélisation solide et dessin technique Les sciences graphiques regroupent un ensemble de techniques graphiques utilisées quotidiennement par les ingénieurs pour exprimer des idées, concevoir

Plus en détail

PROBLEMES D'ORDONNANCEMENT AVEC RESSOURCES

PROBLEMES D'ORDONNANCEMENT AVEC RESSOURCES Leçon 11 PROBLEMES D'ORDONNANCEMENT AVEC RESSOURCES Dans cette leçon, nous retrouvons le problème d ordonnancement déjà vu mais en ajoutant la prise en compte de contraintes portant sur les ressources.

Plus en détail

TEXT MINING. 10.6.2003 1 von 7

TEXT MINING. 10.6.2003 1 von 7 TEXT MINING 10.6.2003 1 von 7 A LA RECHERCHE D'UNE AIGUILLE DANS UNE BOTTE DE FOIN Alors que le Data Mining recherche des modèles cachés dans de grandes quantités de données, le Text Mining se concentre

Plus en détail

Vers l'ordinateur quantique

Vers l'ordinateur quantique Cours A&G Vers l'ordinateur quantique Données innies On a vu dans les chapîtres précédents qu'un automate permet de représenter de manière nie (et même compacte) une innité de données. En eet, un automate

Plus en détail

Projet de traitement d'image - SI 381 reconstitution 3D d'intérieur à partir de photographies

Projet de traitement d'image - SI 381 reconstitution 3D d'intérieur à partir de photographies Projet de traitement d'image - SI 381 reconstitution 3D d'intérieur à partir de photographies Régis Boulet Charlie Demené Alexis Guyot Balthazar Neveu Guillaume Tartavel Sommaire Sommaire... 1 Structure

Plus en détail

ALGORITHME GENETIQUE ET MODELE DE SIMULATION POUR L'ORDONNANCEMENT D'UN ATELIER DISCONTINU DE CHIMIE

ALGORITHME GENETIQUE ET MODELE DE SIMULATION POUR L'ORDONNANCEMENT D'UN ATELIER DISCONTINU DE CHIMIE ALGORITHME GENETIQUE ET MODELE DE SIMULATION POUR L'ORDONNANCEMENT D'UN ATELIER DISCONTINU DE CHIMIE P. Baudet, C. Azzaro-Pantel, S. Domenech et L. Pibouleau Laboratoire de Génie Chimique - URA 192 du

Plus en détail

Programmation Objet - Cours II

Programmation Objet - Cours II Programmation Objet - Cours II - Exercices - Page 1 Programmation Objet - Cours II Exercices Auteur : E.Thirion - Dernière mise à jour : 05/07/2015 Les exercices suivants sont en majorité des projets à

Plus en détail

Comment reproduire les résultats de l article : POP-Java : Parallélisme et distribution orienté objet

Comment reproduire les résultats de l article : POP-Java : Parallélisme et distribution orienté objet Comment reproduire les résultats de l article : POP-Java : Parallélisme et distribution orienté objet Beat Wolf 1, Pierre Kuonen 1, Thomas Dandekar 2 1 icosys, Haute École Spécialisée de Suisse occidentale,

Plus en détail

Perrothon Sandrine UV Visible. Spectrophotométrie d'absorption moléculaire Étude et dosage de la vitamine B 6

Perrothon Sandrine UV Visible. Spectrophotométrie d'absorption moléculaire Étude et dosage de la vitamine B 6 Spectrophotométrie d'absorption moléculaire Étude et dosage de la vitamine B 6 1 1.But et théorie: Le but de cette expérience est de comprendre l'intérêt de la spectrophotométrie d'absorption moléculaire

Plus en détail

Complexité. Licence Informatique - Semestre 2 - Algorithmique et Programmation

Complexité. Licence Informatique - Semestre 2 - Algorithmique et Programmation Complexité Objectifs des calculs de complexité : - pouvoir prévoir le temps d'exécution d'un algorithme - pouvoir comparer deux algorithmes réalisant le même traitement Exemples : - si on lance le calcul

Plus en détail

QUELQUES CONSEILS POUR LA MAINTENANCE DE VOTRE ORDINATEUR

QUELQUES CONSEILS POUR LA MAINTENANCE DE VOTRE ORDINATEUR QUELQUES CONSEILS POUR LA MAINTENANCE DE VOTRE ORDINATEUR Table des matières 1. AVANT-PROPOS...2 2.CRÉER UN POINT de RESTAURATION - RESTAURER le SYSTÈME...2 2.1 Créer un point de restauration...3 2.2 Restaurer

Plus en détail

MABioVis. Bio-informatique et la

MABioVis. Bio-informatique et la MABioVis Modèles et Algorithmes pour la Bio-informatique et la Visualisation Visite ENS Cachan 5 janvier 2011 MABioVis G GUY MELANÇON (PR UFR Maths Info / EPI GRAVITE) (là, maintenant) - MABioVis DAVID

Plus en détail

Objectifs du cours d aujourd hui. Informatique II : Cours d introduction à l informatique et à la programmation objet. Complexité d un problème (2)

Objectifs du cours d aujourd hui. Informatique II : Cours d introduction à l informatique et à la programmation objet. Complexité d un problème (2) Objectifs du cours d aujourd hui Informatique II : Cours d introduction à l informatique et à la programmation objet Complexité des problèmes Introduire la notion de complexité d un problème Présenter

Plus en détail

L apprentissage automatique

L apprentissage automatique L apprentissage automatique L apprentissage automatique L'apprentissage automatique fait référence au développement, à l analyse et à l implémentation de méthodes qui permettent à une machine d évoluer

Plus en détail

Dr E. CHEVRET UE2.1 2013-2014. Aperçu général sur l architecture et les fonctions cellulaires

Dr E. CHEVRET UE2.1 2013-2014. Aperçu général sur l architecture et les fonctions cellulaires Aperçu général sur l architecture et les fonctions cellulaires I. Introduction II. Les microscopes 1. Le microscope optique 2. Le microscope à fluorescence 3. Le microscope confocal 4. Le microscope électronique

Plus en détail

TD de Biochimie 4 : Coloration.

TD de Biochimie 4 : Coloration. TD de Biochimie 4 : Coloration. Synthèse de l expérience 2 Les questions posées durant l expérience 2 Exposé sur les méthodes de coloration des molécules : Générique Spécifique Autres Questions Pourquoi

Plus en détail

Segmentation d'images à l'aide d'agents sociaux : applications GPU

Segmentation d'images à l'aide d'agents sociaux : applications GPU Segmentation d'images à l'aide d'agents sociaux : applications GPU Richard MOUSSA Laboratoire Bordelais de Recherche en Informatique (LaBRI) - UMR 5800 Université de Bordeaux - France Laboratoire de recherche

Plus en détail

SERVICES DE SEQUENÇAGE

SERVICES DE SEQUENÇAGE MARCH 16, 2014 SERVICES DE SEQUENÇAGE Centre d innovation Génome Québec et Université McGill Services de Validation et détection de SNP Technologie de Séquençage de Nouvelle Génération Guide de l utilisateur

Plus en détail

Régime de retraite patronal-syndical (Québec) de l'association internationale des machinistes (A.I.M.)

Régime de retraite patronal-syndical (Québec) de l'association internationale des machinistes (A.I.M.) Régime de retraite patronal-syndical (Québec) de l'association internationale des machinistes (A.I.M.) 2002 Pourquoi la planification de la retraite est-elle importante? Peu importe vos projets pour la

Plus en détail

Algorithmes d'apprentissage

Algorithmes d'apprentissage Algorithmes d'apprentissage 1 Agents qui apprennent à partir d'exemples La problématique : prise de décision automatisée à partir d'un ensemble d'exemples Diagnostic médical Réponse à une demande de prêt

Plus en détail

La correction des erreurs d'enregistrement et de traitement comptables

La correction des erreurs d'enregistrement et de traitement comptables La correction des erreurs d'enregistrement et de traitement comptables Après l'étude des différents types d'erreurs en comptabilité (Section 1) nous étudierons la cause des erreurs (Section 2) et les techniques

Plus en détail

Journée SITG, Genève 15 octobre 2013. Nicolas Lachance-Bernard M.ATDR Doctorant, Laboratoire de systèmes d information géographique

Journée SITG, Genève 15 octobre 2013. Nicolas Lachance-Bernard M.ATDR Doctorant, Laboratoire de systèmes d information géographique Monitorint spatio-temporel intégré de la mobilité urbaine Monitoring spatio-temporel de l ADN urbain Une réponse aux défis, problèmes, enjeux et risques des milieux urbains Nicolas Lachance-Bernard M.ATDR

Plus en détail

Arithmétique binaire. Chapitre. 5.1 Notions. 5.1.1 Bit. 5.1.2 Mot

Arithmétique binaire. Chapitre. 5.1 Notions. 5.1.1 Bit. 5.1.2 Mot Chapitre 5 Arithmétique binaire L es codes sont manipulés au quotidien sans qu on s en rende compte, et leur compréhension est quasi instinctive. Le seul fait de lire fait appel au codage alphabétique,

Plus en détail

Casisa Anthony DOSSIER PERSONNEL

Casisa Anthony DOSSIER PERSONNEL Casisa Anthony TSSI DOSSIER PERSONNEL Année scolaire 2012-2013 La voiture solaire I) Planification 1) Introduction Dans le cadre du Projet Pluridisciplinaire Encadré en classe de Terminale SSI, nous avons

Plus en détail

Reaper : utilisations avancées

Reaper : utilisations avancées Reaper : utilisations avancées Reaper dispose de ressources qui, sans être cachées, ne sont pas toujours faciles à trouver, d'autant plus que souvent on n'imagine même pas que ces choses soient possible!...

Plus en détail

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé A. P. M. E. P. Exercice 1 5 points 1. Réponse d. : 1 e Le coefficient directeur de la tangente est négatif et n est manifestement pas 2e

Plus en détail

EXERCICES : MECANISMES DE L IMMUNITE : pages 406 407 408 409 410

EXERCICES : MECANISMES DE L IMMUNITE : pages 406 407 408 409 410 EXERCICES : MECANISMES DE L IMMUNITE : pages 406 407 408 409 410 EXERCICE 1 PAGE 406 : EXPERIENCES A INTERPRETER Question : rôles respectifs du thymus et de la moelle osseuse dans la production des lymphocytes.

Plus en détail

"La collimation est la première cause de mauvaises images dans les instruments amateurs" Walter Scott Houston

La collimation est la première cause de mauvaises images dans les instruments amateurs Walter Scott Houston "La collimation est la première cause de mauvaises images dans les instruments amateurs" Walter Scott Houston F.Defrenne Juin 2009 Qu est-ce que la collimation en fait? «Newton»? Mais mon télescope est

Plus en détail

ANALYSE DE RISQUE AVEC LA MÉTHODE MEHARI Eric Papet e.papet@dev1-0.com Co-Fondateur SSII DEV1.0 Architecte Logiciel & Sécurité Lead Auditor ISO 27001

ANALYSE DE RISQUE AVEC LA MÉTHODE MEHARI Eric Papet e.papet@dev1-0.com Co-Fondateur SSII DEV1.0 Architecte Logiciel & Sécurité Lead Auditor ISO 27001 ANALYSE DE RISQUE AVEC LA MÉTHODE MEHARI Eric Papet e.papet@dev1-0.com Co-Fondateur SSII DEV1.0 Architecte Logiciel & Sécurité Lead Auditor ISO 27001 PLAN Introduction Générale Introduction MEHARI L'analyse

Plus en détail

Calculateur quantique: factorisation des entiers

Calculateur quantique: factorisation des entiers Calculateur quantique: factorisation des entiers Plan Introduction Difficulté de la factorisation des entiers Cryptographie et la factorisation Exemple RSA L'informatique quantique L'algorithme quantique

Plus en détail

Précisions à propos des services de placement. Ordres et politique d'exécution des ordres

Précisions à propos des services de placement. Ordres et politique d'exécution des ordres Précisions à propos des services de placement Ordres et politique d'exécution des ordres Introduction Dans les Précisions à propos des services de placement, DEGIRO donne le contenu détaillé des accords

Plus en détail

Initiation à la programmation en Python

Initiation à la programmation en Python I-Conventions Initiation à la programmation en Python Nom : Prénom : Une commande Python sera écrite en caractère gras. Exemples : print 'Bonjour' max=input("nombre maximum autorisé :") Le résultat de

Plus en détail

CAHIER DE S CHARGE S Remote Workload Manager

CAHIER DE S CHARGE S Remote Workload Manager CAHIER DE S CHARGE S Remote Workload Manager équipe Regis Rouyard (rouyar_r) Jonathan Bouchot (boucho_o) Johan Massin (massin_j) Jacky Rouquette (rouque_j) Yannick Boillon (boillo_o) EPITECH INOVATION

Plus en détail

CHAPITRE VIII : Les circuits avec résistances ohmiques

CHAPITRE VIII : Les circuits avec résistances ohmiques CHAPITRE VIII : Les circuits avec résistances ohmiques VIII. 1 Ce chapitre porte sur les courants et les différences de potentiel dans les circuits. VIII.1 : Les résistances en série et en parallèle On

Plus en détail

Info0804. Cours 6. Optimisation combinatoire : Applications et compléments

Info0804. Cours 6. Optimisation combinatoire : Applications et compléments Recherche Opérationnelle Optimisation combinatoire : Applications et compléments Pierre Delisle Université de Reims Champagne-Ardenne Département de Mathématiques et Informatique 17 février 2014 Plan de

Plus en détail

Mise en place d une solution automatique de stockage et de visualisation de données de capture des interactions chromatiniennes à l échelle génomique

Mise en place d une solution automatique de stockage et de visualisation de données de capture des interactions chromatiniennes à l échelle génomique Rapport de stage de deuxième année de DUT Génie Biologique option Bioinformatique Mise en place d une solution automatique de stockage et de visualisation de données de capture des interactions chromatiniennes

Plus en détail

LES INDICATEURS CLÉ DE PERFORMANCE : DÉFINIR ET AGIR

LES INDICATEURS CLÉ DE PERFORMANCE : DÉFINIR ET AGIR Online Intelligence Solutions LES INDICATEURS CLÉ DE PERFORMANCE : DÉFINIR ET AGIR Comment intégrer les KPI à sa stratégie d entreprise? Par Jacques Warren WHITE PAPER WHITE PAPER A PROPOS DE JACQUES WARREN

Plus en détail

Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé

Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé EXERCICE 1 5 points Commun à tous les candidats 1. Réponse c : ln(10)+2 ln ( 10e 2) = ln(10)+ln ( e 2) = ln(10)+2 2. Réponse b : n 13 0,7 n 0,01

Plus en détail

D'UN THÉORÈME NOUVEAU

D'UN THÉORÈME NOUVEAU DÉMONSTRATION D'UN THÉORÈME NOUVEAU CONCERNANT LES NOMBRES PREMIERS 1. (Nouveaux Mémoires de l'académie royale des Sciences et Belles-Lettres de Berlin, année 1771.) 1. Je viens de trouver, dans un excellent

Plus en détail

5 semaines pour apprendre à bien jouer un morceau de piano

5 semaines pour apprendre à bien jouer un morceau de piano 5 semaines pour apprendre à bien jouer un morceau de piano Ce guide peut être librement imprimé et redistribué gratuitement. Vous pouvez pouvez l'offrir ou le faire suivre à vos amis musiciens. En revanche,

Plus en détail

Master de Bioinformatique et Biologie des Systèmes Toulouse http://m2pbioinfo.biotoul.fr Responsable : Pr. Gwennaele Fichant

Master de Bioinformatique et Biologie des Systèmes Toulouse http://m2pbioinfo.biotoul.fr Responsable : Pr. Gwennaele Fichant Master de Bioinformatique et Biologie des Systèmes Toulouse http://m2pbioinfo.biotoul.fr Responsable : Pr. Gwennaele Fichant Parcours: Master 1 : Bioinformatique et biologie des Systèmes dans le Master

Plus en détail

Représentation des Nombres

Représentation des Nombres Chapitre 5 Représentation des Nombres 5. Representation des entiers 5.. Principe des représentations en base b Base L entier écrit 344 correspond a 3 mille + 4 cent + dix + 4. Plus généralement a n a n...

Plus en détail

L informatique comme discipline au gymnase. Renato Renner Institut für Theoretische Physik ETH Zürich

L informatique comme discipline au gymnase. Renato Renner Institut für Theoretische Physik ETH Zürich L informatique comme discipline au gymnase Renato Renner Institut für Theoretische Physik ETH Zürich Comment puis-je transférer des fichiers de musique sur mon nouvel iphone? Comment puis-je archiver mes

Plus en détail

INSTALLATION POUR LA MESURE EN CELLULE BLINDÉE DU VOLUME DES AIGUILLES COMBUSTIBLES PROKUDANOV D.L., TROITSKII S.V.

INSTALLATION POUR LA MESURE EN CELLULE BLINDÉE DU VOLUME DES AIGUILLES COMBUSTIBLES PROKUDANOV D.L., TROITSKII S.V. CEA CEN-SACLAY Service de Documentation Groupe "Traductions" CEA-TR- 2266 R2 91191 GIF sur YVETTE CEDEX INSTALLATION POUR LA MESURE EN CELLULE BLINDÉE DU VOLUME DES AIGUILLES COMBUSTIBLES PROKUDANOV D.L.,

Plus en détail

CHAPITRE VI ALEAS. 6.1.Généralités.

CHAPITRE VI ALEAS. 6.1.Généralités. CHAPITRE VI ALEAS 6.1.Généralités. Lors de la synthèse des systèmes logique (combinatoires ou séquentiels), nous avons supposé, implicitement, qu une même variable secondaire avait toujours la même valeur

Plus en détail

TP n 2 Concepts de la programmation Objets Master 1 mention IL, semestre 2 Le type Abstrait Pile

TP n 2 Concepts de la programmation Objets Master 1 mention IL, semestre 2 Le type Abstrait Pile TP n 2 Concepts de la programmation Objets Master 1 mention IL, semestre 2 Le type Abstrait Pile Dans ce TP, vous apprendrez à définir le type abstrait Pile, à le programmer en Java à l aide d une interface

Plus en détail

Système immunitaire artificiel

Système immunitaire artificiel République Algérienne Démocratique et Populaire Ministère de l Enseignement Supérieure Université des Sciences et de la Technologie D Oran Mohammed Boudiaf (USTO) Faculté des Sciences Département d Informatique

Plus en détail

Chapitre V : La gestion de la mémoire. Hiérarchie de mémoires Objectifs Méthodes d'allocation Simulation de mémoire virtuelle Le mapping

Chapitre V : La gestion de la mémoire. Hiérarchie de mémoires Objectifs Méthodes d'allocation Simulation de mémoire virtuelle Le mapping Chapitre V : La gestion de la mémoire Hiérarchie de mémoires Objectifs Méthodes d'allocation Simulation de mémoire virtuelle Le mapping Introduction Plusieurs dizaines de processus doivent se partager

Plus en détail

a) La technique de l analyse discriminante linéaire : une brève présentation. 3 étapes de la méthode doivent être distinguées :

a) La technique de l analyse discriminante linéaire : une brève présentation. 3 étapes de la méthode doivent être distinguées : a) La technique de l analyse discriminante linéaire : une brève présentation. Nous nous limiterons ici à l'analyse discriminante linéaire et à deux groupes : - linéaire, la variante utilisée par ALTMAN

Plus en détail

POKER ET PROBABILITÉ

POKER ET PROBABILITÉ POKER ET PROBABILITÉ Le poker est un jeu de cartes où la chance intervient mais derrière la chance il y a aussi des mathématiques et plus précisément des probabilités, voici une copie d'écran d'une main

Plus en détail

Analyse hiérarchique de tâches (AHT)

Analyse hiérarchique de tâches (AHT) (AHT) Définition Cette méthode consiste à décomposer la tâche principale (ou le but) de l'opérateur en sous-tâches (ou sous-buts), puis chacune de ces sous-tâches en plusieurs sous-sous-tâches, et ainsi

Plus en détail

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Le Data Mining au service du Scoring ou notation statistique des emprunteurs! France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative

Plus en détail

Les réseaux cellulaires

Les réseaux cellulaires Les réseaux cellulaires Introduction Master 2 Professionnel STIC-Informatique Module RMHD 1 Introduction Les réseaux cellulaires sont les réseaux dont l'évolution a probablement été la plus spectaculaire

Plus en détail

6. Les différents types de démonstrations

6. Les différents types de démonstrations LES DIFFÉRENTS TYPES DE DÉMONSTRATIONS 33 6. Les différents types de démonstrations 6.1. Un peu de logique En mathématiques, une démonstration est un raisonnement qui permet, à partir de certains axiomes,

Plus en détail

Raisonnement par récurrence Suites numériques

Raisonnement par récurrence Suites numériques Chapitre 1 Raisonnement par récurrence Suites numériques Terminale S Ce que dit le programme : CONTENUS CAPACITÉS ATTENDUES COMMENTAIRES Raisonnement par récurrence. Limite finie ou infinie d une suite.

Plus en détail

Cours admin 200x serveur : DNS et Netbios

Cours admin 200x serveur : DNS et Netbios LE SERVICE DNS Voici l'adresse d'un site très complet sur le sujet (et d'autres): http://www.frameip.com/dns 1- Introduction : Nom Netbios et DNS Résolution de Noms et Résolution inverse Chaque composant

Plus en détail

Didacticiel du service cartographique en cache

Didacticiel du service cartographique en cache Didacticiel du service cartographique en cache Copyright 1995-2012 Esri All rights reserved. Table of Contents Didacticiel : Création d'un service de carte mis en cache................... 3 Copyright 1995-2012

Plus en détail

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1 Christophe CANDILLIER Cours de DataMining mars 2004 age 1 1. Introduction 2. rocessus du DataMining 3. Analyse des données en DataMining 4. Analyse en Ligne OLA 5. Logiciels 6. Bibliographie Christophe

Plus en détail

SOUTIEN INFORMATIQUE DEP 5229

SOUTIEN INFORMATIQUE DEP 5229 SOUTIEN INFORMATIQUE DEP 5229 Le Diplôme d études professionnelles D.E.P. en soutien informatique a une durée totale de 1800 heures à temps plein. Le programme permet de développer les compétences nécessaires

Plus en détail

Tout savoir sur le matériel informatique

Tout savoir sur le matériel informatique Tout savoir sur le matériel informatique Thème de l exposé : Les Processeurs Date : 05 Novembre 2010 Orateurs : Hugo VIAL-JAIME Jérémy RAMBAUD Sommaire : 1. Introduction... 3 2. Historique... 4 3. Relation

Plus en détail

Partie 7 : Gestion de la mémoire

Partie 7 : Gestion de la mémoire INF3600+INF2610 Automne 2006 Partie 7 : Gestion de la mémoire Exercice 1 : Considérez un système disposant de 16 MO de mémoire physique réservée aux processus utilisateur. La mémoire est composée de cases

Plus en détail

GUIDE DE L'ARCHIVAGE OCTOBRE 2012

GUIDE DE L'ARCHIVAGE OCTOBRE 2012 GUIDE DE L'ARCHIVAGE OCTOBRE 2012 SOMMAIRE - Introduction Page 1 - Coordonnées du service d Archives de l INSERM Page 2 - Glossaire Page 3 - Les archives dans les bureaux Page 4 - Les archives administratives

Plus en détail

INF2015 Développement de logiciels dans un environnement Agile. Examen intra 20 février 2014 17:30 à 20:30

INF2015 Développement de logiciels dans un environnement Agile. Examen intra 20 février 2014 17:30 à 20:30 Examen intra 20 février 2014 17:30 à 20:30 Nom, prénom : Code permanent : Répondez directement sur le questionnaire. Question #1 5% Quelle influence peut avoir le typage dynamique sur la maintenabilité

Plus en détail

Conditions : stage indemnisé, aide au logement possible, transport CEA en Ile-de-France gratuit.

Conditions : stage indemnisé, aide au logement possible, transport CEA en Ile-de-France gratuit. Proposition de stage de BAC+4 ou BAC+5 Pro ou Recherche Etude comparative des outils de vérification d'algorithmes parallèles Logiciels (LSL), localisé à Palaiseau (Essonne), développe les outils d'aide

Plus en détail

2. Activités et Modèles de développement en Génie Logiciel

2. Activités et Modèles de développement en Génie Logiciel 2. Activités et Modèles de développement en Génie Logiciel Bernard ESPINASSE Professeur à l'université d'aix-marseille Plan Les Activités du GL Analyse des besoins Spécification globale Conceptions architecturale

Plus en détail

Recherche dans un tableau

Recherche dans un tableau Chapitre 3 Recherche dans un tableau 3.1 Introduction 3.1.1 Tranche On appelle tranche de tableau, la donnée d'un tableau t et de deux indices a et b. On note cette tranche t.(a..b). Exemple 3.1 : 3 6

Plus en détail

Cours de Master Recherche

Cours de Master Recherche Cours de Master Recherche Spécialité CODE : Résolution de problèmes combinatoires Christine Solnon LIRIS, UMR 5205 CNRS / Université Lyon 1 2007 Rappel du plan du cours 16 heures de cours 1 - Introduction

Plus en détail

Séquençage et Assemblage. de Génomes. François Denizot Emmanuel Talla LCB-IBSM CNRS denizot@ibsm.cnrs-mrs.fr talla@ibsm.cnrs-mrs.

Séquençage et Assemblage. de Génomes. François Denizot Emmanuel Talla LCB-IBSM CNRS denizot@ibsm.cnrs-mrs.fr talla@ibsm.cnrs-mrs. Séquençage et Assemblage de Génomes François Denizot Emmanuel Talla LCB-IBSM CNRS denizot@ibsm.cnrs-mrs.fr talla@ibsm.cnrs-mrs.fr Projet de séquençage d un génome Séquençage aléatoire Assemblage Annotation

Plus en détail

Reconstruction de bâtiments en 3D à partir de nuages de points LIDAR

Reconstruction de bâtiments en 3D à partir de nuages de points LIDAR Reconstruction de bâtiments en 3D à partir de nuages de points LIDAR Mickaël Bergem 25 juin 2014 Maillages et applications 1 Table des matières Introduction 3 1 La modélisation numérique de milieux urbains

Plus en détail

Seconde et première Exercices de révision sur les probabilités Corrigé

Seconde et première Exercices de révision sur les probabilités Corrigé I_ L'univers. _ On lance simultanément deux dés indiscernables donc il n'y a pas d'ordre. Il y a répétition, les dbles. On note une issue en écrivant le plus grand chiffre puis le plus petit. 32 signifie

Plus en détail

PRINCIPE MICROSCOPIE CONFOCALE

PRINCIPE MICROSCOPIE CONFOCALE PRINCIPE MICROSCOPIE CONFOCALE Un microscope confocal est un système pour lequel l'illumination et la détection sont limités à un même volume de taille réduite (1). L'image confocale (ou coupe optique)

Plus en détail

Chaînes de Markov au lycée

Chaînes de Markov au lycée Journées APMEP Metz Atelier P1-32 du dimanche 28 octobre 2012 Louis-Marie BONNEVAL Chaînes de Markov au lycée Andreï Markov (1856-1922) , série S Problème 1 Bonus et malus en assurance automobile Un contrat

Plus en détail

GénoToul 2010, Hôtel de Région Midi Pyrénées, Toulouse, 10 décembre 2010

GénoToul 2010, Hôtel de Région Midi Pyrénées, Toulouse, 10 décembre 2010 GénoToul 2010, Hôtel de Région Midi Pyrénées, Toulouse, 10 décembre 2010 Analyse de la diversité moléculaire des régions génomiques de 30 gènes du développement méristématique dans une core collection

Plus en détail

CAPTEURS - CHAINES DE MESURES

CAPTEURS - CHAINES DE MESURES CAPTEURS - CHAINES DE MESURES Pierre BONNET Pierre Bonnet Master GSI - Capteurs Chaînes de Mesures 1 Plan du Cours Propriétés générales des capteurs Notion de mesure Notion de capteur: principes, classes,

Plus en détail

Série TD 3. Exercice 4.1. Exercice 4.2 Cet algorithme est destiné à prédire l'avenir, et il doit être infaillible! Exercice 4.3. Exercice 4.

Série TD 3. Exercice 4.1. Exercice 4.2 Cet algorithme est destiné à prédire l'avenir, et il doit être infaillible! Exercice 4.3. Exercice 4. Série TD 3 Exercice 4.1 Formulez un algorithme équivalent à l algorithme suivant : Si Tutu > Toto + 4 OU Tata = OK Alors Tutu Tutu + 1 Tutu Tutu 1 ; Exercice 4.2 Cet algorithme est destiné à prédire l'avenir,

Plus en détail

TP N 3 La composition chimique du vivant

TP N 3 La composition chimique du vivant Thème 1 : La Terre dans l'univers, la vie et l'évolution du vivant : une planète habitée Chapitre II : La nature du vivant TP N 3 La composition chimique du vivant Les conditions qui règnent sur terre

Plus en détail

Le chiffre est le signe, le nombre est la valeur.

Le chiffre est le signe, le nombre est la valeur. Extrait de cours de maths de 6e Chapitre 1 : Les nombres et les opérations I) Chiffre et nombre 1.1 La numération décimale En mathématique, un chiffre est un signe utilisé pour l'écriture des nombres.

Plus en détail

Introduction à MATLAB R

Introduction à MATLAB R Introduction à MATLAB R Romain Tavenard 10 septembre 2009 MATLAB R est un environnement de calcul numérique propriétaire orienté vers le calcul matriciel. Il se compose d un langage de programmation, d

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme

Plus en détail