COURS D ANALYSE DES GENOMES
|
|
|
- Julien Lussier
- il y a 10 ans
- Total affichages :
Transcription
1
2 COURS D ANALYSE DES GENOMES ANNEE UNIVERSITAIRE * * * * * * Codirecteurs du Cours : Bernard DUJON et Stéphane LE CROM Chef de Travaux : Lionel FRANGEUL * * * * * * LE COURS SE DEROULE DU 4 NOVEMBRE AU 20 DECEMBRE 2013 AU CENTRE D ENSEIGNEMENT DE L INSTITUT PASTEUR (PAVILLON LOUIS MARTIN, BATIMENT 09) 28, RUE DU DOCTEUR ROUX, PARIS CEDEX 15 CONFERENCES ET COURS : - DU 4 AU 8 NOVEMBRE 2013 : SALLE DE COURS 2 (CENTRE D ENSEIGNEMENT, PLM, BATIMENT 09) - DU 12 NOV. AU 13 DEC.2013 : SALLE DE COURS 4 (BATIMENT SOCIAL 06) - DU 16 AU 20 DECEMBRE 2013 : SALLE DE COURS 2 (CENTRE D ENSEIGNEMENT, PLM, BATIMENT 09) TRAVAUX PRATIQUES : SALLE DE TP 2EME ETAGE DU CENTRE D ENSEIGNEMENT (PLM, BATIMENT 09)
3 PRESENTATION DU COURS
4 Préambule au cours d Analyse des Génomes La Génétique est la Science qui étudie l hérédité. Or, quiconque s interroge sur les différences entre un objet physique, par exemple un nuage, et un organisme vivant, par exemple une souris, arrivera tôt ou tard à la conclusion inévitable qu il n y en a qu une: l hérédité. Car, comme les nuages, les organismes vivants suivent les lois de la physicochimie (voir Schrödinger, 1944). Ils sont constitués des mêmes atomes. Mais, alors qu un nuage se forme à une date et en un lieu donnés comme la conséquence d un ensemble de valeurs précises d humidité, de pression et de température sans souvenir de la présence éventuelle d un autre nuage, similaire ou non, à une date antérieure, une souris naît à partir de deux autres souris préexistantes qui, elles-mêmes, avaient des parents, etc Pour sa formation à partir des atomes et des molécules qui la constitueront, une souris hérite, dès l oeuf, du fruit de l évolution de tous ses ancêtres, proches et lointains, tandis que le nuage part de zéro. Les êtres vivants ont donc, en plus de la physique, une histoire portée de génération en génération par le matériel héréditaire. Connaître ce matériel héréditaire et son fonctionnement c est donc lire l histoire des êtres vivants, comprendre leur complexité et, finalement, appréhender ce qui les distingue du monde inanimé. C'était toujours l objet même de la Génétique depuis son origine même si les méthodes d analyse n ont longtemps permis de lever que quelques pans du voile. Avec l analyse des génomes, notre connaissance du matériel héréditaire devient exhaustive et, s éloignant progressivement des systèmes modèles qui furent si précieux à la Génétique, la Génomique explore maintenant le monde vivant dans son intégralité et, progrès techniques aidant, à travers tout le spectre d'échelles qui relie les molécules élémentaires aux populations naturelles. Des horizons insoupçonnés se découvrent. Les notions classiques font place à des visions nouvelles qui nous permettent même d imaginer des mondes que la Biologie synthétique essai de construire. Pour bien appréhender ces idées, un bref retour en arrière s impose. La Génétique, science des génomes Les bases de la génétique moléculaire Au cours du siècle dernier, nos connaissances sur le matériel héréditaire ont progressé d une manière considérable. Depuis les chromosomes eucaryotes, corpuscules observables au microscope au cours des divisions cellulaires dont le comportement trahissait leur rôle dans l hérédité pour ceux qui connaissaient les lois de Mendel, on est passé à l ADN grâce aux bactéries (Avery et al., 1944, Watson et Crick, 1953). Puis, on a décrit la structure fine du gène grâce aux bactériophages (Benzer, 1961) et déchiffré le code génétique grâce essentiellement à la Biochimie (Crick et al., 1961, Nirenberg et al., 1961, Nishimura et al.,1965). Avec les opérons bactériens, on découvrait des principes de régulation de l'expression des gènes qui semblaient universels (Jacob et Monod, 1961). On savait, grâce aux champignons, qu à chaque gène correspondait une protéine (Beadle et Tatum, 1941). Et le dogme central de la Biologie moléculaire (datant de 1953, voir figure) nous indiquait comment les ARNs, jouant le rôle d'intermédiaires, étaient impliqués dans l'expression des gènes pour former ces protéines. Nul ne doutait alors que ces principes étaient universels et certains, pensant que l'on avait compris l'essentiel, se détournèrent à ce moment de la biologie moléculaire des gènes pour s'intéresser au développement des organismes, au fonctionnement du système nerveux ou à d'autres problématiques jugées plus complexes.
5 Les ARNs Pourtant, la Génétique moléculaire devait révéler encore bien d'autres surprises sans lesquelles l analyse des génomes aujourd hui serait incompréhensible. D'abord, on découvrit que les ARNs peuvent être retrotranscrits sous forme d'adn pouvant être intégré au matériel génétique et donc transmis à la descendance (Temin et Mizutani, 1970, Baltimore, 1970). Dès lors, les ARNs n'étaient plus seulement des intermédiaires de l'expression des gènes, ils pouvaient donner naissance au matériel héréditaire. Ensuite, dès que l'on a pu étudier directement la structure moléculaire des gènes, grâce aux techniques de l ADN recombinant et du Génie génétique (développées à partir de 1973), celle-ci est immédiatement apparue beaucoup plus complexe qu'on ne l'imaginait. Et même surprenante. On découvrit les introns, séquences internes des ARNs transcrites de l'adn mais éliminées des molécules d'arn finales par épissage des séquences qui les entourent, les exons (Berget et al. 1977, Chow et al., 1977, Glover et Hogness, 1977, Jeffreys et Flavell, 1977, Gilbert, 1978). On parlait de gènes mosaïques que l on commençait à séquencer en essayant d interpréter les résultats selon les principes du dogme central de la biologie moléculaire. Figure 1 : Evolution du dogme central de la biologie moléculaire. De simples intermédiaires de l'expression des gènes en 1953, les ARN sont progressivement devenus "le cœur du génome fonctionnel", l'adn n'étant que la forme chimiquement stable de l'information génétique qui passe les générations et est donc le véhicule de l'hérédité des organismes modernes. L'histoire de la biologie moléculaire et les technologies disponibles font que ce sont les séquences d'adn qui sont déterminées et stockées dans les bases de données, avec celles des protéines déduites. Ce n est que depuis l application des nouvelles techniques de séquençage aux ARN (par intermédiaire de copies ADN) que l on peut enfin étudier en profondeur la variété des molécules d ARN dans les cellules, y compris celles de courte durée de vie, et que l'on a compris que la quasi-totalité du génome est transcrit en un très grand nombre de molécules d'arns partiellement chevauchantes et dont l'immense majorité sont non-codantes.
6 En réalité, on était en train de mettre en lumière le rôle central des ARNs, les gènes n en étant que le reflet. On sait maintenant qu'il existe plusieurs catégories d'introns et les différents mécanismes de l'épissage des ARNs ont été identifiés. On découvrit que, dans la plupart des cas, ce sont les ARNs eux-mêmes qui catalysent ces réactions d épissage (voir plus loin) même si, pour ce faire, ils sont parfois associés à des protéines. Sans entrer dans les détails pourtant très significatifs, l'idée importante ici est qu'entre le gène et son produit s'intercalent une série de réactions qui modifient, souvent considérablement, les séquences des populations de molécules d'arns présentes dans la cellule. Or, c est le séquençage de l ADN qui s est développé en donnant naissance à la génomique, les molécules d ARNs, elles, sont chimiquement très réactives, et leur séquençage direct (sans faire une copie ADN) reste, pour l instant, inaccessible à une échelle globale (voir plus loin). Les débuts du séquençage de l ADN Les premières méthodes qui permirent de déterminer rapidement l'ordre de succession des nucléotides le long des molécules d'adn (séquencer l'adn) datent de 1977 (Sanger et al., 1977, Maxam et Gilbert, 1977). C est une date critique. Avant, on savait conceptuellement ce que devait être un gène et ses mutations, mais sans espoir d en connaître réellement le contenu informatif précis. Après, on allait pouvoir déchiffrer ce contenu, vieux rêve de tous les généticiens. Ces méthodes sont aujourd'hui reléguées aux musées (voir plus loin), mais il s'agissait alors d'un progrès considérable qui faisait suite à des années de recherches au cours desquelles avaient été explorées différentes pistes permettant de déterminer des séquences courtes d ADN comme, par exemple, les opérateurs bactériens. Ce n est donc qu à partir de 1977 que l on a commencé à connaître l'information génétique contenue dans les gènes. Une accélération considérable des découvertes de la génétique moléculaire s'ensuivit. Les mutations n'étaient plus uniquement des signatures conceptuelles associées à des phénotypes particuliers dans des conditions définies du laboratoire. On en découvrait maintenant la nature chimique et, en conséquence, on allait pouvoir les créer chimiquement de façon déterminée. Toute l'histoire de la mutagénèse dirigée débutait, suivie plus tard de celle de la synthèse chimique des gènes et maintenant de celle des génomes entiers (voir plus loin). Comme le dogme central de la biologie moléculaire associé au code génétique permettent de prédire les séquences des protéines à partir de celles des gènes (aux modifications près introduites au niveau des ARNs), au début des années 1980s on séquençait les gènes pour avoir la séquence des protéines. Mais le séquençage d ADN restait laborieux et le souci était d éviter la duplication des efforts. Naissaient alors les premières bases de données permettant de mettre à la disposition de la communauté scientifique les séquences d'adn et celles, déduites, de protéines. Peu à peu, comme ces répertoires s'enrichissaient, les comparaisons de séquences devenaient possibles. Graduellement, elles allaient prendre le pas sur les expériences. En même temps, on s'intéressait aux séquences régulatrices de l'expression des gènes que l'on pouvait maintenant manipuler dans des systèmes artificiels d'expression génétique. On s'intéressait évidemment aussi aux premiers gènes morbides identifiés chez l'homme. On espérait en tirer rapidement des traitements (et des retombées financières!). On s'intéressait aux génomes des organelles, des plasmides et des virus dont les tailles limitées permettaient d'obtenir les séquences complètes en seulement. quelques années de travail! C était l époque du Génie génétique triomphant. Certains, pensant alors que l on avait tout compris, ne rêvaient que d applications. Elles furent décevantes pour la plupart car très prématurées.
7 Figure 2 : Une brève histoire de la biologie moléculaire jusqu'à la génomique actuelle. L ingénierie génomique C'est pourtant à cette époque que furent découverts les premiers outils d'ingénierie des génomes. Des endonucléases dont la spécificité de séquence permettait d'envisager cibler un site unique dans un génome entier. La première catégorie d'enzymes de cette nature, appelée maintenant homing endonucleases, avait été découverte à partir d' un intron mobile d'un gène mitochondrial de levure présentant des anomalies de transmission héréditaire lors des croisements (Jacquier et Dujon., 1985, Colleaux et al., 1986, Colleaux et al. 1988, Dujon, 2005a). Tout sauf le chemin direct souhaité par les tenants actuels de la recherche sur projets prédéfinis! De très nombreuses homing endonucleases sont connues actuellement issues d'une variété d'organismes ou synthétisées artificiellement pour des applications précises. Une deuxième catégorie d'endonucléases site-spécifiques est représentée par les protéines à doigt de zinc et, plus récemment, une troisième catégorie a été fabriquée artificiellement par ingénierie de molécules naturelles et synthétiques, les TALLE nucleases ou TALLEN. Avec ces outils, et tout ce que l'on a appris sur les génomes (voir plus loin), on peut raisonnablement espérer maintenant qu'une véritable ère de Génie génomique s'ouvre à nous. Les multiples fonctions des ARNs Pendant ce temps, les ARNs continuèrent de nous surprendre. D'abord, on découvrit qu'ils subissent des éditions, c'est-à-dire que leur séquence est modifiée de façon précise et déterminée, changeant ainsi l'information génétique qu'ils étaient censés véhiculer. On
8 connaît maintenant beaucoup de mécanismes différents d'édition. Dans certains cas, l'édition peut être tellement massive qu'elle crée des messagers traduits en protéines là où il n'y a pas de gène reconnaissable correspondant. C est le cas des mitochondries dans le grand groupe eucaryote des Excavates (voir figure). Mais surtout on découvrit que les ARNs sont capables de catalyser des réactions chimiques (Cech et al., 1981, Altman, 1981). D abord celles concernant leur propre structure (transesterifications permettant l'épissage des introns, hydrolyse des liaisons phosphodiester permettant la maturation des ARNs précurseurs). Mais aussi toute une variété d'autres réactions biochimiques. Aujourd'hui on sait que les ARNs sont impliqués, comme catalyseurs ou comme co-facteurs, dans une variété de réactions essentielles à la vie cellulaire telles que la synthèse protéique au niveau du ribosome, l'élongation des télomères (Greider and Blackburn, 1989), le transport des protéines, les processus de maturation ou de modifications chimiques d'autres ARNs et, bien sûr, le contrôle de l expression d autres gènes ainsi que des éléments mobiles, des séquencs virales ou des séquences répétées dans les génomes. On découvrit des machineries complexes chez les eucaryotes, impliquant des petits ARNs, pour ces dernièrs types d activités (Fire et al., 1998). Le nombre des petits ARNs et la variété de leurs propriétés ont augmenté très vite grâce, en particulier, aux nouvelles méthodes de séquençage. Le séquençage des génomes et le développement de la Génomique Les motifs Au milieu des années 1980s, les applications potentielles du génie génétique et d autres considérations plus stratégiques, voire politiques, allaient motiver le séquençage des génomes entiers, à commencer par celui de l'homme. Plusieurs années s'ensuivirent au cours desquelles hésitations, conflits et rebondissements ne furent pas rares. Contrairement aux idées simples, les progrès les plus décisifs ne vinrent pas toujours de là où on les attendait. Comme dans toute recherche véritable d'ailleurs. Des bactéries (comme Haemophilus influenzae), la levure de boulangerie Saccharomyces cerevisiae et le nématode Caenorhabditis elegans devaient jouer, chacun à leur manière, des rôles essentiels dans le programme "génome humain" alors qu'ils étaient des initiatives indépendantes (lire, par exemple, Vassarotti et al.,1995, Goujon, 2001, Brown, 2003). Ironiquement, alors que certains ne voyaient dans ces génomes que des tremplins technologiques pour le génome humain, c est sur le plan conceptuel que les choses commençaient à bouger. Les surprises Les premiers génomes séquencés (Fleischmann et al. 1995, Goffeau et al. 1996) nous rappelèrent rapidement à quel point des connaissances fondamentales nous manquaient. Avec le génome de la levure, trois surprises majeures attendaient les généticiens. D abord, il y avait dans le génome beaucoup plus de gènes pour chaque fonction que ce que la génétique laissait prévoir. En d autres termes, les cribles génétiques classiques mêmes les plus systématiquement appliqués n arrivaient jamais à l exhaustivité. Ensuite, beaucoup de gènes avaient des séquences entièrement nouvelles, sans similarité dans les bases de données existantes. Une explication triviale était que ces bases de données étaient très incomplètes, ce qui n était pas faux. Mais même aujourd hui chaque nouveau génome séquencé fait apparaître une fraction non nulle de tels gènes qu on désigne donc comme «orphelins». Une autre explication commune à l époque était que ces gènes orphelins n étaient pas des vrais gènes. Ce qui n est pas nécessairement faux non plus pour certain d entre eux. Mais leur nombre élevé exclu la généralisation de cette hypothèse. Une réalité plus intéressante, comprise seulement maintenant, est que certains des gènes orphelins sont en réalité des gènes créés de novo dans les différentes lignées évolutives. Enfin, la troisième surprise était que nombre de gènes étaient dupliqués. Ceci était incompréhensible dans la vision classique de mutations aléatoires soumises à la sélection naturelle. On sait maintenant que cette redondance est vraie pour tous les génomes, même si le cas de la levure était particulier. En d'autres termes, la nature ne connaît pas les génomes minimums dont rêvent les ingénieurs. La raison est à rechercher dans la dynamique évolutive perpétuelle des génomes (voir plus loin).
9 Les chiffres Actuellement, de nombreux génomes bactériens ont été séquencés entièrement ou partiellement (plus de projets sont mentionnés sur le site GOLD ( Il en va de même d'environ six cents génomes d'archaea (un déficit important comparé aux bactéries) et d'un nombre rapidement croissant d eucaryotes (environ sont terminés ou en cours). Historiquement, ce fut la levure Saccharomyces cerevisiae avec son génome d'environ 13 millions de nucléotides (Mb) le premier eucaryote séquencé (Goffeau et al. 1996, 1997). Puis, alors que le nombre de génomes bactériens augmentait, on a vu apparaître successivement les séquences de génomes eucaryotes plus grands tels que ceux de Caenorhabditis elegans, (97 Mb, Sulston, Waterston et Consortium, 1978), un nématode servant de modèle expérimental, et d'arabidopsis thaliana (115 Mb, Arabidopsis Genome Initiative, 2000), une crucifère modèle. Ces débuts étaient très laborieux. Ils nécessitaient plusieurs années de travail de consortiums de laboratoires qui établissaient d'abord une cartographie détaillée des génomes avant un séquençage ordonné des segments par la méthode de Sanger. Chacun de ces projets marquait une étape importante de la génomique naissante. Le génome humain Au tournant de l'an 2000, un premier assemblage du génome de Drosophila melanogaster (160 Mb) était publié, démontrant la faisabilité d'un séquençage aléatoire total, dit shotgun (Adams et al., 2000). Il s'agissait d'une étape importante dans la course au génome humain. Celui-ci (environ 3100 Mb) a été déclaré terminé dans une première version en 2001 (Collins et al., 2001, Venter et al., 2001). C'était un travail considérable qui avait impliqué pour l'international Human genome Consortium, le séquençage chromosome par chromosome, par l'intermédiaire de clones BAC ancrés sur une cartographie génétique, et qui s'est terminé par une compétition contre un groupe privé travaillant par séquençage total aléatoire (shotgun). Compétition biaisée car, alors que les séquences chromosome par chromosome du Consortium international étaient rendues immédiatement publiques, celles du groupe privé restaient confidentielles. Une version plus complète et révisée du génome humain fut publiée par l'international Human genome Sequencing Consortium (2004). Il s'agissait toujours d'un "génome théorique", c'est-à-dire d'un équivalent haploïde de plusieurs individus. Aujourd'hui, les génomes de plusieurs personnes vivantes sont séquencés et certains scientifiques connus ont souhaité voir leurs génomes publiés les premiers. Après plusieurs autres génomes de représentants de différentes populations ayant permis les premières comparaisons, un vaste projet d'étude du polymorphisme a été lancé impliquant le séquençage de plus d'un millier d'individus appartenant à 14 populations (1000 genomes international initiative). Avec les génomes individuels, on découvre qu'au-delà des SNPs et indels, le polymorphisme génétique entre les individus implique de grandes variations structurales dont l'importance était sousestimée, telles que de larges délétions, duplications ou inversions (Korbel et al., 2007) et des réarrangements balancés (Chen et al., 2008). Les variations du nombre de copies de segments de chromosomes (CNVs) sont maintenant reconnues comme une source majeure de polymorphisme des génomes. L'analyse des données de polymorphisme est en train de nous apporter de nombreuses informations sur les variations entre individus (Abecassis et al., 2012), l'origine des indels (Montgomery et al., 2013), les évènements de rétroduplications (Abyzov et al., 2013) ou encore les variations fonctionnelle d'expression des gènes (Lappalainen et al., 2013) pour ne citer que quelques exemples. Des espoirs considérables apparaissent dans le domaine des cancers (Khurana et al., 2013) en particulier grâce à la possibilité d'identifier des allèles à faible pénétrance Whiffin et al., 2013).
10 Les grands génomes Après la première version du génome humain apparurent les génomes d'autres vertébrés qui devaient jouer un rôle fondamental dans l'interprétation du génome humain. Il s'agit du Fugu (365 Mb, Aparicio et al., 2002), un poisson téléostéen, et de son cousin Tetraodon negroviridis (Jaillon et al., 2004). C'est avec ce dernier que, par comparaison détaillée, l'on réussit à déduire que le génome humain devait compter seulement gènes environ. Vinrent aussi les génomes du riz ( Mb, Goff et al. 2002, Yu et al., 2002, Yu et al., 2005), d Anopheles gambiae (278 Mb, Holt et al., 2002), un moustique vecteur de la malaria, d'autres nématodes (Stein et al., 2003, Mitreva et al., 2005), de la souris (Waterston et al., 2002, Mouse genome consortium, 2002), du rat (Gibbs et al., 2004), du poulet (Hillier et al., 2004, du chimpanzé (Mikkelsen et al., 2005) et d'autres grands primates. Ensuite, apparurent les génomes du peuplier, du chien, de la vigne, du cheval, du bananier, de l'ornithorhynque, du concombre, de la papaye, du ver à soie pour ne citer que quelques exemples. Il est devenu impossible de suivre cette accélération. Malgré cette abondance, chaque nouveau génome continue de nous révéler des surprises. Tous ces génomes ne sont pas nécessairement séquencés de manière complète. À cause de leur taille même, ou des difficultés inhérentes à leur complexité, on réalise le séquençage à un certain niveau de couverture moyenne 1, variable selon les besoins. Il reste des trous ou des zones de basse qualité dans les séquences déposées dans les bases de données. Il faut s'en souvenir même si les progrès de la Génomique comparative permettent de s'en accommoder. Et surtout les méthodes de séquençage ayant considérablement évolué (voir plus loin), les problèmes se posent aujourd hui de manière totalement différente pour les nouveaux génomes étudiés. La génomique évolutive En parallèle des grands génomes cités, le séquençage total ou partiel de beaucoup d'autres génomes eucaryotes de taille plus modeste était devenue chose courante au début des années 2000 en utilisant la méthode Sanger. Ceci a ouvert la voie à un nouveau champ de recherches dans lequel la dimension évolutive prenait de plus en plus de place par rapport à la dimension fonctionnelle. Plusieurs dizaines d'espèces de levures ont été séquencées, (Souciet et al., 2000, Wood et al., 2002, Cliften et al., 2003, Kellis et al., 2003, Jones et al., 2004, Dujon et al., 2004, Dietrich et al, 2004, Kellis et al., 2004, Loftus et al., 2005, Dujon, 2005b, 2006, Novo et al, 2009, Dujon, 2010), et autant de champignons divers (Galagan et al., 2003, 2005, Machida et al., 2005, Nierman et al., 2005, Dean et al., 2005, Kaiper et al., 2006, Martin et al., 2008, 2010, Ma et al., 2009,). On a séquencé des microsporidies (la première était Encephalitozoon cuniculi, Katinka et al., 2001), des parasites comme le Plasmodium falciparum (Gardner et al, 2002), agent de la malaria et son cousin P. yoelii yoelii (Carlton et al., 2002) et d'autres Apicomplexes comme Cryptosporidium hominis (Xu et al., 2004), les trypanosomes Trypanosma brucei (Berriman et al., 2005) et T. cruzi (El-Sayed et al., 2005), la leishmanie Leshmania major (Ivens et al., 2005), des amibes comme Entamoeba histolytica (Loftus et al., 2005) ou Dictyostelium discoideum (Eichinger et al., 2005) etc... A mesure que l efficacité de séquençage augmentait, la génomique évolutive a pu également s adresser aux organismes pluricellulaires. Douze espèces de Drosophiles ont été séquencées et comparées pour comprendre l'évolution de ce groupe d'insectes (Drosophila 12 genomes consortium, 2007). Le point critique était l existence de centres de séquençage capables de générer et de traiter des grands volumes de données. 1 Dans un séquençage aléatoire, la couverture est donnée par le nombre de nucléotides totaux séquencés rapporté à la taille du génome. Si L est la longeur moyenne (en nucléotides) de chaque lecture, N le nombre total de lectures effectuées et G la taille du génome (en nucléotides), la couverture C s'exprime par C= NL/G). On a l'habitude d'exprimer ce rapport par un nombre de X (ex. 3X: couverture typique d'un séquençage exploratoire, 6X: couverture typique d'un brouillon assemblé de séquence (draft), X: couverture standard d'une séquence qui sera soumise à finition). Tous ces chiffres correspondent aux séquençages génomiques réalisés selon la méthode de Sanger jusqu en 2007 environ. Avec l'arrivée des nouvelles technologies, des couvertures beaucoup plus élevées sont obtenues et le problème des finitions est abandonné faute de pouvoir le traiter (voir chapitre).
11 Le Génoscope En France, le Génoscope d'evry, qui n'est pourtant que d'une taille modeste vis-à-vis de ses concurrents étrangers, a réalisé le séquençage complet du chromosome 14 humain (Heilig et al., 2003), du poisson Tetraodon (Jaillon et al., 2004), de la Paramécie (Aury et al., 2006), de la vigne (Jaillon et al., 2007), d'une algue brune Ectocarpus silicosus (Cock et al., 2010), de l'urochordé Oikopleura, pour ne citer que les plus grands projets. Depuis une dizaine d années, il a réalisé plusieurs centaines de projets génomes au service de la communauté scientifique française et européenne, en plus du séquençage de régions génomiques d'intérêt particulier, de la recherche de mutations, de banques d'adn complémentaires etc... Les curiosités biologiques Avec les génomes, la Biologie traditionnelle redevient d'actualité. Par exemple, on a séquencé les nucléomorphes de symbiontes récents tels que Guillardia thêta, une Cryptophyte considérée à tort comme une algue rouge (Douglas et al., 2001) et Bigelowiella natans, un Chlorarachniophyte considéré à tort comme une algue verte (Gilson et al., 2006). Ces nucléomorphes représentent en réalité les restes des noyaux d une algue rouge ou verte, respectivement, après leur absorption par d autres eucaryotes unicellulaires ayant ainsi acquis la photosynthèse de manière endosymbiotique (Curtis et al., 2012). De la même façon, on a séquencé le génome d'une ascidie, Ciona intestinalis pour explorer la base évolutive des Chordés (Dehal et al., 2002). On s'intéresse aussi aux annélides et aux mollusques car ce sont des Lophotrochozoaires, une branche animale longtemps inexplorée au niveau génomique et qui présente de nombreuses caractéristiques intéressantes dans le plan de formation du corps. Loin d'être une activité réductionniste à l'extrême comme certains l'imaginent, l'étude des génomes ouvre des voies nouvelles, d'une efficacité inconnue auparavant, pour tous ceux qui connaissent l'histoire naturelle et ses remarquables observations. On s'intéresse aux symbioses, au parasitisme, et à toutes les interactions des organismes dans la nature. Génomique populationnelle et métagénomique De plus, pour un nombre croissant d organismes on séquence, pour les comparer, de nombreux individus d une même espèce. On parle de reséquençage. C est évidemment le cas pour l homme, mais aussi pour de nombreux microorganismes (voir par exemple Liti et al., 2009). Avec cette stratégie, la génomique rejoint la génétique des populations, en l'enrichissant d'une quantité de données que cette dernière ne pouvait pas obtenir par les méthodes traditionnelles. C'est là, l'un des défis majeurs de l'enseignement de la Biologie moderne, tant ces disciplines sont restées trop longtemps séparées (voir Lynch, 2007). De même, l'analyse des génomes nous affranchit de la nécessité d'isoler les organismes étudiés, ce qui n'est pas toujours possible. Au contraire, on peut s'intéresser directement à des populations naturelles, ou même des écosystèmes. On parle de métagénomique. Actuellement, on découvre plus d'espèces nouvelles par le séquençage métagénomique que par les méthodes traditionnelles. L'étendue de la biodiversité des espèces devient accessible aux nouvelles méthodes de séquençage (Sogin et al., 2006). Les océans deviennent des champs d'exploration systématique. Un projet piloté par des équipes françaises et le Génoscope (Tara Océans) a été lancé pour cataloguer des virus, des bactéries et des eucaryotes unicellulaires des océans du monde entier (Karsenti et al., 2011). Plusieurs centaines de prélèvements ont été effectués et les échantillons sont caractérisés par le séquençage et l analyse des morphologies cellulaires (Karsenti, 2012). Les échantillons océaniques montre de nombreux virus dont l importance écologique est probablement grande (Hingamp et al., 2013 ). Les sols aussi sont évidemment étudiés pour leur importance agronomique ou forestière mais également pour suivre les effets de diverses pollutions (Monier, et al., 2011). Au fur et à mesure que les résultats arrivent, on mesure l'ampleur de ce qui nous reste à découvrir, même dans des systèmes limités comme les flores intestinales de l'homme ou des animaux pour lesquels des programmes internationaux ont déjà livrés leurs
12 premiers résultats (Qin et al., 2010). On parle maintenant couramment de microbiome pour désigner les flores microbiennes dont les compositions peuvent maintenant être intégralement décrites par la métagénomique sans nous limiter aux micro-organismes cultivables. La phylogénomique Enfin, c'est tout l'arbre du vivant qui est revu (et souvent corrigé) avec les données des génomes. Il suffit pour s'en convaincre de regarder l'arbre actuel des eucaryotes (Baldauf et al., 2003, Keeling et al., 2005, voir figure) et de le comparer avec les versions antérieures, même relativement récentes. A la phylogénétique succède une phylogénomique dont les principes sont encore objet d'actives recherches, vu la complexité du problème. La congruence des topologies des arbres devient un problème très compliqué si l'on souhaite y intégrer toutes les données des génomes. Les arbres obtenus dépendent du lot de gènes utilisé pour établir la phylogénie. Les raisons de ce phénomène sont complexes et encore mal comprises. Les hybrides naturels et les transferts génétiques horizontaux sont probablement beaucoup plus fréquents qu'on ne l'imagine. Figure 3 : L'arbre phylogénétique des eucaryotes compte neuf lignées principales regroupées ici en cinq branches majeures (Keeling et al, 2005). Le nombre de génomes séquencés complètement ou partiellement (rouge gras) montre un fort déséquilibre entre les cinq principales branches (GOLD octobre 2011). La génomique a encore à faire un long travail d exploration avant qu une description équilibrée du monde vivant devienne disponible.
13 Chez les bactéries, on constate que de nombreux segments de génomes varient entre isolats d'une même espèce, reflets d'intenses échanges génomiques au sein des populations. La notion même d'espèce s'estompe. On en vient à considérer un génome bactérien en deux parties, le "cœur" formé des gènes à transmission verticale (donc propre à la phylogénie) et les "ajouts" reflet d'une intense dynamique horizontale, les propriétés biologiques de l'organisme, ses capacités à s'adapter à des niches écologiques ou, par exemple, à devenir pathogènes, étant la résultante finale des deux parties (Danchin et al., 2007). Évidemment, certains organismes, dont l'homme, ont une reproduction sexuée obligatoire, structurant les populations selon les lois de la génétique classique. Mais beaucoup d'autres, surtout les microorganismes ou les champignons mais aussi les plantes ou même certains animaux, ont des phases d'expansion clonale considérable dont on retrouve la signature dans les génomes. Avec la perte fréquente de la sexualité dans de nombreuses lignées de microorganismes eucaryotes, la notion d'espèce s'estompe encore plus. Le problème de l échantillonage taxonomique A mesure que se précise l'arbre du vivant, on réalise à quel point nos connaissances actuelles sur les génomes sont biaisées. Si l'on reporte les nombres de génomes connus sur les différentes branches évolutives des eucaryotes, on s'aperçoit que l'essentiel des données correspond à deux grandes divisions évolutives, celle des Opistokontes qui rassemble tous les animaux et les champignons et celle des Viridiplantae c est-à-dire les plantes et les algues vertes. Si un nombre raisonnable de données existent pour le complexe des Chromalveolata regroupant les Apicomplexes, les Ciliés, les Algues brunes, les Oomycètes et qulque autres lignées, en revanche pratiquement rien n'est connu des génomes des deux autres grands groupes, Excavata et Rhizaria, alors que les rares données disponibles suggèrent que beaucoup de surprises nous attendent. Les modes de financement de la recherche ne sont pas étrangers à ces biais de nos connaissances. Mais la curiosité des chercheurs est également en cause. Si l'on ne peut enseigner que ce que l'on connaît, la recherche elle, consiste à étudier ce que l on ne connaît pas déjà! Les nouvelles méthodes de séquençage La période Sanger ( ) La méthode de Sanger était basée sur la synthèse in vitro de copies d'adn complémentaire à un brin matrice par les polymérases. La méthode de Maxam et Gilbert était basée sur la dégradation chimique des molécules d'adn. Les deux méthodes impliquaient le marquage terminal des molécules et leur séparation selon leur taille par électrophorèse à haute résolution, toutes les molécules d'une même réaction de séquençage ayant une extrémité commune (origine) et l'autre dépendant de la nature du nucléotide terminal. Malgré leur apport considérable à la Biologie, les méthodes initiales de séquençage ne permettaient pas une augmentation d'échelle significative car elles nécessitaient trop d'interventions manuelles. Plusieurs perfectionnements techniques, couplés aux progrès parallèles de l'informatique, allaient graduellement changer le paysage jusqu au milieu des années On peut citer la mise au point, puis l'utilisation de nucléotides fluorescents qui, couplée à l'électrophorèse capillaire, allait permettre la construction de toute une génération d'automates (séquenceurs) existant encore aujourd'hui bien que de moins en moins utilisés. Avec les machines les plus puissantes de cette génération technologique, on pouvait déterminer en parallèle 96 séquences d'environ 750 nucléotides de long chacune, soit environ nucléotides par "run" de deux à trois heures. Ce sont ces méthodes de séquençage appliquant les principes fondamentaux de la méthode Sanger qui, associées à des développements informatiques adaptés permettant d'assembler, finaliser et annoter de très grands génomes, ont permis l'extraordinaire développement de la génomique jusqu à il y a quelques années.
14 Les nouvelles méthodes de séquençage Mais la situation a radicalement changée au milieu des années 2000 (voir par exemple, Seo et al., 2005, Margulis et al., 2005, Shendure et al., 2005) avec l'arrivée de nouvelles méthodes de séquençage souvent appelées NGS (pour Next Generation Sequencing). Contrairement aux perfectionnements techniques précédents ces nouvelles méthodes appliquent des principes différents de ceux des méthodes historiques. Elles ont été rendues possibles autant par les progrès de la biologie moléculaire (nouvelles molécules, nouvelles réactions) que par ceux de l'ingénierie (miniaturisation, traitement des images). Avec le NGS, la Biologie est entrée dans une nouvelle ère pour plusieurs raisons. D abord, les quantités de séquences produites sont beaucoup plus élevées que celles obtenues par la méthode Sanger. Par exemple, un "run" sur une machine utilisant le pyroséquençage produit environ un million de séquences de longueur moyenne 500 nucléotides, soit un total de plus de 500 millions de nucléotides (à comparer aux nucléotides des méthodes précédentes). Autre exemple, un "run" sur une machine utilisant la synthèse en phase solide peut produire plusieurs milliards de lectures de longueur de 100 nucléotides ou plus, soit un total de plusieurs centaines de milliards de nucléotides. C est actuellement cette dernière technologie qui est la plus utilisée dans le monde. Sa puissance est telle que, souvent, plusieurs échantillons sont mélangés, après étiquetage moléculaire, pour être soumis à un séquençage unique. Les séquences élémentaires sont ensuite aisément triées en utilisant les étiquettes avant d être traitées. Les techniques encore en développement basées sur l'analyse de molécules uniques ont des rendements un peu plus faible mais permettent d'envisager d'allonger la longueur de chaque lecture, ce qui est un point essentiel pour l'assemblage de novo de génomes inconnus. La profondeur de lecture, élément critique Avec ces nouvelles techniques, on entend souvent que le coût du séquençage a chuté en quelques années de plus de 5 ordres de grandeur. Une performance rarement atteinte. C est ce qui a permis au séquençage d ADN une devenir une technologie centrale pour de nombreuses applications (agronomie, environnement, cancer, génétique médicale, recherche d empreintes, criminologie etc ). On parle même de son application en routine dans les simples laboratoires d analyse médicale. Mais ce n est pas cet aspect économique qui est le plus intéressant. Avec les nouvelles techniques de séquençage, la multiplication des lectures est telle qu elle permet enfin d atteindre des nombres comparables à ceux des molécules d ARN dans une cellule ou au nombre de molécules d ADN d un organisme pluricellulaire ou d une population de microorganismes. L étude exhaustive se substitue à l échantillonnage aléatoire. Ensuite, les méthodes NGS n'utilisent plus le clonage de l'adn dans des vecteurs d'e. coli qui fut la signature universelle du génie génétique depuis plus de 35 ans et celle de la génomique pendant une quinzaine d'années. La séparation des molécules d'adn à séquencer et leur amplification se fait maintenant entièrement in vitro par PCR dans des micelles ou sur des supports solides. Avec les nouvelles technologies à molécules uniques, il n'y a même plus d'amplification par PCR. Ce sont les molécules d'adn présentes dans l'organisme étudié qui sont directement séquencées. Avec l'énorme avantage de pouvoir identifier, en plus de la séquence des 4 nucléotides fondamentaux, les modifications chimiques que ces molécules peuvent porter et qui sont effacées par l'amplification par PCR. Une révolution épistémologique Evidemment, les bases de données et les logiciels d analyse doivent s'adapter aux énormes quantités de données produites par ces nouvelles méthodes. Il n'est plus envisageable de stocker les données brutes de manière pérenne. Ces méthodes ont déplacé les limites des problèmes techniques vers des problèmes d'informatique. Dans cette nouvelle Biologie qui émerge, la composition des équipes de recherche et la formation de leurs membres, donc des étudiants, changent totalement. L effort d analyse des données surpasse celui de la production des données. Mais les véritables changements ne se limitent pas au volume des données à traiter. Le changement d'échelle induit un changement de nature des questions étudiées. Les systèmes modèles traditionnels des laboratoires (bactéries, levures,
15 drosophile, souris, etc ) perdent de leur importance. Tous les organismes existants deviennent étudiables. Ce sont leurs particularités biologiques qui font le degré d'intérêt de leur étude. Les populations naturelles elles-mêmes deviennent accessibles à l'étude génomique, sans se limiter aux espèces cultivables. L'évolution, les structures des populations, leur histoire, les forces de sélection auxquelles elles ont été soumises deviennent lisibles dans les génomes. La génomique de la biodiversité révolutionne notre connaissance des écosystèmes et des relations entre organismes au sein de ces derniers. La métagénomique dépasse le catalogue existant d'espèces déjà identifiées (très incomplet) pour nous ouvrir des mondes entièrement inconnus. Les ADN fossiles deviennent analysables sans avoir besoin, d'abord, de les recopier en ADN moderne. En résumé, le changement quantitatif a induit un changement qualitatif dans nos façons d aborder la Biologie. Retour sur les bases du système génétique Avec le nouveau séquençage, la transcriptomique cesse d'être essentiellement quantitative (mesure des quantités de transcrits par hybridation sur des arrays ou par séquençage d'étiquettes) pour devenir analytique (les molécules d'arn présentes dans une cellule sont séquencées directement et quantitativement). Au lieu de se contenter de considérer les ARNs comme de simples intermédiaires de l'expression des gènes, ce sont les multiples formes de ceux-ci qui deviennent analysables, y compris celles à courte durée de vie (Jacquier, 2009, Pelechano et al., 2013) qui correspondent au fait que la transcription des génomes eucaryotes est générale et non limitée aux gènes que l'on sait définir. Le séquençage massif d'arn (par l'intermédiaire d'adn complémentaire soumis à séquençage massif) devient donc l'outil de choix pour annoter les génomes (Denoeud et al., 2008). De nouveaux petits ARNs non codants sont découverts. Et même les variations stochastiques intercellulaires deviennent analysables grâce aux nouvelles méthodes de séquençage. (Newman et al., 2006). La génomique fonctionnelle Le problème Si déterminer les séquences des génomes devient de plus en plus facile, il ne s'agit toujours que du point de départ d'une recherche, pas de son but. Dans la plupart des cas, on aura besoin de relier ces séquences à des fonctions biologiques, domaine plus complexe parce que moins bien défini. Eliminons ici tout de suite toutes les recherches qui s'adressent à la fonction d'un gène ou d'un petit groupe de gènes dans un système expérimental particulier. C'est le domaine de la génétique classique, pas celui de la génomique. Aujourd'hui on dispose, si on le veut, de tous les gènes. Le problème n'est donc plus de connaître les fonctions de certains gènes, ni même de chacun, mais de comprendre comment, ensemble, ils déterminent un phénotype. On entre dans une nouvelle science (en réalité le cœur historique de la Génétique, savoir comment le génotype détermine le phénotype) que l'on tend maintenant à appeler "Systems Biology" et dans laquelle on essaie de reconstituer toutes les interactions fonctionnelles à tous les niveaux de complexité hiérarchiques, du gène à l'organisme. Ceci implique naturellement un effort de modélisation théorique pour intégrer des données de nature, de complexité, de précision et fiabilité différente. La génomique fonctionnelle est la partie expérimentale nécessaire pour l'acquisition de ces données. Elle est très diversifiée et s'applique, selon les modèles étudiés, avec plus ou moins de facilité et de succès.
16 Transcriptome classique Parce qu'elle était le premier eucaryote séquencé complètement, mais aussi et surtout parce qu'elle permet des expériences plus aisées qu'ailleurs, la levure Saccharomyces cerevisiae a joué un rôle important dans l'émergence des nouvelles méthodes de génomique fonctionnelle. C'est avec cette levure que l'on a d'abord validé la méthode SAGE (Velculescu et al., 1995, 1997) puis les "microarrays" (DeRisi et al., 1997, Laskari et al., 1997), utilisés pour quantifier les transcrits, mais aussi maintenant pour les hybridations génomiques comparatives (CGH) qui permettent d'identifier les variations du nombre de copies de gènes qui sont un élément essentiel de l'évolution et du polymorphisme entre individus (Lage et al., 2003). Les "microarrays" permettent aussi l'étude des séquences de régulation ou la sélection (ChIp- CHIP) de séquences fixées à des protéines (Harismendy et al., 2003) ou encore, avec les "tiling arrays", de déterminer tous les polymorphismes de séquences entre individus. En combinant ces méthodes avec la génétique classique (croisement et étude des descendants), on obtient ce que l'on désigne par "genetical genomics", la stratégie la plus puissante actuellement pour identifier les déterminants des caractères complexes tellement important pour l'agronomie, les biotechnologies ou la médecine, sans oublier l'étude des processus essentiels de la vie cellulaire (méiose, réplication, recombinaison, conversion, réparation). Interactome et mutants systématiques C'est encore avec la levure que les premières cartes d'interactions de protéines ont été établies (Fromont-Racine et al., 1997, Uetz et al., 2000, Ito et al., 2000, 2001, Zhong et al. 2003) à partir de la technique de double-hybride (Fields et Song, 1989) ou en utilisant de nouvelles méthodes de marquage et de purification des protéines et des complexes (Gavin et al., 2002, Ho et al., 2002). Pour ces raisons, et d'autres, tous les gènes de levure ont été clonés dans des vecteurs d'expression qui permettent, avec des marquages fluorescents d'examiner la localisation intracellulaire des protéines, ou de développer des matrices ("protein chips") de toutes les protéines (Zhu et al., 2001, Kumar et al., 2002a, Michaud et al., 2002, 2003, Ghaemmaghami et al., 2003,). La levure était le premier organisme pour lequel on a disposé d'une collection quasi-complète de mutants de délétion de chaque gènes. Des collections équivalentes existent maintenant pour certaines bactéries et d autres levure. Dans ces collections, chaque mutant est marqué moléculairement, permettant ainsi de le repêcher à partir de populations (Shoemaker et al., 1996, Winzeler et al., 1999, Giaever, 2002). La collection de mutants de levure a été utilisée directement pour cribler des phénotypes divers (Birrel et al., 2001, Aburatani et al., 2003) y compris ceux qui sont importants pour rechercher des gènes morbides chez l'homme (Steinmetz et al., 2002). De plus, d'astucieuses constructions moléculaires faites à partir de transposons permettent des expériences de mutagenèse aléatoire à partir desquelles les gènes mutés et les protéines correspondantes deviennent immédiatement identifiables car marqués moléculairement (Ross-Macdonald et al., 1999, Bidlingmaier et al., 2002). Chez les autres eucaryotes pour lesquels de telles collections sont difficiles à construire, on a construit des collections d'arn interférant qui permettent de cribler tout un génome en éteignant les gènes un à un sans avoir besoin de les déléter. Interactions génétiques C'est toujours avec la levure, grâce à la puissance de sa génétique, que l'on a développé les cribles de phénotypes synthétiques les plus perfectionnés, c'est-à-dire des cribles nous permettant de rechercher toutes les interactions fonctionnelles entre un gène muté donné et tous les autres gènes de la cellule (Tong et al., 2001). Grâce à l'accumulation de larges collections de données sur les réseaux transcriptionnels, les interactions protéiques, les complexes macromoléculaires ou les interactions génétiques, la levure permet maintenant d'envisager la modélisation des interactions dynamiques qui ont lieu dans une cellule eucaryote et d'imaginer leur évolution (voir, par exemple, Tavazoie et al., 1999, Friedman et al., 2000, Schwikowski et al., 2000, Ideker et al., 2001, Edwards et al., 2002, Harrison et al., 2002a, Jansen et al., 2002, Tong et al., 2002, Werner-Washburne et al., 2002, Bar-Joseph et al., 2003, Famili et al., 2003, Forster et al., 2003, Herrgard et al., 2003, Kelley et al., 2003,
17 Milo et al., 2002, Qian et al., 2003, Ranish et al., 2003, Segal et al., 2003, Stuart et al., 2003, Vasquez et al., 2003, Wagner, 2003, Wuchty et al., 2003, Yu et al., 2003). Cette liste, qui n'est pas exhaustive et qui ne tient pas compte des résultats les plus récents, suffit à illustrer l'ampleur des changements en cours de la Biologie (voir par ex. Costanzo et al., 2010). Le cœur du problème Ce bref tableau ne doit cependant pas nous faire croire qu'il ne reste plus qu'à assembler les éléments. Plus on approfondi l'étude et plus on s'aperçoit que les éléments euxmêmes sont plus complexes qu'on ne le pensait. Même le gène devient difficile à cerner. Avec le projet d'analyse fonctionnelle du génome humain (ENCODE Project Consortium, 2007), on s'est immédiatement aperçu à quel point la complexité des transcrits fait qu'il devient impossible de définir les limites des gènes (Gerstein et al. 2007). Chez l homme comme chez la levure, on voit maintenant que, loin du concept initial un gène un produit, les génomes sont transcrits en une multitude d isoformes d ARN partiellement chevauchants et de durée de vie extrêmement variable (Pelechano et al., 2013). Les molécules d ARN qui, finalement, serviront d intermédiaires pour la synthèse protéique (le premier dogme central de la Biologie moléculaire) ne représentent qu une infime partie de la population de molécules d ARN produites dans la cellule. En d autres termes coder des protéines n est pas le rôle principal des gènes! Et d ailleurs dans notre propre génome, seules 2% des séquences servent à cette fonction, nous laissant 98 % à mieux comprendre. Qu est-ce qu un génome? Le texte des génomes Quand on a séquencé un génome, on dispose du texte intégral qui détermine l ordre, la complexité et le fonctionnement de l organisme qui le porte. Ce texte contient de plus en trace l histoire de ses ancêtres et les limites de ses possibilités évolutives futures. Les variations d expression dites épigénétiques ne changent rien à ce déterminisme fondamental: les mécanismes épigénétiques sont eux-mêmes déterminés génétiquement. Ce qu il est important de comprendre est que le déterminisme génétique n est pas nécessairement simple et direct et encore moins monogénique. Il nous reste à interpréter le texte des génomes en termes fonctionnels et ceci est loin d'être résolu. La difficulté est encore accrue par les variations entre individus d une même population. Croire que l on dispose du génome d une espèce parce qu on a séquencé l un de ses représentants est une erreur commune. Combien de gens ont clamé qu après l annonce du génome humain, on allait (enfin) passer à la post-génomique et se sont évidemment retrouvés frustrés par l absence de retombées immédiate. Mais que pouvait-on conclure d une référence? Sauf de jouer son rôle de référence comme on le voit maintenant que l on dispose des variations individuelles. Combien de gènes? De plus, à la simple question: combien de gènes dans un génome particulier séquencé avec le plus grand soin, la réponse est rarement précise. Chez l'homme, le débat fut même vif il y a quelques années (Roest-Crollius et al. 2000) avant que l'on comprenne que le déterminisme génétique n'est pas une relation simple et univoque entre un gène et sa fonction. Mais même chez la levure, plus de quinze ans après la première séquence intégrale et malgré l'intensité des études fonctionnelles, on en est encore à modifier le nombre de gènes car on en avait oublié quelques centaines, surtout les plus courts, et annotés quelques centaines d'autres qui, après analyse, se sont révélés ne pas exister (Blandin et al., 2000, Zhang et Wang, 2000, Harrison et al., 2002b, Kumar et al., 2002b, Oshiro et al., 2002, Kessler et al., 2003, Kellis et al., 2003). Une partie de ces problèmes est à relier au fait que la limite est floue entre un gène, un pseudogène et un proto-gène (Carvunis et al., 2012). Quelques mutations peuvent suffire pour passer de l un à l autre. Chez la levure, on estime à près de 1900 (un tiers du génome environ) le nombre de proto-gènes capables en quelques mutations
18 de donner naissance à des nouveaux gènes fonctionnels. On voit que les projets de Biologie synthétique, pourtant extrêmement prometteurs en termes de possibilité de synthèse de génomes (Dymond et al., 2011, Cooper et al., 2012), ont peut-être encore des progrès à faire avant d être compétitifs avec la nature. Mais s il est si difficile de définir les modèles de gènes, il ne faut pas oublier qu en définitive chaque génome n est en réalité que l instantané d un processus de changements permanents. Et cette dynamique évolutive devra être prise en compte pour interpréter les génomes. Des références à revoir Actuellement, beaucoup des génomes entièrement séquencés sont mal annotés. C'est l'un des problèmes importants que l'on doit résoudre. L'augmentation très rapide du nombre de séquences disponibles, due aux nouvelles technologies devrait nous y aider en mettant la génomique comparative à l'échelle nécessaire pour étudier le monde vivant réel et non plus seulement les systèmes modèles. La généralisation du "RNA seq" devrait aussi considérablement aider. En même temps, ce sont les ordinateurs qui, seuls, seront capables d'interpréter les textes des génomes tant ils seront nombreux dans le futur. Les utilisateurs, eux, ne pourront qu'interroger ces derniers, qui ne pourront répondre que dans un vocabulaire standardisé, à condition qu'on leur en ait donné un. Quand on parle de fonctions, les efforts actuels de standardisation du vocabulaire sont donc indispensables (Reference Genome Group of the Gene Ontology Consortium, 2009). Mais on reste loin du compte car la notion même de fonction est imprécise. En Biologie, elle représente souvent davantage l idée que l on se fait d un phénomène que le phénomène lui-même. Le gène Si, à force de mieux connaître les gènes, on ne sait plus très bien ce qu'ils sont, c'est peut-être qu'en réalité, ils n'existent pas. Du moins pas comme objet moléculaire précisément définissable. A ce sujet, l étudiant pourra consulter utilement un récent ouvrage qui retrace la notion de gène au cours du développement de la Génétique (Deutsch, 2012). Après tout, comme le disait Johanssen lui-même quand il proposa le terme en 1906, «le gène n est rien d autre qu un petit mot facile à utiliser». C est l intégration physique des gènes le long des chromosomes et leur intégration fonctionnelle au sein des génomes, c est à dire la génomique, qui fait leur intérêt. On notera d ailleurs que, contrairement à ce que l usage actuel tend à suggérer, le mot génome n est pas récent. Il a été proposé pour la première fois par H. Winckler en 1920 pour désigner le lot complet de tous les facteurs héréditaires d un organisme vivant, observable à l époque sous la forme des chromosomes qui les portent (Winckler, 1920). Plus que dans les avancées technologiques indéniables de la génomique, c est dans ce caractère intégré qu il faut rechercher la véritable dimension nouvelle de la génomique. Le cours d Analyse des Génomes Le bref historique ci-dessus n a pour but que d essayer de mieux faire comprendre aux étudiants l origine et la signification des concepts qu ils seront appelés à manipuler. Le cours a pour finalité d amener les étudiants à comprendre les principes fondamentaux de la génomique, à découvrir ses méthodes et à réfléchir à ses implications dans tous les aspects de la Biologie. Pour des raisons pratiques, seules quelques unes des technologies modernes de la génomique pourront être abordées expérimentalement. Les nouvelles technologies qui mettent l'accent sur les volumes de résultats obtenus se prêtent malheureusement mal à des démonstrations de salles de travaux pratiques et il est possible que certains étudiants attirés par les expériences en éprouvent une frustration. Plusieurs systèmes biologiques distincts ont été choisis pour illustrer ces principes et méthodes. Dans tous les cas, on insistera sur les bases fondamentales des stratégies mises en jeu. Le traitement des résultats servira à illustrer l utilisation des méthodes de l informatique sans lesquelles aucune analyse des génomes ne pourrait être possible. Étant donné la spécificité de ce domaine, des notions de
19 bases en Informatique elle-même seront données aux étudiants. Les conférences théoriques ont été choisies pour illustrer différentes facettes de la génomique appliquées à des questions biologiques fondamentales et pour compléter les thèmes qui ne pourront pas être abordés expérimentalement. Elles seront données par des spécialistes renommés du domaine que je voudrais remercier vivement ici de bien vouloir consacrer un peu de leur temps et de leur talent à cet enseignement. Figure 4 : Une vision hypothétique du futur de la génomique, inspirée de ce que l'on entrevoit des développements actuels. Mais n'oublions pas ce que disait Jean Dutourd "La seule chose dont on soit sûr, en ce qui concerne l'avenir, c'est qu'il n'est jamais conforme à nos prévisions".
20 Abecassis, G.R., et al., 2012) An integrated map of genetic variation from 1092 human genomes. Nature 491 : Aburatani S, et al., (2003) Discovery of novel transcription control relationships with gene regulatory networks generated from multiple-disruption full genome expression libraries. DNA Res. 10, 1-8. Abyzov, A. et al., (2013) Analysis of variable retroduplications in human populations suggests coupling of retrotransposition to cell division. Genome Res. Epuc ahead of print. Adams M. D., et al., (2000) The genome sequence of Drosophila melanogaster. Science 287, Altman, S. (1981) Transfer RNA processing enzymes. Cell, 23: 3-4. Aparicio, S. et al., (2002), Whole-genome shutgun assembly and analysis of the genome of Fugu rubripes. Science 297, Arabidopsis Genome Initiative (2000) Analysis of the genome sequence of the flowering plant Arabidopsis thaliana. Nature 408, Aury, J-M. et al., (2006) Global trends of whole-genome duplications revealed by the ciliate Paramecium tetraurelia. Nature 444: Avery, O. T., Mac Leod, C. M., McCarthy, M. (1944) Studies on the chemical nature of the substance inducing transformation of pneumococcal types. J. Exp. Med. 98, Baldauf, S.L. (2003) The deep roots of eukaryotes. Science, 300: Baltimore, D. (1970) RNA-dependent DNA polymerase in virions of RNA tumor viruses. Nature 226, Bar-Joseph Z, Gerber GK, Lee TI, Rinaldi NJ, Yoo JY, Robert F, Gordon DB, Fraenkel E, Jaakkola TS, Young RA, Gifford DK. (2003) Computational discovery of gene modules and regulatory networks. Nat Biotechnol. 21, Beadle, G.W., Tatum, E.L. (1941) Genetic control of biochemical reactions in Neurospora. PNAS 15: Benzer, S. (1961) On the topography of the genetic fine structure. Proc. Natl. Acad. Sci. USA. 47, Berget, S.M., Moore, C., Sharp, P (1977) Spliced segments at the 5 terminus of adenovirus 2 late mrna. P.N.A.S. 74, Berriman, M., et al., (2005) The genome of the african trrypanosome Trypanosoma brucei. Science 309, Bidlingmaier S, Snyder M. (2002) Large-scale identification of genes important for apical growth in Saccharomyces cerevisiae by directed allele replacement technology (DART) screening. Funct Integr Genomics. 1, Birrell GW, et al., (2001) A genome-wide screen in Saccharomyces cerevisiae for genes affecting UV radiation sensitivity. Proc. Natl. Acad. Sci. USA. 98, Blandin, G. et al., (2000) Genomic exploration of the Hemiascomycetous yeasts: 4- The Genome of Saccharomyces cerevisiae revisited. FEBS Letters 487, Brown, A. (2003) In the beginning was the worm. Columbia University Press, New York 244pp. Carlton, J.M. et al., (2002) Genome sequence and comparative analysis of the model rodent malaria parasite Plasmodium yoelii yoelii. Nature 419, Carvunis, A. R.. et al. (2012) Proto-genes and de novo gene birth. Nature 487: Cech, T.R. Zaug, A.J., Grabowski, P.J. (1981) In vitro splicing of the ribosomal RNA precursor of Tetrahymena: involvement of a guanosine nucleotide in the excsision of the intervening sequence. Cell, 27: Chen, W. et al. (2008) Mapping translocation breakpoints by next-generation sequencing. Genome Res. 18: Chow, L.T., Gelinas, R.E., Broker, T.R. Roberts, R.J. (1977) An amazing sequence arrangement at the 5 ends of adenovirus 2 mrna. Cell 12, 1-8. Cliften, P., et al., (2003) Finding functional features in Saccharomyces genomes by phylogenetic footprinting. Science 301, Cock, J.M. et al., (2010) The Ectocarpus genome and the independent evolution of multicellularity in brown algae. Nature 465: Colleaux, L. et al (1985) Universal code equivalent of a yeast mitochondrial intron reading frame is expressed into E. coli as a specific double strand endonuclease. Cell 44: Colleaux, L. et al. (1988) Recognition and cleavage site of the intron-encoded omega transposase. PNAS 85: Collins, F., and the International Human Genome Consortium (2001) The human genome. Nature 409, Cooper, E. M. et al., (2012) The build-a-genome course. Methods Mol. Biol. 852: Costanzo M. et al., (2010) The genetic landscape of a cell. Science 327: Crick, F. H. C. et al., (1961) General nature of the genetic code for proteins. Nature 192, Curtis, B.A. et al. (2012) Algal genomes reveal evolutionary mosaicism and the fate of nucleomorphs. Nature 492: Danchin, A., Fang, G., Noria, S. (2007) The extant core bacterial proteome is an archive of the origin of life. Proteomics 7: Dean R.A. et al., (2005) The genome sequence of the rice blast fungus Magnaporthe grisea. Nature 434: Dehal, P., et al., (2002) The draft genome of Ciona intestinalis: insights into chordate and vertebrate origins. Science, 298, Denoeud, F. et al., (2008) Annotating genomes with massive-scale RNA sequencing. Genome Biol. 9: R175 DeRisi JL, Iyer VR, Brown PO. (1997) Exploring the metabolic and genetic control of gene expression on a genomic scale. Science. 278, Deutsch, J. (2012) Le gene. Un concept en evolution. Editions du Seuil. Dietrich et al., (2004) The Ashbya gossypii genome as a tool for mapping the ancient Saccharomyces cerevisiae genome. Science 304, Douglas, S., et al., (2001) The highly reduced genome of an enslaved algal nucleus. Nature 410, Drosophila 12 genome Consortium (2007) Evolution of genes and genomes on the Drosophila phylogeny. Nature, 450: Dujon B., et al., (2004) Genome evolution in yeasts. Nature 430,
21 Dujon, B. (2005a) Homing endonucleases and the yeast mitochondrial omega locus A historical prespective. In "Homing endonucleases and inteins". (Belfort et al. Eds) Springer Berlin Heidelberg. pp Dujon, B. (2005b) Hemiascomycetous yeasts at the forefront of comparative genomics. Curr Opin Genet Dev. 2005, 6, Dujon, B., (2006) Yeasts illustrate the molecular mechanisms of eukaryotic genome evolution. Trends in Genetics 22, Dujon, B, (2010) Yeast evolutionary genomics. Nature Genetics reviews 11: Dymond, J.S. et al. (2011) Synthetic chromosme arms function in yeast and generate phenotypic diversity by design. Nature 477: Edwards AM, et al. (2002) Bridging structural biology and genomics: assessing protein interaction data with known complexes. Trends Genet. 18, Eichinger, L. et al., (2005) The genome of the social amoeba Dictyostelium discoideum. Nature 435, El-Sayed, N. M., et al., (2005) The genome sequence of Trypanosoma cruzi, etiologic agent of Chagas diseases. Science 309, ENCODE Project Consortium (2007) Identification and analysis of functional elements in 1% of the human genome by the ENCODE pilot project. Nature. 447: Famili I, Forster J, Nielsen J, Palsson BO. (2003) Saccharomyces cerevisiae phenotypes can be predicted by using constraint-based analysis of a genome-scale reconstructed metabolic network. Proc Natl Acad Sci U S A. 100, Fields S, Song O. (1989) A novel genetic system to detect protein-protein interactions. Nature. 340, Fire A, et al. (1998) Potent and specific genetic interference by double-stranded RNA in Caenorhabditis elegans. Nature 391, Fleischmann, R.D. et al., (1995) Whole-genome random sequencing and assembly of Haemophilus influenzae Rd, Science 269, Forster J, Famili I, Fu P, Palsson BO, Nielsen J. (2003) Genome-scale reconstruction of the Saccharomyces cerevisiae metabolic network. Genome Res. 13, Friedman N, Linial M, Nachman I, Pe'er D. (2000) Using Bayesian networks to analyze expression data. J Comput Biol. 7, Fromont-Racine M, Rain JC, Legrain P. (1997) Toward a functional analysis of the yeast genome through exhaustive two-hybrid screens. Nat Genet. 16, Galagan, J.E. et al. (2003) The genome sequence of the filamentous fungus Neurospora crassa. Nature 422, Galagan, J.E. et al. (2005) Sequencing of Aspergillus nidulans and comparative analysis with A. fumigatus and A. oryzae. Nature 438: Gardner, M.J. et al., (2002) Genome sequence of the human malaria parasite Plasmodium falciparum Nature 419, Gavin AC, et al. (2002) Functional organization of the yeast proteome by systematic analysis of protein complexes. Nature. 415, Gerstein MB, et al. (2007) What is a gene, post-encode? History and updated definition. Genome Res. 6, Ghaemmaghami S, et al. (2003) Global analysis of protein expression in yeast. Nature. 425, Giaever G, et al., (2002) Functional profiling of the Saccharomyces cerevisiae genome. Nature. 418, Gibbs, R.A. et al., (2004) Genome sequence of the brown norway rat yields insights into mammalian evolution. Nature 428, Gilbert, W. (1978) Why genes in pieces? Nature 271, 501 Gilson, P.R. et al., (2006) Complete nucleotide sequence of the chlorarachniophyte nucleomorph: nature s smallest nucleus. PNAS 103: Goff, S.A., et al., (2002) A draft sequence of the rice genome (Oryza sativa L. ssp. japonica). Science 296, Glover, D.M., Hogness, D.S. (1977) A novel arrangement of the 18S and 28S sequences in a repeating unit of D. melanogaster rdna. Cell 10, Goffeau, A., et al. (1996) Life with 6000 genes. Science 274, Goffeau A. et al., (1997) The yeast genome directory. Nature 387 suppl Goujon, P. (2001) From Biotechnology to Genomes: the meaning of the double helix. World Scientific Publishing Co. PTE. Ltd. Singapore, 782 pp. Greider CW, Blackburn EH. (1989) A telomeric sequence in the RNA of Tetrahymena telomerase required for telomere repeat synthesis. Nature 337: Harismendy O, et al. (2003) Genome-wide location of yeast RNA polymerase III transcription machinery. EMBO J. 22, Harrison PM, et al. (2002a) A question of size: the eukaryotic proteome and the problems in defining it. Nucleic Acids Res. 30, Harrison P, et al. (2002b) A small reservoir of disabled ORFs in the yeast genome and its implications for the dynamics of proteome evolution. J Mol Biol. 316, Heilig, R., et al., (2003) The DNA sequence and analysis of human chromosome 14. Nature 421, Herrgard MJ, Covert MW, Palsson BO. (2003) Reconciling gene expression data with known genome-scale regulatory network structures. Genome Res. 13, Hillier, L.W. et al., Sequence and comparative analysis of the chicken genome provide unique perspectives on vertebrate evolution. Nature 432, Hingamp, P. et al. (2013) Exploring nucleo-cytoplasmic large DNA viruses in Tara Oceans microbial metagenomes. ISME 7: Ho,Y, et al. (2002) Systematic identification of protein complexes in Saccharomyces cerevisiae by mass spectrometry. Nature. 415, Holt, R.A., et al., (2002) The genome of the malaria mosquito Anopheles gambiae. Science 298,
22 Ideker T, et al. (2001) Integrated genomic and proteomic analyses of a systematically perturbed metabolic network. Science. 292, International Human Genome Sequencing Consortium (2004) Finishing the euchromatic sequence of the human genome. Nature 431, Ito T, et al. (2000) Toward a protein-protein interaction map of the budding yeast: A comprehensive system to examine two-hybrid interactions in all possible combinations between the yeast proteins. Proc Natl Acad Sci U S A. 97, Ito T, et al. (2001) A comprehensive two-hybrid analysis to explore the yeast protein interactome. Proc Natl Acad Sci U S A. 98, Ivens, A.C., et al., (2005) The genome of the kinetoplastid parasite Leishmanaia major. Science 309, Jacob, F, Monod, J. (1961) Genetic regulatory mechanisms in the synthesis of proteins, J. Mol. Biol. 3: Jacquier, A, Dujon, B.. (1985) An intron encoded protein is active in a gene conversion process that spreads an intron into a mitochondrial gene. Cell 41: Jacquier, A. (2009) The complex eukaryotic transcriptome: unexpected pervasive transcription and novel small RNAs. Nat Rev Genet. 10: Jaillon, O. et al., (2004) Genome duplication in the teleost fish Tetraodon nibroviridis reveals the early vertebrate prot-karyotype. Nature 431, Jaillon, O. et al., (2007) The grapevine genome sequence suggests ancestral hexaploidization in major angiosperm phyla. Nature 449: Jansen R, Lan N, Qian J, Gerstein M. (2002) Integration of genomic datasets to predict protein complexes in yeast. J Struct Funct Genomics. 2, Jeffreys, A.J., Flavell, R.A. (1977) The rabbit beta-globin gene contains a large insert in the coding sequence. Cell 12, Jones T., et al., (2004) The diploid genome sequence of Candida albicans. Proc. Nat. Acad. Sc. USA 101, Kaiper, J. et al. (2006) Insight from the genome of the biotrophic fungal plant pathogen Ustilago maydis. Nature 444: Karsenti, E. et al. (2011) A holistic approach to marine eco-systems biology. PLoS Biol. E Karsenti, E. (2012) A journey from reductionist to systemic cell biology aboard the schooner Tara. Mol. Biol. Cell. 23: Katinka M. D., et al., Genome sequence and gene compaction of the eukaryote parasite Encephalitozoon cuniciuli. Nature 414, 45(2001) Keeling P. et al., 2005 Trends in Ecology and Evolution, 20: Kelley BP, Sharan R, Karp RM, Sittler T, Root DE, Stockwell BR, Ideker T. (2003) Conserved pathways within bacteria and yeast as revealed by global protein network alignment. Proc Natl Acad Sci U S A. 100, Kellis, M. et al. (2003) Sequencing and comparison of yeast species to identify genes and regulatory elements. Nature 423, Kellis, M. et al. (2004) Proof and evolutionary analysis of ancient genome duplication in the yeast Saccharomyces cerevisiae. Nature 428, Kessler MM, et al. (2003) Systematic discovery of new genes in the Saccharomyces cerevisiae genome. Genome Res. 13, Khurana, E., et al. (2013) Integrative annotation of variants from 1092 humans: application to cancer genomics. Sciene 342: Epub ahead of print. Korbel, J.O., et al (2007) Paired-end mapping reveals extensive structural variation in the human genome. Science 318: Kumar A, et al. (2002a) Subcellular localization of the yeast proteome. Genes Dev. 16, Kumar A, et al. (2002b) An integrated approach for finding overlooked genes in yeast. Nat Biotechnol. 20, Lage JM, et al. (2003) Whole genome analysis of genetic alterations in small DNA samples using hyperbranched strand displacement amplification and array-cgh. Genome Res. 13, Lappalainen, T., et al., (2013) Transcriptome and genome sequencing uncovers functional variation in humans. Nature 501: Lashkari DA, et al. (1997) Yeast microarrays for genome wide parallel genetic and gene expression analysis. Proc Natl Acad Sci U S A. 94, Liti, G. et al. (2009) Population genomics of domestic and wild yeasts. Nature 458: Loftus B.J. et al., (2005) The gernome of the basidiomycetous yeast and human pathogen Cryptococcus neoformans. Science 307, Loftus B.J. et al., (2005) The genome of the protist parasite Entamaoba histolytica. Nature 433, Lynch, M. (2007) The Origins of Genome Architecture (Sinauer Associates, Sunderland, Massachusetts) Ma, L-J. et al. (2009) Genomic analysis of the basal lineage fungus Rhizopus oryzae reveals a whole genome duplication. PLoS Genetics 5:7 e Machida, M. et al. (2005) Genome sequencing and analysis of Aspergillus oryzae. Nature 438: Margulies, M. et al., (2005) Genome sequencing in microfabricated high-density picolitre reactors. Nature 437, Martin, F. et al. (2008) The genome of Laccaria bicolor provides insight into mycorrhizal symbiosis. Nature 452: Martin, F. et al. (2010) Périgord black truffle genome uncovers evolutionary origins and mechanisms of symbiosis. Nature 464: Maxam A.M., Gilbert, W. (1977) A new method for sequencing DNA. P.N.A.S. 74, Michaud GA, Snyder M. (2002) Proteomic approaches for the global analysis of proteins. Biotechniques. 33,
23 Michaud GA, et al. (2003) Analyzing antibody specificity with whole proteome microarrays. Nat Biotechnol. 21: Mikkelsen, T.S. et al., (2005) Initial sequence of the chimpanzee genome and comparison with the human genome. Nature 437, Milo, R., et al. (2002) Network motifs: simple building blocks of complex networks. Science. 298, Mitreva, M. et al., (2005) Comparative genomics of nematodes. Trends in Genetics 21, Monier, J.M. et al., (2011) Metagenomic exploration of antibiotic resistance in soil. Curr. Opin. Microbiol. 14: Montgomery, S.B. et al. (2012) the origin, evolution, and functional impact of short insertion-deletion variants identified in 179 human genomes. Genome Res. 23: Mouse Genome sequencing Consortium (2002) Initial sequencing and comparative analysis of the mouse genome. Nature 420, Newman JR, et al. (2006) Single-cell proteomic analysis of S. cerevisiae reveals the architecture of biological noise. Nature 441, Nierman W.C. et al., (2005) Genomic sequence of the pathogene and allergenic filamentous fungus Aspergillus fumogatus. Nature 438: Nirenberg, M., W., Matthaei, J. H. (1961) The dependence of cell-free protein synthesis in E. coli upon naturally occuring or synthetic polyribonucleotides P.N.A.S. 47, Nishimura, S., Jones, D.S., Khorana, H.G. (1965) The in vitro synthesis of copolypeptides containing two aminoacids in alternating sequence dependant upon a DNA-like polymer containing two nucleotides in alternating sequence. J. Mol. Biol. 13, Novo M, et al. (2009) Eukaryote-to-eukaryote gene transfer events revealed by the genome sequence of the wine yeast Saccharomyces cerevisiae EC1118. Proc Natl Acad Sci USA. 106: Oshiro G, et al. (2002) Parallel identification of new genes in Saccharomyces cerevisiae. Genome Res. 12, Pelechano, V, Wei, W., Steinmetz, L. M. (2013) Extensive transcriptional heterogeneity recealed by isoform profiling. Nature 497: Qian J, et al. (2003) Prediction of regulatory networks: genome-wide identification of transcription factor targets from gene expression data. Bioinformatics. 19, Qin J. et al. (2010) A human gut microbial gene catalogue established by metagenomic sequencing. Nature 464: Ranish JA, et al. (2003) The study of macromolecular complexes by quantitative proteomics. Nat Genet. 33, Reference Genome Group of the Gene Ontology Consortium (2009) The Gene Ontology s Reference Genome Project: A Unified Framework for Functional Annotation across Species. PLoS Computational Biology 5:7 e Roest Crollius H, et al. (2000) Estimate of human gene number provided by genome-wide analysis using Tetraodon nigroviridis DNA sequence Nat Genet. 25, Ross-Macdonald P, et al. (1999) Large-scale analysis of the yeast genome by transposon tagging and gene disruption. Nature. 402, Sanger, F., Nicklen, S., Coulson, A.R. (1977) DNA sequence with chain terminating inhibitors. P.N.A.S. 74, Schrödinger, E. (1944) What is Life? Cambridge University Press. Schwikowski B, Uetz P, Fields S. (2000) A network of protein-protein interactions in yeast. Nat Biotechnol. 18, Segal E, et al. (2003) Module networks: identifying regulatory modules and their condition-specific regulators from gene expression data. Nat Genet. 34, Seo, T.S. et al., (2005) Four-color DNA sequencing by synthesis on a chip using photocleavable fluorescent nucleotides. Proc. Nat. Acad. Sc. USA 102, Shendure J., et al. (2005) Accurate multiplex polony sequencing of an evolved bacterial genome. Science, 309, Shoemaker DD, et al. (1996) Quantitative phenotypic analysis of yeast deletion mutants using a highly parallel molecular bar-coding strategy. Nat Genet. 14: Sogin ML, et al. (2006) Microbial diversity in the deep sea and the underexplored "rare biosphere". Proc Natl Acad Sci U S A. 103, Souciet, J.L. et al., (2000) Genomic exploration of the Hemiascomycetous yeasts: 1- A set of yeast species for molecular evolution studies. FEBS Letters 487, Stein, L. D. et al., (2003) The genome sequence of Caenorhabditis briggsae: a platform for comparative geneomics. PLoS Biol. E45. Steinmetz LM, et al., (2002) Systematic screen for human disease genes in yeast. Nat Genet. 31, Stuart JM, Segal E, Koller D, Kim SK. (2003) A gene-coexpression network for global discovery of conserved genetic modules. Science. 302, Sulston, J., Waterston, R., and Consortium (1998) Genome sequence of the nematode C. elegans: a platform for investigating biology. Science 282, Tavazoie S, et al., (1999) Systematic determination of genetic network architecture. Nat Genet. 22, Temin, H., and Mizutani, S. (1970) RNA-dependent DNA polymerase in virions of Rous sarcoma virus. Nature 226, Tong AH, et al., (2001) Systematic genetic analysis with ordered arrays of yeast deletion mutants. Science. 294, Tong AH, et al., (2002) A combined experimental and computational strategy to define protein interaction networks for peptide recognition modules. Science. 295,
24 Uetz P, et al. (2000) A comprehensive analysis of protein-protein interactions in Saccharomyces cerevisiae. Nature. 403, Vassarotti, A. et al., (1995) Structure and organization of the European Yeast Genome Sequencing Network. Journal of Biotechnology 41, Vazquez A, Flammini A, Maritan A, Vespignani A. (2003) Global protein function prediction from protein-protein interaction networks. Nat Biotechnol. 21, Velculescu VE, Zhang L, Vogelstein B, Kinzler KW. (1995) Serial analysis of gene expression. Science. 270, Velculescu VE, et al., (1997) Characterization of the yeast transcriptome. Cell. 88, Venter, C., and Consortium (2001) The human genome. Science 291, Wagner A. (2003) How the global structure of protein interaction networks evolves. Proc R Soc Lond B Biol Sci. 270, Waterston, R. et al., (2002) Initial sequencing and comparative analysis of the mouse genome. Nature 420, Watson, J..D., Crick, F. H. C. (1953) A structure for deoxyribonucleic acid. Nature 171, Werner-Washburne M, et al., (2002) Comparative analysis of multiple genome-scale data sets. Genome Res. 12, Whiffin, N., et al. (2013) Deciphering the genetic architecture of low-penetrance susceptibility to colorectal cancer. Hum. Mol. Genet. (Epub ahead of print). Winckler H. (1920) Vererbung und Ursache der Parthenogenese im Pflanzen- und Tierreich. Fischer, Jena, Allemagne. Winzeler EA, et al. (1999) Functional characterization of the S. cerevisiae genome by gene deletion and parallel analysis. Science. 285, Wood V, et al., (2002) The genome sequence of Schizosaccharomyces pombe. Nature. 415, Wuchty S, Oltvai ZN, Barabasi AL. (2003) Evolutionary conservation of motif constituents in the yeast protein interaction network. Nat Genet. 35, Xu, P. et al., (2004) The genome of Cryptosporidium hominis. Nature 431, Yu, J. et al., (2002) A draft sequence of the rice genome (Oryza sativa L. ssp indica). Science 296, Yu, J. et al., (2005) The genomes of Ozyza sativa: a history of duplications. PLoS Biology 3, E38 Yu H, Luscombe NM, Qian J, Gerstein M. (2003) Genomic analysis of gene expression relationships in transcriptional regulatory networks. Trends Genet. 19, Zhang CT, Wang J. (2000) Recognition of protein coding genes in the yeast genome at better than 95% accuracy based on the Z curve. Nucleic Acids Res. 28, Zhong J, et al., (2003) A Strategy for Constructing Large Protein Interaction Maps Using the Yeast Two-Hybrid System: Regulated Expression Arrays and Two-Phase Mating. Genome Res. 13; Zhu H, et al.,. (2001) Global analysis of protein activities using proteome chips. Science. 293, Paris, 15 Octobre 2013 Bernard Dujon
25 COURS D'ANALYSE DES GENOMES ère SEMAINE Travaux Pratiques 1 : Initiation de la transcription chez la bactérie Streptococcus agalactiae Elisabeth SAUVAGE, Isabelle ROSINSKI-CHUPIN Lundi 4 novembre h00-10h00 Accueil des élèves Secrétariat de la Scolarité Présentation générale du Cours Bernard DUJON & Stéphane Le CROM (codirecteurs) Lionel FRANGEUL (chef de travaux) 10h00-12h00 Introduction à l'étude des génomes Bernard DUJON 13h30-17h30 Introduction à la bioinformatique Lionel FRANGEUL Mardi 5 novembre h00-10h30 Conférence : Les technologies de séquençage de l ADN Stéphane Le CROM (Université Pierre et Marie Curie) 10h45-12h00 Présentation des Travaux Pratiques : Isabelle ROSINSKI-CHUPIN Initiation de la transcription chez Streptococcus agalactiae 13h30-14h30 Présentation des conditions de manipulation Corinne FAYOLLE, Isabelle LEQUEUTRE et traitement des déchets dans la salle de TP 14h30-17h30 Travaux Pratiques S. agalactiae: - Purification des ARNs bactériens, traitement à la Dnase Mercredi 6 novembre h00-12h00 Travaux pratiques S. agalactiae : - Déplétion des ARNs ribosomiques, précipitation à l éthanol 13h30-17h30 Cours : Unix 1 Lionel FRANGEUL Cours : Les bases de données relationnelles Jeudi 7 novembre h00-12h00 Travaux pratiques S. agalactiae : - Contrôle de la qualité des ARN sur bioanalyseur Agilent et visite de la Génopole 13h30-17h30 Cours : Unix 2 Lionel FRANGEUL Cours : Les bases de données biologiques Corinne MAUFRAIS Vendredi 8 novembre h00-10h00 Travaux pratiques S. agalactiae : - Traitement par la TAP 10h00-11h30 Cours : Transcription chez les Procaryotes Isabelle ROSINSKI-CHUPIN 11h45-12h30 Travaux pratiques S. agalactiae : - Extraction au phénol chloroforme et précipitation à l éthanol 14h00-18h00 Cours : Unix 3 Lionel FRANGEUL Travaux pratiques bioinformatique : - Recherche multicritère dans les banques de données biologiques
26 2ème SEMAINE Travaux Pratiques 1 : Initiation de la transcription chez la bactérie Streptococcus agalactiae Elisabeth SAUVAGE, Isabelle ROSINSKI-CHUPIN Bio-informatique et traitement des données issues du séquençage génomique Lionel FRANGEUL, Corinne MAUFRAIS, Christophe RUSNIOK, Stéphane LE CROM Lundi 11 novembre 2013 Férié Mardi 12 novembre h00-10h30 Conférence : Introduction aux virus de plante et métagénomique phytovirale Thierry CANDRESSE (INRA, Université de Bordeaux) 10h45-12h00 Travaux pratiques S. agalactiae : - Fabrication des banques (Ligation de l adaptateur 5 ) 13h30-17h30 Cours : Alignement de 2 séquences Corinne MAUFRAIS Cours : Blast Travaux pratiques bioinformatique : - Exercices pratiques Unix Mercredi 13 novembre h00-17h30 Travaux pratiques S. agalactiae : - Fabrication des banques Jeudi 14 novembre h00-13h00 Travaux pratiques S. agalactiae: - Analyse sur bioanalyseur Agilent et contrôles sur gel d agarose 14h30-17h30 Cours : Unix 4 Lionel FRANGEUL Travaux pratiques bioinformatique : - Exercices pratiques Unix Vendredi 15 novembre h00-12h00 Travaux pratiques bioinformatique : - Blast 13h30-17h30 Travaux Pratiques bioinformatique : - Annotations IPF (1 ère partie)
27 Lundi 18 novembre ème SEMAINE Travaux Pratiques 1 : Initiation de la transcription chez la bactérie Streptococcus agalactiae Elisabeth SAUVAGE, Isabelle ROSINSKI-CHUPIN Bio-informatique et traitement des données issues du séquençage génomique Lionel FRANGEUL, Corinne MAUFRAIS, Christophe RUSNIOK, Stéphane LE CROM 9h00-10h30 Conférence : Annotation syntaxique et fonctionnelle de génomes bactériens Claudine MEDIGUE dans un contexte de génomique comparative (Génoscope, Evry) 10h45-12h15 Conférence : Les génomes des virus - une richesse sans précédent Simon WAIN-HOBSON 13h45-17h30 Travaux Pratiques bioinformatique : - Annotations IPF (2 ème partie) Mardi 19 novembre h00-10h30 Conférence : Plasticité du génome bactérien Didier MAZEL 10h45-12h15 Conférence : Génomique comparative d une espèce bactérienne modèle : Marie TOUCHON Escherichia coli 13h45-17h30 Travaux Pratiques bioinformatique : - Exercices Unix appliqués à la biologie Mercredi 20 novembre h00-12h00 Cours : Alignements multiples, recherche de motifs, HMM Corinne MAUFRAIS 13h30-17h30 Travaux Pratiques bioinformatique : - Alignements, recherche de motifs Jeudi 21 novembre h00-10h30 Conférence : Les éléments transposables chez les Eucaryotes Cécile NEUVEGLISE (INRA, Thiverval Grignon) 10h45-12h00 Présentations des thèmes scientifiques pour l examen oral 13h30-15h15 Travaux pratiques bioinformatique : - Comparaison de génomes annotés 15h30-17h30 Travaux Pratiques bioinformatique : - Exercices Unix appliqués à la biologie Vendredi 22 novembre h00-10h30 Conférence : The Transcriptome of Entamoeba histolytica Chung-Chau HON 10h45-12h15 Conférence : Impact des transposons sur la dynamique et l'organisation du Mireille BETERMIER génome de la paramécie (CNRS, Gif-sur-Yvette) 13h45-17h30 Cours : Annotations relationnelles Lionel FRANGEUL Travaux Pratiques bioinformatique : - Dotter
28 Lundi 25 novembre ème SEMAINE Travaux Pratiques 1 : Initiation de la transcription chez la bactérie Streptococcus agalactiae Lionel FRANGEUL, Isabelle ROSINSKI-CHUPIN Bio-informatique et traitement des données issues du séquençage génomique Lionel FRANGEUL, Corinne MAUFRAIS, Christophe RUSNIOK, Stéphane LE CROM 9h00-12h00 Travaux pratiques bioinformatique : - Annotation des séquences eucaryotes 13h30-17h30 Travaux pratiques bioinformatique S. agalactiae: - Analyse des résultats du mapping des transcrits chez Streptococcus agalactiae Mardi 26 novembre h00-10h30 Conférence : Analyse de données ChIP-seq Morgane THOMAS-CHOLLIER (ENS, Paris) 10h45-12h15 Conférence : La transcription dite "pervasive" chez les eucaryotes : Alain JACQUIER l'exemple de la levure (URA 2171 CNRS, Institut Pasteur) 13h30-17h30 Travaux pratiques bioinformatique S. agalactiae : - Analyse des résultats du mapping des transcrits chez Streptococcus agalactiae Mercredi 27 novembre h00-10h30 Conférence : La fidélité de la traduction chez les eucaryotes : approche Olivier NAMY par ribosome profiling (IGM, Université Paris-sud, Orsay) 10h45-12h00 Cours : Lionel FRANGEUL - Usage du code, ACP 13h30-17h30 Travaux Pratiques bioinformatique : - Usage du code, ACP Jeudi 28 novembre h00-10h30 Conférence : Genome analysis of malaria parasites: A pathogens perspective Artur SCHERF 10h45-12h15 Conférence : Paléogénomique des lignées humaines éteintes Eva-Maria GEIGL (Institut J. Monod, Université Paris-Diderot) 13h30-17h30 Travaux pratiques bioinformatique S. agalactiae : - Analyse des résultats du mapping des transcrits chez Streptococcus agalactiae Vendredi 29 novembre h00-12h00 Travaux pratiques bioinformatique : - Annotation des séquences eucaryotes 13h30-17h30 Travaux pratiques bioinformatique S. agalactiae : - Analyse des résultats du mapping des transcrits chez Streptococcus agalactiae
29 Lundi 2 décembre ème SEMAINE Travaux Pratiques 2 : Analyse d un paysage épigénomique par ChIP-seq chez la drosophile Sébastien BLOYER, Laure TEYSSET Bio-informatique et traitement des données issues du séquençage génomique Lionel FRANGEUL, Corinne MAUFRAIS, Christophe RUSNIOK, Stéphane LE CROM 9h00-11h00 Présentation des Travaux Pratiques : Sébastien BLOYER et Laure TEYSSET Analyse d un paysage épigénomique par ChIP-seq chez la drosophile (UPMC, Paris) 11h15-12h00 Travaux Pratiques épigénomique : - Fixation de l anticorps sur billes 13h30-18h00 Travaux Pratiques épigénomique : - Fixation des anticorps sur la chromatine Mardi 3 décembre h00-18h00 Travaux Pratiques épigénomique : - Lavage, élution et immunoprécipitations Mercredi 4 décembre h00-12h00 Travaux Pratiques épigénomique : - Purification de l ADN immunoprécipité 13h30-15h00 Conférence : Insights on chromosome organization: can simple Romain KOSZUL principles explain structural diversity? 15h15-17h15 Conférence : PCR quantitative Emmanuèle MOUCHEL-VIELH (CNRS, UPMC, Paris) Jeudi 5 décembre h00-12h00 Travaux Pratiques épigénomique : - Test de ChIP par PCR quantitative 13h30-17h30 Travaux Pratiques épigénomique : - Assemblage et mapping Vendredi 6 décembre h00-10h30 Conférence : RNAi-based antiviral immunity Carla SALEH 10h45-12h15 Conférence : Les petits ARN de plantes Hervé VAUCHERET (INRA-AgroParisTech, Versailles) 13h45-15h15 Visite du Musée Pasteur 15h30-17h30 Travaux Pratiques épigénomique : - Clustering
30 6ème SEMAINE Travaux Pratiques 2 : Analyse d un paysage épigénomique par ChIP-seq chez la drosophile Sébastien BLOYER, Laure TEYSSET, Stéphane LE CROM, Lionel FRANGEUL Lundi 9 décembre h45-12h15 Conférence : Partenariat hôte-microbe et symbiose Gérard EBERL 13h45-17h30 Travaux Pratiques bioinformatique épigénomique : - Analyse des résultats des PCR quantitatives Mardi 10 décembre h30-12h00 Conférence : Organisation fonctionnelle et dynamique développementale François ROUDIER de l épigénome d Arabidopsie (ENS, Paris) 13h30-17h30 Travaux Pratiques bioinformatique épigénomique : - Mapping et peak calling du ChIP-Seq Mercredi 11 décembre h30-12h00 Conférence : Diatomée et métagénomique TARA Océan Chris BOWLER (ENS, Paris) 13h30-17h30 Travaux pratiques bioinformatique épigénomique : - Analyse globale et corrélation ENCODE Jeudi 12 décembre h00-12h00 Conférence : le projet ENCODE Sarah DJEBALI (Center for Genomic Regulation Barcelone, Espagne) 13h30-15h30 Travaux pratiques épigénomique : - Bilan des analyses des résultats 15h45-16h45 Bilan final du Cours Vendredi 13 décembre 2013 Libre
31 7ème SEMAINE MODALITES DES EXAMENS Examen écrit de bio-informatique : (salle de cours 2, PLM) Lundi 16 décembre 2013 à 10 heures, durée : 1h30 (Note sur 20, coefficient 1) Contrôle continu concernant les Travaux Pratiques «laboratoire» : Note attribuée par les deux équipes de Travaux Pratiques «Initiation de la transcription chez Streptococcus agalactiae» et «Analyse d un paysage épigénomique par ChIP-seq chez la drosophile» (Note sur 20, coefficient 1) Examen oral : (salle de cours 2, PLM) Mercredi 18 décembre et Jeudi 19 décembre 2013 : -1. Présentation d une des parties expérimentales des travaux pratiques «Mapping des transcrits chez Streptococcus agalactiae» ou «Analyse d un paysage épigénomique par ChIP-seq chez la drosophile» : introduction, résultats expérimentaux, discussion, conclusions Durée : 10 mn et questions du jury : 5 mn (Note sur 20, coefficient 1) -2. Présentation d un sujet choisi parmi les thèmes ci-dessous. Durée : 10 mn et questions du jury : 5 mn (Note sur 20, coefficient 1) Organisation de la présentation orale - Exposé non public de chaque étudiant devant le jury - Diapositives (PDF uniquement) - Photocopies des diapositives (4 diapositives par page) à prévoir pour chacun des membres du jury N Thèmes 1 Eléments mobiles dans les génomes 2 Evolution des génomes 3 Génomique des bactéries 4 Génomique des eucaryotes 5 Epigénomique 6 Génomique virale 7 La transcription et ses produits 8 Méthodes de séquençage 9 Métagénomique Thèmes pour l examen oral de Décembre 2013 Les thèmes définis ici sont volontairement larges. Chaque étudiant présentera un sujet précis du thème choisi. L étudiant fera une présentation de 10 mn (plus 5 mn de questions) en s appuyant sur les informations données pendant les travaux pratiques, les conférences et par la bibliographie. Les questions du jury pourront porter sur tous les thèmes. Directives : Il faut : - Présenter un sujet précis du thème choisi Il ne faut pas : - Faire une présentation générale du thème - Refaire une conférence qui a été donnée pendant le cours - Utiliser les diapositives d un conférencier Le jury appréciera : - L originalité du sujet traité, - La pertinence et la précision des informations, - La rigueur du plan de la présentation, - La qualité de la présentation orale et des diapositives, - Les réponses aux questions du jury.
CHAPITRE 3 LA SYNTHESE DES PROTEINES
CHAITRE 3 LA SYNTHESE DES ROTEINES On sait qu un gène détient dans sa séquence nucléotidique, l information permettant la synthèse d un polypeptide. Ce dernier caractérisé par sa séquence d acides aminés
Dr E. CHEVRET UE2.1 2013-2014. Aperçu général sur l architecture et les fonctions cellulaires
Aperçu général sur l architecture et les fonctions cellulaires I. Introduction II. Les microscopes 1. Le microscope optique 2. Le microscope à fluorescence 3. Le microscope confocal 4. Le microscope électronique
Génétique et génomique Pierre Martin
Génétique et génomique Pierre Martin Principe de la sélections Repérage des animaux intéressants X Accouplements Programmés Sélection des meilleurs mâles pour la diffusion Index diffusés Indexation simultanée
MASTER (LMD) PARCOURS MICROORGANISMES, HÔTES, ENVIRONNEMENTS (MHE)
MASTER (LMD) PARCOURS MICROORGANISMES, HÔTES, ENVIRONNEMENTS (MHE) RÉSUMÉ DE LA FORMATION Type de diplôme : Master (LMD) Domaine ministériel : Sciences, Technologies, Santé Mention : BIOLOGIE DES PLANTES
Big data et sciences du Vivant L'exemple du séquençage haut débit
Big data et sciences du Vivant L'exemple du séquençage haut débit C. Gaspin, C. Hoede, C. Klopp, D. Laborie, J. Mariette, C. Noirot, MS. Trotard [email protected] INRA - MIAT - Plate-forme
Les OGM. 5 décembre 2008. Nicole Mounier
Les OGM 5 décembre 2008 Nicole Mounier Université Claude Bernard Lyon 1 CGMC, bâtiment Gregor Mendel 43, boulevard du 11 Novembre 1918 69622 Villeurbanne Cedex OGM Organismes Génétiquement Modifiés Transfert
Master de Bioinformatique et Biologie des Systèmes Toulouse http://m2pbioinfo.biotoul.fr Responsable : Pr. Gwennaele Fichant
Master de Bioinformatique et Biologie des Systèmes Toulouse http://m2pbioinfo.biotoul.fr Responsable : Pr. Gwennaele Fichant Parcours: Master 1 : Bioinformatique et biologie des Systèmes dans le Master
Introduction à la Génomique Fonctionnelle
Introduction à la Génomique Fonctionnelle Cours aux étudiants de BSc Biologie 3ème année Philippe Reymond, MER PLAN DU COURS - Séquençage des génomes - Fabrication de DNA microarrays - Autres méthodes
Chapitre 1 : Introduction aux bases de données
Chapitre 1 : Introduction aux bases de données Les Bases de Données occupent aujourd'hui une place de plus en plus importante dans les systèmes informatiques. Les Systèmes de Gestion de Bases de Données
Cellules procaryotes Service histologie Pr.k.mebarek
Cellules procaryotes Service histologie Pr.k.mebarek I) Les cellules procaryotes II) Les cellules eucaryotes o 1) Caractéristiques générales des cellules eucaryotes o 2) Organisation des cellules eucaryotes
MABioVis. Bio-informatique et la
MABioVis Modèles et Algorithmes pour la Bio-informatique et la Visualisation Visite ENS Cachan 5 janvier 2011 MABioVis G GUY MELANÇON (PR UFR Maths Info / EPI GRAVITE) (là, maintenant) - MABioVis DAVID
LA MITOSE CUEEP - USTL DÉPARTEMENT SCIENCES BAHIJA DELATTRE
Biologie LA MITOSE CUEEP - USTL DÉPARTEMENT SCIENCES BAHIJA DELATTRE Février 2006 I. L'INTRODUCTION Chaque cellule d'un organisme supérieur provient de la multiplication d'une cellule préexistante (cellule
PROBLEMES D'ORDONNANCEMENT AVEC RESSOURCES
Leçon 11 PROBLEMES D'ORDONNANCEMENT AVEC RESSOURCES Dans cette leçon, nous retrouvons le problème d ordonnancement déjà vu mais en ajoutant la prise en compte de contraintes portant sur les ressources.
Conférence technique internationale de la FAO
Décembre 2009 ABDC-10/7.2 F Conférence technique internationale de la FAO Biotechnologies agricoles dans les pays en développement: choix et perspectives pour les cultures, les forêts, l élevage, les pêches
MYRIAD. l ADN isolé n est à présent plus brevetable!
MYRIAD La Cour Suprême des Etats-Unis revient sur plus de 30 ans de pratique : l ADN isolé n est à présent plus brevetable! Mauvaise passe pour les inventions en biotechnologies sur le territoire américain.
Intrants médicamenteux en agriculture et en santé : les écosystèmes microbiens sont-ils un problème ou une solution?
Les Rencontres de l Inra au Salon de l agriculture Intrants médicamenteux en agriculture et en santé : les écosystèmes microbiens sont-ils un problème ou une solution? Lundi 23 février 2015 Programme 14h30
Ebauche Rapport finale
Ebauche Rapport finale Sommaire : 1 - Introduction au C.D.N. 2 - Définition de la problématique 3 - Etat de l'art : Présentatio de 3 Topologies streaming p2p 1) INTRODUCTION au C.D.N. La croissance rapide
Les débuts de la génétique
HPITRE 9 DES DÉBTS DE L ÉNÉTIQE X ENJEX TELS DES BIOTEHNOLOIES 1 Les débuts de la génétique est avec les travaux de regor Mendel vers la fin du XIX e siècle que furent posées les bases de la génétique.
LE PROBLEME DU PLUS COURT CHEMIN
LE PROBLEME DU PLUS COURT CHEMIN Dans cette leçon nous définissons le modèle de plus court chemin, présentons des exemples d'application et proposons un algorithme de résolution dans le cas où les longueurs
3: Clonage d un gène dans un plasmide
3: Clonage d un gène dans un plasmide Le clonage moléculaire est une des bases du génie génétique. Il consiste à insérer un fragment d'adn (dénommé insert) dans un vecteur approprié comme un plasmide par
Gènes Diffusion - EPIC 2010
Gènes Diffusion - EPIC 2010 1. Contexte. 2. Notion de génétique animale. 3. Profil de l équipe plateforme. 4. Type et gestion des données biologiques. 5. Environnement Matériel et Logiciel. 6. Analyses
Rapport d'analyse des besoins
Projet ANR 2011 - BR4CP (Business Recommendation for Configurable products) Rapport d'analyse des besoins Janvier 2013 Rapport IRIT/RR--2013-17 FR Redacteur : 0. Lhomme Introduction...4 La configuration
AVANT-PROPOS CREATIVITE, FEMMES ET DEVELOPPEMENT L'EXEMPLE QUI VIENT DES AUTRES...
AVANT-PROPOS CREATIVITE, FEMMES ET DEVELOPPEMENT L'EXEMPLE QUI VIENT DES AUTRES... Tellement à la mode depuis quelques années, le mot de créativité est peut-être déjà démodé. La publicité, la médiatisation,
Introduction. I Étude rapide du réseau - Apprentissage. II Application à la reconnaissance des notes.
Introduction L'objectif de mon TIPE est la reconnaissance de sons ou de notes de musique à l'aide d'un réseau de neurones. Ce réseau doit être capable d'apprendre à distinguer les exemples présentés puis
Projet Pédagogique Conférence interactive HUBERT REEVES Vendredi 13 mars 2015-14 H
Projet Pédagogique Conférence interactive HUBERT REEVES Vendredi 13 mars 2015-14 H Page 1 DES CONFERENCES QUI ENRICHISSENT LES PROGRAMMES SCOLAIRES : Objectifs principaux : Acquérir et approfondir des
SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique
SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique DOMAINE P3.C3.D1. Pratiquer une démarche scientifique et technologique, résoudre des
La reconnaissance moléculaire: la base du design rationnel Modélisation moléculaire: Introduction Hiver 2006
La reconnaissance moléculaire: la base du design rationnel En 1890 Emil Fisher a proposé le modèle "serrure et clé" pour expliquer la façon de fonctionner des systèmes biologiques. Un substrat rentre et
Séquence 6. Mais ces espèces pour autant ne sont pas identiques et parfois d ailleurs ne se ressemblent pas vraiment.
Sommaire Séquence 6 Nous avons vu dans les séances précédentes qu au cours des temps géologiques des espèces différentes se sont succédé, leur apparition et leur disparition étant le résultat de modifications
POLITIQUE DE BIOSÉCURITÉ
Date d entrée en vigueur: Mai 2006 Remplace/amende: VRS-52/s/o Origine: Vice-rectorat aux services Numéro de référence: VPS-52 DÉFINITION Une substance biologique dangereuse se définit comme un organisme
Comment dit-on qu'une étoile est plus vieille qu'une autre ou plus jeune qu'une autre?
Comment dit-on qu'une étoile est plus vieille qu'une autre ou plus jeune qu'une autre? Comment peut-on donner un âge à l'univers? Dans l'univers, il y a beaucoup de choses : des étoiles, comme le Soleil...
grande simple microscope microscope inventé années 1825. biologie = cellule) et (logos de plus en Anglais. Utilise un La microscopie, 1665,
Cours de Biologie Cellulaire Présentés par Mr CHELLI A. FSNV 2012/ /2013 CHAPITRE I : INTRODUCTION A LA BIOLOGIE CELLULAIRE A- Introduction et définitionn de la biologie cellulaire : Il était difficile
CATALOGUE DES PRESTATIONS DE LA
1/23 La plate-forme Biopuces et Séquençage de Strasbourg est équipée des technologies Affymetrix et Agilent pour l étude du transcriptome et du génome sur puces à ADN. SOMMAIRE ANALYSE TRANSCRIPTIONNELLE...
METHODOLOGIE GENERALE DE LA RECHERCHE EPIDEMIOLOGIQUE : LES ENQUETES EPIDEMIOLOGIQUES
Enseignement du Deuxième Cycle des Etudes Médicales Faculté de Médecine de Toulouse Purpan et Toulouse Rangueil Module I «Apprentissage de l exercice médical» Coordonnateurs Pr Alain Grand Pr Daniel Rougé
Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN
Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN Table des matières. Introduction....3 Mesures et incertitudes en sciences physiques
Prise de position sur les biosimilaires. Résumé
Prise de position sur les biosimilaires Résumé Les médicaments biotechnologiques, appelés également biomédicaments, occupent une place importante dans le traitement de maladies comme le cancer, la polyarthrite
LE PROBLÈME DE RECHERCHE ET LA PROBLÉMATIQUE
LE PROBLÈME DE RECHERCHE ET LA PROBLÉMATIQUE Un problème de recherche est l écart qui existe entre ce que nous savons et ce que nous voudrions savoir à propos d un phénomène donné. Tout problème de recherche
Le chiffre est le signe, le nombre est la valeur.
Extrait de cours de maths de 6e Chapitre 1 : Les nombres et les opérations I) Chiffre et nombre 1.1 La numération décimale En mathématique, un chiffre est un signe utilisé pour l'écriture des nombres.
Exercices de génétique classique partie II
Exercices de génétique classique partie II 1. L idiotie phénylpyruvique est une maladie héréditaire dont sont atteints plusieurs membres d une famille, dont voici l arbre généalogique : 3 4 5 6 7 8 9 10
La correction des erreurs d'enregistrement et de traitement comptables
La correction des erreurs d'enregistrement et de traitement comptables Après l'étude des différents types d'erreurs en comptabilité (Section 1) nous étudierons la cause des erreurs (Section 2) et les techniques
UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES
Université Paris 13 Cours de Statistiques et Econométrie I UFR de Sciences Economiques Année 2008-2009 Licence de Sciences Economiques L3 Premier semestre TESTS PARAMÉTRIQUES Remarque: les exercices 2,
GénoToul 2010, Hôtel de Région Midi Pyrénées, Toulouse, 10 décembre 2010
GénoToul 2010, Hôtel de Région Midi Pyrénées, Toulouse, 10 décembre 2010 Analyse de la diversité moléculaire des régions génomiques de 30 gènes du développement méristématique dans une core collection
INFORMATION GÉNÉTIQUE et REPRODUCTION SEXUÉE
Partie 1, Chapitre 4 INFORMATION GÉNÉTIQUE et REPRODUCTION SEXUÉE Constat : à l'exception des jumeaux, chaque individu est unique. Ses caractères héréditaires dependent des info génétiques (allèles) portées
Observation des modalités et performances d'accès à Internet
Observation des modalités et performances d'accès à Internet Avant-propos La base de cette étude est constituée par les informations collectées par l'outil Cloud Observer d'iplabel (chargement des différents
Exercices de dénombrement
Exercices de dénombrement Exercice En turbo Pascal, un entier relatif (type integer) est codé sur 6 bits. Cela signifie que l'on réserve 6 cases mémoires contenant des "0" ou des "" pour écrire un entier.
CHAPITRE VIII : Les circuits avec résistances ohmiques
CHAPITRE VIII : Les circuits avec résistances ohmiques VIII. 1 Ce chapitre porte sur les courants et les différences de potentiel dans les circuits. VIII.1 : Les résistances en série et en parallèle On
TD de Biochimie 4 : Coloration.
TD de Biochimie 4 : Coloration. Synthèse de l expérience 2 Les questions posées durant l expérience 2 Exposé sur les méthodes de coloration des molécules : Générique Spécifique Autres Questions Pourquoi
Résonance Magnétique Nucléaire : RMN
21 Résonance Magnétique Nucléaire : RMN Salle de TP de Génie Analytique Ce document résume les principaux aspects de la RMN nécessaires à la réalisation des TP de Génie Analytique de 2ème année d IUT de
Comprendre l Univers grâce aux messages de la lumière
Seconde / P4 Comprendre l Univers grâce aux messages de la lumière 1/ EXPLORATION DE L UNIVERS Dans notre environnement quotidien, les dimensions, les distances sont à l échelle humaine : quelques mètres,
BIG DATA une évolution, une révolution, une promesse pour le diagnostic
Journées One Health d Ile-de-France BIG DATA une évolution, une révolution, une promesse pour le diagnostic 27 novembre 2014 de 13h30 à 17h30 Amphithéâtre 3 du Campus Centre UPEC Le séminaire sera suivi
Biomarqueurs en Cancérologie
Biomarqueurs en Cancérologie Définition, détermination, usage Biomarqueurs et Cancer: définition Anomalie(s) quantitative(s) ou qualitative(s) Indicative(s) ou caractéristique(s) d un cancer ou de certaines
a) La technique de l analyse discriminante linéaire : une brève présentation. 3 étapes de la méthode doivent être distinguées :
a) La technique de l analyse discriminante linéaire : une brève présentation. Nous nous limiterons ici à l'analyse discriminante linéaire et à deux groupes : - linéaire, la variante utilisée par ALTMAN
Identification de nouveaux membres dans des familles d'interleukines
Identification de nouveaux membres dans des familles d'interleukines Nicolas Beaume Jérôme Mickolajczak Gérard Ramstein Yannick Jacques 1ère partie : Définition de la problématique Les familles de gènes
Christophe CANDILLIER Cours de DataMining mars 2004 Page 1
Christophe CANDILLIER Cours de DataMining mars 2004 age 1 1. Introduction 2. rocessus du DataMining 3. Analyse des données en DataMining 4. Analyse en Ligne OLA 5. Logiciels 6. Bibliographie Christophe
4 : MÉTHODES D ANALYSE UTILISÉES EN ÉCOLOGIE MICROBIENNE
4 : MÉTHODES D ANALYSE UTILISÉES EN ÉCOLOGIE MICROBIENNE L écologie microbienne (ou étude des micro-organismes de l environnement) étudie : les relations entre les différentes populations de micro-organismes
Manuel d utilisation 26 juin 2011. 1 Tâche à effectuer : écrire un algorithme 2
éducalgo Manuel d utilisation 26 juin 2011 Table des matières 1 Tâche à effectuer : écrire un algorithme 2 2 Comment écrire un algorithme? 3 2.1 Avec quoi écrit-on? Avec les boutons d écriture........
PEUT- ON SE PASSER DE LA NOTION DE FINALITÉ?
PEUT- ON SE PASSER DE LA NOTION DE FINALITÉ? à propos de : D Aristote à Darwin et retour. Essai sur quelques constantes de la biophilosophie. par Étienne GILSON Vrin (Essais d art et de philosophie), 1971.
Liste des matières enseignées
Liste des matières enseignées Domaine : Sciences de la Nature et de la Vie Filière : Biologie Parcours : Tronc Commun Semestre1 VHG Coefficient Cours TD/TP Crédits/s. unité crédits U.E fondamental : 13
«Manuel Pratique» Gestion budgétaire
11/06/01 B50/v2.31/F/MP005.01 «Manuel Pratique» Gestion budgétaire Finance A l usage des utilisateurs de Sage BOB 50 Solution Sage BOB 50 2 L éditeur veille à la fiabilité des informations publiées, lesquelles
Entretien avec Jean-Paul Betbéze : chef économiste et directeur des études économiques du Crédit agricole, est membre du Conseil d'analyse économique
Faut-il reculer l âge de la retraite? Entretien avec Jean-Paul Betbéze : chef économiste et directeur des études économiques du Crédit agricole, est membre du Conseil d'analyse économique Entretien avec
LA SURVEILLANCE ET LE SUIVI DE L'ENVIRONNEMENT. Pierre Guimont Conseiller en environnement Unité Environnement Division Équipement, Hydro-Québec
LA SURVEILLANCE ET LE SUIVI DE L'ENVIRONNEMENT Pierre Guimont Conseiller en environnement Unité Environnement Division Équipement, Hydro-Québec Introduction L'un des principes directeurs de la politique
Physique Chimie. Utiliser les langages scientifiques à l écrit et à l oral pour interpréter les formules chimiques
C est Niveau la représentation 4 ème 2. Document du professeur 1/6 Physique Chimie LES ATOMES POUR COMPRENDRE LA TRANSFORMATION CHIMIQUE Programme Cette séance expérimentale illustre la partie de programme
Les métiers du secrétariat et de la bureautique
Les métiers du secrétariat et de la bureautique Présentation des métiers Alors que l'on avait annoncé la quasi-disparition des secrétaires, supplantées par les ordinateurs, elles bénéficient aujourd'hui
Consensus Scientifique sur. les. Champs statiques
page 1/8 Consensus Scientifique sur Source : OMS (2006) les Champs statiques Résumé & Détails: GreenFacts Contexte - Les équipements d imagerie médicale par résonance magnétique (IRM), les trains et les
MS PROJECT 2000. Prise en main. Date: Mars 2003. Anère MSI. 12, rue Chabanais 75 002 PARIS E mail : [email protected] Site : www.anere.
DOCUMENTATION MS PROJECT 2000 Prise en main Date: Mars 2003 Anère MSI 12, rue Chabanais 75 002 PARIS E mail : [email protected] Site : www.anere.com Le présent document est la propriété exclusive d'anère
MAB Solut. vos projets. MABLife Génopole Campus 1 5 rue Henri Desbruères 91030 Evry Cedex. www.mabsolut.com. intervient à chaque étape de
Mabsolut-DEF-HI:Mise en page 1 17/11/11 17:45 Page1 le département prestataire de services de MABLife de la conception à la validation MAB Solut intervient à chaque étape de vos projets Création d anticorps
Hépatite chronique B Moyens thérapeutiques
Hépatite chronique B Moyens thérapeutiques Dr Olfa BAHRI Laboratoire de Virologie Clinique Institut Pasteur de Tunis INTRODUCTION Plus de 300. 10 6 porteurs chroniques de VHB dans le monde Hépatite chronique
Le logement dans tous ses états. Définition : le logement et l'habitat
Le logement dans tous ses états 17/10/ 2012 Définition : le logement et l'habitat Le logement est un produit : une maison, un appartement, un type 3, un duplex L'habitat est un service : l'espace produit
Perrothon Sandrine UV Visible. Spectrophotométrie d'absorption moléculaire Étude et dosage de la vitamine B 6
Spectrophotométrie d'absorption moléculaire Étude et dosage de la vitamine B 6 1 1.But et théorie: Le but de cette expérience est de comprendre l'intérêt de la spectrophotométrie d'absorption moléculaire
Analyse des données de séquençage massif par des méthodes phylogénétiques
Analyse des données de séquençage massif par des méthodes phylogénétiques Roux S., Taib N., Mangot J.F., Hugoni M., Mary I., Ravet V., Bronner G., Enault F., Debroas D. Équipe Microbiologie de l'environnement
Système immunitaire artificiel
République Algérienne Démocratique et Populaire Ministère de l Enseignement Supérieure Université des Sciences et de la Technologie D Oran Mohammed Boudiaf (USTO) Faculté des Sciences Département d Informatique
Génomique Comparative et intégrative
Génomique Comparative et intégrative Introduction : Le big data : on peut traiter des données massives à présent, l'objectif à présent est d'éviter les transferts de données trop longs. On a tout à portée
Interface PC Vivago Ultra. Pro. Guide d'utilisation
Interface PC Vivago Ultra Pro Guide d'utilisation Version 1.03 Configuration de l'interface PC Vivago Ultra Configuration requise Avant d'installer Vivago Ultra sur votre ordinateur assurez-vous que celui-ci
University of Tokyo Graduate School of Agricultural and Life Sciences et. Kanagawa Academy of Science and Technology
COMMUNIQUÉ DE PRESSE le 25 mars 2014 Une étude conjointe menée par University of Tokyo Graduate School of Agricultural and Life Sciences et Kanagawa Academy of Science and Technology suggère que le sirop
Les tests génétiques à des fins médicales
Les tests génétiques à des fins médicales Les tests génétiques à des fins médicales Nous avons tous hérité d une combinaison unique de gènes de la part de nos parents. Cette constitution originale et l
Item 169 : Évaluation thérapeutique et niveau de preuve
Item 169 : Évaluation thérapeutique et niveau de preuve COFER, Collège Français des Enseignants en Rhumatologie Date de création du document 2010-2011 Table des matières ENC :...3 SPECIFIQUE :...3 I Différentes
Environmental Research and Innovation ( ERIN )
DÉpartEment RDI Environmental Research and Innovation ( ERIN ) Le département «Environmental Research and Innovation» (ERIN) du LIST élabore des stratégies, des technologies et des outils visant à mieux
LES OUTILS DU TRAVAIL COLLABORATIF
LES OUTILS DU TRAVAIL COLLABORATIF Lorraine L expression «travail collaboratif» peut se définir comme «l utilisation de ressources informatiques dans le contexte d un projet réalisé par les membres d un
Les ressources numériques
Les ressources numériques Les ressources numériques sont diverses et regroupent entre autres, les applications, les bases de données et les infrastructures informatiques. C est un ensemble de ressources
Le Monde des insectes, son importance pour l Homme et l apport de l étude des insectes aux sciences du vivant.
MEDAILLE D OR DU CNRS 2011 Le Monde des insectes, son importance pour l Homme et l apport de l étude des insectes aux sciences du vivant. Extrait de l allocution prononcée le 19 juin 2007 par Jules Hoffmann,
ENSEIGNEMENTS ET SÉMINAIRES
CHAIRE ESSEC-AVENTIS ÉTHIQUE & BIOTECHNOLOGIES Dans un marché comme celui du médicament où les clients sont d abord des patients, les biotechnologies sont appelées à répondre à un double défi, à la fois
GESTIONS DE CRISE Gestion de crise et coopération au niveau d'un groupe européen
GESTIONS DE CRISE Gestion de crise et coopération au niveau d'un groupe européen Crisis management Crisis management and cooperation in a European group Oléagineux, Corps Gras, Lipides. Volume 7, Numéro
I. La levure Saccharomyces cerevisiae: mode de vie
LES LEVURES UE «levures» -5 avril: généralités (MN Simon) -6 avril: analyse génétique (MN Simon) -6 avril: Cycle cellulaire I: la réplication (E. bailly) -7 avril: Cycle cellulaire II: la mitose (E. Bailly)
Mise en place de serveurs Galaxy dans le cadre du réseau CATI BBRIC
Mise en place de serveurs Galaxy dans le cadre du réseau CATI BBRIC {Sebastien.Carrere, Ludovic.Legrand,Jerome.Gouzy}@toulouse.inra.fr {Fabrice.Legeai,Anthony.Bretaudeau}@rennes.inra.fr CATI BBRIC 35 bioinformaticiens
LIVRE BLANC Décembre 2014
PARSING MATCHING EQUALITY SEARCH LIVRE BLANC Décembre 2014 Introduction L analyse des tendances du marché de l emploi correspond à l évidence à une nécessité, surtout en période de tension comme depuis
de l air pour nos enfants!
B u l l e t i n d e l O Q A I n 1 Crèches et lieux d enseignement : de l air pour nos enfants! Le programme de l OQAI «Lieux de vie fréquentés par les enfants» a débuté en 2006. Une première phase de recueil
Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION
Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION Classe de terminale de la série Sciences et Technologie du Management et de la Gestion Préambule Présentation Les technologies de l information
Univers Vivant Révision. Notions STE
Univers Vivant Révision Notions STE Chap. 13) L Écologie 1) a) Qu est-ce que l empreinte écologique? L empreinte écologique correspond à la surface terrestre et aquatique totale nécessaire à un individu,
Contrôle de l'expression génétique : Les régulations post-transcriptionnelles
Contrôle de l'expression génétique : Les régulations post-transcriptionnelles http://perso.univ-rennes1.fr/serge.hardy/ utilisateur : biochimie mot de passe : 2007 L'ARNm, simple intermédiaire entre le
des banques pour la recherche
ADN, cellules, tissus... des banques pour la recherche FÉVRIER 2009 Les banques d échantillons de matériel biologique (tissus, cellules, ADN ), appelées biobanques, mettent à disposition des chercheurs
Relation entre deux variables : estimation de la corrélation linéaire
CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence
Plateforme Transgenèse/Zootechnie/Exploration Fonctionnelle IBiSA. «Anexplo» Service Transgenèse. Catalogue des prestations
Plateforme Transgenèse/Zootechnie/Exploration Fonctionnelle IBiSA «Anexplo» Service Transgenèse Catalogue des prestations 04/01/12 - Page 1 sur 8 Présentation du service de Transgenèse Le service de Transgenèse
modélisation solide et dessin technique
CHAPITRE 1 modélisation solide et dessin technique Les sciences graphiques regroupent un ensemble de techniques graphiques utilisées quotidiennement par les ingénieurs pour exprimer des idées, concevoir
La maladie de Huntington, une maladie du cerveau
Actualités à propos de la recherche sur la maladie de Huntington. Expliqué simplement. Écrit par des scientifiques. Pour la communauté mondiale HD. La greffe de moelle osseuse dans la maladie de Huntington
Bases de données des mutations
Bases de données des mutations CFMDB CFTR2 CFTR-France / Registre Corinne THEZE, Corinne BAREIL Laboratoire de génétique moléculaire Montpellier Atelier Muco, Lille, 25-27 septembre 2014 Accès libre http://www.genet.sickkids.on.ca/app
Qu est-ce qu un ordinateur quantique et à quoi pourrait-il servir?
exposé UE SCI, Valence Qu est-ce qu un ordinateur quantique et à quoi pourrait-il servir? Dominique Spehner Institut Fourier et Laboratoire de Physique et Modélisation des Milieux Condensés Université
DIFFRACTion des ondes
DIFFRACTion des ondes I DIFFRACTION DES ONDES PAR LA CUVE À ONDES Lorsqu'une onde plane traverse un trou, elle se transforme en onde circulaire. On dit que l'onde plane est diffractée par le trou. Ce phénomène
1 les caractères des êtres humains.
Quelques rappels des classes précédentes ACTIVITÉ livre pages 8 et 9 : apprendre le bilan de la page 9 Les êtres vivants sont répartis en espèces. Chaque être vivant est formé de cellules. schéma d une
Chapitre 1: Facteurs d'échelle
Chapitre 1: Facteurs d'échelle Des considérations générales sur la taille des objets ou des êtres vivants et leur influence sur différents paramètres, permettent d'établir simplement quelques lois ou tendances,
Pour un usage plus sûr du téléphone portable
Pour un usage plus sûr du téléphone portable On commence tout juste à en parler : l utilisation du portable comporte des risques pour la santé. Pour tenter de les réduire, le Criirem (Centre de recherche
Epreuve de Sciences économiques et sociales
Epreuve de Sciences économiques et sociales Sujet zéro 1 1/ Question d analyse microéconomique ou macroéconomique (6 points) Expliquer et représenter graphiquement les gains à l échange. 2/ Conduite d
