Introduction à la génomique fonctionnelle

Documents pareils
Master de Bioinformatique et Biologie des Systèmes Toulouse Responsable : Pr. Gwennaele Fichant

CATALOGUE DES PRESTATIONS DE LA

Dr E. CHEVRET UE Aperçu général sur l architecture et les fonctions cellulaires

TD de Biochimie 4 : Coloration.

CHAPITRE 3 LA SYNTHESE DES PROTEINES

Génétique et génomique Pierre Martin

Gènes Diffusion - EPIC 2010

MABioVis. Bio-informatique et la

Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments»

Biomarqueurs en Cancérologie

Biologie Appliquée. Dosages Immunologiques TD9 Mai Stéphanie Sigaut INSERM U1141

Chapitre 7 : Structure de la cellule Le noyau cellulaire

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY

I. La levure Saccharomyces cerevisiae: mode de vie

GénoToul 2010, Hôtel de Région Midi Pyrénées, Toulouse, 10 décembre 2010

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST.

Big data et sciences du Vivant L'exemple du séquençage haut débit

Mise en place d une solution automatique de stockage et de visualisation de données de capture des interactions chromatiniennes à l échelle génomique

MAB Solut. vos projets. MABLife Génopole Campus 1 5 rue Henri Desbruères Evry Cedex. intervient à chaque étape de

e-biogenouest CNRS UMR 6074 IRISA-INRIA / Plateforme de Bioinformatique GenOuest yvan.le_bras@irisa.fr Programme fédérateur Biogenouest co-financé

Conception de Médicament

Plateforme. DArT (Diversity Array Technology) Pierre Mournet

Laboratoire de Photophysique et de Photochimie Supra- et Macromoléculaires (UMR 8531)

La reconnaissance moléculaire: la base du design rationnel Modélisation moléculaire: Introduction Hiver 2006

Mise en place d une plateforme de gestion de matériels biologiques : quels avantages pour les chercheurs?

Hépatite chronique B Moyens thérapeutiques

Base de données bibliographiques Pubmed-Medline

Bases de données et outils bioinformatiques utiles en génétique

Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH

Introduction à la Génomique Fonctionnelle

DÉFIS DU SÉQUENÇAGE NOUVELLE GÉNÉRATION

BIG DATA une évolution, une révolution, une promesse pour le diagnostic

Physiopathologie : de la Molécule à l'homme

ÉCOLE DE TECHNOLOGIE SUPÉRIEURE UNIVERSITÉ DU QUÉBEC RAPPORT DE PROJET PRÉSENTÉ À L ÉCOLE DE TECHNOLOGIE SUPÉRIEURE

IMMUNOLOGIE. La spécificité des immunoglobulines et des récepteurs T. Informations scientifiques

Biochimie I. Extraction et quantification de l hexokinase dans Saccharomyces cerevisiae 1. Assistants : Tatjana Schwabe Marcy Taylor Gisèle Dewhurst

2 e partie de la composante majeure (8 points) Les questions prennent appui sur six documents A, B, C, D, E, F (voir pages suivantes).

Plateforme Transgenèse/Zootechnie/Exploration Fonctionnelle IBiSA. «Anexplo» Service Transgenèse. Catalogue des prestations

Environmental Research and Innovation ( ERIN )

Cellules procaryotes Service histologie Pr.k.mebarek

Comment reproduire les résultats de l article : POP-Java : Parallélisme et distribution orienté objet

ATELIER IMAGEJ. Différentes applications vous sont proposées pour apprendre à utiliser quelques fonctions d ImageJ :

MASTER (LMD) MANAGEMENT DE PROJET ET INNOVATION EN BIOTECHNOLOGIE

Montréal, 24 mars David Levine Président et chef de la direction DL Strategic Consulting. DL Consulting Strategies in Healthcare

Les Parcours Scientifiques et les Ecoles Doctorales

Vérifier la qualité de vos applications logicielle de manière continue

Physique Chimie. Utiliser les langages scientifiques à l écrit et à l oral pour interpréter les formules chimiques

Contrôle de l'expression génétique : Les régulations post-transcriptionnelles

Rôle des acides biliaires dans la régulation de l homéostasie du glucose : implication de FXR dans la cellule bêta-pancréatique

Les outils de génétique moléculaire Les techniques liées aux acides nucléiques

Le potentiel phénolique du Cabernet franc

Introduction aux bases de données: application en biologie

UE : GENE Responsable : Enseignant : ECUE 1. Enseignant : ECUE 2. Dr COULIBALY Foungotin Hamidou

Big Data: développement, rôle des ARS?? Laurent Tréluyer, ARS Ile de France Alain Livartowski Institut Curie Paris 01/12/2014

évaluation des risques professionnels

Les apports de l informatique. Aux autres disciplines


Mise en œuvre de la virtualisation à l IGBMC. Guillaume Seith Remy Fritz

Les OGM. 5 décembre Nicole Mounier

Actualités sur la sélection des pondeuses Prospections futures. Dr. Matthias Schmutz, Lohmann Tierzucht

UE6 - Cycle de vie du médicament : Conception rationnelle

Item 169 : Évaluation thérapeutique et niveau de preuve

Séquence 6. Mais ces espèces pour autant ne sont pas identiques et parfois d ailleurs ne se ressemblent pas vraiment.

BASE. Vous avez alors accès à un ensemble de fonctionnalités explicitées ci-dessous :

Bases de données des mutations

4 : MÉTHODES D ANALYSE UTILISÉES EN ÉCOLOGIE MICROBIENNE

Université de Montréal. Développement d outils pour l analyse de données de ChIP-seq et l identification des facteurs de transcription

MASTER 2 SCIENCES DU MEDICAMENT

Présentation Générale

Annales du Contrôle National de Qualité des Analyses de Biologie Médicale

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)

Conférence technique internationale de la FAO

SEQUENÇAGE LI-COR DNA 4200

Concours «30 ans de l Espace des sciences»

Critères pour les méthodes de quantification des résidus potentiellement allergéniques de protéines de collage dans le vin (OIV-Oeno )

Hémochromatose génétique non liée à HFE-1 : quand et comment la rechercher? Cécilia Landman 11 décembre 2010

ÉTUDE DE L EFFICACITÉ DE GÉOGRILLES POUR PRÉVENIR L EFFONDREMENT LOCAL D UNE CHAUSSÉE

Aiguilleurs de courant intégrés monolithiquement sur silicium et leurs associations pour des applications de conversion d'énergie

SysFera. Benjamin Depardon

Depuis des milliers de générations, le ver à soie est l objet d une sélection

L axe 5 du Cancéropole Nord Ouest

Modélisation et simulation du trafic. Christine BUISSON (LICIT) Journée Simulation dynamique du trafic routier ENPC, 9 Mars 2005

Traitement numérique de l'image. Raphaël Isdant

Stages - le calendrier

LA MITOSE CUEEP - USTL DÉPARTEMENT SCIENCES BAHIJA DELATTRE

ANTICORPS POLYCLONAUX ANTI IMMUNOGLOBULINES

SESSION 2013 ÉPREUVE À OPTION. (durée : 4 heures coefficient : 6 note éliminatoire 4 sur 20) CHIMIE

Contrôle de l'expression génétique :

MS PROJECT Prise en main. Date: Mars Anère MSI. 12, rue Chabanais PARIS E mail : jcrussier@anere.com Site :

Innovations Majeures de la Version 4

ANNEXE J POTEAUX TESTÉS SELON UN CHARGEMENT STATIQUE ET TESTÉS SELON UN CHARGEMENT CYCLIQUE ET STATIQUE

DISQUE DUR. Figure 1 Disque dur ouvert

Identification de nouveaux membres dans des familles d'interleukines

5.5.5 Exemple d un essai immunologique

La surveillance biologique des salariés Surveiller pour prévenir

MASTER SIS PRO : logique et sécurité DÉTECTION D INTRUSIONS. Odile PAPINI, LSIS. Université de Toulon et du Var. papini@univ-tln.

UML Diagramme de communication (communication diagram) Emmanuel Pichon 2013

Fiche professeur. Rôle de la polarité du solvant : Dissolution de tâches sur un tissu

De la physico-chimie à la radiobiologie: nouveaux acquis (I)

Introduction au datamining

Transcription:

Master de génétique UE génomique fonctionnelle Université Denis Diderot Janvier 2009 Introduction à la génomique fonctionnelle Stéphane Le Crom (lecrom@biologie.ens.fr) Laboratoire de Génétique Moléculaire du Développement - INSERM U784 Plate-forme Transcriptome - IFR36 École normale supérieure

La génomique : la révolution en biologie? 1900 - La révolution industrielle 2000 - La révolution biologique

La complexité du vivant Dans chacune de nos 1014 cellules 35.000 gènes 450.000 transcrits 1 à 10.000.000 de protéines 100.000.000 de petites molécules Étude du fonctionnement cellulaire Collecte d informations sur les génomes, les gènes, les protéines, les interactions entre molécules, les processus cellulaires,... Établissement de liens entre les données de différentes natures. Inférence de nouvelles connaissances. Représentation dynamique des réseaux cellulaires http://www.sigmaaldrich.com/

Les méthodes «omes» Définition Le «XXXome» décrit l ensemble des XXX dans le génome : - Génome pour l ensemble des gènes ; - Transcriptome pour l ensemble des transcrits ; - Protéome pour l ensemble des protéines ; - Par extension on parle d interactome, de métabolome, de physiome, de lipidome, De même les discipline classique comme la génétique qui sont abordées maintenant à l échelle du génome entier sont qualifiées de génomiques (génomique structurale, génomique fonctionnelle, protéomique, ).

Les puces à ADN La génomique basée sur l hybridation

L hybridation des acides nucléiques A complémentaire de T G complémentaire de C Deux séquences complémentaires peuvent s apparier (hybrider). L hybridation est influencée par de nombreux paramètres : Spécificité (cross-hybridation) Sensibilité (Tm, structure secondaire, ) Séquences choisies (taille, composition) Certains paramètres peuvent être contrôlés par la stringence du milieu d hybridation (température, concentration saline et présence d agents déstabilisant les liaisons H comme la formamide).

Le «dogme central» de la biologie moléculaire Transcription Traduction ADN ARN Protéines Génome Transcriptome Protéome Les puces à ADN sont une des techniques de génomique fonctionnelle qui permet d analyser le génome et le transcriptome des cellules.

Le principe général des puces à ADN Échantillon (cible) = mélange complexe d acides nucléiques marqués par un ou plusieurs fluorochromes Scanner à fluorescence Support contenant plusieurs milliers de sondes nucléiques individualisées (sonde) Hybridation Quantification du signal d hybridation pour chaque sonde = Détermination qualitative et quantitative de la composition de l échantillon pour plusieurs milliers d acides nucléiques

Filtres haute densité (macroarrays) 10.000 clones par membrane marquage radioactif 1 condition à la fois 12 cm x 8 cm Lames de verre (microarrays) 40.000 clones par lame marquage fluorescent 2-3 conditions à la fois 5,4 cm x 0,9 cm Les principales solutions GeneChips (oligo-chips) 500.000 oligonucleotides par lame marquage fluorescent 1 condition à la fois 1,28 cm x 1,28 cm

Greffage Les différentes méthodes de fabrication Dépôt mécanique de produits de PCR ou d oligonucléotides Synthèse in situ Méthode Affymetrix (masques, photo -activation) Masques virtuels (miroirs, Nimblegen) Méthode d imprimante jet d encre (Agilent)

Système de dépôt sur lames de verre

Le principe des puces à ADN Affymetrix Population n 1 Synthèse d acides nucléiques biotinilés Streptavidine Phycoérythrine Hybridation

Les puces Affymetrix (GeneChip)

Comparaison des méthodes de dépôts Greffage 1. Synthèse des sondes 2. Fixation des sondes une par une Synthèse in situ 1. Les sondes sont directement synthétisées à la surface Avantages : Avantages : - pas de restriction de tailles - procédé flexible - haute densité - processus industriel existe Inconvénients : - densité «moyenne» - difficile de rendre le procédé industriel Inconvénients : - processus rigide - uniquement des oligonucléotides Coûts moyens Coûts élevés

Avantages et inconvénients des puces à ADN Avantages Inconvénients Étude simultanée des profils d expression de plusieurs millier de gènes La technique est assez lourde à mettre en place Les données sont cumulables L équipement de départ est d un coût relativement élevé Les groupes de gènes affichent des comportements identiques dans une situation biologique donnée Le grand nombre de résultats obtenu très rapidement nécessite un traitement informatique et statistique non négligeable

Que faire avec des puces à ADN? Utiliser les puces à ADN comme une version améliorée des méthodes qui sont déjà disponible à «petite» échelle avec un petit nombre de gènes choisis comme importants : => Permet de cribler rapidement un grand nombre de conditions sur des questions très précises parfois non couverte par les puces pan-génomiques (épissage alternatif, familles multi-géniques, ) Utiliser les puces à ADN sans a priori et sans sélection de gènes d intérêt : => Permet d obtenir une vision globale non biaisée de la réponse cellulaire

Les applications des puces à ADN

Génotypage : Exemples d applications des puces à ADN Recherche de polymorphismes (SNP) Recherche de mutations Profils d expression des gènes : Comparaison des niveaux d expression dans différentes conditions biologiques Dynamique de la transcription, de la réplication Étude de la stabilité des ARN et leur maturation Études des interactions acides nucléiques - protéines Aide au diagnostique (identification de souches pathogènes, ) CGH array Analyse du profil d expression du génome entier => «Empreinte» transcriptionnelle Des échantillons de tissus Des cellules

Quelques exemples concrets Etudier la réplication à l échelle du génome => Comprendre la dynamique précise de l ensemble des origines de réplication Recherche des séquences de régulation => Obtenir les gènes cibles des facteurs de transcription et découvrir les associations entre ces facteurs. Analyse des réseaux de gènes => Pouvoir comparer des sources de données hétérogènes entre elles pour comprendre les mécanismes mis en jeu et pouvoir les modéliser de façon dynamique. Expériences à haute résolution => Analyse de l ensemble des phénomènes de transcription.

Étude de la réplication à l échelle du génome Raghuraman et al. (2001) Science

Étude de la réplication à l échelle du génome Raghuraman et al. (2001) Science

Les leçons d une étude de la réplication Les temps de réplication des origines sont variés Les chromosomes ne sont pas égaux face à la réplication Pas de corrélation évidente entre %AT et Origine de réplication Raghuraman et al. (2001) Science

Les leçons d une étude de la réplication Les centromères se répliquent très tôt, les télomères très tard Il n y a pas de séquence consensus simple pour les origines de réplication Les temps de réplication des deux extrémités de deux chromosomes sont très corrélés Raghuraman et al. (2001) Science

Quelques exemples concrets Etudier la réplication à l échelle du génome => Comprendre la dynamique précise de l ensemble des origines de réplication Recherche des séquences de régulation => Obtenir les gènes cibles des facteurs de transcription et découvrir les associations entre ces facteurs. Analyse des réseaux de gènes => Pouvoir comparer des sources de données hétérogènes entre elles pour comprendre les mécanismes mis en jeu et pouvoir les modéliser de façon dynamique. Expériences à haute résolution => Analyse de l ensemble des phénomènes de transcription.

Recherche des cibles d un facteur de transcription Séquence consensus commune à toutes les cibles d un même facteur de transcription Comment trouver ces séquences à partir d une liste de gènes co-régulés?

Exemple d affichage d une région consensus Devaux et al. (2001) EMBO J

Combiner les analyses évolutives et d'expression Recherche des séquences conservées parmi 6 espèces de levure (empreinte phylogénétique). A/ Profils d'expression au cours du cycle cellulaire de tous les gènes de S. cerevisiae qui contiennent une boite MCB (motif qui contribue à la régulation de l'expression des gènes lors de la phase G1) dans leur promoteur. B/ Profils d'expression des gènes avec cette boite alignée dans les promoteurs des gènes orthologues au sens strict. Ces informations seules ne révèlent pas où et quand le régulateur transcriptionnel occupe effectivement le site de liaison. Cliften et al. (2003) Science

Mesurer de façon réelle les sites de fixation Analyse par immunoprécipitation de la chromatine sur puces à ADN des 141 facteurs de transcription de S. cerevisiae. Recherche de tous les sites de fixation potentiels et détermination des réseaux de régulations. Exemple : les régulateurs sont en bleu, les promoteurs en rouge. La liaison est représentée par une ligne pleine et les gènes encodant le régulateur par une ligne pointillée. Lee et al. (2002) Science

Combinaison de sources de données multiples Expériences ChIP-on-chips sur 203 régulateurs transcriptionnels dans des conditions de milieu riche et pour 84 de ces régulateurs dans de 1 à 12 conditions environnementales différentes. Cette analyse a identifiée 11 000 interactions. Les informations provenant du ChIP-on-chips on été combinées avec des informations phylogénétique de conservation de séquence et d'autres preuves expérimentales déjà connues. Harbison et al. (2004) Nature

Déterminer l'architecture des promoteurs La combinaison de recherche de motifs connus dans les promoteurs (haut) combinées à l'analyse de conservation dans plusieurs espèces (milieu) et aux résultats des expériences de ChIP-on-chips permet d'obtenir la carte précise des sites de liaison (bas). En recoupant tous les sites on peut découvrir différentes organisations des régions promotrices (droite) Harbison et al. (2004) Nature

et analyser leur dynamique Les régulateurs transcriptionnels sont représentés par des cercles et fixé au dessus de leur cibles (rectangles de couleur). Schéma représentant les différences d'occupation des sites de fixation par les régulateurs en fonction des conditions environnementales ce qui permet d'étudier la dynamique de la réponse. Harbison et al. (2004) Nature

Quelques exemples concrets Etudier la réplication à l échelle du génome => Comprendre la dynamique précise de l ensemble des origines de réplication Recherche des séquences de régulation => Obtenir les gènes cibles des facteurs de transcription et découvrir les associations entre ces facteurs. Analyse des réseaux de gènes => Pouvoir comparer des sources de données hétérogènes entre elles pour comprendre les mécanismes mis en jeu et pouvoir les modéliser de façon dynamique. Expériences à haute résolution => Analyse de l ensemble des phénomènes de transcription.

La dynamique des réseaux de régulation Les méthodes d études classiques Modélisations mathématiques. Expérimentations à différents points de la dynamique (cinétique). La combinaison de différentes sources de données Interactions protéine-protéine : - Criblage double hybride - Précipitation de complexes - MIPS complexes annotés Séries temporelles en puces à ADN sur le cycle cellulaire. De Lichtenberg et al. (2005) Science

Historique Sélection des données d expression Utilisation de différentes méthodes informatiques pour chercher les gènes exprimés de façon périodique au cours du cycle cellulaire, chaque méthode trouve entre 300 et 800 gènes mais peu de recoupement ce qui donne en tout 1800 gènes différents! => D après les données de puces à ADN description d un set de 600 gènes exprimés de façon périodique De Lichtenberg et al. (2005) Science

Sélection des données d interactions Le taux d erreur est important pour chacune des méthodes prises séparément => Ne conserver que les interactions dans lesquelles on a confiance (score en fonction des jeux de données, filtre sur les localisations subcellulaires)

Le réseau de régulation du cycle cellulaire Pour recréer le réseau on intègre Les 600 gènes exprimés de façon périodiques («dynamique») des expériences de puces à ADN sur le cycle cellulaire - Gènes exprimés de façon significative - Association de chaque gène à une étape du cycle Les gènes exprimés de façon constitutive («statique») dont les protéines interagissent préférentiellement avec les protéines «dynamique» - Jeu de données de confiance 300 protéines : 184 dynamiques 116 statiques Sur 600 dynamiques 412 protéines ne donnent pas d interactions De Lichtenberg et al. (2005) Science

Intérêt : la découverte de nouveaux partenaires Association de différents partenaires Les sous-unités statiques des complexes représentent 50% des partenaires d interactions directes. Une grande partie des protéines impliquées dans le cycle cellulaire ne peut pas être identifiée par l analyse d un seul type de données. De Lichtenberg et al. (2005) Science

Régulation dynamique des complexes protéiques Synchronisation de la régulation Exemple du complexe de pré -réplication. La régulation est effectuée par contrôle transcriptionnel sur une partie des éléments du complexe plutôt que sur sa totalité. Régulation de la spécificité de substrat Interaction de Cdc28p avec ces différents régulateurs au cours des phases du cycle. Détection de phénomènes transitoires : phosphorylation et ubiquitination. De Lichtenberg et al. (2005) Science

Quelques exemples concrets Etudier la réplication à l échelle du génome => Comprendre la dynamique précise de l ensemble des origines de réplication Recherche des séquences de régulation => Obtenir les gènes cibles des facteurs de transcription et découvrir les associations entre ces facteurs. Analyse des réseaux de gènes => Pouvoir comparer des sources de données hétérogènes entre elles pour comprendre les mécanismes mis en jeu et pouvoir les modéliser de façon dynamique. Expériences à haute résolution => Analyse de l ensemble des phénomènes de transcription.

Puces à ADN haute résolution Principe Comprendre les phénomènes de transcription sur l ensemble du génome à intervalles réguliers. L intensité des pics est directement proportionnelle aux phénomènes de transcription. Johnson et al. (2005) Trends Genet

Que peut-on découvrir? Puces à ADN haute résolution Confirmation des exons de gènes déjà caractérisés. Apparition de nouvelles régions transcrites. Confirmation des prédictions des exons et des gènes effectués par les programmes bioinformatiques. Apparition de nouveaux gènes sans EST ni prédictions bioinformatiques. Plus de 2000 transcrits codants et 10000 transcrits non-codants jamais décrits. Plus de 5000 transcrits antisens. Johnson et al. (2005) Trends Genet

Puces à ADN haute résolution Les problèmes de détection posés Une résolution élevée permet théoriquement la détection précise des sites d initiation et d arrêt de la transcription. Le bruit de fond intrinsèque de la technologie (cross-hybridation, sensibilité, spécificité, ) rend la détection réelle moins sensible. Huber et al. (2006) Bioinformatics

Les solutions développées Puces à ADN haute résolution Utilisation d une référence génomique pour éliminer les sondes «parasites». Application d une méthode basée sur les «fenêtres glissantes» pour lisser le résultat. Huber et al. (2006) Bioinformatics

La génomique fonctionnelle et la biologie intégrative

Calculer des enrichissements Calcul de la représentation des gènes de sa liste dans chaque catégorie par rapport à une référence (génome, collection). Mesure de l'enrichissement et obtention d une idée de sa significativité. http://genereg.ornl.gov/webgestalt/

Effectuer des recoupements dans la littérature Représentation du nombre de journaux, de résumés (Medline) et de résumé sur le cycle cellulaire et Cdc28 paru entre 1950 et 2005. Le nombre croissant de résumé sur des sujets précis rend maintenant impossible la lecture de tous les papiers publiés. Même si certaine protéines à la mode à un moment donné voit le nombre de résumé diminuer comme Cdc28. Jensen et al. (2006) Nature Rev. Genet.

Représenter les informations bibliographiques Les co-occurrences des gènes dans les résumés peuvent se représenter par un lien. On peut ensuite rajouter de très nombreuses informations complémentaires (site de fixation, données de puces à ADN, interaction protéine-protéine, ) Il est possible d'appliquer certaine propriété des graphes pour effectuer des tris et simplifier les représentations

Pouvoir découvrir de nouvelles relations Représentation d'un réseau de protéines de levure ou les approches d'extraction d'information des résumés de Medline a été appliqué en utilisant des méthodes de co -occurrences statistiques et également des méthodes basés sur le langage naturel (NLP). Les associations fonctionnelles dérivées des co-occurrences sont en gris. La méthode de NLP permet d'extraire des relations concernant des interactions physiques stables (vert), des régulations transcriptionnelles (rouge) et des phosphorylation (bleu). Les nœuds (protéines) sont elles aussi colorées en fonction de différentes propriétés (phosphatases, kinases, cyclines, ). Cette approche permet de découvrir des associations non publiées (b et c). Jensen et al. (2006) Nature Rev. Genet.

Perspectives Le séquençage de masse et la génomique personnelle

Obtention de séquences courtes en très grand nombre Quasiment toutes les applications de l hybridation peuvent être développées avec ces méthodes La quantité de données générées est considérable et rend indispensable l utilisation de la programmation Le séquençage à haut débit Mardis (2008) Trends Genet.

Les applications sont nombreuses Wold et al. (2008) Nat. Methods

Le séquençage des génomes individuels Le premier génome diploïde individuel Séquençage par la méthode de shotgun sur le génome entier de 32 millions de fragments. Couverture de 7,5X. Analyse du génome de J. Craig Venter, fondateur de Celera Genomics, participant au premier séquençage du génome humain. But : Recherche des variants individuels. Levy et al. (2007) PLOS Biol.

Le séquençage des génomes individuels Plus de 4 millions de variants découverts La comparaison avec le génome de référence humain (composite) révèle que la majorité des altérations sont des SNP. Sur les plus de 4 millions de variants découverts plus de 30% étaient inconnus. Passage de la génomique centrée sur les gènes à une analyse centrée sur les individus. Levy et al. (2007) PLOS Biol.

Les projets génomes personnels (PGP) But Publier les génomes complets et les données médicales de plusieurs volontaires afin de permettre la recherche en médecine personnelle. Le projet publiera le génotype des volontaires ainsi que des informations exhaustives sur leur phénotype : fichiers médicaux, analyses diverses, IRM, images, Les données seront librement accessible sur Internet pour que les chercheurs puissent tester des hypothèses sur les relations entre génotype et phénotype. Le projet a été initié par George Church (Harvard) en janvier 2006 a commencé avec 10 volontaires et est maintenant monté à 1000 pour représenter toutes les ethnies. http://www.1000genomes.org/

Quelques références Ressources en ligne Glossaire de génomique de Science : http://www.sciencemag.org/cgi/content/full /291/5507/1197 Livres et revues Quelques livres généraux pour démarrer : Le recueil de liens et d outils utilisable à l Institut Pasteur : http://bioweb.pasteur.fr/ Les bases de données et les outils en ligne de l EBI : http://www.ebi.ac.uk/services/ Les cours en ligne du Weizmann Institute of Science : http://bip.weizmann.ac.il /education/courses.html Les numéros spéciaux de la revue NAR ainsi que la revue Bioinformatics et BMC Bioinformatics :