De la biologie molécualire à la génomique



Documents pareils
CHAPITRE 3 LA SYNTHESE DES PROTEINES

VI- Expression du génome

Séquence 2. L expression du patrimoine génétique. Sommaire

Contrôle de l'expression génétique : Les régulations post-transcriptionnelles

Dr E. CHEVRET UE Aperçu général sur l architecture et les fonctions cellulaires

Université d Evry-Val d Essonne Ecole Doctorale des Génomes Aux Organismes. Thèse

Les OGM. 5 décembre Nicole Mounier

ULBI 101 Biologie Cellulaire L1. Le Système Membranaire Interne

Module 5 La maturation de l ARN et le contrôle post-transcriptionnel chez les eucaryotes

Biomarqueurs en Cancérologie

Introduction aux bases de données: application en biologie

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST.

Formavie Différentes versions du format PDB Les champs dans les fichiers PDB Le champ «ATOM» Limites du format PDB...

Contrôle de l'expression génétique :

Chapitre 7 : Structure de la cellule Le noyau cellulaire

Univers Vivant Révision. Notions STE

TD de Biochimie 4 : Coloration.

Cellules procaryotes Service histologie Pr.k.mebarek

Travaux dirigés de Microbiologie Master I Sciences des Génomes et des Organismes Janvier 2015

MABioVis. Bio-informatique et la

Module Analyse de Génomes Master 2 module FMBS 326 Immunoinformatique

CATALOGUE DES PRESTATIONS DE LA

IMMUNOLOGIE. La spécificité des immunoglobulines et des récepteurs T. Informations scientifiques

Structure quantique cohérente et incohérente de l eau liquide

GénoToul 2010, Hôtel de Région Midi Pyrénées, Toulouse, 10 décembre 2010

MYRIAD. l ADN isolé n est à présent plus brevetable!

Bases moléculaires des mutations Marc Jeanpierre

Université de Montréal. Développement d outils pour l analyse de données de ChIP-seq et l identification des facteurs de transcription

Hépatite chronique B Moyens thérapeutiques

Les débuts de la génétique

Détection des duplications en tandem au niveau nucléique à l'aide de la théorie des flots

IlliS. Le ribosome bactérien : structure et fonctions SYNTHÈSE

1 les caractères des êtres humains.

Génétique et génomique Pierre Martin

Pour un principe matérialiste fort. Jean-Paul Baquiast

Big data et sciences du Vivant L'exemple du séquençage haut débit

Perl Orienté Objet BioPerl There is more than one way to do it

Séquence 1. Reproduction conforme de la cellule et réplication de l ADN Variabilité génétique et mutation de l ADN

Vue d ensemble de la vie microbienne

POURQUOI L HYGIENE HYGIENE = PROPRETE HYGIENE = PREVENTION DES INFECTIONS COMMUNAUTAIRES ET DES INFECTIONS ASSOCIEES AUX SOINS

LA MITOSE CUEEP - USTL DÉPARTEMENT SCIENCES BAHIJA DELATTRE

LES BIOTECHNOLOGIES DANS LE DIAGNOSTIC DES MALADIES INFECTIEUSES ET LE DÉVELOPPEMENT DES VACCINS

Tableau 1. Liste (non exhaustive) des protéines se localisant dans les P-Bodies

De la physico-chimie à la radiobiologie: nouveaux acquis (I)

Projet Matlab : un logiciel de cryptage

Base de données bibliographiques Pubmed-Medline

GMIN206 Info. Biologique et Outils bioinformatiques. Elodie Cassan

Annales de Biologie Cellulaire QCM (niveau SVT 1 er année)

Les outils de génétique moléculaire Les techniques liées aux acides nucléiques

COUSIN Fabien KERGOURLAY Gilles. 19 octobre de l hôte par les. Master 2 MFA Responsable : UE Incidence des paramètres environnementaux

Génomique Comparative et intégrative

Les tests génétiques à des fins médicales

Conférence technique internationale de la FAO

L universalité et la variabilité de l ADN

Introduction à la Génomique Fonctionnelle

Spectrophotomètre double faisceau modèle 6800

Rapport Scientifique Seine-Aval 3

Le don de moelle osseuse :

COURS COLLÉGIAUX PRÉALABLES À L ADMISSION

Mise en place d une solution automatique de stockage et de visualisation de données de capture des interactions chromatiniennes à l échelle génomique

Hépatite C une maladie silencieuse..

EXERCICES : MECANISMES DE L IMMUNITE : pages

Extraction d information des bases de séquences biologiques avec R

Séquence 4. La nature du vivant. Sommaire. 1. L unité structurale et chimique du vivant. 2. L ADN, support de l information génétique

Chapitre III Le phénotype immunitaire au cours de la vie

Mise en place de serveurs Galaxy dans le cadre du réseau CATI BBRIC

MASTER (LMD) PARCOURS MICROORGANISMES, HÔTES, ENVIRONNEMENTS (MHE)

Introduction à l algorithmique et à la programmation (Info 2)

Hémochromatose génétique non liée à HFE-1 : quand et comment la rechercher? Cécilia Landman 11 décembre 2010

présentée DEVANT L UNIVERSITÉ DE RENNES 1 pour obtenir le grade de : DOCTEUR DE L UNIVERSITÉ DE RENNES 1 PAR Emilie GUÉRIN TITRE DE LA THÈSE :

Séquence 6. Mais ces espèces pour autant ne sont pas identiques et parfois d ailleurs ne se ressemblent pas vraiment.

TEST GENOTYPIQUE DE RESISTANCE AUX INHIBITEURS DE L INTEGRASE

Chapitre 2 - Complexité des relations entre génotype et phénotype

4 : MÉTHODES D ANALYSE UTILISÉES EN ÉCOLOGIE MICROBIENNE

Charte de la Banque ADN et de Cellules de Généthon

MAB Solut. vos projets. MABLife Génopole Campus 1 5 rue Henri Desbruères Evry Cedex. intervient à chaque étape de

La Greffe de Cellules Souches Hématopoïétiques

CHAPITRE 3 LES TASQ COMME PLATEFORME POUR LA CATALYSE PSEUDO-ENZYMATIQUE

Partie Observer : Ondes et matière CHAP 04-ACT/DOC Analyse spectrale : Spectroscopies IR et RMN

3: Clonage d un gène dans un plasmide

Vaccins du futur Atelier «Croisière dans l archipel des nouveaux vaccins»

Analyse des données de séquençage massif par des méthodes phylogénétiques

STOP à la Transmission des microorganismes!

Cahier des Charges AMOA - Cartographie des solutions SI Sophie de Visme

DÉFIS DU SÉQUENÇAGE NOUVELLE GÉNÉRATION

Bibliographie Introduction à la bioinformatique

APPORT DU DIAGNOSTIC MOLECULAIRE EN PATHOLOGIE INFECTIEUSE. Service de Microbiologie Hôpital Robert-Debré

IBCP- Service Culture Cell- Règlement Intérieur des laboratoires de culture cellulaire

Le Livre des Infections Sexuellement Transmissibles

Création et développement d une base de données sur le VIH

La PCR en temps réel: principes et applications

Interactions des rayonnements avec la matière

Service d ambulance. Normes. de soins aux patients. et de transport

CHAPITRE 2 : Structure électronique des molécules

Transfusions sanguines, greffes et transplantations

AMAMI Anaïs 3 C LORDEL Maryne. Les dons de cellules & de tissus.

Les coûts en ligne de compte

Transcription:

De la biologie molécualire à la génomique Pierre Neuvial École Nationale de la Statistique et de l Administration Économique Méthodes statistiques pour la biologie

Plan du cours 1 Introduction à la biologie moléculaire Les acides nucléiques : ADN et ARN De l ADN à l ADN : la réplication De l ADN à l ARN : la transcription De l ARN à la protéine : la traduction 2 Quelques mots sur le séquençage Les génomes : quelques repères La séquence, point de départ de la génomique

Dogme central de la biologie moléculaire Mécanismes de stockage, de réplication, et d expression de l information biologique Les protéines, unités fonctionnelles essentielles de la cellule assurent les principales fonctions cellulaires produites par les gènes Dans le noyau ADN ADN réplication ADN ARN transcription Hors du noyau ARN protéine traduction

Les acides nucléiques : ADN et ARN Composants de base : les nucléotides Les nucléotides groupement phosphate sucre base azotée Acide Désoxyribo-Nucléique sucre : le désoxyribose bases azotées : A, T, G, C Acide Ribo-Nucléique sucre : le ribose bases azotées : A, U, G, C

Les acides nucléiques : ADN et ARN Structure bidimensionnelle Complémentarité Appariement entre bases azotées : stable : liaisons hydrogène spécifique : A=T (A=U) et G C Antiparallélisme Brins complémentaires antiparallèles : Polarité (5 3 ) inversée Sens de lecture opposé

Les acides nucléiques : ADN et ARN ADN : structure tridimensionnelle Double hélice formée de brins anti-parallèles Propriétés de la double-hélice structure physiquement et chimiquement stable capable d auto-reproduction et d auto-réparation Caractéristiques physiques tourne à droite (en général) pas de 3.4nm (10.5 bp)

Les acides nucléiques : ADN et ARN ADN : les chromosomes Compaction de l information 2m d ADN dans chaque cellule (de diamètre 10 à 20µm) structure de stockage : le chromosome Différents degrés de compaction nucléosomes : enroulement de 100 bp autour de protéines, les histones hélice de nucléosomes (δ = 30nm) boucles ancrées sur un échafaudage protéique bras de chromosome : super-hélice

De l ADN à l ADN : la réplication Principe de la réplication Réplication semi-conservative Chacune des molécules filles hérite d un brin de l ADN parental Fourche de réplication brin primaire ( leading strand ) synthétisé en continu brin secondaire ( lagging strand ) synthétisé en discontinu

De l ADN à l ADN : la réplication Yeux de réplication Origines de réplication nombreux points de démarrage de la réplication bien que l ADN soit une molécule longue, sa réplication est relativement rapide (de qq minutes à qq heures) Yeux de réplication séparation des deux brins mise en place des premières amorces démarrage des fourches de réplication dans les deux sens

De l ADN à l ARN : la transcription Mécanismes généraux Initiation fixation de l ARN polymérase au niveau du promoteur séparation des deux brins d ADN Élongation lecture du brin matrice ajout de nucléotides en 3 Terminaison atteinte d un site de terminaison libération du brin transcrit

De l ADN à l ARN : la transcription Épissage des ARNm chez les eucaryotes Exemple de modifications post-transcriptionnelles Épissage (splicing) excision des introns réunion des exons Épissage alternatif un même gène peut donner naissance à différentes protéines selon la cellule phénomène d économie pour la cellule (chez les eucaryotes pluricellulaires)

De l ARN à la protéine : la traduction Existence d un code génétique Codons et acides aminés il existe 20 acides aminés différents l alphabet des nucléotides comporte 4 lettres besoin de 3 nucléotides pour coder tous les acides aminés Propriétés du code génétique universel : commun à (presque) tous les êtres vivants non ambigu : un unique acide aminé par codon dégénéré : plusieurs codons par acide aminé

De l ARN à la protéine : la traduction Les ARN, acteurs essentiels de la traduction Trois principaux types d ARN ARNr (80%) ARN ribosomal : s associe à des protéines pour former les ribosomes, siège de la traduction ARTt (15%) ARN de transfert : lien entre le codon et l acide aminé ARNm (3%) ARN messager : porteur du message génétique via l enchaînement des codons Tous ces ARN jouent un rôle fondamental dans la traduction ARNm et ARNt ont un rôle directement fonctionnel Seuls les ARN messagers sont traduits en protéine

De l ARN à la protéine : la traduction Mécanismes généraux Initiation Les deux sous-unités du ribosome s associent avec la méthionine (AUG) en site 1 Élongation recrutement de l ARNt complémentaire au codon du site 2 formation d une liaison peptidique avec la chaîne d acides aminés existante translocation de l ARNt du site 2 au site 1 Terminaison Arrêt de la synthèse au premier codon stop

Définition de la génomique Génomes et génomique génome : ensemble du matériel génétique d un individu ou d une espèce génomique : étude exhaustive des génomes, en particulier de la structure et la fonction de leurs gènes Étapes vers la compréhension d un langage inconnu isoler le texte : séquençage identifier les instructions : annotation structurale comprendre le sens : annotation fonctionnelle Le séquençage est une étape préliminaire indispensable à l annotation des génomes

Quelques mots sur le séquençage Séquençage : principe général Méthode de Sanger réaliser des copies incomplètes de la molécule d ADN didésoxyribonucléotides identifier pour chaque fragment le nucléotide où la copie s est arrêtée électrophorèse Limites de la méthode et stratégie de séquençage Taille des fragments limitée à 500-1000 nucléotides fragmentation aléatoire (enzymatique ou mécanique) lecture des fragments : méthode de Sanger assemblage de la séquence complète

Quelques mots sur le séquençage Stratégies de séquençage à grande échelle Limites de la fragmentation aléatoire taux de couverture : τ = nombre de nucleotides sequences longueur de la sequence nombreux fragments non couverts, même avec τ élevé (proba de non couverture d un nucléotide en e τ ) assemblage après fragmentation en k séquences : O(k 2 ) : pas envisageable pour les grands génomes (k 10 7 ) Approche en deux temps : séquençage après cartographie construction d une banque (ordonnée) de grands fragments séquençage de chacun des fragments par la méthode précédente

Les génomes : quelques repères Taille des génomes Quelques ordres de grandeur Organisme Taille Description Human immunodeficiency virus 1 10 kb HIV Hepatitis B virus 30 kb virus de l hépatite B Mycoplasma genitalium 0.6 Mb parasite des voies génitales Haemophilius influenzae 1.8Mb bacille infectieux Escherichia coli 4.6 Mb bacille modèle Homo sapiens 3.2 Gb homme Bases de données de séquences nombreuses : GenBank, Embl, SwissProt, Ensembl... volumes en croissance exponentielle

Les génomes : quelques repères Le génome humain Le projet public de séquençage du génome humain 1990-1998 : cartographie 1998-2000 : première ébauche de la séquence (τ = 5) 2000-2003 : séquence complète (τ = 10) Ordres de grandeur dans le génome humain 3.2 10 9 nucléotides, 97% de non codant 25000 gènes longueur des gènes : de 1000 à 3000 bases (chacun réparti sur 30 à 40000 bases avec les introns) 1 de différence entre les génomes de deux individus

La séquence, point de départ de la génomique Une révolution en biologie moléculaire Après le séquençage Objectif fondamental : comprendre la fonction des gènes Moyens : développement d outils de production massive de données biologiques Changement d échelle gène par gène mesure de l activité d un génome entier en une seule expérience Changement de paradigme Approche réductionniste : on émet une hypothèse, et on réalise une expérience permettant de la tester Approche globale : exploratoire et génératrice d hypothèses

La séquence, point de départ de la génomique Enjeux de l annotation des génomes Le rôle de la statistique Analyse de séquences détection de gènes inférence de signaux biologiques phylogénie étude des polymorphismes Génomique fonctionnelle (post-génomique) mesure à grande échelle des altérations génétiques, de l expression des gènes, de l activité des protéines étude de la régulation des gènes étude des interactions des gènes