GENETIQUE MEDICALE - Principe des études moléculaires en Génétique Médicale, Méthodes d analyse des microlésions du Génome



Documents pareils
Biomarqueurs en Cancérologie

CHAPITRE 3 LA SYNTHESE DES PROTEINES

Dr E. CHEVRET UE Aperçu général sur l architecture et les fonctions cellulaires

CATALOGUE DES PRESTATIONS DE LA

TD de Biochimie 4 : Coloration.

Les outils de génétique moléculaire Les techniques liées aux acides nucléiques

Plateforme. DArT (Diversity Array Technology) Pierre Mournet

Gènes Diffusion - EPIC 2010

Big data et sciences du Vivant L'exemple du séquençage haut débit

SERVICES DE SEQUENÇAGE

Hépatite chronique B Moyens thérapeutiques

La reconnaissance moléculaire: la base du design rationnel Modélisation moléculaire: Introduction Hiver 2006

Big Data: développement, rôle des ARS?? Laurent Tréluyer, ARS Ile de France Alain Livartowski Institut Curie Paris 01/12/2014

Introduction. I Étude rapide du réseau - Apprentissage. II Application à la reconnaissance des notes.

Chapitre 1 : Introduction aux bases de données

Large succès de l introduction en bourse de Genomic Vision sur Euronext à Paris qui lève 23,0 M

BASE. Vous avez alors accès à un ensemble de fonctionnalités explicitées ci-dessous :

MYRIAD. l ADN isolé n est à présent plus brevetable!

UE : GENE Responsable : Enseignant : ECUE 1. Enseignant : ECUE 2. Dr COULIBALY Foungotin Hamidou

Plateforme Transgenèse/Zootechnie/Exploration Fonctionnelle IBiSA. «Anexplo» Service Transgenèse. Catalogue des prestations

Montréal, 24 mars David Levine Président et chef de la direction DL Strategic Consulting. DL Consulting Strategies in Healthcare

LA MITOSE CUEEP - USTL DÉPARTEMENT SCIENCES BAHIJA DELATTRE

Contrôle de l'expression génétique :

Les renseignements suivants sont destinés uniquement aux personnes qui ont reçu un diagnostic de cancer

Mise en place d une solution automatique de stockage et de visualisation de données de capture des interactions chromatiniennes à l échelle génomique

Critères pour les méthodes de quantification des résidus potentiellement allergéniques de protéines de collage dans le vin (OIV-Oeno )

Bases moléculaires des mutations Marc Jeanpierre

Génétique et génomique Pierre Martin

Introduction à la Génomique Fonctionnelle

4 : MÉTHODES D ANALYSE UTILISÉES EN ÉCOLOGIE MICROBIENNE

a) La technique de l analyse discriminante linéaire : une brève présentation. 3 étapes de la méthode doivent être distinguées :

Master de Bioinformatique et Biologie des Systèmes Toulouse Responsable : Pr. Gwennaele Fichant

Utilisation des médicaments au niveau des soins primaires dans les pays en développement et en transition

Les plateformes de génétique

Gestion éthique des banques de recherche

Contrôle de l'expression génétique : Les régulations post-transcriptionnelles

Les tests de génétique moléculaire pour l accès aux thérapies ciblées en France en 2011

Bases de données des mutations

Traitement numérique de l'image. Raphaël Isdant

3: Clonage d un gène dans un plasmide

Travaux dirigés de Microbiologie Master I Sciences des Génomes et des Organismes Janvier 2015

Détection et prise en charge de la résistance aux antirétroviraux

Conférence technique internationale de la FAO

GénoToul 2010, Hôtel de Région Midi Pyrénées, Toulouse, 10 décembre 2010

Rôle des acides biliaires dans la régulation de l homéostasie du glucose : implication de FXR dans la cellule bêta-pancréatique

Chapitre 2 - Complexité des relations entre génotype et phénotype

EXERCICES : MECANISMES DE L IMMUNITE : pages

3 Les premiers résultats des plans d'actions

Big Data et la santé

Les tests génétiques à des fins médicales

1 Culture Cellulaire Microplaques 2 HTS- 3 Immunologie/ HLA 4 Microbiologie/ Bactériologie Containers 5 Tubes/ 6 Pipetage

Introduction, présentation de la plateforme South Green. h"p://southgreen.cirad.fr/

Diagnostic des Hépatites virales B et C. P. Trimoulet Laboratoire de Virologie, CHU de Bordeaux

POLITIQUE DE BIOSÉCURITÉ

DÉFIS DU SÉQUENÇAGE NOUVELLE GÉNÉRATION

DOCUMENT DE TRAVAIL DES SERVICES DE LA COMMISSION RÉSUMÉ DE L ANALYSE D IMPACT. accompagnant la

SEQUENÇAGE LI-COR DNA 4200

RÉSOLUTION DE SYSTÈMES À DEUX INCONNUES

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1

First Line and Maintenance in Nonsquamous NSCLC: What Do the Data Tell Us?

Projet de traitement d'image - SI 381 reconstitution 3D d'intérieur à partir de photographies

AMAMI Anaïs 3 C LORDEL Maryne. Les dons de cellules & de tissus.

Intérêt diagnostic du dosage de la CRP et de la leucocyte-estérase dans le liquide articulaire d une prothèse de genou infectée

Leica DM4000 B LED. Une imagerie facilitée par un éclairage brillant!

MS PROJECT Prise en main. Date: Mars Anère MSI. 12, rue Chabanais PARIS E mail : jcrussier@anere.com Site :

«Credit scoring» : une approche objective dans l'octroi de crédit?

METHODOLOGIE GENERALE DE LA RECHERCHE EPIDEMIOLOGIQUE : LES ENQUETES EPIDEMIOLOGIQUES

ROTARY INTERNATIONAL District 1780 Rhône-Alpes Mont-Blanc Don volontaire de cellules souches

PC Check & Tuning 2010 Optimisez et accélérez rapidement et simplement les performances de votre PC!

Biologie Appliquée. Dosages Immunologiques TD9 Mai Stéphanie Sigaut INSERM U1141

des banques pour la recherche

APPLICATION DU SCN A L'EVALUATION DES REVENUS NON DECLARES DES MENAGES

Rapport Scientifique Seine-Aval 3

Annales du Contrôle National de Qualité des Analyses de Biologie Médicale

La PCR quantitative (qpcr) et le guide de bonnes pratiques MIQE : adaptation et pertinence dans le contexte de la biologie clinique

COMMENT MAITRISER LA GESTION DES APPROVISIONNEMENTS ET DES STOCKS DE MEDICAMENTS

VIRUS DE L'IMMUNODEFICIENCE HUMAINE (HIV)

Les OGM. 5 décembre Nicole Mounier

1 les caractères des êtres humains.

La Greffe de Cellules Souches Hématopoïétiques

Une protection antivirus pour des applications destinées aux dispositifs médicaux

LES BIOTECHNOLOGIES DANS LE DIAGNOSTIC DES MALADIES INFECTIEUSES ET LE DÉVELOPPEMENT DES VACCINS

Production d une protéine recombinante

LE PLAN D'AMÉLIORATION DE LA FONCTION MARKETING

DON DE SANG. Label Don de Soi

Procédure d utilisation du Beckman CEQ 2000 XL pour la réalisation de programmes de séquençage ou de génotypage.

OBJET : Utilisation des données contenues dans les annuaires téléphoniques.

INFORMATION GÉNÉTIQUE et REPRODUCTION SEXUÉE

MAB Solut. vos projets. MABLife Génopole Campus 1 5 rue Henri Desbruères Evry Cedex. intervient à chaque étape de

Exercices de génétique classique partie II

MABioVis. Bio-informatique et la

PRINCIPE MICROSCOPIE CONFOCALE

A. Protocole de recherche (ainsi que l abrégé en langue française)

AGRÉGATION DE SCIENCES DE LA VIE - SCIENCES DE LA TERRE ET DE L UNIVERS

La maladie de Huntington, une maladie du cerveau

altona altona RealStar CMV PCR Kit 1.0 always a drop ahead. 04/2015 altona Diagnostics GmbH Mörkenstr Hamburg Germany

Analyse tarifaire en ligne (TAO) de l'omc

Université d Evry-Val d Essonne Ecole Doctorale des Génomes Aux Organismes. Thèse

Notice d utilisation M Epigenomics AG, Berlin, Allemangne

Transcription:

29/10/2014 Crévits Léna L2 Génétique médicale Dr Martin Krahn 14 pages Principe des études moléculaires en Génétique Médicale - Méthodes d analyse des microlésions du Génome Plan A. Rappels et généralités B. Techniques courantes d analyse de microlésions du génome I. Notion de diagnostic direct et indirect II. PCR III. Séquençage direct IV. Microarrays V. Techniques d'étude de l'expression des gènes C. La nouvelle ère de la génétique moléculaire I. Principe et enjeux du Séquençage à Haut Débit A. Rappels et généralités Introduction L intérêt médical des études moléculaires en génétique médicale est la mise en évidence d'anomalies génétiques causales, à l'origine de maladies génétiques monofactorielles, et à effet modificateur (qui correspondent à des «prédispositions génétiques»), à l'origine de maladies diverses: cancer, maladies cardio-vasculaires, maladies métaboliques... L'analyse simultanée de tous les gènes d'un individu est impossible en routine à ce jour: il faut donc choisir les techniques à utiliser en fonction de l'anomalie génétique recherchée. Toutefois l'apparition de nouvelles technologies tend à rendre cela possible. Démarche diagnostique dans les maladies génétiques La consultation diagnostique se compose d'un interrogatoire et d'un examen clinique durant lesquels doivent être déterminés l'histoire de la maladie ainsi que l'arbre généalogique et le mode de transmission de cette maladie. Un examen clinique ciblé ainsi qu'un examen clinique général doivent également être réalisés. Des examens complémentaires peuvent également être menés: analyses biologiques selon le contexte, imagerie, examens ciblés selon orientation... Le but étant d'arriver à un diagnostic clinique. Des analyses génétiques ( en cytogénétique et génétique moléculaire ) permettront d'arriver à un diagnostic génétique. 1/14

Matériel d'étude : types d'échantillons GENETIQUE MEDICALE - Principe des études moléculaires cdna: séquence d'adn complémentaire à un ARN messager, obtenue par transcription inverse (technique de RT-PCR) à l'aide d'une enzyme, la «reverse transcriptase» ou «transcriptase inverse». Le génome est en principe identique pour toutes les cellules d'un individu. Le transcriptome et le protéome sont ubiquitaires ou spécifiques d'un tissus, d'un type cellulaire, d'un état... En ce qui concerne le génome et le transcriptome, le prélèvement de «base» en génétique est le prélèvement sanguin périphérique. Celui-ci doit toujours être fait avec le consentement de l'individu. D'autres prélèvements peuvent également être réalisés: prélèvement de tissus embryonnaires/foetaux pour un diagnostic prénatal, prélèvement d'autres tissus pour des analyses complémentaires dans certaines pathologies. Grâce au prélèvement sanguin périphérique: obtention de chromosomes, ADN, ARNmessager, cdna. B. Techniques courantes d'analyse de microlésions du génome I.Notion de diagnostic direct et indirect Diagnostic moléculaire des maladies génétiques L'objectif est d'établir un diagnostic précis par l'identification de l'anomalie génétique. L'intérêt est d'obtenir un diagnostic certain, de pouvoir fournir une prise en charge adaptée ainsi que des conseils génétiques. Pour un patient atteint, les analyses en génétique moléculaire par un diagnostic direct permet l'identification de mutations dans le gène impliqué. Pour un patient atteint, les analyses en génétique moléculaire par un diagnostic indirect permet d'établir la congrégation familiale phénotype/ marqueur. Le diagnostic direct consiste en la recherche de l'anomalie génétique primaire. Celui-ci permet l'identification de mutations constitutionnelles délétères. Cette approche est 2/14

utilisée de préférence et permet un diagnostic de certitude mais pose certains problèmes dont les principaux sont que celle-ci est parfois lourde sur le plan technique (difficulté à étudier les gènes de grande taille), parfois non concluante, et il faut également savoir différencier les polymorphismes des mutations constitutionnelles délétères. De plus, dans le cas du diagnostic prénatal, la contrainte de temps ajoute une difficulté supplémentaire. Génétique moléculaire L'objectif en génétique moléculaire est l'identification d'anomalies à l'échelle du gène. Les mutations à l échelle du gène peuvent être: la substitution d' un nucléotide (principalement), l'insertion ou délétion de un à quelques nucléotides, l'insertion ou délétion de quelques dizaines ou centaines de nucléotides. Rappel: L'information génétique est contenue dans les exons qui sont les «séquences codantes» Comme la majorité des mutations pathogènes est localisée en séquence codante, l'analyse se porte préférentiellement sur les exons (un exon comporte environ 150 pb ( 100 à 200 pb) et les séquences codantes représentent 2 à 3 % de l'adn). Toutefois, le fait de se focaliser sur les exons induit le risque de ne pas détecter une mutation qui se trouverai sur un intron (la taille des introns est variable, cela va jusqu'à des milliers de pb). En outre, il est difficile de savoir si une mutation est délétère ou non en région non codante avec les techniques actuelles. Quelques introns sont tout de même étudiés en raison du phénomène d'épissage. II.PCR Lorsqu'on cherche à identifier une anomalie génétique, les études aux niveaux moléculaires posent un problème: les faibles quantités de matériel. Les solutions à ce problème peuvent être soit de travailler sur de plus grandes quantités de prélèvement, soit l'amplification de la région d'intérêt. La PCR ou polymerase chain reaction est une technique permettant d'amplifier en grande quantité une région d'intérêt. Celle-ci est basée sur l'utilisation de courts fragments d'adn synthétiques (les amorces) complémentaires à la séquence d'intérêt (appariement) et d'une enzyme ADN polymerase (Taq) qui permet d'amplifier/copier de manière fidèle un ADN cible à partir de régions doubles brins (zones d'appariements ADN cible-amorces). Ces amorces ou «primers» sont composées d'une vingtaine de nucléotides seulement pour garantir leur fixation sur la région voulue. La précisons de l'endroit amplifié est donc déterminée par les amorces. Cette technique développée depuis les années 70 est à la base de l'analyse, de la détection de pathogènes. Des PCR spécifiques sont utilisées en microbiologie pour étudier certains virus ou bactéries. La technique étant très sensible, il est important d'éviter les contaminations. 3/14

A) L'étape de dénaturation (séparation des deux brins d'adn) s'effectue à température élevée. B) Pour permettre l'hybridation des amorces, la température est diminuée. C) L'élongation par la Taq polymérase s'effectue à température un peu plus haute, idéale pour cette enzyme. Taq polymérase est donc thermosensible. Les thermocycleurs permettent ces grandes variations de température. Cette technique se compose d'une répétition d'environ 30 cycles: il y a donc une amplification exponentielle de la région d'intérêt. La séquence étant doublée à chaque cycle, si l'on effectue a cycles on obtient 2ª copies. L'analyse de la région d'intérêt amplifiée comprend l'analyse de la séquence principalement (recherche de mutations dans la région d'intérêt ) et l'analyse de la taille qui a des applications diverses (analyse de microsatellites...). L'analyse de la taille sera vue en ED. 4/14

III. Séquençage direct GENETIQUE MEDICALE - Principe des études moléculaires Le séquençage direct est basé sur la méthode de Sanger qui utilise des ddntp, analogues structuraux des dntp mais incapables de réaliser une liaison phosphodiester. Cette méthode consiste en l'incorporation au hasard de ddntp marqués (au fluorochrome rouge, bleu, vert ou jaune) qui stoppent à chaque fois l'élongation. Cette méthode est similaire à la PCR car elle utilise les mêmes constituants lors de la réaction (matrice, amorce, ADN polymérase, dntp...). (La matrice est la région que l'on veut amplifier). Etapes du séquençage direct: Il y a tout d'abord une réaction d'élongation avec incorporation de ddntp fixés à des fluorochromes qui entraînent l'arrêt de celle-ci. Il y a donc production de fragments amplifiés de toutes les tailles, se terminant tous par un ddntp. Ces fragments sont ensuite séparés par électrophorèse capillaire (dans le capillaire les fragments migrent plus ou moins rapidement en fonction de leur taille, les petits migrant plus rapidement), et la lecture de ceux-ci par un système laser permet l'obtention de pics de fluorescence (établissement d'une information couleur qui correspond à la séquence). Enfin le traitement informatique de ces résultats permet la reconstitution de la séquence. 5/14

Exemple: recherche d'une mutation dans un gène chez un patient par la technique du séquençage direct. Après extraction de l'adn et amplification, on compare la séquence obtenue à la séquence de référence afin d'identifier d'éventuelles mutations. Exemple pour les autosomes: Pour les autosomes, il existe deux copies de chaque gène: une copie issue du père et une de la mère. On recherche donc d'éventuelles mutations sur chacune des deux copies: Après l'amplification, l'information génétique maternelle et paternelle est mélangée. Lors de la lecture de la séquence, si l'information génétique issue des deux copies est identique (aucune mutation sur les deux copies du gène, ou bien une même mutation se situant au même endroit sur chacune d'entre elles) alors il y aura une superposition parfaite des signaux. Une éventuelle mutation identique sur les deux copies sera donc détectée lors de la comparaison avec la séquence de référence. Si la mutation se trouve sur une seule des copies, on parle alors de mutation hétérozygote et on obtient donc un «double pic» sur la séquence. 6/14

La méthode de Sanger est une méthode lourde et coûteuse (l'utilisation du fluorochrome est particulièrement coûteuse). En effet, avec le séquençage complet, lors de l'analyse d'un gène, tous les exons sont étudiés : c'est la méthode la plus complète mais plus le gène est grand, plus cela devient fastidieux. L'alternative proposée pour réduire les coûts et le temps d'analyse est le pré criblage suivit du séquençage ciblé. Pour cela, différentes techniques peuvent être utilisées: SSCP, DHPLC, HRM... Cette méthode détecte les exons porteurs d'une variation de séquence, mais ne précise pas quelle est cette variation. Par la suite, seuls ces exons seront séquencés pour connaître la nature de cette variation. L'intérêt de cette méthode apparaît surtout pour les gènes de grande taille. 7/14

Les «mutations récurrentes» sont comme leur nom l'indique des mutations très fréquentes, c'est à dire que pour une maladie donnée, une même mutation est présente au même endroit chez la majorité des patients atteints. Donc en cas de suspicion de la maladie, le gène connu pour être porteur de cette mutation sera séquencé en priorité. IV. Microarrays Les microarrays, technologie développée depuis les années 90, sont des lames de verre (ou autres matériaux) sur lesquelles sont déposées des millions de sondes. Les sondes sont de courtes séquences de nucléotides qui se fixent sur des régions d'intérêt. Des échantillon d'adn ou de cdna (un appartenant au patient et l'autre de contrôle) sont déposés avec les sondes marquées avec des marqueurs différents (par exemple vertes pour le patient et rouge pour le contrôle) :marquage différentiel. Démarre alors un hybridation compétitive entre L'ADN du patient, l'adn contrôle mélangés et les sondes. On analyse ensuite les résultats en capturant les différents signaux fluorescents. Le résultat dépend des sondes: en effet, certaines s'hybrident avec de nombreuses régions, d'autres uniquement avec des séquences spécifiques. Le nombre de sondes est limité, il faut donc choisir entre une analyse générale (peu précise) sur une grande quantité de matériel ou une analyse précise sur peu de matériel. Plus on utilise de sondes et meilleure sera l'analyse. Le but est de mettre en évidence une perte ou un gain de matériel (anomalies quantitatives). Région cible: Si la région d'intérêt est présente en quantité équivalente entre PATIENT et CONTROLE alors il y aura un mélange des couleurs des sondes. Le signal sera jaune. Si la région d'intérêt est sur-représentée dans l'échantillon PATIENT le signal sera vert. C'est le signe d'une amplification. Si la région d'intérêt est sous-représentée dans l'échantillon PATIENT alors le signal sera rouge. C'est le signe d'une délétion. (Pour un exon, la délétion peut s'étendre de 2 à 40 nucléotides, ce qui a pour effet de décaler le cadre de lecture pour la formation de l'arnm). 8/14

De nombreuses applications: - Analyses d expression Exemple: «signatures d expression» de tumeurs. - Analyses de liaison Exemple: identification de locus candidats par génotypage SNP. - Analyses génomiques comparatives Exemple: comparaison de génomes procaryotes. - Hybridation Génomique Comparative Exemple: identification de remaniements chromosomiques. - Re-séquençage Exemple: analyses mutationnelles. - ChIP-chip (chromatin immunoprecipitation on chip) Exemple: identification de sites de fixation de facteurs de transcription. - Analyses d ADN méthylé Exemple: identification de promoteurs, d îlots CpG. - Séquence-capture Exemple: enrichissement de régions génomiques cibles avant séquençage à haut débit. CGH arrays CGH: Comparative Genomic Hybridization (sur arrays) Permet la détection d'anomalies quantitatives c'est à dire gain ou perte de matériel génétique, à l'échelle du génome entier (analyse simultanée de tous les chromosomes), à l'échelle d'une région chromosomique d'intérêt ou encore à l'échelle d'un gène. Techniques d'études d'anomalies du génome entre microlésions et macrolésions V. Techniques d'étude de l'expression des gènes L'objectif est l'identification d'anomalies quantitatives ou qualitatives de l'expression d'un ou de plusieurs gènes (au niveau de l'arn). ADN génome => transcription => ARN transcriptome => technique de RT-PCR, reverse transcription en cdna Il est important de noter que les ARNm ne sont présents que dans certains tissus. Différentes techniques sont disponibles, par exemple: RT-PCR et Séquençage RT-PCR quantitative en temps réel 9/14

Micro-arrays d'expression. Exemples d'utilisation: En génétique: analyse de gènes exprimés dans le muscle pour le diagnostic de myopathies. En cancérologie: identification de profils d'expression spécifiques de certains types de tumeurs. Micro-arrays d'expression Extraction d'arn messagers d'un tissus d'intérêt (il est important de le prélever dans le bon tissus en fonction de la maladie dont est atteint le patient : par exemple en cas de myopathie, il faut en prélever dans les muscles du patient) puis rétro-transcription (RT- PCR) en cdna. Sur ces échantillons de cdna on utilise un marquage différentiel (vert ADN patient, rouge ADN contrôle) et il y a hybridation compétitive des sondes. Ensuite on analyse par capture des signaux fluorescents. Grâce à la technique de la RT-PCR nous pouvons connaître la quantité d'arnm présente dans une cellule du patient par rapport à la référence. Un exemple d'application des micro-arrays d'expression est l'identification de profils d'expression spécifiques de certains types de tumeurs. Cela permet de définir des groupes homogènes (identification de tumeurs, classification des tumeurs en différents grades), d'identifier des facteurs pronostiques et d'évaluer des thérapies ciblées. En effet, en attribuant une certaine couleur à l'arnm issu de la tumeur et une autre pour l'arnm de référence et par le phénomène d'hybridation compétitive nous pouvons savoir quels sont les gènes sur ou sous exprimés dans la tumeur. Interprétation de données mutationnelles: Les résultats des analyses en génétique moléculaire (et cytogénétique moléculaire) permettent l'identification de variations génomiques (par rapport à la séquence de référence). Problème: y a-t-il un effet pathogène ou est-ce un polymorphisme? Pour répondre à cela, il faut rechercher des informations dans des bases de données mutationnelles. C'est la prédiction bio-informatique de pathogénicité. C. La nouvelle ère de la génétique moléculaire Une nouvelle ère: le génome personnel Nous assistons au passage de l'ère du génome humain séquencé à l'ère du génome individuel séquencé. De 1990 à 2003: Human Genome Project, un projet international de séquençage du génome humain à 3 milliards de dollars. 2009: premier séquençage d'un exome pour un diagnostic. L'exome représente la totalité des séquences codantes du génome. 2010: publication du premier séquençage de génome humain pour un diagnostic grâce aux séquenceurs à haut débit. Cela a duré 6 mois et coûté des dizaines de milliers de dollars. 2014: Les séquenceurs à Haut Débit permettent de séquencer un génome humain en une semaine à 10000 dollars. Mais l'analyse des données reste difficile. Des quantités importantes de variations de séquences ont été identifiées: il y a au moins 3 milliards de variations de fréquences dans un génome humain. Mais la majorité sont 10/14

simplement dues à la variabilité inter-individuelle. GENETIQUE MEDICALE - Principe des études moléculaires Le filtrage des données est nécessaire pour l'interprétation : il faut savoir éliminer les polymorphismes et s'intéresser principalement aux gènes connus en pathologie humaine. Or environ 25000 gènes sont impliqués dans des pathologies, c'est pourquoi il est impossible de tous les séquencer sans le séquençage à haut débit (par exemple, plus d'une centaine de gènes sont impliqués dans la neuropathie périphérique). Le futur: séquençage du génome à visée diagnostique? La preuve de principe à été démontrée en 2010 : identification du gène causal chez le patient. Analyse en génétique moléculaire La procédure actuelle utilise le séquençage direct (Sanger) qui est une approche gène par gène. Celle-ci permet de séquencer un ou quelques gènes, est longue (une semaine à un an) et coûteuse. La procédure future utilise les séquenceurs à haut débit ce qui constitue une approche «haut débit» qui permet l'analyse de listes de gènes (une liste de gènes est le nombre de gènes impliqués dans une maladie), exomes, ou d'un génome entier, rapidement (72 heures à une semaine) (l'analyse d'un exome pose moins de problèmes d'interprétation que celle d'un génome entier). De plus cette nouvelle méthode permet une réduction des coûts. L'objectif à atteindre est de proposer le séquençage du génome pour la somme de 1000 dollars («the 1000 dollar genome»). «Next generation sequencers» Les techniques de séquençage à haut débit sont basées sur différentes technologies basées elles-mêmes sur des principes différents. Ce sont des technologies différentes du séquençage direct selon Sanger. Elles permettent la production d'une très grande quantité de séquences: des dizaines à des centaines de gigabases par run: c'est entre 10000 à 100000 fois plus par rapport au séquençage Sanger (le séquençage de Sanger sur amplicons de 500pb analyse 1000kb en 7jours) (notre plate-forme LGM analyse environ 1,5 Mb par mois). Ces nouvelles technologies permettent une diminution importante des délais et des coûts: Séquençage 1 amplicon PCR : BHN370 soit 100 euros, un exome en quelques jours à 1000 euros, un génome à 10000 euros en une semaine. Mais les capacités actuelles de ces machines de séquençage du génome en limitent l'accès aux grands centres de recherche. En revanche, le séquençage d'une liste de gènes ou d'un exome sont plus accessibles. «Next generation sequencers»...les petits frères: Les premiers séquenceurs étaient des machines lourdes et complexes qui nécessitaient l'intervention d'un ingénieur pour les faire fonctionner correctement. C'est pourquoi de nouvelles machines plus petites et plus maniables ont été mises au point. Ces machines permettent l'adaptation des débits à des besoins «moyens» c'est à dire des projets de recherche de taille moyenne ou pour une utilisation en routine diagnostique. Elles permettent le séquençage d'un exome «sur la paillasse» en un jour. Certains hôpitaux en sont désormais équipés. 11/14

Etapes clés: 1) Enrichissement en régions d'intérêts: régions génomiques, panels de gènes, exome... Pour le séquençage d'un génome complet, il n'y a pas d'étape d'enrichissement. La sélection de la région que l'on souhaite analyser peut se faire principalement de deux manières: - capture de séquence: analyse d'une région d'intérêt par complémentarité sonde/séquence (sondes spécifiques des régions que l'on veut étudier) - PCR multiplex (PCRs de manière simultanée, utilisation de milliers d'amorces qui permettent l'amplification de 25000 exons d'intérêt). - autres (Exemple: adaptateurs) Possibilité de multiplexage/barcoding. Exemple: capture «exome» c'est à dire toutes les régions codantes soit environ 1% du génome (entre 30 et 48 Mb) soit environ 180000 exons. En pratique, l'enrichissement se fait en déposant chaque molécule dans une micro-plaque (comportant 165 millions de puits). A chaque incorporation d'un nucléotide, on observe une variation minime du ph dans le puits. Donc lorsqu'on détecte un signal, c'est qu'il y a eu incorporation d'un nucléotide. On obtient donc une succession de signaux, de pics dus à l'incorporation de nucléotides. 2) Amplification clonale Avec la méthode de Sanger, on analyse le mélange réactionnel. L'information ainsi obtenue est l'information de séquence de l'ensemble des produits. Tandis qu'avec l'amplification clonale, il y a une amplification individuelle des molécules d'intérêt suivie du séquençage à haut débit. 3) Séquençage à haut débit Le séquençage à haut débit est un séquençage massif en parallèle: on aura un signal pour chacune des molécules présentes après l'enrichissement (séquençage individuel, analyse individuelle). Avec la méthode de Sanger, «Dye-Terminator Sequencing» il y a séquençage du mélange des produits d'amplification et le signal est issu de l'ensemble des molécules. Avec le Massiv parallel sequencing, le signal est analysé individuellement pour chaque molécule qui a été amplifiée de manière clonale. Principales étapes de l'analyse bioinformatique - Acquisition et traitement des données brutes - Base calling: signifie «appel de base». C'est la transformation des données brutes en données de séquence, c'est à dire que l'on fait correspondre à chaque signal détecté une base ATCG. (fichiers fastq) - Read filter: élimination de lectures de qualité inférieure au seuil fixé (peut grandement changer les résultats de séquençage à la fin). - Alignement: positionnement des fragments de séquence de la région d'intérêt analysée générés par rapport à la séquence de référence. (fichiers bam (binary alignment/map)) - Variant calling: identification de variations de séquence entre les lectures, c'est à dire entre les séquences étudiées et la séquence de référence. (fichiers vcf (variant call format)) 12/14

- Annotation: compilation d'informations disponibles concernant chacun des variants identifiés, pour l'interprétation des données mutationnelles. Il s'agit de recueillir des informations sur les variants afin de pouvoir interpréter les données. Le filtrage des variants permet l'interprétation des données mutationnelles. Définitions: couverture et profondeur de lecture La profondeur de lecture est le nombre de lectures («reads») indépendantes d'une base par le séquenceur. La profondeur de lecture obtenue dépend du débit de séquençage obtenu et de la taille de la région d'intérêt. Pour la détection de mutations germinales, la profondeur minimum voulue est de 20 fois. La couverture de séquence est le pourcentage de bases couvertes par rapport au nombre total de bases de la région d'intérêt (pour une profondeur de lecture donnée). Pour la détection de mutations germinales, l'objectif est une couverture supérieure à 90% (100% si possible) à 20 fois de toutes les régions d'intérêt. Les limites du séquençage à haut débit Une des limites du séquençage à haut débit est la précision qui est à améliorer. Celui-ci soulève également des questions d'éthique: quelles données rendre aux patients? (médecine prédictive, diagnostic présymptomatique). Par exemple, si l'on séquence l'exome d'un patient atteint de myopathie afin de déterminer la cause de cette maladie, il se peut que l'on trouve d'autres mutations: ce sont ce qu'on appelle des découvertes fortuites. Problème: doit-on informer le patient de la découverte de ces autres mutations? Qui pourra avoir accès au séquençage à haut débit? Une autre limite est la masse d'informations à traiter: un exome présente 25000 variants dont 500 nouveaux et un génome présente 3M de variants dont 500000 nouveaux. (Bioinformatique, filtrage des données, interprétation du caractère pathogène...) Le coût de séquençage d'un génome humain en «service» était de 10000 dollars en 2011 et de 5000 dollars en 2012. Actuellement, les capacités de séquençage augmentent: un nouvel énorme projet international est en train de voir le jour : «sequencing nation», qui consiste à séquencer des génomes par pays. 13/14

14/14