On en vient maintenant au test lui-même. 6
Avant d envisager la technologie elle-même, quelques mots sur le diagnostic prénatal non invasif qui est réalisé historiquement à partir du sang maternel. On peut déjà souligner que le sang maternel n est pas la seule source de matériel génétique fœtal : la salive, l urine, les prélèvements endocervicaux peuvent être d autres sources et peut-être des sources futures pour de futurs tests. En l occurrence aujourd hui, c est le sang maternel qui nous préoccupe sang maternel à partir duquel les laboratoires ont toujours essayé d isoler des cellules fœtales qui circulent mais ce n est pas l objet du test, puisque cette approche cellulaire a été jusqu à aujourd hui vouée à l échec. Une autre approche a tenté d étudier des ARN messagers placentaires, mais n a également pas abouti à la production d un test diagnostique. C est donc bien aujourd hui l ADN fœtal circulant, dit «ADN plasmatique» ou «ADN extracellulaire», qu on retrouve dans la phase non cellulaire d un prélèvement sanguin qu est le plasma ou le sérum, qui a conduit au succès de ce test. Quelques points essentiels sur cet ADN plasmatique et tout d abord, la source. C est donc le placenta et très exactement les cellules trophoblastiques qui vont relarguer leur contenu dans le sang maternel au cours de la grossesse. Cet ADN peut être détecté très précocement en cours de grossesse, dès la cinquième ou sixième semaine d aménorrhée, ce qui va donc avoir un impact important puisque cela permet la réalisation de tests très précoces en début de grossesse. Puis, deux points intéressants et importants, surtout vis-à-vis de l histoire des cellules fœtales circulantes, cet ADN disparaît complètement après l accouchement et très rapidement puisqu on retire la source d approvisionnement (le placenta). La demi-vie de cet ADN circulant est de l ordre de 15 minutes, si bien que quelques heures après l accouchement, on ne retrouve plus d ADN fœtal détectable dans le sang d une patiente. Enfin, et c est très important, cet ADN fœtal ne persiste pas après la grossesse c est un point essentiel puisque lorsqu on réalise un test à partir de cet ADN circulant, c est bien la grossesse en cours et actuelle qu on est en train d explorer, quel que soit le passé obstétrical de la patiente, quels que soient les antécédents de grossesse chez cette patiente. 7
Le diagnostic non invasif à partir de cet ADN plasmatique a débuté fin des années 97 par la découverte de ce phénomène grâce au travail d une équipe, celle du Dr Denis Lo. On remarque très rapidement que le test a évolué en prise en charge diagnostique, en utilisation diagnostique courante par les obstétriciens dès les années 2000 (2001-2002 où nous étions particulièrement précurseurs en Europe puisque nous avons été les premiers pratiquement dans le monde à pouvoir utiliser cet ADN circulant en termes de diagnostic clinique, d abord pour la détermination du sexe fœtal, puis ensuite pour le génotypage d un groupe sanguin qu est le groupe rhésus D. Puis, il s est passé pratiquement une dizaine d années avant que l on puisse aboutir à ce test génétique non invasif de la trisomie 21, qui a été proposé dès la fin des années 2011, par des laboratoires américains pour le coup. On va comprendre par la suite pourquoi ce gap d une dizaine d années et pourquoi les États-Unis nous ont damé le pion sur ce test en particulier. 8
Si je reviens à l ADN plasmatique, il y a un facteur extrêmement important à retenir : dans le plasma d un individu, et en particulier d une femme enceinte, ce qu on va retrouver majoritairement, c est l ADN de l individu lui-même, en l occurrence de l ADN maternel. L ADN fœtal ne représente qu une très faible proportion de l ADN global qui circule dans le plasma. Cette fraction, qui est estimée initialement à 5%, a été réévaluée à 10%. En réalité, cette évaluation de fraction fœtale dépend de la manière dont on va le mesurer. Cette notion de fraction fœtale est fondamentale pour comprendre pourquoi il nous a fallu une dizaine d années avant de pouvoir proposer un test génétique de la trisomie 21 et des aneuploïdies en général. 9
La chose se présente de la manière suivante. À gauche, nous avons des tests qui ont vu très rapidement le jour, à savoir la détermination du sexe fœtal pour modèle, qui montrent que l analyse de ce point de vue est purement qualitative, c est-à-dire qu on va rechercher dans le plasma maternel, des séquences d ADN dérivées du fœtus qui ne sont pas communes, ou du moins qui sont au minimum différentes, mais souvent absentes du génome maternel. Le modèle est donc la détermination du sexe fœtal, dans lequel on va rechercher des séquences dérivées du chromosome Y qui n appartiennent pas au génome maternel. A droite, pour ce qui nous intéresse aujourd hui (le test de la trisomie 21), l approche est tout autre puisque jusqu à preuve du contraire, en tout cas jusqu à aujourd hui, on n a pas de marqueur génétique qui soit spécifique d un fœtus porteur d une trisomie 21. L approche va donc être purement quantitative. 10
C est cette diapositive qui illustre la problématique, si nous prenons l exemple d un fœtus de sexe féminin. À gauche, un fœtus euploïde (non porteur d une trisomie 21 pour le modèle présenté ici). À droite, un fœtus qui serait porteur d une trisomie 21. Si on reprend la portion d ADN fœtal circulant, qui est de 10% pour faciliter le calcul, à gauche 90 copies d un ADN maternel dits copie d un ADN fœtal issu des chromosomes 21. À droite, le fœtus est porteur d une trisomie 21 donc non plus 10 mais 15 copies (un tiers de copies supplémentaires provenant du chromosome 21), alors que pour les autres chromosomes pour le reste du génome, il n y a pas de différence par rapport à un fœtus qui ne serait pas porteur d une trisomie 21. On passe donc bien à 15 copies. En termes de représentation du génome du chromosome 21 par rapport à l ensemble du génome, cela nous fait passer de 1,35% - représentation habituelle du chromosome 21 à 1,45% pour le chromosome 21 si le fœtus est porteur d une trisomie 21. La vraie problématique était donc celle-ci : jusqu à présent, en termes de technologie, on n avait pas de moyens suffisamment précis pour faire cette distinction, ou du moins on n avait pas de mesures suffisamment précises pour pouvoir discriminer ces deux populations qui sont de 1,35% ou de 1,45%. 11
Ce qui a modifié la donne, ce sont les travaux quasi-simultanés de deux équipes universitaires l équipe de Stephan Quake de Stanford et l équipe de Denis Lo de la Chinese University qui ont publié fin 2008 une approche originale pour faire ce diagnostic de trisomie 21 non invasif, par l utilisation d une technologie de rupture qui est une technologie dite de séquençage massif en parallèle. 12
Arrêtons nous sur cette technologie pour bien comprendre la rupture actuelle. Jusqu à présent, les méthodes dites de séquençage conventionnel méthodes Sanger avaient des capacités globales par «run machine» d environ 50 KB, c est-à-dire 50 000 bases d ADN, avec en regard un nombre de molécules limités qui pouvaient être séquencées. Ici, le nombre est un format standard qui est de 96 échantillons qui pouvaient être séquencés. Donc, 96 échantillons avec une capacité globale de 50 000 bases. On parle maintenant de séquençage à haut débit sur la génération suivante. Vous voyez déjà la rupture en termes de capacité de séquençage, puisqu avec une capacité de l ordre de 15 GB (300 fois plus) en ce qui concerne la petite génération de haut débit, et, conjointement, 25 millions de molécules qui peuvent être séquencées de manière simultanée, on parle bien de séquençage à haut débit massif et de séquençage en parallèle puisque l ensemble des molécules sont séquencées de manière simultanée. C est une approche nouvelle génération dite «petit débit» qu on peut illustrer de la manière suivante en termes de rupture technologique : si on compare cela à la puissance d un moteur d une voiture, on pouvait considérer jusqu à présent qu on était sur un moteur d une puissance d une centaine de chevaux et que l on passe avec cette nouvelle génération à des moteurs qui sont les moteurs Vulcain de la fusée Ariane 5 qui produisent 21 000 CV (soit un facteur 300 entre les deux). Pour procéder à ce test génétique de la trisomie 21, on va aller encore au-delà et utiliser la nouvelle génération à très haut débit de séquençage qui nous permet d atteindre des capacités de séquençage de l ordre de 300 GB actuellement, qu il faut mettre en regard avec la taille du génome humain qui est de 3GB. Ce sont des technologies qui permettent en un seul temps de séquencer en termes de capacité de génome une centaine de génomes complets humains. Voici pour la partie capacité de séquençage de génome, mais en réalité, ce qu on va exploiter dans cette technologie, ce n est pas cette capacité de séquençage du génome puisque le test ne consiste pas en un séquençage du génome. Ce qu'on va exploiter, c est surtout le nombre de molécules qui sont étudiées en simultané par cette technologie, en l occurrence plus d 1 milliard de molécules vont être étudiées par cette technologie qui va permettre les comparaisons quantitatives avec la sensibilité nécessaire pour détecter l excès des séquences fœtales issues du chromosome 21 dans le sang de la mère. 13
Le cœur du système est vraiment cette mesure du nombre de molécules d ADN et non le séquençage en lui-même. Cela a été très bien démontré par l équipe de Stephen Quake qui a démontré que, pour discriminer efficacement ces deux populations de 1,35% et de 1,45% de représentation du génome, il y a deux paramètres qui entrent en compte, le premier étant le nombre de mesures réalisées. On voit sur l échelle de gauche que, plus le nombre de molécules d ADN va être important en termes de mesure, plus on va être capable de mesurer de manière précise et de discriminer ces deux populations qui sont le 1,35 en gris et 1,45 en rouge. Conjointement à cela, il y a un autre paramètre qu il va falloir intégrer également dans le test, soit la proportion de l ADN fœtal qui circule, plus la fraction est importante, plus il est facile d être discriminant. L objectif est de rendre la mesure discriminante entre les deux populations, le 1,35 et le 1,45%. Dans la diapositive, on voit par exemple que pour un ADN qui serait représenté à 4% dans le sang de la mère (petite ligne en pointillés), pour un nombre de molécules d ADN mesurées au moins de 7 millions, on peut faire la discrimination entre ces deux populations. 14
Si on regarde un peu plus de manière pratique ce qui se passe tout au long du test (en particulier je vais vous demander de regarder le calendrier qui est en bas), il y a trois grandes étapes pour ce test. La première consiste à extraire et purifier l ADN global à partir du plasma. Cette étape est importante (comme on l a vu), c est là l importance du savoirfaire du laboratoire sur les aspects pré-analytiques du test puisqu il va falloir que cet ADN en particulier l ADN fœtal soit stabilisé dans le prélèvement, d où l utilisation de tubes spéciaux qui sont fournis aux laboratoires de prélèvement pour la réalisation de ce test. Mais surtout, il va falloir conserver la fraction d ADN fœtal, c est-à-dire qu en pratique il va falloir éviter que les globules blancs de la mère ne soient lisés pour relarguer leur ADN maternel comme on vient de le voir, la fraction d ADN fœtal est un des facteurs importants de la réussite de ce test. 15
La deuxième grande étape, c est le séquençage de cet ADN. Cet ADN, tel qu on l isole et on le purifie à partir du plasma, n est pas prêt à être séquencé. Il est en particulier de très mauvaise qualité puisque c est un ADN qui provient d un processus d apoptose cellulaire. Il va donc falloir réaliser un certain nombre d étapes et notamment de réparation de cet ADN fœtal. Différentes étapes qui vont le conduire à être prêt à être séquencé : nécessité de purification, réalisation d une étape enzymatique, repurification, etc. (on va le voir sur des photos un peu plus loin). Donc on est déjà à J1 sur la réalisation de ce test. 16
Le support sur lequel ces fragments d ADN vont être séquencés (cette petite lame de verre que l on voit ici et qu on appelle une «flow cell»), qui vont nous permettre de traiter et donc de séquencer toutes les molécules qu on vient de préparer pour cela. Ici, on en est à J2 de la préparation de cet ADN pour le séquençage, voilà ce que cela donne en termes d images : la récupération des plasmas de ces tubes un peu particuliers, une fois que ces plasmas sont récupérés, il va falloir en extraire l ADN qu on va traiter de manière multiple pour le préparer à être séquencé. A chacune des étapes : purification, réalisation d une étape supplémentaire, repurification. 17
Voilà la préparation de l ADN final qui va être prêt à être séquencé mais pas tout à fait puisqu il faut enrichir par une petite étape de PCR. Donc nouvelle intervention, nouvelle purification, vérification que la préparation de cet ADN est compatible avec le séquençage (sur cette photo, le petit pic rouge). Ensuite, l ADN est amené sur ce support de verre pour être séquencé (voilà le support de verre). Le support de verre est placé dans le séquenceur et prêt à être séquencé une fois que les réactifs sont introduits dans l appareil que voilà. Vous voyez que on est à J2 et que le séquençage n a pas commencé, puisque c est maintenant que le séquençage démarre, une fois que les molécules sont fixées sur ce support. Le séquençage ressemble à du séquençage conventionnel, en ce sens qu il utilise un système de fluorophore, chaque fluorophore étant spécifique de chacune des bases qui vont être incorporées au moment du séquençage de ces fragments d ADN. 18
Ici, la complexité de séquençage provient d une part, du nombre de molécules qu on va séquencer (je vous rappelle qu on séquence plus d 1 milliard de molécules en simultané), par conséquent, le test de séquençage lui-même la réaction de séquençage lui-même est long dans le temps. Sur la barre du bas vous voyez qu on est déjà à J5, c est-à-dire que le séquençage lui-même va prendre plusieurs jours, pour générer pratiquement 300 milliards de bases. 19
Une fois le séquençage terminé, le troisième cœur du système est évidemment le traitement des données. À un moment donné, il va falloir convertir ces captures d images en une séquence d ADN et en faire les calculs pour mesurer les fractions chromosomiques. Donc ce qu il faut intégrer c est que par run machine en termes d informatiques, ce sont des capacités gigantesques (plus d un térabyte par chaque run machine), ce qui nécessite un environnement dit HPC (High Performance Computing), pour permettre l analyse de ces données. En résumé ce sont 96 microprocesseurs qui vont travailler en parallèle pour pouvoir réaliser l analyse que je vais vous décrire maintenant. L analyse sur le test. Une fois que les images sont converties en séquences (comme on le voit à gauche de l image) chaque fragment d ADN est séquencé et donc traduit en base. Retenez que pour chaque échantillon, il y a plusieurs millions de molécules qui vont subir le même traitement. L analyse informatique commence par la détermination du chromosome d origine de chacun de ces fragments d ADN. 20
Pour cela, chacune de ces courtes séquences est interrogée contre le génome humain de manière à pouvoir être attribuée à son chromosome d origine. Par exemple cette séquence de 27 paires de bases, qui passe par une analyse informatique et pour laquelle on aura déterminé qu elle provient du chromosome 1. On fait de même pour la totalité du génome, et donc de l ADN contenu dans le plasma, qui subit ce même type de traitement informatique. On aboutit finalement au classement des séquences selon le chromosome. 21
Au final, on va pouvoir établir notamment pour le chromosome 21 si on parle de la trisomie 21 le calcul, la fraction chromosomique, en l occurrence la représentation de séquences dérivées du chromosome 21, par rapport à l ensemble des autres chromosomes. C est la première partie du calcul. Ensuite, l analyse consiste à définir si cette fraction chromosomique de l échantillon, par rapport à un échantillon de référence, aura une surreprésentation ou non, c est-à-dire si statistiquement cette fraction chromosomique est différente ou non d une population de référence. Cette analyse statistique est réalisée à travers le calcul d un Z-score, lequel va nous permettre d interpréter le résultat par rapport à une population de référence (qu on voit sur la gauche) pour laquelle la distribution statistique est dite normale (elle suit une distribution log normale). Après avoir défini un cut-off, c est-à-dire la proportion au-delà de laquelle cette fraction chromosomique n est pas liée à une distribution statistique normale, on va pouvoir définir (comme indiqué sur les flèches rouges en particulier) qu un Z-score élevé, supérieur au cut-off défini (en l occurrence à 3 environ pour le chromosome 21), prouve que statistiquement dans cet échantillon, la fraction chromosomique est supérieure à celle d une population de référence. Un Z-score de 3 signifie que la valeur mesurée est distante de 3 écarts-types de la valeur cible. La probabilité de trouver une valeur à l extérieur est de 0,17% pour une distribution normale, soit 1,7 pour 1 000. Si une valeur est à l extérieur de ce cut-off, cela ne peut s expliquer par les simples fluctuations statistiques. En l occurence, dans le plasma de cette patiente, il y a une proportion d ADN issue du chromosome 21 qui est supérieure à la normale de 6 écarts types (flèche rouge du haut). Par conséquent, le fœtus est porteur de trisomie 21. Selon le même raisonnement, il est possible de définir ou de déterminer si le fœtus est porteur d une trisomie 13 ou d une trisomie 18. 22