Modalités d exécution des prestations NGS réalisées via l UMR 8199-2013 I. Préparation des librairies en vue du séquençage Haut débit via HiSeq et MiSeq 1.1 Points communs à toutes préparations de librairies et envoi d échantillons Pour toutes les préparations de librairies et envoi d échantillons en vue des prestations de type NGS, nous vous demandons d utiliser impérativement des tubes «low binding» afin de minimiser les pertes d ADN par adsorption sur les parois des tubes. Les quantités d ADN demandées pour chaque type de librairie s entende pour tout dosage réalisé au PicoGreen. Si vous effectuez vos dosages via nanodrop, veuillez impérativement tripler cette quantité. Les ADNs seront dosés via Picogreen avant réalisation de la prestation. Le client sera prévenu de la validation quantitative des ADNs envoyés Pour le dosage de librairies préparées par le client, le contrôle se fera via Bioanalyser (Agilent), avant l étape de clusterisation. Le client sera prévenu de la validation quantitative des librairies envoyées Les ADNs et / ou librairies doivent être envoyés sous conditionnement adéquat, par exemple en boîte de polystyrène contenant de la carboglace ou des blocs de glace à -20 C, les tubes d'adns emballés en sachet (pour de petits envois) ou en boîte et fermés hermétiquement. La liste des individus devra être fournie par vos soins sous format Excel. Veuillez à compléter tous renseignements utiles pour chaque ADN tels que : - Identifiant (utilisez un code unique par ADN) - Commentaire - Origine tissulaire - Mode d extraction - Méthode de quantification - Ratio 260/280 - Danger biologique - Concentration Pour tout problème rencontré lors de la réalisation de la prestation le client sera prévenu et décidera de la meilleure stratégie à adopter. Pour plus de détails : cf document Conditions Générales. 1.2 Spécificités de chaque préparation de librairie Modalités d exécution des prestations NGS réalisées via l UMR 8199-2013 Page 1 sur 6
1.2.1 Librairies «exome» La quantité minimale d ADN génomique à fournir est de 4 µg pour des librairies préparées et enrichies via les kits Agilent SureSelect. Les ADNs doivent être fournis à une concentration de 20 à 100 ng / µl. Fragmentation des ADNs à 200pb via Bioruptor (Diagenode), ou Covaris. Validation de la fragmentation via Bioanalyser. Enrichissement selon les recommandations du fournisseur : SureSelect Exome enrichment Agilent : SureSelect Human All Exon + UTRs, 71Mb SureSelect Exome enrichment Agilent : SureSelect Human All Exon, 50Mb Contrôle et dosage des librairies enrichies, via Bioanalyser et Tecan F200. 1.2.2 Librairies «génome» 1.2.3 RNASeq Le client sera prévenu de la validation des librairies après leur enrichissement. La quantité minimale d ADN génomique à fournir est de 1µg, pour des librairies préparées via notre automate de préparation de librairie Spriworks (Beckman Coulter). Les ADNs doivent être fournis à une concentration de 20 à 100 ng / µl. Fragmentation des ADNs via Bioruptor, ou Covaris selon les recommandations du fournisseur. Validation de la fragmentation via Bioanalyser. Finalisation des librairies via Spriworks. Contrôle et dosage des librairies, via Bioanalyser. et Tecan F200 Le client sera prévenu de la validation des librairies. Le séquençage ARN étant spécifique à chaque projet, la préparation des librairies via le laboratoire ne pourra commencer qu à partir de cdna, avec au minimum 500ng à une concentration de 50 ng / µl, et sera réalisée via l automate de préparation des librairies Spriworks. Il est de la responsabilité du client de préparer ses échantillons jusqu à leur validation. Le client fournira les profils Bioanalyser pour chaque échantillon. Le client peut également préparer ses librairies jusqu à l étape finale et procéder au multiplexage de ses librairies si nécessaire. Le client fournira les profils Bioanalyser pour chaque librairie ou pool de librairies. La prestation est alors de type «ready to load», cf. paragraphe II. Contrôle et dosage des librairies, via Bioanalyser et Tecan F200. Le client sera prévenu de la validation des librairies. 1.2.4 Séquençage ciblé - Préparation des librairies via Thunderstorm (Raindance) La préparation de librairies via Thunderstorm sera toujours effectuée avec un minimum de 8 ADNs, et par multiple de 8 ou 48. Modalités d exécution des prestations NGS réalisées via l UMR 8199-2013 Page 2 sur 6
La quantité d ADN génomique à fournir est de 2µg à 3µg. Le client sera prévenu de la validation quantitative des ADNs envoyés. Les ADNs sont fragmentés via Bioruptor ou Covaris en vue de la fusion avec les libraires Raindance via le Thunderstorm, selon les recommandations du fournisseur et les spécificités des librairies Raindance. Le client sera prévenu de la validation des librairies. Le client sera prévenu de la date d envoi des librairies, et aura à sa disposition le numéro de suivi d envoi. Les profils Bioanalyser seront envoyés par mail au client. Si la prestation inclue le séquençage, celui-ci sera réalisé selon les conditions du devis. II. Projets de séquençage «Ready to Load» et Séquençage proprement dit via Hiseq ou Miseq 2.1 Librairies réalisées par le client Les projets «ready to load» concernent : - soit des projets nécessitant l utilisation d une flow cell complète, selon le format de séquençage choisi par le client, - soit des 1/8 ème de flow cell pour des runs Paired End 2 x 76 ou 2 x 100 à réaliser en mode haut débit via le Hiseq2500. Le client préviendra la plateforme avant l envoi de ses librairies, dans un délai de 3 semaines / 1 mois, ceci afin d organiser au mieux les runs de séquençage. Pour les flow cell complètes, les réactifs nécessaires à la réalisation du séquençage ne seront commandés qu après confirmation par le client de la date d envoi des librairies, ceci afin d éviter tout problème de dépassement des dates de péremption des réactifs de séquençage. Si le client juge que ses librairies seront prêtes dans un délai de deux mois après envoi du bon de commande, et que son projet concerne une flow cell complète, il peut décider que la commande des réactifs de séquençage soient effectuée à la réception du bon de commande. Si malheureusement les librairies n étaient pas prêtes, et que les réactifs venaient à être périmés, l UMR 8199 ne pourrait être tenue responsable. Le client devra supporter un nouvel achat de réactifs s il le souhaite, ou la prestation pourra être réalisée avec les kits initialement commandés. Le client confirmera son choix par mail. Le client est seul responsable de la qualité de ses librairies. Le client devra fournir les profils Bioanalyser des librairies envoyées, et devra procéder au mélange équimolaire de celles-ci si un multiplexage est prévu. Le client devra fournir au minimum 10µl de librairies à 10ng/µl. Les quantités et qualité de chaque librairie, ou pool de librairies seront contrôlées via Bioanalyser à leur réception. Modalités d exécution des prestations NGS réalisées via l UMR 8199-2013 Page 3 sur 6
Le client devra également préciser les séquences des index utilisés, et devra informer l UMR 8199 de toute particularité dans ces index. 2.2 Séquençage via HiSeq Le client sera prévenu de la validation quantitative et qualitative des librairies envoyées. Tout type de librairie peut être séquencé sur l HiSeq (Exomes, small ARN, ARN total, MethylSeq, ChipSeq, amplicons, genomes, ). Deux modes de séquençage sont disponibles : le mode classique, long, permettant de générer jusqu à 300Gb de données brutes par flow cell, ou le mode rapide, permettant de générer jusqu à 60Gb de données brutes par flow cell. Pour le mode ultra haut débit : une flow celle est composée de huit lignes, physiquement indépendantes. L hybridation des librairies sur la flow cell et la génération des clusters sont réalisés avec la CBot Pour le séquençage moyen débit en mode rapid run : une flow cell est composée de deux lanes, physiquement indépendantes. On peut ainsi déposer soit une librairie, ou un pool de librairies à séquencer. Dans ce cas l hybridation des librairies sur la flow cell est réalisée directement sur l Hiseq. On peut également séquencer deux libraires ou poll de libraires différents, dans ce cas l hybridation des librairies sur la flow cell est réalisée via la CBot. Le temps de run en mode rapide est de 27H à 40H, selon le type de run choisi. Le séquençage en lui même est réalisé selon les indications du Devis. Le client sera prévenu de la date de lancement du run sur l HiSeq Extractions des intensités des clusters à partir des images et base calling avec le pipeline d Illumina. 2.3 Séquençage via MiSeq Tout type de librairie peut être séquencé sur le MiSeq (small RNA, RNAseq, MethylSeq, ChipSeq, amplicon seq, genome seq, ). Le Miseq peut également être utilisé afin de valider la qualité des librairies avant séquençage sur l Hiseq2500. Hybridation des librairies sur la flow cell et génération des clusters directement sur le Miseq, puis séquençage selon les spécificités du Devis. Le client sera prévenu de la date de lancement du run sur le MiSeq Extractions des intensités des clusters à partir des images et base calling avec le pipeline d Illumina. III. Délais Préparation des librairies quelque soit la technique utilisée : 5 à 6 semaines. - Séquençage proprement dit via Hiseq2500 en mode ultra haut débit : 5 à 6 semaines pour une flow cell complète. - Séquençage proprement dit via Hiseq2500 en mode rapid run: 2 à 3 semaines pour une flow cell complète. Modalités d exécution des prestations NGS réalisées via l UMR 8199-2013 Page 4 sur 6
- Séquençage proprement dit via Miseq : 2 à 3 semaines pour une flow cell complète. Pour toute flow cell nécessitant la mutualisation de plusieurs projets, les délais peuvent être allongés. L UMR 8199 ne pourra être tenue responsable de tout retard dans la réalisation de la prestation si ce retard est de la responsabilité d un tiers. Ces délais sont valables à réception de tout le matériel nécessaire à la réalisation de la prestation. Ils ne tiennent pas compte de retard de livraison qui pourrait survenir de la part des fournisseurs tiers ni de problèmes techniques éventuels. S il s avère que l UMR 8199 n est pas en mesure de fournir les résultats dans les délais initialement fixés, l UMR 8199 s engage à prévenir immédiatement le client de tout retard éventuel. De plus, l UMR 8199 s engage à prévoir une solution pour remédier à ce retard de manière satisfaisante pour le client. IV. Livraison des résultats et analyses bioinformatiques Le client sera prévenu de la mise à disposition de ses données sur disque dur externe. Données issues de l Hiseq2500 : Le responsable du projet peut récupérer ses données de séquençage à la fin du run de séquence, sous format FastQ, via disque dur externe. Pour une flow cell complète il faut compter un disque dur d une capacité de 1T. Si le client souhaite récupérer les données brutes, non démultiplexées, sous format bcl, et ceci uniquement dans le cas ou son projet nécessite l utilisation d une flow cell complète, l UMR 8199 pourra compresser les données sur le nombre de disques dur externes nécessaires. Il sera de la responsabilité du client de décompresser les données et de les démultiplexer. Si le client ne parvient pas à extraire, démultiplexer ou décompresser les données, l UMR 8199 pourra envoyer les données sous format FastQ sur disque dur externe. Dans ce cas nous demandons au client de nous prévenir dans un délai de 15 jours ouvrables à l issue de la réception des données non démultiplexées. L UMR 8199 facturera tout travail supplémentaire au tarif horaire, ainsi que tout disque dur supplémentaire nécessaire. Données issues du Miseq : Les données peuvent être fournies après analyse via le Miseq, sous format FastQ. Analyse bioinformatique pour les projets exome entier Selon vos besoins vous pouvez choisir parmi les différents niveaux d'analyse ci-dessous : Niveau 1 : Données FastQ et compte rendu. Niveau 2 : Données FastQ, Liste des SNPs avec un filtre 8 profondeur; fichier BAM, statistiques, compte rendu. Niveau 3 : Données FastQ, fichier BAM, Liste des SNPs avec annotations supplémentaires (gène concerné, changement d acide aminé, conséquence (non sens, codant ), identification swissprot, description du gène, dbsnp HG19 lien vers rs, 1000génomes / MAF, prédictions fonctionnelles sur dbnspfv2.0 pour les codant non synonymes, complete genomics, lien vers Modalités d exécution des prestations NGS réalisées via l UMR 8199-2013 Page 5 sur 6
Niveau 4 : le gène NCBI, lien vers OMIM, type de position (exonique, intronique, nomenclature HGVS, genomic/transcrip/prot), statistiques, compte rendu. SUR DEMANDE (ex: étude comparative entre individus, comparaison avec données de génotypage, études de ségrégation ). Pour toute autre analyse bioinformatique, merci de prendre contact avec notre équipe bioinformatique, afin de définir vos besoins. Nous évaluerons le temps nécessaire à la réalisation de ce travail. Cette prestation fera l objet d un devis. Olivier SAND - Responsable Bioinformatique Génomique et Maladies Métaboliques CNRS UMR 8199 Institut de Biologie de Lille 1, Rue du Professeur Calmette B.P. 245 59019 Lille Cedex - France Tel: 33 (0)3 20 87 10 71 Fax: 33 (0)3 20 87 10 31 olivier.sand@good.ibl.fr http://www-good.ibl.fr/ Modalités d exécution des prestations NGS réalisées via l UMR 8199-2013 Page 6 sur 6