Sommaire 1. PRINCIPE DE FONCTIONNEMENT:... 2 2. PRE-REQUIS AVANT LE DESSIN DES OLIGONUCLEOTIDES:... 3 2.1 Installation du logiciel OligoArray sur PC:... 3 2.2 Installation du logiciel OligoArray sur Mac:... 3 3. DESSIN DES OLIGONUCLEOTIDES:... 4 3.1 Format du fichier d'entrée:... 4 3.1.1 Formatage de la banque BLAST:... 4 3.1.2 Choix de la gamme de Tm en fonction de la taille des oligos et du contenu en GC... 5 3.2 Lancer un RUN de dessin d'oligonucléotides:... 6 3.2.1 Fichiers d'entrée et paramètres:... 7 3.2.2 Fichiers de sortie:... 8 Ce protocole décrit le dessin d oligonucléotides à l aide du logiciel OligoArray écrit par J.M. Rouillard (Nucleic Acids Res. 2003 Jun 15;31(12):3057-62). Il existe d autres logiciels gratuits. Néanmoins, OligoArray est l un des plus utilisés à l heure actuelle. Le fonctionnement de ce logiciel ainsi que les modalités de son installation sont décrits en détails à l adresse suivante : http://berry.engin.umich.edu/oligoarray2_1/. Pour les personnes qui le souhaitent, OligoArray est installé sur un PC à la plateforme et est accessible après réservation. La plate-forme peut fournir l aide et l encadrement nécessaires au dessin des oligonucléotides. Rédigé par C.Proux et JY Coppée 1/9
1. PRINCIPE DE FONCTIONNEMENT: OligoArray permet le dessin automatique d oligonucléotides selon des paramètres (longueur, Tm, position par rapport au 5, exclusion de séquences prohibées, GC content ) choisis par l expérimentateur. Le principe de fonctionnement est décrit à la figure 1. Figure 1 : Fonctionnement d OligoArray Rédigé par C.Proux et JY Coppée 2/9
Le logiciel crée en premier lieu une matrice de similarité sur base des séquences des cibles (pour lesquelles des oligos sont à dessiner) et de la séquence du génome complet (sous forme de banque Blast). Cette matrice sera utilisée par la suite pour détecter des cross-hybridations potentielles des oligos présélectionnés. Pour chaque séquence cible, OligoArray va créer une fenêtre de X nucléotides (selon la gamme de taille choisie par l utilisateur) générant ainsi un premier oligonucléotide. Il va ensuite contrôler cet oligonucléotide pour les paramètres suivants : - absence de séquences prohibées - vérification du contenu en GC - vérification du Tm (en utilisant le Nearest Neighbour Model) Si ces vérifications échouent, le logiciel va décaler la fenêtre d 1 à 5 nucléotides pour générer un autre oligonucléotide qui sera à son tour contrôlé pour les mêmes paramètres. Si les caractéristiques de cet oligonucléotide correspondent aux paramètres fixés par l utilisateur, OligoArray va ensuite vérifier qu il ne peut former de structure secondaire stable à la température d hybridation (en utilisant Mfold pour la version 2.0 ou OligoarrayAux pour la version 2.1). Si tous les tests décrits ci-dessus sont passés avec succès, OligoArray va déterminer la spécificité de l oligonucléotide sélectionné. En utilisant la matrice de similarité créée initialement, OligoArray va détecter et quantifier toutes les cross hybridations potentielles de l oligonucléotide (OligoArray va quantifier le Tm, l énergie libre, l enthalpie et l entropie associés à chaque hybridation aspécifique). S il n y a pas de cross-hybridation possible avec un Tm supérieur au seuil fixé par l expérimentateur, l oligo est retenu. Dans le cas contraire, il est gardé en réserve. Ces derniers oligos ne seront pris en compte que si le nombre d oligos spécifiques trouvés par le programme est inférieur à celui fixé par l expérimentateur. 2. PRE-REQUIS AVANT LE DESSIN DES OLIGONUCLEOTIDES: 2.1 Installation du logiciel OligoArray sur PC: http://berry.engin.umich.edu/oligoarray2_1/. 2.2 Installation du logiciel OligoArray sur Mac: http://berry.engin.umich.edu/oligoarray2_1/. Rédigé par C.Proux et JY Coppée 3/9
3. DESSIN DES OLIGONUCLEOTIDES: 3.1 Format du fichier d'entrée: Le logiciel OligoArray nécessite que les séquences pour lesquelles des oligonucléotides doivent être dessinés soient au format FASTA. De plus, il est indispensable de créer une banque BLAST (sur base de laquelle sera créée la matrice de similarité). Le formatage de ces fichiers est à la charge des utilisateurs; un protocole est disponible sur le site internet http://berry.engin.umich.edu/oligoarray2_1/. 3.1.1 Formatage de la banque BLAST: Ouvrir un terminal et se mettre dans le dossier comprenant la banque en format FASTA (ex nom_de_la_base.fas). Exemple de base en format FASTA Rédigé par C.Proux et JY Coppée 4/9
Ecrire dans le terminal: formatdb-i nom_de_la_base.fas ot pf (et faire ENTRER) Dans le dossier sont alors créés 5 fichiers: nom_de_la_base.nsq, nom_de_la_base.nsi, nom_de_la_base.nsd, nom_de_la_base.shr, nom_de_la_base.nin (en vert) Le fichier.nsq sera utilisé par OligoArray (cf. 3.2.1 Select Blast database) 3.1.2 Choix de la gamme de Tm en fonction de la taille des oligos et du contenu en GC Pour le dessin des oligos, l utilisateur doit choisir une gamme de Tm. Celle-ci dépend de la taille des oligos ainsi que du contenu en GC. La relation entre ces paramètres a été modélisée de sorte qu Oligoarray peut prédire quelles seront les valeurs de Tm en fonction des valeurs de taille et de GC content. Ce calcul est effectué directement sur le site web d oligoarray (rubrique Tips) Rédigé par C.Proux et JY Coppée 5/9
3.2 Lancer un RUN de dessin d'oligonucléotides: Avant de lancer un run de dessin, il est nécessaire de créer un dossier contenant l application OligoArray et un sous-dossier avec les séquences en format FASTA et la banque BLAST. Le dessin d oligos peut être lancé en lignes de commande ou en utilisant l interface graphique (cf figure 2) Figure 2: interface graphique OligoArray2.jar Rédigé par C.Proux et JY Coppée 6/9
3.2.1 Fichiers d'entrée et paramètres:les paramètres qui doivent être spécifiés pour le dessin sont les suivants : - Select Sequence Input File : Correspond au fichier contenant toutes les séquences pour lesquelles des oligos doivent être dessinés (pour rappel, celles-ci doivent impérativement être en format FASTA) - Select Blast Database.nsq: Correspond à la banque blast utilisée pour calculer la spécifité des oligos - Save Oligos as : Correspond au nom du fichier contenant les séquences des oligonucléotides dessinés - Save Rejected Sequences as : Correspond au fichier contenant les séquences pour lesquelles le dessin des oligos a échoué - Save Log File as : Correspond au fichier contenant toutes les informations générées durant le dessin. -Oligo length : Correspond aux tailles minimale et maximale des oligos. Pour les puces Agilent, il est obligatoire de travailler avec des 60mer. Néanmoins, il est possible d ajouter des linkers de sorte que l on peut dessiner des oligos < 60 nucléotides. Par ailleurs, OligoArray est capable de modifier la taille des oligos de façon à ajuster certains paramètres tels que le Tm. Il est donc utile de donner une gamme de taille plutôt que de se limiter à 60 nucléotides. - Tm Range : Correspond à la gamme de Tm telle qu elle a été estimée en fonction du GC content et de la taille des oligos (cf. 3.1.2) - Max Tm for Structure : Correspond à la température seuil à utiliser pour la prédiction de la formation de structure(s) secondaire(s). Un oligo sera rejeté s il peut former une structure secondaire stable à cette température (valeur par défaut : 65 C) - Min Tm to consider for X-Hybrid : Rédigé par C.Proux et JY Coppée 7/9
Correspond au seuil de Tm à partir duquel on suspectera une cross-hybridation. Toutes les séquences cibles hybridant avec cet oligo avec un Tm > ce seuil seront signalées (valeur par défaut : 65 C) - Max Number of Oligos : Correspond au nombre maximal d oligos à dessiner pour chaque séquence cible - Distance 5 -stop : Correspond à la distance maximale acceptée entre l extrémité 5 de l oligo et l extrémité 3 de la séquence cible. Ce paramètre est important si on veut introduire un biais 3 dans le dessin (pour eucaryote). La valeur par défaut est de 1500 - Min Distance between two oligos : Correspond à la distance minimale entre les extrémités 5 de 2 oligos adjacents. Pour éviter d avoir des overlaps, il faut utiliser une valeur > taille maximale de l oligo. La valeur par défaut est 1.5 X taille moyenne des oligos - Number of parallel processes : Correspond au nombre des séquences cibles qui peuvent être analysées simultanément. Selon le nombre de processeurs et la mémoire disponibles, on peut analyser 3 séquences en parallèle par processeur. - Prohibited Sequences : Correspond aux séquences qui sont interdites. Ces séquences n apparaîtront en aucun cas dans les oligos dessinés. Elles doivent être séparées par des points-virgules. 3.2.2 Fichiers de sortie: - Oligos.txt : Ce fichier contient toutes les données concernant les oligos qui ont été dessinés. Ce fichier peut être ouvert sous excel. Les informations contenues dans ce fichier sont : - Nom de la séquence cible - Position de l extrémité 5 de l oligo dans la séquence cible - Longueur de l oligo Rédigé par C.Proux et JY Coppée 8/9
- L énergie libre, l enthalpie, l entropie et le Tm associés à l hybride oligo-cible. Si l oligo peut cross hybrider sur d autres séquences cibles, celles-ci sont indiquées et les énergie libre, enthalpie, entropie et Tm associés à ces cross hybridations sont également indiqués. - La séquence de l oligo - Rejected.fas : Ce fichier contient les séquences cibles pour lesquelles OligoArray n a pas pu dessiner d oligos compatibles avec les critères choisis par l utilisateur. Ces séquences étant en format FASTA, elles peuvent être directement réutilisées pour un nouveau dessin avec des critères moins stringents - Log file : Ce fichier contient toutes les informations concernant le dessin des oligos (notamment les raisons pour lesquelles certains dessins ont échoué ce qui peut aider à modifier les paramètres à utiliser pour un nouveau dessin). Rédigé par C.Proux et JY Coppée 9/9