Identification des protéines PPR impliquées dans l épissage des ARN messagers dans les chloroplastes et les mitochondries chez Arabidopsis Thaliana.

Dimension: px
Commencer à balayer dès la page:

Download "Identification des protéines PPR impliquées dans l épissage des ARN messagers dans les chloroplastes et les mitochondries chez Arabidopsis Thaliana."

Transcription

1 Ecole doctorale : «Des génomes aux organismes» School of Biomedical, Biomolecular and Chemical Sciences THESE EN COTUTELLE Présentée pour l obtention du grade de DOCTEUR DE L UNIVERSITE D EVRY VAL D ESSONNE Et le grade de DOCTEUR DE L UNIVERSITE DE WESTERN AUSTRALIA Spécialité : Biologie cellulaire et moléculaire Identification des protéines PPR impliquées dans l épissage des ARN messagers dans les chloroplastes et les mitochondries chez Arabidopsis Thaliana. Par : Andeol Alexis FALCON DE LONGEVIALLE Le jury est composé de: Claire LURIN Ian SMALL Francis-André WOLLMAN José GUALBERTO Christian SCHMITZ-LINNEWEBER Bénédicte STURBOIS Dominique GAGLIARDI Martin CRESPI Directrice de thèse Directeur de thèse Rapporteur UEVE et UWA Rapporteur UEVE Examinateur Examinatrice Rapporteur UWA Rapporteur UWA

2 Préambule : Cette thèse est le résultat d un cursus peu habituel. En effet, une grande partie des travaux qui sont présentés ont été réalisés alors que je n étais pas encore inscrit en thèse. Après l obtention de mon diplôme de DESS intitulé «Productivité Végétale- Biotechnologie-Génome» réalisé à l université Denis Diderot PARIS VII, j ai intégré l équipe de Ian Small et de Claire Lurin en tant qu Ingénieur d étude sur le projet européen AGRIKOLA. C est à la fin de ces trois années que j ai commencé peu à peu à m immerger dans le monde des PPR. Puis j ai suivi Ian Small qui est parti en Australie diriger le centre Plant Energy Biology à Perth. C est sous un contrat de Post-doctorant mais sans thèse que j ai effectué mes recherches sur le rôle des protéines PPR dans l épissage des ARNm. Suite à ces deux années enrichissantes, j ai réintégré l équipe de Claire Lurin à Evry sous un nouveau contrat européen, AGRONOMICS, sur la mise en place d une technique d interaction protéine-protéine in vivo chez arabidopsis, le Split-DHFR. Dans l optique de valoriser le travail que j avais réalisé en Australie, j ai donc décidé de m inscrire en thèse en co-tutelle entre l université d Evry Val d Essonne et l université de Western Australia. Ainsi pendant les deux dernières années, j ai donc concilié à la fois le travail sur le Split-DHFR et mon travail de thèse sur les protéines PPR. Cette thèse est donc le fruit d un peu plus de quatre ans dans le monde des PPR, deux ans en Australie et les deux dernières en France dans le laboratoire de Claire Lurin. 1

3 Remerciements : Je tiens tout d abord à remercier Claire et Ian pour m avoir donné chacun l opportunité de travailler sur ces protéines PPR, de m avoir encadré tout en me donnant une grande liberté de recherche. Je remercie également tous les membres du jury qui ont pris le temps de lire ce manuscrit. En grand Merci à ma chère et tendre épouse, Maud qui m a accompagné et soutenu pendant ces quatre années, même si pour elle ce que je fais reste en grande partie incompréhensible. Un autre merci à Paloma, ma première fille et à ma toute dernière Bianca. Sans elles, la rédaction de ce manuscrit n aurait pas été autant un challenge Merci à Anne-Laure, l experte en édition! Merci à Etienne Delannoy pour toutes nos discussions enrichissantes sur le monde des PPR et son aide précieuse. Welcome Back! Merci à Etienne Meyer, mon partenaire de squash, pour son expertise et son aide sur le complexe I. Merci à Charles pour son aide au début de la caractérisation des premiers mutants. Merci également à Cathie qui est devenue l experte en Epissage, Anne, Kristina, Fred, Sandra, Nick Taylor et Nick O Toole à Perth. Et sans oublier Jenny et Jude el leurs agréables sourires!!! Un grand merci aussi à Alex et Laure, qui ont été mes binômes pendant un moment et qui sont toujours disponibles et prêtes à me rendre service. Merci aussi à Dario, mon binôme du split que j ai laissé un peu tomber au moment de la rédaction Merci à Clément, à Richard, à Sandrine et à tout le reste de l équipe Génomique fonctionnelle. Merci a Geert De Jaeger et Mike Bevan pour leur collaboration dans ce travail. Enfin un dernier merci à toutes les personnes qui de loin ou de près m ont aidé pendant cette thèse et que je n ai pas cité ici. 2

4 INTRODUCTION SOMMAIRE Sommaire... 3 Principales Abréviations :... 7 CHAPITRE I : INTRODUCTION... 8 I.1 L épissage des ARN messagers... 8 I.1.1 Définition... 8 I.1.2 Origine de l épissage... 8 I.1.3 Rôle de l épissage... 9 I.1.4 L épissage des ARN messagers dans les organites... 9 Article 1 : de Longevialle A.F., Small I.D. and Lurin C. (2010) Nuclearly Encoded Splicing Factors Implicated in RNA Splicing in Higher Plant Organelles. Molecular Plant, sous presse... 9 I.2 La famille des protéines PPR (Pentatricopeptide Repeat) I.2.1 Caractéristiques des PPRs I Description des motifs PPRs I Composition de la famille I Distribution de la famille I Données de localisation subcellulaire I.2.2 Rôle des protéines PPR I Les protéines PPR dans l initiation de la transcription I Les protéines PPR dans la maturation des ARNm I Maturation en 5 et 3 des ARNm I L édition des ARNm I L épissage des ARNm I Les PPRs dans la stabilisation des ARNm et la traduction I Les protéines PPR impliquées dans la restauration de la fertilité mâle cytoplasmique (CMS) Présentation du sujet de thèse : CHAPITRE II : RESULTATS II.1 Identification de protéines PPR impliquées dans l épissage des ARNm dans les chloroplastes II.1.1 OTP Article 2 : de Longevialle A.F., Hendrickson L., Taylor N.L., Delannoy E., Lurin C., Badger M., Millar A.H. and Small I.D. (2008) The pentatricopeptide repeat gene OTP51 with two LAGLIDADG motifs is required for the cis-splicing of plastid ycf3 intron 2 in Arabidopsis thaliana. The Plant Journal, 56: II.1.2 Identification de défauts d épissage en utilisant la PCR quantitative II.1.2 Identification de défauts d épissage en utilisant la PCR quantitative II OTP52 (At3g06430, emb2750)

5 INTRODUCTION II Profil d épissage des mutants affectés dans la transcription de type PEP 66 II.2. Identification de protéines PPR impliquées dans l épissage des ARNm dans les mitochondries II.2.1 OTP Article 3 : de Longevialle A.F., Meyer E.H., Andrés C., Taylor N.L., Lurin C., Millar A.H. and Small I.D. (2007) The Pentatricopeptide Repeat Gene OTP43 Is Required for trans-splicing of the Mitochondrial nad1 Intron 1 in Arabidopsis thaliana. The Plant Cell, 19: II.2.2 TANG Article 4 : Li Y., Smith C., Colas des Francs-Small C., de Longevialle A.F., Corke F., Zheng L., Tanz S., Small I.D. and Bevan M.W. (2010) TANG2, a Glucose-Responsive Gene, Encodes a Pentatricopeptide Repeat Protein Required for Splicing of Mitochondrial nad5 Transcripts, in submission II.2.3 PPR II.2.4 Comment identifier de nouvelles PPRs impliquées dans l épissage des introns nad? 112 II Co-régulation des PPRs II Les nouveaux facteurs d épissage identifiés II «Pure» PPRs (OTP439) II Influence de l édition dans l épissage II Effet du sucre sur l épissage II.3 L épissage alternatif des PPR II.3.1 Epissage alternatif identifié dans les banques d EST II.3.2 Analyse préliminaire des 48 PPRs «du laboratoire» II.3.3 Cas d OTP43 et de ses différentes isoformes II Identification des isoformes par RT-PCR II Preuves de traduction des différents transcrits : II Complémentation fonctionnelle avec les isoformes II.4 Identification de partenaires des protéines PPR II.4.1 Méthode utilisée : TAP-TAG II.4.2 Partenaires d OTP II.4.3 Partenaires de DYW II.4.4 Partenaires de CLB CHAPITRE III : CONCLUSION et DISCUSSION GENERALE III.1 Les protéines PPR, des facteurs d épissage intron spécifique : III.2 L épissage alternatif, un moyen d augmenter le nombre de protéines PPR : III.3 Rôle de l épissage alternatif : une nouvelle hypothèse sur la reconnaissance de multi-sites d édition par une seule protéine PPR? III.4 Action des protéines PPR, une action seule ou en partenariat : III.5 Rôle et régulation des protéines PPR

6 INTRODUCTION III.5.1 Régulation transcriptionnelle et post-transcriptionnelle : III.5.2 Régulation post-traductionnelle : CHAPITRE IV : MATERIELS ET METHODES IV.1 Matériels IV.1.1 Souches bactériennes IV.1.2 Oligonucleotides utilisés au cours de ma thèse et non répertoriés dans les articles. 159 IV.1.2 Lignées d insertion IV.2 Méthodes IV.2.1 Méthodes relatives à la culture d'arabidopsis IV Culture en terre IV Culture in vitro IV Préparation des graines d Arabidopsis IV Vernalisation IV Stérilisation des graines IV.2.2 Protocoles relatifs à l'adn IV Extraction rapide d'adn génomique IV Extraction d'adn génomique (Dneasy 96 Plant kit QIAGEN) IV Amplification d ADN par PCR IV Méthode de PCR «classique» IV Méthode de PCR «clonage» IV PCR quantitative IV Electrophorèse IV Purification de produits PCR en vue d un clonage ou d un séquençage 166 IV Utilisation du kit QIAquick (Qiagen) IV Purification au PEG IV Clonage de produit PCR IV Clonage dans le vecteur pgemt-easy (Promega) IV Technologie de clonage GatewayTM (Invitrogen) IV Principe du clonage Gateway IV PCR de clonage IV Mutagenèse dirigée par PCR en vue d un clonage dans un vecteur d entrée du système Gateway 167 IV Réaction de BP clonase IV Réaction de LR clonase IV Transformation bactérienne, sélection et test des colonies transformées

7 INTRODUCTION IV Protocole de préparation de cellules DH5α Thermo-compétentes IV IV Protocole de transformation par choc thermique de cellules DH5α compétentes 169 Tranformation d Agrobactéries, sélection et test des colonies transformées 169 IV Protocole de préparation d agrobactéries thermocompétentes IV Protocole de transformation par choc thermique de cellules C58C1 compétentes 169 IV Extraction et purification de plasmides (miniprépration d ADN) IV Séquençage d ADN IV.2.3 Méthodes relatives à l ARN IV Extraction d ARN total IV Traitement de décontamination de l ADN contaminant IV Réaction de transcription «inverse» IV Northern blot IV Protocole pour l analyse PPE IV.2.4 Méthodes propres à Arabidopsis IV Transformation d Arabidopsis par «floral deeping» IV Etude du phénotype Références Bibliographiques ANNEXES :

8 INTRODUCTION PRINCIPALES ABREVIATIONS : ADN : Acide Desoxyribonucléique ADNc : ADN complémentaire ADNg : ADN génomique AGRIKOLA : Arabidopsis Genomic RNAi Knock-out Line Analysis ARN : Acide Ribonucléique ARNm : ARN messager ARNi : ARN interférence ARNr : ARN ribosomique ARNt : ARN de transfert BET : Bromure d'ethidium CMS : "Cytoplasmic Male Sterility", stérilité mâle cytoplasmique dntp : désoxyribonucléotide EST : Expressed Sequence Tag GFP : Green Fluorescente Protein GST : Gene-specific Sequence Tag IPTG : Isopropyl-Beta-Thio-Galactoside MS (1/2MS) : milieu Murashige et Skoog NEP : Nuclear Encoded Polymerase NMD : nonsense mediated mrna decay ORF : Open Reading Frame PCR : "Polymerase chain reaction", réaction en chaîne par polymérase PEP : "Plastidial Encoded Polymerase", polymérase chloroplastique codée par le génome PLS : sous-famille de protéines PPR PPE : Poisoned Primer Extension PPR : PentatricoPeptide Repeat PTC : Premature Termination Codon qpcr : PCR quantitative RIP-CHIP : RNA ImmunoPrecipitation and DNA CHIP hybridization RRM : RNA Recognition Motifs (motif de reconnaissance de l ARN) RT-PCR : réaction de transcription inverse suivie d une PCR RUST : Regulation by Unproductive Splicing and Translation mechanism snrnp : Small Nuclear Ribonucleoprotein TAIR : The Arabidopsis Information Resource UTR : UnTranslated Region (région non traduite) Nomenclature : Pour un gène nucléaire, la nomenclature suivante est utilisée : Gène : NUC, mutant : nuc, protéine : NUC Pour un gène cytoplasmique, la nomenclature bactérienne est adoptée : Gène : cyt, protéine : CyT 7

9 INTRODUCTION I.1 L épissage des ARN messagers I.1.1 Définition CHAPITRE I : INTRODUCTION L'épissage est un processus de maturation post-transcriptionnelle par lequel les pré-arn transcrits à partir de l'adn génomique peuvent subir des étapes de coupure et ligature conduisant à la suppression de certaines régions dans l'arn mature. Ce phénomène permet l assemblage des séquences codantes, les exons, mais aussi l assemblage de séquences non codantes comme des transcrits d ARNt contenant des introns. L'épissage est assuré par un ensemble de complexes ribonucléoprotéiques, appelés les spliceosomes. Chaque complexe snrnp pour Small Nuclear Ribonucleoprotein, contient un ARN et plusieurs protéines. Cet ensemble de protéines reconnait des séquences spécifiques et permet la mise en place d une structure secondaire optimale de l ARN pour l épissage. Il existe également des introns appelés auto-épissables ou auto-catalytiques, c est-à-dire capable de s'exciser sans intervention d'un spliceosome, ceux-ci ont été décrits dans les mitochondries, les plastes et certaines bactéries. Cependant, ce n est pas la règle générale dans les mitochondries et les chloroplastes, chez lesquels la majorité des introns nécessitent l'intervention de protéines codées par le génome nucléaire et importées dans les organites. Par analogie avec le fonctionnement du ribosome, il a été proposé que, dans le spliceosome, c'est l'arn qui est catalytique et donc que le spliceosome est un ribozyme. Le mécanisme catalytique exact du spliceosome est encore inconnu. I.1.2 Origine de l épissage Dès la découverte des introns en 1977, trois questions ont été immédiatement posées : Quelle est l origine de ces introns? Quel est leur rôle dans l évolution? Mais aussi quelle est leur fonction? Deux hypothèses antagonistes s opposent concernant l origine des introns au cours de l évolution : l hypothèse «des introns précoces» propose que les introns existaient avant la divergence des procaryotes et des eucaryotes (Gilbert 1978). Cependant cette hypothèse ne peut expliquer l absence d introns chez les procaryotes et, de ce fait, une explication a été émise, proposant qu il y ait eu une pression de sélection sur les introns chez les procaryotes et que ceux ci aient été éliminés de leur génome. En effet, la plus grande pression que subit le monde procaryote est de devoir se multiplier très rapidement, de ce fait toute séquence inutile est éliminée pour aboutir à un génome minimal. En revanche, du fait de l absence de spliceosome chez les procaryotes, une deuxième hypothèse a été formulée, dite de «l hypothèse des introns tardifs» qui propose que les introns aient été insérés dans les gènes eucaryotes après cette divergence et que les espèces n ayant pas d introns n aient jamais eu d introns (Doolittle and Stoltzfus 1993). Certains éléments sont plus en faveur de la première hypothèse et certains de la deuxième et il est donc difficile de conclure sur l une ou l autre. De plus, la génomique comparative n est toujours pas capable de dissocier entre ces deux hypothèses et il semblerait plutôt que l origine des introns se situe entre ces deux hypothèses, «existence d introns tardifs» et «d introns précoces» (Koonin 2006). 8

10 INTRODUCTION Du fait de la caractéristique des introns nucléaires et du mécanisme nécessaire pour leur épissage, il a été proposé que les introns de group II auto-épissables sont à l origine des introns nucléaires, et qu ils auraient envahi massivement le génome nucléaire au cours de l endosymbiose entre une -proteobactérie et une archebactérie. Quelle que soit l origine des introns, ils ont par la suite évolué au sein des eucaryotes. Ainsi, par exemple, le mécanisme d épissage des introns nucléaires chez les plantes diffère des mammifères, le site de reconnaissance en 3 est enrichi en AU dans les introns des plantes, alors que chez les mammifères, celui-ci est enrichi en poly pyrimidine (Wiebauer, Herrero et al. 1988). Par ailleurs, les introns de group II dits auto-épissables ne le sont dans la majorité des cas plus dans les organites et nécessitent désormais différents facteurs d épissage comme il en sera discuté dans cette thèse. I.1.3 Rôle de l épissage L épissage de manière générale permet de joindre les exons entres eux en excisant toutes les parties non codantes afin d obtenir un ARNm mature qui va pouvoir être traduit. Cette étape, d une grande complexité au niveau nucléaire mais également dans les organites, fait partie des différentes étapes de maturation post-transcriptionnelle des ARN pré-messagers et est donc importante dans la régulation de l expression des gènes et peut être contrôlée grâce à l implication de différents facteurs d épissage. Cependant d autres fonctions peuvent lui être attribuées. En effet, l épissage sous sa forme dite alternative permet d établir différents isoformes dont les fonctions varient. L épissage alternatif est décrit dans le noyau mais n est pas présent dans les organites et se définit sous quatre formes. 1. L excision d exons ; 2. La rétention d introns ; 3. Site d épissage donneur alternatif ; 4. Ou site accepteur d épissage alternatif. Ce phénomène qui sera plus longuement discuté dans le chapitre sur l épissage alternatif, permet soit de réguler l expression des gènes, soit de synthétiser de nouvelles protéines à partir d un même gène, conférant ainsi une adaptation et une évolution. I.1.4 L épissage des ARN messagers dans les organites Article 1 : de Longevialle A.F., Small I.D. and Lurin C. (2010) Nuclearly Encoded Splicing Factors Implicated in RNA Splicing in Higher Plant Organelles. Molecular Plant, sous presse. 9

11 Molecular Plant Advance Access published July 5, 2010 Molecular Plant Pages 1 15, 2010 REVIEW ARTICLE Nuclearly Encoded Splicing Factors Implicated in RNA Splicing in Higher Plant Organelles Andéol Falcon de Longevialle a,b, Ian D. Small b and Claire Lurin a,1 a Unité Mixte de Recherche en GénomiqueVégétale (Institut National de la Recherche Agronomique/Centre National de la Recherche Scientifique/Université d Evry Val d Essonne), Evry, France b Australian Research Council of Excellence in Plant Energy Biology, University of Western Australia, Crawley 6009, WA, Australia ABSTRACT Plant organelles arose from two independent endosymbiosis events. Throughout evolutionary history, tight control of chloroplasts and mitochondria has been gained by the nucleus, which regulates most steps of organelle genome expression and metabolism. In particular, RNA maturation, including RNA splicing, is highly dependent on nuclearly encoded splicing factors. Most introns in organelles are group II introns, whose catalytic mechanism closely resembles that of the nuclear spliceosome. Plant group II introns have lost the ability to self-splice in vivo and require nuclearly encoded proteins as cofactors. Since the first splicing factor was identified in chloroplasts more than 10 years ago, many other proteins have been shown to be involved in splicing of one or more introns in chloroplasts or mitochondria. These new proteins belong to a variety of different families of RNA binding proteins and provide new insights into ribonucleo protein complexes and RNA splicing machineries in organelles. In this review, we describe how splicing factors, encoded by the nucleus and targeted to the organelles, take part in post-transcriptional steps in higher plant organelle gene expression. We go on to discuss the potential for these factors to regulate organelle gene expression. Key words: INTRODUCTION RNA splicing; chloroplast; mitochondria; splicing factors. Eukaryotic cells contain organelles that are essential for supplying energy via ATP synthesis, namely mitochondria and in photosynthetic cells, chloroplasts. These two organelles are the results of two endosymbiosis events: mitochondria derive from endosymbiotic a-proteobacteria (Andersson et al., 2003) and chloroplasts derive from endosymbiotic cyanobacteria (Raven and Allen, 2003). Throughout evolution, organelle genomes have lost much of their original genomes by the redistribution of genetic material between nucleus, mitochondria, and plastids via inter-compartmental DNA transfer (Ayliffe et al., 1998; Ellis, 1982; Stern and Lonsdale, 1982; Weeden, 1981). From the six theoretical DNA transfer possibilities, at least five have been observed (Kleine et al., 2009): DNA transfer from chloroplasts to mitochondria and, vice versa, DNA transfer from nucleus to mitochondria and the two most common events, DNA transfers from chloroplasts or mitochondria to the nucleus. Many of the proteins encoded by genes transferred from organelles to the nucleus are important for organelle gene expression or metabolism and need to be targeted back to their original compartment, creating a requirement for coordinate regulation of nuclear and organellar gene expression. In addition to the genes transferred from organelles, many other nuclearly encoded proteins have acquired functions in different processes of gene expression in organelles. These host-encoded proteins are needed for a wide range of transcriptional and post-transcriptional processes including DNA replication, RNA transcription, RNA processing, RNA editing, RNA splicing and translation. RNA splicing is a good illustration of the typical evolutionary trajectory of these processes, which all illustrate a steadily increasing role for the cell nucleus in controlling organellar activities. Originally, RNA splicing of introns was enhanced by their intronencoded proteins (IEPs). These contained endonuclease and reverse transcriptase domains believed to play an enzymatic role in genetic mobility and a maturase domain, thought to promote splicing. Introns were dispersed as mobile elements, but in land plants, almost all introns have lost their IEPs, ending with only two maturases encoded in the organellar genomes and a set of nuclearly encoded splicing factors. 1 To whom correspondence should be addressed. fax 33 (0) , tel. 33 (0) ª The Author Published by the Molecular Plant Shanghai Editorial Office in association with Oxford University Press on behalf of CSPP and IPPE, SIBS, CAS. doi: /mp/ssq025 Received 12 March 2010; accepted 27 April 2010 Downloaded from by on July 6, 2010

12 2 de Longevialle et al. d RNA Splicing in Plant Organelles INTRON STRUCTURE AND SPLICING MECHANISMS RNA splicing is a processing event in which the introns of a precursor messenger RNA (pre-mrna) are removed and its exons are joined. In plants, several chloroplast and mitochondrial genes, encoding either trnas or proteins, are interrupted by introns. Depending on their conserved primary and secondary structures as well as their different splicing mechanisms, these introns are classified into two main families, group I and group II introns. Twenty group II introns and only one group I intron have been found in the chloroplast genome of Arabidopsis thaliana while 17 group II and one group I intron have been described in maize and rice. Similarly, plant mitochondrial genomes contain mostly group II introns. Among flowering plant mitochondrial genomes, 25 group II introns have been described (Bonen, 2008), most of which disrupt nad genes. In addition, one group I intron, coding an intronic ORF with potential maturase function, was found in the cox1 gene of several plants (Cho et al., 1998). Group I introns are characterized by a secondary structure of 10 domains, P1 to P10, each of them having a specific role in RNA folding to enhance splicing and ligation. Splicing of group I intron is mediated via a two-step phosphoryl transfer reaction using an exogenous guanosine as a cofactor instead of the adenosine in domain VI used in group II introns (Kruger et al., 1982). Group II introns are composed of six domains (Figure 1) and are divided into four subclasses. Two subclasses, group IIA and IIB, are found in flowering plants (Michel et al., 1989), while two additional subclasses, group IIC and IID, have been discovered only in bacteria (Michel et al., 1989; Toor et al., 2001). For the most part, the overall organization and structure are similar in all these classes and reviews of their structure and folding have been published (Fedorova et al., 2007; Keating et al., 2010; Pyle et al., 2007). Domain I, which is essential for ribozyme activity, contains two exon binding sites (EBS1 and EBS2) that interact with two corresponding intron binding sites (IBS1 and IBS2) located at the 3 end of the first exon. Domains II and III enhance the catalysis of splicing, while domain IV, which contains the coding sequence for a maturase in the case of nad1 intron 4 in plant mitochondria and trnk intron in chloroplasts, is not involved in catalysis. This domain is also the break point for eight events of trans-splicing that have been observed in plants (rps12 intron 1 in chloroplasts, nad1 intron 1, intron 3, intron 4; nad2 intron 2; nad5 intron 2, intron 3 in mitochondria (Bonen, 2008), and recently in the mitochondrial cox2 intron in Allium cepa L. (Kim and Yoon, 2010)). Domain V is the most phylogenetically conserved domain and contains a sequence of 34 nucleotides that forms part of the catalytic core and is essential for ribozyme activity. Domain VI provides the branchpoint adenosine for the first trans-esterification step. Although these features are common to most group II introns in plants, some exceptions have been described. For Downloaded from by on July 6, 2010 Figure 1. Scheme of the Secondary Structure of Group II Introns and their Splicing Mechanisms. The catalytic mechanism of group II introns closely resembles that of the spliceosome. Splicing occurs via two trans-esterification steps, annotated 1 and 2. First, the 2 OH of the branch point adenosine within domain VI performs a nucleophilic attack on the first nucleotide of the intron at the 5 splice site, forming the lariat intermediate. Second, the 3 OH of the released 5 -exon performs a nucleophilic attack at the last nucleotide of the intron at the 3 splice site, joining the exons and forming a lariat that will be polyadenylated and degraded.

13 de Longevialle et al. d RNA Splicing in Plant Organelles 3 example, nad1 intron 1, which does not have a bulged adenosine but, in contrast, has an aberrantly large domain V loop (Carrillo et al., 2001; de Longevialle et al., 2007); nad1 intron 2, which has a very short, strongly base-paired domain VI helix (Li-Pook-Than and Bonen, 2006); nad4 intron 2, which lacks a bulged adenosine at the expected position (Bonen, 2008); ycf3 intron 2, which has two additional nucleotides in addition to the 34 nucleotides expected in domain V (de Longevialle et al., 2008); and the chloroplast trnv intron, which lacks a bulged A in domain VI and is spliced by a hydrolytic mechanism (Vogel and Borner, 2002). In most species, many of these group I or group II introns are mobile genetic elements whose mobility is mediated by a ribonucleoprotein (RNP) complex composed of the intron RNA and a conserved intron-encoded protein, also called maturase, which facilitates the splicing of its host intron (Eickbush, 1999; Wank et al., 1999). In flowering plants, most of the organellar intron maturases have been lost. The only remaining maturases are found in the trnk intron of the chloroplasts, in nad1 intron 4 of mitochondria and in the cox1 intron of several plants (Cho et al., 1998). The loss of these maturases has been accompanied by the recruitment of host-encoded proteins to facilitate splicing of introns that have lost their autocatalytic activity. None of the group II introns in plants that have been tested was able to self-splice in vitro and all have been shown to require additional trans factors for efficient splicing in vivo. The two first nuclear mutations affecting a subset of chloroplast splicing events were identified in maize in the crs1 and crs2 mutants (described below), opening a new research area to elucidate the mechanisms that regulate organellar RNA splicing (Jenkins et al., 1997). In mitochondria, the first nuclear mutation affecting a splicing event was identified in Nicotiana sylvestris (Brangeon et al., 2000) in the nuclear nms1 mutant. This mutant presented a defect in RNA splicing of nad4 intron 1 and no spliced nad4 exon1-exon2 could be detected while all other transcripts were not affected. Unfortunately, the Ms1 locus has never been identified and thus no information on the MS1 protein is available. Since then, many other factors acting as splicing factors to facilitate or enhance RNA splicing have been molecularly characterized during the last 10 years. These factors belong to different families of RNA binding proteins that have acquired specific roles in RNA splicing during the evolution of land plants. Their roles are summarized in Table 1, Figure 2, and Figure 3 and each of them will be discussed in detail below. Maturases Maturase proteins are divided into two classes based on the location of their genes, intron-encoded maturases, and nuclearly encoded maturases. Each organelle genome in plants has conserved only a single group II intron-encoded maturase. In chloroplasts, MatK is encoded within the intron of trnk and in mitochondria, MatR is encoded within the fourth intron of nad1. The position of these maturase genes inside introns suggests a specific role in the splicing of precursor RNAs transcribed from the genes in which they reside, but until very recently, no evidence for this was available. Immunoprecipitation of MatK-associated RNA (Zoschke et al., 2010) captured seven out the eight group IIA introns in tobacco chloroplasts, including the trnk intron. MatK preferentially associated with domains II and IV of the trnk intron. These co-purifications strongly suggest a role of MatK in RNA splicing for these seven introns. A similar approach would be very helpful to elucidate the role of MatR in mitochondria. The second class of maturase was discovered by analyzing the complete nuclear genomes of Arabidopsis and rice. Four nuclear genes coding for proteins closely related to group II intron-encoded maturases were found in both genomes (Mohr and Lambowitz, 2003). Three maturases are targeted to mitochondria (Table 1) and one (At1g74350) has a dual localization, depending on the start codon used for its translation (Keren et al., 2009). The longer isoform was observed in mitochondria, while the shorter one is targeted to chloroplasts. All these maturases are presumed to act in trans in the splicing of organellar introns. To date, a role in RNA splicing has been demonstrated by reverse genetic approaches for only two out of the four nuclearly encoded maturases. At-nMat1a (At1g30010) is involved in the maturation of nad4 RNA by being required for the splicing of one of its introns, although which one was not determined (Nakagawa and Sakurai, 2006). AtnMat2 (At5g46920) (Keren et al., 2009) is a mitochondrial protein found in a large RNP complex that co-fractionates with group II introns. Mutants lacking the protein present a decrease in splicing of several introns, suggesting AtnMat2 is involved in the splicing of the cox2 intron, nad1 intron 2, and nad7 intron 2. However, because some splicing of these introns was still observed in the knockout mutants, it has been suggested that other splicing factors may also be involved. In contrast, mutants affected in the dual targeted maturase are embryo lethal in Arabidopsis (Keren et al., 2009) and molecular characterization could not be done. However, its sub-cellular localization and its high sequence similarity with the two other maturases suggested that this maturase is involved in RNA splicing in chloroplasts and/or mitochondria. CRM Domain Proteins The Chloroplast RNA splicing and ribosome maturation (CRM) domain was first described in RNA splicing factor CRS1 (Jenkins et al., 1997; Till et al., 2001). Although this domain is found in at least five characterized chloroplast splicing factors in plants, it derived from an ancient ribosome-associated protein (Barkan et al., 2007). CRM domains in prokaryotes exist as stand-alone proteins of ;100 amino acids encoded by a single copy ORF. The Escherichia coli YhbY protein has been shown to be associated with pre-50s ribosomal subunits, suggesting a function in ribosome assembly. In contrast to prokaryotes, plant genomes encode multiple CRM domain proteins. Sixteen Arabidopsis and 14 rice proteins containing one or more CRM Downloaded from by on July 6, 2010

14 4 de Longevialle et al. d RNA Splicing in Plant Organelles Table 1. Organellar and Nuclear-Encoded Factors Controlling Splicing of Organellar Introns. Type Name A. thaliana O. Sativa Sub-Type Localisation Affected introns References maturase proteins CRM proteins AtnMat3 At5g04050 OS06G44880 maturase mitochondria unknown Keren et al., 2009 AtnMat4 At1g74350 OS06G42770 maturase chloroplasts and mitochondria unknown Keren et al., 2009 At-nMat1a At1g30010 OS12G21870 maturase mitochondria nad4 Nakagawa and Sakurai, 2006 AtnMat2 At5g46920 OS10G41790 maturase mitochondria cox2 intron, nad1 intron2, nad7 intron2 matk maturase chloroplasts atpf intron, trnk intron, trna intron, trnl intron, trnv intron, rpl2 intron, rps12 intron2 matr maturase mitochondria unknown AtCFM2 At3g01370 Os CRS1 subfamily chloroplasts AtCFM3a At3g23070 Os11g37990 chloroplasts and mitochondria trnl intron, ndha intron, ycf3 intron1, clpp* intron2 ndhb intron, rpl16 intron, rps16 intron, trng intron, petb intron and petd intron Keren et al., 2009 Zoschke et al., 2010 Asakura and Barkan 2007 Asakura et al., 2008 AtCFM3b At4g14510 chloroplasts Asakura et al., 2008 ZmCRS1 At5g16180 Os08g27150 chloroplasts atpf intron Jenkins et al., 1997; Till et al., 2001; Asakura and Barkan 2006 At3g18390 Os05g47850 chloroplasts unknown At4g29750 Os09g19850 chloroplasts unknown AtCFM6 At4g13070 Os06g20030 Subfamily 3 mitochondria and nucleus unknown At2g28480 Os01g72820 mitochondria unknown and nucleus At3g25440 Os04g41550 mitochondria unknown and nucleus At3g27550 Os05g05300 mitochondria unknown and nucleus At5g54890 Os08g08860 CAF mitochondria unknown At4g31010 Os08g07790 subfamily mitochondria unknown ZmCAF2 At1g23400 Os01g21990 chloroplasts ndhb intron, petb intron, rps12 intron1, ndha intron and ycf3 intron1 ZmCAF1 At2g20020 Os01g31110 chloroplasts petd intron, rpl16 intron, rps16 intron, trng intron, ndha intron, ycf3 intron1, rpoc1 intron* and ClpP intron1* At2g21350 Os10g36860 subfamily 4 chloroplasts or mitochondria unknown At4g39040 chloroplasts unknown Barkan et al., 2007 Ostheimer et al., 2003; Asakura and Barkan 2006 Ostheimer et al., 2003; Asakura and Barkan 2006 Downloaded from by on July 6, 2010

15 de Longevialle et al. d RNA Splicing in Plant Organelles 5 Table 1. Continued Type Name A. thaliana O. Sativa Sub-Type Localisation Affected introns References PPR proteins peptidyl-trna hydrolase ribonuclease III proteins ZmPPR4 At5g04810 Os04g58780 Pure subfamily chloroplasts trans rps12 intron1 Schmitz-Linneweber et al, 2006 AtOTP51 At2g15820 OS02G47360 chloroplasts ycf3 intron2 Falcon de longevialle et al, 2008 ZmPPR5 At4g39620 OS02G51480 chloroplasts trng-ucc intron Beick et al., 2008; Cushing D.A. et al., 2005 AtHcf152 At3G09650 Os12g or Os11g chloroplasts petb intron Meierhoff et al., 2003 AtOTP43 At1g74900 OS02G45590 mitochondria trans nad1 intron1 Falcon de longevialle et al, 2007 ZmCRS2 At5G38290? chloroplasts rps12 intron1, ndhb intron, petb intron, ndha intron, ycf3 At5g16140 not predictable intron1, rpl16 intron, rps16 intron, petd intron, trng intron, clpp intron1* and rpoc1 intron* At1g18440 OS01G49900 mitochondria unknown or OS05G47630 At5g19830? mitochondria unknown ZmRNC1 At4g37510 Os01g59510 chloroplasts trnv intron, trnk intron, trnl intron, trna intron, atpf intron, rps12 intron2, ndhb intron, petb intron, petd intron, trng intron DUF860 or PORR ZmWTF1 At4g01037 Os05g49610 chloroplasts trnv intron, trnk intron, trnl intron, trna intron, atpf intron, rps12 intron2, ndhb intron, petb intron, petd intron, trng intron Whirly protein DEAD-box protein ZmWHY At1G14410 or At2g02740 Jenkins et al., 2001; Jenkins et al., 1997 Watkins et al., 2007 Kroeger et al., 2009 OS06G05350 chloroplasts atpf intron Prikryl et al., 2008 AtPMH2 At3G22330 OS12G41715 mitochondria nad1 intron 2 and 3, nad2 intron 1, 2 and 4, nad4 intron2 and 3, nad5 intron 1, 2 and 3, nad7 intron1 and 4, cox2 intron, rps3 intron and rpl2 intron Matthes et al., 2007; Kohler et al., 2009 unknown NsNMS1 unknown unknown mitochondria nad4 intron1 Brangeon et al., 2000 Downloaded from by on July 6, 2010 Yellow boxes represent the species in which the different splicing factors have been characterized. Introns found in Arabidopsis thaliana but not in maize and rice are marked with asterisks. Orthologous genes in Oryza sativa or in Arabidopsis thaliana have been determined using FLAGdb ++ v4.2 (http://urgv.evry.inra.fr/flagdb) or BLASTP (http://blast.ncbi.nlm.nih.gov/blast.cgi). The intron whose splicing requires AtCFM3a is marked in red. No clear orthologs of ZmCRS2 and At5g19830 were found in Oryza sativa. Sub-cellular localizations confirmed by reverse genetics analysis and/or by localization studies using a fluorescent protein fusion are indicated in bold.

16 6 de Longevialle et al. d RNA Splicing in Plant Organelles Figure 2. Schematic Representation of Chloroplast Splicing Factors in Land Plants. The group II introns are divided into two subgroups IIA and IIB according to Michel et al. (1989). The introns that are found in Arabidopsis thaliana but not in maize and rice are marked with asterisks. PPR proteins are represented in gray, CRM domains proteins in green, peptidyltrna hydrolase protein in blue, maturase in gold, ribonuclease III domains protein in brown, PORR domain protein in red, and Whirly protein in purple. This figure is modeled after the figure presented in Kroeger et al. (2009). domains have been described and were placed into 14 orthologous groups divided into four subfamilies (Barkan et al., 2007). Seven CRM domain proteins are predicted to be targeted to chloroplasts and among them, five have been characterized as plastidial splicing factors: CFM3, CFM2, CRS1, CAF1, and CAF2 (described below). Two CRM proteins are predicted to be mitochondrial and five others are potentially targeted to two locations: mitochondria and chloroplasts, or mitochondria and nucleus (Table 1). All the CRM proteins characterized so far are involved in RNA splicing in chloroplasts. The first CRM gene, CRS1 (for Chloroplast RNA Splicing 1), was identified from a genetic screen in maize (Jenkins et al., 1997) and later cloned (Till et al., 2001). CRS1 contains three CRM domains and is required for the splicing of the group IIA atpf intron via a direct interaction with its intronic target. Two other CRM domain proteins were discovered in a yeast two-hybrid screen using CRS2 (a homolog of peptidyl-trna hydrolases, which probably lacks that catalytic activity but is required for the splicing of a subset of group II introns) as a bait (Ostheimer et al., 2003). These two proteins, CAF1 and CAF2 (for CRS2-associated factors 1 and 2), have two CRM domains and each of them is bound to CRS2 in chloroplasts. The complex CRS2 CAF1 is required for the splicing of a subset of subgroup IIB introns in maize: petd intron, rpl16 intron, rps16 intron, trng intron, ycf3 intron 1 (Ostheimer et al., 2003). In Arabidopsis, two additional introns, absent in maize (rpoc1 intron and ClpP intron 1), are spliced by the CRS2 CAF1 complex (Asakura and Barkan, 2006). The complex CRS2 CAF2, whose formation is mediated by a 22-amino-acid motif in the C-terminal region of CAF2 (Ostheimer et al., 2006), is required for the splicing of five subgroup IIB introns: ndhb intron, petb intron, rps12 intron 1, ndha intron, and ycf3 intron 1. It was observed that for this last intron, CRS2 CAF1 and CRS2 CAF2 complexes have overlapping functions in maize and in Arabidopsis thaliana (Asakura and Barkan, 2006; Ostheimer et al., 2003). Two Arabidopsis paralogs (At4g31010 and At5g54890) of CAF1 and CAF2 were predicted to be mitochondrial (Table 1). These proteins end just after the second CRM domain, lacking the C-terminal CRS2-binding peptide found in CAF1 and CAF2. In addition, At5g19830, a paralog of CRS2, is also predicted to be mitochondrial and does not contain the conserved residues shown in CRS2 to bind Downloaded from by on July 6, 2010

17 de Longevialle et al. d RNA Splicing in Plant Organelles 7 CAF1 and CAF2. Nevertheless, it has another hydrophobic domain that could potentially bind to CAF paralogs (Ostheimer et al., 2005). It seems likely that CRS2 CAF-type complexes could exist in mitochondria, where they may be involved in RNA splicing (Ostheimer et al., 2006). Another CRM domain protein found to be involved in RNA splicing is closely related to CRS1 but has a fourth CRM domain at the C-terminus. CFM2 (for CRM Family Member 2) was found in the large RNP complexes that contain CAF1 and/or CAF2. RNA co-immunoprecipitation assays (RIP-Chip) in maize have shown that CFM2 is associated with one group I intron (trnl intron) and two group II introns (ndha intron, ycf3 intron 1). In Arabidopsis, a reverse genetic approach has shown that CFM2, in addition to these three introns, also promotes the splicing of the clpp intron 2 (a group II intron), which is not found in maize (Asakura and Barkan, 2007; Asakura et al., 2008). CFM3 (for CRM Family Member 3), the latest CRM domain protein to be characterized in plants, contains three CRM domains (Asakura et al., 2008). In contrast to the other splicing factors in the family, CFM3 is dual-targeted to chloroplasts and mitochondria. In chloroplasts, CFM3 associates in vivo with a distinct subset of CAF/CRS2-dependent group II introns (ndhb intron, rpl16 intron, rps16 intron, trng intron, petb intron, and petd intron) and promotes their splicing in rice. In Arabidopsis thaliana, two paralogs have been described: AtCFM3a (At3g23070) is dual-targeted to both organelles and AtCFM3b (At4g14510) is specific to chloroplasts. Loss of AtCFM3a leads to a strong decrease in the splicing of ndhb intron while atcfm3b mutants do not have any phenotype. The double mutant atcfm3a/atcfm3b presents seed lethality, demonstrating that these two proteins are functionally redundant (Asakura et al., 2008) and may indirectly be involved in translation by having a function in splicing of rpl16 (encoding a ribosomal protein) or the trng intron, as has been demonstrated for OsCFM3 (Asakura et al., 2008). In mitochondria, the role of CFM3 is not completely elucidated and further study will be required. Among the CRM domain family, four additional proteins cluster in the subfamily 3 (Table 1) (Barkan et al., 2007). These CRM domain proteins have not been characterized so far but are predicted to localize to the nucleus and mitochondria, and this has been confirmed by GFP fusion in the case of CFM6 (At4g13070) (Barkan et al., 2007). It has been suggested that CFM6 may function in ribosome biogenesis within the nucleus and mitochondrion. However, an additional function in RNA splicing in mitochondria is not excluded, as also suggested for the mitochondrial paralogs of CAF1 and CAF2. Thus, CRM domain proteins are implicated in the metabolism of three classes of catalytic RNA: group I introns, group II introns, and 23S rrna. PPR Proteins Pentatricopeptide repeat (PPR) proteins are RNA-binding proteins that have been identified from the Arabidopsis thaliana genome sequence and are defined by a canonical 35-amino-acid motif, repeated in tandem up to 30 times (Small and Peeters, 2000). More than 450 members compose this family in each land plant genome while only a few per genome have been described in mammals, suggesting multiple specific roles in plants (Schmitz-Linneweber and Small, 2008). Plant PPR proteins can be classified into two major subfamilies based on the nature of their PPR motifs: the P (for pentatricopeptide) subfamily and the PLS subfamily (where L and S indicate long and short variants of the PPR motif). The latter subfamily can be further divided into several subclasses based on their characteristic C-terminal motifs (Lurin et al., 2004). Abundant genetic evidence suggests that many PPR proteins have sequence-specific RNA binding activity and are involved in organellar gene expression, including RNA transcription, RNA editing, RNA maturation, RNA translation, and RNA splicing (Schmitz-Linneweber and Small, 2008). In chloroplasts, four PPR proteins have been shown to be involved in RNA splicing of specific introns. PPR4 (Schmitz- Linneweber et al., 2006) was identified in maize and presents, in addition to its PPR motifs, an N-terminal RNA recognition motif (RRM). RNA immunoprecipitation showed that PPR4 was associated with the first intron of rps12 pre-mrna. In addition, ppr4 mutants are defective in splicing of this intron, demonstrating a direct role of PPR4 in trans-splicing of rps12 intron 1. The Arabidopsis PPR protein OTP51 (for ORGANELLAR TRANSCRIPT PROCESSING 51) carries two C-terminal LAGLIDADG motifs in addition to seven canonical PPR motifs (de Longevialle et al., 2008). LAGLIDADG homing endonucleases are encoded by mobile genetic elements found mostly in group I introns and catalyze DNA cleavage at specific sites lacking the endonuclease coding region (Chevalier and Stoddard, 2001). Most of the LAGLI- DADG proteins are endonucleases, but some of them have acquired a dual function, acting both as homing endonucleases and as RNA splicing maturases. OTP51 has lost the amino acids thought to be required for endonuclease activity, but has conserved those described to be essential for the maturase activity. Reverse genetics has shown that OTP51 is involved in RNA splicing of ycf3 intron 2 and, in addition, influences the splicing of a subset of trna introns and the atpf intron (de Longevialle et al., 2008). Two other chloroplast PPR proteins may be implicated in splicing, although the data suggest that the effects on splicing may be indirect consequences of alterations in RNA stability. Arabidopsis hcf152 mutants present reduced amounts of spliced petb RNA and are affected in the accumulation of transcripts cleaved between the genes psbh and petb (Meierhoffetal., 2003). HCF152 may bind the exon intron junction of petb and be directly involved in splicing of the petb transcript (Nakamura et al., 2003) or, alternatively, it may play an indirect role by protecting mature mrnas from degradation, as shown for PPR10 in maize (Pfalz et al., 2009). Another possible splicing factor is PPR5, a maize P-class PPR protein that stabilizes unspliced trng-ucc precursor but may also promote its splicing (Beick et al., 2008; Cushing et al., 2005). In mitochondria, PPR proteins are also likely to be involved in RNA splicing (Figure 3). Most mitochondrial introns are Downloaded from by on July 6, 2010

18 8 de Longevialle et al. d RNA Splicing in Plant Organelles Figure 3. Schematic Representation of Mitochondrial Splicing Factors in Land Plants. Dashed circles mark introns that might be affected in the At-nMat1a mutant. Dashed arrows mark interactions needed for high splicing efficiency but not absolutely required. PPR protein is represented in gray, Maturase proteins in gold, DEAD-box protein in brown, and NMS1 in ivory. localized in nad genes, suggesting that splicing mutants are likely to be affected in mitochondrial complex I, leading to partial sterility and delayed development. OTP43 is so far the only PPR protein characterized to be involved in splicing in plant mitochondria (de Longevialle et al., 2007). This P-class PPR is required for trans splicing of nad1 intron 1 and the splicing defect leads to a complete loss of Complex I activity. Theotp43 mutant exhibits increased expression of alternative NAD(P)H dehydrogenases and alternative oxidases to bypass the Complex I defect, similar to that seen in rotenone-treated cells (Garmier et al., 2008), the ndufs4 mutant in Arabidopsis (Meyer et al., 2009), and the Nicotiana CMSII mutant (Dutilleul et al., 2003). All five PPR proteins identified to be involved in splicing in organelles so far are P-class proteins, as opposed to the large class of PLS-class PPR proteins involved in RNA editing (Cai et al., 2009; Hammani et al., 2009; Kim et al., 2009; Okuda et al., 2009, 2010; Robbins et al., 2009; Schmitz-Linneweber and Small, 2008; Takenaka, 2010; Tseng et al., 2010; Verbitskiy et al., 2009; Yu et al., 2009; Zehrmann et al., 2009). The scarce data on the RNA binding activity of P-class PPR proteins suggest they generally bind tightly and specifically to their RNA targets (Schmitz-Linneweber and Small, 2008) and all appear to be primarily required for splicing of a single, specific intron. OTHER SPLICING FACTORS CRS2 (for Chloroplast RNA Splicing 2) is a peptidyl-trna hydrolase (pth ts ) that was first described from maize chloroplasts (Jenkins and Barkan, 2001). This protein, in association with the CRM-containing proteins CAF1 and CAF2, is required for the splicing of nine group II introns (rps12 intron 1, ndhb intron, petb intron, ndha intron, ycf3 intron 1, rpl16 intron, rps16 intron, petd intron, and trng intron) in maize (Jenkins and Barkan, 2001; Jenkins et al., 1997) (see paragraph on CRM proteins). In Arabidopsis, in addition to a plastid-targeted protein, three orthologs of CRS2 have been described. Two of them are predicted to be targeted to mitochondria whilst the last does not appear to contain a predictable targeting signal (Table 1). The lack of several conserved amino acids important for the activity of the E. coli pth ts enzyme, an enzyme that cleaves the ester bond linking the trna and nascent peptide (Menninger, 1976), suggests that CRS2 and its three orthologs may lack peptidyl-trna hydrolase activity but have acquired a function in group II intron splicing. Indeed, in the case of CRS2, no function in translation has been observed (Jenkins and Barkan, 2001). However, interestingly, one mitochondrial paralog of CRS2 in Arabidopsis (At5g19830) has conserved PTH-like traits, suggesting that this particular protein could Downloaded from by on July 6, 2010

19 de Longevialle et al. d RNA Splicing in Plant Organelles 9 have a dual function in RNA splicing and translation (Ostheimer et al., 2005). In Arabidopsis, no mutants in this family have been characterized. However, Arabidopsis CRS2 homologs might have the same functions in splicing of several group II introns in association with AtCAF1 and AtCAF2 proteins. In maize, it was impossible to reconstitute splicing in vitro with these three factors together, suggesting that additional proteins are required. One of these additional factors might be RNC1, which has been identified by mass-spectrometry analysis of proteins that co-immunoprecipitate with CAF1 and CAF2 (Watkins et al., 2007). RNC1 is a plant-specific protein with two ribonuclease III domains that binds RNA but lacks endonuclease activity. In bacteria, Rnase III functions in the processing of a polycistronic rrna precursor. In maize, rnc1 mutants are deficient in plastid ribosome accumulation; however, it was not possible to prove a physical association between rrna sequences and RNC1. This, in addition to the lack of endonuclease activity of RNC1, suggests that in plants, RNC1 is not involved in processing polycistronic rrna precursors but that the phenotype in ribosome accumulation might be a secondary effect of the rnc1 mutation. It has been shown that RNC1 is associated with a subset of group IIA (trnv intron, trnk intron, trni intron, trna intron, atpf intron, and rps12 intron 2) and IIB introns (ndhb intron, petb intron, petd intron, trng intron) and facilitates their splicing (Watkins et al., 2007). Interestingly, RNC1 is also associated with ycf3 intron 1 and rpl2 intron but seems not to be required for their splicing. In addition, this reverse genetic approach has shown that whereas RNC1 was first identified by its co-immunoprecipitation with CAF proteins, it does not seem to be essential for introns that require both CAF/CRS2 complexes, suggesting it plays a supporting role. Another protein identified by mass-spectrometry analysis of proteins that co-immunoprecipitate with CAF1 and CAF2 contains a domain of unknown function (DUF860), renamed recently as the PORR (for Plant Organelle RNA Recognition) domain due to its ability to bind RNA (Kroeger et al., 2009). WTF1 (for What s This Factor? ) is part of a family that has 17 members in rice and 15 in Arabidopsis and that comprises 14 orthologous groups. Nearly all these members are predicted to be targeted to chloroplasts or mitochondria. WTF1 is a plant-specific protein, which co-immunoprecipitates from chloroplast extracts with group II introns and is involved in their splicing (Kroeger et al., 2009). This new factor, by forming a heterodimer with RNC1, enhances the splicing of all the RNC1-specific introns. The many other members of this family of organellar proteins have not been characterized so far. Like WTF1, they might be involved in organellar RNA metabolism, opening a new research area of RNA binding proteins, and putative RNA splicing factors. In chloroplasts, ZmWHY, which has been identified in maize, could be also considered as a splicing factor (Prikryl et al., 2008). ZmWHY is a member of the plant-specific Whirly protein family, whose members have been described as DNA-binding proteins that influence nuclear transcription and telomere maintenance and bind nucleoids in chloroplasts and mitochondria. ZmWHY promotes atpf intron splicing in association with CRS1. Many other WHY proteins exist in plants, raising the question of their functions in RNA splicing. In mitochondria (Figure 3), two additional splicing factors have been described that do not belong to the different families of proteins described above. PMH2 (for Putative Mitochondrial RNA Helicase 2) is a DEAD-box protein (Kohler et al., 2009; Matthes et al., 2007). In Arabidopsis, 58 genes encoding DEAD-box proteins have been identified (Boudet et al., 2001; Mingam et al., 2004). Through their primary function in modifying inter- or intramolecular RNA structures or in dissolving RNA protein complexes, DEAD-box proteins are potentially involved in most events of RNA processing, including RNA synthesis, RNA modification, RNA cleavage, RNA degradation, as well as ribosome biogenesis and translation initiation (Linder, 2006). PMH2 is associated with large RNA-containing complexes in mitochondria (Matthes et al., 2007) and is required for the efficient splicing of 15 out of the 23 group II introns found in Arabidopsis mitochondria (Kohler et al., 2009). More precisely, the pmh2 mutant presents a decrease in the splicing of: nad1 intron 2 and 3; nad2 intron 1, 2, and 4; nad4 intron 2 and 3; nad5 intron 1, 2, and 3; nad7 intron 1 and 4; cox2 intron; rps3 intron; and rpl2 intron. As suggested by the large number of introns that are more or less affected in the mutant, PMH2 does not seem to have a preference for a particular substrate and rather functions as a RNA chaperone that influences RNA stability. Three other DEAD-box proteins involved in RNA splicing have been characterized in other species. In S. cerevisiae, Mss116 is important for the splicing of all mitochondrial group I and group II introns (Huang et al., 2005) and Ded1 has been shown to facilitate group II intron splicing in vitro (Solem et al., 2006). In N. crassa, CYT-19 enhances group I intron splicing (Bertrand et al., 1982). ROLE OF SPLICING FACTORS IN RNA FOLDING AND SPLICE SITE RECOGNITION A large set of splicing factors has been identified in recent years, mainly by reverse genetic approaches and/or because of their RNA binding activities. However, their precise roles and the basis for sequence-specific RNA recognition still need to be elucidated for most of them. Progress in understanding splicing mechanisms has been achieved for some chloroplast splicing factors, providing new insights into ribonucleoprotein complexes and the need for RNA folding trans-factors. As described above, the CRS1 protein, which has three CRM domains, binds the atpf intron in vivo (Ostheimer et al., 2003; Till et al., 2001). To further understand its role in RNA splicing, a recombinant dimeric CRS1 has been used for binding assays on the atpf intron (Ostersetzer et al., 2005). It revealed that the maize recombinant CRS1 binds two different sequences within Downloaded from by on July 6, 2010

20 10 de Longevialle et al. d RNA Splicing in Plant Organelles the maize atpf intron, which correspond to 111 nucleotides at the 3 end of domain I and 30 nucleotides ( ) in domain IV. Through this association, CRS1 promotes the RNA folding of the atpf intron into its predicted catalytically active form. Interestingly, these sequences are not well conserved between monocotyledons and dicotyledons. For example, a deletion of the 3 end of domain I is observed in dicotyledons. Because the Arabidopsis homolog of CRS1 was shown to be required for the splicing of the same intron (Asakura and Barkan, 2006), it would be very interesting to discover the sites bound by the Arabidopsis protein to understand how CRS1 recognizes its binding sites and how RNA binding proteins have coevolved with their RNA targets. To understand how multiple CRM domains cooperate to achieve highly specific RNA binding, affinity assays were performed on the three CRM domains of maize CRS1 (Keren et al., 2008). Through this analysis, these three CRM motifs did not show the same affinity for the RNA sequences of the atpf intron. Whereas CRM domain 3 bound tightly to atpf intron, CRM domain 1 associated with the 111 nucleotides at the 3 end of domain I and CRM domain 2 interacted with several regions within domains I, III, and IV but with low affinity. A similar approach was used to investigate the binding sites of PPR5 (Beick et al., 2008; Williams-Carrier et al., 2008). ZmPPR5 binds in vivo to the unspliced precursor of trng-ucc and is involved in RNA stabilization and possibly RNA splicing of this intron. Recombinant ZmPPR5 is associated with high affinity to the central region of the trng intron (Beick et al., 2008) and interacts preferentially with single-stranded RNA in a region of 50 nucleotides in domain I of the trng intron (Williams-Carrier et al., 2008). This binding site is located where the intron is cut in the mutant, confirming a role for PPR5 in RNase protection. Through these analyses and RIP-Chip experiments, it seems quite clear that at least some splicing factors directly interact with introns in a sequence-specific manner. By this binding activity, the interacting protein changes the intron RNA folding to enhance its splicing. This conformational change is mediated by at least one or more proteins, depending on the intron targeted. For example, even if we cannot exclude that many splicing factors remain to be identified, only one splicing factor has been identified for ycf3 intron 2, clpp intron 2, or trnl intron, while the splicing of some other introns involve four or five known splicing factors, such as, for example, the petb intron. In the case of the atpf intron, six splicing factors have been described to be absolutely or partially required for its splicing. Sedimentation through sucrose gradients showed that CRS1 is part of a ribonucleoprotein complex of about kda (Till et al., 2001), comprising about 270 kda of the atpf intron and around 160 kda of dimeric CRS1. By adding in the molecular weight of all the splicing factors (WTF1, 61 kda; RNC1, 62 kda; MatK, 65 kda; ZmWHY, 29 kda) that have been shown to be involved in atpf splicing, a complex of 647 kda, very close to the experimental observations, ispredicted.thisraisesthe question of whether all the splicing factors are present in a single RNP complex. Splicing factors may interact with each other via direct protein protein interactions or indirectly by RNA tethering. For example, whilst RNC1 and WTF1 were shown to interact together to promote the splicing of most group II introns in chloroplasts (Kroeger et al., 2009), ZmWHY is associated with CRS1 in an indirect RNA-mediated manner to promote the splicing of atpf (Prikryl et al., 2008). So far, the evidence suggests that factors required for splicing more than one intron are generally incorporated into one of several alternate multi-protein complexes (Kroeger et al., 2009). Intron-specific factors have not generally been found to be physically associated with such splicing complexes. It is possible that they act in an initial sequence-specific binding step that alters RNA conformation ready for recruitment of the relevant splicing complex, but such ideas await the challenging reconstitution of RNA splicing in vitro before they can be tested. OTHER MECHANISMS INFLUENCING RNA SPLICING EFFICIENCY INDIRECTLY RNA Editing Maturation of organellar mrnas involves many different processes in plant organelles, which include exonucleolytic processing of 5 and 3 termini, RNA splicing, and RNA editing. RNA editing is usually an early step of RNA maturation and required for expression of many plant mitochondrial and chloroplast genes. Thirty-four cytidine to uridine editing sites have been described in Arabidopsis chloroplast transcripts (Chateigner-Boutin and Small, 2007) whereas 441 were found in Arabidopsis mitochondria, 427 in Brassicanapus,and491in Oryza sativa (Giege and Brennicke, 1999; Handa, 2003; Notsu et al., 2002). In addition to their principal effect of changing coding sequences of mrna, RNA editing sites have also been found in introns or near intron exon junctions. The function of RNA editing sites in untranslated regions remains to be elucidated, but a role in intron RNA folding is plausible. Such effects were observed in a chimeric yeast mitochondrial intron containing the domain V of nad1 intron 3 from Oenothera mitochondria. In these experiments, in vitro self-splicing was observed only for the edited and not for the unedited mrna (Borner et al., 1995). In addition, some RNA editing events close to exon intron boundaries are affected by splicing: only unspliced or spliced RNA is edited, depending on the mrna. For example, in the case of cox2 exon 1, suppressing an editing site located in the IBS1 at low temperature reveals an accumulation of unspliced precursors in wheat, suggesting that this editing event is required for high splicing efficiency (Kurihara-Yonemoto and Handa, 2001). On the other hand, some RNA editing sites very close to intron exon junctions are edited only in the spliced mrna, suggesting that the recognition of the editing site occurs only when the precursor is spliced or that the different EBS and IBS interactions are Downloaded from by on July 6, 2010

21 de Longevialle et al. d RNA Splicing in Plant Organelles 11 competing with the editing machinery (Li-Pook-Than and Bonen, 2006). Temperature RNA folding is sensitive to temperature. Interactions within introns or between intron and exon sequences may be different at low or high temperatures, leading to different RNA conformations. Changes in RNA folding will modify the interactions between introns and their associated splicing factors and thus modify splicing efficiency. Such alterations have been observed for ndhb mrna in tobacco (Karcher and Bock, 2002). The processing of ndhb pre mrna is sensitive to heat stress. At 25 or 37 C, the splicing of this intron is normal, but no spliced ndhb is observed at 42 C and an accumulation of the unspliced mrna is observed. In this case, the splicing defect may be explained by an inactivation of the associated splicing factors at high temperatures. Another example of such an event has been described for ycf3 intron 1 in the cl3 mutant (for cytoplasmic line 3) in barley (Landau et al., 2009). Two point mutations in ycf3 intron 1 lead to a decrease in splicing of this intron at 18 C and no splicing was detected when plants were grown at 32 C. In silico folding analysis of the mutant ycf3 intron 1 sequence suggested that the temperature increase to 32 C might lead to the disruption of the RNA secondary structure required for intron splicing. CONTROL OF ORGANELLAR RNA SPLICING BY SPLICING FACTORS: A HYPOTHETICAL MODEL Most of the nuclearly encoded splicing factors that have been identified are required for RNA splicing of their corresponding introns. If splicing were rate-limiting for expression of the organelle proteins encoded by the spliced transcripts, then these splicing factors could be said to regulate organellar gene Downloaded from by on July 6, 2010 Figure 4. Hypothetical Model of Plant Organellar RNA Splicing. (A) A primary transcript is produced that is incapable of self-splicing under physiological conditions. (B) One or more primary-sequence-specific RNA binding factors, such as a PPR protein for example, associates with the selected intron. This initial protein RNA association leads to conformational change stabilizing the RNA in a structure that can be recognized by general splicing factors. In the case of trans-splicing introns, this RNA binding factor could associate with the two parts of the intron, helping in this way the RNA RNA interaction. (C) Association of one of several alternative general splicing complexes enhances the two trans-esterification steps leading to splicing. Two predictions from this hypothetical schema can be made: the first is that there is no requirement that the initial sequence-specific splicing factors targeting the selected intron have any physical association with the general splicing complex. The second is that the binding of the initial RNA binding factor is likely to be the rate-limiting step, making these intron-specific splicing factors good candidates as regulatory factors.

22 12 de Longevialle et al. d RNA Splicing in Plant Organelles expression, as changes in the level of activity of the splicing factor should lead to concomitant changes in the level of spliced transcripts and their translation. It remains unclear whether any such regulation occurs. This question was partially addressed in a study of mitochondrial transcript profiles in wheat during early germination and seedling development (Li-Pook-Than et al., 2004). During early development, RNA splicing was shown to be incomplete for many introns. For example, in the case of nad7 mrna, partially spliced mrna accumulated during the early developmental stages before subsequently disappearing 4 d after germination. Similar observations were made for nad4 mrna, where nad4 intron 1 was inefficiently excised during early development, whilst introns 2 and 3 were fully spliced. In chloroplasts, examination of four genes in several tissues of maize suggests that splicing is part of the regulation of plastid gene expression (Barkan, 1989). While the fraction of spliced transcripts of atpf, petb, petd, and rpl16 is similar in all leaf tissues examined, it is lower in meristematic and root tissue. Given that there is little evidence for gene-specific transcriptional regulation in plant organelles and many assumptions that regulation of gene expression is largely post-transcriptional, intron-specific splicing factors make attractive candidates as potential regulatory factors (see the model presented in Figure 4). It would be useful to carry out a systematic analysis of rates of splicing and expression of splicing factors throughout plant development and correlate the observations with translation rates for organellar proteins. One such analysis has been partially done in rnc1 mutants. Three alleles have been identified in maize for which two are mild rnc1 alleles. While some introns are less affected in the mild rnc1 alleles than with a total loss of function of RNC1, there is a strong effect on trna and trni splicing, indicating that RNC1 is limiting for splicing in these cases and that it could be a regulatory factor (Watkins et al., 2007). CONCLUSIONS AND FUTURE PROSPECTS RNA splicing in plant organelles is considerably more complicated that was first expected, involving a large number of diverse RNA binding factors. A wide range of nuclearly encoded proteins have co-evolved with introns, giving rise to several novel plant-specific RNA binding protein families. Some splicing factors are involved in many intron splicing events. While no data are available concerning the recognition sites of these factors, it could be proposed that these proteins bind to specific sequences that are common to all targeted introns or, more likely, that they recognize secondary structures specific to each intron class. Other splicing factors are specific to only one intron, suggesting a specific RNA recognition site, which may be determined by primary sequence or unique structural motifs. The result is that each intron requires a different set of splicing factors. In theory at least, this provides the necessary flexibility to control expression of any spliced transcript in a gene-specific manner. It remains to be seen whether regulated activity of individual splicing factors is a factor in controlling any aspects of organelle gene expression, but the possibility is there. It will be interesting in the near future to understand how these splicing factors are regulated during plant growth and development, and also to see their responses to imposed environmental stress. From a mechanistic point of view, more splicing factors need to be characterized to catalog the splicing machinery for each intron, with the ultimate goal of examining the splicing mechanism in vitro with a reconstituted splicing complex. FUNDING A.F.L. was supported by a fellowship from the AGRON-OMICS Integrated Project (LSHG-CT ). I.D.S. is supported as a WA State Premier s Fellow. No conflict of interest declared. REFERENCES Andersson, S.G., Karlberg, O., Canback, B., and Kurland, C.G. (2003). On the origin of mitochondria: a genomics perspective. Philos. Trans. R. Soc. Lond. B. Biol. Sci. 358, ; discussion Asakura, Y., and Barkan, A. (2006). Arabidopsis orthologs of maize chloroplast splicing factors promote splicing of orthologous and species-specific group II introns. Plant Physiol. 142, Asakura, Y., and Barkan, A. (2007). A CRM domain protein functions dually in group I and group II intron splicing in land plant chloroplasts. Plant Cell. 19, Asakura, Y., Bayraktar, O.A., and Barkan, A. (2008). Two CRM protein subfamilies cooperate in the splicing of group IIB introns in chloroplasts. RNA. 14, Ayliffe, M.A., Scott, N.S., and Timmis, J.N. (1998). Analysis of plastid DNA-like sequences within the nuclear genomes of higher plants. Mol. Biol. Evol. 15, Barkan, A. (1989). Tissue-dependent plastid RNA splicing in maize: transcripts from four plastid genes are predominantly unspliced in leaf meristems and roots. Plant Cell. 1, Barkan, A., Klipcan, L., Ostersetzer, O., Kawamura, T., Asakura, Y., and Watkins, K.P. (2007). The CRM domain: an RNA binding module derived from an ancient ribosome-associated protein. RNA. 13, Beick, S., Schmitz-Linneweber, C., Williams-Carrier, R., Jensen, B., and Barkan, A. (2008). The pentatricopeptide repeat protein PPR5 stabilizes a specific trna precursor in maize chloroplasts. Mol. Cell Biol. 28, Bertrand, H., Bridge, P., Collins, R.A., Garriga, G., and Lambowitz, A.M. (1982). RNA splicing in Neurospora mitochondria: characterization of new nuclear mutants with defects in splicing the mitochondrial large rrna. Cell. 29, Bonen, L. (2008). Cis- and trans-splicing of group II introns in plant mitochondria. Mitochondrion. 8, Borner, G.V., Morl, M., Wissinger, B., Brennicke, A., and Schmelzer, C. (1995). RNA editing of a group II intron in Oenothera as a prerequisite for splicing. Mol. Gen. Genet. 246, Boudet, N., Aubourg, S., Toffano-Nioche, C., Kreis, M., and Lecharny, A. (2001). Evolution of intron/exon structure of DEAD helicase Downloaded from by on July 6, 2010

23 de Longevialle et al. d RNA Splicing in Plant Organelles 13 family genes in Arabidopsis, Caenorhabditis, and Drosophila. Genome Res. 11, Brangeon, J., et al. (2000). Defective splicing of the first nad4 intron is associated with lack of several complex I subunits in the Nicotiana sylvestris NMS1 nuclear mutant. Plant J. 21, Cai, W., et al. (2009). LPA66 is required for editing psbf chloroplast transcripts in Arabidopsis. Plant Physiol. 150, Carrillo, C., Chapdelaine, Y., and Bonen, L. (2001). Variation in sequence and RNA editing within core domains of mitochondrial group II introns among plants. Mol. Gen. Genet. 264, Chateigner-Boutin, A.L., and Small, I. (2007). A rapid high-throughput method for the detection and quantification of RNA editing based on high-resolution melting of amplicons. Nucleic Acids Res. 35, e114. Chevalier, B.S., and Stoddard, B.L. (2001). Homing endonucleases: structural and functional insight into the catalysts of intron/ intein mobility. Nucleic Acids Res. 29, Cho, Y., Qiu, Y.L., Kuhlman, P., and Palmer, J.D. (1998). Explosive invasion of plant mitochondria by a group I intron. Proc. Natl Acad. Sci. U S A. 95, Cushing, D.A., Forsthoefel, N.R., Gestaut, D.R., and Vernon, D.M. (2005). Arabidopsis emb175 and other ppr knockout mutants reveal essential roles for pentatricopeptide repeat (PPR) proteins in plant embryogenesis. Planta. 221, de Longevialle, A.F., et al. (2007). The pentatricopeptide repeat gene OTP43 is required for trans-splicing of the mitochondrial nad1 Intron 1 in Arabidopsis thaliana. Plant Cell. 19, de Longevialle, A.F., et al. (2008). The pentatricopeptide repeat gene OTP51 with two LAGLIDADG motifs is required for the cissplicing of plastid ycf3 intron 2 in Arabidopsis thaliana. PlantJ. 56, Dutilleul, C., et al. (2003). Leaf mitochondria modulate whole cell redox homeostasis, set antioxidant capacity, and determine stress resistance through altered signaling and diurnal regulation. Plant Cell. 15, Eickbush, T.H. (1999). Mobile introns: retrohoming by complete reverse splicing. Curr. Biol. 9, R11 R14. Ellis, J. (1982). Promiscuous DNA chloroplast genes inside plant mitochondria. Nature. 299, Fedorova, O., Waldsich, C., and Pyle, A.M. (2007). Group II intron folding under near-physiological conditions: collapsing to the near-native state. J. Mol. Biol. 366, Garmier, M., et al. (2008). Complex I dysfunction redirects cellular and mitochondrial metabolism in Arabidopsis. Plant Physiol. 148, Giege, P., and Brennicke, A. (1999). RNA editing in Arabidopsis mitochondria effects 441 C to U changes in ORFs. Proc. Natl Acad. Sci. U S A. 96, Hammani, K., Okuda, K., Tanz, S.K., Chateigner-Boutin, A.L., Shikanai, T., and Small, I. (2009). A study of new Arabidopsis chloroplast RNA editing mutants reveals general features of editing factors and their target sites. Plant Cell. 21, Handa, H. (2003). The complete nucleotide sequence and RNA editing content of the mitochondrial genome of rapeseed (Brassica napus L.): comparative analysis of the mitochondrial genomes of rapeseed and Arabidopsis thaliana. Nucleic Acids Res. 31, Huang, H.R., Rowe, C.E., Mohr, S., Jiang, Y., Lambowitz, A.M., and Perlman, P.S. (2005). The splicing of yeast mitochondrial group I and group II introns requires a DEAD-box protein with RNA chaperone function. Proc. Natl Acad. Sci. U S A. 102, Jenkins, B.D., and Barkan, A. (2001). Recruitment of a peptidyltrna hydrolase as a facilitator of group II intron splicing in chloroplasts. EMBO J. 20, Jenkins, B.D., Kulhanek, D.J., and Barkan, A. (1997). Nuclear mutations that block group II RNA splicing in maize chloroplasts reveal several intron classes with distinct requirements for splicing factors. Plant Cell. 9, Karcher, D., and Bock, R. (2002). Temperature sensitivity of RNA editing and intron splicing reactions in the plastid ndhb transcript. Curr. Genet. 41, Keating, K.S., Toor, N., Perlman, P.S., and Pyle, A.M. (2010). A structural analysis of the group II intron active site and implications for the spliceosome. RNA. 16, 1 9. Keren, I., et al. (2009). AtnMat2, a nuclear-encoded maturase required for splicing of group-ii introns in Arabidopsis mitochondria. RNA. 15, Keren, I., Klipcan, L., Bezawork-Geleta, A., Kolton, M., Shaya, F., and Ostersetzer-Biran, O. (2008). Characterization of the molecular basis of group II intron RNA recognition by CRS1-CRM domains. J. Biol. Chem. 283, Kim, S., and Yoon, M.K. (2010). Comparison of mitochondrial and chloroplast genome segments from three onion (Allium cepa L.) cytoplasm types and identification of a trans-splicing intron of cox2. Curr. Genet. 56, Kim, S.R., et al. (2009).RiceOGR1encodesapentatricopeptide repeat-dyw protein and is essential for RNA editing in mitochondria. Plant J. 59, Kleine, T., Maier, U.G., and Leister, D. (2009). DNA transfer from organelles to the nucleus: the idiosyncratic genetics of endosymbiosis. Annu. Rev. Plant Biol. 60, Kohler, D., Schmidt-Gattung, S., and Binder, S. (2009). The DEADbox protein PMH2 is required for efficient group II intron splicing in mitochondria of Arabidopsis thaliana. Plant Mol. Biol. 72, Kroeger, T.S., Watkins, K.P., Friso, G., van Wijk, K.J., and Barkan, A. (2009). A plant-specific RNA-binding domain revealed through analysis of chloroplast group II intron splicing. Proc. Natl Acad. Sci. U S A. 106, Kruger, K., Grabowski, P.J., Zaug, A.J., Sands, J., Gottschling, D.E., and Cech, T.R. (1982). Self-splicing RNA: autoexcision and autocyclization of the ribosomal RNA intervening sequence of Tetrahymena. Cell. 31, Kurihara-Yonemoto, S., and Handa, H. (2001). Low temperature affects the processing pattern and RNA editing status of the mitochondrial cox2 transcripts in wheat. Curr. Genet. 40, Landau, A.M., Lokstein, H., Scheller, H.V., Lainez, V., Maldonado, S., and Prina, A.R. (2009). A cytoplasmically inherited barley mutant is defective in photosystem I assembly due to a temperaturesensitive defect in ycf3 splicing. Plant Physiol. 151, Downloaded from by on July 6, 2010

24 14 de Longevialle et al. d RNA Splicing in Plant Organelles Li-Pook-Than, J., and Bonen, L. (2006). Multiple physical forms of excised group II intron RNAs in wheat mitochondria. Nucleic Acids Res. 34, Li-Pook-Than, J., Carrillo, C., and Bonen, L. (2004). Variation in mitochondrial transcript profiles of protein-coding genes during early germination and seedling development in wheat. Curr. Genet. 46, Linder, P. (2006). Dead-box proteins: a family affair active and passive players in RNP-remodeling. Nucleic Acids Res. 34, Lurin, C., et al. (2004). Genome-wide analysis of Arabidopsis pentatricopeptide repeat proteins reveals their essential role in organelle biogenesis. Plant Cell. 16, Matthes, A., et al. (2007). Two DEAD-box proteins may be part of RNA-dependent high-molecular-mass protein complexes in Arabidopsis mitochondria. Plant Physiol. 145, Meierhoff, K., Felder, S., Nakamura, T., Bechtold, N., and Schuster, G. (2003). HCF152, an Arabidopsis RNA binding pentatricopeptide repeat protein involved in the processing of chloroplast psbb-psbtpsbh-petb-petd RNAs. Plant Cell. 15, Menninger, J.R. (1976). Peptidyl transfer RNA dissociates during protein synthesis from ribosomes of Escherichia coli. J. Biol. Chem. 251, Meyer, E.H., et al. (2009). Remodeled respiration in ndufs4 with low phosphorylation efficiency suppresses Arabidopsis germination and growth and alters control of metabolism at night. Plant Physiol. 151, Michel, F., Umesono, K., and Ozeki, H. (1989). Comparative and functional anatomy of group II catalytic introns: a review. Gene. 82, Mingam, A., Toffano-Nioche, C., Brunaud, V., Boudet, N., Kreis, M., and Lecharny, A. (2004). DEAD-box RNA helicases in Arabidopsis thaliana: establishing a link between quantitative expression, gene structure and evolution of a family of genes. Plant Biotechnol. J. 2, Mohr, G., and Lambowitz, A.M. (2003). Putative proteins related to group II intron reverse transcriptase/maturases are encoded by nuclear genes in higher plants. Nucleic Acids Res. 31, Nakagawa, N., and Sakurai, N. (2006). A mutation in At-nMat1a, which encodes a nuclear gene having high similarity to group II intron maturase, causes impaired splicing of mitochondrial NAD4 transcript and altered carbon metabolism in Arabidopsis thaliana. Plant Cell Physiol. 47, Nakamura, T., Meierhoff, K., Westhoff, P., and Schuster, G. (2003). RNA-binding properties of HCF152, an Arabidopsis PPR protein involved in the processing of chloroplast RNA. Eur. J. Biochem. 270, Notsu, Y., et al. (2002). The complete sequence of the rice (Oryza sativa L.) mitochondrial genome: frequent DNA sequence acquisition and loss during the evolution of flowering plants. Mol. Genet Genomics. 268, Okuda, K., et al. (2009). Pentatricopeptide repeat proteins with the DYW motif have distinct molecular functions in RNA editing and RNA cleavage in Arabidopsis chloroplasts. Plant Cell. 21, Okuda, K., et al. (2010). The pentatricopeptide repeat protein OTP82 is required for RNA editing of plastid ndhb and ndhg transcripts. Plant J. 61, Ostersetzer, O., Cooke, A.M., Watkins, K.P., and Barkan, A. (2005). CRS1, a chloroplast group II intron splicing factor, promotes intron folding through specific interactions with two intron domains. Plant Cell. 17, Ostheimer, G.J., Hadjivassiliou, H., Kloer, D.P., Barkan, A., and Matthews, B.W. (2005). Structural analysis of the group II intron splicing factor CRS2 yields insights into its protein and RNA interaction surfaces. J. Mol. Biol. 345, Ostheimer, G.J., Rojas, M., Hadjivassiliou, H., and Barkan, A. (2006). Formation of the CRS2 CAF2 group II intron splicing complex is mediated by a 22-amino acid motif in the COOH-terminal region of CAF2. J. Biol. Chem. 281, Ostheimer, G.J., Williams-Carrier, R., Belcher, S., Osborne, E., Gierke, J., and Barkan, A. (2003). Group II intron splicing factors derived by diversification of an ancient RNA-binding domain. EMBO J. 22, Pfalz, J., Bayraktar, O.A., Prikryl, J., and Barkan, A. (2009). Sitespecific binding of a PPR protein defines and stabilizes 5 and 3 mrna termini in chloroplasts. EMBO J. 28, Prikryl, J., Watkins, K.P., Friso, G., van Wijk, K.J., and Barkan, A. (2008). A member of the Whirly family is a multifunctional RNA- and DNA-binding protein that is essential for chloroplast biogenesis. Nucleic Acids Res. 36, Pyle, A.M., Fedorova, O., and Waldsich, C. (2007). Folding of group II introns: a model system for large, multidomain RNAs? Trends Biochem. Sci. 32, Raven, J.A., and Allen, J.F. (2003). Genomics and chloroplast evolution: what did cyanobacteria do for plants? Genome Biol. 4, 209. Robbins, J.C., Heller, W.P., and Hanson, M.R. (2009). A comparative genomics approach identifies a PPR-DYW protein that is essential for C-to-U editing of the Arabidopsis chloroplast accd transcript. RNA. 15, Schmitz-Linneweber, C., and Small, I. (2008). Pentatricopeptide repeat proteins: a socket set for organelle gene expression. Trends Plant Sci. 13, Schmitz-Linneweber, C., Williams-Carrier, R.E., Williams-Voelker, P.M., Kroeger, T.S., Vichas, A., and Barkan, A. (2006). A pentatricopeptide repeat protein facilitates the trans-splicing of the maize chloroplast rps12 pre-mrna. Plant Cell. 18, Small, I.D., and Peeters, N. (2000). The PPR motif: a TPR-related motif prevalent in plant organellar proteins. Trends Biochem. Sci. 25, Solem, A., Zingler, N., and Pyle, A.M. (2006). A DEAD protein that activates intron self-splicing without unwinding RNA. Mol. Cell. 24, Stern, D.B., and Lonsdale, D.M. (1982). Mitochondrial and chloroplast genomes of maize have a 12-kilobase DNA sequence in common. Nature. 299, Takenaka, M. (2010). MEF9, an E-subclass pentatricopeptide repeat protein, is required for an RNA editing event in the nad7 transcript in mitochondria of Arabidopsis. Plant Physiol. 152, Till, B., Schmitz-Linneweber, C., Williams-Carrier, R., and Barkan, A. (2001). CRS1 is a novel group II intron splicing factor that was derived from a domain of ancient origin. RNA. 7, Downloaded from by on July 6, 2010

25 de Longevialle et al. d RNA Splicing in Plant Organelles 15 Toor, N., Hausner, G., and Zimmerly, S. (2001). Coevolution of group II intron RNA structures with their intron-encoded reverse transcriptases. RNA. 7, Tseng, C.C., Sung, T.Y., Li, Y.C., Hsu, S.J., Lin, C.L., and Hsieh, M.H. (2010). Editing of accd and ndhf chloroplast transcripts is partially affected in the Arabidopsis vanilla cream1 mutant. Plant. Mol. Biol. 73, Verbitskiy, D., Zehrmann, A., van der Merwe, J.A., Brennicke, A., and Takenaka, M. (2009). The PPR protein encoded by the LOVASTATIN INSENSITIVE 1 gene is involved in RNA editing at three sites in mitochondria of Arabidopsis thaliana. PlantJ.61, Vogel, J., and Borner, T. (2002). Lariat formation and a hydrolytic pathway in plant chloroplast group II intron splicing. EMBO J. 21, Wank, H., SanFilippo, J., Singh, R.N., Matsuura, M., and Lambowitz, A.M. (1999). A reverse transcriptase/maturase promotes splicing by binding at its own coding segment in a group II intron RNA. Mol. Cell. 4, Watkins, K.P., et al. (2007). A ribonuclease III domain protein functions in group II intron splicing in maize chloroplasts. Plant Cell. 19, Weeden, N.F. (1981). Genetic and biochemical implications of the endosymbiotic origin of the chloroplast. J. Mol. Evol. 17, Williams-Carrier, R., Kroeger, T., and Barkan, A. (2008). Sequencespecific binding of a chloroplast pentatricopeptide repeat protein to its native group II intron ligand. RNA. 14, Yu, Q.B., Jiang, Y., Chong, K., and Yang, Z.N. (2009). AtECB2, a pentatricopeptide repeat protein, is required for chloroplast transcript accd RNA editing and early chloroplast biogenesis in Arabidopsis thaliana. Plant J. 59, Zehrmann, A., Verbitskiy, D., van der Merwe, J.A., Brennicke, A., and Takenaka, M. (2009). A DYW domain-containing pentatricopeptide repeat protein is required for RNA editing at multiple sites in mitochondria of Arabidopsis thaliana. Plant Cell. 21, Zoschke, R., Nakamura, M., Liere, K., Sugiura, M., Borner, T., and Schmitz-Linneweber, C. (2010). An organellar maturase associates with multiple group II introns. Proc. Natl Acad. Sci. U S A. 107, Downloaded from by on July 6, 2010

26 INTRODUCTION I.2 La famille des protéines PPR (Pentatricopeptide Repeat) Le séquençage du génome d Arabidopsis en décembre 2000 a permis de révéler la présence de milliers de gènes jusque là encore insoupçonnés et dont la fonction était inconnue. Parmi ces gènes, une nouvelle famille, la famille des gènes PPR (pour PentatricoPeptide Repeat) a été mise en évidence de façon indépendante par deux équipes françaises (Aubourg, Boudet et al. 2000; Small and Peeters 2000). Deux grands points caractérisent cette famille, tout d abord les deux tiers de ses membres sont prédits localisés soit dans les mitochondries, soit dans les chloroplastes en utilisant le logiciel de prédiction Predotar (Small and Peeters 2000; Small, Peeters et al. 2004) et le deuxième point concerne leur étrange abondance dans le génome d Arabidopsis (Aubourg, Boudet et al. 2000). En effet, cette famille, comportant plus de 450 membres chez Arabidopsis représente près de 2% du génome, ce qui a fait d elle la plus grande famille pour laquelle la fonction n était pas connue. Au moment de leur découverte, peu de données permettaient de leur attribuer un rôle fonctionnel, mais, grâce à la caractérisation de trois protéines de ce type dans d autres espèces, une idée plus précise de leur fonction avait pu être proposée. Ainsi, chez le maïs, le gène CRP1 code pour une protéine PPR impliquée dans la traduction de certains transcrits chloroplastiques (Barkan, Walker et al. 1994) ; la protéine PET309 chez Saccharomyces cerevisiae est également impliquée dans la traduction mais aussi dans la stabilité du transcrit cox1 dans les mitochondries (Manthey and McEwen 1995) ; et le gène cya-5 chez Neurospora crassa code pour une protéine PPR, homologue de PET309 et impliquée également dans la maturation post-transcriptionnelle du transcrit cox1 (Coffin, Dhillon et al. 1997). Ces premières données suggéraient donc une fonction des protéines PPR dans la régulation posttranscriptionnelle des ARN messagers des organites. Mais quelles sont leurs caractéristiques, leurs fonctions et leur distribution dans le monde vivant? I.2.1 Caractéristiques des PPRs I Description des motifs PPRs Les protéines PPR sont caractérisées par la présence d un motif de 35 acides aminés répété en tandem, entre 2 et 26 fois (Lurin, Andres et al. 2004). Ce motif est assez proche du motif TPR (pour tetratricopeptide repeat). Les protéines TPR sont impliquées dans des interactions de type protéine-protéine (Blatch and Lassle 1999; Small and Peeters 2000) et le motif TPR forme une paire d hélices alpha antiparallèles, qui en répétitions, conduisent à la formation d une structure super hélicoïdale englobant un sillon central correspondant au site de fixation à un ligand protéique (Das, Cohen et al. 1998). L analyse bioinformatique prédictive des motifs PPR a également permis de proposer une structure super hélicoïdale (Small and Peeters 2000). Cependant, à la différence des protéines TPR, les chaînes exposées dans le sillon central des protéines PPR seraient dans la majorité des cas hydrophiles et basiques ce qui suggère que ces protéines se lieraient préférentiellement à des cibles chargées négativement comme des acides aminés acides ou des acides nucléiques (Small and Peeters 2000). Des données permettent aujourd hui de confirmer ce type d interactions pour un certain nombre de protéines PPR et plus précisément avec des molécules d ARN. En effet des expériences de RIP-CHIP, de retard sur gel ou «d UV cross linking», ont montré cette interaction entre une protéine PPR et un ARN cible. C est le cas par exemple de PPR4 chez le maïs qui a été montrée par RIP-CHIP comme interagissant avec l intron 1 de rps12 dans les chloroplastes (Schmitz-Linneweber, Williams-Carrier et al. 2006). Cela a été aussi montré 25

27 INTRODUCTION pour HCF152 dont la protéine recombinante se lie avec une haute affinité à la jonction exonintron de petb, permettant sa stabilité et facilitant l épissage de l intron (Nakamura, Meierhoff et al. 2003), mais dont l affinité est diminuée lorsque la protéine est tronquée et ne contient que deux motifs PPR au lieu de 12. C est le cas également de CRP1 chez le maïs, se liant à une région d ARN simple brin de 69 nucléotides dans la région 5 UTR des transcrits psac et peta (Schmitz-Linneweber, Williams-Carrier et al. 2005), de PPR5, se fixant elle aussi préférentiellement sur de l ARN simple brin dans une région de 45 nucléotides dans l intron du trng-ucc (Beick, Schmitz-Linneweber et al. 2008; Williams-Carrier, Kroeger et al. 2008), ou encore plus récemment de PPR10 chez le maïs qui en interagissant en 5 UTR du transcrit d atph et en 3 UTR de psaj protège ces transcrits face à l action d exonucléases (Pfalz, Bayraktar et al. 2009). Il en va également de même pour des protéines PPR impliquées dans l édition. Ainsi CCR4 et CCR21 se lient sur une région de 25 nucléotides en amont et 10 nucléotides en aval des sites d édition sur le transcrit de ndhd (Okuda, Nakamura et al. 2006). L interaction entre des molécules d ARN et des protéines PPR a également été montrée chez d autres espèces. Ainsi chez l homme, LRP130 se lie in vivo à de l ARN mitochondrial mais également à de l ARN nucléaire (Mili and Pinol-Roma 2003). Toutes les protéines PPR caractérisées à ce jour n ont pas été montrées se fixant spécifiquement à leur ARN cible, cependant les nombreux exemples décrits permettent de proposer que ce soit une propriété commune à l ensemble des protéines PPR (Delannoy, Stanley et al. 2007). Cette fixation spécifique à une séquence d ARN leur permettrait ainsi de jouer un rôle majeur dans la régulation post-transcriptionnelle des ARN mitochondriaux et chloroplastiques. En revanche, aucune donnée ne permet aujourd hui de comprendre le mécanisme moléculaire permettant cette interaction spécifique mis à part des études in silico de comparaisons de structure avec les protéines TPR. Un enjeu clef de la compréhension de la famille PPR sera donc de connaître la structure des protéines par cristallographie ainsi que la structure de l interaction afin de comprendre comment cette interaction s établit et pourquoi elle est spécifique de la séquence de l ARN. I Composition de la famille Les protéines PPR, selon les types de motifs qu elles portent, peuvent être classées en deux sous-familles : les PPR de type «Pure» comportant seulement des motifs classiques et les PPR de type «PLS» comportant en plus des motifs classiques, d autres motifs PPR plus courts (S pour Short) ou plus longs (L pour Long) (Figure 1). La sous-famille «Pure» est composée de 251 membres chez Arabidopsis. La sous-famille «PLS» est assez particulière et est elle-même divisée en 4 sous-groupes selon les motifs retrouvés en partie C-terminale. Le premier sous-groupe comprend des protéines PPR de type PLS sans aucun motif C-terminal additionnel (6 membres chez Arabidopsis), le deuxième, des protéines PPR PLS ayant en partie C-terminale un motif E pour «Elongated» (47 membres chez Arabidopsis), le troisième, des protéines PPR PLS avec un motif E plus un motif E+ (60 membres chez Arabidopsis) et enfin le quatrième sous-groupe comprend des protéines PPR PLS avec un motif E, E+ et un domaine dénommé DYW (87 membres chez Arabidopsis). Les motifs E et E+ sont dans l ensemble des motifs plus ou moins dégénérés dont l identification reste difficile, en revanche le domaine DYW est un domaine d environ 100 acides aminés très conservé entre les différents membres de ce sous-groupe. Ce motif est composé entre autre de résidus histidines, cystéines et d un triplet final aspartate (D)-tyrosine (Y) tryptophane (W) quasiment invariants. Ce domaine très conservé pourrait avoir une activité catalytique (Aubourg, Boudet et al. 2000; Lurin, Andres et al. 2004), activité qui a été proposée par homologie de séquence comme étant une cytidine désaminase intervenant dans l édition des ARNm (Salone, Rudinger et al. 2007). 26

28 INTRODUCTION Figure 1 : Composition de la famille des protéines PPR chez Arabidopsis thaliana. La famille est divisée en deux sous-familles, la sous-famille «Pure» (P subfamily) comportant des motifs classiques représentés en orange et la sous-famille PLS (PLS subfamily) caractérisée par des motifs courts (S pour Short) en jaune, des motifs longs (L1 et L2 pour Long) en orange foncé et l addition pour certains cas de motif E en vert clair, de motif E+ en vert foncé, et d un motif DYW en bleu. La présence de motifs additionnels non PPR a également été décrite dans des PPR de type «Pure». Ainsi un domaine RRM (pour RNA Recognition Motif) en N-terminal est présent sur PPR4 (Schmitz-Linneweber, Williams-Carrier et al. 2006) permettant un deuxième type de reconnaissance de l ARN ; deux domaines LAGLIDADG sont décrits en C-terminal de OTP51 (de Longevialle, Hendrickson et al. 2008). Une dizaine de protéines PPR ont en partie C-terminale un domaine SMR apparenté au domaine terminal des protéines bactériennes MutS2 dont la fonction est d inhiber la recombinaison homologue. La fonction de ce domaine chez les PPR n'est pas connue, mais il pourrait intervenir dans des interactions de type protéine-protéine ou porter une fonction d endonucléase avec une reconnaissance de l ADN simple ou double brin (Moreira and Philippe 1999; Malik and Henikoff 2000; Fukui, Kosaka et al. 2007; Diercks, Ab et al. 2008). Enfin, une autre PPR de type «Pure», AT5G10690, comprend un domaine CBS (pour Cystathionine beta-synthase) en partie C-terminale. Contrairement à la présence des motifs E, E+ et DYW très répandus dans la famille, la présence de ces motifs additionnels reste sporadique suggérant une fonction particulière pour ces protéines PPR portant de tels motifs supplémentaires. I Distribution de la famille Les protéines PPR sont présentes chez tous les eucaryotes mais presque totalement absentes du monde des procaryotes sauf dans quelques cas où des protéines PPR sont retrouvées dans certaines bactéries. C est le cas chez Erwinia amylovora où la protéine CFBP1430 YP_ présente 7 motifs PPR identifiés sous TPRpred (http://toolkit.tuebingen.mpg.de/tprpred) et chez Rhodobacter sphaeroides où la protéine ATCC YP_ présente 11 motifs PPR identifiés également sous TPRpred. Rhodobacter est une bactérie photosynthétique qui présente l originalité de posséder deux chromosomes ce qui est rare chez les procaryotes. Erwinia amylovora est un agent pathogène de la famille des Enterobacteriaceae responsable 27

29 INTRODUCTION du feu bactérien qui infecte majoritairement les poiriers, les pommiers, les cognassiers et les néfliers par le biais des fleurs ou de blessures. Dans ce cas particulier, il est possible que cette PPR soit le résultat d un transfert horizontal. La distribution de ces protéines dans le monde des eucaryotes n est cependant pas très homogène. En effet, il est très intéressant de voir que la famille des protéines PPR a connu une très grande expansion dans le monde végétal (Figure 2). Figure 2 : Distribution des protéines PPR dans différentes espèces. Alors que l on comptabilise seulement 7 protéines PPR chez l homme (Lightowlers and Chrzanowska-Lightowlers 2008), 3 protéines PPR chez la levure Saccharomyces ceriviasae et 11 protéines PPR chez l algue Chlamydomonas reinhardtii (Johnson, Wostrikoff et al. 2010), on en compte plus de 450 chez Arabidopsis thaliana et chez le riz Oryza sativa (O'Toole, Hattori et al. 2008; Schmitz-Linneweber and Small 2008). Il est néanmoins possible que ce nombre soit sous estimé chez les espèces autres que les plantes. En effet, les motifs PPR sont assez dégénérés, donc difficiles à détecter, et les matrices de détection ont été générées essentiellement à partir de motifs «végétaux». Cependant, même si leur détection était améliorée, leur nombre resterait certainement largement inférieur à celui des plantes. Comme nous le verrons plus tard dans le chapitre concernant la fonction des protéines PPR, cette expansion chez les plantes pourrait résulter du nombre de gènes restants dans les organites et d une grande complexité de la maturation des ARN dans les organites. Un autre point assez intéressant à noter est que cette expansion des PPR chez les plantes s est également faite avec l apparition de la sous-famille PLS (Figure 2). En effet cette sous-famille n est trouvée que chez les plantes supérieures, tous les autres eucaryotes n ayant que des protéines PPR de type «Pure». Plusieurs hypothèses peuvent être faites sur l apparition de la sous-famille de type 28

30 INTRODUCTION PLS, mais la plus probable serait que cette expansion serait liée à la présence d un événement particulier et très répandu chez les plantes terrestres qu est l édition des ARN. En effet, Véronique Salone, au cours de sa thèse a montré, par une analyse phylogénétique, une corrélation stricte entre la présence de séquences codants pour le motif DYW dans les génomes et l existence du phénomène d édition dans les organites (Salone, Rudinger et al. 2007). Par ailleurs, une comparaison de la famille des protéines PPR d Arabidopsis thaliana, d Oryza sativa et de Physcomitrella patens a permis de montrer qu il existe une corrélation entre l expansion de la sous-famille des protéines PPR de type PLS et celle du processus d édition chez les plantes terrestres (O'Toole, Hattori et al. 2008). Enfin, l homologie du motif DYW avec une cytidine désaminase permet de proposer que ces protéines soient impliquées dans l édition des ARNm (Salone, Rudinger et al. 2007). I Données de localisation subcellulaire Les logiciels de prédiction de localisation subcellulaire proposent une localisation pour la plupart des protéines PPR. Ainsi une grande majorité des PPR est prédite dans les mitochondries et certaines autres dans les chloroplastes. Des données de protéomique permettent de confirmer une partie de ces données de prédiction, mais, du fait de leur faible expression, d une demi-vie courte des ARN (Narsai, Howell et al. 2007) et d une faible abondance des protéines PPR, cette confirmation ne peut pas être faite pour une grande majorité d entres elles. Néanmoins, parmi les 450 protéines PPR, près d un quart n ont pas de claire prédiction de localisation dans les organites. Ainsi, selon les cas, des localisations en dehors des organites sont proposées ou bien il existe une trop grande contradiction entre les différents logiciels de prédiction. Pour évaluer l existence de protéines PPR localisées en dehors des organites, une étude systématique de la localisation subcellulaire de 167 protéines PPR sans prédiction précise a été entreprise par le laboratoire de Claire Lurin. Ces expériences de localisation sont sur le point d être terminées par Laure Heurtevin et permettent dès maintenant de montrer que la grande majorité des protéines PPR sans prédiction claire sont malgré tout localisées dans les organites. Cependant, parmi les protéines testées, de façon très intéressante, 17 protéines PPR se trouvent doublement adressées dans les chloroplastes et les mitochondries et 8 autres ont une localisation cytoplasmique ou nucléaire. Cette analyse étant faite en utilisant des protéines de fusion entre les 100 premiers acides aminés des PPR et la DsRedII, la localisation reste à être confirmée en utilisant des fusions avec les protéines entières. I.2.2 Rôle des protéines PPR Depuis la découverte de la famille il y a dix ans, de nombreuses protéines PPR ont été étudiées et caractérisées, permettant de démontrer leur implication majeure dans divers phénomènes de régulation transcriptionnelle et post-transcriptionnelle dans les organites. Les tableaux 1, 2 et 3 listent les différentes PPR caractérisées à ce jour, et décrivent leur fonction lorsque celle-ci a été identifiée. 29

31 INTRODUCTION Tableau 1 : Protéines PPR chloroplastiques chez les plantes supérieures décrites dans la littérature à la date du 25 juin

32 INTRODUCTION Tableau 2 : Protéines PPR mitochondriales chez les plantes supérieures décrites dans la littérature à la date du 25 juin Tableau 3 : Protéines PPR décrites dans la littérature à la date du 25 juin 2010 chez les organismes autres que les plantes supérieures. 31

33 INTRODUCTION I Les protéines PPR dans l initiation de la transcription La première étape de la régulation de l expression des gènes s effectue au niveau de la transcription des gènes. Dans les plastes et les mitochondries, plusieurs protéines sont impliquées dans ce mécanisme, que ce soit des ARN polymérases ou des protéines permettant la reconnaissance de l initiation de la transcription par ces polymérases comme par exemple les facteurs sigmas reconnaissant des sites d initiation spécifiques dans le génome chloroplastique (Kanamaru and Tanaka 2004). Dans cette première étape, certaines protéines PPR ont également un rôle primordial. La première PPR à avoir été montrée comme étant active dans la transcription est P63. En effet cette protéine PPR de type «Pure», identifiée lors d une extraction de protéines se liant spécifiquement à l ADN mitochondrial, possède une forte affinité pour l ADN et plus particulièrement pour la région promotrice du gène cox2 (Ikeda and Gray 1999). Dans les chloroplastes, la transcription s effectue via deux types de complexes de polymérases. Le premier, la NEP, est constitué de protéines codées par le génome nucléaire et le deuxième, la PEP, contient des protéines codées par le génome chloroplastique. Ces deux types de polymérases n interviennent pas toujours dans la transcription des mêmes gènes et il existe donc des gènes transcrits spécifiquement par la NEP : les gènes accd, rpob et rpoc et des gènes transcrits spécifiquement par la PEP comme une grande partie des gènes codant des protéines impliquées dans la photosynthèse, ainsi que des gènes transcrits par les deux mais avec des sites d initiation de la transcription différents. Ainsi, l activité de la polymérase PEP est essentielle dans la transcription des gènes de la photosynthèse et celle de la NEP dans les gènes dits «housekeeping» pour les fonctions basales (Hajdukiewicz, Allison et al. 1997; Liere and Maliga 1999). Plusieurs facteurs influencent et régulent étroitement ces deux activités, ainsi certaines protéines PPR ont un rôle majeur dans la transcription et font partie intégrante de ces complexes. C est le cas de PTAC2 (pour Platidial Transcriptional Active Complex), une protéine PPR de type «Pure» qui fait partie également des protéines PPR possédant des motifs supplémentaires car elle comporte un motif SMR dont la fonction reste à déterminer. Cette PPR a été montrée associée à la PEP et le mutant ptac2, dont le phénotype macroscopique est très affecté, présente un défaut majeur dans la transcription des gènes dépendant de la polymérase de type PEP (Pfalz, Liere et al. 2006). On ne connaît malheureusement pas comment cette protéine régule cette activité transcriptionnelle, et quel est son rôle exact dans le complexe actif transcriptionnel. La protéine PPR DG1 (pour Delayed Greening 1) est aussi impliquée dans l activité transcriptionnelle chloroplastique (Chi, Ma et al. 2008). Cette protéine contrairement à PTAC2 n est pas associée au complexe actif de transcription. En revanche l activité de la PEP est fortement affectée chez le mutant. La protéine PPR GRP23 impliquée dans le développement précoce de l embryon, interagit avec la sous-unité III de l ARN polymérase de type II, mais non pas dans les organites comme la majorité des PPR mais dans le noyau (Ding, Liu et al. 2006). Il est possible que cette interaction permette une régulation de l expression de gènes nucléaires via la PPR. Cependant un autre rôle au niveau des organites n est pas à exclure car cette PPR a également été localisée dans les mitochondries au sein du laboratoire de Claire Lurin. Chez les mammifères, il a été montré un lien direct entre les ARN polymérases mitochondriales et les protéines PPR, car des motifs PPR sont retrouvés directement dans celles-ci (Shadel 2004). Chez la levure, des protéines PPR associées à l ARN polymérase mitochondriale se lient aux chaînes d ARN néosynthétisées afin de les stabiliser (Shadel 2004). Ces différents exemples montrent qu il existe un lien direct entre l ARN polymérase, la transcription et les protéines PPR. Néanmoins, le type d interaction moléculaire avec les 32

34 INTRODUCTION acides nucléiques (PPR-ARN ou PPR-ADN) n est pas toujours très clair. Les PPR pourraient jouer un rôle directement en aval de la transcription en stabilisant les ARN néosynthétisés et/ou en permettant leur maturation de façon couplée à la transcription. I Les protéines PPR dans la maturation des ARNm Une fois le transcrit immature synthétisé, un certain nombre d étapes de maturation sont nécessaires avant la phase traductionnelle ou une phase de régulation conduisant à la dégradation des ARN synthétisés. Dans les organites ces étapes sont hautement régulées de façon spécifique à chaque transcrit; ceci implique un grand nombre de protéines parmi lesquelles de nombreuses protéines PPR. I Maturation en 5 et 3 des ARNm Par leurs origines, la majorité des gènes des organites sont transcrits sous des formes polycistroniques. De ce fait, l expression de chaque gène nécessite différentes étapes de clivages sur chaque transcrit. Ces clivages en 5 et 3 de chaque transcrit nécessitent l intervention d enzymes de type RNase ayant des activités exoribonucléase ou endoribonucléase. L action spécifique de ces RNase dans la reconnaissance ou dans leur arrêt nécessite soit des protéines de type «RNA binding» soit une structure secondaire spécifique de l ARN. Parmi les protéines reconnaissants des séquences spécifiques de l ARN, les protéines PPR sont de très bon candidats et, à ce jour, un certains nombre de protéines PPR ont été identifiées dans ce type de maturation. CRR2 (pour chlororespiratory reduction) est la première PPR identifiée dans les chloroplastes ayant un rôle dans la maturation des ARN (Hashimoto, Endo et al. 2003). Cette PPR de type DYW est impliquée dans le clivage du transcrit polycistronique rps7-ndhb. Une autre PPR du même type, AT2G02980, mais localisée dans les mitochondries a également été montrée comme ayant une activité endoribonucléase in vitro (Nakamura and Sugita 2008) mais aucune cible n a été déterminée. Récemment une autre PPR, RPF2 appartenant à une sous-famille particulière des PPR qui sera décrite ultérieurement, les Rf-like, a été montrée impliquée dans le clivage en 5 des transcrits de nad9 et cox3 (Jonietz, Forner et al. 2010). Enfin, toujours chez Arabidopsis, deux autres PPR de type «Pure», PGR3 (pour Proton Gradient Regulation) et HCF152 (pour High Chlorophyll Fluorescence), sont impliquées dans la maturation des transcrits polycistroniques petl-petg-psaj et psbt-psbh-petb-petd, respectivement (Meierhoff, Felder et al. 2003; Yamazaki, Tasaka et al. 2004), avec également un rôle dans l épissage de l intron de petb pour HCF152. Dans d autres espèces, des protéines PPR ont également été caractérisées comme ayant un rôle dans la maturation des transcrits. Chez la souris, PTC2, est impliquée dans le clivage du transcrit polycistronique nd5-cytb (Xu, Ackerley et al. 2008). Chez Physcomitrella patens PPR531.11, renommée PpPPR_38 est impliquée dans la maturation de clpp (Hattori, Miyake et al. 2007) et permet le clivage entre clpp et rps12 en se liant directement sur cette région (Hattori and Sugita 2009). De façon intéressante cette protéine se lie également sur une région chevauchant l exon1 et l intron1 de clpp facilitant ainsi l épissage de celui-ci, donnant à cette protéine une double fonction dans la maturation de ce transcrit. Chez la levure Saccharomyces cerevisiae, le mutant Aep3p présente un défaut de clivage de l ARN polycistronique atp8-atp6 (Ellis, Helfenbein et al. 2004), mais il vient également d être montré que cette protéine aurait un rôle dans l initiation de la traduction en se liant avec mif2, un initiateur de la traduction dans les mitochondries (Lee, Tibbetts et al. 2009). 33

35 INTRODUCTION I L édition des ARNm Une autre étape de la maturation des ARNm dans les organites est l édition. L édition est une modification de la séquence nucléotidique mature de l ARNm ; dans les organites des plantes supérieures, elle consiste généralement en une substitution d un nucléotide Cytidine en Uridine. Ce changement, en modifiant la séquence de l ARNm, peut avoir plusieurs impacts sur la synthèse de la protéine finale. Par exemple, l édition peut conduire à la création d un codon d initiation de la traduction comme dans le cas du site ndhd-1 par le changement de ACG en AUG. L édition a aussi un impact sur la fonctionnalité de la protéine en changeant un acide aminé par un autre via l édition de l ARN. Mais il existe également certains sites d édition qui n ont aucun impact sur la séquence en acides aminés, mais dont on pense qu ils auraient un rôle dans la structure secondaire de l ARN et permetteraient ou non la maturation correcte de celui-ci. Ainsi, l édition d ARNm pourrait influencer l efficacité de l épissage lorsque le site d édition se situe à proximité de la jonction exon-intron ou au sein même de l intron. 34 sites d édition ont été décrits dans les ARN chloroplastiques (Tillich, Funk et al. 2005; Chateigner-Boutin and Small 2007) et 526 dans les ARN mitochondriaux chez Arabidopsis (Giege and Brennicke 1999; Bentolila, Chateigner-Boutin et al. 2005; de Longevialle, Meyer et al. 2007; Bentolila, Elliott et al. 2008; Zehrmann, van der Merwe et al. 2008). Le mécanisme moléculaire de l édition dans les organites des plantes supérieures n est toujours pas réellement connu, en revanche, de plus en plus de protéines sont identifiées comme étant strictement nécessaires à l édition de certains sites d édition. De façon très intéressante, ces protéines sont exclusivement des protéines PPR, et de façon encore plus remarquable, toutes celles décrites jusqu'à ce jour sont des protéines PPR de la sous-famille PLS et plus particulièrement des protéines PPR de type E, E+ ou DYW. Dans les chloroplastes, à ce jour, 16 protéines PPR, représentées dans la figure 3, ont été caractérisées comme permettant l édition de 21 sites d édition sur les 34 totaux. CRR4 est la première protéine PPR de type E identifiée dans l édition, elle est nécessaire à l édition du site ndhd-1, créant ainsi un site d initiation de la traduction (Kotera, Tasaka et al. 2005). CRR21, une protéine PPR de type E+ est impliquée dans l édition du site ndhd-2 (Okuda, Myouga et al. 2007). OTP80, une protéine de type E est nécessaire à l édition du site rpl23 (Hammani, Okuda et al. 2009). Enfin CLB19, PPR de type E+, est impliquée dans l édition des deux sites rpoa et clpp, dont les défauts d édition observés chez le mutant créent un problème dans la transcription par la PEP polymérase (Chateigner-Boutin, Ramos-Vega et al. 2008). Douze protéines de type DYW ont également été décrites nécessaires dans l édition d un ou plusieurs sites chloroplastiques. C est le cas de YS1 impliquée dans l édition de rpob-1 (Zhou, Cheng et al. 2008), et de FLV impliquée dans l édition du site rpoc1 (Anne-Laure Chateigner-Boutin et al., résultats non publiés). LPA66 est impliquée dans l édition du site psbf (Cai, Ji et al. 2009). OTP85 et OTP86 sont nécessaires pour l édition respective des sites ndhd et rps14 (Hammani, Okuda et al. 2009). Et OTP81 permet l édition du site dans l intron de rps12, ce dernier n ayant visiblement aucun impact sur l efficacité de l épissage (Hammani, Okuda et al. 2009). Dans le cas de l édition du site accd-1 (accd C794), deux protéines PPR de type DYW ont été décrites nécessaires chez Arabidopsis, RARE1 (Robbins, Heller et al. 2009) et ECB2 (Yu, Jiang et al. 2009). Cependant, une caractérisation récente de la protéine nommée VAC1 codée par le même gène que ECB2 a mis en évidence un résultat différent de celui publié précédemment (Tseng, Sung et al. 2010). Ainsi, il a été montré que le mutant vac1 présente 34

36 INTRODUCTION une diminution de l édition du site accd-1, et non une absence de l édition, mais en revanche également une forte diminution du site en 3 UTR d accd et du site sur ndhf. Figure 3 : Schématisation des protéines PPR impliquées dans l édition des différents sites dans les chloroplastes chez Arabidopsis. Les quatre dernières PPR-DYW décrites sont impliquées dans l édition de plusieurs sites. Ainsi, CRR22 permet l édition des sites ndhb-7, ndhd-5 et rpob-3 (Okuda, Chateigner- Boutin et al. 2009). L édition des sites ndhb-2 et ndhd-3 est sous le contrôle de CRR28 (Okuda, Chateigner-Boutin et al. 2009). OTP82 est impliquée dans l édition des sites ndhb-7 (C-95644) et ndhg (Okuda, Hammani et al. 2010). Et les sites psbz, ndhb-10 et ndhf nécessitent OTP84 (Hammani, Okuda et al. 2009). Ainsi, au total, cinq protéines PPR (de type E+ ou DYW) sont nécessaires à l édition de plusieurs sites dans les chloroplastes. Une analyse de la séquence aux alentours de chaque site a permis d identifier des séquences consensus potentielles de reconnaissance pour 4 de ces protéines PPR. En revanche, ce type d analyse n a pas permis de proposer une séquence consensus de fixation pour CRR22 (Hammani, Okuda et al. 2009). 35

37 INTRODUCTION Dans les mitochondries, seulement 4 protéines PPR de type DYW et 4 autres de type E et E+ ont été identifiées dans l édition, et donc la quasi totalité des sites d édition mitochondriaux n a aucun facteur d édition connu. Cependant, il est fort probable que d ici peu, la majorité d entre eux sera caractérisée. Dans le riz, OGR1 est essentielle pour l édition de 7 sites d édition répartis sur 5 transcrits différents nad4-c401, nad4-c416, nad4-c433, nad2-c1457, ccmc-c458, cox2-c167, cox3-c572 (Kim, Yang et al. 2009). MEF1 (pour mitochondrial RNA Editing Factor) est impliquée dans l édition de rps4-c956, nad7-c963, nad2-c1160 (Zehrmann, Verbitskiy et al. 2009). MEF11 ou LOI1 (pour LOvastatin Insensitive) est nécessaire pour l édition de 3 sites, cox3-c422, nad4-c124 and ccb203-c344 (Verbitskiy, Zehrmann et al. 2010). Et MEF22, la dernière protéine DYW, est impliquée dans l édition du site nad3-c149 (Takenaka, Verbitskiy et al. 2010). En ce qui concerne les protéines PPR de type E et E+, SLO1 (pour SLOW GROWTH1), une protéine PPR de type E+, est impliquée dans l édition des deux sites nad4-449 and nad9-328 pour lesquels une séquence consensus est détectable en 5 du site (Sung, Tseng et al. 2010). Et les protéines MEF18, MEF19, MEF20, et MEF21 sont impliquées dans les sites respectifs : nad4-c1355 ; ccb206-c566 ; rps4-c226 et cox3-c257 (Takenaka, Verbitskiy et al. 2010). Chez la mousse Physcomitrella patens, la proteine PpPPR_71, une protéine PPR de type DYW, est impliquée dans l édition de ccmf-1 (Tasaki, Hattori et al. 2010). I L épissage des ARNm Comme il a déjà été discuté dans la première partie de l introduction, l épissage des ARNm dans les organites fait partie des étapes de maturation indispensables à la maturation correcte de l ARN avant la traduction. Certaines PPR sont nécessaires à ce mécanisme. Les protéines PPR impliquées dans l épissage dans les organites chez Arabidopsis sont décrites dans l article 1 présenté dans l introduction. Certaines protéines PPR non décrites dans la revue, car identifiées chez d autres organismes que les plantes supérieures, sont également impliquées dans l épissage des introns dans les organites. Ainsi la protéine Pet309 est nécessaire pour l accumulation de la forme non épissée de cox1 chez la levure, mais son rôle direct dans l épissage reste cependant à être prouvé (Manthey and McEwen 1995) et CCM1 (pour COB and COX1 mrna Maturation) est impliquée dans l épissage de l intron 4 de cob et de l intron 4 de cox1, tous deux décrits comme des introns de group I (Moreno, Buie et al. 2009). Chez la mousse Physcomitrella patens, la protéine PPR ou PpPPR_38 est impliquée dans l épissage de l ARNm de clpp dans les chloroplastes en se fixant sur la région exon1-intron1 de l ARN pré-messager de clpp (Hattori, Miyake et al. 2007; Hattori and Sugita 2009), cependant cette protéine n est pas essentielle pour l épissage car des formes épissées de clpp sont toujours détectables chez le mutant. I Les PPRs dans la stabilisation des ARNm et la traduction Certaines protéines PPR permettent le clivage en 5 ou en 3 des ARNm, mais il existe aussi des protéines PPR dont la fonction essentielle est de protéger les transcrits face à des dégradations de type exonucléase et des clivages en jouant un rôle protecteur et de stabilisation de l ARNm mature. Chez le maïs, PPR10 stabilise deux transcrits chloroplastiques en se fixant sur deux séquences similaires (Pfalz, Bayraktar et al. 2009). Cette interaction en 5 UTR du transcrit d atph et en 3 UTR de psaj permet ainsi la protection des transcrits face à l action des 5-3 ou 3-5 exoribonucleases et augmente donc ainsi la durée de vie de ces transcrits et permet également de montrer qu une protection protéique est nécessaire pour les transcrits n ayant pas de structure de type boucle en 3 UTR. Plus récemment, chez Chlamydomonas et 36

38 INTRODUCTION Arabidopsis, il a été montré que MRL1, une protéine PPR de type «Pure» se trouvant dans un complexe de haut poids moléculaire, est nécessaire à la stabilisation et la maturation du transcrit rbcl en se fixant certainement dans la région en 5 UTR (Johnson, Wostrikoff et al. 2010). De la même manière, MCA1 permet la stabilisation du transcrit peta en se fixant sur les premiers 25 nucléotides de la région 5 UTR et permet sa protection contre des 5-3 RNases (Loiselay, Gumpel et al. 2008). Chez la drosophile, la protéine PPR BSF (pour Bicoïd mrna Stability Factor) stabiliserait le transcrit bicoïd codant pour une protéine importante dans le développement embryonnaire en se fixant sur la région 3 UTR du transcrit (Mancebo, Zhou et al. 2001). Cependant, l homologue humain de cette protéine, LRP130 est localisé dans les mitochondries, alors que le transcrit bicoïd se situe dans le cytosol, cette différence de compartimentation remet partiellement en cause cette interaction. La protéine PPR LRP130 est également importante dans la stabilité des ARNm. Des mutations dans le gène codant pour cette protéine conduisent à une maladie neurodégénèrative : la LSFC (pour Leigh Syndrome French Canadian), une déficience de la cytochrome c oxydase chez l homme (Mootha, Lepage et al. 2003). Chez les patients atteints de cette maladie, les transcrits cox1 et cox3 sont très réduits suggérant un rôle de LRP130 dans la stabilisation des transcrits cox1 et cox3 (Xu, Morin et al. 2004). La stabilisation des ARN matures permet d augmenter leur durée de vie et ainsi influence leur taux de traduction. Cette dernière étape implique également d autres facteurs, notamment dans la reconnaissance des sites d initiation de la traduction, mais aussi dans la biogénèse des sous-unités ribosomales, et, là encore, des protéines PPR ont été montrées essentielles dans ces procédés dans les organites. La protéine CRP1 chez le maïs est nécessaire pour la traduction des transcrits peta et petd en se liant dans la région 5 UTR de chaque transcrit (Barkan, Walker et al. 1994; Schmitz- Linneweber, Williams-Carrier et al. 2005) et agit ainsi comme régulateur de la traduction de ces deux transcrits. Le mutant ppr2 chez le maïs présente une absence de ribosomes chloroplastiques suggérant que la protéine PPR2 est nécessaire dans l assemblage de la machinerie traductionnelle (Williams and Barkan 2003). Une autre PPR, PPR336, identifiée chez Arabidopsis, serait certainement impliquée dans la traduction au niveau mitochondrial du fait de son association avec les polysomes (Uyttewaal, Mireau et al. 2008). Chez l homme, PTCD3 (pour pentatricopeptide repeat domain protein) s associe directement avec la petite sous-unité ribosomale mitochondriale (ARNr 12S) et régule ainsi directement l activité traductionnelle de façon positive (Davies, Rackham et al. 2009). En revanche, PTCD1, une autre protéine PPR chez l homme, a un rôle de régulation négative sur l abondance de l ARN de transfert Leucine et par ce fait a donc un rôle indirect sur la traduction, avec un effet négatif sur son activité (Rackham, Davies et al. 2009). Dans ce même type de régulation de la traduction, il a été montré récemment chez la levure Saccharomyces cerevisiae que la protéine PPR DMR1 s associe avec la sous-unité ribosomale ARNr 15S et serait impliquée dans la biogénèse des ribosomes mitochondriaux et ainsi dans la traduction (Puchta, Lubas et al. 2010). Chez la levure, la protéine AEP3p est nécessaire dans la maturation du transcrit polycistronique atp8-atp6 (Ellis, Helfenbein et al. 2004), mais pourrait également avoir un rôle dans l initiation de la traduction en se liant avec mif2, un initiateur de la traduction dans les mitochondries (Lee, Tibbetts et al. 2009). Enfin, la protéine PPR, PET309, en plus de son rôle dans la stabilité de l ARN cox1, est également impliquée dans la traduction de ce transcrit en se fixant dans la région non traduite 5 UTR (Manthey and McEwen 1995) et a été montrée par double hybride comme interagissant avec Nam1p, une protéine importante dans le métabolisme des ARN mitochondriaux qui permet le transfert des ARN vers leur site de traduction au niveau de la membrane interne (Naithani, Saracco et al. 37

39 INTRODUCTION 2003). Plus récemment, des délétions des différents motifs PPR composant cette protéine ont permis de montrer que tous les motifs PPR sont importants pour la traduction du transcrit cox1, en revanche, la délétion de ces motifs n a pas d impact sur la stabilité du transcrit (Tavares-Carreon, Camacho-Villasana et al. 2008), montrant ainsi l importance de cette PPR dans la traduction et visiblement moins dans la stabilisation. I Les protéines PPR impliquées dans la restauration de la fertilité mâle cytoplasmique (CMS) La stérilité mâle cytoplasmique (CMS) est un phénomène par lequel une plante hermaphrodite n est plus capable de produire des gamètes mâles fertiles empêchant ainsi son autofécondation. Le terme cytoplasmique évoque le fait que le phénotype est provoqué par un facteur porté par le génome mitochondrial. Ce phénomène de grand intérêt agronomique est dû à l expression d un gène mitochondrial «toxique», nommé généralement ORF-CMS. Dans la nature, ce processus favorise les croisements entre individus afin d augmenter la diversité génétique. En agronomie, ce processus a deux intérêts majeurs : faciliter la production de descendance hybride chez des plantes naturellement autogames et bénéficier ainsi du phénomène de vigueur hybride ou hétérosis, et, grâce aux gènes restaurateurs, produire des hétérozygotes fertiles. En effet, sans gène de restauration, la stérilité mâle cytoplasmique est transmise à la descendance. Très souvent, c'est une production de graines qui est recherchée pour la plante hybride et il est nécessaire de restaurer la fertilité dans l hybride. C'est le parent mâle de l'hybride qui aura cette fonction en apportant dans son génome nucléaire le gène de restauration de fertilité. De façon intéressante, hormis le cas d une aldéhyde déshydrogénase codée par le gene Rf2 du maïs (Cui, Wise et al. 1996), tous les gènes restaurateurs de fertilité découverts à ce jour codent pour des protéines PPR. Ces protéines PPR appartiennent en très grande majorité à la sous-famille «Pure» et, étrangement, font partie d une petite sous-famille de PPR qui a évolué très rapidement. Par exemple, ces deux sous-familles sont très différentes chez le riz et chez Arabidopsis, les gènes d Arabidopsis n ayant pas d orthologues chez le riz (O'Toole, Hattori et al. 2008). Rf-PPR592, restaurateur de fertilité de type PPR, a été isolé chez le pétunia (Bentolila, Alfonso et al. 2002). Chez cette espèce, la stérilité male cytoplasmique est conférée par l expression d un gène PCF qui est présent au sein d un transcrit polycistronique comprenant atp9, cox2 et cette orf de fonction inconnue. En présence de la protéine PPR592 fonctionnelle, l expression du transcrit pcf est fortement affectée ainsi que l expression de la protéine résultante apportant ainsi une restauration de la fertilité. Ainsi la protéine PPR592, faisant partie d un large complexe protéique, aurait une action sur la maturation posttranscriptionnelle de ce transcrit avec un effet de régulation négative sur l expression du gène PCF en s associant directement au transcrit (Gillman, Bentolila et al. 2007). Chez le riz, la CMS est induite par l expression de l ORF79 codant pour un peptide cytotoxique et dont le gène se situe en aval du gène atp6 dans les mitochondries. Lors de la CMS, un seul transcrit de 2 kb comprenant atp6 et l orf79 est observé alors que deux transcrits sont normalement formés en présence du restaurateur de fertilité (Kazama and Toriyama 2003). En réalité deux gènes PPR sont capables de restaurer la fertilité chez le riz, Rf1a and Rf1b (Wang, Zou et al. 2006). Le premier, Rf1a code pour une protéine PPR impliquée dans le clivage du transcrit de 2 kb mais aussi dans l édition d atp6 et le deuxième, Rf1b ou Ifr1 code pour une PPR impliquée dans la dégradation du transcrit dicistronique atp6- orf79. En effet il a été montré récemment que la protéine codée par le gène Ifr1 permettrait de réduire la quantité de transcrit atp6-orf79 mais n affecterait en aucun cas le clivage de ce 38

40 INTRODUCTION transcrit, montrant ainsi que les deux restaurateurs de fertilité chez le riz induisent deux effets différents sur les transcrits selon leur site de fixation (Ohta, Ogino et al. 2010). Chez le radis, le locus Rfo comprenant 3 gènes PPR (PPR-A, PPR-B/ Rfk1 et PPR-C) réduisent l expression des ORF mitochondriales 138 et 125 responsables de la stérilité mâle cytoplasmique (Brown, Formanova et al. 2003; Desloire, Gherbi et al. 2003; Koizuka, Imai et al. 2003). Parmi les 3 gènes du locus Rfo, il a été montré que seul le gène PPR-B était le restaurateur de fertilité en s associant in vivo à l orf138 (Uyttewaal, Arnal et al. 2008). Ainsi la protéine PPR-B agirait directement sur la régulation de la traduction du transcrit de l orf138. Le restaurateur de fertilité chez le sorgho (Sorghum bicolor) est également une protéine PPR, cependant le mécanisme d action de cette restauration n est pas claire pour le moment car le gène responsable de la stérilité n a toujours pas été identifié (Klein, Klein et al. 2005). Les protéines PPR impliquées dans la restauration de la fertilité n ont pas un rôle réellement diffèrent des autres PPR car le mécanisme moléculaire réside dans la maturation des transcrits et/ou dans la régulation de la traduction. Cependant, la présence de la protéine PPR restauratrice de fertilité a un effet négatif sur l expression de l Orf-cms (au niveau transcriptionnel, post-transcriptionnel ou traductionnel) au contraire de l effet plus classiquement positif des protéines PPR sur l expression des transcrits chloroplastiques et mitochondriaux. Il est également intéressant de noter qu il est difficile de trouver des orthologues pour ces protéines PPR entre différentes espèces. Ceci peut s expliquer par la mise en place de différents mécanismes pour la stérilité male cytoplasmique. Cette diversité des mécanismes a ainsi forcé l évolution spécifique de ces protéines PPR, créant ainsi une plus ou moins grande divergence. Ces protéines devenant donc uniques. 39

41 INTRODUCTION PRESENTATION DU SUJET DE THESE : Depuis la découverte de la famille des protéines PPR, il a été montré que ces protéines ont un rôle majeur dans la régulation transcriptionnelle, post-transcriptionnelle et traductionnelle du génome des organites. Parmi les différents processus, l épissage des ARNm comprenant des introns est un évènement essentiel de maturation. Le génome chloroplastique d Arabidopsis est composé de 20 introns de groupe II et d un intron de groupe I et le génome mitochondrial est composé de 23 introns de groupe II. Ces introns ne peuvent pas s autoépisser et nécessitent donc un certain nombre de facteurs facilitant la mise en place d une structure secondaire adéquate pour les deux étapes de trans-éstérification caractérisant ce processus. Avant de commencer ma thèse, peu de facteurs intervenant dans cette maturation des ARNm avaient été identifiés, mais parmi les quelques caractérisés, deux protéines PPR avait été identifiées dans ce phénomène. Ainsi PPR4, strictement nécessaire pour l épissage en trans de l intron 1 de rps12, fut la première protéine PPR décrite dans l épissage en trans (Schmitz-Linneweber, Williams-Carrier et al. 2006) et HCF152, la première PPR identifiée dans l épissage en stabilisant et en permettant l épissage de l intron de petb (Meierhoff, Felder et al. 2003). Cette découverte, le nombre important d introns décrits dans les génomes des organites, ainsi que la capacité des protéines PPR à interagir avec les ARN, suggéraient que ces deux protéines PPR n étaient certainement pas des cas isolés et que d autres protéines PPR pouvaient avoir un rôle majeur dans le processus de l épissage. Dans le but de connaître et de comprendre le fonctionnement des protéines PPR dans les différentes étapes de la maturation des ARNm, il était donc important de trouver d autres protéines PPR impliquées dans le processus d épissage. C est dans ce cadre que mon sujet de thèse a été élaboré. C est au cours du projet AGRIKOLA, dans lequel j étais responsable des étapes de clonage, que j ai eu l opportunité de commencer la caractérisation de certains mutants pour des protéines PPR d intérêt au sein du laboratoire de Ian Small et de Claire Lurin à l URGV. Ce projet Européen consistait à utiliser le système «ARNi» afin de créer une collection de mutants knock-down pour tous les gènes d Arabidopsis (Hilson, Small et al. 2003). La famille PPR était une famille cible intéressante pour ce projet car, d une part, un certain nombre de gènes codant pour des PPR ne présentent pas de mutant d insertion ADN-T dans les différentes collections disponibles et, d autre part, s il existe des mutants d insertion, une grande partie d entre-eux est décrite comme embryo-letaux empêchant toute caractérisation fonctionnelle de ces protéines par une approche classique de génétique inverse. Le projet AGRIKOLA pouvait donc permettre d obtenir par la méthode de «ARNi» des mutants dans lesquels l expression des gènes PPR serait dérégulée mais pas totalement afin d obtenir des plantes suffisamment viables pour leur étude. C est dans ce cadre que j ai commencé une analyse systématique des mutants «ARNi» pour les 48 PPRs sélectionnées dans le laboratoire. Mon analyse s est alors plus particulièrement focalisée sur une protéine PPR, OTP43, dont les mutants «ARNi» présentaient des retards importants de développement. Afin de valider la corrélation entre l extinction du gène OTP43 et le phénotype, j ai étudié le mutant d insertion ADN-T associé et commencé la caractérisation de celui-ci. Par la suite, l élaboration de différents outils permettant de cribler des mutants pour des défauts d épissage m a permis de caractériser un certain nombre de protéines PPR plus ou moins essentielles dans le processus d épissage, créant ainsi une carte plus complète des facteurs d épissage chloroplastiques et mitochondriaux. Plus récemment, j ai mené deux nouvelles approches dans le but de mieux comprendre la régulation de la fonction des protéines PPR. Ainsi en 3 ieme partie de mon manuscrit, je présente une étude de l épissage alternatif des transcrits PPR et de l impact éventuel des différentes isoformes sur la fonction des protéines. Enfin, des données très récentes d interactions protéine-protéine pour les protéines PPR sont présentées et permettent de proposer de nouvelles hypothèses sur le fonctionnement des protéines PPR impliquées notamment dans l édition des ARN. 40

42 RESULTATS CHAPITRE II : RESULTATS II.1 Identification de protéines PPR impliquées dans l épissage des ARNm dans les chloroplastes. Le génome chloroplastique d Arabidopsis est composé de 20 introns de groupe II et d un intron de groupe I (cf Introduction). Ces introns, comme il a été décrit dans la revue présentée dans l introduction, nécessitent l intervention de différents facteurs pour leur épissage. Au début de ma thèse, une grande partie de ces facteurs avait déjà été identifiée dans le laboratoire d Alice Barkan, mais, néanmoins,, les facteurs nécessaires à l épissage de certains introns n avaient pas encore été identifiés. Parmi les protéines impliquées dans l épissage, une majorité fait partie d une famille contenant des motifs CRM, mais on retrouve également d autres protéines provenant d autres familles de protéines comme des protéines PPR. Seulement deux protéines PPR avaient été identifiées comme jouant un rôle dans l épissage des introns dans le chloroplaste au début de ma thèse. PPR4, impliquée dans l épissage en trans de l intron 1 de rps12 et HCF152, impliquée dans la stabilisation et l épissage de l intron de petb. Ces deux protéines PPR permettent de démontrer que les protéines PPR, parmi les nombreuses fonctions dans la modification post-transcriptionnelle, sont impliquées dans le phénomène d épissage. Environ un quart des PPRs (soit environ une centaine de protéines) sont adressées dans les chloroplastes. En dehors des fonctions dans l édition ou le processing en 5 et 3, il est fort probable que certaines d entre-elles soient impliquées dans l épissage des introns dans les organites. II.1.1 OTP51 Un des candidats les plus probables était OTP51. Cette «Pure» PPR a une caractéristique bien particulière. En effet, en plus de ses 7 motifs PPR de type «Pure», deux autres motifs de type «LAGLIDADG» sont décrits par Pfam (PF00961) en C-terminal. Cette PPR n est pas la seule à présenter des motifs supplémentaires aux motifs PPRs. En revanche, OTP51 est la seule protéine PPR, mais aussi la seule protéine décrite chez Arabidopsis, à avoir des motifs de type «LAGLIDADG». Ces motifs sont majoritairement trouvés chez d autres espèces dans des endonucléases codées par des introns de group I. Grace à leur activité endonucléase, ces protéines coupent une séquence d ADN double brin spécifique dans les gènes ne contenant pas ce type d intron, permettant l invasion de cet intron codant dans le génome. Mais certaines protéines LAGLIDADG ont aussi acquis une fonction de maturase, permettant l épissage de l intron, d autres encore ont perdu l activité endonucléase mais conservé l activité de maturase. C est le cas certainement d OTP51, comme nous le verrons dans l article suivant, qui a perdu les acides aminés essentiels pour l activité endonucléase, mais a en revanche conservé les acides aminés essentiels pour la fonction de maturase. Le fait qu OTP51 soit prédite dans les chloroplastes et que la fonction de maturase soit conservée laissent à penser que cette PPR pourrait être fortement impliquée dans l épissage d introns chloroplastiques. L article suivant montre la caractérisation de cette protéine et de son rôle primordial dans l épissage de l intron 2 de ycf3, un des introns chloroplastiques pour lesquels aucun facteur d épissage n avait été identifié jusqu à présent. Article 2 : de Longevialle A.F., Hendrickson L., Taylor N.L., Delannoy E., Lurin C., Badger M., Millar A.H. and Small I.D. (2008) The pentatricopeptide repeat gene OTP51 with two LAGLIDADG motifs is required for the cis-splicing of plastid ycf3 intron 2 in Arabidopsis thaliana. The Plant Journal, 56:

43 The Plant Journal (2008) 56, doi: /j X x The pentatricopeptide repeat gene OTP51 with two LAGLIDADG motifs is required for the cis-splicing of plastid ycf3 intron 2 in Arabidopsis thaliana Andéol Falcon de Longevialle 1,2, Luke Hendrickson 3, Nicolas L. Taylor 1, Etienne Delannoy 1, Claire Lurin 2, Murray Badger 3, A. Harvey Millar 1 and Ian Small 1,2,* 1 Australian Research Council Centre of Excellence in Plant Energy Biology, University of Western Australia, Crawley 6009 WA, Australia, 2 Unité Mixte de Recherche en Génomique Végétale (Institut National de la Recherche Agronomique/Centre National de la Recherche Scientifique/Université d Evry Val d Essonne), Evry, France, and 3 Australian Research Council Centre of Excellence in Plant Energy Biology, Australian National University, Canberra, Canberra 0200 ACT, Australia Received 27 March 2008; revised 19 May 2008; accepted 22 May 2008; published online 29 July * For correspondence (fax ; Summary The Arabidopsis thaliana chloroplast contains 20 group-ii introns in its genome, and seven known splicing factors are required for the splicing of overlapping subsets of 19 of them. We describe an additional protein (OTP51) that specifically promotes the splicing of the only group-ii intron for which no splicing factor has been described previously. This protein is a pentatricopeptide repeat (PPR) protein containing two LAGLIDADG motifs found in group-i intron maturases in other organisms. Amino acids thought to be important for the homing endonuclease activity of other LAGLIDADG proteins are missing in this protein, but the amino acids described to be important for maturase activity are conserved. OTP51 is absolutely required for the splicing of ycf3 intron 2, and also influences the splicing of several other group-iia introns. Loss of OTP51 has far-reaching consequences for photosystem-i and photosystem-ii assembly, and for the photosynthetic fluorescence characteristics of mutant plants. Keywords: PPR protein, RNA splicing, chloroplast, LAGLIDADG motif. Introduction Many plant chloroplast and mitochondrial genes contain introns of the group-ii family (Bonen, 2008; Bonen and Vogel, 2001). Group-II introns, characterized by their secondary structure divided into six domains, can self-splice in vitro in some cases (although this has never been demonstrated for any of the plant organelle introns), but require protein splicing factors in vivo. Some organelle group-ii introns from a wide range of organisms encode the maturases required for splicing. Similar genes are found in the fourth intron of nad1 in Arabidopsis mitochondria (matr), and in the intron of trnk in plastids (matk), although their role in splicing remains to be demonstrated. Similar genes are found in the Arabidopsis nuclear genome, and at least one encodes a protein involved in mitochondrial intron splicing (Nakagawa and Sakurai, 2006). Some group-i introns also code for maturases: notably proteins containing the so-called LAGLIDADG motif encoded by introns in green algae and a wide variety of other eukaryote organelles, prokaryotes and archaea (Lucas et al., 2001). These proteins often have a dual function as a sequence-specific DNA endonuclease, and as an RNA splicing factor. LAGLIDADG proteins can act in intron homing to render the introns that encode them able to invade genomes that lack the intron (Chevalier and Stoddard, 2001). Many RNA binding proteins have acquired roles in RNA splicing, and indeed a variety of often unrelated RNA binding proteins have essential roles in splicing in most plastid introns in plants (Asakura and Barkan, 2007; Ostersetzer et al., 2005; Ostheimer et al., 2003, 2005, 2006; Till et al., 2001; Watkins et al., 2007), with varying degrees of specificity to different ª 2008 The Authors 157 Journal compilation ª 2008 Blackwell Publishing Ltd

44 158 Andéol Falcon de Longevialle et al. introns. The largest family of RNA binding proteins in plant organelles is the pentatricopeptide repeat (PPR) family (Andrés et al., 2007; Lurin et al., 2004; Saha et al., 2007; Small and Peeters, 2000). PPR proteins are involved in many post-transcriptional processes in both chloroplasts and mitochondria. Two of them have been described to be absolutely and specifically required for the trans-splicing of particular introns: rps12 intron 1 in plastids (Schmitz- Linneweber et al., 2006) and nad1 intron 1 (de Longevialle et al., 2007) in mitochondria. In this study, we describe a novel plant organelle splicing factor from Arabidopsis that contains two potential RNA-binding domains, namely an array of PPR motifs and a tandem pair of LAGLIDADG domains. This factor is required for the optimal splicing of several plastid introns, including most notably, ycf3 intron 2. Further characterization of mutants show that loss of this factor, and concomitantly the splicing event, has far-reaching consequences for the assembly of photosystem I (PSI) and PSII. Results A gene encoding a protein with both PPR and LAGLIDADG motifs Among the 451 PPR genes in Arabidopsis thaliana, many have additional motifs or domains. The commonest are the C-terminal E and DYW domains, which are probably linked to RNA editing (Lurin et al., 2004; Okuda et al., 2007; Salone et al., 2007), but other RNA-binding or DNA-binding domains, such as RRM domains (Schmitz-Linneweber et al., 2006) or SMR domains (Koussevitzky et al., 2007), are also found. Liu et al. (2005) reported 21 different domains linked to PPR motifs, and although closer examination suggests most of these links result from gene fusion errors during annotation, one of the linked domains merited further verification. The gene model for At2g15820 contains PPR motifs and two C-terminal LAGLIDADG motifs. This is the only predicted protein in all three Arabidopsis genomes to contain LAGLIDADG motifs. Comparison with putative orthologs from other plants suggests that the current At2g15820 gene model is wrong, and by 5 RACE we could demonstrate that the mrna is longer than previously thought, and includes two exons (see Figure S1). We have named this gene ORGANELLE TRANSCRIPT PROCESSING 51 (OTP51), after the molecular phenotype of the mutants (see below). Figure 1a shows an alignment of the predicted A. thaliana OTP51 protein with putative orthologs from grape (Vitis vinifera), poplar (Populus trichocarpa) and rice (Oryza sativa). The least conserved part of the sequence is the N-terminal extremity, predicted by Predotar (Small et al., 2004) and TargetP (Emanuelsson et al., 2000) to be a plastid targeting sequence. OTP51 comprises seven PPR motifs in equivalent positions in each sequence. Although the sequences of the PPR motifs are not particularly similar between species, three other domains are highly conserved. Two domains with unknown function and no similarity with other known proteins surround the first PPR motif, and two LAGLIDADG domains are found towards the C terminus. The alignment of the two LAGL- IDADG motifs (Figure 1b) of OTP51 with other LAGLIDADG endonuclease proteins encoded by group-i introns shows a high conservation of these motifs. The glycine in position 3 in the LAGLIDADG motif has been shown to be essential for the maturase activity of the protein encoded by intron bi2 in Saccharomyces cerevisiae (Szczepanek et al., 2000). None of the OTP51 LAGLIDADG motifs have the aspartate residue in position 8 of the motif (Figure 1b). The two acidic residues in the motif have been shown to bind a catalytic metal ion required for the endonuclease activity (Chevalier et al., 2001). The substitutions of these two residues by alanine in the bifunctional protein I-AniI in Aspergillus nidulans completely inhibit the DNA cleavage activity, without affecting RNA splicing (Chatterjee et al., 2003). The lack of conservation of critical catalytic residues and the conservation of amino acids important for the maturase activity in the LAGLIDADG domains of OTP51 (Figure 1b) suggest that it lacks the DNA endonuclease activity, but could conserve a maturase function. otp51 mutants are chlorophyll deficient To evaluate a putative role in the splicing of OTP51, we obtained and analyzed two independent T-DNA insertion lines. The position of the insertions were confirmed by PCR and sequencing. The Salk_ line (otp51-1) has the insertion of the T-DNA in the first exon of the gene (position in chromosome 2), and the Sail_713D08 line (otp51-2) has the T-DNA inserted in the second exon (position in chromosome 2) (Figure 2a). Both mutants show identical phenotypes (Figure 2b). Seedlings are pale straw yellow; rosettes are pale yellow in normal light and pale green for young leaves in low light conditions. Plants that are homozygous for either of these alleles die on soil, but can be rescued by in vitro culture (with sucrose) under low light. The plants are much smaller than the wild-type plants and develop more slowly. Mutant otp51 plants are depleted in protein (60 80% of wild-type levels) primarily because of a lack of chloroplasts and thylakoid membranes (26 48% of wild-type levels) (Table 1). The chlorophyll content of the mutant is extremely low at 11 12% of the wild-type levels on a fresh weight basis, and the chlorophyll a/b ratios are higher than that of wild-type plants (Table 1). ª 2008 The Authors Journal compilation ª 2008 Blackwell Publishing Ltd, The Plant Journal, (2008), 56,

45 Splicing of ycf3 intron 2 requires OTP Figure 1. The predicted OTP51 Protein. (a) Multiple sequence alignment of Arabidopsis thaliana OTP51 (AtOTP51) with its Poplar trichocarpa, Vitis vinifera and rice orthologs (PtOPT51, VvOTP51 and OsOTP51, respectively). The domain organization of OTP51 is shown diagrammatically at top. Identical residues are shaded in black, and similar residues are set in bold. The gray bars beneath the alignment mark the pentatricopeptide repeat (PPR) domains, and the black diagonally striped bars mark the two LAGLIDADG domains. VvOTP51 corresponds to CAO and OsOTP51 corresponds to Os02g The transient peptide cleavage sites predicted by TARGETP (Emanuelsson et al., 2000) are after amino acids 94 and 56 for AtOTP51, and OsOTP51 respectively. (b) Multiple sequence alignment of the two LAGLIDADG domains from AtOTP51, PtOPT51, VvOTP51, and OsOTP51 with LAGLIDADG domains from Trebouxia aggregata chloroplast homing endonuclease (AAL77574), Trichosarcina mucosa chloroplast homing endonuclease (AAG61151), Nephroselmis olivacea mitochondrial homing endonuclease (YP_665643) and Saccharomyces cerevisiae homing endonuclease I-SceI chain A (1R7M_A). The black diagonally striped bars mark the two LAGLIDADG domains. Residues known to be important for maturase or DNA endonuclease activity are boxed. (a) (b) otp51 shows splicing defects in chloroplast mrnas As virtually all of the PPR proteins characterized so far are involved in RNA processing within organelles, we employed a quantitative RT-PCR screen to gain a general overview of plastid transcripts in the mutant plants (Figure 3). A striking decrease in the accumulation of ycf3 transcripts was observed. The ycf3 gene is annotated to consist of two exons in Arabidopsis (Sato et al., 1999), whereas three exons are described in other plant species. Cross-species comparisons and verification by RT-PCR demonstrate that the Arabidopsis ycf3 gene is mis-annotated, and that two cis-splicing events are necessary for the complete maturation of the ycf3 transcript (see Figure S2). Given the association of LAGLIDADG motifs with intron maturases, we verified if the failure to amplify spliced ycf3 transcript resulted from a defect in the splicing of one or both of the two ycf3 introns. Total RNA blots from wild-type and mutant plants were probed with sequences specific to ycf3 exon 3 and ycf3 intron 2 (Figure 4). An RNA of approximately 900 nucleotides is detected specifically with the exon probe, and not with the intron probe, and corresponds to the expected size ª 2008 The Authors Journal compilation ª 2008 Blackwell Publishing Ltd, The Plant Journal, (2008), 56,

46 160 Andéol Falcon de Longevialle et al. (a) (b) spliced to unspliced introns in otp51 mutants compared with wild-type plants (Figure 5a). In both otp51 mutants we were unable to detect spliced ycf3 mrna lacking intron 2, whereas the first intron of ycf3 was correctly and efficiently spliced (see Figure S3a). In addition to this absolute splicing defect, both mutants also present an eightfold decrease in splicing of the atpf intron. These results were confirmed by poisoned primer extension (see Figure S3). Other mrna transcripts are largely unaffected in otp51, apart from the twofold increases in rrn23, matk and accd transcripts, and a decrease in spliced atpf mrna (Figure 3). Decreased splicing of trna introns Figure 2. Mutant alleles of otp51. (a) Positions of the two T-DNA insertions in the otp51 gene. Salk_ was named otp51-1 and Sail_713D08 was named otp51-2. (b) Phenotype of an otp51 mutant seedling at the cotyledon stage (left) and otp51 mutants at the 8 10-leaf stage grown in low light conditions. Table 1 Total protein, total chlorophyll contents and chlorophyll a/b ratios, and relative protein levels (as a percentage of wild-type levels) for hydroponic cultured wild-type (Col-0) and the otp51 mutant lines of Arabidopsis thaliana Col-0 otp51-2 otp51-1 Total protein, mg g ) a ab b fresh weight (FW) Thylakoid membrane a b b protein, mg g )1 FW Chlorophyll (a + b), a 49 3 b b mg g )1 FW Chlorophyll a/b a b a,b Relative protein levels, as a % of wild type PsaD a 6 1 b n.d. Lhca n.d. n.d. PsbA n.d. n.d. AtpB a 74 5 b 74 6 b Porin a a a RbcL a 78 3 b 77 4 b Each value is the mean SE of three or four replicate plants. The superscript letters indicate a significant difference based on a oneway ANOVA and Tukey s Honestly Significantly Different test (P < 0.05). of the mature ycf3 mrna. This RNA species is undetectable in the mutant plants, whereas the longer precursor RNAs are present in the usual quantities. The major RNA in both the wild type and the mutant is a 1.6-kb RNA, which from its size, contains unspliced intron 2, but from which intron 1 has been spliced out. This transcript pattern closely resembles that for the ycf3 transcripts reported previously (Asakura and Barkan, 2007). We designed primers to detect each splicing event by qrt-pcr and to compare the change in ratios of In A. thaliana, five trna precursors contain group-ii introns, and trnl has a group-i intron. The quantitative RT-PCR assay is not well-adapted to measuring the splicing of trna precursors, because of the rapid cleavage of the precursors, and because of the strong secondary structure and base modifications in mature trnas that make reverse transcription unreliable. Therefore, to determine whether the splicing of trna precursors is affected in otp51, we carried out an RNA gel blot hybridization assay using oligonucleotide probes specific for each trna. We found a large decrease in the correctly processed forms of trna Val and trna Lys, coupled with increases in the unprocessed precursor (Figure 5b). Unprocessed precursors from trnl, trng, trni and trna also accumulated (Figure 5b), but without any obvious affect on the quantity of mature trnas. The accumulation of trnk, trna and trni precursors is consistent with the qrt-pcr results for matk and rrn23, as they are part of the same precursor transcripts. Unconventional domain V, but a conventional splicing mechanism In group-ii introns, domain V is the most conserved sequence. This domain is composed of 34 nucleotides, and is usually highly conserved in sequence and secondary structure. The domain V of ycf3 intron 2 is highly conserved between plant species, but differs a little from the classical group-ii intron domain V (see Figure S4a) in having two nucleotides more than the 34 usually seen. To see if this difference has an impact on the splicing mechanism, we performed RT-PCR assays to detect lariat formation or other forms of excised introns in the wild type and in both otp51 mutants. Reverse transcription with a specific primer designed to bind to ycf3 intron 2, followed by amplification with carefully chosen primers (Figure S4b), revealed the presence of the lariat, as well as the correct junction formation in wild-type plants. Splicing of ycf3 intron 2 has been previously shown to follow a classical lariat pathway in barley (Vogel and Börner, 2002). Twenty of the numerous clones obtained were sequenced with ª 2008 The Authors Journal compilation ª 2008 Blackwell Publishing Ltd, The Plant Journal, (2008), 56,

47 Splicing of ycf3 intron 2 requires OTP Figure 3. Levels of plastid transcripts in otp51 mutants. All mrna and rrna transcripts were measured from both alleles of otp51 and wild-type plants. The graph depicts the log2 ratio of transcript levels in the mutants compared with levels in the wild-type plantsau: Is the edited text OK: compared with levels in the wild-type plants. Fully spliced ycf3 transcripts are undetectable in otp51 mutants. A strong decrease (between three- and fourfold) in atpf transcripts was also observed. All other transcripts showed minor or insignificant changes. identical results. The same experiment in both otp51 mutants failed to reveal any correctly formed lariats (Figure S4c). Loss of PSI and PSII The Ycf3 protein is essential for the assembly of PSI, and appears to act as a chaperone that interacts directly and specifically with at least two of the PSI subunits, PsaA and PsaD, during assembly of the PSI complex (Naver et al., 2001). As no mature ycf3 mrna is detected, it is probable that no Ycf3 protein is produced in the mutant plants. Bluenative (BN)/SDS-PAGE on thylakoid extracts revealed a typical pattern of PSI, PSII and ATP synthase membrane complexes in wild-type samples (Figure 6a; Kügler et al., 1997), but failed to detect any subunits of the photosytem-i complex or assembled PSII in mutant samples (Figure 6a). We observed the presence of assembled ATP synthase and LHCB subunits in a low molecular weight complex, and in the mutant samples, but with both at decreased abundance compared with wild-type. These results were verified by western blot analysis (Figure 6b; Table 1). RbcL and AtpB proteins were limited to approximately 75% of wild-type levels on a fresh-weight basis, but there was a dramatic reduction in PSI and PSII core complex proteins, and their peripheral light-harvesting complex proteins (LHCA and LHCB, respectively), to the extent that the majority of proteins evaluated were either at significantly less than 20% of the wild-type levels or were undetectable (Figure 6b; Table 1). In contrast, the wild-type and otp51 samples had approximately equal levels of the mitochondrial marker protein, porin, on a fresh-weight basis, indicating that mitochondrial abundance is unaffected in otp51. The maximal intrinsic quantum efficiency of PSII from dark-acclimated plate-grown seedlings was significantly ª 2008 The Authors Journal compilation ª 2008 Blackwell Publishing Ltd, The Plant Journal, (2008), 56,

48 162 Andéol Falcon de Longevialle et al. suggests that the loss of PSI is more significant than the loss of PSII in these mutants. The relative ratios of LHCII : PSII and LHCI : PSI emission peaks indicates a functional disconnection of light harvesting proteins from their respective core reaction centers. These data clearly indicate that the distribution of excitation energy to each of the photosystems, and/or their relative abundance within the thylakoid membranes, as well as PSI organization and function, are greatly affected in the otp51 mutant. Discussion OTP51 encodes a PPR protein with two LAGLIDADG motifs Figure 4. RNA gel blots showing a ycf3 intron 2 splicing defect in otp51 mutants. Total leaf RNA (10 lg) was probed with exon 3- or intron 2-specific probes. The spliced (S) and unspliced (U) transcripts for each gel are indicated on the right. The two blots used were stained with methylene blue, and are shown below to illustrate the loading of RNAs in each samples. No spliced ycf3 transcripts are seen in either otp51 allele, and neither is a moderate accumulation of unspliced ycf3 transcripts observedau: Is the edited text OK:, and neither is a moderate accumulation of unspliced ycf3 transcripts observed?. lower in the otp51 mutant (F v /F m = ) compared with the wild type (F v /F m = ). After illumination at growth light intensity for 5 10 min, the fluorescence signal was maximal, leading to undetectable PSII quantum efficiencies in the otp51 mutant lines, compared with wild type (FPSII = ). Wild-type leaves of hydroponic-cultured plants exhibited low temperature (77 K) chlorophyll fluorescence emission spectra typical for higher plants, consisting of four main emission peaks at 683, 699, 723 and 737 nm (Figure 7a,b). These peaks were assigned to the PSII core complex subunits CP43 and CP47 (at 685 and 695 nm, respectively), the PSI core complex (at 720 nm) and LHCI (at 740 nm) (Govindjee, 1995). Consistent with our western blot data, the otp51 mutants exhibited a drastically reduced PSI emission peak at F720 nm compared with wild-type Arabidopsis (Figure 7a; Figure 7b). The emission peak (F685 nm) commonly associated with CP43 of the PSII complex was also reduced. The new emergent peak at 680 nm can be ascribed to fluorescence from the LHCII complex, which is not detectable in wild type because of the efficient energy transfer to PSII (Govindjee, 1995). Despite the significant loss of the CP43 fluorescence peak, the CP47 peak (F695 nm) remains detectable as a shoulder at nm in the otp51 mutant lines (Figure 7a,b). This LAGLIDADG homing endonucleases are encoded by mobile genetic elements, and catalyze DNA cleavage at specific sites lacking the endonuclease coding region (Chevalier and Stoddard, 2001). Most of the LAGLIDADG proteins described so far are DNA endonucleases, but some of them have acquired a dual function, acting both as homing endonucleases and as RNA-splicing maturases. The best-known of these is I-AniI from A. nidulans. This protein promotes the splicing of the mitochondrial cob intron in vitro by facilitating the folding of this intron (Ho and Waring, 1999; Solem et al., 2002). Amino acid substitutions that affect endonuclease activity often have little effect on the splicing of the cob intron, and vice versa, suggesting that the DNA and RNA recognition sites are different (Bolduc et al., 2003; Chatterjee et al., 2003). Recently it has been shown that this protein preferentially stabilizes one conformation of the intron relative to another, in order to facilitate the formation of the RNA protein complex (Caprara et al., 2007). Other LAGLI- DADG endonucleases have been described to have lost their DNA endonuclease activity and have conserved only the maturase activity. The best known of these is the bi3 maturase that facilitates the splicing of the mitochondrial cob intron 3 in S. cerevisiae (Lazowska et al., 1989; Bassi et al., 2002). One of the reasons for the loss of the endonuclease activity is the substitution of the acidic residue in position 8 of the LAGLIDADG motif by a lysine (Longo et al., 2005). Whereas the bi3 maturase has lost its original function, crystallographic analysis has shown that the global architecture of this protein is unchanged from its DNAbinding homologs (Longo et al., 2005). The loss of amino acids important for the endonuclease activity strongly suggests that OTP51 is unable to cleave DNA. On the other hand, the high conservation of the two LAGLIDADG domains, including amino acids known to be important for maturase activity, suggests that these domains have a role in splicing. Presumably, OTP51 is derived from the transfer of an organelle maturase gene to the nucleus, followed by fusion to a nuclear PPR gene. This occurred a long time ago, as two similar PPR-LAGLIDADG proteins are encoded in the Physcomitrella genome ª 2008 The Authors Journal compilation ª 2008 Blackwell Publishing Ltd, The Plant Journal, (2008), 56,

49 Splicing of ycf3 intron 2 requires OTP (a) (b) Figure 5. Splicing defects in otp51 mutants. (a) Change in ratios of spliced to unspliced introns in otp51 mutants compared with wild-type plants by quantitative RT-PCR. A strong decrease of the ratio in spliced/ unspliced mutants for ycf3 intron 2 is observed for the two mutants, as well a decrease in the ratio for the atpf intron. The others splicing events are not affected in both mutants. (b) RNA gel blot hybridizations showing trnk, trnl, trnv, trng, clpp, trni and trna transcripts. Leaf RNA (10 lg) was analyzed in each lane: lane 1 corresponds to the wild type, lane 2 corresponds to otp51-2 and lane 3 corresponds to otp51-1. The spliced (S) and unspliced (U) transcripts for each gel are indicated on the left. The two blots used were stained with methylene blue, and are shown below to illustrate the RNAs in each samples. A decrease of spliced trnas as well as an accumulation of unspliced trnas are observed in both otp51 alleles for trnk and trnv. One of the blots was also probed with clpp as a control, as splicing of this transcript had already been shown to be unaffected (by quantitative RT-PCR). (O Toole et al., 2008). The most closely related organellar LAGLIDADG domains are found in the rrnl intron (a group-i intron) of certain green algae (Lucas et al., 2001; Pombert et al., 2006). Whether the change in specificity (from promoting group-i intron splicing to promoting group-ii intron splicing) occurred before or after the transfer to the nucleus cannot be ascertained from the current data. OTP51 is required for the splicing of ycf3 intron 2 Previously, six other nucleus-encoded proteins have been identified to be required for RNA splicing in land plant chloroplasts. The complexes CAF2/CRS2 and CRS2/CAF2 are required for the splicing of overlapping subsets of nine group-ii introns out of the 17 in maize (Ostheimer et al., 2003, 2005, 2006), RNC1 is required for the splicing of 10 introns (Watkins et al., 2007), CRS1 is required for the splicing of atpf (Till et al., 2001) and PPR4 is required for the trans-splicing of rps12 intron 1 (Schmitz-Linneweber et al., 2006). From the 17 group-ii introns in maize, 15 have at least one splicing factor identified. Of the two remaining, the rpl2 intron showed a strong RNC1-dependent enrichment in RIP-chip assays, although this protein is not required for the optimal splicing of this intron (Watkins et al., 2007). None of the mutants for any of the six previously known splicing factors show a decrease in splicing of ycf3 intron 2. Identification of orthologous splicing factors in Arabidopsis for CRS1, CAF1 and CAF2 demonstrates that these factors are involved in the splicing of the same chloroplast introns as their maize counterparts, and that two of the three additional introns found in Arabidopsis require the CAF1 ª 2008 The Authors Journal compilation ª 2008 Blackwell Publishing Ltd, The Plant Journal, (2008), 56,

50 164 Andéol Falcon de Longevialle et al. (a) (b) Figure 6. Loss of photosystem I and photosystem II in otp51. (a) Two-dimensional blue native/sds-page of thylakoid proteins from Col-0 wild-type plants (left) and otp51-1 mutants (right). The gels are stained with Coomassie blue. The apparent molecular mass of the subunits is shown in kda. Spots that have been identified by mass spectrometry are described in Figure S5 and Table S2. PsbB (AtCg00680), PsbC (AtCg00280) and PsbD (AtCg00270) are subunits of photosystem II, and none are visible in the gel of otp51-1 proteins. PsaA (AtCg00350), PsaB (AtCg00340), PsaL (At4g12800), PsaF (At1g31330), PsaD1 (At4g02770) and PsaD2 (At1g03130) are subunits of photosystem I, and none are visible in the gel of otp51-1 proteins. RbcL (AtCg00490) is the large subunit of Rubisco, and has been identified in both wild-type and otp51-1 plants. AtpA (AtCg00120) and AtpB (AtCg00480), identified in both wild-type and otp51-1, are both subunits of the ATP synthase complex. LHCB4 (At5g01530), LHCB5 (At4g10340) and LHCB1 (At1g29910) are subunits of the photosystem-ii light harvesting complex, and have been identified both in the wild-type and in the otp51-1 plants. LHCA3 (At1g61520) and LHCA4 (At3g47470) are subunits of the photosystem-i light harvesting complex, and are only observed in the wild type. (b) Western blots comparing wild-type (left lanes) and the otp51 mutant lines otp51-1 and otp51-2 (right lanes) immunochemically detected with antisera for chloroplast thylakoid membrane proteins (PsaD, Lhca1, AtpB and PsbA), the soluble stromal protein RbcL and a mitochondrial protein (porin). Each lane was loaded on an equal fresh-weight basis. ortholog for splicing (Asakura and Barkan, 2006). Recently, CFM2, a protein with four CRM domains, has been identified in Arabidopsis to be a required splicing factor for the third additional intron, clpp intron 2, as well as for ndha, ycf3 intron 1 and trnl (Asakura and Barkan, 2007). Orthologs for RNC1 and PPR4 are also present in Arabidopsis, and are likely to have the same roles as the maize proteins (Schmitz- Linneweber et al., 2006; Watkins et al., 2007). This would leave only ycf3 intron 2 lacking a previously identified splicing factor. OTP51, described in this study, is absolutely required for the splicing of ycf3 intron 2: in the two mutant alleles, the correctly spliced ycf3 exon 1 exon 2 is totally absent. In addition to this primary effect, OTP51 is also involved in other splicing events, as the otp51 mutants show a strong decrease in the splicing of atpf, trnv and trnk transcripts. We were unable to find a feature common to these four introns that might explain this pattern of specificity. There is no obvious conserved sequence that might represent an OTP51 binding site in the four introns, for example. CRS1 is required for the splicing of atpf (Till et al., 2001), and is found together with the atpf intron RNA in a complex of 700 kda in size (Ostheimer et al., 2003; Till et al., 2001). It is possible that OTP51 is also part of this complex, although we cannot rule out that the effect on atpf splicing is an indirect, secondary effect. Loss of PSI and PSII The PSI of higher plants contains 18 subunits, and several steps are needed for its biogenesis. PsaA and PsaB assemble at an early stage of PSI biogenesis to form a pre-complex that is needed for the assembly of the extrinsic PsaC. The stromal subunits PsaD and PsaE then assemble coordinately around PsaC, before the rest of the complex forms. In Arabidopsis, several mutants for these subunits have been identified and described. A double mutant for the two nuclear genes encoding PsaD shows no detectable subunits of PSI, demonstrating that these proteins are essential for the stability of the complex (Ihnatowicz et al., 2004). In addition, a drastic reduction of PSII was observed by BN SDS-PAGE in this double mutant, just as we observed in otp51. A lack of PsaE does not affect the levels of PsaA and PsaB, but is associated with a decrease in the other subunits and a decrease in PSII (Ihnatowicz et al., 2007). A lack of ª 2008 The Authors Journal compilation ª 2008 Blackwell Publishing Ltd, The Plant Journal, (2008), 56,

51 Splicing of ycf3 intron 2 requires OTP (a) (b) assemble. However, otp51 also lacks PSII, which was not seen in the tobacco and Chlamydomonas ycf3 mutants. This may represent a species difference, as a range of Arabidopsis mutants in the PSI subunits outlined above also have decreased PSII, but it is also possible that some of the other splicing decreases in otp51 contribute to the physiological phenotype. The mutant presents decreased splicing of atpf, and at least trnv and trnk. The latter two could have an impact on the translation of PSII subunits; however, at least some plastid-encoded proteins, such as AtpB, accumulate normally, so translation is not universally impeded. Experimental procedures Plant material and culture conditions Figure 7. Chlorophyll fluorescence. (a) Low-temperature (77 K) chlorophyll fluorescence emission spectra of wildtype (WT) and otp51 mutant lines of Arabidopsis thaliana chloroplasts. Each fluorescence spectrum is the mean of four corrected scans. Chlorophyll fluorescence was excited at 440 nm. (b) Parameters describing theau: Is the inserted text OK: Parameters describing the 77-K chlorophyll fluorescence emission peaks for hydroponic-cultured wild-type (Col-0) and otp51 mutant lines of Arabidopsis thaliana. Each value is the mean of four replicate plants. Non-detectable peaks are marked as n.d. PsaG is associated with a decrease in the abundance of most PSI core proteins (Varotto et al., 2002). In addition to mutants of subunits of PSI, several mutants have also been described for proteins involved in PSI biosynthesis. The Arabidopsis pyg7-1 and hcf101 mutants have no detectable subunits of PSI, but contain normal levels of PSII (Stockel and Oelmuller, 2004; Stockel et al., 2006). The first ycf3 mutant described was created by biolistic transformation in tobacco (Ruf et al., 1997). Homoplasmic Dycf3 plants display a photosynthetically incompetent phenotype, lack detectable levels of all PSI subunits, but still have PSII subunits. The second mutant described was in Chlamydomonas (Boudreau et al., 1997). Transformants lacking Ycf3 were unable to grow photoautotrophically and were lacking PSI subunits. Further studies on this mutant have shown that Ycf3 is involved in the assembly of PSI by interaction with PsaA and PsaD (Naver et al., 2001). The mutant that we describe here, otp51, presents a somewhat similar phenotype to these ycf3 mutants; a photosynthetically incompetent phenotype and a lack of PSI subunits that could be explained by epistasy of synthesis, as has been described in Chlamydomonas (Wostrikoff et al., 2004) as a result of the inability of PsaA and PsaD to The A. thaliana (ecotype Columbia) T-DNA mutants and wild-type plants were germinated on ½ MS medium, with 1% sucrose, at 22 C, with a 16-h photoperiod and a light intensity of 10 lmol quanta m )2 sec )1. Seedlings from solid medium were transferred on a grid in liquid ½ MS medium, with 1% sucrose, in the same conditions as described above. DNA and RNA isolation and RT-PCR analysis Leaf DNA was isolated as described by Edwards et al. (1991). A 10-ng portion from the extraction was used for PCR with primers sail_713_d08_lp (5 -GTACACAAACGCCTGAGAAGG-3 ), sail_713_ D08_RP (5 -TTTTCACGGCTAATTCCACAG-3 ) and LB1 (5 -GCCTT- TTCAGAAATGGATAAATAGCCTTGCTTCC-3 ) for the Sail T-DNA line, and primers salk_112013_rp (5 -TTCACTTGGTACACGTCC- TTG-3 ), salk_112013_lp (5 -TTTCAATTTTAGTTTCGAACATGAAC- 3 ) and Lba1 (5 -TGGTTCACGTAGTGGGCCATCG-3 ) for the Salk T-DNA insertion line. PCR was performed at 35 cycles using Taq DNA polymerase (New England Biolabs, Leaf RNA was isolated using the plant RNeasy extraction kit (Qiagen, The leaf RNA was treated with DNase (Ambion, and 3 lg was reverse-transcribed with Superscript III (Invitrogen, according to the manufacturer s directions using random hexamers (Invitrogen). Quantitative RT-PCR analysis Quantitative RT-PCR was performed using LightCycler 480 SYBR Green I Master Mix (Roche Diagnostics, div_diag.htm) and a LightCycler 480 Roche Real Time PCR system with the following thermal cycling program: 95 C for 10 min, followed by 45 cycles of 95 C for 10 sec, 60 C for 10 sec and 72 C for 20 sec. The primer sequences used are described in Table S1. Data were analyzed using the LIGHTCYCLER 480 software version 1.2 (Roche Diagnostics). The data set was normalized using cytosolic 18S rrna as a reference, setting the median value to 0. RNA gel blot analysis Arabidopsis leaf RNA (10 lg) was run on 1.2% agarose/formaldehyde gels, and was then transferred to nitrocellulose membrane ª 2008 The Authors Journal compilation ª 2008 Blackwell Publishing Ltd, The Plant Journal, (2008), 56,

52 166 Andéol Falcon de Longevialle et al. (0.45-lm pore size, Hybond-N+; Amersham, com) and then hybridized with biotinylated oligomer probes, or in vitro biotinylated transcript probes specific to chloroplast genes. The hybridizations were carried out overnight at 50 C in 5X SSC, 20 mm Na 2 HPO 4, 7% SDS and 100 lg ml )1 heparin, followed by washing. For hybridization with biotinylated transcripts, the hybridization was carried out overnight at 68 C in 5X SSC, 50% deionized formamide, 5X Denhardt and 0.5% SDS, followed by stringent washes. Signal detection was performed using the Phototope Star detection kit (New England Biolabs). The following biotinylated probes were used: trnk, 5 -AAAGCC- GAGTACTCTACCGTTG-3 ; trnl, 5 -TGGGGATAGAGGGACTTGAAC- 3 ; trng, 5 -CATCGTTAGCTTGGAAGGCTAAGGG-3 ; trni, 5 -CTAC- CACTGAGCTAATAGCCC-3 ; trnv, 5 -GTGTAAACGAGGTGCTC- TACCTAA-3 ; trna, 5 -GGACTCGAACCGCTGACATCCGCC-3. For clpp, ycf3 exon 3 and ycf3 intron 2, PCR fragments using primers clppfor (5 -GTAATGATCCATCAACCCGC-3 ) and clpprev (5 -TGAAC- CGCTACAAGATCAAC-3 ), ycf3ex3 For (5 -GGGAAAGTTCTTATTC- GAAGCGCCTCG-3 ) and ycf3ex3 Rev (5 -ACAGGCCATTCAACA- AGGAG-3 ), and ycf3int2 For (5 -AAAGCATGTCCACTGTTATTA- GATATTAGA-3 ) and ycf3int2 Rev (5 -AGGGCTTTCTACATAA- GCATCG-3 ) were cloned into pgem-t Easy (Promega, promega.com), and the biotinylated probes were made according to the manufacturer s protocols using the Maxiscript in vitro transcription kit (Ambion) and Biotin CTP (Invitrogen). Protein extraction Equal fresh weights of seedling material were homogenized in isolation buffer [50 mm Tricine, 0.8 M Sorbitol, 5 mm MgCl 2,2mM EDTA, 10 mm NaCl, 1 mm -aminocaproic acid, 10% glycerol (v/v) and 3% Protease inhibitor cocktail (v/v; Sigma-Aldrich, at ph 7.8, and were then filtered through two layers of 20-lm Miracloth. All extractions were undertaken on ice or at 4 C. The standard and sample absorbance change was measured at 750 nm in a spectrophotometer (Cary 50 Bio; Varian Inc., Sample extracts were assayed for protein content using a modified Lowry et al. (1951) method (Bio-Rad DC Protein Assay; Bio-Rad Laboratories, bio-rad.com). For total chlorophyll pigment analyses, fresh extract was diluted with 80% acetone, buffered with 25 mm Hepes, and then centrifuged at 800 g for 3 min. The supernatant was used for the spectrophotometric estimation (Cary 50 Bio; Varian Inc.) of chlorophyll content per leaf fresh weight according to the method described by Porra et al. (1989). Immunodetection of chloroplast and mitochondrial proteins Chloroplast and mitochondrial proteins were detected in whole-cell extracts using SDS-PAGE and western immunoblotting. Equal fresh weights of wild-type and otp51 seedlings were extracted and separated on a 10% (w/v) linear polyacrylamide gel, and were electrophoretically transferred to a nitrocellulose membrane (0.2-lm pore size, Hybond C Extra; Amersham) at 5 C for 1 h at 100 V. Polypeptides of PSI (PsaD and LhcaI), PSII (PsbA), ATP-synthase (AtpB) and Rubisco (RbcL) were detected with commercially available primary antisera (Agrisera AB, and with an anti- IgG alkaline phosphatase conjugated secondary antibody (SIGMA- Aldrich). A monoclonal antibody against mitochondrial porin, developed by Dr Tom Elthon (University of Nebraska, nebraska.edu), was used to determine the relative mitochondrial content. Immunoreactive peptides were identified using the Atto- Phos fluorescence substrate system (Promega), and were quantified by densitometry (IMAGEJ software; Leaf chlorophyll fluorescence Leaf chlorophyll fluorescence parameters were measured and calculated as described by Bilger et al. (1995) using a pulse-amplitude modulated chlorophyll fluorometer (PAM 2000; Walz, Effeltrich, Germany). The intrinsic quantum efficiency of PSII photochemistry [(F v /F m )=(F m ) F o )/F m, where F o is the minimum chlorophyll fluorescence yield in the dark-acclimated plants] was derived from fluorescence measurements on intact seedlings after 30 min of dark acclimation. The quantum efficiency of open PSII reaction centers [u PSII =1) (F s /F m ), where F m is the maximal chlorophyll fluorescence yield during illumination, and F s is the steady-state, lightacclimated fluorescence yield] was determined under an irradiance of 50 lmol quanta m )2 sec )1 at 20 C in air. Thylakoid isolation, Blue-Native and 2D SDS-PAGE Leaf tissue (5 g) grown in hydroponic, low-light conditions was ground in extraction buffer [50 mm Tricine NaOH, ph 7.8, 0.4 M sorbitol, 10 mm NaCl, 5 mm MgCl 2 Æ4H 2 O, 1 mm -amino caproic acid, 2 mm EDTA and 3% protease inhibitor cocktail (v/v; Sigma- Aldrich)] in a polytron (three times for 3 sec each time). The resulting extract was filtered through two layers of Miracloth and then spun for 10 min at g at 4 C. The pellet was resuspended in 1 ml of extraction buffer before the chlorophyll and protein content was measured. The extract was spun again for 10 min at g at 4 C, and the pellet was then resuspended in resuspension buffer (50 mm Tricine NaOH, ph 7.8, 10 mm NaCl, 5 mm MgCl 2 Æ4H 2 O, 1 mm -amino caproic acid and 2 mm EDTA) at a protein concentration of 1 mg ml )1. Thylakoid proteins (200 lg) were solubilized in 2% N-dodecylmaltoside in ACA750 buffer. BN strips were excised, incubated in 1% (w/v) SDS 1% (w/v) b-mercaptoethanol for 30 min to denature the complexes, and were then placed horizontally on top of a 12% SDS-PAGE. The resulting gels were stained with colloidal Coomassie Brilliant Blue G 250, as described previously (Millar et al., 2001). Identification of gel spots by mass spectrometry The protein samples to be analyzed were cut from the gels, destained in 10 mm NH 4 CO 3 and 50% (v/v) acetonitrile, dehydrated at 50 C and rehydrated with 15 ll of digestion solution (10 mm NH 4 CO 3 and 12.5 lg ml )1 trypsin in 0.01% trifluoroacetic acid), and were then incubated overnight at 37 C. Peptides were extracted according to the method described by Taylor et al. (2005). Samples were loaded onto self-packed Microsorb (Varian Inc.) C18 (5 lm, 100 Å) reverse-phase columns ( mm) using an Agilent Technologies (http://www.home.agilent.com) 1100 series capillary liquid chromatography system, were and eluted into an XCT Ultra IonTrap mass spectrometer (Agilent Technologies) with an ESI source equipped with a low-flow nebuliser in positive mode, and controlled by Chemstation [Rev B (204); Agilent Technologies] and MSD TRAP CONTROL v6.0 (build 38.15) software (Bruker Daltoniks, Peptides were eluted from the C18 reverse-phase column at 10 ll min )1 using a 9-min acetonitrile gradient (5 60%) in 0.1% formic acid at a regulated temperature of 50 C. Ions were selected for MS/MS after reaching an intensity of counts per second, and two precursor ions were selected from the initial MS scan. The resulting MS/MS spectra were ª 2008 The Authors Journal compilation ª 2008 Blackwell Publishing Ltd, The Plant Journal, (2008), 56,

53 Splicing of ycf3 intron 2 requires OTP exported, and the extracted results were queried against the Arabidopsis nucleus-encoded protein set (TAIR7), and the Arabidopsis mitochondrial and plastid genome-encoded protein sets (the combined database contained a total of protein sequences with residues) using the MASCOT search engine v (Matrix Science, utilizing error tolerances of 1.2 Da for MS and 0.6 Da for MS/MS, and with Max Missed Cleavages set to 1 and the Peptide charge set at 2+ and 3+. The results were filtered using Standard scoring, Max. number of hits set to 20, Significance threshold at P < 0.05 and Ions score cut-off at 20. Ions scores >20 represent a false-positive rate of <5% against randomized databases of the same protein sequences. Acknowledgements This research was supported by an Australian Research Council Centre of Excellence grant CE IDS is supported as a WA Premier s Fellow, NLT as an ARC Australian Post-doctoral Fellow (DP ) and AHM as an ARC Australian Professorial Fellow (DP ). Supporting Information Additional supporting information may be found in the online version of this article. Figure S1. Re-annotation of the gene At2g Figure S2. Re-annotation of the Arabidopsis thaliana gene ycf3. Figure S3. Detection of splicing defects. Figure S4. ycf3 intron 2 structure and lariat detection. Figure S5. Localization of the spots sequenced on the Blue Native (BN) SDS-PAGE gels. Identification of each spot is described in Table S2. Table S1. qpcr primer sequences and their positions on the genome. Table S2. Spots identified by mass spectrometry. Please note: Wiley-Blackwell are not responsible for the content or functionality of any supporting materials supplied by the authors. Any queries (other than missing material) should be directed to the corresponding author for the article. References Andrés, C., Lurin, C. and Small, I.D. (2007) The multifarious roles of PPR proteins in plant mitochondrial gene expression. Physiol. Plant. 129, Asakura, Y. and Barkan, A. (2006) Arabidopsis orthologs of maize chloroplast splicing factors promote splicing of orthologous and species-specific group II introns. Plant Physiol. 142, Asakura, Y. and Barkan, A. (2007) A CRM domain protein functions dually in group I and group II intron splicing in land plant chloroplasts. Plant Cell, 19, Bilger, W., Schreiber, U. and Bock, M. (1995) Determination of the quantum efficiency of photosystem II and of non-photochemical quenching of chlorophyll fluorescence in the field. Oecologia, 102, Bassi, G.S., de Oliveira, D.M., White, M.F. and Weeks, K.M. (2002) Recruitment of intron-encoded and co-opted proteins in splicing of the bi3 group I intron RNA. Proc. Natl. Acad. Sci. USA, 99, Bolduc, J.M., Spiegel, P.C., Chatterjee, P., Brady, K.L., Downing, M.E., Caprara, M.G., Waring, R.B. and Stoddard, B.L. (2003) Structural and biochemical analyses of DNA and RNA binding by a bifunctional homing endonuclease and group I intron splicing factor. Genes Dev. 17, Bonen, L. (2008) Cis- and trans-splicing of group II introns in plant mitochondria. Mitochondrion, 8, Bonen, L. and Vogel, J. (2001) The ins and outs of group II introns. Trends Genet. 17, Boudreau, E., Takahashi, Y., Lemieux, C., Turmel, M. and Rochaix, J.D. (1997) The chloroplast ycf3 and ycf4 open reading frames of Chlamydomonas reinhardtii are required for the accumulation of the photosystem I complex. EMBO J. 16, Caprara, M.G., Chatterjee, P., Solem, A., Brady-Passerini, K.L. and Kaspar, B.J. (2007) An allosteric-feedback mechanism for proteinassisted group I intron splicing. RNA, 13, Chatterjee, P., Brady, K.L., Solem, A., Ho, Y. and Caprara, M.G. (2003) Functionally distinct nucleic acid binding sites for a group I intron encoded RNA maturase/dna homing endonuclease. J. Mol. Biol. 329, Chevalier, B.S. and Stoddard, B.L. (2001) Homing endonucleases: structural and functional insight into the catalysts of intron/intein mobility. Nucleic Acids Res. 29, Chevalier, B.S., Monnat, R.J.. Jr and Stoddard, B.L. (2001) The homing endonuclease I-CreI uses three metals, one of which is shared between the two active sites. Nat. Struct. Biol. 8, Edwards, K., Johnstone, C. and Thompson, C. (1991) A simple and rapid method for the preparation of plant genomic DNA for PCR analysis. Nucleic Acids Res. 19, Emanuelsson, O., Nielsen, H., Brunak, S. and von Heijne, G. (2000) Predicting subcellular localization of proteins based on their N-terminal amino acid sequence. J. Mol. Biol. 300, Govindjee. (1995) Sixty-three years since Kautsky: chlorophyll a fluorescence. Aust. J. Plant Physiol. 22, Ho, Y. and Waring, R.B. (1999) The maturase encoded by a group I intron from Aspergillus nidulans stabilizes RNA tertiary structure and promotes rapid splicing. J. Mol. Biol. 292, Ihnatowicz, A., Pesaresi, P., Varotto, C., Richly, E., Schneider, A., Jahns, P., Salamini, F. and Leister, D. (2004) Mutants for photosystem I subunit D of Arabidopsis thaliana: effects on photosynthesis, photosystem I stability and expression of nuclear genes for chloroplast functions. Plant J. 37, Ihnatowicz, A., Pesaresi, P. and Leister, D. (2007) The E subunit of photosystem I is not essential for linear electron flow and photoautotrophic growth in Arabidopsis thaliana. Planta, 226, Koussevitzky, S., Nott, A., Mockler, T.C., Hong, F., Sachetto- Martins, G., Surpin, M., Lim, J., Mittler, R. and Chory, J. (2007) Signals from chloroplasts converge to regulate nuclear gene expression. Science, 316, Kügler, M., Jänsch, L., Kruft, V., Schmitz, U.K. and Braun, H.-P. (1997) Analysis of the chloroplast protein complexes by bluenative polyacrylamide gel electrophoresis (BN-PAGE). Photosynth. Res. 53, Lazowska, J., Claisse, M., Gargouri, A., Kotylak, Z., Spyridakis, A. and Slonimski, P.P. (1989) Protein encoded by the third intron of cytochrome b gene in Saccharomyces cerevisiae is an mrna maturase. Analysis of mitochondrial mutants, RNA transcripts proteins and evolutionary relationships. J. Mol. Biol. 205, Li-Pook-Than, J. and Bonen, L. (2006) Multiple physical forms of excised group II intron RNAs in wheat mitochondria. Nucleic Acids Res. 34, Liu, S., Zhang, C. and Zhou, Y. (2005) Domain graph of Arabidopsis proteome by comparative analysis. J. Proteome Res. 4, ª 2008 The Authors Journal compilation ª 2008 Blackwell Publishing Ltd, The Plant Journal, (2008), 56,

54 168 Andéol Falcon de Longevialle et al. de Longevialle, A. Falcon, Meyer, E.H., Andres, C., Taylor, N.L., Lurin, C., Millar, A.H. and Small, I.D. (2007) The pentatricopeptide repeat gene OTP43 is required for trans-splicing of the mitochondrial nad1 intron 1 in Arabidopsis thaliana. Plant Cell, 19, Longo, A., Leonard, C.W., Bassi, G.S., Berndt, D., Krahn, J.M., Hall, T.M. and Weeks, K.M. (2005) Evolution from DNA to RNA recognition by the bi3 LAGLIDADG maturase. Nat. Struct. Mol. Biol. 12, Lowry, O.H., Rosebrough, N.J., Farr, A.L. and Randall, R.J. (1951) Protein measurement with the Folin-Phenol reagents. J. Biol. Chem. 193, Lucas, P., Otis, C., Mercier, J.P., Turmel, M. and Lemieux, C. (2001) Rapid evolution of the DNA-binding site in LAGLIDADG homing endonucleases. Nucleic Acids Res. 29, Lurin, C., Andres, C., Aubourg, S. et al. (2004) Genome-wide analysis of Arabidopsis pentatricopeptide repeat proteins reveals their essential role in organelle biogenesis. Plant Cell, 16, Millar, A.H., Sweetlove, L.J., Giege, P. and Leaver, C.J. (2001) Analysis of the Arabidopsis mitochondrial proteome. Plant Physiol. 127, Nakagawa, N. and Sakurai, N. (2006) A mutation in At-nMat1a, which encodes a nuclear gene having high similarity to group II intron maturase, causes impaired splicing of mitochondrial NAD4 transcript and altered carbon metabolism in Arabidopsis thaliana. Plant Cell Physiol. 47, Naver, H., Boudreau, E. and Rochaix, J.D. (2001) Functional studies of Ycf3: its role in assembly of photosystem I and interactions with some of its subunits. Plant Cell, 13, O Toole, N., Hattori, M., Andres, C., Iida, K., Lurin, C., Schmitz- Linneweber, C., Sugita, M. and Small, I. (2008) On the expansion of the pentatricopeptide repeat gene family in plants. Mol. Biol. Evol. 25, Okuda, K., Myouga, F., Motohashi, R., Shinozaki, K. and Shikanai, T. (2007) Conserved domain structure of pentatricopeptide repeat proteins involved in chloroplast RNA editing. Proc. Natl Acad. Sci. USA, 104, Ostersetzer, O., Cooke, A.M., Watkins, K.P. and Barkan, A. (2005) CRS1, a chloroplast group II intron splicing factor, promotes intron folding through specific interactions with two intron domains. Plant Cell, 17, Ostheimer, G.J., Williams-Carrier, R., Belcher, S., Osborne, E., Gierke, J. and Barkan, A. (2003) Group II intron splicing factors derived by diversification of an ancient RNA-binding domain. EMBO J. 22, Ostheimer, G.J., Hadjivassiliou, H., Kloer, D.P., Barkan, A. and Matthews, B.W. (2005) Structural analysis of the group II intron splicing factor CRS2 yields insights into its protein and RNA interaction surfaces. J. Mol. Biol. 345, Ostheimer, G.J., Rojas, M., Hadjivassiliou, H. and Barkan, A. (2006) Formation of the CRS2-CAF2 group II intron splicing complex is mediated by a 22-amino acid motif in the COOH-terminal region of CAF2. J. Biol. Chem. 281, Pombert, J.F., Lemieux, C. and Turmel, M. (2006) The complete chloroplast DNA sequence of the green alga Oltmannsiellopsis viridis reveals a distinctive quadripartite architecture in the chloroplast genome of early diverging ulvophytes. BMC Biol. 4, 3. Porra, P.J., Thompson, W.A. and Kriedemann, P.E. (1989) Determination of accurate extinction coefficients and simultaneous equations for assaying chlorophylls a and b extracted with four different solvents: verification of the concentration of chlorophyll standards by atomic absorption spectroscopy. Biochim. Biophys. Acta, 975, Ruf, S., Kossel, H. and Bock, R. (1997) Targeted inactivation of a tobacco intron-containing open reading frame reveals a novel chloroplast-encoded photosystem I-related gene. J. Cell Biol. 139, Saha, D., Prasad, A.M. and Srinivasan, R. (2007) Pentatricopeptide repeat proteins and their emerging roles in plants. Plant Physiol. Biochem. 45, Salone, V., Rudinger, M., Polsakiewicz, M., Hoffmann, B., Groth- Malonek, M., Szurek, B., Small, I., Knoop, V. and Lurin, C. (2007) A hypothesis on the identification of the editing enzyme in plant organelles. FEBS Lett. 581, Sato, S., Nakamura, Y., Kaneko, T., Asamizu, E. and Tabata, S. (1999) Complete structure of the chloroplast genome of Arabidopsis thaliana. DNA Res. 6, Schmitz-Linneweber, C., Williams-Carrier, R.E., Williams-Voelker, P.M., Kroeger, T.S., Vichas, A. and Barkan, A. (2006) A pentatricopeptide repeat protein facilitates the trans-splicing of the maize chloroplast rps12 pre-mrna. Plant Cell, 18, Small, I.D. and Peeters, N. (2000) The PPR motif a TPR-related motif prevalent in plant organellar proteins. Trends Biochem. Sci. 25, Small, I., Peeters, N., Legeai, F. and Lurin, C. (2004) Predotar: a tool for rapidly screening proteomes for N-terminal targeting sequences. Proteomics, 4, Solem, A., Chatterjee, P. and Caprara, M.G. (2002) A novel mechanism for protein-assisted group I intron splicing. RNA, 8, Stockel, J. and Oelmuller, R. (2004) A novel protein for photosystem I biogenesis. J. Biol. Chem. 279, Stockel, J., Bennewitz, S., Hein, P. and Oelmuller, R. (2006) The evolutionarily conserved tetratrico peptide repeat protein pale yellow green7 is required for photosystem I accumulation in Arabidopsis and copurifies with the complex. Plant Physiol. 141, Szczepanek, T., Jamoussi, K. and Lazowska, J. (2000) Critical base substitutions that affect the splicing and/or homing activities of the group I intron bi2 of yeast mitochondria. Mol. Gen. Genet. 264, Taylor, N.L., Heazlewood, J.L., Day, D.A. and Millar, A.H. (2005) Differential impact of environmental stresses on the pea mitochondrial proteome. Mol. Cell. Proteomics, 4, Till, B., Schmitz-Linneweber, C., Williams-Carrier, R. and Barkan, A. (2001) CRS1 is a novel group II intron splicing factor that was derived from a domain of ancient origin. RNA, 7, Varotto, C., Pesaresi, P., Jahns, P., Lessnick, A., Tizzano, M., Schiavon, F., Salamini, F. and Leister, D. (2002) Single and double knockouts of the genes for photosystem I subunits G, K, and H of Arabidopsis. Effects on photosystem I composition, photosynthetic electron flow, and state transitions. Plant Physiol. 129, Vogel, J. and Börner, T. (2002) Lariat formation and a hydrolytic pathway in plant chloroplast group II intron splicing. EMBO J. 21, Watkins, K.P., Kroeger, T.S., Cooke, A.M., Williams-Carrier, R.E., Friso, G., Belcher, S.E., van Wijk, K.J. and Barkan, A. (2007) A ribonuclease III domain protein functions in group II intron splicing in maize chloroplasts. Plant Cell, 19, Wostrikoff, K., Girard-Bascou, J., Wollman, F.A. and Choquet, Y. (2004) Biogenesis of PSI involves a cascade of translational autoregulation in the chloroplast of Chlamydomonas. EMBO J. 23, ª 2008 The Authors Journal compilation ª 2008 Blackwell Publishing Ltd, The Plant Journal, (2008), 56,

55 Figure S1 : Re-annotation of the gene At2g (a) Multiple sequence alignment of Arabidopsis thaliana NP_ with its Vitis Vinefera and rice orthologs (Vv OTP51 and OsOTP51, respectively). The Arabidopsis OTP51 sequence is shorter than the putative orthologs. (b) Sequence alignment of the 5 -RACE PCR sequence against the Arabidopsis genomic sequence and the AGI gene model At2g The 5 -RACEsequence shows that OTP51 transcripts include an upstream exon not included in the At2g15820 gene model. (c) Proposed corrected model for Arabidopsis thaliana gene At2g15820.

56 Figure S2 : Re-annotation of the Arabidopsis thaliana gene ycf3. (a) Multiple sequence alignment of Arabidopsis thalianaycf3 (AtYCF3; BAA84386) with its rice, maize and tobacco orthologs (OsYCF3;NP_039384, ZmYCF3; NP_ and NtYCF3; CAA77415, respectively). Identical residues are shaded in black. The first 42 amino acids present in YCF3 of rice, maize and tobacco are missing in the predicted Ycf3 protein of Arabidopsis thaliana, suggesting an erroneous annotation. (b) Multiple sequence alignment of the chloroplast genome sequence of Arabidopsis thaliana (AtChloroplast) with ycf3 exon 1of tobacco, rice and maize (Nt_ycf3exon1, Os_ycf3exon1, Zm_ycf3exon1,respectively). A sequence highly similar to exon 1 is found in the chloroplast genome of Arabidopsis thaliana (complement ( )). (c) New proposed annotation of the Arabidopsis thaliana gene ycf3.

57 Figure S3 : Detection of splicing defects (a) Detection of ycf3 splicing by RT-PCR on cdna fromotp51-1, otp51-2 and wild-type Col-0. Col-0 genomic DNA was compared to indicate the unspliced products. The primers designed to detect splice junctions were: YCF3_exon1R (5 -CGAGTCATTCCGACAACTTC-3 ); YCF3_exon2F (5 -TGTGGTAAAAAGGGGTTTCG-3 );YCF3_exon2R (5 - ATGTCGGCTCAATCTGAAGG-3 ) and YCF3_exon3F (5 -CTCCTTGTTGAATGGCCTGT-3 ).No amplification of spliced ycf3 exon2-exon3 is detected from otp51-1and otp51-2 with primer pairs ycf3_exon2r / ycf3_exon3f while the unspliced form is amplified, showing that intron 2 is not spliced in the mutant. Molecular weight markers are shown at left.(b) Poisoned Primer Extension (PPE) assays of splicing of ycf3intron 1, ycf3 intron 2 and the atpf intron in wild-type and otp51.poisoned primer extension was performed as previously described (Chateigner-BoutinA-L and Small I, 2007). Primers used to amplify the first product were: for ycf3intron 1, YCF3_exon1R (5 - CGAGTCATTCCGACAACTTC-3 ); YCF3_exon2F (5 -TGTGGTAAAAAGGGGTTTCG-3 ); for ycf3intron 2, ycf3f (5 -TCCAATACTCAGCGGCTTG-3 );ycf3r (5 -TTCGGGCATTAGAACGAAAC-3 ); for atpf intron, atpf-f (5 -TGAATAGCTCCTTCACGCAGT-3 );atpf-r (5 - TTAGCAACAAATCCAATAAATCTAAGTG-3 );1/660th of the reverse transcription reaction was used for PCR with Taq DNApolymerase (New England Biolabs).The primers and dideoxynucleotides for each intron were as follows: ycf3 intron 1, primer PPE-ycf AATTTCCTTCAGATTGAGCCGACA-3 ddgtp; ycf3 intron 2, primer PPE-ycf3-2, 5 - CTTGTTGAATGGCCTGTTCTCCAC-3,ddCTP; atpf, primer PPE-atpF, 5 - CTTTCGGTTATCTAATAAATCA-3, ddctp. Gels were imaged with a Typhoon Trio imager (GE Healthcare) and analysed with IMAGEQUANTsoftware (GE Healthcare). The predicted sizes of the PPE products for spliced (S) and unspliced (U) transcripts are stated in nucleotides next to each product. No splicing of ycf3 intron 2 is detectable in otp51. An accumulationof the unspliced atpf transcript and a decrease of the spliced atpf transcript is also observed in otp51 while no difference is observed forycf3 intron 1.

58 Figure S4 : ycf3 intron 2 structure and lariat detection. (a) Sequence alignment of the Arabidopsis thaliana ycf3intron 2 domain V with the ycf3 intron 2 domain V sequence from rice to show the complete conservation of sequence. The secondary structure prediction of domain V and VI of ycf3 intron 2 is shown to indicate the position of the two extra nucleotides (bold) with respect to the 34 usually seen in a classical domain V and the purine (circled adenosine) instead of a pyrimidine at position 10 from the 3 end. The adenosine in the domain VI needed for the first trans-esterification step is marked with an asterix. (b) Detection of ycf3 intron 2 lariats by RT-PCR. TheA represents the branchpoint adenosine. RT-PCR across the intron termini should generate an expected product of 200 bp (denoted by the arrowhead), only visible in the sample from wild-type plants (left, 1: otp51-1, 2: otp51-2,3: col0). Size markers are shown to the left of the gel. The RT-PCR to detect ycf3intron 2 lariat molecules was performed according to Li- Pook-Than and Bonen (2006). 10 µg of Arabidopsis leaf RNA were reverse transcribed using a specific primer near the 5 end of ycf3 intron 2 (5 -CGATGGATGAAGTTTAGTTATTTGC-3 ) and Superscript II (Invitrogen). Subsequently, a primer at the 5 end of the intron (5 - TTTGCTACAGCTGATAAAAATCG-3 ) and a primer at the 3 end of the intron, (5 - AGTTGGTTGTCGAGCCGTAT-3 ) were used for PCR amplification with TaqDNA polymerase (New England Biolabs). RT-PCR products were cloned into pgemt-easy (Promega). Cloned products were size-selected by PCR and clones close to the expected size were sequenced.(c) Sequence analysis of RT- PCR clones of intron junctions for ycf3 intron 2 in wild-type, otp51-1 and otp51-2 samples. The bold A or T nucleotides indicate the branch-point nucleotide. The apparent substitution of the branch-point adenosine by a thymidine as shown in the sequences from the wild-type sample has been previously reported as a reverse transcriptase artefact for templates with 2-5 bonds (Li-Pook-Than and Bonen,2006).

59 Figure S5 : Localization of the spots sequenced on the BN-SDS PAGE gels. Identification of each spot is described in the Table 2.

60 RESULTATS Supplemental Table 1. qpcr primer sequences 59

61 RESULTATS 60

62 RESULTATS Supplemental Table 2. Spots identified by mass spectrometry. 61

63 RESULTATS II.1.2 Identification de défauts d épissage en utilisant la PCR quantitative. Plusieurs méthodes ont été mises au point pour identifier et quantifier des défauts d épissage d ARNm. La plus communément utilisée est le northern blot. Celle-ci permet non seulement de vérifier le taux d introns épissés, mais aussi de regarder en parallèle la maturation des transcrits. Une autre technique, qui a été fortement utilisée lors de l identification de facteurs d épissage chloroplastiques, est la PPE (Poisoned Primer Extension). Cette méthode, décrite dans la Figure 4, permet grâce à sa grande sensibilité de quantifier très précisément un défaut d épissage. Figure 4 : Principe de la PPE (Poisonned Primer Extension), exemple de détection de l épissage de l intron 2 d ycf3. 1. Une PCR ayant pour matrice de l ADNc dilué est réalisée en présence d oligonucléotides spécifiques de l exon 2 et l exon 3 de ycf3. Cette PCR permet d amplifier à la fois la forme non épissée et la forme épissée de l ARNm. Les produits PCR sont alors purifiés afin d éliminer les oligonuclétides et les dntps restants. 2. Une réaction de type «séquençage» sur les produits PCR est réalisée en présence d un oligonucléotide marqué en 5 par de la Fluorescéine (FAM) et spécifique de la partie en 5 de l exon 3, de dntps (datp, dgtp, dttp) et d un dideoxynucléotide (ddctp). Lors de l inclusion du ddctp au cours de la synthèse, la réaction d élongation est alors bloquée. 3. La séquence en 3 de l intron et en 3 de l exon 2 n étant pas les mêmes, deux types de produits PPE sont alors obtenus. Un premier produit où l inclusion du ddctp se fait 4 nucléotides après l oligonucléotide, alors spécifique de la forme non épissée de l intron 2 d ycf3, et un autre produit plus grand car l inclusion du ddctp s effectue 9 nucléotides plus loin. Ce dernier produit est spécifique de la forme épissée d ycf3. Ces produits sont dénaturés et déposés sur un gel d acrylamide afin de permettre une séparation à un nucléotide près des produits de PPE et de comparer les ratios des formes épissées et non épissées obtenues. Lors de crible de mutants, ces deux méthodes ne sont malheureusement pas envisageables et dans l optique d identifier des protéines PPR impliquées dans l épissage, il fallait mettre en 62

64 RESULTATS place une technique adéquate. La méthode la plus simple était alors d amplifier par PCR la forme épissée en utilisant des oligonucléotides sur chaque exon et de vérifier la présence de chaque transcrit épissé pour chaque événement d épissage chloroplastique mais aussi mitochondrial. Même si cette méthode, très rapide, permet de cribler un défaut total d épissage chez les mutants étudiés, elle n est pas quantitative et permet difficilement d identifier des défauts partiels. De plus, un certain nombre d introns se trouvant dans les ARNt ne peuvent être analysés par cette méthode étant donné l impossibilité de dessiner des oligonucléotides dans ces zones très courtes. Afin de pallier au problème de la quantitativité, nous avons choisi d utiliser une approche de PCR quantitative. Pour chaque événement d épissage des oligonucléotides ont été dessinés sur les exons et sur l intron associé, permettant ainsi d amplifier la forme épissée et la forme non épissée. Le ratio «forme épissée/ forme non épissée» pour chaque événement d épissage est alors comparé entre le mutant étudié et le sauvage (Figure 5). Figure 5 : Schéma représentant la technique de quantification de l épissage par PCR quantitative. Les conditions et le dessins des oligonucléotides sont décrits dans l article 2 (supplemental table 1) pour les événements d épissage chloroplastiques et dans l article 3 (supplemental table 1) pour les événements d épissage mitochondriaux. Comme il a été montré pour OTP51, cette approche permet de quantifier très précisément des défauts d épissage au même titre que de la PPE. Cependant le problème de dessin d oligonucléotides pour de la PCR quantitative sur les introns des ARNt réside, et seul le northern blot permet de regarder ces événements. Grâce à ce nouvel outil, il m a été possible de quantifier les événements d épissage pour un certain nombre de mutants ppr et ainsi identifier de nouvelles protéines PPR impliquées dans cette étape importante de modification post-transcriptionnelle. 63

65 RESULTATS II OTP52 (At3g06430, emb2750) OTP52 est une PPR de type «Pure» prédite dans les chloroplastes sous Predotar (http://urgi.versailles.inra.fr/predotar/predotar.html) et TargetP (http://www.cbs.dtu.dk/services/targetp/). Le mutant d insertion ADN-T dans ce gène, emb2750, est décrit comme «embryo-letal» chez Arabidopsis. Chez les dicotylédones, contrairement aux monocotylédones, un certain nombre de gènes essentiels pour le développement des chloroplastes sont codés dans le génome chloroplastique (accd, ycf1, ycf2), alors qu ils sont absents du génome chloroplastique chez les monocotylédones (Konishi, Shinohara et al. 1996; Wakasugi, Tsudzuki et al. 2001). Un défaut de traduction ou de certaines modifications post-transcriptionnelles au niveau de ces gènes peuvent donc aboutir à un phénotype très marqué, l arrêt de développement des plastes conduisant à un arrêt précoce du développement embryonnaire. Ainsi, il n est pas possible d obtenir des mutants homozygotes pour des gènes essentiels dans la traduction plastidiale. Le gène accd code pour une β-carboxyl transferase, sous-unité de l acetyl-coa carboxylase. Cette enzyme a un rôle essentiel dans la synthèse des acides gras (Kode, Mudd et al. 2005) et se trouve essentielle lors de la germination de la graine. Etienne Delannoy (chercheur post-doctoral dans l équipe de Ian Small à Perth) a envisagé une approche permettant de sauver des mutants homozygotes en les complémentant avec un transgène accd nucléaire codant pour une protéine ACC-D portant un peptide d adressage chloroplastique. En complémentant avec cette construction chimérique, il serait éventuellement possible de «passer» certains stades de développement embryonnaire, et ainsi sauver en partie certains mutants décrits comme embryo-letaux. Parmi les mutants testés, se trouve le mutant «embryo-letal» otp52. La complémentation par le gène accd n a pas très bien fonctionnée, mais il a été possible de récupérer des mutants d insertion ADN-T homozygotes pour ce gène. Ces mutants présentent un très fort phénotype : très faible taux de germination mais supérieur chez les mutants complémentés par le gène accd que chez le mutant non complémenté ; des plantules blanches et très petites en condition in vitro. Des analyses réalisées par Etienne sur les ARNt chloroplastiques par northern blot ont montré que le mutant présente un défaut d épissage de l ARNt Val UAC. En effet, aucun ARNt Val mature n est observé alors que l on observe une accumulation de la forme non épissée de cet ARNt. En addition de cette absence quasi totale de l épissage de cet intron, le mutant présente également une diminution de l épissage des introns ARNt Ile et Ala, celle-ci étant probablement due a un défaut de maturation de l ARN 23S. Afin de voir si d autres événements d épissage sont affectés chez ce mutant, j ai réalisé une analyse de l épissage des ARN chloroplastiques par PCR quantitative. Comme il est montré sur la Figure 6, en plus du défaut d épissage de l ARNt Val, le mutant présente un très fort défaut d épissage de l intron d atpf, pratiquement aucun ARNm d atpf mature ne pouvant être détecté et également un défaut partiel d épissage de l intron 2 de rps12. Un défaut d épissage d atpf a déjà été observé pour un grand nombre de mutants, tels que crs1 et why1 (Jenkins, Kulhanek et al. 1997; Till, Schmitz-Linneweber et al. 2001; Asakura and Barkan 2006; Prikryl, Watkins et al. 2008). Et ce défaut chez ces mutants conduit à un phénotype assez similaire à celui d otp52. L absence d épissage de l ARNt Val devrait conduire à un problème majeur dans la traduction chloroplastique. Et on peut se demander si les défauts d épissage observés sur les autres introns sont des effets indirects ou des conséquences du défaut de traduction engendré par le défaut d épissage de l ARNt Val. 64

66 RESULTATS Figure 6 : Détection des événements d épissage par qpcr chez le mutant otp52. Pour chaque intron, le ratio entre les formes épissées et non épissées chez le mutant est comparé au sauvage et est représenté en abscisse sous la forme d un Log2 : Log2 [(forme épissée/ forme non épissée) mutant / ((forme épissée/ forme non épissée) sauvage]. L épissage des ARNt n est pas représenté sur ce graphique car la détection de celui-ci a été quantifiée par northern blot (données non montrées). Deux études différentes permettent en partie de répondre à cette question. La première, qui a été réalisée au sein du laboratoire de Ian Small à Perth et qui est expliquée ultérieurement dans ce chapitre, consiste à regarder le profil d épissage chez des mutants affectés dans la transcription de type PEP. En effet, un des effets de l arrêt de la traduction conduit à un défaut de la transcription impliquant les ARN polymerases codées par le génome chloroplastique (PEP). Et ce défaut de transcription sur des transcrits ayant des introns pourrait provoquer des défauts apparents d épissage. La deuxième étude consiste à connaître quels sont les introns dépendants de la maturase chloroplastique, MatK. Un des effets de l arrêt de la traduction est l absence de synthèse de la maturase chloroplastique, MatK, codée dans l intron trnk. Cette protéine qui a longtemps été décrite comme jouant certainement un rôle essentiel dans l épissage d introns chloroplastiques, vient récemment d être mieux caractérisée. MatK pourrait être impliquée dans l épissage de l intron d atpf, de rpl2, de l intron2 de rps12, de l intron de trnv, trnk, trna et de trni puisque son association avec ces différents introns a été révélée par RIP-CHIP (Zoschke, Nakamura et al. 2010). Chez le mutant otp52, cinq introns sur les sept présentant une interaction avec MatK sont affectés, néanmoins aucun défaut d épissage n est observé pour l intron de rpl2 et de trnk. Il faut remarquer que l interaction de MatK avec ces 7 introns ne signifie pas nécessairement que cette maturase ait un rôle essentiel dans leur épissage. Et il est donc envisageable que les effets observés chez le mutant otp52 ne correspondent qu à des effets indirects dus à l absence de traduction. Cependant l absence de défaut sur l intron de trnk, dont l épissage serait certainement très lié à la maturase codée par son intron, suggère qu il existe un certain taux de traduction de cette maturase et donc que la protéine OTP52 a un effet plutôt direct sur l épissage des introns trnv et atpf et qu une partie du défaut de l absence de l ARNt Val mature serait compensée par un autre mécanisme permettant un taux «minimal» de la traduction. En effet, des données de western blot effectuées par Etienne Delannoy montrent une quantité significative des protéines chloroplastiques AtpB, RbcL, PsaD et PsbA et de nouvelles données obtenues par Catherine Colas-des-Francs ne montrent aucune différence 65

67 RESULTATS dans l accumulation de la protéine AccD entre les mutants otp52 et crs1 et, en revanche, une sur-accumulation comparée au sauvage. En conclusion, ceci suggère que le mutant otp52 est plus apparenté à un mutant de l ATP synthase, au même titre que crs1, et que le défaut de traduction lié aux problèmes d épissage des ARNt est relativement mineur. II Profil d épissage des mutants affectés dans la transcription de type PEP Un certain nombre de phénomènes de régulation transcriptionnelle et posttranscriptionnelle peuvent affecter l efficacité de l épissage et il est important, mais difficile, de dissocier les effets indirects d une mutation aux effets directs de celle-ci sur l épissage. L outil de PCR quantitative n étant pas brin spécifique, il est fort possible que, dans un cas où il existe un défaut de transcription, on observe moins d épissage pour un intron mais que la forme non épissée observée reste au même niveau que dans le sauvage alors que celle-ci devrait être réduite en raison du défaut transcriptionnel pour ce transcrit. Cela peut s expliquer par l amplification de transcrits chevauchants, en général en sens opposé, qui ne sont pas forcément affectés et qui peuvent au contraire s accumuler et ainsi biaiser le résultât observé. Seul un northern blot permettrait de discriminer parmi ces deux événements. Cependant, il est possible d avoir une idée du profil d épissage des transcrits chloroplastiques dans le cas de mutants affectés dans la transcription et ainsi de définir quels sont les évènements d épissage affectés dans ces mutants. La transcription chloroplastique est effectuée par deux types de polymérases. Deux polymérases codées par le génome nucléaire, RpoTp et RpoTmp, nommées NEP pour «Nuclear Encoded Polymerase», et une autre codée par le génome chloroplastique, la PEP (Plastid-Encoded Polymerase), comprenant quatre sous-unités, RpoA, RpoB, RpoC1, RpoC2. Ces deux types de polymérases ont un rôle bien défini dans la transcription chloroplastique et, alors que ces trois polymérases vont transcrire un ensemble de gènes en commun, d autres gènes sont transcrits préférentiellement par la PEP ou les polymérases de type NEP. Deux mutants ppr (ptac2 et clb19) affectés dans la transcription par la PEP ont été identifiés et présentent le même phénotype. PTAC2 est une PPR de type «Pure» comportant un domaine endonucléase de type SMR en C-terminal. Plusieurs autres protéines PPR comportant ce motif sont codées par le génome nucléaire d Arabidopsis et sont soit localisées dans les chloroplastes comme GUN1 intervenant dans le signal rétrograde (Koussevitzky, Nott et al. 2007) ou encore P67 identifiée comme se fixant à l ARN (Lahmy, Barneche et al. 2000), soit dans les mitochondries. Le mutant ptac2 présente un défaut de transcription de la PEP (Pfalz, Liere et al. 2006). Cette protéine PPR trouvée dans des complexes de haut poids moléculaire associés à des protéines impliquées dans la transcription, serait directement liée à l activité transcriptionnelle de type PEP, cependant sa fonction moléculaire exacte n est pas encore élucidée. CLB19 est une PPR de type E+ impliquée dans l édition des deux sites chloroplastiques clpp et rpoa (Chateigner-Boutin, Ramos-Vega et al. 2008). ClpP est une protéase et RpoA est une sous-unité de la PEP. Le défaut d édition de ce transcrit codant pour cette sous-unité conduit à un défaut de la transcription par la PEP équivalent à celui observé dans le mutant ptac2 et de ce fait le profil transcriptionnel du génome chloroplastique des deux mutants est identique. Afin de déterminer le profil d épissage chez un mutant affecté dans la PEP, ces deux mutants ont été étudiés. Les résultats des profils d épissage pour chacun sont représentés dans la figure 7. 66

68 RESULTATS A. B. Figure 7 : Profil de l épissage des introns chloroplastiques chez les mutants ptac2 (A.) et clb19 (B.) comparés à des plantes de type sauvage. Les ratios des formes épissées sur les formes non épissées entre le mutant et le sauvage sont représentés en Log2 : Log2 [(forme épissée/ forme non épissée) mutant / ((forme épissée/ forme non épissée) sauvage]. Seuls les introns des gènes chloroplastiques codants pour des protéines ont été analysés dans cette expérience, et aucune donnée n a été obtenue concernant l épissage des ARNt. Lorsque l on regarde les deux profils d épissage chez les deux mutants, on observe les mêmes défauts d épissage. Huit introns présentent un ratio formes épissées sur formes non épissées au moins deux fois inférieur à celui du sauvage. Ces deux mutants présentent des défauts de transcription et donc le ratio pourrait être biaisé du fait de l existence de zones chevauchantes. C est donc pour cette raison qu il est aussi important de regarder le taux des formes épissées avant de comparer les ratios. En établissant cette comparaison représentée dans la figure 8, les deux mutants présentent moins de formes épissées pour petb, petd et ndha et étrangement plus de formes épissées pour rpoc1. Le transcriptome chloroplastique de ces deux mutants montre une diminution des transcrits de petb et petd qui sont des gènes majoritairement sous le contrôle de la PEP. La diminution des formes épissées pour ces transcrits peut donc s expliquer par une diminution de l abondance des transcrits primaires. 67

69 RESULTATS Figure 8 : Profil des transcrits chloroplastiques épissés des mutants clb19 et ptac2. Log2 des ratios des formes épissées des ARNm chloroplastiques chez les mutants clb19 et ptac2 sur les formes épissées chez les sauvages Col0 : Log2 (forme épissée mutant/ forme épissée sauvage). En parallèle, chez ces deux mutants, un certain nombre de transcrits spécifiques des polymérases de type NEP s accumulent. Comme si en absence de l activité de la PEP, les transcrits NEP ont une durée de vie plus importante et de ce fait s accumulent. C est le cas de rpoc1 dont le transcrit s accumule, mais aussi la forme épissée, suggérant une durée de vie plus importante de ces transcrits ou bien que ce défaut de la PEP s accompagne d une surexpression des facteurs d épissage liés à l intron de rpoc1. En ce qui concerne ndha, il n y a pas de réduction de l expression des transcrits polycistroniques ndhh-ndha-ndhi-ndhgndhe-psac-ndhd, en revanche une forte diminution de l épissage de l intron de ndha est observée chez les deux mutants. Pour ce transcrit, 5 précurseurs possibles sont décrits et il est possible que le précurseur adéquat pour l épissage soit sous représenté chez les mutants. Les deux polymérases sont impliquées dans la transcription de ces transcrits mais les précurseurs ne sont pas les mêmes selon la polymérase. La reconnaissance par les facteurs d épissage pourrait donc s effectuer via un seul type de précurseur, qui serait préférentiellement transcrit via la PEP. En conclusion, ce profil d épissage est spécifique des mutants ayant un défaut de la polymérase PEP, et permet désormais d avoir une certaine signature de ce type de mutant. Ces défauts ne sont visiblement pas liés à des défauts d épissage mais plus à une diminution des transcrits ou des formes correctes pour l épissage. Concernant OTP52, le profil d épissage du mutant correspondant n est pas similaire au profil des mutants PEP. Des défauts partiels de l épissage de ndha, petb, petd et une augmentation de l épissage de rpoc1 sont observés chez otp52 lorsque l on compare les taux de formes épissées plutôt que les ratios. Cependant ces défauts sont beaucoup moins importants que ceux observés chez clb19 et ptac2, suggérant encore qu une activité de traduction existe chez le mutant otp52 malgré le défaut d épissage de l ARNt Val. 68

70 RESULTATS II.2. Identification de protéines PPR impliquées dans l épissage des ARNm dans les mitochondries. Il existe une réelle disproportion entre les facteurs d épissage chloroplastiques identifiés et les facteurs mitochondriaux. En effet, alors que tous les introns chloroplastiques ont au moins un facteur d épissage identifié, au niveau mitochondrial, la quasi-totalité des facteurs d épissage reste à être caractérisée. Au début de ma thèse, seulement un mutant dans un probable facteur d épissage avait été identifié (nms1) (Brangeon, Sabar et al. 2000), mais pour lequel aucun clonage positionnel n a été entrepris. Et de ce fait, au niveau mitochondrial, tous les facteurs d épissage restaient donc à découvrir. 23 introns de group II sont décrits dans le génome mitochondrial chez Arabidopsis. Un certain nombre d homologues de protéines CRM identifiées comme des facteurs d épissage dans les chloroplastes sont prédits être localisés dans les mitochondries et pourraient avoir un rôle dans l épissage des introns mitochondriaux (cf article 1) mais jusqu à présent aucune preuve n a été apportée. Comme il a été montré précédemment, les protéines PPR sont impliquées dans l épissage d un certain nombre d introns chloroplastiques et il est fort possible que ces protéines PPR aient aussi un rôle dans l épissage dans les mitochondries au même titre que les protéines CRM. En utilisant une approche de génétique inverse, j ai pu identifier quatre protéines PPR ayant une fonction plus ou moins majeure dans l épissage de certains introns mitochondriaux. II.2.1 OTP43 OTP43 est la première protéine PPR que j ai étudiée et caractérisée. Cette protéine PPR de type «Pure» fait partie des 48 protéines PPR pour lesquelles j avais mis en place une étude systématique par «ARNi» dans le cadre du projet AGRIKOLA. Le «mutant ARNi» d OTP43 présente un phénotype de retard de croissance assez fort comparé au sauvage. Dans le but de comparer un «mutant ARNi» à un mutant «knockout» de type insertion ADN-T pour le même gène, j ai entrepris l étude du mutant ADN-T Sail_867F07 dont l insertion se situe en 3 du gène OTP43. Cette étude a montré, dans un premier temps, que le phénotype du mutant d insertion était plus marqué. En plus du retard de croissance observé dans les lignées «ARNi», des problèmes de germination, des retards de croissance plus forts et une stérilité des graines issues des homozygotes sont observés chez le mutant Sail_867F07. Afin de comprendre le rôle de cette protéine PPR, des études plus poussées ont été réalisées et ont pu montrer que cette protéine est impliquée dans l épissage en trans de l intron 1 de nad1. Cette protéine dont la caractérisation est décrite dans le papier suivant est la première protéine PPR identifiée au niveau mitochondrial ayant un rôle dans l épissage. Article 3 : de Longevialle A.F., Meyer E.H., Andrés C., Taylor N.L., Lurin C., Millar A.H. and Small I.D. (2007) The Pentatricopeptide Repeat Gene OTP43 Is Required for trans-splicing of the Mitochondrial nad1 Intron 1 in Arabidopsis thaliana. The Plant Cell, 19:

71 The Plant Cell, Vol. 19: , October 2007, ª 2007 American Society of Plant Biologists The Pentatricopeptide Repeat Gene OTP43 Is Required for trans-splicing of the Mitochondrial nad1 Intron 1 in Arabidopsis thaliana W Andéol Falcon de Longevialle, a,b Etienne H. Meyer, b Charles Andrés, a Nicolas L. Taylor, b Claire Lurin, a A. Harvey Millar, b and Ian D. Small a,b,1 a Unité MixtedeRechercheGénomique Végétale (Institut National de la Recherche Agronomique, Centre National de la Recherche Scientifique, Université d Evry/Val d Essonne), Evry, France b Australian Research Council Centre of Excellence in Plant Energy Biology, University of Western Australia, Crawley 6009 WA, Australia The mitochondrial NADH:ubiquinone oxidoreductase complex (Complex I) is a large protein complex formed from both nuclearly and mitochondrially encoded subunits. Subunit ND1 is encoded by a mitochondrial gene comprising five exons, and the mature transcript requires four RNA splicing events, two of which involve trans-splicing independently transcribed RNAs. We have identified a nuclear gene (OTP43) absolutely required for trans-splicing of intron 1 (and only intron 1) of Arabidopsis thaliana nad1 transcripts. This gene encodes a previously uncharacterized pentatricopeptide repeat protein. Mutant Arabidopsis plants with a disrupted OTP43 gene do not present detectable mitochondrial Complex I activity and show severe defects in seed development, germination, and to a lesser extent in plant growth. The alternative respiratory pathway involving alternative oxidase is significantly induced in the mutant. INTRODUCTION NADH:ubiquinone oxidoreductase (Complex I) is the major entry point for the electron transport chain in plant and animal mitochondria (Brandt, 2006). Deficiency in Complex I function has been associated with various human diseases, including neurodegenerative diseases, and the aging process (Adam-Vizi and Chinopoulos, 2006; Janssen et al., 2006). In plants, this complex is still the major entry point under normal conditions, even though the electron transport chain is potentially more complicated due to the presence of alternative NAD(P)H dehydrogenases and alternative oxidase (reviewed in Noctor et al., 2007). Due to these alternative pathways, the plant mitochondrial respiratory chain has been a popular target for biochemical studies. Despite this widespread interest, very few studies have used genetic approaches to look at respiratory chain function. Mitochondrial Complex I is comprised of >40 subunits in Arabidopsis thaliana (Heazlewood et al., 2003). The majority of these are encoded by nuclear genes, and only nine genes have been retained in the land plant mitochondrial genome, namely, nad1, nad2, nad3, nad4, nad4l, nad5, nad6, nad7, and nad9 (Sugiyama et al., 2005). With such a plethora of genes involved, one might have expected many mutants with alterations in Complex I activity to have been investigated, but in fact, the literature is very sparse. 1 Address correspondence to The author responsible for distribution of materials integral to the findings presented in this article in accordance with the policy described in the Instructions for Authors (www.plantcell.org) is: Ian D. Small W Online version contains Web-only data. Two mitochondrial mutants with similar deletions have been described from Nicotiana sylvestris (Pla et al., 1995) and another mitochondrial DNA deletion mutant from maize (Zea mays; Karpova and Newton, 1999). A nuclear mutant almost lacking Complex I was observed in N. sylvestris (Brangeon et al., 2000), while three nuclear mutants affected in Complex I have been identified in Arabidopsis (Lee et al., 2002; Perales et al., 2005; Nakagawa and Sakurai, 2006). Each of these mutants is defective in a different gene, and the phenotypes of these mutants are quite varied. Five of the nad genes are fragmented into different exons that are flanked by sequences with group II intron features, and their transcripts need to be spliced. Although other mitochondrial transcripts (rps3, cox2, ccmf, and rpl2) contain introns, only nad1, nad2, and nad5 transcripts require trans-splicing (Malek and Knoop, 1998). Very little is known about RNA splicing factors in plant mitochondria, but much more is known about the process in chloroplasts. In maize chloroplasts, four RNA splicing factors (CRS1, CRS2, CAF1, and CAF2) have been identified, and three chloroplast protein complexes have been proposed for the splicing of different intron subsets (Till et al., 2001; Ostheimer et al., 2003, 2005, 2006; Ostersetzer et al., 2005). Orthologs in Arabidopsis for these RNA splicing factors have been identified (Asakura and Barkan, 2006). In addition to these splicing factors, one highly specific factor has been identified that is required for the trans-splicing of rps12 intron 1 in chloroplasts (Schmitz- Linneweber et al., 2006). This rps12 RNA splicing factor is a pentatricopeptide repeat (PPR) protein, one of a very large family in Arabidopsis of at least 450 proteins (Aubourg et al., 2000; Lurin et al., 2004; Rivals et al., 2006). They are characterized by tandemly repeated,

72 OTP43 Is Needed for nad1 trans-splicing 3257 degenerate, 35 amino acid motifs and have been proposed to be sequence-specific RNA binding proteins (Small and Peeters, 2000). Most of the few that have been characterized play a role in posttranscriptional processes in organelles (reviewed in Nakamura et al., 2004; Andres et al., 2007). PPR proteins have been implicated in RNA editing (Kotera et al., 2005; Okuda et al., 2007), RNA processing (Meierhoff et al., 2003; Hattori et al., 2007), RNA splicing (Schmitz-Linneweber et al., 2006), and translational activation (Schmitz-Linneweber et al., 2005). During a reverse genetics screen of PPR mutants, we identified one with a defect in splicing of nad1 transcripts. Nothing is known of RNA transsplicing factors in mitochondria; thus, this mutant is of considerable interest in understanding mitochondrial RNA splicing processes. This mutant is also specifically affected in nad1 expression and appears to lack Complex I activity. It is thus equally interesting from the biochemical and physiological point of view and may be helpful in understanding the role of Complex I and the alternative pathways in plant mitochondria. RESULTS Macroscopic Phenotype The gene studied in this work (At1g74900) was first flagged as worthy of interest from a high-throughput RNA interference screen of a large number of Arabidopsis genes, including many genes encoding PPR proteins (Hilson et al., 2004). Different independent lines of knockdown expression of At1g74900 showed delayed development and delayed flowering, so three T-DNA insertion lines putatively mutated in At1g74900 were obtained and analyzed. The positions of the three T-DNA inserts were confirmed by PCR and sequencing, but only one line, Sail867_F07, proved to contain the T-DNA insert within the coding region (130 bp upstream of the stop codon) (Figure 1A). Seeds from each of the three lines were sown on soil. For the two lines with insertions outside of the coding sequence, all seeds germinated and homozygous mutant plants exhibited no obvious phenotype. These lines were not considered further. For the line Sail867_F07, only three-quarters of the seeds germinated, and no homozygous mutant plants were obtained. Closer examination of seeds from Sail867_F07 plants heterozygous for the insertion revealed two kinds (Figure 1B); three-quarters of the seeds were wild-type, while the remaining quarter were smaller and darker. PCR amplification of DNA from both kinds of seeds confirmed that the smaller, darker seeds contained homozygous mutant embryos. A small fraction of mutant seeds could be germinated on half-strength Murashige and Skoog medium. The rare seedlings obtained were homozygous for the T-DNA insertion and could be subsequently transferred to soil. The mutant plants show obviously delayed development and delayed flowering and are smaller than the wild type, but the difficulty in reproducibly germinating significant numbers of seeds precluded any rigorous statistical analysis of growth rate. The leaves are often curled (Figure 1C), and the seeds produced from these plants are invariably malformed and impossible to germinate. Perhaps surprisingly, male and female gametogenesis appears to be relatively unaffected; heterozygous plants produce close to 20% phenotypically mutant seeds (38/207), and seed set in Figure 1. The otp43 Mutant Line. (A) T-DNA insertion map of the Sail_867F07 line. (B) Mutant (left) and wild-type (right) seeds from a plant heterozygous for the Sail_867F07 insertion. (C) Rosette from a homozygous otp43 plant growing on soil in short-day conditions. (D) Rosettes growing on soil in short-day conditions, from left to right: wild-type (Columbia [Col-0]), otp43, and complemented otp43. Rosettes from otp43 are 4 weeks older than those of the wild type and the complemented otp43 to approximately match the developmental stages of the plants. homozygous mutants plants is as good as could be expected given the poor growth of the plants. All the phenotypes observed were absent from mutant plants transformed with a genome fragment carrying the wild-type At1g74900 gene (Figure 1D). Molecular Characterization The protein encoded by At1g74900 is strongly predicted by Mitoprot (Claros, 1995) and Predotar (Small et al., 2004) to be mitochondrial, like the majority of PPR proteins. As virtually all of the PPR proteins characterized so far are involved in RNA processing within organelles, we employed a mitochondrial transcriptome mapping approach (C. Andrés, A. Falcon de Longevialle, A.L. Chateigner-Boutin, C. Lurin, and I.D. Small, unpublished data) to gain a general view of mitochondrial transcripts in the mutant plants and find any eventual RNA processing defects. The major defect found in the mutant was an absence of fully spliced nad1 transcript (Figure 2). We thus named this mutant otp43 (for organelle transcript processing defect) in line with other mutants identified by this screen. The nad1 gene encoding

73 3258 The Plant Cell Figure 2. A Splicing Defect in nad1 Intron 1 in otp43. (A) Schematic representation of the localization of the primers used to detect the four splicing events by RT-PCR on the nad1 pre-mrna. 1, nad1exon1f/nad1exon2r; 2, nad1exon2f/nad1exon3r; 3, nad1exon3f/nad1exon4r; 4, nad1exon4f/nad1exon5r; 5, nad1exon1f/nad1exon5r. (B) RT-PCR on Col-0 cdna, on cdna from otp43, and on cdna from complemented otp43 using primers designed to amplify across nad1 splice junctions. No amplification is detected from otp43 with primer pairs 1 and 5, showing that intron 1 is not spliced in the mutant. Molecular weight markers are shown on the right. (C) PCR on cdna from otp43 leaves 48, 72, or 92 h after infiltration with Agrobacterium carrying a T-DNA containing the wild-type OTP43 gene. subunit 1 of Complex I is fragmented into five coding segments that are scattered over at least 175 kb and interspersed with other genes in the Arabidopsis mitochondrial genome. Two trans-splicing events and two cis-splicing events are necessary for the complete maturation of the nad1 transcript. To verify if the absence of spliced nad1 transcript is due to a defect in splicing of a specific intron, we designed primers to detect each splicing event by RT-PCR. In the mutant, trans-spliced mrna joining exon 1 and exon 2 is not detected, whereas the three other introns of nad1 are correctly and efficiently spliced (Figure 2). We tested all 22 other mitochondrial RNA splicing events by quantitative RT-PCR (see Supplemental Figure 1 and Supplemental Table 1 online) without observing any other qualitative differences between the mutant and the wild type. Complementation of the RNA trans-splicing Event by Wild-Type Copies of OTP43 To verify that the RNA splicing defect observed is due to a lack of functional OTP43, we directly transformed mutant plants with a wild-type copy of the gene (including the upstream sequences likely to contain the promoter). As homozygous mutant seeds almost never germinate, we reasoned that transformed seeds could be selected simply by their ability to grow, and this proved to be the case. The seedlings obtained were genotyped and shown to be carrying the OTP43 transgene (see Supplemental Figure 2 online). Their growth and development were indistinguishable from wild-type plants (Figure 1D), and splicing of the nad1 transcript was fully restored (Figure 2B). Incidentally, the easy recovery of complemented seedlings also demonstrates that the defective seed development and germination phenotype is a property of the mutant embryos, not a maternal effect due to the poor growth of the plants. To further investigate the restoration of RNA splicing, we infiltrated leaves of homozygous mutant plants with Agrobacterium tumefaciens carrying the T-DNA construct with the OTP43 gene. By 48 h after inoculation, traces of spliced exon1-exon2 nad1 mrna could be detected by RT-PCR (Figure 2C), and by 92 h, the complete mature nad1 mrna could be amplified. We conclude that the defect observed in nad1 transcript splicing in otp43 plants is solely due to a lack of functional OTP43. New RNA Editing Sites in nad1 Intron 1 and Exon 4 As at least one PPR protein is known to be involved in RNA editing (Kotera et al., 2005), we sequenced cdnas covering the five exons of nad1 cdna and both halves of intron 1 from the mutant in case an RNA editing defect was at the root of the RNA splicing defect. Twenty-four C-to-U editing sites have been described in exons 1, 3, and 5 of nad1 mrna from Arabidopsis (Giegé and Brennicke, 1999).

74 OTP43 Is Needed for nad1 trans-splicing 3259 In wheat (Triticum aestivum), a C-to-U editing event in domain VI of the nad1 intron 1 may have an impact on secondary structure (Li-Pook-Than and Bonen, 2006). In Arabidopsis, as previously described (Carrillo et al., 2001), this site is not edited. However, we found a new C-to-U editing site in domain V of the nad1 intron 1 (Figure 3). This site is correctly edited in the mutant. It has also been demonstrated in wheat that an editing site located very close to the intron/exon junction could be essential for the correct secondary structure of the group II intron and, thus, splicing (Li-Pook-Than et al., 2007). No differences between the mutant and the wild type were observed in any of the nad1 exons, although we did find a new editing site in nad1 exon 4 that was not described from Arabidopsis but has been observed in Brassica napus (Handa, 2003). Thus, the splicing defect is unlikely to be due to a deficiency in editing; furthermore, none of the editing events in nad1 transcripts require prior splicing out of intron 1. Loss of Mitochondrial Complex I The NAD1 protein is a central anchor component of Complex I and would be expected to be essential for assembly of the complex in the membrane. As no mature nad1 mrna is detected, it is highly likely that no NAD1 protein is produced in the mutant plants. No effective antibodies against the highly hydrophobic NAD1 protein are available to verify this. However, separation of mitochondrial complexes by blue-native PAGE and NADH dehydrogenase activity staining (Figure 4A) fail to reveal any trace of Complex I activity. Two-dimensional blue-native/sds-page on the mutant confirms the specific lack of Complex I (Figure 4B); none of the other complexes appear to be affected. We cannot rule out that partial complexes formed from some of the other Figure 3. Secondary Structure Model of Domains V and VI of the Arabidopsis nad1 Intron 1. The C-to-U editing site found in nad 1 intron 1 domain VI in wheat, highlighted in gray, is not edited in Arabidopsis. The second nucleotide highlighted in gray in domain V is a novel C-to-U editing site that was found to be edited in the wild type and in otp43. The underlined adenosine in domain V is a uracil in almost all other group II introns, while the underlined uracil in domain VI lies approximately where the bulged adenosine involved in lariat formation would normally be located. Complex I subunits are still present but not visible under the gel procedures used. Accumulation of Alternative Respiratory Pathway Transcripts and Proteins The previously described Nicotiana and maize mutants lacking Complex I had elevated levels of alternative oxidase (AOX) (Karpova et al., 2002; Dutilleul et al., 2003b). To check whether this Arabidopsis mutant has the same phenotype, we performed quantitative RT-PCR assays for transcripts coding for alternative respiratory pathway proteins, namely, the alternative external (NDB1-4) and internal (NDA1-2 and NDC1) NAD(P)H dehydrogenases and the AOX isoforms AOX1a-c and AOX2 (Figure 5A). The levels of many of these transcripts are significantly altered in the otp43 mutant, and some, such as AOX1c, NDB2, and NDB4, are highly induced. The transcript increases lead to protein accumulation, at least of the AOX, as revealed by a protein gel blot using an antibody against AOX. As shown in Figure 5B, the mutant plants contain considerably increased levels of AOX compared with wild-type plants. DISCUSSION Plant Organellar Splicing Factors cis-spliced group II introns can self-splice in vitro, but both cisand trans-spliced group II introns in the chloroplast and mitochondria require RNA splicing factors in vivo. Each organelle genome contains one group II intron that encodes a conserved maturase protein. In chloroplasts, the matk maturase is suspected to be involved in several different splicing events but is not required for splicing of all introns (Vogel et al., 1999). The other cofactors and RNA splicing factors are encoded by nuclear genes and are imported into organelles. Four of these (CRS1, CRS2, CAF1, and CAF2) that act as factors in splicing of one or more different introns have been identified from maize chloroplasts (Jenkins and Barkan, 2001; Till et al., 2001; Ostheimer et al., 2003, 2005, 2006; Ostersetzer et al., 2005), and a PPR protein has been characterized that is specifically needed for trans-splicing of the rps12 transcript (Schmitz-Linneweber et al., 2006). RNA trans-splicing probably requires more proteins than cis-splicing, and many more may remain to be identified in land plants if we compare the currently known factors with the 14 nuclear genes that are required for the removal of the transspliced introns in the psaa gene in Chlamydomonas reinhardtii chloroplasts (Goldschmidt-Clermont et al., 1990; Merendino et al., 2006). In plant mitochondria, much less is known about RNA splicing factors. Introns in fungal mitochondria usually require the activity of intron-encoded maturases, but various other RNA binding cofactors have been shown to be important for splicing of specific introns. In land plants, the nad1 intron 4 encodes a maturase, but it is not known which introns, if any, require its activity for splicing. Recently, an Arabidopsis nuclear gene encoding a maturase-like protein was shown to be involved in splicing of the mitochondrial nad4 transcript (Nakagawa and Sakurai, 2006), but some RNA splicing still occurs in the mutant described.

75 3260 The Plant Cell Figure 4. Complex I Is Lacking from otp43 Mitochondria. (A) Blue-native gel (left) and NADH dehydrogenase activity staining of the same gel (right) of isolated mitochondrial proteins from Col-0 rosettes and from otp43 rosettes growing in short-day conditions. I and IIIþI indicate the positions of Complex I and the supercomplex of Complex I þ Complex III. (B) Two-dimensional blue-native/sds-page of mitochondrial proteins from Col-0 wild-type plants (left) and otp43 plants (right). The gels are stained with Coomassie blue. Apparent molecular mass of subunits is shown in kilodaltons. Arrows indicate spots that have been identified by mass spectrometry (see Supplemental Table 2 online): 1, 76-kD subunit (At5g37510); 2, 51-kD subunit (At5g08530), ND5 (NP_085478/AtMg01460); 3, ND7 (NP_085511/AtMg00510); 4, 39-kD subunit (At2g20360), ND2 (NP_085584/AtMg01450); 5, CAL1 (At5g63510), 23-kD subunit (At1g79010), ND1 (NP_085565/AtMg01275); 6, ND9 (NP_085479/AtMg0070); 7, 16-kD subunit (At2g27730), PDSW subunit (At3g18410, At1g49140); 8, B14 subunit (At3g12260), B18 subunit (At2g02050); 9, B18 subunit (At2g02050). These proteins are all subunits of Complex I and none are visible in the gel of otp43 proteins. 10 and 19, ATP2 (At5g08670), ATP1 (NP_085571/AtMg01190); 11 and 20, ATP3 (At2g33040); 12 and 21, ATP FAD (At2g21870); 13 and 22, ATP8 (NP_085508/AtMg00480). These proteins, identified in both wild-type and otp43 plants, are all subunits of Complex V. 14 and 23, MPP b (At3g02090); 15 and 24, MPP a (At1g51980); 16 and 25, Cyt c1-1 (At3g27240), Cyt c1-2 (At5g40810), COB (NP_085492/AtMg00220); 17 and 26: URC1 (At5g13430); 18 and 27, QCR7 (At4g32470). These proteins, identified in both wild-type and otp43 plants, are all subunits of Complex III. AMitochondrialtrans-Splicing Factor Our results clearly show that OTP43 is absolutely and specifically required for splicing of the first intron in the mitochondrial nad1 transcript. In comparison, all other introns in the mutant mitochondria are correctly spliced to a large extent. A decrease in splicing of nad2 intron 1 is also observed (see Supplemental Figure 1 online) and could be due to a minor role for OTP43 in splicing of this intron too or to pleiotropic effects of the loss of Complex I. The high degree of specificity of OTP43 resembles that shown for maize PPR4, but the two PPR proteins are not closely related. PPR4 and its probable Arabidopsis ortholog (At5g04810) contain an RNA recognition motif domain, and At5g04810 is the only one of the 450 Arabidopsis PPR proteins to do so. By contrast, At1g74900 is a more typical PPR protein, containing only canonical PPR motifs. There is a putative ortholog of At1g74900 in the rice (Oryza sativa) genome (Os02g45590 using the TIGR 3.0 annotation), as would be expected considering that the presence of nad1 intron 1 is widely conserved across angiosperms. Possible Mechanisms of Action By immunoprecipitating PPR4-RNA complexes from maize chloroplast stromal extract, PPR4 was shown to bind specifically to rps12 intron sequences and thus presumably helps the two intron halves to associate or fold into an active conformation (Schmitz-Linneweber et al., 2006). The extreme difficulty in obtaining sufficient Arabidopsis mitochondrial matrix extract (particularly from the rare mutant plants we have obtained that were needed to carry out the necessary controls) precludes an equivalent test of At1g74900 function. Nevertheless, it is likely that this PPR protein does interact in some way with the nad1 intron 1. A second possibility is that it acts indirectly by being required for expression of another splicing factor (e.g., a small RNA or the mitochondrial matr maturase). A third possibility, which we have partially disproved, is that At1g74900 is required for accumulation and processing of nad1 precursors such that they are in a correct state for RNA splicing. We observed no differences in RNA abundance, editing, or structure of the various nad1 precursor transcripts in the mutant, and, indeed, all other nad1 splicing events take place normally. nad1 Intron 1 Has Some Unique Features Based on extensive phylogenetic, biochemical, mutational, and biophysical data, a consensus sequence has been derived from 112 group IIA/IIB introns (Bonen and Vogel, 2001). The nad1 intron 1 differs from this consensus at several points and has an

76 OTP43 Is Needed for nad1 trans-splicing 3261 Figure 5. Alternative Electron Transport Pathway Transcripts and Proteins Are Induced in otp43. (A) Quantitative RT-PCR on cdna from three independent otp43 plants (otp43-a, otp43-b, and otp43-c). (B) Immunoblot analysis of AOX proteins. Coomassie blue stained SDS-PAGE gel (left) of mitochondrial proteins extracted from wild-type and otp43 plants. This gel was used for a protein gel blot (right) using anti-aox antibodies. Bound antibodies were revealed by chemiluminescence. unconventional domain V sequence with a stem loop of 18 nucleotides instead of the four nucleotides found in the conventional domain V. A second major difference is the presence of an adenosine nine nucleotides downstream from the 59 end of domain V (Figure 3). Among 112 domain V sequences from group II introns, only angiosperm nad1 intron 1 and the Marchantia polymorpha petb intron contain an adenosine at what is usually a highly conserved uracil. The base at this position is thought to be paired with the conserved guanine at position 26 (Costa et al., 1998). The cytidine at position 25 and the guanosine in position 26 are the site of important 29-OH and phosphoryl groups involved in intron structure. Domain VI is also unusual in this intron, and, notably, the bulged adenosine that typically acts as the attacking nucleophile at the 59 splice site in other group II introns is missing (Figure 3). It has been proposed that nad1 intron 1 splicing may involve hydrolysis rather than trans-esterification (Carrillo et al., 2001). It is possible that one or more of these unique features explain the need for a specific splicing factor. Plant Complex I Mutants In Arabidopsis, three nuclear mutants of Complex I have been described so far. The fro1 mutant was identified as being cold sensitive (Lee et al., 2002) and has a mutation affecting the expression of the FRO1, which codes for an 18-kD subunit of Complex I. The phenotype of the fro1 mutant is similar to the phenotype of the otp43 mutant described here: slow growth, retarded development, and delayed germination. However, no problems with seed formation were observed, and the fro1 germination phenotype is less severe. Another mutant contained a T-DNA insertion in a nuclear gene (At1g47260) encoding a subunit of Complex I with some similarity to carbonic anhydrases (Perales et al., 2005). These mutants were not visually distinguishable from wild-type plants, although Complex I activity was decreased by 80%. The third mutant, css1, was identified by its sensitivity to an inhibitor of cellulose biosynthesis (Nakagawa and Sakurai, 2006). The nuclear gene affected in this mutant has a high similarity to group II intron maturases, and the affected plants show impaired splicing of the mitochondrial nad4 transcript. The molecular phenotype of this mutant resembles that of the NMS1 mutant from N. sylvestris, also specifically defective in splicing of nad4 transcripts (Brangeon et al., 2000). Complex I activity was not measured in the css1 mutant, but like the other previously described Arabidopsis Complex I mutants, the overall phenotype appears to be milder than the otp43 mutant described here. Two apparently total knockouts of Complex I activity have been described from other species, and in both cases, they are mitochondrial mutants. The best-characterized mutant to date is the CMSII mutant in N. sylvestris. This mutant carries a mitochondrial deletion in the nad7 gene encoding a 40-kD subunit of Complex I (Pla et al., 1995). The mutant plants develop slowly, exhibit conditional male sterility, and have no detectable Complex I, increased amounts and activity of AOX, and multiple perturbations to primary metabolism (Gutierres et al., 1997, 1999; Lelandais et al., 1998; Sabar et al., 2000; Dutilleul et al., 2003a, 2003b, 2005; Pineau et al., 2005; Priault et al., 2006a, 2006b; Vidal et al., 2007). A second Complex I mutant has been described from maize (Karpova and Newton, 1999). The NCS2 mutant carries a deletion of the 39 end of the nad4 gene. This deletion causes lethality during kernel development, and only mutant plants containing at least some normal mitochondria can propagate, giving rise to striped plants containing sectors with varying ratios of mutant to wild-type mitochondria. The mutant sectors have no Complex I activity but a partially assembled Complex I (Karpova and Newton, 1999). As observed in the CMSII mutant, the amount of AOX is increased in NCS2 sectors (Karpova et al., 2002). Both of these mutants resemble otp43 in that they lack a mitochondrially encoded subunit of Complex I, leading to a partial or complete loss of the complex and a complete loss of activity. However, the physiological effect on the plants is quite distinct; in N. sylvestris, loss of Complex I leads to conditional male sterility but relatively minor effects on growth and seed development. In maize and Arabidopsis, on the contrary, male fertility is near normal, but seed development is severely compromised and plant growth drastically affected (to the point in maize where it is impossible to recover completely mutant plants). Further research is needed to discover whether

77 3262 The Plant Cell these differences are due to differences in the relative importance of Complex I to the physiology of these different species or whether the differences arise because different Complex I subunits are missing in each mutant. TheEffectsofaLossofComplexIActivity Inhibition of Complex I by inhibitors, such as rotenone, or by loss of subunits as in the mutants described above leads to problems with primary metabolism in the affected plants (reviewed in Noctor et al., 2007). The primary entry point for electrons into the electron transport chain is missing, leading to a loss in ATP synthesis and an initial buildup of unoxidized NADH. It has been previously shown in other plants that under these conditions the alternative respiratory pathway is engaged, comprising the induction of alternative NAD(P)H dehydrogenases and AOXs (Gutierres et al., 1997; Sabar et al., 2000; Karpova et al., 2002; Dutilleul et al., 2003b), bypassing the classical cytochrome electron transport chain. Our data show that this response is significantly induced in this mutant, with transcriptional induction of both alternative NADH dehydogenases and AOX and a significant increase in total AOX protein revealed by immunodetection. The availability of an Arabidopsis mutant lacking expression of a major Complex I subunit will be valuable for genetically dissecting the retrograde signaling pathways involved in this response. METHODS Plant Material and Culture Conditions The Arabidopsis thaliana Sail867_F07 mutant from the SAIL collection (Sessions et al., 2002) and Col-0 wild type were germinated on halfstrength Murashige and Skoog medium and 1% sucrose at 228C with a 16-h photoperiod. Two-week-old rosettes were transferred to soil, and plants were grown at 228C with a 8-h photoperiod for isolation of mitochondria and RNA and also for the transient complementation experiments. For the other experiments described, rosettes were transferred to soil and grown at 228C with a 16-h photoperiod. Quantitative RT-PCR Analysis Quantitative RT-PCR was performed using LightCycler 480 SYBR Green I Master Mix (Roche Diagnostics) and a LightCycler 480 Roche real-time PCR system with the following thermal cycling program: 958C for 10 min, followed by 18 touchdown cycles of denaturation at 948C for 10 s, 858C ( 28C per cycle) for 10 s, and extension at 728C for 20 s, followed by 40 cycles of 958C for 10 s, 508C for 10 s, and 728C for 20 s. Primer sequences used were as follows: AOX1a (At3g22370) forward (F), 59-GACGGTCCG- TACGGTTTCG-39, and reverse (R), 59-CTTCTGATTCGCGTCCTCCT- CCT-39; AOX1c (At3g27620) F, 59-GCATCAAAGCAAGCGACATCC-39, and R, 59-TGGCTTCACGCCCCAATAAC-39; NDA1 (At1g07180) F, 59-GTCCGTGAGAGCAAGGAAGG-39, and R, 59-GGCGAAGTGGAGGG- GATATG-39; NDA2 (At2g29990) F, 59-CGAGAGCAAGGACGCAAAAG-39, and R, 59-CAGTAGGCCGAGATTGAGAC-39; NDB1 (At4g28220) F, 59-CTGTGACTGATAAAGATATC-39, and R, 59-GCCAACTGCATATA- CATTC-39; NDB2 (At4g05020) F, 59-CTGACTCTCTCAAAGAGTTCC-39, and R, 59-CGATTTGAACTCTTCGATC-39; NDB3 (At4g21490) F, 59-GCA- AATCCATCATATAGCAAC-39,andR,59-CAAGGGAGTGAAAGCAAAG-39; NDB4 (At2g20800) F, 59-TCAAGTCTTAAGGGCACAACA-39,andR,59-CGG- AAGAGAGAGGCTCTCTCG-39; NDC1 (At5g08740) F, 59-TCCATAAAGA- GAGCAAGCAAC-39,andR,59-CGAATCACCTAATGCAAATATC-39;Actin2.8, Actin2 (At3g18780), and Actin8 (At1g49240) F, 59-GGTAACATTGTGCT- CAGTGGTGG-39,andR,59-AACGACCTTAATCTTCATGCTGC-39.Actin2.8 was used as an internal reference amplicon. Data were analyzed using LightCycler 480 software version 1.2 (Roche Diagnostics). Complementation Genomic DNA fragments were amplified using Pfx polymerase (Invitrogen) and the primers 59-AAGGTACCAGGGACCCAATTTTCTTTGA-39 and 59-AAGGTACCGGGAGCAGCCACACTATCTC-39. The products were subcloned into pgem-t Easy (Promega) and sequenced. The resulting plasmid was cut by KpnI and transferred into pcambia-1301 (www. cambia.org). The resulting vector was transformed into Agrobacterium tumefaciens GV3101pMP90 and used for infiltration of leaves and floral dip transformation. Agrobacterium-mediated transientexpression byleaf infiltration assays was performed with this strain as described by Marois et al. (2002) and floral dip transformation of homozygous plants as described by Clough and Bent (1998). Resulting seeds were sown on soil without selection because only transformed seeds can germinate and grow. DNA and RNA Isolation and RT-PCR Analysis Leaf DNA was isolated using the DNA plant extraction protocol as described by Edwards et al. (1991), and 10 ng from the extraction was used for PCR with primers sail_867_f07_lp (59-TGGTTACAGGAGA- CTCGGTTG-39), sail_867_f07_rp (59-GGTGAGGAGAGGTTATGAGCC-39), and LB1 (59-GCCTTTTCAGAAATGGATAAATAGCCTTGCTTCC-39). Leaf RNA was isolated using the plant RNeasy extraction kit (Qiagen) according to the manufacturer s protocols. The leaf RNA was treated with DNase (Ambion) according to the manufacturer s protocols, and 3 mg was reverse transcribed with Superscript III (Invitrogen) according to the manufacturer s directions using random hexamers (Invitrogen). Primers designed to detect splice junctions were as follows: nad1exon1f (59-GCAACGTAGAAAGGGTCCTG-39), nad1exon2r (59-TGAGCTGCAGA- TCGTAATGC-39), nad1exon2f (59-TCGAAATATGCCTTTCTAGGAG-39), nad1exon3r (59-ATTCAGCTTCCGCTTCTGG-39), nad1exon3f (59-GTC- ATGGCGCAAAAGCAGATATGG-39), nad1exon4r (59-AGAGCAGACCC- CATTGAAGA-39), nad1exon4f (59-TCTTCAATGGGGTCTGCTCT-39), and nad1exon5r (59-AGGAAGCCATTGAAAGGTGA-39). One microliter of a 33-fold dilution of the reverse transcription reaction was used for PCR with Taq DNA polymerase (New England Biolabs). Mitochondrial Isolation Ten grams of plant tissue were ground in extraction buffer (0.45 M sucrose, 1.5 mm EDTA, 0.2% BSA, 0.6% PVP40, and 15 mm MOPS/ KOH, ph 7.4) using a mortar and pestle. The resulting extract was filtered through two layers of Miracloth and spun 5 min at 2500g. The pellet was discarded, and the supernatant was spun 10 min at 15,000g at 48C. The pellet was resuspended in 1 ml of wash buffer (0.3 M sucrose and 10 mm MOPS/KOH, ph 7.2), loaded on a linear 0 to 4% (w/v) PVP-40 gradient in wash buffer containing 28% Percoll, and spun 45 min at 40,000g at 48C. The mitochondrial band located in the bottom of the gradient was recovered, diluted in wash buffer, and loaded on top of a 35% Percoll gradient and spun 45 min at 40,000g at 48C. Mitochondria form a band in the top part of the gradient. This band was collected and washed twice in wash buffer. Blue-Native and Two-Dimensional SDS-PAGE and NADH Dehydrogenase Activity Stain Four hundred micrograms of mitochondrial membrane proteins were solubilized in 1% N-dodecylmaltoside in ACA750 buffer as described

78 OTP43 Is Needed for nad1 trans-splicing 3263 by Schagger and von Jagow (1991). Blue-native strips were excised, incubated in 1% (w/v) SDS and 1% (w/v) b-mercaptoethanol for 30 min to denature the complexes, and placed horizontally on top of a 12% SDS- PAGE. The resulting gels were stained with colloidal Coomassie Brilliant Blue G 250 as described previously (Millar et al., 2001). The NADH dehydrogenase activity of Complex I was revealed by incubating the Blue-Native gel in 1 mm nitroblue tetrazolium and 0.14 mm NADH in 0.1 M Tris, ph 7.4. The reaction was stopped by soaking the gel in fixing solution (30% [v/v] methanol and 10% [v/v] acetic acid). ACKNOWLEDGMENTS This research was supported by Australian Research Council Centre of Excellence Grant CE and the European Union Framework 5 project AGRIKOLA (QLRT ). I.D.S. is a WA Premier s fellow, A.H.M. is an Australian Research Council Professorial fellow, and N.L.T. is an Australian Research Council postdoctoral fellow. We thank Kate Howell and Etienne Delannoy for the primers used for quantitative RT-PCR. Immunoblot Analysis Proteins were separated by SDS-PAGE and transferred onto a PVDF membrane (Amersham Pharmacia Biotech). Protein gel blots with AOX antibodies were performed at a dilution of 1/5000. Goat anti-mouse antibodies conjugated to horseradish peroxidase (GE Healthcare) were used as secondary antibodies and revealed with ECL reagents (GE Healthcare). Identification of Gel Spots by Mass Spectrometry The protein samples to be analyzed were cut from the gels, destained in 10 mm NH 4 CO 3 and 50% (v/v) acetonitrile, dehydrated at 508C, rehydrated with 15 ml of digestion solution (10 mm NH 4 CO 3 and 12.5 mg/ml of trypsin in 0.01% trifluoroacetic acid), and incubated overnight at 378C. Peptides were extracted according to Taylor et al. (2005). Samples were loaded onto self-packed Microsorb C18 (5 mm, 100 Å; Varian) reverse phase columns ( mm) using an Agilent Technologies 1100 series capillary liquid chromatography system and eluted into a XCT Ultra IonTrap mass spectrometer (Agilent Technologies) with an electrospray ionization source equipped with a low flow nebulizer in positive mode and controlled by Chemstation (rev B [204]; Agilent Technologies) and MSD Trap Control version 6.0 software (build 38.15; Bruker Daltonik). Peptides were eluted from the C18 reverse phase column at 10 ml/min using a 9-min acetonitrile gradient (5 to 60%) in 0.1% formic acid at a regulated temperature of 508C. Ions were selected for tandem mass spectrometry (MS/MS) after reaching an intensity of 25,000 counts per second, and two precursor ions were selected from the initial MS scan. The resulting MS/MS spectra were exported, and the extracted results were queried against the Arabidopsis protein set (TAIR7) using the Mascot search engine v (Matrix Science) using error tolerances of D for MS and D for MS/MS, maximum missed cleavages set to 1,and peptide chargeset at 2þ and3þ. Results were filtered using standard scoring, maximum number of hits set to 20, significance threshold at P < 0.05, and ion score cutoff at 0. Accession Number Sequence data from this article can be found in the Arabidopsis Genome Initiative database under accession number At1g74900 (OTP43). Supplemental Data The following materials are available in the online version of this article. Supplemental Figure 1. Intron Splicing in otp43 Mutant Plants. Supplemental Figure 2. Genotyping of Complemented otp43 Plants. Supplemental Table 1. Primers Used for RT-PCR Assays. Supplemental Table 2. Mass Spectrometry Results from the Analysis of Two-Dimensional BN-PAGE Gels. Received August 7, 2007; revised September 26, 2007; accepted October 3, 2007; published October 26, REFERENCES Adam-Vizi, V., and Chinopoulos, C. (2006). Bioenergetics and the formation of mitochondrial reactive oxygen species. Trends Pharmacol. Sci. 27: Andres, C., Lurin, C., and Small, I.D. (2007). The multifarious roles of PPR proteins in plant mitochondrial gene expression. Physiol. Plant. 129: Asakura, Y., and Barkan, A. (2006). Arabidopsis orthologs of maize chloroplast splicing factors promote splicing of orthologous and speciesspecific group II introns. Plant Physiol. 142: Aubourg, S., Boudet, N., Kreis, M., and Lecharny, A. (2000). In Arabidopsis thaliana, 1% of the genome codes for a novel protein family unique to plants. Plant Mol. Biol. 42: Bonen, L., and Vogel, J. (2001). The ins and outs of group II introns. Trends Genet. 17: Brandt, U. (2006). Energy converting NADH:quinone oxidoreductase (complex I). Annu. Rev. Biochem. 75: Brangeon, J., Sabar, M., Gutierres, S., Combettes, B., Bove, J., Gendy, C., Chetrit, P., Des Francs-Small, C.C., Pla, M., Vedel, F., and De Paepe, R. (2000). Defective splicing of the first nad4 intron is associated with lack of several complex I subunits in the Nicotiana sylvestris NMS1 nuclear mutant. Plant J. 21: Carrillo, C., Chapdelaine, Y., and Bonen, L. (2001). Variation in sequence and RNA editing within core domains of mitochondrial group II introns among plants. Mol. Gen. Genet. 264: Claros, M.G. (1995). MitoProt, a Macintosh application for studying mitochondrial proteins. Comput. Appl. Biosci. 11: Clough, S.J., and Bent, A.F. (1998). Floral dip: A simplified method for Agrobacterium-mediated transformation of Arabidopsis thaliana. Plant J. 16: Costa, M., Christian, E.L., and Michel, F. (1998). Differential chemical probing of a group II self-splicing intron identifies bases involved in tertiary interactions and supports an alternative secondary structure model of domain V. RNA 4: Dutilleul, C., Driscoll, S., Cornic, G., De Paepe, R., Foyer, C.H., and Noctor, G. (2003a). Functional mitochondrial complex I is required by tobacco leaves for optimal photosynthetic performance in photorespiratory conditions and during transients. Plant Physiol. 131: Dutilleul, C., Garmier, M., Noctor, G., Mathieu, C., Chetrit, P., Foyer, C.H., and de Paepe, R. (2003b). Leaf mitochondria modulate whole cell redox homeostasis, set antioxidant capacity, and determine stress resistance through altered signaling and diurnal regulation. Plant Cell 15: Dutilleul, C., Lelarge, C., Prioul, J.L., De Paepe, R., Foyer, C.H., and Noctor, G. (2005). Mitochondria-driven changes in leaf NAD status exert a crucial influence on the control of nitrate assimilation and the

79 3264 The Plant Cell integration of carbon and nitrogen metabolism. Plant Physiol. 139: Edwards, K., Johnstone, C., and Thompson, C. (1991). A simple and rapid method for the preparation of plant genomic DNA for PCR analysis. Nucleic Acids Res. 19: Giegé, P., and Brennicke, A. (1999). RNA editing in Arabidopsis mitochondria effects 441 C to U changes in ORFs. Proc. Natl. Acad. Sci. USA 96: Goldschmidt-Clermont, M., Girard-Bascou, J., Choquet, Y., and Rochaix, J.D. (1990). Trans-splicing mutants of Chlamydomonas reinhardtii. Mol. Gen. Genet. 223: Gutierres, S., Combettes, B., De Paepe, R., Mirande, M., Lelandais, C., Vedel, F., and Chetrit, P. (1999). In the Nicotiana sylvestris CMSII mutant, a recombination-mediated change 59 to the first exon of the mitochondrial nad1 gene is associated with lack of the NADH: ubiquinone oxidoreductase (complex I) NAD1 subunit. Eur. J. Biochem. 261: Gutierres, S., Sabar, M., Lelandais, C., Chetrit, P., Diolez, P., Degand, H., Boutry, M., Vedel, F., de Kouchkovsky, Y., and De Paepe, R. (1997). Lack of mitochondrial and nuclear-encoded subunits of complex I and alteration of the respiratory chain in Nicotiana sylvestris mitochondrial deletion mutants. Proc. Natl. Acad. Sci. USA 94: Handa, H. (2003). The complete nucleotide sequence and RNA editing content of the mitochondrial genome of rapeseed (Brassica napus L.): Comparative analysis of the mitochondrial genomes of rapeseed and Arabidopsis thaliana. Nucleic Acids Res. 31: Hattori, M., Miyake, H., and Sugita, M. (2007). A pentatricopeptide repeat protein is required for RNA processing of clpp pre-mrna in moss chloroplasts. J. Biol. Chem. 282: Heazlewood, J.L., Howell, K.A., and Millar, A.H. (2003). Mitochondrial complex I from Arabidopsis and rice: Orthologs of mammalian and fungal components coupled with plant-specific subunits. Biochim. Biophys. Acta 1604: Hilson, P., et al. (2004). Versatile gene-specific sequence tags for Arabidopsis functional genomics: Transcript profiling and reverse genetics applications. Genome Res. 14: Janssen, R.J., Nijtmans, L.G., van den Heuvel, L.P., and Smeitink, J.A. (2006). Mitochondrial complex I: Structure, function and pathology. J. Inherit. Metab. Dis. 29: Jenkins, B.D., and Barkan, A. (2001). Recruitment of a peptidyl-trna hydrolase as a facilitator of group II intron splicing in chloroplasts. EMBO J. 20: Karpova, O.V., Kuzmin, E.V., Elthon, T.E., and Newton, K.J. (2002). Differential expression of alternative oxidase genes in maize mitochondrial mutants. Plant Cell 14: Karpova, O.V., and Newton, K.J. (1999). A partially assembled complex I in NAD4-deficient mitochondria of maize. Plant J. 17: Kotera, E., Tasaka, M., and Shikanai, T. (2005). A pentatricopeptide repeat protein is essential for RNA editing in chloroplasts. Nature 433: Lee, B.H., Lee, H., Xiong, L., and Zhu, J.K. (2002). A mitochondrial complex I defect impairs cold-regulated nuclear gene expression. Plant Cell 14: Lelandais, C., Albert, B., Gutierres, S., De Paepe, R., Godelle, B., Vedel, F., and Chetrit, P. (1998). Organization and expression of the mitochondrial genome in the Nicotiana sylvestris CMSII mutant. Genetics 150: Li-Pook-Than, J., and Bonen, L. (2006). Multiple physical forms of excised group II intron RNAs in wheat mitochondria. Nucleic Acids Res. 34: Li-Pook-Than, J., Carrillo, C., Niknejad, N., Calixte, S., Crosthwait, J., and Bonen, L. (2007). Relationship between RNA splicing and exon editing near intron junctions in wheat mitochondria. Physiol. Plant. 129: Lurin, C., et al. (2004). Genome-wide analysis of Arabidopsis pentatricopeptide repeat proteins reveals their essential role in organelle biogenesis. Plant Cell 16: Malek, O., and Knoop, V. (1998). Trans-splicing group II introns in plant mitochondria: The complete set of cis-arranged homologs in ferns, fern allies, and a hornwort. RNA 4: Marois, E., Van den Ackerveken, G., and Bonas, U. (2002). The Xanthomonas type III effector protein AvrBs3 modulates plant gene expression and induces cell hypertrophy in the susceptible host. Mol. Plant Microbe Interact. 15: Meierhoff, K., Felder, S., Nakamura, T., Bechtold, N., and Schuster, G. (2003). HCF152, an Arabidopsis RNA binding pentatricopeptide repeat protein involved in the processing of chloroplast psbb-psbtpsbh-petb-petd RNAs. Plant Cell 15: Merendino, L., Perron, K., Rahire, M., Howald, I., Rochaix, J.D., and Goldschmidt-Clermont, M. (2006). A novel multifunctional factor involved in trans-splicing of chloroplast introns in Chlamydomonas. Nucleic Acids Res. 34: Millar, A.H., Sweetlove, L.J., Giege, P., and Leaver, C.J. (2001). Analysis of the Arabidopsis mitochondrial proteome. Plant Physiol. 127: Nakagawa, N., and Sakurai, N. (2006). A mutation in At-nMat1a, which encodes a nuclear gene having high similarity to group II intron maturase, causes impaired splicing of mitochondrial NAD4 transcript and altered carbon metabolism in Arabidopsis thaliana. Plant Cell Physiol. 47: Nakamura, T., Schuster, G., Sugiura, M., and Sugita, M. (2004). Chloroplast RNA-binding and pentatricopeptide repeat proteins. Biochem. Soc. Trans. 32: Noctor, G., De Paepe, R., and Foyer, C.H. (2007). Mitochondrial redox biology and homeostasis in plants. Trends Plant Sci. 12: Okuda, K., Myouga, F., Motohashi, R., Shinozaki, K., and Shikanai, T. (2007). Conserved domain structure of pentatricopeptide repeat proteins involved in chloroplast RNA editing. Proc. Natl. Acad. Sci. USA 104: Ostersetzer, O., Cooke, A.M., Watkins, K.P., and Barkan, A. (2005). CRS1, a chloroplast group II intron splicing factor, promotes intron folding through specific interactions with two intron domains. Plant Cell 17: Ostheimer, G.J., Hadjivassiliou, H., Kloer, D.P., Barkan, A., and Matthews, B.W. (2005). Structural analysis of the group II intron splicing factor CRS2 yields insights into its protein and RNA interaction surfaces. J. Mol. Biol. 345: Ostheimer, G.J., Rojas, M., Hadjivassiliou, H., and Barkan, A. (2006). Formation of the CRS2-CAF2 group II intron splicing complex is mediated by a 22-amino acid motif in the COOH-terminal region of CAF2. J. Biol. Chem. 281: Ostheimer, G.J., Williams-Carrier, R., Belcher, S., Osborne, E., Gierke, J., and Barkan, A. (2003). Group II intron splicing factors derived by diversification of an ancient RNA-binding domain. EMBO J. 22: Perales, M., Eubel, H., Heinemeyer, J., Colaneri, A., Zabaleta, E., and Braun, H.P. (2005). Disruption of a nuclear gene encoding a mitochondrial gamma carbonic anhydrase reduces complex I and supercomplex I þ III 2 levels and alters mitochondrial physiology in Arabidopsis. J. Mol. Biol. 350: Pineau, B., Mathieu, C., Gerard-Hirne, C., De Paepe, R., and Chetrit, P. (2005). Targeting the NAD7 subunit to mitochondria restores a functional complex I and a wild type phenotype in the Nicotiana sylvestris CMS II mutant lacking nad7. J. Biol. Chem. 280:

80 OTP43 Is Needed for nad1 trans-splicing 3265 Pla, M., Mathieu, C., De Paepe, R., Chetrit, P., and Vedel, F. (1995). Deletion of the last two exons of the mitochondrial nad7 gene results in lack of the NAD7 polypeptide in a Nicotiana sylvestris CMS mutant. Mol. Gen. Genet. 248: Priault, P., Fresneau, C., Noctor, G., De Paepe, R., Cornic, G., and Streb, P. (2006a). The mitochondrial CMSII mutation of Nicotiana sylvestris impairs adjustment of photosynthetic carbon assimilation to higher growth irradiance. J. Exp. Bot. 57: Priault, P., Tcherkez, G., Cornic, G., De Paepe, R., Naik, R., Ghashghaie, J., and Streb, P. (2006b). The lack of mitochondrial complex I in a CMSII mutant of Nicotiana sylvestris increases photorespiration through an increased internal resistance to CO 2 diffusion. J. Exp. Bot. 57: Rivals, E., Bruyere, C., Toffano-Nioche, C., and Lecharny, A. (2006). Formation of the Arabidopsis pentatricopeptide repeat family. Plant Physiol. 141: Sabar, M., De Paepe, R., and de Kouchkovsky, Y. (2000). Complex I impairment, respiratory compensations, and photosynthetic decrease in nuclear and mitochondrial male sterile mutants of Nicotiana sylvestris. Plant Physiol. 124: Schagger, H., and von Jagow, G. (1991). Blue native electrophoresis for isolation of membrane protein complexes in enzymatically active form. Anal. Biochem. 199: Schmitz-Linneweber, C., Williams-Carrier, R., and Barkan, A. (2005). RNA immunoprecipitation and microarray analysis show a chloroplast pentatricopeptide repeat protein to be associated with the 59 region of mrnas whose translation it activates. Plant Cell 17: Schmitz-Linneweber, C., Williams-Carrier, R.E., Williams-Voelker, P.M., Kroeger, T.S., Vichas, A., and Barkan, A. (2006). A pentatricopeptide repeat protein facilitates the trans-splicing of the maize chloroplast rps12 pre-mrna. Plant Cell 18: Sessions, A., et al. (2002). A high-throughput Arabidopsis reverse genetics system. Plant Cell 14: Small, I., Peeters, N., Legeai, F., and Lurin, C. (2004). Predotar: A tool for rapidly screening proteomes for N-terminal targeting sequences. Proteomics 4: Small, I.D., and Peeters, N. (2000). The PPR motif - A TPR-related motif prevalent in plant organellar proteins. Trends Biochem. Sci. 25: Sugiyama, Y., Watase, Y., Nagase, M., Makita, N., Yagura, S., Hirai, A., and Sugiura, M. (2005). The complete nucleotide sequence and multipartite organization of the tobacco mitochondrial genome: Comparative analysis of mitochondrial genomes in higher plants. Mol. Genet. Genomics 272: Taylor, N.L., Heazlewood, J.L., Day, D.A., and Millar, A.H. (2005). Differential Impact of environmental stresses on the pea mitochondrial proteome. Mol. Cell. Proteomics 4: Till, B., Schmitz-Linneweber, C., Williams-Carrier, R., and Barkan, A. (2001). CRS1 is a novel group II intron splicing factor that was derived from a domain of ancient origin. RNA 7: Vidal, G., Ribas-Carbo, M., Garmier, M., Dubertret, G., Rasmusson, A.G., Mathieu, C., Foyer, C.H., and De Paepe, R. (2007). Lack of respiratory chain complex I impairs alternative oxidase engagement and modulates redox signaling during elicitor-induced cell death in tobacco. Plant Cell 19: Vogel, J., Borner, T., and Hess, W.R. (1999). Comparative analysis of splicing of the complete set of chloroplast group II introns in three higher plant mutants. Nucleic Acids Res. 27:

81 Supplemental Figures. de Longevialle et al. (2007). The Pentatricopeptide Repeat Gene OTP43 is Required for trans-splicing of the Mitochondrial nad1 Intron 1 in Arabidopsis thaliana. Log2(ratio Spliced/Unspliced) rpl2 intron1 rps3 intron1 cox2 intron1 ccb452 intron1 nad1 intron1 nad1 intron2 nad1 intron3 nad1 intron4 nad2 intron1 nad2 intron2 nad2 intron3 nad2 intron4 nad4 intron1 nad4 intron2 nad4 intron3 nad5 intron1 nad5 intron2 nad5 intron3 nad5 intron4 nad7 intron1 nad7 intron2 nad7 intron3 nad7 intron4 Supplemental Figure 1. The change in ratios of spliced to unspliced introns in otp43 mutants compared to complemented otp43 plants. Quantitative RT-PCR was carried out using using primers designed to amplify across splice junctions (to quantify spliced mrna) and intron-exon junctions (to quantify unspliced mrna). The primer sequences used are described in Supplemental Table 1. The ratio of amplified spliced products to unspliced products for each splicing event was calculated after normalising the quantities of each product against those in the complemented plants. The thermal cycling program used was: 95 C for 10 min, followed by 40 cycles of 95 C for 10 sec, 60 C for 10 sec, 72 C for 20 sec. Data were analysed using the LightCycler 480 software version 1.2 (Roche Diagnostics).

82 A otp43 complemented col0 B otp43 complemented col0 C otp43 complemented col0 Supplemental Figure 2. Genotyping of complemented otp43 plants. PCR products from genomic DNA from seven independent otp43 transformants complemented with the wildtype OTP43 gene. A PCR products from genomic DNA using the primer pair LP_Sail867F07-RP_Sail867F07 to amplify the wild type At1g74900 locus. The LP_Sail867F07 primer binds outside of the fragment used for complementation. The lack of amplification from the seven complemented lines indicates all of them are homozygous for the Sail_867_F07 insertion. B. PCR products from genomic DNA using the primer pair RP_Sail867F07-LB1. This primer pair amplifies the left border and flanking sequence of the Sail_867_F07 insertion. The amplification product from the complemented plants confirm that they contain the Sail_867_F07 insertion. C. PCR products from genomic DNA using primer pairs designed to amplify a fragment of the E. coli gusa gene incorporated in the T-DNA carrying the wild-type copy of At1g74900 used for complementation. This indicates that all seven plants do carry the complementing T-DNA. All seven plants had wild-type growth rates and morphology. DNA size markers are 1 kb Plus Ladder (Invitrogen). LP_Sail867F07, RP_Sail867F07 and LB1 primers are described in Methods. The primers used to amplify gusa were: gus_f 5 -CTGATAGCGCGTGACAAAAA-3 ; gus_r 5 -GGCACAGCACATCAAAGAGA-3.

83 RESULTATS Supplemental Table 1 82

84 RESULTATS Supplemental Table 2 83

85 RESULTATS II.2.2 TANG2 TANG2 est une PPR de type «Pure» qui a été identifiée par Yunhai Li dans l équipe de Mike Bevan au cours d un crible de mutants sensibles au glucose. Le mutant présente un retard de développement, et des graines plus foncées. Ce phénotype très similaire au mutant otp43 ainsi qu à d autres mutants des sous-unités du complexe I étudiés par Etienne Meyer comme ndufs4 (Meyer, Tomaz et al. 2009) suggère un défaut éventuel de l activité du complexe I. En collaboration avec l équipe de Mike Bevan, j ai donc eu l opportunité d étudier plus en détails le mutant tang2 et ainsi d identifier le défaut moléculaire associé. Cette étude décrite dans le papier suivant montre que cette protéine PPR est impliquée dans l épissage en trans de l intron 3 de nad5, ce qui fait de cette protéine la deuxième protéine PPR décrite comme ayant un rôle dans l épissage d introns mitochondriaux. Mon rôle dans la caractérisation de ce mutant a été d identifier le défaut moléculaire en utilisant les outils de transcriptomique mis en place dans le laboratoire de Ian Small. Ainsi, des expériences de RT- PCR, de PCR quantitative sur l expression des gènes mitochondriaux, mais aussi sur les évènements d épissage, et des expériences de northern blot sur certains transcrits mitochondriaux ont permis de mettre en évidence en grande partie la fonction de TANG2. Article 4 : Li Y., Smith C., Colas des Francs-Small C., de Longevialle A.F., Corke F., Zheng L., Tanz S., Small I.D. and Bevan M.W. (2010) TANG2, a Glucose-Responsive Gene, Encodes a Pentatricopeptide Repeat Protein Required for Splicing of Mitochondrial nad5 Transcripts, in submission. 84

86 RESULTATS TANG2, a Glucose-Responsive Gene, Encodes a Pentatricopeptide Repeat Protein Required for Splicing of Mitochondrial nad5 Transcripts Yunhai Li a,b,1, Caroline Smith a, Catherine Colas des Francs-Small c, Andéol Falcon de Longevialle c, Fiona Corke a, Leiying Zheng a, Sandra K. Tanz c, Ian Small c, and Michael W. Bevan a,1 UK. a Department of Cell and Developmental Biology, John Innes Centre, Norwich NR4 7UH, b State Key Laboratory of Plant Cell and Chromosome Engineering, Institute of Genetics and Developmental Biology, Chinese Academy of Sciences, Beijing , China c Australian Research Council of Excellence in Plant Energy Biology, University of Western Australia, Crawley 6009 WA, Australia. 1 Corresponding authors Telephone: 86 (10) ; Fax: 86 (10) Telephone: 44 (1603) ; Fax: 44 (1603) Running title: The TANG2 PPR protein splices mitochondrial nad5 transcripts Key words: tang2, sugar responses, PPR, Complex I, splicing of mitochondrial genes 85

87 RESULTATS ABSTRACT Pentatricopeptide repeat (PPR) proteins are RNA binding proteins required for RNA editing, splicing, cleavage and translation of mitochondrial and chloroplast transcripts. Mutations in PPR genes lead to diverse organelle defects, cytoplasmic male sterility and a wide variety and severity of other phenotypes. We have identified an Arabidopsis nuclear PPR gene called TANG2 that is specifically required for splicing of intron 3 of the mitochondrial nad5 gene. This defect leads to substantially reduced, but not absent, Complex I activity. tang2 mutant plants have substantially elevated glucose, sucrose and anthocyanin levels, increased expression of sugar-responsive genes, and greatly enhanced sensitivity of seedling growth and development to high glucose levels. Expression of the TANG2 gene is rapidly induced by glucose and is expressed in tissues with a high energy demand, suggesting nad5 splicing by TANG2 responds to available energy sources such as sugars. 86

88 RESULTATS INTRODUCTION Metabolism of sugars in the glycolytic and TCA pathways produces reducing equivalents that generate ATP in the oxidative phosphorylation pathway in mitochondria. The oxidative phosphorylation system is located on the inner mitochondrial membrane and is composed of five enzyme complexes. Complex I (NADH:ubiquinone oxidoreductase) is the main entry point for electrons and is composed of more than 40 subunits in Arabidopsis (Heazlewood, Howell et al. 2003), of which nine are encoded by the mitochondrial genome. The centrally important role of Complex I in cellular energetics is reflected in the multiple effects of mutations and chemicals that reduce Complex I function. In plants the best-known effect of altered Complex I mitochondrial loci is cytoplasmic male sterility (CMS) (Chase 2007). This maternally-inherited trait is characterised by mitochondrial dysfunctions that result in nonviable pollen. The Nicotiana sylvestris CMSII mutant, which lacks functional Complex I, respires using alternative NADH dehydrogenases and alternative oxidase, and manages a high photosynthetic capacity (Dutilleul, Driscoll et al. 2003). However, Complex I activity was needed for optimal photosynthetic performance when both respiratory and photorespiratory substrates needed to be oxidised simultanteously. Inhibition of Complex I activity by rotenone (Garmier, Carroll et al. 2008) caused a transient decrease in respiration, a subsequent acclimation by the induction of alternative oxidase, and reduced growth. This study also identified a physical and functional dissociation of glycolytic enzymes from mitochondria in response to reduced Complex I activity and associated changes in carbon metabolism reflecting the activation of compensatory pathways. Rotenone treatment also led to increased expression of nuclear genes encoding mitochondrial proteins. This was thought to be be due to retrograde signalling from the mitochondria to the nucleus mediated by cellular redox status (Garmier, Carroll et al. 2008). Another link between reduced Complex I function and nuclear gene expression was shown by the reduced cold-induced gene expression in the fro1 mutant, which is defective in the 18- kd Fe-S subunit of complex I (Lee, Lee et al. 2002). fro1 mutant lines exhibited reduced cold acclimation and accumulate reactive oxygen species (ROS) that are involved in cold signalling. Five of the nine mitochondrial nad genes encoding Complex I subunits are composed of exons that need to be spliced to create functional complex I subunits. The nad1, nad2 and nad5 transcripts are trans-spliced via type II introns (Malek and Knoop 1998) in a process that probably requires RNA splicing factors. Several factors involved in splicing analogous chloroplast introns have been identified, including a pentatricopeptide repeat (PPR) protein that is required for trans-splicing of rps12 transcripts (Schmitz-Linneweber, Williams-Carrier et al. 2006). PPR proteins are also necessary for RNA editing, processing and stabilisation 87

89 RESULTATS (Schmitz-Linneweber and Small 2008; Zhou, Cheng et al. 2008; Okuda, Chateigner-Boutin et al. 2009; Zehrmann, Verbitskiy et al. 2009). PPR proteins are encoded by a relatively large family of 450 genes in Arabidopsis (Lurin, Andres et al. 2004) and other land plants (O'Toole, Hattori et al. 2008) that are predicted to be predominantly located to mitochondria or plastids. Biochemical studies have shown the PPR repeat regions, comprising a canonical 35 amino acid motif repeated in tandem up to 30 times, bind different types of RNA. An understanding of PPR function is emerging in which PPR repeats function as RNA-binding specificity determinants and other domains and interacting proteins provide functions for splicing and editing (Schmitz-Linneweber and Small 2008). A reverse genetic screen of members of the Arabidopsis PPR gene family using RNAi (Hilson, Allemeersch et al. 2004) identified the PPR gene OTP43 as a mitochondrial transsplicing factor that is specifically required for splicing of intron 1 of the nad1 transcript in Arabidopsis (de Longevialle, Meyer et al. 2007). Complex 1 activity was absent in the mutant, which exhibited severely impaired germination and reduced growth and development. The otp43 mutant also led to increased expression of alternative NAD(P)H dehydrogenases and alternative oxidases to bypass the Complex 1 defect, similar to that seen in rotenone- treated cells (Garmier, Carroll et al. 2008) and the Nicotiana CMSII mutant (Dutilleul, Driscoll et al. 2003). Key questions in the biology of PPR proteins concern the specific role of individual family members in organelle RNA metabolism and whether PPR proteins may have a role, as nuclear- encoded genes, in coordinating the functions of organelles in a cellular context. Here we characterise the tang2 mutant, exhibiting extreme sugar-sensitive growth, as being defective in a sugar-inducible PPR gene. Complex I activity is reduced in tang2 due to decreased splicing of mitochondrial nad5 transcripts, demonstrating a specific role of TANG2 in mitochondrial RNA processing. RESULTS The Sugar-Inducible Gene TANG2 Encodes a Pentatricopeptide Repeat Protein Microarray data has revealed that the expression of thousands of genes was rapidly altered in response to glucose (Li, Lee et al. 2006). To further understand the biological functions of these sugar-responsive genes, we are characterizing their functions, and here we describe the function of the glucose-inducible gene At1g We first confirmed the glucose induction of this gene using quantitative RT-PCR (Fig.1A) and called the gene TANG2 (TANG means sugar in Chinese). This gene has a single exon and is predicted to 88

90 Figure 1. Expression of TANG2 gene. (A) Quantitative RT PCR analysis revealed that expression of TANG2 is induced by glucose. Seven-day-old wild-type seedlings were treated with 3% glucose or mannitol for 2, 4, and 6h. B. Cartoon of the predicted structure of TANG2 showing 17 canonical PPR repeats. (C-H) TANG2 expression was monitored by ptang2::gus transgene expression. GUS staining of seedlings, root tips, lateral root primordia, flowers and stamens. Bars = 0.1mm in (C), 0.01mm in (D and E), 1mm in (F) and 0.5mm in (G and H).

91 RESULTATS encode a pentatricopeptide repeat (PPR) protein comprising 17 conserved PPR motifs (Fig. 1B). In different plant species, genome sequencing revealed a large number of PPR domain proteins (O'Toole, Hattori et al. 2008). TANG2 homologs sharing highly conserved domain structure were identified in Vitis vinifera and rice (Supplementary Fig.1). Expression pattern of TANG2 The spatial expression patterns of TANG2 were revealed by histochemical assays of β- glucuronidase (GUS) activity of transgenic plants grown on Murashige and Skoog (MS) medium or in the greenhouse expressing TANG2 promoter:gus fusions (ptang2 GUS). Histochemical staining showed the relatively high levels of GUS activity in the shoot and root apexes, lateral root primordia, young flower buds, and stamens (Fig.1C-G). GUS activity was essentially undetectable in mature tisses of stems, leaves and flowers. The tang2 Mutant has Altered Growth and Development To determine the biological functions of TANG2 in plant growth and development, we obtained a T-DNA insertion allele of TANG2. The position of the T-DNA insert in a canonical PPR repeat was confirmed by PCR and sequencing. The line Salk_ (hereafter called tang2) contained the T-DNA insert within the coding region, 1436 bp upstream of the stop codon (Fig.2A). tang2 was transformed with a genomic DNA fragment carring the wild-type At1g19290 gene, and two lines expressing TANG2 were identified. One of these lines, TANG2COM2, was used in further studies; it fully complemented the morphological and growth phenotypes of tang2 (Fig. 2B-E). In addition, transgenic plants expressing an antisense transcript to TANG2 (35S:antiTANG2) showed similar phenotypes to tang2 mutants (data not shown). On Murashige and Skoog (MS) agar medium, tang2 seeds germinated about 1 day later than wild-type seeds. After germination, tang2 plants also grow more slowly than the wild type (Fig.2B), and plate-grown tang2 mutants also exhibited smaller stature and shorter roots compared with wild type (Fig.2B). Soil-grown tang2 plants have smaller stature, with narrow, dark green leaves, and delayed growth compared with the wild type (Fig.2C and D). Seeds of the tang2 mutant are larger than those of the wild type (Fig.2E) but seed set was reduced. tang2 flowers also have shorter stamen filaments than the wild type (data not shown) such that tang2 pollen is not able to reach stigmatic papillae directly; this may explain the decreased fertility. These results indicated that TANG2 is required for normal growth and development. 90

92 Figure 2. The Growth Phenotypes of tang2. T-DNA insertion map of Salk (tang2). The drawing shows the characteristic PPR repeat structure of the protein encoded by the TANG2 gene. Plate-grown tang2 plants have delayed growth, dark green leaves, small stature and short primary roots. (C and D) Soil-grown plants of Col-0, tang2 and tang2com2. (E) Dry seeds of Col-0, tang2 and tang2com2 showing the larger size of tang2 seeds. Bars = 1mm in (D), 5cm in (E) and 1cm in (F).

93 RESULTATS tang2 Seedlings Are Sensitive to Glucose. We investigated whether the tang2 mutant has altered sugar responses since the expression of TANG2 is induced by glucose. Seedling development on different concentrations of glucose is a widely used assay for assessing glucose sensitivity(sheen, Zhou et al. 1999). Seedlings of the wild-type grown on media containing 3% (w/v) glucose for 10 days developed two pairs of true leaves, while tang2 seedlings were arrested at an early growth stage and did not green or develop true leaves and the cotyledons accumulated anthocyanins. This demonstrated that that tang2 is hypersensitive to glucose (Fig.3A). This hypersensitivity of tang2 in response to glucose is not a result of an osmotic effect, because tang2 seedlings were fully established on medium supplemented with 3% mannitol (data not shown). Quantitative analysis of seedling establishment on medium containing 3% glucose showed that tang2 was extremely sensitive to 3% glucose, with less that 5% of the seedlings (n=100) greening or developing true leaves (Fig.3B). In these conditions all Col-0 seedlings rapidly developed true leaves. We assessed the expression levels of several sugar-responsive genes known to have altered expression patterns in sugar response mutants (Moore, Zhou et al. 2003; Li, Smith et al. 2007). For example, genes involved in starch and flavonoid biosynthesis are sugarinducible (Rook, Corke et al. 2001), while in glucose-hypersensitive lines the expression of these genes is induced at lower glucose concentrations than in wild-type (Baier, Hemmann et al. 2004; Li, Smith et al. 2007). Expression of the sugar-inducible ApL3 (Rook, Corke et al. 2001) and Atβ-Amylase (Mita, Suzuki-Fujii et al. 1995) genes was significantly increased in tang2 in response to 1% (w/v) glucose compared with wild type (Fig. 3C). Furthermore the expression level of both the TT4 and DRF genes involved in flavonoid biosynthesis (Weisshaar and Jenkins 1998) was also higher in tang2 than in wild type (Fig. 3C). tang2 Plants Have Altered Starch, Anthocyanin and Sugar Levels The ApL3 gene encodes one of four large subunits of ADPG-pyrophosphorylase (AGPase), which catalyses the first committed step in starch synthesis, and TT4 and DRF are required for anthocyanin biosynthesis. Consistent with the elevated expression of these genes, starch levels were slightly but significantly increased in the tang2 mutant compared with the wild- type (Fig. 4A), and anthocyanins also accumulated to higher levels in tang2 compared with the wild type (Fig.4B). These results indicated that the tang2 mutation enhances several glucose-mediated metabolic responses. Increased cellular levels of sugars could contribute to enhanced responses of tang2 plants to exogenous glucose. Therefore glucose, fructose and sucrose levels were measured in 7-92

94 Figure 3. tang2 exhibits hypersensitive glucose responses. (A) The phenotypes of 14-d-old wild-type Col-0 and tang2 seedlings germinated and grown on MS medium supplemented with 3% glucose. (B) Seedling establishment of Col-0 and tang2 grown on MS medium supplemented with 0% glucose or 3% glucose. (C) Quantitative real time RT-PCR analysis of transcript levels in tang2. Quantitative real time RT-PCR was performed on first-strand cdna made from 10-d-old seedlings grown in constant light on MS medium containing 1% glucose. cdna was standardized by reference to an actin standard. Bar = 1cm in (A)

95 Figure 4. tang2 Plants Have Altered Starch, Anthocyanin and Sugar Levels (A) Starch content of Col-0, tang2 and tang2com2 seedlings. (B) Anthocyanin content of Col-0, tang2 and tang2com2 seedlings. (C) Glucose, fructose and sucrose contents of Col-0, tang2 and tang2com2 seedlings.

96 RESULTATS day-old seedlings of the tang2 mutant and the wild type. The tang2 seedlings have significantly increased levels of glucose, fructose, and sucrose compared to wild type seedlings of the same age (Fig. 4C), suggesting that altered intracellular sugar levels may account for the enhanced glucose responses seen in the tang2 mutant. TANG2 Is Involved in the biogenesis of Complex I. The phenotypes of the tang2 mutant, such as slow growth and darker, narrower leaves, are reminiscent of Arabidopsis mitochondrial Complex I mutants (de Longevialle, Meyer et al. 2007). We first demonstrated that a GFP fusion of TANG2 is co-localised with a mitochondrial-specific protein fused to the red fluorescent protein (Figs. 5A-C). Having determined that TANG2 is mitochondrial, we used BN-PAGE (Blue-Native polyacrylamide gel electrophoresis) and NADH oxidase staining to investigate the activity of Complex I in tang2 mitochondria. As shown in Fig.5D, NADH oxidase activity at the position expected for Complex I was greatly reduced in the tang2 mutant, compared with mitochondria from Col-0 and complemented tang2com2 plants. A similar BN-PAGE gel was blotted and probed with a NAD9 antibody (Fig.5E), proving that the high molecular weight band of NADH oxidase activity is indeed Complex I, and that the tang2 mitochondria not only have very little complex I activity, but also very little assembled complex I protein. Two-dimensional blue-native/sds- PAGE of mitochondrial proteins from the tang2 mutant further confirmed the specific reduction of Complex I (arrowed in Figs. 5F and 5G), whereas none of the other complexes appear to be affected, indicating that TANG2 is specifically required for the biogenesis of mitochondrial Complex I. The Splicing of Mitochondrial Transcripts is altered in the tang2 Mutant As several PPR proteins have been shown to be involved in RNA processing in plant organelles (Schmitz-Linneweber and Small 2008), we performed RT-PCR on tang2 RNA to analyse the mitochondrial transcripts encoding subunits of Complex I. Fig.6A shows that the mature, fully-processed nad5 transcript was hardly detectable in tang2 RNA, whereas other nad transcripts accumulated normally, suggesting that transcription, processing or stability of nad5 RNA is defective in tang2. As several other PPR proteins are required for transcriptspecific splicing (Meierhoff, Felder et al. 2003; Schmitz-Linneweber, Williams-Carrier et al. 2006; de Longevialle, Meyer et al. 2007; Hattori, Miyake et al. 2007; Beick, Schmitz- Linneweber et al. 2008; de Longevialle, Hendrickson et al. 2008; Williams-Carrier, Kroeger et al. 2008), we performed an RT-PCR splicing assay designed to quantify the extent of splicing of each mitochondrial intron in Arabidosis. The results showed clear defects in splicing of 95

97 Figure 5. TANG2 Protein Localization and Mutation in TANG2 Causes Reduced Activity of Mitochondrial Complex I. (A) The TANG2-GFP fusion protein co-localises with a mitochondrial protein in Arabidopsis cells. TANG2-GFP and ScCOX4-mCherry plasmids were biolistically co-transformed into Arabidopsis cultured cells. After 24 hrs in the dark, cells were analyzed for GFP (panel A) and RFP fluorescence (panel C). The overlaid images showing co-localisation is shown in panel B. (D and E) Blue-native PAGE of mitochondrial membrane protein complexes. At left, in-gel NADH oxidase activity staining (D); at right, blot of a matched blue-native gel probed with an antibody against NAD9 (E). (F and G) Two-dimensional blue-native/sds-page of mitochondrial proteins from Col-0 (F) and tang2 plants (G). The arrow indicates the migration of complex I. Mitochondria were isolated from 8-week-old rosettes of Col-0 (WT), tang2 and complemented tang2 (tang2com) plants. Each sample contained 200 g of protein.

98 RESULTATS nad2 intron 1 and, much more dramatically, in splicing of nad5 intron 3 (Fig.6,B and C). Nevertheless, low levels of correctly spliced nad5 transcripts were recovered in tang2 and verified by sequencing (data not shown). The splicing of other transcripts is not significantly altered in tang2 mutants. The defect in splicing of nad5 intron 3 is sufficient to explain the dramatic reduction of fully-processed nad5 transcript, and in turn, that of Complex I activity in tang2 mutants. DISCUSSION Plant organellar genomes contain introns that are excised with the aid of nuclear-encoded and/or organelle-encoded factors. Several PPR proteins have been implicated directly or indirectly in organellar RNA splicing. HCF152 increases splicing of the petb-petd precursor RNA coding for subunits of the cytochrome b 6 f complex (Meierhoff, Felder et al. 2003). The maize chloroplast proteins PPR4 and PPR5 are involved in splicing introns in rps12 and trng(ucc) transcripts, respectively, and have been shown to associate with these introns in vivo (Schmitz-Linneweber, Williams-Carrier et al. 2006; Beick, Schmitz-Linneweber et al. 2008; Williams-Carrier, Kroeger et al. 2008). OTP43 is specifically required for trans-splicing of the mitochondrial nad1 intron 1 in Arabidopsis (de Longevialle, Meyer et al. 2007). Arabidopsis OTP51 is needed for the splicing of chloroplast ycf3 intron 2, and also influences the splicing of several other group-iia introns in plastids (de Longevialle, Hendrickson et al. 2008). TANG2 encodes a pentatricopetide repeat protein similar to OTP43 and OTP51, and loss of TANG2 gene function causes a 100x reduction in splicing of nad5 intron 3 and a much smaller reduction in nad2 intron 1 splicing (Fig.6,B and C). As nad2 intron1 splicing is also affected to the same degree in opt43 (de Longevialle, Meyer et al. 2007), this may be a secondary effect. The splicing of other mitochondrial transcripts was not significantly altered in tang2 mutants, indicating a high degree of specificity. PPR motifs bind RNA directly (Williams-Carrier, Kroeger et al. 2008; Okuda, Chateigner- Boutin et al. 2009) and it is thought that diversity in PPR motif organisation provides this binding specificity reviewed in (Delannoy, Stanley et al. 2007), although direct biochemical evidence is sparse. The characterisation of TANG2 provides further genetic evidence for a high degree of specificity of mitochondrial intron recognition by PPR proteins. Mitochondrial Complex I is the main entry point for the electron transport chain in plant and animal mitochondria and is of central importance in cellular energy homeostasis (Sterky and Larsson 2008). A T-DNA insertion in the TANG2 gene causes a specific major reduction in the levels of mitochondrial NADH:ubiquinone oxidoreductase (Complex I) as determined by western blotting and two-dimensional blue-native/sds-page of mitochondrial proteins 97

99 Figure 6. Mutation in TANG2 Causes Altered Splicing of Mitochondrial Genes. (A) Detection of nad1, nad2, nad3, nad4, nad5, nad6, nad7 and nad9 transcripts. The cdna was synthetised using 3 g of RNA isolated from 6-week-old rosettes of tang2, complemented tang2 (tang2com2) and Col-0 plants. (B) Quantitative RT-PCR of spliced mitochondrial transcripts. The histogram shows the relative quantities of spliced to unspliced forms of each transcript as log 2 values of the ratio. (C) Location of oligonucleotide primers for quantifying splicing of nad5 transcripts. As an example, the extent of splicing of nad5 intron 1 is estimated as the ratio between the quantity of RT-PCR product obtained with primers A, B and the quantity of RT-PCR product obtained with primers C, B. The sequences of the primers are given in Supplementary Table 2.

100 RESULTATS isolated from the tang2 mutant (Figs. 5F and G). None of the other complexes appear to be significantly affected, indicating that TANG2 is specifically involved in the biogenesis of mitochondrial Complex I. The link between electron transport and altered sugar levels and responses we observed in tang2 have also been noticed previously in another mutant that may affect Complex I activity. The Arabidopsis css1 mutation in a type II intron maturase gene that reduces nad4 splicing also exhibits sugar hypersensititive seedling establishment phenotypes, increased amino acid and starch levels, and reduced cellulose synthesis (Nakagawa and Sakurai 2006). However the effects of this mutation on Complex I levels was not determined. The tang2 T-DNA insertion mutant enhances a wide range of responses to physiologically relevant sugar levels, including increased starch and anthocyanin levels, glucose-sensitive seedling growth, and enhanced expression of sugar-inducible genes compared with the wild type (Fig. 3C). These phenotypes are similar to those observed in several mutations that lead to hypersensitive responses to glucose (Baier, Hemmann et al. 2004; Li, Lee et al. 2006). tang2 mutant plants also exhibited a range of other defects such as growth retardation, small stature, narrow and dark green leaves, short roots, reduced fertility and large seeds, showing that TANG2 is required for normal plant growth and development. Although other mutations that reduce Complex I levels such as fro1 and otp43 (Lee, Lee et al. 2002; de Longevialle, Meyer et al. 2007) exhibit some similar phenotypes to tang2 such as retarded growth and small stature, these mutants exhibit very distinct phenotypes. No difference in root growth between fro1 and the wild type was observed, in contrast to the shorter primary roots of tang2. The otp43 mutant has smaller and darker seeds than wild type which have severely reduced germination, whereas tang2 has larger seeds compared to wild type with only slightly reduced germination. Mutations in fro1 cause reduced cold induction of stress-responsive genes such as RD29A, KIN1, COR15A, and COR47, in contrast to the elevated starch and anthocyanin biosynthesis gene expression seen in tang2. We showed that tang2 mutants accumulate substantially higher levels of glucose, fructose and sucrose (Fig. 4C). This could be explained by reduced Complex 1 activity, as Complex I inhibition in cell cultures by rotenone affects carbon metabolism by slowing the TCA cycle and reducing the association of glycolytic enzymes with mitochondria (Garmier, Carroll et al. 2008). The increased glucose, fructose and sucrose levels seen in tang2 plants is consistent with reduced TCA cycle activity. Reduced activity of the electron transport chain also leads to compensatory increases in the activity of alternative oxidase pathways (Dutilleul, Driscoll et al. 2003; Dutilleul, Lelarge et al. 2005; Vidal, Ribas-Carbo et al. 2007). These contribute to altered balances between ATP/ADP, NAD/NADH and ROS, which are known to regulate metabolism and multiple cellular processes, and may therefore also account for altered 99

101 RESULTATS sugar- responsive gene expression and growth. However, a recent analysis of an Arabidopsis mutant specifically lacking Complex 1 activity (Meyer, Tomaz et al. 2009) did not reveal increased glucose or fructose levels, nor was the expression of sugar-responsive genes altered despite similar growth conditions (1% glucose in this work and 1% sucrose in (Meyer, Tomaz et al. 2009)), and there was no reduction in germination in tang2. This may be due to differences in Complex I activity, although it is unlikely that a partial reduction in Complex I activity leads to strong sugar-response phenotypes that are not seen when Complex I activity is abolished. This suggests that tang2 may specifically alter sugar levels and sugar-responsive gene expression and growth. The rapid induction of TANG2 expression in response to sugars (Fig. 1A) and its preponderant expression in tissues with high energy demand such as meristem and floral tissues, and its virtual absence from mature tissues Fig. 1,B-G), suggest that TANG2 may mediate nad5 splicing levels and Complex I activity in response to sugar levels. As sugars are the primary mobile form of photosynthate and the main source of energy in heterotrophic tissues, it is possible that TANG2 expression could be a link between energy substrates and energy generation in the mitochondria. METHODS Plant Materials and Growth Conditions All lines were in the Col-0 background. Seeds were surface-sterilized with 100% isopropanol and 20% (v/v) household bleach, washed at least five times with sterile water, stratified at 4 C for 4d in the dark, dispersed on Murashige and Skoog (MS) medium (Duchefa Biochemie BV, Haarlem, The Netherlands) supplemented with 0.9% agar and 1% and 3% glucose or mannitol, and then grown at 22 C. Identification of tang2 Mutant and Complementation Tests The tang2 mutant (SALK_003139) was obtained from the Nottingham Arabidopsis Stock Centre. SALK_ T-DNA insertion in the TANG2 gene was confirmed by PCR and sequencing, by using primers SALK_ LP (CTGCAATAGCAAACAAGCCTC), SALK_003139RP (TGTACGGTGTGTTGATGGATG) and LBa1. A genomic DNA fragment containing the entire TANG2 coding region, the 1.5kb upstream sequence, and the 1.0kb downstream sequence was inserted into the binary vector pcambia1300 to generate the transformation plasmid COM for complementation.the 100

102 RESULTATS plasmid COM was introduced into the tang2 mutant using Agrobacterium tumefaciens GV3101 and transformants were selected on hygromycin-containing medium. GUS Staining The TANG2 promoter-gus construct (ptang2:gus) was made using a PCR-based Gateway system. The promoter specific primers for the TANG2 gene were TOPOTANG2PROM-F (CACC AGC TAT ACT TTG TAG CCA CGG) and TOPOTANG2-R (GTC AAA GAC TGT AGG AGA GAA G). PCR products were subcloned into the pentr/d- TOPO vector (Invitrogen) using TOPO enzyme and sequenced. The TANG2 promoter was then subcloned into Gateway Binary Vector (pgwb3) containing the GUS reporter gene. Seedlings were grown in the soil or on MS medium supplemented with 1% glucose. TANG2 Localisation The first 300 bp of the coding sequence of TANG2 were amplified including adapters containing the attb Gateway cloning sequences with the primers 5 - GGGGACAAGTTTGTACAAAAAAGCAGGCTTCGAAGGAGATAGAACCATGCTCCGACGG TCTCCG and 5 - GGGGACCACTTTGTACAAGAAAGCTGGGTCTCCACCTCCGGATCCGAACTTTTGTTGCT TTGAAGCCAA using the Expand High Fidelity PCR system (Roche Diagnostics, Germany). The PCR product was cloned into Gateway vector pdonr207 (Invitrogen, USA) and sequenced to check PCR accuracy. The entry vector and a Gateway cloning cassette were recombined to clone the targeting sequence of TANG2 in frame with the coding region of the green fluorescent protein (GFP). For co-localization studies, the mitochondrial targeting sequence of yeast ScCox4 fused to mcherry in pbin20 (Nelson BK, Cai X, Nebenfuehr A (2007) A multicolored set of in vivo organelle markers for co-localization studies in Arabidopsis and other plants. Plant J 51: ) was used as a mitochondrial control. The constructs were biolistically transformed into Arabidopsis cultured cells as previously described. In brief, the GFP and mcherry plasmids (5 μg each) were co-precipitated onto 1µm gold particles and transformed using the biolistic PDS-1000/He system (Bio-Rad, USA). Particles were bombarded onto 2 ml of Arabidopsis cell suspension resting on filter paper on osmoticum plates. After bombardment, the Arabidopsis cell suspension was placed in the dark at 22 C. Fluorescence images were obtained 24 hrs after transformation using an Olympus BX61 epifluorescence microscope with HQ GFP (U-MGFPHQ) and RFP (U- MRFPHQ) filters and the Cell imaging software. 101

103 RESULTATS RNA Isolation, Reverse Transcription (RT)-PCR and Quantitative Real-Time RT-PCR Analysis Total RNA was extracted from Arabidopsis seedlings grown on MS medium supplemented with 1% glucose using an RNeasy Plant Mini kit (Qiagen). Reverse transcription (RT)-PCR analysis was performed as described (Li, Lee et al. 2006). Quantitative real-time RT-PCR analysis was performed with Biorad system using the SYBR Green JumpStart Taq readymix (Sigma). ACTIN mrna was used as an internal control, and relative amounts of mrna were calculated using the comparative threshold cycle method. The primers used for Quantitative real-time RT-PCR are as follows: AT5G09810-ACTIN (AtactF -5 - GAGAAGATGACTCAGATC-3 and AtactR -5 - ATCCTTCCTGATATCGAC-3 ); AT4G ApL3 (ApL3F-5 -CGTCTGAATCATGCAACC-3 and ApL3R- 5 - GCATTTCCTGATCTTTGTATCCTCG-3 ); AT4G Amylase ( -AmyF-5 - CGGAGAAGGGGAAGTTTTTC-3 and -AmyR-5 - AATCTCATGCCCGTACTTCG-3 ); AT5G13930-TT4 (TT4F-5 - GGT TCA TGG CTA GTG ATG CG-3 and TT4R-5 - A ACG CTG TGC AAG ACG ACT G-3 ); AT5G42800-DRF (DRFF-5 - GGT TCA TGG CTA GTG ATG CG- 3 and DRFR-5 - AGA CGT TGT GAT GAA TGG ACC-3 ) and At1g19290-TANG2 (TANG2QRTF-5 -. ATA ACA CTC TGA TAT CTG GTG C-3 and TANG2QRTR-5 - TAA TGT GTG CTT ACC TGA GGC-3 ). Carbohydrate and Anthocyanin Analysis Carbohydrate and anthocyanin analysis of day old seedlings grown on MS medium supplemented with 1% glucose were performed as described (Baier, Hemmann et al. 2004). Glucose, fructose, and sucrose were measured sequentially in cleared supernatants of K 2 CO 3 -neutralized HClO 4 extracts of ground, frozen plant material (Galtier and Gouy 1995). Mitochondrial Isolation, BN PAGE and Immunoblot Analysis Mitochondria were isolated from 8-week-old rosette leaves of greenhouse grown plants and BN PAGE was performed as previously described (de Longevialle, Meyer et al. 2007). Proteins separated by BN PAGE were transferred onto PVDF membrane (GE Healthcare) in cathode buffer for 15 h at 40 ma, using a BioRad Mini transblot cell. The membrane was then destained with ethanol and restained with Coomassie blue to visualise the complexes, and subsequently destained before any further treatment. The western blot was performed using an anti NAD9 antibody at a 1/50,000 dilution, and a goat anti-rabbit conjugated to 102

104 RESULTATS horseradish peroxidase secondary antibody at a 1/10,000 dilution, and subsequently revealed using ECL reagents (GE Healthcare). Isolation of Mitochondrial RNA and Transcript Analysis Total leaf RNA was isolated from 6-week-old rosettes of greenhouse grown plants using the plant RNeasy extraction kit (Qiagen) according to the manufacturers instructions, and genomic DNA was removed using DNAfree DNAse (Ambion). Complete removal of both mitochondrial and nuclear DNA was checked by PCR on diluted RNA prior to reverse transcription. The reverse transcription step was performed on 3 g of DNase-treated RNA using Superscript III (Invitrogen) and random hexamer primers as described previously (de Longevialle, Meyer et al. 2007). RT-PCR was performed with l of 1/10 dilution of the reverse transcriptase reaction (except for nad5 for which 3.5 l of 1/10 dilution were used and nad3 and nad6 for which 3 l of 1/10 dilution were used). The primers used for detecting the spliced nad transcripts are given in Supplementary Table 1. To quantify the splicing of mitochondrial mrnas, primers were designed to amplify bp regions spanning intron-exon junctions (unspliced forms) or spanning splice junctions (spliced forms) of each gene (see example given for nad5 in Fig.5C). The complete list of these primers is given in Supplementary Table 2. Quantitative RT-PCR was performed using LightCycler 480 SYBR Green I Master Mix (Roche Diagnostics) and a Roche LightCycler 480 real-time PCR system with the following thermal cycling program: 95ºC for 10 min, followed by 45 cycles of 95ºC for 10 s, 60ºC for 10 s, and 72ºC for 10 s. The data were analysed using the LightCycler 480 software version 1.5 (Roche Diagnostics). Three independent experiments were performed, and each sample at a 1/200 dilution was run in triplicate. Nuclear and mitochondrial 18S rrna genes were used as internal controls. The primers used for quantitative RT-PCR assays are given in Supplementary Table 2. The same RNA preparations and data analysis methods were used to quantify the expression of TANG2 in the complemented lines in Fig. 2, Two independent experiments were performed, and each sample at a 1/200 dilution was run in triplicate. The primers used were tang2 F; 5' TTGTTCAAGCTTGGCGATTT 3' and R: 5' TGGCTTCATTGACCTTCTCC 3'. ACKNOWLEDGMENTS This work was supported by BBSRC Grant BB/C515620, the John Innes Centre Core Strategic Grant, the National Basic Research Program of China (2009CB941503), Australian Research Council Centre of Excellence grant CE , and DEST International Science Linkages grant CG IS is supported as a WA State Premier s Fellow.

105 RESULTATS REFERENCES Baier, M., et al. (2004). Characterization of mutants in Arabidopsis showing increased sugarspecific gene expression, growth, and developmental responses. Plant Physiol 134: Beick, S., Schmitz-Linneweber, C., Williams-Carrier, R., Jensen, B., and Barkan, A. (2008). The pentatricopeptide repeat protein PPR5 stabilizes a specific trna precursor in maize chloroplasts. Mol Cell Biol 28: Chase, C.D. (2007). Cytoplasmic male sterility: a window to the world of plant mitochondrialnuclear interactions. Trends Genet 23: de Longevialle, A.F., et al. (2008). The pentatricopeptide repeat gene OTP51 with two LAGLIDADG motifs is required for the cis-splicing of plastid ycf3 intron 2 in Arabidopsis thaliana. Plant J 56: de Longevialle, A.F., et al. (2007). The pentatricopeptide repeat gene OTP43 is required for trans-splicing of the mitochondrial nad1 Intron 1 in Arabidopsis thaliana. Plant Cell 19: Delannoy, E., Stanley, W.A., Bond, C.S., and Small, I.D. (2007). Pentatricopeptide repeat (PPR) proteins as sequence-specificity factors in post-transcriptional processes in organelles. Biochem Soc Trans 35: Dutilleul, C., Driscoll, S., Cornic, G., De Paepe, R., Foyer, C.H., and Noctor, G. (2003). Functional mitochondrial complex I is required by tobacco leaves for optimal photosynthetic performance in photorespiratory conditions and during transients. Plant Physiol 131: Dutilleul, C., Lelarge, C., Prioul, J.L., De Paepe, R., Foyer, C.H., and Noctor, G. (2005). Mitochondria-driven changes in leaf NAD status exert a crucial influence on the control of nitrate assimilation and the integration of carbon and nitrogen metabolism. Plant Physiol 139: Galtier, N., and Gouy, M. (1995). Inferring phylogenies from DNA sequences of unequal base compositions. Proc Natl Acad Sci U S A 92: Garmier, M., et al. (2008). Complex I dysfunction redirects cellular and mitochondrial metabolism in Arabidopsis. Plant Physiol 148: Hattori, M., Miyake, H., and Sugita, M. (2007). A Pentatricopeptide repeat protein is required for RNA processing of clpp Pre-mRNA in moss chloroplasts. J Biol Chem 282: Heazlewood, J.L., Howell, K.A., and Millar, A.H. (2003). Mitochondrial complex I from Arabidopsis and rice: orthologs of mammalian and fungal components coupled with plant-specific subunits. Biochim Biophys Acta 1604: Hilson, P., et al. (2004). Versatile gene-specific sequence tags for Arabidopsis functional genomics: transcript profiling and reverse genetics applications. Genome Res 14: Lee, B.H., Lee, H., Xiong, L., and Zhu, J.K. (2002). A mitochondrial complex I defect impairs cold-regulated nuclear gene expression. Plant Cell 14: Li, Y., et al. (2006). Establishing glucose- and ABA-regulated transcription networks in Arabidopsis by microarray analysis and promoter classification using a Relevance Vector Machine. Genome Res 16: Li, Y., et al. (2007). Signaling from an altered cell wall to the nucleus mediates sugarresponsive growth and development in Arabidopsis thaliana. Plant Cell 19:

106 RESULTATS Lurin, C., et al. (2004). Genome-wide analysis of Arabidopsis pentatricopeptide repeat proteins reveals their essential role in organelle biogenesis. Plant Cell 16: Malek, O., and Knoop, V. (1998). Trans-splicing group II introns in plant mitochondria: the complete set of cis-arranged homologs in ferns, fern allies, and a hornwort. Rna 4: Meierhoff, K., Felder, S., Nakamura, T., Bechtold, N., and Schuster, G. (2003). HCF152, an Arabidopsis RNA binding pentatricopeptide repeat protein involved in the processing of chloroplast psbb-psbt-psbh-petb-petd RNAs. Plant Cell 15: Meyer, E.H., et al. (2009). Remodeled respiration in ndufs4 with low phosphorylation efficiency suppresses Arabidopsis germination and growth and alters control of metabolism at night. Plant Physiol 151: Mita, S., Suzuki-Fujii, K., and Nakamura, K. (1995). Sugar-inducible expression of a gene for beta-amylase in Arabidopsis thaliana. Plant Physiol 107: Moore, B., et al. (2003). Role of the Arabidopsis glucose sensor HXK1 in nutrient, light, and hormonal signaling. Science 300: Nakagawa, N., and Sakurai, N. (2006). A mutation in At-nMat1a, which encodes a nuclear gene having high similarity to group II intron maturase, causes impaired splicing of mitochondrial NAD4 transcript and altered carbon metabolism in Arabidopsis thaliana. Plant Cell Physiol 47: O'Toole, N., et al. (2008). On the expansion of the pentatricopeptide repeat gene family in plants. Mol Biol Evol 25: Okuda, K., et al. (2009). Pentatricopeptide repeat proteins with the DYW motif have distinct molecular functions in RNA editing and RNA cleavage in Arabidopsis chloroplasts. Plant Cell 21: Rook, F., Corke, F., Card, R., Munz, G., Smith, C., and Bevan, M.W. (2001). Impaired sucrose-induction mutants reveal the modulation of sugar-induced starch biosynthetic gene expression by abscisic acid signalling. Plant J 26: Schmitz-Linneweber, C., and Small, I. (2008). Pentatricopeptide repeat proteins: a socket set for organelle gene expression. Trends Plant Sci 13: Schmitz-Linneweber, C., Williams-Carrier, R.E., Williams-Voelker, P.M., Kroeger, T.S., Vichas, A., and Barkan, A. (2006). A pentatricopeptide repeat protein facilitates the trans-splicing of the maize chloroplast rps12 pre-mrna. Plant Cell 18: Sheen, J., Zhou, L., and Jang, J.C. (1999). Sugars as signaling molecules. Curr Opin Plant Biol 2: Sterky, F.H., and Larsson, N.G. (2008). Complex I: a complex gateway to the powerhouse. Cell Metab 7: Vidal, G., et al. (2007). Lack of respiratory chain complex I impairs alternative oxidase engagement and modulates redox signaling during elicitor-induced cell death in tobacco. Plant Cell 19: Weisshaar, B., and Jenkins, G.I. (1998). Phenylpropanoid biosynthesis and its regulation. Curr Opin Plant Biol 1: Williams-Carrier, R., Kroeger, T., and Barkan, A. (2008). Sequence-specific binding of a chloroplast pentatricopeptide repeat protein to its native group II intron ligand. Rna 14: Zehrmann, A., Verbitskiy, D., van der Merwe, J.A., Brennicke, A., and Takenaka, M. (2009). A DYW domain-containing pentatricopeptide repeat protein is required for RNA 105

107 RESULTATS editing at multiple sites in mitochondria of Arabidopsis thaliana. Plant Cell 21: Zhou, W., et al. (2008). The Arabidopsis gene YS1 encoding a DYW protein is required for editing of rpob transcripts and the rapid development of chloroplasts during early growth. Plant J. 106

108 TANG2 MLRRSPARVVAYQLLPFLYTRSFSEASRTLRRELRGGNGRIRPELLERVSRLLVLGRYEA 60 Vitis -MEVEHSVAIKIKHSNHCHTLLVSFGISQPVEHL------LQSFWVSRICRLVLLRRCNA 53 rice ---MPHGCHFLRPLSFTCRRRRLHSSLPRADGDGTEAGAATDTTLLGRFTRLLLLHRFPA : *. **::* * * TANG2 LHDLSLDFS---DELLNSILRRLRLNPEACLEIFNLASKQQKFRPDYKAYCKMVHILSRA 117 Vitis ISKLNFVFS---DDIVDAVLRNLRLNPTASLGFFQFVSKQQNFRPNVKSYCKLVHILSRG 110 rice AERLLASSSPLTPALLQAALRRVRLDPDAALHLFRLAPS----RPSLVSHAQLLHILARA 113 * * :::: **.:**:* *.* :*.:... **. ::.:::***:*. TANG2 RNYQQTKSYLCELVALN---HSGFVVWGELVRVFKEFSFSPTVFDMILKVYAEKGLVKNA 174 Vitis RMYDETRAYLNQLVDLCKFKDRGNVIWDELVGVYREFAFSPTVFDMILKVYVEKGLTKNA 170 rice RRFHDARALLSSLPPHA------EPLFPHLAEVYRDFTFSAVSFDLLLRAHADAGQLSSA 167 * :.:::: *.* ::.*. *:::*:**.. **::*:.:.: *..* TANG2 LHVFDNMGNYGRIPSLLSCNSLLSNLVRKGENFVALHVYDQMISFEVSPDVFTCSIVVNA 234 Vitis LYVFDNMGKCGRIPSLRSCNSLLNNLVKNGETHTAHYVYQQMIRVGIVPDVFMVSIMVNA 230 rice LNVFDGMGKVGCRPSLRSCNRLLNKLVQSGDPGMAAMVYGQMRIAGVLPDEFTVAIMAKA 227 * ***.**: * *** *** **.:**:.*: * ** ** : ** * :*:.:* TANG2 YCRSGNVDKAMVFAKETESSLGLELNVVTYNSLINGYAMIGDVEGMTRVLRLMSERGVSR 294 Vitis FCKDGKVDEAAGFVKKMEN-LGVEPNIVTYHSLINGYVSLGDVEAAKGVLKFMSEKGVSR 289 rice YCRDGRVAQAVEFVEEMEG-MGLEVNLVAYHAVMDCYCGMGWTEDARRILESLQRKGLSP 286 :*:.*.* :* *.:: *. :*:* *:*:*::::: * :*.* :*. :..:*:* TANG2 NVVTYTSLIKGYCKKGLMEEAEHVFE-LLKEKKLVADQHMYGVLMDGYCRTGQIRDAVRV 353 Vitis NVVTYTLLIKGYCKQCKMDEAEKVLRGMQEEAALVPDERAYGVLIDGYCRTGKIDDAVRL 349 rice NVVTYTLLVKGYCKDGRMEEAERVVKEMKETGDIVVDEVAYGMMINGYCQRGRMDDATRV 346 ****** *:*****. *:***:*.. : : :* *: **::::***: *:: **.*: TANG2 HDNMIEIGVRTNTTICNSLINGYCKSGQLVEAEQIFSRMNDWSLKPDHHTYNTLVDGYCR 413 Vitis LDEMLRLGLKTNLFICNSLINGYCKRGEIHEAEGVITRMVDWNLKPDSYSYNTLLDGYCR 409 rice RNEMRDAGIHVNLFVYNTMINGLCKLGRMEEVQKVLQEMEDVGMRPDKYSYNTLIDGYCR 406 ::* *::.* : *::*** ** *.: *.: ::.* *.::** ::****:***** TANG2 AGYVDEALKLCDQMCQKEVVPTVMTYNILLKGYSRIGAFHDVLSLWKMMLKRGVNADEIS 473 Vitis EGHTSEAFNLCDKMLQEGIEPTVLTYNTLLKGLCRVGAFDDALQIWHLMMKRGVAPDEVG 469 rice EGSMRKAFEMCRMMVRNGLAATTLTYNTLLKGFCSLHAIDDALRLWFLMLKRGVAPNEIS 466 * :*:::* * :: :.*.:*** ****. : *:.*.* :* :*:****.:*:. TANG2 CSTLLEALFKLGDFNEAMKLWENVLARGLLTDTITLNVMISGLCKMEKVNEAKEILDNVN 533 Vitis YSTLLDGLFKMENFEGASTLWKDILARGFTKSRITFNTMISGLCKMGKMVEAEEIFDKMK 529 rice CSTLLDGLFKAGKTEQALNLWKETLARGLAKNVITFNTVINGLCKIGRMAEAEELLDRMK 526 ****:.***. : *.**:: ****:.. **:*.:*.****: :: **:*::*.:: TANG2 IFRCKPAVQTYQALSHGYYKVGNLKEAFAVKEYMERKGIFPTIEMYNTLISGAFKYRHLN 593 Vitis DLGCSPDGITYRTLIDGYCKASNVGQAFKVKGAMEREPISPSIEMYNSLISGLFKSRRLV 589 rice ELRCPPDSLTYRTLFDGYCKLGQLGTATHLMNKMEHLGFAPSVEMFNSFITGHFIAKQWH 586 : * * **::*.** *.:: * : **: : *::**:*::*:* * :: TANG2 KVADLVIELRARGLTPTVATYGALITGWCNIGMIDKAYATCFEMIEKGITLNVNICSKIA 653 Vitis EVTDLLTEMGIRGLTPNIVTYGALIDGWCKEGMLDKAFSSYFEMTENGLSANIIICSTMV 649 rice KVNDIHSEMSARGLSPNLVTYGALIAGWCKEGNLHEACNLYFEMVNNGMNPNVFICSALM 646 :* *: *: ***:*.:.****** ***: * :.:* *** ::*:. *: *** : TANG2 NSLFRLDKIDEACLLLQKIVDFDLLLPGYQSLKEFLEASATTCLKTQKIAESVENSTPKK 713 Vitis SGLYRLGRIDEANLLMQKMVDHGFFPD-----HECFLKSDIRYAAIQKIADSLDESC-KT 703 rice SCFYKEGKVDEANLVLQKLVNIDMIPG CSISTIEIDKISHVVDTIADGN 695. :::.::*** *::**:*:.::. :**:. ::. TANG2 LLVPNNIVYNVAIAGLCKAGKLEDARKLFSDLLSSDRFIPDEYTYTILIHGCAIAGDINK 773 Vitis FLLPNNIVYNIAIAGLCKTGKVDDARRFFS-MLSLKGFVPDNFTYCTLIHGYSAAGNVDE 762 rice PHSAN-VMWNVIIFGLCKSGRIADAKSLFE-SLRNKRFLPDNFTYSSLIHGCAASGSIDE 753.* :::*: * ****:*:: **: :*. *. *:**::** **** : :*.::: TANG2 AFTLRDEMALKGIIPNIVTYNALIKGLCKLGNVDRAQRLLHKLPQKGITPNAITYNTLID 833 Vitis AFRLRDEMLRRGLVPNIVTYNALINGLCKSENVDRAQRLFHKLHQKGLFPNVVTYNTLID 822 rice AFSLRDVMLSAGLTPNIITYNSLIYGLCKSGKLSRAVNLFNKLQSKGISPNGITYNTLID 813 ** *** * *: ***:***:** **** ::.**.*::**.**: ** :******* TANG2 GLVKSGNVAEAMRLKEKMIEKG LVRGSDKQGDVDIPKEVVLDPEVKLGST 883 Vitis GYCKIGNMDAAFKLKDKMIEEGISPSVVTYSALINGLCKHGDIER-SMKLLNQMIKAGVD 881 rice EYCKEGKTTEAFKLKQKMVEEG YMEEAIKLLDQMIENNVD 853 * *: *::**:**:*:* :*: ::. TANG2 G-VIEMNS NELYDVR RVSEAVV Vitis SKLIEYCTLVQGYIRSGEMQKIHKLYDMMHIR CLSTTAISHKQVDLRPQ 930 rice PNYITYCTLIHGYIKSGNMEEISKLYDEMHIRGLLPTNWIGNWKRSDPVVVNNWNRKDGH 913 * : :.:* *..: TANG Vitis TTMK Supplementary Figure 1 Li, et al., 2009

109 RESULTATS Supplementary table 1: Primers Used for Amplifying the Whole nad Transcripts Forward primer Reverse primer nad1 exon1-5 AGCCCGGGATCTTCTTGA TTGCCATATCTTCGCTAGGTG nad2 exon1-5 CAAAGGAGAGGGGTATAGCAA GGATCCTCCCACACATGTTC nad3 GCACCCCTTTTCCATTCATA GATGTCAGAATTTGCACCAA nad4 exon1-4 ATTCTATGTTTTTCCCGAAAGC TGAAATTTGCCATGTTGCAC nad5 exon1-5 AACATTGCAAAGGCATAATGA ACCATGGATCTCATCGGAAAT nad6 CGTCCTCCTCATTATAGTCCTCC CTCTGGTTTGATGGTTGCAC nad7 exon1-5 ACCTCAACATCCTGCTGCTC AGGTGCTTCAACTGCGGTAT nad9 TTGGGTCATCTCAATGGGTT CGATCGATATTTGCGGAGTT Supplemental table 2: Primers Used for the Splicing qrt-pcr Experiment. For nad5, the letters refer to the primers shown on the nad5 diagram in Materials and Methods. Forward primer Reverse primer rpl2 CCGAAGACGGATCAAGGTAA CGCAATTCATCACCATTTTG rpl2 intron exon2 TTAGGAAGAGCCGTACGAGG CGCAATTCATCACCATTTTG rps3 AGCCGAAGGTGAGTCTCGTA CCGATTTCGGTAAGACTTGG rps3 intron1 exon2 AGCCGAAGGTGAGTCTCGTA TCTACGGCGGGGTCACTAT cox2 TGGGGGATTAATTGATTGGA TGATGCTGTACCTGGTCGTT cox2 intron1 exon2 TGGGGGATTAATTGATTGGA AGCAGTACGAGCTGAAAGGC ccb452 GTGGGTCCATGTAAATGATCG CACATGGAGGAGTGTGCATC ccb452 intron1 exon1 CCCGGATCGAATCAGAGTT CACATGGAGGAGTGTGCATC nad1 exon1-2 GACCAATAGATACTTCATAAGAGACCA TTGCCATATCTTCGCTAGGTG nad1 intron1 exon2 GACCAATAGATACTTCATAAGAGACCA CGTGCTCGTACGGTTCATAG nad1 exon2-3 ATTCAGCTTCCGCTTCTGG TCTGCAGCTCAAATGGTCTC nad1 intron2 exon2 GGTTGGGTTAGGGGAACATC TCTGCAGCTCAAATGGTCTC nad1 exon3-4 AAAAGAGCAGACCCCATTGA TCCGTTTGATCTCCCAGAAG nad1 intron3 exon4 AAAAGAGCAGACCCCATTGA GGGAGCTGTATGAGCGGTAA nad1 exon4-5 AGCCCGGGATCTTCTTGA TCTTCAATGGGGTCTGCTC nad1 intron4 exon5 AGCCCGGGATCTTCTTGA ACGGAGCTGCATCCCTACT nad2 exon1-2 GCGAGCAGAAGCAAGGTTAT GGATCCTCCCACACATGTTC nad2 intron1 exon2 GCGAGCAGAAGCAAGGTTAT CCCATTCCTAACCAGTGGAG nad2 exon2-3 AAAGGAACTGCAGTGATCTTGA AATATTTGATCTTAGGTGCATTTT nad2 intron2 exon2 CCCGATCCGATAGTTTACAA AATATTTGATCTTAGGTGCATTTT nad2 exon3-4 GCGCAATAGAAAGGAATGCT CTATGGGTCTACTGGAGCTACCC nad2 intron3 exon4 GCGCAATAGAAAGGAATGCT GGCGAATTTCAAACTTGTGG nad2 exon4-5 CAAAGGAGAGGGGTATAGCAA TATTTGTTCTTCGCCGCTTT nad2 intron4exon4 CTTATTCGTGGCAACCTTCC TATTTGTTCTTCGCCGCTTT nad4 exon1-2 ATTCTATGTTTTTCCCGAAAGC GAAAAACTGATATGCTGCCTTG nad4 intron1 exon2 CCGTATGATGCGGAAGTCTC GAAAAACTGATATGCTGCCTTG nad5 introne-i AACTCGGATTCGGCAAGAA GCCGTGTAATAGGCGACCA nad7 intron4 exon5 CGGCCAAATGACTACAGGAT AGGTGCTTCAACTGCGGTAT nad5 exon K-J AACATTGCAAAGGCATAATGA GTTCCTGCGTTTCGGATATG nad5 intronk-l AACATTGCAAAGGCATAATGA CCTGTAAACCCCCATGATGT nad7 intron1 exon2 ACGGTTTTTAGGGGGATCTG AAGGTAAAGCTTGAAGATAAGTTT nad7 intron2 exon3 AGTGGGAGAGCCGTGTTATG TGGTACCTCGCAATTCAAAA nad7 intron3 exon4 TAAAGTGAAGTGGTGGGCCT CATTGCACAATGATCCGAAG nad4 exon2-3 AATACCCATGTTTCCCGAAG TGCTACCTCCAATTCCCTGT nad4 intron2 exon3 GCGGAACGACCAGAAAAATA TGCTACCTCCAATTCCCTGT nad4 exon3-4 TTCCTCCATAAATTCTCCGATT TGAAATTTGCCATGTTGCAC nad4 intron3 exon4 TCTAGCTTGGTTCGGAGAGC TGAAATTTGCCATGTTGCAC nad5 exon B-A TGGACCAAGCTACTTATGGATG CCATGGATCTCATCGGAAAT nad5 intron B-C TGGACCAAGCTACTTATGGATG TTCGCAAATAGGTCCGACT nad5 exon E-D AACTCGGATTCGGCAAGAA CTGGCTCTCGGGAGTCTCTT nad5 exon F-D GTGAGTCCCATGCGTCAGT CTGGCTCTCGGGAGTCTCTT nad5 intro G-D GTACGATCGTGTCGGGTGA CTGGCTCTCGGGAGTCTCTT nad5 exon E-H AACTCGGATTCGGCAAGAA GTTTTGAAGCCGAGCCTTT nad7 exon1-2 ACCTCAACATCCTGCTGCTC AAGGTAAAGCTTGAAGATAAGTT nad7 exon2-3 GAGGGACTGAGAAATTAATAGAGTACA TGGTACCTCGCAATTCAAAA nad7 exon3-4 ACTGTCACTGCACAGCAAGC CATTGCACAATGATCCGAAG nad7 exon4-5 GATCAAAGCCGATGATCGTAA AGGTGCTTCAACTGCGGTAT 108

110 RESULTATS La protéine TANG2 n est pas totalement essentielle pour l épissage en trans de l intron 3 de nad5. D autres défauts mineurs sont présents chez le mutant tang2, et il est intéressant de voir que ces défauts se retrouvent également chez le mutant otp43. Par exemple, ces deux mutants présentent aussi une réduction de l épissage de l intron1 de nad2 et une accumulation de la forme non épissée (Figure 10). Ces deux protéines ont-elles une action plus ou moins directe sur l efficacité de l épissage de cet intron ou s agit-il d un effet de régulation dû à l absence de l assemblage des sous-unités du complexe I? A ce stade, il est difficile de répondre à cette question, en revanche il serait intéressant de vérifier ce phénomène chez d autres mutants affectés dans l épissage des introns des gènes nad ou chez d autres mutants affectés dans les sous-unités de ce complexe. En collaboration avec Etienne Meyer, j ai eu l occasion de regarder le profil chez un mutant affecté dans une des sous-unités du complexe I. Le défaut d épissage de l intron 1 de nad2 n est pas retrouvé alors que le mutant ndufs4 n a plus de complexe I (Figure 10). Ce défaut n est donc pas typique des mutants de complexe I mais il est plus probable que OTP43 et TANG2 aient une fonction mineure (directe ou indirecte) dans l épissage de l intron 1 de nad2. Un autre point intéressant à noter est la surexpression du transcrit nad6 chez les trois mutants du complexe I. Comme il est montré sur la figure 9, le transcrit nad6 semble être plus abondant chez les mutants otp43, tang2 et ndufs4 comparés au sauvage et aux mutants complémentés. Ce résultat suggère qu une régulation de la transcription ou une régulation post-transcriptionnelle pourrait se mettre en place lorsqu une des sous-unités du complexe I n est plus présente. Figure 9 : Analyse par northern blot des ARN issus des mutants de complexe I et des mutants complémentés avec la sonde nad6. 109

111 RESULTATS Figure 10 : Quantification par PPE des évènements d épissage de l intron1 de nad2 et de l intron de rps3 chez les mutants otp43, tang2, ndusf4 comparés au sauvage. II.2.3 PPR40 PPR40 est également une PPR de type «Pure» faisant partie des 48 protéines PPR que nous avions sélectionnées lors de l étude systématique des protéines PPR. Hormis des clonages et des données de localisation subcellulaire montrant que cette PPR est localisée dans les mitochondries, aucune étude n avait été réalisée sur les mutants d insertion pour cette PPR dans l équipe de Ian Small et de Claire Lurin. En revanche, une analyse de deux mutants d insertion faite par l équipe de L. Szabados a permis d élucider en partie le rôle de cette protéine PPR (Zsigmond, Rigo et al. 2008). 110

112 RESULTATS Cette protéine PPR fusionnée à un TAG HA en C-terminal a été montrée comme étant apparemment associée au complexe III, cependant des données de spectrométrie de masse sur le complexe III provenant d Etienne Meyer n ont jamais permis d identifier cette protéine PPR. Néanmoins, la majorité des protéines PPR étant faiblement exprimées, il est possible qu aucune identification par cette technique ne puisse être faite. Dans les résultats obtenus, Zsigmond et ses collaborateurs montrent que le mutant présente une diminution du complexe III. Or le Blue-Native présenté dans le papier semble montrer également une diminution du complexe I. Les événements d épissage pour les introns de nad1, nad4, et nad7 sont présentés dans l article mais aucune mention n est faite des introns des gènes nad2 et nad5 alors que l on en dénombre 8 pour ces gènes. Le phénotype des deux allèles de ppr40 est caractérisé par des plantes plus petites avec un retard de croissance, phénotype assez similaire à celui des mutants de complexe I, même si cependant d autres défauts pourraient conduire au même phénotype. Ces différentes observations, ou manque d informations, concernant les introns de nad2 et nad5 me laissaient penser que ce mutant pouvait éventuellement présenter un défaut au niveau du complexe I. Nous avions au laboratoire un des deux allèles décrits dans le papier, ppr40-2 (SALK_071712), mais pour lequel le phénotype est moins marqué que ppr40-1. J ai donc décidé de regarder les événements d épissage chez ce mutant afin de voir si le phénotype observé pouvait s expliquer par un défaut dans ce processus au niveau des introns de nad2 et nad5. La PCR quantitative sur les formes épissées et non épissées chez le mutant montre des défauts partiels d épissage pour certains introns (figure 11). En effet, le mutant présente huit fois moins de forme épissée des introns 1 et 4 de nad5. Cette diminution d épissage pourrait expliquer la diminution de complexe I observée dans le BN-PAGE décrit dans le papier de Zsigmond et al. Figure 11 : Profil de l épissage mitochondrial du mutant ppr40-2. Les ratios des formes épissées sur les formes non épissées sont représentés en Log2 en abscisse. 111

113 RESULTATS Le défaut observé dans l épissage de certains introns chez le mutant ppr40 ne signifie pas que la protéine PPR40 est un facteur d épissage. En effet, ce défaut est une diminution et non une absence d épissage et suffisamment de formes épissées sont présentes pour la synthèse et la formation de complexe I. Cependant, l analyse faite ici se porte sur le deuxième allèle dont le phénotype est moins marqué que celui de ppr40-1. Une nouvelle analyse vient d être faite sur cet allèle par Catherine Colas-des-Francs dans le laboratoire de Ian Small et montre qu il n y a pas plus de défaut d épissage chez le mutant ppr40-1 que pour ppr40-2. Le phénotype étant plus marqué il est possible qu il existe une autre mutation dans le mutant ppr40-1. Quoi qu il en soit, cette mutation influence clairement l efficacité de l épissage. Comme il a été décrit dans l introduction, les protéines PPR sont impliquées dans de nombreuses modifications post-transcriptionnelles. Il est possible que PPR40 ne soit pas impliquée directement dans l épissage car cette protéine ne se trouve pas être indispensable pour les deux introns de nad5 pour lesquels un défaut d épissage a été observé, mais elle pourrait avoir un rôle dans la stabilité de certaines formes d ARNm pré-épissées ou dans des maturations en 5 ou en 3 des transcrits primaires, influençant ainsi l épissage. Il reste donc de nombreuses analyses à effectuer afin de comprendre exactement le rôle de cette protéine PPR. II.2.4 Comment identifier de nouvelles PPRs impliquées dans l épissage des introns nad? La majorité des introns dans le génome mitochondrial se situe dans les gènes nad. Ces gènes codent pour des sous-unités du complexe NADH dehydrogenase. Ces sous-unités faisant partie du même complexe, il est possible qu une co-régulation de l expression des gènes codant ces sous-unités ait lieu. Cette régulation pourrait s effectuer à différents niveaux, en commençant par la transcription, la maturation des ARNm et enfin par l activité traductionnelle. La régulation de l épissage pouvant être un mode de régulation de l expression, il est possible que les introns des gènes nad soient épissés et régulés de façon conjointe. Si c est le cas, les facteurs impliqués dans l épissage de ces introns doivent être exprimés de façon conjointe. S il existe une régulation quelconque de l épissage, il pourrait être possible d identifier d autres protéines PPR dont la régulation de l expression des gènes serait similaire à celle des deux gènes codant des protéines PPR décrites dans l épissage des introns nad, et ainsi identifier d autres protéines PPR impliquées dans l épissage. II Co-régulation des PPRs Comme le montre le graphique d expression réalisé sous Genecat (http://genecat.mpg.de/) dans la figure 12, le profil d expression des gènes OTP43 et TANG2 au cours du développement est assez similaire. Les données de ce même logiciel donnent un coefficient de corrélation de Pearson de 0,67 entre ces deux gènes, montrant ainsi une corrélation moyenne entre l expression des deux gènes. En utilisant ce logiciel, de nombreux gènes codant pour des protéines PPR sont identifiés comme étant co-exprimés avec OTP43 et TANG2, mais il est hasardeux de supposer que ces protéines soient impliquées dans un mécanisme similaire car les coefficients restent assez faibles. 112

114 RESULTATS Figure 12 : Expression des gènes OTP43 (At1g74900) et TANG2 (At1g19290) au cours du développement. Analyse réalisée sous Genecat (http://genecat.mpg.de/) en utilisant l option «profil d expression» et sans normalisation du signal d expression. Le mutant tang2 a été identifié au cours de tests de sensibilité au glucose. En présence de glucose ce gène est très fortement exprimé. Il est difficile d établir une relation directe entre le glucose et le fonctionnement de la protéine TANG2 dans l épissage, mais cette information pourrait être utile dans la recherche de nouveaux facteurs intervenant dans ce processus. Sur Genevestigator (https://www.genevestigator.com), logiciel regroupant un grand nombre d expériences de «microarrays», il existe peu de conditions pour lesquelles les deux gènes réagissent de la même manière dans leur expression (ce qui confirme l analyse effectuée sous Genecat). Seule une condition montre une réelle co-expression : les 2 gènes OTP43 et TANG2 sont surexprimés en présence de fortes concentrations en saccharose. Une étude a donc été entreprise à l aide de Genevestigator afin d identifier les autres gènes PPR surexprimés dans les mêmes conditions. L idée était de tester par la suite en génétique inverse si les protéines codées par ces gènes ont un rôle dans l épissage des introns mitochondriaux. Il est clair que cette approche reste très critiquable, mais, n ayant au début que peu d éléments concernant les facteurs d épissage de type PPR dans les mitochondries, cette approche me semblait plus appropriée qu une approche de criblage complètement aléatoire de mutants ppr. II Les nouveaux facteurs d épissage identifiés Parmi les 450 gènes codant pour des protéines PPR, seulement 378 possèdent une sonde de type Affymetrix (description dans le tableau 1 en annexe). Une analyse de l expression sur saccharose grâce à Genevestigator a donc été faite pour ces 378 gènes. En plus des 2 gènes 113

115 RESULTATS OTP43 et TANG2, 19 autres gènes codant pour des protéines PPR sont surexprimés d un facteur au moins deux dans des expériences de haute concentration en saccharose (Figure 13). Figure 13 : Capture d image de l analyse de l expression des 19 gènes codant pour des protéines PPR sous GENEVESTIGATOR. La flèche bleue montre la surexpression de tous ces gènes en présence d une forte concentration en saccharose. A l exception d une protéine montrée expérimentalement par fusion GFP localisée dans les mitochondries, aucune donnée de localisation n a été réalisée pour les 18 autres. Cependant, les données de prédiction de localisation obtenues sous SUBA (http://suba.plantenergy.uwa.edu.au/) permettent de prédire une éventuelle fonction dans les mitochondries pour la majorité d entre-elles (tableau 4). Parmi ces 19 protéines PPR, 10 sont des PPR de type P, 3 de type E, 5 de type E+ et une de type DYW. Les protéines PPR de la sous classe PLS sont généralement impliquées dans l édition ou le clivage des ARNm. De ce fait, si ces gènes surexprimés sur saccharose ont un rôle quelconque dans l épissage, il est fort possible que l effet sur ce type de maturation chez ces mutants soit indirect, en raison d un défaut soit dans l édition de sites proches des sites d épissage (intron ou exon), soit d un défaut de clivage des ARN pré-messagers. Pour cette raison, je me suis focalisé dans un premier temps sur l étude des lignées d insertion ADN-T dans les gènes codant pour les 10 protéines PPR-P, car jusqu à présent seules des protéines PPR-P ont été décrites comme jouant un rôle dans l épissage. 114

116 RESULTATS Tableau 4 : Prédiction de la localisation subcellulaire des 19 protéines PPR surexprimées en présence de saccharose. Prédictions extraites de la base de données SUBA ((http://suba.plantenergy.uwa.edu.au/). II «Pure» PPRs (OTP439) Parmi les 10 gènes codant pour des PPR-P, il a été possible d identifier des mutants d insertion ADN-T disponibles dans les bases de données pour 9 d entre-elles. Ces lignées ont été commandées, semées, et un génotypage ainsi qu une étude du phénotype ont été réalisés pour chaque lignée. Les résultats sont présentés dans le tableau 5. Pour deux gènes PPR, At5g61990 et At3g09060, aucune plante homozygote pour l insertion n a pu être obtenue. Pour deux autres gènes, At2g32630 et At2g30780, il n a pas été possible d amplifier le transgène pour toutes les lignées décrites, l insertion n a donc pas été confirmée. Finalement, seuls 5 gènes sur les 10 de départ ont permis d identifier des mutants homozygotes pour l insertion de l ADN-T. Une lignée homozygote pour chacun des 5 gènes a été sélectionnée et une détection des événements d épissage mitochondriaux a été entreprise. Les 4 lignées homozygotes pour les 4 gènes, At1g06580, At1g62670, At1g02060, At2g01390 ne présentent pas de phénotype particulier et sans surprise aucun défaut d épissage n est détecté par PCR quantitative comme le montre la figure 14. En revanche, la dernière lignée d insertion homozygote, correspondant au gène At3g48810 codant pour une protéine PPR nommée OTP439 par la suite, présente un défaut de retard de développement. La détection des événements d épissage représentée sur la figure 15 montre plusieurs défauts partiels dans l épissage de l intron 1 de nad2, de l intron 1 de nad5 et de l intron 2 de nad5 (dans cette expérience les oligonucléotides dessinés pour la PCR quantitative ne permettaient pas de distinguer entre l intron 2 et 3 de nad5. C est au cours d une nouvelle analyse non montrée ici, en redessinant des oligonucléotides, que l on a pu distinguer le défaut entre ces deux introns). A ce stade il est intéressant de noter que l on retrouve un défaut partiel de l épissage de l intron 1 de nad2 identique aux défauts observés chez les autres mutants, tang2, otp43 et ppr40, affectés dans l épissage des introns mitochondriaux. 115

117 RESULTATS Tableau 5 : Résumé des génotypages et de l analyse des phénotypes associés des mutants présentant des insertions dans des gènes PPR de type «Pure» sur-exprimés sur saccharose. Figure 14 : Profil de l épissage mitochondrial chez les mutants affectés dans les gènes At1g06580 (425 : salk_022879), At1g62670 (428 : salk_146198), At1g02060 (430 :Sail_423B07), At2g01390 (432 : salk_025648). 116

118 RESULTATS Figure 15 : Profil de l épissage mitochondrial chez le mutant otp439. Ce retard de développement, observé chez ce mutant est typique des mutants de complexe I et peut s expliquer par une réduction des formes épissées des transcrits nad2 et nad5. Cette réduction s accompagne d une diminution mais non une absence de complexe I, ainsi que de la présence d un sous-complexe partiel de taille plus petite comprenant la sous-unité NAD6 (résultats obtenus par Catherine Colas-des-Francs à Perth). Cette présence de ce souscomplexe est accompagnée d une sur-expression de la protéine NAD6 et est spécifique du mutant otp439. Le mutant tang2 est également affecté dans l épissage des transcrits nad5 mais, en revanche, il ne présente pas d accumulation de la protéine NAD6 et de souscomplexe comme pour otp439. Il est donc possible qu OTP439, en plus d influencer l épissage, ait une autre action. Même si le défaut d épissage est assez marqué chez otp439, ce défaut n est pas total et on ne peut donc pas conclure sans expérience additionnelle que la protéine OTP439 est un facteur d épissage mitochondrial, en revanche cette protéine est importante pour l efficacité d épissage de certains introns et est ainsi la quatrième protéine PPR identifiée influençant l épissage mitochondrial. Il sera intéressant d effectuer de plus amples études afin de comprendre comment cette protéine influence l épissage, si c est en stabilisant l ARNm ou alors en agissant sur sa maturation. II Influence de l édition dans l épissage Neuf gènes codant pour des protéines de type PLS sont également surexprimés sur saccharose. Aucune donnée ne permet de montrer la fonction de ces neuf protéines au niveau mitochondrial, cependant le fait qu elles appartiennent à la sous-famille PLS suggère un éventuel rôle dans l édition ou dans le clivage. Certains sites d édition dans le génome mitochondrial sont décrits à proximité de jonctions exon-intron ou au sein même de l intron. Ces sites pourraient avoir une influence sur l efficacité de l épissage en agissant sur la structure secondaire des ARN pré-messagers comme il a déjà été montré pour l épissage de 117

119 RESULTATS l intron de cox2 chez le blé où l édition d un site dans la zone IBS (pour Intron Binding Site) de l exon1 est essentielle pour l efficacité de l épissage (Kurihara-Yonemoto and Handa 2001). Afin de savoir si ces neuf gènes ont un rôle quelconque dans l épissage, une approche de génétique inverse a donc été mise en place. Deux gènes, At1g06145 et At2g04860 n ont pas de lignées d insertion ADN-T associée dans les bases de données. Pour les 7 autres gènes, une étude des lignées d insertion a permis d obtenir des mutants homozygotes pour 3 gènes uniquement. Cependant, aucune de ces 3 lignées ne présente de phénotype macroscopique. Les mutants affectés dans le complexe I présentent des délais de germination plus ou moins sévères selon la mutation. Ainsi pour otp43, des plantes homozygotes ne peuvent être obtenues qu en semant des graines issus d hétérozygotes sur un milieu in vitro standard et après un long délai avant germination. Ainsi, contrairement à des graines issues de plantes sauvages ou à trois quart des graines issues d hétérozygotes, il faut attendre entre 2 et 3 semaines avant que des graines homozygotes ne germent. Dans le cas des lignées pour lesquelles aucun mutant homozygote n avait été obtenu dans une première étude, j ai prolongé les temps de germination et transféré en terre les plantules ayant germé très tardivement. En utilisant cette méthode, des plantes homozygotes pour l insertion ADN-T SALK_ dans le gène At1g03540 ont été obtenues très récemment. Ce mutant présente un délai de germination très important et montre également un fort délai de développement ainsi qu un phénotype nain (Figure 16). Alors que les graines des plantes hétérozygotes pour l insertion sont déjà récoltées, la majorité des plantes homozygotes commencent seulement à avoir une hampe florale comme le montre la photo dans la figure 16. Seule une lignée ADN-T pour ce gène montre ce phénotype. Pour les deux autres lignées, il n a jamais été possible de détecter la présence du transgène par PCR sur ADNg. Figure 16 : Photos du mutant salk_ et description des motifs PPR qui composent la protéine At1g Ce phénotype très marqué est probablement le résultat d un dysfonctionnement mitochondrial. Afin d identifier le défaut moléculaire, j ai tout d abord caractérisé les événements d épissage chez ce mutant par PCR quantitative dans l espoir qu un défaut d édition ou de clivage pourrait avoir un impact sur l épissage. Lorsque la comparaison entre le mutant et le sauvage est effectuée entre les taux de formes épissées, on observe une 118

120 RESULTATS diminution de l épissage de l intron1 de nad2, diminution déjà observée chez les autres mutants étudiés précédemment (figure 17A). En revanche, lorsque cette comparaison est effectuée entre les ratios de formes épissées sur les formes non épissées (Figure 17B), le mutant montre une diminution relativement importante pour une majorité des introns. Ainsi, le taux d épissage ne semble pas être affecté à l exception de l intron 1 de nad2, mais le taux de transcrits non épissés est fortement augmenté chez le mutant. Ce mutant est actuellement en cours d étude afin de comprendre quel est le défaut moléculaire primaire. Dans le cadre d un projet de mise au point des nouvelles approches de séquençage «haut-débit» sur appareil de type «Solexa», ce mutant va être utilisé pour évaluer notre capacité à détecter des défauts moléculaires chez des mutants PPR par ce type d approche. Figure 17 : Profil de l épissage des transcrits mitochondriaux du mutant salk_ et sont deux répétitions biologiques. A. Ratios des formes épissées entre le mutant et le sauvage représentés en Log2 en abscisse. B. Ratios des formes épissées sur les formes non épissées entre le mutant et le sauvage représentés en Log2 en abscisse. 119

121 RESULTATS II Effet du sucre sur l épissage Le saccharose ou le glucose ont visiblement une influence sur la transcription de certains gènes codant pour des protéines PPR impliquées dans l épissage des introns mitochondriaux, mais il reste à vérifier si cette surexpression a un impact sur l efficacité de l épissage. En d autres termes : Y a t-il une variation de l épissage lorsque des graines ou des plantules sont cultivées sur des milieux plus ou moins riches en sucre? En vue de mieux comprendre le phénomène observé et de tenter d expliquer cette surexpression des gènes codant ces proteines PPR, j ai donc entrepris différentes expériences de culture d Arabidopsis de type sauvage (Col-0) sur des milieux plus ou moins riches en sucre et analysé les différents événements d épissage afin d observer d éventuels changements de ratios entre les formes épissées et non épissées pour chaque intron. Deux types d expériences ont été réalisées, la première a été de caractériser l épissage chez des plantules cultivées sur des milieux ½ MS avec des concentrations de saccharose variant de 0 à 3% et d effectuer des comparaisons de ratios avec des plantules poussées sur 1% de saccharose. La deuxième expérience a consisté à effectuer la même analyse pour des plantules cultivées sur des concentrations de glucose variant de 0 à 3% comparées à des plantules cultivées sur des concentrations en mannitol similaires. Comme il est montré dans les deux figures suivantes (figures 18 et 19), aucun changement significatif n a été détecté dans ces deux types d expériences. Alors qu une forte concentration en sucres influence l expression de gènes codant pour des PPR impliquées dans l épissage, il n existe pas de lien entre cet effet et le taux de transcrits mitochondriaux épissés. Figure 18 : Profil de l épissage mitochondrial chez des plantules cultivées en présence de différentes concentrations de saccharose. La comparaison est faite avec des plantules cultivées sur 1% de saccharose. 120

122 RESULTATS Figure 19 : Profil de l épissage mitochondrial chez des plantules cultivées en présence de différentes concentrations de glucose et de mannitol. Il n a pas été possible dans cette expérience de regarder en détails le taux de transcription mitochondrial en présence de sucre, mais il est possible qu en condition de forte concentration de sucre, l activité transcriptionnelle mitochondriale soit augmentée et que les facteurs d épissage soient donc aussi sur-exprimés. 121

123 RESULTATS II.3 L épissage alternatif des PPR Préambule : Au cours de clonages, j ai été amené à découvrir par hasard des événements d épissage alternatif dans des transcrits codant pour des protéines PPR et j ai donc voulu évaluer ce phénomène au sein de la famille. L épissage alternatif est un phénomène permettant à un gène de coder pour plusieurs protéines. Ce phénomène s établit soit par l épissage de façon alternative de un ou plusieurs exons, soit par la rétention d un ou plusieurs introns ou par l utilisation de sites donneurs ou accepteurs d épissage alternatifs. Ce phénomène chez l homme joue un rôle très important dans le développement des cellules, l'organisation des tissus et même dans le développement d'un individu. Le dogme de «un gène => une protéine» est donc révolu et il est maintenant montré par séquençage haut-débit que plus de 90 % des gènes chez l homme subissent de l épissage alternatif (Wang, Sandberg et al. 2008) créant ainsi une grande variété de protéines largement supérieure à celle estimée. Ainsi gènes chez l homme vont permettre de coder pour environ protéines (Modrek and Lee 2002). Chez les plantes, et notamment chez Arabidopsis, l épissage alternatif a longtemps été largement sous-estimé. Alors que les données d EST dénombraient moins de 20% des gènes chez Arabidopsis possédant des formes alternatives d épissage (Kim, Magen et al. 2007), les nouvelles données provenant de séquençage haut-débit montrent que 42% des gènes comprenant des introns ont des formes d épissage alternatives (Filichkin, Priest et al. 2010). Contrairement au monde animal, chez les plantes peu d études ont été réalisées concernant la fonction des différents isoformes au niveau protéique cependant il est certain que ces isoformes permettent d augmenter la diversité protéique. L épissage alternatif est régulé de façon temporelle et spatiale et est souvent induit lors de stress environnementaux (Reddy 2007), permettant ainsi la régulation de l expression des gènes. Dans ce type de régulation, deux mécanismes majeurs sont impliqués. De nombreux isoformes découverts par séquençage haut-débit aboutissent à des formes pour lesquelles l épissage alternatif conduit à un changement de phase et à l apparition d un codon stop prématuré (PTC). Lorsque ce codon apparaît 50 nucléotides avant le codon stop originel, un processus de dégradation de ces transcrits est alors mis en place par la voie NMD (pour Nonsense mediated mrna Decay) qui va reconnaître les transcrits aberrants grâce à un complexe protéique et ainsi provoquer la dégradation de ceux-ci (Chang, Imam et al. 2007). Un deuxième mécanisme, qui induit également la voie de dégradation NMD, est l apparition de formes aberrantes d épissage de type «RUST» (pour Regulated of unproductive splicing and translation). Cette voie permet ainsi la régulation de l expression de certains gènes et est notamment décrite chez les gènes codants les protéines SR impliquées dans l épissage alternatif (Lareau, Inada et al. 2007). Il existe plusieurs types d épissage alternatif décrits dans la figure 20. Quatre vont permettre de changer la séquence protéique et deux autres permettent de contrôler l expression et la stabilité des ARNm. Selon les règnes, ces événements ne sont pas présents de la même manière et, alors qu un type d événement est majoritairement présent dans un cas, il peut se trouver très rare chez un autre. C est le cas du phénomène de rétention d introns très répandu chez les plantes alors qu il est rare chez les vertébrés et les invertébrés (Keren, Lev- Maor et al. 2010). Ainsi, chez les plantes supérieures dont le génome a été séquencé et pour lesquelles suffisamment de séquences d ESTs et d ADNc sont disponibles, la proportion des événements d épissage alternatif est différente des vertébrés et des invertébrés. Comme le montre la figure 21, les deux phénomènes majoritaires trouvés chez Arabidopsis, le riz et le maïs sont des événements d épissage alternatif de type «rétention d intron» et «site 122

124 RESULTATS d épissage alternatif accepteur», représentant à eux deux plus des trois quart des formes trouvées (Barbazuk, Fu et al. 2008). Figure 20 : Description des différents événements possibles d épissage alternatif. L épissage alternatif peut être divisé en quatre sous-groupes : A. L excision d exon est la forme d épissage alternatif la plus répandue chez les eucaryotes supérieurs et représente 40 % des événements d épissage, en revanche ce phénomène est moins répandu voir même très rare chez les eucaryotes inférieurs. B. La rétention d intron est un mécanisme dans lequel l intron n étant pas excisé, est présent dans l ARNm mature et va donc être traduit. Ce mécanisme peu répandu chez les vertébrés et les invertébrés (5% des événements d épissage alternatif), est assez répandu chez les plantes, les mousses et les protozoaires. C. Le site accepteur alternatif et D. le site donneur alternatif sont deux mécanismes qui ont lieu lorsque plusieurs sites d épissage accepteurs ou donneurs sont présents au sein d un même exon. Ces deux événements représentent respectivement 18,4% et 7,9% des événements d épissage alternatif chez les eucaryotes supérieurs. De façon assez rare, l épissage alternatif peut avoir lieu sur des séquences non codantes, dans les régions 5 ou 3 UTR, conduisant ainsi à la possibilité d obtenir différents sites d initiation de la traduction (E) ou des sites alternatifs de poly Adenylation (F) (Keren, Lev-Maor et al. 2010). 123

125 RESULTATS Figure 21 : Proportion des événements d épissage alternatif chez Arabidopsis, le riz et le maïs. Figure extraite de Barbazuk et al. (2008). Qu en est-il des transcrits codant des protéines PPR? Il faut tout d abord noter que les gènes PPR sont une classe de gènes à part. En effet, la majorité de ces gènes ne contient pas d introns. Alors qu une moyenne de 5 introns par gène est observée chez Arabidopsis, un ratio bien inférieur est observé pour la famille PPR. Environ 80 % des gènes PPR n a pas d introns, 12 % ont un intron et seulement 8 % ont plus d un intron. Du fait de leur architecture, si de l épissage existe pour ces gènes sans intron il est donc fort probable que l épissage alternatif au sein de cette famille soit différent de ce qui est observé globalement chez Arabidopsis. II.3.1 Epissage alternatif identifié dans les banques d EST Cette première étude a été réalisée en utilisant FLAGdb++ (http://urgv.evry.inra.fr/flagdb) (Samson, Brunaud et al. 2004). Pour chaque gène PPR d Arabidopsis, les ESTs et les ADNc décrits dans cette base de données ont été analysés afin de voir si des formes alternatives d épissage étaient décrites. La majorité des gènes PPR sont très faiblement exprimés et de ce fait aucun ADNc ou EST n existe pour une grande partie d entre eux. Ainsi, sur les 450 gènes codant pour des protéines PPR, seulement 201 ont au moins un ADNc décrit et de fait mon étude s est donc portée sur ces derniers. Sur ces 201 gènes PPR, 6 gènes (At1g13040, At2g02980, At5g60960, At1g09410, At5g06540, At1g74900) ont des transcrits présentant au moins une isoforme d épissage identifiée par des ADNc ou des ESTs. 4 autres gènes (At1g61870, At1g62350, At1g74900, At2g02750) présentent également des formes épissées alternatives, cependant, pour ces derniers, il est difficile de conclure car l EST montrant ce phénomène ne couvre qu une faible partie du gène. Cette première observation suggère que 5% des gènes PPR caractérisés ont des transcrits alternatifs d épissage. Cette proportion est certainement sous estimée car parmi les 201 gènes PPR étudiés, la majorité n a seulement qu un ou deux ADNc décrits ce qui ne permet pas d avoir une couverture statistiquement satisfaisante de la structure des transcrits. Néanmoins, cette première analyse a permis de confirmer l existence d épissage alternatif au sein de plusieurs gènes PPR sans intron. Sur les six gènes présentant différentes isoformes, se trouve le gène OTP43 qui, par ailleurs, est le premier cas pour lequel des formes alternatives d épissage ont été mises en évidence au laboratoire. Une seule isoforme est décrite dans les différentes banques, alors que j ai pu mettre en évidence quatre autres formes au cours de ma thèse. Le cas d OTP43 sera présenté dans le chapitre «cas d OTP43». 124

126 RESULTATS Les différentes isoformes décrites dans les banques de d ADNc sont présentées dans la figure 22, chaque isoforme après traduction est montrée sous la forme d un alignement de séquence avec la protéine issue d un ARNm non épissé. L épissage alternatif sur ces 6 gènes conduit à 3 différentes classes d isoformes selon le type d impact sur l ARNm final et la synthèse protéique. La première classe d isoformes se caractérise par l apparition d un codon stop prématuré comme le montre l exemple AT1g09410, conduisant certainement à une dégradation de cet ARN via la voie NMD. Ce mécanisme, comme cela a été décrit précédemment, permettrait la régulation de l expression de cette PPR. La deuxième classe, visiblement la plus répandue, est caractérisée par des isoformes dans lesquelles l excision d une partie codante ne change pas la phase de lecture. Si l isoforme est traduite, les codons d initiation et d arrêt de la traduction seront identiques, mais la protéine présentera un certain nombre de délétions de peptides en comparaison avec la forme non épissée. Ces délétions de peptides pourraient créer ainsi des protéines différentes pouvant avoir d autres fonctions. De tels événements ont été identifiés pour les gènes At5g06540, At2g02980, At5g La troisième classe est définie par l apparition potentielle d un nouveau codon «start» en aval du codon d initiation de la traduction originel. Deux cas sont présentés : At5g60960 et At1g La majorité des protéines PPR possèdent une séquence d adressage à leur extrémité N-terminale. Ce changement de codon d initiation de la traduction pourrait ainsi avoir un impact sur la localisation subcellulaire de ces nouvelles isoformes créées, même s il n est pas prouvé que ces différentes isoformes soient effectivement traduites. Ces différentes formes observées sont, dans la majorité des cas, le résultat d une excision par l intermédiaire de sites donneurs et accepteurs d épissage conventionnels, GT-AG. Cependant trois autres cas sont décrits ici. La présence d un site accepteur GG pour At2g02980, l intervention d un site donneur GC pour la synthèse de l isoforme 3 de At5g60960, et la présence d un site donneur CT et accepteur AT non conventionnels pour l élaboration de l isoforme 2 de At5g

127 RESULTATS 126

128 RESULTATS Figure 22 : Description des isoformes de At1g13040, At2g02980, At5g60960, At1g09410, At5g Les isoformes d ARNm sont représentées dans un premier temps sous la forme d un schéma sur lequel les sites donneurs et accepteurs d épissage sont annotés. Les protéines résultantes de ces isoformes sont ensuite représentées dans un alignement avec la forme non épissée traduite sous Multalin. Depuis cette première analyse, d autres cas ont été identifiés. C est le cas de At5g04810 qui, par séquençage haut-débit, a montré une isoforme provenant d un site accepteur alternatif dans l exon 4, 8 nucléotides après le site conventionnel (Filichkin, Priest et al. 2010). Ce changement conduit à un codon de terminaison de la transcription prématuré pour lequel le transcrit va certainement être pris en charge par la voie de dégradation NMD. D autres exemples sont également répertoriés dans la base de données plantgdb (http://www.plantgdb.org/). La rétention d intron pour At4g26800 conduit à un probable changement de codon d initiation de la traduction alors que la rétention d intron dans le cas de At5g02830 et de At2g17670 conduit a un codon stop prématuré. 127

129 RESULTATS II.3.2 Analyse préliminaire des 48 PPRs «du laboratoire» La majorité des gènes PPR étant faiblement exprimée, il existe peu d ADNc décrits. Afin d avoir une meilleure idée de la proportion de gènes PPR présentant des formes alternatives d épissage, une RT-PCR à partir d ADNc, suivie d un clonage, a été effectuée pour un échantillon de gènes PPR représentatif. Quarante huit gènes PPR ont été sélectionnés par le laboratoire il y a une dizaine d années afin de mener de nombreuses études fonctionnelles de la famille des protéines PPR. En vue de réaliser ces études, un clonage systématique avait été réalisé en utilisant le système de clonage par recombinaison GATEWAY. Ces gènes PPR n ayant pas d introns, tous les clonages avaient donc été faits à partir d ADNg. Nous avions toujours au laboratoire les oligonucléotides permettant d amplifier ces gènes PPRs. Une PCR sur ADNg et ADNc après synthèse à partir d ARN total de feuilles d Arabidopsis a donc été faite (figure 23). Figure 23 : Analyse par PCR comparative sur ADNc et ADNg de la présence d épissage alternatif au sein des 48 transcrits PPR du laboratoire. La présence de profils d amplification est encadrée en vert. Dépôt sur gel 1,2% TAE des produits PCR obtenus à partir d ADNc (puits de gauche) et d ADNg (puits de droite). Le marqueur de taille utilisé est le «1kb DNA ladder» de chez Biolabs (ref : N3232L). 128

130 RESULTATS Cette comparaison montre des profils d amplification différents selon la matrice utilisée. Ainsi, des bandes supplémentaires ont été observées lorsque la matrice utilisée est de l ADNc, alors qu elles sont absentes lorsque la matrice est de l ADNg. Sur les 48 amplifications, 21 présentent des bandes supplémentaires plus ou moins intenses mais qui ne sont pas retrouvées lorsque l amplification est réalisée sur de l ADNg (Figure 23). Ces bandes peuvent correspondre à des bandes parasites dues à une amplification aspécifique ou à des formes d épissage alternatif. Afin de conclure, les produits PCR ont été clonés dans le vecteur pgemteasy, des bactéries DH5 ont été transformées et sélectionnées sur carbenicilline/xgal/iptg. Les colonies blanches positives ont été testées par PCR et les plasmides extraits ont été séquencés en utilisant les amorces M13Fw et M13rev. Tous les produits n ont pu être caractérisés entièrement mais l étude a été menée jusqu au bout pour un certain nombre. Nous avons pu montrer que les bandes supplémentaires obtenues dans certains puits étaient des amplifications aspécifiques, comme par exemple l amplification d une palmitoyl thoesterase (At3g60340) avec les oligonucléotides spécifiques de PPR28, ou d une Purine transmembranaire AtPUP14 avec les oligonucléotides spécifiques de PPR16. Pour d autres, comme PPR36, PPR4, PPR13, PPR19, il n a pas été possible de cloner les produits intermédiaires. En revanche, pour deux autres gènes, PPR24 et PPR47, il a été possible de montrer l existence d épissage alternatif. Figure 24 : Isoformes d épissage alternatif de PPR24 détectées par RT-PCR suivie d un clonage. Les deux isoformes amplifiées et déposées sur un gel contenant 1% d agarose dans du TAE (marqueur de taille : «1kb DNA ladder» de chez Biolabs (ref : N3232L)), sont représentées sous la forme d un schéma sur lequel les sites donneurs et accepteurs d épissage sont annotés. Le transcrit isoforme 2 peut coder théoriquement pour 2 protéines comme montré dans l alignement effectué sous Multalin. 129

131 RESULTATS PPR24 est une protéine PPR de type DYW. Par RT-PCR et dépôt sur gel, deux produits d amplification sont détectés en utilisant les oligonucléotides «start» et «stop» de PPR24 (figure 24). Ces deux produits correspondent à deux transcrits ppr24. Le premier est la forme pleine longueur sans épissage et le deuxième est le résultat d une excision de 586 nucléotides entre la position 515 et 1101 (Figure XX). Cet épissage crée un changement de phase de lecture avec la création d un codon de terminaison de la traduction prématuré (PTC) (AS1 sur la figure XX) et le transcrit résultant devrait donc être dégradé via la voie NMD. Cependant un autre codon d initiation de la traduction pourrait être utilisé aboutissant à une nouvelle protéine identique à PPR24 mais tronquée en N-terminal (AS2 sur la Figure 24). Ceci n est qu une hypothèse très théorique qui demande à être confirmée. Figure 25 : Isoformes d épissage alternatif de PPR47 détectées par RT-PCR suivie d un clonage. Les deux isoformes amplifiées et déposées sur un gel contenat 1% d agarose dans du TAE (marqueur de taille : «1kb DNA ladder» de chez Biolabs (ref : N3232L)), sont représentées sous la forme d un schéma sur lequel les sites donneurs et accepteurs d épissage sont annotés. Les deux transcrits peuvent coder pour 2 protéines différentes comme montré dans l alignement effectué sous Multalin. PPR47 est une protéine PPR de type E+ localisée dans les chloroplastes, dont le mutant d insertion SALK_ ne présente pas de défaut d édition (Hammani, Okuda et al. 2009). Deux isoformes ont pu être mises en évidence par séquençage. La première correspond à la forme pleine longueur du transcrit PPR47 et correspond au transcrit majoritaire détecté par RT-PCR en utilisant les oligonucleotides «start» et «stop» de PPR47 (Figure 25). La deuxième isoforme (isoforme 2 sur la Figure 25) correspond à un transcrit épissé, dans lequel 597 nucléotides sont excisés. L épissage de cette séquence codante ne change pas la phase de lecture et, comme le montre l alignement de séquence protéique entre les deux isoformes, l isoforme 2 conduit à une protéine similaire ayant une séquence interne tronquée. Il est possible, que cette isoforme, même si elle est visiblement très peu présente (indétectable par RT-PCR et dépôt sur gel) ait une fonction alternative. 130

132 RESULTATS Des isoformes d épissage alternatif ont également été détectées pour PPR14, cependant comme le montre la Figure 26, il est fort possible que celles-ci n existent pas réellement et ne soient finalement que le résultat d un artefact lors de la synthèse du premier brin d ADNc ou de la PCR. En effet au niveau de chacune des jonctions des sites d épissage putatifs, on trouve des séquences identiques de 7 et 9 nucléotides (marquées en rouge sur la Figure 26). Lors de la synthèse d ADNc, il est possible que ces séquences s hybrident, éliminant ainsi la séquence interne. Il serait nécessaire d effectuer une synthèse d ADNc avec de la Superscript III pour laquelle la température de synthèse est de 50ºC (au lieu de 42ºC pour la Superscript II) afin de vérifier si ces formes sont conservées à cette température plus haute et s il s agit, ou non, de formes probables d épissage alternatif. Faute de temps, cette expérience n a pas été réalisée. Quoi qu il en soit ces formes pourraient également résulter d événements moléculaires liés à la PCR qu il sera plus difficile d éliminer simplement. Figure 26 : Isoformes detectées pour PPR14. En majuscule sont décrites les zones non épissées. En rouge, les nucléotides dont la séquence identique pourrait créer des artéfacts lors de la réaction de transcription inverse de synthèse d ADNc ou au cours de la PCR sur ADNc. En conclusion, cette analyse n est pas encore terminée et d autres clonages doivent être entrepris, cependant, sur les 48 gènes PPR sélectionnés, il a été possible de montrer qu au moins 4 gènes, OTP43, PPR15, PPR24 et PPR47 présentent des formes alternatives d épissage. Ces données préliminaires montrent à nouveau que cet événement n est pas isolé, et doit donc jouer un rôle soit dans la régulation de l expression, soit dans l élaboration de nouvelles protéines fonctionnelles. Faute de temps, malheureusement cette expérience n a jamais été complètement terminée. Mais, il a tout de même été possible de caractériser deux nouveaux cas et aussi de montrer que des artefacts pouvaient avoir lieu au cours de la synthèse du premier brin d ADNc. 131

133 RESULTATS II.3.3 Cas d OTP43 et de ses différentes isoformes II Identification des isoformes par RT-PCR OTP43, comme il a été décrit auparavant, est une protéine PPR de type «Pure», dont la fonction dans l épissage en trans de l intron 1 de nad1 a été montrée (de Longevialle, Meyer et al. 2007). Cette protéine PPR fait partie des 48 PPR sélectionnées lors de l étude préliminaire de la détection des formes alternatives d épissage par RT-PCR. Un intérêt majeur étant porté à celle-ci, une étude plus approfondie a été entreprise. L annotation TAIR 9 propose l existence d au moins une isoforme. En effet, alors qu une annotation manuelle de ce gène décrit un gène sans intron, l annotation basée sur le séquençage d un ADNc propose un gène présentant un intron dans la région 3 du gène. Plusieurs logiciels de prédiction de sites alternatifs d épissage sont disponibles en ligne. En utilisant le logiciel NNSPLICE version 9.0 (http://www.fruitfly.org/seq_tools/splice.html), deux sites donneurs et deux sites accepteurs sont détectés et permettent de prédire 5 isoformes possibles pour l ARNm otp43. Une analyse similaire en utilisant le logiciel ASSP (http://www.es.embnet.org/~mwang/assp.html), permet de prédire deux sites donneurs constitutifs, un site accepteur constitutif et un autre site accepteur alternatif. Ces sites correspondent aux sites décrits en utilisant le premier logiciel. Ces données in silico montrent que le transcrit d OTP43 pourrait avoir au moins 5 isoformes possibles. Afin de vérifier l existence de la forme pleine longueur sans intron et de trouver les autres formes prédites par les logiciels de prédiction, une RT-PCR, suivie d un clonage en pgemt easy et de séquençage ont été effectués sur les transcrits d OTP43. Après le séquençage de nombreux plasmides, j ai pu identifier 4 isoformes correspondants à OTP43 (figure 27), mais étrangement je n ai pas réussi à cloner la forme décrite dans la collection d ADNc sous TAIR9, représentée dans la Figure 27 par le transcrit noté otp43-2. Comme le montre le gel (figure 27A), ces différentes formes ne sont pas présentes de manière équivalente. La forme prédominante est la forme pleine longueur sans épissage et les autres formes sont moins représentées. Parmi les 5 isoformes, quatre ont la même phase de lecture que le transcrit non épissé (OTP43-1, OTP43-2, OTP43-3, OTP43-4). Ces isoformes après traduction codent pour des protéines ayant des extrémités N- et C-terminales identiques mais présentant des délétions de motifs plus ou moins importantes selon l épissage. La dernière isoforme, OTP43-5, est l isoforme la plus courte et est issue de l épissage entre le premier site donneur et le dernier site accepteur. Ce processus crée un changement de phase de lecture et conduit à l apparition d un codon de terminaison de la traduction prématuré. Ce codon se situe à moins de 50 nucléotides de la fin du transcrit, suggérant que ce transcrit n est éventuellement pas dégradé via la voie NMD et pourrait être traduit. Il existe cinq isoformes différentes pour OTP43, en revanche seule la forme non épissée est «fortement» exprimée. Toutes ces expériences ont été réalisées à partir d ARN extrait de feuilles. L épissage alternatif est un événement qui peut se produire selon le stade de développement, selon les organes ou lors de conditions de stress. J ai voulu rechercher quelle est la proportion des différentes isoformes d OTP43 dans différents organes et si l on pouvait observer une accumulation ou disparition de certaines formes selon les organes examinés. Afin de commencer à apporter un début de réponse à cette question, j ai réalisé une RT- PCR en utilisant des ARN provenant de différents organes et les oligonucléotides «start» et «stop» d OTP43. Comme il est montré sur la Figure 28, dans cette expérience, il semble que la proportion des différents isoformes diffère selon l organe. 132

134 RESULTATS Figure 27 : Isoformes issues d épissage alternatif du transcrit OTP43. A. PCR sur ADNc avec les amorces «Start» et «Stop» correspondants à OTP43. B. Représentation schématique des 5 isoformes avec la position des sites donneurs et accepteurs d épissage. Figure 28 : Caractérisation des différents transcrits otp43 dans différents organes d Arabidopsis. RT-PCR à partir d ARN extraits de cotylédons, de feuilles, d apex, de feuilles caulinaires ou de boutons floraux. La PCR sur ADNc est faite en présence des amorces «start» et «stop» d OTP µl sont déposés sur un gel TAE contenant 1,2% d agarose. Le marqueur de taille est du «1kb DNA ladder» de chez Biolabs (ref : N3232L). L isoforme OTP43-5 n est présente que dans les cotylédons, les feuilles caulinaires et les boutons floraux. Alors qu elle est fortement diminuée dans les feuilles, elle n est pas détectable au niveau de l apex. L isoforme OTP43-4 ne semble être détectable que dans les 133

135 RESULTATS cotylédons et la forme OTP43-3 est présente dans l apex, les feuilles caulinaires et les boutons floraux. En parallèle, OTP43-1 n est pas exprimée de façon équivalente dans tous les organes, alors qu elle est fortement exprimée au niveau de l apex et des feuilles caulinaires, son expression est diminuée dans les boutons floraux. Ainsi la forme OTP43-5 est la plus abondante dans les boutons floraux alors que dans tous les autres organes testés, c est la forme pleine longueur sans épissage qui domine. Ces premières données suggèrent qu il existe une régulation de l épissage alternatif dans les organes. Malheureusement, une répétition de cette expérience n a pas été très concluante et m a conduit à envisager une approche plus quantitative. Afin de démontrer l existence d une régulation de l épissage du transcrit OTP43, une autre approche «semi-quantitative» par northern blot ou par PCR quantitative serait en effet plus judicieuse. En utilisant des oligonucléotides chevauchant les différentes régions de jonction exon-exon après épissage, j ai essayé de quantifier les différentes isoformes, mais, malheureusement, certains oligonucléotides n étant pas compatibles avec la PCR quantitative et la majorité des produits PCR étant amplifiés trop tardivement, je n ai pas été capable d obtenir des conditions permettant une quantification. Une approche par northern blot devra être envisagée dans le futur pour confirmer ces résultats. II Preuves de traduction des différents transcrits : La détection de ces différents transcrits ne signifie pas que tous vont être traduits et coder ainsi pour différentes protéines. Néanmoins, il faut remarquer que la majorité d entre eux conservent les mêmes codons d initiation et de terminaison de la traduction ce qui rend plus probable leur traduction. Il est possible que ces isoformes d ARNm aient juste un rôle dans la régulation de l expression d OTP43. Et il est donc nécessaire de vérifier leur existence en tant que «protéine». Dans les différentes bases de données de protéomiques, aucune donnée concernant OT43 n est disponible, ainsi aucun peptide spécifique de cette protéine n a été séquencé par spectrométrie de masse (ce résultat illustre à nouveau la faible expression des protéines PPR). Cependant, OTP43 a fait l objet, comme nous en discuterons ultérieurement, d une expérience de TAP-TAG dans le but d identifier ses partenaires protéiques éventuels. Une surexpression dans des cellules d Arabidopsis de la protéine étiquetée en C-terminal, nous a permis de la purifier sur colonne d affinité et de séquencer par spectrométrie de masse les protéines co-purifiées avec notre protéine d intérêt. Au cours de ce séquençage, un certain nombre de peptides spécifiques d OTP43 ont été observés, mais également des peptides spécifiques de certaines isoformes. La figure 29 montre un alignement protéique entre les différentes isoformes possibles d OTP43 ainsi que les zones spécifiques permettant de différencier les différentes isoformes. Aucun peptide permettant d identifier un épissage de la zone A n a pu être détecté, en revanche un peptide spécifique de cette zone A permettrait de prouver sa rétention dans certaines isoformes (OTP43isoform1 et OTP43isoform2). La zone B est présente pour les isoformes 1 et 3 (OTP43isoform1 et OTP43isoform3) et est absente pour les isoformes 2 et 4 (OTP43isoform2 et OTP43isoform4). Deux peptides indiqués en rouge au niveau de cette zone dans la figure 29 permettent de distinguer entre ces deux types d isoformes et la conjugaison entre la présence et l absence de la zone A et la zone B selon les zones où le séquençage a eu lieu sur le gel, permettent de préciser la présence ou l absence de telle ou telle isoforme. Ainsi, dans la zone des 35kDa sur le gel SDS-PAGE, le peptide spécifique de la zone B est détecté alors qu il n y a aucune présence de la zone A. Seuls les peptides après cette zone sont détectés. Il est possible que cette protéine corresponde à l isoforme OTP43-isoform3 mais avec une dégradation en N-terminal. Dans la zone des 42 kda, aucun peptide spécifique des zones A et B n est détecté, en revanche le peptide spécifique de l absence de la zone B est trouvé. Ceci correspond donc à l isoforme OTP43isoform4 avec un poids moléculaire théorique de 42,1 kda. Dans la zone des 55 kda, 134

136 RESULTATS nous avons une preuve de la présence de la zone A et de l absence de la zone B, correspondant donc à l isoforme OT43isoform2 avec un poids moléculaire théorique de 54,4 kda. Enfin dans la zone supérieure, nous retrouvons l isoforme OTP43isoform1 provenant de la traduction du transcrit non épissé. Dans cette expérience, il n a pas été possible d identifier l isoforme la plus courte. En effet, cette isoforme présentant un codon de terminaison de la traduction prématuré, l étiquette en C-terminal n est pas traduite. Cette isoforme n est donc pas étiquetée et ne peut donc être purifiée. En revanche, les 4 autres isoformes, en phase avec l étiquette, ont pu être mises en évidence au niveau protéique démontrant ainsi une traduction de chacune d entre elles dans ce système d expression constitutif. Nous n avons malheureusement jamais réussi à produire des anticorps dirigés spécifiquement contre OTP43, mais ceux-ci seraient très utiles pour tenter de détecter les différentes isoformes chez une plante sauvage ayant un niveau d expression normal du transcrit otp43. Cependant une alternative à ce système pourrait être de complémenter le mutant otp43 avec une forme étiquetée d OTP43 sous le contrôle de son propre promoteur et de détecter les éventuelles isoformes par western blot en utilisant un anticorps spécifique de l étiquette. 135

137 RESULTATS Figure 29 : Alignement des différentes isoformes d OTP43 et définition des peptides permettant de différencier les différentes protéines. 136

138 RESULTATS II Complémentation fonctionnelle avec les isoformes OTP43 présente donc 5 isoformes, dont 4 ont pu être détectées au niveau protéique, laissant suggérer que chacune a un éventuel rôle fonctionnel. Cette fonction est elle importante pour la régulation de l expression d OTP43? Les isoformes ont-elles des fonctions additionnelles et complémentaires dans l épissage en trans de l intron 1 de nad1? Ou bien des fonctions complètement nouvelles? Finalement, quelle est l isoforme nécessaire pour l épissage en trans de l intron 1 de nad1? Le mutant otp43 présente un phénotype beaucoup plus marqué que n importe quel autre mutant de complexe I. Il se peut que l absence de la sous-unité NAD1, sous-unité importante dans l ancrage du complexe dans la membrane du complexe ait un impact plus important que n importe quelle autre sous-unité, mais il est aussi possible que l absence éventuelle des isoformes d OTP43 explique une partie du phénotype. Afin de répondre à certaines de ces questions, et d essayer d élucider la fonction de chaque isoforme, j ai entrepris une complémentation fonctionnelle du mutant otp43 avec les différentes isoformes d OTP43, ainsi qu avec une forme pleine longueur dont les sites accepteurs d épissage ont été mutés par mutagénèse dirigée de telle sorte qu aucun événement d épissage ne puisse avoir lieu. Quatre constructions on été réalisées et ont été introduites dans un vecteur binaire pgwb2 dont l expression est sous le contrôle du promoteur 35S (Figure 30). La première construction contient la forme pleine longueur ayant les sites accepteurs d épissage mutés (OTP43 AS sites mutés), dans laquelle les nucléotides AG sont modifiés en AA, cette mutation ne change pas l acide aminé codé par le transcrit. La deuxième contient la forme sauvage d OTP43 (OTP43-1). La troisième contient l isoforme dont l exon 2 est excisé (OTP43-3). La quatrième contient la plus petite isoforme dans laquelle les exons 2, 3 et 4 sont excisés (OTP43-5). Toutes ces constructions, après transfert dans une souche d Agrobacterium C58C1 pmp90, ont été utilisées pour la transformation de plantes hétérozygotes pour la mutation otp43 (en effet, les plantes homozygotes étant stériles, elles ne peuvent pas être transformées directement). Une sélection des transformants sur kanamycine et un génotypage ont permis d identifier différentes plantes homozygotes pour la mutation otp43 et portant les différentes constructions. Figure 30 : Schéma décrivant les différentes isoformes utilisées pour la complémentation du mutant otp43. Seule la construction pleine longueur d OTP43-1 et la forme dans laquelle les sites accepteurs d épissage ont été mutés (OTP43 AS sites mutés) ont permis d obtenir des plantes homozygotes pour la mutation otp43 et présentant un phénotype «sauvage». Ce résultat montre que ces constructions sont capables de complémenter fonctionnellement la mutation otp43. Cette première observation permet de montrer que la forme pleine longueur sans épissage permet la complémentation fonctionnelle du mutant. Cependant, une analyse par RT- PCR de l ARN extrait à partir de deux plantes homozygotes pour l insertion Sail867F07 complémentées avec la forme mutée a mis en évidence des produits d amplification très 137

139 RESULTATS similaires aux différentes isoformes (gel non présenté). Une identification de ces bandes sera nécessaire pour conclure (ou non) sur la capacité de la forme pleine longueur seule à complémenter le phénotype. En parallèle, aucune plante homozygote pour l insertion Sail_867F07 n a été identifiée lors de la sélection des plantes transformées avec les deux autres isoformes (OTP43-3 et OTP43-5). La descendance d une plante hétérozygote pour l insertion Sail867F07 contenant le transgène a été semée sur milieu ½ MS contenant 1% de saccharose. Sur les 216 graines semées pour la complémentation par OTP43-5, 149 graines germent normalement, et 56 ont un phénotype de germination retardée similaire au mutant otp43 (germination deux semaines après le «sauvage»). 48 plantules parmi les 149 germant normalement ont été transférées en terre et génotypées. Aucun homozygote pour l insertion Sail867F07 n a été identifié. En revanche il a été possible de sélectionner un certain nombre de mutants portant la construction codant pour l isoforme OTP43-5 parmi les 56 graines ayant germé tardivement. Ainsi, parmi les 35 plantules génotypées, 19 portent la construction et 3 autres sont seulement homozygotes pour l insertion Sail867F07. Cependant aucune complémentation du phénotype macroscopique n a été observée, suggérant que cette isoforme n a pas de rôle dans l épissage. Figure 31 : Photographies de plantes homozygotes pour la mutation otp43 (Sail867F07) portant la construction OTP43-5. Le phénotype de plantes homozygotes et hétérozygotes pour la mutation est également présenté. En ce qui concerne la complémentation par l isoforme OTP43-3, parmi les 161 graines semées issues d un hétérozygote, 125 germent normalement et 22 seulement ont germé tardivement. 48 plantules sur les 125 ont été génotypées et aucun homozygote n a été détecté, en revanche, 38 plantes étaient hétérozygotes pour la mutation et 5 de génotype «sauvage» ; elles contenaient toutes le transgène. Sur les 22 plantules ayant germé tardivement, 16 ont été transférées en terre et seulement une plantule présentant le phénotype du mutant otp43 était homozygote et portait le transgène, 13 étaient des mutants otp43 et 2 plantes étaient de type sauvage. Il est assez étrange que la proportion d homozygotes portant le transgène soit si faible alors que dans les 48 plantes de type sauvage genotypées toutes montrent la présence du transgène. Ce résutat très étonnant suggère fortement qu il y ait eu un problème au cours du génotypage et ces expériences sont donc à refaire. 138

140 RESULTATS Il reste beaucoup d analyses avant de comprendre quel est le rôle de chaque isoforme. Grace aux différentes expériences de complémentation, on peut penser que l isoforme OT43-5 ne complémente pas le phénotype macroscopique d otp43, suggérant donc que cette protéine n a pas de fonction dans l épissage de l intron1 de nad1. Néanmoins, le fait que la descendance d une seule plante transgénique ait été analysée ne permet pas de conclure définitivement. Pour les isoformes OTP43-3 et OTP43-4 (de façon indirecte), une seule plante homozygote pour l insertion de l ADN-T ayant le transgène a été obtenue et le phénotype n est pas complémenté. L étude d autres plantes est nécessaire, mais il semblerait que ces deux isoformes ne sont pas non plus impliquées dans l épissage. Des confirmations sont nécessaires afin de déterminer quelle isoforme est responsable de l épissage de l intron 1 de nad1. La complémentation avec la forme pleine longueur mutée sur les sites accepteurs d épissage complémente le phénotype, mais il semblerait que l épissage alternatif ait encore lieu. Rien ne permet pour le moment de savoir laquelle des ces deux isoformes OTP43-1 et OTP43-2 est impliquée dans ce processus. Et il reste donc à découvrir quelle est la fonction de chaque isoforme et si elles en ont une. Mise à part OTP43-5, pour lequel il n a pas été possible de vérifier sa présence au niveau protéique, toutes les autres isoformes sont traduites. Ces différentes isoformes ne sont donc pas prises en charge majoritairement par une voie de dégradation de l ARN et leur rôle ne semble pas être dans la régulation de l expression d OTP43. De plus, il faut noter qu au moins pour les formes OTP43-3, -4 et -5, la surexpression n a aucun impact phénotypique lorsque ces isoformes sont exprimées dans un fond génétique sauvage ou hétérozygote. Il n est pas encore possible de définir un rôle pour chaque isoforme d OTP43, mais il est cependant possible d émettre quelques hypothèses. En vue du phénotype plus marqué du mutant otp43 comparé à d autres mutants de complexe I, il est possible que certaines isoformes aient un rôle important autre que dans l épissage de l intron 1 de nad1, comme par exemple dans la maturation des graines ou dans la germination. Cependant il n a pas encore été montré qu une seule forme est nécessaire pour l épissage et il est également possible que l isoforme OTP43-2 ait un rôle complémentaire dans la reconnaissance des deux parties de l intron1. Tous ces résultats de complémentation sont préliminaires et une dernière vérification qui n a malheureusement pas été encore faite permettra de pouvoir conclure sur le rôle de certaines isoformes. En effet l insertion de l ADN-T du mutant otp43 se situe 130 pb avant le codon de terminaison de la traduction, et est donc dans la dernière séquence de 87 nucléotides qui peut être excisée. Si cette insertion n a pas d impact sur l épissage, alors 3 isoformes peuvent exister dans le mutant, OTP43-2, OTP43-4 et OTP43-5. Cette hypothèse pourrait expliquer le fait que l on observe des bandes chez les plantes complémentées avec la forme mutée. 139

141 RESULTATS II.4 Identification de partenaires des protéines PPR A ce jour, environ 10% des protéines PPR d Arabidopsis ont été plus ou moins caractérisées. Leurs fonctions dans l expression, la maturation des ARN ou la traduction sont très spécifiques et ne nécessitent visiblement, dans la majorité des cas, aucun autre facteur. Cependant, la plupart des caractérisations a été faite par une approche de génétique inverse et très peu de données de type «interaction protéique» ont été obtenues. Certains résultats permettent néanmoins de proposer que, probablement en fonction de leur rôle, certaines protéines PPR sont associées à d autres facteurs ou font partie de complexes protéiques. C est le cas de PTAC2 qui est associé au complexe actif transcriptonnel dans les chloroplastes (Pfalz, Liere et al. 2006), de GRP23 qui interagit avec la sous-unité III de l ARN polymerase II (Ding, Liu et al. 2006), de PPR40 visiblement associée au complexe III mitochondrial (Zsigmond, Rigo et al. 2008) et encore de PPR5 associée à un complexe ribonucléoprotéique (Beick, Schmitz-Linneweber et al. 2008). Ces résultats d interactions montrent que les protéines PPR peuvent en plus de leur reconnaissance à l ARN, établir des interactions protéiques ou être associées à des complexes. Pour ces protéines, mise à part PPR5, la fonction moléculaire n est pas encore élucidée. Qu en est il des autres protéines PPR impliquées dans l épissage ou dans l édition des ARNm? Il a été montré par des expériences de RIP-CHIP que certaines protéines PPR, telles que PPR4 et PPR5 sont liées directement à des séquences spécifiques au sein de l intron, permettant certainement la mise en place de la structure secondaire optimale de l intron pour les deux étapes de trans-esterification. Contrairement à PPR5, il semblerait que PPR4 ne soit pas lié au complexe d épissage mais aucune donnée ne permet de dire qu aucune interaction n existe. Dans l optique de mieux comprendre comment les protéines PPR fonctionnent, il est important de connaître les interactions de type protéine-protéine pour chacune. Ces informations permettront de mieux comprendre les mécanismes de régulation de l expression du génome des organites et de découvrir de nouveaux facteurs impliqués. Ce type d information est malheureusement difficile à obtenir pour le moment, mais des projets d interaction protéine-protéine comme le test matriciel systématique de plus de protéines d Arabidopsis en système double hybride chez la levure effectué actuellement dans le laboratoire de Marc Vidal à Boston vont permettre de révéler un grand nombre d interactions. Ces données ne sont pas encore rendues publiques, mais par l intermédiaire d une collaboration du laboratoire de Claire Lurin avec ce grand projet NSF, nous avons eu accès aux premiers résultats. Parmi les protéines PPR faisant partie de la première matrice d étude, certaines interagissent avec une ou plusieurs protéines autres que des protéines PPR ouvrant ainsi un nouveau champ d étude. Malheureusement toutes ces interactions observées ne concernent pas nos candidats ou des protéines PPR déjà identifiées, en revanche ce seront d excellents candidats pour des études de caractérisation à venir. Pour nos protéines candidates à la fois impliquées dans l épissage ou dans l édition, il était donc important de trouver une méthode nous permettant d identifier potentiellement des candidats d interaction. Que ces protéines fassent parties d un important complexe protéique ou juste présente une simple interaction binaire avec une unique autre protéine, une des méthodes les plus appropriées est une approche de purification des protéines d intérêt marquées par TAP-TAG. C est donc dans ce cadre que nous avons établie une collaboration avec Geert De Jaeger au VIB à Gent (Belgique) qui a mis en place une plateforme de purification de protéines marquées après expression dans des cultures cellulaires d Arabidopsis. 140

142 RESULTATS II.4.1 Méthode utilisée : TAP-TAG La technique de «Tandem Affinity Purification» de protéines étiquetées (TAP-TAG) est une technique qui est de plus en plus utilisée dans la recherche de partenaires mais surtout dans l identification de complexes protéiques car les interactions observées ne sont pas seulement binaires comme dans la plupart des autres techniques d interactions protéineprotéine utilisées. Grace aux adaptations qui ont été apportées dans l équipe de Geert De Jaeger, cette méthode a été optimisée dans des cultures cellulaires d Arabidopsis et permet d obtenir une purification avec un minimum de protéines non-spécifiques grâce à l utilisation de deux purifications successives différentes avec des étiquettes adaptées (Van Leene, Witters et al. 2008). Le vecteur GATEWAY d expression utilisé, décrit dans le papier de Van Leene et al., permet une fusion en C-terminal de la proie avec la construction GS-TAG qui comprend deux domaines «IgG-binding» de la protéine G et un peptide de liaison à la streptavidine SBP séparés par un site de clivage à la protéase de type TEV. Une première purification sur colonne en présence de streptavidine permet d éliminer un grand nombre de protéines n interagissant pas avec la proie, cette première étiquette est ensuite éliminée par la protéase TEV et une seconde purification sur colonne en présence d un anticorps IgG permet ainsi une meilleure co-purification des partenaires. Quatre protéines PPR, deux impliquées dans l épissage, OTP43 et OTP51, et deux autres dans l édition, CLB19 et DYW1, ont été sélectionnées et clonées dans un vecteur d entrée pdonr221 sans codon stop afin de permettre une fusion en C-terminal (Figure 32). Parmi les quatre, seul le gène codant pour OTP51 n a pas pu être cloné malgré trois tentatives. Les expériences de TAP-TAG se sont donc limitées aux trois autres. La réaction de recombinaison LR a été faite à Gent ainsi que les transformations de cellules d Arabidopsis et le reste des purifications et analyses. Figure 32 : Résumé du protocole adopté pour les expériences de TAP-TAG réalisées pour OTP43, CLB19 et DYW1. 141

143 RESULTATS Comme décrit dans l article de Van Leene, Witters et al, après transformation, les cellules transformées et sélectionnées sur antibiotiques sont mises en culture et une purification protéique est alors faite sur l extrait cellulaire total. Après deux purifications successives, une élution permet de récupérer l éluât comprenant la proie avec ses éventuels partenaires associés. Cet éluât est alors déposé sur un gel SDS-PAGE afin de dissocier toutes les protéines présentes. Puis le gel est fractionné en 48 bandes qui sont envoyées pour le séquençage par spectrométrie de masse. Deux extractions indépendantes et analyses ont été faites pour chaque construction. En parallèle, afin d évaluer si les constructions chimériques étaient encore fonctionnelles, j ai effectué une complémentation des mutants otp43, clb19 et dyw1. Ainsi, j ai pu montrer que la fusion des protéines OTP43 et CLB19 en C-terminal avec les deux étiquettes ne modifie pas leur fonction car ces deux constructions complémentent le phénotype macroscopique des deux mutants. En revanche, il semblerait qu aucune complémentation fonctionnelle n a lieu dans le cas de DYW1 car tous les homozygotes contenant la construction chimérique présentent toujours le même défaut moléculaire. II.4.2 Partenaires d OTP43 Cette expérience de TAP-TAG réalisée sur OTP43 nous a permis dans un premier temps de vérifier la présence des isoformes d épissage alternatif décrits précédemment. Sur les cinq isoformes décrites, les données de séquençage par spectrométrie de masse permettent d en identifier trois de façon certaine et une par déduction. Seule la forme la plus courte OTP43-5 n a pas pu être détectée (cf Chapitre II.3.2.2). Après la double purification sur colonne décrite dans le paragraphe sur la méthode du TAP-TAG, notre protéine étiquetée a été purifiée par élution avec ses partenaires et le tout est déposé sur un gel SDS-PAGE (figure 33). Les résultats de séquençage de chaque bande découpée obtenus sont alors filtrés en fonction du nombre de peptides trouvés pour chaque protéine, du pourcentage de recouvrement, un score de confiance est attribué et toutes les protéines ne l atteignant pas sont éliminées de la liste. Enfin, les protéines contaminantes trouvées très régulièrement dans ce type d extraction sont éliminées de la liste. Toutefois, si certaines d entre elles sont très abondantes dans une expérience, elles sont conservées. Enfin, une comparaison est faite entre les résultats obtenus entre les deux extraits. Pour OTP43, une première analyse a révélé un résultat très surprenant. Alors que dans tous les gels de TAP-TAG analysés, la bande majoritaire observée correspond toujours à la protéine étiquetée surexprimée, dans notre expérience, cette bande ne correspond pas à OTP43 mais à plusieurs protéines de type chaperone dites de «choc thermique» ou «Heat Shock protein» (Figure 33). Le plus grand nombre de peptides spécifiques d OTP43 a été repéré dans les fragments des bandes F3/F4/F6/F15 ainsi que H3/H4/H6 et H15. D autres peptides sont identifiés ailleurs dans le gel dont certains sont spécifiques des différents isoformes d OTP43. En revanche, aucun n a été détecté dans la zone F8 et H8, correspondant à la bande majoritaire. Cette zone ne comprend que majoritairement des peptides spécifiques des protéines HSP60 (AT3G23990), HSP60-2 (AT2G33210) et HSP60-3A (AT3G13860). Dans la liste finale, ces trois protéines sont trouvées en plus d une autre protéine, APS1 (AT3G22890). HSP60, HSP60-2 et APS1 sont considérées comme des partenaires faux positifs, cependant leur surabondance dans les deux extraits comparée à leur présence générale dans d autres extraits suggère une réelle interaction avec OTP43. Les trois protéines HSP ont toutes été détectées dans les mitochondries par spectrométrie de masse (données sous 142

144 RESULTATS SUBA), montrant une fois de plus que les résultats ne sont certainement pas des artefacts. Cependant leur lien avec OTP43 n est pas très clair à première vue. Figure 33 : SDS-PAGE des extraits de TAP-TAG sur OTP43. Les protéines des deux extraits, TAP OTP43-1 et TAP OTP43-2, ont été séparées en fonction de leur masse moléculaire. Chaque piste de gel, découpée en 48 fragments (E1 à F24 pour TAP OTP43-1 et G1 à H24 pour TAP OTP43-2) a été analysée par spectrométrie de masse. Les protéines de choc thermique sont directement impliquées dans la mise en place de la structure tertiaire et quaternaire des protéines nouvellement synthétisées dans les mitochondries mais elles ont aussi un rôle dans l import de protéines cytoplasmiques dans les mitochondries et dans leur structure. Par cette fonction primordiale dans le fonctionnement et l activation de celles ci, ces protéines sont responsables de la maintenance de la conformation du pool protéique face à des réponses au stress. Il est fort possible qu OTP43 et ses différents isoformes nécessitent une conformation bien précise une fois intégrées dans les mitochondries afin d être pleinement fonctionnelles. Les protéines HSP60 sont généralement très présentes dans les expériences de TAP-TAG du fait de leur fonction dans la conformation protéique et dans la détoxification, mais c est la première fois qu elles sont autant représentées. C est également la première fois qu une expérience de ce type est réalisée sur des protéines mitochondriales au VIB. Et il est donc possible que cette surreprésentation de ces HSP60 dans les extraits soit tout à fait liée à la surexpression d une protéine importée dans les mitochondries et non spécifiquement à celle d OTP43. Il serait intéressant lors de futures expériences de TAP-TAG sur des protéines mitochondriales de voir quelle est la proportion de HSP60 dans les extraits. L autre protéine trouvée associée à OTP43 est APS1 (pour ATP sulfurylase 3), une enzyme impliquée dans la voie d assimilation du sulfate. Cette protéine, contrairement aux 143

145 RESULTATS HSP60, est décrite dans les chloroplastes et des données de spectrométrie de masse le confirment sous SUBA. Cette protéine est elle-aussi considérée comme faux positif, et il est fort possible qu il n existe pas une réelle interaction avec OTP43. En conclusion de ces analyses, peu de protéines passant les différents critères d analyse sont décrites associées à OTP43, et les seules trouvées n ont probablement pas de lien direct avec la fonction d épissage dans les mitochondries. OTP43 n est probablement pas associé à un complexe protéique et notre approche n a pas permis de montrer l importance d un autre facteur dans l épissage de l intron 1 de nad1. II.4.3 Partenaires de DYW1 Une des actions des protéines PPR qui a été discutée dans l introduction est l édition des ARN des chloroplastes et des mitochondries. Le mécanisme enzymatique d édition n a pas encore été élucidé dans les organites, mais à partir des données sur les facteurs impliqués identifiés à ce jour, un modèle peut être proposé. Seules les protéines PPR de type E, E+ et DYW ont un rôle dans l édition. Dans ce modèle, les motifs PPRs permettent une reconnaissance spécifique de l ARNm cible et c est grâce au motif DYW que l édition a lieu du fait de la présence d un motif similaire à la cytidine désaminase (Salone, Rudinger et al. 2007), motif qui aurait donc la fonction de désaminer une Cytidine en Uridine. Les protéines PPR E et E+ impliquées dans l édition n ont pas ce motif DYW en C-terminal et semblent donc nécessiter un facteur enzymatique additionnel, par exemple un partenaire de type DYW, pour que la réaction catalytique puisse avoir lieu. Une des protéines de ce type que nous avons longtemps supposée comme étant le partenaire de toutes les protéines E et E+ impliquées dans l édition est DYW1 (At1g47580). Cette protéine PPR, assez spéciale est composée de très peu de motifs PPR et d un motif DYW très conservé mais sans motifs E et E+. C est donc dans l optique de confirmer notre modèle, que nous avons envisagé des expériences de TAP-TAG sur DYW1. Malheureusement une contamination sur les cultures a retardé la suite des expériences et nous n avons toujours pas de résultats permettant de montrer quels sont les partenaires de cette protéine. Cependant, des résultats récents obtenus dans le cadre de la thèse de Clément Boussardon, semblent indiquer que cette protéine serait impliquée uniquement dans l édition d un site chloroplastique, ndhd-1. Une autre protéine PPR, CRR4 est un facteur essentiel de l édition de ce site (Okuda, Nakamura et al. 2006). Et il apparait donc que deux protéines PPR sont essentielles à l édition de ce site. CRR4 est une protéine PPR de type E, n ayant pas le motif E+ et de motif DYW décrit comme portant l activité catalytique. Ainsi, pour le site ndhd-1, un modèle peut être dessiné. CRR4 permettrait la reconnaissance spécifique du site ndhd-1 et DYW1 se liant à CRR4 apporterait l activité catalytique nécessaire à l édition. L intéraction est en cours de validation par des techniques de split-luciferase et de split-yfp, mais les futures données de TAP-TAG permettront également de confirmer ce nouveau modèle. II.4.4 Partenaires de CLB19 Les nouvelles données sur DYW1 modifient en grande partie notre premier modèle, mais le modèle d association entre une protéine E ou E+ sans motif DYW avec une protéine DYW est toujours d actualité. Il fallait donc trouver quelles sont les protéines DYW susceptibles de se lier avec les autres PPR E et E+ impliquées dans l édition afin de redessiner notre modèle sur l édition. Ainsi une stratégie de type «TAP-TAG» a été privilégiée, et une protéine PPR 144

146 RESULTATS de type E+ a été utilisée comme proie. CLB19, première PPR caractérisée au laboratoire comme ayant un rôle dans l édition et impliquée dans l édition de deux sites chloroplastiques, ClpP et RpoA (Chateigner-Boutin, Ramos-Vega et al. 2008), était donc un bon candidat. Les résultats de purification par «TAP-TAG» des partenaires de CLB19 ont permis d identifier sans aucune ambiguïté deux protéines associées à CLB19. Ces deux protéines sont des protéines PPR. La première est une PPR de type «Pure», AT3G49240 renommée OTP100, pour laquelle des mutants ont été décrits comme embryo-léthaux. La deuxième, de façon très intéressante, est une PPR de type DYW, AT2G15690 renommée DYW2 par la suite. La prédiction de la localisation subcellulaire n est pas très claire concernant ces deux protéines, en revanche des données de spectrométrie de masse pour OTP100 et des données de localisation en fusion GFP effectuées par Sandra Tanz à Perth pour DYW2 permettent de proposer leur double adressage dans les chloroplastes et les mitochondries. De plus, une forte homologie de séquence en N-terminal de OTP100 avec GRP23 (figure 34) suggère une éventuelle localisation dans le noyau. Figure 34 : Alignement grâce au logiciel Multalin des protéines GRP23 et OTP100 («Pure»PPR). La région NLS est surlignée en vert et la région de liaison à l ADN (Leucine Zipper motif) en bleu. Au niveau de l expression, les deux gènes, OTP100 et DYW2 sont relativement co-régulés comme le montre la figure 35, suggérant que les deux protéines codées par ces deux gènes pourraient avoir une fonction similaire au sein des organites. 145

147 RESULTATS Figure 35 : Analyse de l expression des gènes OTP100 et DYW2 grâce au logiciel «Genecat». L expression a été normalisée de 0 à 1. Afin de tester si ces deux protéines sont associées à CLB19, et potentiellement impliquées dans l édition des deux sites dans les transcrits rpoa et clpp, une approche par génétique inverse a été entreprise. Des mutants d insertion ADN-T ont été commandés, semés et génotypés. Pour le moment, aucun homozygote pour aucune des lignées n a pu être obtenu. Ces deux protéines semblent donc essentielles pour la survie de l embryon (ou éventuellement d un des gamètes) ce qui n est pas compatible avec une fonction unique dans l édition des mêmes sites que CLB19 ; en effet le mutant clb19, quoique très affecté, est viable. Une première analyse des siliques prélevées sur des plantes hétérozygotes montre deux types de populations de graines : des graines de type «sauvage» et des graines blanches et plus petites. Plusieurs essais de germination en condition in vitro n ont pas permis d obtenir la germination d homozygotes et des expériences de «sauvetage d embryons» sont en cours. Afin de confirmer les interactions, des expériences de test d interaction protéine-protéine par le biais de la technique de split-luciférase et de split-yfp sont également en cours. Ces expériences nous permettront ainsi de tester les interactions binaires. En addition, Clément Boussardon met au point actuellement un essai d édition in vitro en utilisant les extraits purifiés par TAP-TAG sur CLB19 et, en parallèle, il tente de reconstituer un complexe minimal par expression en système bactérien. Grace à ces nouvelles données, un nouveau modèle a été élaboré (Figure 36). La protéine DYW2, est une PPR d un type DYW assez particulier, assez proche de DYW1. En effet, contrairement à la plupart des protéines de type DYW, mais de façon similaire à DYW1, elle 146

148 RESULTATS n a pas de motifs E et E+ et est composée seulement de quelques motifs PPR en plus de son motif DYW très conservé (figure 37). Il est donc proposé que cette protéine doublement adressée se lie à certaines protéines E ou E+ impliquées dans l édition au niveau chloroplastique et mitochondrial (Figure 36). Ainsi, ces protéines E/E+ reconnaitraient de façon spécifique les molécules d ARN à éditer et DYW2 apporterait l activité catalytique nécessaire pour l édition dans certains cas. Ce nouveau modèle est assez similaire au précédent mais une spécificité de l interaction «protéine PPR-E»-«protéine DYW» semblerait exister. Par ailleurs, le rôle de la PPR «Pure» OTP100 dans ce complexe reste à être élucidé. Figure 36 : Modèle d édition faisant intervenir DYW2, une protéine E+ et la «Pure» PPR OTP100. Figure 37 : Composition de la protéine DYW2. 147

149 CONCLUSION ET DISCUSSION GENERALE CHAPITRE III : CONCLUSION ET DISCUSSION GENERALE III.1 Les protéines PPR, des facteurs d épissage intron spécifique : Depuis la mise en place de l outil de détection des événements d épissage chloroplastiques et mitochondriaux par PCR quantitative, d autres protéines PPR ont pu être caractérisées. Figure 38 : Facteurs d épissage chloroplastiques. Les introns marqués par un astérisque sont les introns présents chez Arabidopsis mais absents chez les monocotylédones comme le maïs (Figure contenant des résultats non publiés du laboratoire actualisée à partir de celle de l article Falcon et al, 2010). 148

150 CONCLUSION ET DISCUSSION GENERALE La figure 38 présente les facteurs d épissage chloroplastiques identifiés à ce jour. Quatre facteurs de type PPR, OTP51, OTP52, OTP70 et PPR5, ont été caractérisés en plus de PPR4 et de HCF152. A l exception d OTP52 nécessaire dans l épissage de deux introns, les cinq autres protéines PPR sont indispensables pour l épissage d un seul intron. Au niveau mitochondrial, les recherches effectuées dans le domaine ont permis d établir une carte de l épissage un peu plus détaillée qu il y a quatre ans. A ce jour, 9 à 10 facteurs ont été caractérisés (figure 39) dont 4 protéines PPR, OTP43, BIR6, OTP439, TANG2, indispensables ou quasiment indispensables pour l épissage d introns, et une protéine PPR, PPR40 influençant l efficacité de l épissage de certains introns. Comme pour les protéines PPR impliquées dans l épissage au niveau chloroplastique, la majorité des protéines PPR identifiées dans les mitochondries dans ce processus sont spécifiques d un intron. Le mécanisme d épissage s effectue par l intermédiaire d un complexe ribonucléoprotéique visiblement différent pour chaque intron mais dont les protéines PPR peuvent faire partie. C est le cas de PPR5 dont l interaction avec le complexe est plus de l ordre d une interaction protéique que via l ARN (Beick, Schmitz-Linneweber et al. 2008). Pour OTP43, aucune interaction avec une protéine de complexe ribonucléoprotéique n a pu être identifiée par TAP-TAG, on pourrait donc penser que cette protéine a une action isolée sur l épissage ; cependant des expériences supplémentaires seraient nécessaire pour affirmer qu aucune interaction avec d autres facteurs n a lieu. OTP43 est impliquée dans l épissage de l intron 1 de nad1. L épissage de cet intron s effectue en trans et nécessite donc la jonction de deux transcrits différents. Malheureusement je n ai pas entrepris d expérience permettant de mettre en évidence les séquences de liaison avec OTP43 car la production de protéine recombinante a échoué du fait de l impossibilité d exprimer celle ci en système bactérien. Cependant, on peut émettre l hypothèse que cette protéine ait un rôle dans la reconnaissance des deux parties de l intron 1 de nad1. Cette interaction permettrait ainsi de joindre l intron 1 en 5 et l intron 1 en 3 afin que le complexe ribonucléoprotéique se forme. Cette même hypothèse peut également être proposée pour les autres introns en trans pour lesquels une protéine PPR est essentielle pour l épissage comme dans le cas de PPR4 et de l intron 1 de rps12 dans les chloroplastes, par exemple. Ces protéines PPR restent des facteurs d épissage à part. Leur reconnaissance spécifique d un intron et d une séquence spécifique au sein même de l intron comme il a été montré pour PPR5 (Beick, Schmitz-Linneweber et al. 2008; Williams-Carrier, Kroeger et al. 2008), confèrent à ces protéines un rôle limitant de l épissage et donc, en quelque sorte, elles pourraient être considérées comme des régulateurs de ce processus de maturation. Cependant aucune donnée ne permet actuellement d affirmer ce dernier rôle. Même si de plus en plus de protéines PPR sont identifiées dans l épissage, leur rôle dans ce processus n est pas encore totalement élucidé. Comme il a été montré, certaines sont totalement nécessaires dans ce mécanisme alors que d autres telles qu OTP439 et TANG2 facilitent uniquement ce processus. Il est possible pour ces dernières que le rôle dans l épissage soit de type indirect et qu un défaut dans la maturation des ARN pré-messagers, ou dans leur stabilisation va influencer l efficacité de l épissage comme c est le cas de HCF152 (Meierhoff, Felder et al. 2003). Pour les autres protéines PPR essentielles dans l épissage, la reconnaissance spécifique de l intron pourrait permettre à celui ci d adopter une conformation optimale afin d être reconnu par d autres facteurs d épissage plus généraux (hypothèse émise dans l article 1). Cette mise en place des autres facteurs établirait ainsi la conformation finale divisée en six domaines, typique des introns de groupe II, et permettrait le mécanisme d épissage caractérisé par deux étapes successives de trans-estérifications. 149

151 CONCLUSION ET DISCUSSION GENERALE Figure 39 : Facteurs d épissage mitochondriaux. Les flèches en pointillés indiquent les introns pour lesquels une diminution de l épissage est observée (Figure contenant des résultats non publiés du laboratoire actualisée à partir de celle de l article Falcon et al, 2010). Ce modèle n est pour le moment qu une hypothèse et, évidemment, plusieurs expériences sont à mettre en place afin de confirmer celle-ci. Dans ce modèle, la protéine PPR est le premier facteur se liant à l ARN à épisser et est donc la protéine clef pour la mise en place de ce système. Si cette protéine n est pas présente, alors le complexe ribonucléoprotéique ne peut se former. Une analyse des introns et des protéines fixées sur ces introns chez les mutants ppr permettrait de confirmer ou de réfuter cette hypothèse. Ainsi, dans le cas de PPR5, l analyse de l intron trng chez le mutant ppr5 permettrait de voir si les facteurs CAF1/CRS2, CFM3, ou encore WTF1/RNC1 sont encore liés à l intron de cet ARNt. La même question pourrait être posée pour OTP52, avec les facteurs MatK, CRS1, WHY1 et WTF1/RNC1. Une autre étude pourrait être entreprise lorsque les facteurs connus seront cristallisés. La structure de ces protéines et la connaissance des sites de fixation permettront ainsi de modéliser in silico l interaction. Cette interaction modifie probablement la structure secondaire de l ARN cible et cette «reconfiguration» permettrait l accès à d autres facteurs d épissage. Ainsi, en absence ou présence des PPR, on pourrait prédire l affinité d autres facteurs d épissage. En effet, des études in silico permettent aujourd hui de prédire des interactions avec l ARN et notamment pour des facteurs d épissage nucléaires chez l homme (www.bioquanta.net). Ce type d étude, mené sur les PPR, permettrait ainsi de montrer 150

152 CONCLUSION ET DISCUSSION GENERALE l affinité des autres facteurs sur l intron en présence ou en l absence de la PPR. Et ainsi de montrer leur rôle primordial dans la mise en place des facteurs d épissage. Tous les facteurs d épissage connus dans les organites ont, sauf dans le cas de CRS1, WHY1 et des protéines PPR, au minimum deux introns cibles. Du fait de la grande conservation des séquences nucléotidiques dans les introns de groupe II, il est fort possible que les facteurs plus généraux reconnaissent ces zones et que les PPR reconnaissent des parties non conservées. Ces zones moins conservées provenant de différentes mutations au cours de l évolution peuvent avoir un impact sur la structure secondaire de l ARN, et ce serait pour cette raison que des protéines de type PPR sont présentes afin de modifier la structure secondaire pour l épissage. Ceci irait dans le sens de l hypothèse émise par Maier et al. (Maier, Bozarth et al. 2008; Schmitz-Linneweber and Small 2008), qui proposent que l expansion des protéines PPR serait liée aux mutations dans le génome et que ces protéines seraient présentes en tant que suppresseur de ces mutations. En effet, le génome des organites mute et évolue beaucoup moins rapidement que le génome nucléaire (Lynch, Koskella et al. 2006). Ainsi, lors de délétions ou de mutations, il serait plus rapide de créer des facteurs de réparation pour lesquels les protéines PPR seraient de très bons candidats. III.2 L épissage alternatif, un moyen d augmenter le nombre de protéines PPR : Au cours de mon étude sur certains transcrits des gènes PPR, j ai pu identifier des formes alternatives d épissage. Etrangement, ces formes sont trouvées pour des gènes dans lesquels aucun intron n avait été identifié. C est la première fois qu un tel phénomène est décrit. Lors d analyses de l épissage alternatif par des approches de séquençage haut-débit (Filichkin, Priest et al. 2010), les gènes ne contenant pas d introns n avaient pas été considérés et il est donc probable que ce phénomène soit en réalité plus général. Pour les PPR, le phénomène observé est plus proche de l épissage alternatif de type «rétention d introns» qui se trouve être très fréquent chez les plantes comparées aux mammifères. Mais, contrairement à la majorité des transcrits observés dans ce cas, cette rétention d introns dans des transcrits PPR ne crée pas généralement de codon de terminaison de la traduction prématuré. Ainsi, dans le cas de ce que l on appelle généralement une «rétention d intron», le modèle de gène annoté, correspondant au transcrit majoritaire, est celui dans lequel l intron est épissé. La forme non épissée correspond à une «anormalité» d épissage. Les pertes de séquences codantes observées pour les transcrits PPR correspondent à un phénomène inverse, à ma connaissance jamais observé auparavant. Il est donc difficile de classer ce phénomène puisque l on pourrait parler plutôt de perte d exon («exon skipping»). Afin de préciser ce nouveau phénomène, je propose de le nommer «coding region skipping». Le résultat de cet épissage alternatif est de produire un certain nombre de transcrits isoformes. Comme il a été montré pour OTP43, ces ARN isoformes sont traduits, créant ainsi une diversité et une augmentation de la famille des protéines PPR. Dans le cadre de ma thèse, j ai mis en évidence le phénomène et montré l existence d un certain nombre d isoformes pour plusieurs gènes PPR. Cette analyse étendue à la famille entière, révélera très certainement de nombreuses autres isoformes. En revanche, nous n avons pas obtenu de données nous permettant de comprendre ce phénomène, et notamment de savoir si ces isoformes ont un rôle fonctionnel ou pas. Il est néanmoins possible de formuler de nombreuses hypothèses : 1. Les ARN isoformes ne sont le fruit que du hasard de la séquence nucléotidique, et ces formes alternatives ne sont pas prises en charge par des voies de dégradation de l ARN car ces isoformes gardent la même séquence terminale. Cependant, ce hasard permettrait 151

153 CONCLUSION ET DISCUSSION GENERALE d élaborer de nouvelles protéines intervenant dans la réparation des mutations créées dans le génome des organites. Si cela est vraiment le fruit du hasard, alors 2/3 des événements devraient changer la phase. Nous n avons malheureusement pas assez d exemples pour réaliser de véritables tests de probabilité, mais pour l ensemble des cas décrits dans ma thèse, cette proportion est de 3 cas de changement de phase sur 13 sans changement de phase pour les gènes PPR sans intron, donc bien inférieur au fruit du hasard. 2. Les protéines isoformes produites ont une action d autorégulation de l expression de l isoforme majeure qui a seule un réel rôle moléculaire. 3. Un moyen de réguler la fonction d une protéine à un autre niveau que celui de l expression du gène est de le faire au niveau protéique. Des isoformes plus courtes pourraient jouer un rôle antagoniste et rentreraient donc en compétition avec la forme fonctionnelle. 4. Les isoformes traduites sont fonctionnelles et ont une fonction propre indépendante de celle codée par l ARN non épissé. Chaque forme joue alors un rôle particulier dans la maturation des ARNm (les cibles pouvant être différentes). Par exemple, dans le cas des protéines impliquées dans l édition des ARNm, il est possible que la formation de certaines isoformes permette la reconnaissance de différents sites. Cette dernière hypothèse pourrait expliquer la reconnaissance de plusieurs sites d édition sans séquences consensus par une même protéine PPR, qui serait en réalité plusieurs isoformes (cf partie suivante pour le modèle proposé). La fonction de ce phénomène reste donc un grand mystère mais ouvre de nouvelles voies d investigations sur la régulation et la fonction des protéines PPR. Ces isoformes d épissage alternatif sont-elles régulées en fonction du développement? sont-elles activées au cours d un stress? ou sont-elles exprimées de façon tissu- ou organespécifique? Autant de questions auxquelles malheureusement je n ai pas réussi à répondre dans le temps de ma thèse mais auxquelles il sera intéressant de répondre dans un avenir proche. III.3 Rôle de l épissage alternatif : une nouvelle hypothèse sur la reconnaissance de multi-sites d édition par une seule protéine PPR? Des formes alternatives d épissage ont été identifiées à la fois chez des PPR de type «Pure» mais aussi sur des protéines PPR de la sous-famille PLS. Cette dernière comprend notamment les sous-familles de PPR de type E, E+ et DYW impliquées pour la plupart dans l édition. 526 sites d édition sont décrits au niveau mitochondrial et 34 sites dans les chloroplastes. Seulement 193 protéines PPR de type E, E+ et DYW sont décrites dans le génome d Arabidopsis. Partant de l hypothèse que seules les protéines PPR sont impliquées dans l édition, il existe donc un ratio d un facteur de type PPR pour plusieurs sites d édition. Ainsi, bien que les protéines PPR aient une reconnaissance spécifique de la séquence de l ARN, parmi les facteurs d édition identifiés dans les chloroplastes, cinq protéines PPR (CRR22, CRR28, CLB19, OTP82 et OTP84) sont impliquées dans l édition de plusieurs sites. Pour ces dernières, il existe potentiellement une séquence de reconnaissance commune entre les sites. En effet, il a été montré récemment qu une séquence consensus autour des différents sites pouvait être définie pour quatre d entre elles, même si aucune preuve expérimentale n est apportée et que ces similitudes restent très faibles (Hammani, Okuda et al. 2009). De façon notable, aucune séquence consensus ne peut être identifiée pour les trois sites d édition impliquant CRR

154 CONCLUSION ET DISCUSSION GENERALE Cette difficulté, voire impossibilité, à reconnaitre une séquence consensus peut être expliquée par trois hypothèses. La première serait que d autres facteurs seraient impliqués dans l édition, apportant pour certains la reconnaissance spécifique de l ARN. La deuxième serait que la zone de reconnaissance est une très courte séquence composée éventuellement de plusieurs éléments cis ou alors que la reconnaissance s effectue par l élaboration d une structure secondaire spécifique de l ARN. La troisième, enfin, pourrait être que des formes alternatives d épissage permettraient de reconnaitre ces différents sites. Ainsi, mon travail de thèse me permet de proposer, par exemple, que le gène CRR22 pourrait coder pour trois protéines différentes, et chaque protéine serait impliquée dans l édition d un des trois sites d édition décrits pour CRR22. Cette dernière hypothèse, très attractive, peut se tester en regardant s il existe des formes alternatives d épissage pour cette PPR mais également pour d autres PPRs impliquées dans l édition de plusieurs sites (même si une séquence consensus a pu être définie). Aucun ADNc ne permet de vérifier cette hypothèse pour CRR22, en revanche des prédictions de sites donneurs et accepteurs peuvent être effectuées (figure 40). Figure 40 : Prédiction des isoformes d épissage alternatif pour CRR22 en utilisant le logiciel Un alignement sous «Multalin» des différentes isoformes putatives traduites est représenté. Ces prédictions permettent de proposer l existence de trois isoformes putatives. Une sans épissage et deux autres avec une excision d une séquence codante ne changeant pas la phase de lecture. Ces isoformes ne sont que des prédictions et une analyse par RT-PCR suivie d un clonage serait nécessaire afin de confirmer l hypothèse de l existence de plusieurs isoformes. Des premières données d amplification sur ADNc faites par Sandra Tanz dans l équipe de Ian 153

155 CONCLUSION ET DISCUSSION GENERALE Small montrent que seule la forme pleine longueur est présente, cependant le signal d amplification étant très faible, ces résultats ne sont pas définitifs et demandent à être confirmés par une nouvelle expérience d amplification suivie d un clonage. Pour tester un éventuel épissage alternatif d autres transcrits PPR codant pour une protéine importante dans l édition, nous avions en notre possession les oligonucléotides utilisés pour le clonage de CLB19. Cette PPR de type E+ chloroplastique est impliquée dans l édition de deux sites, un sur le transcrit ClpP et l autre sur RpoA (Chateigner-Boutin, Ramos-Vega et al. 2008). Elle s avère donc être une autre candidate pour tester si des formes alternatives peuvent expliquer la reconnaissance de deux sites. J ai effectué quelques expériences dans ce but au cours de ma thèse (résultats non présentés). Malheureusement, elles n ont pas permis d identifier une autre forme que celle décrite, suggérant qu aucune forme alternative d épissage n existe dans le cas de CLB19 et que la reconnaissance des deux sites s effectuerait par un autre mécanisme. J ai également regardé tous les ESTs disponibles pour toutes les PPR E, E+ et DYW décrites dans les différentes espèces présentes dans la base de données FlagDB++, Arabidopsis thaliana, Populus trichocarpa, Oryza sativa et Vitis Vinefera. Malheureusement trop peu d ADNc ou d ESTs couvrent ces gènes PPR et aucune forme alternative n a été détectée. Des sites alternatifs d épissage peuvent être prédits pour la majorité d entre eux mais seule une PCR sur ADNc suivie d un clonage et d un séquençage permettrait de confirmer ces prédictions. III.4 Action des protéines PPR, une action seule ou en partenariat : Les premières données d interaction protéine-protéine obtenues par TAP-TAG mais aussi par double hybride montrent que certaines protéines PPR interagissent avec d autres protéines PPR mais également avec d autres protéines. Jusqu ici, dans le cas des protéines PPR impliquées dans l épissage des ARNm, seule PPR5 a été montrée associée à un complexe ribonucléoprotéique (Beick, Schmitz-Linneweber et al. 2008). Aucune donnée ne permet de montrer que PPR4 est associée avec d autres protéines et les données obtenues par TAP-TAG ne montrent pas d interaction entre OTP43 et des protéines pouvant être impliquées dans ce phénomène post-transcriptionnel. Ces deux dernières protéines sont impliquées dans l épissage en trans de l intron 2 de rps12 (Schmitz- Linneweber, Williams-Carrier et al. 2006) et l intron 1 de nad1 (de Longevialle, Meyer et al. 2007). Le rôle de ces deux protéines pourrait être de reconnaître de façon spécifique des séquences dans les deux parties de l intron et de permettre ainsi l assemblage du reste du complexe ribonucleoprotéique sans forcément nécessiter une interaction physique avec les autres facteurs. Cet assemblage pourrait avoir lieu grâce à la formation d interactions entre elles-mêmes, formation qui a visiblement été suspectée dans le cas de PPR4. Dans le cas de PPR5, il a été montré que l interaction avec le complexe ne se faisait pas via l ARN et il est donc possible que cette protéine interagisse avec un ou plusieurs autres facteurs d épissage. Dans le cas de protéines PPR impliquées dans l édition, le laboratoire a proposé un modèle depuis plusieurs années dans lequel les protéines de type E et E+ interagissent avec une autre protéine PPR ayant le motif DYW, mais sans le motif E+. En revanche, pour les protéines PPR de type DYW avec la présence des motifs E et E+, il est proposé que ces protéines agissent seules dans l édition, sans aucun autre facteur. Grâce à l approche de TAP-TAG sur CLB19, nous avons pu montrer une interaction entre deux ou voire trois protéines PPR impliquées dans l édition. CLB19, une protéine PPR E+ interagit avec une protéine DYW 154

156 CONCLUSION ET DISCUSSION GENERALE renommée DYW2 et OTP100, une protéine PPR de type «Pure». Dans ce cas précis, CLB19 n ayant pas de motif DYW suspecté comme porteur de la fonction enzymatique, nécessite une interaction avec une protéine de type DYW. DYW2 apporterait cette fonction. Les résultats de TAP-TAG ne permettent pas de conclure si les interactions entre CLB19 et OTP100, d une part, et CLB19 et DYW2, d autre part, sont directes, même si cette dernière interaction est plus probable. La fonction d OTP100 reste pour le moment inconnue, mais est en cours d étude au laboratoire. L interaction pourrait également s effectuer de façon indirecte, via le ou les transcrits sur lesquels sont fixés CLB19. Dans ce cas OTP100 aurait une fonction différente de l édition sur ces transcrits. Afin de tester cette hypothèse, la purification du complexe en absence d ARN (après traitement avec une RNAse) sera effectuée prochainement. Dans le génome d Arabidopsis, d autres gènes codant pour des protéines similaires aux protéines DYW1 et DYW2 sont décrits. Il serait donc intéressant afin de valider notre nouveau modèle d effectuer d autres expériences de TAP-TAG avec celles-ci afin de voir avec quel type de protéine une éventuelle interaction est observée. Puis, dans un deuxième temps, étudier la manière dont elles interagissent et quels sont les domaines nécessaires pour ce type d interactions. III.5 Rôle et régulation des protéines PPR La caractérisation d un certain nombre de protéines PPR permet de montrer leur rôle primordial dans l expression et la maturation des ARNm et des ARNt dans les organites. Cette famille joue donc un rôle essentiel dans l expression de ces deux génomes et établit un lien étroit entre le noyau et les organites. On peut se demander pour quelle raison, chez les plantes, une telle complexité a été créée et conservée et implique autant de protéines de type PPR. Une des hypothèses avancées, et déjà évoquée, est que des mutations intervenant dans le génome des organites sont plus facilement rectifiées par l élaboration de nouveaux facteurs codés par le noyau corrigeant de telles erreurs. Si cela est vrai, alors les PPR ne peuvent pas être considérés comme des facteurs de régulation et devraient agir d une manière plus ou moins constitutive. On peut également proposer que ces PPR jouent au contraire un rôle de régulation très fine contrôlée par leur état d activité et leur expression. Cette régulation des PPR pourrait s établir à deux niveaux. La première au niveau de la transcription et de la régulation posttranscriptionnelle et la deuxième au niveau de l activité de la protéine. III.5.1 Régulation transcriptionnelle et post-transcriptionnelle : La majorité des gènes PPR est faiblement exprimée et a une durée de demi-vie très courte (Narsai, Howell et al. 2007) qui peut être expliquée par l absence d introns. En conséquence, cette durée de vie courte est un facteur limitant de la traduction des PPR. Cependant ce n est parce qu ils sont faiblement exprimés qu ils ne sont pas différentiellement exprimés. En effet selon les conditions environnementales et selon les apports nutritifs, certains gènes PPR sont plus ou moins exprimés. Ainsi comme nous l avons montré certains gènes vont être surexprimés en présence de sucre. Ce n est évidemment pas la seule condition où l on observe un changement dans l expression. De nombreuses données de transcriptome ont été accumulées depuis ces dernières années par l intermédiaire des puces CATMA et AFFYMETRIX. Ces données sont en cours d analyse par Richard Berthomé à l URGV afin de faire un «clustering» des PPR selon les conditions et ainsi essayer d établir un lien entre 155

157 CONCLUSION ET DISCUSSION GENERALE leur expression, leur localisation et leur fonction. Cette analyse pourra éventuellement prédire la fonction de certaines protéines PPR pour lesquelles celle-ci reste pour le moment inconnue. Un autre moyen de limiter la traduction et de réguler l expression est la dégradation de ces ARN via la voie TGS (Transcriptional Gene Silencing) ou PTGS (Post-Transcriptional Gene Silencing) qui est induite par les petits ARN de type microarn ou siarn. Chaque petit ARN est spécifique d un gène et certains petits ARN sont également décrits pour des gènes PPR chez Arabidopsis et également chez le peuplier (Klevebring, Street et al. 2009). Ainsi mir161 code un microarn ciblant 20 gènes PPR et mais dont seule la cible At1g63130 a été validée (Fahlgren, Howell et al. 2007). Deux autres microarn, mir400 et mir158 sont prédits pour avoir plusieurs gènes PPR comme cibles mais aucune validation n a été faite pour ces deux derniers (Rhoades, Reinhart et al. 2002; Sunkar and Zhu 2004). Il est possible également que la traduction soit limitée via de l épissage alternatif. En effet, en plus des phénomènes décrits précédemment dans les séquences codantes, des introns sont également décrits pour certains gènes PPR dans les parties 5 et 3 UTR. Si ces introns ne sont pas épissés, ils peuvent avoir une action sur la stabilité des ARNm comme il est montré pour le gène AUF1 chez l homme codant une protéine intervenant dans la reconnaissance d éléments AU-rich et qui induit la déstabilisation des ARNm via la voie NMD (Banihashemi, Wilson et al. 2006). L intron en 3 UTR de ce gène possède ces éléments et sa rétention conduit donc à une autorégulation de son expression. Je n ai pas regardé si de tels éléments étaient présents dans les introns en 3 UTR pour les gènes PPR, mais il est fort possible que ceux-ci aient un impact sur l expression. Enfin l épissage alternatif peut aussi créer des codons de terminaison de la traduction prématurés chez les PPR, ces transcrits seront alors pris en charge par la voie de dégradation NMD. Cet épissage alternatif s il est régulé va donc avoir un impact sur l expression des PPR. III.5.2 Régulation post-traductionnelle : Une autre voie de régulation peut avoir lieu au niveau de la protéine. En effet un certain nombre d étapes au niveau post-traductionnel influencent l activité de la protéine. En plus des phénomènes de glycosylation ou de myristoylation, des étapes de phosphorylation peuvent avoir lieu. Ainsi, il est fréquent que l activité d une protéine soit dépendante de son état de phosphorylation. Du fait de la faible expression générale des protéines PPR, peu de peptides phosphorylés spécifiques de protéines PPR ont pu être détectés par des approches de spectrométrie de masse systématiques. Cependant 7 protéines PPR sont décrites comme phosphorylées dans la base de données PepBase (http://pepbase.iab.keio.ac.jp/phospho/msb/) et 69 dans PhosPhat 3.0 (http://phosphat.mpimp-golm.mpg.de/db.html). La majorité de ces PPR n a qu un seul site phosphorylé de type Serine, Threonine ou Tyrosine, mais il est également possible de trouver de 2 à 4 sites pour certaines. Parmi les 69 protéines décrites, on trouve CRR4, CRR21, PPR596, PPR2, DOT4 et OTP52, qui sont des protéines dont la fonction dans l édition, l épissage ou la biogénèse des ribosomes a été décrite. Cette phosphorylation pourrait réguler l activité de ces protéines importées dans les organites en fonction des besoins et des demandes des organites et de la cellule. L autre étape de régulation pour laquelle très peu d éléments sont connus est une éventuelle implication des protéines HSP. Comme nous l avons montré par TAP-TAG, la purification des protéines interagissant avec OTP43 est fortement enrichie en HSP60. Dans ce type d expérience, ces protéines sont très souvent considérées comme des faux positifs, mais vu la quantité trouvée dans notre extrait, il est possible que cette interaction soit réelle. De plus, les premières données de double hybride montrent également des interactions entre des 156

158 CONCLUSION ET DISCUSSION GENERALE protéines PPR et des HSP. Plusieurs hypothèses peuvent être proposées. Il est possible que ces protéines soient nécessaires pour le repliement et la configuration finale des protéines importées mais il est aussi envisageable qu elles aient un rôle de régulateur de la quantité fonctionnelle des protéines actives. Il faut remarquer ici que les résultats obtenus concernant les protéines HSP ouvrent également de nouvelles pistes quant à l expression de protéines PPR en système bactérien. Par exemple, il serait intéressant de tester l effet d une coexpression de protéine chaperone et d OTP43 sur l efficacité d expression de cette PPR qui n a jamais pu être obtenue en système bactérien. Enfin, une dernière régulation peut être envisagée par l épissage alternatif des transcrits PPR. En effet celui ci peut conduire à la synthèse de différentes isoformes caractérisées par la délétion de motifs PPR plus ou moins importante selon le type d épissage. Cette modification a certainement un impact sur les capacités physico-chimiques de ces protéines puisque c est au niveau de ces motifs que la reconnaissance avec l ARN doit avoir lieu et il est possible que par ce biais une régulation de la fonction soit mise en place, avec un effet potentiel de compétition entre certaines isoformes (cf partie III.2). C est le cas par exemple chez l homme où la protéine CD45 qui joue un rôle dans l activation des lymphocytes T lors d une réponse immunitaire à une infection est active ou non selon l isoforme d épissage alternatif (Oberdoerffer, Moita et al. 2008). Ainsi lorsque les lymphocytes T sont au repos, la forme la plus longue est exprimée et comporte neuf exons, en revanche lorsque les lymphocytes T sont activés, les ARNm CD45 sont épissés alternativement et les exons 4, 5 et 6 sont excisés. Cette modification crée ainsi une protéine plus courte qui ne peut alors activer les lymphocytes T. Ce phénomène de régulation empêche de déclencher une réponse immunitaire disproportionnée, et l on peut imaginer qu une compétition puisse avoir lieu entre différentes isoformes dites actives et non-actives dans le cas des PPR. 157

159 CONCLUSION ET DISCUSSION GENERALE Depuis la découverte de la famille PPR il y a plus de dix ans, de nombreuses avancées ont été faites dans l élucidation du rôle de ces protéines. Aujourd hui environ 1/10ieme de ces protéines chez les plantes ont une fonction connue et joue un rôle majeur et très spécifique dans la transcription, la maturation et la traduction des ARN dans les organites. Cependant, même si de nombreux défauts ont été et seront certainement encore découverts chez des mutants ppr, on ne connaît pas encore comment ces protéines interagissent. Un enjeu clef de la compréhension de la famille PPR sera donc de connaître la structure des protéines par cristallographie ainsi que la structure de l interaction avec l ARN afin de comprendre comment cette interaction s établit et pourquoi elle est spécifique de la séquence de l ARN. La fonction de ces PPR codées par le génome nucléaire en fait des facteurs clefs pour le fonctionnement des organites, et créant ainsi un lien étroit entre le noyau, cerveau central de la cellule et les deux organites, moteurs énergétiques. 158

160 MATERIELS ET METHODES IV.1 Matériels CHAPITRE IV : MATERIELS ET METHODES IV.1.1 Souches bactériennes La souche DH5 a été utilisée pour tous les clonages de type GATEWAY ou pgemt. Afin de multiplier les vecteurs d entrée et de destination GATEWAY vides, la souche DB3.1 résistante à la cassette suicide ccdb a été utilisée. La transformation du mutant otp43 en vue de complémentation fonctionnelle avec les différentes isoformes a été réalisée par l intermédiaire de la souche d agrobactérie C58C1pMP90. IV.1.2 Oligonucleotides utilisés au cours de ma thèse et non répertoriés dans les articles. Oligonucléotides utilisés pour le clonage Gateway : Oligonucléotides utilisés pour la mutagénèse dirigée : Oligonucléotides utilisés pour la PCR quantitative : Oligonucléotides utilisés pour la PPE : Oligonucléotides utilisés pour la sonde biotinilée pour le northern blot : 159

161 MATERIELS ET METHODES Oligonucléotides utilisés pour la détection d'isoformes d'épissage alternatif sur les 48 PPRs : Oligonucléotides utilisés pour le Génotypage : 160

162 MATERIELS ET METHODES IV.1.2 Lignées d insertion 161

163 MATERIELS ET METHODES IV.2 Méthodes IV.2.1 Méthodes relatives à la culture d'arabidopsis IV Culture en terre A Perth, les plantes ont été cultivées sur terreau (3/5 terreau, 1/5 vermiculite, 1/5 perlite), en chambre de culture confinée à 22 C et 60% d'humidité moyenne, 8H de jours 16H de nuit. A Evry, les plantes ont été cultivées sur terreau et également en chambre de culture confinée à 21ºC et 45% d humidité moyenne, 8H de jours 16H de nuit. IV Culture in vitro En condition in vitro, les plantes ont été cultivées sur un milieu Murashige et Skoog appelé ½ MS. Pour 1L : 2,2g de MS (Sigma Aldrich M5519 Murashige and Skoog Basal Medium), 0 à 3% de sucrose (m/v) ou 0 à 3% de glucose (m/v) et 8% d'agar type E (m/v) pour les cultures en milieu solide (A6674 sigma Aldrich ). Le ph est ajusté à 5,8 par ajout d'hydroxyde de potassium (KOH). Les conditions de culture de la chambre sont 25 C, 8 heures d'obscurité, 16h de luminosité. IV Préparation des graines d Arabidopsis IV Vernalisation Avant chaque semis, une vernalisation des graines est faite au préalable, la quantité de graines désirées est transférée dans un tube de 1,5 ml et 1 ml d eau est ajouté. Le tube est alors conservé à 4ºC pendant 48 heures avant semis. Cette vernalisation est aussi faite sur des graines venant d être stérilisées en ajoutant également de l eau mais stérile. IV Stérilisation des graines Deux protocoles de stérilisation ont été employés selon le lieu où les expériences ont été faites. A Perth, le protocole suivant a été utilisé : Les graines sont incubées dans 1 ml d éthanol 70 % (v/v) pendant 2 min, puis incubées dans 1 ml de la solution suivante : 5 % Javel (v/v)/ 0,1 % Tween20 (v/v) pendant 15 min en agitant toutes les 5 minutes. Les graines sont alors rincées 5 fois dans de l eau stérile puis resuspendues une dernière fois dans 1 ml d eau stérile. Les graines sont alors prêtes pour la vernalisation puis pour un semis en boite de culture in vitro. A Evry, le protocole suivant a été utilisé : Une pastille de chlore est dissoute dans 50ml d eau milliq et 50 µl de tween 20 sont ajoutés. 1 ml de cette solution est ajouté à 9 ml d éthanol technique 95 % (v/v). Les graines à stériliser sont alors incubées sous agitation légère dans 1 ml de cette nouvelle préparation pendant 7 min. 3 lavages à l éthanol 96% sont ensuite effectués, suivi soit d un séchage des graines sous la hotte soit de plusieurs rinçages à l eau stérile en vue d une vernalisation. 162

164 MATERIELS ET METHODES IV.2.2 Protocoles relatifs à l'adn IV Extraction rapide d'adn génomique Ce protocole est utilisé en tube de 1,5 ml pour le génotypage de plantes. Tampon de Lyse : SDS NaCl EDTA Tris-HCl ph = 7,5 Concentration finale 0,5 % (m/v) 250 M 25 mm 200 mm Une feuille est collectée et broyée dans de l azote liquide pour chaque échantillon à génotyper. 400μl de Tampon de lyse sont alors ajoutés et le tout est mélangé sur un vortex pendant 15 secondes. Les tubes sont alors incubés pendant 15 minutes à 50ºC puis centrifugés pendant 15 minutes à 5000 G à 4 C. 150 μl de surnageant sont transférés dans de nouveaux tubes de 1,5 ml et un volume de 150 µl d isopropanol est ajouté. Le tout est alors mélangé sur un vortex pendant 15 secondes, puis incubé pendant 20 minutes à température ambiante et centrifugé à 4 C pendant 10 minutes à G. Les surnageants sont alors éliminés par renversement et les culots sont repris avec 125μl d éthanol à 70%. Les échantillons sont alors centrifugés à 4 C pendant 5 minutes à G. Les surnageants sont de nouveau éliminés par renversement des tubes et les culots sont séchés en incubant les tubes ouverts dans une étuve à 60ºC pendant 10 min. Une fois les culots secs, ceux ci sont repris dans 125μl de TE (10mM, 1mM ph 7.5) et 2μl de cette extraction seront utilisés pour une PCR. IV Extraction d'adn génomique (Dneasy 96 Plant kit QIAGEN) Ce protocole a été utilisé pour toutes les extractions d ADN génomique en plaque 96 et toutes les centrifugations ont été faites à l aide d une centrifugeuse Eppendorf 5810 R. Tampon AP1 (500 ml) : Tris 1M ph ml EDTA 0.5M 50 ml NaCl 2,5M 100 ml SDS 20% 31,5 ml PVP g Sodium Bisulfite 5g Eau stérile qsp 500 ml Tampon AP2 (200 ml) : Acétate de potassium (3M K, 5M Ac) Acide acétique glacial Eau 120 ml 23 ml qsp 200 ml Tampon AP3 (150 ml) : Guanidium Chloride Eau stérile Ethanol 96% 37,25 g qsp 50 ml 100 ml 163

165 MATERIELS ET METHODES Tampon AW (1 L) : Tris 1M ph ,5 ml EDTA 0,5 M 200 µl Potassium acétate 5M 32 ml Eau stérile qsp 1L Le tampon AW/E est préparé en mélangeant 100 ml de solution AW et 170 ml d éthanol 96%. Une feuille est prélevée et placée dans un puits d une plaque 96 contenant une bille d acier. Apres le prélèvement, la plaque est fermée å l aide de bouchons et placée dans de l azote liquide. Celle-ci est alors agitée dans un agitateur à peinture pendant 30 secondes puis centrifugée pour culoter tous les débris. Les bouchons sont retirés délicatement et 300 µl de tampon AP1 préchauffé à 65ºC, contenant 125 mg/l de RNase A sont ajoutés dans chaque puit. Les bouchons replacés, la plaque est agitée énergétiquement et manuellement pendant 15 secondes de haut en bas, puis centrifugée pendant 5 secondes à 3000 rpm et à température ambiante. Les bouchons sont de nouveau retirés pour ajouter 100 µl de tampon AP2 puis refermés et la plaque est agitée énergétiquement pendant 15 secondes de haut en bas puis 5 secondes de retournement léger. La plaque, après avoir été centrifugé 5 secondes à 3000 rpm, est placée pendant 10 minutes à -20ºC et est ensuite centrifugée pendant 10 minutes à 4100 rpm. 300 µl de surnageant sont ensuite transférés dans une nouvelle plaque et 1,5 volume de AP3/E sont ajoutés dans chaque puits. Après fermeture de la plaque par de nouveaux bouchons, celle ci est agitée énergétiquement pendant 15 secondes de haut en bas puis 5 secondes de retournement léger puis centrifugée 5 secondes à 3000 rpm. Une plaque de colonnes Dneasy 96 est placée sur une plaque µl et 600 µl des échantillons sont transférés sur les colonnes. Ce montage est scellé avec une feuille «airpore tae sheet» et le tout est centrifugé pendant 5 minutes à 4100 rpm. La plaque 96 de 800 µl est vidée par retournement et la plaque de colonnes est replacée dessus. 600µl de tampon AW/E sont ajoutés à chaque colonne, la plaque est de nouveau scellée avec une feuille airpore et le montage est centrifugé 15 min à 4100 rpm. La plaque de colonnes est alors placée sur la plaque d étude (nouvelle plaque µl), 100µl de tampon AE (10 mm TrisHCl ; 0,5mM EDTA ; ph9.0) sont ajoutés à chaque colonne et le tout est incubé 1 min à température ambiante. L élution s effectue en centrifugeant 3 minutes à 4100 rpm et la plaque de travail est alors conservée à -20ºC et 2 µl seront utilisés pour la PCR de génotypage. IV Amplification d ADN par PCR IV Méthode de PCR «classique» Les réactions de PCR de type «classique» sont utilisées dans le cadre des réactions de test des colonies ou de génotypage. Les réactions sont réalisées en utilisant une Taq Polymérase préparée au laboratoire d Evry ou de Perth, dans un tampon adapté (Composition du tampon 10X : Tris-HCl 100mM ph8, MgCl2 25mM, KCl 500mM, Nonidet P40 0.5%) pour le test de colonies et une Taq Polymérase commerciale (Biolabs) dans certaines situations pour le génotypage. Les réactions PCR ont été réalisées à l aide d un programme dont la température d hybridation est adaptée aux différents couples d oligonucléotides, et le temps d élongation dépend de la taille du fragment à amplifier. 164

166 MATERIELS ET METHODES Protocole de PCR «classique» Dans un volume final de 10 à 50 µl, 25 à 75 ng d ADN sont utilisés comme matrice et sont mélangés avec du rouge de crésol 1X (solution 10 X : Rouge de crésol 2 mg/ml ; Saccharose 600 mg/ml), du tampon de Taq polymérase 1X, des dntps à 0,2 mm chacun, des oligonucléotides à 1 µm et de la Taq polymérase entre 1 à 5 unités (ou 0,2 µl de Taq polymérase produite dans le laboratoire). La réaction d amplification s effectue dans un «thermocycler» en utilisant le programme suivant : une incubation de 5 minutes à 94ºC permet une première dénaturation de la matrice ; Puis une dénaturation de 30 secondes à 94ºC, suivie d une hybridation de 30 secondes entre 50ºC et 60ºC selon les oligonucléotides utilisés et d une élongation à 72ºC d une minute par kb à amplifier sont ensuite répétés 35 fois. La réaction est terminée par une élongation de 5 minutes à 72ºC. IV Méthode de PCR «clonage» Lorsque nous amplifions un fragment d ADN par PCR afin de le cloner, les réactions de PCR sont réalisées comme décrit précédemment à la différence près que la Polymérase utilisée est une enzyme dite «fidèle» (avec une activité de relecture). Différentes enzymes ont été utilisées telles que la iproof (Biorad) au laboratoire d Evry et la DNA polymerase (Takara) au laboratoire de Perth, en utilisant les protocoles recommandés pour chaque Polymerase. IV PCR quantitative Les réactions de PCR quantitatives ont été réalisées au laboratoire de Perth, dans la machine LightCycler 480 Real-time PCR system (Roche) à l aide du master mix LightCycler 480 SYBR green 1 (Roche). Au laboratoire d Evry, ces réactions ont été réalisées dans la machine Applied Biosystems 7900HT Sequence détection system à l aide du MESA green qpcr Mastermix Plus for SYBR (Eurogentec). Les oligonucléotides utilisés figurent en Annexes des articles sur OTP43 et OTP51 IV Electrophorèse Les molécules d'adn sont séparées sur gel d'agarose (concentration 0,8 à 2%) contenant du BET (Bromure d'éthidium) à une concentration de 0.5µg/ml dans un tampon de migration (TBE 1X ou TAE 1X) par application d'un champ électrique d'une tension variant entre 50 à 200 V suivant la taille du gel (7 à 30 cm de longueur). Pour aider au dépôt sur gel des échantillons d'adn, du rouge de crésol est ajouté au mélange. La visualisation s'effectue sous UV. TBE 1X, ph8 : 89 mm TRIS, 89 mm Acide borique, 2 mm EDTA TAE 1X, ph8 : 89 mm TRIS, 89 mm Acide acétique, 2 mm EDTA 165

167 MATERIELS ET METHODES IV Purification de produits PCR en vue d un clonage ou d un séquençage IV Utilisation du kit QIAquick (Qiagen) Les produits de PCR destinés à être clonés ou séquencés, peuvent être directement extraits du gel d électrophorèse purifiés et concentrés en utilisant le kit QIAquick et en suivant les indications du fournisseur. IV Purification au PEG Alternativement, les produits PCR destinés à être clonés peuvent être précipités, purifiés et concentrés, par ajout de 5 volumes d une solution de PEG/MgCl2/TE (solution PEG/MgCl2: 12mM MgCl2, 12% PEG 8000 m/v, 6mM Tris, 0,6mM EDTA ph 7,5). Après centrifugation pendant 20 min à G à température ambiante, le culot est repris dans 20µL de TE (10mM Tris, 1mM EDTA ph 7,5). IV Clonage de produit PCR IV Clonage dans le vecteur pgemt-easy (Promega) Les produits PCR purifiés peuvent être directement clonés dans le vecteur pgemt-easy en suivant les instructions du fournisseur (Promega), avant transformation de bactéries compétentes. IV Technologie de clonage GatewayTM (Invitrogen) IV Principe du clonage Gateway Son principe repose sur les réactions de recombinaison permettant l intégration et l excision du phage lambda dans le génome d E. coli. Les clonages sont réalisés en deux étapes. La première (réaction BP) consiste en la recombinaison directionnelle d un gène d intérêt avec un vecteur dit «donneur», dont le produit donne le vecteur dit «d entrée». Ce dernier sert de matrice à une seconde réaction (réaction LR) de recombinaison avec un vecteur de destination, aboutissant à un vecteur dit «d expression». Les vecteurs donneurs et de destination utilisés au cours de ma thèse figurent dans la table en annexe tableau 2. IV PCR de clonage A l aide deux PCR successives, le fragment d ADN à insérer est amplifié et les sites de recombinaisons attb1 et attb2 sont ajoutés. Les produits PCR obtenus sont purifiés par précipitation au PEG (comme décrit dans le paragraphe «puification au PEG») Protocole de PCR1 en vue d un clonage Gateway 1 µl d ADN (~50 ng/µl) est utilisé comme matrice et mélangé avec 1 µl de chaque oligonucléotides à 0,5 µm, de 0,2 µl de dntp à 100mM, de 2 µl de tampon HF Biorad 5X, de 0,1 µl de Taq Iproof Biorad High Fidelity polymerase et complété avec de l eau pour un volume final de 10 µl. La réaction s effectue dans un «thermocycler» en utilisant le programme suivant: 2 minutes à 98ºC puis 10 cycles de 15 secondes à 98ºC, de 30 secondes à 55ºC et 30 secondes par kb à amplifier à 68ºC et terminé par 5 minutes à 68ºC. 166

168 MATERIELS ET METHODES Protocole de PCR2 en vue d un clonage Gateway Sur la réaction PCR1 sont ajoutés, 1 µl de l amorce attb1 et attb2 à 10 µm, 0,8 µl de dntp à 10 mm, 8 µl de tampon HF Biorad 5X, 0,2 µl de polymerase Iproof High Fidelity de chez Biorad et complété avec de l eau pour un volume final de 40 µl. La réaction s effectue dans un «thermocycler» en utilisant le programme suivant: 2 minutes à 98ºC puis 25 cycles de 15 secondes à 98ºC, de 30 secondes à 55ºC et 30 secondes par kb à amplifier à 72ºC. La réaction est terminée par 5 minutes à 68ºC. IV Mutagenèse dirigée par PCR en vue d un clonage dans un vecteur d entrée du système Gateway Lors des expériences de complémentation du mutant otp43 avec les différents isoformes d épissage alternatif, j ai voulu également complémenter avec une forme ne pouvant plus épisser. Ainsi une mutagénèse ponctuelle sur les deux sites accepteurs AG a été réalisée par PCR, ainsi que l ajout de sites de recombinaison Gateway. Pour chaque site à muter, deux amorces en sens et antisens chevauchant le site ont été générées et sont représentées sur la figure 41 : 1-antisens (OTP43_Acceptor1rev) ; 2-sens (OTP43_Acceptor1Fw) ; 2-antisens (OTP43_Acceptor2rev) ; 3-sens (OTP43_Acceptor2Fw). Ces amorces ont été dessinées de façon à changer la séquence des deux sites accepteurs en AA au lieu de AG. Figure 41 : Procédure de mutagénèse dirigée des sites accepteurs d épissage d OTP43. Pour cela trois PCR indépendantes avec la Polymérase iproof de chez Biorad sont tout d abord réalisées sur de l ADNg: la première avec les amorces «start» de PPR43 (OTP43S- 167

169 MATERIELS ET METHODES Fw) et OTP43_Acceptor1rev, la deuxième avec les amorces OTP43_Acceptor1Fw avec OTP43_Acceptor2rev et la troisième en utilisant les amorces OTP43_Acceptor2Fw et l amorce «stop» de PPR43 (OTP43stop_rev). En parallèle, le clonage de la forme pleine longueur sans mutation est réalisé en utilisant les amorces «start» et «stop» de PPR43. Par la suite, après vérification sur gel des amplifications, 1 µl de chacune des trois premières PCR est mélangé et utilisé comme matrice pour l amplification avec les amorces attb1 et attb2, ces dernières permettant d ajouter les sites de recombinaison Gateway. Après vérification sur un gel contenant 1,2 % d agarose dans du TAE, les produits PCR sont alors purifiés par la méthode PEG et clonés dans une vecteur pdonr207 par une réaction de BP clonasse expliquée dans le paragraphe suivant. IV Réaction de BP clonase La réaction de BP permet de cloner la séquence encadrée par les sites attb1 et attb2 dans un vecteur d entrée contenant les sites attp1 et attp2. Protocole de réaction de BP clonase 2 µl de produit PCR purifié sont mélangés avec 100 ng de vecteur donneur (pdonr207 ou pdonr221), 1 µl de tampon de BP 5X, 0,4 µl de Clonase BP (Invitrogen) et complété à 5µL avec du TE ph8. Le mélange réactionnel est incubé sur la nuit à 25ºC. Puis la réaction est stoppée en ajoutant 0,5 µl de protéinase K (2 µg/µl) et en incubant 15 minutes à 37ºC. La totalité de la réaction est utilisée pour la transformation de bactéries compétentes par choc thermique. Les colonies positives après PCR sont alors sélectionnées pour une minipréparation d ADN. Les plasmides extraits, nommés vecteurs d «entrée» seront utilisés pour la réaction LR. IV Réaction de LR clonase La réaction de LR clonase va permettre de transférer les inserts clonés dans les vecteurs d «entrée» dans un vecteur de destination entre les sites de recombinaison attr1 et attr2 Protocole de réaction de LR clonase 100 ng de clone d entrée sont ajoutés à 100ng de vecteur destination, 1 µl de tampon LR 5X, 0,4 µl de Clonase LR (Invitrogen) et complété à 5 µl final par du TE ph8. Le mélange réactionnel est incubé sur la nuit à 25ºC. Puis la réaction est stoppée en ajoutant 0,5 µl de protéinase K (2 µg/µl) et en incubant 15 minutes à 37ºC. La totalité de la réaction est utilisée pour la transformation de bactéries compétentes par choc thermique. Les colonies obtenues après sélection sur l antibiotique adéquat sont testées par PCR. IV Transformation bactérienne, sélection et test des colonies transformées Des cellules bactériennes de la souche DH5α compétentes (de l ordre de transformants par µg d ADN) pour la transformation par choc thermique sont utilisées. IV Protocole de préparation de cellules DH5α Thermo-compétentes Une colonie sur boite est inoculée dans 10 ml de milieu LB et incubée à 37ºC sous agitation (200 rpm) sur la nuit. Les 10 ml de la préculture sont ensuite ensemencés dans 500 ml de milieu SOB. La culture est alors mise sous agitation (200 rpm) à 19 ºC jusqu à l obtention d une DO à 600nm comprise entre 0,5 et 0,6, puis incubée 10 minutes dans la glace. La culture est alors centrifugée à 5000 G pendant 10 minutes à 4ºC (en 2 flasques de 168

170 MATERIELS ET METHODES 1L). Chaque culot est repris dans 80 ml de TB froid puis incubé 10 minutes dans la glace suivi d une nouvelle centrifugation de 10 minutes à 5000 G à 4ºC. Chaque culot est alors repris dans 20 ml de TB froid et 2,8 ml de DMSO sont ajoutés. Les bactéries sont alors aliquotées, congelées et conservées à -80ºC. Milieu SOB : 20g/L Bacto-tryptone, 5g/L Bacto-yeast extract, 10mM NaCl, 2,5mM KCl, 10mM MgCl2, 10mM MgSO4, ph ajusté à 7 avec du NaOH TB : 10mM Pipes, 15mM CaCl2, 250mM KCl, ajusté à ph 6,7 avec du KOH, 55mM MnCl2, stérilisé par filtration (pas d autoclave) IV Protocole de transformation par choc thermique de cellules DH5α compétentes 100µl de bactéries compétentes sont ajoutés à 10 pg de plasmide ou au mélange réactionnel de réaction BP ou LR. Le mélange est incubé 20 minutes dans un mélange glace/eau, puis une minute à 42ºC dans un bain-marie (lorsque la réaction s effectue en tube eppendorf) et tout de suite transféré dans un mélange glace/eau pendant 5 minutes. 900 µl de milieu SOC sont ensuite ajoutés et le mélange est incubé sous agitation pendant une heure à 37ºC. 150 µl sont alors étalés sur boite de milieu LB additionné de l antibiotique approprié. Les boites sont incubées une nuit dans une étuve à 37ºC et les colonies sont testées par PCR. Milieu SOC : SOB + 20mM glucose IV Tranformation d Agrobactéries, sélection et test des colonies transformées Des cellules bactériennes de la souche C58C1 pmp90 compétentes (de l ordre de transformants par µg d ADN) pour la transformation par choc thermique sont utilisées. IV Protocole de préparation d agrobactéries thermocompétentes Une colonie sur boite est inoculée dans 1,6 ml de milieu LB Agro et la préculture est incubée sous agitation (200 rpm) sur la nuit à 28ºC. La préculture est ensuite ensemencée dans 40 ml de LB Agro et mise sous agitation (200 rpm) à 28ºC jusqu à l obtention d une DO à 600nm comprise entre 0,4 et 0,8. La culture est alors centrifugée à 5000 G pendant 15 minutes à 4ºC. Le culot est repris dans 10mL 10 mm Tris-HCl ph 7,5 froid, puis de nouveau centrifugée à 5000 G pendant 15 minutes à 4ºC. Le culot est enfin repris dans 10mL de Tris- HCl 10 mm ph 7,5 froid. Les agrobactéries sont alors aliquotées, congelées et conservées à - 80ºC. LBAgro ; Bactotryptone : 10 g/l Bacto Yeast Extract : 5 g/l NaCl : 5 g/l ph : 7,5 IV Protocole de transformation par choc thermique de cellules C58C1 compétentes 200µl de bactéries compétentes sont ajoutés à 1µg de plasmide et incubés 5 minutes dans un mélange eau/glace, puis 5 minutes dans l azote liquide et 5 minutes dans un bain-marie à 37ºC. 800 µl de milieu LB Agro sont alors ajoutés et mis en incubation à 28ºC sous agitation pendant deux heures. 300 µl sont ensuite étalés sur boite de milieu LBAgro additionné de l antibiotique approprié. Les boites sont placées dans une étuve à 28ºC pendant deux jours et les colonies sont testées par PCR. 169

171 MATERIELS ET METHODES IV Extraction et purification de plasmides (miniprépration d ADN) Selon les laboratoires, différents kits commerciaux ont été utilisés tels que : -le kit SV Miniprep (Promega) au laboratoire d Evry -les kits : QIAprep Spin Miniprep Kit (Qiagen) et Plasmid Miniprep Kit (Invitrogen) au laboratoire de Perth. La quantité de plasmide obtenue est systématiquement vérifiée par spectrométrie (mesure de la DO à 260nm). IV Séquençage d ADN Le séquençage des produits de PCR ou des ADN plasmidiques a été effectué par une entreprise externe, Macrogen (Macrogen, 908 World Meridian Venture Center, #60-24, Gasan-dong, Geumchun-gu, Seoul , Kore) ou GATC (GATC Biotech AG, Jacob- Stadler-Platz Konstanz, Germany). IV.2.3 Méthodes relatives à l ARN IV Extraction d ARN total L ARN total est extrait à partir de quelques milligrammes d un échantillon végétal (une feuille ou une plantule). L échantillon prélevé et transféré dans un tube eppendorf de 2ml et est ensuite broyé après congélation dans l azote liquide à l aide d une bille en acier et d un agitateur prévu à cet effet. L extraction en tant que telle est réalisée à l aide du kit RNeasy plant minikit (Qiagen) en suivant les instructions du fournisseur. IV Traitement de décontamination de l ADN contaminant Les ARN totaux sont traités à la DNaseI (DNA-free DNase Treatment and Removal Reagents AM1906) suivant les instructions du fournisseur (Ambion ). Les ARN totaux sont quantifiés au spectrophotomètre par mesure de l'absorption à 260nm à l aide d un «nanodrop» et visualisés sur gel d'agarose 2 %, dans du tampon TAE ou TBE. IV Réaction de transcription «inverse» Les ARNm des organites ayant une queue polya sont, contrairement aux ARNm nucléaires, en phase de dégradation. C est donc pour cette raison que la synthèse du premier brin d'adn complémentaire d'arn d'organites se fait à l'aide d'hexanucléotides aléatoires et non avec des oligonucléotides dt. En revanche, la synthèse du premier brin d'adn complémentaire d'arn nucléaires se fait à l aide d oligonucléotides dt. La synthèse d ADN complémentaire est effectuée en utilisant la transcriptase inverse SuperscriptII ( , Invitrogen ) ou la reverse transcriptaseiii ( , Invitrogen ) en suivant les instructions du fournisseur. La synthèse s effectue à partir d 1 µg à 3 µg d ARN décontaminé à la DNaseI. IV Northern blot Le protocole de northern blot utilisé pour regarder l accumulation des transcrits nad6 dans les différents mutants de complexe 1 est le même que celui décrit dans l article 2 sur OTP51. Les amorces utilisées pour fabriquer la sonde biotinilée sont décrites dans le paragraphe IV

172 MATERIELS ET METHODES IV Protocole pour l analyse PPE Les ARN d une plante sauvage et mutante sont extraits et des ADNc sont synthétisés. Alternativement, pour les témoins, 25pg d ADN plasmidique (contenant la séquence du transcrit d intérêt édité ou non édité) servent de matrice. Une PCR est effectuée en utilisant un couple d amorces flanquant le site d intérêt dans le transcrit. 2,5 l de PCR sont purifiés par 1µl d enzyme ExoSAP-IT (USB 78200) et incubés à 37 C pendant 20 minutes pour éliminer les nucléotides et les oligonucléotides non incorporés. L enzyme est inactivée à 80 C pendant 15 minutes. La réaction de PPE s effectue par le biais d un kit Thermosequenase Cycle Sequencing kit (USB 78500). Pour la réaction de l extension PPE, 100ng de produit PCR purifié sont ajoutés à 2 l de tampon 10X, 0,5pmol d amorce marquée en 5 à la 6-carboxyfluorescein (FAM), 1 unité de ThermoSequenase DNA polymérase, 100 nm de chaque nucléotides (mélange contenant trois dntp+ un ddntp) et complété à 20 µl avec de l eau. La réaction d amplification est faite dans un «thermocycler» en utilisant le programme suivant : 1 minute à 94ºC, suivie de 35 cycles de 30 secondes à 94ºC, 30 secondes à 55ºC et de 10 secondes à 68ºC. La réaction est terminée par 3 minutes d élongation à 68ºC. Le produit d amplification est alors déposé sur un gel de séquençage à 12% acrylamide (Sequagel) et migré à 55W. Le gel est ensuite révélé sur un Typhoon Trio Imager (GE Healthcare, ex-amersham), avec un filtre d émission 520BP40. L acquisition du signal fluorescent se fait à 488nm. La quantification des bandes se fait grâce au logiciel ImageQuant TL 1D gel analysis (Amersham Bioscience). Les bandes correspondant aux produits épissés et non épissés sont manuellement déterminées, et le logiciel calcule un volume correspondant à l intensité de fluorescence dans cette bande. Le bruit de fond est déterminé par la mesure d une bande «absente» correspondant au produit épissé et non épissé, obtenu à partir des plasmides épissé et non épissé, respectivement. IV.2.4 Méthodes propres à Arabidopsis IV Transformation d Arabidopsis par «floral deeping» Les plantes d Arabidopsis sont transformées par trempage des boutons floraux dans une solution d agrobactéries d intérêt, selon la méthode décrite par Clough et Bent, (Clough and Bent 1998). Protocole de transformation d Arabidopsis : Une culture de la souche d agrobactérie d intérêt est réalisée dans du LB-Agro jusqu à une DO à 600 nm comprise entre 0,8 et 1,0 (le volume dépend de la quantité de plantes que l on souhaite transformer). Les cellules sont ensuite centrifugées à 4000 G pendant 30 minutes et les culots sont resuspendus dans une solution 5% de sucrose, 0.02% de Silwet-L77 (volume identique au volume de culture). Les boutons floraux sont alors trempés pendant deux minutes dans la solution. Les plantes sont ensuite couvertes par un couvercle pendant 24 heures et cultivées jusqu à l obtention de graines. IV Etude du phénotype L analyse phénotypique des mutants consiste en l étude de plusieurs caractères comme : le pourcentage de germination, la taille et l aspect des germinations et des plantes adultes. 171

173 REFERENCES RÉFÉRENCES BIBLIOGRAPHIQUES Asakura, Y. and A. Barkan (2006). "Arabidopsis orthologs of maize chloroplast splicing factors promote splicing of orthologous and species-specific group II introns." Plant Physiol 142(4): Aubourg, S., N. Boudet, et al. (2000). "In Arabidopsis thaliana, 1% of the genome codes for a novel protein family unique to plants." Plant Mol Biol 42(4): Baier, M., G. Hemmann, et al. (2004). "Characterization of mutants in Arabidopsis showing increased sugar-specific gene expression, growth, and developmental responses." Plant Physiol 134(1): Banihashemi, L., G. M. Wilson, et al. (2006). "Upf1/Upf2 regulation of 3' untranslated region splice variants of AUF1 links nonsense-mediated and A+U-rich element-mediated mrna decay." Mol Cell Biol 26(23): Barbazuk, W. B., Y. Fu, et al. (2008). "Genome-wide analyses of alternative splicing in plants: opportunities and challenges." Genome Res 18(9): Barkan, A., M. Walker, et al. (1994). "A nuclear mutation in maize blocks the processing and translation of several chloroplast mrnas and provides evidence for the differential translation of alternative mrna forms." Embo J 13(13): Beick, S., C. Schmitz-Linneweber, et al. (2008). "The pentatricopeptide repeat protein PPR5 stabilizes a specific trna precursor in maize chloroplasts." Mol Cell Biol 28(17): Bentolila, S., A. A. Alfonso, et al. (2002). "A pentatricopeptide repeat-containing gene restores fertility to cytoplasmic male-sterile plants." Proc Natl Acad Sci U S A 99(16): Bentolila, S., A. L. Chateigner-Boutin, et al. (2005). "Ecotype allelic variation in C-to-U editing extent of a mitochondrial transcript identifies RNA-editing quantitative trait loci in Arabidopsis." Plant Physiol 139(4): Bentolila, S., L. E. Elliott, et al. (2008). "Genetic architecture of mitochondrial editing in Arabidopsis thaliana." Genetics 178(3): Blatch, G. L. and M. Lassle (1999). "The tetratricopeptide repeat: a structural motif mediating protein-protein interactions." Bioessays 21(11): Brangeon, J., M. Sabar, et al. (2000). "Defective splicing of the first nad4 intron is associated with lack of several complex I subunits in the Nicotiana sylvestris NMS1 nuclear mutant." Plant J 21(3): Brown, G. G., N. Formanova, et al. (2003). "The radish Rfo restorer gene of Ogura cytoplasmic male sterility encodes a protein with multiple pentatricopeptide repeats." Plant J 35(2): Cai, W., D. Ji, et al. (2009). "LPA66 is required for editing psbf chloroplast transcripts in Arabidopsis." Plant Physiol 150(3): Chang, Y. F., J. S. Imam, et al. (2007). "The nonsense-mediated decay RNA surveillance pathway." Annu Rev Biochem 76: Chase, C. D. (2007). "Cytoplasmic male sterility: a window to the world of plant mitochondrial-nuclear interactions." Trends Genet 23(2):

174 REFERENCES Chateigner-Boutin, A. L., M. Ramos-Vega, et al. (2008). "CLB19, a pentatricopeptide repeat protein required for editing of rpoa and clpp chloroplast transcripts." Plant J 56(4): Chateigner-Boutin, A. L. and I. Small (2007). "A rapid high-throughput method for the detection and quantification of RNA editing based on high-resolution melting of amplicons." Nucleic Acids Res 35(17): e114. Chi, W., J. Ma, et al. (2008). "The pentratricopeptide repeat protein DELAYED GREENING1 is involved in the regulation of early chloroplast development and chloroplast gene expression in Arabidopsis." Plant Physiol 147(2): Clough, S. J. and A. F. Bent (1998). "Floral dip: a simplified method for Agrobacteriummediated transformation of Arabidopsis thaliana." Plant J 16(6): Coffin, J. W., R. Dhillon, et al. (1997). "The Neurospora crassa cya-5 nuclear gene encodes a protein with a region of homology to the Saccharomyces cerevisiae PET309 protein and is required in a post-transcriptional step for the expression of the mitochondrially encoded COXI protein." Curr Genet 32(4): Cui, X., R. P. Wise, et al. (1996). "The rf2 nuclear restorer gene of male-sterile T-cytoplasm maize." Science 272(5266): Das, A. K., P. W. Cohen, et al. (1998). "The structure of the tetratricopeptide repeats of protein phosphatase 5: implications for TPR-mediated protein-protein interactions." EMBO J 17(5): Davies, S. M., O. Rackham, et al. (2009). "Pentatricopeptide repeat domain protein 3 associates with the mitochondrial small ribosomal subunit and regulates translation." FEBS Lett 583(12): de Longevialle, A. F., L. Hendrickson, et al. (2008). "The pentatricopeptide repeat gene OTP51 with two LAGLIDADG motifs is required for the cis-splicing of plastid ycf3 intron 2 in Arabidopsis thaliana." Plant J 56(1): de Longevialle, A. F., E. H. Meyer, et al. (2007). "The pentatricopeptide repeat gene OTP43 is required for trans-splicing of the mitochondrial nad1 Intron 1 in Arabidopsis thaliana." Plant Cell 19(10): Delannoy, E., W. A. Stanley, et al. (2007). "Pentatricopeptide repeat (PPR) proteins as sequence-specificity factors in post-transcriptional processes in organelles." Biochem Soc Trans 35(Pt 6): Desloire, S., H. Gherbi, et al. (2003). "Identification of the fertility restoration locus, Rfo, in radish, as a member of the pentatricopeptide-repeat protein family." EMBO Rep 4(6): Diercks, T., E. Ab, et al. (2008). "Solution structure and characterization of the DNA-binding activity of the B3BP-Smr domain." J Mol Biol 383(5): Ding, Y. H., N. Y. Liu, et al. (2006). "Arabidopsis GLUTAMINE-RICH PROTEIN23 is essential for early embryogenesis and encodes a novel nuclear PPR motif protein that interacts with RNA polymerase II subunit III." Plant Cell 18(4): Doolittle, W. F. and A. Stoltzfus (1993). "Molecular evolution. Genes-in-pieces revisited." Nature 361(6411):

175 REFERENCES Dutilleul, C., S. Driscoll, et al. (2003). "Functional mitochondrial complex I is required by tobacco leaves for optimal photosynthetic performance in photorespiratory conditions and during transients." Plant Physiol 131(1): Dutilleul, C., C. Lelarge, et al. (2005). "Mitochondria-driven changes in leaf NAD status exert a crucial influence on the control of nitrate assimilation and the integration of carbon and nitrogen metabolism." Plant Physiol 139(1): Ellis, T. P., K. G. Helfenbein, et al. (2004). "Aep3p stabilizes the mitochondrial bicistronic mrna encoding subunits 6 and 8 of the H+-translocating ATP synthase of Saccharomyces cerevisiae." J Biol Chem 279(16): Fahlgren, N., M. D. Howell, et al. (2007). "High-throughput sequencing of Arabidopsis micrornas: evidence for frequent birth and death of MIRNA genes." PLoS One 2(2): e219. Filichkin, S. A., H. D. Priest, et al. (2010). "Genome-wide mapping of alternative splicing in Arabidopsis thaliana." Genome Res 20(1): Fukui, K., H. Kosaka, et al. (2007). "Nuclease activity of the MutS homologue MutS2 from Thermus thermophilus is confined to the Smr domain." Nucleic Acids Res 35(3): Galtier, N. and M. Gouy (1995). "Inferring phylogenies from DNA sequences of unequal base compositions." Proc Natl Acad Sci U S A 92(24): Garmier, M., A. J. Carroll, et al. (2008). "Complex I dysfunction redirects cellular and mitochondrial metabolism in Arabidopsis." Plant Physiol 148(3): Giege, P. and A. Brennicke (1999). "RNA editing in Arabidopsis mitochondria effects 441 C to U changes in ORFs." Proc Natl Acad Sci U S A 96(26): Gilbert, W. (1978). "Why genes in pieces?" Nature 271(5645): 501. Gillman, J. D., S. Bentolila, et al. (2007). "The petunia restorer of fertility protein is part of a large mitochondrial complex that interacts with transcripts of the CMS-associated locus." Plant J 49(2): Hajdukiewicz, P. T., L. A. Allison, et al. (1997). "The two RNA polymerases encoded by the nuclear and the plastid compartments transcribe distinct groups of genes in tobacco plastids." EMBO J 16(13): Hammani, K., K. Okuda, et al. (2009). "A study of new Arabidopsis chloroplast RNA editing mutants reveals general features of editing factors and their target sites." Plant Cell 21(11): Hashimoto, M., T. Endo, et al. (2003). "A nucleus-encoded factor, CRR2, is essential for the expression of chloroplast ndhb in Arabidopsis." Plant J 36(4): Hattori, M., H. Miyake, et al. (2007). "A Pentatricopeptide repeat protein is required for RNA processing of clpp Pre-mRNA in moss chloroplasts." J Biol Chem 282(14): Hattori, M. and M. Sugita (2009). "A moss pentatricopeptide repeat protein binds to the 3' end of plastid clpp pre-mrna and assists with mrna maturation." Febs J 276(20): Heazlewood, J. L., K. A. Howell, et al. (2003). "Mitochondrial complex I from Arabidopsis and rice: orthologs of mammalian and fungal components coupled with plant-specific subunits." Biochim Biophys Acta 1604(3):

176 REFERENCES Hilson, P., J. Allemeersch, et al. (2004). "Versatile gene-specific sequence tags for Arabidopsis functional genomics: transcript profiling and reverse genetics applications." Genome Res 14(10B): Hilson, P., I. Small, et al. (2003). "European consortia building integrated resources for Arabidopsis functional genomics." Curr Opin Plant Biol 6(5): Ikeda, T. M. and M. W. Gray (1999). "Characterization of a DNA-binding protein implicated in transcription in wheat mitochondria." Mol Cell Biol 19(12): Jenkins, B. D., D. J. Kulhanek, et al. (1997). "Nuclear mutations that block group II RNA splicing in maize chloroplasts reveal several intron classes with distinct requirements for splicing factors." Plant Cell 9(3): Johnson, X., K. Wostrikoff, et al. (2010). "MRL1, a conserved Pentatricopeptide repeat protein, is required for stabilization of rbcl mrna in Chlamydomonas and Arabidopsis." Plant Cell 22(1): Jonietz, C., J. Forner, et al. (2010). "RNA PROCESSING FACTOR2 is required for 5' end processing of nad9 and cox3 mrnas in mitochondria of Arabidopsis thaliana." Plant Cell 22(2): Kanamaru, K. and K. Tanaka (2004). "Roles of chloroplast RNA polymerase sigma factors in chloroplast development and stress response in higher plants." Biosci Biotechnol Biochem 68(11): Kazama, T. and K. Toriyama (2003). "A pentatricopeptide repeat-containing gene that promotes the processing of aberrant atp6 RNA of cytoplasmic male-sterile rice." FEBS Lett 544(1-3): Keren, H., G. Lev-Maor, et al. (2010). "Alternative splicing and evolution: diversification, exon definition and function." Nat Rev Genet 11(5): Kim, E., A. Magen, et al. (2007). "Different levels of alternative splicing among eukaryotes." Nucleic Acids Res 35(1): Kim, S. R., J. I. Yang, et al. (2009). "Rice OGR1 encodes a pentatricopeptide repeat-dyw protein and is essential for RNA editing in mitochondria." Plant J 59(5): Klein, R. R., P. E. Klein, et al. (2005). "Fertility restorer locus Rf1 [corrected] of sorghum (Sorghum bicolor L.) encodes a pentatricopeptide repeat protein not present in the colinear region of rice chromosome 12." Theor Appl Genet 111(6): Klevebring, D., N. R. Street, et al. (2009). "Genome-wide profiling of populus small RNAs." BMC Genomics 10: 620. Kode, V., E. A. Mudd, et al. (2005). "The tobacco plastid accd gene is essential and is required for leaf development." Plant J 44(2): Koizuka, N., R. Imai, et al. (2003). "Genetic characterization of a pentatricopeptide repeat protein gene, orf687, that restores fertility in the cytoplasmic male-sterile Kosena radish." Plant J 34(4): Konishi, T., K. Shinohara, et al. (1996). "Acetyl-CoA carboxylase in higher plants: most plants other than gramineae have both the prokaryotic and the eukaryotic forms of this enzyme." Plant Cell Physiol 37(2): Koonin, E. V. (2006). "The origin of introns and their role in eukaryogenesis: a compromise solution to the introns-early versus introns-late debate?" Biol Direct 1:

177 REFERENCES Kotera, E., M. Tasaka, et al. (2005). "A pentatricopeptide repeat protein is essential for RNA editing in chloroplasts." Nature 433(7023): Koussevitzky, S., A. Nott, et al. (2007). "Signals from chloroplasts converge to regulate nuclear gene expression." Science 316(5825): Kurihara-Yonemoto, S. and H. Handa (2001). "Low temperature affects the processing pattern and RNA editing status of the mitochondrial cox2 transcripts in wheat." Curr Genet 40(3): Lahmy, S., F. Barneche, et al. (2000). "A chloroplastic RNA-binding protein is a new member of the PPR family." FEBS Lett 480(2-3): Lareau, L. F., M. Inada, et al. (2007). "Unproductive splicing of SR genes associated with highly conserved and ultraconserved DNA elements." Nature 446(7138): Lee, B. H., H. Lee, et al. (2002). "A mitochondrial complex I defect impairs cold-regulated nuclear gene expression." Plant Cell 14(6): Lee, C., A. S. Tibbetts, et al. (2009). "Yeast AEP3p is an accessory factor in initiation of mitochondrial translation." J Biol Chem 284(49): Li, Y., K. K. Lee, et al. (2006). "Establishing glucose- and ABA-regulated transcription networks in Arabidopsis by microarray analysis and promoter classification using a Relevance Vector Machine." Genome Res 16(3): Li, Y., C. Smith, et al. (2007). "Signaling from an altered cell wall to the nucleus mediates sugar-responsive growth and development in Arabidopsis thaliana." Plant Cell 19(8): Liere, K. and P. Maliga (1999). "In vitro characterization of the tobacco rpob promoter reveals a core sequence motif conserved between phage-type plastid and plant mitochondrial promoters." EMBO J 18(1): Lightowlers, R. N. and Z. M. Chrzanowska-Lightowlers (2008). "PPR (pentatricopeptide repeat) proteins in mammals: important aids to mitochondrial gene expression." Biochem J 416(1): e5-6. Loiselay, C., N. J. Gumpel, et al. (2008). "Molecular identification and function of cis- and trans-acting determinants for peta transcript stability in Chlamydomonas reinhardtii chloroplasts." Mol Cell Biol 28(17): Lurin, C., C. Andres, et al. (2004). "Genome-wide analysis of Arabidopsis pentatricopeptide repeat proteins reveals their essential role in organelle biogenesis." Plant Cell 16(8): Lynch, M., B. Koskella, et al. (2006). "Mutation pressure and the evolution of organelle genomic architecture." Science 311(5768): Maier, U. G., A. Bozarth, et al. (2008). "Complex chloroplast RNA metabolism: just debugging the genetic programme?" BMC Biol 6: 36. Malek, O. and V. Knoop (1998). "Trans-splicing group II introns in plant mitochondria: the complete set of cis-arranged homologs in ferns, fern allies, and a hornwort." Rna 4(12): Malik, H. S. and S. Henikoff (2000). "Dual recognition-incision enzymes might be involved in mismatch repair and meiosis." Trends Biochem Sci 25(9):

178 REFERENCES Mancebo, R., X. Zhou, et al. (2001). "BSF binds specifically to the bicoid mrna 3' untranslated region and contributes to stabilization of bicoid mrna." Mol Cell Biol 21(10): Manthey, G. M. and J. E. McEwen (1995). "The product of the nuclear gene PET309 is required for translation of mature mrna and stability or production of introncontaining RNAs derived from the mitochondrial COX1 locus of Saccharomyces cerevisiae." Embo J 14(16): Meierhoff, K., S. Felder, et al. (2003). "HCF152, an Arabidopsis RNA binding pentatricopeptide repeat protein involved in the processing of chloroplast psbb-psbtpsbh-petb-petd RNAs." Plant Cell 15(6): Meyer, E. H., T. Tomaz, et al. (2009). "Remodeled respiration in ndufs4 with low phosphorylation efficiency suppresses Arabidopsis germination and growth and alters control of metabolism at night." Plant Physiol 151(2): Mili, S. and S. Pinol-Roma (2003). "LRP130, a pentatricopeptide motif protein with a noncanonical RNA-binding domain, is bound in vivo to mitochondrial and nuclear RNAs." Mol Cell Biol 23(14): Mita, S., K. Suzuki-Fujii, et al. (1995). "Sugar-inducible expression of a gene for betaamylase in Arabidopsis thaliana." Plant Physiol 107(3): Modrek, B. and C. Lee (2002). "A genomic view of alternative splicing." Nat Genet 30(1): Moore, B., L. Zhou, et al. (2003). "Role of the Arabidopsis glucose sensor HXK1 in nutrient, light, and hormonal signaling." Science 300(5617): Mootha, V. K., P. Lepage, et al. (2003). "Identification of a gene causing human cytochrome c oxidase deficiency by integrative genomics." Proc Natl Acad Sci U S A 100(2): Moreira, D. and H. Philippe (1999). "Smr: a bacterial and eukaryotic homologue of the C- terminal region of the MutS2 family." Trends Biochem Sci 24(8): Moreno, J. I., K. S. Buie, et al. (2009). "Ccm1p/Ygr150cp, a pentatricopeptide repeat protein, is essential to remove the fourth intron of both COB and COX1 pre-mrnas in Saccharomyces cerevisiae." Curr Genet 55(4): Naithani, S., S. A. Saracco, et al. (2003). "Interactions among COX1, COX2, and COX3 mrna-specific translational activator proteins on the inner surface of the mitochondrial inner membrane of Saccharomyces cerevisiae." Mol Biol Cell 14(1): Nakagawa, N. and N. Sakurai (2006). "A mutation in At-nMat1a, which encodes a nuclear gene having high similarity to group II intron maturase, causes impaired splicing of mitochondrial NAD4 transcript and altered carbon metabolism in Arabidopsis thaliana." Plant Cell Physiol 47(6): Nakamura, T., K. Meierhoff, et al. (2003). "RNA-binding properties of HCF152, an Arabidopsis PPR protein involved in the processing of chloroplast RNA." Eur J Biochem 270(20): Nakamura, T. and M. Sugita (2008). "A conserved DYW domain of the pentatricopeptide repeat protein possesses a novel endoribonuclease activity." FEBS Lett 582(30):

179 REFERENCES Narsai, R., K. A. Howell, et al. (2007). "Genome-wide analysis of mrna decay rates and their determinants in Arabidopsis thaliana." Plant Cell 19(11): O'Toole, N., M. Hattori, et al. (2008). "On the expansion of the pentatricopeptide repeat gene family in plants." Mol Biol Evol 25(6): Oberdoerffer, S., L. F. Moita, et al. (2008). "Regulation of CD45 alternative splicing by heterogeneous ribonucleoprotein, hnrnpll." Science 321(5889): Ohta, H., A. Ogino, et al. (2010). "Fertility restoration by Ifr1 in rice with BT-type cytoplasmic male sterility is associated with a reduced level, but not processing, of atp6-orf79 co-transcribed RNA." Plant Cell Rep 29(4): Okuda, K., A. L. Chateigner-Boutin, et al. (2009). "Pentatricopeptide repeat proteins with the DYW motif have distinct molecular functions in RNA editing and RNA cleavage in Arabidopsis chloroplasts." Plant Cell 21(1): Okuda, K., K. Hammani, et al. (2010). "The pentatricopeptide repeat protein OTP82 is required for RNA editing of plastid ndhb and ndhg transcripts." Plant J 61(2): Okuda, K., F. Myouga, et al. (2007). "Conserved domain structure of pentatricopeptide repeat proteins involved in chloroplast RNA editing." Proc Natl Acad Sci U S A 104(19): Okuda, K., T. Nakamura, et al. (2006). "A pentatricopeptide repeat protein is a site recognition factor in chloroplast RNA editing." J Biol Chem 281(49): Pfalz, J., O. A. Bayraktar, et al. (2009). "Site-specific binding of a PPR protein defines and stabilizes 5' and 3' mrna termini in chloroplasts." EMBO J 28(14): Pfalz, J., K. Liere, et al. (2006). "ptac2, -6, and -12 are components of the transcriptionally active plastid chromosome that are required for plastid gene expression." Plant Cell 18(1): Prikryl, J., K. P. Watkins, et al. (2008). "A member of the Whirly family is a multifunctional RNA- and DNA-binding protein that is essential for chloroplast biogenesis." Nucleic Acids Res 36(16): Puchta, O., M. Lubas, et al. (2010). "DMR1 (CCM1/YGR150C) of Saccharomyces cerevisiae encodes an RNA-binding protein from the pentatricopeptide repeat family required for the maintenance of the mitochondrial 15S ribosomal RNA." Genetics 184(4): Rackham, O., S. M. Davies, et al. (2009). "Pentatricopeptide repeat domain protein 1 lowers the levels of mitochondrial leucine trnas in cells." Nucleic Acids Res 37(17): Reddy, A. S. (2007). "Alternative splicing of pre-messenger RNAs in plants in the genomic era." Annu Rev Plant Biol 58: Rhoades, M. W., B. J. Reinhart, et al. (2002). "Prediction of plant microrna targets." Cell 110(4): Robbins, J. C., W. P. Heller, et al. (2009). "A comparative genomics approach identifies a PPR-DYW protein that is essential for C-to-U editing of the Arabidopsis chloroplast accd transcript." RNA 15(6): Rook, F., F. Corke, et al. (2001). "Impaired sucrose-induction mutants reveal the modulation of sugar-induced starch biosynthetic gene expression by abscisic acid signalling." Plant J 26(4):

180 REFERENCES Salone, V., M. Rudinger, et al. (2007). "A hypothesis on the identification of the editing enzyme in plant organelles." FEBS Lett 581(22): Samson, F., V. Brunaud, et al. (2004). "FLAGdb++: a database for the functional analysis of the Arabidopsis genome." Nucleic Acids Res 32(Database issue): D Schmitz-Linneweber, C. and I. Small (2008). "Pentatricopeptide repeat proteins: a socket set for organelle gene expression." Trends Plant Sci 13(12): Schmitz-Linneweber, C., R. Williams-Carrier, et al. (2005). "RNA immunoprecipitation and microarray analysis show a chloroplast Pentatricopeptide repeat protein to be associated with the 5' region of mrnas whose translation it activates." Plant Cell 17(10): Schmitz-Linneweber, C., R. E. Williams-Carrier, et al. (2006). "A pentatricopeptide repeat protein facilitates the trans-splicing of the maize chloroplast rps12 pre-mrna." Plant Cell 18(10): Shadel, G. S. (2004). "Coupling the mitochondrial transcription machinery to human disease." Trends Genet 20(10): Sheen, J., L. Zhou, et al. (1999). "Sugars as signaling molecules." Curr Opin Plant Biol 2(5): Small, I., N. Peeters, et al. (2004). "Predotar: A tool for rapidly screening proteomes for N- terminal targeting sequences." Proteomics 4(6): Small, I. D. and N. Peeters (2000). "The PPR motif - a TPR-related motif prevalent in plant organellar proteins." Trends Biochem Sci 25(2): Sterky, F. H. and N. G. Larsson (2008). "Complex I: a complex gateway to the powerhouse." Cell Metab 7(4): Sung, T. Y., C. C. Tseng, et al. (2010). "The SLO1 PPR protein is required for RNA editing at multiple sites with similar upstream sequences in Arabidopsis mitochondria." Plant J. Sunkar, R. and J. K. Zhu (2004). "Novel and stress-regulated micrornas and other small RNAs from Arabidopsis." Plant Cell 16(8): Takenaka, M., D. Verbitskiy, et al. (2010). "Reverse genetic screening identifies five E-class PPR-proteins involved in RNA editing in mitochondria of Arabidopsis Thaliana." J Biol Chem. Tasaki, E., M. Hattori, et al. (2010). "The moss pentatricopeptide repeat protein with a DYW domain is responsible for RNA editing of mitochondrial ccmfc transcript." Plant J. Tavares-Carreon, F., Y. Camacho-Villasana, et al. (2008). "The pentatricopeptide repeats present in Pet309 are necessary for translation but not for stability of the mitochondrial COX1 mrna in yeast." J Biol Chem 283(3): Till, B., C. Schmitz-Linneweber, et al. (2001). "CRS1 is a novel group II intron splicing factor that was derived from a domain of ancient origin." RNA 7(9): Tillich, M., H. T. Funk, et al. (2005). "Editing of plastid RNA in Arabidopsis thaliana ecotypes." Plant J 43(5): Tseng, C. C., T. Y. Sung, et al. (2010). "Editing of accd and ndhf chloroplast transcripts is partially affected in the Arabidopsis vanilla cream1 mutant." Plant Mol Biol 73(3):

181 REFERENCES Uyttewaal, M., N. Arnal, et al. (2008). "Characterization of Raphanus sativus pentatricopeptide repeat proteins encoded by the fertility restorer locus for Ogura cytoplasmic male sterility." Plant Cell 20(12): Uyttewaal, M., H. Mireau, et al. (2008). "PPR336 is associated with polysomes in plant mitochondria." J Mol Biol 375(3): Van Leene, J., E. Witters, et al. (2008). "Boosting tandem affinity purification of plant protein complexes." Trends Plant Sci 13(10): Verbitskiy, D., A. Zehrmann, et al. (2010). "The PPR protein encoded by the LOVASTATIN INSENSITIVE 1 gene is involved in RNA editing at three sites in mitochondria of Arabidopsis thaliana." Plant J 61(3): Vidal, G., M. Ribas-Carbo, et al. (2007). "Lack of respiratory chain complex I impairs alternative oxidase engagement and modulates redox signaling during elicitor-induced cell death in tobacco." Plant Cell 19(2): Wakasugi, T., T. Tsudzuki, et al. (2001). "The genomics of land plant chloroplasts: Gene content and alteration of genomic information by RNA editing." Photosynth Res 70(1): Wang, E. T., R. Sandberg, et al. (2008). "Alternative isoform regulation in human tissue transcriptomes." Nature 456(7221): Wang, Z., Y. Zou, et al. (2006). "Cytoplasmic male sterility of rice with boro II cytoplasm is caused by a cytotoxic peptide and is restored by two related PPR motif genes via distinct modes of mrna silencing." Plant Cell 18(3): Weisshaar, B. and G. I. Jenkins (1998). "Phenylpropanoid biosynthesis and its regulation." Curr Opin Plant Biol 1(3): Wiebauer, K., J. J. Herrero, et al. (1988). "Nuclear pre-mrna processing in plants: distinct modes of 3'-splice-site selection in plants and animals." Mol Cell Biol 8(5): Williams, P. M. and A. Barkan (2003). "A chloroplast-localized PPR protein required for plastid ribosome accumulation." Plant J 36(5): Williams-Carrier, R., T. Kroeger, et al. (2008). "Sequence-specific binding of a chloroplast pentatricopeptide repeat protein to its native group II intron ligand." Rna 14(9): Xu, F., C. Ackerley, et al. (2008). "Disruption of a mitochondrial RNA-binding protein gene results in decreased cytochrome b expression and a marked reduction in ubiquinolcytochrome c reductase activity in mouse heart mitochondria." Biochem J 416(1): Xu, F., C. Morin, et al. (2004). "The role of the LRPPRC (leucine-rich pentatricopeptide repeat cassette) gene in cytochrome oxidase assembly: mutation causes lowered levels of COX (cytochrome c oxidase) I and COX III mrna." Biochem J 382(Pt 1): Yamazaki, H., M. Tasaka, et al. (2004). "PPR motifs of the nucleus-encoded factor, PGR3, function in the selective and distinct steps of chloroplast gene expression in Arabidopsis." Plant J 38(1): Yu, Q. B., Y. Jiang, et al. (2009). "AtECB2, a pentatricopeptide repeat protein, is required for chloroplast transcript accd RNA editing and early chloroplast biogenesis in Arabidopsis thaliana." Plant J 59(6):

182 REFERENCES Zehrmann, A., J. A. van der Merwe, et al. (2008). "Seven large variations in the extent of RNA editing in plant mitochondria between three ecotypes of Arabidopsis thaliana." Mitochondrion 8(4): Zehrmann, A., D. Verbitskiy, et al. (2009). "A DYW domain-containing pentatricopeptide repeat protein is required for RNA editing at multiple sites in mitochondria of Arabidopsis thaliana." Plant Cell 21(2): Zhou, W., Y. Cheng, et al. (2008). "The Arabidopsis gene YS1 encoding a DYW protein is required for editing of rpob transcripts and the rapid development of chloroplasts during early growth." Plant J. Zoschke, R., M. Nakamura, et al. (2010). "An organellar maturase associates with multiple group II introns." Proc Natl Acad Sci U S A 107(7): Zsigmond, L., G. Rigo, et al. (2008). "Arabidopsis PPR40 connects abiotic stress responses to mitochondrial electron transport." Plant Physiol 146(4):

183 ANNEXES ANNEXES : Tableau 1 : Sondes affymetrix pour chaque gène PPR AGI code Probe set id AGI code Probe set id AGI code Probe set id At1g _at At2g _at At3g _s_at At1g _at At2g _at At4g _at At1g _at At2g _at At4g _at At1g _at At2g _at At4g _at At1g _at At2g _at At4g _at At1g _at At2g _at At4g _at At1g _at At2g _at At4g _at At1g _at At2g _at At4g _at At1g _at At2g _at At4g _at At1g _at At2g _at At4g _at At1g _at At2g _at At4g _at At1g _at At2g _at At4g _at At1g _at At2g _at At4g _at At1g _at At2g _at At4g _at At1g _at At2g _at At4g _at At1g _at At2g _at At4g _at At1g _at At2g _at At4g _at At1g _at At2g _at At4g _at At1g _at At2g _at At4g _at At1g _at At2g _at At4g _at At1g _at At2g _at At4g _at At1g _at At2g _at At4g _at At1g _at At2g _at At4g _at At1g _at At2g _at At4g _at At1g _at At2g _at At4g _at At1g _at At2g _s_at At4g _at At1g _at At2g _at At4g _at At1g _at At2g _at At4g _at At1g _at At2g _at At4g _at At1g _at At2g _at At4g _at At1g _at At2g _at At4g _at At1g _at At2g _at At4g _at At1g _at At2g _at At4g _at At1g _at At2g _at At4g _at At1g _at At2g _at At4g _at At1g _at At2g _at At4g _at At1g _at At2g _at At4g _at At1g _at At2g _at At4g _at At1g _at At2g _at At4g _at At1g _at At2g _at At4g _at At1g _at At2g _at At4g _at At1g _at At2g _at At4g _at At1g _at At2g _at At4g _at At1g _at At2g _at At4g _at At1g _at At2g _at At4g _at At1g _at At2g _at At4g _at At1g _at At2g _at At4g _at At1g _at At2g _at At4g _at At1g _at At2g _at At5g _at At1g _at At2g _at At5g _at 182

184 ANNEXES At1g _at At2g _at At5g _at At1g _at At3g _at At5g _at At1g _at At3g _at At5g _at At1g _at At3g _at At5g _at At1g _at At3g _at At5g _at At1g _at At3g _at At5g _at At1g _at At3g _at At5g _at At1g _at At3g _at At5g _at At1g _at At3g _at At5g _at At1g _at At3g _at At5g _at At1g _at At3g _at At5g _at At1g _at At3g _at At5g _at At1g _at At3g _at At5g _at At1g _at At3g _at At5g _at At1g _at At3g _at At5g _at At1g _at At3g _at At5g _s_at At1g _at At3g _at At5g _at At1g _at At3g _at At5g _at At1g _at At3g _at At5g _at At1g _at At3g _at At5g _at At1g _at At3g _at At5g _at At1g _at At3g _at At5g _at At1g _at At3g _at At5g _at At1g _at At3g _at At5g _at At1g _at At3g _at At5g _at At1g _at At3g _at At5g _at At1g _at At3g _at At5g _at At1g _at At3g _at At5g _at At1g _at At3g _at At5g _at At1g _at At3g _at At5g _at At1g _s_at At3g _at At5g _at At1g _at At3g _at At5g _at At1g _at At3g _at At5g _at At1g _at At3g _at At5g _s_at At1g _at At3g _at At5g _at At1g _at At3g _at At5g _at At1g _at At3g _at At5g _at At1g _x_at At3g _at At5g _at At1g _at At3g _at At5g _at At1g _s_at At3g _at At5g _at At1g _at At3g _at At5g _at At1g _at At3g _at At5g _at At1g _at At3g _at At5g _at At1g _at At3g _at At5g _at At1g _at At3g _at At5g _at At1g _at At3g _at At5g _at At1g _at At3g _at At5g _at At1g _at At3g _s_at At5g _at At1g _at At3g _s_at At5g _at At1g _at At3g _at At5g _at At1g _at At3g _at At5g _at At1g _at At3g _at At5g _at At1g _at At3g _s_at At5g _at At1g _at At3g _at At5g _at At1g _at At3g _at At5g _at 183

185 ANNEXES At1g _at At3g _at At5g _at At1g _at At3g _at At5g _at At1g _at At3g _at At5g _at At1g _at At3g _at At5g _at At1g _at At3g _at At5g _at At1g _at At3g _at At5g _at At1g _at At3g _at At5g _at At1g _s_at At3g _at At5g _at At1g _at At3g _at At5g _at At1g _at At3g _at At5g _at At1g _at At3g _at At5g _at At1g _at At3g _at At5g _at At1g _at At3g _at At5g _at At1g _at At3g _at At5g _at At1g _at At3g _at At5g _at At1g _at At3g _at At5g _at At2g _s_at At3g _s_at At5g _at At2g _s_at At3g _at At5g _at At2g _at At3g _at At5g _at At2g _at At3g _s_at At5g _at At2g _at At3g _s_at At5g _at Tableau 2 : Vecteurs Gateway utilisés pour les clonages. 184

2 players Ages 8+ Note: Please keep these instructions for future reference. WARNING. CHOKING HAZARD. Small parts. Not for children under 3 years.

2 players Ages 8+ Note: Please keep these instructions for future reference. WARNING. CHOKING HAZARD. Small parts. Not for children under 3 years. Linja Game Rules 2 players Ages 8+ Published under license from FoxMind Games NV, by: FoxMind Games BV Stadhouderskade 125hs Amsterdam, The Netherlands Distribution in North America: FoxMind USA 2710 Thomes

Plus en détail

EZRATY Benjamin Laboratoire Chimie Bactérienne, CNRS ezraty@ibsm.cnrs-mrs.fr. Cursus: 1994: Bac D. 1999: maîtrise microbiologie 2000: DEA

EZRATY Benjamin Laboratoire Chimie Bactérienne, CNRS ezraty@ibsm.cnrs-mrs.fr. Cursus: 1994: Bac D. 1999: maîtrise microbiologie 2000: DEA EZRATY Benjamin Laboratoire Chimie Bactérienne, CNRS ezraty@ibsm.cnrs-mrs.fr Cursus: 1994: Bac D 1999: maîtrise microbiologie 2000: DEA Mars 2004: thèse Avril 2004 Septembre 2005: Post-Doc Octobre 2005:

Plus en détail

Expression des gènes Comparatif entre procaryotes et eucaryotes

Expression des gènes Comparatif entre procaryotes et eucaryotes Comparaison procaryotes/ 2TSbc Expression des gènes Comparatif entre procaryotes et eucaryotes La majeure partie des connaissances de biologie moléculaire a d'abord débuté par l'étude des phénomènes chez

Plus en détail

PROTEIN COMPLEXES INVOLVED IN PCG FUNCTION

PROTEIN COMPLEXES INVOLVED IN PCG FUNCTION DISS. ETH NO. 21505 PROTEIN COMPLEXES INVOLVED IN PCG FUNCTION A dissertation submitted to ETH ZURICH for the degree of Doctor of Sciences presented by MARIA DERKACHEVA Master of Biology (Honours), Saint-Petersburg

Plus en détail

Chapitre 5 : La transcription. Professeur Joël LUNARDI

Chapitre 5 : La transcription. Professeur Joël LUNARDI Chapitre 5 : La transcription UE1 : Biochimie Biologie moléculaire Professeur Joël LUNARDI Année universitaire 2011/2012 Université Joseph Fourier de Grenoble - Tous droits réservés. Chapitre 5. La transcription

Plus en détail

RNAseq et NGS. Adriana Alberti Karine Labadie

RNAseq et NGS. Adriana Alberti Karine Labadie RNAseq et NGS Séquençage et Diversité LES ORGANISMES EUCARYOTES animaux plantes champignons protistes BACTERIES ARCHEES VIRUS METAGENOMES LES SOURCES ADN GENOMIQUE ARN / cdna AMPLICONS BACs ET FOSMIDES

Plus en détail

Natixis Asset Management Response to the European Commission Green Paper on shadow banking

Natixis Asset Management Response to the European Commission Green Paper on shadow banking European Commission DG MARKT Unit 02 Rue de Spa, 2 1049 Brussels Belgium markt-consultation-shadow-banking@ec.europa.eu 14 th June 2012 Natixis Asset Management Response to the European Commission Green

Plus en détail

Silene latifolia (Caryophyllaceae) sex chromosome evolution

Silene latifolia (Caryophyllaceae) sex chromosome evolution Diss. ETH N 20391 Silene latifolia (Caryophyllaceae) sex chromosome evolution A dissertation submitted to ETH ZURICH for the degree of DOCTOR OF SCIENCES presented by Nicolas Blavet Master of Science in

Plus en détail

Photo: Sgt Serge Gouin, Rideau Hall Her Majesty The Queen in Right of Canada represented by the Office of the Secretary to the Governor General

Photo: Sgt Serge Gouin, Rideau Hall Her Majesty The Queen in Right of Canada represented by the Office of the Secretary to the Governor General As the father of five children and the grandfather of ten grandchildren, family is especially important to me. I am therefore very pleased to mark National Foster Family Week. Families, whatever their

Plus en détail

APPENDIX 6 BONUS RING FORMAT

APPENDIX 6 BONUS RING FORMAT #4 EN FRANÇAIS CI-DESSOUS Preamble and Justification This motion is being presented to the membership as an alternative format for clubs to use to encourage increased entries, both in areas where the exhibitor

Plus en détail

MAT 2377 Solutions to the Mi-term

MAT 2377 Solutions to the Mi-term MAT 2377 Solutions to the Mi-term Tuesday June 16 15 Time: 70 minutes Student Number: Name: Professor M. Alvo This is an open book exam. Standard calculators are permitted. Answer all questions. Place

Plus en détail

PROJET DE LOI C- BILL C- SECRET SECRET HOUSE OF COMMONS OF CANADA CHAMBRE DES COMMUNES DU CANADA

PROJET DE LOI C- BILL C- SECRET SECRET HOUSE OF COMMONS OF CANADA CHAMBRE DES COMMUNES DU CANADA SECRET C- SECRET C- First Session, Forty-first Parliament, Première session, quarante et unième législature, HOUSE OF COMMONS OF CANADA CHAMBRE DES COMMUNES DU CANADA BILL C- PROJET DE LOI C- An Act to

Plus en détail

Archived Content. Contenu archivé

Archived Content. Contenu archivé ARCHIVED - Archiving Content ARCHIVÉE - Contenu archivé Archived Content Contenu archivé Information identified as archived is provided for reference, research or recordkeeping purposes. It is not subject

Plus en détail

Kit d extraction PicoPure RNA

Kit d extraction PicoPure RNA Isoler des ARN même à partir d une cellule Le kit d extraction PicoPure RNA a été développé pour obtenir une haute qualité des ARNs totaux à partir d un minimum de dix cellules. Le haut rendement obtenu

Plus en détail

Assoumta Djimrangaye Coordonnatrice de soutien au développement des affaires Business development support coordinator

Assoumta Djimrangaye Coordonnatrice de soutien au développement des affaires Business development support coordinator 2008-01-28 From: [] Sent: Monday, January 21, 2008 6:58 AM To: Web Administrator BCUC:EX Cc: 'Jean Paquin' Subject: RE: Request for Late Intervenorship - BCHydro Standing Offer C22-1 Dear Bonnie, Please

Plus en détail

Réplication de l ADN

Réplication de l ADN Réplication de l ADN Réplication de l ADN: expériences historiques I] Expérience de Meselson et Stahl Replication de l ADN est semie-conservative Expérience de Meselson et Stahl :1958 -Cultive E.Coli sur

Plus en détail

Publication IEC 61000-4-3 (Edition 3.0 2008) I-SH 01

Publication IEC 61000-4-3 (Edition 3.0 2008) I-SH 01 Publication IEC 61000-4-3 (Edition 3.0 2008) I-SH 01 Electromagnetic compatibility (EMC) Part 4-3: Testing and measurement techniques Radiated, radio-frequency, electromagnetic field immunity test INTERPRETATION

Plus en détail

Sujet de TPE PROPOSITION

Sujet de TPE PROPOSITION Single photon source made of single nanodiamonds This project will consist in studying nanodiamonds as single photon sources. The student will study the emission properties of such systems and will show

Plus en détail

Chapitre 10 L isolement et la manipulation de gènes. Injection d ADN étranger dans une cellule animale

Chapitre 10 L isolement et la manipulation de gènes. Injection d ADN étranger dans une cellule animale Chapitre 10 L isolement et la manipulation de gènes Injection d ADN étranger dans une cellule animale Comment amplifier un gène d intérêt? Amplification in vivo à l aide du clonage d ADN L ensemble formé

Plus en détail

TD Révision BIO57. Connaissance et Technique du gène

TD Révision BIO57. Connaissance et Technique du gène TD Révision BIO57 Connaissance et Technique du gène Novembre 2007 Cécile BAUDOT cecile.baudot@medecine.univ-mrs.fr INSERM 910 «Génétique Médicale et Génomique Fonctionnelle» Maladies Neuromusculaires Le

Plus en détail

French 2208A. French for Healthcare Le français de la santé

French 2208A. French for Healthcare Le français de la santé French 2208A French for Healthcare Le français de la santé Professeur : Heures de bureau : Iryna Punko disponible tous les jours par courriel, sauf le week-end. Préalable - Fr 1900 E ou Fr 1910, ou permission

Plus en détail

Déterminants moléculaires et spécificité du Priming immunitaire chez le mollusque d eau douce Biomphalaria glabrata.

Déterminants moléculaires et spécificité du Priming immunitaire chez le mollusque d eau douce Biomphalaria glabrata. Délivré par UNIVERSITE DE PERPIGNAN VIA DOMITIA Préparée au sein de l école doctorale ED305 Energie et Environnement Et de l unité de recherche UMR5244 Ecologie et Evolution des Interactions Spécialité

Plus en détail

Product Platform Development: A Functional Approach Considering Customer Preferences

Product Platform Development: A Functional Approach Considering Customer Preferences Product Platform Development: A Functional Approach Considering Customer Preferences THÈSE N O 4536 (2009) PRÉSENTÉE le 4 décembre 2009 À LA FACULTé SCIENCES ET TECHNIQUES DE L'INGÉNIEUR LABORATOIRE DES

Plus en détail

RESULTING FROM THE ANTI-SEMITIC LEGISLATION IN FORCE DURING THE OCCUPATION. (Decree 99-778 of September 10, 1999) QUESTIONNAIRE. Family Name...

RESULTING FROM THE ANTI-SEMITIC LEGISLATION IN FORCE DURING THE OCCUPATION. (Decree 99-778 of September 10, 1999) QUESTIONNAIRE. Family Name... COMMISSION FOR THE COMPENSATION OF VICTIMS OF SPOLIATION RESULTING FROM THE ANTI-SEMITIC LEGISLATION IN FORCE DURING THE OCCUPATION (Decree 99-778 of September 10, 1999) Case Number : (to remind in all

Plus en détail

Photo Manipulations in the 2011 CES

Photo Manipulations in the 2011 CES Canadian Election Study Methodological Briefs Methodological Brief #2013-A Photo Manipulations in the 2011 CES Patrick Fournier, Université de Montréal Stuart Soroka, McGill University Fred Cutler, University

Plus en détail

6. Les désastres environnementaux sont plus fréquents. 7. On ne recycle pas ses déchets ménagers. 8. Il faut prendre une douche au lieu d un bain.

6. Les désastres environnementaux sont plus fréquents. 7. On ne recycle pas ses déchets ménagers. 8. Il faut prendre une douche au lieu d un bain. 1. Notre planète est menacée! 2. Il faut faire quelque chose! 3. On devrait faire quelque chose. 4. Il y a trop de circulation en ville. 5. L air est pollué. 6. Les désastres environnementaux sont plus

Plus en détail

Organisation de Coopération et de Développement Economiques Organisation for Economic Co-operation and Development. Bil.

Organisation de Coopération et de Développement Economiques Organisation for Economic Co-operation and Development. Bil. A usage officiel/for Official Use C(2006)34 C(2006)34 A usage officiel/for Official Use Organisation de Coopération et de Développement Economiques Organisation for Economic Co-operation and Development

Plus en détail

AMESD-Puma2010-EFTS- Configuration-update-TEN (en-fr)

AMESD-Puma2010-EFTS- Configuration-update-TEN (en-fr) AMESD-Puma2010-EFTS- Configuration-update-TEN (en-fr) Doc.No. : EUM/OPS/TEN/13/706466 Issue : v2 Date : 23 July 2013 WBS : EUMETSAT Eumetsat-Allee 1, D-64295 Darmstadt, Germany Tel: +49 6151 807-7 Fax:

Plus en détail

Forthcoming Database

Forthcoming Database DISS.ETH NO. 15802 Forthcoming Database A Framework Approach for Data Visualization Applications A dissertation submitted to the SWISS FEDERAL INSTITUTE OF TECHNOLOGY ZURICH for the degree of Doctor of

Plus en détail

C est quoi, Facebook?

C est quoi, Facebook? C est quoi, Facebook? Si tu as plus de 13 ans, tu fais peut-être partie des 750 millions de personnes dans le monde qui ont un compte Facebook? Et si tu es plus jeune, tu as dû entendre parler autour de

Plus en détail

Software Design Description

Software Design Description Software Design Description ABSTRACT: KEYWORDS: APPROVED: AUTHOR PROJECT MANAGER PRODUCT OWNER General information/recommendations A SDD provides a representation of a software system created to facilitate

Plus en détail

CONTRAT D ETUDES - LEARNING AGREEMENT

CONTRAT D ETUDES - LEARNING AGREEMENT CONTRAT D ETUDES - LEARNING AGREEMENT Règles générales La présence aux séances d enseignement des modules choisis est obligatoire. Chaque module comporte des séances de travail encadrées et non encadrées

Plus en détail

Quelques termes-clef de biologie moléculaire et leur définition

Quelques termes-clef de biologie moléculaire et leur définition Acide aminé (AA) Quelques termes-clef de biologie moléculaire et leur définition Isabelle Quinkal INRIA Rhône-Alpes Septembre 2003 Petite molécule dont l enchaînement compose les protéines - on dit qu

Plus en détail

Hydro-Québec Distribution

Hydro-Québec Distribution Hydro-Québec Distribution 2004 Distribution Tariff Application Demande R-3541-2004 Request No. 1 Reference: HQD-5, Document 3, Page 6 Information Requests HQD says that it will be required to buy energy

Plus en détail

Stress and Difficulties at School / College

Stress and Difficulties at School / College Stress and Difficulties at School / College This article will deal with the pressures and problems that students face at school and college. It will also discuss the opposite - the positive aspects of

Plus en détail

Application Form/ Formulaire de demande

Application Form/ Formulaire de demande Application Form/ Formulaire de demande Ecosystem Approaches to Health: Summer Workshop and Field school Approches écosystémiques de la santé: Atelier intensif et stage d été Please submit your application

Plus en détail

Photoactivatable Probes for Protein Labeling

Photoactivatable Probes for Protein Labeling Photoactivatable Probes for Protein Labeling THÈSE N O 4660 (2010) PRÉSENTÉE LE 26 MARS 2010 À LA FACULTÉ SCIENCES DE BASE LABORATOIRE D'INGÉNIERIE DES PROTÉINES PROGRAMME DOCTORAL EN CHIMIE ET GÉNIE CHIMIQUE

Plus en détail

CONVENTION FOR THE JOINT SUPERVISION OF THESIS - SAMPLE CONVENTION DE COTUTELLE DE THESE

CONVENTION FOR THE JOINT SUPERVISION OF THESIS - SAMPLE CONVENTION DE COTUTELLE DE THESE CONVENTION FOR THE JOINT SUPERVISION OF THESIS - SAMPLE CONVENTION DE COTUTELLE DE THESE (Note: This sample agreement will normally be initiated by the European/other partner institution on their proforma)

Plus en détail

SCHOLARSHIP ANSTO FRENCH EMBASSY (SAFE) PROGRAM 2015-2 APPLICATION FORM

SCHOLARSHIP ANSTO FRENCH EMBASSY (SAFE) PROGRAM 2015-2 APPLICATION FORM SCHOLARSHIP ANSTO FRENCH EMBASSY (SAFE) PROGRAM 2015-2 APPLICATION FORM APPLICATION FORM / FORMULAIRE DE CANDIDATURE Note: If there is insufficient space to answer a question, please attach additional

Plus en détail

CONVENTION DE COTUTELLE DE THESE AGREEMENT FOR THE JOINT SUPERVISION OF DOCTORATES. L Université... The University of. Adresse complète / pays...

CONVENTION DE COTUTELLE DE THESE AGREEMENT FOR THE JOINT SUPERVISION OF DOCTORATES. L Université... The University of. Adresse complète / pays... CONVENTION DE COTUTELLE DE THESE AGREEMENT FOR THE JOINT SUPERVISION OF DOCTORATES Entre/ Between, L École des Hautes Études en Sciences Sociales 190-198 avenue de France 75013 Paris représentée par son

Plus en détail

Initiative d excellence de l université de Bordeaux. Réunion du Comité stratégique 17-19 décembre 2014. Recommandations

Initiative d excellence de l université de Bordeaux. Réunion du Comité stratégique 17-19 décembre 2014. Recommandations Initiative d excellence de l université de Bordeaux Réunion du Comité stratégique 17-19 décembre 2014 Recommandations 2/1 RECOMMANDATIONS DU COMITE STRATEGIQUE Une feuille de route pour le conseil de gestion

Plus en détail

Fiche d Inscription / Entry Form

Fiche d Inscription / Entry Form Fiche d Inscription / Entry Form (A renvoyer avant le 15 octobre 2014 Deadline octobrer 15th 2014) Film Institutionnel / Corporate Film Film Marketing Produit / Marketing Product film Film Communication

Plus en détail

2002 Maritime Mathematics Competition Concours de Mathématiques des Maritimes 2002

2002 Maritime Mathematics Competition Concours de Mathématiques des Maritimes 2002 2002 Maritime Mathematics Competition Concours de Mathématiques des Maritimes 2002 Instructions: Directives : 1 Provide the information requested below Veuillez fournir les renseignements demandés ci-dessous

Plus en détail

L3-BH01 Cours n 10 Modifications post-transcriptionnelles

L3-BH01 Cours n 10 Modifications post-transcriptionnelles L3-BH01 Cours n 10 Modifications post-transcriptionnelles Ce cours est présent sur le web à l adresse suivante : http://www.univ-orleans.fr/sciences/biochimie/l/ressources.htm Plan (cours n 10 & 11) Introduction

Plus en détail

Le contrôle qualité sur les données fastq

Le contrôle qualité sur les données fastq Le contrôle qualité sur les données fastq TP detection exome Plan Théorie 1: le format FastQ et l'encodage des qualités Session pratique 1: conversion des qualités (fichier illumina.fastq) Théorie 2: le

Plus en détail

EOIS Service Provider Connect Service Provider User Guide. Chapter 4: Service Provider Management

EOIS Service Provider Connect Service Provider User Guide. Chapter 4: Service Provider Management EOIS Service Provider Connect Service Provider User Guide Chapter 4: Service Provider Management Version: 1.0 October, 2015 Document Versions Version # Date Description V 1.0 September 2015 First version

Plus en détail

Regulation of isoprenoid synthesis in Arabidopsis thaliana analysis of the GGPP branchpoint

Regulation of isoprenoid synthesis in Arabidopsis thaliana analysis of the GGPP branchpoint DISS. ETH NO. 20230 Regulation of isoprenoid synthesis in Arabidopsis thaliana analysis of the GGPP branchpoint A dissertation submitted to the ETH Zürich For the degree of Doctor of Sciences Presented

Plus en détail

David Marsden Labour market segmentation in Britain: the decline of occupational labour markets and the spread of entry tournaments

David Marsden Labour market segmentation in Britain: the decline of occupational labour markets and the spread of entry tournaments David Marsden Labour market segmentation in Britain: the decline of occupational labour markets and the spread of entry tournaments Article (Accepted version) (Refereed) Original citation: Marsden, David

Plus en détail

Mesure Measurement Réf 322 033 Etiquettes Terre, Jupiter, Mars, Français p 1 Lune pour dynamomètre 10 N English p 4 Earth, Jupiter, Mars, Moon,

Mesure Measurement Réf 322 033 Etiquettes Terre, Jupiter, Mars, Français p 1 Lune pour dynamomètre 10 N English p 4 Earth, Jupiter, Mars, Moon, Mesure Measurement Français p 1 English p 4 Version : 8006 Etiquettes Terre, Jupiter, Mars, Lune pour dynamomètre 10 N Earth, Jupiter, Mars, Moon, labels for 10 N dynamometer Mesure Etiquettes Terre, Jupiter,

Plus en détail

AMESD-Puma2010-EFTS- Configuration-update-TEN (en-fr)

AMESD-Puma2010-EFTS- Configuration-update-TEN (en-fr) AMESD-Puma2010-EFTS- Configuration-update-TEN (en-fr) Doc.No. : EUM/OPS/TEN/13/706466 Issue : v3 Date : 7 May 2014 WBS : EUMETSAT Eumetsat-Allee 1, D-64295 Darmstadt, Germany Tel: +49 6151 807-7 Fax: +49

Plus en détail

Autres termes clés (Other key terms)

Autres termes clés (Other key terms) Carve-out method Autres termes clés (Other key terms) Norme Rapports d assurance sur les contrôles d une société de services extérieurs (, Assurance Reports on Controls at a Third Party Service Organization)

Plus en détail

Formation en conduite et gestion de projets. Renforcer les capacités des syndicats en Europe

Formation en conduite et gestion de projets. Renforcer les capacités des syndicats en Europe Formation en conduite et gestion de projets Renforcer les capacités des syndicats en Europe Pourquoi la gestion de projets? Le département Formation de l Institut syndical européen (ETUI, European Trade

Plus en détail

Appendix 1 Wording of Noumea Accord and 1999 Organic Law on Restricted Electorates

Appendix 1 Wording of Noumea Accord and 1999 Organic Law on Restricted Electorates Appendix 1 Wording of Noumea Accord and 1999 Organic Law on Restricted Electorates Relating to local (provincial and Congress) elections Article 2.2.1 of the Noumea Accord: le corps électoral aux assemblées

Plus en détail

Diss. ETH No. 18521. Prof. Dr. Wilhelm Gruissem, examiner Dr. John Beeching, co-examiner Dr. Peng Zhang, co-examiner

Diss. ETH No. 18521. Prof. Dr. Wilhelm Gruissem, examiner Dr. John Beeching, co-examiner Dr. Peng Zhang, co-examiner Diss. ETH No. 18521 Molecular and Biochemical Understanding of Post-harvest Physiological Deterioration in Cassava Roots and Approaches for its Modulation A dissertation submitted to the ETH Zurich for

Plus en détail

(Programme de formation pour les parents ~ Training program for parents)

(Programme de formation pour les parents ~ Training program for parents) PODUM-INFO-ACTION (PIA) La «carte routière» pour les parents, sur l éducation en langue française en Ontario A «road map» for parents, on French-language education in Ontario (Programme de formation pour

Plus en détail

Enzymein Higher Plants

Enzymein Higher Plants Diss.ETH N. 15732 FunctionalAnalysisofInsulin-Degrading Enzymein Higher Plants A dissertation submittedto the SWISS FEDERALINSTITUTE OF TECHNOLOGY ZÜRICH for the degreeof DOCTOR ofnaturalsciences Presented

Plus en détail

Informations principales / Main information

Informations principales / Main information Fiche d Inscription Entry Form À renvoyer avant le 15 Octobre 2015 Deadline October 15th 2015 Dans quelle catégorie participez-vous? In what category do you participate? Institutionnel / Corporate Marketing

Plus en détail

Embedded Domain-Specific Languages using Libraries and Dynamic Metaprogramming

Embedded Domain-Specific Languages using Libraries and Dynamic Metaprogramming Embedded Domain-Specific Languages using Libraries and Dynamic Metaprogramming THÈSE N O 5007 (2011) PRÉSENTÉE le 20 mai 2011 À LA FACULTÉ INFORMATIQUE ET COMMUNICATIONS LABORATOIRE DE MÉTHODES DE PROGRAMMATION

Plus en détail

Exemple PLS avec SAS

Exemple PLS avec SAS Exemple PLS avec SAS This example, from Umetrics (1995), demonstrates different ways to examine a PLS model. The data come from the field of drug discovery. New drugs are developed from chemicals that

Plus en détail

Editing and managing Systems engineering processes at Snecma

Editing and managing Systems engineering processes at Snecma Editing and managing Systems engineering processes at Snecma Atego workshop 2014-04-03 Ce document et les informations qu il contient sont la propriété de Ils ne doivent pas être copiés ni communiqués

Plus en détail

Les objets de l évolution :

Les objets de l évolution : Les objets de l évolution : éléments de biologie cellulaire Table des matières Les 3 règnes et leurs spécificitéss Les cellules procaryotes Les cellules eucaryotes Les cellules végétales Les cellules de

Plus en détail

Bibliothèque numérique de l enssib

Bibliothèque numérique de l enssib Bibliothèque numérique de l enssib European integration: conditions and challenges for libraries, 3 au 7 juillet 2007 36 e congrès LIBER Results from the Seminar on Measuring Quality in Libraries Bayir,

Plus en détail

Florida International University. Department of Modern Languages. FRENCH I Summer A Term 2014 FRE 1130 - U01A

Florida International University. Department of Modern Languages. FRENCH I Summer A Term 2014 FRE 1130 - U01A Florida International University Department of Modern Languages FRENCH I Summer A Term 2014 FRE 1130 - U01A Class time: Monday, Tuesday, Wednesday, Thursday; 6:20 P.M. - 9:00 P.M. Instructors: Prof. Jean-Robert

Plus en détail

Fiche d Inscription / Entry Form

Fiche d Inscription / Entry Form Fiche d Inscription / Entry Form Catégories - Category Film Institutionnel / Corporate Film Film Marketing Produit / Marketing Product film Film Communication Interne / Internal Communication film Film

Plus en détail

Association des Doctorants du campus STIC. Séminaires doctorants 11

Association des Doctorants du campus STIC. Séminaires doctorants 11 Association des Doctorants du campus STIC Séminaires doctorants 11 07 mars 2007 Actes édités par l association des doctorants du campus STIC. Les travaux individuels publiés restent l unique propriété

Plus en détail

COUNCIL OF THE EUROPEAN UNION. Brussels, 18 September 2008 (19.09) (OR. fr) 13156/08 LIMITE PI 53

COUNCIL OF THE EUROPEAN UNION. Brussels, 18 September 2008 (19.09) (OR. fr) 13156/08 LIMITE PI 53 COUNCIL OF THE EUROPEAN UNION Brussels, 18 September 2008 (19.09) (OR. fr) 13156/08 LIMITE PI 53 WORKING DOCUMENT from : Presidency to : delegations No prev. doc.: 12621/08 PI 44 Subject : Revised draft

Plus en détail

Doctorat ParisTech T H È S E. l École Nationale Supérieure d'arts et Métiers

Doctorat ParisTech T H È S E. l École Nationale Supérieure d'arts et Métiers N : 2009 ENAM XXXX École doctorale n 432 : Science des Métiers de l Ingénieur 2012-ENAM-00XX Doctorat ParisTech T H È S E pour obtenir le grade de docteur délivré par l École Nationale Supérieure d'arts

Plus en détail

Net-université 2008-1-IS1-LEO05-00110. http://www.adam-europe.eu/adam/project/view.htm?prj=5095

Net-université 2008-1-IS1-LEO05-00110. http://www.adam-europe.eu/adam/project/view.htm?prj=5095 Net-université 2008-1-IS1-LEO05-00110 1 Information sur le projet Titre: Code Projet: Année: 2008 Type de Projet: Statut: Accroche marketing: Net-université 2008-1-IS1-LEO05-00110 Projets de transfert

Plus en détail

S-9.05 Small Business Investor Tax Credit Act 2003-39 RÈGLEMENT DU NOUVEAU-BRUNSWICK 2003-39 NEW BRUNSWICK REGULATION 2003-39. établi en vertu de la

S-9.05 Small Business Investor Tax Credit Act 2003-39 RÈGLEMENT DU NOUVEAU-BRUNSWICK 2003-39 NEW BRUNSWICK REGULATION 2003-39. établi en vertu de la NEW BRUNSWICK REGULATION 2003-39 under the SMALL BUSINESS INVESTOR TAX CREDIT ACT (O.C. 2003-220) Regulation Outline Filed July 29, 2003 Citation........................................... 1 Definition

Plus en détail

that the child(ren) was/were in need of protection under Part III of the Child and Family Services Act, and the court made an order on

that the child(ren) was/were in need of protection under Part III of the Child and Family Services Act, and the court made an order on ONTARIO Court File Number at (Name of court) Court office address Applicant(s) (In most cases, the applicant will be a children s aid society.) Full legal name & address for service street & number, municipality,

Plus en détail

Plateforme Transcriptome Végétale

Plateforme Transcriptome Végétale Plateforme Transcriptome Végétale INRA- Unité de Recherche en Génomique Végétale Journée «Plateformes Génopole», 25 juin 2013. Sandrine Balzergue, balzerg@evry.inra.fr Analyse quan8ta8ve de l expression

Plus en détail

CHAPITRE III: Le Clonage

CHAPITRE III: Le Clonage BIOLOGIE MOLECULAIRE CHAPITRE III: Le Clonage I) Définition: Cloner un fragment d'adn consiste à: isoler physiquement ce fragment. en augmenter le nombre de copie (cf: amplification) II) Principe: Le clonage

Plus en détail

Le passé composé. C'est le passé! Tout ça c'est du passé! That's the past! All that's in the past!

Le passé composé. C'est le passé! Tout ça c'est du passé! That's the past! All that's in the past! > Le passé composé le passé composé C'est le passé! Tout ça c'est du passé! That's the past! All that's in the past! «Je suis vieux maintenant, et ma femme est vieille aussi. Nous n'avons pas eu d'enfants.

Plus en détail

The evolution and consequences of the EU Emissions Trading System (EU ETS)

The evolution and consequences of the EU Emissions Trading System (EU ETS) The evolution and consequences of the EU Emissions Trading System (EU ETS) Jon Birger Skjærseth Montreal 27.10.08 reproduction doivent être acheminées à Copibec (reproduction papier) Introduction What

Plus en détail

LOI SUR LE FONDS DU PATRIMOINE DES TERRITOIRES DU NORD-OUEST NORTHWEST TERRITORIES HERITAGE FUND ACT

LOI SUR LE FONDS DU PATRIMOINE DES TERRITOIRES DU NORD-OUEST NORTHWEST TERRITORIES HERITAGE FUND ACT NORTHWEST TERRITORIES HERITAGE FUND ACT NORTHWEST TERRITORIES HERITAGE FUND REGULATIONS R-008-2013 AMENDED BY LOI SUR LE FONDS DU PATRIMOINE DES TERRITOIRES DU NORD-OUEST RÈGLEMENT SUR LE FONDS DU PATRIMOINE

Plus en détail

Loi sur le point de service principal du gouvernement du Canada en cas de décès

Loi sur le point de service principal du gouvernement du Canada en cas de décès CANADA CONSOLIDATION CODIFICATION Main Point of Contact with the Government of Canada in case of Death Act Loi sur le point de service principal du gouvernement du Canada en cas de décès S.C. 2015, c.

Plus en détail

Niveau débutant/beginner Level

Niveau débutant/beginner Level LE COFFRE À OUTILS/THE ASSESSMENT TOOLKIT: Niveau débutant/beginner Level Sampler/Echantillon Instruments d évaluation formative en français langue seconde Formative Assessment Instruments for French as

Plus en détail

Appendix C CRITERIA FOR A PROFESSIONAL GROWTH PLAN SUPERVISION OF PROFESSIONAL STAFF: TEACHER EVALUATION GCNA

Appendix C CRITERIA FOR A PROFESSIONAL GROWTH PLAN SUPERVISION OF PROFESSIONAL STAFF: TEACHER EVALUATION GCNA SUPERVISION OF PROFESSIONAL STAFF: TEACHER EVALUATION Appendix C CRITERIA FOR A PROFESSIONAL GROWTH PLAN A Professional Growth Plan is a written statement describing a teacher s intended focus for professional

Plus en détail

CATO 55-04 OAIC 55-04. a. squadron music training; a. instruction musicale à l'escadron;

CATO 55-04 OAIC 55-04. a. squadron music training; a. instruction musicale à l'escadron; GENERAL MUSIC BADGES POLICY 1. Air Cadet music training is conducted in accordance with CATO 14-22, Technical Standards for Cadet Musicians. Air Cadet music training is divided as follows: POLITIQUE SUR

Plus en détail

Haslingden High School French Y8 Block C Set 1 HOMEWORK BOOKLET

Haslingden High School French Y8 Block C Set 1 HOMEWORK BOOKLET Haslingden High School French Y8 Block C Set 1 HOMEWORK BOOKLET Name: Form: Subject Teacher: Date Given: Date to Hand in: Level: Effort: House Points: Comment: Target: Parent / Guardian Comment: Complete

Plus en détail

Photo: Sgt Serge Gouin, Rideau Hall Her Majesty The Queen in Right of Canada represented by the Office of the Secretary to the Governor General

Photo: Sgt Serge Gouin, Rideau Hall Her Majesty The Queen in Right of Canada represented by the Office of the Secretary to the Governor General One of the pillars of my mandate as governor general of Canada is supporting families and children. This is just one of the reasons why my wife, Sharon, and I are delighted to extend greetings to everyone

Plus en détail

Université de XY University of XY. Faculté XY Faculty of XY

Université de XY University of XY. Faculté XY Faculty of XY Université de XY University of XY Faculté XY Faculty of XY Le présent supplément au diplôme suit le modèle élaboré par la Commission européenne, le Conseil d'europe et l'unesco/cepes. Le supplément vise

Plus en détail

AINoE. Rapport sur l audition d AINoE Paris, 18 juin 2003

AINoE. Rapport sur l audition d AINoE Paris, 18 juin 2003 AINoE Abstract Interpretation Network of Excellence Patrick COUSOT (ENS, Coordinator) Rapport sur l audition d AINoE Paris, 18 juin 2003 Thématique Rapport sur l audition d AINoE Paris, 18 juin 2003 1

Plus en détail

openoffice 40 manual

openoffice 40 manual openoffice 40 manual Print and Online Should you be particular with knowing everything concerning this openoffice 40 manual, you have to look for these details. OPENOFFICE 40 MANUAL Here are one of the

Plus en détail

Electronic Documents (Cooperative Credit Associations) Regulations. Règlement sur les documents électroniques (associations coopératives de crédit)

Electronic Documents (Cooperative Credit Associations) Regulations. Règlement sur les documents électroniques (associations coopératives de crédit) CANADA CONSOLIDATION CODIFICATION Electronic Documents (Cooperative Credit Associations) Regulations Règlement sur les documents électroniques (associations coopératives de crédit) SOR/2010-242 DORS/2010-242

Plus en détail

Construire son projet : Rédiger la partie impacts (2/4) Service Europe Direction des Programmes et de la Formation pour le Sud

Construire son projet : Rédiger la partie impacts (2/4) Service Europe Direction des Programmes et de la Formation pour le Sud Construire son projet : Rédiger la partie impacts (2/4) Service Europe Direction des Programmes et de la Formation pour le Sud Sommaire Construire son projet : Rédiger la partie impacts (2/4) Comment définir

Plus en détail

Academic Project. B3 - Architecture. Resit Project. Version 1.0 Last update: 24/05/2013 Use: Students Author: Samuel CUELLA

Academic Project. B3 - Architecture. Resit Project. Version 1.0 Last update: 24/05/2013 Use: Students Author: Samuel CUELLA SUPINFO Academic Dept. Resit Project Academic Project 2012-2013 Version 1.0 Last update: 24/05/2013 Use: Students Author: Samuel CUELLA Conditions d utilisations : SUPINFO International University vous

Plus en détail

Grant Application form

Grant Application form The New Zealand-South Pacific District Kiwanis Foundation Trust Regn No: CC20665 L'Association Fondation Kiwanis du District de Nouvelle-Zélande Sud Pacifique Texte français peut être trouvé sur la deuxième

Plus en détail

Filière SVI - S6 Module de Génétique et Biologie Moléculaire M21 Elément 2: Biologie Moléculaire l -Pr. Abdelkarim FILALI-MALTOUF

Filière SVI - S6 Module de Génétique et Biologie Moléculaire M21 Elément 2: Biologie Moléculaire l -Pr. Abdelkarim FILALI-MALTOUF Laboratoire de Microbiologie et Biologie Moléculaire Faculté des Sciences - Rabat Filière SVI - S6 Module de Génétique et Biologie Moléculaire M21 Elément 2: Biologie Moléculaire l -Pr. Abdelkarim FILALI-MALTOUF

Plus en détail

IS/07/TOI/164004. http://www.adam-europe.eu/adam/project/view.htm?prj=6140

IS/07/TOI/164004. http://www.adam-europe.eu/adam/project/view.htm?prj=6140 La vente au détail - RetAiL est un cours fondé sur la technologie de l information, un IS/07/TOI/164004 1 Information sur le projet La vente au détail - RetAiL est un cours fondé sur la technologie de

Plus en détail

AccessLearn Community Group: Introductory Survey. Groupe communautaire AccessLearn : étude introductive. Introduction.

AccessLearn Community Group: Introductory Survey. Groupe communautaire AccessLearn : étude introductive. Introduction. AccessLearn Community Group: Introductory Survey Introduction The W3C Accessible Online Learning Community Group (aka AccessLearn) is a place to discuss issues relating to accessibility and online learning,

Plus en détail

Eléments primordiaux de biologie moléculaire

Eléments primordiaux de biologie moléculaire Eléments primordiaux de biologie moléculaire Pourquoi s intéresser au matériel génétique? Base de l information génétique Tissu Cellule Noyau Organisme entier Lieu où est localisé l ADN Mol d ADN qui est

Plus en détail

Instructions Mozilla Thunderbird Page 1

Instructions Mozilla Thunderbird Page 1 Instructions Mozilla Thunderbird Page 1 Instructions Mozilla Thunderbird Ce manuel est écrit pour les utilisateurs qui font déjà configurer un compte de courrier électronique dans Mozilla Thunderbird et

Plus en détail

AMENDMENT TO BILL 32 AMENDEMENT AU PROJET DE LOI 32

AMENDMENT TO BILL 32 AMENDEMENT AU PROJET DE LOI 32 THAT the proposed clause 6(1), as set out in Clause 6(1) of the Bill, be replaced with the following: Trustee to respond promptly 6(1) A trustee shall respond to a request as promptly as required in the

Plus en détail

Règlement sur les prestations de retraite supplémentaires. Supplementary Retirement Benefits Regulations

Règlement sur les prestations de retraite supplémentaires. Supplementary Retirement Benefits Regulations CANADA CONSOLIDATION CODIFICATION Supplementary Retirement Benefits Regulations Règlement sur les prestations de retraite supplémentaires C.R.C., c. 1511 C.R.C., ch. 1511 Current to December 10, 2015 À

Plus en détail

LA TRANSCRIPTION. Introduction. I. Modalité générale de la transcription. II. Transcription chez les Procaryotes

LA TRANSCRIPTION. Introduction. I. Modalité générale de la transcription. II. Transcription chez les Procaryotes LA TRANSCRIPTION Introduction I. Modalité générale de la transcription II. Transcription chez les Procaryotes 1. L'ARN polymérase 2. Etapes de la transcription a. Initiation b. Elongation c. Terminaison

Plus en détail

Security Materials Technology Roadmap (SMTRM) Steering Committee Application Template

Security Materials Technology Roadmap (SMTRM) Steering Committee Application Template Security Materials Technology Roadmap (SMTRM) Steering Committee Application Template Date Full Name Organization Address Phone E-mail Selection criteria Mandatory criteria Company products include vehicle

Plus en détail

Promotion of bio-methane and its market development through local and regional partnerships. A project under the Intelligent Energy Europe programme

Promotion of bio-methane and its market development through local and regional partnerships. A project under the Intelligent Energy Europe programme Promotion of bio-methane and its market development through local and regional partnerships A project under the Intelligent Energy Europe programme Contract Number: IEE/10/130 Deliverable Reference: W.P.2.1.3

Plus en détail

Experiences TCM QUALITY MARK. Project management Management systems ISO 9001 ISO 14001 ISO 22000

Experiences TCM QUALITY MARK. Project management Management systems ISO 9001 ISO 14001 ISO 22000 TCM QUALITY MARK Jean-Marc Bachelet Tocema Europe workshop 4 Project management Management systems ISO 9001 ISO 14001 ISO 22000 + lead auditors for certification bodies Experiences Private and state companies,

Plus en détail

Contrôle de l'expression génétique : Les régulations post-transcriptionnelles

Contrôle de l'expression génétique : Les régulations post-transcriptionnelles Contrôle de l'expression génétique : Les régulations post-transcriptionnelles http://perso.univ-rennes1.fr/serge.hardy/ utilisateur : biochimie mot de passe : 2007 L'ARNm, simple intermédiaire entre le

Plus en détail