The Exploration of HIV Fitness Landscapes



Documents pareils
Forthcoming Database

Exemple PLS avec SAS

THÈSE. présentée à TÉLÉCOM PARISTECH. pour obtenir le grade de. DOCTEUR de TÉLÉCOM PARISTECH. Mention Informatique et Réseaux. par.

COUNCIL OF THE EUROPEAN UNION. Brussels, 18 September 2008 (19.09) (OR. fr) 13156/08 LIMITE PI 53

RÉSUMÉ DE THÈSE. L implantation des systèmes d'information (SI) organisationnels demeure une tâche difficile

APPENDIX 6 BONUS RING FORMAT

Analysis of Water Transport in Polymer Electrolyte Fuel Cells using Neutron Imaging

PIB : Définition : mesure de l activité économique réalisée à l échelle d une nation sur une période donnée.

NORME INTERNATIONALE INTERNATIONAL STANDARD. Dispositifs à semiconducteurs Dispositifs discrets. Semiconductor devices Discrete devices

Improving the breakdown of the Central Credit Register data by category of enterprises

INSTITUT MARITIME DE PREVENTION. For improvement in health and security at work. Created in 1992 Under the aegis of State and the ENIM

Practice Direction. Class Proceedings

Tex: The book of which I'm the author is an historical novel.

Natixis Asset Management Response to the European Commission Green Paper on shadow banking

SMALL CITY COMMERCE (EL PEQUEÑO COMERCIO DE LAS PEQUEÑAS CIUDADES)

RAPID Prenez le contrôle sur vos données

Comprendre l impact de l utilisation des réseaux sociaux en entreprise SYNTHESE DES RESULTATS : EUROPE ET FRANCE

L OBSERVATOIRE DE LA BIOLOGIE DE SYNTHESE SYNTHETIC BIOLOGY OBSERVATORY

L ESPACE À TRAVERS LE REGARD DES FEMMES. European Economic and Social Committee Comité économique et social européen

Photoactivatable Probes for Protein Labeling

Application Form/ Formulaire de demande

DOCUMENTATION - FRANCAIS... 2

UNIVERSITY OF MALTA FACULTY OF ARTS. French as Main Area in an ordinary Bachelor s Degree

Instructions Mozilla Thunderbird Page 1

that the child(ren) was/were in need of protection under Part III of the Child and Family Services Act, and the court made an order on

CLIM/GTP/27/8 ANNEX III/ANNEXE III. Category 1 New indications/ 1 re catégorie Nouvelles indications

INDIVIDUALS AND LEGAL ENTITIES: If the dividends have not been paid yet, you may be eligible for the simplified procedure.

Préconisations pour une gouvernance efficace de la Manche. Pathways for effective governance of the English Channel

Data issues in species monitoring: where are the traps?

English Q&A #1 Braille Services Requirement PPTC Q1. Would you like our proposal to be shipped or do you prefer an electronic submission?

VTP. LAN Switching and Wireless Chapitre 4

PRACTICE DIRECTION ON THE LENGTH OF BRIEFS AND MOTIONS ON APPEAL

«Rénovation des curricula de l enseignement supérieur - Kazakhstan»

RISK-BASED TRANSPORTATION PLANNING PRACTICE: OVERALL METIIODOLOGY AND A CASE EXAMPLE"' RESUME

La solution idéale de personnalisation interactive sur internet

CONVENTION DE STAGE TYPE STANDART TRAINING CONTRACT

An Ontology-Based Approach for Closed-Loop Product Lifecycle Management

BNP Paribas Personal Finance

Règlement relatif à l examen fait conformément à la Déclaration canadienne des droits. Canadian Bill of Rights Examination Regulations CODIFICATION

: Machines Production a créé dès 1995, le site internet

1.The pronouns me, te, nous, and vous are object pronouns.

Discours du Ministre Tassarajen Pillay Chedumbrum. Ministre des Technologies de l'information et de la Communication (TIC) Worshop on Dot.

ETABLISSEMENT D ENSEIGNEMENT OU ORGANISME DE FORMATION / UNIVERSITY OR COLLEGE:

Mon Service Public - Case study and Mapping to SAML/Liberty specifications. Gaël Gourmelen - France Telecom 23/04/2007

WEB page builder and server for SCADA applications usable from a WEB navigator

Integrated Music Education: Challenges for Teaching and Teacher Training Presentation of a Book Project

L. Obert, T. Lascar, A. Adam

AIDE FINANCIÈRE POUR ATHLÈTES FINANCIAL ASSISTANCE FOR ATHLETES

Cheque Holding Policy Disclosure (Banks) Regulations. Règlement sur la communication de la politique de retenue de chèques (banques) CONSOLIDATION

RULE 5 - SERVICE OF DOCUMENTS RÈGLE 5 SIGNIFICATION DE DOCUMENTS. Rule 5 / Règle 5

Quick Start Guide This guide is intended to get you started with Rational ClearCase or Rational ClearCase MultiSite.

LOI SUR LA RECONNAISSANCE DE L'ADOPTION SELON LES COUTUMES AUTOCHTONES ABORIGINAL CUSTOM ADOPTION RECOGNITION ACT

The new consumables catalogue from Medisoft is now updated. Please discover this full overview of all our consumables available to you.

AUDIT COMMITTEE: TERMS OF REFERENCE

MONTRÉAL LA CONFORTABLE MC

Formulaire de candidature pour les bourses de mobilité internationale niveau Master/ Application Form for International Master Scholarship Programme

DOCUMENTATION MODULE BLOCKCATEGORIESCUSTOM Module crée par Prestacrea - Version : 2.0

Fédération Internationale de Handball. b) Règlement du but

Les contraintes de financement des PME en Afrique : le rôle des registres de crédit

REMOTE DATA ACQUISITION OF EMBEDDED SYSTEMS USING INTERNET TECHNOLOGIES: A ROLE-BASED GENERIC SYSTEM SPECIFICATION

DOCUMENTATION - FRANCAIS... 2

Nouveautés printemps 2013

Quatre axes au service de la performance et des mutations Four lines serve the performance and changes

Marie Curie Individual Fellowships. Jean Provost Marie Curie Postdoctoral Fellow, Institut Langevin, ESCPI, INSERM, France

Credit Note and Debit Note Information (GST/ HST) Regulations

Judge Group: P Title: Quel est meilleur: le compost ou le fertilisant chimique? Student(s): Emma O'Shea Grade: 6

THE EVOLUTION OF CONTENT CONSUMPTION ON MOBILE AND TABLETS

Form of Deeds Relating to Certain Successions of Cree and Naskapi Beneficiaries Regulations

IDENTITÉ DE L ÉTUDIANT / APPLICANT INFORMATION

Mise en place d un système de cabotage maritime au sud ouest de l Ocean Indien. 10 Septembre 2012

Les doutes et les questions des économistes face au système des brevets

RETHINKING JACQUES ELLUL AND THE TECHNOLOGICAL SOCIETY IN THE 21ST CENTURY REPENSER JACQUES ELLUL ET LA SOCIETE TECHNICIENNE AU 21EME SIECLE

CONFERENCE PALISADE. Optimisation robuste d un plan d expériences par simulation Monte-Carlo Concepts de «Design Space» et de «Quality by Design»

Project 1 Experimenting with Simple Network Management Tools. ping, traceout, and Wireshark (formerly Ethereal)

Consultation Report / Rapport de consultation REGDOC-2.3.3, Periodic Safety Reviews / Bilans périodiques de la sûreté

First Nations Assessment Inspection Regulations. Règlement sur l inspection aux fins d évaluation foncière des premières nations CONSOLIDATION

APPENDIX 2. Provisions to be included in the contract between the Provider and the. Holder

INSTRUCTIONS. Comment compléter le formulaire. How to complete this form. Instructions

BILL 203 PROJET DE LOI 203

Le No.1 de l économie d énergie pour patinoires.

Railway Operating Certificate Regulations. Règlement sur les certificats d exploitation de chemin de fer CODIFICATION CONSOLIDATION

Face Recognition Performance: Man vs. Machine

Présentation par François Keller Fondateur et président de l Institut suisse de brainworking et M. Enga Luye, CEO Belair Biotech

Projet de réorganisation des activités de T-Systems France

THE SUBJUNCTIVE MOOD. Twenty-nineth lesson Vingt-neuvième leçon

ÉVALUATION PRIMAIRE D UN SYSTÈME D AIDE AU CONTRÔLE AÉRIEN EN ROUTE

MEMORANDUM POUR UNE DEMANDE DE BOURSE DE RECHERCHE DOCTORALE DE LA FONDATION MARTINE AUBLET

I. Programmation I. 1 Ecrire un programme en Scilab traduisant l organigramme montré ci-après (on pourra utiliser les annexes):

Small Businesses support Senator Ringuette s bill to limit credit card acceptance fees

ONTARIO Court File Number. Form 17E: Trial Management Conference Brief. Date of trial management conference. Name of party filing this brief

Les nouveaux concepts de gestion de la qualité pharmaceutique ICH Q8, Q9 et Q10

Must Today s Risk Be Tomorrow s Disaster? The Use of Knowledge in Disaster Risk Reduction

Qualité de la conception de tests logiciels : plate-forme de conception et processus de test

Stratégie DataCenters Société Générale Enjeux, objectifs et rôle d un partenaire comme Data4

IPSAS 32 «Service concession arrangements» (SCA) Marie-Pierre Cordier Baudouin Griton, IPSAS Board

Algorithmes de recommandation, Cours Master 2, février 2011

Relions les hommes à l entreprise Linking people to companies

Compte-rendu technique complet et détaillé des cookies

Scénarios économiques en assurance

Transcription:

Diss. ETH No. 20486 The Exploration of HIV Fitness Landscapes A dissertation submitted to ETH Zurich for the degree of Doctor of Sciences presented by João Zambujo Ramos Martins Dipl.-Ing. INSA Lyon, France born October 3, 1983 citizen of Portugal accepted on the recommendation of Prof. Dr. Sebastian Bonhoffer, examiner Prof. Dr. Christoph Adami, co-examiner 2012

Abstract One of the aims of systems biology is to decode genetic sequences in terms of biological activity and phenotypic expression. In particular, to describe evolutionary processes, it is important to characterize the fitness of organisms as a function of the genetic space they can explore. In other words, it is important to characterize the fitness landscape on which evolution takes place. Many theoretical studies in evolutionary biology have assumed simplistic fitness functions to be able to study the evolutionary process. This thesis however, explores and describes a fitness landscape based on real invitro fitness of HIV experimental data. Background knowledge about the data is presented in chapter 1. In addition, this chapter also introduces two individual mutation-based models of the fitness landscape used in chapters 2 and 3. One, the main effects (ME) model, includes the estimates of the fitness effects of individual amino acid variants; whereas the other, the main and epistatic effects (MEEP) model, also accommodates the estimates of the pairwise epistatic interactions. The details of the fitting and the performance of the models are presented in the appendix A. Most importantly, the two individual mutation-based models of the fitness landscape are a great tool to investigate the roles of epistasis and pleiotropy. Chapter 2 explores three complementary visual representations of the fitness landscape. One provides a polynomial surface fitting of the experimental fitness values of the viral sequences, represented by points in a plane and placed such that the information about the number of amino acid mutations between the sequences is maximally conserved. The second representation renders the fitness landscape as a network where edges link neighboring sequences and the size of the nodes accounts for fitness. The third representation uses the MEEP model to generate a three dimensional fitness surface based on a grid of 1-mutation neighboring sequences incorporating the most frequent individual mutations. All three representations indicate a high level of local ruggedness and support Kauffman s massif central hypothesis which states that high fitness genotypes tend to be close to each other. Most importantly, they show that low-dimensional fitness maps can still capture important features of complex fitness landscapes. Chapter 3 uses the ME and the MEEP fitness landscape models to simulate the evolution of HIV populations and study the maintenance of genetic recombination, one of the most intriguing problems of evolutionary biology. On the basis of simplistic models of fitness landscapes, it has been shown that the interaction between genetic drift and natural selection favors recombination independent of epistatic interactions. The ME and the MEEP iii

fitness landscape models therefore offer an unprecedented opportunity to bridge the gap between simplistic models and real fitness landscapes. Although recombination is shown to be still generally favored under the ME and the MEEP fitness landscape models, evolved HIV populations cannot be kept in realistic regions of the sequence space, and therefore it remains unclear whether genetic drift outweighs epistasis as a factor for the maintenance of recombination in a more complex and rugged fitness landscape. Chapter 4 provides an exploratory analysis of the change of the HIV fitness values across different common drug environments. Specifically, chapter 4 presents a principal component analysis of the fitness data of the different conditions which reveals structure and patterns associated with drug resistance and cross-resistance. In addition, by comparison with patterns generated by simulated data, it was possible to quantify which part of the total variance of the original data was due to non-specific, drug-class-specific and drug-specific effects of resistance mutations. Accordingly, it was shown that relative fitness is mainly drug-independent and that drug-specific effects are significantly different between drug classes. Further comparison of the results with known combination therapies indicates that principal component analysis can identify effective drug combinations to minimize the risk of emergence of resistance. At last, chapter 5 sums-up the most important difficulties and challenges encountered in the previous chapters and puts the main results in perspective. First and last, this thesis shows that a better understanding of HIV s evolutionary process leads to a better understanding of HIV drug resistance and the other way around. iv

Résumé L un des principaux objectifs de la biologie des systèmes est celui de décoder des séquences génétiques en termes d activité biologique et d expression phénotypique. En particulier, afin de mieux comprendre le processus évolutif, il est important de caractériser l aptitude des organismes en fonction de l espace génétique qu ils peuvent explorer. Autrement dit, il est important de caractériser le paysage adaptatif où l évolution peut avoir lieu. En biologie évolutive, de nombreuses études théoriques sont basées sur des fonctions de fitness simples afin de pouvoir étudier les processus de l évolution naturelle. Cette thèse, en revanche, explore et décrit un paysage adaptatif qui est basé sur des données expérimentales de fitness in-vitro du VIH. Quelques précisions sur les données sont présentées dans le chapitre 1. Ce chapitre introduit également deux modèles du paysage adaptatif utilisés dans la suite de la thèse. L un permet de calculer la fitness d un virus à partir de l effet de chaque mutation individuelle (ce modèle est appelé ME) ; tandis que l autre prend en compte non seulement l effet de chaque mutation individuelle, mais aussi les effets des interactions entre les paires de mutations (ce modèle est appelé MEEP). Les détails sur l ajustement et la performance des modèles sont présentés dans l annexe A. Ces deux modèles constituent un outil sans précédent pour étudier le rôle des interactions de mutations (épistasie et pléiotropie) dans le processus évolutif. Le chapitre 2 explore trois représentations visuelles complémentaires du paysage adaptatif. La première consiste en une surface de régression polynomiale sur les valeurs de fitness des séquences virales, qui sont représentées par des points dans un plan et placées de telle sorte que l information sur le nombre de mutations entre les séquences est maximale. La seconde représentation montre le paysage adaptatif sous forme d un réseau dont les arêtes lient des séquences voisines et la taille des nœuds représente la fitness de chaque virus. Enfin, la troisième représentation utilise le modèle MEEP pour générer une surface adaptative tridimensionnelle basée sur un treillis formé par des séquences espacées d une mutation les unes des autres et intégrant les mutations les plus fréquemment observées. Ces trois représentations indiquent toutes un haut niveau de rugosité locale et soutiennent l hypothèse du massif central de Kauffman qui stipule que les génotypes dont la fitness est élevée ont tendance à être proches les uns des autres. Elles montrent également qu un espace de dimension réduite (deux ou trois dimensions) est suffisant pour retrouver les caractéristiques les plus importantes des paysages adaptatifs complexes. Le chapitre 3 utilise les modèles ME et MEEP pour reproduire l évolution des populations virales et, de cette façon, étudier le maintien de la recombiv

naison génétique qui constitue l un des problèmes les plus intrigants de la biologie évolutive. Sur la base de modèles simples de paysages adaptatifs, il a été observé que l interaction entre la dérive génétique et la sélection naturelle favorise la recombinaison indépendamment des interactions entre les effets des mutations. Les modèles ME et MEEP permettent donc de faire le lien entre des modèles plus simples et les vrais paysages adaptatifs. Bien que la recombinaison soit, de façon générale, aussi favorisée pour les modèles plus complexes tels que le ME et le MEEP, les populations virales n ont pas pu évoluer et rester dans les régions réalistes de l espace de séquences. Il n apparaît donc pas encore clairement si la dérive génétique est toujours plus importante que les interactions épistatiques pour le maintien de la recombinaison dans le cas d un paysage adaptatif qui soit plus complexe et plus rugueux. Le chapitre 4 présente une analyse exploratoire de la variation des valeurs de fitness du VIH mesurées en présence de différents médicaments. Plus précisément, ce chapitre présente une analyse en composantes principales des données de fitness qui révèle la structure et les profils de résistance aux médicaments. En outre, par comparaison avec des données simulées, nous avons pu quantifier la partie de la variance totale des données d origine due à des effets non-spécifiques et à des effets spécifiques à chaque classe de médicaments. En conséquence, il a été montré que la fitness est essentiellement indépendante de l environnement (du médicament) et que les effets spécifiques aux médicaments sont significativement différents entre les classes de médicaments. Par la comparaison de ces résultats avec les thérapies connues, il s avère que l analyse en composantes principales permet d identifier des combinaisons de médicaments efficaces pour réduire au minimum le risque d émergence de résistance. Enfin, le chapitre 5 fait un résumé des difficultés les plus importantes et des défis rencontrés le long des chapitres précédents et fait une rétrospective des résultats les plus importants. Avant tout, cette thèse montre qu une meilleure compréhension des processus d évolution du VIH conduit à une meilleure compréhension de la résistance du VIH aux médicaments et viceversa. vi