THÈSE DOCTORAT DE L UNIVERSITÉ BORDEAUX

Dimension: px
Commencer à balayer dès la page:

Download "THÈSE DOCTORAT DE L UNIVERSITÉ BORDEAUX"

Transcription

1 Année 2013 Thèse n 2056 THÈSE pour le DOCTORAT DE L UNIVERSITÉ BORDEAUX Ecole doctorale : Sociétés, Politique et Santé Publique (SP2) Mention : Santé publique et Epidémiologie Option : Biostatistique Présentée et soutenue publiquement Le 15 novembre 2013 Par Mélanie PRAGUE Née le 8 juin 1987 à Bordeaux Utilisation des modèles dynamiques pour l'optimisation des traitements des patients infectés par le VIH Use of dynamical models for treatment optimization in HIV infected patients Membres du Jury Daniela DE ANGELIS, Programme Leader, MRC Biostatistics, Cambridge... Rapporteur France MENTRE, PU-PH Inserm U738, Université Paris Diderot... Rapporteur Robin CALLARD, Professor, University College London... Examinateur Geneviève CHENE, PU-PH, Inserm U897, Bordeaux... Examinateur Daniel COMMENGES, DR, Inserm U897, Bordeaux... Directeur de thèse Rodolphe THIEBAUT, PU-PH, Inserm U897, Bordeaux... Membre invité Victor DE GRUTTOLA, Professor, Harvard School Public Health, Boston... Membre invité

2

3 Remerciements 3 Remerciements Mes premières pensées vont à mon directeur de thèse Daniel Commenges sans qui aucune de ces lignes n aurait pu être écrite. Merci de m avoir guidée et de m avoir consacré autant de temps. J affectionne particulièrement la visite imprévue (pas si imprévue) de 9h/10h du matin où nous pouvions échanger à bâtons rompus sur les dossiers en cours. Merci d avoir partagé avec moi vos connaissances, vos points de vue sur les méthodes statistiques et vos idées de recherche ; merci de m avoir obligé à savoir reconnaître et prononcer les lettres grecques ; merci pour vos nombreuses relectures d articles et de ce manuscrit où même moi j avais parfois l impression de moins les avoir lus que vous. Finalement, merci pour vos conseils sur la rédaction. Vous m avez appris qu un mot important peut être répété dans un texte scientifique, je n ai donc pas peur de vous dire encore une fois merci. J exprime tout aussi vivement la plus grande reconnaissance à mon codirecteur de thèse Rodolphe Thiébaut. Malgré tes journées de 42h et la pile de mail quotidienne que tu dois traiter, tu as toujours répondu efficacement et dans les délais à la moindre de mes questions. Merci de m avoir éveillée aux problématiques médicales pour lesquelles je partais du niveau zéro (peut-être même -10). J ai particulièrement apprécié les déjeuners imprévus sur le pouce où l expression parler de choses importantes entre la poire et le dessert prend tout son sens. Merci de m avoir donné de nombreux conseils avisés et ouvert des opportunités. I would like to thank my two reviewers Daniela de Angelis et France Mentré who gave their time to read this thesis. Daniela, I am very admirative of your knowledge in biostatistics. France, j ai lu de nombreux de vos travaux qui m ont beaucoup appris durant cette thèse, merci. I sincerely thank Robin Callard and Geneviève Chêne who also accepted to be part of the jury and to review my works. Robin, I am very glad that you can bring some immunological lights to this works. Geneviève, merci pour votre aide dans l obtention des autorisations d usage des jeux de données durant ces 3 ans. All of you, I am very grateful of your presence. My thoughts also go to Victor de Gruttola who, from the other side of the Atlantic, will attend my defense on Skype. Thank you for hiring me as a postdoc, I am very excited about beginning and I hope to meet your expectations. Je tiens aussi à remercier les directeurs passés et actuels de l ISPED et de l unité Inserm U897 : Roger Salamon, Rachid Salmi et Christophe Tzourio. Je pense aussi à l ensemble du personnel du laboratoire pour l esprit familial qui règne dans ces locaux, qui s illustre bien dans la traditionnelle journée à Carcan avec huîtres et grillades. J aimerais avoir la chance de pouvoir retravailler un jour dans cette structure. Je voudrais remercier particulièrement Réjane pour toute son aide administrative. C est toujours un plaisir de passer dans ton bureau, que ce soit pour organiser des déplacements ou pour prendre des fournitures. Désormais, le bureau 45 pourra se targuer d avoir une grosse agrafeuse comme Daniel. Merci à Christian Weller, Coralie Thore et Evelyne Mouillet qui trouvent les articles plus vite que leur ombre et m ont fait gagner un temps précieux. J adresse une pensée aux informaticiens du CREDIM.

4 Remerciements 4 Je remercie donc toute l équipe pédagogique qui a su me faire une place. Mes pensées vont en particulier à Nancy pour sa bonne humeur même lorsque l on veut changer un horaire dans le planning, Pierre qui sait (très bien) conseiller tout en râlant (beaucoup), Alioum et Marthe-Aline pour leurs conseils. J espère avoir été une chargée de TD guillerette pour Marie Chavent, Marta, François Caron et Robin. Aussi étrange que cela puisse paraître, j ai particulièrement aimé faire des croix, des traits et des ronds avec Fleur et Valérie. J en profite aussi pour remercier mes anciens professeurs de prépa et de l ENSAI pour m avoir montré ce qu il fallait faire (et ne pas faire). Merci aux étudiants de m avoir écouté d une oreille bienveillante. Merci à tous les permanents, doctorants, ingénieurs et stagiaires de l équipe biostatistique et de l ISPED en général pour les bons moments passés ensemble. J aime la bonne humeur des RLP (réunion d équipe dinatoire trimestrielle) qui sont toujours l occasion d échanger et de s échanger la dernière recette culinaire à la mode. Désolée pour les nombreuses briques au chocolat que j ai malencontreusement pu apporter. Merci à Cécile pour ses conseils jeux de société. Un remerciement particulier aux colocataires successifs du Bureau 45 : Linda pour avoir partagé ton expérience de jeune phd, Yassin pour nous avoir montré l exemple l an dernier, Paul pour l achat d une machine à café rutilante qui fait la jalousie de tout le couloir violet, Julie pour nos moments fille-fille à mettre Ycare à tue-tête dans le bureau, Audrey pour les potins du net venus de nul part qui arrivent toujours au bon moment, Lingling pour tes anecdotes chinoises et Loic pour ta bonne humeur et ton accent. J ai aussi une pensée pour Alexandre chez qui je prends plaisir à taper quand le bureau 1 est fermé. Je pense aussi aux filles que Paul appelait les paquidettes qui se reconnaitront et en particulier Fanny qui en plus de me sauver lorsque j oublie mes clefs de bureau (soit 4 jours sur 5) est une bonne copine de bavardage. Loin des yeux, mais pas loin du cœur, dans les hauteurs du 3 ième, je remercie aussi Boris sans qui les pauses café(s) ne seraient pas si drôles. J espère que tu resteras un ami. Et puis les autres : Jérémie 2, Célia, Mbéry, Ana, Sophie, Mélanie, Matthieu et les autres (pas dans l ordre)... Bordelaise d origine, j ai pris un plaisir immense à côtoyer de nouveau mes amis. Merci d avoir su me changer les idées, me divertir et me débaucher quand cette thèse me sortait par les yeux. Vous êtes tous de belles personnes que je veux revoir à Boston puis où que je sois. Ma Nono, tu es une fille extraordinaire, j aime nos soirées à durées indéfinies quand tu viens à la maison. Grâce à toi et à Momo j ai pu booster ma positive attitude (pieds sur le bureau, mains sur les hanches!). Jb ma famille choisie, nous serons toujours cousins lorsque cela nous arrange. Talex et Tib mes deux compagnons de trappes, que ferions-nous sans Appolo? Shin (Cendrillon) toujours prêt à tout, enfin, avant le coup de pompe de minuit. Les amis d amis qui sont maintenant des amis Noel. Les +1 Remi et Marion 2 bout-en-trains en soirée. Florence la voisine d enfance, bientôt voisine de ville. Les week-ends langues de vipère compét de patin à rigoler avec Morgan et Amande. La liste des personnes qui ont compté pour moi est ensuite longue même si certains font parti des intermittents du spectacle : merci à Vathana, Ian, Mathias, Elsa, Morina, Bastien, Pauline, Romain, Benjamin et les autres (pas dans l ordre)... J ai une pensée tendre pour ma famille qui, je le sais, est très heureuse pour moi. Les premières années de ce cette thèse passées en voisins avec mon papa nous ont permis de profiter l un de l autre, je n oublierai jamais ces bons moments. Je ne dirai jamais assez

5 Remerciements 5 merci à ma maman pour son amour et son soutien inconditionnel. Tu es toujours là pour me conseiller avec tendresse et vision éclairée. J aime que l on soit aussi proche et pouvoir tout te dire autour d un café ou d un verre de vin. Merci à Mamimi fournisseuse officielle de Guerlain et cuisinière hors pair qui m a toujours répété que tant que je travaillais à l école elle s occupait de tout. J ai de la chance de t avoir, même si des-fois, enfin parfois j oublie d appeler. Je voulais vous dire que je vous aime très fort. Je pense aussi à mamie Marie, papi Jean et Papipi qui auraient été si fiers de voir ce manuscrit. Je pense aussi à ma voisine Jacqueline qui m a vu grandir. Merci à Lisette qui reste notre petit ange gardien du jeudi et permet de mieux me concentrer sur le travail. Pour finir, je pense à ma belle famille, en particulier Hélène, Krister et Norman qui m ont toujours accueillie comme leur propre enfant et m ont beaucoup aidé à progresser en anglais. Pour finir, on laisse souvent le meilleur pour la fin, j ai une pensée amoureuse pour Vincent. Tu sais me supporter après des journées de boulot trop longues où désormais tu m envoies faire du sport ou me coucher pour ne pas avoir à subir ma mauvaise humeur. Tu es mon ange depuis presque 9 ans de bonheur et avec qui je m apprête à partir à l aventure. J espère que tout le chemin que nous avons parcouru nous a rendu plus forts. Merci de m aimer comme tu le fais tous les jours. L aventure de la thèse s arrête ici. Ces derniers mots ferment un chapitre de trois ans de ma vie passée à étudier, travailler, mais aussi m amuser, profiter de la vie et rire auprès de gens formidables professionnellement et personnellement. Dès demain, une nouvelle aventure commencera, mais avant cela je profite de ces dernières lignes pour remercier ceux que j ai oublié et qui n en sont pas moins importants. Cette thèse commence ici pour les lecteurs courageux que je tiens, pour finir, à remercier.

6

7 Productions scientifiques liées à la thèse 7 Productions scientifiques liées à la thèse Articles liés à la thèse Acceptés Treatment monitoring of HIV infected patients based on mechanistic models. Prague M., Commenges D., Drylewicz J. et Thiébaut R. Biometrics 68(3) : (sept. 2012) Dynamical models of biomarkers and clinical progression for personalized medicine : the HIV context. Prague M., Commenges D. et Thiébaut R. Advanced Drug Delivery Reviews 65(7) : (Juin 2013) NIMROD : A Program for Inference via Normal Approximation of the Posterior in Models with Random effects based on Ordinary Differential Equations. Prague M., Commenges D., Guedj J., Drylewicz J. et Thiébaut R. Computer Methods and Programs in Biomedicine 111(2) : (Août 2013) Soumis From descriptive causal models to mechanistic models : effect of HAART on CD4 counts and viral load. Commenges D., Prague M., Gégout-Petit A. et Thiébaut R. Quantifying and Predicting the Effect of exogenous Interleukin-7 on CD4+T cells in HIV-1 Infection. Thiébaut R., Drylewicz J., Prague M., Lacabaratz C., Beq S., Crough T., Sekaly R.P., Lederman M.M., Sereti I., Commenges D. et Levy Y. Communications internationales dans un congrès avec comité de lecture ( orateur) Communications orales From in vivo to in vitro quantification of antiretroviral drugs effects based on dynamical models of HIV. Prague M., Commenges D. et Thiébaut R. HIV dynamics and evolution Utrecht - Pays-bas (Mai 2013) Toward information synthesis with mechanistic models of HIV dynamics. Prague M., Commenges D. et Thiébaut R. International society for Clinical Biostatistics Bergen - Norvège (Août 2012) Bayesian MAP Estimation in Models with Random effects based on Ordinary Differential Equations applied to Treatment Monitoring in HIV. Prague M. et Commenges D. Eurandom Workshop PEDSII Eindhoven - Pays-bas (juin 2012) Treatment monitoring of HIV infected patients : optimal drug dose control. Prague M., Commenges D., Drylewicz J. et Thiébaut R. International Biometric Society Channel Network Bordeaux - France (Avril 2011) The stochastic system approach for causal modeling. Commenges D., Prague M., Gégout-Petit A. et Thiébaut R. International Biometric Society Channel Network Glasgow - UK (Juillet 2013) Using mechanistic models to design and analyze immune intervention trials : the example of phase I/II trials of IL-7 therapy in HIV-infected individuals. Thiébaut

8 Productions scientifiques liées à la thèse 8 R., Prague M., Drylewicz J., Jarne A., Croughs T., Levy Y. et Commenges D. International society for Clinical Biostatistics Munich - Allemagne (Août 2013) Communications affichées Modeling the effect of Interleukin-7 on CD4+ T cells. Jarne A., Prague M., Commenges D. et Thiébaut R. HIV dynamics and evolution Utrecht - Pays-bas (Mai 2013) Communications nationales dans un congrès avec comité de lecture Communications orales Inférence par Approximation Normale de l a posteriori dans les modèles dynamiques à effets mixtes. Prague M., Commenges D., Guedj J., Drylewicz J. et Thiébaut R. Journées de la SFDS Toulouse - France (Juin 2013) Illustration of information synthesis of clinical trials with mechanistic models of HIV dynamics. Prague M., Commenges D. et Thiébaut R. GDR Statistiques et Santé Rennes - France (Sept. 2012) R Package marqlevalg : the Marcquardt-Levenberg algorithm an alternative to optimx in minimization problems. Prague M., Diakité A. et Commenges D. Rencontres R Bordeaux - France (Juill. 2012) Estimation in Differential Equations and prediction of treatment response in HIV infected patients. Prague M. et Commenges D. GDR Statistiques et Santé Paris - France (Mai 2011) Communications affichées HIV and immune system dynamics modeling and drug dose reduction. Prague M., Commenges D. et Thiébaut R. Université des jeunes chercheurs sur le VIH Sidaction Carry-le-rouet - France (Sept 2011) Séminaires / Communications orales invitées Overview on dynamical models : treatment optimization in HIV infected patients. Prague M., Commenges D. et Thiébaut R. John Hopkins University lab meeting. Baltimore - US (Oct. 2013) Individual predictions using mechanistic models Prague M., Commenges D. et Thiébaut R. Workshop Dynamic predictions for repeated markers and repeated events : models and validation. Bordeaux - France (Oct. 2013) Estimation and treatment optimization in HIV infected patients. Prague M., et Commenges D. Department of methodological statistics Université de Liège - Belgique (Dec. 2012)

9 Table des matières Productions scientifiques 7 Introduction 14 PARTIE I : Contexte biologique et thérapeutique de l infection à VIH 17 1 L infection à VIH Données épidémiologiques actuelles Dynamique VIH-système immunitaire Structure du VIH Une organisation en quasi-espèces Cycle de réplication du VIH Réponse du système immunitaire au VIH Biomarqueurs et critères de jugement cliniques de l avancée de l infection Charge virale Numération des CD Histoire naturelle de la maladie Les populations cellulaires d intérêt dans cette thèse Les stratégies de traitement dans les pays du Nord Les thérapies antirétrovirales hautement actives

10 Table des matières Les molécules antirétrovirales Les thérapies par combinaisons d antirétroviraux (cart) Les échappements thérapeutiques Les effets secondaires L adhérence aux traitements Médecine personnalisée : vers une individualisation des traitements Individualisation du choix du traitement Surveillance des réponses aux traitements et adaptations PARTIE II : Aspects mathématiques, statistiques et numériques des modèles dynamiques 43 3 Les modèles d analyse de la dynamique des biomarqueurs Les modèles descriptifs Modèles multivariés Les modèles causaux Concept de causalité G-calculs Modèles structuraux marginaux Les modèles dynamiques mécanistes explicatifs Vocabulaire et Notations Différents types de modèles dynamiques Les systèmes d équations différentielles ordinaires (ODE) Algorithmes d estimation en modèles NLME-ODE Méthodes d inférence disponibles Validité de l approximation normale de l a posteriori Inférence par approximation normale de l a posteriori Les modèles dynamiques mécanistes pour le VIH Modèle simple

11 Table des matières Complexification des mécanismes Modèles simplifiés : parcimonie et identifiabilité Pistes de modélisation des effets traitement NIMROD pour l inférence en modèle dynamique Le programme NIMROD Amélioration de la convergence Amélioration des temps de calcul Diffusion Description et application à la pharmacocinétique : «NIMROD : A program for inference via a normal approximation of the posterior in models with random effects based on ordinary differential equations» dans Computer methods and Programs in Biomedecine, Volume 111, Issue 2, août 2013, Pages Perspectives Causalité et comparaison d approches Comparaison des modèles descriptifs et dynamiques Problématique Sélection des données Aspects techniques et limites Un continuum entre modèles descriptifs et explicatifs : «From the descriptive to mechanistic dynamical models : effect of HAART on CD4 count» Perspectives

12 Table des matières 12 PARTIE III : Vers une médecine personnalisée dans le domaine du VIH Optimisation de la dose de traitement Les problématiques liées à l optimisation des traitements Évaluation des qualités des modèles Qualité d ajustement Paramètres individuels pour la prédiction Qualité de prédiction Optimisation et théorie de la commande Adaptation de la dose Définition de la fonction objectif Exploitation des propriétés dynamiques Stratégie adaptative d optimisation de la dose de traitement : «Treatment monitoring of HIV infected patients based on mechanistic models» dans Biometrics, Volume 68, Issue 3, septembre 2012, Pages Perspectives Modélisation des effets des cart, vers une optimisation Les facteurs d intérêt dans les modèles dynamiques appliqués au VIH : «Dynamical models fo biomarkers and clinical progression for personalized medicine : The HIV context» dans Advanced Drug Delivery Reviews, Volume 65, Juin 2013, Pages De l in vitro à l in vivo L information in vitro De l in vitro à l estimation d effets traitement in vivo : «From in vitro to in vivo quantification of antiretroviral drugs effects based on dynamical models of HIV»

13 Table des matières 13 Conclusion et Perspectives Générales 173 Bibliographie 177 Annexes 201 A Matériel supplémentaire Comp. Meth. and Prog. in Biomedecine 203 B Matériel supplémentaire Biometrics 209

14

15 Introduction Dans ces travaux de thèse, nous proposons des approches statistiques pour mettre en place des stratégies d optimisation de traitements qui pourraient par la suite être reprises dans des essais cliniques. Pour cela nous nous intéressons à la modélisation de l interaction entre le système immunitaire et le VIH. Nous considérons et comparons différentes techniques proposées dans la littérature pour finalement préférer les modèles mécanistes dynamiques explicatifs. Cela demande de résoudre des problèmes d inférence dans ces modèles basés sur des équations différentielles ordinaires avec des effets mixtes sur les paramètres. Nous développons et utilisons des méthodes et des outils statistiques d estimation. La mise en œuvre de ces méthodes permet ensuite une recherche de la meilleure modélisation des interactions entre le VIH et les différentes populations de cellules immunitaires avec et sans traitement. Il s agit de retenir un modèle cohérent qui soit à la fois capable d ajuster et de prédire des données, puis de l utiliser afin de proposer et de valider des stratégies d optimisation des traitements. Nous travaillons en particulier sur le concept de prédictions bayésiennes dans les modèles dynamiques et considérons l évaluation de leur crédibilité et de leur incertitude. Nous profitons de la présence d effets aléatoires pour à la fois utiliser les données de l ensemble de la population et effectuer des prédictions individuelles rendant possible l individualisation des traitements. Par ailleurs, l information sur le patient qui augmente au cours du temps, permet par une approche bayésienne une mise à jour adaptative des traitements. Comme application et illustration de l usage des outils statistiques et des modélisations développées dans cette thèse, nous proposons donc des stratégies d individualisation adaptatives du traitement chez les patients infectés par le VIH.

16 Introduction 16 La première partie présente les enjeux et le contexte de l infection à VIH. Le chapitre 1 introduit quelques données épidémiologiques de l infection afin de situer la problématique dans un cadre de santé publique puis énonce les bases biologiques et virologiques de l infection sans traitement. Le chapitre 2 s intéresse aux traitements antirétroviraux, pour contrôler l infection à VIH qui dans l état actuel des connaissances ne peut pas être éradiquée. Une perspective individuelle est adoptée, nous mettons en valeur pourquoi et comment la médecine personnalisée utilisée pour de nombreuses autres pathologies pourrait être appliquée au VIH. La deuxième partie met en avant les solutions mathématiques, statistiques et numériques qui existent pour modéliser l interaction entre VIH et système immunitaire. Le chapitre 3 présente les différents types de modèles pour l analyse des biomarqueurs. Le chapitre 4 traite de l inférence dans les modèles dynamiques basés sur des équations différentielles ordinaires avec effets mixtes sur les paramètres et présente un programme d estimation appelé NIMROD. Le chapitre 5 montre la supériorité d une approche dynamique comparée à une analyse longitudinale descriptive des biomarqueurs pour analyser l effet d un traitement lorsque la mise sous traitement est conditionnée par les variables observées et les variables d intérêt. La troisième partie s intéresse à l utilisation de ce type d approches pour une prescription individualisée des traitements antirétroviraux chez les patients infectés par le VIH. Le chapitre 6 introduit des méthodes de prédictions bayésiennes dans les modèles dynamiques et propose des solutions pour évaluer leurs qualités. Par la suite, ce chapitre présente une stratégie adaptative d individualisation et d optimisation de la dose de traitement basée sur l utilisation d un indicateur d équilibre en modèle ODE qui identifie les états de contrôle de l infection. Le chapitre 7 fait une revue de littérature des facteurs d intérêt pour la médecine personnalisée dans le domaine du VIH. Pour conclure, ce chapitre présente nos travaux actuels sur la prise en compte de résultats pharmacologiques in vitro, la modélisation des réservoirs latents, l inclusion des mutations, l étude de l adhérence et des propositions de stratégies d individualisation du choix du traitement.

17 PARTIE I : Contexte biologique et thérapeutique de l infection à VIH

18

19 Chapitre 1 L infection à VIH Résumé : Dans ce chapitre, nous donnons le contexte lié à l application biomédicale de cette thèse. Après avoir exposé en quoi l infection à VIH reste encore un enjeu de santé publique majeur dans le monde entier en ce début de XXI ième siècle, nous présentons les aspects biologiques et immunologiques de cette infection. Au travers de ces explications, nous mettons en avant les biomarqueurs spécifiques du VIH qui vont ensuite constituer des variables à expliquer et prédire dans des modèles de dynamique de populations de cellules. Mots-clés : biomarqueur ; charge virale ; cycle de réplication ; incidence ; lymphocyte T-CD4 ; mutation ; primo-infection ; quasi-espèce ; SIDA ; système immunitaire ; VIH. Abstract : In this chapter, we present the context of the biomedical application of this PhD work. We show why HIV is still, in the 21 th century, an important public health problem in the world. We present biological and immunological aspects of this infection. We explicit specific biomarkers for HIV that will afterward be variables to explain and to predict in populations of cells dynamics models. Key words : AIDS ; acute-infection ; biomarker ; HIV ; immune system ; incidence ; lymphocyte T-CD4 ; mutation ; quasispecies ; replication cycle ; viral load.

20 Chapitre 1 : L infection à VIH 20 Le virus de l immunodéficience humaine (VIH) a été découvert au début des années 80 [Barré-Sinoussi et al., 1983, Gallo et al., 1983] deux ans après le premier cas clinique de syndrome d immunodéficience acquise (SIDA) [Stahl et al., 1982]. L épidémie est classée en pandémie en 1987 et est devenue un enjeu majeur de santé publique [Mann et al., 1988]. 1.1 Données épidémiologiques actuelles En 1995, le programme ONUSIDA de l ONU destiné à coordonner l action des agences spécialisées pour lutter contre la pandémie de VIH/SIDA est créé. En 2013, la prévalence [UNAIDS, 2013] établie sur 186 pays (parmi les 193 pays membres de l ONU) est de 34 millions [ millions]. Malgré un nombre de personnes infectées environ 20% inférieur à celui de 2001, l incidence annuelle reste de 2.5 millions [ millions]. Sur cette même période, l intensification de l usage et l amélioration des traitements ont permis de réduire de plus de 24% le nombre de décès dus au SIDA, amenant ce nombre à 1.7 millions [ millions] par an. 1.2 Dynamique VIH-système immunitaire Structure du VIH Le VIH est un rétrovirus appartenant à la famille des lentivirus dont la pathologie est caractérisée par une longue période entre l infection et les manifestations cliniques. Deux types viraux et de nombreux sous-types, basés sur des différences génétiques, ont été identifiés : le VIH-1 présent dans le monde entier et le VIH-2 répandu principalement en Afrique de l ouest. Le VIH est d un aspect sphérique (voir Figure 1.1), pour un diamètre moyen de 145 nanomètres. Une capside, comprenant un brin simple d ARN en double exemplaires et des enzymes agissant dans le cycle de réplication du virus (voir Section 1.2.3), est contenue dans l enveloppe virale jalonnée de glycoprotéines : la gp41 et la gp120.

21 1.2 : Dynamique VIH-système immunitaire Une organisation en quasi-espèces Des variabilités du matériel génétique peuvent être transmises ou générées au sein d un hôte [Wittkop et al., 2011]. En effet, une grande diversité génétique du virus existe à l état naturel, car le VIH, comme beaucoup de lentivirus, conserve ses capacités de réplication virale avec une grande tolérance aux variations de l ARN [Ndung u and Weiss, 2012, Taylor et al., 2008]. Au regard du matériel viral, le virus est présent sous forme de quasiespèce au sein d un hôte, il exprime plusieurs génotypes au sein d un même type et soustype viral [Goodenow et al., 1989]. Par pression de sélection, lors par exemple de prise de traitements, certains génotypes peuvent être amenés à devenir presque inexistants au profit d autres génotypes plus résistants : on parle alors de mutations de résistance. Ce nouveau génotype viral peut alors croître aux dépens des précédents et régénérer de nouveau, par mutations, une quasi-espèce de virus Cycle de réplication du VIH Le système immunitaire constitue une ligne de défense contre le VIH, mais il est aussi une cible. En effet, le virus ne disposant pas de tous les éléments nécessaires à sa réplication il profite de la machinerie cellulaire pour se multiplier. De plus, la structure de l enveloppe confère au VIH des propriétés de réplication, car elle lui permet d infecter facilement des cellules immunitaires présentant à leur surface des récepteurs CD4 (principalement les lymphocytes T-CD4+, cette question sera abordée dans la Section 1.2.4). L attachement du virus (Figure 1.1.1) à une cellule cible se fait par la fusion de la couche lipidique du virus à la membrane plasmatique de la cellule, menée par les glycoprotéines. Il y a ensuite relâchement du matériel viral dans le cytoplasme de la cellule [Clapham and McKnight, 2002] (Figure 1.1.2). Une étape de décapsidation permet ensuite de verser le matériel viral à l intérieur de la cellule puis la transcriptase inverse (Figure 1.1.3) produit de l ADN viral grâce à l ARN viral. Le génome viral peut alors être acheminé vers le noyau, quel que soit l état d activation de la cellule [Nisole and Saïb, 2004]. L ADN viral est ensuite intégré à l ADN chromosomique de la cellule infectée grâce à l intégrase (Figure 1.1.4). L ARN

22 Chapitre 1 : L infection à VIH 22 messager (ARNm) est ensuite produit et exporté du noyau. Une fois sorti par les pores nucléaires, l ARNm est lu par les ribosomes de la cellule qui assemblent des acides aminés afin de constituer les protéines virales (Figure 1.1.5). C est en particulier lors de ces deux étapes que se crée la diversité génétique par des erreurs de lecture de codons et de recopies. Ce phénomène est très fréquent, car la dynamique de renouvellement du virus est très rapide, avec en moyenne plus de 0.68 milliard [ milliards] de virions journaliers créés [Ho et al., 1995]. Cet ordre de grandeur a été retrouvé par d autres auteurs [Coffin et al., 1995, Herz et al., 1996, Nowak et al., 1995, Perelson et al., 1996]. Après cet assemblage, le nouveau matériel viral sort de la cellule infectée en arrachant une partie de la membrane cellulaire, ce qui lui confère les propriétés d enveloppe permettant sa réplication et donne naissance à un nouveau virus infectieux après maturation (Figure et Figure 1.1.7) Réponse du système immunitaire au VIH De nombreuses populations de cellules participent à la réponse immunitaire contre le VIH mais seulement une partie de ces cellules immunitaires permettent au virus de se répliquer et de persister au sein du corps de l hôte. Les lymphocytes T-CD4+, que nous appellerons par souci de simplicité CD4 par la suite, prolifèrent et activent d autres cellules immunitaires qui vont agir directement sur le virus. Les lymphocytes B produisent des anticorps permettant la lutte anti-vih par neutralisation du virus circulant puis son élimination par les monocytes macrophages. Les lymphocytes T-CD8+, quant à eux, s attaquent directement aux cellules infectées. Ainsi, un schéma proie-prédateur s instaure entre les populations cellulaires. Les CD4 constituent le plus important groupe de cellules cibles. En effet, elles présentent des récepteurs capables de reconnaitre spécifiquement les glycoprotéines à la surface du virus favorisant le schéma de réplication décrit Section Les CD4 activés sont d autant plus susceptibles d être infectées. Lors de leur désactivation, ces cellules migrent vers des compartiments tissulaires (organes lymphoïdes, cerveau...) formant des réservoirs à VIH. Certains de ces CD4 sont infectés de façon latente, avec une

23 1.2 : Dynamique VIH-système immunitaire 23 Figure 1.1 : Cycle de réplication du VIH (adapté de [NIAID, 2013]) demi-vie longue [Finzi et al., 1999], et persistent dans ces réservoirs [Siliciano et al., 2003, Chun et al., 1998, Ribeiro et al., 2002, Grossman et al., 2002]. C est entre autres là où d autres types de cellules (macrophages, cellules dendritiques...) peuvent être infectées par ces CD4 infectés latents. Ces cellules ne peuvent pas être ciblées par le système immunitaire, car le VIH est intégré au noyau et donc indétectable. C est le concept de réservoir latent du VIH qui constitue une problématique de recherche actuelle (voir Section 7.2.2). Cependant, les mécanismes sont plus complexes et dans les organes lymphoïdes par exemple, les CD4 infectés, les monocytes macrophages et les cellules dendritiques

24 Chapitre 1 : L infection à VIH 24 peuvent s infecter par contacts synaptiques ce qui pourrait avoir un impact significatif sur la persistance du virus [Felts et al., 2010]. Nous n utiliserons dans ces travaux de thèse que les données mesurées dans le compartiment sanguin en faisant l hypothèse qu il s agit d un bon reflet de la dynamique globale. 1.3 Biomarqueurs et critères de jugement cliniques de l avancée de l infection Les infections opportunistes étant de plus en plus rares chez les patients sous traitement, le suivi des patients se fait essentiellement par des mesures biologiques. Il existe une large palette de biomarqueurs dont une revue de littérature peut être trouvée dans [Lange et al., 1989, Taylor et al., 1989, Vajpayee and Mohan, 2011]. Nous nous concentrons sur la charge virale et le nombre de CD4 qui constituent la dynamique principale du VIH Charge virale La mesure du nombre de virus circulant, appelée «charge virale», correspond à la concentration de copies d ARN viral dans le sang : la quantification est donnée en copies par ml. On dénombre entre et virions par millilitres (ml) en phase asymptomatique. Sa mesure est compliquée par des seuils de détection. Le seuil de détection pour les grandes valeurs de charge virale (censure à droite) est rarement atteint. De plus, il ne constitue pas une problématique lors de l analyse puisque, quelque soit le niveau exact atteint, il est porteur d information : le patient est en échappement virologique. Concernant le seuil de détection pour les valeurs faibles et donc la censure à gauche, initialement calibrés pour détecter tout niveau supérieur à 500 copies/ml, les kits de mesures biologiques sont désormais en routine à 50 copies/ml. Plus coûteuses, des mesures avec des seuils de détection inférieurs peuvent aussi être réalisées sur demande du praticien. Ce seuil de détection à gauche masque l information sur le patient (le pronostic peut être différent

25 1.3 : Biomarqueurs et critères de jugement cliniques de l avancée de l infection 25 en fonction du nombre exact de copies présentes) et doit être pris en compte statistiquement. Les méthodes d imputation des valeurs en remplaçant les valeurs censurées par zéro, le seuil de détection ou un quantile du seuil de détection conduisent à des résultats instables vis-à-vis d une analyse de sensibilité. Ainsi, une alternative est de quantifier la contribution des données censurées à la vraisemblance, ce qui conduit à des estimations non biaisées [Thiébaut et al., 2006]. Ce point statistique sera plus particulièrement traité Section Une charge virale faible, voire indétectable, est corrélée avec un meilleur pronostic clinique [Murray et al., 1999]. De plus, cet indicateur permet la surveillance du traitement par le clinicien : un pic de charge virale peut indiquer un échappement thérapeutique et le besoin de faire des tests de résistance aux traitements pour potentiellement changer le traitement du patient Numération des CD4 La numération des CD4 se fait par une technique de cytométrie de flux et s exprime en nombre de cellules par mm 3. Cependant, le nombre de CD4 est à prendre avec précaution puisqu il est connu pour avoir une grande variabilité avec des fluctuations selon les caractéristiques du patient (âge, sexe...), mais aussi diurnes [Malone et al., 1990], avec un plus haut niveau de CD4 la journée que la nuit. Des grandeurs usuelles sont pour les sujets sains entre 700 et cellules/mm 3 avec une moyenne estimée à 830 cellules/mm 3 [Bofill et al., 1992]. Un grand nombre de CD4 est associé à de meilleures défenses immunitaires. De plus, dans le cadre du VIH, il a été montré que c est un bon prédicteur de la progression de l infection et de la survie [Mellors et al., 1997, Egger et al., 2002] Histoire naturelle de la maladie La dynamique VIH-système immunitaire est très corrélée avec le déroulement clinique de l infection. L évolution naturelle passe par trois phases (Figure 1.2) : une phase de primo-infection entre 6 et 12 semaines après l infection, une phase asymptomatique de durée variable et la phase SIDA, dernière phase de l infection.

26 Chapitre 1 : L infection à VIH 26 Figure 1.2 : Graphe de la relation entre la charge virale VIH et le nombre de CD4 en moyenne au cours du temps chez un patient non traité. (adapté de [Wikipedia, 2013]). En phase de primo-infection, les défenses immunitaires s affaissent et la charge virale présente un pic. Cette phase est importante, car elle est très corrélée au pronostic immunologique, virologique et clinique du patient. Le pic viral et le nadir de CD4 (nombre minimum de CD4 mesuré) durant cette période sont largement corrélés avec les niveaux d équilibre atteint ultérieurement par le patient [Lindbäck et al., 2000], déterminant ainsi l évolution clinique du patient [Mellors et al., 1995]. Une explication possible est que des réservoirs latents de VIH sont remplis pendant la phase de primo-infection et responsable dans la suite de l infection de rebonds virologiques [Sedaghat et al., 2007]. De nombreuses revues de littérature sur les problématiques de la primo-infection peuvent être trouvées dans [Kaufmann et al., 1998, Kahn and Walker, 1998, Sedaghat et al., 2007, Drylewicz, 2009, Cohen et al., 2011]. La phase asymptomatique est une phase de latence clinique pouvant durer plusieurs années pendant laquelle le patient ne présente aucun symptôme lié au VIH. Sans traitement, le niveau de CD4 est souvent faible, mais acceptable (autour de cellules/mm 3 ) et la charge virale est stable autour de copies/ml. Cet état ne signifie pas pour autant un arrêt de la dynamique entre VIH et système immunitaire. En effet, c est une période où les taux de création et de décès des CD4 et du VIH sont très importants,

27 1.3 : Biomarqueurs et critères de jugement cliniques de l avancée de l infection 27 mais où les populations sont en équilibre [Ho et al., 1995, Coffin et al., 1995]. Cependant, après une période de 8 ans en moyenne, la quasi-totalité des patients non traités infectés par le VIH évolue vers un SIDA. En période de SIDA, les défenses immunitaires cèdent, avec un nombre de CD4 inférieur à 200 cellules/mm 3, et la charge virale explose à plus de virions par ml. Les manifestations cliniques se caractérisent par l apparition de symptômes constitutionnels et de maladies opportunistes graduellement liés au nombre de CD4 et pouvant entraîner la mort du patient. Cependant, la progression vers cette phase n est pas irréversible et de nos jours un patient pour lequel le traitement est efficace peut sortir de cette phase Les populations cellulaires d intérêt dans cette thèse Dans ces travaux de thèse, les populations de cellules d intérêt seront les CD4 pouvant être activés (T ) ou quiescents (Q). Les populations de cellules infectées sont notées avec un astérisque ( ). De plus, nous modéliserons la charge virale du VIH (V ), voir Figure 1.3 les pictogrammes associés. Ces aspects compartimentaux seront repris Section V Charge virale du VIH Q T T* Q* CD4 non infectés quiescents CD4 non infectés activés CD4 infectés activés CD4 infectés latents Figure 1.3 : Population de cellules d intérêt et virus VIH dans la modélisation in vivo de la dynamique entre VIH et système immunitaire.

28

29 Chapitre 2 Les stratégies de traitement dans les pays du Nord Résumé : Dans ce chapitre, nous introduisons les différents traitements disponibles pour les patients infectés par le VIH et, plus particulièrement, le mode d action des antirétroviraux et de leurs combinaisons (cart). Puis nous montrons comment les spécificités génétiques du VIH et les problématiques d effets indésirables des traitements font de cette infection une application potentielle à la construction de stratégies d optimisation de traitements. Nous présentons différentes approches utilisées pour d autres pathologies et énonçons les premières avancées en matière de médecine personnalisée dans le domaine du VIH. Mots-clés : antirétroviraux ; combinaison de traitements antirétroviraux (cart) ; échappement thérapeutique ; effet secondaire ; inhibiteur de protéase (PI) ; inhibiteur de fusion (IF) ; inhibiteur d intégrase (II) ; inhibiteur non nucléosidique de la transcriptase inverse (NNRTI) ; inhibiteur nucléosidique de la transcriptase inverse (NRTI) ; ligne de conduite de traitement anti-vih ; médecine personnalisée ; médecine stratifiée ; résistance ; surveillance des traitements ; test génotypique ; test phénotypique ; thérapie ciblée ; VIH. Abstract : In this chapter, we list the treatments available for HIV-infected patients : we describe the mechanism of action of antiretroviral drugs and the therapies based on combinations of antiretroviral drugs (cart). Then, we show how genetic specificities of HIV and high levels of drugs adverse effects make this infection a good application for treatment monitoring and optimization. We review approaches used in other pathologies and highlight first steps toward personalized medicine in the HIV context. Key words : adverse effect ; anti-hiv treatment guidelines ; antiretroviral drugs ; combinaison of antiretroviral therapies (cart) ; fusion inhibitor (IF) ; genotypic test ; HIV ; integrase inhibitor (II) ; monitoring ; non nucleosidic inverse transcriptase inhibitor (NNRTI) ; nucleosidic inverse transcriptase inhibitor (NRTI) ; personalized medicine ; phenotypic test ; protease inhibitor (PI) ; resistance ; stratified medicine ; targeted therapy ; therapeuthic escape.

30 Chapitre 2 : Les stratégies de traitement dans les pays du Nord Les thérapies antirétrovirales hautement actives Même si de nouvelles techniques, comme celles reposant sur le cas clinique du patient de Berlin [Hütter et al., 2009], laissent toujours espérer une possibilité de guérison pour les patients infectés par le VIH, l éradication de l infection par le VIH ne peut en général pas être atteinte avec les traitements actuels, même après une intensification [Dinoso et al., 2009]. Cela repose sur de multiples mécanismes de long terme : la présence de réservoirs de cellules infectées CD4 latentes [Chun and Fauci, 1999], la réplication continuelle du virus ou encore l échec du système immunitaire à reconnaître et éliminer les cellules infectées [Deeks et al., 2012]. Par conséquent, les principaux objectifs de l instauration du traitement antirétroviral (ART) sont de réduire la morbidité associée au VIH, de prolonger la durée et la qualité de la survie, de restaurer ou au moins préserver la fonction immunologique, de durablement supprimer la charge virale plasmatique du VIH et de prévenir la transmission du VIH. En d autres termes, les antirétroviraux permettent de ralentir la progression naturelle de la maladie et ainsi de réduire le nombre de décès lié au VIH/SIDA. Ainsi, dans les cas les plus favorables, nous parlons de guérison fonctionnelle où l organisme peut contrôler naturellement le VIH et le maintenir à des niveaux très faibles. Des études conduites au Danemark suggèrent qu une personne diagnostiquée séropositive à l âge de 25 ans aurait une espérance de vie de plus de 64 ans en 2011 alors qu elle n était que de 33 ans en Ce chiffre est à comparer avec 76 ans en population générale. L usage de traitements antirétroviraux multiplie donc par près de 5 l espérance de vie des personnes vivant avec le VIH [Lohse et al., 2007]. Les bénéfices associés à l usage d antirétroviraux ne sont donc plus à démontrer Les molécules antirétrovirales Les molécules antirétrovirales sont classifiées en fonction de l étape de réplication du virus qu elles inhibent. Elles ont été mises sur le marché de manière successive fournissant au clinicien une palette de plus en plus étoffée de traitements, voir Figure 2.1 pour la frise temporelle des autorisations de mise sur le marché. C est en 1987 que le premier

31 2.1 : Les thérapies antirétrovirales hautement actives 31 traitement pour le VIH est introduit et approuvé par la FDA aux États-Unis : il s agit de la Zidovudine (AZT) [Fischl et al., 1987]. C est un inhibiteur nucléosidique de transcriptase inverse (NRTI) qui altère la production d ADN viral (voir Figure 1.1.3) en introduisant des codons illisibles. Depuis, sept autres NRTI ont été mis sur le marché : abacavir (ABC), didanosine (DDI), emtricitabine (FTC), lamivudine (d4t), stavudine (3TC), tenofovir (TFV) et zalcitabine (ddc). Légèrement différents par leur mode d action, mais agissant au même niveau du cycle de réplication, les inhibiteurs de transcriptase inverse non nucléosidique (NNRTI) sont autorisés en 1996 et bloquent l étape de production d ADN viral (voir Figure 1.1.3). Il existe 5 NRTI : delavirdine (DLV), efavirenz (EFV), etravirine (ETV), nevirapine (NVP) et rilpivirine (RPV). En 1995, une nouvelle classe de molécules appelées inhibiteurs de protéase (PI) est introduite. Ces molécules empêchent l enzyme protéase du VIH (voir Figure 1.1.5) de réassembler une protéine virale fonctionnelle. Il existe 10 PI autorisés : amprenavir (APV), atazanavir (ATZ), darunavir (DRV), fosamprenavir (FAPV), indinavir (IDV), lopinavirritonavir (LPV/r), nelfinavir (NFV), ritonavir (RTV), saquinavir (SQV) et tipranavir (TPV). La plupart des PI sont utilisés en combinaison avec du RTV à faible dose (noté /r) afin d améliorer les propriétés pharmacocinétiques [Cooper et al., 2003]. Les inhibiteurs de fusion (IF) apparus en 2003 qui inhibent l entrée du virus (voir Figure 1.1.1) sont de deux types : soit ils bloquent le co-récepteur des cellules cibles et empêchent la protéine gp120 de s accrocher, tels que le marivaroc (MVC) ; soit ils cassent les liens établis entre la cellule et le virus comme l enfuvirtide (T20). Encore plus récent, depuis 2007, les inhibiteurs d intégrase (II) agissent en empêchant l ADN viral de s intégrer à l ADN de la cellule hôte (voir Figure 1.1.4). Ces dernières molécules sont particulièrement prometteuses, car elles présentent une dynamique d action considérablement différente de celles des autres molécules antirétrovirales. En effet [Sedaghat et al., 2008] ont montré une diminution de la charge virale plus rapide avec les II, phénomène souvent pronostic d une meilleure réponse au traitement à long terme.

32 Chapitre 2 : Les stratégies de traitement dans les pays du Nord 32 Mono therapy Dual therapy cart NRTI NNRTI PI FI II AZT ddi ddc d4t 3TC ABC TDF FTC NVP DLV EFV SQV RTV NFV APV LPV/r ATV TPV DRV IDV FPV T20 MVC RAL Figure 2.1 : Dates d autorisation de mise sur le marché d antirétroviraux pour le VIH par la FDA par classes antirétrovirales Les thérapies par combinaisons d antirétroviraux (cart) En 1994, l essai clinique CONCORDE [Seligmann et al., 1994] met en évidence une durée limitée d efficacité de l AZT en mono thérapie à cause d une apparition rapide de résistances virales. Sur la base de ces premiers résultats, un intérêt grandissant a été porté aux combinaisons d antirétroviraux (cart), voir [Caliendo and Hirsch, 1994] pour une revue des problématiques de passage des mono à des multi thérapies. Par la suite, les premiers essais cliniques ont démontré qu une cart est souvent plus efficace qu un antirétroviral administré en mono thérapie [Hammer et al., 1996, Detels et al., 1998, Bierman et al., 2009, Katlama et al., 2010, Delfraissy et al., 2008]. Cependant, ce résultat ne s applique qu aux antirétroviraux les plus anciens et peut être nuancé pour certains nouveaux antirétroviraux. Par exemple le DRV/r dans l essai clinique MONET est montré comme non inférieur par rapport à des stratégies de traitement par trithérapies classiques [Arribas et al., 2010]. En dépit du grand nombre d antirétroviraux existant, de nombreuses questions sont encore débattues : quel est le meilleur moment pour commencer un traitement? Quelle combinaison de traitement prescrire? Faut-il interrompre les traitements ou les modifier sans apparition d échecs thérapeutiques? Pour répondre à ces questions, des lignes de conduite publiées annuellement par les différentes autorités de santé (WHO, NIH, HAS...) per-

33 2.1 : Les thérapies antirétrovirales hautement actives 33 mettent de faire évoluer les pratiques cliniques ([Yeni et al., 2002], [Hammer et al., 2008], [Thompson et al., 2010]). La première interrogation consiste à savoir quand commencer le traitement. Les seuils de mise sous cart ont évolué depuis 1996 et sont maintenant de traiter en dessous de 500 cellules CD4/mm 3 [Sterne et al., 2009, Kitahata et al., 2009, Severe et al., 2010]. Des stratégies de traitement précoce sont aussi à l étude, cette problématique est un sujet de recherche à part entière, et ne sera pas traité dans ces travaux, voir [Kilby et al., 2008, Sáez-Cirión et al., 2013, Syed et al., 2013] pour une introduction. Une autre question est quels traitements administrer pour quels patients. Il existe des lignes de conduite sur les cart à choisir en fonction de critères cliniques et de l historique du patient. Le rationnel de ces choix s appuie sur des critères d efficacité, de sécurité, de tolérance, de toxicité, de facilité d usage des antirétroviraux et sur leurs caractéristiques intrinsèques dans la cart. Légèrement modifiée en fonction des avancées, la composition des cart en terme de classes de traitement n a que peu varié depuis les années En revanche, les molécules incluses dans les cart sont de plus en plus puissantes. Pour les patients naïfs de traitements, la cart consiste en 2 NRTI et un antirétroviral supplémentaire PI, NNRTI ou II. Ce sont des traitements dits de première ligne. De manière préférentielle, en 2013, les recommandations du NIH sont de choisir entre quatre régimes comme premier traitement : TDF+FTC supplément de EFV (NNRTI), ATV/r (PI), DRV/r (PI) ou RAL(II) selon l avis du clinicien au regard du patient. Des essais ont montré que les cart basées sur des NNRTI ou II sont d une efficacité durable d un point de vue virologique, mais beaucoup de patients ne les tolèrent pas. Ce problème est moins présent pour les cart basées sur des PI. En revanche, la grande variabilité de réponse pharmacocinétique à cette classe de traitement [Acosta et al., 2000] peut entraîner des toxicités chez certains patients et peuvent justifier la nécessité d un suivi personnalisé. Par ailleurs, certaines cart sont fortement déconseillées sauf exception cliniquement justifiées. Les doses de traitements en routine sont pour la plupart standardisées et ne

34 Chapitre 2 : Les stratégies de traitement dans les pays du Nord 34 dépendent que du poids du patient. Cette contrainte est en partie due aux problèmes de galénique et d industrialisation des molécules Les échappements thérapeutiques Après l initiation d une première ligne de traitement, le patient peut avoir un échec virologique à la cart : il est défini comme l incapacité à maintenir une réplication virale faible amenant à une charge virale inférieure à 200 copies/ml. Il est donc nécessaire de passer aussi vite que possible sur une seconde ligne de traitement afin d éviter l accumulation de mutations de résistance [Hosseinipour et al., 2009] ; son choix est beaucoup plus qualitatif et repose sur l avis d expert du clinicien. La décision est majoritairement orientée par des critères objectifs comme les trajectoires des biomarqueurs, les antécédents médicaux, les tests de résistance, les habitudes de vie et les comorbidités du patient. Cependant, le clinicien explore en profondeur les raisons qualitatives de l échec virologique qui est le plus souvent lié au manque d adhérence, à l intolérance de la cart et aux interactions pharmacologiques avec la nourriture, les drogues ou les autres médications du patient. Cependant, il n existe pas de consensus sur le choix de nouvelles cart. Le patient peut aussi expérimenter un échec immunologique, défini comme l incapacité de maintenir un niveau adéquat de CD4. Ce niveau dépend de l état du patient à l initiation du traitement, mais correspond en moyenne à une augmentation du nombre de CD4 de 150 cellules/mm 3 après environ 5 mois de cart [Bartlett et al., 2001]. Dans ces cas, la meilleure stratégie en terme d amélioration immunologique et virologique n est pas de changer le cart ou d ajouter des antirétroviraux, mais de rechercher de potentielles coinfections [Hammer et al., 2010]. Par ailleurs, une possibilité pas encore recommandée ni validée par les autorités de santé serait d utiliser des traitements de restauration immune tels que les thérapies géniques, les hormones de croissance ou encore les immunothérapies (comme l interleukine 7, voir Section ).

35 2.1 : Les thérapies antirétrovirales hautement actives Les effets secondaires Des effets secondaires ont été rapportés avec l usage de tous les antirétroviraux et sont la raison principale de changements de cart, d interruptions de traitement et de nonadhérence [O Brien et al., 2003]. Les plus fréquents sont des maux de tête, des nausées, des vomissements, de la fatigue, une perte d appétit, des accès de fièvre, des picotements, des diarrhées, des problèmes de peaux et des troubles de répartition des graisses. D autres effets peuvent engager le pronostic vital et toucher le système cardiovasculaire et le système nerveux central. Pour finir, l apparition de comorbidités dues à un vieillissement précoce de 10 à 15 ans [Guaraldi et al., 2011] est un nouveau problème dans les pratiques cliniques. Bien que présents dans plus de 10% des patients, le coût des effets secondaires est en général inférieur à celui qu aurait le coût d une infection VIH non prise en charge [Lichtenstein et al., 2008]. Cependant, ces effets secondaires sont importants, car ils modifient l apparence et la vie du patient ce qui favorise la non-adhérence du traitement [Catz et al., 2000, Weiser et al., 2003] qui est un enjeu majeur de sa réussite L adhérence aux traitements L adhérence est le respect par le patient des prescriptions de son médecin concernant la dose et l heure de la prise médicamenteuse. Elle varie de manière générale pour un traitement entre 28% et 82% [Backes and Schentag, 1991]. La quantification de l adhérence est difficile et aucune méthode n est optimale [Paterson et al., 2000, Arnsten et al., 2001, Fletcher et al., 2005]. Nous présentons une liste non exhaustive des méthodes disponibles en commençant par les plus consistantes et comparables entre essais, une revue de littérature est disponible dans [Costagliola and Barberousse, 2001, van Dulmen et al., 2007]. Le dosage de la concentration plasmatique en traitement permet de vérifier la prise du médicament. C est la mesure la plus significativement associée à la réponse virologique [Fletcher et al., 2005] mais ell ne peut être effectuée que ponctuellement. La surveillance électronique des capuchons des piluliers (ou MEMS Medication Event Monitoring System en anglais) [Averbuch et al., 1990] : A chaque fois qu un

36 Chapitre 2 : Les stratégies de traitement dans les pays du Nord 36 pilulier est ouvert, la prise du traitement est supposée. Cette technique est couteûse et encombrante [Samet et al., 2001]. Cependant elle demeure le seul moyen d avoir une évaluation en continue de l adhérence. Le décompte non annoncé de pilules [Kalichman et al., 2010] permet de calculer le nombre d oublis mais pas le schéma d adhérence. L auto-report par auto-questionnaires (questionnaires ACTG [Chesney et al., 2000], PMAQ [Duong et al., 2001]...), carnet de route ou entretiens dépendent en grande partir de la qualité des questions et de la fréquence du recueil. Quel que soit la méthode de recueil, les recommandations en matière de traitement anti- VIH sont en faveur d une adhérence parfaite puisque l adhérence est un déterminant majeur de la réussite du traitement, en terme d apparition du SIDA, de décès et de restauration immune [García de Olalla et al., 2002, Parienti et al., 2013]. Par exemple, il est montré qu une diminution de 10% du taux d adhérence augmente de 90% les risques d échecs virologiques [Gardner et al., 2009]. De plus, une faible adhérence est parfois associée au retour de VIH sous forme de virus résistant aux drogues prescrites [Paterson et al., 2000] bien que ce dernier point reste discuté en fonction de la classe de traitement utilisée [Bangsberg et al., 2003]. Les données d adhérence utilisées dans ces travaux de thèse, lorsqu elles sont disponibles, sont recueillies par auto-questionnaires ACTG. Nous supposons l adhérence bien reportée. Cependant, nous discutons en Section une potentielle surestimation de l adhérence [Liu et al., 2001] amenant à une sous-estimation probable de l efficacité in vivo des antirétroviraux. 2.2 Médecine personnalisée : vers une individualisation des traitements L amélioration de l efficacité et de la qualité de vie du patient est un enjeu applicatif des méthodes et des modèles statistiques développés, une voie d exploration est l individualisation des traitements. Dans cette section, nous définissons le concept et les différents

37 2.2 : Médecine personnalisée : vers une individualisation des traitements 37 types de médecine personnalisée. Ces techniques sont très utilisées en oncologie et, depuis quelques années, apparaissent aussi dans le traitement de l infection par VIH. Les différences entre les individus peuvent expliquer pourquoi un traitement peut provoquer des effets indésirables ou être efficace uniquement chez certains patients. Ces différences peuvent être liées aux caractéristiques de l individu, mais aussi à celle des bases moléculaires de l infection et du traitement. La médecine personnalisée permet d identifier quels patients présenteront la meilleure réponse thérapeutique à quels traitements, afin de prescrire le traitement le plus efficace et le plus sûr. Comme souligné par Janet Woodcock [Woodcock, 2007], le concept de médecine personnalisée n est rien de plus que la pratique médicale elle-même en intégrant scrupuleusement l état de santé du patient en prenant la meilleure information individuelle disponible. De nos jours, la majorité des cliniciens essaye naturellement de s en rapprocher. Cependant, ceci n est possible que s il existe une compréhension mécaniste de la maladie et du traitement Individualisation du choix du traitement Le premier pas vers la médecine personnalisée consiste en la stratification des patients en groupes. Pour cela il est nécessaire de cibler des biomarqueurs représentatifs de l évolution de la maladie et/ou prédictifs d une réponse positive. Puis, il faut savoir comment les utiliser pour établir un diagnostic précis, pour choisir un traitement ciblé quand il est disponible, pour suivre l efficacité du traitement et pour établir un pronostic sur l évolution du patient. Des lignes de conduite basées sur des essais cliniques passés permettent de définir des seuils pour de nombreux biomarqueurs et ainsi de définir des sous-groupes de patients pour lequel un certain traitement est préconisé. Cette médecine stratifiée est facilitée par l apparition de tests compagnons. La médecine stratifiée constitue un continuum vers la médecine individualisée où chaque patient constituerait une strate. Par exemple, en oncologie, les deux techniques sont pratiquées séquentiellement. Les patients sont d abord stratifiés en deux sous groupes : les bons répondeurs et les mauvais répondeurs par une analyse génomique. Les patients

38 Chapitre 2 : Les stratégies de traitement dans les pays du Nord 38 ayant une bonne signature tumorale reçoivent une thérapie standard alors que les mauvais répondeurs reçoivent une thérapie ciblée en fonction de la mutation présente. Ce choix spécifique peut s effectuer à la fois sur le type et la dose de traitement. L un des premiers exemples associant une maladie et un traitement spécifique est l Herceptest. Il est apparu en 1998 et permettait d identifier les patients avec un cancer du poumon métastatique de type HER-2, meilleurs répondeurs à l Herceptin [Perez et al., 1999]. Par ailleurs, la présence de la mutation ALK entraîne un choix particulier de la molécule de traitement [Choi et al., 2010]. Pour les cancers du sein, les patients exprimant le gène erbb2 bénéficient d une plus forte dose de chimiothérapie [Muss et al., 1994]. [Arias, 2011] propose un revue de la littérature concernant les thérapies ciblées en fonction de la génomique, de la protéomique ou encore de l imagerie des tumeurs. Cependant, le plus grand obstacle reste celui des connaissances ; en effet, le succès de cette médecine personnalisée dépend en grande partie de la disponibilité de tests diagnostiques [Papadopoulos et al., 2006] pour identifier les patients qui peuvent bénéficier d un traitement particulier. Dans le domaine du VIH, la médecine personnalisée (au sens de la connaissance de l hôte et du pathogène [Law et al., 2013]) en est encore à ses prémices, mais, le choix des molécules de traitement peut en partie être orienté par l analyse des virus du patient. Avant ou en début de traitement, le virus présent dans l hôte est majoritairement sauvage (chez 84% à 94% des patients [Ross et al., 2007]). Cependant, des mutations sur au moins un codon de l ARN viral arrivent 10 4 à 10 5 fois par jour chez les patients infectés par le VIH [Coffin et al., 1995]. Il est donc important de connaitre la quasi-espèce du patient pour orienter le choix des molécules de traitement. Concernant les tests de résistance, le test génotypique séquence l ARN et donc les gènes viraux afin de détecter certaines mutations qui confèrent des résistances aux traitements. Il permet de mettre en valeurs des mutations identifiées et classifiées (bases de données de type [ANRS-AC11-database, 2013, Stanford-database, 2013]) en terme de résistance à certaines classes de traitements, voir [Shafer, 2002] pour une revue de littérature. Un score de susceptibilité génotypique (GSS) peut être calculé comme le nombre

39 2.2 : Médecine personnalisée : vers une individualisation des traitements 39 total de traitements actifs, au vu des tests génotypiques, comparé au nombre de traitements donnés au patient. Par ailleurs, les tests phénotypiques consistent à regarder la capacité du virus de l hôte à se reproduire dans différentes concentrations de traitements en comparaison avec un virus de référence issu d une source sauvage (WT). Longs et coûteux, ils permettent de manière analogue au GSS de construire un Score de susceptibilité phénotypique (PSS). Ces tests de résistance sont associés à la réponse virologique [DeGruttola et al., 2000, Wittkop et al., 2008] et l essai clinique HAVANA [Tural et al., 2002] a démontré que l usage des tests génotypiques du VIH améliore les résultats virologiques. En effet, le choix de thérapies ciblées est utilisé en cas de résistances connues pour choisir un traitement auquel le patient est sensible [Meynard et al., 2002]. Ces tests ponctuels, souvent effectués à l initiation d un nouveau traitement, ne constituent que des recommandations stratifiées [Mallal et al., 2008, Fätkenheuer et al., 2005]. Cependant, l identification incomplète des mutations virales qui confèrent des résistances constitue une limitation à leur usage, en particulier pour les inhibiteurs de protéases [Rabi et al., 2013]. Les caractéristiques génomiques du patient infecté par le VIH peuvent aussi jouer un rôle sur la progression du VIH et la réponse au traitement. Par exemple, certaines versions de gènes présentent des interactions pharmacogénomiques [Rodriguez-Novoa et al., 2006, Haas et al., 2011] qui confèrent une hypersensibilité à certains traitements. Ainsi, pour certaines molécules telles que le MVC ou l ABC, un dépistage des polymorphismes individuels est réalisé. D autres allèles indiqueraient des progresseurs lents ou rapides vers le SIDA [den Uyl et al., 2004, Itescu et al., 1992]. La connaissance encore très parcellaire des gènes impliqués est une limite à leur utilisation.

40 Chapitre 2 : Les stratégies de traitement dans les pays du Nord Surveillance des réponses aux traitements et adaptations L approche générale de surveillance des réponses de traitements (Treatment Drug monitoring (TDM) en anglais) est la même pour toutes les maladies. Il s agit de surveiller les doses de traitement par des mesures pharmacocinétiques et les réponses du patient par des biomarqueurs ou des observations cliniques. Cela permet de déterminer les raisons d effets secondaires, de toxicité ou d échecs de traitement. En effet, des polymorphismes enzymatiques peuvent expliquer que certaines molécules ne se métabolisent pas de manière analogue entre les individus. En d autres mots, les métaboliseurs rapides pourraient être sur-dosés et les métaboliseurs lents sous-dosés expliquant les variabilités de réponses. Or, malgré les recherches pharmacogénomiques, il n existe pas de technique systématique pour le définir à l avance. Ainsi, pour la tuberculose, les TDM permettent de varier la dose de traitement administrée au patient pour la maintenir dans un intervalle cible afin d obtenir la meilleure efficacité [Peloquin, 2002]. Pour des maladies où les traitements à hautes doses sont très agressifs, comme les antidépresseurs tricycliques, les TDM permettent de détecter précocement une toxicité [Peveler et al., 1999]. Dans le domaine du VIH, pendant le suivi du traitement, un TDM est de plus en plus fréquemment établi. En 2002, un essai randomisé sur 40 patients [Fletcher et al., 2002] a permis de montrer qu un traitement de même dose chez chaque patient est sousoptimal par rapport à des doses choisies par TDM. Cependant, un grand nombre de molécules interviennent dans les cart et ne sont pas toutes aussi adéquates pour le TDM. Par exemple, les RTI présentent une étape de phosphorylisation qui rend difficile l association de leurs concentrations sanguines et intracellulaires avec leurs effets [Moore et al., 1999, Bazzoli et al., 2010], d où toute la difficulté d extrapoler et de comparer les effets in vitro et in vivo. Ce phénomène peut expliquer le fait que certains essais, tels que GENOPHAR [Bossi et al., 2004] ou encore PharmAdapt [Clevenbergh et al., 2002], ne trouvent pas de supériorité significative des TDM par rapport aux stratégies standard de traitement. Globalement, les TDM basés uniquement sur la pharmacocinétique ne seraient pas suffisants, mais, en incluant d autres facteurs telle qu une analyse conjointe avec

41 2.2 : Médecine personnalisée : vers une individualisation des traitements 41 les biomarqueurs spécifiques du VIH, la piste des TDM reste envisagée. Une revue de leurs différents avantages et inconvénients peut être trouvée dans [Gerber and Acosta, 2003, Rakhmanina and la Porte, 2012]. Ainsi, les TDM restent avantageux dans les situations où ils permettent au patient de continuer un traitement qu ils auraient autrement arrêté ou substitué par un autre traitement plus complexe [Schoenenberger et al., 2013]. Pour finir, nous pouvons noter que l évaluation par TDM des réponses aux traitements repose en grande partie sur l adhérence du patient et la possibilité de son observation. En effet, si par exemple l objectif est de contrôler la concentration plasmatique d équilibre de traitement chez le patient, son recueil ne sera possible que si le patient a correctement pris son traitement les jours précédents. Que l on s intéresse à des TDM ou au suivi simple de biomarqueurs, l adhérence est donc un facteur clé de la réussite de l adaptation des traitements d où leur analyse conjointe de plus en plus fréquente [Mentré et al., 2005, Savic et al., 2012]. Finalement, une question intéressante concernant l adaptation des traitement reste la simplification des traitements via l analyse du schéma de l adhérence : une adhérence aléatoire a-t-elle moins d impact qu une adhérence de type traitement intermittents en cycles courts. Les connaissances actuelles ne permettent pas de trancher, certains essais tendent à montrer un contrôle acceptable de l infection avec, par exemple, des traitements de type «une semaine sur deux» [Dybul et al., 2001], d autres essais sont stoppés précocement [Ananworanich et al., 2003]. Nous introduirons en perspectives comment ces travaux de thèse associés à un TDM pourraient permettre d évaluer l impact des schémas d adhérence. Le passage en revue de ces techniques de choix et d adaptation du traitement montre que l avenir des méthodes d adaptation des traitements dans le domaine du VIH semble être de faire du cas par cas, c est pourquoi notre champ d application sera l optimisation des traitements par individualisation. Dans le contexte de cette thèse, nous nous attacherons à des travaux méthodologiques dans lesquelles nous tâcherons de développer des outils statistiques pour améliorer l ajustement, la sélection et la prédiction de modèles décrivant la dynamique du VIH-1 pour rendre cela possible.

42

43 PARTIE II : Aspects mathématiques, statistiques et numériques des modèles dynamiques

44

45 Chapitre 3 Les modèles d analyse de la dynamique des biomarqueurs Résumé : L objectif est d analyser les données longitudinales de la charge virale et du nombre de CD4 des patients avec et sans cart. Nous présentons dans ce chapitre deux approches : les modèles descriptifs pour lesquels nous décrivons les modèles multivariés et les modèles causaux, et les modèles mécanistes dynamiques basés sur des systèmes d équations différentielles. Nous présentons chacun des modèles et les techniques d inférence associées dans le cadre de la modélisation VIH-système immunitaire. Mots-clés : effets mixtes ; équations d estimation généralisées (GEE) ; maximisation a posteriori (MAP) ; modèle causal ; modèle multivarié ; modèles structuraux marginaux (MSM) ; modèle à cellules cibles ; modèle mécaniste dynamique ; optimisation ; systèmes d équations différentielles ordinaires (ODE) ; fonction de vraisemblance. Abstract : The objective is to analyze longitudinal data of viral load and CD4 count of patients with and without cart. This chapter presents two different approaches : descriptive models for which we introduce multivariate modeling and causal models, and dynamic mechanistic models based on differential equations systems. Each model is introduced in the specific context of modeling the interaction between HIV and the immune system, and we present the associated inference techniques. Key words : maximization a posteriori (MAP) ; causal models ; generalized estimating equations (GEE) ; likelihood ; marginal structural models (MSM) ; mechanistic dynamic models ; mixed effets ; multivariate modeling ; optimization ; ordinary differential equations systems (ODE) ; target cells model.

46 Chapitre 3 : Les modèles d analyse de la dynamique des biomarqueurs Les modèles descriptifs Modèles multivariés Les modèles linéaires mixtes classiques [Laird and Ware, 1982] permettent de décrire les trajectoires pour la charge virale et les CD4, voir [Boscardin et al., 1998] pour une revue. Ils ont ensuite été étendus pour prendre en compte la censure à gauche de certains biomarqueurs [Jacqmin-Gadda et al., 2000], la sortie d étude informative [Lyles et al., 2000], les aléas stochastiques [Taylor et al., 1994], ou encore pour modéliser conjointement des événements de progression et de survie [De Gruttola and Tu, 1994]. Cependant, les CD4 et la charge virale sont des biomarqueurs intrinsèquement corrélés, il existe une dynamique entre ces populations. Ainsi, un modèle conjoint bivarié est montré comme plus adapté que deux modèles séparés [Thiébaut et al., 2003, Thiébaut et al., 2005]. Soit Y i = (Yi 1, Y2 i )T les biomarqueurs observés pour un individu i = 1,..., n. Y 1 i (resp. Yi 2 ) est un vecteur de n i observations de la charge virale (resp. nombre de CD4). Un modèle conjoint à effets mixtes s écrit : Y i = X i β + Z i γ i + ɛ i ɛ i N (0, Σ) γ i N (0, G), où β = (β 1, β 2 ) T est le vecteur des effets fixes associé à X i = (X 1 i, X2 i )T où X k i est la matrice de taille n i n k p, avec n k p le nombre de covariables explicatives pour les effets fixes pour le biomarqueur k = 1, 2. De plus, γ i = (γ i 1, γ i 2) T est le vecteur des effets aléatoires associé à Z i = (Z 1 i, Z2 i )T où Z k i la matrice de taille n i n k q, avec n k q le nombre de covariables associées aux effets aléatoires pour le biomarqueur k = 1, 2. La matrice de variance-covariance Σ est supposée diagonale. Les éléments diagonaux σ 1 et σ 2 sont les erreurs de mesure pour chaque biomarqueur. La matrice de variance-covariance des effets aléatoires G, supposée non structurée, permet de prendre en compte la corrélation entre les deux biomarqueurs. Par le biais de l hypothèse de normalité des erreurs de distribution telle qu elle est faite ici, la solution de cette équation est le maximum de

47 3.1 : Les modèles descriptifs 47 vraisemblance qui peut être trouvé par des algorithmes de maximisation de type Newton- Raphson ou encore l algorithme Espérance-Maximisation (EM) [Dempster et al., 1977, Lindstrom and Bates, 1988]. Cependant, dans le cadre de cette thèse, nous sommes plus particulièrement intéressés par l évaluation des effets traitement ; ainsi les modèles présentés ci-dessus ne sont pas valides pour tous les types de données. En effet, si nous travaillons sur des essais randomisés, alors les patients sont répartis de manière aléatoire entre le groupe traitement et le groupe contrôle. Ainsi, une interprétation directe des coefficients des modèles de régression sera permise. En revanche, dans des données observationnelles, l attribution du traitement n est pas due au hasard, mais dépend des marqueurs qui servent aussi à évaluer l efficacité du traitement. En d autres termes, certaines des covariables explicatives (X i, Z i ) sont fortement corrélées avec les variables d intérêt Y i. Ainsi, l estimation de l effet causal du traitement requiert une modélisation particulière Les modèles causaux Concept de causalité Dans la théorie traditionnelle de la causalité, des variables aléatoires sont manipulées et représentent la réalisation d événements. Nous cherchons à distinguer une association et une relation causale entre A (la cause) et Y (la conséquence). Par exemple, A peut représenter la mise sous traitement et Y l impact sur un biomarqueur ou le biomarqueur lui-même. Il s agit d établir une relation entre A et Y en présence de facteurs de confusion mesurés L et non mesurés U. Pour avoir une bonne compréhension de la situation, [Robins, 1987] a proposé les graphes dirigés acycliques (DAG) comme méthode de visualisation des problèmes causaux (Figure 3.1). Plusieurs théories ont été développées pour appréhender la causalité. Nous pouvons classer les principales graduellement en fonction de leur degré d implication requis entre A et Y. Les théories probabilistes [Suppes, 1970] regardent si l occurrence de A augmente la probabilité de Y toutes choses étant égales par ailleurs. Une association significative

48 Chapitre 3 : Les modèles d analyse de la dynamique des biomarqueurs 48 Facteurs de confusion L Traitement A U Facteurs de confusion non mesurés Y Biomarqueurs Figure 3.1 : Modèles causaux : définition de l effet entre A et Y en fonction des facteurs de confusion L et U. suffisamment forte doit être mise en évidence pour parler de causalité, cependant la magnitude requise et l interprétation restent subjectives. Ainsi, le courant interventionniste étudie la causalité entre A et Y en regardant s il est possible de changer Y en modifiant A [Eberhardt and Scheines, 2007] mais le choix de l intervention peut être crucial quant à la conclusion de l analyse. Une approche plus radicale, basée sur des théories contrefactuelles [Rubin, 1974, Höfler, 2005], définit la causalité comme le fait que Y n aurait pas pris les valeurs qu il a prises si A ne s était pas produit. Nous présenterons ici des modèles dans le cadre de cette dernière approche bien qu elle soit controversée. En effet, le résultat de l inférence est basé sur des hypothèses inobservables puisqu il s agit de l évaluation des conséquences d alternatives passées non réalisées ; voir [Dawid, 2000] pour une revue. Par ailleurs, [Commenges and Gégout-Petit, 2009] soulignent que les DAG ne font pas intervenir le temps de manière continu et ne permettent donc pas de prendre en compte des relations cycliques (comme le fait que les biomarqueurs peuvent eux aussi avoir un impact sur la mise sous traitement, voir Figure 5.1 Section 5). En effet, pour rester dans le cadre acyclique, la situation classique des facteurs de confusion dépendant du temps se présente en temps discret comme l impact de A au temps t sur Y au temps t + 1. Dans la Section 3.2 et la Section 5 nous étendons ces concepts à des modèles dynamiques où A et Y sont des processus.

49 3.1 : Les modèles descriptifs G-calculs Pour ces méthodes descriptives, l idée est de corriger la provenance des données pour simuler le fait qu elles viennent d un essai randomisé. Initialement, [Robins, 1987] s est intéressé à l espérance d observation de Y sachant le traitement en A en s affranchissant par intégration des facteurs de confusion L : E [Y A = a] = E [Y A = a, L = l] dp l. l Il propose des algorithmes de calcul de l estimateur Ê [Y A = a] utilisant un rétrocalcul à l aide de méthodes itératives appelées G-calculs. Initialement, [Greenland, 2004] traite l effet du traitement en binaire (oui/non) en évaluant par la quantité C 1/0 = Ê [Y A = 1] Ê [Y A = 0], cependant les calculs sont très lourds. Plus tard, des méthodes semi-paramétriques de G-calcul ont été développées [Robins et al., 1992] et permettent d alléger les calculs. Cela a permis de faire des hypothèses sur les différences de niveaux de traitement (N 1,..., N K ) et de quantifier C N1 /0,..., C NK /0. Bien qu ils permettent un bon ajustement sur les facteurs de confusion observés L, les G-calculs restent lourds en terme de calculs en particulier en cas de données censurées et ne seront pas utilisés dans la suite de ces travaux Modèles structuraux marginaux Une alternative est les modèles de régression ajustant sur les variables de choix du traitement qui sont des facteurs de confusion observés L [Greenland and Robins, 1986]. Cependant, les théories d ajustement classiques ne suffisent pas. Ni l introduction des L en tant que facteurs de confusion ni la stratification par L ne parvient à estimer de manière consistante l effet total du traitement [Robins, 1989]. Ainsi, [Robins, 1998, Robins et al., 2000] ont développé une nouvelle classe de modèles appelés : modèles structuraux marginaux (MSM) qui pondèrent l inférence par des poids correspondant aux probabilités inverses de traitement et de censure pour chaque temps et pour chaque patient.

50 Chapitre 3 : Les modèles d analyse de la dynamique des biomarqueurs 50 Si nous notons A ij+1 la mise sous traitement du patient i au temps j +1, cette quantité dépend des valeurs passées des différents traitements : Āij = (A i0, A i1,..., A ij ). De plus, elle dépend des covariables d intérêt jusqu au temps j : L ij = (L i0, L i1,..., L ij ), où L ij est le vecteur des p facteurs de confusion observés pour le patient i au temps j. De plus, les valeurs passées des biomarqueurs Y sont incluses dans les facteurs de confusion, car elles influencent le choix du traitement, ainsi Y ij L ij. Il est alors possible de construire un modèle marginal causal : E [ ] Y ij Āij, L i0 = µij. (3.1) Généralement, ce type de modèle causal fait intervenir un modèle de régression en Āij du type g(β 0 + β 1 A ij ) [Cole et al., 2003]. Le régresseur β 1 représente alors l effet traitement. Pour estimer les coefficients β 0 et β 1 en ajustant sur ( X ij, L ij ), les variables ayant permis le choix de mise sous traitement, nous calculons les probabilités inverses de traitement. Nous notons f(..) la valeur de la fonction de vraisemblance conditionnelle aux covariables des observations, les poids de probabilités inverses de traitement sont définis par : W A ij = j k=0 f(a ik Āik 1, L i0, C ik = 0) f(a ik Āik 1, L ik, C ik = 0), où ces poids W A ij peuvent être vus comme la probabilité qu un patient i reçoive un traitement au temps j sachant les traitements précédents reçus sur la probabilité que ce même patient reçoive le traitement qui lui a été attribué sachant son historique de traitement et de réponse aux traitements. De manière analogue, il faut aussi ajuster sur la sortie d étude. En définissant un indicateur de censure C ij valant 1 si le patient i est censuré à la visite j et 0 sinon, il est possible de définir des poids de probabilités inverses de censures : j+1 Wij C = k=0 P [ C ik = 0 C ik 1 = 0, Āik 1, L i0 ) ] P [ C ik = 0 C ik 1 = 0, Āik 1, L ik 1 ]. Ainsi, ajuster sur la mise sous traitement et la sortie d étude dans ces modèles est possible grâce aux poids : W ij = W A ij W C ij.

51 3.1 : Les modèles descriptifs 51 En appelant σ 2 la variance de l erreur résiduelle gaussienne du modèle décrit par l équation 3.1, la contribution marginale à la vraisemblance pour un patient i au temps j n est pas la même pour tous les patients à tous les temps. Elle est pondérée par les probabilités d attribution de traitement w ij et s écrit : { [ p(y ij Āij, L 1 ij ) = exp 1 ( ) ]} 2 wij yij µ ij. (3.2) 2πσ 2 σ Elle est aussi définie pour les données censurées à gauche [Cole et al., 2007]. L estimation peut se faire ensuite par GEE (équation d estimation généralisée [Liang and Zeger, 1986, Diggle et al., 1994]) qui diffère du maximum de vraisemblance, car elle ne fait une hypothèse que sur les moments d ordre un de Y ij et le caractère borné du moment d ordre deux. L approche GEE permet d estimer les paramètres dans des modèles multivariés où les variables d intérêt sont corrélées, car elle prend en compte une matrice de corrélation de travail (notée par la suite R i ). Il s agit d étendre l équation du score d une vraisemblance classique à une vraisemblance pondérée comme définie équation 3.2. Nous notons Y i = (Y i1,..., Y ini ) T et W i = (W i1,..., W ini ) T des vecteurs de taille n i. Nous reprenons les notations de la Section : X i = A i1... A ini L 1 i1... L 1 in i L p i1... L p in i, est la matrice de taille n i par le nombre de facteurs de confusion observés du modèle. Le modèle de régression marginal s écrit donc : µ i = g(x i β). De plus, R i la matrice de corrélation de travail nécessaire pour les GEE sera choisie diagonale dans ces problématiques pour éviter un biais résiduel quand certaines variables explicatives sont dépendantes du temps [Sullivan Pepe and Anderson, 1994]. Ainsi, obtenir un estimateur de β, c est trou-

52 Chapitre 3 : Les modèles d analyse de la dynamique des biomarqueurs 52 ver la solution de : n i=1 X T i R 1 i W i (Y i X i β) = 0. Cette approche ne s applique pas uniquement aux données longitudinales observationnelles. Dans le cadre d essais randomisés, cette approche est inutile, mais valide. En effet, lorsque l attribution du traitement ne dépend que des covariables au temps de base, f(a ik Āik 1, L i0, C ik = 0) = f(a ik Āik 1, L ik, C ik = 0) et donc i, j, W A ij = 1 ce qui revient à faire une GEE non pondérée. Par ailleurs, cette approche peut être étendue en une GEE augmentée qui permet de prendre en compte des problématiques particulières telles que des essais en sous-groupes ou des variables d intérêt corrélées [Stephens et al., 2012]. Ces modèles, qui peuvent être qualifiés de descriptifs, conduisent à des estimateurs biaisés s il existe des facteurs de confusion non mesurés pour la mise sous traitement ou la trajectoire des biomarqueurs [Cole and Hernán, 2002]. Or, si cela est possible, il n existe pas de méthode pour tester cette hypothèse sur les données. 3.2 Les modèles dynamiques mécanistes explicatifs Par opposition, les modèles mécanistes explicatifs ne reposent pas sur l analyse de données, mais en premier lieu sur la transcription de connaissances physiopathologiques. En d autres termes, par mécaniste nous voulons dire que nous essayons de traduire par des équations différentielles les lois expliquant les phénomènes observés. Dans notre cas, il s agit de prendre en compte les interactions complexes existant entre le système immunitaire et le VIH par l intermédiaire de systèmes d équations différentielles Vocabulaire et Notations Différents types de modèles dynamiques Les systèmes d équations différentielles, autrement appelés systèmes dynamiques, sont utilisés en physique, ingénierie et épidémiologie. Ils permettent d exprimer comment un

53 3.2 : Les modèles dynamiques mécanistes explicatifs 53 système X(t) évolue à l instant t en fonction de lois physiques. Il existe différents types de systèmes dynamiques décrits ci-dessous. Les systèmes d équations différentielles ordinaires (ODE) relient les valeurs d une fonction à celles de ses dérivées. Il s agit d écrire une relation entre une quantité continue et ses taux de changements dans le temps. C est, sauf rares digressions, cette classe de systèmes dynamiques que nous utiliserons dans ces travaux de thèse. Cependant, il existe des extensions décrites ici. Les systèmes d équations différentielles partielles (PDE) contiennent des fonctions multivariées (f(x, y, z)) et leurs dérivées partielles ( f(x,y,z) ) par rapport à certains x paramètres. Elles sont particulièrement utilisées pour représenter des phénomènes spatiaux multidimensionnels ou lorsqu il existe des phénomènes multi échelles à modéliser [Jacquez et al., 1988]. Par exemple, lorsqu il s agit de mesurer l effet des PI sur le déclin du virus de l hépatite humaine (HCV), les PDE sont utilisées, car il est important de dissocier une dynamique au niveau intra et extra cellulaire [Rong et al., 2013]. Ces méthodes ne sont à ce jour que peu utilisées dans le domaine de la modélisation des biomarqueurs du VIH, car elles alourdissent les calculs. Cependant, le mode d action de nouveaux antirétroviraux, par exemple les II dont l action se situe au niveau de l intégration de l ADN viral au noyau [Sedaghat et al., 2008], pourra pousser à prendre en compte ce type de modélisations, au prix de mesures beaucoup plus précises des activités intracellulaires. Les systèmes d équations différentielles stochastiques (SDE) permettent de modéliser des trajectoires aléatoires. Il s agit d ajouter un élément différentiel Brownien ou un bruit au système lui-même. Majoritairement utilisés dans des études de simulation, ces approches permettent de capturer la variabilité non expliquée par les parties déterministes des équations différentielles. Elles sont en particulier utilisées pour modéliser les mutations du virus [Ribeiro and Bonhoeffer, 2000, Savkovic et al., 2012, Wang et al., 2013], pour décrire la dynamique du virus en primo-infection où les nombres de cellules sont petits et les temps de progression

54 Chapitre 3 : Les modèles d analyse de la dynamique des biomarqueurs 54 inconnus et variables [Tan and Wu, 1998, Banks et al., 2003] ou durant les pics d infection virale [Conway and Coombs, 2011] Les systèmes d équations différentielles ordinaires (ODE) Dans le cadre des modèles non linéaires à effets mixtes basés sur des équations différentielles ordinaires (NLME-ODE), nous considérons un échantillon de n patients indépendants. À chaque instant t R+, l espace d états est composé de K composantes X i (t) = (X1(t), i..., XK i (t)). Les trajectoires de ces composantes dépendent de paramètres intrinsèques au modèle et aux individus ξ i = (ξ i1, )..., ξ inp et des fonctions f et h supposées bijectives deux fois différentiables : dx i (t) dt = f[x i (t), ξ i (t)], X i (0) = h[ξ i (0)]. (3.3) Afin d être capables de prendre en compte des données longitudinales issues de plusieurs individus, nous adoptons une approche populationnelle. Ainsi, les paramètres ξ i sont modélisés en fonction : d interceptes fixes (φ de taille n p ) qui sont des effets fixes constants dans la population, et représentent les valeurs moyennes des paramètres biologiques, d effets fixes de covariables (nommés β qui est une matrice de taille n p n e ) qui représentent l effet moyen des covariables sur les paramètres biologiques ; le vecteur de taille n e (le nombre de covariables) composé des covariables potentiellement dépendantes du temps se note z i (t), d effets aléatoires (u i de taille n q n p ) représentant une variabilité interindividuelle inexpliquée et permettant une déviation de certains paramètres des individus par rapport aux valeurs fixes ; nous supposerons u i N (0, Σ) avec Σ une matrice diagonale pour simplifier les calculs même si [Dumont et al., 2013] montre l avantage de considérer les corrélations entre les effets aléatoires ; nous posons Σ = [ (ω 2 j ) i=j, 0 i j, i = 1,..., n q, j = 1,..., n q ].

55 3.2 : Les modèles dynamiques mécanistes explicatifs 55 Une modélisation linéaire est proposée pour une transformation ξ i des paramètres ξ i. En général, les quantités représentées par les paramètres sont des quantités positives et nous adoptons une transformation logarithmique : ξ i = log(ξ i ). Cependant, d autres types de transformations peuvent être adoptées, par exemple, les transformations logistiques pour des paramètres à valeur dans [0; 1]. Nous écrivons le modèle statistique défini par un modèle à effets mixtes : ξ i = φ + β T z(t) i + u i. (3.4) Il n est souvent pas possible d observer un système en temps continu ( t R) : en pratique chaque patient i a donc un certain nombre de mesures n i réalisées aux temps t ij avec j = 1,... n i. De plus, les K composantes du système dynamique ne sont pas toujours observées et seules K K combinaisons (g 1 1 [X i (t ij )],..., g 1 K [Xi (t ij )]) le sont. Pour finir, pour rendre possible les procédures d estimation, nous supposons qu il existe une fonction de lien bijective g 2 (.) = [g1(.), 2..., gk 2 (.)] assurant la normalité et l homoscédasticité des erreurs de mesures [Box and Cox, 1964]. Nous notons g = g 1 og 2 la fonction multivariée qui relie les observations discrètes et bruitées du système notées Y i (t ij ) = [Y i 1 (t ij ),..., Y i K (t ij)] aux X i (t). Le modèle d observation s écrit pour tout m = 1,... K : Y ijm = g m [X i (t ij )] + ɛ ijm, ɛ ij N (0, V), V = ( (σ 2 j ) i=j, 0 i j, i = 1,..., K, j = 1,..., K ).. (3.5) Les modèles NLME-ODE sont donc définis avec un modèle mathématique (de la forme de l équation 3.3), un modèle statistique (de la forme de l équation 3.4) et un modèle d observation (de la forme de l équation 3.5). Dans ce cadre, il existe deux grands types d applications décrits ci-dessous. L approche de simulation mathématique, autrement appelée descendante, permet de simuler les trajectoires X i (t, ξ i ) des composantes X i (t) pour une fonction f

56 Chapitre 3 : Les modèles d analyse de la dynamique des biomarqueurs 56 et des paramètres ξ i donnés. Lorsqu il n existe pas de solution analytique, cela est rendu possible par des méthodes de simulations numériques [Lambert, 1974, Gupta et al., 1985, Butcher, 2008]. [Hull et al., 1972] ont comparé de nombreuses méthodes et montré que les méthodes de différenciation (BDF - backward differentiation methods en anglais) [Gear, 1971] sont plus efficaces que les approches de Runge-Kutta ou d extrapolations trapézoïdales. Ainsi, nous avons choisi d utiliser la méthode BDF du solveur LSODE (Livermore Solver for Ordinary Differential Equations) implémentée dans de nombreux langages, dont Fortran [Hindmarsh, 1983, Radhakrishnan and Hindmarsh, 1993]. L approche d inférence statistique, appelée parfois ascendante résout le problème inverse qui est d inférer la valeur des paramètres du système en fonction des données Y i (t). C est cet aspect qui nous intéressera dans ces travaux de thèse où nous proposons d estimer le vecteur de paramètres : θ = [ ] (φ k ) k=1,...,np, (β k ) k=1,...,ne, (ω) k=1,...,nq, (σ k ) k=1,...,k. Pour résoudre ce problème, nous avons besoin de résoudre répétitivement les systèmes ODE pour différentes valeurs de paramètres et donc d utiliser l approche descendante Algorithmes d estimation en modèles NLME-ODE Méthodes d inférence disponibles Pour l estimation des paramètres dans ces modèles, les méthodes non paramétriques par analyse fonctionnelle [Wang et al., 2012] sont encore très confidentielles sans réelle interface utilisateurs ; cependant, des méthodes paramétriques supposant la normalité des observations Y existent. Les premières approches consistent à estimer les paramètres patient par patient puis à agréger les données en utilisant des indicateurs de dispersion empiriques [Ribeiro et al., 2002, Dixit and Perelson, 2005] ou des moyennes modifiées

57 3.2 : Les modèles dynamiques mécanistes explicatifs 57 en tenant compte de contraintes de dispersions sur les paramètres [Steimer et al., 1984, Davidian, 1995]. Cependant, ces approches ne permettent pas de tirer parti de l information populationnelle contenue dans les données. Les méthodes des modèles à effets mixtes non linéaires classiques [Lindstrom and Bates, 1990] basées sur la formule analytique exacte de la vraisemblance ne peuvent pas être appliquées, car la plupart du temps, les équations différentielles utilisées n ont pas de solution analytique (en particulier dû à leur non-linéarité). La vraisemblance peut en revanche être calculée en utilisant les solveurs numériques issus des méthodes descendantes, puis optimisée. Cependant, la présence d effets aléatoires implique un modèle hiérarchique où la vraisemblance conditionnelle aux effets aléatoires peut être facilement calculée, mais doit être intégrée pour obtenir la vraisemblance marginale. Plusieurs approches basées sur l approximation de la vraisemblance ont été proposées [Pinheiro and Bates, 1995], mais les approches peuvent conduire à des estimations contradictoires lorsque l approximation choisie est trop grossière au regard de la structure de la vraisemblance [Ding and Wu, 2001]. Une alternative est l algorithme SAEM (Approximation stochastique de l espérance Maximisation) implémenté dans le logiciel MONOLIX [Kuhn and Lavielle, 2005] et dans NONMEM [Beal et al., 1992] qui est une version particulière stochastique de l algorithme EM [Dempster et al., 1977]. Cependant, en temps fini, la stabilisation à des maxima locaux à cause de diminution mécanique du pas de déplacement est l un des principaux inconvénients. Par ailleurs, l usage de la vraisemblance hiérarchique [Lee and Nelder, 1996] sans utilisation de corrections spécifiques telles que le bootstrap est légèrement biaisé [Commenges et al., 2011]. Ainsi, le calcul numérique des intégrales semble la meilleure des solutions, en particulier par les méthodes de quadratures adaptatives gaussiennes [Plan et al., 2012]. Bien qu en pratique les intégrales numériques multiples entraînent une précision de calcul limitée, cette méthode permet le calcul numérique de la vraisemblance exacte. Ainsi, [Guedj et al., 2007a] ont proposé une approche d estimation directe par maximisation de la vraisemblance que nous proposons d étendre et d utiliser.

58 Chapitre 3 : Les modèles d analyse de la dynamique des biomarqueurs 58 Par ailleurs, en complément des approches fréquentistes présentées ci-dessus, des techniques bayésiennes ont permis de grandes améliorations dans l estimation des paramètres. En effet, il y a souvent des problèmes d identifiabilité [Guedj et al., 2007b, Miao et al., 2011]. L inférence bayésienne est souvent réalisée grâce aux méthodes de Monte-Carlo par chaînes de Markov (MCMC) [Putter et al., 2002, Huang et al., 2006, Gilks et al., 1996] implémentées par exemple dans WinBUGS [Lunn et al., 2000]. Évitant les intégrations numériques, [Drylewicz et al., 2010] montre que ces méthodes sont très coûteuses en terme de temps de calcul et ne permettent donc pas parfois l estimation. Plus rapides, les méthodes basées sur des approximations de Laplace de la loi a posteriori, telles que la méthode INLA [Rue et al., 2009], ne sont pas utilisables quand les ODE utilisées ne possèdent pas de solution analytique. Ainsi, l algorithme de [Guedj et al., 2007a] a été étendu dans un cadre bayésien approximé et est décrit dans les Sections suivantes [Drylewicz et al., 2012] Validité de l approximation normale de l a posteriori Le rationnel de cette approche repose sur le fait que la distribution a posteriori des paramètres p(θ Y 1,..., Y n ) peut être approximée. [Tierney and Kadane, 1986] ont proposé une approximation basée sur l approximation de Laplace des intégrales. Au vu de la complexité de notre problématique, nous nous intéressons à l approximation normale de l a posteriori. Cette dernière peut être justifiée par la convergence de la distribution a posteriori vers une loi normale énoncée dans le théorème de Bernstein von-mises [van der Vaart, 2000]. Nous notons ˆθ n un estimateur asymptotiquement efficace de θ (tel que le maximum de vraisemblance) et I 1 θ n l information de Fischer individuelle prise en ce point. Alors, en distance de variation totale notée., dans le cas fréquentiste paramétrique, nous avons la convergence en probabilité de la distribution a posteriori vers une loi normale d espérance ˆθ n et de variance I 1 θ n /n : ( ) p(θ Y 1,..., Y n ) N ˆθ n, I 1 θ n P 0. (3.6) n n +

59 3.2 : Les modèles dynamiques mécanistes explicatifs 59 Il existe aussi d autres versions de ce théorème, par exemple, la convergence peut être montrée en terme de risque de Kullback-Leiber [Clarke, 1999]. Par ailleurs, si nous notons θ la vraie valeur des paramètres dans la population, le théorème de consistance de Doob [van der Vaart, 2000] garantit la convergence en loi de la distribution a posteriori vers un dirac en θ : p(θ Y 1,..., Y n ) L n + δ θ Inférence par approximation normale de l a posteriori Calcul de la vraisemblance pénalisée En reprenant les notations définies dans la Section , nous notons y ijm les trajectoires observées des biomarqueurs et X(t ijm, ξ i ) les trajectoires prédites pour les paramètres ξ i pour le patient i au temps j du compartiment m. Il est possible d écrire la vraisemblance de l individu i conditionnellement aux effets aléatoires u i : p (y i u i, z i, θ) = n i K j=1 m=1 ( 1 exp 1 σ m 2π 2 y ijm g m (X(t ijm, ξ ) i 2 )), σ m où les trajectoires X(t ijm, ξ i ) sont évaluées par une approche descendante à l aide d un solveur d équations différentielles. Par ailleurs, il est nécessaire de prendre en compte les problèmes méthodologiques posés par la censure à gauche (notamment de la charge virale) [Jacqmin-Gadda et al., 2000]. En notant, ζ m le seuil de censure à gauche du biomarqueur m, δ ijm = I yijm >ζ m est une indicatrice de censure pour l individu i au temps j, nous avons : p(y i u i, z i, θ) = n i K j=1 m=1 ( 1 exp 1 σ m 2π 2 { Ψ ( y ijm g m (X(t ijm, ξ i )) σ m ζ m g m (X(t ijm, ξ )} i 1 δijm ), σ m ) 2 δ ijm

60 Chapitre 3 : Les modèles d analyse de la dynamique des biomarqueurs 60 où Ψ est la fonction de répartition d une loi normale centrée réduite. Intégrer par rapport aux effets aléatoires, par exemple avec des méthodes d intégration numérique, permet d obtenir la contribution marginale de l individu i à la vraisemblance observée. En notant Φ la loi normale des effets aléatoire, nous avons : p(y i z i, θ) = p(y i u i, z i, θ)φ(u)du. (3.7) u R q La vraisemblance observée pour tous les patients, supposés indépendants et identiquement distribués, est obtenue de manière multiplicative et s écrit donc : p(y z, θ) = n p(y i z i, θ). i=1 Afin de travailler dans un cadre bayésien, un terme de pénalité est construit. Il se base sur deux grands types d a priori décrits ci-dessous. Les a priori informatifs permettent d introduire dans le modèle une information issue d analyses précédentes. C est ce type d a priori qui est choisi pour les effets fixes du modèle pour lesquels il existe des études in vitro et in vivo précédentes les quantifiant : ((φ k ) k=1,...,np, (β k ) k=1,...,ne ) T N (E 0, V 0 ). Les a priori non informatifs qui permettent de rester dans un cadre bayésien, alors même que l on ne dispose pas d information a priori. Pour les erreurs de mesure, ( ) σ 2 k, nous pourrons utiliser une loi de type Jeffreys (π(σ) = 1/σ). Pour k=1,...,k les variances des effets aléatoires, (ω 2 ) k=1,...,nq, nous pourrons choisir des a priori demi-cauchy de médiane s 2 plutôt que des lois gamma classiquement utilisées ; en effet, elles mettent une masse trop forte en zéro, restreignant la magnitude des effets aléatoires [Gelman, 2006, Polson and Scott, 2012]. Ainsi, nous prenons pour a priori π(ω) = (ω 2 + s 2 ) 1. Un autre choix est de ne pas pénaliser sur les variances des erreurs de mesure et les variances des effets aléatoires et ainsi d adopter comme a priori une loi uniforme.

61 3.2 : Les modèles dynamiques mécanistes explicatifs 61 Ainsi, la fonction de pénalisation pour la log-vraisemblance s écrit : J(θ) = J 1 (θ) + J 2 (θ), avec, J 1 (θ) = n p j=1 [φ j E(φ j )] 2 2V(φ j ) + n e j=1 [β j E(β j )] 2, 2V(β j ) et J 2 (θ) = 0 si un a priori uniforme est choisi sur les termes de variances, sinon : n q K J 2 (θ) = + log(ω 2 j + s 2 j ) + log(σ j ). j=1 j=1 D après le théorème de Bayes nous avons p(θ z, y) π(θ)p(y z, θ). Le logarithme de la densité a posteriori est donc égal (à une constante près) à la log-vraisemblance pénalisée : L P (y, θ) = ln [p(y z, θ)] J(θ). } {{ } L(y,θ) Le maximum a posteriori (MAP) noté θ MAP = argmax(l P (y, θ)) est l estimateur de θ : [ ( ) θ MAP = ˆφ k k=1,...,n p, ( ˆβ k ) k=1,...,n e, (ˆω) k=1,...,nq, (ˆσ k ) k=1,...,k ]. [Diaconis and Freedman, 1986] ont prouvé que le MAP est asymptotiquement équivalent au maximum de vraisemblance. En effet, le MAP peut être vu comme un barycentre pondéré entre les a priori et la valeur de l estimateur de maximum de vraisemblance en théorie classique. Ainsi, la vraisemblance pénalisée peut être approximée par une loi normale (voir théorème de Bernstein von-mises Section équation 3.6) d espérance θ MAP et de variance H 1 (θ MAP ), qui est l inverse de la dérivée seconde par rapport aux paramètres de L P (y, θ) prise au mode θ MAP. En pratique, on obtient une meilleure approximation de l a posteriori par N (θ MAP, H 1 (θ MAP )) qu en utilisant le maximum de vraisemblance N (θ MV, H 1 (θ MV )).

62 Chapitre 3 : Les modèles d analyse de la dynamique des biomarqueurs 62 Optimisation et déplacements L algorithme de type Newton-Raphson peut être utilisé pour trouver θ MAP. Le schéma itératif de cet algorithme permet de se déplacer sur la surface à n p +n e +n q +K dimensions en fonction des pentes (U) et de la courbure (H) : θ (k+1) = θ (k) H 1 (θ (k) )U(θ (k) ). Dans un algorithme de Newton-Raphson classique, le déplacement requiert que H soit inversible. Si ce n est pas le cas, on peut utiliser l algorithme de Marquardt basé sur l augmentation de la diagonale de la matrice H [Marquardt, 1963]. Nous prenons H = H + νi où I est la matrice identité et ν est un coefficient d adaptation qui tend vers 0 si H devient inversible. La façon classique de calculer numériquement U et H consiste à faire des différenciations finies de la fonction objectif L P (y, θ). En notant dθ et dθ deux petits déplacements, nous avons : Ũ(θ) = LP (y, θ + dθ) L P (y, θ dθ), 2dθ et, H(θ) = LP (y, θ + dθ + dθ ) L P (y, θ + dθ) L P (y, θ + dθ ) + L P (y, θ) dθdθ. La précision de l approximation repose sur le choix de dθ, ainsi, [Guedj et al., 2007a] ont proposé une alternative qui repose sur le calcul analytique des dérivées appelées scores. Afin d illustrer cette approche, nous ne présenterons ici les formules analytiques de calcul des scores que pour les effets fixes φ, pour les autres types de paramètres le lecteur peut se référer à [Guedj et al., 2007a]. Comme pour la vraisemblance, le score est calculé

63 3.2 : Les modèles dynamiques mécanistes explicatifs 63 conditionnellement aux effets aléatoires pour chaque individu, pour tout l = 1,..., n p : U φ l (y i u i, θ) = ln(p(y i u i, z i, θ)) ξ i, l = n i K 1 σ 2 j=1 m=1 m g m (X(t ijm, ξ i )) ξ i l [ y ijm g m (X(t ijm, ξ ] i )), où, les équations de sensibilité 1 du système d équations différentielles ( Xk (t, ξ i ) ) peuvent en général être définies analytiquement et permettent de calculer : ξ i l g m (X(t, ξ i )) ξ i l = K k=1 g m (X(t, ξ i )) X k (t, ξ i ) X k (t, ξ i ) ξ i. l La contribution marginale individuelle au score est obtenue par intégration numérique : U i (θ) = (p(y i z i, θ)) 1 R q p(y i u i, z i, θ)u(y i u i, θ)φ(u)du. Le score global est obtenu en sommant pour tous les individus puis en le pénalisant avec la dérivée de J(θ) : U P (θ) = n i=1 U i (θ) J(θ) θ. Dériver une seconde fois le système d équations différentielles est possible, mais amènerait à un système d équations de sensibilité secondes de grande, difficile à manipuler. 1. Exemple Soit le système d équations différentielles suivant, avec {a, b, c, e, f} R 5 : { dx dt = ax + by + c dy dt = ex + fy Les équations de sensibilité liées au paramètre a sont les suivantes : dx dt = ax + by + c dy dt = ex + fy dx a dt = X + ax a + by a dy a dt = ex a + fy a

64 Chapitre 3 : Les modèles d analyse de la dynamique des biomarqueurs 64 De plus, le calcul par différentiation finie est coûteux en terme de temps. Ainsi, certains auteurs tels que [Hedeker and Gibbons, 1994] ont proposé de faire une approximation de H en l écrivant comme la somme pour tous les individus de l échantillon du produit scalaire des U : n i=1 U i U it, voir aussi l algorithme BHHH [Berndt et al., 1974]. [Commenges et al., 2006] propose comme extension l algorithme RVS (robust variance scoring en anglais) permettant le calcul de H par son approximation G qui est la variance des scores. Un terme de pénalité qui est la dérivée seconde J(θ) est ajouté : G P (θ) = n i=1 U i (θ)u it (θ) 1 n U(θ)U T (θ) + 2 J(θ) θ 2. Finalement, une recherche linéaire [Potra and Shi, 1995] du meilleur déplacement, fraction du déplacement initial calculé par U et G, permet d optimiser la vraisemblance pénalisée pour trouver θ MAP Les modèles dynamiques mécanistes pour le VIH Modèle simple Les premiers travaux se sont intéressés à la dynamique virale après mise sous traitement. Ils partaient de la constatation biologique que «le virus V est produit par des cellules infectées à un taux noté π et meurt à un taux µ V supposé constant», l équation différentielle s écrit dv dt = π µ V V [Ho et al., 1995]. En faisant des hypothèses sur les conditions initiales, nous pouvons résoudre de manière analytique cette équation. Un modèle comparable peut être appliqué aux CD4 [Wei et al., 1995]. Le premier avantage des modèles dynamiques est ici clairement identifié puisqu il permet aux cliniciens et aux biologistes une interprétation directe des paramètres de ces modèles comme des grandeurs physiques (essentiellement des taux de création et de décès). Modéliser conjointement les deux biomarqueurs conduit à un modèle analogue à un modèle proie-prédateur [Volterra, 1928]. En 1996, [Perelson et al., 1996] affinent le modèle en combinant la dynamique des CD4 (infectés et non infectés) à celle du virus. Ils pré-

65 3.2 : Les modèles dynamiques mécanistes explicatifs 65 sentent alors un modèle dynamique à trois composantes (Figure 3.2). La règle biologique observée est la suivante : «les cellules CD4 sont produites à un taux λ, elles s infectent à un taux γv et meurent avec un taux µ T. Le nombre de nouvelles cellules infectées est le terme γv T provenant d une loi d action de masse. Chaque cellule infectée T produit π virions. Les cellules T meurent à un taux µ T et les virions à un taux µ V» : Figure 3.2 : Modèle de Perelson de la dynamique du VIH dt = λ µ dt T T γv T dt dt = γv T µ T T dv = πt µ dt V V Complexification des mécanismes Nous ne cherchons pas à faire un catalogue des différents modèles existants, de bonnes revues peuvent être trouvées dans [Perelson and Nelson, 1999, Le Corfec et al., 2000] et plus récemment dans [Xiao et al., 2013]. Cependant, l évolution des connaissances sur l infection par VIH a permis l évolution des modélisations dynamiques. Nous listons ici quelques exemples. Il est intéressant de distinguer des cellules CD4 quiescentes non infectées Q ou infectées Q pour modéliser les réservoirs latents. Ces cellules s activent en cellules T (resp. T ) au taux α (resp. α ) et se désactivent au taux ρ (resp. ρ ). En plus des CD4, d autres types de cellules sont susceptibles d être infectées par le VIH (comme par exemple les macrophages). Ces populations de cellules ont généralement des durées de vie plus longues ce qui peut jouer un rôle sur la dynamique

66 Chapitre 3 : Les modèles d analyse de la dynamique des biomarqueurs 66 du VIH [Perelson et al., 1997]. Ainsi, elles peuvent être ajoutées au modèle à la fois en tant que cellules infectées (M ) ou non infectées (M) dans le modèle. Par ailleurs, les cellules infectées ( ) disparaissent du système soit par mort naturelle soit par l action de cellules effectrices tueuses notées E [Bonhoeffer et al., 2000, Nowak and Bangham, 1996]. Concernant le virus, une quasi-espèce de virus préexiste dans l organisme de l hôte [Goodenow et al., 1989]. En présence de cart, les génotypes résistants ne sont plus en compétition avec d autres génotypes plus robustes, ainsi, il y a émergence d un virus résistant par sélection (voir Section 1.2.2). Une méthode pour représenter cela consisterait à supposer qu il existe R composantes virales différentes (V 1,..., V R ), chacun représentant un génotype [Nowak et al., 1990]. Chaque génotype i représente une fraction F (i) de la population de virus. L apparition des PI qui agissent sur les propriétés infectieuses du VIH a permis d étendre le modèle pour inclure deux types de virus : une fraction f I de virus infectieux V I et une fraction (1 f I ) de virus non infectieux V NI. E T* Q Q T T* Q * T Q T T* Q* * * E Q* E M * E E E M M M M* M M * V 1 I 1 VI V 1 NI 1 VNI V R I 1 VI V R NI R VNI Figure 3.3 : Proposition de modèle dynamique complexe de l interaction VIH-système immunitaire à 7 + 2R composantes. Ce modèle est donné à titre d exemple pour illustrer la potentielle complexité des modèles NLME-ODE.

67 3.2 : Les modèles dynamiques mécanistes explicatifs 67 Nous pouvons inclure ces remarques aux modélisations existantes et proposer une nouvelle représentation plus complexe (Figure 3.3). Pour cela, nous faisons l hypothèse forte que tous les taux de décès et de création sont des constantes. Par exemple, pour la prolifération des CD4, nous négligeons qu elle peut varier en particulier en fonction des états du système par des termes de rétrocontrôle [Bains et al., 2009, Yates et al., 2007, Callard and Hodgkin, 2007]. Nous définissons un modèle à 7 + 2R composantes et au moins R paramètres ressemblant à celui utilisé par [Adams et al., 2005] : dq dt = λ Q µ Q Q αq + ρt dt = αq ρt µ dt T T γ R T i=1 V i T dm dt = λ M µ M M γ M R i=1 V i M de = λ dt E µ E E dt dt = γ T R i=1 V i T µ T T µ E T T E ρ T + α Q dq dt = ρ T α Q µ Q Q µ E Q Q E dm dt = γ M R i=1 V i M µ M M µ E M M E dvi 1 = π dt T ft I F (1)T + π M fm I F (1)M µ V 1 I VI 1... (3.8) dv R I dt = π T f I T F (R)T + π M f I M F (R)M µ V R I V R I dv 1 NI dt = π T (1 f I T )F (1)T + π M (1 f I M )F (1)M µ V 1 NI V 1 NI... dv R NI dt = π T (1 f NI T )F (R)T + π M (1 f NI M )F (R)M µ V R NI V R NI

68 Chapitre 3 : Les modèles d analyse de la dynamique des biomarqueurs Modèles simplifiés : parcimonie et identifiabilité. Des modèles complexes, tel que celui présenté équation 3.8, sont difficiles à manier et présentent des limites quant à leur utilisation. En effet, ils peuvent être utilisés de manière descendante, par simulations, en fixant des valeurs de paramètres [Kubiak et al., 2001, Callaway and Perelson, 2002, Smith and Wahl, 2005, Zhou et al., 2013]. Cependant, cela est peu informatif quant à la quantification des aspects biologiques des phénomènes. Par ailleurs, des problèmes d identifiabilité théorique et pratique [Petersen et al., 2001] rendent difficile les méthodes ascendantes et l estimation des paramètres par les techniques présentées Section L identifiabilité théorique dépend de la structure du modèle en adéquation avec le type de données disponibles. L identifiabilité pratique fait rentrer en ligne de compte les phénomènes statistiques liés aux conditions expérimentales. Des indicateurs, majoritairement basés sur la matrice d information de Fisher ou des approximations [Mentre et al., 1997, Retout and Mentré, 2003], permettent de donner une indication sur la faisabilité des estimations [Rothenberg, 1971, Walter and Pronzato, 1997, Guedj et al., 2007b]. D autres méthodes, plus fastidieuses, reposent sur des simulations issues du monde de l ingénierie (multiple time point technique) et étudient les dérivées successives du système jusqu à l ordre 3 [Xia and Moog, 2003, Wu et al., 2008]. Plus répandues, les approches basées sur l analyse de la sensibilité aux changements des paramètres par profil de vraisemblance [Raue et al., 2009] sont peu utilisables en grande dimension. En reprenant les équations 3.8, nous pouvons voir que certains phénomènes sont concurrents. Par exemple, pour les cellules infectées, les décès par apoptose et les décès par réponses immunitaires de cellules effectrices ne peuvent pas être différenciés avec le niveau d information recueillie dans la majorité des études non spécifiques à cette problématique. Une première solution est de faire le choix de fixer certains paramètres à des valeurs issues de la littérature [Guedj et al., 2007a, Drylewicz et al., 2010, Huang et al., 2006]. Cependant, cela impacte la qualité du modèle lorsque la valeur d un paramètre est mal choisie [Banks et al., 2003, Xia and Moog, 2003]. Ainsi, une solution alternative est de définir

69 3.2 : Les modèles dynamiques mécanistes explicatifs 69 des modèles simplifiés en adéquation avec l information recueillie dans les études à notre disposition et les phénomènes biologiques les plus importants au regard de nos problématiques. Ainsi, dans la suite de ces travaux nous utiliserons le modèle à cellules cibles (voir Figure 3.4) : dq dt = λ + ρt αq µ Q Q, dt = αq γt V ρt µ dt T T, dt dt = γt V µ T T, dv = πt µ dt V V. (3.9) Figure 3.4 : Modèle à cellules cibles de la dynamique du VIH Pistes de modélisation des effets traitement Certains des paramètres du modèle définit équation 3.9 peuvent évoluer au cours du temps, en particulier, lors de l introduction d un traitement. Pour pouvoir envisager une médecine personnalisée, il est nécessaire de définir une fonction de lien entre le traitement (type/dose) et son impact sur le système dynamique : quels sont les paramètres impliqués? Quelle est la forme de la réponse? Les cart n agissent pas directement sur le virus V, il existe un phénomène de médiation. Les cart inhibent certaines étapes de réplication du VIH au sein des cellules cibles T les empêchant de devenir infectées T, d où la baisse de charge virale. Ainsi, dans la suite de ces travaux nous supposerons que les cart jouent uniquement sur le paramètre d infectivité du modèle à cellules cibles γ. Cette modélisation est classique pour toutes

70 Chapitre 3 : Les modèles d analyse de la dynamique des biomarqueurs 70 les classes d antirétroviraux sauf les PI. Cependant, il sera montré section que cette approximation est acceptable dans le cadre du modèle à cellules cibles. Concernant, la forme de la fonction pharmacodynamique ψ(.) liant la cart à l effet, nous avons comparé plusieurs approches. En notant d i j(t) la dose de traitement j prise par le patient i au temps t et β j un coefficient de régression estimé, nous avons considéré entre autres : les fonctions en escaliers : ψ(d i j(t)) = β j 1 d i j (t)>0, les fonctions puissance : ψ(d i j(t)) = β j (d i j(t)) κ j, où κ j est une puissance estimée par profil de vraisemblance, les fonctions sigmoïdales : ψ(d i j(t)) = β j log { [ ( ( ) bj aj 1 1/ 1 + ])}, où a d i j (t) j et b j sont des coefficients estimés identifiables avec des indicateurs pharmacodynamiques. des fonctions pharmacodynamiques établies in vitro : potentiel d inhibition instantané (IIP) ou encore facteur d inhibition (IF) (voir Section 7.2.2). Aucun des choix n est uniformément meilleur. La sélection de la fonction ψ(.) se fera pour chaque problématique par une approche de sélection de modèles (voir Section ).

71 Chapitre 4 NIMROD pour l inférence en modèle dynamique Résumé : Dans ce chapitre, nous présentons un logiciel dédié à l estimation bayésienne de paramètres dans des modèles dynamiques à effets mixtes par maximisation a posteriori (MAP) basée sur l optimisation de la vraisemblance pénalisée. Cependant, il permet aussi l inférence par maximum de vraisemblance simple. Ce programme parallélisé, diffusé et gratuitement téléchargeable s appelle NIMROD (normal approximation inference in models with random effects based on ordinary differential equations). Nous comparons ses performances avec celles de logiciels et méthodes concurrents. L exemple fil rouge est la pharmacocinétique, car c est l un des systèmes ODE le plus utilisé. Mots-clés : approche bayésienne ; calcul parallèle ; critères de convergence ; distance au maximum (RDM) ; estimation conditionnelle de premier ordre (FOCE) ; maximum a posteriori (MAP) ; MCMC ; NLME-ODE ; optimisation numérique. Abstract : In this chapter, we present a software for Bayesian estimation of parameters in dynamical models with mixed effects. The algorithm is based on a posteriori maximization (MAP) based on the optimization of the penalized likelihood. However, it also allows classical maximum likelihood. This parallelized, disseminated and free for download program is called NIMROD (normal approximation inference in models with random effects based on ordinary differential equations). We compare the performances of this algorithm compared to existing methods. We present pharmacokinetics as leading example because it is one of the most used ODE system. Key words : a posteriori maximization (MAP) ; bayesian approach ; convergence criteria ; distance to maximum (RDM) ; first order conditional estimation (FOCE) ; MCMC ; NLME-ODE ; numerical optimization ; parallel computing.

72 Chapitre 4 : NIMROD pour l inférence en modèle dynamique Le programme NIMROD L algorithme pour l estimation des paramètres en NLME-ODE présenté en Section mis au point par [Guedj et al., 2007a] puis [Drylewicz et al., 2012] présentait des échecs de convergence en particulier lorsque le nombre de paramètres était important. De plus, il était coûteux en terme de temps de calcul et confidentiel au niveau de son utilisation. Nous avons effectué une refonte du programme avec des améliorations de l algorithme amenant à une meilleure convergence, une restructuration de l architecture logicielle, la parallélisation des calculs et la mise en place d outils de diffusion. Nous présentons l outil NIMROD (normal approximation inference in models with random effects based on ordinary differential equations) Amélioration de la convergence Nous avons implémenté un critère de convergence, la distance relative au maximum (RDM), développé par [Commenges et al., 2006]. En reprenant les notations de la Section , le RDM en θ s écrit : RDM(θ) = U P (θ) T G P (θ) 1 U P (θ) n p. Le RDM permet d évaluer simultanément le degré de courbure de la surface et d évaluer le ratio entre l erreur statistique et l erreur numérique. Ainsi, le RDM doit être inférieur à 1 et aussi proche de 0 que possible. Dans des études de simulation, nous avons vérifié les propriétés du RDM vis-à-vis de la précision finale sur la valeur de la vraisemblance. Par ailleurs, nous avons mis en valeur que plus le RDM est faible plus la précision est grande sur la valeur des paramètres estimés et donc plus il y a de chiffres significatifs. Cette première méthode a permis de mettre en avant des problèmes spécifiques de convergence lorsque les points de départ de l algorithme sont loin du maximum (en simulation et sur des données réelles). Nous avons donc amélioré l algorithme RVS (voir Section ). En effet, loin du maximum la matrice G peut être une mauvaise approxi-

73 4.1 : Le programme NIMROD 73 mation de la matrice H. Ainsi, l algorithme RVS peut avoir des difficultés à maximiser la fonction objectif c est pourquoi nous avons introduit une possibilité de commutation ( switch en anglais) vers un algorithme de Marquardt-Levenberg classique où la Hessienne est calculée par différentiations finies lorsque l algorithme RVS ne progresse pas pendant plusieurs itérations. Ce travail a par ailleurs donné lieu au développement d un package R de l algorithme de Marquardt-Levenberg [Prague et al., 2012b] 1. Pour finir, une attention particulière a été portée à la définition des a priori. Nous avons retravaillé le choix des a priori non informatifs et défini une méthodologie de choix d espérance et de variance pour les a priori informatifs en fonction des données de littérature Amélioration des temps de calcul Nous avons mis en évidence par profilage les sous-routines et fonctions les plus coûteuses en terme de temps de calcul. Nous avons identifié que le calcul de la vraisemblance et le calcul des scores étaient les deux fonctions les plus consommatrices de ressources. Or, dans ces deux fonctions, les calculs sont hautement parallèles puisque les individus sont supposés indépendants. Ainsi, leurs vraisemblances individuelles sont calculées sans faire appel les unes aux autres. Nous avons donc pris le parti de paralléliser le programme sur les individus : le nombre maximum de processeurs (n proc ) ou cœurs pour la parallélisation active du programme est donc inférieur ou égal au nombre d individus dans l étude (n proc n). Comme [Krawezik and Cappello, 2006], nous avons ensuite comparé deux techniques de parallélisation : OpenMP [Chapman et al., 2008] sur architectures à mémoire partagée et MPI [Snir et al., 1995] sur ordinateurs distants. La première est légèrement plus rapide 1. Nous avons proposé le package marqlevalg implémentant l algorithme de Levenberg-Marquardt sans contrainte [Marquardt, 1963]. L implémentation du package marqlevalg est classique au niveau de l optimisation, mais comporte comme critère de convergence particulier le RDM. Nous avons comparé les résultats obtenus avec marqlevalg avec ceux du package optimx [Nash and Varadhan, 2011] (Nelder-mead, BFGS...) en particulier sur des exemples disponibles dans le manuel d optimx. Avec des temps de calcul comparables, les estimations s avèrent parfois meilleures en particulier pour des points de départ loin du minimum ou des surfaces non strictement convexes ou éloignées d une forme quadratique. Concernant l utilisation de ce package, des statistiques sont disponibles via un des serveurs CRAN depuis le 01/10/2012. Ainsi, nous pouvons voir qu en environ 10 mois nous comptabilisons 726 téléchargements.

74 Chapitre 4 : NIMROD pour l inférence en modèle dynamique 74 en terme de performances brutes (voir Table 4.1) en revanche, nous ne pouvons exploiter que des cœurs situés sur les mêmes ordinateurs ce qui limite les ressources. C est pourquoi nous avons choisi la technologie MPI. Au même moment, un calculateur haute performance de plus de 3000 cœurs 2 a été mis en service au mésocentre aquitain (MCIA) nous permettant une gestion des jobs plus facile que sur les grilles de calculs. Avec ces techniques, nous obtenons par régression polynomiale que les temps de calcul ont été diminués d un facteur n 0.85 proc environ. Technique de parallélisation : MPI Technique de parallélisation : OpenMP n proc Temps Facteur d accélération Temps Facteur d accélération 1 6 h 42 min h 42 min h 01 min h 51 min h 18 min min 18 sec min 8 sec impossible min 12 sec impossible Table 4.1 : Comparaison des temps de calcul après parallélisation OpenMP et MPI en fonction du nombre de coeurs utilisés sur le cluster de calcul Avakas du MCIA. Les résultats sont obtenus sur le modèle VIH utilisé dans l article [Prague et al., 2012a] voir Section avec 16 paramètres estimés, 149 sujets et 2 compartiments observés Diffusion L élaboration d un package R de ce programme est complexe, car les fonctions devant être définies par l utilisateur pour changer le modèle sont intriquées et leur définition fait appel à des calculs symboliques à effectuer en Maple pour définir les équations de sensibilité des systèmes ODE. Nous avons donc décidé de diffuser au format Fortran le programme NIMROD (Normal approximation Inference in Models with Random effects based on Ordinary Differential equations). NIMROD actuellement est un programme libre de droits qui peut être modifié et redistribué sous les termes de la licence publique générale GNU version 2.0 ou ultérieure publiée par la fondation du logiciel libre. Nous avons travaillé sur la structure de NIMROD afin d avoir une architecture modulaire et ergono- 2. Avakas : 264 serveurs de calcul biprocesseur Intel R Xeon R 3.06 GHz avec 3168 cœurs, 4 GB RAM/cœur et une puissance de crête de 38,8 Tflop/s

75 4.1 : Le programme NIMROD 75 mique. Ainsi, elle se présente en trois sous dossiers ce qui permet d adapter au niveau de l utilisateur le niveau de compréhension requise sur la programmation, voir Figure 4.1 : Figure 4.1 : Architecture modulaire de NIMROD Pour les nouveaux utilisateurs, le dossier users contient toutes les sous-routines permettant la définition d un modèle du point de vue mathématique, statistique et observationnel. Il peut être utilisé comme une librairie et être remplacé par un autre dossier correspondant à un autre modèle ou modifié par l utilisateur lui même. Ces dossiers-modèles-librairies sont disponibles en téléchargement sur le site de NIM- ROD. Pour les utilisateurs intermédiaires, le dossier options permet de modifier/régler tous les paramètres de convergence pour les algorithmes d optimisation, les dérivations, le solveur ODE, les quadratures adaptatives gaussiennes.... Les paramètres initialisés par défaut sont choisis comme optimisés pour des problèmes généraux. Par exemple, augmenter le nombre de points dans les calculs des quadratures adaptatives gaussiennes peut dans certains cas allonger considérablement les temps de calcul sans pour autant améliorer la précision. De même, mettre des seuils de précision ODE trop grands par rapport à la variabilité des trajectoires peut entraîner des erreurs dans les calculs des vraisemblances empêchant la convergence. Ainsi, un mauvais réglage de ces paramètres peut avoir des conséquences catastrophiques sur les propriétés de l inférence.

76 Chapitre 4 : NIMROD pour l inférence en modèle dynamique 76 Pour les utilisateurs avancés, le dossier blackbox contient toutes les sous-routines et fonctions permettant l inférence. Website Frequentation (03/ /2013) Bounce rate (03/ /2013) Visit duration (03/ /2013) Percentage of returns (03/ /2013) QR Code Link to Website Figure 4.2 : Statistiques de fréquentation du site Internet NIMROD et QR code de référencement du site Internet. Nous avons diffusé NIMROD sur un site internet (QR code Figure 4.2) qui a été généré par Doxygen [Laramee, 2011]. Ce site a pour but de fournir une interface de téléchargement au programme NIMROD et une solide documentation. Il est, à ce jour, fréquemment mis à jour avec les nouvelles avancées logicielles et la mise à disposition de nouvelles librairies de programme pour traiter de nouveaux problèmes dynamiques (pharmacocinétique, modèles VIH, modèle de restauration immunitaire...). Les statistiques de fréquentation des 6 derniers mois (avril-septembre 2013) produites par Google analytics sont présentée Figure 4.2. La fréquentation est mondiale et augmente au fil des mois avec un total de 302 visites, dont 143 visiteurs différents, sur 6 mois. Parmi ces visites, 47% sont en fait des rebonds où les utilisateurs ne consultent pas le contenu des pages. Pour les autres, 26% cliquent sur le lien de téléchargement (soit environ 42 téléchargements en 6 mois) et la durée moyenne de visite est de 2 minutes 50 secondes.

77 4.1 : Le programme NIMROD Description et application à la pharmacocinétique Le programme NIMROD permet d analyser tous les types de modèles dynamiques basés sur des NLME-ODE avec pour seule restriction technique connue les limites de tailles de tableaux supportés par Fortran 95. La Table 4.2 présente une comparaison des fonctionnalités entre NIMROD et les logiciels classiques utilisés dans l industrie et la recherche, tels que R [R Core Team, 2013], NONMEM [Beal et al., 1992] WinBUGS [Lunn et al., 2000] ou MONOLIX [Lavielle, 2005], Charactéristiques R NONMEM MONOLIX WinBUGS NIMROD Logiciel Utilisation payante X X Interface clique bouton X X Langage de modélisation X X X X Parallélisme X X X X Analyse statistique Fréquentiste paramétrique X X X X Fréquentiste non paramétrique X X Bayésienne paramétrique X X X X X Bayésienne non paramétrique X Table 4.2 : Fonctionnalités de R, NONMEM, MONOLIX, WinBUGS et NIMROD. Par souci de large diffusion, nous avons proposé des exemples pour l analyse de données pharmacocinétiques d absorption orale de traitements avec mesures sanguines en utilisant des modèles à un compartiment (sang) et deux compartiments (sang et tissus) [Rosenbaum, 2011]. En effet, ce modèle NLME-ODE est l un des plus utilisé dans le domaine biomédical. Nous avons comparé les performances de NIMROD avec des algorithmes plus classiques (FOCE et MCMC) sur des données simulées et sur des données issues de l essai clinique PUZZLE [Raguin et al., 2004] concernant la dynamique de concentration plasmatique de l APV chez des patients infectés par le VIH. Ce travail fait l objet d un article publié dans Computer methods and Programs in Biomedecine, Volume 111, Issue 2, août 2013, Pages [Prague et al., 2013a]. Le matériel supplémentaire électronique de cet article se trouve en annexe A.

78 c o m p u t e r m e t h o d s a n d p r o g r a m s i n b i o m e d i c i n e ( ) jo ur nal ho me p ag e: h.com/journals/cmpb NIMROD: A program for inference via a normal approximation of the posterior in models with random effects based on ordinary differential equations Mélanie Prague a,b,, Daniel Commenges a,b, Jérémie Guedj c, Julia Drylewicz d,e, Rodolphe Thiébaut a,b a Univ. Bordeaux, ISPED, Centre INSERM U897-Epidemiologie-Biostatistique, F Bordeaux, France b INSERM, ISPED, Centre INSERM U897-Epidemiologie-Biostatistique, F-33000, Bordeaux, France c Theoretical Biology and Biophysics, Los Alamos National Laboratory, Los Alamos, NM 87545, USA d Laboratory for Translational Immunology, University Medical Center Utrecht, 3508 AB, Utrecht, The Netherlands e Theoretical Biology & Bioinformatics, Department of Biology, Utrecht University, 3584 CH, Utrecht, The Netherlands a r t i c l e i n f o Article history: Received 7 August 2012 Received in revised form 4 March 2013 Accepted 23 April 2013 Keywords: Maximum likelihood Maximum a posteriori HIV Non-linear mixed-effects model Ordinary differential equations Pharmacokinetics a b s t r a c t Models based on ordinary differential equations (ODE) are widespread tools for describing dynamical systems. In biomedical sciences, data from each subject can be sparse making difficult to precisely estimate individual parameters by standard non-linear regression but information can often be gained from between-subjects variability. This makes natural the use of mixed-effects models to estimate population parameters. Although the maximum likelihood approach is a valuable option, identifiability issues favour Bayesian approaches which can incorporate prior knowledge in a flexible way. However, the combination of difficulties coming from the ODE system and from the presence of random effects raises a major numerical challenge. Computations can be simplified by making a normal approximation of the posterior to find the maximum of the posterior distribution (MAP). Here we present the NIMROD program (normal approximation inference in models with random effects based on ordinary differential equations) devoted to the MAP estimation in ODE models. We describe the specific implemented features such as convergence criteria and an approximation of the leave-one-out cross-validation to assess the model quality of fit. In pharmacokinetics models, first, we evaluate the properties of this algorithm and compare it with FOCE and MCMC algorithms in simulations. Then, we illustrate NIMROD use on Amprenavir pharmacokinetics data from the PUZZLE clinical trial in HIV infected patients Elsevier Ireland Ltd. All rights reserved. 1. Introduction Mechanistic or semi-mechanistic models based on ordinary differential equations (ODE) can naturally capture dynamic interactions in time between biomarkers and help understanding biological mechanisms. Thus, their use is particularly popular in pharmacometrics to describe the drug pharmacokinetics (PK) in plasma [43] or to analyse viral kinetics during treatment [27]. In the clinical setting, studies involve a relatively large number of patients, but technical and ethical reasons often limit the number of sampling measurements that can be done within each patient. In this context, non-linear mixed-effects Corresponding author. Tel.: address: (M. Prague) /$ see front matter 2013 Elsevier Ireland Ltd. All rights reserved.

79 448 c o m p u t e r m e t h o d s a n d p r o g r a m s i n b i o m e d i c i n e ( ) models are a better way than subject-by-subject analysis to handle the available information [42]. Inference for these models can be done by either frequentist or Bayesian approaches. Many algorithms have been suggested for frequentist approaches. Semi-parametric methods based on functional analysis with splines smoothing have been proposed by Ramsay et al. [36] and extended for mixed-effects by Wang et al. [44]. The main drawback of this approach relies in the choice of the splines basis, the order of the splines and knots [46]. Moreover, the parameter tuning the trade-off between fitting the data and satisfying the ODE system has to be chosen by cross-validation, which is computationally demanding. Alternatively, a large body of literature focuses on parametric approaches based on the likelihood computation using ODE numerical solvers. Because of random effects, likelihood computation also implies the computation of integrals with, most of the time, no closed-forms if the biological model is nonlinear. A method based on the approximation of the likelihood, namely the Laplacian methods (FO and FOCE), has been proposed by Pinheiro and Bates [28] and Lindstrom and Bates [21]; see Wang [45] for a detailed introduction. However, optimization based on an exact likelihood provides better results than methods based on approximation of the likelihood [8]. A solution for maximizing the likelihood is to use the stochastic approximation expectation maximisation (SAEM) algorithm proposed by Kuhn and Lavielle [20] implemented in MONOLIX. Of note, all these methods are also implemented in NONMEM. However, Plan et al. [30] suggested that among methods based on an exact likelihood, those based on Gaussian quadratures might be more precise. We proposed an algorithm based on Gaussian quadratures specially adapted for models defined by ODE [15], but its use was limited by the lack of an interface user. Lack of identifiability [16] is another issue arising in these mechanistic models and motivates a Bayesian approach frequently encountered in non-linear models with a large number of parameters. By incorporating information found in the literature, one may increase the information available and thus improve parameter identifiability. However, priors can also be introduced to take advantage of previous data analysis when raw data are not available. In this second context, the priors arise from the posteriors of previous data analysis in an information synthesis framework, see Drylewicz et al. [10] for an example in HIV context. In ODE-based models, the conventional MCMC algorithm (such as implemented in Win- BUGS) for computing the marginal posterior distributions of the parameters is time consuming and convergence of chains is often difficult to assess. Other Bayesian methods for approximation of the posterior distributions, such as the integrated nested Laplace approximation (INLA) method [38] cannot be applied here because ODE do not have an analytical solution. Computationally less demanding, a way to use Bayesian approaches is to assume a normal approximation of the posterior (NAP). This is justified asymptotically by the Bernstein Von Mises theorem [41]. Numerically, this amounts to compute the maximum of the posterior distribution (MAP) while the variance matrix is approximated by the inverse of the Hessian of minus the logarithm of the posterior. This approach was shown to work well in situations where MCMC may fail [10]. Here we detail the NAP approach and its implementation in a program called NIMROD (normal approximation inference in models with random effects based on ordinary differential equations). NIMROD can also be used for classical maximum likelihood inference. We introduce some new statistical and numerical features of the algorithm, such as the properties of the stopping criterion and the optimization of the algorithm for parallel computing. The paper is organized as follows. In Section 2 a statistical model based on an ODE system in a general form is described. Section 3 presents the algorithm and its statistical properties. In Section 4, the NIMROD program is introduced in a simplified user-manual style. Section 5 presents the analysis of simulated data and of data coming from a clinical trial. Section 6 concludes. 2. Model and inference 2.1. General model for the system Let us consider an ODE model for a population of n subjects. For subject i, with i = 1,..., n, this can be written: dx i (t) dt X i (0) = h[ i (0)] = f [X i (t), i (t)] where i (t) = [ i 1 (t),..., i n b (t)] is a vector of n b biological parameters which appear naturally in the ODE system and have a biological interpretation; X i (t) = [X i 1 (t),..., X i K (t)] is the vector of the K state variables (or compartments). We let X[t, i (t)] = X i (t) to underline that i (t) completely determines the trajectories X i (t). We assume that f is a possibly non-linear function, twice differentiable with respect to i (t). To determine the initial value of the ODE system we suppose we are in one of those two cases: either X i (0) comes from initial conditions in the experiment (see pharmacokinetics illustration Section 5.1) or we assume that the system is in a stable state before the experiment (see pharmacokinetics illustration Section 5.2). In this case, h can be computed by solving the equation dx i (t)/dt = 0 analytically or with a numerical ODE solver. Reparametrization of the system allows us to take constraints into account: we introduce one-to-one functions l(.), l = 1,..., n b and define transformed parameters i l (t) = l[ i l (t)]. For instance, biological parameters such as rates can be parametrized using a logarithmic transformation to ensure positivity, or parameters between 0 and 1 (such as probabilities or bioavailability) can be parametrized using a logistic transformation. A mixed-effects model for the i l (t) allows introducing covariates and taking into account the betweensubject variations. In this approach, random effects give each subject a different value for a subset q n b of the biological parameters: l i (t) = l + ˇlz i l (t) + u i l, u i l N(0, ω 2 l ). where l is the intercept and z i l is a vector of n e (possibly timedependent) explanatory variables associated with the fixed effects of the lth biological parameter; ˇl is a vector of regression coefficients; u i l is the individual random effect with ω 2 l = 0 for l > q.

80 c o m p u t e r m e t h o d s a n d p r o g r a m s i n b i o m e d i c i n e ( ) In practice, we do not observe X i (t) directly, but we have discrete-time observations Y i (t ij ) of some functions of X i (t). We assume that there are known link functions g m (.), m = 1,..., M, leading to an additive measurement error model. For i = 1,..., n, m = 1,..., M and j = 1,... n i (the number of observation times for subject i), we observe: Y i m (t ij) = g m [X i (t ij )] + ijm, ijm N(0, 2 m ). This observation scheme may be complicated by leftcensoring due to detection limits [18]. We denote by the parameter vector to be estimated: = [( l ) l=1,...,nb, (ˇl) l=1,...,ne, (ω l ) l=1,...,q, ( l ) l=1,...,m ] R p Likelihood and NAP The likelihood formula for the model and observations described in Section 2.1 can be found in Guedj et al. [15]. The individual likelihood given the random effects (L F i u i ) is easily computed as a function of g m [X i (t ij )] since the Y i m (t ij) are independent Gaussian variables. However, the computation of the g m [X i (t ij )] requires to solve the ODE system. This is done by using the Livermore solver DLSODE [17], specially adapted for stiff systems using backward difference formula and gear type method BDF from Radhakrishnan et al. [34]. Then, the likelihood (L i ) is computed by integrating over the random effects via the adaptive Gaussian quadrature (implemented as in Genz and Keister [13]) as proposed by Pinheiro and Bates [29]. Bayes theorem gives: log[p( Y)] = L() + log[()] + C, where C is the normalization constant, P( Y) the posterior distribution, L() the log-likelihood and () the prior distribution. The normal approximation of the posterior is obtained by maximizing the penalized log-likelihood L P () = L() J() (which does not involve the difficult normalization constant C) and computing its Hessian at the maximum value; here, J() is a penalization term equal to log [()] up to a constant. If we assume normal independent priors for the fixed effects, half- Cauchy priors for the standard deviation of the random effects, as recommended by Gelman [12] with median parameter s j 2 and conventional one-dimension Jeffreys-type improper priors for the standard deviation of the measurement errors, the penalization function J() can be written: J() = p [ j E 0 ( j )] 2 n e [ˇj E 0 (ˇj)] 2 + 2var 0 ( j ) 2var 0 (ˇj) j=1 j=1 j=1 q m + log(ω 2 j + s 2 j ) + log( j ), j=1 where E 0 and var 0 are the expectation and the variance under the priors Credible sets and Bayesian p-values In a frequentist approach, parameter significance is assessed by testing ˇ = 0 or ˇ 0 (resp. ˇ 0 ). In a Bayesian approach, once we have the marginal posterior distributions of the parameters, it is straightforward to compute (1 )- credible sets of highest probability density (HPD-sets, Berger [1], part 4.3.2). We implemented a Bayesian p-value (Bp-value) as an analogue to the frequentist one (see Section 2.8 Box and Tiao [3]). For the one-sided test ˇ 0, it is simply P(ˇ 0 Y). For the two-sided Bayesian p-value testing ˇ = 0, it is such that the largest HPD credible set not containing zero has probability 1 Bp-value. This can be computed as 2min[P(ˇ 0 Y), P(ˇ 0 Y)]. If all priors are flat, this Bp-value is equal to the frequentist p-value obtained from a two-sided Wald test. Moreover, as credible sets and confidence intervals of the same coverage are asymptotically equivalent, the Bp-value is also asymptotically consistent with the frequentist p-value for any prior Model choice Commenges et al. [5,6] proposed an approximate crossvalidation criterion that can be used to choose estimators based on penalized likelihood. Taking advantage of the fact that we maximize a penalized likelihood, we propose to use LCV a for model choice. This criterion is given by: LCV a = n 1 [L(ˆ) Tr(H 1 L P (ˆ)H L (ˆ))], where H L and H L P are the Hessians of minus the log-likelihood and the penalized log-likelihood respectively, computed in ˆ. The criterion is implemented in NIMROD with H L and H L P approximated as indicated in Section 3.1. The lower the criterion, the better the model. Differences of criteria between two models can be interpreted: differences larger that 0.1 are considered as large while differences lower than are considered as negligible [7]. 3. Algorithm 3.1. Optimization procedure Under the conditions of the Bernstein Von Mises theorem, the posterior tends to a normal, thus, when n is large enough the penalized log-likelihood is close to a quadratic form in. The use of the Newton Raphson method is justified as this method is based on a quadratic approximation of the surface to maximize. However, with n not very large, the surface may be close to a quadric only in a region near the maximum and may not be convex everywhere. More robust methods such as the Levenberg Marquardt algorithm [23] are called for. Moreover, in ODE mixed-effects models the likelihood is difficult to compute: we need to solve the ODE system and numerically compute multiple integrals; on top of that, both Newton Raphson and Levenberg Marquardt algorithms require first and second derivatives of the objective function which also have to be numerically computed. To decrease the computation time we use an approximation of the second derivative of the log-likelihood leading to the robust variance

81 450 c o m p u t e r m e t h o d s a n d p r o g r a m s i n b i o m e d i c i n e ( ) scoring (RVS) algorithm [4], an improved version of the BHHH algorithm [2]. The individual score for a given value of the parameter, U i (), is calculated using Louis formula [22] and the systems of sensitivity equations (given by {df [X i (t), i (t)]/d i l (t)} l=1,...,p) as described in Guedj et al. [15]. Then, the penalized scores, U P i (), are derived as U P i () = U i () (1/n)( J()/ ). The observed log-likelihood and scores are calculated as the sum over all the subjects: L P n () = i=1 LP i (), n U() = i=1 U i(), U P () = n i=1 UP i (). The Hessian of L P (), denoted H L P (), is approximated by an estimator of the variance of U plus the second derivative of the penalization J: G() = n i=1 U i ()U T i () 1 n U()UT () + 2 J() 2. For close to the true value and n large, n i= U i()u T i () (1/n)U()U T () approximates H L () and G() approximates H L P (), the Hessians of L and L P, respectively. The RVS algorithm with the calculations described before is implemented in NIMROD with an optional automatic switch to a classical Levenberg Marquardt algorithm when the algorithm gets stuck, i.e. between two iterations there is neither log-likelihood change nor parameters displacement whereas the main convergence criterion based on RDM (see Section 3.2) is not met yet. Finally, a line search algorithm, such as in Potra and Shi [31], is used to adjust the displacement when the log-likelihood is not improved at the first try. Despite of all these tricks, it may happen that the log-likelihood cannot be improved, possibly due to too large errors in the computation of the scores. In that case, the displacement is done toward the highest proposed log-likelihood Convergence criteria Two commonly used criteria assess the stability of the algorithm concerning the displacement in the parameter space (k+1) = (k+1) (k) and the variation of the objective function, here: L (k+1) = L P ( (k+1) ) L P ( (k) ). If both of these criteria take very low values, this means that the algorithm does not move any more. This is the case when (k) is very close to ˆ but this is not sufficient. Stopping rules may be defined by (k+1) < 1 and L (k+1) < 2 but this is not really satisfactory. In the first place, it is not easy to fix good thresholds (at least for 1 which may depend on the parameters order of magnitude). More importantly, these stopping rules are not directly linked to the properties of the surface to maximize. If the algorithm does not move, this is not a proof that it has reached the maximum: it may just get stuck and be unable to find a good direction to improve the objective function. A maximum is characterized by U P (ˆ) = 0. Thus, a norm of the gradient will be a good candidate as convergence criterion. Commenges et al. [4] proposed a criterion based on the metric G 1 that we call the relative distance to maximum (RDM): RDM( (k) ) = UP ( (k) ) T G 1 ( (k) )U P ( (k) ) p The name RDM can be justified by noting that near the maximum we have U P ( (k) ) T G 1 ( (k) )U P ( (k) ) ( (k) ˆ) T H L P ( (k) )( (k) ˆ), that is a distance between (k) and ˆ. Using the same metric, by neglecting the effect of penalization, we have E [(ˆ ) T I( )(ˆ )] p, where I is the information matrix, * is the true value of parameters and E * is the expectation under the true probability. Thus, RDM is approximately the ratio of the distance of (k) from ˆ over the expectation of the distance between ˆ and *. It can also be interpreted as the ratio of the numerical error over the statistical error. This criterion is asymptotically invariant near the maximum to any one-to-one transformation of the parameters. Thanks to its interpretation, the threshold (called 3 ) can be chosen independently from the problem or from the data: it must be lower than 1 and as close as possible to 0. RDM is an indicator of the number of significant digits that are obtained. See Section for the analysis of the impact of this threshold; 0.1 is a good default value. In all cases, we recommend to run the algorithm from several starting points to check reproducibility and assess the number of significant digits that have been obtained. As a secure stopping rule, one may combine the three criteria, although RDM is clearly the best criterion. In the case where G is not invertible, RDM cannot be computed and the program will stop only when the maximum number of iterations is reached; this case is a failure of convergence. 4. The NIMROD program 4.1. Packaging The program is written in Fortran 90 and comes with a Maple routine which allows the user to calculate sensitivity equations for the ODE system. An open source code is available and can be modified with external accessible subroutines. The code is organized in two levels: a user level that has to be modified to specify a new model, and an optimization part that can be used as a black box for new users. Nevertheless, it is freely modifiable if necessary Parallel computing Depending on the number of random effects, number of subjects and number of parameters, the optimization can take from few minutes to several days. Parallel computing offers the possibility of speeding the program. Indeed, calculations presented in Section 3.1 are highly parallel: likelihood and scores are first calculated subject-by-subject, then aggregated. We implemented parallel computing over the subjects of the study. Thus, the program can efficiently use n p n processors. Our experience shows that the speed-up approximately follows the power law of n 0.85 p. As an example, treating a nonlinear model of HIV dynamics similar to the one used in Prague et al. [32] with 3 random effects, 149 subjects and 17 parameters takes about 7h30. Using 149 processors for this problem reduces the computation time in theory to 6.4 min (approximated by the power law formula to be ); in practice, we observe similar order of magnitude (see Section 5.2 for an illustration in Pharmacokinetics models on real data).

82 c o m p u t e r m e t h o d s a n d p r o g r a m s i n b i o m e d i c i n e ( ) Table 1 Comparison of FOCE, MCMC and NIMROD estimations over 100 simulation replicates in one-compartment PK model with absorption: percentage of failure, time to convergence, empirical standard deviation, overall parameters absolute bias and overall parameters RMSE. Simulation scenario {n, n i, CP } Failure (%) Time (s) Empirical s.d. Overall abs. bias Overall RMSE n = 100 n i = 10 CP = 1.0 FOCE MCMC NIMROD CP = 0.3 FOCE MCMC NIMROD n i = 4 CP = 1.0 FOCE MCMC NIMROD CP = 0.3 FOCE MCMC NIMROD n = 20 n i = 10 CP = 1.0 FOCE MCMC NIMROD CP = 0.3 FOCE MCMC NIMROD n i = 4 CP = 1.0 FOCE MCMC NIMROD CP = 0.3 FOCE MCMC NIMROD Technically, MPI (message passing interface) is a library of functions that exploit the existence of multiple processors [26]. It is a freely available internationally recognized standard. It can work on existing networks of workstations on processors with or without shared memory. Even if a super-computer is not available, one can still efficiently use the twelve cores that are available on standard workstations to obtain a speedup higher than Requirements and abilities The user must specify the number of parameters, the ODE system, the ODE sensitivity systems, the parameters transformations, the statistical model and the observational model. Structurally, there is no limitation in the number of equations and random effects. However, if the model complexity is too high the program can either be time consuming or fail to converge. In our experience, 5 to 6 equations in the system can be handled without problem but the number of random effects must be limited to l 5. Drylewicz et al. [9] proposed a forward selection of the random effects. Moreover, the program can handle censored data. Penalization as described in Section 2.2 can be set on all parameters or biological parameters only. The user can also easily implement his own penalizations. We advise to carefully choose the priors for each parameter by making a synthesis of the literature. For instance, defining a normal prior taking the mean between maximum and minimum found values (resp. the range divided by two) seems adequate to indicate the mean (resp. the standard deviation). In all cases, we recommend to perform a sensitivity analysis to priors. NIMROD can operate two ways: inference or predictions. Concerning inference there are several algorithm options: foremost, the user must set the optimization algorithm by choosing either the RVS only, or Marquardt only or a combination of both. Maximum number of iterations (default is 200), starting points (default are priors means) and convergence thresholds (default are 1 = 2 = 3 = 0.1) have to be set. Predictions (see Web-Appendix E for details) with parametric empirical Bayes [19] are automatically done after the inference with the stopping points as input values. Plots are automatically generated. 5. Illustration in pharmacokinetics NIMROD can be used in complex non-linear ODE systems without analytic solution. However, pharmacokinetics (PK) models are maybe the most studied ODE systems. Thus, we based illustrations on a one-compartment and a twocompartments PK model with absorption with three random effects Simulation: one-compartment pharmacokinetics model with oral absorption We consider a one-compartment PK model with oral absorption (more details in Web-Appendix A). The amount of drug in the gastrointestinal compartment (A GI ) is described by a firstorder drug absorption equation (Eq. (1a)); the concentration of

83 452 c o m p u t e r m e t h o d s a n d p r o g r a m s i n b i o m e d i c i n e ( ) Fig. 1 Posterior distributions for all the parameters in a one-compartment PK model with absorption obtained with MCMC method with WinBUGS. Burn-in length was 100,000 iterations, then we ran a 50,000-sampling phase with a 100-thinning interval. Convergence diagnostics were acceptable, mixing is displayed. Plain lines on posterior distribution is the density of a normal law for adequate mean and standard deviation. drug in the plasma (A P ) at any time depends on the relative rate of drug absorption and elimination (Eq. (1b)): da GI dt da P dt = k a A GI, (a) = k a A GI k e A P. (b) The bio-availability cannot be estimated, thus we fixed it equal to one. Initial values are known and given by A GI (0) = dose and A P (0) = 0. Random effects were associated to all parameters but no covariate was introduced. We simulated data for 40 subjects with this one-compartment PK model for a unique initial dose of 100 mg by oral absorption. Parameters values for simulations are presented Table 2 (Rosenbaum [37], chapter 9). Only the plasma concentration C P = A P /V 0 was supposed observed at 10 observation times (baseline, 0.5, 1, 1.5, 2, 3, 4, 6, 8 and 10 h). We assume that we observe, with CP = 0.3: Y i 1 (t ij) = [C i P (t ij)] ij1, ij1 N(0, 2 C P ). The choice of the penalization for Bayesian methods is presented in Web-Appendix B. However, we took rather tight priors (that can be found in Table 1 in Web-Appendix B) (1) because in a one-compartment PK model with absorption, k a and k e are mathematically exchangeable without impacting the trajectories, this is called the flip-flop paradox [14] NAP and convergence criteria evaluation To evaluate the quality of the normal approximation in this problem, we estimated the posteriors by the MCMC algorithm using WinBUGS. Fig. 1 shows that the NAP is very good, except for ωṽ0. For comparison of posteriors means, results obtained with NIMROD are presented Table 1 in Web-Appendix B. The behaviour of the main convergence criterion (RDM) during the optimization with NIMROD is monitored in Fig. 2. The RDM decreases when the log-likelihood improves. A zoom of Fig. 2 for the last iterations with a better scale and parameters trajectories over iterations is displayed in Web-Appendix C. To evaluate the link between the RDM and reproducibility, we randomly generated 1000 starting points at 2 standard deviations from the prior mean. We ran NIMROD with a unique convergence criterion: 3 < 1.0. Convergence was reached for 97% of the starting points, otherwise the program was stopped after 1000 iterations. The final RDM value is necessarily smaller than 1.0, but takes randomly different values. The final

84 c o m p u t e r m e t h o d s a n d p r o g r a m s i n b i o m e d i c i n e ( ) Fig. 2 Trajectories of the RDM and the log-likelihood along iterations during optimization with NIMROD from a random starting point to convergence. RDM value correlates with the final log-likelihood (see Fig. 3a). At the stopping value, the variability of the log-likelihood values is smaller when the RDM is close to zero. We ran NIMROD again with 3 < 0.01 as a convergence criterion from the same 1000 starting points sample. This led to 96.3% of convergence. Compared to the previous convergence criterion, we observed less variability in the final log-likelihood values (Fig. 3b). When RDM is small enough, variability in ˆ is reduced Comparison with existing algorithms We compared the NIMROD program results with two estimation techniques from the R software: the Laplacian first-order conditional method (FOCE) from the PKTools package using the nlme function [21] and the R2WinBUGS package for the MCMC approach. We did a gradient of simulations with different numbers of patients (n = 100 and n = 20), numbers of repeated measurements (n i = 10 with observation times at baseline, 0.5, 1, 1.5, 2, 3, 4, 6, 8 and 10 hours and n i = 4 with observation times at baseline, 1, 2 and 6 hours) and standard deviations of the measurement error ( CP = 0.3 and CP = 1.0). We generated 100 simulation replicates for each scenario. For NIMROD and MCMC, we selected the same tight priors as in previous simulations. For FOCE, convergence criteria were internal to PKTools; two main causes of failure were detected: maximum number of iterations reached before convergence and non-invertibility of the Hessian. For NIM- ROD, convergence criteria were 1 = 10 3 and 2 = 3 = 0.1. For MCMC, we used standard autocorrelation diagnostics, Geweke and Gelman and Rubin statistics tests to ensure the convergence of the chains. We ran 2 chains and monitored a 10,000-sample with a thinning interval of 2 after a burn-in phase of 10,000 iterations. Table 1 presents the percentage of failures (i.e. when the algorithm did not converge), the computation times, the empirical standard deviation in estimates over simulations, the mean absolute bias over all parameters ( E(ˆ) ) and the root mean square error (RMSE: E[(ˆ ) 2 ] 1/2 ). Of note, to compute these indicators for MCMC, ˆ is approximated by the posterior mode of the parameters distributions. In this model, FOCE failed in more than 50% of simulations maybe mainly due to identifiability issues. Thus, NIMROD or MCMC (i.e. Bayesian techniques) should be preferred to FOCE. In this problem, NIMROD is generally faster than the MCMC method. More generally, it has been previously Fig. 3 Link between the final RDM and the final log-likelihood at convergence (L(ˆ)) in NIMROD for 1000 starting points with two values of convergence threshold 3.

85 454 c o m p u t e r m e t h o d s a n d p r o g r a m s i n b i o m e d i c i n e ( ) Table 2 Comparison of FOCE, MCMC and NIMROD estimations for each parameter in one-compartment PK model with absorption (n = 20, n i = 10 and CP = 0.3) over 100 simulation replicates: mean posteriors mean and standard deviation, empirical standard deviation, bias, RMSE and 95% coverage probabilities for each parameter in the model. Parameter values Mean posterior mean Mean posterior s.d. Empirical s.d. Bias RMSE 95% CP k e = 5.56 FOCE MCMC NIMROD Ṽ 0 = 4.19 FOCE MCMC NIMROD k a = 4.60 FOCE MCMC NIMROD ω ke = 0.25 FOCE MCMC NIMROD ωṽ0 = 0.10 FOCE MCMC NIMROD ω ka = 0.20 FOCE MCMC NIMROD CP = 0.3 FOCE MCMC NIMROD shown that WinBUGS computation times were significantly greater for complex non-linear ODE model without analytical solution [10]. We ran again simulations where NIMROD failed with an allowance for a greater number of iterations: convergence was reached in all cases and results remained as good. The MCMC method passed all convergence tests. For all simulations, NIMROD has better empirical standard deviations of estimations (reduced by 11.3%) and RMSE (reduced by 10.3%) than MCMC, with no significant difference in absolute biases. Finally, for the simulation scenario (N = 20, n i = 10 and CP = 0.3), which is a plausible observation scheme in PK, we computed the posterior mean estimated value, the posterior mean standard deviations, the empirical standard deviation of estimations in simulations, bias, RMSE and 95% Coverage Probabilities (CP) for each parameters, results are presented Table 2. Some results for other simulation scenarios are presented in Web-Appendix D. For biological parameters, MCMC tends to underestimate the posterior standard deviation whereas NIMROD very slightly overestimates it. This may explain the better CP for NIM- ROD. Concerning standard deviation of the measurement error, CP are small compared to the expected 95% but this problem is shared by all methods and is probably due to underestimation of the variance of this quantity (see Olofsen et al. [25] for details). However, for most parameters estimated with NIMROD, empirical standard deviations and RMSE are smaller than those estimated with MCMC, with similar biases. Table 3 Inference in a one and two-compartments PK model with absorption for APV concentrations in HIV-infected patients: priors and posteriors means and standard deviations. Convergence criteria were 1 = 2 = 0.1 and 3 = 0.3. Parameters (in log) Priors mean (sd.) One-compartment w/abs. mean (sd.) Two-compartments w/abs. mean (sd.) LCV a k e 5.0 (3.0) 6.25 (0.01) 5.45 (0.01) Ṽ (3.0) 1.41 (0.04) 2.05 (0.10) k a 3.0 (3.0) 1.91 (0.13) 3.39 (0.10) k PT 5.0 (2.0) 4.94 (0.01) k TP 7.0 (2.0) 5.32 (0.01) Ṽ T 1.0 (0.5) 0.58 (0.41) ω ke (0.01) ωṽ (0.10) 0.48 (0.05) ω ka (0.02) 0.68 (0.05) CP 1/ CP 0.66 (0.03) 0.52 (0.02)

86 c o m p u t e r m e t h o d s a n d p r o g r a m s i n b i o m e d i c i n e ( ) APV Plasma Concentration (ng/ml) Pat dose 600 mg one compartment PK Minutes APV Plasma Concentration (ng/ml) Pat dose 600 mg two compartments PK Minutes APV Plasma Concentration (ng/ml) Pat dose 600 mg one compartment PK Minutes APV Plasma Concentration (ng/ml) Pat dose 600 mg two compartments PK Minutes APV Plasma Concentration (ng/ml) Pat dose 600 mg one compartment PK Minutes APV Plasma Concentration (ng/ml) Pat dose 600 mg two compartments PK Minutes APV Plasma Concentration (ng/ml) Pat dose 600 mg one compartment PK Minutes APV Plasma Concentration (ng/ml) Pat dose 600 mg two compartments PK Minutes Fig. 4 Examples of fits for APV PK dynamics in 4 HIV infected patients from PUZZLE study. Left side presents one-compartment PK model with absorption; Right side is two-compartments PK model with absorption. Triangles are observations. Plain lines are the predicted plasma concentration. Dashed lines represent the 95% measurement error predictive interval given by Ŷ ± 1.96 CP.

87

88 c o m p u t e r m e t h o d s a n d p r o g r a m s i n b i o m e d i c i n e ( ) [2] E. Berndt, B. Hall, R. Hall, Estimation and inference in nonlinear structural models, Annals of Economic and Social Measurement 3 (4) (1974) [3] G. Box, G. Tiao, Bayesian Inference in Statistical Analysis, Addison-Wesley Publishing Company, University of Michigan, USA, [4] D. Commenges, H. Jacqmin-Gadda, C. Proust, J. Guedj, A Newton-like Algorithm for Likelihood Maximization: The Robust-Variance Scoring Algorithm, 2006, Arxiv math/ [5] D. Commenges, P. Joly, A. Gégout-Petit, B. Liquet, Choice between semi-parametric estimators of markov and non-markov multi-state models from coarsened observations, Scandinavian Journal of Statistics 34 (1) (2007) [6] D. Commenges, C. Proust-Lima, C. Samieri, B. Liquet, A Universal Approximate Cross-validation Criterion and its Asymptotic Distribution, 2012, arxiv: [7] D. Commenges, A. Sayyareh, L. Letenneur, J. Guedj, A. Bar-Hen, Estimating a difference of kullback-leibler risks using a normalized difference of AIC, Annals of Applied Statistics 2 (3) (2008) [8] A. Ding, H. Wu, Assessing antiviral potency of anti-hiv therapies in vivo by comparing viral decay rates in viral dynamic models, Biostatistics 2 (1) (2001) [9] J. Drylewicz, D. Commenges, R. Thiébaut, Score tests for exploring complex models: application to HIV dynamics models, Biometrical Journal 52 (1) (2010) [10] J. Drylewicz, D. Commenges, R. Thiébaut, Maximum a posteriori estimation in dynamical models of primary HIV infection, Statistical Communications in Infectious Diseases 4 (1) (2012) (Online). [11] J. Drylewicz, J. Guedj, D. Commenges, R. Thiébaut, Modeling the dynamics of biomarkers during primary HIV infection taking into account the uncertainty of infection date, Annals of Applied Statistics 4 (4) (2010) [12] A. Gelman, Prior distributions for variance parameters in hierarchical models, Bayesian Analysis 1 (3) (2006) [13] A. Genz, B. Keister, Fully symmetric interpolatory rules for multiple integrals over infinite regions with gaussian weight, Journal of Computational and Applied Mathematics 71 (2) (1996) [14] K. Godfrey, R. Jones, R. Brown, Identifiable pharmacokinetic models: the role of extra inputs and measurements, Journal of Pharmacokinetics and Pharmacodynamics 8 (6) (1980) [15] J. Guedj, R. Thiébaut, D. Commenges, Maximum likelihood estimation in dynamical models of HIV, Biometrics 63 (4) (2007) [16] J. Guedj, R. Thiébaut, D. Commenges, Practical identifiability of HIV dynamics models, Bulletin of Mathematical Biology 69 (8) (2007) [17] A. Hindmarsh, Odepack: A systematized collection of ode solvers, IMACS Transactions on Scientific Computations 1 (1) (1983) [18] H. Jacqmin-Gadda, R. Thiébaut, G. Chêne, D. Commenges, Analysis of left-censored longitudinal data with application to viral load in HIV infection, Biostatistics 1 (4) (2000) [19] R. Kass, D. Steffey, Approximate Bayesian inference in conditionally independent hierarchical models (parametric empirical Bayes models), Journal of the American Statistical Association 84 (407) (1989) [20] E. Kuhn, M. Lavielle, Maximum likelihood estimation in nonlinear mixed effects models, Computational Statistics and Data Analysis 49 (4) (2005) [21] M. Lindstrom, D. Bates, Nonlinear mixed effects models, Biometrics 46 (1990) [22] T. Louis, Finding the observed information matrix when using the em algorithm, Journal of the Royal Statistical Society: Series B (Methodological) 44 (2) (1982) [23] D. Marquardt, An algorithm for least-squares estimation of nonlinear parameters, Journal of the Society for Industrial and Applied Mathematics 11 (2) (1963) [24] O. Okusanya, A. Forrest, R. DiFrancesco, S. Bilic, S. Rosenkranz, M. Para, E. Adams, K. Yarasheski, R. Reichman, G. Morse, et al., Compartmental pharmacokinetic analysis of oral amprenavir with secondary peaks, Antimicrobial agents and chemotherapy 51 (5) (2007) [25] E. Olofsen, D.F. Dinges, H. Van Dongen, Nonlinear mixed-effects modeling: individualization and prediction, Aviation, Space, and Environmental Medicine 75 (Supplement 1) (2004) A134 A140. [26] P. Pacheco, Parallel Programming with MPI, Morgan Kaufmann, San francisco, USA, [27] A. Perelson, A. Neumann, M. Markowitz, J. Leonard, D. Ho, HIV-1 dynamics in vivo: virion clearance rate, infected cell life-span, and viral generation time, Science 271 (5255) (1996) [28] J. Pinheiro, D. Bates, Approximations to the log-likelihood function in the nonlinear mixed-effects model, Journal of Computational and Graphical Statistics 4 (1) (1995) [29] J. Pinheiro, D. Bates, Mixed-effects Models in S and S-PLUS, Springer Verlag, New York, USA, [30] E. Plan, A. Maloney, F. Mentré, M. Karlsson, J. Bertrand, Performance comparison of various maximum likelihood nonlinear mixed-effects estimation methods for dose response models, AAPS Journal 14 (3) (2012) [31] F. Potra, Y. Shi, Efficient line search algorithm for unconstrained optimization, Journal of Optimization Theory and Applications 85 (3) (1995) [32] M. Prague, D. Commenges, J. Drylewicz, R. Thiébaut, Treatment monitoring of HIV infected patients based on mechanistic models, Biometrics 68 (3) (2012) [33] M. Prague, D. Commenges, R. Thiébaut, Dynamical models of biomarkers and clinical progression for personalized medicine: the HIV context, Advanced Drug delivery Reviews (2013), press). [34] K. Radhakrishnan, A. Hindmarsh, U.S.N. Aeronautics, S. Administration, Description and use of LSODE, The Livermore Solver for Ordinary Differential Equations, National Aeronautics and Space Administration, Office of Management, Scientific and Technical Information Program, Livermore National Laboratory & Lewis Research Center Group, Livermore, USA, [35] G. Raguin, G. Chêne, L. Morand-Joubert, A. Taburet, C. Droz, C. Le Tiec, F. Clavel, P. Girard, P.S. Group, et al., Salvage therapy with amprenavir, lopinavir and ritonavir 200 mg/d or 400 mg/d in HIV-infected patients in virological failure, Antiviral Therapy 9 (2004) [36] J. Ramsay, G. Hooker, D. Campbell, J. Cao, Parameter estimation for differential equations: a generalized smoothing approach, Journal of the Royal Statistical Society: Series B: Statistical Methodology 69 (5) (2007) [37] S. Rosenbaum, Basic Pharmacokinetics and Pharmacodynamics: An Integrated Textbook and Computer Simulations, Wiley, Hoboken, New Jersey, USA, [38] H. Rue, S. Martino, N. Chopin, Approximate Bayesian inference for latent Gaussian models by using integrated nested Laplace approximations, Journal of the Royal Statistical Society: Series B: Statistical Methodology 71 (2) (2009)

89 458 c o m p u t e r m e t h o d s a n d p r o g r a m s i n b i o m e d i c i n e ( ) [39] B. Sadler, P. Piliero, S. Preston, P. Lloyd, Y. Lou, D. Stein, Pharmacokinetics and safety of amprenavir and ritonavir following multiple-dose, co-administration to healthy volunteers, Aids 15 (8) (2001) [40] M. Sale, B. Sadler, D. Stein, Pharmacokinetic modeling and simulations of interaction of amprenavir and ritonavir, Antimicrobial Agents and Chemotherapy 46 (3) (2002) [41] A. Van der Vaart, Asymptotic Statistics, Cambridge Univ. Pr., Cambridge, UK, [42] G. Verbeke, G. Molenberghs, Linear Mixed Models for Longitudinal Data, Springer Verlag, New York, USA, [43] J. Wakefield, A. Racine-Poon, An application of bayesian population pharmacokinetic/pharmacodynamic models to dose recommendation, Statistics in Medicine 14 (9) (1995) [44] L. Wang, J. Cao, J. Ramsay, D. Burger, C. Laporte, J. Rockstroh, Estimating mixed-effects differential equation models, Statistics and Computing (2012) [45] Y. Wang, Derivation of various nonmem estimation methods, Journal of Pharmacokinetics and Pharmacodynamics 34 (5) (2007) [46] S. Welham, B. Cullis, M. Kenward, R. Thompson, A comparison of mixed model splines for curve fitting, Australian and New Zealand Journal of Statistics 49 (1) (2007) 1 23.

90 Chapitre 4 : NIMROD pour l inférence en modèle dynamique Perspectives Ce logiciel reste encore difficile d utilisation en particulier parce que son paramétrage se fait par lignes de codes et non par des menus déroulants ou une interface graphique. Par ailleurs, il ne possède pas de langage de description de modèle propre comme par exemple MLXTRAN pour NONMEM et MONOLiX, mais doit être modifié en Fortran. Ainsi, la création d un package R permettrait une meilleure diffusion de NIMROD et constitue une priorité dans les étapes d évolution de ce logiciel. Concernant les performances de l optimisation, nous avons remarqué que la convergence est parfois difficile à atteindre dans des problèmes de grandes dimensions. Bien qu il soit difficile de faire la part entre des problèmes d identifiabilité et des problèmes de précision, nous pourrions implémenter un passage de NIMROD en quadruple précision pour gagner en terme de chiffres significatifs dans les calculs (codé sur 128 bits au lieu de 64 bits en double précision). Par exemple, lorsque la surface de la log-vraisemblance pénalisée est particulièrement plate, une grande précision dans le calcul du score est nécessaire pour se déplacer vers le maximum. Par ailleurs, lors de l intégration numérique, la quadrature adaptative gaussienne (QAG) est la troisième fonction la plus coûteuse en temps après le calcul des vraisemblances et des scores non parallélisés. Son remplacement par d autres méthodes ne semble pas adéquat, car des études de simulations nous ont permis de confirmer sa supériorité en terme de précision et de temps de calcul par rapport à des méthodes trapézoïdales et de quasi Monte-Carlo, ainsi, nous avons cherché à optimiser la QAG. Le caractère adaptatif de la méthode rend les calculs plus longs, mais les résultats sont significativement moins biaisés lorsque la fonction à intégrer est éloignée d une loi normale. La seule optimisation possible reste donc un meilleur choix du nombre de nœuds utilisés par la QAG. À l heure actuelle, l utilisateur choisit un nombre minimal (n min ) et maximal de nœuds (n max ), la QAG réalise ensuite l évaluation de l intégrale pour tous les nombres de nœuds, en partant de n min jusqu à ce que la précision soit suffisante. Ceci est long et pourrait être évité en

91 4.2 : Perspectives 91 fixant le nombre de nœuds utilisé. Nous cherchons actuellement à modifier la fonction de QAG pour que cela soit possible. Par la suite, lors de la première itération de NIMROD, le nombre de nœuds pourrait être choisi par choix optimal par la QAG puis tenu fixe pour toutes les itérations suivantes. De manière plus générale, il serait intéressant de définir des méthodes pour choisir de manière automatique et optimiser les paramétrages (seuil de précision solveur, dθ,...) de NIMROD lors de la première itération puis de les garder fixes. Finalement, certains problèmes spécifiques de nos collaborateurs sont décrits ci-dessous et restent à implémenter pour prendre en compte une plus large gamme de modèles. Prise en compte d un modèle d erreur proportionnelle : c est le cas lorsque l erreur est supposée proportionnelle à la grandeur observée. Ceci est possible, mais demande une réécriture complète de la vraisemblance et des scores. En reprenant les équations 3.5 Section le nouveau modèle d observation serait : Y i m(t ij ) = g m [X i (t ij )](1 + ɛ ijm ) ɛ ij N (0, V). Estimation des points initiaux des systèmes ODE : cela pourrait se faire en fonction des données pour prendre en compte des modèles où les points de départ ne sont pas les points d équilibre des systèmes dynamiques. En reprenant l équation 3.3 Section , la fonction h ne serait plus définie, mais inférée avec potentiellement des effets aléatoires. Une solution préliminaire consiste à fixer les points initiaux du modèle mathématique aux valeurs observées pour chaque patient. Un assouplissement de cette méthode serait de fixer les points initiaux du modèle mathématique à la valeur moyenne observée pour tous les patients et de rajouter des effets aléatoires. Estimation des paramètres n intervenant pas dans les systèmes ODE : par exemple, si l effet traitement n est actif qu à partir d un certain temps η après le début du traitement T trt nous aurions γ(t) = γ 0 + βδ trt(t)=1 δ t>ttrt+η. Le paramètre η sera

92 Chapitre 4 : NIMROD pour l inférence en modèle dynamique 92 à estimer, mais n interviendra pas dans le système ODE. Il en est de même pour des paramètres qui interviendraient dans l équation d observation, par exemple si l on suppose qu on observe qu une fraction des CD4 et que l on veut estimer cette fraction. L estimation est d ores et déjà possible par des méthodes de profil de vraisemblance. Cependant, elles sont longues et fastidieuses à mettre en œuvre. Une alternative serait l inférence directe, mais celle-ci passe par le calcul des scores qui utilise les équations de sensibilité. Il n est donc pas possible d inférer des paramètres n y apparaissant pas. Une solution pourrait être de calculer les Ũ et H par différenciation finie pour ces paramètres. Pour finir, dans certains cas NIMROD échoue à estimer les paramètres en modèles NLME- ODE. Dans ce cas, en général, les méthodes MCMC classiques échouent. Lorsqu il ne s agit pas de problème d identifiabilité l échec vient pour MCMC de temps de calcul trop longs pour échantillonner la distribution a posteriori. Ainsi, nous pourrions penser à utiliser des filtres particulaires qui reviennent à faire du MCMC parallélisé [Del Moral et al., 2006]. Il s agit alors d approximer la distribution a posteriori par un nuage de réalisations pondérées aléatoirement que l on propage et qui sont sélectionnées par des algorithmes d échantillonnage d importance ( importance sampling ) où seules les particules de plus gros poids sont conservées et répliquées. Cependant, le développement d un tel algorithme dépasse le cadre de cette thèse.

93 Chapitre 5 Causalité et comparaison d approches Résumé : Dans ce chapitre, nous mettons en valeur les avantages et les inconvénients des modèles descriptifs comparés aux modèles mécanistes dynamiques explicatifs pour quantifier l effet d un traitement. Dans le cadre de données longitudinales observationnelles, nous réalisons une étude de comparaison de ces modèles sur la quantification d un effet traitement par cart (codé de manière binaire oui/non) sur le nombre de CD4 chez les patients infectés par le VIH. Nous montrons que les résultats obtenus par les modèles dynamiques sont plus réalistes à long terme vis-à-vis des connaissances et des données observées. Mots-clés : causalité ; CD4 ; effet des cart ; facteur de confusion ; HIV ; médiation ; modèles descriptifs ; modèles structuraux marginaux (MSM) ; NLME-ODE ; processus stochastiques. Abstract : The objective is to compare pros and cons of descriptive and mechanistic dynamic explicative models to quantify a treatment effect. In the settings of observationnal longitudinal data, we do a comparison study to investigate the suitability of these models to quantify the effect of cart (binary outcome yes/no) on CD4 in HIV-infected patients. We show that the dynamical model is more realistic for long-term trends regarding knowledge and observed data. Key words : causality ; cart effect ; CD4 ; confusion factor ; descriptive models ; HIV ; marginal structural models (MSM) ; mediation ; NLME-ODE ; stochastic process.

94 Chapitre 5 : Causalité et comparaison d approches Comparaison des modèles descriptifs et dynamiques Problématique Il s agit d estimer l effet de cart à l aide de données issues d une cohorte observationnelle. La détermination de l effet des cart sur l évolution des biomarqueurs du VIH est difficile, car le traitement est initié et modifié en fonction des niveaux de charge virale et du nombre de cellules CD4 [Thompson et al., 2010, Dybul et al., 2002] qui sont aussi prédicteurs de leurs numérations futures [Tarwater et al., 2001]. Comme nous l avons vu dans la Section 3.1.2, cette problématique peut être traitée à l aide de modèles structuraux marginaux. Nous nous proposons de faire une comparaison formelle des modèles descriptifs (Section 3.1) et explicatifs (Section 3.2) dans le contexte de cette problématique. Ce travail fait suite à des travaux plus théoriques sur la causalité réalisés par [Commenges and Gégout-Petit, 2009, Gégout-Petit and Commenges, 2010] présentés et étendus dans la première partie de l article situé en Section Il s agit d étendre les notions de causalité sur des variables aléatoires à des processus. Ainsi, A et Y seront des processus dépendants et pourrons avoir un effet dynamique de l un sur l autre au cours du temps. Le phénomène causal pourra donc être représenté par des graphes dirigés non acycliques (Figure 5.1). L application à laquelle j ai plus particulièrement participé applique l approche méthodologique de [Cole et al., 2003, Cole et al., 2005, Cole et al., 2007] sur les données de la Multicentric AIDS Cohort Study (MACS) [kaslow et al., 1987] aux données de la cohorte GECSA Anrs C Sélection des données Afin d obtenir des résultats comparables sur les jeux de données de la cohorte GECSA Anrs C03 (Groupe d Épidémiologie clinique du SIDA en Aquitaine) à ceux obtenus sur la MACS, nous avons sélectionné des patients sur le même schéma d étude (Figure 5.2). Les critères sont définis ci-dessous.

95 5.1 : Comparaison des modèles descriptifs et dynamiques 95 Facteurs de confusion L Traitement A U Facteurs de confusion non mesurés Y Biomarqueurs Figure 5.1 : Modèles causaux pour des processus : A a un effet sur Y qui a un effet sur A. Les patients doivent avoir été inclus dans la cohorte entre avril 1996 et avril En effet, 1996 correspond aux premières apparitions de cart. Après 2005 de nombreux nouveaux traitements sont mis sur le marché rendant l effet des cart trop hétérogène pour être modélisé de manière binaire. Les patients sous antirétroviraux simples non cart sont exclus, car l effet mesuré est alors plus faible puisque ces traitements sont connus comme sous-optimaux. Les patients avec des données manquantes sont exclus, car la GEE ne gère pas ce type de données sans imputation. Les patients sous traitement à l entrée de l étude sont exclus, car l effet de la cart est alors non identifiable. Les patients n ayant pas une visite tous les 6 mois [±2.5 mois] sont exclus, car pour la GEE les données doivent être équireparties. Nous nous sommes ensuite assuré que la sélection n avait pas créé de biais conséquent sur les covariables d intérêt et que les populations d étude avaient une description similaire avec la population recrutée dans la MACS (Table 5.1).

96 Chapitre 5 : Causalité et comparaison d approches 96 All = 6580 ( person- visit) All = 2100 (47444 person- visit) Patients included after April 1996 Visits after April 2005 Visits before April 1996 Visits with ARV (no HAART) prescibed All = 1970 (36431 person- visit) All = 1900 (29601 person- visit) Visits with missing values for CD4 Visits with missing values for Viral load Patients with treatment before April 1996 All = 685 (8689 person- visit) All = 212 (1510 person- visit) Patients without half- year visits +/- 2.5 months Patients with less than 1 year follow- up (2 visits) Figure 5.2 : Diagramme de sélection des patients GECSA pour la comparaison des modèles descriptifs et explicatifs. Temps de base suivi Caractéristiques n=212 personnes n= 1298 personnes-visites Âge moyen (années) Femmes(%) SIDA (%) cart (%) Nombre de CD4 (%) < > Nombre moyen de CD4 490 [69 ;1047] 508 [168 ;1092] Niveaux de charge virale(%) < > Niveaux moyens en log10 de charge virale 4.0 [2.7 ;5.4] 2.7 [1.7 ;4.8] Table 5.1 : Caractéristiques des 212 patients infectés par le VIH sélectionnés dans la cohorte GECSA Anrs C Aspects techniques et limites Par la suite, nous avons implémenté chacun des modèles descriptifs (avec SAS procédure GEE [Karim and Zeger, 1988]), explicatifs en temps discret (avec SAS procédure

97 5.1 : Comparaison des modèles descriptifs et dynamiques 97 NLMIXED [Wolfinger, 1999]) et dynamique (avec NIMROD [Prague et al., 2013a]). Nous avons étudié les différences d hypothèses sur lesquelles reposent ces modèles. Concernant les modèles descriptifs, nous avons mis en évidence une instabilité liée au choix de la matrice de variance-covariance de travail (Table 5.2). Ce défaut avait déjà été noté par [Sullivan Pepe and Anderson, 1994]. En effet, pour obtenir des estimateurs non biaisés lors d une analyse GEE, il faut utiliser une matrice de corrélation de travail diagonale si certaines des covariables sont dépendantes du temps comme c est le cas ici. Matrice de travail Effet traitement 1 an Effet traitement > 1 an Modèle 4 moy. e.t. Z stat. moy. e.t. Z stat. Diagonale Échangeable m-dépendante Non structurée Convergence non atteinte Table 5.2 : Effet du traitement sur le nombre de CD4 dans le modèle défini par [Cole et al., 2003], modèle 4 voir article Section Impact du choix de la matrice de travail dans la procédure GEE pour les modèles MSM. L analyse explicative a aussi montré des limites lorsque le modèle ODE est trop éloigné de la réalité. Par exemple lorsque les composantes peuvent prendre des valeurs aberrantes par rapport aux problématiques biologiques traitées, tel qu un nombre de cellules négatif ou infini. Dans ces cas, la log-vraisemblance ne peut pas être calculée par manque de précision. Si cela arrive pour un grand nombre de combinaisons de paramètres, cela empêche l optimisation. L aspect mécaniste des modèles explicatifs s avère donc être un handicap lorsque les connaissances biologiques d une dynamique sont mal cernées Un continuum entre modèles descriptifs et explicatifs Nous montrons qu il existe un continuum entre les modèles descriptifs et les modèles explicatifs bien que les capacités prédictives des modèles explicatifs semblent meilleures à la fois à court et long terme après comparaison avec des données observées et les connaissances sur l évolution des biomarqueurs après mise sous cart. Ce travail fait l objet d un article soumis.

98 From descriptive to mechanistic dynamical models: effect of HAART on CD4 counts Daniel Commenges 1,2, Mélanie Prague 1,2, Anne Gégout-Petit 3,4 and Rodolphe Thiébaut 1,2 1 Univ. Bordeaux, ISPED, F Bordeaux, France 2 Centre INSERM U897-épidémiologie-Biostatistique, F Bordeaux, France 3 CNRS UMR5251, Univ. Bordeaux I/II, F Bordeaux, France 4 INRIA CQFD, Univ. Bordeaux I, F Bordeaux, France June 2013 Abstract The problem of assessing the effect of a treatment on a marker in observational studies raises the difficulty that attribution of the treatment may depend on the observed marker values. This problem has been treated using marginal structural models relying on the counterfactual/potential response formalism. Another approach to causality is based on dynamical models, and causal influence has been formalized in the framework of the Doob-Meyer decomposition of stochastic processes. Causal inference however needs assumptions that we detail in this paper and we call this approach to causality the stochastic system approach. This approach allows incorporating biological knowledge naturally, so that a continuum can be established between descriptive and mechanistic modeling. The mechanistic models involve distinguishing the model for the system and the model for the observations. Indeed, biological systems live in continuous time, and mechanisms can be expressed in the form of a system of differential equations. Inference in mechanistic models is challenging, particularly from a numerical point of view, but these models can yield much richer and reliable results. Because of the difficulty of inference in models based on stochastic differential equations, most models that have been developed are based on ordinary differential equations. The different approaches are illustrated by estimating the effect of highly active antiretroviral treatment (HAART) on CD4+ lymphocytes counts in an observational study of HIV infected subjects. 1 Introduction One problem that has appeared as particularly challenging in clinical research is that of assessing the effect of a dynamic treatment regime, that is, a regime where covariates history of a subject up to time t may influence treatment given after t and may also influence the process of interest. A motivating application has been to assess the effect of antiretroviral therapy in HIV infected subjects. As CD4+ lymphocytes are the main target cells of the virus, it is possible to assess this effect on the blood concentration of these cells: CD4 counts are measurements of this concentration, generally given in cells by ml. In observational studies however, the decision to start an antiretroviral therapy may depend on CD4 counts as well as on other covariates. In this setting it has been demonstrated that conventional regressions lead to biased estimates of the treatment effect, typically underestimating it and possibly indicating a negative effect. Robins et al. (2000) developed the marginal structural model (MSM) approach for treating this problem. Essentially the approach is based on choosing a causal model in terms of counterfactual responses to the treatment, the parameters of which are estimated through a weighted generalized estimating equation (GEE). The weights are determined in order to eliminate the bias due to the dependance of treatment attribution on covariates linked to the outcome and are obtained through a model of treatment attribution. The approach has been applied by Hernán et al. (2002) and by Cole et al. (2005) for estimating the effect on CD4 counts of zidovudine and of highly active antiretrovial therapy (HAART) respectively. Cole et al. (2007) and Cole et al. (2010) used it for estimating the effect of HAART on viral load 1

99 Submitted article and on AIDS or death, respectively. Robins (1994) also introduced the structural nested models which can be applied to this problem. The dynamic approach to causality which does not use the counterfactual representation can also be applied to this problem. This approach has been pioneered by Granger (1969). Schweder (1970) and then Aalen (1987) generalized this approach and formalized the influence between stochastic processes using the Doob-Meyer decomposition. This was further developed by Didelez (2008); Commenges and Gégout- Petit (2009); Gégout-Petit and Commenges (2010); Eichler and Didelez (2010). Recently, Aalen et al. (2012) have suggested that a discrete-time dynamic model can be considered for studying HAART effect on CD4 counts and viral load. The aim of this paper is to give the assumptions that are needed in the dynamic approach for establishing the causal effect of a treatment in an observational study and to give examples of implementation in both discrete and continuous time. The concept of system is fundamental to ground a causal meaning of influence between stochastic processes. We call the dynamic approach aimed at causal inference the stochastic system approach. We examine models of different degrees of complexity, going from very simple descriptive models to a rather complex mechanistic model, and we compare this approach with the MSM approach. These models are applied for estimating the effect of HAART on CD4 counts. In Section 2, dynamic discrete-time models with different degrees of complexity are studied within the framework of the stochastic system approach. The central role of the Doob decomposition in causal interpretation is highlighted. The concept of perfect system is defined. We begin with a simple perfect system involving only the marker and the treatment. It is shown that in this case, the dynamic approach can estimate the same parameters as the MSM. The assumptions needed for making causal inference in the stochastic system approach are precisely given. Then we explore systems where the marker of interest is influenced by another process, which may act as a confounder. In Section 3 it is argued that we should model separately the biological system which lives in continuous time and the observations which are taken at discrete times. Mechanistic models based on systems of stochastic differential equations (SDE) or ordinary differential equations (ODE) can be developed; in practice ODE-based models are more manageable. Application of these different models is presented in Section 4 for estimating the effect of HAART on CD4 counts, based on the data of a cohort of HIV infected patients (the Aquitaine cohort). Section 5 concludes. 2 The stochastic system approach to the dynamic treatment problem 2.1 Introduction to the Doob decomposition Markers as stochastic processes As in Hernán et al. (2002), we denote the value of a physiological marker at time t by Y (t) and the value of a treatment given at time t by A(t). The problem is to assess the causal effect of the treatment on the marker in a situation where treatment attribution may be influenced by previous values of the marker. Here we immediately encounter a difficulty which comes from the discrete-time modeling of a phenomenon which actually evolves in continuous time: treatment attribution, if it can depend on Y (t), must be decided after t, at t + δ where δ is a small positive delay. To keep notation simple we will still call A(t) the treatment attributed just after t. However this raises a problem for the Doob decomposition: in a rigorous description of the problem time t and t + δ must be distinguished (see Appendix 6.1). The family of variables (Y (0), Y (1),...) and (A(0), A(1),...) form stochastic processes in discrete time. Thus it is natural to use the formalism and the results of the stochastic process theory. We will denote the processes themselves by Y and A and, in this context it is common to write Y t for the value of the process Y at the value t of the discrete time-parameter Martingales and previsible processes The Doob decomposition (Doob-Meyer in the case of continuous time parameter) is central to the theory of stochastic processes and can play a central role for formalizing causality. For understanding it, one must first understand the concept of filtration. An intuitive description is possible; for more rigorous definitions see Williams (1991). A filtration {F t : t 0} is an increasing family of sigma-fields. In our example, the sigma-field F 0 will be generated by A 0, Y 0, that is, the set of all events that we can form with these two variables. Similarly F t will be generated by the variables (Ȳt, Āt), where Ȳt = (Y 0,..., Y t ) and Āt = (A 0,..., A t ). We note: F t = σ(āt, Ȳt). Observing F t can be interpreted as getting the information about Y and A up to t. There is more information available at t than at t 1, so F t 1 F t. Our filtration is a family of such sigma-fields: {F t : t 0}. Next we have to define a previsible process in a given filtration. A process C is previsible if, for all t, the variable C t is mea- Page 2 of 14

100 Submitted article surable for F t 1. For instance if A t = 1 {Y (t 1)<300} the events {A t = 1} and {A t = 0} belong to F t 1. The process A defined by A t = 1 {Y (t 1)<300} for all t, is previsible. On the other hand, if attribution of treatment is randomized such that A(t) = 1 with probability 1/2, then A is not previsible. Finally, a martingale is a process M = (M t : t 0) such that, the conditional expectation of M t given the past is such that: E(M t F t 1 ) = M t 1, for all t The Doob decomposition The Doob decomposition of a process is an additive decomposition into a previsible process and a martingale; see again Williams (1991). Applied to Y this gives: Y = Y 0 + Λ Y + M Y, (2.1) where Λ Y is a previsible process null at 0 that we call the compensator, and M Y is a martingale null at 0. This decomposition exists and is unique (modulo undistinguishability). In continuous time, the same kind of decomposition is called the Doob-Meyer decomposition. We also have the Doob decomposition for A: A = A 0 + Λ A + M A, with Λ A a previsible process and M A a martingale. Equation (2.1) means that for all t we have Y t = Y 0 + Λ Y,t + M Y,t. It is illuminating to look at the difference equation which gives the evolution of Y between t 1 and t: Z t = Y t Y t 1 = Λ Y,t Λ Y,t 1 +M Y,t M Y,t 1. (2.2) We have, because of the martingale property and the previsibility of Λ Y : E(Z t F t 1 ) = E(Λ Y,t Λ Y,t 1 F t 1 ) = Λ Y,t Λ Y,t 1. That is, if we know Λ Y we can compute the expectation of the evolution of Y between t 1 and t; or in other terms, the evolution is equal to something which can be computed from information at t 1 plus a random term of null expectation Perfect system We must remember that the Doob decomposition of a process depends on both the probability law and the filtration. We can (and we shall) play with different probability laws and filtrations, not completely freely, but for formalizing causality. First, t will mean the physical time. The probability law which is interesting in this context is the true probability law P, which gives rise to the realized events (which may be observed). We can consider more or less rich filtrations. For instance, for the problem of a physiological marker Y and a treatment A, we can consider the filtration {F} generated by (Y, A), as described in Denote by Λ {F} Y the compensator of Y in this filtration. In a richer filtration {G} generated by (Y, A, V ) where V is another process, the compensator will be Λ {G} Y. However we will restrict to what we call physical filtrations : {F} is a physical filtration if F t contains only events that may have occurred before or at t (here, t is not just a mathematical parameter but represents physical time). A physical process is a process which generates a physical filtration. Definition 2.1 (Perfect system). A system specified by the filtration {F} is perfect for Y if under the true probability P, the Doob decomposition of Y t is the same in {F} and in any physical filtration {G} which is finer than {F}, that is {F} {G}. 2.2 The simple perfect system The physical law assumption It is necessary to make explicit the fact that the processes at hand represent real events, occurring to subjects that we label i, i = 1,..., n. The events of interest for subject i are denoted by the process X i = (Y i, A i ), which generates the filtration {F} i, and Y i has a Doob decomposition in this filtration under probability P i (the true probability law for subject i): Yt i = Y0 i + Λ Y i,t + M Y i,t = Y0 i + φ i t(ȳ t 1, i t 1) + M Y i,t. We make the following assumptions. Perfect system assumption: System represented by the filtration {F} i is perfect for Y i, for all i. Independent innovation assumption: Under P, for all i, j and t: M Y i,t+1 Āj t and, for all j i and all t: M Y i,t+1 M Y j,t. Stability assumption: Under P, φ i t(.,.) = φ t (.,.) for all t and i; the martingales M Y i, for all i, have the same law denoted P M Y ; Y 0i have the same law for all i. Note : We cannot say of course that Λ Y i,t and Λ Y i,t for i i are the same process, not even that they have the same law: what is invariant is the function φ t (.,.). Also the Y i do not have the same law because the A i may have different laws for different i s. The conjunction of the perfect system, the independent innovation and the stability assumptions are Page 3 of 14

101 Submitted article called the physical law assumption for Y. To completely specify the physical law for Y on horizon t f one must specify the law of Y0 i, φ t (.,.) for t t f, and the law of the martingale P M Y. The laws of X i, P i, may be different because the treatment regimes may be different. The treatment process can also be described by a Doob decomposition difference equation: φ t (Ȳt 1, Āt 1) = β1a t 1 + β2. (2.5) Summing equations (2.5) for t = 1 to t f we obtain φ tf (Ȳt f 1, Āt f 1) = β1cum(āt f 1) + β2t f and thus Y tf = Y 0 + β1cum(āt f 1) + β2t f + M Y,tf, A i t = A i 0 + Λ Ai,t + M Ai,t = A i 0 + ψt(ȳ i t i, Āi t 1) + M A i,t, (2.3) with again the slight difficulty that Ȳ t i (rather than Ȳt 1) i appears in the compensator because we assume that treatment attribution is decided just after observing Y. The martingales M A i and M Y j are independent for all i, j. Thus, the treatment regime up to t f is specified by A i 0, ψt(.) i and the law of the martingale P M for t t A i f. Finally, the law of X i = (Y i, A i ), P i, is completely specified by the law of Y0 i, the physical law for Y and the treatment regime. The treatment regimes may differ, in particular between subjects who are part of an observational study and subjects enrolled in a randomized study. If one knows the physical law for Y, one knows the causal effect of A on Y. For instance if by an intervention on subject i we give the treatment regime A i = a (that is, A i t = a t, t = 0,..., t f where the a t are fixed values), the law of X i is completely specified if we know the specific physical law for Y ; we denote it by P a. Note that if A i = a, the Doob decomposition 2.3 still hold but is degenerate with a zero martingale. More generally, if we know the physical law, we know the probability law of Y for any treatment regime Definition of causal effects It has been conventional to define a particular summary of the treatment effect. There are many ways of defining such a summary: for contrasting the effects of values a and a given to A, any contrast between P a and P a would do. For simplicity and to match with the summary used by Cole et al. (2005) we define the causal effect on horizon t f as CE(a, a ) = E a (Y tf ) E a (Y tf ), (2.4) where E a means expectation under probability P a. More generally, denoting by P 1 and P 2 probability laws specified by two different treatment regimes, one could contrast the causal effects of the two treatment regimes by CE(P 1, P 2 ) = E P 1(Y tf ) E P 2(Y tf ). As an example, suppose that the physical law is such that the compensator of Y is specified by the Page 4 of 14 where cum(āt f 1) = t f 1 t=0 A t. We can assess the causal effect at horizon t f by: CE(a, a ) = E a (Y tf ) E a (Y tf ) = β 1[cum(ā tf 1) cum(ā t f 1)]. Another possibility would be to use a ratio rather than a difference of expectations Inference Suppose that we observe X t i f One important feature of this approach is that we can infer causal effects without knowing the law of A i. Indeed, if there was a very large number of observations = (Ȳ i t f, Āi t f ), i = 1,..., n. and both Āi t 1, Ȳ t 1 i took a finite number of values we could estimate φ t (Āi t 1, Ȳ t 1) i by a simple mean of the observations. An interesting factorisation of the likelihood also shows that the distribution of A i is not needed. We use light notations writing the likelihood for variable X f(x) rather than the more rigorous f X (X), where f X (.) is the probability density function of X. Under the physical law assumption of the perfect system, the likelihood of observation X t i f, or equivalently ( Z t i f, Āi t f ) (see equation (2.2)), factors in: f( Z i t f, Āi t f ) = t f t=1 t f f(zt Ȳ i t 1, i Āi t 1) f(a i t Ȳ t i, Āi t 1). t=1 (2.6) This factorisation can be easily checked. For inference, provided the same parameters are not involved in both f(zt Ȳ i t 1, i Āi t 1) and f(a i t Ȳ t i, Āi t 1), we can use the partial likelihood (in the sense of Andersen et al. (1993)): t f t=1 f(z i t Ȳ i t 1, Āi t 1). (2.7) It is clear that we do not need to model treatment attribution. The term f(zt Ȳ i t 1, i Āi t 1) gives the physical law of the dynamics of Y i and can be expressed in terms of φ t (.,.) and the law of the martingale M Y i. Specifically, the contribution to the likelihood of subject i is t f t=1 f M Y,t [Z i t φ t (Ȳ i t 1, Āi t 1)]. In practice we must make assumptions to obtain good estimates with a moderate number of observations. First a Markov assumption leads to : φ t (Āi t 1, Ȳ i t 1) = φ t (A i t 1, Y i t 1).

102 Submitted article A very simple parametric form, with (β 1, β 2 ) R 2, is : φ t (A i t 1, Yt 1) i = β 1 A i t 1 + β 2, This gives : In terms of Y i t φ t (A i t 1, Y i t 1) = β 1 cum(āi t 1) + β 2 t. this model implies that: E a (Y i t ) = E a (Y i 0 ) + β 1 cum(ā t 1 ) + β 2 t, which is the same model as in Hernán et al. (2002) who call β 1 the causal parameter. If one makes the assumption that all the martingale increments are independent (both in t and i), all the Zt i are independent; we may in addtion make a distribution assumption for the martingale increments, for instance assume they are distributed as N (0, σ 2 ): this completes the model, up to the law of A i. The maximum likelihood estimator ˆβ 1 of β1 can be computed by standard regression of Zt i on A i t 1; it is consistent and has asymptotic efficiency if the model is well specified. However it is important to note that we use in fact the partial likelihood (2.7) which does not involve the distribution of A i. That is, the mechanism of treatment attribution is ignorable (reminiscent of ignorable mechanisms of incomplete observations and reduced model in Commenges et al. (2007)). If one does not want to make such assumptions on the law of the martingale, β1 can be estimated using an unweighted GEE for estimating the parameters of the model for the expectation of Zt i conditional on A i t 1: E(Zt A i i t 1) = β 1 A i t 1+β 2. Even if Zt i 1 and Zt i 2 are not strictly independent given A (for instance if the martingales do not have independent increments), the independence working assumption is likely to be better for Z i than for Y i. 2.3 Perfect system with a confounder The physical law assumption We examine the case where we can find a physical process V i which modifies the dynamics of Y i. We denote by Λ Fi Y the compensator of Y i in the filtration {F} i generated by X i and by Λ Gi Y the compensator of Y i in {G} i where {G} i is the filtration generated by XC i = (Y i, A i, V i ). If Λ Gi Y = ΛFi Y we would say that weak conditional local independence (WCLI) holds for Y i relative to V i (Commenges and Gégout-Petit, 2009). Saying that X i = (Y i, A i ) is not a perfect system means that Λ Gi Y ΛFi Y (that is, they are not undistinguishable). This can be noted : V i X i C Y i, which reads: V i influences Y i in the system XC i. can be written as φi t(ȳ t 1, i Āi t 1, V t 1). i Λ Gi Y The physical law assumption here is the conjunction of the following assumptions: Perfect system assumption: System represented by the filtration {G} i is perfect for Y i, for all i. Independent innovation assumption: Under P, for all j and t: M Y i,t+1 Āj t, V j t and, for all j i and all t: M Y i,t+1 M Y j. t Stability assumption: Under P, φ i t(.,.,.) = φ t (.,.,.), for all t and i; the M Y i have the same law for all i. We also make the assumption that Y i / XC i V i. The process V i also admit a Doob decomposition: Vt i = V0 i + χ i t( V t 1) i + M V i,t. For simplicity we make an additional stability assumption on V. Stability assumption for the confounder: Under P, χ i t(.) = χ t (.) for all i and t and the martingales M V i have the same law for all i. With these assumptions, the Doob decompositions of the three components of X i C are: Yt i = Y0 i + φ t (Ȳ t 1, i Āi t 1, V t 1) i + M Y i,t, Vt i = V0 i + χ t ( V t 1, i Āi t 1) + M V i,t, A i t = A i 0 + ψt(ȳ i t i, Āi t 1, V t 1) i + M A i,t, (2.8) with again the slight difficulty that Ȳ t i (rather than Ȳt 1)appears i in ψt. i We assume that all the martingales M Y i, M A j, M V k for any i, j, k are independent and the increments of these martingales are independent of the past. Note that the φ t and χ t do not depend on i but the ψt i do because different subjects may have different treatment regimes. V can be a confounder or a mediator, of both. For studying the effect of A i in this system we make the further assumption that V i is WCLI of A i, in other words A i does not influence V i ; this is noted: A i / XC i V i ; we do not investigate further the problem of mediation in the theoretical part of this paper. Thus we will write the second equation of the system 2.8: V i t = V i 0 + χ t ( V i t 1) + M V i,t. In the Doob decomposition 2.8 we have in general that V i X i C A i and V i X i C Y i, so that V i is a confounder. The corresponding graph of influences (assuming V i is WCLI of A i ) is depicted in Figure 1, where an arrow from one process to another represents an influence and conversely, lack of an arrow represents a WCLI relation. As in the simple perfect system, if one knows the physical law for Y, one knows the causal effect of A Page 5 of 14

103 Submitted article expectation of conditional causal effects: ACE(a, a ) = E{CE(a, a ; V )}. Note that ACE(a, a ) depends on the law of V. Example 1. Suppose that the physical law is such that φ t (Ȳt 1, Āt 1, V t 1 ) = β1a t 1 + β2 + β3v t 1. Under P a and conditional on V = v we obtain: φ t (Ȳt 1, ā t 1, v t 1 ) = β 1cum(ā t 1 )+β 2t+β 3cum( v i t 1). We find : Figure 1: A system with confounder: Y is the process of interest, A is the treatment process, V is a process which influences both A and Y. Note the arrow from Y to A meaning that process Y influences the treatment process A. Thick arrows pointing toward Y pertain to the physical law for Y, while thin arrows pointing toward A pertain to treatment regime; in some treatment regimes the latter can be broken. on Y. For instance if by an intervention on subject i we give the treatment regime A i = a, the law of XC i is completely specified if we know the specific physical law for Y and the law of V i. This is true for any treatment regime Conditional, average, and marginal causal effects As in the simple system of section 2.2 we can summarize the causal effect by well chosen contrasts. In this section we omit the index i. In this more complex situation however, we can define three types of effects: conditional, average, and marginal. Conditional causal effect: A conditional causal effect of value of the trajectory A = a versus A = a on horizon t f conditional on V = v is: CE(a, a ; v) = E a (Y tf V = v) E a (Y tf V = v). Note that the expectation here does not depend on the treatment regime. The causal effects are defined for each value v of V, and when V is random we have a distribution of causal effects. It may be interesting to define the average causal effect. Average causal effect: An average causal effect of value A = a versus A = a on horizon t f is the CE(a, a ; v) = β 1{cum(ā tf 1) cum(ā t f 1)}. Here, due to the linearity of the contrast and of the compensator in V, the causal effect does not depend on the value v of V. Thus ACE(a, a ) = CE(a, a ; v) for any v. Example 2. Suppose that the physical law is such that φ t (Ȳt 1, Āt 1, V t 1 ) = β1a t 1 V t 1 + β2. Under P a and conditional on V = v we obtain: We find : t 1 φ t (Ȳt 1, ā t 1, v t 1 ) = β1 a s v s + β2t. s=0 t 1 CE(a, a ; v) = β1 v s (a s a s). s=0 Here, the causal effect depends on v. The average causal effect is t ACE(a, a ) = E{CE(a, a ; V )} = β1 E(V s )(a s a s). s=0 There is another way to define an effect which gets rid of the value of V, and that we call the marginal causal effect. We can define the marginal casual effect as: Marginal causal effect: A marginal causal effect of value A = a versus A = a on horizon t f is the expectation of conditional causal effects: MCE(a, a ) = E a (Y tf ) E a (Y tf ). Formally this is the same definition as that of the causal effect in the case of a simple perfect system. However here it is marginal and we need know the law of X C to compute it. Because of the linearity of the contrast, the average causal effect is equal to the marginal causal effect : MCE(a, a ) = ACE(a, a ). This would not hold if the contrast was not linear (like a ratio). Page 6 of 14

104 Submitted article Inference For inference, we still can use a partial likelihood which does not involve the distribution of A nor V : t f t=1 f(z t Ȳt 1, Āt 1, V t 1 ). (2.9) Assume that the perfect system is X C but we use X, and we observe subjects in an observational study where A is random; we denote by P O the probability law of X C. In the filtration {F} the compensator of Y under P O is φ F t = E P O(φ G t F t 1 ) (the innovation theorem ). This compensator can be observed and hence estimated. The question is whether knowledge of this compensator gives us the marginal causal effect or not. There are two cases and the answer to the question is in agreement with the intuition: in the case where V does not influence A (V / X C A), the observed compensator gives the marginal causal effect; when V XC A, that is V is a confounder, the observed compensator does not give the marginal causal effect. In order to prove the result when V / X C A we need to show that and under any P which respect the physical laws assumption for Y and V the {F} compensators of Y are the same. For this we need the following lemma. Lemma 2.1. Let P 1 and P 2 two probability laws such that: (i) V 0 independent of (Y 0, A 0 ); (ii) the associated pdf satisfy the physical law assumption: f 1 Y t Āt 1, V = f 2 t 1,Ȳt 1 Y t Āt 1, V t 1,Ȳt 1, and f 1 Vt = f 2 Vt for all 0 < t T ; (iii) V / X C A. Then f 1 V = f 2 t 1 Āt 1,Ȳt 1 V t 1 Āt 1,Ȳt 1. The proof is given in Appendix 6.2. result now follows. The main Theorem 2.1. Under any P which respects the physical laws assumption for Y and V, the {F} compensators of Y are the same. By the innovation theorem, the {F}-compensator is given by : φ F t (Ȳt 1, Āt 1) = E[φ G t (Ȳt 1, Āt 1, V t 1 ) Ȳt 1, Āt 1], where the expectation is taken either with P a or P. The computation of this expectation involves integrating using the kernel f Vt 1 Āt 1,Ȳt 1. φg t is the same function whatever the probability which respects the physical law; if the integrating kernel is the same the compensators of Y will be the same, which proves the Theorem. In particular, they are the same under P O and P a. Thus, estimating the compensator in an observational study allows to know the dynamic of Y on a subject for which A is fixed to the value a. Thus if we ignore processes that influence Y, we can still estimate the marginal causal effect, although Like in the simple perfect system, inference can be made by maximum likelihood or GEE. Once we have estimated f Zt Ȳt 1,Āt 1, V t 1 for all t, we can estimate conditional causal effects. For estimating average or marginal causal effects we must also estimate the probability law of V, which is easy if V is observed. not the average causal effect if it is different. For estimating the marginal causal effect there must be 2.4 The unperfect system case no unmeasured confounder, a well known condition, although we speak in terms of processes rather than random variables. Consider the Example 1 of section 2.3. The {G}- compensator is : φ G t (Ȳt 1, Āt 1, V t 1 ) = β 1cum(Āt 1)+β 2t+β 3cum( V t 1 ). The {F}-compensator is : φ F t (Ȳt 1, Āt 1, V t 1 ) = β 1cum(Āt 1) + β 2t +β 3E{cum( V t 1 ) Ȳt 1, Āt 1}. If V / X C A, then in virtue of Lemma 2.1, the result of E{cum( V t 1 ) Ȳt 1, Āt 1} is the same for all probability laws respecting the physical law, in particular it is the same under P O and P a. In that case the marginal causal effect is MCE(a, a ; v) = β1{cum(ā tf 1) cum(ā t f 1)}. β1 can be estimated by maximum likelihood as described in Section from observation of Y and A in an observational study. On the other hand, if V XC A, then E{cum( V t 1) Ȳt 1, i Āt 1} depends on Āt 1 in a way which depends on the probability law. Thus the observed {F}-compensator does not give us the marginal causal effect. 3 Generalization to continuous time and mechanistic models 3.1 Stochastic differential equations models A more realistic modeling of the dynamics of CD4 and viral load acknowledges that the biological processes live in continuous time. However, since observations are in discrete time we must distinguish between the biological processes and their observations. Thus we have the Doob-Meyer decomposition for the Page 7 of 14

105 Submitted article physiological process T, representing the concentration of CD4+ T-lymphocytes and another process V which may represent the concentration of viruses. This model must be completed by an equation for the observations. The differential form of the Doob- Meyer decomposition is: dt t = dφ T,t { T t, V t, Āt } + dm T,t, dv t = dφ V,t { T t, V t, Āt } + dm V,t, A t = φ A,t {T t, V t, A t } + M A,t. (3.1) V could play the role of a confounder if it influences both T and A; if V is influenced by A, part of the effect of A on T is mediated by V. The equation for A is given by the operator because the trajectory of A is not continuous and only makes jumps at visit times. Note that in the inference based on the partial likelihood, as in the discrete-time case, we do not need in fact the model for A, which is supposed to be completely observed. CD4 counts and viral load are observed at times t j, j = 1,..., m. For making a model with gaussian errors acceptable, transformations can be used. Noting ˇY j and ˇV j transforms by g 1 and g 2 of the CD4 counts and viral loads at t j respectively, the observational model could be: { ˇYj = g 1 (T tj ) + ε 1j, (3.2) ˇV j = g 2 (V tj ) + ε 2j, where g 1 (.) and g 2 (.) are known functions and ε 1j and ε 2j are Gaussian errors terms. The effect of the treatment can still be assessed by a contrast applied to compensators for treatments a or a. More realistic models can be constructed on the basis of knowledge of biological mechanisms. For instance we know that only infected cells can produce viruses, so we should distinguish between uninfected and infected cells. In practice however, stochastic differential equations are difficult to treat statistically as well as numerically, and methods are restricted for the moment to rather simple systems: see for instance Picchini et al. (2010), Delattre et al. (2012). So we restrict in the remaining of the paper to models based on systems of ordinary differential equations (ODE). 3.2 Practical mechanistic models based on systems of ordinary differential equations We can use general principles and the specificity of the problem to develop a mechanistic model. We can take into account that viruses can infect T-cells, that infected T cells can produce viruses, that both T-cells and viruses die at a certain rate and so on. These considerations lead to rather complex non-linear differential equations. This kind of models have been initiated by Ho et al. (1995) and developed in further works (Wu, 2005). One advantage of these non-linear models is that they generally admit an equilibrium state, which is indeed observed. The models are made more flexible by introduction of random effects and this was developed by Huang et al. (2006) and Guedj et al. (2007). The activated cells model used by Prague et al. (2012) proved good predictive ability. For describing this model, we distinguish the mathematical structure, the model for the interindividual variability and the model for the observations. The mathematical structure distinguishes quiescent (Q t ), activated (T t ) and infected (Tt ) CD4+ T- cells: dq t = (λ + ρt t αq t µ Q Q t )dt, dt t = (αq t γt t V t ρt t µ T T t )dt, dtt = (γt t V t µ T Tt )dt, dv t = (πtt µ V V t )dt. (3.3) Here, the parameters have biological meanings: λ is the production rate of new CD4+ T-cells, the µ s are mortality rates, α and ρ are transition rates between quiescent and activated cells, π is the rate of production of virions by infected cells, and γ is the infectivity parameter. The model assumes that the rate of infection of activated T cells is γv t. The model for inter-individual variability of the parameters includes possibly time-dependent explanatory variables (such as the treatment) and random effects. Score tests or Akaike criterion are guides to choose how to model the effect of explanatory variables and where to put the random effects. The treatment effect can be modeled as an effect on the infectivity parameter γ that consequently depends on t through A t : log γ(t) = ˇγ 0 + βa t, (3.4) where we expect β < 0. Random effects can be put on several parameters; based on previous experience with this model we propose to put random effects on λ and µ T as: log λ = ˇλ 0 + u λ ; log µ T = ˇµ T 0 + u µt, (3.5) where u λ and u µt are independent normal variables. CD4 counts and viral loads are observations of total CD4+ T-cells and virus concentrations respectively made at times t j, j = 1,..., m. A model for the observations of the type of 3.2 can be used with and g 1 (x) = (x) 0.25 and g 2 (x) = log 10 (x). This allows Page 8 of 14

106 Submitted article making a normal measurement error distribution acceptable: { ˇYj = (T tot t j ) ɛ 2j j = 1,..., n, ˇV j = log 10 (V tj ) + ɛ 1j j = 1,..., n, (3.6) where Tt tot = Q t +T t +Tt is the total number of CD4 cells at time t, and the ɛ kj are independent Gaussian with zero mean for all k and j. The observation mechanism is generally complicated by a detection limit for the viral load, producing left-censoring for ˇV j Jacqmin-Gadda et al. (2000) In this mechanistic model, it is natural to consider that β in (3.4) is a causal parameter. A more comparable measure of effect would be the extension of a contrast of the type E a (Tt tot f ) E a (Tt tot f ): here, the expectation is degenerate since the equations are deterministic: it simply means the value of the solution for the particular value of the treatment, a or a. We can also add random effects in this models, in which case we can compute an effect conditional on the random effects and also the average of these conditional effects. 4 Application 4.1 The sample We compared the estimation of the effect of HAART on CD4 counts obtained by the naive, the MSM and the dynamic approaches. We used real data from the Aquitaine cohort (Thiébaut et al., 2000). Similarly as in Cole et al. (2005) we took the sample of patients who were alive, HIV positive, yet untreated and under follow-up in April 1996 when HAART became available. All patients taking ARV in monoor bi-therapy instead of HAART were excluded. For applying the discrete-time models we need to have equally spaced observations without missing data. In the Aquitaine cohort the patients were not regularly seen every six months, thus, we selected only patients for whom a visit with both CD4 count and viral load were available at least two months and a half around the theoretical half-year visit date. We selected 212 patients and for each of them the follow-up began with the first visit after April 1996 and ended with 1) the last visit at which he or she was seen alive, 2) the last visit before patient discontinued the twice yearly check-up, or 3) April 2005, whichever came first. A total of 1510 person-visits were gathered. We assumed that HAART was not interrupted until the end of the follow-up as defined above. 4.2 The models We used several discrete-time models, close to those used by Hernán et al. (2002) and Cole et al. (2005) for analysing CD4 counts. Our first series of models involves only an equation for the evolution of CD4 counts (Y): Model 1: E(Y t ) = γ 0 + γ 1 cum(āt 1) + γ 2 t; unweighted GEE Model 2: E(Y t ) = β 0 + β 1 cum(āt 1) +β 3 cum(āt 3) + β 2 t; MSM, weighted GEE depending only on CD4 counts Model 3: E(Y t Y t 1 F t 1 ) = β 2 + β 1 A t 1 + β 3 A t 3 ; unweighted GEE Model 3 : E(Y t Y t 1 F t 1 ) = β 2 + β 1 A t 1 + β 3 A t 3 ; maximum likelihood assuming normal distribution. Thus, Model 1 is the naive one-slope regression model treated by unweighted GEE; Model 2 has two different slopes for cumulative treatment effect up to one year and larger than one year as in Cole et al. (2005). We used a constant trend (β 2 ) as in Hernán et al. (2002). In this MSM, we performed weighted GEE with only baseline and time-varying CD4 count to compute stabilized probability-of-treatment weights; Model 3 is a dynamic model which is the same as Model 2 for the expectation and which uses unweighted GEE, with the advantage that the working independence matrix should be more acceptable; Model 3 further assumes conditional independence and a normal distribution which allows computation of the likelihood. Cole et al. (2005) used a more complete model using for the weights both probability-of-treatment and probability-of-censoring. These weights were computed with sex, CD4 count in categories (< 200, and > 350), viral load in categories (< 401, and > 10000) as baseline covariates. The subset of time-varying covariates consisted of indicator variable for detectable viral load, CD4 count and detectable log10 viral load. Our Model 4 was identical to the model of Cole et al. (2005) except that these authors used splines for the effect of viral load in the logistic model for the weights. Model 4: E(Y t ) = β 0 + β 1 cum(āt 1) +β 3 cum(āt 3) + β 2 t; MSM, weighted GEE for treatment and censoring, depending on several baseline and time-varying covariates (including viral load). Page 9 of 14

107 Submitted article In the dynamic approach we have to jointly model the dynamics of viral load together with that of CD4 counts. This is feasible and leads to a richer description of the physiological processes. Our second series of models are systems of two or more difference or differential equations. Model 5 is a discrete-time system of difference equations. It is not necessary here to explicitly put two slopes since the solution of these linear difference equations is non-linear in t. The coefficients of the difference equations can be estimated by two separate regressions that can be done by either unweighted GEE or, if we assume conditional independence and normal distribution, by maximum likelihood. In that case we can also use Akaike criterion for model selection. Model 5: Y : CD4 counts; ˇV : log viral load. E(Y t Y t 1 F t 1 ) = β 0 + β 1 A t 1 +β 2 Y t 1 + β 3 ˇVt 1, E( ˇV t ˇV t 1 F t 1 ) = α 0 + α 1 A t 1 +α 3 Y t 1 + α 4 ˇVt 1. (4.1) Finally, we considered a mechanistic continuoustime model. Model 6: the mechanistic model (3.3), completed by treatment effect (3.4), random effects (3.5) and the observation model (3.2). 4.3 Results Table 1 displays the results we obtained for the treatment effect on CD4 counts in the first five models. For all these models but Model 3, GEE was used. Models 2 and 4 used weighted GEE with stabilized weights. For these GEE, independence working correlation matrices were used since Pepe and Anderson (1994) showed that GEE using non-diagonal working matrices could be biased in case of time-varying covariates, which is the case here. As expected, the naive Model 1 (not correcting for treatment attribution) indicates a deleterious effect of the treatment. Moreover, the MSM Model 2 which computes weights based on only CD4 counts does not correct anything. The results for the dynamical Model 3 are consistent with a favourable effect of treatment with two slopes, and are close to the results of the dynamical Model 3 (which makes the conditional independence and normality assumptions); only the estimates of the standard errors are different. Model 4 is also consistent with a favourable two-slopes effect of the treatment, but fails to reach significance. The estimates of the first slope by Model Treatment Standard Test Model Effect error Z-stat Model Model 2 1 year > 1 year Model 3 1 year > 1 year Model 4 1 year > 1 year Table 1: Effect of treatment on CD4 count: Model 1: naive regression; Model 2: MSM with simple weights; Model 3: simple dynamical model, unweighted GEE; Model 3 : simple dynamical model, maximum likleihood; Model 4: MSM with well-adjusted weights. 3 is close to the estimate found by Cole et al. (2005) ( = 81 cells per year) but larger for the second slope. Model 4 finds even larger effects but with large standard errors. Next, we turn to the multivariate dynamical models. Table 2 shows the estimates for the effect of treatment in Models 5 and 6. In model 5 there is a parameter for the effect of the treatment on CD4 and on viral load; in Model 6, the effect of the treatment concentrates on the infectivity parameter γ. The absolute values of these parameters are not comparable: we look only at the direction of the effect and the degree of significance. Treatment Standard Test Model Effect error Z-stat Model 5 CD log VL Model 6 effect γ Table 2: Effect of treatment on CD4, viral load and infectivity: Model 5: bivariate dynamical discrete-time model; Model 7: bivariate dynamical continuous-time model; Model 6: activated cells model In Model 5, we see that treatment has no significant effect on CD4 count but has a significant effect on viral load, by decreasing it. Another interesting parameter is the effect of viral load on CD4. We found ˆβ 2 = with standard error This is consistent with the treatment decreasing the viral load and having a positive effect on CD4 count entirely medi- Page 10 of 14

108 Submitted article ated by the decrease of viral load; this fits biological knowledge. Biological knowledge is incorporated in Model 6 in which the treatment may change the infectivity parameter. Here, the effect on CD4 concentration (here we distinguish between CD4 concentration and CD4 count which is a measurement of it) is mediated by viral concentration and by the interaction between virus and infected CD4 cells. Model 6 was fitted by penalized likelihood thanks to the NIMROD program (Prague et al., 2013). The incorporation of biological knowledge in the mechanistic model leads to a large increase of power to detect the effect of treatment (Z = 7.41). Figure 4.3 shows the mean evolution of CD4 predicted by Models 1, 4, 5 and 6 for treated and untreated patients, starting at the mean value of treated patients at the day they start treatment, that is 400 CD4. The naive Model 1 yields a slight increase for treated and a much larger increase for untreated patients. The three other models yield a strong increase for treated patients, but with different shapes. The dynamical models tend to level of. The MSM Model 4 and the mechanistic Model 6 are in very good agreement for the first year, but while the mechanistic model has a set point, Model 4 gives a constant increase every year which is not very realistic. As for the untreated, Model 6 yields an increase which is not credible; Model 4 yields a slight decrease, while Model 6 imposes a constant value of the CD4 counts. Table 3 gives figures of the year-by-year changes for all the models. Note that in models 5 and 6 the changes decrease which is consistent with the CD4 counts reaching a set point. 5 Conclusion We have stated the assumptions which are needed for grounding causal interpretation in the stochastic system approach. We focussed on the problem of estimating the effect of HAART on CD4 in an observational study. This approach can be extended to processes in continuous time and we argue that distinguishing the system which lives in continuous time and the observations, most often done at discrete times, allows moving towards more realistic representations, and hence more reliable causal interpretations. Describing the stochastic system approach in continuous time was out of the scope of this paper, but we did try such models on the real data of the Aquitaine cohort study and compared them to simpler discrete-time models and MSM. Also, we did not have space to develop the issue of mediation in the theoretical part of the paper, although there are mediations in the activated cell model, and the dynamic approach seems to be better adapted to cope with this issue than the counterfactual approach (Aalen et al., 2012). As expected, the naive regression model indicated a deleterious effect of the treatment. The MSM model with simple weights did not correct this misleading result. The MSM with more elaborate weights (Model 4) did, but failed to reach significance. A problem with GEE was highlighted by Pan and Connett (2002). In case of time-varying covariates, which is the case here, Pepe and Anderson (1994) noted that GEE results could be biased with non-diagonal working correlation matrix; Fitzmaurice (1995) highlighted that GEE estimates could be very inefficient when using an independent working correlation matrix. See also Emond et al. (1997),Vansteelandt (2007). In contrast, the very simple dynamic model (Model 3) yielded consistent results. Model 5 which jointly models CD4 and viral load also gave consistent results (except for the non-credible increase of CD4 in untreated), with a richer interpretation since it indicates that the effect of HAART on CD4 is mediated by viral load. All these discrete-time models are easy to run. The mechanistic model directly incorporates biological knowledge; for instance we know that the effect of HAART on CD4 is mediated by virus concentration. This leads to a much more powerful test for the parameter of interest. Also the mechanistic model has an equilibrium point, which is indeed observed. In the mechanistic approach, we distinguish the system living in continuous time and observations taken at discrete times. One of the advantages of this distinction is that we would be able to treat a much larger data set: with discrete-time models we must have approximately equally-spaced observations, which rarely occurs in real observational studies. The mechanistic model which does not have this restriction has a much greater flexibility for treating different type of data. Finally the mechanistic model, thanks to random effects, allows representing the inter-subject variability. The drawback of this approach is that it is numerically challenging and requires special software. Another limitation is that we do not have always sufficient biological knowledge for constructing a mechanistic model. In that case we may still construct dynamical models with less (or no) mechanistic assumptions. Page 11 of 14

109 Submitted article Mean CD4 count on HAART Model 1 Model 4 Model 5 Model 6 Mean CD4 without HAART Model 1 Model 4 Model 5 Model Time in months Time in months Figure 2: Mean evolution of CD4 predicted by Models 1, 4, 5 and 6 for treated and untreated patients. Predicted trends for each model are presented with different style lines. In the no-treatment group for the mechanistic model, the value is the without treatment equilibrium of the system. HAART NO HAART 0-1 yr. 1-2 yr. 2-3 yr. 3-4 yr. 0-1 yr. 1-2 yr. 2-3 yr. 3-4 yr. Model Model Model Model Model Model Table 3: Mean CD4 count change in cells/ml across time in different modeling. Model 1: naive model; Model 2: simple MSM; Model 3: simple dynamical model; Model 4: MSM with well adjusted weights; Model 5: bivariate dynamical discrete-time model; Model 6: activated cells model 6 Appendix section 6.1 Distinguishing measurement time and time to treatment attribution Treatment attribution, if it can depend on Y (t), must be decided after t, at t + δ where δ is a small positive delay. The family of variables (Y (0), Y (1),...) and (A(0), A(δ), A(1+δ),...) form stochastic processes in discrete time. Thus it is natural to use the formalism and the results of the stochastic process theory. We will denote the processes themselves by Y and A and, in this context it is common to write Y n for the value of the process Y at the discrete time-parameter n. In this approach we have to distinguish the discrete time-parameter and the physical time, and we have the correspondence: t = [n/2] for n even and t = [n 1)/2] + δ for n odd, n 1, so that Y 2t = Y (t) and Y 2t 1 = Y (t 1 + δ). The Doob decomposition (Doob-Meyer in the case of continuous time parameter) is central to the theory of stochastic processes and can play a central role for formalizing causality. For understanding it one must first understand the Page 12 of 14

110 Submitted article concept of filtration. An intuitive description is possible; for more rigorous definitions see Williams (1990). A filtration {F n : n 0} is an increasing family of sigma-fields. We will be interested in the sigmafields generated by the variables Y n and A n. Thus the sigma-field F 0 will be generated generated by A 0, Y 0, that is, the set of all events that we can form with these two variables. Similarly F n will be generated by the variables by (Ȳn, Ān), where Ȳn = (Y 0,..., Y n ) and Ān = (A 0,..., A n ). Observing F n can be interpreted as getting the information about Y and A up to n. Our filtration, which distinguishes information at t and information at t + δ, is: {F n : n 0}, with F n = σ(ān, Ȳn) the sigma-field generated by (Ān, Ȳn) and Ān = (A 0,..., A n ); Ȳn = (Y 0,..., Y n ). 6.2 Proof of Lemma 2.1 The proof can be made by induction. The result holds for t = 1 since f 1 V0 Ā0,Ȳ0 = f 2 V0 Ā0,Ȳ0 = f V 0. Assuming f 1 Vt 1 Āt 1,Ȳt 1 = f 2 Vt 1 Āt 1,Ȳt 1, we prove that we have f 1 Vt Āt,Ȳt = f 2 V t Āt,Ȳt. We have first that f 1 Vt Āt,Ȳt = f 1 V t V t 1 f 1 Vt 1 Āt,Ȳt (because A / X C V and Y / X C V ). Using the decomposition (Āt, Ȳt) = (Y t, A t, Āt 1, Ȳt 1 and letting all densities conditioned on (Āt 1, Ȳt 1), we have from Bayes theorem: f 1 f 1 Vt 1 Āt,Ȳt = f 1 Y t,a t Āt 1, V t 1,Ȳt 1f1 Vt 1 Āt 1,Ȳt 1 Y t,a t Āt 1, V t 1= v t 1,Ȳt 1f1 Vt 1 Āt 1,Ȳt 1 Next, we have: d v. t 1 f 1 Y t,a t Āt 1, V = f 1 t 1,Ȳt 1 A t Āt 1, V t 1,Ȳtf1 Y t Āt 1, V t 1,Ȳt 1. Because V / X C A we have that A t Vt 1. Āt 1,Ȳt Thus f 1 A t Āt 1, V = f 1 t 1,Ȳt A t Āt 1,Ȳt 1. Since this term does not depend on v t 1 it can be taken out of the integral in the denominator and deleted from numerator and denominator. It is easy to see that all the other terms are equal under P 1 and P 2 using the assumptions of the Lemma and our inductive assumption. Hence the Lemma. References Aalen, O. (1987). Dynamic modelling and causality. Scandinavian Actuarial Journal. Aalen, O. O., K. Rø ysland, J. M. Gran, and B. Ledergerber (2012, October). Causality, mediation and time: a dynamic viewpoint. Journal of the Royal Statistical Society: Series A (Statistics in Society) 175 (4), Andersen, P., O. Borgan, R. Gill, and N. Keiding (1993). Statistical models based on counting processes. Springer Verlag. Cole, S., M. Hernán, K. Anastos, B. Jamieson, and J. Robins (2007). Determining the effect of highly active antiretroviral therapy on changes in human immunodeficiency virus type 1 rna viral load using a marginal structural left-censored mean model. American journal of epidemiology 166 (2), Cole, S. R., M. a. Hernán, J. B. Margolick, M. H. Cohen, and J. M. Robins (2005, September). Marginal structural models for estimating the effect of highly active antiretroviral therapy initiation on CD4 cell count. American journal of epidemiology 162 (5), Cole, S. R., L. P. Jacobson, P. C. Tien, L. Kingsley, J. S. Chmiel, and K. Anastos (2010, January). Using marginal structural measurement-error models to estimate the long-term effect of antiretroviral therapy on incident AIDS or death. American journal of epidemiology 171 (1), Commenges, D. and A. Gégout-Petit (2009, June). A general dynamical statistical model with causal interpretation. Journal of the Royal Statistical Society: Series B (Statistical Methodology) 71 (3), Commenges, D., P. Joly, A. Gégout-Petit, and B. Liquet (2007). Choice between semi-parametric estimators of markov and non-markov multi-state models from coarsened observations. Scandinavian Journal of Statistics 34 (1), Delattre, M., V. Genon-Catalot, and A. Samson (2012). Maximum likelihood estimation for stochastic differential equations with random effects. Scandinavian Journal of Statistics. Didelez, V. (2008, January). Graphical models for marked point processes based on local independence. Journal of the Royal Statistical Society: Series B (Statistical Methodology) 70 (1), Eichler, M. and V. Didelez (2010). On Granger causality and the effect of interventions in time series. Lifetime data analysis 16, Emond, M. J., J. Ritz, and D. Oakes (1997). Bias in gee estimates from misspecified models for longitudinal data. Communications in statistics-theory and methods 26 (1), Page 13 of 14

111 Submitted article Fitzmaurice, G. M. (1995). A caveat concerning independence estimating equations with multivariate binary data. Biometrics, Gégout-Petit, A. and D. Commenges (2010, January). A general definition of influence between stochastic processes. Lifetime data analysis 16 (1), Granger, C. W. J. (1969, August). Investigating Causal Relations by Econometric Models and Cross-spectral Methods. Econometrica 37 (3), 424. Guedj, J., R. Thiébaut, and D. Commenges (2007). Maximum likelihood estimation in dynamical models of HIV. Biometrics 63 (4), Hernán, M. a., B. a. Brumback, and J. M. Robins (2002, June). Estimating the causal effect of zidovudine on CD4 count with a marginal structural model for repeated measures. Statistics in medicine 21 (12), Ho, D., A. Neumann, A. Perelson, W. Chen, J. Leonard, M. Markowitz, et al. (1995). Rapid turnover of plasma virions and cd4 lymphocytes in hiv-1 infection. Nature 373 (6510), Huang, Y., D. Liu, and H. Wu (2006). Hierarchical Bayesian methods for estimation of parameters in a longitudinal HIV dynamic system. Biometrics 62 (2), Jacqmin-Gadda, H., R. Thiébaut, G. Chene, and D. Commenges (2000). Analysis of left-censored longitudinal data with application to viral load in hiv infection. Biostatistics 1 (4), Pan, W. and J. E. Connett (2002). Selecting the working correlation structure in generalized estimating equations with application to the lung health study. Statistica Sinica 12 (2), Prague, M., D. Commenges, J. Guedj, J. Drylewicz, and R. Thiébaut (2013). NIMROD: A Program for Inference via Normal Approximation of the Posterior in Models with Random effects based on Ordinary Differential Equations. Computer Methods and Programs in Biomedicine in press. Robins, J. (1994). Correcting for non-compliance in randomized trials using structural nested mean models. Communications in Statistics-Theory and methods 23 (8), Robins, J. M., M. a. Hernán, and B. Brumback (2000, September). Marginal structural models and causal inference in epidemiology. Epidemiology (Cambridge, Mass.) 11 (5), Schweder, T. (1970). Composable markov processes. Journal of applied probability 7 (2), Thiébaut, R., P. Morlat, H. Jacqmin-Gadda, D. Neau, P. Mercié, F. Dabis, G. Chêne, et al. (2000). Clinical progression of hiv-1 infection according to the viral response during the first year of antiretroviral treatment. Aids 14 (8), Vansteelandt, S. (2007). On confounding, prediction and efficiency in the analysis of longitudinal and cross-sectional clustered data. Scandinavian Journal of Statistics 34 (3), Williams, D. (1991). Probability with martingales. Cambridge university press. Wu, H. (2005). Statistical methods for HIV dynamic studies in AIDS clinical trials. Statistical Methods in Medical Research 14 (2), Pepe, M. S. and G. L. Anderson (1994). A cautionary note on inference for marginal regression models with longitudinal data and general correlated response data. Communications in Statistics- Simulation and Computation 23 (4), Picchini, U., A. Gaetano, and S. Ditlevsen (2010). Stochastic differential mixed-effects models. Scandinavian Journal of Statistics 37 (1), Prague, M., D. Commenges, J. Drylewicz, and R. Thiébaut (2012). Treatment monitoring of hivinfected patients based on mechanistic models. Biometrics 68, Page 14 of 14

112 Chapitre 5 : Causalité et comparaison d approches Perspectives Dans cette comparaison des modèles descriptifs aux modèles mécanistes, nous avons montré que, pour utiliser des modèles MSM, il est nécessaire de faire une sélection des patients très importante ; elle réduit l échantillon de 6580 à 212 patients. Sélectionner les patients en fonction de leurs fréquences de visites et l absence de données manquantes conduit probablement à exclure les patients pour lesquels le cart est le plus actif et qui ne font pas de visite tous les six mois. À l inverse, les patients avec des visites très régulières pourraient être des patients connaissant de nombreux effets secondaires importants ou nécessitant des visites plus régulières, car ils sont en échec de traitement. Ainsi, cette sélection obligatoire pour pouvoir adopter une approche causale par MSM introduit un biais de sélection si le design de la cohorte n est pas préalablement établi pour effectuer ce type d analyse (comme dans la MACS où les visites sont équiréparties tous les 6 mois). L approche par modèles dynamiques permet de prendre en compte beaucoup plus de données et donc d avoir une estimation plus puissante des effets traitement. Cependant, comme nous avons pu le voir dans la Section 4, les temps de calcul sont importants dans les NLME-ODE et rendent un échantillon de taille 6580 difficile à prendre en compte. De plus, la grande hétérogénéité des individus dans un tel échantillon peut entraîner un besoin de plus d effets aléatoires ; or, pour des raisons de précision numérique et de temps de calcul, nous sommes limités à environ 5 effets aléatoires. En effet, rajouter un effet aléatoire équivaut à faire une intégration numérique supplémentaire (voir équation 3.7 Section ). Pour ne pas avoir à rajouter d effet aléatoire supplémentaire, mais appliquer une variabilité individuelle à tous les paramètres, nous pourrions prendre en compte une matrice d effets aléatoires partagés par plusieurs paramètres. L effet aléatoire sur un paramètre serait une combinaison linéaire des éléments de cette matrice d effets aléatoires. En reprenant le modèle statistique équation 3.4 Section , nous redéfinissons les effets aléatoires par : u i = bv i,

113 5.2 : Perspectives 113 où u i, le vecteur d effets aléatoires sur tous les paramètres est de dimension n p ; v i, le vecteur d effets aléatoires à estimer, est de dimension n q ; et, pour des raisons d identifiabilité, b est une matrice triangulaire inférieure de n p n q coefficients à estimer. Cette méthode demande l estimation d un plus grand nombre de paramètres : (n p + 1) n q au lieu de n q. Cependant, elle a l avantage que tous les paramètres ont un effet aléatoire sans pour autant augmenter la multiplicité de l intégrale dans le calcul de la quadrature adaptative gaussienne. Son implémentation permettrait plus de souplesse sans pour autant rendre les calculs trop coûteux en temps et en précision. Pour prendre en compte un échantillon de très grande taille, il est aussi possible de faire une synthèse bayésienne de l information [Ades and Sutton, 2006, Presanis et al., 2011]. En effet, en coupant en sous-groupes l échantillon global il est possible de faire plusieurs analyses en prenant comme nouveau a priori, l a posteriori de l étude précédente. Cette approche ne pose pas de problèmes dans un cadre bayésien classique, soit un échantillon composé de s sous échantillons ȳ S = {y 1, y 2,... y S } : p(θ y 1,..., y s ) p(θ y s )p(θ y 1,..., y s 1 ), s [ p(θ yj )p(θ ȳ j 1 ) ], j=1 avec la convention que p(θ y 0 ) = π(θ) l a priori sur θ. En revanche, lorsque nous faisons une approximation normale de l a posteriori, l hypothèse de normalité faite successivement sur les lois a posteriori de θ conditionnellement aux observations peut perturber les propriétés de l analyse séquentielle. Nous avons cherché à savoir dans quelle mesure cela pouvait impacter les résultats pour le modèle à cellules cibles. Pour cela nous avons utilisé les données de l essai clinique ALBI [Molina et al., 1999] composé de 148 patients que nous avons coupé en trois sous-étude de tailles différentes (n A = 50, n B = 25 et n C = 73). Nous avons effectué des analyses séquentielles pour toutes les séquences des trois sous-études et vérifié la cohérence des résultats obtenus (voir Table 5.3 pour l analyse séquentielle A > B > C). Nous avons comparé les courbes des biomarqueurs moyens entre les valeurs à convergence de l analyse globale ({A, B, C}) et celles à convergence de la synthèse

114 Chapitre 5 : Causalité et comparaison d approches 114 d information bayésienne (A > B > C). Les courbes sont quasi confondues, ainsi nous concluons que les différences de valeurs des paramètres à convergence s explique en grande part par une non-identifiabilité résiduelle (Figure 5.3). L approximation normale de l a posteriori ne semble pas trop perturber les propriétés bayésiennes d une analyse séquentielle ; cependant une validation théorique permettrait de fournir un cadre plus formel à cette approche. Figure 5.3 : Courbes moyennes des biomarqueurs : pointillé analyse globale ({A, B, C}), trait plein synthèse d information bayésienne (A > B > C). Pour finir, nous avons analysé les données de l essai clinique PUZZLE [Raguin et al., 2004] avec pour a priori 1) ceux de la littérature 2) l a posteriori de l analyse d ALBI avec des a priori de la littérature. La valeur de la vraisemblance à convergence montre la supériorité de l approche par synthèse d information bayésienne. La Figure 5.4 illustre ce gain dans la qualité d ajustement. Figure 5.4 : Exemple d ajustement des données : pointillé analyse PUZZLE avec les a priori de la littérature, trait plein synthèse d information bayésienne avec ALBI.

115 5.2 : Perspectives 115 Table 5.3 : Analyse séquentielle de l information pour trois sous-groupes de l essai ALBI. A priori A posteriori {A, B, C} A B C B > A A->B->C L ( θ, y) L P (θ, y) Itérations Paramètres biologiques : Paramètre moy (et.) moy (et.) moy (et.) moy (et.) moy (et.) moy (et.) moy (et.) λ 2.55 (1.90) 1.70 (0.10) 2.02 (0.27) 2.13 (0.12) 1.96 (0.17) 2.01 (0.17) 1.94 (0.11) µt (0.68) (0.05) (0.16) (0.07) (0.11) (0.12) (0.07) µq (1.00) (0.99) (0.99) (0.99) (0.99) (0.99) (0.99) α (2.00) (0.13) (0.36) (0.24) (0.22) (0.24) (0.13) ρ (1.38) (1.34) (1.08) (1.15) (1.08) (0.88) (0.56) µt (0.34) (0.03) (0.17) (0.05) (0.13) (0.12) (0.08) γ (4.02) (0.12) (0.19) (0.04) (0.09) (0.13) (0.07) π 4.04 (2.66) 2.75 (0.67) 3.94 (0.72) 3.96 (0.59) 3.41 (0.68) 3.84 (0.51) 3.46 (0.37) µv 2.90 (0.68) 3.16 (0.66) 3.0 (0.66) 2.91 (0.43) 3.40 (0.66) 3.05 (0.50) 3.29 (0.37) Effets traitement : Paramètre moy (et.) moy (et.) moy (et.) moy (et.) moy (et.) moy (et.) moy (et.) βazt +3T C (0.37) (0.10) (0.15) (0.03) (0.06) (0.10) (0.05) βd4t +ddi (0.37) (0.13) (0.16) (0.03) (0.07) (0.10) (0.06) Écarts-types des effets aléatoires : Paramètre médiane moy (et.) moy (et.) moy (et.) moy (et.) moy (et.) moy (et.) ωλ (0.02) 0.25 (0.06) 0.22 (0.01) 0.24 (0.04) 0.23 (0.09) 0.24 (0.04) ωµ T (0.02) 0.24 (0.06) 0.21 (0.01) 0.25 (0.03) 0.21 (0.06) 0.23 (0.03) Écarts-types des erreurs de mesures : Paramètre moy (et.) moy (et.) moy (et.) moy (et.) moy (et.) moy (et.) σcv (0.01) 0.61 (0.02) 0.46 (0.004) 0.51 (0.02) 0.47 (0.06) 0.50 (0.02) σcd (0.005) 0.20 (0.008) 0.21 (0.003) 0.20 (0.01) 0.21 (0.01) 0.20 (0.007)

116

117 PARTIE III : Vers une médecine personnalisée dans le domaine du VIH

118

119 Chapitre 6 Optimisation de la dose de traitement Résumé : Dans ce chapitre, nous rappelons quelles sont les propriétés d ajustement aux données et de prédiction que doit posséder un modèle afin d être valide comme outil pour la médecine personnalisée. Nous proposons la construction d intervalles d encadrement des prédictions pour prendre en compte l incertitude et les erreurs de mesure sur les observations faites ou à venir. Puis, après avoir introduit différentes approches statistiques disponibles pour optimiser les traitements, nous montrons que les propriétés des systèmes dynamiques sont un avantage pour s affranchir de fonctions de coût habituellement utilisées. Pour finir, nous proposons une stratégie adaptative de l individualisation de la dose de traitement basée sur une approche bayésienne. Mots-clés : Bernstein von-mises ; cart ; choix de modèles ; dose cible ; erreur de mesure ; fonction de coût ; incertitude ; individualisation ; intervalle de crédibilité ; médecine personnalisée ; MCMC ; Métropolis-Hastings ; NMLE-ODE ; nombre de reproduction de base (R 0 ) ; optimisation des traitements. Abstract : In this chapter, we recall the properties of quality of fit and prediction that a model needs to possess in order to be a valid tool for personalized medicine. We build confidence and credible intervals for predictions to account for uncertainty and measurment error on past and future observed data. Then, we introduce different statistical approaches available to optimize treatments and we show that dynamical systems properties are an advantage to be free of a cost function usually used in those problematics. Finally, we propose an adaptive treatment strategy for drug dose individualization based on bayesian approach. Key words : Bernstein von-mises ; cart ; cost function ; credibility interval ; individualization ; MCMC ; measurement error ; Métropolis-Hastings ; model choice ; NLME-ODE ; personalized medicine ; targeted dose ; treatment optimization ; reproductive number (R 0 ) ; uncertainty.

120 Chapitre 6 : Optimisation de la dose de traitement Les problématiques liées à l optimisation des traitements Dans les parties précédentes, nous avons vu qu il était possible de manipuler les modèles dynamiques et d estimer, grâce à NIMROD, l ensemble des paramètres sous réserve d identifiabilité du système. Nous avons aussi vu que les modèles descriptifs sont moins adaptés à l analyse des biomarqueurs du VIH que les modèles explicatifs dynamiques. Cependant, pour pouvoir envisager de faire de l optimisation de traitement il faut s assurer des bonnes propriétés prédictives des modèles Évaluation des qualités des modèles Qualité d ajustement La qualité d ajustement peut être évaluée à l aide de plusieurs indicateurs et permet de choisir le modèle le plus adéquat aux données en prenant en compte des arguments de déviance et de complexité. Des critères, par exemple le coefficient de détermination adapté aux cas non linéaires [Dougherty et al., 2000], l erreur quadratique moyenne [Wang and Bovik, 2009] ou encore l observation des critères d Akaike sur la vraisemblance (AIC et BIC [Akaike, 1998]), permettent d avoir une idée de l erreur résiduelle entre la courbe d ajustement et les données. Cependant, ils ne prennent pas en compte la dimension bayésienne de notre approche. Un critère bayésien classique pour évaluer la qualité d ajustement et de prédiction du modèle est le facteur de Bayes [Kass and Raftery, 1995]. Cet indicateur est critiqué, car il est très sensible aux choix des a priori et n est pas correctement défini pour des a priori non informatifs. De plus, il est souvent difficile ou impossible à calculer. Ainsi, le critère d information de déviance (DIC) qui en est une approximation a été proposé par [Spiegelhalter et al., 2002]. En notant D(θ) la déviance définie comme deux fois l inverse de la log vraisemblance ( 2L(θ, y)), le DIC s écrit : DIC(θ) = E [D(θ) y] + {E [D(θ) y] D (E [θ y])}.

121 6.1 : Les problématiques liées à l optimisation des traitements 121 L interprétation du DIC, sous cette formulation, est critiquée dans des modèles non linéaires et dans les modèles avec des données manquantes, car il est trop variable d un modèle à un autre [Celeux et al., 2006]. En alternative, [Liquet et al., 2007] propose d utiliser le LCV a (approximate Likelihood cross validation criterion en anglais) qui se base sur la vraisemblance elle-même et sur une approximation de la distance de Kullback-Leibler. De plus, il présente l avantage d être rapide à calculer. Pour deux modèles dont les vraisemblances sont proches, le plus parcimonieux sera choisi ; le LCV a doit être aussi petit que possible. Nous notons H L (resp. H L P ) la dérivée seconde de la vraisemblance non pénalisée (resp. pénalisée), en reprenant les notations de la section , le LCV a s écrit : LCV a (θ) = 1 n [ L(y, θ) T r(h 1 L P (θ)h L (θ)) ]. Ce critère sera utilisé pour sélectionner le modèle qui a un meilleur ajustement aux données. Cela peut permettre de faire un choix entre différents modèles mécanistes dynamiques en accord avec les données et revient à tester la véracité d une hypothèse biologique en confrontant un modèle test aux modèles précédents. Par exemple, cela peut permettre de préciser la voie métabolique d action d un traitement comme nous avons pu le faire dans le cadre de travaux annexes à cette thèse où nous avons étudié l effet de l Interleukine-7 (IL7) sur la restauration du système immunitaire Paramètres individuels pour la prédiction Il est important de bien distinguer la qualité d ajustement et la capacité prédictive d un modèle. En effet, un bon ajustement n implique pas toujours de bonnes qualités 1. Nous avons comparé différents modèles d effet d injections d IL7 (sur la création, la prolifération et la survie des CD4 naïfs et mémoire). Par le LCV a, nous avons mis en valeur un effet significatif de l IL7 sur l augmentation de la survie des CD4 et l augmentation de leur prolifération après chaque cure d IL7. Dans la suite de ce travail, nous avons simulé des scénarios de variation des effets de l IL7 pour des traitements répétés lorsque le patient passe en dessous de 500 cellules CD4 par mm 3 afin d évaluer la possibilité de maintenance du système immunitaire. Les résultats sont encourageants. En effet, même dans les scénarios les plus pessimistes, il serait possible de maintenir les patients 50% du temps au-dessus de 500 CD4 pendant deux ans avec seulement une injection tous les 135 jours soit environ 4 injections en 24 mois. Ces chiffres sont à mettre en perspective avec 12% du temps passé en dessus de 500 CD4 en deux ans pour des patients sans cure successive d IL7. Ce travail fait l objet d un article soumis

122 Chapitre 6 : Optimisation de la dose de traitement 122 de prédiction : pour nous représenter ce phénomène, nous pouvons citer le cas des modèles sur paramétrés [Reichert and Omlin, 1997]. Comme nous l avons vu au Chapitre 3, nous nous plaçons dans le cadre de modèles NLME-ODE, nous nous intéressons aux prédictions individuelles. Pour chaque patient, en utilisant un sous-ensemble de ses données, nous calculons ses paramètres individuels à l aide d estimateurs paramétriques empiriques de Bayes [Morris, 1983, Kass and Steffey, 1989] (PEB). En reprenant les notations de la Section , l estimateur PEB s écrit : ˆ ξ i F i j = ˆφ + ˆ β T z(t) i + ûi F i j, (6.1) où ˆφ et ˆβ sont les valeurs MAP (voir Section ) des paramètres fixes estimés sur un échantillon de population excluant les valeurs que l on cherche à prédire. Éventuellement toutes les données du patient i peuvent être exclues pour ne pas avoir à faire de réactualisation en fonction de l horizon de la prédiction. Les effets aléatoires individuels ûi F i j sont obtenus en maximisant la vraisemblance pénalisée individuelle du patient i en utilisant j observations de ses biomarqueurs (Y i1,..., Y ij ) : û i F i j = argmax u R nq { ln [ p(yi1,..., y ij θ MAP, z i, u) ] J(θ MAP, u) }. Ces valeurs peuvent être obtenues par un algorithme d optimisation de type Marquardt- Levenberg. Nous notons ξ i les vraies valeurs des paramètres du patient i. La preuve théorique de la convergence de la loi a posteriori de l estimateur PEB, notée p(ξ i Fj), i vers les vraies valeurs des paramètres du patient fait intervenir une double asymptotique où le nombre de patients et le nombre de mesures du patient pour lequel nous faisons les prédictions tendent vers l infini. Nous ne démontrons pas ici théoriquement la convergence, cependant nous l étayons dans la partie perspective de cette Section. Nous avons vérifié empiriquement cette propriété et nous admettons : p(ξ i F i j) j + δ ξ i. (6.2)

123 6.1 : Les problématiques liées à l optimisation des traitements Qualité de prédiction Dans l ensemble de cette Section, nous utilisons comme exemple fil conducteur la prédiction individuelle des trajectoires de 10 patients sélectionnés de manières aléatoires parmi les patients de l essai clinique ALBI [Molina et al., 1999], exclus de l analyse principale. La modélisation utilisée pour l ajustement aux données et les prédictions est celle présentée dans l article section [Prague et al., 2012a]. Pour les prédictions, une, deux ou les cinq premières observations de chaque biomarqueur ont été utilisées. Figure 6.1 : Graphe des résidus pour l évaluation de la qualité des prédictions : (A,B) couples valeurs observées / valeurs prédites pour la charge virale détectable et le nombre de CD4 transformés (C,D) Tendance temporelle de qualité de prédiction pour la charge virale et le nombre de CD4 transformés. Les graphes sont à mettre en relation avec les erreurs de mesures observées sur chacun des biomarqueurs représentées en pointillés.

124 Chapitre 6 : Optimisation de la dose de traitement 124 Les paramètres ˆξ i F i j sont utilisés dans un solveur d équations différentielles afin de prédire la trajectoire de chaque composante de chaque patient notée X(t, ˆξ i F ). Notons j i la prédiction de la k ième composante observée Ŷi k Fj(t, ˆξ i i F ) = g j i k [X(t, ˆξ ] i F ). La validité ij des prédictions peut être évaluée visuellement par un graphe des résidus montrant les couples valeurs observées / valeurs prédites (voir Figure 6.1(A) et Figure 6.1(B)) : (Ŷi k Fj(t i ij, ˆξ ) i F ); j i Yi k(t ij ). i=1,...,n,j=1,...,n i,k=1,...,k De même, pour vérifier qu il n y a pas de tendance temporelle dans la qualité des prédictions, un second graphe des résidus peut être tracé et comparé à une ligne horizontale passant par l origine (Figure 6.1(C) et Figure 6.1(D)) : ( t ij, [Ŷi k Fj(t i ij, ˆξ ]) i F ) j i Yi k(t ij ). i=1,...,n,j=1,...,n i,k=1,...,k Une alternative consiste à tracer des intervalles pour évaluer la fiabilité des prédictions. La Figure 6.2 présente une illustration. Il s agit de prendre en compte l incertitude statistique et d erreur de mesure. Intervalle de prédiction de l erreur de mesure : Nous faisons l hypothèse que la variabilité entre les observations et les prédictions n est issue que des erreurs de mesure dans le modèle supposées gaussiennes. Cet intervalle de prédiction ne prend pas en compte l incertitude qui existe sur l estimation. À 95%, pour k = 1,... K, cet intervalle s écrit : Y i k(t) [Ŷi k Fj(t i ij, ˆξ ] i F ) ± 1.96 ˆσ j i k. Intervalle de crédibilité : Aucune solution analytique n existe de manière générale dans les problèmes NLME-ODE, nous passons donc par une phase de rééchantillonage. Avec l approximation normale des a posteriori, il est possible de tirer au hasard L réalisations des effets fixes et des effets aléatoires sur leurs lois normales

125 6.1 : Les problématiques liées à l optimisation des traitements 125 approximantes. En effet, utiliser des méthodes MCMC classiques serait beaucoup plus long pour un gain de précision faible. Ainsi, par sommation il est possible d obtenir un L-échantillon, ξ il F, de la loi a posteriori p(ξ i F { } j j) i des paramètres i l=1,...,l individuels du patient i sachant l information F i j : ξ il F i j = φl + β T l z(t) i + u il F i j, avec, (φ l, β T l ) N (θ MAP, H 1 (θ MAP )), 1 I u il û i F N j i ûi Fj i, F j i. j Il est donc possible d échantillonner les L trajectoires a posteriori associées, cet } échantillon est noté {Ŷi k F (t j i ij, ξ il F ) et constitue des réalisations de la loi j i l=1,...,l a posteriori des trajectoires du patient i sachant l information Fj. i Les quantiles à 5% et 95% de cette série de données sont les intervalles à 95% de crédibilité, pour k = 1,... K, cet intervalle s écrit : ( } ) ( } )] Yk i (t) [q 5% {Ŷik F (t ij, ξ il F ) ; q {Ŷi ij ij 95% k F i(t ij, ξ il l=1,...,l j F ). j i l=1,...,l Cependant, faire de l extrapolation avec un modèle trop simple et mal spécifié peut amener à des résultats trop optimistes. En effet, les intervalles à 95% de prédiction n englobera que les points pour lesquels il n y a pas ou peu d erreur de mesure. Intervalle prédictif : Afin de prendre en compte un intervalle de prédictibilité global, nous prenons en compte l erreur commise sur la prédiction (à l aide de l intervalle de crédibilité) et l erreur de mesure possible (à l aide l intervalle de prédiction de l erreur de mesure). En supposant l indépendance entre ces deux sources d erreur, } l écart-type de {Ŷi k F (t j i ij, ξ il F ) noté ˆκ i j i k F est calculé empiriquement sur cet l=1,...,l j i

126 Chapitre 6 : Optimisation de la dose de traitement 126 échantillon. En faisant une approximation gaussienne des trajectoires a posteriori, à 95%, pour k = 1,... K, cet intervalle s écrit : Y i k (t) [ Ŷk F i (t j i ij, ˆξ i F ) ± 1.96 j i ˆσ k 2 + ˆκ i k 2 F i j ]. Figure 6.2 : Intervalles pour évaluer la fiabilité des prédictions à 95% pour les patients 316 et 15 de l essai clinique ALBI en fonction du nombre d observations utilisées pour les prédictions. Les intervalles à 95% d erreurs de mesure sont matérialisés par la zone grisée. Les intervalles à 95% de crédibilité sont en tirets. Les intervalles à 95% de prédictibilité sont en pointillés. Les triangles représentent les observations de la charge virale (à gauche) et du nombre de CD4 (à droite). De manière générale l intervalle prédictif, sommant l incertitude de mesure et d estimation, sera plus grand que les intervalles de crédibilité et d erreur de mesure. Par contre, la relation entre l intervalle de crédibilité et celui d erreur de mesure dépend du niveau d information recueillie pour le patient. Plus elle est grande plus l intervalle de crédibilité

127 6.2 : Adaptation de la dose 127 aura tendance à devenir plus petit que l intervalle d erreur de mesure, comme le montre le patient 15 de la Figure 6.2. Cette propriété montre bien le bénéfice que peut apporter une modélisation par rapport à l observation seule des biomarqueurs Optimisation et théorie de la commande Sous réserve d une consistance et d une robustesse suffisante, c.-à-d. que le modèle prédictif soit suffisamment réaliste pour imiter les données observées, nous voulons construire une stratégie adaptative de traitement. Selon la définition de [Lavori and Dawson, 2008], c est une règle pour adapter le traitement d un patient en prenant en compte à la fois son historique de traitement et son historique de réponses aux traitements. Nous sommes dans le cadre d un problème de décision : il est nécessaire de définir le type d actions pouvant jouer sur le système et une fonction objectif pour évaluer l impact de chaque action. La fonction objectif peut être définie de manière explicite par exemple un seuil à atteindre sur les biomarqueurs. Dans ce cas, les méthodes de simulations par échantillonnage sont particulièrement indiquées, car elles permettent de simuler les conséquences attendues d une action [Dorazio and Johnson, 2003]. Une alternative consiste à définir une fonction objectif aussi appelée fonction de coût (resp. gain) et de chercher à la minimiser (resp. maximiser) [Joshi, 2002, Kirschner et al., 1997]. Cependant, la définition de cette fonction dépend de la question posée : pondération entre toxicité et efficacité [Agur et al., 1988], mise en avantage d interruptions de cart [Bajaria et al., 2004, Adams et al., 2004], meilleur temps d initiation de la cart [Kirschner and Webb, 1996]. 6.2 Adaptation de la dose Définition de la fonction objectif La fonction objectif dépend de l enjeu principal de la stratégie : pour la réduction de dose, il s agit de chercher l amélioration de la qualité de vie du patient en réduisant les effets secondaires de la cart sans diminuer son efficacité. Or, définir une fonction de coûts

128 Chapitre 6 : Optimisation de la dose de traitement 128 en effets secondaires est difficile, car cela demande de les quantifier. Cette quantification dépend de l opinion de chaque patient ou de chaque clinicien ce qui limite les possibilités de généralisation de la méthode. Pour s affranchir de la définition d une fonction de coût analytique, il est possible de la définir de manière intuitive : Plus la dose administrée est importante plus le coût lié aux effets secondaires est important, voir Figure 6.3.C1. Plus la charge virale est grande plus le coût de l infection est important, voir Figure 6.3.C2 ; or, passée une certaine dose la charge virale devrait définir nulle. Il est plus coûteux pour le patient d avoir une infection non contrôlée que des effets secondaires liés à la dose de traitement administrée. La meilleure dose (notée d crit ) est donc la plus faible dose pour laquelle l infection est contrôlée, voir Figure 6.3C. Figure 6.3 : Caractérisation graphique de la meilleure dose de traitement (d crit ) par une fonction de coût définie de manière implicite Exploitation des propriétés dynamiques L étude des trajectoires dans de précédentes modélisations a montré qu un équilibre de la charge virale et du nombre de CD4 était pratiquement atteint dans un délai de 15 à 21 jours après la mise sous traitement. De plus, il y complète stabilisation après 24 semaines à l état d équilibre [Haase, 1999, Pakker et al., 1998], ordre de grandeur retrouvé à l aide des modèles dynamiques par [Guedj et al., 2007a]. Ainsi, il nous est permis d éviter le calcul complexe de la commande optimale en temps continu comme cela peut être fait en automatique et a été adapté, dans le domaine du VIH, à l aide de fonctions de rétrocontrôle par [Brandt and Chen, 2001]. Les changements de dose seront donc faits en temps discrets en travaillant sur les états d équilibre. Notre but est donc d adapter la dose du traitement

129 6.2 : Adaptation de la dose 129 administrée en la mettant à jour visite après visite. Ces visites doivent être suffisamment espacées pour que l état d équilibre soit atteint entre l une et l autre. L équilibre d un système dynamique, noté X = ( Q, T, T, V ), peut se calculer de manière analytique en résolvant dx(t)/dt = 0. Lorsqu aucune solution analytique n existe, il peut aussi être calculé numériquement par un solveur d équations différentielles. Le nombre de reproduction de base R 0 caractérise l existence et la stabilité des équilibres du système. Dans le cas du modèle à cellules cibles défini par l équation 3.9 Section , R 0 possède une expression analytique. D un point de vue biologique, chaque cellule infectée produit des virus au taux π. Pendant cette production de virus, les cellules infectées vivent en moyenne un temps 1/µ T. Ainsi, chaque cellule infectée produit un total de π/µ T virions. Comme la clearance des virus est faite au taux µ V par virion, chaque virion survit un temps moyen de 1/µ V. Pendant cette période, chaque virion infecte en moyenne (γ T )/µ V cellules saines, où T est le nombre de cellules cibles à l équilibre. Ainsi, R 0 = παλγ µ V µ T (αµ T +ρµ Q +µ T µ Q ) et est le nombre de nouvelles cellules infectées causées en moyenne par une cellule infectée à l état d équilibre [Gran et al., 2008]. Si R 0 > 1, cela signifie qu une cellule infectée T va produire plus d une cellule infectée et V > 0. En revanche, si R 0 1, l infection sera par opposition sous contrôle ( V = 0). C est donc ce critère qui caractérise la fonction objectif C2 (Figure 6.3). Par ailleurs, R 0 est une fonction strictement décroissante de la dose, en effet, plus la dose de traitement est forte plus R 0 est faible et plus l infection est contrôlée. Ainsi, trouver la meilleure dose pour le patient revient à trouver la plus petite dose pour laquelle R 0 1, c est à dire la dose pour laquelle R 0 = Stratégie adaptative d optimisation de la dose de traitement Lorsque les paramètres de l individu (ξ i ) sont supposés connus, une résolution analytique de R 0 = 1 pour trouver d crit peut être faite. Dans la pratique, les valeurs des paramètres spécifiques à un patient sont inconnues. Nous pouvons cependant considérer que

130 Chapitre 6 : Optimisation de la dose de traitement 130 nous avons une certaine connaissance a priori issue des a posteriori des effets fixes pour des études précédentes. Par ailleurs, les observations concernant le patient avant et après le début de l initiation de la cart permettent une accumulation d informations concernant les valeurs des effets aléatoires pour le patient. Il serait possible d utiliser un estimateur PEB (équation 6.1). Cependant nous nous intéressons aux queues de distribution où l approximation normale de l a posteriori est moins vraisemblable. Nous mettons donc en oeuvre un algorithme bayésien de Métropolis-Hastings [Metropolis et al., 1953, Hastings, 1970] afin d échantillonner le R 0 spécifique au patient et ainsi définir conditionnellement à l information disponible la meilleure dose pour le patient. Une preuve mathématique et des simulations permettent de vérifier les bonnes propriétés de cette stratégie adaptative d optimisation de la dose de traitement. Ce travail fait l objet d un article publié dans Biometrics, Volume 68, Issue 3, septembre 2012, Pages [Prague et al., 2012a]. Le matériel supplémentaire électronique de cet article se trouve en annexe B.

131 Biometrics 68, September 2012 DOI: /j x Treatment Monitoring of HIV-Infected Patients based on Mechanistic Models Mélanie Prague, 1,2, Daniel Commenges, 1,2 Julia Drylewicz, 3 and Rodolphe Thiébaut 1,2 1 University of Bordeaux, ISPED, Centre INSERM U897-Épidémiologie-Biostatistique, F Bordeaux, France 2 INSERM, ISPED, Centre INSERM U897-Épidémiologie-Biostatistique, F Bordeaux, France 3 Department of Immunology, University Medical Center Utrecht, The Netherlands Summary. For most patients, the HIV viral load can be made undetectable by highly active antiretroviral treatments highly active antiretroviral therapy: the virus, however, cannot be eradicated. Thus, the major problem is to try to reduce the side effects of the treatment that patients have to take during their life time. We tackle the problem of monitoring the treatment dose, with the aim of giving the minimum dose that yields an undetectable viral load. The approach is based on mechanistic models of the interaction between virus and the immune system. It is shown that the activated cells model, allows making good predictions of the effect of dose changes and, thus, could be a good basis for treatment monitoring. Then, we use the fact that in dynamical models, there is a nontrivial equilibrium point, that is with a virus load larger than zero, only if the reproductive number R 0 is larger than one. For reducing side effects, we may give a dose just above the critical dose corresponding to R 0 equal to 1. A prior distribution of the parameters of the model can be taken as the posterior arising from the analysis of previous clinical trials. Then the observations for a given patient can be used to dynamically tune the dose so that there is a high probability that the reproductive number is below one. The advantage of the approach is that it does not depend on a cost function, weighing side effects and efficiency of the drug. It is shown that it is possible to approach the critical dose if the model is correct. A sensitivity analysis assesses the robustness of the approach. Key words: Bayes; Differential equations; Epidemiology; HIV; Metropolis Hastings algorithm; Monitoring; Optimal control. 1. Introduction In developed countries, most HIV-infected patients are treated with highly active antiretroviral therapies highly active antiretroviral therapy: which include a combination of several antiretroviral drugs. For many patients, such treatments succeed to control viral replication (i.e., the viral load becomes undetectable) and to restore the immune system sufficiently to dramatically decrease the risk of opportunistic diseases and AIDS (Egger et al., 2002). The virus is, however, still present in sanctuaries like resting memory cells (Chomont et al., 2009). Several side effects have been described in patients having long-term therapy (Carr and Cooper, 2000). To reduce these side effects, treatment interruptions have been attempted. However, these trials have been stopped at interim analysis showing an increased risk of opportunistic diseases (Ananworanich et al., 2006; Danel et al., 2006; Lundgren et al., 2008). Attempts have been made to decrease the number of drugs but did not succeed either (Girard et al., 2009). Reducing the doses of treatment may be a flexible way to alleviate side effects while maintaining efficiency (Sánchez-Conde et al., 2005; Milinkovic et al., 2007; Meynard et al., 2010). These studies, however, proposed an arm-specific reduction (same reduction for every patient from the same arm). A subject-specific dose adaptation (dose individualization) will probably lead to more significant results. Recently, adaptive treatment strategies have been proposed in the statistical literature (Murphy, 2003; Murphy and McKay, 2004; Moodie, Richardson, and Stephens, 2007; Lavori and Dawson, 2008; Henderson, Ansell, and Alshibani, 2010). These approaches adapt some concepts of control theory, in particular dynamic programming, developed in engineering (Sage and White, 1977). In engineering, dynamical models on which optimal control is based are more complex than those generally used for adaptive treatment strategies and they are often expressed through a system of differential equations. Kirschner, Lenhart, and Serbin (1997) proposed to use control theory based on mechanistic models of the interaction of HIV and the immune system for adapting the dose of antiretroviral treatment. Indeed, since the pioneering work of Ho et al. (1995) and Wei et al. (1995), several mechanistic models have been developed. However, treatment monitoring raises different issues than control problems in engineering and the estimation of parameters in HIV dynamics models is challenging. Recent statistical approaches use random effect models with the aim to estimate the parameters of complex models using rather large samples from clinical trials: see Wu (2005) for a review and Putter et al. (2002); Huang, Liu, and Wu (2006); Guedj, Thiébaut, and Commenges (2007); Huang, Wu, and Acosta (2010) among others for original developments. 902 C 2012, The International Biometric Society

132 Treatment Monitoring and Mechanistic Models 903 The aim of this article is to examine the possibility of using such sophisticated mechanistic models, with parameters that can be estimated on previous clinical trial data, for monitoring the treatment dose of an individual patient. A Bayesian approach seems here natural (Berger, 1985). Previous data give a prior for the parameters of the model. Observations for a new patient give additional information, especially on parameters varying between patients, and permit to update the priors. Then the dose can be adapted so as to minimize a risk function. One key idea in this article is that, for reasonable risk functions, the target dose is the critical dose which makes the reproductive number R 0 equal to (or just below) one. After presenting the method, we shall examine whether it can work in real life. This is a proof of concept article: real patients have not yet taken doses recommended by our method but we give arguments to convince that mechanistic models, and this particular method, can be used for treatment monitoring. We first examine, using real data, whether our model can detect an influence of the treatment dose; then we examine the predictive ability of the model, still using real data. Then, we apply the control method on simulated data. The article is organized as follows. Section 2 recalls the mathematical and statistical models developed by Guedj et al. (2007) and Drylewicz et al. (2010). Section 3 tackles the control problem first treating the case with known parameters, then the case with unknown parameters. The optimal dose is defined as the dose which controls the probability that R 0 < 1 and this can be computed by use of a MCMC algorithm. In Section 4, a detailed analysis of the ALBI clinical trial is presented. In this trial, patients received different treatments or doses (patients in the third arm shifted treatment and some changed their dose) allowing us to study the predictive ability of the model. In Section 5, we present a simulation study of the proposed strategy. The posterior distribution of the parameters is used as a prior for a new patient whose data are generated from the model. We examinethesensitivityof the method to misspecification of the prior. A conclusion and perspectives are given in Section Models of Interaction Between HIV and Immune System 2.1 Mathematical Models Perelson et al. (1996) proposed a three-dimensional Ordinary Differential Equation (ODE) system featuring uninfected CD4 + T cells, infected CD4 + T cells (T )andviruses (V ) concentrations. We shall work with an extension of this model called the activated cells model, which distinguishes among uninfected cells those which are quiescent (Q) and those which are activated (T ). This model has been shown to fit the ALBI trial data much better (Commenges et al., 2008). The definition of the parameters can be found in Table 1. The model can be written as: dq = λ + ρt αq μ Q Q, dt dt = αq γtv ρt μ T T, dt dt (1) = γtv μ T T, dt dv = πt μ V V. dt Table 1 Biological parameters for the activated cells model Parameter Meaning α Activation rate of Q cells (day 1 ). μ T Death rate of T cells (day 1 ). λ Rate of Q cells production (μ 1 L day 1 ). μ T Death rate of T cells (day 1 ). π Rate of virions per T cell (day 1 ). ρ Rate of reversion to the Q state (day 1 ). γ Infectivity: Infection rate of T cells per virion (day 1 μ L ). μ Q Death rate of Q cells (day 1 ). μ V Death rate of free virions (day 1 ). The basic reproductive number R 0 (Gran et al., 2008) is given by: R 0 = γπαλ μ T μ V (ρμ Q + αμ T + μ Q μ T ). (2) If R 0 is lower than one, the only equilibrium point is the trivial one with V = 0, otherwise the trivial equilibrium is unstable and after introduction of the virus, the system stabilizes to a nontrivial equilibrium with V > 0 (see the formula in Web Appendix A ). 2.2 Statistical Models For the interindividual variability of the parameters, we use a statistical model with the same structure as proposed by Guedj et al. (2007). For i =1...N,wedenotebyξ i the vector of the nine individual biological parameters and by ξ i the vector of the log-transformed parameters: ξ i = ( ξi l,l =1...9 ) = ( α i, μ i T, λ i, μ i T, π i, ρ i, μ i Q, μ i V, γ i) T. The possible between-subjects variability and time variability of the parameters is modeled as: i ξ l (t) =φl + zl i (t)β l + ωl i u i, l =1...9, (3) where φ l is the intercept, zl i and ωl i are the vectors of (possibly time-dependent) explanatory variables associated to the fixed and random effects respectively of the lth biological parameter. The β l are vectors of regression coefficients associated to the fixed effects; u i is the individual vector of random effects. We assume u i N(0, Σ) with Σ a diagonal matrix. Specifically, in the following, we shall use as explanatory variable only the treatments doses d i j (t), where j is the treatment index. In the application, there are two treatments (j =1, 2); for sake of simplicity, we present the theory for only one treatment. We assume that the treatment acts by diminishing the infectivity (this is indeed the case for the reverse transcriptase inhibitors used in the application). The model for the infectivity parameter is assumed to be: γ i = γ 0 + βψ{d i (t)}, (4) with β<0 and where ψ(.) is a known increasing positive pharmaco-dynamic function. We assume in addition ψ(0) = 0andψ(.) unbounded.

133 904 Biometrics, September 2012 Figure 1. Flow chart for the control strategy procedure: individualized dose monitoring. Let X =(Q, T, T,V) in model (1). We used g 1 (X) = log 10 (V )andg 2 (X) =(Q + T + T ) 0.25 as transformations to achieve normality and homoscedasticity of measurement error distributions (Thiébaut et al., 2003) of the observed two compartments: the viral load (number of virions per μl) and the total CD4 count (number of cells per μl). Let Yjm i denote the jth measurements of the mth observable component for subject i at time t i jm ; we assume that: Y i j 1 = g 1{ X ( t i j 1, ξ i)} + ɛ i j 1 j =1,...,n i 1 Y i j 2 = g 2{ X ( t i j 2, ξ i)} + ɛ i j 2 j =1,...,n i 2, where ɛ i j 1 and ɛi j 2 are independent Gaussian with zero mean and variances σvl 2 and σ2 CD4, respectively. The observation mechanism is generally complicated by a detection limit for the viral load, producing left-censoring for Yj i 1 (Jacqmin- Gadda et al., 2000). 3. Control Strategy 3.1 Targeting R 0, Known Parameters Our aim is to adapt the treatment dose at visits spaced by several weeks. Study of mathematical models and observed trajectories shows that the equilibrium state is essentially reached in a very short period of time. So, we can avoid the complexity of optimal control theory where the control is in continuous time and the cost function is an integral over time of a function of state and control. Instead, we define a cost function which depends only on the equilibrium state X(d; ξ i ) that is reached for a dose d: C{ X(d; ξ i ),d}, and more specifically C{ V (d; ξ i ),d}. The best dose for the patient minimizes C{ V (d; ξ i ),d} on [0,d max ]. The function C(.,.) is strictly increasing in both arguments. Then, we can use the fact that in our HIV dynamic model if R 0 (d, ξ i ) < 1 there is only one equilibrium state which is the trivial one with V = 0. The critical dose d crit (ξ i ) is defined as the solution of R 0 (d, ξ i )=1. Because ψ(.) is an unbounded and increasing function in the dose, R 0 is a one-to-one function strictly decreasing with the dose. Thus, for any given ξ i,auniquecriticaldoseexists.we obtain the critical dose, d crit (ξ i ) from (2) and (4): d crit (ξ i )=ψ 1 [ 1 β ln { μ i T μi V ( ρ i μ i Q + αi μ i T + μi Q μi T π i α i λ i γ i 0 )}] (5) (6). Because C(.,.) is increasing in its second argument, the optimal dose cannot be higher than d crit (ξ i ). If C(.,.) rises very sharply in its first argument, the optimal dose will be close to d crit (ξ i ). If C(x, y) presents a discontinuity in x =0, the optimal dose is d crit (ξ i ). This is a reasonable requirement from the medical point of view: d crit (ξ i ) is the minimum dose which achieves virus extinction (in practice, a very low viral load). This relieves us from the burden of specifying a cost function which would weigh the toxicity and the efficiency of the drug in an arbitrary way. 3.2 Unknown Parameters: Controlling the Probability that R 0 < 1 In practice, the values of the parameters of a particular subject are unknown. We have, however, a certain amount of knowledge about ξ i. We make observations of both viral load and CD4 count at times before and after the initiation of the control strategy: t 0,t 1,t 2...,andt 1,t 2,...,respectively; this gives essentially information about the values of the random effects u i for this subject. Given Ft i k, the information at time t k, R 0 (d, ξ i ) has a posterior distribution. At time t k,we propose to choose d t k opt, the readjusted optimum dose, as the minimum dose which gives a high posterior probability (ω) that R 0 is below 1: [ { P Fi t t k R0 d k opt(ω),ξ i} < 1 ] = ω. (7) We may take ω = 90%; in the following, we write d t k opt for the optimal dose at time t k. R 0 is a decreasing one-to-one function, thus, d t k opt is unique. We denote by ξ i thetrueparameters value for patient i and d crit (ξ i ) his critical dose. If we assume that the information increases in time so that Doob s consistency theorem can be applied (Van der Vaart, 2000), d t k opt will tend to the critical dose (see Web Appendix B for the proof): d t k opt P t k d crit(ξ i ). We have that P Fi t k {R 0 (d, ξ i ) < 1} = P Fi t k {d crit (ξ i ) <d} (see Web Appendix B). Thus d t k opt is the ω-quantile of the posterior distribution of d crit (ξ i ) which can be computed by MCMC using formula (6). Figure 1 displays a flow chart for the control strategy. Time after time, observations of CD4 counts and viral loads are collected and an optimal dose given the reaction to the previous doses is provided. Optimal dose greater than d max make the patient leave the control strategy because of treatment failure.

134 Treatment Monitoring and Mechanistic Models Dose Effect and Predictive Ability in the ALBI Trial 4.1 The ALBI Trial We use the data of the ALBI ANRS 070 trial (Molina et al., 1999). In this three arms controlled trial, 151 antiretroviralnaive patients (with viral loads between 10,000 and 100,000 copies/ml and CD4 counts greater than 200 cells/mm 3 ) received 24 weeks of treatment. The 51 patients from arm 1, received the d4t + ddi treatment, that is stavudine (d4t)/didanosine (ddi) whose dosage depended on their weight; d4t 250 mg plus ddi 60 mg for patients less than 60 kg, otherwise d4t 400 mg plus ddi 80 mg. For arm 2, 51 patients received the AZT + 3TC treatment, that is 500 mg of zidovudine (AZT) and 300 mg of lamivudine (3TC). The 49 patients from arm 3, the switch arm, received the d4t + ddi treatment for 12 weeks followed by AZT + 3TC, with the same doses as in arm 1 and 2. Blood samples were collected every 4 weeks until 24 weeks. CD4 counts and viral loads (with a lower quantification limit of 50 copies/ml) were measured. Two patients dropped out before the first blood sample collection time, so 149 patients were available for the analysis. For each patient, changes in dose were either self reported or declared by the clinician. Twenty-seven patients (18%) changed their doses during the trial; some of them even interrupted the treatment during a period of time. Molina et al. (1999) found that the d4t + ddi treatment was significantly better than the AZT + 3TC treatment in an intent-to-treat (ITT) analysis. 4.2 Model For the ALBI Trial We performed a thorough analysis of the ALBI trial using the activated cells model, taking into account all the complexities of the design and the doses actually taken by the patients. Doses were included in the analysis, by considering treatment as a time-varying covariate. We took into account the doses of the two ALBI treatments, denoted {d i 11(t),d i 12(t)} and {d i 21(t),d i 22(t)}. To overcome unities problem, we took as reference dose the median dose for each drug, denoted (d 11,d 12) and (d 21,d 22). We constructed an indicator of the doses for treatment j = 1 (d4t + ddi) or 2 (AZT + 3TC) as: d i j (t) = 1 2 { d i j 1 (t) d j 1 + di j 2 (t) d j 2 Moreover, we smoothed the dose indicators by taking the mean of the three doses taken in previous days, as this provided a better fit. Therefore, the dose indicator for treatment j of subject i at time t can be written: d i j (t) ={ d i j (t 2) + d i j (t 1) + d i j (t) } /3. As for the choice of ψ in (4), we first tried a linear function, but this achieved a poor fit of the data. We obtained a much better fit with power functions, with a power around 0.1. However, such a simple power function does not have an acceptable shape in the sense that the effect is still high for very low doses (for which we had no data). We tried sigmoid functions as in Shen et al. (2008) but this yielded shapes very similar to the power functions. To overcome this problem, we constructed a function which was a power function in the range where information was available [0.6; 1], connected to }. zero by a linear function. Finally, the pharmaco-dynamical function for patient i, treatmentj at time t was: ψ { d i j (t) } { d i = j (t) κ d if d i j (t) > 0.6, (0.6) κ d 1 d i j (t) otherwise. (8) We also tried to introduce the weights of the subjects as explanatory variable but did not find any effect of it; so these results are not shown. 4.3 Elicitation of a Prior, Algorithm, and Posterior We denote by θ =(φ, β, σ α,σ λ,σ μ,σ VL,σ T CD4 ), the vector of the parameters. Here, φ =(φ l,l=1...9), appearing in (3), is the vector of the nine baseline biological parameters and β the two-dimensional vector of regressors for treatment doses. There are also three standard deviations of random effects (on α, λ and μ T as suggested in Guedj et al. (2007)) and the two standard deviations of errors measurements. Normal independent priors were assumed for the components of φ with expectation and variance elicited in accordance with the literature. Essentially, the rule was to define the lowest and the largest values proposed in the literature φ lower l and φ upper l and take the mean and standard deviation as (φ upper l + φ lower l )/2 and(φ upper l φ lower l )/4, respectively. The literature was not precise enough to elicit these bounds for the infectivity parameter γ 0 ; we took a very wide range: φ lower 9 = log(10 6 )= 13.8 andφ upper 9 = log(10) = 2.3. For the effects of the treatment doses, we also assumed normal priors with expectation corresponding to dividing the infectivity by 3 for the standard dose, and standard deviation equals to about the third of the absolute value of this expectation: this expresses the fact that it is unlikely that treatments increase the infectivity while yielding rather weakly informative priors. The priors did not value one treatment over the other. Half-Cauchy priors were taken for the variance of the random effects, as recommended by Gelman (2006). For the variances of the measurement errors, conventional Jeffreys s improper noninformative priors were taken. Table 2 summarizes the priors for the different parameters. In view of the complexity of the problem, MCMC methods would be too time consuming and the INLA method (Approximate Bayesian Inference for Latent Gaussian Models; Rue, Martino, and Chopin, 2009) can not be applied to this problem. We turned to a normal approximation of the posterior which is justified by the Bernstein Von Mises Theorem (Van der Vaart, 2000). Numerically, this amounts to compute the maximum a posteriori estimator (MAP); this is identical to penalized likelihood maximization. Specifically, the function that must be maximized is pl = L J(θ), where the penalty term J(θ) is: J(θ) = 9 j =1 [φ j E 0 (φ j )] 2 2var 0 (φ j ) + 2 j =1 [β j E 0 (β j )] 2 2var 0 (β j ) +log(σ 2 α + s 2 α )+log(σ 2 μ T + s 2 μ T ) +log(σ VL )+log(σ CD4 ), where E 0 and var 0 stand for the means and variances of the priors. Here, L is the log likelihood which is described in Guedj et al. (2007). The maximization (or rather the

135 906 Biometrics, September 2012 Table 2 Priors and posteriors for the activated cells model parameters estimated from ALBI trial data Priors Posteriors Biological parameter (Normal priors): Parameter Mean (SD) References Mean SD α 4.00 (2.00) Ribeiro et al. (2002) μ T 0.05 (0.68) Althaus, De Vos, and De Boer (2009) Brandin et al. (2006) λ 2.55 (1.90) Mohri et al. (1998) μ T 2.59 (0.34) Ribeiro et al. (2002) π 4.04 (2.66) Chen et al. (2007) ρ 4.34 (1.38) Ribeiro et al. (2002) γ (4.02) See Section μ Q 9.00 (1.00) Vrisekoop et al. (2008) μ V 2.90 (0.68) Ramratnam et al. (1999) Regressors for treatments doses (Normal priors): Parameter Mean (SD) References Mean SD β (0.37) See Section β (0.37) See Section Standard deviation for random effects (Half-Cauchy priors): Parameter Median References Mean SD σ α 0.53 Guedj et al. (2007) σ μ T 0.37 Guedj et al. (2007) σ λ 0.10 Guedj et al. (2007) Standard deviation for error measurment (Jeffrey s priors): Parameter Mean SD σ CV σ CD minimization of pl) can be done using the algorithm described in Guedj et al. (2007), modified to take into account the penalty brought by the prior. This algorithm uses the so-called RVS algorithm which approximates the Hessian using first derivatives. For penalized likelihood, the way the Hessian is approximated must be modified as described in section 4.5 of Commenges et al. (2006). There is, however, a sign error in the original version. The correct formula for the Hessian of pl in θ k (at iteration k) is: G(θ k )= N U i (θ k )Ui T i=1 (θ k ) n 1 U(θ k )U T (θ k )+ 2 J(θ) θ 2, (9) where U(θ k )= pl θ θ k and the U i (θ k ) s are the individual gradients (U(θ k )= N U i=1 i(θ k )). The addition of 2 J (θ ) (here θ 2 a diagonal matrix with positive diagonal) generally improves the condition number of the approximate Hessian. G(θ k )is close to 2 pl (θ θ 2 k ) near the maximum. It is generally easy to compute 2 J (θ ). θ 2 We evaluated κ d in (8) by profile likelihood, leading to κ d = For other parameters, the posterior was approximated by a normal distribution with expectation given by the MAP and variance given by the inverse of the approximation of the Hessian of pl (9). We present their means and standard deviations of posteriors in Table 2. Finally, we checked reproducibility by starting from 10 different initial values drawn at random at one standard deviation from the mean of the prior. The algorithm converged toward the same region obtaining the same two significant digits for the standard deviations of measurement errors and main random effect, one significant digit for most other parameters, except π, μ Q,andμ P, for which we only had the order of magnitude. This is probably due to lack of practical identifiably: actually, predictions are not impacted by this relative lack of precision. In Web Appendix C, we show that the fits for three stopping points with rather different values of π, μ Q,andμ P are nearly indistinguishable. Because we use the model essentially for prediction, the problem is not too severe. 4.4 Results: Predictive Ability for Treatment Change The ALBI design offers a very good opportunity to assess the predictive ability of our model, especially thanks to the switch arm. We can use the first period to assess the random effects for these patients and then predict how they react to the next treatment. We selected patients from the switch arm in an objective manner: we took them at the quartile values of the distribution of the viral load at the end of the study. We computed the MAP estimates removing these patients. Then, we estimated the parameters with random effects thanks to a parametric empirical Bayes (PEB) procedure (Kass and Steffey, 1989) based on the first 12 weeks; viral loads and CD4 counts were computed for the value of the parameters using MAP estimates for fixed effects and PEB for parameters with random effects, taking into account the

136 Treatment Monitoring and Mechanistic Models 907 Figure 2. Viral load (log10 copies/ml) et CD4 count (cells/l) predictions for patient 642 from the switch arm who took full dose of d4t + ddi then switched after 85 days to full dose AZT + 3TC. are observations. Dashed lines represent 95% measurement error predictive interval. Vertical line materializes when the treatment switch occurred. Left side: fit; right side: predictions. Treatment adherence is presented on the lower part of the graph. adherence for the remaining 12 weeks. Using notations in (5), we also computed a 95% measurement error predictive interval as [Ŷ j i 1 ± 1.96σ VL] and[ŷ j i 2 ± 1.96σ CD4 ]. For space concern, we only present the median patient, but predictions for Q 1 and Q 3 patients at quartiles are available in Web Appendix D, others on request. Figure 2 presents the viral load and the total CD4 count with a fit in the first 12 weeks and predictions for the last 12 weeks after the treatment switch. One can see that we are able to predict quite well the viral load rebound after the treatment change (because the AZT + 3TC treatment is less efficient). 4.5 Results: Predictive Ability for Dose Change We selected analyzed patients in an objective manner among the 27 patients with dose changes: we took those at each quartile values in function of the distribution of the viral load at the end of the study. We estimated again all the parameters excluding this new subset of patients and did step-by-step prediction. Each time we had an additional observation, we updated the knowledge about random effect and computed the predicted value taking into account the reported adherence. For sake of illustration, we present a patient who particularly well filled his adherence information and who had a large range of behaviors (drug dose reduction, stop, switch...). Figure 3 presents predicted of viral loads and total CD4 counts for each time taking into account the increase of information in time. The 95% measurement error predictive interval is represented. Predictions taking into account drugs doses are much better than the ITT fits. This can be quantified by computing the mean square error (MSE) over all the patients with dose changes. The MSE for the viral load is 0.23 for the prediction versus 0.61 for the ITT fit. For the CD4 counts, the MSE are 7768 versus The predictions together with the MSE for selected patients are available in Web Appendix E. 5. Simulation Study For Dose Optimization 5.1 Principle of the Data Simulation In this section, we aim at analyzing the efficiency of our drug dose reduction algorithm in term of precision and safety (recommended doses should be higher than critical doses). Data were simulated using the MAP estimates from the analysis of the ALBI trial (Table 2). We simulated samples of 100 patients (n). Parameters with random effects, α, μ T and λ were drawn from the multinormal Gaussian posterior for every patient. Fixed parameters were drawn with the constraint (θ ˆθ) T G(ˆθ)(θ ˆθ) = 1 and were the same for all the patients of a sample. We only selected patients who had a baseline R 0 (that is without treatment) higher than 1 and a critical dose lower than the standard dose; thus, we excluded long-term nonprogressors and only kept patients needing a dose reduction. We assumed a plausible observation schedule: observation times were at 0, 7, and 14 days whereas dose readjustments were performed every 15 days. The initial dose was taken as the reference, d 0 = 1. We simulated the viral loads and CD4 counts with measurement errors variances equal to (0.45) 2 and (0.2 2 ; Table 2). Finally, as ALBI treatments are under-efficient compared to those given in 2011, we took a treatment effect equal to twice the MAP estimate of treatment effect for d4t + ddi (β 2 ), that is β = Illustration of the Monitoring Method We ran the control strategy algorithm described in Section 3.2 with a burn-in phase consisting in a 100,000 updates, a sampling phase of 50,000 updates, d max =2andω = 90%. All the nine biological parameters were updated even if significant updates were only noticeable for parameters with random effects. It never recommended a dose greater than d max. We first present the results for a particular patient drawn at random as visual illustration (10 updates were performed). His critical dose was We can see on Figure 4 (left) that at the first readjustment time we could advise a reduction by

137 908 Biometrics, September 2012 Figure 3. Viral load (log10 copies/ml) et CD4 count (cells/l) predictions for patient 316 who took 0.7% of d4t + ddi during 4 days, then decreased by about two during 8 days and then stopped until day 59. He then took again his treatment until day 65 but with reference posology (probably because he gained weight during the first treatment part and then passed the threshold of 60 kg). He stopped again the treatment and then from day 91 to the end of the study, he switched to AZT + 3TC treatment. are observations. Each color represents the predictions knowing the information up to the previous observation time. Dashed lines represent 95% measurement error predictive interval. Treatments are presented on the lower part of the graph. The gray plain line presents the fit without taking into account adherence. more than 55% of the dose given to the patient. It is noticeable that the final dose was close to the critical dose. Moreover, this result was obtained while remaining above the critical dose during the tuning period. Furthermore, we can check on Figure 4 (right) that neither the viral load nor the CD4 count are impacted by drug reduction. Table 3 presents the MSEs between the optimal dose and the critical dose for each readjustment time computed as: MSE(t k )= 1 n n i=1 { d t k opt(i) d crit (ξ i ) } 2, together with the percentage of doses lower than the critical dose for the patient and the percentage of doses greater than d max. In a well-specified model, the MSE decreases while information about the patient increases and we effectively control the probability to give a dose below the critical dose. 5.3 Sensitivity Analysis and A Safer Monitoring Method We performed a sensitivity analysis to evaluate the robustness of our control strategy in misspecified models. First, we investigated the effect of priors misspecification. In the same fashion as in part 5.1, we simulated samples of 100 patients with parameters such that (θ ˆθ) T G(ˆθ)(θ ˆθ) = k, k =1.5, 2, 2.5, 3, and 5. For each k, 10 different samples were taken to explore different profiles of prior misspecification. This extensive simulation study was made possible by using parallel computing. Results are presented in Table 3. MSE were good up to k =2.5 but the percentage of d t k opt <d crit reached 31% in average at the fifth readjustment. To fix this problem, we propose to add a safety margin to the readjusted dose. We focused on k = 2 because priors should not be too badly specified if patients come from the same population as in ALBI trial. The value of the safety margin was determined such that our key proposition k 0..5, P Fi t k [R 0 {d t k opt(ω),ξ i } < 1] < 10% hold in the worst simulated case for k = 2. We ran again the control procedure, applying the safety margin, over a new validation sample of 1000 patients with misspecified priors. Table 3 shows that MSE are increased but are still reasonable while, as expected, the percentage of d t k opt <d crit is smaller than 10%. To finish, we tried a misspecified model. Data were generated from a productive cell model (Drylewicz et al., 2010) which has five compartments instead of four. To do so, we took a productive cell model with the same equilibrium state as in the activated cell model. Productive cell production rate was fixed at 0.12, the estimates found by Drylewicz et al. (2010). For all the readjustment times, the percentage of optimal doses lower than the critical dose was always lower than 10%. MSE ranged from 1.21 at time t 1 to 0.12 at time t Discussion In this article, we have proposed a method of dose individualization of HAART for HIV infected patients. We have attempted to demonstrate its feasibility. First, a pharmacodynamic model was developed for the ALBI trial and we showed that it could be applied to real data. The model fitted the viral loads and CD4 counts data quite well, providing an in vivo estimation of the treatment efficacy. More importantly, the model had good prediction abilities. Then, the simulation study showed that when information is rich enough, the critical dose can be found in a rather small number of readjustments, while staying most of the time above the critical dose.

138 Treatment Monitoring and Mechanistic Models 909 Figure 4. Simulation of 10 doses readjustments spaced by 15 days after three observation times: (up) Viral load (+) and CD4 count ( ) simulated observations (down) Dose readjustment simulation, d t k opt become closer by above to d crit =0.306 (horizontal line). An issue is the possible lack of information due to leftcensoring when the treatment is very effective. Then, Doob s consistency theorem invoked in Section 3.2, would not apply. In that case, more intensive schedules and/or the measurements of more compartments would be needed. Other concerns could arise from model misspecification. A misspecificationcouldleadtobiasedresults and wrong recommendations. We have made a sensitivity analysis to test the robustness of the procedure to misspecification of the sampling distribution and to misspecification of the prior (which happens if the new patients are different from those used for defining the prior). In both cases, the convergence toward the critical dose is slower but the procedure, which can be improved by using a safety margin, generally works. A major issue is development of drug resistance. If this happens during the monitoring, then viral load will raise leading to higher recommended dose until we reach the maximum admissible dose. This is a failure of the treatment and another treatment has to be prescribed. The search of the optimal dose is relevant in a time period where no major resistance mutation develops. We conclude that the use of such an adaptive scheme is to be further tested on more informative data (especially with well-documented adherence); however, this work shows that dose individualization is possible. The further step would be to validate the procedure in a clinical trial before using it in clinical practice. Such a clinical trial would typically have two arms, one in which the proposed procedure of dose monitoring would be applied, the other in which standard clinical practice would be applied; the endpoints would be the doses given at the end of the trial, measures of adverse effects and the proportion of virological failures. 7. Supplementary Materials Web Appendices referenced in Sections 2.1, 3.2, 4.3, 4.4, and 4.5 are available with this article at the Biometrics website on Wiley Online Library.

139 910 Biometrics, September 2012 Table 3 Analysis of sensitivity to prior misspecification: evaluation of the convergence of (d t k opt)k =0...5 toward dcrit MSE(d t k opt; %d t k opt <dcrit %d t k opt >dmax) t0 t1 t2 t3 t4 t5 Well specification 0.62 (0% 0%) 0.04 (0% 0%) 0.03 (0% 0%) 0.01 (1% 0%) (4% 0%) (9% 0%) Prior Misspecification k = 1.5, Act. T cell 0.59 (0% 0%) 0.04 (9% 0%) 0.03 (9% 0%) 0.01 (14% 0%) 0.01 (20% 0%) (25% 0%) k = 2, Act. T cell 0.66 (0% 0%) 0.09 (15% 0.5%) 0.04 (14% 0%) 0.02 (19% 0%) 0.02 (27% 0%) 0.01 (31% 0%) k = 2.5, Act. T cell 0.69 (0% 0%) 0.13 (22% 1.5%) 0.06 (20% 0.1%) 0.03 (28% 0%) 0.02 (37% 0%) 0.02 (40% 0%) k = 3, Act. T cell 0.67 (0% 0%) 0.24 (39% 4%) 0.18 (37% 1.3%) 0.11 (42% 0%) 0.08 (45% 0%) 0.08 (47% 0%) k = 5, Act. T cell 0.74 (0% 0%) 0.71 (41% 16%) 0.74 (40% 15%) 0.61 (40% 12%) 0.56 (39% 11%) 0.55 (37% 10%) A safer monitoring method : safety margin = 0.07 k = 2, Act. T cell 0.71 (0% 0%) 0.18 (3% 0%) 0.09 (2% 0.9%) 0.07 (2% 0%) 0.05 (1% 0%) 0.04 (0.2% 0%) Acknowledgements The authors would like to thank the investigators of the ALBI ANRS 070 trial, particularly J. M. Molina (principal investigator), G. Chêne (methodologist) and V. Journot for data management help. Parallel computing was used thanks to the computing facilities MCIA (Mésocentre de Calcul Intensif Aquitain) of the Université de Bordeaux and of the Université de Pau et des Pays de l Adour. References Althaus, C., De Vos, A., and De Boer, R. (2009). Reassessing the human immunodeficiency virus type 1 life cycle through age-structured modeling: Life span of infected cells, viral generation time, and basic reproductive number, R0. Journal of Virology 83, Ananworanich, J., Gayet-Ageron, A., Le Braz, M., Prasithsirikul, W., Chetchotisakd, P., Kiertiburanakul, S., Munsakul, W., Raksakulkarn, P., Tansuphasawasdikul, S., Sirivichayakul, S., Cavassini, M., Karrer, U., Genné, D., Nuesch, R., and Vernazza, P. (2006). CD4-guided scheduled treatment interruptions compared with continuous therapy for patients infected with HIV-1: Results of the Staccato randomised trial. The Lancet 368, Berger, J. (1985). Statistical Decision Theory and Bayesian Analysis. Springer-Verlag New York. Brandin, E., Thorstensson, R., Bonhoeffer, S., and Albert, J. (2006). Rapid viral decay in simian immunodeficiency virus-infected macaques receiving quadruple antiretroviral therapy. Journal of Virology 80, Carr, A. and Cooper, D. (2000). Adverse effects of antiretroviral therapy. The Lancet 356, Chen, H., Di Mascio, M., Perelson, A., Ho, D., and Zhang, L. (2007). Determination of virus burst size in vivo using a single-cycle SIV in rhesus macaques. Proceedings of the National Academy of Sciences 104, Chomont, N., El-Far, M., Ancuta, P., Trautmann, L., Procopio, F., Yassine-Diab, B., Boucher, G., Boulassel, M., Ghattas, G., Brenchley, J., Schacker, T., Hill, B., Douek, D., Routy, J., Haddad, E., and Sékaly, R. (2009). Hiv reservoir size and persistence are driven by t cell survival and homeostatic proliferation. Nature Medicine 15, Commenges, D., Jacqmin-Gadda, H., Proust, C., and Guedj, J. (2006). A newton-like algorithm for likelihood maximization: The robustvariance scoring algorithm. Arxiv math/ Commenges, D., Sayyareh, A., Letenneur, L., Guedj, J., and Bar-Hen, A. (2008). Estimating a difference of Kullback Leibler risks using a normalized difference of aic. The Annals of Applied Statistics 2, Danel, C., Moh, R., Minga, A., Anzian, A., Ba-Gomis, O., Kanga, C., Nzunetu, G., Gabillard, D., Rouet, F., Sorho, S., Chaix, M., Eholié, S., Menan, H., Sauvageot, D., Bissagnene, E., Salamon, R., and Anglaret, X. (2006). Cd4-guided structured antiretroviral treatment interruption strategy in HIV-infected adults in West Africa (trivacan anrs 1269 trial): A randomised trial. The Lancet 367, Drylewicz, J., Guedj, J., Commenges, D., and Thiébaut, R. (2010). Modeling the dynamics of biomarkers during primary HIV infection taking into account the uncertainty of infection date. The Annals of Applied Statistics 4, Egger, M., May, M., Chêne, G., Phillips, A., Ledergerber, B., Dabis, F., Costagliola, D., Monforte, A., de Wolf, F., Reiss, P., Lundgren, J., Justice, A., Schlomo, S., Leport, C., Hogg, R., Sabin, C., Gill, J., Salzberger, B., and Sterne, J. (2002). Prognosis of HIV- 1-infected patients starting highly active antiretroviral therapy:

140 Treatment Monitoring and Mechanistic Models 911 A collaborative analysis of prospective studies*. The Lancet 360, Gelman, A. (2006). Prior distributions for variance parameters in hierarchical models. Bayesian Analysis 1, Girard, P., Cabié, A., Michelet, C., Verdon, R., Katlama, C., Mercié, P., Morand-Joubert, L., Pétour, P., Monchecourt, F., Chêne, G., and Trylesinski, A. (2009). A randomized trial of two-drug versus three-drug tenofovir-containing maintenance regimens in virologically controlled HIV-1 patients. Journal of Antimicrobial Chemotherapy 64, Gran, J., Wasmuth, L., Amundsen, E., Lindqvist, B., and Aalen, O. (2008). Growth rates in epidemic models: Application to a model for HIV/aids progression. Statistics in Medicine 27, Guedj, J., Thiébaut, R., and Commenges, D. (2007). Maximum likelihood estimation in dynamical models of HIV. Biometrics 63, Henderson, R., Ansell, P., and Alshibani, D. (2010). Regret-regression for optimal dynamic treatment regimes. Biometrics 66, Ho, D., Neumann, A., Perelson, A., Chen, W., Leonard, J., Markowitz, M., (1995). Rapid turnover of plasma virions and cd4 lymphocytes in HIV-1 infection. Nature 373, Huang, Y., Liu, D., and Wu, H. (2006). Hierarchical Bayesian methods for estimation of parameters in a longitudinal HIV dynamic system. Biometrics 62, Huang, Y., Wu, H., and Acosta, E. (2010). Hierarchical Bayesian inference for HIV dynamic differential equation models incorporating multiple treatment factors. Biometrical Journal 52, Jacqmin-Gadda, H., Thiebaut, R., Chene, G., and Commenges, D. (2000). Analysis of left-censored longitudinal data with application to viral load in HIV infection. Biostatistics 1, Kass, R. and Steffey, D. (1989). Approximate Bayesian inference in conditionally independent hierarchical models (parametric empirical bayes models). Journal of the American Statistical Association 87, Kirschner, D., Lenhart, S., and Serbin, S. (1997). Optimal control of the chemotherapy of HIV. Journal of Mathematical Biology 35, Lavori, P. and Dawson, R. (2008). Adaptive treatment strategies in chronic disease. Annual Review of Medicine 59, Lundgren, J., Babiker, A., El-Sadr, W., Emery, S., Grund, B., Neaton, J., Neuhaus, J., and Phillips, A. (2008). Inferior clinical outcome of the cd4 (+) cell count guided antiretroviral treatment interruption strategy in the smart study: Role of cd4 (+) cell counts and hiv rna levels during follow-up. Journal of Infectious Diseases 197, Meynard, J., Morand-Joubert, L., Lacombe, K., Poirier, J., Slama, L., Valantin, M., and Girard, P. (2010). Impact of reduced dosing of lopinavir/ritonavir in virologically controlled hiv-infected patients: The kaledose trial. Journal of Antimicrobial Chemotherapy 65, Milinkovic, A., Martinez, E., López, S., de Lazzari, E., Miró, O., Vidal, S., Blanco, J., Garrabou, G., Laguno, M., Arnaiz, J., Leon, A., Larrousse, M., Lonca, M., Mallolas, J., and Gatell, J. (2007). The impact of reducing stavudine dose versus switching to tenofovir on plasma lipids, body composition and mitochondrial function in HIV-infected patients. Antiviral Therapy 12, Mohri, H., Bonhoeffer, S., Monard, S., Perelson, A., and Ho, D. (1998). Rapid turnover of T lymphocytes in SIV-infected rhesus macaques. Science 279, Molina, J., Chêne, G., Ferchal, F., Journot, V., Pellegrin, I., Sombardier, M., Rancinan, C., Cotte, L., Madelaine, I., Debord, T., and Decazes, J. (1999). The ALBI trial: A randomized controlled trial comparing stavudine plus didanosine with zidovudine plus lamivudine and a regimen alternating both combinations in previously untreated patients infected with human immunodeficiency virus. The Journal of Infectious Diseases 180, Moodie, E., Richardson, T., and Stephens, D. (2007). Demystifying optimal dynamic treatment regimes. Biometrics 63, Murphy, S. (2003). Optimal dynamic treatment regimes. Journal of the Royal Statistical Society: Series B (Statistical Methodology) 65, Murphy, S. and McKay, J. (2004). Adaptive treatment strategies: An emerging approach for improving treatment effectiveness. Clinical Science 12, Perelson, A., Neumann, A., Markowitz, M., Leonard, J., and Ho, D. (1996). HIV-1 dynamics in vivo: virion clearance rate, infected cell life-span, and viral generation time. Science 271, Putter, H., Heisterkamp, S., Lange, J., and De Wolf, F. (2002). A Bayesian approach to parameter estimation in HIV dynamical models. Statistics in Medicine 21, Ramratnam, B., Bonhoeffer, S., Binley, J., Hurley, A., Zhang, L., Mittler, J., Markowitz, M., Moore, J., Perelson, A., and Ho, D. (1999). Rapid production and clearance of HIV-1 and hepatitis C virus assessed by large volume plasma apheresis. The Lancet 354, Ribeiro, R., Mohri, H., Ho, D., and Perelson, A. (2002). In vivo dynamics of t cell activation, proliferation, and death in hiv-1 infection: Why are cd4+ but not cd8+ t cells depleted? Proceedings of the National Academy of Sciences of the United States of America 99, Rue, H., Martino, S., and Chopin, N. (2009). Approximate Bayesian inference for latent gaussian models by using integrated nested laplace approximations. Journal of the royal statistical society: Series B (Statistical Methodology) 71, Sage, A. and White, C. (1977). Optimum Systems Control. NJ: Prentice-Hall Englewood Cliffs. Sánchez-Conde, M., de Mendoza, C., Jiménez-Nacher, I., Barreiro, P., Gonzalez-Lahoz, J., and Soriano, V. (2005). Reductions in stavudine dose might ameliorate mitochondrial-associated complications without compromising antiviral activity. HIV Clinical Trials 6, Shen, L., Peterson, S., Sedaghat, A., McMahon, M., Callender, M., Zhang, H., Zhou, Y., Pitt, E., Anderson, K., Acosta, E., and Siliciano, R. (2008). Dose-response curve slope sets class-specific limits on inhibitory potential of anti-hiv drugs. Nature Medicine 14, Thiébaut, R., Jacqmin-Gadda, H., Leport, C., Katlama, C., Costagliola, D., Moing, V., Morlat, P., Chêne, G., and Group, A. (2003). Bivariate longitudinal model for the analysis of the evolution of HIV RNA and CD4 cell count in HIV infection taking into account left censoring of HIV RNA measures. Journal of Biopharmaceutical Statistics 13, Van der Vaart, A. (2000). Asymptotic Statistics. Cambridge University Press, UK. Vrisekoop, N., Den Braber, I., De Boer, A., Ruiter, A., Ackermans, M., Van Der Crabben, S., Schrijver, E., Spierenburg, G., Sauerwein, H., Hazenberg, M., De Boer, R., Miedema, F., Borghans, J., and Tesselaar, K. (2008). Sparse production but preferential incorporation of recently produced naive T cells in the human peripheral pool. Proceedings of the National Academy of Sciences 105, Wei, X., Ghosh, S., Taylor, M., Johnson, V., Emini, E., Deutsch, P., Lifson, J., Bonhoeffer, S., Nowak, M., and Hahn, B. (1995). Viral dynamics in human immunodeficiency virus type 1 infection. Nature 373, Wu, H. (2005). Statistical methods for HIV dynamic studies in AIDS clinical trials. Statistical Methods in Medical Research 14, Received September Revised December Accepted January 2012.

141 6.3 : Perspectives Perspectives Nous avons montré que cette stratégie d adaptation de la dose possède de bonnes propriétés pour réduire la dose de traitement des patients infectés par le VIH. Nous avons fait de nombreuses études de robustesse et de sensibilité, comme par exemple mesurer l impact d un plus grand nombre d observations du patient, de la censure à gauche ou de la mauvaise spécification du modèle. Cela nous a permis de mettre en lumière les limites de l algorithme de Métropolis-Hastings à marche aléatoire simple que nous utilisons. En effet, pour un modèle bien spécifié, le taux d acceptation commence à environ 60% puis diminue de presque 15% à chaque nouvelle observation utilisée pour la mise à jour de la dose. À partir de 15 observations utilisées, le taux de rejet est supérieur à 99% rendant les calculs très longs. Dans certains cas où le modèle est mal spécifié, comme lorsque les données sont simulées avec un modèle à cellules productives [Drylewicz et al., 2010] et l algorithme de mise à jour de la dose se base sur un modèle à cellules cibles (équation 3.9), Métropolis-Hastings ne parvient pas à proposer de nouvelles valeurs dans un temps raisonnable. Ainsi, un axe d amélioration serait d implémenter un algorithme bayésien plus conservateur, par exemple des filtres particulaires [Del Moral et al., 2006]. Par ailleurs, il serait intéressant de mettre au point des indicateurs pouvant révéler une mauvaise spécification du modèle, qu elle soit intrinsèque (mauvais nombre de composantes) ou dynamique (terme manquant dans les ODE) des modèles. Bien que dans nos modèles, la magnitude des variances des effets aléatoires peut être vue comme un indice de mauvaise spécification, il serait intéressant de le formaliser. En effet, nous avons observé que lorsque des effets aléatoires deviennent très grands le modèle n est souvent plus adéquat. Il serait aussi intéressant d introduire un paramètre d adhésion du modèle au système ODE comme proposé par [Jaeger and Lambert, 2012] dans une approche non paramétrique basée sur celle de [Wang et al., 2012]. Ainsi, nous pourrions travailler sur un terme de pénalité qui, lorsque l écart devient trop grand entre données observées et trajectoires prédites, avertit le modélisateur. Par ailleurs, la mauvaise spécification peut aussi être évaluée en introduisant de l aléa dans les ODE via des termes stochastiques appliqués

142 Chapitre 6 : Optimisation de la dose de traitement 142 directement sur les composantes ou par des drifts sur les paramètres. Il s agit ensuite d évaluer l impact sur la qualité d ajustement avec pour outil les critères de choix de modèle. En particulier, il serait intéressant de reprendre les travaux de [Commenges et al., 2012] afin d étendre le critère LCV a afin de pourvoir comparer des modèles ne prenant pas en compte la même quantité d information. Un aspect plus théorique à développer consiste en la démonstration de la convergence de la loi a posteriori des paramètres vers la vraie valeur des paramètres individuels énoncée équation 6.2. En reprenant les notations de la Section et en supposant les observations faites du patient indépendantes les unes des autres, nous pouvons appliquer le théorème de Bernstein von-mises aux effets aléatoires individuels ce qui nous donne la convergence en probabilité : I p(u i F i j) N ûi F i, j j 1 û i F j i 0 j + Ainsi, pour n fixé, (ˆφ et ˆβ) étant des constantes, nous pouvons écrire : I p(ξ i F i j) N ˆξ i F, j i j 1 û i F j i 0 j + Nous nous plaçons ensuite dans l asymptotique où n est grand et où nous pouvons considérer que ˆφ = φ et ˆβ = β. Alors, il est possible d écrire : p(ξ i Fj) i n + δ ξ j + i Cependant, cette démonstration repose sur deux hypothèses fortes, probablement non vérifiées sur le type de données dont nous disposons : les observations (Y i1,..., Y ij ) ne sont pas i.i.d. et la validité de la double asymptotique n est pas assurée, car pour n fini (ˆφ, ˆβ) sont des estimateurs.

143 6.3 : Perspectives 143 Pour finir, l analyse de patients réels issus de l essai ALBI donne une idée de ce que la stratégie adaptative de traitement pourrait permettre en pratique. Ainsi, les patients pour lesquels l infection était contrôlée avec la dose standard de l étude auraient vu leur dose réduite ; d autres patients auraient vu leurs doses augmentées. Par exemple, le patient 538 aurait dû prendre 53% de sa dose alors que la dose du patient 33 aurait dû être augmentée de 2.5%. Cette bidirectionnalité confère à cet algorithme la capacité de mettre en évidence des échecs thérapeutiques. En effet, si la dose de traitement proposée est supérieure à une dose maximale admissible de traitement (d max ), le patient pourra être déclaré en échec thérapeutique, car aucune nouvelle dose ne peut lui être proposée pour le traitement en cours. Ainsi, un développement complémentaire possible serait le développement d une stratégie adaptative de changement de traitement comme présenté Figure 6.4. Cependant, ceci demande de prendre en compte les aspects de pharmacologie et de résistances au traitement d où les travaux suivants. Figure 6.4 : Protocole d optimisation du traitement pour le choix d une nouvelle cart après un échec thérapeutique mis en valeur par une stratégie adaptative de réajustement de la dose de traitement.

144

145 Chapitre 7 Modélisation des effets des cart, vers une optimisation Résumé : Certains modèles dynamiques pour le VIH, en particulier le modèle à cellules cibles, possèdent comme nous l avons vu au chapitre précédent de bonnes propriétés prédictives, le rendant utile pour construire des stratégies de surveillance des traitements. Dans ce chapitre, nous passons en revue l ensemble des phénomènes biologiques qui doivent être considérés dans le contexte des cart : les mécanismes d action des molécules, leurs pharmacocinétiques, leurs pharmacodynamiques ainsi que les caractéristiques génétiques du virus et de l hôte. Nous présentons une modélisation permettant la quantification in vivo d effets d antirétroviraux et de cart basé sur des données in vitro. Pour finir, nous introduisons les problématiques d intérêt dans les travaux futurs comme la compréhension des mécanismes d adhérence ou de réservoirs latents. Mots-clés : activité antivirale ; adhérence ; antirétroviraux ; cart ; in vitro ; in vivo ; médecine personnalisée ; NLME-ODE ; pharmacocinétique ; pharmacodynamique ; pharmacogénétique ; potentiel inhibiteur instantané (IIP) ; réservoir latent ; surveillance des traitements ; VIH. Abstract : As shown in the previous chapter, some dynamical models for HIV, the target cells model in particular, may have good predictive abilities, and are useful in the design of treatment monitoring strategies. In this chapter, we review the biological aspects that have to be considered to understand the effect of cart : drug types of action, pharmacokinetics, pharmacodynamics and genetic caracteristics of patients and HIV. We present a modeling that allows quantifying in vivo the effect of antiretroviral drugs and cart based on in vitro knowledge. Finally, we introduce future concerns and prospects such as the understanding of adherence or latent reservoirs mechanisms. Key words : adherence ; antiretroviral drugs ; antiviral activity ; cart ; instantaneous inhibitory potential (IIP) ; in vitro ; in vivo ; HIV ; latent reservoir ; NLME-ODE ; personalized medicine ; pharmacokinetics ; pharmacodynamics ; pharmacogenomics ; treatment monitoring.

146 Chapitre 7 : Modélisation des effets des cart, vers une optimisation Les facteurs d intérêt dans les modèles dynamiques appliqués au VIH Dans l idée de la médecine personnalisée, comme développée Section 2.2 et Figure 7.1, chaque patient est traité par une stratégie thérapeutique précisément adaptée à ses besoins. La réalisation de cette idée repose inévitablement sur l utilisation réussie d une approche systémique par laquelle les biomarqueurs et les paramètres clinico-pathologiques sont intégrés aux profils génétiques et moléculaires [Mias and Snyder, 2013]. Ce travail passe par la réalisation d une revue de la littérature des différents facteurs pouvant avoir un impact sur la réponse au traitement d un patient. Cette étape est essentielle, car si certaines sources de forte variabilité ne sont pas identifiées, les performances d optimisation des traitements seront largement dégradées, comme cela a été montré en écologie [Williams, 1996, Ludwig, 1996]. Figure 7.1 : Abstract graphique : Schématisation du protocole de médecine personnalisée dans le domaine du VIH basée sur des modèles dynamiques Ce travail fait l objet d un article publié dans Advanced Drug Delivery Reviews, Volume 65, Juin 2013, Pages [Prague et al., 2013b].

147 Advanced Drug Delivery Reviews 65 (2013) Contents lists available at SciVerse ScienceDirect Advanced Drug Delivery Reviews journal homepage: Dynamical models of biomarkers and clinical progression for personalized medicine: The HIV context M. Prague, D. Commenges, R. Thiébaut University of Bordeaux, ISPED-Epidémiologie-Biostatistique, F Bordeaux, France INSERM, ISPED, Centre INSERM U897, F Bordeaux, France article info abstract Article history: Accepted 10 April 2013 Available online 18 April 2013 Keywords: Mechanistic models Dynamic models Personalized medicine HIV infection Biomarkers Mechanistic models, based on ordinary differential equation systems, can exhibit very good predictive abilities that will be useful to build treatment monitoring strategies. In this review, we present the potential and the limitations of such models for guiding treatment (monitoring and optimizing) in HIV-infected patients. In the context of antiretroviral therapy, several biological processes should be considered in addition to the interaction between viruses and the host immune system: the mechanisms of action of the drugs, their pharmacokinetics and pharmacodynamics, as well as the viral and host characteristics. Another important aspect to take into account is clinical progression, although its implementation in such modelling approaches is not easy. Finally, the control theory and the use of intrinsic properties of mechanistic models make them very relevant for dynamic treatment adaptation. Their implementation would nevertheless require their evaluation through clinical trials Elsevier B.V. All rights reserved. Contents 1. Introduction Models for HIV biomarker dynamics and their predictive ability A tool: the dynamical/mechanistic models An example of field of application: HIV infection Statistical challenges in parameters estimation in dynamical models Predictive ability of the activated cell model in HIV infection Including in vivo/in vitro drug efficacy and compliance The type of drug mechanism Pharmacokinetics/dynamics Compliance Viral mutations Host genetics Including clinical progression Toward the use of mechanistic models for personalized medicine Treatment monitoring using mechanistic models Implementing the TDM in clinical settings The challenge of the approach Acknowledgments References Abbreviations: HIV, HumanImmunodeficiency Virus; HAART, HighlyActiveantiretroviral Therapy; TDM, Therapeutic Drug monitoring; STI, Structured Treatment Interruptions; ODE, Ordinary Differential Equation; PK, Pharmacokinetics; PD, Pharmacodynamics; PG, Pharmacogenomics. This review is part of the Advanced Drug Delivery Reviews theme issue on Mathematical modeling of systems pharmacogenomics towards personalized drug delivery. Corresponding author. Tel.: address: (R. Thiébaut). 1. Introduction Guidelines for medical treatments are usually based on empirical results of clinical trials. For instance, for defining the treatment of an HIV-infected subject, these recommendations pertain to four questions [1]: when to start antiretroviral therapy? What to start? When to change? What to change? X/$ see front matter 2013 Elsevier B.V. All rights reserved.

148 M. Prague et al. / Advanced Drug Delivery Reviews 65 (2013) The guidelines are defined at a population level and are to be applied to all patients in a standardized way. Personalized medicine aims at defining more specific criteria for each patient. A usual approach is to define subgroups that would more likely benefit from starting or changing a treatment than others because of some individual characteristics based on clinical, biological or genetic markers. Once the treatment is started, another possibility is to observe the initial response of a given patient in order to adapt his/her treatment dynamically: this is often referred to as Treatment Drug Monitoring (TDM) or adaptive treatment strategy [2 4]. Although mathematical models could be useful for this purpose, their use is actually limited by the complexity of their implementation. A well-known example is the regulation of insulin injection based on glycaemia measurements [5]. In a model-based approach, the idea is to learn from the data collected from an individual to forecast the best choices likely to produce the best clinical outcomes. This relies on considering the patient as a system that is changing over time [2,6,7]. It then becomes possible to apply models to regulate this system and thereby achieve more desirable outcomes based on control of the input and feedback [8]. The main objective of this review is to show how useful mechanistic models can be for personalized medicine, with a special emphasis on HIV infection. This is introduced in Section 2, where we also present a model of HIV dynamics which has already proven its predictive ability. In Section 3, we then review the potential of using additional information relating to the individual's clinical data related to the HIV infection such as patient compliance, pharmacokinetics (PK)/dynamics data, viral and host genetics. In Section 4, we discuss attempts that have been made for treatment monitoring and Section 5 raises challenges that remain to be addressed. 2. Models for HIV biomarker dynamics and their predictive ability 2.1. A tool: the dynamical/mechanistic models In medicine and especially in clinical research, mathematical models can be useful for dealing with the growing amount of information. More and more factors are recorded for each patient, and more and more biomarkers are measured repeatedly over time. The aim of modelling is usually to summarize multi-dimensional datasets, as well as trying to predict outcomes in future patients. A summary may be a set of independent factors associated to the occurrence of a disease, such as in conventional epidemiological studies. Regarding models, two types can be distinguished, i.e. descriptive and mechanistic models. Descriptive models are designed using a standard structure that will best fit all available data, with a view to capture association between factors and the evolution of the disease. For instance, if a continuous marker is repeatedly measured over time and has a non-linear evolution, a model based on non-linear mixed effect could then be used. Once the estimates have been obtained, the interpretation of the results might then lead to biological hypotheses explaining the link between factors and the change in the marker. In contrast, the mechanistic approach starts from biological knowledge. Biological knowledge is translated into a set of mathematical equations, generally a system of differential equations. Here, we will restrict our discussion to the case of ordinary differential equations (ODE), although models have also been based on the more complex partial differential equations or stochastic differential equations. The ODE system defines a dynamical system for which the behaviour can be studied. There generally are, however, several unknown parameters involved in such a system of differential equations, and its behaviour will of course depend on the value of all parameters, including the unknown ones. Mechanistic models based on differential equations are commonly used in physics. Using this type of models in biology is challenging because the biological mechanisms are different from physical laws and the biological systems are generally more complex than physical systems. In other words, models are always a simplification of reality, but an acceptable simplification is often more difficult to achieve in biology than in physics. The gap between model and reality may be reduced by increasing the model complexity, or by introducing stochasticity [9]. Moreover, in physics many parameters are assumed to be known while in biological models, nearly all the parameters are either estimated, or unknown. Thus, the issue of parameter estimation, which is a statistical issue, is a major challenge in biological models. As a consequence, in order to be able to estimate the parameters, a compromise has to be found to design a reasonably simple model which correctly fits the observed data, an issue coined in statistics as the parsimony principle. In mechanistic models we have the additional requirement that the structure of the model must represent important characteristics of the underlying biological mechanisms. Using a mechanistic model presents the advantage of bringing external information to the analysis, i.e. information coming from the knowledge of the biological mechanisms at work, which may lead to a comparison of models reflecting different biological mechanisms [10]. Interaction between various biomarkers may be better captured by the mechanistic modelling than by a complex descriptive model. For instance, several descriptive models were suggested for jointly modelling two markers in HIV infection such as viral load and lymphocytes T CD4 + count [11 14]. However, none were fully satisfactory because none gave both a good fit of the data and an easy biological interpretation of the parameters. The mechanistic nature of the model should ensure two fundamental properties: (i) the parameters should be universal (at least approximately) in the sense that their value should be consistent across any datasets (e.g. cell survival rate); (ii) the predictive ability should be better than that of a descriptive model, that is in situations with data different from those used for learning the model. Once a model has been obtained and shown to have a good predictive ability, it becomes possible to envisage using it for controlling the response, for example for adapting and monitoring drug treatments An example of field of application: HIV infection The HIV infection provides a good example of the use of mathematical mechanistic modelling. The basic biological knowledge is as follows. The HIV virus uses the CD4 receptor to enter into a cell that it will infect: thus the target cells are those presenting a large number of CD4 receptors, essentially the CD4+ T lymphocytes. It is the use of mechanistic models that helped to reveal that a high turn-over of virus and cells is a fundamental phenomenon in the HIV disease [15]. When infected subjects are given a potent antiretroviral drug, the viral load decreases sharply. Assuming there is no more viral replication, the half-life of the virus can be estimated by fitting a simple exponential model (which is the solution of the differential equation dv dt ¼ μ V V, where V is the viral load and μ V the death rate of the virus). Further refinements provided updated estimations of the infected cells half-life [16]. This revealed that the half-life of the virus was short [17]. Hence, the equilibrium state observed during the asymptomatic phase of the HIV disease was actually associated to a constant renewing of both the virus and target cells with a very high turnover rate. One implication of these results was the very high probability of mutations of the virus in just one day. This understanding constituted one of the bases for the rationale of combined antiretroviral therapies that is now the standard of care (SOC). These models, as any model, made several strong assumptions, including a perfect efficacy of the antiretroviral treatment (see [18,19] for a review). This assumption was acceptable as a first approximation because the antiretroviral treatments were highly potent on a short term. However, researchers have also used these models to estimate the antiviral potency of the antiretroviral regimen [20]. Although this objective is clinically highly relevant, several methodological issues arise when embarking in such studies. This is presented

149 956 M. Prague et al. / Advanced Drug Delivery Reviews 65 (2013) in part in the Xiao's paper of the present issue (see [21] in this journal) and summarized in the following paragraphs. A wide variety of models exists. As mentioned above, in the pioneering work of Wei et al. [17], only the viral decay was modelled. A model that also incorporated viral production with separate analysis of the viral load and CD4 count was then developed [15]. Later, many proposals were made by various authors, leading to models including more compartments. First, distinguishing between uninfected and infected CD4+ T lymphocytes (in short CD4 ) led to detect that there are heterogeneous half-lives for infected cells and that more complex non-linear models are needed to accurately describe long-term viral decay [16,22]. Several other models were then proposed, assuming exponential life-span of infected CD4 [23], different maturation stages of CD4, CD8 modelling [24] and mutations, most of the time modelled by a finite number of mutants in a discrete form [25 27]. Most of these models were associated to new breakthroughs in the understanding of the infection, and were designed to include the action of antiretroviral drugs. The effects of different drug classes, however, have typically been aggregated in these modelling approaches, with some notable exceptions [20,28 30]. Nevertheless, most of these works are burdened by problems of identifiability: see [31,32] for a description of this issue in the HIV setting. One of the main problems is that, while it is useful to distinguish several types of cells, leading to several compartments, only very few compartments can be observed clinically (typically two in the HIV setting: CD4 count and viral load). Because of the difficulty of estimating parameters, most authors used mathematical modelling as a tool for studying possible dynamics of the system when all the parameters are fixed in advance. With carefully chosen values of parameters, this type of approach can indeed be valuable, for example to examine hypotheses on different biological mechanisms [33], to perform simulations of mutations occurrence [34] or to compare designs of therapies [35]. In a particularly interesting instance, Smith and Wahl [30] proposed an impulsive differential equations model accounting for kinetics of drug actions to evaluate the effect of the duration of the interval between administrations. It was found that a high frequency and a short interval dosing interval is compulsory to maintain a normal T cell count and a threshold defined per individual can result in optimized dosing intervals. However the behaviour of dynamical systems strongly depends on the values of the parameters. This type of approach is thus limited to an exploratory phase. We believe that the strength of the mechanistic models approach for medicine individualization can be exploited only if the parameters have been estimated from data. Estimation is a statistical problem, and this represents a particularly challenging one for mechanistic models. This partly arises from the fact that we want to fit the model not on a single patient but using a sample of patients in order to have as much information as possible. However, the assumption that the parameters are the same for all patients does not hold. Treating some parameters as random allows taking into account inter-patient variability. Statistical approaches using random effect models have been developed and applied to data from large clinical trials samples. One should note, however, that fitting ODE-based models with random effects is numerically challenging (see [36] for a review) Statistical challenges in parameters estimation in dynamical models In this section, we introduce various methods to estimate parameters in ODE-based models. Classical non-linear mixed effects models [37] based on the exact analytic formula of the likelihood cannot be applied since most of the time the ODEs used to model the dynamics between HIV and the immune system do not have analytic solutions. To get rid of this problem, one may adopt functional data analysis where data are fitted by splines curve smoothing while a penalty term maintains the fidelity to ODE [38]. Although, ODEs do not have to be solved in this approach, computations are heavy whereas numerical solving of ODEs is computationally possible. Thus, the classical method is to use an ODE solver for computing the likelihood and adopt classical maximization techniques. But, individual hierarchical level in the modelling leads to multiple integration for exact computation of the likelihood and most of the time no close-form exists for the integral. Then, estimation with an approximation of the likelihood has been proposed and implemented in the NONMEM software [39] but this may lead to biased estimations [40]. An alternative is the Stochastic Approximation Expectation Maximization (SAEM) algorithm implemented in the MONOLIX software [41 43] which is a spinoff of the EM algorithm [44] extended to non-linear models. Alternatively, numerical computation of integrals is possible and highly effective in particular by Adaptive Gaussian Quadrature methods [45], thus the exact numerical likelihood computation can be computed instead of making approximations. Complementary to the frequentist approaches presented above, Bayesian techniques have made great improvements in parameters estimation because information from noisy data is often sparse due to practical rather than theoretical lack of identifiability [31]. The most used techniques of estimation are via stochastic simulation known as Markov chain Monte Carlo (MCMC) [46 48]. These approaches can be implemented in the freeware Winbugs [49]. This is particularly appreciated since the direct numerical integrations for the computation of the likelihood are avoided. However, these algorithms are highly time-consuming and convergence is often difficult to assess. A valuable alternative based on penalized maximum likelihood can be found in [50]. This method has been implemented in the NIMROD program (Normal approximation Inference in Models with Random effects based on ODE) which is available for download [51]. In short, the penalized likelihood is computed as the sum of the exact numerical log-likelihood, computed thanks to Adaptive Gaussian Quadrature and the ODEs numerical solver, plus a penalization term coming from the external information that we have on the parameters of the model. Then, a Newton Raphson like algorithm (the Robust Variance Scoring algorithm [52]) maximizes the penalized likelihood. A significant gain of time is made possible by the approximation of gradients and Hessian by numerical computation of the derivatives of the penalized log-likelihood. The penalized likelihood approach can be thought of as an approximate Bayesian approach: the approximation consists in approximating the posterior distribution of the parameters by a normal distribution (which is asymptotically justified by the Bernstein Von Mises theorem). This method takes advantage of newly widespread high performance computation clusters thanks to parallel computing of the likelihood for each patient. Moreover, specific attention has been paid to the definition of good convergence criteria. Satisfactory bias and root mean squared errors are reached compared to MCMC technique, see [51] for quantitative details Predictive ability of the activated cell model in HIV infection In this section, we illustrate the good predictive ability that can be achieved with a particular mathematical model applied to a HIV clinical trial. We used the data of the controlled randomized open-label ALBI ANRS 070 trial [53] in which three antiretroviral strategies based on two nucleosidic reverse transcriptase inhibitors (NRTI) were compared in 151 previously untreated patients over 24 weeks. The 51 patients from arm 1 received the d4t (stavudine) + ddi (didanosine) treatment, with drug doses adjusted to their weight: d4t 250 mg plus ddi 60 mg for patients under 60 kg, and d4t 400 mg plus ddi 80 mg for those above 60 kg. For arm 2, 51 patients received 500 mg of zidovudine (AZT) and 300 mg of lamivudine (3TC). In the third arm (49 patients), patients were given the same treatment as in arm 1 (D4T + ddi) for 12 weeks and then switched to the treatment given to arm 2 patients (AZT + 3TC) for the remaining 12 weeks. CD4 counts and viral loads

150 M. Prague et al. / Advanced Drug Delivery Reviews 65 (2013) were measured every 4 weeks until 24 weeks. Two patients dropped out beforethetimeofthefirst blood sample collection, so 149 patients were available for the Intent-To-Treat analysis. For each patient, changes in dose were either self-reported or declared by the clinician. The details of the design and the collecting methods have been described in details elsewhere [53]. The activated cell model is represented by a four-dimensional ODE system, featuring quiescent (Q) and activated (T) uninfected CD4+ T cells, infected CD4+ T cells (T*) and viruses (V) concentrations (see Fig. 1 and Table 1 for parameters description): 8 dq dt ¼ λ þ ρt αq μ Q Q; dt >< dt ¼ αq γvt ρt μ T T; dt dt ¼ γvt μ T T ; >: dv dt ¼ πt μ V V: Based on this mathematical structure, a statistical model was developed for the logarithm of all biological parameters. This transformation was chosen to ensure positivity of all these rates. Let us denote θ ¼ logðþ. θ To take inter-patient variability into account, parameters can be modelled as the sum of a population (fixed) parameter θ 0 and a random effect b i having independent standard normal distributions: θ i ¼ θ 0 þ b i leading to a mixed effects model. After a forward selection strategy [54], parameters α; λ and μ T were found to vary substantially among patients and were selected for having random effects, while the other parameters were assumed constant in the population. Because the antiretroviral drugs considered were reverse transcriptase inhibitors (RTI), the treatment was assumed to act on the infectivity parameter γ [55]. For a specific treatment, the standardized dose d was introduced as a covariate with a power function: γ i ¼ γ 0 þ βd κ i, where β is the treatment effects. This can be easily extended to treatment regimens that may change over time by considering as many treatment effects and power functions as the number of drugs in combination. As an illustration, if two treatments are considered then the infectivity will be γ i ¼ γ 0 þ β 1 d 1 i κ 1 þ β2 d 2 i κ 2 with two distinct treatment effects estimated. Although the model distinguishes between quiescent, non-infected and infected CD4, only the total number of CD4 is observed. We built an observational model for the log 10 of the viral load and the fourth root of total CD4 count (written Y = [log 10 (V);(Q + T + T*) 0.25 ]) plus a Gaussian measurement error. From the ALBI data, we constructed a training dataset for estimating the model parameters and a validation dataset on which we performed predictions. To avoid over-fitting, we excluded the patients for whom we made predictions from the learning set. A description of the analysis can be found in [56]. The individual predicted trajectories of viral load and CD4 count were computed by plugging individual estimates of the parameters into the ODE model and by computing the solutions numerically. We assessed Table 1 Biological parameters for the Activated cells model. Parameter Meaning α Activation rate of Q cells (day 1 ) μ T* Death rate of T cells (day 1 ) λ Rate of Q cells production (μl 1 day 1 ) μ T Death rate of T cells (day 1 ) π Rate of virions per T cell (day 1 ) ρ Rate of reversion to the Q state (day 1 ) γ Infectivity: Infection rate of T cells per virion (μl day 1 ) μ Q Death rate of Q cells (day 1 ) μ V Death rate of free virions (day 1 ) two endpoints: prediction of treatment changes and dose changes. In the third arm of ALBI, patients switched treatment after 12 weeks. To examine whether it was possible to forecast their response to the new treatment given during the remaining 12 weeks, we selected patients at each decile of the distribution of HIV viral load at the end of the study and excluded them from the learning dataset. For each patient belonging to these different deciles, we used the first 12 weeks associated with the first 4 measurements to compute individual parameters and predict the patient responses to the treatment modification. Fig. 2 presents the individual prediction of the markers for a patient (the median patient for viral load) who switched from d4t + ddi to AZT + 3TC. The predictions thus obtained were quite good: only 4.9% of the observations were out of the 95% measurement error predictive intervals. This high quality of prediction suggests that this arm could actually have been avoided since we were able to predict the marker dynamics reliably for each individual. The same type of analysis was performed to assess the predictive ability of our model to dose changes. Predictions of the response to treatment changes were also found to be quite good (Figs. 3 and 4a). Taken together, Fig. 4a and b illustrate that, as expected, these predictions are better if many observations from the patients are used to build the predictions. In other words, short-term predictions are better than long-term predictions. In this particular example, CD4 counts can be correctly predicted using three observations of biomarkers from the same patient (both viral load and CD4 count), whereas one is not sufficient. The AZT + 3TC regimen appeared to have a lower potency in this trial. Indeed, the prescribed AZT dose of 300 mg/d was probably too low if we consider that the current dose prescribed nowadays is 600 mg/d. Additional virus genotype data did not allow to conclude for a higher incidence of resistance mutations in AZT + 3TC group [57]. In conclusion, the individual predictions of the mechanistic model in this trial were found to be very good, thanks to the relevance of the model used in this application and a full estimation of all the parameters jointly. If the mechanistic model does not include a biological mechanism playing an important role in a given circumstance, however, the predictions will probably not be as good as those we observed in the ALBI trial. Further work is currently ongoing to look at the robustness of such models with more up-to-date antiretroviral therapies. Moreover, since it is generally accepted that this kind of model is by definition misspecified, other components will have to be considered to go further. 3. Including in vivo/in vitro drug efficacy and compliance 3.1. The type of drug mechanism Fig. 1. Graphical representation of the Activated cells model. A potential power of mechanistic models is to distinguish between the mechanisms of action of different antiretroviral agents. Nowadays, five classes of antiretroviral agents exist which do not act on the same pathways (see [58] for a review). Entry inhibitors, interfere with the binding, fusion and entry of the HIV virus. RTIs impair the synthesis of the HIV DNA genome from the RNA strands. In mechanistic models,

151 958 M. Prague et al. / Advanced Drug Delivery Reviews 65 (2013) Fig. 2. Viral load (log10 copies/ml) and CD4 count (cells/l) predictions for patients at median of the final HIV viral load distribution for patients in ALBI switch arm (#642). Triangles are observations, red diamonds are observations outside the CI; black lines are fits, blue line on the left of the horizontal line is prediction. Shaded zone represents the 95% measurement error predictive interval. Horizontal dashed line represent left censoring threshold for viral load. Bottom part of graphs gives treatment posology. we may consider that drugs belonging to these two classes decrease the rate of infection of the CD4. Consequently, the infectivity parameter (γ) should be reduced. Integrase inhibitors block the action of the integrase, a viral enzyme that inserts the viral genome into the cell nucleus. Different stages of infection of the CD4 cells can be modelled, the last stage being virus production. Thus, integrase inhibitors diminish the rate of conversion from early stage infection to late-stage infection. It has been argued that the steep viral load decrease observed with integrase inhibitors is due to the action of the drug at a rather late stage of the viral life cycle [29]. Finally, protease inhibitors (PIs) prevent the viral replication by inhibiting the activity of proteases enzymes used by the virus to cleave nascent proteins for the final assembly of new virions. This can be represented in the model by assuming that part of the produced viruses are defective and non-infectious [59]. Altogether, antiretroviral drugs do not act at the same stage of the viral life cycle; this has asignificant impact on the dynamics of the system and must be adequately represented in the models developed. Of note, the ability to distinguish the biological mechanism of any antiretroviral drug will depend on the precision of the measurement (e.g. infected cell, integrated DNA ). In this regard, the models used in most previously published studies have assumed known and/or constant effects of the drugs [59 61] Pharmacokinetics/dynamics PK of antiretroviral drugs are also important factors, but they are difficult to use directly because of the high variability between subjects in the drugs absorption, distribution, metabolism and excretion [62]. Moreover, bioavailability and protein binding can complicate the in vitro drugs quantification and cause confusions [63]. Although the antiretroviral activity should be linked with plasma concentration, this is only correlated with the drugs intracellular concentrations, which are the truly significant variable [64]; this is mainly because antiretroviral agents act mostly at intracellular sites. Quantification techniques thus need to improve before PK values can be used to evaluate treatment efficacy and clinical endpoints. Thus, the PK data may be insufficient to guide the adjustment of administered doses in patients appropriately and must be combined with considerations about pharmacodynamics (PD). Fig. 3. Viral load (log10 copies/ml) and CD4 count (cells/l) predictions for patients at quartiles (Q1 and median) of the final HIV viral load distribution for patients in ALBI experiencing dose changes (#660 and #562). Triangles are observations, red diamonds are observations outside the CI; black lines are fits, blue line on the left of the horizontal line is prediction. Shaded zone represents the 95% measurement error predictive interval. Horizontal dashed line represent left censoring threshold for viral load. Bottom part of graphs gives treatment posology.

152 M. Prague et al. / Advanced Drug Delivery Reviews 65 (2013) Fig. 4. Viral load (log10 copies/ml) and CD4 count (cells/l) predictions for patient at third quartile (Q3) of the final HIV viral load distribution for patients in ALBI experiencing dose changes (#664). Triangles are observations, red diamonds are observations outside the CI; black lines are fits, blue line on the left of the horizontal line is prediction. Shaded zone represents the 95% measurement error predictive interval. Horizontal dashed line represent left censoring threshold for viral load. Bottom part of graphs gives treatment posology. Two graphs at the lower part of the figure represent predictions for the same patient (Q3) demanding on the number of observations used to construct predictions. Left is on a long-term (1 observation used to predict a 6 points trajectory) and on a short-term (3 observations used to predict a 3 points trajectory). (a) Only the baseline observation is used to build long-term predictions. (b) First three observations are used to build shorter-term predictions. Several factors are important to determine PK PD relations, ranging from inter-patients differences to heterogeneity of viral responses to drugs, as well as interactions between the two. Table 2 presents a summary of some of the most used indicators. Most of the time, PD is evaluated in vitro since it is easier to measure viral replication in the presence of various concentrations of the drug. The most commonly used indicator is the IC 50, defined as the concentration of drug required to achieve 50% inhibition for a specific strain of virus. This is a static indicator that does not indicate what the impact of lower or higher drug concentrations would be. Moreover, it is a poor reflection of antiviral activity since it depends on the intrinsic properties of the drug, the kinetics of the stage of the viral life cycle and the kinetics of the infected cells [18]. Inhibitory quotients (IQs) are associated with the virological response since they are defined as the ratio between drug concentration (C through, plasma concentration before the next dose) and IC 50 [65]. IQs are, however, constant factors and do not describe dynamic variations according to the administrated doses. Hence, using dose response curves from infectivity assays has been suggested for quantifying the antiretroviral potency [66]. The instantaneous inhibitory potential (IIP) is a function of the dose (D). It is dynamic thanks to the Hill coefficient (m) which tunes the slope of the dose response curve. This is particularly interesting because it allows to use the number of infected cells as a direct readout for viral replication. In practical terms, IIP is the logarithm of the number of single-round infection events reduced by a drug [67]: IIPðDÞ ¼ log 10 1 þ D IC 50 m : Thus, the effectiveness of an antiretroviral in vivo is determined by m and IC 50. It then becomes possible to introduce time variations by using the PK for a particular dosing schedule leading to D(t) (where t is the time). This time-varying ratio between the dose and IC 50 in IIP has an interpretation comparable to IQs [67]. Moreover, apart from the dynamical advantages, IIPs are similar to IQs for predicting HIV responses to antiretroviral agents [68]. Furthermore, IIPs are sensitive to PK-boosting effects and interactions between drugs [69]. Empirically observed interactions of antiretroviral drugs in clinical trials

153 960 M. Prague et al. / Advanced Drug Delivery Reviews 65 (2013) Table 2 PK PD indicators definition. PK PD markers Meaning Advantages Drawbacks C through Plasma Drug concentration observed after a drug administration and just prior to the administration of a subsequent dose. IC 50 Drug concentration needed to obtain 50% inhibition of the HIV replication in culture cells. IQ C through/ic 50 The Inhibitory Quotient measures how much the drug exceeds the IC 50. vp The Virtual Phenotype is the change-fold in IC 50 for a mutant variant compared to a WT. vg viq giq D The Virtual Genotype is number of expressed listed mutations linked to the considered drug. IQ/vP The Phenotypic Inhibitory Quotient is the IQ for a specific virus strain compared to WT. C through/vg The Genotypic Inhibitory Quotient evaluates the effective concentration of the drug. Drug concentration achieved with a standard dosing. IIP log 10(1 + (D/IC 50) m ) Instantaneous Inhibitory potential measures the antiviral activity accounting for the slope of the inhibition curve (m, the Hill coefficient) depending on the dose. Easy to sample, Recognized as a standard measure. Intuitive interpretation - considered as the minimum required level, Can quantify phenotypic resistances. Include virus susceptibility and individual drug absorption information. Evaluate individual virus susceptibility, Account for a mixture of HIV variants. Evaluate individual virus genotype, Fast to run. Easy to interpret for a clinician, No understanding of mutations effects. Avoid use of IC 50, Sensitive to detect new resistances. Dynamic modeling of drug intake. Interpretation regarding the replication, Possible to account for cooperation between drugs, Differentiate antiretroviral agents classes with m. Spatiotemporal, Few data, Inter individual variations. In vivo determination is difficult, Depend on the virus strains. Based on in vitro results, Not optimal in case of mutations, Assume linear impact of the dose. Based on in vitro results, High costs and long to run. Need a full understanding and knowledge of virus position of mutations. Related with the drugs cut-off, Low sensitivity to emerging strains. Values difficult to interpret, Need to understand gene pathways due to mutations. Spatiotemporal variations, Difficult to establish which dose is of interest (oral, plasma, intracellular ). It is unclear whether it is better than IQ in vivo to correlate with virologic outcomes are reviewed in [70]. There is no metric to describe the combined effect of multiple drugs, but, four categories of interactions can be distinguished: synergism when one drug enhances the effect of the other: Bliss independence when each drug inhibits a portion of the targets; Loewe additivity that assumes that two inhibitors act on a target through a similar mechanism; antagonism when action of a drug inhibits the action of the other [71]. Combined IIP can be evaluated in vitro and reflects these interactions. An exhaustive listing for more than 166 pair-wise and 1892 three-ways combinations over 20 treatments is available in [72]. This provides a large dataset of in vitro potency assessment and a quantitative basis to compare and analyse treatment effects. However, extrapolating from in vitro data to in vivo situations is complex. First, in vitro susceptibility assays do not follow the viral dynamics during days or weeks but at a specific time point in specific conditions [73]. Second, variations of several fold of these PK PD indicators can occur during particular clinical situations such as acute infections, advanced HIV disease or pregnancy [74]. This can, however, be partially corrected by introducing explanatory variables, or by introducing a conversion parameter that has to be estimated from the data [75]. This is analogous to introducing a scaling factor that is reflective of the uncertainty between the drug measurements of drug potency in vitro and the specific model-based drug potency in vivo [76] Compliance Compliance to treatment is essential for achieving efficient concentration at the target tissues. Lack of compliance can be represented by dose-delay or dose-omission. Although many methods exist, compliance remains very difficult to assess [77]. Poor compliance is a key factor for explaining viral load variations and is strongly associated with treatment failure [78,79] as it favours viral mutations and therefore viral resistance to treatment (see next section). Nevertheless, the impact of compliance varies according to the type of antiretroviral regimen [80]. For estimation concerns, poor or unmeasured compliance can result in an underestimation of drug effectiveness leading to overestimation of drug dosage [81]. A classical and convenient way to take compliance into account in models is to include a compliance rate A(t) and to replace the dose D(t) by the product A(t)D(t) in the PD model [48,82 86] Viral mutations Genotypic and phenotypic characteristics of the virus can also greatly influence the response to antiretroviral treatment. Genetic barrier for resistance refers to the number of nucleotide changes a virus needs to accumulate to become resistant to a given antiretroviral drug. Information on patterns of resistances and cross-resistances is important for making decisions on how to change and combine drugs to achieve an optimum antiviral effect. Hence, genotype information is increasingly used for deciding which antiretroviral drugs should be included in a given regimen. Genotypic and phenotypic assays based either on the detection of specific point mutations or on complete DNA sequencing are increasingly available [87]. In vitro assessment of HIV fitness has been extensively studied by different techniques; see [88] for a complete review of this topic. In short, resistance is typically measured by the virtual phenotype which is the fold change in IC 50 relative to the wild-type (WT) virus [89,90]. A derivation of this is the virtual IQ (viq), which is the IQ divided by the virtual phenotype and has been shown to have a significant link with the viral response to treatment [91]. An improvement is to introduce viqs in IIPs (described in Section 2.1 multiplying the IC 50 by the virtual phenotype leading to virtual IIPs) because this allows accounting for the steepness of the dose response curves (represented by Hill coefficient m). This is particularly important for PIs whose IC 50 is usually the same in mutant variants and WT but for which a higher dose is needed to achieve viral extinction because the Hill coefficient m is smaller [92]. In vivo, the viral response to a new antiretroviral regimen is studied according to the genotype measured at the time of treatment change. Various approaches have been proposed

154 M. Prague et al. / Advanced Drug Delivery Reviews 65 (2013) to predict the response to antiretroviral regimen according to the baseline genotype [93]. In mathematical modelling, mutations are introduced by adding virus compartments to account for different strains of virus (for an example, see the pioneering work of Nowak et al. [94]). One approach consists in considering that several genotypes of the virus, V =(V 1 V K ) exist in each patient. They are called quasi-species. The different genotypes may have different fitness, which is efficiency of replication. In real life, the number of genotypes can be large, but numerical complexity limits the number of possible genotypes that can be represented in a model [95]. Another approach which is easier to build focuses on viips instead of IIPs, and modulates the treatment effect depending on the mutant variant k. ODE-based models with immune cells and multiple strains of viruses have allowed the comparison of scenarios; as an example of results, it has been calculated that the probability that resistant mutants pre-exist to treatment is higher than the probability that resistant mutants are generated during therapy [96]. In similar models, Rong et al. introduced the effects of compliance to short-term [86] and long-term [97] treatment, and showed that many variants of the virus live as quasi-species in the host. Mutant variants that are selected have a lower sensitivity to the antiretroviral drugs and are associated with a rebound of the viral load [98]. The resistant viruses are capable of replicating better than the sensitive viruses and will therefore be positively selected [99]. The viral fitness of a mutant is, however, generally lower than that of a wild type; consequently, replication, virulence, and transmission of the selected mutant viruses may be reduced compared with those of the WT [100]. Specific models have been suggested for estimating these differences in viral fitness [101,102]. An integrated model has been recently proposed by Rosenbloom et al. [85]. The authors suggested that this approach might be more relevant than the use of a genotype analysis for evaluating the antiviral response. Indeed, genotype information is based on meta-analysis of data obtained from various regimens in patients with various characteristics, and this is not reliable because the effect of mutations is probably highly dependent on the context. In practice the detection of resistant mutants is commonly used to choose or modify the drug regimen given to a patient; however, this kind of knowledge has not yet been incorporated in a mechanistic model for personalized medicine Host genetics It is not common to use pharmacogenomic (PG), which is the patient genetic characteristics, for determining the choice of antiretroviral drug but this may be relevant in some very specific indications. For instance, the HLA-B*5701 allele has been shown to lead to a risk of about 50% of hypersensitivity with abacavir, making the screening of this haplotype systematic before prescribing this drug [103]. Drug drug interactions and genetic polymorphism in drug-metabolizing enzymes and drug transporters (MDR1, CYP3A5, CYP2C19 ) contribute to wide variability in drug PK, response to therapy and toxicity [ ]. For instance, using a population PK model including genetic characteristics, several CYP2B6 polymorphisms have been identified as being associated with steady-state nevirapine clearance among HIV-infected patients [108]. A dynamic approach is valuable to model gene interaction in a quantitative manner [109]. A modelling strategy with linear ODEs has been proposed by Lu et al. [110] to capture gene regulatory network. The perspective of introducing biomarkers and antiretroviral drugs as new compartments in these systems is appealing and can bridge the gap to combine PK PD PG to explain HIV dynamics under treatment. To date, however, the information on individual susceptibility to antiretroviral drugs remains sparse [105]. The inclusion of any PG data in mechanistic models, provided that the information is available, can be expressed by modelling some parameters as a function of individual values. The remaining inter-individual variability is then taken into account through random effects on parameters, especially those representing treatment effects. Including PG information would decrease the unexplained variability captured by the variance of the random effect Including clinical progression The first outcome of interest when modelling the response to antiretroviral treatment is the viral rebound [85] followed by the CD4 dynamics since both these markers are very good prognostic markers [111,112]. These markers, however, are still imperfect surrogate markers of clinical outcome, that is, it is not possible to predict the exact clinical effect of an antiretroviral treatment by just observing an increase in CD4 or a decrease of HIV viral load [113,114]. This is even more the case nowadays because AIDS-classifying diseases are less common, whereas the proportion of deaths due to cardiovascular diseases and cancer is growing [115]. Also, depending on the type of therapeutic approach used, the ability of these markers to reflect the clinical benefit is not guaranteed. For instance, the administration of the IL-2 cytokine results in a substantial increase of CD4 but without any significant clinical benefit [116]. Therefore, it may be important to model the dynamics of biomarkers and clinical progression jointly. Many joint models have been proposed in the literature, including applications in the HIV-AIDS field [13,14, ]. Wuetal.[121] proposed a joint model including a non-linear (bi-exponential) mixed effect model for the viral dynamics with a proportional hazards model for the time-todisease progression, and a complete mechanistic model based on ODE including a time-to-event process has subsequently been proposed by Guedj et al. [122]. Starting from a previous ODE-based model [50], the time-to-disease progression has been linked to the marker predictions at any time by a proportional hazard model. Such joint models of longitudinal markers and time-to-event processes take into account the informative missing data process due to the censoring of observations after the occurrence of disease progression. Furthermore, an easier two steps approach, where the longitudinal model is fitted first and predictions are then used in a survival model, ignores the variability of the parameters of the longitudinal model estimated in the first step [118]. Finally, in the context of adaptive treatment, one needs dynamical models from which predictions are available at any time, thus requiring joint models. What is interesting with such models is that one can obtain predictions of changes in markers (CD4 count, viral load) but also the probability of disease progression (according to the change in markers). A treatment monitoring based on this type of models sounds very useful. However, the wide spectrum of clinical diseases observed today in HIV-infected patients is due to various processes, from antiretroviral side effects [123] to the consequences of long-term HIV infection (cell activation, inflammation) [124]. Therefore, including all types of clinical events may result in a highly complex model. On the other hand, this type of model could be devoted to specific questions. For instance, with the objective of finding an optimal dose of antiretroviral, a model that includes the effect on the viral dynamics as well as the probability of side effects could serve at finding a good compromise between viral efficacy and side effects. 4. Toward the use of mechanistic models for personalized medicine 4.1. Treatment monitoring using mechanistic models HAART succeeds in reducing viral load in most HIV infected patients but does not eradicate the virus. Thus the treatment has to be taken life-long. To reduce the burden of side effects it has been proposed to interrupt the treatment under certain conditions or to find an optimal dose. Structured treatment interruptions (STI), where antiretroviral treatments are stopped either during a given period or according to CD4 counts has been a first attempt to optimize drug administration [28,125,126]. These periods of treatment interruption

155 962 M. Prague et al. / Advanced Drug Delivery Reviews 65 (2013) were supposed to boost the immune system, to offer pill burden vacancy and decrease side effects. Some studies have also evaluated strategies where the immune system was boosted with vaccine and/or interleukin 2 before interruption [127,128]. Unfortunately, the evaluation of the effect of STI on clinical outcomes through randomized clinical trials has concluded that STI were harmful [129]. Control theory (taken from engineering literature) has been suggested to find the optimal interventions that reduce a given cost function [130]. Quadratic cost functions that weighted system response (viral load or CD4 count) and side-effects of the drug have been proposed [9]. Although conceptually interesting, this approach is not realistic because (i) the model is not known, (ii) the choice of the cost function is debatable, (iii) the treatment cannot be continuously adapted. More recent approaches tend to get free from cost functions [131] and do not aim at adapting the dose continuously [132]. Pragueetal.[56] proposed to give the lowest dose for which there is infection control. This is based on ODE stability criterion, the reproductive number R 0 also used in SIR models: if R 0 b 1 there is extinction of the infection. Thus the idea is to give the lowest possible dose that ensures R 0 b 1. Such an approach was applied to the ALBI clinical trial. The patients in the most potent group (d4t + ddi) were selected to evaluate the best dose change required. A specific patient with undetectable viral load (below 50 copies/ml) during all the study after treatment initiation was proposed a dose reduction up to 53% of her/his initial dose whereas another patient with default in infection control during antiretroviral therapy was assigned a moderate dose increase. Then, observing how the patient reacts to the new dose it should be possible to update it in an iterative manner. Such recommendations should be tested in order to be validated and in order to observe how patients react Implementing the TDM in clinical settings Before the efficiency of TDM on HIV disease control can be tested, a first step should be to assess the capacity of TDM to influence the concentrations of drugs or biomarkers values into a predefined range so as to validate or invalidate the model used, and the TDM approach. This could initially be applied to all antiviral drugs, with a view to focus subsequently on more targetable drugs. This was already done by Duval et al. [133], who showed that, among PIs, dose TDM is more likely to be useful for indinavir and lopinavir than for nelfinavir. Variability should also exist between treatment regimens: on this subject, Back et al. [134] argue in favour of TDM for PIs instead of NRTIs. It is still difficult to build an acceptable design to test TDM. To date, TDM trials are difficult to interpret and statistically underpowered [135]. The method of choice could be a randomized clinical trial comparing at least two strategies: SOC and TDM. One of the simplest treatment adaptations in HIV infection is based on the use of viral resistance information. Several randomized clinical trials have been performed to evaluate a strategy based on resistance information compared to SOC [ ]. Specific designs could, however, be considered for the evaluation of more complex approaches for dynamic treatment. Murphy [139] advocated for the use of adaptive design, where the term adaptive refers to the experimental design that could be flexible: changing strategy allocation according to the responses in previous patients. An example of this is the sequential multiple assignment randomized (SMAR) trials where each individual may be randomized multiple times and multiple randomizations occur sequentially through time. Finally, an easily acceptable way of testing, which can be adapted retrospectively by adjusting on confounders, should be to analyse a previously designed clinical trial in two groups: after the forecast of the best treatment according to mechanistic models, comparing results between patients who had treatments below TDM targets and others. This kind of comparison was partly used by Best et al. [140] to assess antiviral drug dose TDM and this study showed that patients below TDM forecast tended toward a greater viral load. 5. The challenge of the approach In this paper, we have shown that, in HIV patients, mechanistic models could be very useful to perform individual prediction of the response to an intervention based on antiretroviral drugs and could therefore be a useful tool for treatment monitoring. This could also be the case for other interventions such as immune based therapy [128,141]. However, the mechanistic model needs to (i) include relevant biological processes involved in the response (ii) to be fed with enough data (that is with relevant markers measured repeatedly). In some circumstances such as in the ALBI trial this could be achieved, but more developments are probably needed to cope with the numerous types of drugs available today. The implementation of processes such as the occurrence of genotypic mutation or the effect of known host genotype on the treatment efficacy could be achieved without too much complexity. In such cases, however, the restriction might come from the absence of measured information. Also, in line with the parsimony principle that maximizes the external validity of the predictions, simple models should be prioritized. Then, if a good model proves relevant for current treatments, the next step would be to evaluate the potential of such approaches for treatment monitoring by well-designed clinical trials. Acknowledgments We thank the ANRS/Vaccine Research Institute for grant support. Parallel computing used in illustrations was used thanks to the computing facilities MCIA (Mésocentre de Calcul Intensif Aquitain) of the Université de Bordeaux and of the Université de Pau et des Pays de l'adour. References [1] S.M. Hammer, M.S. Saag, M. Schechter, J.S.G. Montaner, R.T. Schooley, D.M. Jacobsen, M.A. Thompson, C.C.J. Carpenter, M.A. Fischl, B.G. Gazzard, et al., Treatment for adult HIV infection, JAMA 296 (7) (2006) [2] P.W. Lavori, R. Dawson, Adaptive treatment strategies in chronic disease, Annu. Rev. Med. 59 (2008) [3] D. Back, G. Gatti, C. Fletcher, R. Garaffo, R. Haubrich, R. Hoetelmans, M. Kurowski, A. Luber, C. Merry, C.F. Perno, Therapeutic drug monitoring in HIV infection: current status and future directions, AIDS 16 (2002) S5 S37. [4] J.G. Gerber, E.P. Acosta, Therapeutic drug monitoring in the treatment of HIVinfection, J. Clin. Virol. 27 (2) (2003) [5] D.J. Lunn, C. Wei, R. Hovorka, Fitting dynamic models with forcing functions: application to continuous glucose monitoring in insulin therapy, Stat. Med. 30 (18) (2011) [6] S. Murphy, Optimal dynamic treatment regimes, J. R. Stat. Soc. Ser. B (Stat. Methodol.) 65 (2) (2003) [7] S.A. Murphy, J.R. McKay, Adaptive treatment strategies: an emerging approach for improving treatment effectiveness, Clin. Sci. 12 (3) (2004) [8] D.E. Rivera, M.D. Pew, L.M. Collins, Using engineering control principles to inform the design of adaptive interventions: a conceptual introduction, Drug Alcohol Depend. 88 (2007) S31 S40. [9] R.F. Stengel, R. Ghigliazza, Stochastic optimal therapy for enhanced immune response, Math. Biosci. 191 (2) (2004) [10] A. Yates, J. Stark, N. Klein, R. Antia, R. Callard, Understanding the slow depletion of memory CD4+ T cells in HIV infection, PLoS Med. 4 (5) (2007) e177. [11] W.J. Boscardin, J.M.G. Taylor, N. Law, Longitudinal models for AIDS marker data, Stat. Methods Med. Res. 7 (1) (1998) [12] R. Thiébaut, H. Jacqmin-Gadda, C. Leport, C. Katlama, D. Costagliola, V.L. Moing, P. Morlat, G. Chêne, A.S. Group, Bivariate longitudinal model for the analysis of the evolution of HIV RNA and CD4 cell count in HIV infection taking into account left censoring of HIV RNA measures, J. Biopharm. Stat. 13 (2) (2003) [13] R. Thiébaut, H. Jacqmin-Gadda, A. Babiker, D. Commenges, Joint modelling of bivariate longitudinal data with informative dropout and left-censoring, with application to the evolution of CD4+ cell count and HIV RNA viral load in response to treatment of HIV infection, Stat. Med. 24 (1) (2005) [14] E.R. Brown, J.G. Ibrahim, V. DeGruttola, A flexible B-spline model for multiple longitudinal biomarkers and survival, Biometrics 61 (1) (2005)

156 M. Prague et al. / Advanced Drug Delivery Reviews 65 (2013) [15] D.D. Ho, A.U. Neumann, A.S. Perelson, W. Chen, J.M. Leonard, M. Markowitz, et al., Rapid turnover of plasma virions and CD4 lymphocytes in HIV-1 infection, Nature 373 (6510) (1995) [16] A.S. Perelson, A.U. Neumann, M. Markowitz, J.M. Leonard, D.D. Ho, HIV-1 dynamics in vivo: virion clearance rate, infected cell life-span, and viral generation time, Science 271 (5255) (1996) [17] X. Wei, S.K. Ghosh, M.E. Taylor, V.A. Johnson, E.A. Emini, P. Deutsch, J.D. Lifson, S. Bonhoeffer, M.A. Nowak, B.H. Hahn, Viral dynamics in human immunodeficiency virus type 1 infection, Nature 373 (6510) (1995) 117. [18] A.R. Sedaghat, C.O. Wilke, et al., Kinetics of the viral cycle influence pharmacodynamics of antiretroviral therapy, Biol. Direct 6 (1) (2011) [19] D.S. Callaway, A.S. Perelson, HIV-1 infection and low steady state viral loads, Bull. Math. Biol. 64 (1) (2002) [20] A.S. Perelson, R.M. Ribeiro, Estimating drug efficacy and viral dynamic parameters: HIV and HCV, Stat. Med. 27 (23) (2008) [21] Y. Xiao, H. Miao, S. Tang, H. Wu, Modeling antiretroviral drug response for HIV-1 infected patients using differential equation models, Mathematical modeling of systems pharmacogenomics towards personalized drug delivery, vol. 65, [22] S. Bonhoeffer, R.M. May, G.M. Shaw, M.A. Nowak, Virus dynamics and drug therapy, Proc. Natl. Acad. Sci. 94 (13) (1997) [23] A.L. Lloyd, The dependence of viral parameter estimates on the assumed viral life cycle: limitations of studies of viral load data, Proc. R. Soc. London, Ser. B 268 (1469) (2001) [24] I.M. Rouzine, R.A. Sergeev, A.I. Glushtsov, Two types of cytotoxic lymphocyte regulation explain kinetics of immune response to human immunodeficiency virus, Proc. Natl. Acad. Sci. U. S. A. 103 (3) (2006) [25] S. Bonhoeffer, M.A. Nowak, Pre existence and emergence of drug resistance in HIV 1 infection, Proc. R. Soc. London, Ser. B 264 (1382) (1997) [26] M. Coffin, etal., HIV population dynamics invivo: implicationsfor genetic variation, pathogenesis, and therapy, Science-New York then Washington, [27] E. Vergu, A. Mallet, J.L. Golmard, A modeling approach to the impact of HIV mutations on the immune system, Comput. Biol. Med. 35 (1) (2005) [28] B.M. Adams, H.T. Banks, M. Davidian, H.D. Kwon, H.T. Tran, S.N. Wynne, E.S. Rosenberg, HIV dynamics: modeling, data analysis, and optimal treatment protocols, J. Comput. Appl. Math. 184 (1) (2005) [29] A.R. Sedaghat, J.B. Dinoso, L. Shen, C.O. Wilke, R.F. Siliciano, Decay dynamics of HIV-1 depend on the inhibited stages of the viral life cycle, Proc. Natl. Acad. Sci. 105 (12) (2008) [30] R.J. Smith, L.M. Wahl, Distinct effects of protease and reverse transcriptase inhibition in an immunological model of HIV-1 infection with impulsive drug effects, Bull. Math. Biol. 66 (5) (2004) [31] J. Guedj, R. Thiébaut, D. Commenges, Practical identifiability of HIV dynamics models, Bull. Math. Biol. 69 (8) (2007) [32] X. Xia, C.H. Moog, Identifiability of nonlinear systems with application to HIV/AIDS models,ieeetrans.autom.control48(2)(2003) [33] D.M. Bortz, P.W. Nelson, Model selection and mixed-effects modeling of HIV infection dynamics, Bull. Math. Biol. 68 (8) (2006) [34] D.P. Wilson, D.L.S. McElwain, A mathematical model of continuous HIV mutations eluding immune defence, J. Theor. Med. 4 (4) (2002) [35] L.M. Wein, R.M. D'Amato, A.S. Perelson, Mathematical analysis of antiretroviral therapy aimed at HIV-1 eradication or maintenance of low viral loads, J. Theor. Biol. 192 (1) (1998) [36] H. Wu, Statistical methods for HIV dynamic studies in AIDS clinical trials, Stat. Methods Med. Res. 14 (2) (2005) [37] M.J. Lindstrom, D.M. Bates, Nonlinear mixed effects models for repeated measures data, Biometrics (1990) [38] L. Wang, J. Cao, J.O. Ramsay, D.M. Burger, C.J.L. Laporte, J.K. Rockstroh, Estimating mixed-effects differential equation models, Stat. Comput. (2012) [39] J.C. Pinheiro, D.M. Bates, Approximations to the log-likelihood function in the nonlinear mixed-effects model, J. Comput. Graph. Stat. 4 (1) (1995) [40] A. Ding, H. Wu, Assessing antiviral potency of anti-hiv therapies in vivo by comparing viral decay rates in viral dynamic models, Biostatistics 2 (1) (2001) [41] E. Kuhn, M. Lavielle, Maximum likelihood estimation in nonlinear mixed effects models, Comput. Stat. Data Anal. 49 (4) (2005) [42] M. Lavielle, F. Mentré, Estimation of population pharmacokinetic parameters of saquinavir in HIV patients with the MONOLIX software, J. Pharmacokinet. Pharmacodyn. 34 (2) (2007) [43] M. Lavielle, A. Samson, A. Karina Fermin, F. Mentré, Maximum likelihood estimation of long-term HIV dynamic models and antiviral response, Biometrics 67 (1) (2011) [44] A.P. Dempster, N.M. Laird, D.B. Rubin, Maximum likelihood from incomplete data via the EM algorithm, J. R. Stat. Soc. Ser. B (Methodol.) (1977) [45] E.L. Plan, A. Maloney, F. Mentré, M.O. Karlsson, J. Bertrand, Performance comparison of various maximum likelihood nonlinear mixed-effects estimation methods for dose response models, AAPS J. (2012) [46] W.R. Gilks, Markov chain Monte Carlo, Encyclopedia of Biostatistics, [47] H. Putter, S. Heisterkamp, J. Lange, F. De Wolf, A Bayesian approach to parameter estimation in HIV dynamical models, Stat. Med. 21 (15) (2002) [48] Y. Huang, D. Liu, H. Wu, Hierarchical Bayesian methods for estimation of parameters in a longitudinal HIV dynamic system, Biometrics 62 (2) (2006) [49] D.J. Lunn, A. Thomas, N. Best, D. Spiegelhalter, WinBUGS-a Bayesian modelling framework: concepts, structure, and extensibility, Stat. Comput. 10 (4) (2000) [50] J. Guedj, R. Thiébaut, D. Commenges, Maximum likelihood estimation in dynamical models of HIV, Biometrics 63 (4) (2007) [51] M. Prague, D. Commenges, J. Guedj, J. Drylewicz, R. Thiébaut, NIMROD: a program for inference via normal approximation of the posterior in models with random effects based on ordinary differential equations, Comput. Methods Programs Biomed., [website: Index.aspx] (in press). [52] D. Commenges, H. Jacqmin-Gadda, C. Proust, J. Guedj, A newton-like algorithm for likelihood maximization: the robust-variance scoring algorithm, Arxiv math/ , [53] J.M. Molina, G. Chêne, F. Ferchal, V. Journot, I. Pellegrin, M.N. Sombardier, C. Rancinan, L. Cotte, I. Madelaine, T. Debord, et al., The ALBI trial: a randomized controlled trial comparing stavudine plus didanosine with zidovudine plus lamivudine and a regimen alternating both combinations in previously untreated patients infected with human immunodeficiency virus, J. Infect. Dis. 180 (2) (1999) [54] J. Drylewicz, D. Commenges, R. Thiébaut, Score tests for exploring complex models: application to HIV dynamics models, Biom. J. 52 (1) (2010) [55] M. Von Kleist, S. Menz, W. Huisinga, Drug-class specific impact of antivirals on the reproductive capacity of HIV, PLoS Comput. Biol. 6 (3) (2010) e [56] M. Prague, D. Commenges, J. Drylewicz, R. Thiébaut, Treatment monitoring of HIV-infected patients based on mechanistic models, Biometrics 68 (3) (2012) [57] V. Picard, E. Angelini, A. Maillard, E. Race, F. Clavel, G. Chêne, F. Ferchal, J.M. Molina, Comparisonofgenotypicand phenotypicresistancepatterns of humanimmunodeficiency virus type 1 isolates from patients treated with stavudine and didanosine or zidovudine and lamivudine, J. Infect. Dis. 184 (6) (2001) [58] G. Antonelli, O. Turriziani, Antiviral therapy: old and current issues, Int. J. Antimicrob. Agents 40 (2) (2012) [59] A.S. Perelson, P.W. Nelson, Mathematical analysis of HIV-I: dynamics in vivo, SIAM Rev. 41 (1) (1999) [60] H. Wu, A.A. Ding, Population HIV-1 dynamics in vivo: applicable models and inferential tools for virological data from AIDS clinical trials, Biometrics 55 (2) (1999) [61] M. Markowitz, M. Louie, A. Hurley, E. Sun, M. Di Mascio, A.S. Perelson, D.D. Ho, A novel antiviral intervention results in more accurate assessment of human immunodeficiency virus type 1 replication dynamics and T-cell decay in vivo, J. Virol. 77 (8) (2003) [62] E.P. Acosta, K.L. Limoli, L. Trinh, N.T. Parkin, J.R. King, J.M. Weidler, I. Ofotokun, C.J. Petropoulos, Novel method to assess antiretroviral target trough concentrations using in vitro susceptibility data, Antimicrob. Agents Chemother. 56 (11) (2012) [63] M. Boffito, D.J. Back, T.F. Blaschke, M. Rowland, R.J. Bertz, J.G. Gerber, V. Miller, Protein binding in antiretroviral therapies, AIDS Res. Hum. Retrovir. 19 (9) (2003) [64] C. Bazzoli, V. Jullien, C. Le Tiec, E. Rey, F. Mentré, A.M. Taburet, Intracellular pharmacokinetics of antiretroviral drugs in HIV-infected patients, and their correlation with drug action, Clin. Pharmacokinet. 49 (1) (2010) [65] J.L. Casado, A. Moreno, R. Sabido, P. Martí-Belda, A. Antela, F. Dronda, M.J. Perez-Elías, S. Moreno, Individualizing salvage regimens: the inhibitory quotient (Ctrough/IC50) as predictor of virological response, AIDS 17 (2) (2003) [66] H. Zhang, Y. Zhou, C. Alcock, T. Kiefer, D. Monie, J. Siliciano, Q. Li, P. Pham, J. Cofrancesco, D. Persaud, et al., Novel single-cell-level phenotypic assay for residual drug susceptibility and reduced replication capacity of drug-resistant human immunodeficiency virus type 1, J. Virol. 78 (4) (2004) [67] L. Shen, S. Peterson, A.R. Sedaghat, M.A. McMahon, M. Callender, H. Zhang, Y. Zhou, E. Pitt, K.S. Anderson, E.P. Acosta, et al., Dose response curve slope sets class-specific limits on inhibitory potential of anti-hiv drugs, Nat. Med. 14 (7) (2008) [68] T.J. Henrich, H.J. Ribaudo, D.R. Kuritzkes, Instantaneous inhibitory potential is similar to inhibitory quotient at predicting HIV-1 response to antiretroviral therapy, Clin. Infect. Dis. 51 (1) (juill 2010) [69] L. Shen, S.A. Rabi, R.F. Siliciano, A novel method for determining the inhibitory potential of anti-hiv drugs, Trends Pharmacol. Sci. 30 (12) (2009) [70] A. Jackson, S. Taylor, M. Boffito, et al., Pharmacokinetics and pharmacodynamics of drug interactions involving HIV-1 protease inhibitors, AIDS Rev. 6 (2004) [71] J.B. Fitzgerald, B. Schoeberl, U.B. Nielsen, P.K. Sorger, Systems biology and combination therapy in the quest for clinical efficacy, Nat. Chem. Biol. 2 (9) (2006) [72] B.L. Jilek, M. Zarr, M.E. Sampah, S.A. Rabi, C.K. Bullen, J. Lai, L. Shen, R.F. Siliciano, A quantitative basis for antiretroviral therapy for HIV-1 infection, Nat. Med. 18 (3) (2012) [73] N. Buss, N. Cammack, Measuring the effectiveness of antiretroviral agents, Antivir. Ther. 6 (1) (2001) 1 8. [74] M. Barry, S. Gibbons, D. Back, F. Mulcahy, et al., Protease inhibitors in patients with HIV disease. Clinically important pharmacokinetic considerations, Clin. Pharmacokinet. 32 (3) (1997) 194. [75] H. Wu, Y. Huang, E.P. Acosta, J.G. Park, S. Yu, S.L. Rosenkranz, D.R. Kuritzkes, J.J. Eron, A.S. Perelson, J.G. Gerber, Pharmacodynamics of antiretroviral agents in HIV-1 infected patients: using viral dynamic models that incorporate drug susceptibility and adherence, J. Pharmacokinet. Pharmacodyn. 33 (4) (2006) [76] J. Fang, P.R. Jadhav, From in vitro EC 50 to in vivo dose response for antiretrovirals using an HIV disease model. Part I: A framework, J. Pharmacokinet. Pharmacodyn. (2012) [77] A.J. Claxton, J. Cramer, C. Pierce, A systematic review of the associations between dose regimens and medication compliance, Clin. Ther. 23 (8) (2001)

157 964 M. Prague et al. / Advanced Drug Delivery Reviews 65 (2013) [78] C.L. Besch, Compliance in clinical trials, AIDS 9 (1) (janv. 1995) [79] E.M. Gardner, W.J. Burman, J.F. Steiner, P.L. Anderson, D.R. Bangsberg, Antiretroviral medication adherence and the development of class-specific antiretroviral resistance, AIDS 23 (9) (juin 2009) [80] D.R. Bangsberg, A.R. Moss, S.G. Deeks, Paradoxes of adherence and drug resistance to HIV antiretroviral therapy, J. Antimicrob. Chemother. 53 (5) (janv. 2004) [81] J.R. Ickovics, A.W. Meisler, Adherence in AIDS clinical trials: a framework for clinical research and clinical care, J. Clin. Epidemiol. 50 (4) (avr 1997) [82] H. Wu, Y. Huang, E.P. Acosta, S.L. Rosenkranz, D.R. Kuritzkes, J.J. Eron, A.S. Perelson, J.G. Gerber, Modeling long-term HIV dynamics and antiretroviral response: effects of drug potency, pharmacokinetics, adherence, and drug resistance, JAIDS 39 (3) (2005) [83] L.M. Wahl, M.A. Nowak, Adherence and drug resistance: predictions for therapy outcome, Proc. Biol. Sci. 267 (1445) (avr 2000) [84] R.J. Smith, Adherence to antiretroviral HIV drugs: how many doses can you miss before resistance emerges? Proc. R. Soc. B 273 (1586) (juill 2006) [85] D.I.S. Rosenbloom, A.L. Hill, S.A. Rabi, R.F. Siliciano, M.A. Nowak, Antiretroviral dynamics determines HIV evolution and predicts therapy outcome, Nat. Med. 18 (9) (2012) [86] L. Rong, Z. Feng, A.S. Perelson, Emergence of HIV-1 drug resistance during antiretroviral treatment, Bull. Math. Biol. 69 (6) (2007) [87] S.G. Deeks, D.I. Abrams, Genotypic-resistance assays and antiretroviral therapy, Lancet 349 (9064) (mai 1997) [88] M.E. Quiñones-Mateu, E.J. Arts, HIV-1 fitness: implications for drug resistance, disease progression, and global epidemic evolution, HIV Seq. Compend (2001) [89] K. Hertogs, M.-P. de Béthune, V. Miller, T. Ivens, P. Schel, A.V. Cauwenberge, C.V. den Eynde, V. van Gerwen, H. Azijn, M. van Houtte, F. Peeters, S. Staszewski, M. Conant, S. Bloor, S. Kemp, B. Larder, R. Pauwels, A rapid method for simultaneous detection of phenotypic resistance to inhibitors of protease and reverse transcriptase in recombinant human immunodeficiency virus type 1 isolates from patients treated with antiretroviral drugs, Antimicrob. Agents Chemother. 42 (2) (févr. 1998) 269. [90] C.J. Petropoulos, N.T. Parkin, K.L. Limoli, Y.S. Lie, T. Wrin, W. Huang, H. Tian, D. Smith, G.A. Winslow, D.J. Capon, J.M. Whitcomb, A novel phenotypic drug susceptibility assay for human immunodeficiency virus type 1, Antimicrob. Agents Chemother. 44 (4) (avr 2000) [91] N. Shulman, A. Zolopa, D. Havlir, A. Hsu, C. Renz, S. Boller, P. Jiang, R. Rode, J. Gallant, E. Race, et al., Virtual inhibitory quotient predicts response to ritonavir boosting of indinavir-based therapy in human immunodeficiency virus-infected patients with ongoing viremia, Antimicrob. Agents Chemother. 46 (12) (2002) [92] M.E.S. Sampah, L. Shen, B.L. Jilek, R.F. Siliciano, Dose response curve slope is a missing dimension in the analysis of HIV-1 drug resistance, Proc. Natl. Acad. Sci. 108 (18) (2011) [93] L. Wittkop, D. Commenges, I. Pellegrin, D. Breilh, D. Neau, D. Lacoste, J.-L. Pellegrin, G. Chêne, F. Dabis, R. Thiébaut, Alternative methods to analyse the impact of HIV mutations on virological response to antiviral therapy, BMC Med. Res. Methodol. 8 (1) (oct 2008) 68. [94] M.A. Nowak, R.M. May, R.M. Anderson, The evolutionary dynamics of HIV-1 quasispecies and the development of immunodeficiency disease, AIDS 4 (11) (1990) [95] L.M. Wein, S.A. Zenios, M.A. Nowak, Dynamic multidrug therapies for HIV: a control theoretic approach, J. Theor. Biol. 185 (1) (1997) [96] R.M. Ribeiro, S. Bonhoeffer, Production of resistant HIV mutants during antiretroviral therapy, Proc. Natl. Acad. Sci. 97 (14) (2000) [97] L. Rong, M.A. Gilchrist, Z. Feng, A.S. Perelson, Modeling within-host HIV-1 dynamics and the evolution of drug resistance: trade-offs between viral enzyme function and drug susceptibility, J. Theor. Biol. 247 (4) (août 2007) [98] J. Durant, P. Clevenbergh, P. Halfon, P. Delgiudice, S. Porsin, P. Simonet, N. Montagne, C. Boucher, J. Schapiro, P. Dellamonica, Drug-resistance genotyping in HIV-1 therapy: the VIRAD APT randomi sed controlled trial, Lancet 353 (9171) (juin 1999) [99] E. Domingo, J.J. Holland, RNA virus mutations and fitness for survival, Annu. Rev. Microbiol. 51 (1) (1997) [100] D. Turner, B. Brenner, M.A. Wainberg, Multiple effects of the M184V resistance mutation in the reverse transcriptase of human immunodeficiency virus type 1, Clin. Diagn. Lab. Immunol. 10 (6) (nov 2003) [101] H. Wu, Y. Huang, C. Dykes, D. Liu, J. Ma, A.S. Perelson, L.M. Demeter, Modeling and estimation of replication fitness of human immunodeficiency virus type 1 in vitro experiments by using a growth competition assay, J. Virol. 80 (5) (2006) [102] H. Miao, C. Dykes, L.M. Demeter, H. Wu, Differential equation modeling of HIV viral fitness experiments: model identification, model selection, and multimodel inference, Biometrics 65 (1) (2009) [103] S. Mallal, E. Phillips, G. Carosi, J.-M. Molina, C. Workman, J. Tomažič, E. Jägel-Guedes, S. Rugina, O. Kozyrev, J.F. Cid, P. Hay, D. Nolan, S. Hughes, A. Hughes, S. Ryan, N. Fitch, D. Thorborn, A. Benbow, HLA-B*5701 screening for hypersensitivity to abacavir, N. Engl. J. Med. 358 (6) (2008) [104] R.M. Savic, A. Barrail-Tran, X. Duval, G. Nembot, X. Panhard, D. Descamps, C. Verstuyft, B. Vrijens, A.M. Taburet, C. Goujard, Effect of adherence as measured by MEMS, ritonavir boosting, and CYP3A5 genotype on atazanavir pharmacokinetics in treatment-naive HIV-infected patients, Clin. Pharmacol. Ther. 92 (5) (2012) [105] A. Telenti, U.M. Zanger, Pharmacogenetics of anti-hiv drugs, Annu. Rev. Pharmacol. Toxicol. 48 (1) (2008) [106] V. Michaud, T. Bar-Magen, J. Turgeon, D. Flockhart, Z. Desta, M.A. Wainberg, The dual role of pharmacogenetics in HIV treatment: mutations and polymorphisms regulating antiretroviral drug resistance and disposition, Pharmacol. Rev. 64 (3) (juill 2012) [107] J. Bertrand, J.M. Treluyer, X. Panhard, A. Tran, S. Auleley, E. Rey, D. Salmon-Céron, X. Duval, F. Mentré, Influence of pharmacogenetics on indinavir disposition and short-term response in HIV patients initiating HAART, Eur. J. Clin. Pharmacol. 65 (7) (2009) [108] J. Bertrand, M. Chou, D.M. Richardson, C. Verstuyft, P.D. Leger, F. Mentré, A.M. Taburet, D.W. Haas, Multiple genetic variants predict steady-state nevirapine clearance in HIV-infected Cambodians, Pharmacogenet. Genomics 22 (12) (2012) [109] M. Hecker, S. Lambeck, S. Toepfer, E. van Someren, R. Guthke, Gene regulatory network inference: data integration in dynamic models A, Biosystems 96 (2009) [110] T. Lu, H. Liang, H. Li, H. Wu, High-dimensional ODEs coupled with mixed-effects modeling techniques for dynamic gene regulatory network identification, J. Am. Stat. Assoc. 106 (496) (2011) [111] M. Egger, M. May, G. Chêne, A.N. Phillips, B. Ledergerber, F. Dabis, D. Costagliola, A.D.A. Monforte, F. de Wolf, P. Reiss, et al., Prognosis of HIV-1-infected patients starting highly active antiretroviral therapy: a collaborative analysis of prospective studies*, Lancet 360 (9327) (2002) [112] R. Thiébaut, G. Chêne, H. Jacqmin-Gadda, P. Morlat, P. Mercié, M. Dupon, D. Neau, H. Ramaroson, F. Dabis, R. Salamon, Time-updated CD4+ T lymphocyte count and HIV RNA as major markers of disease progression in naive HIV-1-infected patients treated with a highly active antiretroviral therapy: the Aquitaine cohort, , JAIDS 33 (3) (2003) [113] M.D. Hughes, M.J. Daniels, M.A. Fischl, S. Kim, R.T. Schooley, CD4 cell count as a surrogate endpoint in HIV clinical trials: a meta-analysis of studies of the AIDS Clinical Trials Group, AIDS 12 (14) (1998) [114] HIV Surrogate Marker Collaborative Group, Human immunodeficiency virus type 1 RNA level and CD4 count as prognostic markers and surrogate end points: a meta-analysis, AIDS Res. Hum. Retrovir. 16 (12) (2000) [115] C. Lewden, T. May, E. Rosenthal, C. Burty, F. Bonnet, D. Costagliola, E. Jougla, C. S le, P. Morlat, D. Salmon, Changes in causes of death among adults infected by HIV between 2000 and 2005: the Mortalite 2000 and 2005 surveys (ANRS EN19 and Mortavic), JAIDS 48 (5) (2008) [116] D. Abrams, Y. Lévy, M.H. Losso, A. Babiker, G. Collins, D. Cooper, J. Darbyshire, S. Emery, L. Fox, F. Gordin, Interleukin-2 therapy in patients with HIV infection, N. Engl. J. Med. 361 (16) (2009) [117] V. De Gruttola, X.M. Tu, Modelling progression of CD4-lymphocyte count and its relationship to survival time, Biometrics (1994) [118] A.A. Tsiatis, M. Davidian, Joint modeling of longitudinal and time-to-event data: an overview, Stat. Sin. 14 (3) (2004) [119] X. Song, M. Davidian, A.A. Tsiatis, A semiparametric likelihood approach to joint modeling of longitudinal and time-to-event data, Biometrics 58 (4) (2004) [120] N. Pantazis, G. Touloumi, A.S. Walker, A.G. Babiker, Bivariate modelling of longitudinal measurements of two human immunodeficiency type 1 disease progression markers in the presence of informative drop-outs, J. R. Stat. Soc.: Ser. C: (Appl. Stat.) 54 (2) (2005) [121] L. Wu, X.J. Hu, H. Wu, Joint inference for nonlinear mixed-effects models and time to event at the presence of missing data, Biostatistics 9 (2) (2008) [122] J. Guedj, R. Thiébaut, D. Commenges, Joint modeling of the clinical progression and of the biomarkers' dynamics using a mechanistic model, Biometrics 67 (1) (2011) [123] R.C. Kaplan, P.C. Tien, J. Lazar, R. Zangerle, M. Sarcletti, T.M. Pollack, D.M. Rind, C. Sabin, N. Friis-Møller, J.D. Lundgren, Antiretroviral drugs and the risk of myocardial infarction, N. Engl. J. Med. 357 (7) (2007) [124] J.H. Stein, Cardiovascular risks of antiretroviral therapy, N. Engl. J. Med. 356 (17) (2007) [125] S.A. Murphy, K.G. Lynch, D. Oslin, J.R. McKay, T. TenHave, Developing adaptive treatment strategies in substance abuse research, Drug Alcohol Depend. 88 (2007) S24 S30. [126] E.S. Rosenberg, M. Davidian, H.T. Banks, Using mathematical modeling and control to develop structured treatment interruption strategies for HIV infection, Drug Alcohol Depend. 88 (2007) S41 S51. [127] Y. Lévy, C. Durier, A.S. Lascaux, V. Meiffrédy, H. Gahéry-Ségard, C. Goujard, C. Rouzioux, M. Resch, J.G. Guillet, M. Kazatchkine, Sustained control of viremia following therapeutic immunization in chronically HIV-1-infected individuals, AIDS 20 (3) (2006) [128] Y. Lévy, R. Thiébaut, M.L. Gougeon, J.M. Molina, L. Weiss, P.M. Girard, A. Venet, P. Morlat, B. Poirier, A.S. Lascaux, Effect of intermittent interleukin-2 therapy on CD4+ T-cell counts following antiretroviral cessation in patients with HIV, AIDS 26 (6) (2012) 711. [129] W.M. El-Sadr, J.D. Lundgren, J.D. Neaton, F. Gordin, D. Abrams, R.C. Arduino, A. Babiker, W. Burman, N. Clumeck, C.J. Cohen, CD4+ count-guided interruption of antiretroviral treatment, N. Engl. J. Med. 355 (22) (2006) [130] D. Kirschner, S. Lenhart, S. Serbin, Optimal control of the chemotherapy of HIV, J. Math. Biol. 35 (7) (1997) [131] D.J. Austin, N.J. White, R.M. Anderson, The dynamics of drug action on the within-host population growth of infectious agents: melding pharmacokinetics with pathogen population dynamics, J. Theor. Biol. 194 (3) (oct. 1998) [132] M.J. Van Der Laan, M.L. Petersen, Causal effect models for realistic individualized treatment and intention to treat rules, Int. J. Biostat. 3 (1) (2007) 1 53.

158 M. Prague et al. / Advanced Drug Delivery Reviews 65 (2013) [133] X. Duval, F. Mentré, E. Rey, S. Auleley, G. Peytavin, M. Biour, A. Métro, C. Goujard, A.-M. Taburet, C. Lascoux, X. Panhard, J.-M. Tréluyer, D. Salmon-Céron, Benefitof therapeutic drug monitoring of protease inhibitors in HIV-infected patients depends on PI used in HAART regimen ANRS 111 trial, Fundam. Clin. Pharmacol. 23 (4) (août 2009) [134] D.J. Back, S.H. Khoo, S.E. Gibbons, C. Merry, The role of therapeutic drug monitoring in treatment of HIV infection, Br. J. Clin. Pharmacol. 51 (4) (avr. 2001) [135] S.H. Khoo, J. Lloyd, M. Dalton, A. Bonington, E. Hart, S. Gibbons, P. Flegg, J. Sweeney, E.G.L. Wilkins, D.J. Back, Pharmacologic optimization of protease inhibitors and nonnucleoside reverse transcriptase inhibitors (POPIN) a randomized controlled trial of therapeutic drug monitoring and adherence support, J. Acquir. Immune Defic. Syndr. 41 (4) (avr. 2006) [136] J.D. Baxter, D.L. Mayers, D.N. Wentworth, J.D. Neaton, M.L. Hoover, M.A. Winters, S.B. Mannheimer, M.A. Thompson, D.I. Abrams, B.J. Brizz, A randomized study of antiretroviral management based on plasma genotypic antiretroviral resistance testing in patients failing therapy, AIDS 14 (9) (2000) F83 F93. [137] C.J. Cohen, S. Hunt, M. Sension, C. Farthing, M. Conant, S. Jacobson, J. Nadler, W. Verbiest, K. Hertogs, M. Ames, A randomized trial assessing the impact of phenotypic resistance testing on antiretroviral therapy, AIDS 16 (4) (2002) [138] J.L. Meynard, M. Vray, L. Morand-Joubert, E. Race, D. Descamps, G. Peytavin, S.Matheron,C.Lamotte,S.Guiramand,D.Costagliola,Phenotypicorgenotypic resistance testing for choosing antiretroviral therapy after treatment failure: a randomized trial, AIDS 16 (5) (2002) [139] S.A. Murphy, An experimental design for the development of adaptive treatment strategies, Stat. Med. 24 (10) (2005) [140] B.M. Best, M. Goicoechea, M.D. Witt, L. Miller, E.S. Daar, C. Diamond, J.G. Tilles, C.A. Kemper, R. Larsen, D.T. Holland, S. Sun, S. Jain, G. Wagner, E.V. Capparelli, J.A. McCutchan, R.H. Haubrich, A randomized controlled trial of therapeutic drug monitoring in treatment-naive and -experienced HIV-1-infected patients, JAIDS 46 (4) (déc. 2007) [141] Y. Lévy, I. Sereti, G. Tambussi, J.P. Routy, J.D. Lelièvre, J.F. Delfraissy, J.M. Molina, M. Fischl, C. Goujard, B. Rodriguez, C. Rouzioux, V. Avettand-Fenoël, T. Croughs, S. Beq, M. Morre, J.F. Poulin, R.P. Sekaly, R. Thiebaut, M.M. Lederman, Effects of recombinant human interleukin 7 on T-cell recovery and thymic output in HIV-infected patients receiving antiretroviral therapy: results of a phase I/IIa randomized, placebo-controlled, multicenter study, Clin. Infect. Dis. 55 (2) (juill. 2012)

159 7.2 : De l in vitro à l in vivo De l in vitro à l in vivo Dans les modèles prenant en compte la pharmacologie et la génomique, il y a un grand nombre de paramètres. À cause de problèmes d identifiabilité, tous les paramètres ne peuvent pas être estimés directement. C est pourquoi, dans ce chapitre, nous développons une approche pour inclure des données issues d essais in vitro et des données issues de combinaisons de plusieurs essais in vivo L information in vitro Dans le domaine du VIH, pour mesurer les capacités antirétrovirales d un traitement, les expérimentations in vitro sont réalisées en mesurant le nombre de nouvelles infections en présence du traitement à différents niveaux de concentration. Les technologies d essais in vitro ont évolué permettant des quantifications de plus en plus précises. Initialement, il existait des kits d essai multi étapes (multiround assays en anglais) où des cellules cibles humaines étaient mise en présence de virus et incubées pendant plusieurs semaines [Japour et al., 1993]. Cependant, les essais in vitro multi-étapes sont difficilement reproductibles [Kellam and Larder, 1994] et sous-estiment potentiellement la capacité antivirale [Ferguson et al., 2001]. Depuis le début des années 2000 sont apparues des alternatives beaucoup plus rapides et permettant d avoir un indicateur de la capacité antivirale instantanée, ce sont les kits d essai une-étape (single round infectivity assays an anglais) [Zhang et al., 2004], voir Figure 7.2 pour une description. Des cellules cibles génétiquement modifiées par la protéine verte fluorescente GFP qui ne fluorescent que si la cellule devient productrice de VIH, sont infectées par spinoculation (inoculation par centrifugeuse). Les cellules pour lesquelles le traitement est actif n expriment pas la GFP et ne sont donc pas détectées par les techniques de quantification par cytométrie de flux. Pour différents niveaux et types de traitements (à l image de ce qui est fait dans les tests phénotypiques voir Section 2.2.1), il est alors possible de quantifier la fraction non affectée par le traitement (f u ) et d obtenir des courbes instantanées d activité antivirale. Une méthode usuelle pour ensuite analyser

160 De l in vitro à l estimation d effets traitement in vivo 160 ces résultats est d utiliser une sigmoïde ce qui amène la capacité antivirale à dépendre de trois facteurs [Chou, 1976] : la dose (D), un coefficient d inhibition à 50% (IC 50 ) et la pente de la courbe dose-réponse (m), aussi appelée coefficient de Hill [Hill et al., 1910]. Figure 7.2 : Essai in vitro une étape (single round infectivity assays) pour la quantification instantanée de capacité antivirale des traitements VIH Des courbes doses-réponses ont été évaluées in vitro pour différents traitements antirétroviraux [Shen et al., 2008] puis étendues pour des cart en prenant en compte des interactions [Jilek et al., 2012]. Pour finir, la question de l impact de mutations spécifiques du VIH sur ces courbes a été quantifié par [Sampah et al., 2011, Rosenbloom et al., 2012]. Ainsi, il existe une base de données in vitro pour la majorité des cart donnés en routine chez les patients infectés par le VIH que nous pouvons exploiter pour augmenter l information contenue dans des jeux de données cliniques De l in vitro à l estimation d effets traitement in vivo La diversité du VIH et des cellules cibles ne peut pas être reproduite dans toute sa complexité dans des conditions d expérience in vitro. De plus, [Orenstein, 2007] a montré qu il existe de nombreuses disparités entre ce qui peut être observé in vitro et in vivo lors de la réplication du VIH. Par exemple, alors que les macrophages sont facilement infectés in vitro, ceci est moins commun in vivo. Quand l intérêt se porte sur l évaluation des

161 De l in vitro à l estimation d effets traitement in vivo 161 effets traitement, la dynamique est encore mal comprise, en particulier, il n existe pas de relation claire entre activité antivirale et efficacité chez le patient [McMahon et al., 2009]. L information in vitro, n est donc pas facile à prendre en compte de manière directe même lorsqu elle est disponible c est pourquoi il est nécessaire d introduire des facteurs de conversion in vitro-in vivo [Huang et al., 2003]. Nous proposons une nouvelle modélisation dynamique afin d être capables de prédire la réaction d un patient à un nouveau traitement. Ce travail fait l objet d un article en cours d écriture et d une collaboration avec l équipe de Robert Siliciano (Department of Medicine, Johns Hopkins University School of Medicine, Howard Hughes Medical Institute, Baltimore, Maryland, USA.), Daniel Rosenbloom (Program for Evolutionary Dynamics, Department of Mathematics, Department of Organismic and Evolutionary Biology, Harvard University, Cambridge, Massachusetts, USA.) et Martin Nowak (Program for Evolutionary Dynamics, Department of Mathematics, Department of Organismic and Evolutionary Biology, Harvard University, Cambridge, Massachusetts, USA.). Nous introduisons ici une note d étape résumant la modélisation, les principaux résultats et les perspectives de travaux futurs. Ce document ne constitue pas un travail soumis mais une présentation prospective des voies de recherche possibles.

162 % [average] 3TC ABC AZT d4t ddi FTC TDF EFV NVP DLV ATV APV DRV IDV LPV NFV SQV TPV T20 RAL IIP [average] IIP [average] Work in progress (not submitted) From in vitro to in vivo quantification of antiretroviral drugs effects based on dynamical models of HIV Prague Mélanie 1,2,3, Commenges Daniel 1,2,3 and Rodolphe Thiébaut 1,2,3, 1Univ. Bordeaux, ISPED, F Bordeaux, France 2 Centre INSERM U897-épidémiologie-Biostatistique, F Bordeaux, France 3 INRIA, SISTM, F Bordeaux, France Abstract. Population dynamics of HIV and CD4+ T cells can be modeled with Ordinary Differential Equations (ODE). We aim at quantifying the in vivo effect of combinations of antiretroviral drugs treatments (carts) by a function of the effects of the antiretroviral drugs in the combination. To estimate the antiretroviral drugs effects we must have a large dataset and it is desirable to add external information to ensure identifiability. An adequate modeling of in vitro assays yields such information. Recent single-round infectivity assays allowed quantifying the dose-response curves in vitro: the instantaneous inhibitory potential (IIP) has been established as a measure of antiretroviral drugs activity. The IIPs of carts can be viewed as a function of antiretroviral drug s IIPs based on known interactions. Bliss independence is a convenient assumption. Random effects account for inter-individual variability of IIPs that may result from host and virus genetics. Finally, more flexibility is provided by estimating an in vitro to in vivo conversion factor. We used a Bayesian approach for estimating the antiretroviral drugs in vivo effects: carts in vivo effects follow by computation. We demonstrate that this model has good fit abilities and that our approach opens the perspective to get a deeper understanding of treatment action regarding adherence and latent reservoirs and to consider treatment choice optimization. This analysis is applied to a dataset of 350 patients taking 7 different antiretroviral drugs (AZT, D4T, ddi, 3TC, LPV, APV, DRV) from two stand-alone clinical trial: ALBI, PUZZLE, and two clinical trials nested in the ANRS CO3 Aquitaine Cohort: ZEPHIR and PREDIZISTA. a NRTI: AZT (600mg), 3TC (300mg), d4t (60mg), ddi (400mg) PI: APV(1400mg), DRV(800mg), SQV(1000mg) d Drugs In vitro IIP (drugs) In vitro IIP (cart) Q T T * Q T T* b V V Drugs In vivo dynamic target cells model c APV EFV RAL 3TC TDF ABC AZT FTC 3TC cart In vitro to In vivo Drug-specific in vitro to in vivo estimated conversion factor Time-dependant Adherence 150% 100% 50% 0% Years Figure 1: Graphical abstract. (a) the 7 drugs studied in the application (b) have intrinsic antiviral activities called IIPs evaluated in vitro. Assuming Bliss independence IIPs of cart can be computed from drugs IIPs by summation. (c) Estimated conversion factor and patients adherence information allow us to use in vitro IIPs in (d) the in vivo target cells model of the dynamics between HIV and the immune system. Page 1 of 10

163 Work in progress (not submitted) Biological Model Mathematical model. We recall the target cells model (see Figure 1.d). This is exactly similar to the activated cells model used in this PhD thesis but was renamed to avoid over interpretation regarding the term activation. dq dt = λ + ρt αq µ Q Q, dt dt = αq γt V ρt µ T T, dt dt = γt V µ T T, dv dt = πt µ V V. In vitro pharmacodynamics. Shen et al. (2008) designed the instantaneous inhibitory potential (IIP) as a measure of antiviral activity. It is the number of logs single-round infection events that are prevented by the treatment. Thus, it is related to the fraction of cells unaffected by an antiretroviral drug X, fu X, also called fraction of infectible cells. Then, IIP depends on the drug intake d X (t), the concentration producing 50% inhibition of viral replication (IC 50X ) and the Hill coefficient (m X ), see Chou (1976) for definitions. IIP X (d X (t)) = log(fu X (t)), ( ( dx (t) = log 1 + IC 50X ) mx ). Jilek et al. (2012) showed that drug-drug interaction in combination of antiretroviral therapies (cart) obeys most of the time Bliss independence (Bliss, 1939). In other words, drugs act through competitive phenomenon on the same receptors, thus, fu cart is the product of the fraction of infectible cells for each antiretroviral in the cart. The in vitro IIP of a cart composed of n cart antiretroviral drugs is : IIP cart (d X1 (t),..., d XncART (t)) = log(fu cart (t)), = log(f X1 = n cart i=1 In vivo pharmacodynamics. We introduce a drug-specific conversion factors (β s) between in vitro and in vivo IIPs. This gives the model more flexibility compared to conversion factors common to all drugs (Wu et al., 2005; Huang et al., 2006) or class-specific (Fang and Jadhav, 2012). If in vitro and in vivo effects are equivalent β = 1.0. The in vivo IIP of a cart composed of n cart antiretroviral drugs is : IIP cart (d X1 (t),..., d XncART (t)) u (t) f Xn cart u (t)), We define the adherence as a time-dependent IIP Xi (d Xi (t)). drug-specific covariate A X (t), which is the percentage of the drug taken by the patient compared to what = n cart i=1 β Xi IIP Xi (d Xi (t)). Dynamical modeling of in vivo effects of cart. NRTI, NNRTI, FI and II directly act on the fraction of infectible T cells: under such antiretroviral drug X, only fu X T cells can be infected. PI acts on the number of T cells producing viruses, thus only fu X V viruses can infect T cells. In both cases the number of infected cells T created in a time dt is γ 0 fu X V T, where γ 0 is the infectivity without treatment. Thus it is equivalent to consider that f u modify the infectivity parameter in a multiplicative way. Figure 2 shows the impact of fu cart on the law mass action of production of T cells depending on V and T. WITHOUT TREATMENT 0 TV T T* V T WITH TREATMENT 0 Unaffected by the cart fraction of cells. f cart TV u V T* Figure 2: Effect of cart on the infectivity parameter. Altogether, we denote γ the log-infectivity under treatment and γ 0 the base log-infectivity without treatment : n cart γ = γ 0 i=1 Evaluation of drug intakes. β Xi IIP Xi (d Xi (t)) was prescribed by the clinician. Thus, drug intake d X (t) at time t can be defined as d X (t) = A X (t)d X, where D X is the standard daily dose given in standard of care routine for a drug X whatever the daily number of intake (see Figure 1 a for details on these values). As instance, if an antiretroviral drug X must be taken twice daily and is forgotten every morning A X (t) = 50%. Page 2 of 10

164 Work in progress (not submitted) Statistical Model Inter-individual variability. We use a mixed effect model, with the structure proposed by Guedj et al. (2007), for the logtransformed ODE parameters. Normally distributed random effects are put on immune system cells input ( λ) and death rate of infected cells ( µ T ), which is consistent with biological mechanisms knowledge (Vieillard et al., 2010; Mogensen et al., 2010). An additional random effect is put on γ to model variability in subjects responses to treatment potentially due to pharmacogenomics (Michaud et al., 2012) or virus mutations (Gardner et al., 2009; Harrigan et al., 2005). This modeling is consistent with in vitro knowledge. Actually, Sampah et al. (2011) showed that for the same concentration of cart, IIPs may change depending on virus mutations; generally wildtype viruses lead to greater IIPs (Rosenbloom et al., 2012). Observational Model. In HIV studies, longitudinal data collected in routine are the total CD4 count in cells/µl and viral load in copies RNA/µL. To model measurement errors, we use transformations to achieve normality and homoscedasticity of noises. We assume that combinations of compartments are observed, to say (Q + T + T ) 0.25 and log 10 (V ). The standard deviation of measurement errors are respectively denoted by σ CD4 and σ V L. Statistical methodology. A total of 22 parameters have to be estimated on clinical data : biological parameters, in vitro to in vivo conversion factors, standards deviation of random effects and measurement errors. We used the NIMROD program for estimation (Normal approximation Inference in Models with Random effects based on Ordinary Differential equations). This is a bayesian approach based on maximization of a penalized likelihood, see (Prague et al., 2013) for details. Descriptive analysis of the dataset : Albi, Puzzle, Zephir and Predizista Study Population. The ALBI, PUZZLE, ZEPHIR and PREDIZISTA studies have been described elsewhere (Molina et al., 1999; Raguin et al., 2004; Pellegrin et al., 2007, 2008). Briefly, we used the pooled data of these 4 clinical trials with an overall study population of 350 patients. Studies sizes, number of available data, lengths of follow-up, antiretroviral drugs repartition and patients characteristics are available in Table 1. We considered eight main antiretroviral drugs given in cart, other peripheral drugs were omitted (less than 5% of the patients). We studied zidovudine (AZT), stavudine (D4T), didonasine (ddi) and lamivudine (3TC) as Reverse Transcriptase Inhibitors (RTIs), and lopinavir (LPV), amprenavir (APV), darunavir (DRV) as Protease Inhibitors (PIs). Ritonavir (RTV) was given as a pharmacokinetic boost but always in the same cart. Thus, to avoid identifiability problems we did not estimate it individual effect. As a consequence, we consider the estimation of boosted DRV/r, APV/r and SQV/r effects. Daily adherence documented by self-reported questionnaires was available for 42.5% of the population (patients from ALBI Study); basically A X (t) can take every value (even more than 100%). For patients in other studies we had information about treatment doses, regimen switches and interruptions reported during visits to clinician; basically A X (t) = 0% or A X (t) = 100%. Statistical analysis. For the Bayesian analysis in NIMROD, we put informative priors on biological parameters, see Prague et al. (2012) for a description of the choice of these priors. We put weakly informative priors for the conversion factor, to say wide normal laws with mean 1. We took non-informative uniforme priors for variance parameters. Priors and posteriors are presented Table 2. Biological parameters estimates are consistent with the literature. Measurement errors have the expected magnitude, however it remains high for σ CD4. Altogether, data adjustment quality is acceptable, see fits examples (Figure 3, Figure 4 and Figure 5) and visual checks (Figure 6). Conversion factors analysis. A Wald significance test found that, as expected, conversion factors were positive (to say, the treatment decrease the infectivity γ). This is significant except for 3TC (p-value=40.8%). We have a high variability of β s values between drugs and drug classes (NRTI and PI). Moreover, the conversion factors β s are significantly different from one. Thus conversion between doses used in vitro and in vivo is not straightforward. For instance, the in vivo effect of ddi is significantly higher than it in vitro effect. This may suggest that the dose used in vitro were too low compared to standard in vivo dose. The reverse reasoning applies for DRV/r. Page 3 of 10

165 Work in progress (not submitted) Table 1: Studies and patients characteristics. 350 patients from ALBI, PUZZLE, ZEPHIR and PREDIZISTA studies. ALBI PUZZLE ZEPHIR PREDIZISTA ALL Studies characteristics Number of patients Average Duration (weeks) Drugs characteristics Use of AZT (%) Use of 3TC (%) Use of d4t (%) Use of ddi (%) Use of LPV (%) Use of APV (%) Use of DRV (%) Patients characteristics Age (year) Median follow-up (days) log10 HIV-RNA baseline (copies/ml) log10 HIV-RNA 4 months (copies/ml) CD4 count baseline (cells/ml) CD4 count 4 months (cells/ml) Table 2: Priors and posteriors for the target cells model parameters. Estimation from ALBI, PUZZLE, ZEPHIR and PREDIZISTA datasets Priors Posteriors Priors Posteriors log-parameters Mean s.d. Mean s.d. log-parameters Mean s.d. Mean s.d. Biological Parameters Conversion factors λ β AZT µ T β 3T C γ β d4t α β ddi ρ β LP V µ T β AP V µ Q β DRV π µ V Standard deviations of random effects Standard deviations of measurement error σ λ σ CV σ µt σ CD σ γ Figure 3: Biomarkers adjustment according to adherence for patient 39 in ALBI. Observations (triangle), fits (plain), 95% predictivity intervals (dashed) Page 4 of 10

166 Difference between Predicted and observed values of CD4 count Predicted values of Viral load Work in progress (not submitted) Figure 4: Biomarkers adjustment according to adherence for patient 230 in PUZZLE. Observations (triangle), fits (plain), 95% predictivity intervals (dashed) Figure 5: Biomarkers adjustment according to adherence for patient 348 in PREDIZISTA. Observations (uncensored triangle, censored round), fits (plain), 95% predictivity intervals (dashed) Figure 6: Visual diagnostic plot for data fits of viral load (a,c) and CD4 count (b,d). In scatter plot (a,b), model trajectories values are plotted against observed values. Lines represent the first bisector and acceptable error regarding estimated measurement error for each biomarker. For viral load, shaded square highlight points that are not misclassified since true viral load is unknown because of detection limit complication in data. In (c,d) Differences between model trajectories and observation are plotted against time together with acceptable deviance threshold of 95% confidence interval regarding measurement error. a b c Observed values of Viral load d Time (days) Page 5 of 10

167 Work in progress (not submitted) In vivo quantification and forecast of treatment effects Antiretroviral drugs in vivo effect. It is interesting to look at the in vivo effect of each antiretroviral (β X IIP X ), presented in Figure 7a. Mean value and 95% credible intervals can be directly found by computation from estimates in Table 2. DRV/r is the most effective (both in vitro and in vivo). It effect in mono-therapy is comparable with the in vivo effects of some weak cart (let say AZT+3TC Figure 7b), which is in accordance with previous studies (Katlama et al., 2010; Phung and Yeni, 2011). Moreover, we observe that drugs may be ranked. Whereas the in vitro ranking is DRV > LPV > APV > 3TC > ddi > AZT > d4t, the in vitro ranking is DRV > AZT > d4t > LPV > APV > ddi > 3TC. RTIs could be missclassified due to phosphorylation that makes dose-response curves difficult to evaluate. of antiretroviral drugs. Finally, if forecasts are possible we could consider the possibility of optimizing the treatment change as suggested by Figure 8. Based on individual observations of the patient, we could forecast the responses to various carts and take the best cart according to criteria such as to have the highest probability of infection control. We currently build collaborations to gather more data with a wider variety of antiretroviral drugs and carts. Figure 7: In vivo estimated treatment effects for antiretroviral drugs and selected cart for standard daily doses. (a) β Xi IIP Xi (b) ncart i=1 β Xi IIP Xi. The cart in vivo effect. As an illustration, we selected four commonly used cart (AZT+3TC, d4t+ddi, DRV+ddI and AZT+3TC+APV) and computed their effects in vivo ( n cart i=1 β Xi IIP Xi ) which are displayed on Figure 7b. 95% credible intervals are not significantly different. However, AZT+3TC+APV and DRV+ddI seem to have a greater effect than old fashion NRTI bitherapies. This guess is consistent with knowledge on the benefit to add a PI in cart (Deeks et al., 1997). Moreover, this ranking in these carts is consistent with the average observed viral load and CD4 count for patients. Regimens AZT+3TC+APV and DRV+ddI lead to a greater decrease of the viral load (about 2 log10 in 6 months) and increase of CD4 count (about 100 cells in 6 months) compared to AZT+3TC and d4t+ddi. Limitation and perspectives. These preliminary results are obtained from samples with moderate size regarding the quantification of treatment effects: most of carts are given in less than 20 patients, some are only given in less than 5 patients. Moreover, results are mainly driven by ALBI sub study (60% of our dataset). Then, concerning the validation of our model, it would be interesting to estimate in vivo effects of drugs on a learning dataset and test it on a validation dataset. Although cross-validation remains a solution to assess the forecast quality, we expect to do the same analysis on a larger dataset. Moreover, we aim at estimating the in vivo effect of a larger number Figure 8: Forecasts of various carts responses. Patient 50 from ALBI Study. Page 6 of 10

168 Work in progress (not submitted) Figure 9: Probability of virologic (a) and immunologic (b) failure as a function of adherence levels. Observed proportions of failures in the studied population are indicated for comparison purpose. Dynamical models are valuable to investigate the matter of adherence Simulation of adherence in dynamical models. Adherence is very difficult to assess accurately but is a main issue in HIV (Paterson et al., 2002). In our model we can account for adherence through A X (t). Thus, at each time t, we may simulate a stochastic term A X (t) which equal 100% with the probability p and 0% with the probability (1 p). This is the adherence pattern of a patient who is randomly adherence 100p% of the time. Then, parametric empirical bayes predictions (Kass and Steffey, 1989) are used to forecast how patients would have responded to cart according to their simulated adherence pattern. Random adherence and treatment failures We tried to investigate the effect of 100p% random adherence on virologic and immunologic failure after 100 days. Actually this length of study should let the time to the mechanistic model to reach equilibrium state. Impact of adherence seems to be more perceptible on viral load than on CD4 count (Figure 9a). We found that there is a treshold at 80% for adherence below which there is a high probability of treatment failure whatever the real adherence level. Figure 9a shows that the probability of experiencing virologic failure is greater than 90% for all adherence level lower than 70%. For a full adherence 50 copies undetectability (resp. 500 copies) is reached 35% (resp. 60%) of the time. Thus, our model correctly mimics observed data where only 27% (resp. 61%) of the population reached 50 copies/ml (resp. 500 copies/ml) undetectability after 100 days. Figure 9b shows that an adherence greater than 80% should be sufficient to ensure less than 25% of immunologic failure which is pessimistic compared to observed data where only 15% of the patients have less than 250 CD4 cells/ml after 100 days. Limitation and perspectives. In this investigation, we tried to see if we were able to assess the impact of adherence patterns. This could be extended to the analysis of all adherence patterns including intermittent treatments (x days on, (7 x) days off). However, before answering precisely questions on adherence, estimation must be done on a dataset where adherence is correctly reported. Actually, the major weakness in this analysis is that adherence information is sparse and the number of 100% adherent patients is probably overestimated. During estimation, we think that this poor measurement resulted in an underestimation of drug effectiveness (Ickovics and Meisler, 1997). This may explain why we showed that an adherence of more than 80% is requested which is slightly higher than what is realistic, to say around 60-70% (Arnsten et al., 2001), but not impossible (Paterson et al., 2000). We currently build collaborations to gather studies with good reported adherence data and possibly MEMS (Medication Events Monitoring System) information. Page 7 of 10

169 Work in progress (not submitted) Additional discussions and concerns The issue of mutations. We made the choice to account for mutations by including random effects, especially on γ, so that drugs can have an effect on some patients but be less effective for others. This is justified because drug resistance mutations reduce the virus fitness relatively to wild-type virus. There is no trend in time on biomarkers predictions (Figure 6), thus we can guess that our model remains valid on our data. Probably, there is no major resistance occurrence. However, genotypic susceptibility scores (GSS) were available for all the patients except those from ALBI. We showed that high GSS was correlated with high values of random effects on γ. Thus, we conclude that the use of resistance testing data (genotypic and phenotypic test) could help in accounting for preexisting mutations and probably significantly improve the results. Methodological concerns to build a likelihood and optimization procedure that account for the fact that information is not the same in all dataset is a work in progress. The issue of latent reservoirs. Figure 10: Target cells with latent reservoirs model : we extended the target cells model by adding a latent infected cells (Q ) compartment. now on, two research leads are considered : - to enhance the identifiability by fixing some parameters (for example µ Q = µ Q ), - to find data where viral DNA is measured to have a proxy to measure the number of latent cells (T + Q ). Other pharmacological models. The model we used in this preliminary note sheet is highly parameterized, particularly because of the conversion factors. We currently compare it with a model with a power function to assess and validate the contribution of using in vitro data. Moreover, if data are not rich enough and we plan to estimate the in vivo effects of a greater number of antiretroviral drugs, we may surely encounter identifiability problems. Instead of using IIPs, we will propose to compare our approach with the use of inhibitory factors (IF) that may be computed and consist in time-averaged IIPs over all antiretroviral drugs in the cart. In other words, the pharmacodynamical function will not be drug-specific anymore but cartspecific (Figure 11). Thus, the number of conversion factor to be estimated is reduced. Figure 11: Inhibitory Factors may be computed according to cart administration and adherence information (source : D. Rosenbloom 8th International Conference on HIV treatment and prevention adherence). One of the actual major concern in HIV treatment and cart dynamics is to assess their impact on latent reservoirs. For this purpose, we begin to use the Target cells with latent reservoirs model (Figure 10). First investigations on ALBI data showed that this model improves the log-likelihood (-950 vs -1293) as well as model choice criterion LCV a (6.3 vs 7.9). Thus, it provides a better adjustment to data. Regarding parameters estimates, µ Q µ Q, α α and ρ ρ. This is what was expected and order of magnitudes are similar to those found by Ribeiro et al. (2002). Nevertheless, convergence criteria are difficult to reach because identifiability is weak. From Page 8 of 10

170 Work in progress (not submitted) Acknowledgments The authors would like to thank the investigators of the CO3 ANRS Aquitaine Cohort and the Groupe d Épidémiologie Clinique du Sida en Aquitaine (GECSA), particularly M. Bruyand, G. Chêne and F. Dabis. We also thank the investigators of PUZZLE ANRS 104 trial particularly G. Raguin and the investigators of the ALBI ANRS 070 trial particularly J.M. Molina. Parallel computing was used thanks to the computing facilities MCIA (Mésocentre de Calcul Intensif Aquitain) of the Université de Bordeaux and of the Université de Pau et des Pays de l Adour. References Arnsten, J. H., Demas, P. A., Farzadegan, H., Grant, R. W., Gourevitch, M. N., Chang, C.-J., Buono, D., Eckholdt, H., Howard, A. A., and Schoenbaum, E. E. (2001). Antiretroviral therapy adherence and viral suppression in HIV-infected drug users: comparison of self-report and electronic monitoring. Clinical Infectious Diseases, 33(8): Bliss, C. (1939). The toxicity of poisons jointly applied. Annals of applied biology, 26(3): Chou, T.-C. (1976). Derivation and properties of michaelis-menten type and hill type equations for reference ligands. Journal of theoretical biology, 59(2): Deeks, S. G., Smith, M., Holodniy, M., and Kahn, J. O. (1997). HIV-1 protease inhibitors. JAMA: the journal of the American Medical Association, 277(2): Fang, J. and Jadhav, P. R. (2012). From in vitro EC50 to in vivo dose response for antiretrovirals using an HIV disease model. part i: A framework. Journal of pharmacokinetics and pharmacodynamics, 39(4): Gardner, E. M., Burman, W. J., Steiner, J. F., Anderson, P. L., and Bangsberg, D. R. (2009). Antiretroviral medication adherence and the development of class-specific antiretroviral resistance. AIDS, 23(9):1035. Guedj, J., Thiébaut, R., and Commenges, D. (2007). Maximum likelihood estimation in dynamical models of HIV. Biometrics, 63(4): Harrigan, P. R., Hogg, R. S., Dong, W. W., Yip, B., Wynhoven, B., Woodward, J., Brumme, C. J., Brumme, Z. L., Mo, T., Alexander, C. S., et al. (2005). Predictors of HIV drug-resistance mutations in a large antiretroviral-naive cohort initiating triple antiretroviral therapy. Journal of Infectious Diseases, 191(3): Huang, Y., Liu, D., and Wu, H. (2006). Hierarchical Bayesian methods for estimation of parameters in a longitudinal HIV dynamic system. Biometrics, 62(2): Ickovics, J. R. and Meisler, A. W. (1997). Adherence in AIDS clinical trials: a framework for clinical research and clinical care. Journal of clinical epidemiology, 50(4): Jilek, B., Zarr, M., Sampah, M., Rabi, S., Bullen, C., Lai, J., Shen, L., and Siliciano, R. (2012). A quantitative basis for antiretroviral therapy for HIV-1 infection. Nature Medicine. Kass, R. and Steffey, D. (1989). Approximate bayesian inference in conditionally independent hierarchical models (parametric empirical bayes models). Journal of the American Statistical Association, 87(407): Katlama, C., Valantin, M. A., Algarte-Genin, M., Duvivier, C., Lambert-Niclot, S., Girard, P. M., Molina, J. M., Hoen, B., Pakianather, S., Peytavin, G., et al. (2010). Efficacy of darunavir/ritonavir maintenance monotherapy in patients with HIV-1 viral suppression: a randomized open-label, noninferiority trial, monoi-anrs 136. AIDS, 24(15): Michaud, V., Bar-Magen, T., Turgeon, J., Flockhart, D., Desta, Z., and Wainberg, M. A. (2012). The dual role of pharmacogenetics in HIV treatment: mutations and polymorphisms regulating antiretroviral drug resistance and disposition. Pharmacological Reviews, 64(3): Mogensen, T. H., Melchjorsen, J., Larsen, C. S., and Paludan, S. R. (2010). Review innate immune recognition and activation during hiv infection. Retrovirology, pages Molina, J., Chêne, G., Ferchal, F., Journot, V., Pellegrin, I., Sombardier, M., Rancinan, C., Cotte, L., Madelaine, I., Debord, T., and Decazes, J. (1999). The ALBI trial: a randomized controlled trial comparing stavudine plus didanosine with zidovudine plus lamivudine and a regimen alternating both combinations in previously untreated patients infected with human immunodeficiency virus. The Journal of infectious diseases, 180(2): Page 9 of 10

171 Work in progress (not submitted) Paterson, D. L., Potoski, B., and Capitano, B. (2002). Measurement of adherence to antiretroviral medications. JAIDS Journal of Acquired Immune Deficiency Syndromes, 31:S103 S106. Paterson, D. L., Swindells, S., Mohr, J., Brester, M., Vergis, E. N., Squier, C., Wagener, M. M., and Singh, N. (2000). Adherence to protease inhibitor therapy and outcomes in patients with HIV infection. Annals of internal medicine, 133(1): Pellegrin, I., Breilh, D., Coureau, G., Boucher, S., Neau, D., Merel, P., Lacoste, D., Fleury, H., Saux, M.-C., Pellegrin, J.-L., et al. (2007). Interpretation of genotype and pharmacokinetics for resistance to fosamprenavir-ritonavir-based regimens in antiretroviral-experienced patients. Antimicrobial agents and chemotherapy, 51(4): Pellegrin, I., Wittkop, L., Joubert, L. M., Neau, D., Bollens, D., Bonarek, M., Girard, P.-M., Fleury, H., Winters, B., Saux, M.-C., et al. (2008). Virological response to darunavir/ritonavir-based regimens in antiretroviral-experienced patients (predizista study). Antiviral therapy, 13(2):271. Phung, B.-C. and Yeni, P. (2011). Darunavir: an effective protease inhibitor for HIV-infected patients. Expert Review of Anti-infective Therapy, 9(6): Prague, M., Commenges, D., Drylewicz, J., and Thiébaut, R. (2012). Treatment monitoring of HIV infected patients based on mechanistic models. Biometrics, 68(3): Prague, M., Commenges, D., Guedj, J., Drylewicz, J., and Thiébaut, R. (2013). Nimrod: A program for inference via a normal approximation of the posterior in models with random effects based on ordinary differential equations. Computer methods and programs in biomedicine, 111(2): Raguin, G., Chêne, G., Morand-Joubert, L., Taburet, A., Droz, C., Le Tiec, C., Clavel, F., Girard, P., Group, P.. S., et al. (2004). Salvage therapy with amprenavir, lopinavir and ritonavir 200 mg/d or 400 mg/d in HIV-infected patients in virological failure. Antiviral therapy, 9: Ribeiro, R., Mohri, H., Ho, D., and Perelson, A. (2002). In vivo dynamics of t cell activation, proliferation, and death in HIV-1 infection: Why are cd4+ but not cd8+ t cells depleted? Proceedings of the National Academy of Sciences of the United States of America, 99(24): Rosenbloom, D. I., Hill, A. L., Rabi, S. A., Siliciano, R. F., and Nowak, M. A. (2012). Antiretroviral dynamics determines HIV evolution and predicts therapy outcome. Nature medicine, 18(9): Sampah, M. E. S., Shen, L., Jilek, B. L., and Siliciano, R. F. (2011). Dose response curve slope is a missing dimension in the analysis of hiv-1 drug resistance. Proceedings of the National Academy of Sciences, 108(18): Shen, L., Peterson, S., Sedaghat, A., McMahon, M., Callender, M., Zhang, H., Zhou, Y., Pitt, E., Anderson, K., Acosta, E., et al. (2008). Dose-response curve slope sets class-specific limits on inhibitory potential of anti-hiv drugs. Nature medicine, 14(7): Vieillard, V., Fausther-Bovendo, H., Samri, A., Debré, P., et al. (2010). Specific phenotypic and functional features of natural killer cells from hivinfected long-term nonprogressors and hiv controllers. JAIDS Journal of Acquired Immune Deficiency Syndromes, 53(5): Wu, H., Huang, Y., Acosta, E. P., Rosenkranz, S. L., Kuritzkes, D. R., Eron, J. J., Perelson, A. S., and Gerber, J. G. (2005). Modeling long-term HIV dynamics and antiretroviral response: effects of drug potency, pharmacokinetics, adherence, and drug resistance. JAIDS Journal of Acquired Immune Deficiency Syndromes, 39(3): Page 10 of 10

172

173 Conclusion et perspectives générales Nous avons développé dans cette thèse une méthodologie générale pour la mise au point de stratégies adaptatives de traitement dans le domaine du VIH. Notre objet d intérêt a été les modèles dynamiques qui sont basés sur des NLME-ODE. L une des réalisations de ce travail de thèse a été l élaboration et le perfectionnement d un algorithme et d un programme d estimation des paramètres dans les modèles dynamiques. Les méthodes bayésiennes développées, basées sur une maximisation de la distribution a posteriori des paramètres, ont été validées et comparées avec des algorithmes déjà proposés dans la littérature : elles possèdent des propriétés comparables en terme de biais et de précision des estimateurs mais permettent des calculs plus rapides que des méthodes basées sur des simulations bayésiennes. Par ailleurs, nous avons effectué des travaux sur la comparaison des modèles pour la prise en compte des effets traitement. Nous avons montré la supériorité des modèles dynamiques par rapport aux modèles descriptifs de type structuraux marginaux pour décrire la trajectoire de biomarqueurs lorsque la mise sous traitement dépend de la quantité d intérêt. D un point de vue appliqué, nous nous sommes intéressés à l interaction entre le VIH et le système immunitaire. Pour cela, nous avons analysé les trajectoires des biomarqueurs de routine, la charge virale et le nombre de CD4, des patients infectés par le VIH avant et après mise sous traitement. Nous avons considéré et comparé, sur des jeux de données où les patients et les traitements avaient des caractéristiques variées, les qualités d ajustement et de prédictions de nombreux modèles dynamiques : nous avons sélectionné le modèle à cellules cibles qui prend en compte l activation et l infection des CD4 par le VIH. Nous avons estimé les paramètres sur différentes données d essais cliniques et de cohortes (ALBI, PREDIZISTA,

174 Conclusion et perspectives générales 174 PUZZLE, ZEPHIR, données GECSA...). Cela nous a permis de valider les connaissances qualitatives sur le mécanisme de l interaction entre le VIH et le système immunitaire et d obtenir une quantification des différents taux de création, taux de décès et effets traitement pour les cart. Ainsi, nous avons pu développer des stratégies d optimisation du traitement, par exemple une individualisation de la dose de traitement en fonction des réactions passées du patient aux doses précédentes. Nous avons montré que, sous la condition forte d accroissement de l information sur le patient à chaque visite (malgré notamment la censure à gauche de certains biomarqueurs), il était possible de mettre à jour de manière itérative la dose de traitement jusqu à donner au patient une dose optimale. Cependant, des études de sensibilité ont montré que la mauvaise spécification des modèles et leur extrême simplicité rendent difficile une mise en pratique. Nous avons donc proposé une modélisation plus complexe faisant intervenir des approches de synthèse bayésienne pour combiner différentes données in vivo avec des données in vitro. Cela permet d avoir un modèle plus proche de la réalité mécaniste de l infection tout en assurant l identifiabilité pour envisager la quantification de l effet de chaque antirétroviral. Il existe de nombreuses perspectives de développement dans les modèles NLME-ODE. D un point de vu statistique, les méthodes présentées dans cette thèse ont été validées empiriquement mais certains travaux théoriques pourraient être continués. Nous avons étudié en simulation par MCMC le comportement des distributions a posteriori : pour un nombre de patients n intermédiaire, l hypothèse de normalité semble vérifiée. De plus, pour n très grand, nous avons montré que les propriétés asymptotiques rendent l estimation valide [van der Vaart, 2000]. Cependant, un approfondissement théorique de l approximation normale de la distribution a posteriori permettrait une validation de la méthode. En particulier, il serait intéressant d étudier les vitesses de convergence pour savoir à partir de quelle taille d échantillon (n) et quel nombre de paramètres (n p + n e + n q + K ) estimés simultanément ces approximations restent vraisemblables (voir Section 6.3). Par ailleurs, la complexification des modèles, qui est nécessaire à la meilleure description mécaniste des phénomènes, entraîne des problèmes d identifiabilité. La non-identifiabilité pratique

175 Conclusion et Perspectives Générale 175 pourrait être réglée par l utilisation des techniques biologiques plus puissantes (kit de charge virale avec sensibilité à 1 copie en routine, meilleur dénombrement des cellules immunitaire, réduction des erreurs de mesure...) et par l acquisition de données exhaustives (en terme de nombre de mesures et de nombre de biomarqueurs observés). Si la non-identifiabilité est théorique, le modèle devra être reformulé ou certains paramètres devront être fixés ou avoir une distribution a priori très informative. Dans les deux cas, limiter autant que possible cette problématique passe par l utilisation de toute l information et de toutes les données disponibles dans plusieurs jeux de données ; or, cela alourdit la modélisation et les calculs. Les sources de variabilité seront très importantes et il faudra inclure de nombreux effets aléatoires ce qui pose de nombreux problèmes numériques (voir Section 4.2 et Section 5.2) ; même s il faut toutefois souligner que cette difficulté numérique est partiellement corrigée par la disponibilité de surpercalculateurs. Par ailleurs, si les covariables disponibles pour chaque jeu de données ne sont pas les mêmes, il faudra approfondir la possibilité de faire une synthèse bayésienne de l information pour des modèles avec des données manquantes (voir Section 5.2). D un point de vue biologique, il est intéressant de regarder la cohérence des estimateurs avec les connaissances immunologiques et virologiques de l infection. Cette comparaison est à mettre en perspective avec une analyse de sensibilité et de robustesse des estimations (voir en Annexes B). Nous mettons en valeur que plus le modèle est complexe, moins la précision est grande sur la valeur des estimateurs. Bien que ces valeurs seront d autant plus précises que le modèle représente bien la réalité, nous pensons que l apport des modèles dynamiques repose en particulier sur leurs capacités de prédiction (voir Section ). L approche par estimateur empirique de Bayes est celle que nous avons favorisée, d autres méthodes de prédiction bayésienne, comme celles basées sur l échantillonnage de la distribution a posteriori, pourraient être comparées. Par ailleurs, les combinaisons antirétrovirales sont de plus en plus efficaces, cependant il serait important de dissocier l effet de chaque molécule antirétrovirale afin de pouvoir prédire l effet de nouvelles combinaisons (voir Section 7.2.2). Ceci permettrait d éviter de monter des essais cliniques comparant

176 Conclusion et perspectives générales 176 de nouvelles stratégies dont nous pouvons prédire avec ces modélisations qu elles seront inférieures aux stratégies standards. Par exemple, dans l essai clinique ALBI, s il avait existé des études sur les effets traitements des antirétroviraux AZT, 3TC, d4t et ddi (comme nous l avons fait Section 6.2.3), il aurait pu être prédit que le bras switch était sous-optimal. Par ailleurs, si nos travaux permettent de mettre à jour une relation claire entre les effets in vitro et in vivo des antirétroviraux, une étude par modèles dynamiques pourrait être envisagée pour préalablement confirmer la supériorité d une nouvelle molécule. Certaines question médicales actuelles pourraient aussi être abordées. Par exemple, les nouveaux traitements permettraient une cure fonctionnelle où seules certaines cellules infectées restent cachées dans les réservoirs latents : modéliser ce phénomène reste une piste à exploiter (voir Section 7.2.2). Cependant, le modélisateur devra garder à l esprit que la modélisation de nouveaux traitements et de nouveaux mécanismes peut amener à la nécessité d un révision globale de la modélisation, voire sortir du contexte NLME- ODE de cette thèse. Par exemple, cela a été le cas pour l hépatite virale (HCV) où la considération de de nouvelles thérapies (comme le daclatasvir) contraint à utiliser des modèles dynamiques multi-échelles NLME-PDE. Finalement, un phénomène peu modélisé dans ces travaux, mais d intérêt majeur dans le domaine du VIH est l apparition de mutations de résistance. Ce dernier aspect est la piste privilégiée à exploiter pour enrichir les modèles mécanistes. En conclusion, ces travaux peuvent être poursuivis dans le but de trouver un modèle dynamique où tous les paramètres peuvent être estimés individuellement afin de guider une stratégie thérapeutique globale prenant en compte la diversité des patients, des virus, des traitements et de leurs interactions. Par ailleurs, ce travail a aussi été l opportunité d améliorer la technique d estimations et de prédictions dans les modèles NLME-ODE qui pourrait maintenant être utilisée dans un tout autre contexte que l optimisation des traitements dans l infection à VIH.

177 Bibliographie [Acosta et al., 2000] Acosta, E. P., Kakuda, T. N., Brundage, R. C., Anderson, P. L., and Fletcher, C. V. (2000). Pharmacodynamics of human immunodeficiency virus type 1 protease inhibitors. Clinical infectious diseases, 30(Supplement 2) :S151 S159. [Adams et al., 2005] Adams, B., Banks, H., Davidian, M., Kwon, H.-D., Tran, H., Wynne, S., and Rosenberg, E. (2005). HIV dynamics : modeling, data analysis, and optimal treatment protocols. Journal of Computational and Applied Mathematics, 184(1) : [Adams et al., 2004] Adams, B., Banks, H., Kwon, H.-D., and Tran, H. T. (2004). Dynamic multidrug therapies for HIV : Optimal and sti control approaches. Mathematical Biosciences and Engineering, 1(2) : [Ades and Sutton, 2006] Ades, A. and Sutton, A. (2006). Multiparameter evidence synthesis in epidemiology and medical decision-making : current approaches. Journal of the Royal Statistical Society : Series A (Statistics in Society), 169(1) :5 35. [Agur et al., 1988] Agur, Z., Arnon, R., and Schechter, B. (1988). Reduction of cytotoxicity to normal tissues by new regimens of cell-cycle phase-specific drugs. Mathematical Biosciences, 92(1) :1 15. [Akaike, 1998] Akaike, H. (1998). Information theory and an extension of the maximum likelihood principle. In Selected Papers of Hirotugu Akaike, pages Springer. [Ananworanich et al., 2003] Ananworanich, J., Nuesch, R., Le Braz, M., Chetchotisakd, P., Vibhagool, A., Wicharuk, S., Ruxrungtham, K., Furrer, H., Cooper, D., and Hirschel, B. (2003). Failures of 1 week on, 1 week off antiretroviral therapies in a randomized trial. AIDS, 17(15) : [ANRS-AC11-database, 2013] ANRS-AC11-database (2013). HIV french resistance anrs group : HIV-1 genotypic drug resistance interpretation s page http ://www.hivfrenchresistance.org/. [Arias, 2011] Arias, J. (2011). Drug targeting strategies in cancer treatment : an overview. Mini Reviews in Medicinal Chemistry, 11(1) :1 17. [Arnsten et al., 2001] Arnsten, J. H., Demas, P. A., Farzadegan, H., Grant, R. W., Gourevitch, M. N., Chang, C.-J., Buono, D., Eckholdt, H., Howard, A. A., and Schoenbaum, E. E. (2001). Antiretroviral therapy adherence and viral suppression in HIV-infected drug users : comparison of self-report and electronic monitoring. Clinical Infectious Diseases, 33(8) : [Arribas et al., 2010] Arribas, J. R., Horban, A., Gerstoft, J., Fätkenheuer, G., Nelson, M., Clumeck, N., Pulido, F., Hill, A., van Delft, Y., Stark, T., et al. (2010). The monet trial : darunavir/ritonavir with or without nucleoside analogues, for patients with HIV RNA below 50 copies/ml. AIDS, 24(2) :

178 Bibliographie 178 [Averbuch et al., 1990] Averbuch, M., Weintraub, M., and Pollock, D. (1990). Compliance assessment in clinical trials : the MEMS device. Journal of clinical research and pharmacoepidemiology, 4(3) : [Backes and Schentag, 1991] Backes, J. and Schentag, J. (1991). Partial compliance as a source of variance in pharmacokinetics and therapeutic drug monitoring. Patient compliance in medical practice and clinical trials, pages [Bains et al., 2009] Bains, I., Thiébaut, R., Yates, A. J., and Callard, R. (2009). Quantifying thymic export : combining models of naive t cell proliferation and tcr excision circle dynamics gives an explicit measure of thymic output. The Journal of Immunology, 183(7) : [Bajaria et al., 2004] Bajaria, S. H., Webb, G., and Kirschner, D. E. (2004). Predicting differential responses to structured treatment interruptions during haart. Bulletin of Mathematical Biology, 66(5) : [Bangsberg et al., 2003] Bangsberg, D. R., Charlebois, E. D., Grant, R. M., Holodniy, M., Deeks, S. G., Perry, S., Conroy, K. N., Clark, R., Guzman, D., Zolopa, A., et al. (2003). High levels of adherence do not prevent accumulation of HIV drug resistance mutations. AIDS, 17(13) : [Banks et al., 2003] Banks, H., Bortz, D., and Holte, S. (2003). Incorporation of variability into the modeling of viral delays in HIV infection dynamics. Mathematical biosciences, 183(1) : [Barré-Sinoussi et al., 1983] Barré-Sinoussi, F., Chermann, J.-C., Rey, F., Nugeyre, M. T., Chamaret, S., Gruest, J., Dauguet, C., Axler-Blin, C., Vézinet-Brun, F., Rouzioux, C., et al. (1983). Isolation of a t-lymphotropic retrovirus from a patient at risk for acquired immune deficiency syndrome (AIDS). Science, 220(4599) : [Bartlett et al., 2001] Bartlett, J. A., DeMasi, R., Quinn, J., Moxham, C., and Rousseau, F. (2001). Overview of the effectiveness of triple combination therapy in antiretroviralnaive HIV-1 infected adults. AIDS, 15(11) : [Bazzoli et al., 2010] Bazzoli, C., Jullien, V., Le Tiec, C., Rey, E., Mentré, F., and Taburet, A.-M. (2010). Intracellular pharmacokinetics of antiretroviral drugs in HIV-infected patients, and their correlation with drug action. Clinical pharmacokinetics, 49(1) : [Beal et al., 1992] Beal, S., Sheiner, L. B., Boeckmann, A., and Bauer, R. J. (1992). Nonmem users guides. San Francisco, NONMEM Project Group, University of California. [Berndt et al., 1974] Berndt, E. K., Hall, B. H., and Hall, R. E. (1974). Estimation and inference in nonlinear structural models. In Annals of Economic and Social Measurement, Volume 3, number 4, pages NBER. [Bierman et al., 2009] Bierman, W. F., van Agtmael, M. A., Nijhuis, M., Danner, S. A., and Boucher, C. A. (2009). HIV monotherapy with ritonavir-boosted protease inhibitors : a systematic review. AIDS, 23(3) : [Bofill et al., 1992] Bofill, M., Janossy, G., Lee, C., MacDonald-Burns, D., Phillips, A., Sabin, C., Timms, A., Johnson, M., and Kernoff, P. (1992). Laboratory control values for CD4 and CD8 T lymphocytes. implications for HIV-1 diagnosis. Clinical & Experimental Immunology, 88(2) :

179 Bibliographie 179 [Bonhoeffer et al., 2000] Bonhoeffer, S., Rembiszewski, M., Ortiz, G. M., and Nixon, D. F. (2000). Risks and benefits of structured antiretroviral drug therapy interruptions in HIV-1 infection. AIDS, 14(15) : [Boscardin et al., 1998] Boscardin, W. J., Taylor, J. M., and Law, N. (1998). Longitudinal models for AIDS marker data. Statistical Methods in Medical Research, 7(1) : [Bossi et al., 2004] Bossi, P., Peytavin, G., Ait-Mohand, H., Delaugerre, C., Ktorza, N., Paris, L., Bonmarchand, M., Cacace, R., David, D.-J., Simon, A., et al. (2004). Genophar : a randomized study of plasma drug measurements in association with genotypic resistance testing and expert advice to optimize therapy in patients failing antiretroviral therapy*. HIV medicine, 5(5) : [Box and Cox, 1964] Box, G. E. and Cox, D. R. (1964). An analysis of transformations. Journal of the Royal Statistical Society. Series B (Methodological), pages [Brandt and Chen, 2001] Brandt, M. E. and Chen, G. (2001). Feedback control of a biodynamical model of HIV-1. Biomedical Engineering, IEEE Transactions on, 48(7) : [Butcher, 2008] Butcher, J. C. (2008). Numerical methods for ordinary differential equations. John Wiley & Sons. [Caliendo and Hirsch, 1994] Caliendo, A. M. and Hirsch, M. S. (1994). Combination therapy for infection due to human immunodeficiency virus type 1. Clinical infectious diseases, 18(4) : [Callard and Hodgkin, 2007] Callard, R. and Hodgkin, P. (2007). Modeling T-and B-cell growth and differentiation. Immunological reviews, 216(1) : [Callaway and Perelson, 2002] Callaway, D. S. and Perelson, A. S. (2002). HIV-1 infection and low steady state viral loads. Bulletin of Mathematical Biology, 64(1) : [Catz et al., 2000] Catz, S. L., Kelly, J. A., Bogart, L. M., Benotsch, E. G., and McAuliffe, T. L. (2000). Patterns, correlates, and barriers to medication adherence among persons prescribed new treatments for HIV disease. Health Psychology, 19(2) :124. [Celeux et al., 2006] Celeux, G., Forbes, F., Robert, C. P., and Titterington, D. M. (2006). Deviance information criteria for missing data models. Bayesian Analysis, 1(4) : [Chapman et al., 2008] Chapman, B., Jost, G., and van Der Pas, R. (2008). Using OpenMP : portable shared memory parallel programming, volume 10. The MIT Press. [Chesney et al., 2000] Chesney, M. A., Ickovics, J., Chambers, D., Gifford, A., Neidig, J., Zwickl, B., Wu, A., and AACTG (2000). Self-reported adherence to antiretroviral medications among participants in HIV clinical trials : the AACTG adherence instruments. AIDS care, 12(3) : [Choi et al., 2010] Choi, Y. L., Soda, M., Yamashita, Y., Ueno, T., Takashima, J., Nakajima, T., Yatabe, Y., Takeuchi, K., Hamada, T., Haruta, H., et al. (2010). Eml4-alk mutations in lung cancer that confer resistance to alk inhibitors. New England Journal of Medicine, 363(18) : [Chou, 1976] Chou, T.-C. (1976). Derivation and properties of michaelis-menten type and hill type equations for reference ligands. Journal of theoretical biology, 59(2) :

180 Bibliographie 180 [Chun et al., 1998] Chun, T.-W., Engel, D., Berrey, M. M., Shea, T., Corey, L., and Fauci, A. S. (1998). Early establishment of a pool of latently infected, resting CD4+ T cells during primary HIV-1 infection. Proceedings of the National Academy of Sciences, 95(15) : [Chun and Fauci, 1999] Chun, T.-W. and Fauci, A. S. (1999). Latent reservoirs of HIV : obstacles to the eradication of virus. Proceedings of the National Academy of Sciences, 96(20) : [Clapham and McKnight, 2002] Clapham, P. R. and McKnight, Á. (2002). Cell surface receptors, virus entry and tropism of primate lentiviruses. Journal of General Virology, 83(8) : [Clarke, 1999] Clarke, B. S. (1999). Asymptotic normality of the posterior in relative entropy. Information Theory, IEEE Transactions on, 45(1) : [Clevenbergh et al., 2002] Clevenbergh, P., Garraffo, R., Durant, J., and Dellamonica, P. (2002). Pharmadapt : a randomized prospective study to evaluate the benefit of therapeutic monitoring of protease inhibitors : 12 week results. AIDS, 16(17) : [Coffin et al., 1995] Coffin, J. M. et al. (1995). HIV population dynamics in vivo : implications for genetic variation, pathogenesis, and therapy. Science, pages [Cohen et al., 2011] Cohen, M. S., Shaw, G. M., McMichael, A. J., and Haynes, B. F. (2011). Acute HIV-1 infection. New England Journal of Medicine, 364(20) : [Cole and Hernán, 2002] Cole, S. R. and Hernán, M. A. (2002). Fallibility in estimating direct effects. International journal of epidemiology, 31(1) : [Cole et al., 2007] Cole, S. R., Hernán, M. A., Anastos, K., Jamieson, B. D., and Robins, J. M. (2007). Determining the effect of highly active antiretroviral therapy on changes in human immunodeficiency virus type 1 RNA viral load using a marginal structural left-censored mean model. American journal of epidemiology, 166(2) : [Cole et al., 2005] Cole, S. R., Hernán, M. A., Margolick, J. B., Cohen, M. H., and Robins, J. M. (2005). Marginal structural models for estimating the effect of highly active antiretroviral therapy initiation on CD4 cell count. American journal of epidemiology, 162(5) : [Cole et al., 2003] Cole, S. R., Hernán, M. A., Robins, J. M., Anastos, K., Chmiel, J., Detels, R., Ervin, C., Feldman, J., Greenblatt, R., Kingsley, L., et al. (2003). Effect of highly active antiretroviral therapy on time to acquired immunodeficiency syndrome or death using marginal structural models. American Journal of Epidemiology, 158(7) : [Commenges and Gégout-Petit, 2009] Commenges, D. and Gégout-Petit, A. (2009). A general dynamical statistical model with causal interpretation. Journal of the Royal Statistical Society : Series B (Statistical Methodology), 71(3) : [Commenges et al., 2006] Commenges, D., Jacqmin-Gadda, H., Proust, C., and Guedj, J. (2006). A newton-like algorithm for likelihood maximization : The robust-variance scoring algorithm. arxiv preprint math/ [Commenges et al., 2011] Commenges, D., Jolly, D., Drylewicz, J., Putter, H., and Thiébaut, R. (2011). Inference in HIV dynamics models via hierarchical likelihood. Computational Statistics & Data Analysis, 55(1) :

181 Bibliographie 181 [Commenges et al., 2012] Commenges, D., Proust-Lima, C., Samieri, C., and Liquet, B. (2012). A universal approximate cross-validation criterion and its asymptotic distribution. arxiv preprint arxiv : [Conway and Coombs, 2011] Conway, J. M. and Coombs, D. (2011). A stochastic model of latently infected cell reactivation and viral blip generation in treated HIV patients. PLoS computational biology, 7(4) :e [Cooper et al., 2003] Cooper, C., van Heeswijk, R., Gallicano, K., and Cameron, D. (2003). A review of low-dose ritonavir in protease inhibitor combination therapy. Clinical Infectious Diseases, 36(12) : [Costagliola and Barberousse, 2001] Costagliola, D. and Barberousse, C. (2001). Comment mesurer l observance. Collection sciences sociales et sida. ANRS P, editor. L observance aux traitements contre le VIH/sida : mesure, déterminants, évolution, pages [Davidian, 1995] Davidian, M. (1995). Nonlinear models for repeated measurement data, volume 62. CRC Press. [Dawid, 2000] Dawid, A. P. (2000). Causal inference without counterfactuals. Journal of the American Statistical Association, 95(450) : [De Gruttola and Tu, 1994] De Gruttola, V. and Tu, X. M. (1994). Modelling progression of CD4-lymphocyte count and its relationship to survival time. Biometrics, pages [Deeks et al., 2012] Deeks, S. G., Autran, B., Berkhout, B., Benkirane, M., Cairns, S., Chomont, N., Chun, T.-W., Churchill, M., Di Mascio, M., Katlama, C., et al. (2012). Towards an HIV cure : a global scientific strategy. Nature reviews Immunology. [DeGruttola et al., 2000] DeGruttola, V., Dix, L., D Aquila, R., Holder, D., Phillips, A., Ait-Khaled, M., Baxter, J., Clevenbergh, P., Hammer, S., Harrigan, R., et al. (2000). The relation between baseline HIV drug resistance and response to antiretroviral therapy : re-analysis of retrospective and prospective studies using a standardized data analysis plan. Antiviral therapy, 5(1) : [Del Moral et al., 2006] Del Moral, P., Doucet, A., and Jasra, A. (2006). Sequential monte carlo samplers. Journal of the Royal Statistical Society : Series B (Statistical Methodology), 68(3) : [Delfraissy et al., 2008] Delfraissy, J.-F., Flandre, P., Delaugerre, C., Ghosn, J., Horban, A., Girard, P.-M., Norton, M., Rouzioux, C., Taburet, A.-M., Cohen-Codar, I., et al. (2008). Lopinavir/ritonavir monotherapy or plus zidovudine and lamivudine in antiretroviral-naive HIV-infected patients. AIDS, 22(3) : [Dempster et al., 1977] Dempster, A. P., Laird, N. M., and Rubin, D. B. (1977). Maximum likelihood from incomplete data via the em algorithm. Journal of the Royal Statistical Society. Series B (Methodological), pages [den Uyl et al., 2004] den Uyl, D., van der Horst-Bruinsma, I. E., van Agtmael, M., et al. (2004). Progression of HIV to AIDS : a protective role for hla-b27. AIDS Rev, 6(2) : [Detels et al., 1998] Detels, R., Muñoz, A., McFarlane, G., Kingsley, L. A., Margolick, J. B., Giorgi, J., Schrager, L. K., Phair, J. P., et al. (1998). Effectiveness of potent antiretroviral therapy on time to AIDS and death in men with known HIV infection duration. JAMA : the journal of the American Medical Association, 280(17) :

182 Bibliographie 182 [Diaconis and Freedman, 1986] Diaconis, P. and Freedman, D. (1986). On the consistency of bayes estimates. The Annals of Statistics, pages [Diggle et al., 1994] Diggle, P., Liang, K.-Y., and Zeger, S. L. (1994). Longitudinal data analysis. Oxford Univ. Press. [Ding and Wu, 2001] Ding, A. A. and Wu, H. (2001). Assessing antiviral potency of anti-hiv therapies in vivo by comparing viral decay rates in viral dynamic models. Biostatistics, 2(1) : [Dinoso et al., 2009] Dinoso, J., Kim, S., Wiegand, A., Palmer, S., Gange, S., Cranmer, L., O Shea, A., Callender, M., Spivak, A., Brennan, T., et al. (2009). Treatment intensification does not reduce residual HIV-1 viremia in patients on highly active antiretroviral therapy. Proceedings of the National Academy of Sciences, 106(23) : [Dixit and Perelson, 2005] Dixit, N. M. and Perelson, A. S. (2005). HIV dynamics with multiple infections of target cells. Proceedings of the National Academy of Sciences of the United States of America, 102(23) : [Dorazio and Johnson, 2003] Dorazio, R. M. and Johnson, F. A. (2003). Bayesian inference and decision theory-a framework for decision making in natural resource management. Ecological Applications, 13(2) : [Dougherty et al., 2000] Dougherty, E. R., Kim, S., and Chen, Y. (2000). Coefficient of determination in nonlinear signal processing. Signal Processing, 80(10) : [Drylewicz, 2009] Drylewicz, J. (2009). Modélisation dynamique de l interaction hôtepathogène appliquée à la primo-infection à VIH. PhD thesis, Université Victor Segalen- Bordeaux II. [Drylewicz et al., 2012] Drylewicz, J., Commenges, D., and Thiébaut, R. (2012). Maximum a posteriori estimation in dynamical models of primary HIV infection. Statistical Communications in Infectious Diseases, 4(1). [Drylewicz et al., 2010] Drylewicz, J., Guedj, J., Commenges, D., and Thiébaut, R. (2010). Modeling the dynamics of biomarkers during primary HIV infection taking into account the uncertainty of infection date. The Annals of Applied Statistics, 4(4) : [Dumont et al., 2013] Dumont, C., Chenel, M., Mentré, F., et al. (2013). Influence of covariance between random effects in design for nonlinear mixed effect models with an illustration in paediatric pharmacokinectics. HAL. [Duong et al., 2001] Duong, M., Piroth, L., Grappin, M., Forte, F., Peytavin, G., Buisson, M., Chavanet, P., and Portier, H. (2001). Evaluation of the patient medication adherence questionnaire as a tool for self-reported adherence assessment in HIV-infected patients on antiretroviral regimens. HIV clinical trials, 2(2) : [Dybul et al., 2001] Dybul, M., Chun, T.-W., Yoder, C., Hidalgo, B., Belson, M., Hertogs, K., Larder, B., Dewar, R. L., Fox, C. H., Hallahan, C. W., et al. (2001). Short-cycle structured intermittent treatment of chronic HIV infection with highly active antiretroviral therapy : effects on virologic, immunologic, and toxicity parameters. Proceedings of the National Academy of Sciences, 98(26) : [Dybul et al., 2002] Dybul, M., Fauci, A. S., Bartlett, J. G., Kaplan, J. E., and Pau, A. K. (2002). Guidelines for using antiretroviral agents among HIV-infected adults and adolescents : The panel on clinical practices for treatment of HIV. Annals of Internal Medicine, 137(5 Part 2) :

183 Bibliographie 183 [Eberhardt and Scheines, 2007] Eberhardt, F. and Scheines, R. (2007). Interventions and causal inference. Philosophy of Science, 74(5) : [Egger et al., 2002] Egger, M., May, M., Chêne, G., Phillips, A. N., Ledergerber, B., Dabis, F., Costagliola, D., Monforte, A. D., de Wolf, F., Reiss, P., et al. (2002). Prognosis of HIV-1-infected patients starting highly active antiretroviral therapy : a collaborative analysis of prospective studies. The Lancet, 360(9327) : [Fätkenheuer et al., 2005] Fätkenheuer, G., Pozniak, A. L., Johnson, M. A., Plettenberg, A., Staszewski, S., Hoepelman, A. I., Saag, M. S., Goebel, F. D., Rockstroh, J. K., Dezube, B. J., et al. (2005). Efficacy of short-term monotherapy with maraviroc, a new CCR5 antagonist, in patients infected with HIV-1. Nature medicine, 11(11) : [Felts et al., 2010] Felts, R. L., Narayan, K., Estes, J. D., Shi, D., Trubey, C. M., Fu, J., Hartnell, L. M., Ruthel, G. T., Schneider, D. K., Nagashima, K., et al. (2010). 3d visualization of HIV transfer at the virological synapse between dendritic cells and t cells. Proceedings of the National Academy of Sciences, 107(30) : [Ferguson et al., 2001] Ferguson, N. M., Fraser, C., and Anderson, R. M. (2001). Viral dynamics and anti-viral pharmacodynamics : rethinking< i> in vitro</i> measures of drug potency. Trends in pharmacological sciences, 22(2) : [Finzi et al., 1999] Finzi, D., Blankson, J., Siliciano, J. D., Margolick, J. B., Chadwick, K., Pierson, T., Smith, K., Lisziewicz, J., Lori, F., Flexner, C., et al. (1999). Latent infection of CD4+ T cells provides a mechanism for lifelong persistence of HIV-1, even in patients on effective combination therapy. Nature medicine, 5(5) : [Fischl et al., 1987] Fischl, M. A., Richman, D. D., Grieco, M. H., Gottlieb, M. S., Volberding, P. A., Laskin, O. L., Leedom, J. M., Groopman, J. E., Mildvan, D., Schooley, R. T., et al. (1987). The efficacy of azidothymidine (azt) in the treatment of patients with AIDS and AIDS-related complex. New England Journal of Medicine, 317(4) : [Fletcher et al., 2005] Fletcher, C., Testa, M., Brundage, R., Chesney, M., Haubrich, R., Acosta, E., Martinez, A., Jiang, H., and Gulick, R. (2005). Four measures of antiretroviral medication adherence and virologic response in AIDS clinical trials group study 359. J Acquir Immune Defic Syndr, 40(3) : [Fletcher et al., 2002] Fletcher, C. V., Anderson, P. L., Kakuda, T. N., Schacker, T. W., Henry, K., Gross, C. R., and Brundage, R. C. (2002). Concentration-controlled compared with conventional antiretroviral therapy for HIV infection. AIDS, 16(4) : [Gallo et al., 1983] Gallo, R. C., Sarin, P. S., Gelmann, E., Robert-Guroff, M., Richardson, E., Kalyanaraman, V., Mann, D., Sidhu, G. D., Stahl, R. E., Zolla-Pazner, S., et al. (1983). Isolation of human t-cell leukemia virus in acquired immune deficiency syndrome (AIDS). Science, 220(4599) : [García de Olalla et al., 2002] García de Olalla, P., Knobel, H., Carmona, A., Guelar, A., López-Colomés, J. L., Caylà, J. A., et al. (2002). Impact of adherence and highly active antiretroviral therapy on survival in HIV-infected patients. Journal of acquired immune deficiency syndromes (1999), 30(1) :105. [Gardner et al., 2009] Gardner, E. M., Burman, W. J., Steiner, J. F., Anderson, P. L., and Bangsberg, D. R. (2009). Antiretroviral medication adherence and the development of class-specific antiretroviral resistance. AIDS, 23(9) :1035.

184 Bibliographie 184 [Gear, 1971] Gear, C. W. (1971). The automatic integration of ordinary differential equations. Communications of the ACM, 14(3) : [Gégout-Petit and Commenges, 2010] Gégout-Petit, A. and Commenges, D. (2010). A general definition of influence between stochastic processes. Lifetime data analysis, 16(1) : [Gelman, 2006] Gelman, A. (2006). Prior distributions for variance parameters in hierarchical models (comment on article by browne and draper). Bayesian analysis, 1(3) : [Gerber and Acosta, 2003] Gerber, J. G. and Acosta, E. P. (2003). Therapeutic drug monitoring in the treatment of HIV-infection. Journal of Clinical Virology, 27(2) : [Gilks et al., 1996] Gilks, W. R., Richardson, S., and Spiegelhalter, D. J. (1996). Markov chain Monte Carlo in practice, volume 2. CRC press. [Goodenow et al., 1989] Goodenow, M., Huet, T., Saurin, W., Kwok, S., Sninsky, J., and Wain-Hobson, S. (1989). HIV-1 isolates are rapidly evolving quasispecies : evidence for viral mixtures and preferred nucleotide substitutions. AIDS, 2(4) : [Gran et al., 2008] Gran, J. M., Wasmuth, L., Amundsen, E. J., Lindqvist, B. H., and Aalen, O. O. (2008). Growth rates in epidemic models : application to a model for HIV/AIDS progression. Statistics in medicine, 27(23) : [Greenland, 2004] Greenland, S. (2004). An overview of methods for causal inference from observational studies. Applied Bayesian methods and causal inference from incomplete data perspectives. Volume Chap, 1. [Greenland and Robins, 1986] Greenland, S. and Robins, J. M. (1986). Identifiability, exchangeability, and epidemiological confounding. International journal of epidemiology, 15(3) : [Grossman et al., 2002] Grossman, Z., Meier-Schellersheim, M., Sousa, A. E., Victorino, R. M., and Paul, W. E. (2002). CD4+ T-cell depletion in HIV infection : are we closer to understanding the cause? Nature medicine, 8(4) : [Guaraldi et al., 2011] Guaraldi, G., Orlando, G., Zona, S., Menozzi, M., Carli, F., Garlassi, E., Berti, A., Rossi, E., Roverato, A., and Palella, F. (2011). Premature age-related comorbidities among HIV-infected persons compared with the general population. Clinical Infectious Diseases, 53(11) : [Guedj et al., 2007a] Guedj, J., Thiébaut, R., and Commenges, D. (2007a). Maximum likelihood estimation in dynamical models of HIV. Biometrics, 63(4) : [Guedj et al., 2007b] Guedj, J., Thiébaut, R., and Commenges, D. (2007b). Practical identifiability of HIV dynamics models. Bulletin of mathematical biology, 69(8) : [Gupta et al., 1985] Gupta, G. K., Sacks-Davis, R., and Tescher, P. E. (1985). A review of recent developments in solving odes. ACM Computing Surveys (CSUR), 17(1) :5 47. [Haas et al., 2011] Haas, D. W., Kuritzkes, D. R., Ritchie, M. D., Amur, S., Gage, B. F., Maartens, G., Masys, D., Fellay, J., Phillips, E., Ribaudo, H. J., et al. (2011). Pharmacogenomics of HIV therapy : summary of a workshop sponsored by the national institute of allergy and infectious diseases. HIV clinical trials, 12(5) :

185 Bibliographie 185 [Haase, 1999] Haase, A. (1999). Population biology of HIV-1 infection : viral and CD4+ T cell demographics and dynamics in lymphatic tissues. Annual review of immunology, 17(1) : [Hammer et al., 2008] Hammer, S. M., Eron Jr, J. J., Reiss, P., Schooley, R. T., Thompson, M. A., Walmsley, S., Cahn, P., Fischl, M. A., Gatell, J. M., Hirsch, M. S., et al. (2008). Antiretroviral treatment of adult HIV infection. JAMA : the journal of the American Medical Association, 300(5) : [Hammer et al., 1996] Hammer, S. M., Katzenstein, D. A., Hughes, M. D., Gundacker, H., Schooley, R. T., Haubrich, R. H., Henry, W. K., Lederman, M. M., Phair, J. P., Niu, M., et al. (1996). A trial comparing nucleoside monotherapy with combination therapy in HIV-infected adults with CD4 cell counts from 200 to 500 per cubic millimeter. New England Journal of Medicine, 335(15) : [Hammer et al., 2010] Hammer, S. M., Ribaudo, H., Bassett, R., Mellors, J. W., Demeter, L. M., Coombs, R. W., Currier, J., Morse, G. D., Gerber, J. G., Martinez, A. I., et al. (2010). A randomized, placebo-controlled trial of abacavir intensification in HIV-1 infected adults with virologic suppression on a protease inhibitor containing regimen. HIV clinical trials, 11(6) : [Hastings, 1970] Hastings, W. K. (1970). Monte carlo sampling methods using markov chains and their applications. Biometrika, 57(1) : [Hedeker and Gibbons, 1994] Hedeker, D. and Gibbons, R. D. (1994). A random-effects ordinal regression model for multilevel analysis. Biometrics, pages [Herz et al., 1996] Herz, A., Bonhoeffer, S., Anderson, R. M., May, R. M., and Nowak, M. A. (1996). Viral dynamics in vivo : limitations on estimates of intracellular delay and virus decay. Proceedings of the National Academy of Sciences, 93(14) : [Hill et al., 1910] Hill, A. V. et al. (1910). The possible effects of the aggregation of the molecules of haemoglobin on its dissociation curves. J physiol, 40(4) :iv vii. [Hindmarsh, 1983] Hindmarsh, A. C. (1983). Odepack, a systematized collection of ode solvers, rs stepleman et al.(eds.), north-holland, amsterdam,(vol. 1 of), pp IMACS transactions on scientific computation, 1 : [Ho et al., 1995] Ho, D. D., Neumann, A. U., Perelson, A. S., Chen, W., Leonard, J. M., Markowitz, M., et al. (1995). Rapid turnover of plasma virions and CD4 lymphocytes in HIV-1 infection. Nature, 373(6510) : [Höfler, 2005] Höfler, M. (2005). Causal inference based on counterfactuals. BMC Medical Research Methodology, 5(1) :28. [Hosseinipour et al., 2009] Hosseinipour, M. C., van Oosterhout, J. J., Weigel, R., Phiri, S., Kamwendo, D., Parkin, N., Fiscus, S. A., Nelson, J. A., Eron, J. J., and Kumwenda, J. (2009). The public health approach to identify antiretroviral therapy failure : highlevel nucleoside reverse transcriptase inhibitor resistance among malawians failing firstline antiretroviral therapy. AIDS, 23(9) :1127. [Huang et al., 2006] Huang, Y., Liu, D., and Wu, H. (2006). Hierarchical bayesian methods for estimation of parameters in a longitudinal HIV dynamic system. Biometrics, 62(2) : [Huang et al., 2003] Huang, Y., Rosenkranz, S. L., and Wu, H. (2003). Modeling HIV dynamics and antiviral response with consideration of time-varying drug exposures, adherence and phenotypic sensitivity. Mathematical biosciences, 184(2) :

186 Bibliographie 186 [Hull et al., 1972] Hull, T., Enright, W., Fellen, B., and Sedgwick, A. (1972). Comparing numerical methods for ordinary differential equations. SIAM Journal on Numerical Analysis, 9(4) : [Hütter et al., 2009] Hütter, G., Nowak, D., Mossner, M., Ganepola, S., Müßig, A., Allers, K., Schneider, T., Hofmann, J., Kücherer, C., Blau, O., et al. (2009). Long-term control of HIV by CCR5 delta32/delta32 stem-cell transplantation. New England Journal of Medicine, 360(7) : [Itescu et al., 1992] Itescu, S., Mathur-Wagh, U., Skovron, M. L., Brancato, L. J., Marmor, M., Zeleniuch-Jacquotte, A., and Winchester, R. (1992). Hla-b35 is associated with accelerated progression to AIDS. AIDS, 5(1) : [Jacqmin-Gadda et al., 2000] Jacqmin-Gadda, H., Thiébaut, R., Chêne, G., and Commenges, D. (2000). Analysis of left-censored longitudinal data with application to viral load in HIV infection. Biostatistics, 1(4) : [Jacquez et al., 1988] Jacquez, J. A., Simon, C. P., Koopman, J., Sattenspiel, L., and Perry, T. (1988). Modeling and analyzing HIV transmission : the effect of contact patterns. Mathematical Biosciences, 92(2) : [Jaeger and Lambert, 2012] Jaeger, J. and Lambert, P. (2012). On the use of adhesion parameters to validate models specified using systems of affine differential equations. Université de Louvain. [Japour et al., 1993] Japour, A. J., Mayers, D., Johnson, V., Kuritzkes, D., Beckett, L., Arduino, J., Lane, J., Black, R., Reichelderfer, P., and D Aquila, R. (1993). Standardized peripheral blood mononuclear cell culture assay for determination of drug susceptibilities of clinical human immunodeficiency virus type 1 isolates. the rv-43 study group, the AIDS clinical trials group virology committee resistance working group. Antimicrobial agents and chemotherapy, 37(5) : [Jilek et al., 2012] Jilek, B. L., Zarr, M., Sampah, M. E., Rabi, S. A., Bullen, C. K., Lai, J., Shen, L., and Siliciano, R. F. (2012). A quantitative basis for antiretroviral therapy for HIV-1 infection. Nature medicine, 18(3) : [Joshi, 2002] Joshi, H. R. (2002). Optimal control of an HIV immunology model. Optimal control applications and methods, 23(4) : [Kahn and Walker, 1998] Kahn, J. O. and Walker, B. D. (1998). Acute human immunodeficiency virus type 1 infection. New England Journal of Medicine, 339(1) : [Kalichman et al., 2010] Kalichman, S. C., Amaral, C., Swetsze, C., Eaton, L., Kalichman, M. O., Cherry, C., Detorio, M., Caliendo, A. M., and Schinazi, R. F. (2010). Monthly unannounced pill counts for monitoring HIV treatment adherence : tests for self-monitoring and reactivity effects. HIV Clinical Trials, 11(6) : [Karim and Zeger, 1988] Karim, M. R. and Zeger, S. L. (1988). Gee : A sas macro for longitudinal data analysis. AGE, 11184(Q2) : [kaslow et al., 1987] kaslow, R., Ostrow, D., Detels, R., Phair, J., Polk, B., Rinaldo, C., et al. (1987). The multicenter AIDS cohort study : rationale, organization, and selected characteristics of the participants. American Journal of Epidemiology, 126(2) : [Kass and Raftery, 1995] Kass, R. E. and Raftery, A. E. (1995). Bayes factors. Journal of the american statistical association, 90(430) :

187 Bibliographie 187 [Kass and Steffey, 1989] Kass, R. E. and Steffey, D. (1989). Approximate bayesian inference in conditionally independent hierarchical models (parametric empirical bayes models). Journal of the American Statistical Association, 84(407) : [Katlama et al., 2010] Katlama, C., Valantin, M. A., Algarte-Genin, M., Duvivier, C., Lambert-Niclot, S., Girard, P. M., Molina, J. M., Hoen, B., Pakianather, S., Peytavin, G., et al. (2010). Efficacy of darunavir/ritonavir maintenance monotherapy in patients with HIV-1 viral suppression : a randomized open-label, noninferiority trial, monoi-anrs 136. AIDS, 24(15) : [Kaufmann et al., 1998] Kaufmann, G., Duncombe, C., Zaunders, J., Cunningham, P., and Cooper, D. (1998). Primary HIV-1 infection : a review of clinical manifestations, immunologic and virologic changes. AIDS patient care and STDs, 12(10) : [Kellam and Larder, 1994] Kellam, P. and Larder, B. A. (1994). Recombinant virus assay : a rapid, phenotypic assay for assessment of drug susceptibility of human immunodeficiency virus type 1 isolates. Antimicrobial agents and chemotherapy, 38(1) : [Kilby et al., 2008] Kilby, J. M., Lee, H. Y., Hazelwood, J. D., Bansal, A., Bucy, R. P., Saag, M. S., Shaw, G. M., Acosta, E. P., Johnson, V. A., Perelson, A. S., et al. (2008). Treatment response in acute/early infection versus advanced AIDS : equivalent first and second phases of HIV RNA decline. AIDS, 22(8) : [Kirschner et al., 1997] Kirschner, D., Lenhart, S., and Serbin, S. (1997). Optimal control of the chemotherapy of HIV. Journal of mathematical biology, 35(7) : [Kirschner and Webb, 1996] Kirschner, D. and Webb, G. F. (1996). A model for treatment strategy in the chemotherapy of AIDS. Bulletin of Mathematical Biology, 58(2) : [Kitahata et al., 2009] Kitahata, M. M., Gange, S. J., Abraham, A. G., Merriman, B., Saag, M. S., Justice, A. C., Hogg, R. S., Deeks, S. G., Eron, J. J., Brooks, J. T., et al. (2009). Effect of early versus deferred antiretroviral therapy for HIV on survival. New England Journal of Medicine, 360(18) : [Krawezik and Cappello, 2006] Krawezik, G. and Cappello, F. (2006). Performance comparison of mpi and openmp on shared memory multiprocessors. Concurrency and Computation : Practice and Experience, 18(1) : [Kubiak et al., 2001] Kubiak, S., Lehr, H., Levy, R., Moeller, T., Parker, A., and Swim, E. (2001). Modeling control of HIV infection through structured treatment interruptions with recommendations for experimental protocol. Industrial Mathematics Modeling Workshop. [Kuhn and Lavielle, 2005] Kuhn, E. and Lavielle, M. (2005). Maximum likelihood estimation in nonlinear mixed effects models. Computational Statistics & Data Analysis, 49(4) : [Laird and Ware, 1982] Laird, N. M. and Ware, J. H. (1982). Random-effects models for longitudinal data. Biometrics, pages [Lambert, 1974] Lambert, J. D. (1974). Nonlinear methods for stiff systems of ordinary differential equations. In Conference on the Numerical solution of Differential Equations, pages Springer. [Lange et al., 1989] Lange, J. M., de Wolf, F., and Goudsmit, J. (1989). progression in HIV infection. AIDS, 3(1) :S Markers for

188 Bibliographie 188 [Laramee, 2011] Laramee, R. S. (2011). Bob s concise introduction to doxygen. Technical report, Technical report, The Visual and Interactive Computing Group, Computer Science Department, Swansea University, Wales, UK, 2007.(available online). [Lavielle, 2005] Lavielle, M. (2005). Monolix (modèles non linéaires à effets mixtes). MO- NOLIX group, Orsay, France. [Lavori and Dawson, 2008] Lavori, P. W. and Dawson, R. (2008). Adaptive treatment strategies in chronic disease. Annual review of medicine, 59 :443. [Law et al., 2013] Law, G. L., Korth, M. J., Benecke, A. G., and Katze, M. G. (2013). Systems virology : host-directed approaches to viral pathogenesis and drug targeting. Nature Reviews Microbiology. [Le Corfec et al., 2000] Le Corfec, E., Rouzioux, C., and Costagliola, D. (2000). Dynamique quantitative du vih-1 in vivo : revue des modeles mathématiques. Revue d épidémiologie et de santé publique, 48(2) : [Lee and Nelder, 1996] Lee, Y. and Nelder, J. A. (1996). Hierarchical generalized linear models. Journal of the Royal Statistical Society. Series B (Methodological), pages [Liang and Zeger, 1986] Liang, K.-Y. and Zeger, S. L. (1986). Longitudinal data analysis using generalized linear models. Biometrika, 73(1) : [Lichtenstein et al., 2008] Lichtenstein, K. A., Armon, C., Buchacz, K., Chmiel, J. S., Moorman, A. C., Wood, K. C., Holmberg, S. D., Brooks, J. T., et al. (2008). Initiation of antiretroviral therapy at CD4 cell counts>= 350 cells/mm3 does not increase incidence or risk of peripheral neuropathy, anemia, or renal insufficiency. AIDS, 47(1) : [Lindbäck et al., 2000] Lindbäck, S., Karlsson, A. C., Mittler, J., Blaxhult, A., Carlsson, M., Briheim, G., Sönnerborg, A., Gaines, H., et al. (2000). Viral dynamics in primary HIV-1 infection. AIDS, 14(15) : [Lindstrom and Bates, 1988] Lindstrom, M. J. and Bates, D. M. (1988). Newton raphson and em algorithms for linear mixed-effects models for repeated-measures data. Journal of the American Statistical Association, 83(404) : [Lindstrom and Bates, 1990] Lindstrom, M. J. and Bates, D. M. (1990). Nonlinear mixed effects models for repeated measures data. Biometrics, pages [Liquet et al., 2007] Liquet, B., Saracco, J., and Commenges, D. (2007). Selection between proportional and stratified hazards models based on expected log-likelihood. Computational Statistics, 22(4) : [Liu et al., 2001] Liu, H., Golin, C. E., Miller, L. G., Hays, R. D., Beck, C. K., Sanandaji, S., Christian, J., Maldonado, T., Duran, D., Kaplan, A. H., et al. (2001). A comparison study of multiple measures of adherence to HIV protease inhibitors. Annals of Internal Medicine, 134(10) : [Lohse et al., 2007] Lohse, N., Hansen, A., Pedersen, G., Kronborg, G., Gerstoft, J., Sorensen, H., Vaeth, M., and Obel, N. (2007). Survival of persons with and without HIV infection in denmark, Annals of Internal Medicine, 146(2) :87. [Ludwig, 1996] Ludwig, D. (1996). Uncertainty and the assessment of extinction probabilities. Ecological Applications, pages

189 Bibliographie 189 [Lunn et al., 2000] Lunn, D. J., Thomas, A., Best, N., and Spiegelhalter, D. (2000). Winbugs-a bayesian modelling framework : concepts, structure, and extensibility. Statistics and computing, 10(4) : [Lyles et al., 2000] Lyles, R. H., Lyles, C. M., and Taylor, D. J. (2000). Random regression models for human immunodeficiency virus ribonucleic acid data subject to left censoring and informative drop-outs. Journal of the Royal Statistical Society : Series C (Applied Statistics), 49(4) : [Mallal et al., 2008] Mallal, S., Phillips, E., Carosi, G., Molina, J.-M., Workman, C., Tomažič, J., Jägel-Guedes, E., Rugina, S., Kozyrev, O., Cid, J. F., et al. (2008). Hla-b* 5701 screening for hypersensitivity to abacavir. New England Journal of Medicine, 358(6) : [Malone et al., 1990] Malone, J. L., Simms, T. E., Gray, G. C., Wagner, K. F., Burge, J. R., and Burke, D. S. (1990). Sources of variability in repeated t-helper lymphocyte counts from human immunodeficiency virus type 1-infected patients : total lymphocyte count fluctuations and diurnal cycle are important. JAIDS Journal of Acquired Immune Deficiency Syndromes, 3(2) : [Mann et al., 1988] Mann, J. M., Chin, J., Piot, P., and Quinn, T. (1988). The international epidemiology of AIDS. Scientific American, 259(4) :82. [Marquardt, 1963] Marquardt, D. W. (1963). An algorithm for least-squares estimation of nonlinear parameters. Journal of the Society for Industrial & Applied Mathematics, 11(2) : [McMahon et al., 2009] McMahon, M. A., Shen, L., and Siliciano, R. F. (2009). New approaches for quantitating the inhibition of HIV-1 replication by antiviral drugs in vitro and in vivo. Current opinion in infectious diseases, 22(6) : [Mellors et al., 1995] Mellors, J., Kingsley, L., Rinaldo, C., Todd, J., Hoo, B., Kokka, R., and Gupta, P. (1995). Quantitation of HIV-1 RNA in plasma predicts outcome after seroconversion. Annals of Internal Medicine, 122(8) :573. [Mellors et al., 1997] Mellors, J. W., Munoz, A., Giorgi, J. V., Margolick, J. B., Tassoni, C. J., Gupta, P., Kingsley, L. A., Todd, J. A., Saah, A. J., Detels, R., et al. (1997). Plasma viral load and CD4+ lymphocytes as prognostic markers of HIV-1 infection. Annals of internal medicine, 126(12) : [Mentré et al., 2005] Mentré, F., Duval, X., Rey, E., Peytavin, G., Auleley, S., Legrand, M., Biour, M., Bouxin, A., Goujard, C., Taburet, A., et al. (2005). Prospective trial to evaluate how therapeutic drug monitoring of protease inhibitors increases virologic success and tolerance of HAART (COPHAR 2-ANRS 111 trial). In 12th Conference on Retroviruses and Opportunistic Infections. [Mentre et al., 1997] Mentre, F., Mallet, A., and Baccar, D. (1997). Optimal design in random-effects regression models. Biometrika, 84(2) : [Metropolis et al., 1953] Metropolis, N., Rosenbluth, A. W., Rosenbluth, M. N., Teller, A. H., and Teller, E. (1953). Equation of state calculations by fast computing machines. The journal of chemical physics, 21 :1087. [Meynard et al., 2002] Meynard, J.-L., Vray, M., Morand-Joubert, L., Race, E., Descamps, D., Peytavin, G., Matheron, S., Lamotte, C., Guiramand, S., Costagliola, D., et al. (2002). Phenotypic or genotypic resistance testing for choosing antiretroviral therapy after treatment failure : a randomized trial. AIDS, 16(5) :

190 Bibliographie 190 [Miao et al., 2011] Miao, H., Xia, X., Perelson, A. S., and Wu, H. (2011). On identifiability of nonlinear ode models and applications in viral dynamics. SIAM review, 53(1) :3 39. [Mias and Snyder, 2013] Mias, G. I. and Snyder, M. (2013). Personal genomes, quantitative dynamic omics and personalized medicine. Quantitative Biology, pages [Molina et al., 1999] Molina, J.-M., Chêne, G., Ferchal, F., Journot, V., Pellegrin, I., Sombardier, M.-N., Rancinan, C., Cotte, L., Madelaine, I., Debord, T., et al. (1999). The albi trial : a randomized controlled trial comparing stavudine plus didanosine with zidovudine plus lamivudine and a regimen alternating both combinations in previously untreated patients infected with human immunodeficiency virus. Journal of Infectious Diseases, 180(2) : [Moore et al., 1999] Moore, K. H., Barrett, J. E., Shaw, S., Pakes, G. E., Churchus, R., Kapoor, A., Lloyd, J., Barry, M. G., and Back, D. (1999). The pharmacokinetics of lamivudine phosphorylation in peripheral blood mononuclear cells from patients infected with HIV-1. AIDS, 13(16) : [Morris, 1983] Morris, C. N. (1983). Parametric empirical bayes inference : theory and applications. Journal of the American Statistical Association, 78(381) : [Murray et al., 1999] Murray, J. S., Elashoff, M. R., Iacono-Connors, L. C., Cvetkovich, T. A., and Struble, K. A. (1999). The use of plasma HIV RNA as a study endpoint in efficacy trials of antiretroviral drugs. AIDS, 13(7) : [Muss et al., 1994] Muss, H. B., Thor, A. D., Berry, D. A., Kute, T., Liu, E. T., Koerner, F., Cirrincione, C. T., Budman, D. R., Wood, W. C., Barcos, M., et al. (1994). c-erbb-2 expression and response to adjuvant therapy in women with node-positive early breast cancer. New England Journal of Medicine, 330(18) : [Nash and Varadhan, 2011] Nash, J. C. and Varadhan, R. (2011). Unifying optimization algorithms to aid software system users : optimx for r. Journal of Statistical Software, 43(9) :1 14. [Ndung u and Weiss, 2012] Ndung u, T. and Weiss, R. A. (2012). On HIV diversity. AIDS, 26(10) : [NIAID, 2013] NIAID (2013). Us department of health and human services - national institutes of page http ://www.niaid.nih.gov/topics/hivaids/understanding/biology/pages/hivreplicationcycle.aspx. [Nisole and Saïb, 2004] Nisole, S. and Saïb, A. (2004). Early steps of retrovirus replicative cycle. Retrovirology, 1(1) :9. [Nowak and Bangham, 1996] Nowak, M. A. and Bangham, C. R. (1996). Population dynamics of immune responses to persistent viruses. Science, 272(5258) : [Nowak et al., 1995] Nowak, M. A., Bonhoeffer, S., Loveday, C., Balfe, P., Semple, M., Kaye, S., Tenantflowers, M., and Tedder, R. (1995). HIV results in the frame-results confirmed. Nature, 375(6528) : [Nowak et al., 1990] Nowak, M. A., May, R. M., and Anderson, R. M. (1990). The evolutionary dynamics of HIV-1 quasispecies and the development of immunodeficiency disease. AIDS, 4(11) : [O Brien et al., 2003] O Brien, M. E., Clark, R. A., Besch, C. L., Myers, L., and Kissinger, P. (2003). Patterns and correlates of discontinuation of the initial haart regimen in an urban outpatient cohort. AIDS, 34(4) :

191 Bibliographie 191 [Orenstein, 2007] Orenstein, J. M. (2007). Ultrastructural pathology, 31(2) : Replication of HIV-1 in vivo and in vitro. [Pakker et al., 1998] Pakker, N. G., Notermans, D. W., De Boer, R. J., Roos, M., De Wolf, F., Hill, A., Leonard, J. M., Danner, S. A., Miedema, F., and Schellekens, P. T. A. (1998). Biphasic kinetics of peripheral blood t cells after triple combination therapy in HIV-1 infection : a composite of redistribution and proliferation. Nature medicine, 4(2) : [Papadopoulos et al., 2006] Papadopoulos, N., Kinzler, K. W., and Vogelstein, B. (2006). The role of companion diagnostics in the development and use of mutation-targeted cancer therapies. Nature biotechnology, 24(8) : [Parienti et al., 2013] Parienti, J.-J., Barrail-Tran, A., Duval, X., Nembot, G., Descamps, D., Vigan, M., Vrijens, B., Panhard, X., Taburet, A.-M., Mentré, F., et al. (2013). Adherence profiles and therapeutic responses of treatment-naive HIV-infected patients starting boosted atazanavir-based therapy in the ANRS 134-COPHAR 3 trial. Antimicrobial agents and chemotherapy, 57(5) : [Paterson et al., 2000] Paterson, D. L., Swindells, S., Mohr, J., Brester, M., Vergis, E. N., Squier, C., Wagener, M. M., and Singh, N. (2000). Adherence to protease inhibitor therapy and outcomes in patients with HIV infection. Annals of internal medicine, 133(1) : [Peloquin, 2002] Peloquin, C. A. (2002). Therapeutic drug monitoring in the treatment of tuberculosis. Drugs, 62(15) : [Perelson et al., 1997] Perelson, A. S., Essunger, P., Cao, Y., Vesanen, M., Hurley, A., Saksela, K., Markowitz, M., and Ho, D. D. (1997). Decay characteristics of HIV-1- infected compartments during combination therapy. Nature, 387 : [Perelson and Nelson, 1999] Perelson, A. S. and Nelson, P. W. (1999). analysis of HIV-1 dynamics in vivo. SIAM review, 41(1) :3 44. Mathematical [Perelson et al., 1996] Perelson, A. S., Neumann, A. U., Markowitz, M., Leonard, J. M., and Ho, D. D. (1996). HIV-1 dynamics in vivo : virion clearance rate, infected cell life-span, and viral generation time. Science, 271(5255) : [Perez et al., 1999] Perez, E. A. et al. (1999). Her-2 as a prognostic, predictive, and therapeutic target in breast cancer. Cancer Control, 6 : [Petersen et al., 2001] Petersen, B., Gernaey, K., and Vanrolleghem, P. A. (2001). Practical identifiability of model parameters by combined respirometric-titrimetric measurements. Water Science and Technology, 43(7) : [Peveler et al., 1999] Peveler, R., George, C., Kinmonth, A.-L., Campbell, M., and Thompson, C. (1999). Effect of antidepressant drug counselling and information leaflets on adherence to drug treatment in primary care : randomised controlled trial. BMJ : British Medical Journal, 319(7210) :612. [Pinheiro and Bates, 1995] Pinheiro, J. C. and Bates, D. M. (1995). Approximations to the log-likelihood function in the nonlinear mixed-effects model. Journal of Computational and Graphical Statistics, 4(1) : [Plan et al., 2012] Plan, E. L., Maloney, A., Mentré, F., Karlsson, M. O., and Bertrand, J. (2012). Performance comparison of various maximum likelihood nonlinear mixed-effects estimation methods for dose response models. The AAPS journal, 14(3) :

192 Bibliographie 192 [Polson and Scott, 2012] Polson, N. G. and Scott, J. G. (2012). On the half-cauchy prior for a global scale parameter. Bayesian Analysis, 7(4) : [Potra and Shi, 1995] Potra, F. and Shi, Y. (1995). Efficient line search algorithm for unconstrained optimization. Journal of Optimization Theory and Applications, 85(3) : [Prague et al., 2012a] Prague, M., Commenges, D., Drylewicz, J., and Thiébaut, R. (2012a). Treatment monitoring of HIV-infected patients based on mechanistic models. Biometrics, 68(3) : [Prague et al., 2013a] Prague, M., Commenges, D., Guedj, J., Drylewicz, J., and Thiébaut, R. (2013a). Nimrod : A program for inference via a normal approximation of the posterior in models with random effects based on ordinary differential equations. Computer methods and programs in biomedicine, 111(2) : [Prague et al., 2013b] Prague, M., Commenges, D., and Thiébaut, R. (2013b). Dynamical models of biomarkers and clinical progression for personalized medicine : The HIV context. Advanced drug delivery reviews, 65 : [Prague et al., 2012b] Prague, M., Diakite, A., Commenges, D., et al. (2012b). Package marqlevalg -algorithme de levenberg-marquardt en r : Une alternative à optimx pour des problèmes de minimisation. 1ères Rencontres R - Bordeaux. [Presanis et al., 2011] Presanis, A., De Angelis, D., Goubar, A., Gill, O., and Ades, A. (2011). Bayesian evidence synthesis for a transmission dynamic model for HIV among men who have sex with men. Biostatistics, 12(4) : [Putter et al., 2002] Putter, H., Heisterkamp, S., Lange, J., and De Wolf, F. (2002). A bayesian approach to parameter estimation in HIV dynamical models. Statistics in medicine, 21(15) : [R Core Team, 2013] R Core Team (2013). R : A Language and Environment for Statistical Computing. R Foundation for Statistical Computing, Vienna, Austria. [Rabi et al., 2013] Rabi, S. A., Laird, G. M., Durand, C. M., Laskey, S., Shan, L., Bailey, J. R., Chioma, S., Moore, R. D., Siliciano, R. F., et al. (2013). Multi-step inhibition explains HIV-1 protease inhibitor pharmacodynamics and resistance. The Journal of clinical investigation, 123(9) :0 0. [Radhakrishnan and Hindmarsh, 1993] Radhakrishnan, K. and Hindmarsh, A. (1993). Comparing numerical methods for ordinary differential equations. LLNL report UCRL, ID [Raguin et al., 2004] Raguin, G., Chêne, G., Morand-Joubert, L., Taburet, A.-M., Droz, C., Le Tiec, C., Clavel, F., Girard, P.-M., Group, P.. S., et al. (2004). Salvage therapy with amprenavir, lopinavir and ritonavir 200 mg/d or 400 mg/d in HIV-infected patients in virological failure. Antiviral therapy, 9 : [Rakhmanina and la Porte, 2012] Rakhmanina, N. Y. and la Porte, C. J. (2012). Therapeutic drug monitoring of antiretroviral drugs in the management of human immunodeficiency virus infection. Therapeutic Drug Monitoring : Newer Drugs and Biomarkers, page 373. [Raue et al., 2009] Raue, A., Kreutz, C., Maiwald, T., Bachmann, J., Schilling, M., Klingmüller, U., and Timmer, J. (2009). Structural and practical identifiability analysis of partially observed dynamical models by exploiting the profile likelihood. Bioinformatics, 25(15) :

193 Bibliographie 193 [Reichert and Omlin, 1997] Reichert, P. and Omlin, M. (1997). On the usefulness of overparameterized ecological models. Ecological Modelling, 95(2) : [Retout and Mentré, 2003] Retout, S. and Mentré, F. (2003). Further developments of the fisher information matrix in nonlinear mixed effects models with evaluation in population pharmacokinetics. Journal of Biopharmaceutical Statistics, 13(2) : [Ribeiro and Bonhoeffer, 2000] Ribeiro, R. M. and Bonhoeffer, S. (2000). Production of resistant HIV mutants during antiretroviral therapy. Proceedings of the National Academy of Sciences, 97(14) : [Ribeiro et al., 2002] Ribeiro, R. M., Mohri, H., Ho, D. D., and Perelson, A. S. (2002). In vivo dynamics of t cell activation, proliferation, and death in HIV-1 infection : why are CD4+ but not CD8+ T cells depleted? Proceedings of the National Academy of Sciences, 99(24) : [Robins, 1987] Robins, J. (1987). A graphical approach to the identification and estimation of causal parameters in mortality studies with sustained exposure periods. Journal of chronic diseases, 40 :139S 161S. [Robins, 1989] Robins, J. (1989). The control of confounding by intermediate variables. Statistics in medicine, 8(6) : [Robins, 1998] Robins, J. M. (1998). Structural nested failure time models. Encyclopedia of Biostatistics. [Robins et al., 1992] Robins, J. M., Blevins, D., Ritter, G., and Wulfsohn, M. (1992). G- estimation of the effect of prophylaxis therapy for pneumocystis carinii pneumonia on the survival of AIDS patients. Epidemiology, pages [Robins et al., 2000] Robins, J. M., Hernán, M. Á., and Brumback, B. (2000). Marginal structural models and causal inference in epidemiology. Epidemiology, 11(5) : [Rodriguez-Novoa et al., 2006] Rodriguez-Novoa, S., Barreiro, P., Jimenez-Nacher, I., and Soriano, V. (2006). Overview of the pharmacogenetics of HIV therapy. The pharmacogenomics journal, 6(4) : [Rong et al., 2013] Rong, L., Guedj, J., Dahari, H., Coffield Jr, D. J., Levi, M., Smith, P., and Perelson, A. S. (2013). Analysis of hepatitis c virus decline during treatment with the protease inhibitor danoprevir using a multiscale model. PLoS computational biology, 9(3) :e [Rosenbaum, 2011] Rosenbaum, S. E. (2011). Basic pharmacokinetics and pharmacodynamics : An integrated textbook and computer simulations. John Wiley & Sons. [Rosenbloom et al., 2012] Rosenbloom, D. I., Hill, A. L., Rabi, S. A., Siliciano, R. F., and Nowak, M. A. (2012). Antiretroviral dynamics determines HIV evolution and predicts therapy outcome. Nature medicine, 18(9) : [Ross et al., 2007] Ross, L., Lim, M. L., Liao, Q., Wine, B., Rodriguez, A. E., Weinberg, W., and Shaefer, M. (2007). Prevalence of antiretroviral drug resistance and resistanceassociated mutations in antiretroviral therapy-naïve HIV-infected individuals from 40 united states cities. HIV clinical trials, 8(1) :1 8. [Rothenberg, 1971] Rothenberg, T. J. (1971). Identification in parametric models. Econometrica : Journal of the Econometric Society, pages [Rubin, 1974] Rubin, D. B. (1974). Estimating causal effects of treatments in randomized and nonrandomized studies. Journal of educational Psychology, 66(5) :688.

194 Bibliographie 194 [Rue et al., 2009] Rue, H., Martino, S., and Chopin, N. (2009). Approximate bayesian inference for latent gaussian models by using integrated nested laplace approximations. Journal of the royal statistical society : Series b (statistical methodology), 71(2) : [Sáez-Cirión et al., 2013] Sáez-Cirión, A., Bacchus, C., Hocqueloux, L., Avettand-Fenoel, V., Girault, I., Lecuroux, C., Potard, V., Versmisse, P., Melard, A., Prazuck, T., et al. (2013). Post-treatment HIV-1 controllers with a long-term virological remission after the interruption of early initiated antiretroviral therapy anrs visconti study. PLoS pathogens, 9(3) :e [Samet et al., 2001] Samet, J. H., Sullivan, L. M., Traphagen, E. T., and Ickovics, J. R. (2001). Measuring adherence among HIV-infected persons : Is MEMS consummate technology? AIDS and Behavior, 5(1) : [Sampah et al., 2011] Sampah, M. E. S., Shen, L., Jilek, B. L., and Siliciano, R. F. (2011). Dose response curve slope is a missing dimension in the analysis of HIV-1 drug resistance. Proceedings of the National Academy of Sciences, 108(18) : [Savic et al., 2012] Savic, R. M., Barrail-Tran, A., Duval, X., Nembot, G., Panhard, X., Descamps, D., Verstuyft, C., Vrijens, B., Taburet, A.-M., Goujard, C., et al. (2012). Effect of adherence as measured by mems, ritonavir boosting, and cyp3a5 genotype on atazanavir pharmacokinetics in treatment-naive hiv-infected patients. Clinical Pharmacology & Therapeutics, 92(5) : [Savkovic et al., 2012] Savkovic, B., Symonds, G., and Murray, J. M. (2012). Stochastic model of in-vivo X4 emergence during HIV infection : Implications for the CCR5 inhibitor maraviroc. PloS one, 7(7) :e [Schoenenberger et al., 2013] Schoenenberger, J. A., Aragones, A. M., Cano, S. M., Puig, T., Castello, A., Gomez-Arbones, X., and Porcel, J. M. (2013). The advantages of therapeutic drug monitoring in patients receiving antiretroviral treatment and experiencing medication-related problems. Therapeutic drug monitoring, 35(1) : [Sedaghat et al., 2008] Sedaghat, A. R., Dinoso, J. B., Shen, L., Wilke, C. O., and Siliciano, R. F. (2008). Decay dynamics of HIV-1 depend on the inhibited stages of the viral life cycle. Proceedings of the National Academy of Sciences, 105(12) : [Sedaghat et al., 2007] Sedaghat, A. R., Siliciano, J. D., Brennan, T. P., Wilke, C. O., and Siliciano, R. F. (2007). Limits on replenishment of the resting CD4+ T cell reservoir for HIV in patients on haart. PLoS pathogens, 3(8) :e122. [Seligmann et al., 1994] Seligmann, M., Warrell, D., Aboulker, J., Carbon, C., Darbyshire, J., Dormont, J., Eschwege, E., Girling, D., James, D., Levy, J., et al. (1994). Concorde : Mrc/anrs randomised double-blind controlled trial of immediate and deferred zidovudine in symptom-free HIV infection. Lancet, 343 : [Severe et al., 2010] Severe, P., Jean Juste, M. A., Ambroise, A., Eliacin, L., Marchand, C., Apollon, S., Edwards, A., Bang, H., Nicotera, J., Godfrey, C., et al. (2010). Early versus standard antiretroviral therapy for HIV-infected adults in haiti. New England Journal of Medicine, 363(3) : [Shafer, 2002] Shafer, R. W. (2002). Genotypic testing for human immunodeficiency virus type 1 drug resistance. Clinical Microbiology Reviews, 15(2) :

195 Bibliographie 195 [Shen et al., 2008] Shen, L., Peterson, S., Sedaghat, A. R., McMahon, M. A., Callender, M., Zhang, H., Zhou, Y., Pitt, E., Anderson, K. S., Acosta, E. P., et al. (2008). Doseresponse curve slope sets class-specific limits on inhibitory potential of anti-hiv drugs. Nature medicine, 14(7) : [Siliciano et al., 2003] Siliciano, J. D., Kajdas, J., Finzi, D., Quinn, T. C., Chadwick, K., Margolick, J. B., Kovacs, C., Gange, S. J., and Siliciano, R. F. (2003). Long-term follow-up studies confirm the stability of the latent reservoir for HIV-1 in resting CD4+ T cells. Nature medicine, 9(6) : [Smith and Wahl, 2005] Smith, R. and Wahl, L. (2005). Drug resistance in an immunological model of HIV-1 infection with impulsive drug effects. Bulletin of Mathematical Biology, 67(4) : [Snir et al., 1995] Snir, M., Otto, S. W., Walker, D. W., Dongarra, J., and Huss-Lederman, S. (1995). MPI : the complete reference. MIT press. [Spiegelhalter et al., 2002] Spiegelhalter, D. J., Best, N. G., Carlin, B. P., and van Der Linde, A. (2002). Bayesian measures of model complexity and fit. Journal of the Royal Statistical Society : Series B (Statistical Methodology), 64(4) : [Stahl et al., 1982] Stahl, R. E., Friedman-Kien, A., Dubin, R., Marmor, M., and Zolla- Pazner, S. (1982). Immunologic abnormalities in homosexual men : relationship to kaposi s sarcoma. The American journal of medicine, 73(2) : [Stanford-database, 2013] Stanford-database (2013). Acurated public database designed to reperesent, store and analyze the divergent of data underlying HIV drug resistance. HIV drug resistance :http ://hivdb.stanford.edu/. [Steimer et al., 1984] Steimer, J.-L., Mallet, A., Golmard, J.-L., and Boisvieux, J.-F. (1984). Alternative approaches to estimation of population pharmacokinetic parameters : comparison with the nonlinear mixed-effect model. Drug metabolism reviews, 15(1-2) : [Stephens et al., 2012] Stephens, A. J., Tchetgen, E. J. T., and De Gruttola, V. (2012). Augmented gee for improving efficiency and validity of estimation in cluster randomized trials by leveraging cluster-and individual-level covariates. Statistics in medicine, 31(10) :915. [Sterne et al., 2009] Sterne, J. A., May, M., Costagliola, D., De Wolf, F., Phillips, A. N., Harris, R., Funk, M. J., Geskus, R., Gill, J., Dabis, F., et al. (2009). Timing of initiation of antiretroviral therapy in AIDS-free HIV-1-infected patients : a collaborative analysis of 18 HIV cohort studies. The Lancet, 373(9672) : [Sullivan Pepe and Anderson, 1994] Sullivan Pepe, M. and Anderson, G. L. (1994). A cautionary note on inference for marginal regression models with longitudinal data and general correlated response data. Communications in Statistics-Simulation and Computation, 23(4) : [Suppes, 1970] Suppes, P. (1970). A probabilistic theory of causality. North-Holland publishing company- Amsterdam. [Syed et al., 2013] Syed, S. S., Balluz, R. S., Kabagambe, E. K., Meyer III, W. A., Lukas, S., Wilson, C. M., Kapogiannis, B. G., Nachman, S. A., and Sleasman, J. W. (2013). Assessment of biomarkers of cardiovascular risk among HIV type 1-infected adolescents : Role of soluble vascular cell adhesion molecule as an early indicator of endothelial inflammation. AIDS Research and Human Retroviruses, 29(3) :

196 Bibliographie 196 [Tan and Wu, 1998] Tan, W.-Y. and Wu, H. (1998). Stochastic modeling of the dynamics of CD4< sup>+</sup> t-cell infection by HIV and some monte carlo studies. Mathematical Biosciences, 147(2) : [Tarwater et al., 2001] Tarwater, P. M., Margolick, J. B., Jin, J., Phair, J. P., Detels, R., Rinaldo, C., Giorgi, J., and Muñoz, A. (2001). Increase and plateau of CD4 T- cell counts in the 31/2 years after initiation of potent antiretroviral therapy. AIDS, 27(2) : [Taylor et al., 2008] Taylor, B. S., Sobieszczyk, M. E., McCutchan, F. E., and Hammer, S. M. (2008). The challenge of HIV-1 subtype diversity. New England Journal of Medicine, 358(15) : [Taylor et al., 1994] Taylor, J. M., Cumberland, W., and Sy, J. (1994). A stochastic model for analysis of longitudinal AIDS data. Journal of the American Statistical Association, 89(427) : [Taylor et al., 1989] Taylor, J. M., Fahey, J. L., Detels, R., and Giorgi, J. V. (1989). CD4 percentage, CD4 number, and CD4 : CD8 ratio in HIV infection : which to choose and how to use. AIDS, 2(2) : [Thiébaut et al., 2006] Thiébaut, R., Guedj, J., Jacqmin-Gadda, H., Chêne, G., Trimoulet, P., Neau, D., and Commenges, D. (2006). Estimation of dynamical model parameters taking into account undetectable marker values. BMC medical research methodology, 6(1) :38. [Thiébaut et al., 2005] Thiébaut, R., Jacqmin-Gadda, H., Babiker, A., and Commenges, D. (2005). Joint modelling of bivariate longitudinal data with informative dropout and left-censoring, with application to the evolution of CD4+ cell count and HIV RNA viral load in response to treatment of HIV infection. Statistics in medicine, 24(1) : [Thiébaut et al., 2003] Thiébaut, R., Jacqmin-Gadda, H., Leport, C., Katlama, C., Costagliola, D., Le Moing, V., Morlat, P., Chêne, G., and the APROCO Study Group (2003). Bivariate longitudinal model for the analysis of the evolution of HIV RNA and CD4 cell count in HIV infection taking into account left censoring of HIV RNA measures. Journal of biopharmaceutical statistics, 13(2) : [Thompson et al., 2010] Thompson, M. A., Aberg, J. A., Cahn, P., Montaner, J. S., Rizzardini, G., Telenti, A., Gatell, J. M., Günthard, H. F., Hammer, S. M., Hirsch, M. S., et al. (2010). Antiretroviral treatment of adult HIV infection. JAMA : the journal of the American Medical Association, 304(3) : [Tierney and Kadane, 1986] Tierney, L. and Kadane, J. B. (1986). Accurate approximations for posterior moments and marginal densities. Journal of the American Statistical Association, 81(393) : [Tural et al., 2002] Tural, C., Ruiz, L., Holtzer, C., Schapiro, J., Viciana, P., González, J., Domingo, P., Boucher, C., Rey-Joly, C., Clotet, B., et al. (2002). Clinical utility of HIV-1 genotyping and expert advice : the havana trial. AIDS, 16(2) : [UNAIDS, 2013] UNAIDS (2013). Global report on AIDS page http ://www.unaids.org. [Vajpayee and Mohan, 2011] Vajpayee, M. and Mohan, T. (2011). Current practices in laboratory monitoring of HIV infection. The Indian journal of medical research, 134(6) :801.

197 Bibliographie 197 [van der Vaart, 2000] van der Vaart, A. (2000). Asymptotic statistics. Cambridge Univ Pr. [van Dulmen et al., 2007] van Dulmen, S., Sluijs, E., van Dijk, L., de Ridder, D., Heerdink, R., and Bensing, J. (2007). Patient adherence to medical treatment : a review of reviews. BMC health services research, 7(1) :55. [Volterra, 1928] Volterra, V. (1928). Variations and fluctuations of the number of individuals in animal species living together. J. Cons. Int. Explor. Mer, 3(1) :3 51. [Walter and Pronzato, 1997] Walter, E. and Pronzato, L. (1997). Identification of parametric models. Communications and Control Engineering. [Wang et al., 2012] Wang, L., Cao, J., Ramsay, J., Burger, D., Laporte, C., and Rockstroh, J. (2012). Estimating mixed-effects differential equation models. Statistics and Computing, pages [Wang and Bovik, 2009] Wang, Z. and Bovik, A. C. (2009). Mean squared error : love it or leave it? a new look at signal fidelity measures. Signal Processing Magazine, IEEE, 26(1) : [Wang et al., 2013] Wang, Z., Luo, J., Fu, G., Wang, Z., and Wu, R. (2013). Stochastic modeling of systems mapping in pharmacogenomics. Advanced drug delivery reviews. [Wei et al., 1995] Wei, X., Ghosh, S. K., Taylor, M. E., Johnson, V. A., Emini, E. A., Deutsch, P., Lifson, J. D., Bonhoeffer, S., Nowak, M. A., Hahn, B. H., et al. (1995). Viral dynamics in human immunodeficiency virus type 1 infection. Nature, 373(6510) : [Weiser et al., 2003] Weiser, S., Wolfe, W., Bangsberg, D., Thior, I., Gilbert, P., Makhema, J., Kebaabetswe, P., Dickenson, D., Mompati, K., Essex, M., et al. (2003). Barriers to antiretroviral adherence for patients living with hiv infection and aids in botswana. Journal of acquired immune deficiency syndromes (1999), 34(3) : [Wikipedia, 2013] Wikipedia (2013). The average course of untreated HIV page http ://en.m.wikipedia.org/wiki. [Williams, 1996] Williams, B. K. (1996). Adaptive optimization and the harvest of biological populations. Mathematical Biosciences, 136(1) :1 20. [Wittkop et al., 2008] Wittkop, L., Commenges, D., Pellegrin, I., Breilh, D., Neau, D., Lacoste, D., Pellegrin, J.-L., Chêne, G., Dabis, F., and Thiébaut, R. (2008). Alternative methods to analyse the impact of HIV mutations on virological response to antiviral therapy. BMC medical research methodology, 8(1) :68. [Wittkop et al., 2011] Wittkop, L., Günthard, H. F., De Wolf, F., Dunn, D., Cozzi-Lepri, A., de Luca, A., Kücherer, C., Obel, N., Von Wyl, V., Masquelier, B., et al. (2011). Effect of transmitted drug resistance on virological and immunological response to initial combination antiretroviral therapy for HIV (eurocoord-chain joint project) : a european multicohort study. The Lancet infectious diseases, 11(5) : [Wolfinger, 1999] Wolfinger, R. D. (1999). Fitting nonlinear mixed models with the new nlmixed procedure. In Proceedings of the 24th Annual SAS Users Group International Conference (SUGI 24), pages [Woodcock, 2007] Woodcock, J. (2007). The prospects for personalized medicine in drug development and drug therapy. Clinical Pharmacology & Therapeutics, 81(2) :

198 Bibliographie 198 [Wu et al., 2008] Wu, H., Zhu, H., Miao, H., and Perelson, A. S. (2008). Parameter identifiability and estimation of HIV/AIDS dynamic models. Bulletin of mathematical biology, 70(3) : [Xia and Moog, 2003] Xia, X. and Moog, C. H. (2003). Identifiability of nonlinear systems with application to HIV/AIDS models. Automatic Control, IEEE Transactions on, 48(2) : [Xiao et al., 2013] Xiao, Y., Miao, H., Tang, S., and Wu, H. (2013). Modeling antiretroviral drug responses for HIV-1 infected patients using differential equation models. Advanced drug delivery reviews, 65 : [Yates et al., 2007] Yates, A., Stark, J., Klein, N., Antia, R., and Callard, R. (2007). Understanding the slow depletion of memory CD4+ T cells in HIV infection. PLoS medicine, 4(5) :e177. [Yeni et al., 2002] Yeni, P. G., Hammer, S. M., Carpenter, C. C., Cooper, D. A., Fischl, M. A., Gatell, J. M., Gazzard, B. G., Hirsch, M. S., Jacobsen, D. M., Katzenstein, D. A., et al. (2002). Antiretroviral treatment for adult HIV infection in JAMA : the journal of the American Medical Association, 288(2) : [Zhang et al., 2004] Zhang, H., Zhou, Y., Alcock, C., Kiefer, T., Monie, D., Siliciano, J., Li, Q., Pham, P., Cofrancesco, J., Persaud, D., et al. (2004). Novel single-cell-level phenotypic assay for residual drug susceptibility and reduced replication capacity of drug-resistant human immunodeficiency virus type 1. Journal of virology, 78(4) : [Zhou et al., 2013] Zhou, S., Hu, Z., Ma, W., and Liao, F. (2013). Dynamics analysis of an HIV infection model including infected cells in an eclipse stage. Journal of Applied Mathematics, 2013.

199

200

201 Annexes

202

203 Annexe A Matériel supplémentaire Comp. Meth. and Prog. in Biomedecine

204

205

206

207

208

209 Annexe B Matériel supplémentaire Biometrics

210 Web-based Supplementary Materials : Treatment monitoring of HIV infected patients based on mechanistic models. Mélanie Prague 1,2,, Daniel Commenges 1,2, Julia Drylewicz 3 and Rodolphe Thiébaut 1,2 1 Univ. Bordeaux, ISPED, Centre INSERM U897-Épidémiologie-Biostatistique, F Bordeaux, France 2 INSERM, ISPED, Centre INSERM U897-Épidémiologie-Biostatistique, F Bordeaux, France 3 Department of Immunology, University Medical Center Utrecht, The Netherlands * 1 Web-based Supplementary Materials : Treatment monitoring and mechanistic models 1 1. Web Appendix A: Activated cell model A graphical representation of the activated cell model presented as a differential equation system in the main article is available in Figure 1. We distinguish two different equilibrium points. The Figure 1. Graphical representation of the activated cells model. trivial equilibrium without infection is: Q0 = (ρ+µt )λ, αµt +ρµq+µqµt αλ T0 =, αµt +ρµq+µqµt T 0 = 0, V0 = 0. If the basic reproductive number R0 is higher than or equal to one, after the introduction of virions, (1) the system stabilizes to a new non-trivial equilibrium: Q = λγπ+ρµ T µv γπ(α+µq), T = µ T µv, γπ T = λγπα ρµv µ T µq αµv µ T µt µv µ T µqµt γπµ T, (α+µq) V = λγπα ρµv µ T µq αµv µ T µt µv µ T µqµt γµ T. µv (α+µq) Otherwise the trivial equilibrium (1) is asymptotically reached. 2. Web Appendix B: Proof of the convergence of d tk opt toward dcrit when Doob s consistency theorem applies Let ξ be the random vector of biological parameters for a patient and ξ the true value of these parameters; here we omit the superscript i. We denote P Ft k ξ the posterior law of ξ knowing the

211 2 Biometrics 2012 available information Ftk at time t k. We also assume that we have identifiability (i.e., the information increases infinitely with time and the version of the posterior for ξ is essentially unique). With these assumptions, Doob s consistency theorem (see Van der (2000) p. 149 for details) ensures that the posterior distribution tends to a Dirac in the true value: P Ft k ξ L δ ξ tk. (2) R0 is a one-to-one function in the dose, thus, for a specific value of the biological parameters ξ, the critical dose is unique. Therefore, we can write the critical dose as a function of ξ implicitly defined as: R0 {ξ, dcrit(ξ)} = 1. (3) Since the application dcrit(ξ) : R p R is continuous, convergence in law of dcrit(ξ) toward dcrit(ξ ) holds by composition. Since dcrit(ξ ) is a constant, convergence in law is here equivalent to convergence in probability, so we have : dcrit(ξ) P d crit(ξ ). tk The properties of R0 and (3) lead to a perfect match between the events {dcrit(ξ) < d} and {R0(ξ, d) < 1}. Thus we have: P [{ dcrit(ξ) < d opt} tk F tk ] = P [{ R0(ξ, d tk opt) < 1 } Ftk] = ω, (4) This entails that d tk opt is the ω-quantile of P Ft k dcrit(ξ). Since the law of d crit(ξ) tends to a Dirac in dcrit(ξ ) any quantile of the law tends to dcrit(ξ ): d tk opt P d crit(ξ ). tk 3. Web Appendix C: Assessment of convergence reproducibility We ran our optimization algorithm from 10 different starting points drawn at random at one standard deviation of the mean of the prior. The average coefficient of variation of the values at convergence is 0.3. In particular for π, µv and µq we had only the order of magnitude. Thus the accuracy on the values of the parameters is not high. However we checked that the different Web-based Supplementary Materials : Treatment monitoring and mechanistic models 3 values obtained at convergence yielded essentially the same fit. We selected the patient with median viral load at the end of the study (labeled 663) and compared the fits (Figure 2) for three different stopping points: the one presented in Table 2 in the main article and stopping points with extreme values for the combination of parameters π, µv and µq (P1 : (1.48, 0.65, 9.35) and P2 : (4.97, 4.18, 10.72)). It is the case that these three sets of parameter values yield nearly the same trajectories for both viral load and CD4 count. Figure 2. Viral load and total CD4 count fits for the patient with median viral load at the end of study for 3 different stopping points: the one presented in Table 2 in the main article (black plain line), P1 (red point-dashed line) and P2 (blue dashed line). 4. Web Appendix D: Predictive ability for treatment change (quartile patients) We selected patients in the switch arm at each quartile values of the distribution of the viral load at the final visit (week 24) in the ALBI trial. The median patient (Q2) is presented in the article. The patients for the other quartiles (Q1 and Q3) are presented Figures 3 and 4. The organization of the figures is the same as in the article. We present the viral load and the total CD4 count: this is a fit for the first treatment phase (d4t+ddi) and a prediction after the treatment switch to AZT+3TC.

212 4 Biometrics 2012 We only used the first 12 weeks observations to update the parameters of the patients and predicted viral loads and CD4 counts after treatment switch. Most of the time, all the observations are in the 95% measurement error predictive interval for both viral load and CD4 count. Figure 3. Prediction of patient 881 (Q1) viral load and CD4 count after treatment change. We ignored a dose change from day 97 to day 99 because it only lasted 2 days and was considered as a reporting artefact. 5. Web Appendix E: Predictive ability for dose change (quartile patients) We selected patients with dose changes at each quartile values of the distribution of the viral load at the final visit (week 24) in the ALBI trial. Patient 316 (at the 6 th deciles) is presented in the main article as an illustration because of a large range of behaviors. Nevertheless, this is not the one with the most reduced MSE compared to the ITT fit (without taking into account adherence) as it is shown Table 1. The patients for the quartiles (Q1,Q2 and Q3) are presented Figures 5 to 7. The organization of the figures is the same as in the article. We present the viral load and the total CD4 count: the fit Web-based Supplementary Materials : Treatment monitoring and mechanistic models 5 Figure 4. Prediction of patient 748 (Q3) viral load and CD4 count after treatment change. Table 1 Comparison of mean MSE between ITT model and our model accounting for dose changes. MSE for Viral Load MSE for CD4 Count Patient ITT Dose model ITT Dose model 562 (Q1) (Q2) (D7) (Q3) for the ITT analysis and the step by step predictions taking into account dose changes (parameters of the patient with random effects are updated each time we have an additional observation; this is labeled by a color change). Most of the time, all the observations are in the 95% measurement error predictive interval for both viral load and CD4 count. We expect a better prediction on viral load than on CD4 count.

213 6 Biometrics 2012 Figure 5. Prediction of patient 562 (Q1) viral load and CD4 count accounting for dose changes. Figure 6. Prediction of patient 660 (Q2 median) viral load and CD4 count accounting for dose changes. Web-based Supplementary Materials : Treatment monitoring and mechanistic models 7 Figure 7. Prediction of patient 664 (Q3) viral load and CD4 count accounting for dose changes. References Van der, A. (2000). Asymptotic statistics. Cambridge Series in Statistical and Probabilistic Mathematics, Cambridge University Press, UK. Received September Revised December Accepted January 2012.

214 [c] Individualisation de la dose chez les patients infectés par le VIH : un algorihme de Robbins-Monro-Métropolis-Hastings Mélanie Prague 1,2, Daniel Commenges 1,2 1 INSERM, U897 Centre de Recherche en Épidémiologie et Biostatistiques, Bordeaux, France 2 Université de Bordeaux 2, Bordeaux, France Contexte Pour la plupart des patients infectés par le HIV, la charge virale peut être rendue indétectable par des traitements antirétroviraux hautement actifs. L enjeux principal est alors la qualité de vie : il faut réduire les effets secondaires des traitements. Dans la lignée des modèles méchanistiques, nous appliquons la théorie de contrôle optimal afin de proposer au patient la dose efficace de traitement la plus faible possible. Objectifs Évaluer les capacités prédictives de notre modélisation pour les changements de traitements et les changements de doses. Proposer une stratégie adaptative de traitement permettant l individualisation de la dose de traitement, diminuer la dose de traitement en controlant le risque de donner une dose de traitement trop faible au patient. Résultats : Capacité du modèle prédictif ALBI ANRS 070 : Les estimations ont été réalisées sur un jeux de données issu d un essai clinique composé de 3 bras ; AZT+3TC sur 24 semaines, d4t+ddi sur 24 semaines, AZT+3TC sur 12 semaines suivi de d4t+ddi sur 12 semaines (Molina et al., J. of Inf. Diseases, 1999) Prédictions aux changements de molécules de traitement : Nous sommes capable de prédire le rebond de la charge virale après le changement de traitement dṷ au fait qu AZT+3TC est inférieur à d4t+ddi. Modélisation de l intéraction VIH - système immunitaire Modélisation méchanistique à 4 compartiments. 4 types de cellules sont modélisées : les CD4 quiescents (Q), les CD4 activés (T ), les CD4 activés infectés (T ) et les virus (V ). dq dt = λ µqq αq + ρt dt dt = αq ρt µtt γvt dt dt = γvt µt T dv dt = πt µvv Prédictions aux changements de dose de traitement : Les prédiction sont plus proches des observations (triangles) que les fits ITT (gris). Paramètre Signification λ Taux de création de cellules Q µq Taux de décès des cellules Q α Taux d activation des cellules Q ρ Taux de désactivation des cellules T µt Taux de décès des cellules T γ Infectivité : Taux d infection des cellules T par les virus µt Taux de décès des cellules T π Taux de création des virus µv Taux de décès des virus Modélisation pharmaco-dynamique : prise en compte du traitement et de sa dose. Le traitement agit en diminuant l infectivité. L absence de données pour des doses 0.6 nous a contraint à faire une approximation linéaire pour les doses faibles. { γ0 + β(ψ(d(t))) γ = log(γ) = κd si d(t) 0.6 γ0 + β(0.6) κd 1 d(t) sinon Résultats : Individualisation de la dose de traitement Illustration : Simulation de 11 réajustements de doses espacés de 15 jours. (haut) Charge virale et CD4 observés (bas) d tk opt devient de plus en plus proche de dcrit. Modélisation statistique : prise en compte de la variabilité inter-individu avec un modèle mixte. Posons ξ i le vecteur des paramètres à estimer. Les effets aléatoires sont placés sur les paramètres α, λ et µt ξ l i = φl } + {{ zl i (t)βl } + ω } l i (t)ui {{ } Effets fixes Effets alèatoires l = Modèle d observation : prise en compte d erreurs de mesures et transformation pour assurer la normalité et l homoscédasticité. Charge virale : Yij1 = log 10 (V (tij, ξ i )) + ɛij1 Nombre total de CD4 : Yij2 = (Q(tij, ξ i ) + T (tij, ξ i ) + T (tij, ξ i )) ɛij2 Estimation MAP : les paramètres biologiques (9), les effets aléatoires (3), les effets traitements et les erreurs de mesures (2) sont estimés par un algorithme Newton-like par maximisation a Posteriori (Guedj et al., Biometrics, 2007). Prédiction : Calcul des paramètres individuels grâce aux estimateurs paramétriques empiriques de Bayes (Kass et Steffey, JASA, 1989). Caractérisation de la dose critique de traitement Trouver la dose critique qui minimiser une fonction de coṷt raisonnable pour le patient : Trouver la dose de traitement minimale (dcrit) pour laquelle le virus est indétectable Caractérisation du contrôle (R0) : R0 est le nombre de cellules moyen infectées par une cellule infectée. Ainsi, si R0 1 alors V est indétectable. R0 est strictement décroissant de la dose. παλγ R0 = µvµt (αµt + ρµq + µtµq) La dose critique est telle que R0(ξ, dcrit) = 1. Elle peut être calculée directement si les paramètres ξ i du patient sont connus. Stratégie adaptative de recherche de dose optimale pour le patient Contrôler la probabilité de donner une dose de traitement trop faible : Les paramètres ξ i sont inconnus. Nous disposons seulement d observations de biomarqueurs au temps tk (F i ). Par exemple, ω = 90%. tk ( ) P R0(ξ i, d tk opt ) < 1 F i tk = ω Algorithme Robbins-Monro-Métropolis-Hastings (RMMH) : (Robbins et Monro, Ann. Stat. Math., Hastings, Biometrika, 1970) 1 Tirer avec un algorithme de Métropolis-Hastings (MH) une réalisation des ξ i sachant F i tk 2 En déduire une réalisation a postériori de R0(ξ i, dn tk ) sachant F i tk 3 Injecter dans l algorithme de Robbins-Monro (RM) : d tk n+1 = d n tk + 1 n 0.65(ω I R0(ξ i,d t ) k n )<1 4 Tant que non convergence retour en 1 Propriétés asymptotiques : Nous prouvons mathématiquement que d tk opt est unique pour tout temps tk et converge vers dcrit lorsque l information sur le patient devient infinie. dn tk P d tk n opt d tk P opt tk dcrit(ξi ) Simulation pour 100 patients : MSE (distance entre d tk opt et dcrit) et pourcentage de d administration de dose trop faibles (toujours ω = 90%) Conclusion Temps MSE (ecart-type) % d tk opt < dcrit t0 = (0.113) 0% t1 = (0.095) 0% t2 = (0.017) 1% t3 = (0.010) 3% t4 = (0.007) 2% Notre modélisation est acceptable d un point de vue prédictif. Introduire la dose améliore le modèle. La stratégie adaptative de traitement RMMH permet de diminuer la dose de traitement sans impact significatif sur la charge virale et le nombre de CD4. d tk opt est proche de dcrit en un petit nombre d itérations. Le risque d administrer une dose trop faible est contrôlé. Les limitations évidentes sont le manque d information sur le patient (censure à gauche de la charge virale, dérive des paramètres... ), la mauvaise spécification du modèle et un mauvais choix de la fonction pharmaco-dynamique. La preuve de concept est faite : Extension possible à des données réelles. Une perspective intéressante serait de tester la procédure RMMH sur des données d essai avec administration de dose faibles et une adhéérence rigoureusement renseignée. References [1] Guedj, J., Thiébaut,, R., and Commenges, D. (2007) Biometrics 63(4), [2] Kass, R.E. and Steffey, D. (1989) Journal of American Statistical Association [3] Hastings, W.K. (1970) Biometrika 57(1), [4] Robbins, H. and Monro, S. (1951) The annals of Mathematical Statistics [5] Molina, J.M., Chêne, G., Ferchal, F., Journot, V., et al. (1999) J. of Infectious Diseases 180(2), 351. ISPED équipe Biostatistique, Bordeaux-France

infovihtal #6 hiver 2001

infovihtal #6 hiver 2001 infovihtal #6 Primo-infection Primo-infection Le stade qui suit l infection par le VIH est connu sous le nom de primo-infection ou phase aiguë de l infection à VIH. Quand le VIH entre dans l organisme

Plus en détail

Virus: Virus: Diversité génétique. Diversité génétique et variation antigénique. Virus: Conséquences épidémiologiques et thérapeutiques

Virus: Virus: Diversité génétique. Diversité génétique et variation antigénique. Virus: Conséquences épidémiologiques et thérapeutiques Virus: Diversité génétique et variation antigénique Conséquences épidémiologiques et thérapeutiques M. Segondy Virus: Diversité génétique Virus: Génome + Capside ± Enveloppe 1 Virus: Diversité génétique

Plus en détail

LE SIDA: UNE AFFECTION DU SYSTEME IMMUNITAIRE

LE SIDA: UNE AFFECTION DU SYSTEME IMMUNITAIRE LE SIDA: UNE AFFECTION DU SYSTEME IMMUNITAIRE Introduction: Le SIDA, ou syndrome immunodéficience acquise, est une maladie due à un virus, le virus de l'immunodéficience humaine ou VIH (HIV: Human Immunodeficiency

Plus en détail

Détection et prise en charge de la résistance aux antirétroviraux

Détection et prise en charge de la résistance aux antirétroviraux Détection et prise en charge de la résistance aux antirétroviraux Jean Ruelle, PhD AIDS Reference Laboratory, UCLouvain, Bruxelles Corata 2011, Namur, 10 juin 2011 Laboratoires de référence SIDA (Belgique)

Plus en détail

Journées Nationales d Infectiologie. en 2007 pour un. 15 Juin 2007

Journées Nationales d Infectiologie. en 2007 pour un. 15 Juin 2007 Journées Nationales d Infectiologie Quelles exigences en 2007 pour un nouvel Inhibiteur de Protéase? 15 Juin 2007 Journées Nationales d Infectiologie Quelles exigences en 2007 pour un nouvel inhibiteur

Plus en détail

COMMISSION DE LA TRANSPARENCE AVIS. 04 juillet 2012

COMMISSION DE LA TRANSPARENCE AVIS. 04 juillet 2012 COMMISSION DE LA TRANSPARENCE AVIS 04 juillet 2012 Examen du dossier des spécialités inscrites pour une durée de 5 ans à compter du 19/09/2007 (JO du 07/04/2009). VIRACEPT 50 mg/g, poudre orale Flacon

Plus en détail

LIGNES DIRECTRICES CLINIQUES TOUT AU LONG DU CONTINUUM DE SOINS : Objectif de ce chapitre. 6.1 Introduction 86

LIGNES DIRECTRICES CLINIQUES TOUT AU LONG DU CONTINUUM DE SOINS : Objectif de ce chapitre. 6.1 Introduction 86 LIGNES DIRECTRICES CLINIQUES TOUT AU LONG DU CONTINUUM DE SOINS : ÉTABLISSEMENT DE LIENS ENTRE LES PERSONNES CHEZ QUI UN DIAGNOSTIC D INFECTION À VIH A ÉTÉ POSÉ ET LES SERVICES DE SOINS ET DE TRAITEMENT

Plus en détail

Lecture historique et prospective du rôle de la barrière génétique

Lecture historique et prospective du rôle de la barrière génétique Lecture historique et prospective du rôle de la barrière génétique Clotilde Allavena NANTES Symposium JANSSEN JNI 2011, Toulouse Jusqu en 1996, la montée en puissance Bithérapie 2 NUCs Trithérapie 2 NUCs

Plus en détail

Quels bénéfices cliniques d une indétectabilité rapide? Pascale Leclercq CHU Grenoble

Quels bénéfices cliniques d une indétectabilité rapide? Pascale Leclercq CHU Grenoble Quels bénéfices cliniques d une indétectabilité rapide? Pascale Leclercq CHU Grenoble Quels liens entre puissance et rapidité d action? Est-ce un avantage d obtenir une décroissance virale rapide? Dans

Plus en détail

Prise en charge du. Dr FERNANE.Arezki Hôpital André Grégoire Montreuil

Prise en charge du. Dr FERNANE.Arezki Hôpital André Grégoire Montreuil Prise en charge du nouveau-né de mère m HIV Dr FERNANE.Arezki Hôpital André Grégoire Montreuil GROSSESSE Chez une femme infecté par le VIH,la grossesse est a risque = prise en charge multidisciplinaire

Plus en détail

Charges virales basses sous traitement: définition impact virologique. Laurence Bocket Virologie CHRU de Lille

Charges virales basses sous traitement: définition impact virologique. Laurence Bocket Virologie CHRU de Lille XVIIe Journée Régionale de Pathologie Infectieuse 12 octobre 2010 Charges virales basses sous traitement: définition impact virologique Laurence Bocket Virologie CHRU de Lille conflits d intérêts subventions,

Plus en détail

Traitement et questions connexes

Traitement et questions connexes Traitement et questions connexes L essentiel du congrès sur le sida AIDS 2012 (et des ateliers du congrès 14 th International Workshops on Comorbidities and Adverse Drug Reactions in HIV, juillet 2012)

Plus en détail

DÉTECTION DU GÉNOME DU VIH

DÉTECTION DU GÉNOME DU VIH DÉTECTION DU GÉNOME DU VIH AU SEIN DES FRACTIONS DU SPERME Classement NABM : 16-02 - code : non codé JUILLET 2006 Service évaluation des actes professionnels 2 avenue du Stade de France 93218 Saint-Denis

Plus en détail

Lettre à l éditeur. Résistance du VIH aux Antirétroviraux : Quoi de neuf au Mali? Quelles. perspectives?

Lettre à l éditeur. Résistance du VIH aux Antirétroviraux : Quoi de neuf au Mali? Quelles. perspectives? Lettre à l éditeur Résistance du VIH aux Antirétroviraux : Quoi de neuf au Mali? Quelles perspectives? HIV Antiretroviral Drug Resistance: What s new in Mali? What is the future? Maiga AI 1,2, Sangare

Plus en détail

Pathologie VIH. Service maladies infectieuses Archet 1. Françoise ALEXIS, infirmière Monique BORGHI, infirmière 15 octobre 2013

Pathologie VIH. Service maladies infectieuses Archet 1. Françoise ALEXIS, infirmière Monique BORGHI, infirmière 15 octobre 2013 Pathologie VIH Service maladies infectieuses Archet 1 Françoise ALEXIS, infirmière Monique BORGHI, infirmière 15 octobre 2013 Les traitements antirétroviraux Sont classés en 5 familles selon leur mode

Plus en détail

Prévention de la transmission mère-enfant du VIH

Prévention de la transmission mère-enfant du VIH Prévention de la transmission mère-enfant du VIH Rapport Morlat2013 REUNION COREVIH - Vendredi 17 Janvier 2014 Docteur Yasmine DEBAB Service des Maladies Infectieuses et Tropicales CHU Rouen 1 I. Désir

Plus en détail

L adhésion au traitement: les clés du succès

L adhésion au traitement: les clés du succès L adhésion au traitement: les clés du succès Dr Marie P. Schneider, pharmacienne Policlinique Médicale Universitaire Lausanne CHUV avril 005 Mme W.M. 970 Patiente d origine angolaise, en Suisse depuis

Plus en détail

Vivre avec le VIH. Point de départ

Vivre avec le VIH. Point de départ Vivre avec le VIH Point de départ Vous venez d apprendre que vous avez le VIH et vous cherchez des repères? Nous pouvons vous aider. Voici quelques questions auxquelles vous trouverez réponse dans ce livret

Plus en détail

Résistance du VIH-1 aux antirétroviraux dans les compartiments anatomiques et cellulaires

Résistance du VIH-1 aux antirétroviraux dans les compartiments anatomiques et cellulaires Résistance du VIH-1 aux antirétroviraux dans les compartiments anatomiques et cellulaires Jade GHOSN Laboratoire de Virologie CHU Necker-Enfants Malades EA MRT 3620 Paris 5 Réservoirs anatomiques du VIH:

Plus en détail

Cycle de réplication. Webinaire présenté par : Michael Bailey, directeur, Réalisation des programmes Date : 6 février 2014, de 13 h à 14 h (HNE)

Cycle de réplication. Webinaire présenté par : Michael Bailey, directeur, Réalisation des programmes Date : 6 février 2014, de 13 h à 14 h (HNE) Cycle de réplication virale du VIH Webinaire présenté par : Michael Bailey, directeur, Réalisation des programmes Date : 6 février 2014, de 13 h à 14 h (HNE) Pourquoi est-ce important de comprendre le

Plus en détail

Septembre 2006 Rapport sur un nouveau médicament breveté - Reyataz

Septembre 2006 Rapport sur un nouveau médicament breveté - Reyataz Septembre 2006 Rapport sur un nouveau médicament breveté - Reyataz Au titre de son initiative de transparence, le CEPMB publie les résultats des examens des prix des nouveaux médicaments brevetés effectués

Plus en détail

LE MEILLEUR DE LA CROI 2013 - VIROLOGIE. Marie Leoz 12 avril 2013

LE MEILLEUR DE LA CROI 2013 - VIROLOGIE. Marie Leoz 12 avril 2013 LE MEILLEUR DE LA CROI 2013 - VIROLOGIE Marie Leoz 12 avril 2013 Réservoirs, Persistance et Eradication Qu est-ce que le réservoir? Caractérisation des cellules réservoirs Stratégies de traitement précoce

Plus en détail

En partenariat avec l association «Dessine-moi un mouton» Adolescence & VIH

En partenariat avec l association «Dessine-moi un mouton» Adolescence & VIH En partenariat avec l association «Dessine-moi un mouton» Adolescence & VIH En tant qu adolescents ou jeunes adultes, vous pouvez avoir besoin d informations spécifiques sur votre maladie et sa prise en

Plus en détail

Journées scientifiques du site ANRS Cameroun: 15-16 novembre 2011

Journées scientifiques du site ANRS Cameroun: 15-16 novembre 2011 Journées scientifiques du site ANRS Cameroun: 15-16 novembre 2011 Projet ANRS-12186 Évaluation de l échec virologique et résistance aux ARV chez des patients VIH positifs pris en charge dans les programmes

Plus en détail

COMMISSION DE LA TRANSPARENCE AVIS. 9 mai 2012. rilpivirine Code ATC (2012): J05AG05 (inhibiteur non nucléosidique de la transcriptase inverse)

COMMISSION DE LA TRANSPARENCE AVIS. 9 mai 2012. rilpivirine Code ATC (2012): J05AG05 (inhibiteur non nucléosidique de la transcriptase inverse) COMMISSION DE LA TRANSPARENCE AVIS 9 mai 2012 EDURANT 25 mg, comprimés pelliculés Flacon/30 (CIP: 219 472-9) Laboratoire JANSSEN-CILAG rilpivirine Code ATC (2012): J05AG05 (inhibiteur non nucléosidique

Plus en détail

Généralités sur les virus Structure, Réplication, Évolution

Généralités sur les virus Structure, Réplication, Évolution Généralités sur les virus Structure, Réplication, Évolution Les virus sont des microorganismes de très petite taille, 20 à 300 nanomètres, 100 fois plus petit qu une bactérie, non visibles en microscopie

Plus en détail

brochure papamamanbebe.net Comment faire un bébé? Des parents concernés par le VIH vous expliquent

brochure papamamanbebe.net Comment faire un bébé? Des parents concernés par le VIH vous expliquent 1 brochure Comment faire un bébé? Des parents concernés par le VIH vous expliquent OUI c est possible de faire un bébé quand on a le VIH! Alors, comment faire? Vous devez protéger votre partenaire et votre

Plus en détail

Avis 6 novembre 2013

Avis 6 novembre 2013 COMMISSION DE LA TRANSPARENCE Avis 6 novembre 2013 ISENTRESS, comprimé à croquer 25 mg Flacon de 60 comprimés (CIP : 3400926992408) ISENTRESS, comprimé à croquer sécable 100 mg Flacon de 60 comprimés (CIP

Plus en détail

Hépatite chronique B Moyens thérapeutiques

Hépatite chronique B Moyens thérapeutiques Hépatite chronique B Moyens thérapeutiques Dr Olfa BAHRI Laboratoire de Virologie Clinique Institut Pasteur de Tunis INTRODUCTION Plus de 300. 10 6 porteurs chroniques de VHB dans le monde Hépatite chronique

Plus en détail

Le genre masculin utilisé dans ce document désigne aussi bien les femmes que les hommes.

Le genre masculin utilisé dans ce document désigne aussi bien les femmes que les hommes. Ce document est destiné aux personnes vivant avec le VIH. Il a été révisé en janvier 2004 par les membres du Comité consultatif pour la prise en charge clinique des personnes vivant avec le VIH-SIDA en

Plus en détail

Le SIDA. Et toi, Qu est-ce que tu connais. De cette maladie?

Le SIDA. Et toi, Qu est-ce que tu connais. De cette maladie? Le SIDA Et toi, Qu est-ce que tu connais De cette maladie? Sommaire 1 partie : Testez vos connaissances Pages jaunes 1. Çà veut dire quoi cette maladie 2. Comment peux-tu l attraper? 3. Prendre un risque,

Plus en détail

Grossesse chez la femme infectée par le VIH en 2012

Grossesse chez la femme infectée par le VIH en 2012 74e JOURNEE FRANCAISE DE MEDECINE - 4 MAI 2012 Grossesse chez la femme infectée par le VIH en 2012 Pr Laurent Mandelbrot Service de Gynécologie-Obstétrique, Pôle Femme/Enfant Hôpital Louis Mourier, Colombes

Plus en détail

Dr Pantxika BELLECAVE MFP- UMR 5234 Laboratoire de virologie du Pr. Fleury

Dr Pantxika BELLECAVE MFP- UMR 5234 Laboratoire de virologie du Pr. Fleury Dr Pantxika BELLECAVE MFP- UMR 5234 Laboratoire de virologie du Pr. Fleury 1 er cas SIDA MONO BI HAART (TRITHERAPIE) 1981 1987 1991 1992 1991 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005

Plus en détail

UTILISATION DES ANTIRÉTROVIRAUX POUR TRAITER LA FEMME ENCEINTE ET PRÉVENIR L INFECTION À VIH CHEZ LE NOURRISSON

UTILISATION DES ANTIRÉTROVIRAUX POUR TRAITER LA FEMME ENCEINTE ET PRÉVENIR L INFECTION À VIH CHEZ LE NOURRISSON Programme VIH/sida MISE À JOUR PROGRAMMATIQUE UTILISATION DES ANTIRÉTROVIRAUX POUR TRAITER LA FEMME ENCEINTE ET PRÉVENIR L INFECTION À VIH CHEZ LE NOURRISSON RÉSUMÉ ANALYTIQUE AVRIL 2012 WHO/HIV/2012.8

Plus en détail

Le VIH et votre foie

Le VIH et votre foie Le VIH et votre foie Le VIH et votre foie Que dois-je savoir au sujet de mon foie? Votre foie joue un rôle incroyablement important. Il filtre votre sang en éliminant les substances nocives (toxiques)

Plus en détail

Etude APROVIR: Résumé du protocole

Etude APROVIR: Résumé du protocole AntiPROtéases COhorte Résumé Objectif principal Etudier l'évolution clinique et biologique des patients infectés par le VIH débutant un traitement avec antiprotéase dans le contexte de la pratique actuelle

Plus en détail

Impact économique de la nouvelle indication de PREZISTA sur le budget de l assurance maladie

Impact économique de la nouvelle indication de PREZISTA sur le budget de l assurance maladie Impact économique de la nouvelle indication de PREZISTA sur le budget de l assurance maladie Annabelle Godet 1, Dan Havet 1, Anne Anceau 1, Julien Robert 2 Antoine Lafuma 2 1 Janssen, Issy les Moulineaux,

Plus en détail

Item 169 : Évaluation thérapeutique et niveau de preuve

Item 169 : Évaluation thérapeutique et niveau de preuve Item 169 : Évaluation thérapeutique et niveau de preuve COFER, Collège Français des Enseignants en Rhumatologie Date de création du document 2010-2011 Table des matières ENC :...3 SPECIFIQUE :...3 I Différentes

Plus en détail

Situation actuelle. Attachée temporaire d enseignement et de recherche (section CNU 25) à l Université Paris 2. Thèmes de recherche

Situation actuelle. Attachée temporaire d enseignement et de recherche (section CNU 25) à l Université Paris 2. Thèmes de recherche Cyrielle DUMONT Docteur en biostatistiques Née le 9 mai 1985 à Chartres (28) Adresse : Université Paris 2 12 place du Panthéon 75005 Paris Courriel : cyrielle.dumont@inserm.fr Page personnelle : www.biostat.fr/home-dumont.htm

Plus en détail

Les Enjeux et Défis de la troisième ligne en Afrique. Solthis le 28/06/2012

Les Enjeux et Défis de la troisième ligne en Afrique. Solthis le 28/06/2012 Les Enjeux et Défis de la troisième ligne en Afrique Solthis le 28/06/2012 Évolution des recommandations OMS pays à ressources limitées 2002 2006 2010 d4t +++ d4t ± Arrêt d4t, AZT ++, TDF ++ CD4+/- CV

Plus en détail

L investigation chez la personne infectée par le VIH

L investigation chez la personne infectée par le VIH P O U R Q U O I P A R L E R D U V I H E N 2 0 0 4? 2 L investigation chez la personne infectée par le VIH quand et comment utiliser les différents tests de laboratoire? par Harold Dion Paul, un homme de

Plus en détail

Les stratégies de traitement VIH: nouvel algorithme des IP

Les stratégies de traitement VIH: nouvel algorithme des IP Les stratégies de traitement VIH: nouvel algorithme des IP Dr Laurence Bocket Service de virologie CHRU de Lille XIème journée régionale de Pathologie Infectieuse - 27 Septembre 2005 - Lille Résistance

Plus en détail

ABL and Evivar Medical for Strategic Partnership and Alliance in HIV and Hepatitis

ABL and Evivar Medical for Strategic Partnership and Alliance in HIV and Hepatitis ABL and Evivar Medical for Strategic Partnership and Alliance in HIV and Hepatitis Conférence de Presse ABL SA - Chambre de Commerce de Luxembourg - Mardi 29 Septembre 2009, 18h Annonce de Presse ABL and

Plus en détail

Comment se manifeste cette maladie? Comment repérer la séropositivité au SIDA? -> Discussion préparatoire.

Comment se manifeste cette maladie? Comment repérer la séropositivité au SIDA? -> Discussion préparatoire. I.7 Immunologie 1/4. Le SIDA Le système immunitaire est l ensemble des cellules et tissus d un individu pouvant s opposer à la pénétration et à l infection par des micro-organismes. Les moyens «de défense»

Plus en détail

C N (1,2), MA (1), X (1), G (1), M (1), T (1), C (2), P (3), M (4), V (1,5), JP (1,5), PN. (1), E

C N (1,2), MA (1), X (1), G (1), M (1), T (1), C (2), P (3), M (4), V (1,5), JP (1,5), PN. (1), E Caractérisation phénotypique et rôle des lymphocytes T régulateurs intra- hépatiques au cours de l hépatite chronique virale C N Sturm (1,2), MA Thélu (1), X Camous (1), G Dimitrov (1), M Ramzan (1), T

Plus en détail

Traitements futurs. Traitements de la SP 2014-10-01. I. Prévention de la maladie II. Prévention des poussées III. Neuroprotection et remyélinisation

Traitements futurs. Traitements de la SP 2014-10-01. I. Prévention de la maladie II. Prévention des poussées III. Neuroprotection et remyélinisation Traitements futurs Dr François Grand Maison, neurologue et directeur, clinique Neuro Rive Sud Traitements de la SP I. Prévention de la maladie II. Prévention des poussées III. Neuroprotection et remyélinisation

Plus en détail

2-1- Modalités de la trithérapie antirétrovirale chez la femme enceinte

2-1- Modalités de la trithérapie antirétrovirale chez la femme enceinte PRÉVENTION DE LA TRANSMISSION MÈRE-ENFANT 2-1- Modalités de la trithérapie antirétrovirale chez la femme enceinte 2-1-1- Objectif du traitement L objectif du traitement antirétroviral est l obtention d

Plus en détail

VIH. Dr Chakib ALLOUI. Laboratoire de Bactériologie, Virologie, Hygiène CHU Avicenne Université Paris 13 (Bobigny)

VIH. Dr Chakib ALLOUI. Laboratoire de Bactériologie, Virologie, Hygiène CHU Avicenne Université Paris 13 (Bobigny) VIH Dr Chakib ALLOUI Laboratoire de Bactériologie, Virologie, Hygiène CHU Avicenne Université Paris 13 (Bobigny) DCEM 1, le 23.10.2007 Historique 1981 Juin : premiers cas groupés de pneumocystose chez

Plus en détail

QU EST-CE QUE LA PROPHYLAXIE?

QU EST-CE QUE LA PROPHYLAXIE? QU EST-CE QUE LA PROPHYLAXIE? TABLES DES MATIÈRES Publié par la Fédération mondiale de l hémophilie (FMH) Fédération mondiale de l hémophilie, 2014 La FMH encourage la traduction et la redistribution de

Plus en détail

COMMISSION DE LA TRANSPARENCE. Avis. 20 juillet 2005

COMMISSION DE LA TRANSPARENCE. Avis. 20 juillet 2005 COMMISSION DE LA TRANSPARENCE Avis 20 juillet 2005 1 flacon(s) en verre de 0,5 ml : 557 767-8 3 flacon(s) en verre de 0,5 ml : 557 768-4 12 flacon(s) en verre de 0,5 ml : 557 769-0 6 flacon(s) en verre

Plus en détail

Pr Bernard Combe. Immuno-Rhumatologie, Hôpital Lapeyronie CHU de Montpellier

Pr Bernard Combe. Immuno-Rhumatologie, Hôpital Lapeyronie CHU de Montpellier Journal de L ANDAR (Association Nationale de Défense contre l Arthrite Rhumatoîde) octobre2008 Le Mabthéra dans la polyarthrite rhumatoïde Pr Bernard Combe Immuno-Rhumatologie, Hôpital Lapeyronie CHU de

Plus en détail

Structure générale d'une particule virale de type herpès

Structure générale d'une particule virale de type herpès Virus de type herpès et coquillages 1 - Caractéristiques des virus de type herpès infectant les coquillages Des infections à virus de type herpès sont associées à des mortalités massives chez différentes

Plus en détail

Aspects virologiques de l infection l. à VIH

Aspects virologiques de l infection l. à VIH CHU Saint Louis Paris Aspects virologiques de l infection l à VIH Constance Delaugerre SFLS Mars 2010 2008 Inhibiteur de corécepteur Inhibiteurs de TI INTI 1985 INNTI 1998 2008 Inhibiteurs d intégrase

Plus en détail

ÉPIDEMIOLOGIE DU SIDA ET DE L INFECTION À VIH EN BELGIQUE

ÉPIDEMIOLOGIE DU SIDA ET DE L INFECTION À VIH EN BELGIQUE Service maladies infectieuses dans la population générale ÉPIDEMIOLOGIE DU SIDA ET DE L INFECTION À VIH EN BELGIQUE Situation au 31 décembre ÉPIDEMIOLOGIE DU SIDA ET DE L INFECTION À VIH EN BELGIQUE Ce

Plus en détail

Chapitre 5 : lutter contre l infection

Chapitre 5 : lutter contre l infection Chapitre 5 : lutter contre l infection Mais, que dois-je savoir? Pour rattraper un cours manquant, retrouve-le sur le site du collège dans la rubrique «enseignements» : Contrat-élève 3 ème Chapitre 5 :

Plus en détail

Mise à jour VIH Revue des données récentes concernant les nouveaux traitements antiviraux

Mise à jour VIH Revue des données récentes concernant les nouveaux traitements antiviraux Mise à jour VIH Revue des données récentes concernant les nouveaux traitements antiviraux Soutenu par une bourse indépendante de formation de ViiV Healthcare. www.medscape.org/viewarticle/826417 Mise à

Plus en détail

COMMISSION DE LA TRANSPARENCE AVIS DE LA COMMISSION. 10 octobre 2001

COMMISSION DE LA TRANSPARENCE AVIS DE LA COMMISSION. 10 octobre 2001 COMMISSION DE LA TRANSPARENCE AVIS DE LA COMMISSION 10 octobre 2001 VIRAFERONPEG 50 µg 80 µg 100 µg 120 µg 150 µg, poudre et solvant pour solution injectable B/1 B/4 Laboratoires SCHERING PLOUGH Peginterféron

Plus en détail

Analyse de survie appliquée à la modélisation de la transmission des maladies infectieuses : mesurer l impact des interventions

Analyse de survie appliquée à la modélisation de la transmission des maladies infectieuses : mesurer l impact des interventions Analyse de survie appliquée à la modélisation de la transmission des maladies infectieuses : mesurer l impact des interventions Génia Babykina 1 & Simon Cauchemez 2 1 Université de Lille, Faculté Ingénierie

Plus en détail

Août 2010. a thérapie. antirétrovirale. pour les adultes infectés par le VIH. Guide pour les professionnels de la santé du Québec

Août 2010. a thérapie. antirétrovirale. pour les adultes infectés par le VIH. Guide pour les professionnels de la santé du Québec Août 2010 a thérapie antirétrovirale pour les adultes infectés par le VIH Guide pour les professionnels de la santé du Québec Août 2010 a thérapie antirétrovirale pour les adultes infectés par le VIH

Plus en détail

57 ème Répi. Les résistances virales aux traitements anti-vih

57 ème Répi. Les résistances virales aux traitements anti-vih 57 ème Répi Les résistances virales aux traitements anti-vih Le virus du sida est considéré comme le plus variable des agents viraux, à l origine d une maladie humaine ; cela est dû à son haut niveau de

Plus en détail

Études cliniques sur les essais de thérapies cellulaires et géniques de phase précoce

Études cliniques sur les essais de thérapies cellulaires et géniques de phase précoce Études cliniques sur les essais de thérapies cellulaires et géniques de phase précoce DIAPOSITIVE 1 Cette présentation a trait aux études cliniques précoces portant sur les thérapies cellulaires et géniques.

Plus en détail

VIH & Interactions Médicamenteuses

VIH & Interactions Médicamenteuses VIH & Interactions Médicamenteuses L ABC en quizz K. De Heller & M.Cavassini MIN-IAL, le 21 avril 2005 Ce que je ne vais pas aborder Les interactions médicamenteuses entre les différents antirétroviraux!!!

Plus en détail

DW Radio Learning By Ear Feuilleton VIH «Un ange en chacun de nous» Ep.8

DW Radio Learning By Ear Feuilleton VIH «Un ange en chacun de nous» Ep.8 Learning by Ear HIV «Un ange en chacun de nous», 8 e épisode Texte : Romie Singh Rédaction : Maja Dreyer Adaptation : Christophe Lascombes PERSONNAGES : Pinto, Angela, Jet, marabout, Annie, infirmière

Plus en détail

Immunité anti-tumorale

Immunité anti-tumorale Immunité anti-tumorale Professeur M GUENOUNOU Laboratoire d Immunologie & Microbiologie UFR de Pharmacie 51100 REIMS 1- Cellules tumorales - Une tumeur est une prolifération clonale issue d une cellule

Plus en détail

Aspects pharmacologiques des molécules anti-vhc

Aspects pharmacologiques des molécules anti-vhc Aspects pharmacologiques des molécules anti-vhc Caroline SOLAS Laboratoire de Pharmacocinétique et Toxicologie CHU Timone, Marseille CRO2, INSERM U911 Faculté de Pharmacie, Marseille Principales Caractéristiques

Plus en détail

Médecine 4P Prédictive, Préventive, Personnalisée, Participative Les enjeux

Médecine 4P Prédictive, Préventive, Personnalisée, Participative Les enjeux Médecine 4P Prédictive, Préventive, Personnalisée, Participative Les enjeux Unité Inserm UMR 1087-CNRS UMR 6291 Hervé Le Marec Evolution de la médecine et de la recherche biomédicale développement de traitements

Plus en détail

Traitement ARV de l'infection à VIH chez l'adulte et l'adolescent

Traitement ARV de l'infection à VIH chez l'adulte et l'adolescent Notes Traitement ARV de l'infection à VIH chez l'adulte et l'adolescent Module 5 Contexte Les traitements ARV sont des médicaments destinés à bloquer la multiplication du VIH. Leur bonne utilisation chez

Plus en détail

Analyses dans les essais thérapeutiques :

Analyses dans les essais thérapeutiques : 6ème Université d été Recherche et Evaluation en Cancérologie Analyses dans les essais thérapeutiques : analyses intermédiaires, finale et cross-over. M. Bouziani (Oran) 1 Laboratoire de biostatistique

Plus en détail

Tutoriel pour les enseignants de lycée. Rappel du contenu des programmes au lycée en classe de seconde

Tutoriel pour les enseignants de lycée. Rappel du contenu des programmes au lycée en classe de seconde Tutoriel pour les enseignants de lycée Ce document sert à l enseignant pour préparer différentes séquences pédagogiques afin d aborder : les questions de la génétique, des maladies génétiques, et les métiers

Plus en détail

brochure papamamanbebe.net COMMENT FAIRE UN BÉBÉ? Des parents concernés par le VIH vous expliquent

brochure papamamanbebe.net COMMENT FAIRE UN BÉBÉ? Des parents concernés par le VIH vous expliquent 1 brochure papamamanbebe.net COMMENT FAIRE UN BÉBÉ? Des parents concernés par le VIH vous expliquent OUI c est possible de faire un bébé quand on a le VIH! Alors, comment faire? Vous devez protéger votre

Plus en détail

Entretien du professeur Dartigues, directeur de l unité Inserm U897 de l Université de Bordeaux

Entretien du professeur Dartigues, directeur de l unité Inserm U897 de l Université de Bordeaux Entretien du professeur Dartigues, directeur de l unité Inserm U897 de l Université de Bordeaux - Que pensez vous du débat suscité par l article paru dans Sciences et Avenir sur l association entre benzodiazépines

Plus en détail

Université D Oran, Faculté de Médecine, Service D Histologie-Embryologie Dr Belarbi-Amar. Le virus. Les virus(acaryotes)

Université D Oran, Faculté de Médecine, Service D Histologie-Embryologie Dr Belarbi-Amar. Le virus. Les virus(acaryotes) Les virus(acaryotes) Le virus I-Généralités : Le virus (cellule acaryote) est une entité biologique incapable de se reproduire de façon autonome, nécessitant une cellule hôte, dont il utilise les constituants

Plus en détail

Analyse de la dynamique de l infection VIH Sensibilité aux traitements

Analyse de la dynamique de l infection VIH Sensibilité aux traitements 71 Prépublication n 16 Fascicule n 2 Analyse de la dynamique de l infection VIH Sensibilité aux traitements Marie-José Mhawej IRCCyN Institut de recherche en communication et cybernétique de Nantes, UMR-CNRS

Plus en détail

TRANSMISSION DES VIRUS ET CYCLE DE MULTIPLICATION

TRANSMISSION DES VIRUS ET CYCLE DE MULTIPLICATION TRANSMISSION DES VIRUS ET CYCLE DE MULTIPLICATION II. 1 Généralités II.2 Transmission des Virus II.3 Grandes étapes de Cycle de Multiplication Attachement Pénétration Réplication Libération II. 1 Généralités

Plus en détail

Sélection des Médicaments pour la Prise en Charge des PVVIH/SIDA

Sélection des Médicaments pour la Prise en Charge des PVVIH/SIDA Sélection des Médicaments pour la Prise en Charge des PVVIH/SIDA Dr Vincent HABIYAMBERE, OMS/ Département du VIH/SIDA Dr Bianca Kamps, IDA HIV Group Dakar, Sénégal, Mars 2006 Plan de la Présentation Éléments

Plus en détail

Avis 6 novembre 2013

Avis 6 novembre 2013 COMMISSION DE LA TRANSPARENCE Avis 6 novembre 2013 VIREAD 245 mg, comprimés pelliculés Boîte de 1 flacon de 30 comprimés (CIP : 34009 358 500 1 0) VIREAD 33 mg/g, granulés pour administration orale Boîte

Plus en détail

Les microarrays: technologie pour interroger le génome

Les microarrays: technologie pour interroger le génome Les microarrays: technologie pour interroger le génome Patrick DESCOMBES patrick.descombes@frontiers-in-genetics.org Plate forme génomique NCCR Frontiers in Genetics Université de Genève http://genomics.frontiers-in-genetics.org

Plus en détail

MASTER «Sciences de la Vie et de la Santé» Mention «Santé Publique»

MASTER «Sciences de la Vie et de la Santé» Mention «Santé Publique» M1_presentation_generale_4juil05.doc 1/11 MASTER «Sciences de la Vie et de la Santé» Mention «Santé Publique» La mention s articule autour de 6 spécialités : Recherche en éthique : Pr Christian HERVE (herve@necker.fr)

Plus en détail

Pr Vincent CALVEZ CHU Pitié-Salpêtrière INSERM U 943 ANRS AC11 Resistance

Pr Vincent CALVEZ CHU Pitié-Salpêtrière INSERM U 943 ANRS AC11 Resistance Réplication résiduelle Pr Vincent CALVEZ CHU Pitié-Salpêtrière INSERM U 943 ANRS AC11 Resistance ART bloque la réplication virale avec persistance de ADN viral intégré Taille du réservoir est établie avant

Plus en détail

Lecture critique d article ou comment briller en société sans en avoir trop l air

Lecture critique d article ou comment briller en société sans en avoir trop l air Lecture critique d article ou comment briller en société sans en avoir trop l air Réunion Inter-Corevih Basse Normandie - Bretagne Mont Saint-Michel Février 2014 Jean-Marc Chapplain Plan Actualité Dissection

Plus en détail

Analyse de données longitudinales continues avec applications

Analyse de données longitudinales continues avec applications Université de Liège Département de Mathématique 29 Octobre 2002 Analyse de données longitudinales continues avec applications David MAGIS 1 Programme 1. Introduction 2. Exemples 3. Méthodes simples 4.

Plus en détail

Gene Predictis parce que je suis unique

Gene Predictis parce que je suis unique Gene Predictis parce que je suis unique Route de Chantemerle 64 - CP 160 - CH-1763 Granges-Paccot Téléphone: +41 26 466 15 45 Fax: +41 26 466 15 46 info@genepredictis.com www.genepredictis.com Gene Predictis

Plus en détail

- 2 - faire industriel dans la mise au point des produits biologiques. L Institut Roche de Recherche et Médecine Translationnelle (IRRMT, basé à

- 2 - faire industriel dans la mise au point des produits biologiques. L Institut Roche de Recherche et Médecine Translationnelle (IRRMT, basé à Information presse Roche, l Agence Nationale de Recherches sur le Sida et les hépatites virales (ANRS), le Baylor Research Institute (BRI) et Inserm Transfert mettent en place une coopération stratégique

Plus en détail

RISQUE CARDIOVASCULAIRE ET METABOLIQUE

RISQUE CARDIOVASCULAIRE ET METABOLIQUE RISQUE CARDIOVASCULAIRE ET METABOLIQUE RAPPEL DEFINITIONS Hyperlipidémie g/l mmol/l Triglycérides < 2 < 2.2 Cholestérol Total

Plus en détail

Les médicaments antirétroviraux

Les médicaments antirétroviraux Les médicaments antirétroviraux Décembre 2011 1ère édition Décembre 2011 ACTIF SANTÉ 109 rue Orfila 75020 Paris tél : 0950 796 160 fax : 0955 796 160 web : www.actif-sante.org association loi 1901 J.O.

Plus en détail

HIV et Soins Intensifs. Colloque SMIA 06.09.2007 Dr Pierre Voirol - PHA

HIV et Soins Intensifs. Colloque SMIA 06.09.2007 Dr Pierre Voirol - PHA HIV et Soins Intensifs Colloque SMIA 06.09.2007 Dr Pierre Voirol - PHA HIV et Soins Intensifs: pourquoi? Interactions Effets secondaires Risques Suivi du traitement 2 Patients HIV en soins intensifs: causes

Plus en détail

Hépatite C une maladie silencieuse..

Hépatite C une maladie silencieuse.. Hépatite C une maladie silencieuse.. F. Bally Centre de Maladies Infectieuses et Epidémiologie Institut Central des Hôpitaux Valaisans Histoire Années 70 Hépatite non-a-non-b = hépatite post-transfusionelle

Plus en détail

Echec virologique et Résistance virale

Echec virologique et Résistance virale Echec virologique et Résistance virale Pr Christine KATLAMA SOLTHIS Niamey Journées Scientifiques octobre 2009 Incidence pour 1000 personnes-années Les acquis de la Recherche Clinique La progression de

Plus en détail

LE MALI L HÔPITAL GABRIEL TOURE L HÔPITAL DU POINT G INTRODUCTION 2 INTRODUCTION 1 DISPENSATION DES ARV DANS LES HÔPITAUX DU POINT G ET GABRIEL TOURE

LE MALI L HÔPITAL GABRIEL TOURE L HÔPITAL DU POINT G INTRODUCTION 2 INTRODUCTION 1 DISPENSATION DES ARV DANS LES HÔPITAUX DU POINT G ET GABRIEL TOURE DISPENSATION DES ARV DANS LES HÔPITAUX DU POINT G ET GABRIEL TOURE KALLE A.D A (1), BENGALY L (2)., KONE D ( 1), COULIBALY S.M (2). DIAKITE A.S. (2) DIAMOUTENE A (2) (1) Service de Pharmacie Hôpital Gabriel

Plus en détail

Chapitre 2: Les mécanismes de

Chapitre 2: Les mécanismes de Chapitre 2: Les mécanismes de l immunité I-Les anticorps: agents du maintien de l intégrité du milieu extracellulaire 1- La réaction antigène- anticorps et l élimination du complexe immun Les anticorps:

Plus en détail

L hépatite C pas compliqué! Véronique Lussier, M.D., F.R.C.P.C. Gastroentérologue Hôpital Honoré-Mercier 16 avril 2015

L hépatite C pas compliqué! Véronique Lussier, M.D., F.R.C.P.C. Gastroentérologue Hôpital Honoré-Mercier 16 avril 2015 L hépatite C pas compliqué! Véronique Lussier, M.D., F.R.C.P.C. Gastroentérologue Hôpital Honoré-Mercier 16 avril 2015 Objectifs de la présentation Décrire l évolution clinique et la prise en charge d

Plus en détail

État des lieux des biotech en France vision macroéconomique Pierre-Yves Arnoux

État des lieux des biotech en France vision macroéconomique Pierre-Yves Arnoux État des lieux des biotech en France vision macroéconomique Pierre-Yves Arnoux Leem Direction des Affaires scientifiques pharmaceutiques et médicales 11 décembre 2008 Le plan d études du Leem Les segments

Plus en détail

LIVRET D INFORMATION. PrEP. Prophylaxie Préexposition - PrEP. en France. Un nouvel outil de prévention pour les hommes gays séronégatifs

LIVRET D INFORMATION. PrEP. Prophylaxie Préexposition - PrEP. en France. Un nouvel outil de prévention pour les hommes gays séronégatifs LIVRET D INFORMATION PrEP Prophylaxie Préexposition - PrEP en France Un nouvel outil de prévention pour les hommes gays séronégatifs La PrEP LA PrEP C EST QUOI? OU EN EST-ON? LA PrEP C EST POUR QUI? LA

Plus en détail

Sélection et Évaluation Quantitative des Médicaments pour la Prise en Charge du VIH/SIDA. Sophie Logez, OMS/PSM Addis Abeba, Ethiopie, Février 2005

Sélection et Évaluation Quantitative des Médicaments pour la Prise en Charge du VIH/SIDA. Sophie Logez, OMS/PSM Addis Abeba, Ethiopie, Février 2005 Sélection et Évaluation Quantitative des Médicaments pour la Prise en Charge du VIH/SIDA Sophie Logez, OMS/PSM Addis Abeba, Ethiopie, Février 2005 Sélection et Évaluation Quantitative Références Sélection

Plus en détail

«La solidarité médicale en action» Infection VIH. Dr Kara Biologiste CH Marc Jacquet 77000 Melun

«La solidarité médicale en action» Infection VIH. Dr Kara Biologiste CH Marc Jacquet 77000 Melun «La solidarité médicale en action» Infection VIH Dr Kara Biologiste CH Marc Jacquet 77000 Melun I. Les rétroviridae Famille des Rétroviridae : 3 sous-familles Spumavirus Oncovirus Lentivirus non pathogènes

Plus en détail

La cytométrie de flux

La cytométrie de flux TD5 La cytométrie de flux Air sous-pression Signal de formation des gouttes Signal de charge des gouttes Cellules en suspension Liquide de Gaine Vibrateur Ultrason Dˇtecteur de Lumi re Arrt du Faisceau

Plus en détail

Institut Supérieur d Ostéopathie de Lille

Institut Supérieur d Ostéopathie de Lille N de Table : ISO2 PATHOLOGIES INFECTIEUSES & NOTIONS D INFECTIOLOGIE 1 ère Session M. MABON 18/06/2013 (Durée : 2h) Partie 1 : QCM (10 questions) sur 20 points Chaque question peut avoir une à 5 réponses

Plus en détail

Procréation et prise en charge de la grossesse et VIH Journée régionale d actualisation CH Tourcoing Dr Y Hammou JdF

Procréation et prise en charge de la grossesse et VIH Journée régionale d actualisation CH Tourcoing Dr Y Hammou JdF Procréation et prise en charge de la grossesse et VIH Journée régionale d actualisation CH Tourcoing Dr Y Hammou JdF LE VIH :une infection qui concerne la mère et l enfant Beaucoup de progrès ont été accomplis

Plus en détail

ViiV Healthcare France,

ViiV Healthcare France, ViiV Healthcare France, Un nouveau laboratoire entièrement dédié au VIH Dossier de presse Mars 2010 Contacts presse Laurence Mertz Anne Bellion & Isabelle de Noailles Laboratoire GlaxoSmithKline Capital

Plus en détail

Virologie en Pédiatrie

Virologie en Pédiatrie Virologie en Pédiatrie Pr Coumba Touré Kane ANRS-SENEGAL Introduc3on 3,4 millions d enfants en 2010 (OMS 2011) 90% de ces enfants en Afrique sub- saharienne 260 000 enfants infectés en 2012 Baisse de 52

Plus en détail