Projet de thèse. Intitulé de la thèse. Spécialité du doctorat. Problématique scientifique générale



Documents pareils
Rubrique SNIIRAM dans Statistiques et publications/ameli.fr

Etudes d utilisation médicamenteuse et accès aux bases de données de soins de santé : Enjeu sociétal et juridique

Méthode et exemples d application. Congrès SFSE - Jeudi 15 décembre 2011

Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH

Le SNIIRAM et les bases de données de l Assurance Maladie en Dominique POLTON, Philippe Ricordeau CNAMTS 30 mars 2011

Formations proposées en par le Réseau Doctoral de Santé Publique

Etudes observationnelles sur les bases de données de l assurance maladie

La Cohorte des Grossesses du Québec

Industrial Phd Progam

Exposé n 5: Bases IMS, Thalès Quel apport pour la sécurité d emploi des médicaments?

Faculté des Sciences Economiques et de Gestion de Nabeul. Université de Carthage. Master de Recherche Finance des Entreprises et des Marchés

Programme international de formation

Le projet PROTECT Un partenariat Européen public-privé innovant pour développer de nouvelles méthodes en Pharmacovigilance et Pharmaco-épidémiologie

COMMISSION NATIONALE D EVALUATION DES DISPOSITIFS MEDICAUX ET DES TECHNOLOGIES DE SANTE. AVIS DE LA COMMISSION 08 février 2011 CONCLUSIONS

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1

Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services

M.Benmimoun MD,MBA Medical Operations Director

Une méthode de classification supervisée sans paramètre pour l apprentissage sur les grandes bases de données

Détection spatiale de données aberrantes. Application à la surveillance de la qualité de l'air.

MASTER MARKETING VENTE, SPECIALITE COMMERCE,VENTE DANS LES INDUSTRIES AGROALIMENTAIRES PAR APPRENTISSAGE

DUT Statistique et Traitement Informatique des Données (S.T.I.D.)

Création de procédures inter-services pour la gestion des essais de phase I à l Institut Gustave Roussy

Caroline Hurault-Delarue 1, Cécile Chouquet 2, Nicolas Savy 2, Isabelle Lacroix 1, Christine Damase- Michel 1

Mention : STAPS. Sport, Prévention, Santé, Bien-être. Objectifs de la spécialité

Essais cliniques de phase 0 : état de la littérature

METHODOLOGIE GENERALE DE LA RECHERCHE EPIDEMIOLOGIQUE : LES ENQUETES EPIDEMIOLOGIQUES

First do no harm Hippocrates ( BC)

COMPARAISON DE LOGICIELS TESTANT L INDEPENDANCE DE VARIABLES BINAIRES

JSPS Strasbourg Office

,,ÉTUDES ET RECHERCHES SUR LA DISTRIBUTION, LA PROMOTION ET LA VALORISATION DES PRODUITS DE BOULANGERIE DANS LE MUNICIPE DE CONSTANŢA

Analyse des incidents

BOURSE DE RECHERCHE QUICK : SECURITE ET HYGIENE ALIMENTAIRE

Les Data Sciences pour la santé: Qui, Quoi, Comment?

DEMANDE DE CREDIT DE RECHERCHE MINI-ARC TRANSDISCIPLINAIRE Année académique

Pharmacovigilance des Essais cliniques

Université de Technologie Sino-Européenne de l Université de Shanghai

Etat des lieux de la recherche en soins infirmiers en France

Techniques du Data Mining pour la prédiction de faillite des entreprises et la gestion du risque de crédit

DROIT-ECONOMIE-GESTION SCIENCES DU MANAGEMENT ADMINISTRATION DES ENTREPRISES

Les études post-inscription sur les technologies de santé (médicaments, dispositifs médicaux et actes)

Medication management ability assessment: results from a performance based measure in older outpatients with schizophrenia.

Cursus de Master en Ingénierie de la Production Alimentaire. Une autre façon d accéder au métier d ingénieur

Analyse de grandes bases de données en santé

Annonce. Beyrouth, le 4/6/2013. La Doyenne. Nina SAADALLAH. UNIVERSITE LIBNAISE Faculté de Santé Publique Décanat

La raison d être des systèmes d information

Que signifie être membre du Programme de l OMS pour la pharmacovigilance internationale

GUIDE DE CONSTITUTION DE DOSSIER EN VUE DE LA RECONNAISSANCE ET/OU DE L EQUIVALENCE DES DIPLOMES, TITRES ET GRADES DE L ENSEIGNEMENT SUPERIEUR

L approche de régression par discontinuité. Thomas Lemieux, UBC Atelier de formation du Congrès de l ASDEQ Le 18 mai 2011

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Statistiques et traitement des données

Transplantation pulmonaire et mucoviscidose. Optimiser la prise en charge médicale

Population responses to environmental forcing : approaches to model and monitor habitat characteristics

Les bourses de thèse

Spécificités, Applications et Outils

Mise en place du Business Activity Monitoring (BAM) pour piloter les processus logistiques grâce aux Echanges de Données Informatisés (EDI)

L ÉDUCATION THÉRAPEUTIQUE DU PATIENT EN 15 QUESTIONS - RÉPONSES

Projet ARMED Assessment and Risk Management of MEdical Devices in plasticized polyvinylchloride

SOMMAIRE I. INTRODUCTION 4 II. SOURCES D INFORMATION 5

La recherche interventionnelle en santé des populations : moteur d innovation

Les cotutelles internationales de thèse

Soutien pour la formation à la recherche translationnelle en cancérologie

Présentation Générale

Rapport sur les nouveaux médicaments brevetés Iressa

METIERS DES LANGUES ET CULTURES ETRANGERES

UNIVERSITÉ PARIS-SUD 11 FACULTÉ DE MÉDECINE

Exemple PLS avec SAS

Masters OBSER VATOIRE. Sciences / Technologies / Santé OBSERVATOIRE CARREFOUR DES ÉTUDIANTS. Université de Limoges

Proposition de sujet de thèse CIFRE EUROCOPTER / LGI2P

Introduction au métier d ARC. en recherche clinique

Formations et diplômes. Rapport d'évaluation. Master Finance. Université Jean Monnet Saint-Etienne - UJM. Campagne d évaluation (Vague A)

Formation continue. Ensae-Ensai Formation Continue (Cepe)

Bienvenue à l UCL, dans une

Bourses de mobilité pour doctorantes et doctorants Doc.Mobility

Item 169 : Évaluation thérapeutique et niveau de preuve

De la recherche universitaire le règlement

RÉSUMÉ DE THÈSE. L implantation des systèmes d'information (SI) organisationnels demeure une tâche difficile

Evidence-based medicine en français

Transports sanitaires

DEVELOPPEMENT DU MEDICAMENT 4 ème, 5 ème et 6 ème année de pharmacie

Vinci Consulting Conseil en Stratégie d innovation

1 Bourses Victor Hugo Université de Franche-Comté

«Cours Statistique et logiciel R»

Spécialité Sciences Mécaniques et Ingénierie

Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux

SUPPLEMENT AU DIPLOME

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

Déclarations européennes de la pharmacie hospitalière

médicale canadienne, l Institut canadien d information sur la santé, Santé Canada et le Collège royal des médecins et chirurgiens du Canada.

«Management et Direction de Projets»

Thierry DELZESCAUX. «biopicsel» group, URA CNRS-CEA 2210 Service MIRCen, I²BM, CEA Fontenay-aux-Roses, France.

Relation entre deux variables : estimation de la corrélation linéaire

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

Une forte dynamique des prescriptions de ces nouveaux anti-coagulants oraux

Les Parcours Scientifiques et les Ecoles Doctorales

Intelligence Economique - Business Intelligence

La recherche clinique au cœur du progrès thérapeutique

Rapport d évaluation du master

Hospital Anxiety and Depression Scale (HADS)

Formation CTOM «Printemps 2013»

Transcription:

Projet de thèse Intitulé de la thèse Détection automatisée de signaux en pharmacovigilance : Exploitation conjointe de données de notifications spontanées et médico- administratives. Spécialité du doctorat Biostatistique, ED420 «Santé Publique» Problématique scientifique générale La pharmacovigilance a pour objectif de détecter le plus précocement les effets indésirables de médicaments commercialisés. Elle repose le plus souvent sur l exploitation de notifications spontanées, c est à dire la déclaration par un professionnel de santé de la survenue d un événement indésirable dont l origine suspectée est médicamenteuse. A l échelle nationale ou internationale, ces notifications spontanées représentent de grands ensembles de données. Il a donc été proposé depuis une quinzaine d années un certain nombre de méthodes statistiques visant à détecter des associations statistiques suspectes entre médicaments et effets indésirables (Almenoff et al. 2007; Harpaz et al. 2012). De manière schématique, pour un couple médicament- événement (i,j) donné, les mesures d associations proposées dans la littérature reposent généralement sur l agrégation des données de notifications sous la forme de la table de contingence 2x2 croisant la présence/absence du médicament i avec la présence/absence de l événement j. Une mesure d association est calculée simultanément pour chacun des couples présents dans la base. Un signal est déclenché lorsque la mesure d association dépasse un certain seuil. Ces approches sont donc caractérisées par le fait que les individus servant de référence sont des personnes ayant rencontré un autre événement indésirable et/ou pris un autre médicament que le couple (i,j) et ayant fait l objet d une notification spontanée par un professionnel de santé. Malgré le caractère obligatoire de la notification spontanée, des travaux ont montré que la sous- notification est très importante même dans le cas d effets indésirables graves. De plus, cette sous- notification varie en fonction du type de médicaments, du patient ainsi que du type d événement indésirable. Ainsi, on parle de détection de signaux, les signaux statistiques générés à partir de ces données devant obligatoirement être évalués par des experts pharmacovigilants. Plus récemment, un intérêt croissant s est porté sur l exploitation d autres sources données pour la génération de signaux. En particulier, aux Etats Unis, un projet de très grande envergure s est focalisé sur l exploitation de grandes bases privées de données de remboursement de médicaments et dont les conclusions ont été publiées dans un supplément de la revue Drug Safety (Drug Safety, 2013, Vol. 36, Supplement 1 (pp. S1- S204). Studying the Science of Observational Research: Empirical Findings from the Observational Medical Outcomes Partnership). En France, l exploitation des données du SNIIRAM (Système national d information inter- régimes de l Assurance maladie) dans le cadre d études pharmacoépidémiologiques a fait

l objet de travaux récents (Weill et al. 2010). La richesse de cette base de données, l une des plus grandes bases médico- administratives au monde, réside dans le fait qu elle contienne l ensemble des remboursements de soins pour la presque totalité de la population française. De plus ces données sont aussi chaînées au PMSI (Programme de médicalisation des systèmes d'information), c est- à- dire aux séjours hospitaliers. L accès à ces données est fortement réglementé et nécessite des demandes spécifiques à la CNIL. Néanmoins, la CNAMTS a fortement facilité l accès de la communauté de chercheurs à l échantillon généraliste des bénéficiaires (EGB) rassemblant les données du SNIIRAM pour un échantillon au 1/97 ème de la population française. L évaluation de l intérêt de l EGB pour la détection de signaux dans le cas d effets indésirables graves (nécessitant une hospitalisation) fait l objet d un projet démarré au premier janvier 2015 au sein de l équipe (Génération automatisée de signaux de pharmacovigilance sur l échantillon généraliste de bénéficiaires avec la méthode en série de cas : développements méthodologiques et étude pilote, Financement ANSM, PI Ismaïl Ahmed). La difficulté dans l exploitation de ces grandes bases de données médico- administratives réside dans le fait qu elles n ont pas été conçues avec un objectif de réponse à des questions de santé. Ainsi le SNIIRAM contient très peu de données sociodémographiques. Il ne contient aussi aucune information directe concernant les pathologies pour lesquelles sont dispensés les soins (en dehors des affections longues durées). Par ailleurs les effets indésirables pouvant être étudiés sont nécessairement «graves» puisque requérant une hospitalisation. Enfin, l accès aux données du SNIIRAM dans un temps compatible avec de la détection de signaux est restreint à l EGB. Malgré une taille très importante (environ 700000 personnes), son exploitation pour la détection d effets indésirables n est réalisable que pour des effets indésirables relativement fréquents dans la population. Objectifs scientifiques de la thèse L objectif général de ce projet de thèse est de proposer de nouveaux outils de détection automatisée de signaux tirant partie des complémentarités des sources d information que sont les notifications spontanées et l EGB. La première étape de ce travail de thèse consistera à développer une méthode de détection de signaux s appuyant à la fois sur les données de notifications spontanées de la base nationale de pharmacovigilance française et les données de l EGB. L originalité de cette approche est qu elle utilisera les données de l EGB pour la constitution d un groupe contrôle tandis que les cas seront extraits à partir des notifications spontanées. Dans un premier temps, nous envisagerons l utilisation d approches appariées «univariées» : pour un médicament étudié, les témoins seront appariés aux cas selon leur âge et leur sexe. Nous réfléchirons aussi à des appariements prenant en compte le profil d expositions médicamenteux autres que celui étudié. Cette méthode s appuiera donc vraisemblablement sur un modèle de régression logistique conditionnelle. Le seuil de significativité des associations trouvées devra aussi tenir compte du nombre important de tests réalisés par l utilisation de critères statistiques tels que le False Discovery Rate (Benjamini & Hochberg 1995). L évaluation de cette nouvelle méthodologie de détection sera conduite sur la base de plusieurs ensembles existants de signaux de référence établis de différentes manières : expertise humaine (Ahmed et al. 2012; Ryan et al. 2013) exploitation de la littérature

biomédicale (Xu & Wang 2014), exploitation du résumé des caractéristiques du produit (Kuhn et al. 2010; Candore et al. 2015). Dans un deuxième temps nous nous attacherons à comparer l intérêt de cette méthodologie par rapport à une détection automatisée «classique», c est- à- dire s appuyant uniquement sur les données de notifications spontanées. La comparaison sera basée sur les différents ensembles de signaux de référence mentionnés plus haut, ainsi que sur une étude de simulations. Le troisième temps de ce travail sera consacré à l exploration de méthodes «multivariées» comme alternative aux méthodes appariées. Le nombre de médicaments mentionnés pour un événement indésirable donné étant potentiellement très grand, ce volet pourra faire appel à des approches telles que les régressions pénalisées de type lasso (Tibshirani 1996; Genkin et al. 2007) qui commencent à être explorées en pharmacovigilance (Caster et al. 2010). Néanmoins, ces méthodes ont été initialement développées avec un objectif prédictif. Leur utilisation dans un but de sélection de variables ; en pharmacovigilance, il s agit d identifier un nombre restreint de médicaments associés à un effet indésirable donné); fait l objet de développements méthodologiques actuels (Meinshausen & Bühlmann 2010). Plus généralement, les méthodes issues de l apprentissage statistique n ont pas encore été beaucoup abordées en pharmacovigilance. Ce travail de thèse pourra donc être l occasion d explorer certaines d entres elles. En particulier les Random Forest (Breiman 2001) qui ont récemment été revisitées dans un contexte de sélection de variables semblent être une piste intéressante (Genuer et al. 2010; Hapfelmeier & Ulm 2013). Titre en anglais du projet de thèse Automated signal detection in pharmacovigilance from large spontaneous reporting and medico- administrative databases Profil du candidat Le candidat sera titulaire d un diplôme d école d ingénieur en statistique /mathématiques appliquées (ENSAE, ENSAI, ISUP, INSA, Agro, Centrale, ENSIMAG, ) ou d un M2 de statistique ou biostatistique. Sa formation comprendra un solide cursus théorique en statistique et un goût et des aptitudes pour les applications biomédiales et le travail collaboratif avec d autres disciplines scientifiques, ainsi que de fortes compétences en programmation. Laboratoire d accueil La thèse de déroulera dans l équipe «Biostatistique et Pharmacoépidémiologie» de l unité Inserm U1181 «Biostatistique, Biomathématique, Pharmacoépidémiologie et Maladies Infectieuses» (B2PHI), une unité de recherche mixte Inserm, UVSQ et Institut Pasteur. L unité 1181 est dirigée par Didier Guillemot et comprend 2 équipes. L équipe Biostatistique et Pharmacoépidémiologie, localisée à Villejuif, est dirigée par Pascale Tubert- Bitter. Cette équipe a notamment développé de nombreux travaux statistiques pour la détection de signal en pharmacovigilance à partir des systèmes de notifications spontanées, ainsi qu une expertise pour l exploitation du SNIIRAM en pharmacoépidémiologie. L encadrement de la thèse sera conjoint entre Ismaïl Ahmed (Chargé de recherche Inserm) et Pascale Tubert- Bitter (Directeur de recherche Inserm).

Financement Le financement sera sollicité auprès de l école doctorale. Les modalités de candidature sont détaillées sur le site de l ED420 (http://www.ed- sante- publique.u- psud.fr/etre- candidat/trouver- un- financement/contrats- doctoraux- ed420.html). Pour cette année, la première étape est une déclaration d intention à envoyer avant le 5 juin 2015. Contact Ismaïl Ahmed : ismail.ahmed@inserm.fr Pascale Tubert- Bitter : pascale.tubert@inserm.fr Bibliographie Ahmed, I. et al., 2012. Early detection of pharmacovigilance signals with automated methods based on false discovery rates: a comparative study. Drug Saf, 35(6), pp.495 506. Almenoff, J.S. et al., 2007. Novel statistical tools for monitoring the safety of marketed drugs. Clin Pharmacol Ther, 82(2), pp.157 166. Benjamini, Y. & Hochberg, Y., 1995. Controlling the false discovery rate: a practical and powerful approach to multiple testing. Journal of the Royal Statistical Society. Series B, Statistical methodology, 57, pp.289 300. Breiman, L., 2001. Random forests. Machine learning, 45(1), pp.5 32. Candore, G. et al., 2015. Comparison of Statistical Signal Detection Methods Within and Across Spontaneous Reporting Databases. Drug Saf. Caster, O. et al., 2010. Large- scale regression- based pattern discovery: The example of screening the WHO global drug safety database. Statistical Analysis And Data Mining, 3(4), pp.197 208. Genkin, A., Lewis, D.D. & Madigan, D., 2007. Large- Scale Bayesian Logistic Regression for Text Categorization. Technometrics, 49(3), pp.291 304. Genuer, R., Poggi, J.- M.-. M. & Tuleau- Malot, C., 2010. Variable selection using random forests. Pattern Recognition Letters, 31(14), pp.2225 2236. Hapfelmeier, A. & Ulm, K., 2013. A new variable selection approach using random forests. Computational Statistics & Data Analysis, 60, pp.50 69. Harpaz, R. et al., 2012. Novel data- mining methodologies for adverse drug event discovery and analysis. Clin Pharmacol Ther, 91(6), pp.1010 1021. Kuhn, M. et al., 2010. A side effect resource to capture phenotypic effects of drugs. Mol Syst Biol, 6, p.343.

Meinshausen, N. & Bühlmann, P., 2010. Stability selection. Journal of the Royal Statistical Society: Series B (Statistical Methodology), 72(4), pp.417 473. Ryan, P.B. et al., 2013. Defining a reference set to support methodological research in drug safety. Drug Saf, 36 Suppl 1, pp.s33 47. Tibshirani, R., 1996. Regression shrinkage and selection via the lasso. Journal of the Royal Statistical Society. Series B, Statistical methodology, 58, pp.267 288. Weill, A. et al., 2010. Benfluorex and valvular heart disease: a cohort study of a million people with diabetes mellitus. Pharmacoepidemiology and drug safety, 19(12), pp.1256 62. Xu, R. & Wang, Q., 2014. Automatic construction of a large- scale and accurate drug- side- effect association knowledge base from biomedical literature. J Biomed Inform.