UNIVERSITÉ PARIS-SUD 11 FACULTÉ DE MÉDECINE

Documents pareils

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Projet de thèse. Intitulé de la thèse. Spécialité du doctorat. Problématique scientifique générale

VI. Tests non paramétriques sur un échantillon

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

TABLE DES MATIERES. C Exercices complémentaires 42

Les indices à surplus constant

NON-LINEARITE ET RESEAUX NEURONAUX

Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

La problématique des tests. Cours V. 7 mars Comment quantifier la performance d un test? Hypothèses simples et composites

Filtrage stochastique non linéaire par la théorie de représentation des martingales

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

Principe de symétrisation pour la construction d un test adaptatif

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

Principe d un test statistique

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

PROBABILITES ET STATISTIQUE I&II

M2 IAD UE MODE Notes de cours (3)

Limites finies en un point

Méthodes de Simulation

Modélisation aléatoire en fiabilité des logiciels

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Mémoire d actuariat - promotion complexité et limites du modèle actuariel, le rôle majeur des comportements humains.

Le modèle de Black et Scholes

Analyse de la variance Comparaison de plusieurs moyennes

Probabilités III Introduction à l évaluation d options

Annexe commune aux séries ES, L et S : boîtes et quantiles

Cours 9 : Plans à plusieurs facteurs

La classification automatique de données quantitatives

Estimation et tests statistiques, TD 5. Solutions

Mortalité observée et mortalité attendue au cours de la vague de chaleur de juillet 2006 en France métropolitaine

FIMA, 7 juillet 2005

TSTI 2D CH X : Exemples de lois à densité 1

Table des matières. I Mise à niveau 11. Préface

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I

Etude des propriétés empiriques du lasso par simulations

Modèles et Méthodes de Réservation

Chapitre 3. Quelques fonctions usuelles. 1 Fonctions logarithme et exponentielle. 1.1 La fonction logarithme

Tests du χ 2. on accepte H 0 bonne décision erreur de seconde espèce on rejette H 0 erreur de première espèce bonne décision

Continuité en un point

Les débats sur l évolution des

Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes.

Format de l avis d efficience

Résumé des communications des Intervenants

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

Loi binomiale Lois normales

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

23. Interprétation clinique des mesures de l effet traitement

Docteur José LABARERE

INF6304 Interfaces Intelligentes

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé

Liste des notes techniques... xxi Liste des encadrés... xxiii Préface à l édition internationale... xxv Préface à l édition francophone...

Chapitre 2/ La fonction de consommation et la fonction d épargne

OPTIMISATION DE LA MAINTENANCE DES EQUIPEMENTS DE MANUTENTION DU TERMINAL A CONTENEURS DE BEJAIA (BMT)

3 Approximation de solutions d équations

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels

Image d un intervalle par une fonction continue

Chp. 4. Minimisation d une fonction d une variable

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

4. Résultats et discussion

Théorème du point fixe - Théorème de l inversion locale

Arithmétique binaire. Chapitre. 5.1 Notions Bit Mot

Item 169 : Évaluation thérapeutique et niveau de preuve

Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH

Données longitudinales et modèles de survie

PROGRAMME (Susceptible de modifications)

Texte Agrégation limitée par diffusion interne

Chapitre 2 Le problème de l unicité des solutions

Introduction à l approche bootstrap

Soutenance de stage Laboratoire des Signaux et Systèmes

Simulation de variables aléatoires

La mesure de Lebesgue sur la droite réelle

EXERCICES - ANALYSE GÉNÉRALE

Chapitre 3. Les distributions à deux variables

CAPTEURS - CHAINES DE MESURES

Économetrie non paramétrique I. Estimation d une densité

Trafic aérien de passagers au Canada : une analyse exploratoire du modèle origine-destination de Transports Canada pour le marché intérieur

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://

Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux

CNAM léments de cours Bonus-malus et Crédibilité

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications

Programmation linéaire

Document d orientation sur les allégations issues d essais de non-infériorité

MODELES DE DUREE DE VIE

Contents. 1 Introduction Objectifs des systèmes bonus-malus Système bonus-malus à classes Système bonus-malus : Principes

Incertitude et variabilité : la nécessité de les intégrer dans les modèles

Qu est-ce qu une probabilité?

Probabilités Loi binomiale Exercices corrigés

Moments des variables aléatoires réelles

Introduction à la Statistique Inférentielle

Sur certaines séries entières particulières

(51) Int Cl.: H04L 29/06 ( ) G06F 21/55 ( )

Résolution d équations non linéaires

Value at Risk. CNAM GFN 206 Gestion d actifs et des risques. Grégory Taillard. 27 février & 13 mars 20061

De la mesure à l analyse des risques

Dérivées d ordres supérieurs. Application à l étude d extrema.

Transcription:

UNIVERSITÉ PARIS-SUD 11 FACULTÉ DE MÉDECINE Année : 2009 N attribué par la bibiothèque THÈSE en vue de l obtention du diplôme de DOCTEUR DE L UNIVERSITÉ PARIS-SUD 11 Spécialité : BIOSTATISTIQUE Présentée et soutenue publiquement par Ismaïl AHMED Le 8 avril 2009 Détection automatique de signaux en pharmacovigilance : Approche statistique fondée sur les comparaisons multiples Directeur de thèse : M me Pascale Tubert-Bitter JURY M. Jean Christophe Thalabard, Pr. Président M. Stephen Evans, Pr. Rapporteur M me Sylvia Richardson, Pr. Rapporteur M. Stéphane Robin, Pr. Examinateur M me Pascale Tubert-Bitter, DR. Examinateur

Mes remerciements s adressent en premier lieu à Pascale Tubert-Bitter. Travailler avec elle a été un très grand plaisir et je lui suis profondément reconnaissant d avoir su si bien me guider et m encourager tout au long de ce parcours. Je tiens aussi à remercier chaleureusement Françoise Haramburu, Annie Fourrier- Réglat, Frantz Thiessard, Carmen Kreft-Jais, Ghada Miremont-Salamé et Bernard Bégaud pour leur aide et l intérêt qu ils ont porté à ce travail. Mes remerciements s adressent ensuite à Cyril Dalmasso avec qui j ai eu grand plaisir à travailler ainsi qu à Philippe Broët. Je remercie également les membres et ex-membres de l équipe biostatistique, et plus particulièrement Laurence Watier et Thierry Moreau, pour leur accueil, leur disponibilité et leurs conseils. Je tiens aussi à remercier vivement M. Lellouch pour nos longues conversations, ses lectures attentives et ses conseils avisés. Merci aux membres de l unité 780 qui ont rendu ces trois années de thèse très agréables et plus particulièrement à Jérémie, Hélène, Antoine, Estelle, Olivier, Hélèna, Yves, Dorota, Sigrid, Juliette, Mounia, Raphaëlle, Marie, Alexia et David avec lesquels j ai le plus partagé. L occasion m est donnée de remercier l Institut de Recherche en Santé Publique qui a contribué financièrement à l accomplissement de ce travail. Je remercie Stephen Evans et Sylvia Richardson pour avoir accepté d être les rapporteurs de ma thèse ainsi que Stéphane Robin et Jean Christophe Thalabard pour leur participation à mon jury. Mes derniers remerciements s adressent à ma famille et à Aurélie. i

Valorisation scientifique Communications orales I. Ahmed, C. Dalmasso, F. Haramburu, A. Fourrier-Réglat, F. Thiessard, C. Kreft-Jaïs, G. Miremont-Salamé, B. Bégaud, P. Broët, P. Tubert-Bitter, Fisher s Exact Test Applied to Pharmacovigilance, 29th Annual Conference of the International Society for Clinical Biostatistics, 17-21 August 2008, Copenhagen, Denmark. I. Ahmed, F. Haramburu, A. Fourrier-Réglat, F. Thiessard, C. Kreft-Jais, G. Miremont- Salamé, B. Bégaud, P. Tubert-Bitter, Signal Ranking-Based Comparison of Automatic Detection Methods in Pharmacovigilance : A Hypothesis Test Approach, Epidemiology and Biometry 2008, IBS Channel Network, 10-11 July 2008, Paris, France. I. Ahmed, F. Haramburu, A. Fourrier-Réglat, F. Thiessard, G. Miremont-Salamé, C. Kreft- Jaïs, P. Tubert-Bitter, Bayesian Pharmacovigilance Signal Detection Methods Revisited in a Multiple Comparison Setting, First IBS Channel Network Conference, 8-11 May 2007, Rolduc, The Netherlands. I. Ahmed, F. Haramburu, A. Fourrier-Réglat, F. Thiessard, G. Miremont-Salamé, C. Kreft- Jaïs, P. Tubert-Bitter, A New Automatic Signal Detection Method in Pharmacovigilance ; A Bayesian Multiple Comparisons Setting, 22nd International Conference on Pharmacoepidemiology & Therapeutic Risk Management, 24-27 August 2006, Lisbon, Portugal. Publications avec comité de lecture I. Ahmed, C. Dalmasso, F. Haramburu, F. Thiessard, P. Broët, P. Tubert-Bitter, False Discovery Rate Estimation for Frequentist Pharmacovigilance Signal Detection Methods, Biometrics, Accepté. I. Ahmed, F. Haramburu, A. Fourrier-Réglat, F. Thiessard, C. Kreft-Jais, G. Miremont- Salamé, B. Bégaud, P. Tubert-Bitter, Bayesian Pharmacovigilance Signal Detection Methods Revisited in a Multiple Comparison Setting Statistics in Medicine, Accepté. ii

Table des matières Remerciements i Valorisation scientifique Communications orales............................. Publications avec comité de lecture...................... ii ii ii Table des matières iii Table des figures vi Liste des tableaux viii Liste des abréviations ix 1 Introduction 1 1.1 Contexte.................................. 1 1.2 Problématique............................... 3 1.3 Objectif.................................. 5 2 Description des principales méthodes de détection automatique 7 2.1 Structure des données analysées..................... 7 2.2 Les méthodes fréquentistes........................ 9 2.2.1 La méthode Reporting Odds Ratio (ROR)........... 9 iii

TABLE DES MATIÈRES iv 2.2.2 La méthode Proportional Reporting Ratio (PRR)....... 9 2.3 Les méthodes bayésiennes........................ 10 2.3.1 La méthode Bayesian Confidence Propagation Neural Network (BCPNN)............................. 10 2.3.2 La méthode Gamma Poisson Shrinker (GPS)......... 15 2.4 Quelques remarques générales...................... 18 3 Méthodes de détection automatique revisitées dans le cadre des comparaisons multiples 20 3.1 Comparaisons multiples et méthodes fréquentistes........... 21 3.1.1 ROR, PRR et test d hypothèses................. 21 3.1.2 Test exact de Fisher et mid-p-values.............. 22 3.1.3 FDR et méthodes fréquentistes................. 23 3.2 Comparaisons multiples et méthodes bayésiennes........... 29 3.2.1 GPS et BCPNN dans le cadre bayésien de la théorie de la décision 31 3.2.2 Autres approches proposées pour la prise en compte des comparaisons multiples à partir du modèle GPS.......... 34 3.3 Quelques remarques............................ 36 4 Étude de simulations 38 4.1 Modèle de simulation........................... 40 4.2 Comparaison des approches fréquentistes................ 43 4.2.1 Étude de la densité des degrés de signification......... 44 4.2.2 Estimation de π 0 π 0....................... 46 4.2.3 Comparaison des méthodes selon le FDR et son estimation.. 46 4.3 Comparaison des approches bayésiennes................ 53 4.3.1 GPS et règles de classement................... 54

TABLE DES MATIÈRES v 4.3.2 Comparaison de GPS et BCPNN basés sur Pr(H 0 )....... 57 4.4 Comparaison à partir du modèle de simulations proposé........ 57 4.5 Comparaison à partir du modèle de simulations de Roux et al..... 65 4.6 Conclusion des simulations........................ 67 5 Application aux données françaises de pharmacovigilance 68 5.1 Comparaison des méthodes sur les données de 1984-2003....... 69 5.1.1 Les données............................ 69 5.1.2 Estimation des quantités caractéristiques (FDR, FNR, Se et Sp) 70 5.1.3 Comparaison des signaux générés................ 73 5.2 Évaluation séquentielle à partir de cas d alertes réels......... 77 5.2.1 Plan d analyse........................... 78 5.2.2 Premier scénario : Mise en place d un système de détection automatique............................ 79 5.2.3 Deuxième scénario : Utilisation en routine de GPS....... 84 6 Conclusion 90 Réferences 94 Annexes 98 A Résultats complémentaires pour l étude de simulations 98 B Résultats complémentaires pour l application 102 C Publications 114

Table des figures 3.1 Histogrammes de la densité marginale des degrés de signification obtenus à partir de la méthode midrfet sur les données de la base française.................................. 29 3.2 Histogramme de la distribution de Pr(λ ij 1) obtenu à partir des données de la base Française....................... 35 4.1 Histogrammes du logarithme des risques observés dans la base française et dans les données simulées..................... 42 4.2 Histogrammes des distributions marginales, sous H 0 et sous H 1 des degrés de signification pour ROR, RFET et midrfet......... 45 4.3 Estimations de π 0 π 0 obtenues avec LBE et Qvalue à partir de la distribution marginale des degrés de signification transformés (p ) pour RFET.................................... 47 4.4 Comparaison de ROR, RFET et midrfet selon le FDR et son estimation pour n ij 1............................ 48 4.5 Comparaison de ROR, RFET et midrfet selon le FDR et son estimation pour n ij 3............................ 50 4.6 Biais relatif observé dans l estimation du FDR pour ROR, RFET et midrfet.................................. 52 4.7 Comparaison selon le FDR et son estimation des différentes règles de classement pour GPS........................... 55 4.8 Variabilité du FDR et de son estimation pour GPS basé sur Pr(H 0).. 56 4.9 Comparaison selon le FDR et son estimation de BCPNN et GPS basés sur Pr(H 0)................................. 58 4.10 Comparaison selon le FNR et son estimation de BCPNN et GPS basés sur Pr(H 0 )................................. 59 4.11 Comparaison selon la sensibilité et son estimation de BCPNN et GPS basés sur Pr(H 0 ).............................. 60 4.12 Comparaison selon la spécificité et son estimation de BCPNN et GPS basés sur Pr(H 0).............................. 61 4.13 Comparaison du FDR obtenu avec midrfet, ROR, BCPNN et GPS basé sur Pr(H 0)............................... 63 vi

TABLE DES FIGURES vii 4.14 Comparaison du FDR et de son estimation pour midrfet, BCPNN et GPS basé sur Pr(H 0).......................... 64 4.15 Comparaison du FDR et de son estimation pour ROR, midrfet, BCPNN et GPS basé Pr(H 0) à partir du plan de simulation de Roux et al. (2005)................................. 66 5.1 Comparaison des estimations du FDR sur la base de pharmacovigilance française............................... 71 5.2 Proportion de signaux communs entre les méthodes proposées en fonction du nombre de signaux générés.................... 74 5.3 Proportion de signaux communs entre les méthodes proposées pour {ψ 0 = 1, RR 0 = 1} en fonction du FDR estimé par GPS basé sur Pr(H 0).................................... 75 5.4 Proportion de signaux communs entre les différentes règles de classement pour GPS et RR 0 = 1....................... 76 5.5 Évolution au cours du temps du nombre de couples médicamentévénements présentant au moins une et au moins trois notifications dans la base française créée au 1 er janvier 1995............ 79 5.6 Histogramme des délais observés entre la date de détection par le modèle GPS basé sur Pr(H 0 ) et la date d alerte en comité technique - Scénario 1................................. 5.7 Évolution du nombre de nouveaux signaux générés à partir du modèle 83 5.8 GPS basé sur Pr(H 0 ) et d un seuil de 5% pour le FDR - Scénario 2.. 85 Évolution du seuil sur Pr(H 0) pour FDR = 5% lors de l utilisation de GPS - Scénario 2.............................. 86 5.9 Histogramme des 216 délais observés entre la date de détection par le modèle GPS basé sur Pr(H 0 ) et la date d alerte en comité technique - Scénario 2.................................. 87 5.10 Évolution du nombre de nouveaux signaux générés à partir du modèle GPS basé sur Pr(H 0 ) et FDR = 1% - Scénario 2............ 88 A.1 Histogrammes de la distribution des degrés de signification sous H 0 pour ROR, RFET et midrfet avec n ij 1.............. 99 A.2 Histogrammes de la distribution des degrés de signification sous H 0 pour ROR, RFET et midrfet avec n ij 3............... 100 A.3 Estimations de π 0 π 0 obtenues avec LBE et Qvalue à partir de la distribution marginale des degrés de signification transformés (p ) pour ROR..................................... 101 B.1 Proportion de signaux communs entre les méthodes proposées en fonction du FDR estimé par GPS....................... 103

Liste des tableaux 2.1 Représentation des données pour le couple (i, j)............. 8 3.1 Tableau récapitulatif des méthodes étudiées............... 36 5.1 Estimation des quantités caractéristiques avec GPS et Pr(H 0 ) sur les données de pharmacovigilance française................. 72 5.2 Nombre de signaux de référence détectés par GPS basé sur Pr(H 0) et Q 0.05 (λ ), midrfet et ROR - Scénario 1................ 81 5.3 Comparaison des signaux de référence détectés dans les cas n ij 3 et n ij 1 pour GPS basé sur Pr(H 0) et pour midrfet - Scénario 1... 81 5.4 Rangs moyens dans le délai de détection des 309 signaux de référence pour GPS basé sur Pr(H 0) et Q 0.05 (λ ), midrfet et ROR - Scénario 1. 82 5.5 Rangs moyens dans le délai de détection des 164 signaux de référence pour GPS basé sur Pr(H 0 ) et Q 0.05(λ ), midrfet et ROR - Scénario 1. 82 5.6 Capacité de détection du modèle GPS basé sur Pr(H 0) et FDR = 5% en fonction du nombre de notifications associé aux signaux de référence au 1 er juillet 2002 - Scénario 2....................... 88 B.1 Signaux de référence (47) avec moins de 3 notifications spontanées au 1 er juillet 2002............................... 104 B.2 Signaux de référence (216) détectés par le modèle GPS basé sur Pr(H 0) et FDR = 5% - Scénario 2........................ 106 B.3 Signaux de référence (46) avec au moins 3 notifications spontanées au 1 er juillet 2002 et non détectés par le modèle GPS basé sur Pr(H 0) et FDR = 5% - Scénario 2.......................... 112 viii

Liste des abréviations Afssaps Agence française de sécurité sanitaire des produits de santé ATC Anatomical Therapeutical Clinical ATC5 Code ATC à 5 caractères BCPNN Bayesian Confidence Propagation Neural Network CRPV Centre régional de pharmacovigilance FDA Food and Drug Administration FDP False Discovery Proportion FDR False Discovery Rate FNP False Negative Proportion FNR False Negative Rate GPS Gamma Poisson Shrinker HLT High Level Term LBE Location Based Estimator MedDRA Medical Dictionary for Regulatory Activities MGPS Multi-Item Gamma Poisson Shrinker midrfet mid-p-values calculées à partir du test exact de Fisher PRR Proportional Reporting Ratio RFET Reporting Fisher s Exact Test ROR Reporting Odds Ratio. Se Sensibilité Sp Spécificité ix

Chapitre 1 Introduction 1.1 Contexte Les effets indésirables des médicaments sont le plus souvent découverts après leur autorisation de mise sur le marché et ceci pour au moins deux raisons. La première tient à la nature même des effets indésirables qui peuvent être rares, spécifiques à certaines catégories de la population ou se manifester après une grande période de latence. Une autre raison est qu une fois le médicament commercialisé, ses conditions d utilisation sont en général différentes de celles étudiées dans les cadres expérimentaux précédant sa mise sur le marché. Les systèmes de pharmacovigilance ont donc pour but de détecter le plus précocement possible l existence d associations entre médicaments et événements indésirables. Ils reposent en général sur la déclaration par des professionnels de santé (médecins ou pharmaciens) de la survenue d événements indésirables dont la cause suspectée est médicamenteuse. Prises individuellement, ces notifications spontanées ne comportent que très rarement l assurance de la responsabilité du ou des médicaments incriminés. C est donc leur accumulation qui conduit les pharmacologues à mettre en évidence l existence d effets indésirables médicamenteux. Une difficulté rencontrée dans l analyse de telles données réside dans le fait que 1

1.1 Contexte 2 les effets indésirables des médicaments commercialisés ne sont pas tous reconnus ni rapportés aux instances de pharmacovigilance. Des études montrent que cette sousnotification peut être très importante même dans le cas d effets indésirables graves (Bégaud et al., 2002). Il est très vraisemblable qu elle soit fonction de l événement indésirable, du médicament ou du couple événement-médicament étudié ce qui peut biaiser les conclusions tirées de l information brute (van der Heijden et al., 2002). Néanmoins, malgré ses limites, l analyse des notifications spontanées demeure certainement le moyen le plus rapide et économique pour identifier de nouveaux effets médicamenteux après l autorisation de mise sur le marché et est par conséquent à la base de la plupart des décisions prises par les instances de pharmacovigilance. Le système de pharmacovigilance français a été mis en place en 1979. Il reposait alors sur un réseau de 15 centres régionnaux de pharmacovigilance (CRPV) qui fut rapidement étendu à 29 en 1984 puis à 31 en 1994. Ces centres ont une mission d information auprès des professionnels de santé. Ils ont aussi en charge la collecte des notifications ainsi que leur enregistrement au sein de la base nationale coordonnée par l unité de pharmacovigilance de l Agence Française de Sécurité Sanitaire des Produits de Santé (Afssaps). C est aussi au niveau de ces centres que s exerce une partie de la surveillance; les cas suspectés étant par la suite discutés par le comité technique de pharmacovigilance lors de réunions mensuelles au siège de l Afssaps. Entre 1986 et 2001, les données de pharmacovigilance françaises ont été enrichies de 197 580 notifications spontanées avec une augmentation linéaire à travers le temps pour atteindre le nombre annuel de 18 253 en 2001 (Thiessard et al., 2005). Cette base doit être cependant considérée comme petite face aux deux principales bases mondiales : la base américaine coordonnée par la Food and Drug Administration (FDA) et la base de l Organisation Mondiale de la Santé administrée par l Uppsala Moni-

1.2 Problématique 3 toring Center en Suède, qui, en décembre 2004, contenaient respectivement environ 2.6 et 3.7 millions de notifications (Almenoff et al., 2005). Face à ce flux très important de données, ces deux systèmes de pharmacovigilance ainsi que d autres ont développé depuis une dizaine d années des méthodes statistiques de génération automatique de signaux. Ces méthodes ont pour but de détecter les couples événement-médicament dont la présence est anormalement fréquente par rapport à ce qui est attendu compte tenu de l information présente dans le reste de la base. Du fait des limites des notifications spontanées énoncées plus haut et de la nature essentiellement exploratoire des ces analyses, les signaux ainsi générés doivent être examinés par des experts pour en évaluer la pertinence. Il s agit donc plutôt d outils complémentaires à la veille opérée par les pharmacovigilants ayant pour objectif d aider à l exploration de l immensité des données et agissant comme des générateurs d hypothèses. 1.2 Problématique Les principales méthodes de détection automatique décrites dans la littérature sont les méthodes Proportional Reporting Ratio (PRR, Evans et al. 2001), Reporting Odds Ratio (ROR, van Puijenbroek et al. 2002), Bayesian Confidence Propagation Neural Network (BCPNN, Bate et al. 1998; Norén et al. 2006) et (Multi- Item) Gamma Poisson Shrinker ((M)GPS, DuMouchel 1999; DuMouchel et Pregibon 2001). La méthode PRR est utilisée à la fois par le système de pharmacovigilance anglais (Medical Control Agency) et par le système de pharmacovigilance européen EudraVigilance. La méthode ROR est utilisée sur la base nationale des Pays Bas. La méthode BCPNN est utilisée sur la base de l OMS tandis que la méthode MGPS est utilisée par la FDA (Almenoff et al., 2005; Hauben et al., 2005). La France, pour sa part, n utilise pas encore de système de détection automatique. Néanmoins, le tra-

1.2 Problématique 4 vail de thèse de Frantz Thiessard (Thiessard, 2004), l étude par simulation de Roux et al. (2005) et ce travail réalisé en collaboration avec l unité de pharmacovigilance de l Afssaps et le CRPV de Bordeaux (Inserm U. 687) témoignent de la volonté de mettre en place un tel système à moyen terme. Les méthodes de détection automatique citées plus haut reposent sur une représentation simplifiée de la base de pharmacovigilance dans laquelle les données sont agrégées de manière à obtenir une très grande table de contingence croisant l ensemble des événements indésirables et des médicaments. Chaque couple se voit ensuite associer une mesure de disproportionnalité qui conduit par comparaison à un seuil à la génération ou non d un signal. Ces méthodes diffèrent sur la mesure de disproportionnalité choisie, le modèle de probabilité à l origine de cette mesure ainsi que sur les seuils de génération d alerte. De plus, elles ne présentent pas le même degré de complexité. En effet, les méthodes PRR et ROR sont des méthodes simples de nature fréquentiste alors que BCPNN et GPS sont des méthodes bayésiennes reposant sur une modélisation des données plus complexe. Une limite de ces méthodes réside dans les seuils actuellement utilisés qui ont été déterminés de manière arbitraire, au mieux sur la seule base d études rétrospectives empiriques. Il nous a donc semblé intéressant de réfléchir à une détermination plus objective de ces derniers, fondée en particulier sur des critères d erreurs statistiques tenant compte du nombre très important de comparaisons effectuées simultanément. La prise en compte de la multiplicité des comparaisons est un problème statistique qui a reçu un intérêt croissant ces dernières années, en grande partie motivé par l arrivée de technologies pour l analyse de données génomiques que sont les biopuces. Le fruit de ces travaux a été le développement d une multitude de méthodes pour contrôler ou estimer de nouveaux critères d erreurs. Parmi eux, le False Discovery Rate (FDR) proposé par Benjamini et Hochberg (1995) et défini comme l espérance

1.3 Objectif 5 du taux de fausses découvertes a reçu un intérêt particulier dans la mesure où il est adapté à l exploration de jeux de données de grandes tailles. 1.3 Objectif Ce travail a été initié par la volonté de proposer des seuils de détection pour les méthodes existantes fondés sur le FDR. Pour ce faire, les méthodes ont été revisitées dans le cadre des tests d hypothèses, ce qui ne modifie en rien leur modèle statistique sous-jacent mais conduit néanmoins à des stratégies de détection relativement différentes. Nous nous sommes intéressés au FDR dans la mesure où ce critère semblait a priori répondre au caractère exploratoire de l analyse des données de pharmacovigilance. La nature fréquentiste ou bayésienne des méthodes nous a conduit à son estimation selon deux approches différentes. En ce qui concerne les méthodes fréquentistes, nous avons étudié les approches d estimation du FDR par la modélisation des degrés de signification à l aide de mélanges de distributions (Storey, 2002) tandis que pour les méthodes bayésiennes, l approche envisagée s est appuyée sur le cadre de la théorie de la décision proposé par Müller et al. (2004). Le plan de ce manuscrit est le suivant. Nous présentons dans le chapitre 2 les principales méthodes de détection automatique. Le chapitre 3 expose l extension de ces méthodes au cadre des comparaisons multiples. Le chapitre 4 est consacré à la présentation de deux études par simulations visant à comparer les stratégies de détection proposées à celles actuellement en vigueur. La première se fonde sur un modèle de simulation utilisant des caractéristiques de la base française de pharmacovigilance tandis que la deuxième reprend le modèle de simulation de Roux et al. (2005) qui vise à reproduire un système complet de notifications spontanées. Le chapitre 5 inclut d une part les résultats de ce travail sur l ensemble des données françaises de pharmacovigilance collectées entre 1984 et 2003. D autre part nous présentons les

1.3 Objectif 6 résultats d une étude rétrospective ayant pour objectif d évaluer les méthodes proposées en utilisation séquentielle à partir de cas d alertes réels. Le chapitre 6 conclut sur le travail réalisé.

Chapitre 2 Description des principales méthodes de détection automatique 2.1 Structure des données analysées Toutes les méthodes de détection automatique de signaux citées en introduction se fondent sur une représentation des données de pharmacovigilance sous la forme d une très grande table de contingence de dimension I J croisant l ensemble des médicaments et des événements indésirables impliqués au moins une fois dans une notification spontanée. Comme nous le verrons dans le chapitre 5, la taille de cette table de contingence dépend fortement du degré de précision utilisé pour le codage des événements indésirables et des médicaments. Cette table est aussi caractérisée par une grande proportion de cellules vides dépendant, là encore, du codage utilisé. Une grande partie des notifications spontanées envoyées aux CRPV implique plusieurs médicaments et/ou plusieurs événements indésirables. Dans de tels cas, 7

2.1 Structure des données analysées 8 chacune des combinaisons médicament-événement indésirable présente dans la notification est reportée dans la table de contingence. Les méthodes automatiques étudiées reposent sur des mesures de disproportionnalité calculées pour l ensemble des couples ayant fait l objet d au moins une notification spontanée. Ces dernières constituent les statistiques d intérêt et sont calculées pour un couple (i, j) par agrégation de la table I J en une table de contingence 2 2 présentée dans le tableau 2.1. Tab. 2.1: Représentation des données pour le couple (i, j). Evénement Autres événement indésirable j indésirables Médicament i n ij n i j n i. Autres médicaments n īj n ī j n ī. n.j n. j n n ij avec i {1,...I} et j {1,...J} indique donc le nombre de notifications impliquant à la fois le médicament i et l événement indésirable j. n i. = i n ij, n.j = j n ij et n = ij n ij représentent les comptes marginaux. Il faut néanmoins noter que du fait de la multiplicité des couples impliqués dans certaines notifications spontanées, ces comptes marginaux ne correspondent pas au nombre de notifications impliquant le médicament i (n i. ), l événement indésirable j (n.j ) ou les deux (n). Dans la suite de l exposé, les méthodes existantes sont passées en revue.

2.2 Les méthodes fréquentistes 9 2.2 Les méthodes fréquentistes 2.2.1 La méthode Reporting Odds Ratio(ROR) La méthode ROR proposée par van Puijenbroek et al. (2002) consiste à estimer pour chacun des couples (i, j) l odds ratio ψ ij à partir de la table 2.1 : ˆψ ij = n ijn ī j. n īj n i j Le logarithme de ˆψ ij est supposé suivre une loi normale dont la variance est estimée à partir de la delta méthode : var{ln( ˆψ ij )} = 1 n ij + 1 n ī j + 1 n īj + 1. n i j Un signal est généré lorsque la borne inférieure de l intervalle de confiance à 95% de ln( ˆψ ij ) est strictement supérieure à 0. De par sa définition, ˆψij n est pas calculable dans les cas très rares où le médicament i n est associé qu à l événement indésirable j (n i j = 0) ou lorsque l événement indésirable j n est associé qu au médicament i (n īj =0). 2.2.2 La méthode Proportional Reporting Ratio(PRR) La méthode PRR proposée par Evans et al. (2001) est basée sur le calcul du risque relatif observé dans la table 2.1 : ˆϕ ij = n ij/n i.. n īj /n ī. De manière analogue à ˆψ ij, ˆϕ ij n est pas calculable dans le cas où n īj = 0.

2.3 Les méthodes bayésiennes 10 La règle proposée par Evans et al. et utilisée au MCA pour la génération d un signal est fondée sur 3 critères : (i) ˆϕ ij 2, (ii) n ij 3 et (iii) la statistique de χ 2 à 1 degré de liberté 4. D autre part, van Puijenbroek et al. (2002) ont proposé le même type de règle de décision que celle utilisée pour la méthode ROR. Le logarithme de ˆϕ ij est supposé suivre une loi normale de variance estimée par : var{ln(ˆϕ ij )} = 1 n ij + 1 n i. + 1 n īj + 1, n ī. et un signal est généré lorsque la borne inférieure de l intervalle de confiance à 95% de ln(ˆϕ ij ) est strictement supérieure à 0. En pratique, les deux statistiques ˆψ et ˆϕ donnent des résultats très proches ce qui s explique par le fait que l on observe pour la très grande majorité des couples n ij (n īj, n i j) n ī j (Almenoff et al., 2007). 2.3 Les méthodes bayésiennes 2.3.1 La méthode Bayesian Confidence Propagation Neural Network(BCPNN) Le modèle La méthode initialement proposée par Bate et al. (1998) repose sur 3 modèles beta-binomiaux : n ij p ij Bi(n, p ij ) avec p ij Be(α ij, β ij ) n i. p i. Bi(n, p i. ) avec p ij Be(α i., β i. ) n.j p.j Bi(n, p.j ) avec p.j Be(α.j, β.j )

2.3 Les méthodes bayésiennes 11 dans lesquels p i., p.j et p ij indiquent respectivement la probabilité dans la base d être exposé au médicament i, d observer l événement indésirable j et de rencontrer les deux. Les distributions des paramètres a posteriori sont donc aussi des lois beta : p ij p ij n ij Be(α ij + n ij, β ij + n n ij ) p i. p i. n i. Be(α i. + n i., β i. + n n i. ) p.j p.j n.j Be(α.j + n.j, β.j + n n.j ). Dans la suite de l exposé, le symbole sera utilisé pour indiquer des variables aléatoires conditionnelles aux observations appropriées. Les hyperparamètres proposés par Bate et al. (1998) pour les distributions a priori sont les suivants : α ij = 1, β ij = 1 E(p i. )E(p.j ) 1, α i. = 1, β i. = 1, α.j = 1 et β.j = 1 avec E(p i. ) = α i. + n i. α i. + β i. + n et E(p.j ) = α.j + n.j α.j + β.j + n. Bate et al. définissent donc deux lois uniformes pour p i. et p.j. Quant aux valeurs choisies pour les hyperparamètres α ij et β ij, elles sont justifiées par le fait que l espérance a priori de p ij correspond ainsi au produit des espérances a posteriori des probabilités marginales. Plus récemment, Norén et al. (2006) ont proposé de généraliser ces 3 modèles beta-binomiaux à un modèle Dirichlet-multinomial afin de mieux prendre en compte les dépendances existant entre la probabilité de la cellule considérée et les probabilités

2.3 Les méthodes bayésiennes 12 marginales correspondantes : (n ij, n i j, n īj, n ī j) Mu(n, p ij, p i j, p īj, p ī j) avec (p ij, p i j, p īj, p ī j) Di(α ij, α i j, α īj, α ī j). La distribution a posteriori de (p ij, p i j, p īj, p ī j) est donc aussi une loi de Dirichlet : (p ij, p i j, p īj, p ī j) Di(γ ij, γ i j, γ īj, γ ī j) où γ kl désigne α kl + n kl. p i., p.j et p ij sont toujours distribuées selon des lois beta mais avec une paramétrisation légèrement différente : p ij Be(γ ij, γ i j + γ īj + γ ī j) p i. = p ij + p i j Be(γ ij + γ i j, γ īj + γ ī j) p.j = p ij + p īj Be(γ ij + γ īj, γ i j + γ ī j). Les hyperparamètres choisis sont les suivants : α ij = q i. q.j α.., α i j = q i. q. j α.., α īj = q ī. q.j α.., α ī j = q ī. q. j α.., avec α.. = 0.5 q i. q.j et q i. = n i. + 0.5 n + 1, qī. = nī. + 0.5 n + 1, q.j = n.j + 0.5 n + 1, q. j = n. j + 0.5 n + 1.