UNIVERSITÉ PARIS-SUD 11 FACULTÉ DE MÉDECINE

Dimension: px
Commencer à balayer dès la page:

Download "UNIVERSITÉ PARIS-SUD 11 FACULTÉ DE MÉDECINE"

Transcription

1 UNIVERSITÉ PARIS-SUD 11 FACULTÉ DE MÉDECINE Année : 2009 N attribué par la bibiothèque THÈSE en vue de l obtention du diplôme de DOCTEUR DE L UNIVERSITÉ PARIS-SUD 11 Spécialité : BIOSTATISTIQUE Présentée et soutenue publiquement par Ismaïl AHMED Le 8 avril 2009 Détection automatique de signaux en pharmacovigilance : Approche statistique fondée sur les comparaisons multiples Directeur de thèse : M me Pascale Tubert-Bitter JURY M. Jean Christophe Thalabard, Pr. Président M. Stephen Evans, Pr. Rapporteur M me Sylvia Richardson, Pr. Rapporteur M. Stéphane Robin, Pr. Examinateur M me Pascale Tubert-Bitter, DR. Examinateur

2 Mes remerciements s adressent en premier lieu à Pascale Tubert-Bitter. Travailler avec elle a été un très grand plaisir et je lui suis profondément reconnaissant d avoir su si bien me guider et m encourager tout au long de ce parcours. Je tiens aussi à remercier chaleureusement Françoise Haramburu, Annie Fourrier- Réglat, Frantz Thiessard, Carmen Kreft-Jais, Ghada Miremont-Salamé et Bernard Bégaud pour leur aide et l intérêt qu ils ont porté à ce travail. Mes remerciements s adressent ensuite à Cyril Dalmasso avec qui j ai eu grand plaisir à travailler ainsi qu à Philippe Broët. Je remercie également les membres et ex-membres de l équipe biostatistique, et plus particulièrement Laurence Watier et Thierry Moreau, pour leur accueil, leur disponibilité et leurs conseils. Je tiens aussi à remercier vivement M. Lellouch pour nos longues conversations, ses lectures attentives et ses conseils avisés. Merci aux membres de l unité 780 qui ont rendu ces trois années de thèse très agréables et plus particulièrement à Jérémie, Hélène, Antoine, Estelle, Olivier, Hélèna, Yves, Dorota, Sigrid, Juliette, Mounia, Raphaëlle, Marie, Alexia et David avec lesquels j ai le plus partagé. L occasion m est donnée de remercier l Institut de Recherche en Santé Publique qui a contribué financièrement à l accomplissement de ce travail. Je remercie Stephen Evans et Sylvia Richardson pour avoir accepté d être les rapporteurs de ma thèse ainsi que Stéphane Robin et Jean Christophe Thalabard pour leur participation à mon jury. Mes derniers remerciements s adressent à ma famille et à Aurélie. i

3 Valorisation scientifique Communications orales I. Ahmed, C. Dalmasso, F. Haramburu, A. Fourrier-Réglat, F. Thiessard, C. Kreft-Jaïs, G. Miremont-Salamé, B. Bégaud, P. Broët, P. Tubert-Bitter, Fisher s Exact Test Applied to Pharmacovigilance, 29th Annual Conference of the International Society for Clinical Biostatistics, August 2008, Copenhagen, Denmark. I. Ahmed, F. Haramburu, A. Fourrier-Réglat, F. Thiessard, C. Kreft-Jais, G. Miremont- Salamé, B. Bégaud, P. Tubert-Bitter, Signal Ranking-Based Comparison of Automatic Detection Methods in Pharmacovigilance : A Hypothesis Test Approach, Epidemiology and Biometry 2008, IBS Channel Network, July 2008, Paris, France. I. Ahmed, F. Haramburu, A. Fourrier-Réglat, F. Thiessard, G. Miremont-Salamé, C. Kreft- Jaïs, P. Tubert-Bitter, Bayesian Pharmacovigilance Signal Detection Methods Revisited in a Multiple Comparison Setting, First IBS Channel Network Conference, 8-11 May 2007, Rolduc, The Netherlands. I. Ahmed, F. Haramburu, A. Fourrier-Réglat, F. Thiessard, G. Miremont-Salamé, C. Kreft- Jaïs, P. Tubert-Bitter, A New Automatic Signal Detection Method in Pharmacovigilance ; A Bayesian Multiple Comparisons Setting, 22nd International Conference on Pharmacoepidemiology & Therapeutic Risk Management, August 2006, Lisbon, Portugal. Publications avec comité de lecture I. Ahmed, C. Dalmasso, F. Haramburu, F. Thiessard, P. Broët, P. Tubert-Bitter, False Discovery Rate Estimation for Frequentist Pharmacovigilance Signal Detection Methods, Biometrics, Accepté. I. Ahmed, F. Haramburu, A. Fourrier-Réglat, F. Thiessard, C. Kreft-Jais, G. Miremont- Salamé, B. Bégaud, P. Tubert-Bitter, Bayesian Pharmacovigilance Signal Detection Methods Revisited in a Multiple Comparison Setting Statistics in Medicine, Accepté. ii

4 Table des matières Remerciements i Valorisation scientifique Communications orales Publications avec comité de lecture ii ii ii Table des matières iii Table des figures vi Liste des tableaux viii Liste des abréviations ix 1 Introduction Contexte Problématique Objectif Description des principales méthodes de détection automatique Structure des données analysées Les méthodes fréquentistes La méthode Reporting Odds Ratio (ROR) iii

5 TABLE DES MATIÈRES iv La méthode Proportional Reporting Ratio (PRR) Les méthodes bayésiennes La méthode Bayesian Confidence Propagation Neural Network (BCPNN) La méthode Gamma Poisson Shrinker (GPS) Quelques remarques générales Méthodes de détection automatique revisitées dans le cadre des comparaisons multiples Comparaisons multiples et méthodes fréquentistes ROR, PRR et test d hypothèses Test exact de Fisher et mid-p-values FDR et méthodes fréquentistes Comparaisons multiples et méthodes bayésiennes GPS et BCPNN dans le cadre bayésien de la théorie de la décision Autres approches proposées pour la prise en compte des comparaisons multiples à partir du modèle GPS Quelques remarques Étude de simulations Modèle de simulation Comparaison des approches fréquentistes Étude de la densité des degrés de signification Estimation de π 0 π Comparaison des méthodes selon le FDR et son estimation Comparaison des approches bayésiennes GPS et règles de classement

6 TABLE DES MATIÈRES v Comparaison de GPS et BCPNN basés sur Pr(H 0 ) Comparaison à partir du modèle de simulations proposé Comparaison à partir du modèle de simulations de Roux et al Conclusion des simulations Application aux données françaises de pharmacovigilance Comparaison des méthodes sur les données de Les données Estimation des quantités caractéristiques (FDR, FNR, Se et Sp) Comparaison des signaux générés Évaluation séquentielle à partir de cas d alertes réels Plan d analyse Premier scénario : Mise en place d un système de détection automatique Deuxième scénario : Utilisation en routine de GPS Conclusion 90 Réferences 94 Annexes 98 A Résultats complémentaires pour l étude de simulations 98 B Résultats complémentaires pour l application 102 C Publications 114

7 Table des figures 3.1 Histogrammes de la densité marginale des degrés de signification obtenus à partir de la méthode midrfet sur les données de la base française Histogramme de la distribution de Pr(λ ij 1) obtenu à partir des données de la base Française Histogrammes du logarithme des risques observés dans la base française et dans les données simulées Histogrammes des distributions marginales, sous H 0 et sous H 1 des degrés de signification pour ROR, RFET et midrfet Estimations de π 0 π 0 obtenues avec LBE et Qvalue à partir de la distribution marginale des degrés de signification transformés (p ) pour RFET Comparaison de ROR, RFET et midrfet selon le FDR et son estimation pour n ij Comparaison de ROR, RFET et midrfet selon le FDR et son estimation pour n ij Biais relatif observé dans l estimation du FDR pour ROR, RFET et midrfet Comparaison selon le FDR et son estimation des différentes règles de classement pour GPS Variabilité du FDR et de son estimation pour GPS basé sur Pr(H 0) Comparaison selon le FDR et son estimation de BCPNN et GPS basés sur Pr(H 0) Comparaison selon le FNR et son estimation de BCPNN et GPS basés sur Pr(H 0 ) Comparaison selon la sensibilité et son estimation de BCPNN et GPS basés sur Pr(H 0 ) Comparaison selon la spécificité et son estimation de BCPNN et GPS basés sur Pr(H 0) Comparaison du FDR obtenu avec midrfet, ROR, BCPNN et GPS basé sur Pr(H 0) vi

8 TABLE DES FIGURES vii 4.14 Comparaison du FDR et de son estimation pour midrfet, BCPNN et GPS basé sur Pr(H 0) Comparaison du FDR et de son estimation pour ROR, midrfet, BCPNN et GPS basé Pr(H 0) à partir du plan de simulation de Roux et al. (2005) Comparaison des estimations du FDR sur la base de pharmacovigilance française Proportion de signaux communs entre les méthodes proposées en fonction du nombre de signaux générés Proportion de signaux communs entre les méthodes proposées pour {ψ 0 = 1, RR 0 = 1} en fonction du FDR estimé par GPS basé sur Pr(H 0) Proportion de signaux communs entre les différentes règles de classement pour GPS et RR 0 = Évolution au cours du temps du nombre de couples médicamentévénements présentant au moins une et au moins trois notifications dans la base française créée au 1 er janvier Histogramme des délais observés entre la date de détection par le modèle GPS basé sur Pr(H 0 ) et la date d alerte en comité technique - Scénario Évolution du nombre de nouveaux signaux générés à partir du modèle GPS basé sur Pr(H 0 ) et d un seuil de 5% pour le FDR - Scénario Évolution du seuil sur Pr(H 0) pour FDR = 5% lors de l utilisation de GPS - Scénario Histogramme des 216 délais observés entre la date de détection par le modèle GPS basé sur Pr(H 0 ) et la date d alerte en comité technique - Scénario Évolution du nombre de nouveaux signaux générés à partir du modèle GPS basé sur Pr(H 0 ) et FDR = 1% - Scénario A.1 Histogrammes de la distribution des degrés de signification sous H 0 pour ROR, RFET et midrfet avec n ij A.2 Histogrammes de la distribution des degrés de signification sous H 0 pour ROR, RFET et midrfet avec n ij A.3 Estimations de π 0 π 0 obtenues avec LBE et Qvalue à partir de la distribution marginale des degrés de signification transformés (p ) pour ROR B.1 Proportion de signaux communs entre les méthodes proposées en fonction du FDR estimé par GPS

9 Liste des tableaux 2.1 Représentation des données pour le couple (i, j) Tableau récapitulatif des méthodes étudiées Estimation des quantités caractéristiques avec GPS et Pr(H 0 ) sur les données de pharmacovigilance française Nombre de signaux de référence détectés par GPS basé sur Pr(H 0) et Q 0.05 (λ ), midrfet et ROR - Scénario Comparaison des signaux de référence détectés dans les cas n ij 3 et n ij 1 pour GPS basé sur Pr(H 0) et pour midrfet - Scénario Rangs moyens dans le délai de détection des 309 signaux de référence pour GPS basé sur Pr(H 0) et Q 0.05 (λ ), midrfet et ROR - Scénario Rangs moyens dans le délai de détection des 164 signaux de référence pour GPS basé sur Pr(H 0 ) et Q 0.05(λ ), midrfet et ROR - Scénario Capacité de détection du modèle GPS basé sur Pr(H 0) et FDR = 5% en fonction du nombre de notifications associé aux signaux de référence au 1 er juillet Scénario B.1 Signaux de référence (47) avec moins de 3 notifications spontanées au 1 er juillet B.2 Signaux de référence (216) détectés par le modèle GPS basé sur Pr(H 0) et FDR = 5% - Scénario B.3 Signaux de référence (46) avec au moins 3 notifications spontanées au 1 er juillet 2002 et non détectés par le modèle GPS basé sur Pr(H 0) et FDR = 5% - Scénario viii

10 Liste des abréviations Afssaps Agence française de sécurité sanitaire des produits de santé ATC Anatomical Therapeutical Clinical ATC5 Code ATC à 5 caractères BCPNN Bayesian Confidence Propagation Neural Network CRPV Centre régional de pharmacovigilance FDA Food and Drug Administration FDP False Discovery Proportion FDR False Discovery Rate FNP False Negative Proportion FNR False Negative Rate GPS Gamma Poisson Shrinker HLT High Level Term LBE Location Based Estimator MedDRA Medical Dictionary for Regulatory Activities MGPS Multi-Item Gamma Poisson Shrinker midrfet mid-p-values calculées à partir du test exact de Fisher PRR Proportional Reporting Ratio RFET Reporting Fisher s Exact Test ROR Reporting Odds Ratio. Se Sensibilité Sp Spécificité ix

11 Chapitre 1 Introduction 1.1 Contexte Les effets indésirables des médicaments sont le plus souvent découverts après leur autorisation de mise sur le marché et ceci pour au moins deux raisons. La première tient à la nature même des effets indésirables qui peuvent être rares, spécifiques à certaines catégories de la population ou se manifester après une grande période de latence. Une autre raison est qu une fois le médicament commercialisé, ses conditions d utilisation sont en général différentes de celles étudiées dans les cadres expérimentaux précédant sa mise sur le marché. Les systèmes de pharmacovigilance ont donc pour but de détecter le plus précocement possible l existence d associations entre médicaments et événements indésirables. Ils reposent en général sur la déclaration par des professionnels de santé (médecins ou pharmaciens) de la survenue d événements indésirables dont la cause suspectée est médicamenteuse. Prises individuellement, ces notifications spontanées ne comportent que très rarement l assurance de la responsabilité du ou des médicaments incriminés. C est donc leur accumulation qui conduit les pharmacologues à mettre en évidence l existence d effets indésirables médicamenteux. Une difficulté rencontrée dans l analyse de telles données réside dans le fait que 1

12 1.1 Contexte 2 les effets indésirables des médicaments commercialisés ne sont pas tous reconnus ni rapportés aux instances de pharmacovigilance. Des études montrent que cette sousnotification peut être très importante même dans le cas d effets indésirables graves (Bégaud et al., 2002). Il est très vraisemblable qu elle soit fonction de l événement indésirable, du médicament ou du couple événement-médicament étudié ce qui peut biaiser les conclusions tirées de l information brute (van der Heijden et al., 2002). Néanmoins, malgré ses limites, l analyse des notifications spontanées demeure certainement le moyen le plus rapide et économique pour identifier de nouveaux effets médicamenteux après l autorisation de mise sur le marché et est par conséquent à la base de la plupart des décisions prises par les instances de pharmacovigilance. Le système de pharmacovigilance français a été mis en place en Il reposait alors sur un réseau de 15 centres régionnaux de pharmacovigilance (CRPV) qui fut rapidement étendu à 29 en 1984 puis à 31 en Ces centres ont une mission d information auprès des professionnels de santé. Ils ont aussi en charge la collecte des notifications ainsi que leur enregistrement au sein de la base nationale coordonnée par l unité de pharmacovigilance de l Agence Française de Sécurité Sanitaire des Produits de Santé (Afssaps). C est aussi au niveau de ces centres que s exerce une partie de la surveillance; les cas suspectés étant par la suite discutés par le comité technique de pharmacovigilance lors de réunions mensuelles au siège de l Afssaps. Entre 1986 et 2001, les données de pharmacovigilance françaises ont été enrichies de notifications spontanées avec une augmentation linéaire à travers le temps pour atteindre le nombre annuel de en 2001 (Thiessard et al., 2005). Cette base doit être cependant considérée comme petite face aux deux principales bases mondiales : la base américaine coordonnée par la Food and Drug Administration (FDA) et la base de l Organisation Mondiale de la Santé administrée par l Uppsala Moni-

13 1.2 Problématique 3 toring Center en Suède, qui, en décembre 2004, contenaient respectivement environ 2.6 et 3.7 millions de notifications (Almenoff et al., 2005). Face à ce flux très important de données, ces deux systèmes de pharmacovigilance ainsi que d autres ont développé depuis une dizaine d années des méthodes statistiques de génération automatique de signaux. Ces méthodes ont pour but de détecter les couples événement-médicament dont la présence est anormalement fréquente par rapport à ce qui est attendu compte tenu de l information présente dans le reste de la base. Du fait des limites des notifications spontanées énoncées plus haut et de la nature essentiellement exploratoire des ces analyses, les signaux ainsi générés doivent être examinés par des experts pour en évaluer la pertinence. Il s agit donc plutôt d outils complémentaires à la veille opérée par les pharmacovigilants ayant pour objectif d aider à l exploration de l immensité des données et agissant comme des générateurs d hypothèses. 1.2 Problématique Les principales méthodes de détection automatique décrites dans la littérature sont les méthodes Proportional Reporting Ratio (PRR, Evans et al. 2001), Reporting Odds Ratio (ROR, van Puijenbroek et al. 2002), Bayesian Confidence Propagation Neural Network (BCPNN, Bate et al. 1998; Norén et al. 2006) et (Multi- Item) Gamma Poisson Shrinker ((M)GPS, DuMouchel 1999; DuMouchel et Pregibon 2001). La méthode PRR est utilisée à la fois par le système de pharmacovigilance anglais (Medical Control Agency) et par le système de pharmacovigilance européen EudraVigilance. La méthode ROR est utilisée sur la base nationale des Pays Bas. La méthode BCPNN est utilisée sur la base de l OMS tandis que la méthode MGPS est utilisée par la FDA (Almenoff et al., 2005; Hauben et al., 2005). La France, pour sa part, n utilise pas encore de système de détection automatique. Néanmoins, le tra-

14 1.2 Problématique 4 vail de thèse de Frantz Thiessard (Thiessard, 2004), l étude par simulation de Roux et al. (2005) et ce travail réalisé en collaboration avec l unité de pharmacovigilance de l Afssaps et le CRPV de Bordeaux (Inserm U. 687) témoignent de la volonté de mettre en place un tel système à moyen terme. Les méthodes de détection automatique citées plus haut reposent sur une représentation simplifiée de la base de pharmacovigilance dans laquelle les données sont agrégées de manière à obtenir une très grande table de contingence croisant l ensemble des événements indésirables et des médicaments. Chaque couple se voit ensuite associer une mesure de disproportionnalité qui conduit par comparaison à un seuil à la génération ou non d un signal. Ces méthodes diffèrent sur la mesure de disproportionnalité choisie, le modèle de probabilité à l origine de cette mesure ainsi que sur les seuils de génération d alerte. De plus, elles ne présentent pas le même degré de complexité. En effet, les méthodes PRR et ROR sont des méthodes simples de nature fréquentiste alors que BCPNN et GPS sont des méthodes bayésiennes reposant sur une modélisation des données plus complexe. Une limite de ces méthodes réside dans les seuils actuellement utilisés qui ont été déterminés de manière arbitraire, au mieux sur la seule base d études rétrospectives empiriques. Il nous a donc semblé intéressant de réfléchir à une détermination plus objective de ces derniers, fondée en particulier sur des critères d erreurs statistiques tenant compte du nombre très important de comparaisons effectuées simultanément. La prise en compte de la multiplicité des comparaisons est un problème statistique qui a reçu un intérêt croissant ces dernières années, en grande partie motivé par l arrivée de technologies pour l analyse de données génomiques que sont les biopuces. Le fruit de ces travaux a été le développement d une multitude de méthodes pour contrôler ou estimer de nouveaux critères d erreurs. Parmi eux, le False Discovery Rate (FDR) proposé par Benjamini et Hochberg (1995) et défini comme l espérance

15 1.3 Objectif 5 du taux de fausses découvertes a reçu un intérêt particulier dans la mesure où il est adapté à l exploration de jeux de données de grandes tailles. 1.3 Objectif Ce travail a été initié par la volonté de proposer des seuils de détection pour les méthodes existantes fondés sur le FDR. Pour ce faire, les méthodes ont été revisitées dans le cadre des tests d hypothèses, ce qui ne modifie en rien leur modèle statistique sous-jacent mais conduit néanmoins à des stratégies de détection relativement différentes. Nous nous sommes intéressés au FDR dans la mesure où ce critère semblait a priori répondre au caractère exploratoire de l analyse des données de pharmacovigilance. La nature fréquentiste ou bayésienne des méthodes nous a conduit à son estimation selon deux approches différentes. En ce qui concerne les méthodes fréquentistes, nous avons étudié les approches d estimation du FDR par la modélisation des degrés de signification à l aide de mélanges de distributions (Storey, 2002) tandis que pour les méthodes bayésiennes, l approche envisagée s est appuyée sur le cadre de la théorie de la décision proposé par Müller et al. (2004). Le plan de ce manuscrit est le suivant. Nous présentons dans le chapitre 2 les principales méthodes de détection automatique. Le chapitre 3 expose l extension de ces méthodes au cadre des comparaisons multiples. Le chapitre 4 est consacré à la présentation de deux études par simulations visant à comparer les stratégies de détection proposées à celles actuellement en vigueur. La première se fonde sur un modèle de simulation utilisant des caractéristiques de la base française de pharmacovigilance tandis que la deuxième reprend le modèle de simulation de Roux et al. (2005) qui vise à reproduire un système complet de notifications spontanées. Le chapitre 5 inclut d une part les résultats de ce travail sur l ensemble des données françaises de pharmacovigilance collectées entre 1984 et D autre part nous présentons les

16 1.3 Objectif 6 résultats d une étude rétrospective ayant pour objectif d évaluer les méthodes proposées en utilisation séquentielle à partir de cas d alertes réels. Le chapitre 6 conclut sur le travail réalisé.

17 Chapitre 2 Description des principales méthodes de détection automatique 2.1 Structure des données analysées Toutes les méthodes de détection automatique de signaux citées en introduction se fondent sur une représentation des données de pharmacovigilance sous la forme d une très grande table de contingence de dimension I J croisant l ensemble des médicaments et des événements indésirables impliqués au moins une fois dans une notification spontanée. Comme nous le verrons dans le chapitre 5, la taille de cette table de contingence dépend fortement du degré de précision utilisé pour le codage des événements indésirables et des médicaments. Cette table est aussi caractérisée par une grande proportion de cellules vides dépendant, là encore, du codage utilisé. Une grande partie des notifications spontanées envoyées aux CRPV implique plusieurs médicaments et/ou plusieurs événements indésirables. Dans de tels cas, 7

18 2.1 Structure des données analysées 8 chacune des combinaisons médicament-événement indésirable présente dans la notification est reportée dans la table de contingence. Les méthodes automatiques étudiées reposent sur des mesures de disproportionnalité calculées pour l ensemble des couples ayant fait l objet d au moins une notification spontanée. Ces dernières constituent les statistiques d intérêt et sont calculées pour un couple (i, j) par agrégation de la table I J en une table de contingence 2 2 présentée dans le tableau 2.1. Tab. 2.1: Représentation des données pour le couple (i, j). Evénement Autres événement indésirable j indésirables Médicament i n ij n i j n i. Autres médicaments n īj n ī j n ī. n.j n. j n n ij avec i {1,...I} et j {1,...J} indique donc le nombre de notifications impliquant à la fois le médicament i et l événement indésirable j. n i. = i n ij, n.j = j n ij et n = ij n ij représentent les comptes marginaux. Il faut néanmoins noter que du fait de la multiplicité des couples impliqués dans certaines notifications spontanées, ces comptes marginaux ne correspondent pas au nombre de notifications impliquant le médicament i (n i. ), l événement indésirable j (n.j ) ou les deux (n). Dans la suite de l exposé, les méthodes existantes sont passées en revue.

19 2.2 Les méthodes fréquentistes Les méthodes fréquentistes La méthode Reporting Odds Ratio(ROR) La méthode ROR proposée par van Puijenbroek et al. (2002) consiste à estimer pour chacun des couples (i, j) l odds ratio ψ ij à partir de la table 2.1 : ˆψ ij = n ijn ī j. n īj n i j Le logarithme de ˆψ ij est supposé suivre une loi normale dont la variance est estimée à partir de la delta méthode : var{ln( ˆψ ij )} = 1 n ij + 1 n ī j + 1 n īj + 1. n i j Un signal est généré lorsque la borne inférieure de l intervalle de confiance à 95% de ln( ˆψ ij ) est strictement supérieure à 0. De par sa définition, ˆψij n est pas calculable dans les cas très rares où le médicament i n est associé qu à l événement indésirable j (n i j = 0) ou lorsque l événement indésirable j n est associé qu au médicament i (n īj =0) La méthode Proportional Reporting Ratio(PRR) La méthode PRR proposée par Evans et al. (2001) est basée sur le calcul du risque relatif observé dans la table 2.1 : ˆϕ ij = n ij/n i.. n īj /n ī. De manière analogue à ˆψ ij, ˆϕ ij n est pas calculable dans le cas où n īj = 0.

20 2.3 Les méthodes bayésiennes 10 La règle proposée par Evans et al. et utilisée au MCA pour la génération d un signal est fondée sur 3 critères : (i) ˆϕ ij 2, (ii) n ij 3 et (iii) la statistique de χ 2 à 1 degré de liberté 4. D autre part, van Puijenbroek et al. (2002) ont proposé le même type de règle de décision que celle utilisée pour la méthode ROR. Le logarithme de ˆϕ ij est supposé suivre une loi normale de variance estimée par : var{ln(ˆϕ ij )} = 1 n ij + 1 n i. + 1 n īj + 1, n ī. et un signal est généré lorsque la borne inférieure de l intervalle de confiance à 95% de ln(ˆϕ ij ) est strictement supérieure à 0. En pratique, les deux statistiques ˆψ et ˆϕ donnent des résultats très proches ce qui s explique par le fait que l on observe pour la très grande majorité des couples n ij (n īj, n i j) n ī j (Almenoff et al., 2007). 2.3 Les méthodes bayésiennes La méthode Bayesian Confidence Propagation Neural Network(BCPNN) Le modèle La méthode initialement proposée par Bate et al. (1998) repose sur 3 modèles beta-binomiaux : n ij p ij Bi(n, p ij ) avec p ij Be(α ij, β ij ) n i. p i. Bi(n, p i. ) avec p ij Be(α i., β i. ) n.j p.j Bi(n, p.j ) avec p.j Be(α.j, β.j )

21 2.3 Les méthodes bayésiennes 11 dans lesquels p i., p.j et p ij indiquent respectivement la probabilité dans la base d être exposé au médicament i, d observer l événement indésirable j et de rencontrer les deux. Les distributions des paramètres a posteriori sont donc aussi des lois beta : p ij p ij n ij Be(α ij + n ij, β ij + n n ij ) p i. p i. n i. Be(α i. + n i., β i. + n n i. ) p.j p.j n.j Be(α.j + n.j, β.j + n n.j ). Dans la suite de l exposé, le symbole sera utilisé pour indiquer des variables aléatoires conditionnelles aux observations appropriées. Les hyperparamètres proposés par Bate et al. (1998) pour les distributions a priori sont les suivants : α ij = 1, β ij = 1 E(p i. )E(p.j ) 1, α i. = 1, β i. = 1, α.j = 1 et β.j = 1 avec E(p i. ) = α i. + n i. α i. + β i. + n et E(p.j ) = α.j + n.j α.j + β.j + n. Bate et al. définissent donc deux lois uniformes pour p i. et p.j. Quant aux valeurs choisies pour les hyperparamètres α ij et β ij, elles sont justifiées par le fait que l espérance a priori de p ij correspond ainsi au produit des espérances a posteriori des probabilités marginales. Plus récemment, Norén et al. (2006) ont proposé de généraliser ces 3 modèles beta-binomiaux à un modèle Dirichlet-multinomial afin de mieux prendre en compte les dépendances existant entre la probabilité de la cellule considérée et les probabilités

22 2.3 Les méthodes bayésiennes 12 marginales correspondantes : (n ij, n i j, n īj, n ī j) Mu(n, p ij, p i j, p īj, p ī j) avec (p ij, p i j, p īj, p ī j) Di(α ij, α i j, α īj, α ī j). La distribution a posteriori de (p ij, p i j, p īj, p ī j) est donc aussi une loi de Dirichlet : (p ij, p i j, p īj, p ī j) Di(γ ij, γ i j, γ īj, γ ī j) où γ kl désigne α kl + n kl. p i., p.j et p ij sont toujours distribuées selon des lois beta mais avec une paramétrisation légèrement différente : p ij Be(γ ij, γ i j + γ īj + γ ī j) p i. = p ij + p i j Be(γ ij + γ i j, γ īj + γ ī j) p.j = p ij + p īj Be(γ ij + γ īj, γ i j + γ ī j). Les hyperparamètres choisis sont les suivants : α ij = q i. q.j α.., α i j = q i. q. j α.., α īj = q ī. q.j α.., α ī j = q ī. q. j α.., avec α.. = 0.5 q i. q.j et q i. = n i n + 1, qī. = nī n + 1, q.j = n.j n + 1, q. j = n. j n + 1.

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures) CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un

Plus en détail

VI. Tests non paramétriques sur un échantillon

VI. Tests non paramétriques sur un échantillon VI. Tests non paramétriques sur un échantillon Le modèle n est pas un modèle paramétrique «TESTS du CHI-DEUX» : VI.1. Test d ajustement à une loi donnée VI.. Test d indépendance de deux facteurs 96 Différentes

Plus en détail

Projet de thèse. Intitulé de la thèse. Spécialité du doctorat. Problématique scientifique générale

Projet de thèse. Intitulé de la thèse. Spécialité du doctorat. Problématique scientifique générale Projet de thèse Intitulé de la thèse Détection automatisée de signaux en pharmacovigilance : Exploitation conjointe de données de notifications spontanées et médico- administratives. Spécialité du doctorat

Plus en détail

Théorie et codage de l information

Théorie et codage de l information Théorie et codage de l information Mesure quantitative de l information - Chapitre 2 - Information propre et mutuelle Quantité d information propre d un événement Soit A un événement de probabilité P (A)

Plus en détail

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE UE4 : Biostatistiques Chapitre 3 : Principe des tests statistiques d hypothèse José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Introduction

Plus en détail

Les indices à surplus constant

Les indices à surplus constant Les indices à surplus constant Une tentative de généralisation des indices à utilité constante On cherche ici en s inspirant des indices à utilité constante à définir un indice de prix de référence adapté

Plus en détail

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3

Plus en détail

Programme des épreuves des concours externes de recrutement des personnels techniques et administratifs de recherche et de formation

Programme des épreuves des concours externes de recrutement des personnels techniques et administratifs de recherche et de formation Programme des épreuves des concours externes de recrutement des personnels E1 RECRUTEMENT DES ASSISTANTS INGENIEURS DE RECHERCHE ET DE FORMATION...2 E1.1 Gestionnaire de base de données...2 E1.2 Développeur

Plus en détail

TABLE DES MATIERES. C Exercices complémentaires 42

TABLE DES MATIERES. C Exercices complémentaires 42 TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence

Plus en détail

NON-LINEARITE ET RESEAUX NEURONAUX

NON-LINEARITE ET RESEAUX NEURONAUX NON-LINEARITE ET RESEAUX NEURONAUX Vêlayoudom MARIMOUTOU Laboratoire d Analyse et de Recherche Economiques Université de Bordeaux IV Avenue. Leon Duguit, 33608 PESSAC, France tel. 05 56 84 85 77 e-mail

Plus en détail

La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites

La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites La problématique des tests Cours V 7 mars 8 Test d hypothèses [Section 6.1] Soit un modèle statistique P θ ; θ Θ} et des hypothèses H : θ Θ H 1 : θ Θ 1 = Θ \ Θ Un test (pur) est une statistique à valeur

Plus en détail

Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes

Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes Zohra Guessoum 1 & Farida Hamrani 2 1 Lab. MSTD, Faculté de mathématique, USTHB, BP n 32, El Alia, Alger, Algérie,zguessoum@usthb.dz

Plus en détail

Travaux Dirigés de Probabilités - Statistiques, TD 4. Lois limites ; estimation.

Travaux Dirigés de Probabilités - Statistiques, TD 4. Lois limites ; estimation. Travaux Dirigés de Probabilités - Statistiques, TD 4 Lois limites ; estimation. Exercice 1. Trois machines, A, B, C fournissent respectivement 50%, 30%, 20% de la production d une usine. Les pourcentages

Plus en détail

Agrégation interne de Mathématiques. Session 2009. Deuxième épreuve écrite. (et CAERPA)

Agrégation interne de Mathématiques. Session 2009. Deuxième épreuve écrite. (et CAERPA) Agrégation interne de Mathématiques (et CAEPA Session 2009 Deuxième épreuve écrite 2 NOTATIONS ET PÉLIMINAIES On désigne par le corps des nombres réels et par C le corps des nombres complexes. Si f est

Plus en détail

Théorie de la crédibilité

Théorie de la crédibilité ISFA - Année 2008-2009 Théorie de la crédibilité Chapitre 2 : Prime de Bayes Pierre-E. Thérond Email, Page web, Ressources actuarielles Langage bayesien (1/2) Considérons une hypothèse H et un événement

Plus en détail

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE UE4 : Biostatistiques Chapitre 6 Test de comparaison de pourcentages χ² José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Nature des variables

Plus en détail

UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES

UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES Université Paris 13 Cours de Statistiques et Econométrie I UFR de Sciences Economiques Année 2008-2009 Licence de Sciences Economiques L3 Premier semestre TESTS PARAMÉTRIQUES Remarque: les exercices 2,

Plus en détail

Filtrage stochastique non linéaire par la théorie de représentation des martingales

Filtrage stochastique non linéaire par la théorie de représentation des martingales Filtrage stochastique non linéaire par la théorie de représentation des martingales Adriana Climescu-Haulica Laboratoire de Modélisation et Calcul Institut d Informatique et Mathématiques Appliquées de

Plus en détail

Principe de symétrisation pour la construction d un test adaptatif

Principe de symétrisation pour la construction d un test adaptatif Principe de symétrisation pour la construction d un test adaptatif Cécile Durot 1 & Yves Rozenholc 2 1 UFR SEGMI, Université Paris Ouest Nanterre La Défense, France, cecile.durot@gmail.com 2 Université

Plus en détail

Statistique Descriptive et Inférentielle Méthodes paramétriques et non paramétriques

Statistique Descriptive et Inférentielle Méthodes paramétriques et non paramétriques Fiche TD avec le logiciel : a2-1-c Statistique Descriptive et Inférentielle Méthodes paramétriques et non paramétriques Sylvain Mousset Rappels de probabilités / statistiques Table des matières 1 Probabilités

Plus en détail

Principales caractéristiques de Mixmod

Principales caractéristiques de Mixmod Modèle de mélanges Principales caractéristiques de Mixmod Gérard Govaert et Gilles Celeux 24 octobre 2006 1 Plan Le modèledemélange Utilisations du modèle de mélange Les algorithmes de Mixmod Modèle de

Plus en détail

Jeux à somme nulle : le cas fini

Jeux à somme nulle : le cas fini CHAPITRE 2 Jeux à somme nulle : le cas fini Les jeux à somme nulle sont les jeux à deux joueurs où la somme des fonctions de paiement est nulle. Dans ce type d interaction stratégique, les intérêts des

Plus en détail

Principe d un test statistique

Principe d un test statistique Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre

Plus en détail

PROBABILITES ET STATISTIQUE I&II

PROBABILITES ET STATISTIQUE I&II PROBABILITES ET STATISTIQUE I&II TABLE DES MATIERES CHAPITRE I - COMBINATOIRE ELEMENTAIRE I.1. Rappel des notations de la théorie des ensemble I.1.a. Ensembles et sous-ensembles I.1.b. Diagrammes (dits

Plus en détail

M2 IAD UE MODE Notes de cours (3)

M2 IAD UE MODE Notes de cours (3) M2 IAD UE MODE Notes de cours (3) Jean-Yves Jaffray Patrice Perny 16 mars 2006 ATTITUDE PAR RAPPORT AU RISQUE 1 Attitude par rapport au risque Nousn avons pas encore fait d hypothèse sur la structure de

Plus en détail

Analyse de la variance Comparaison de plusieurs moyennes

Analyse de la variance Comparaison de plusieurs moyennes Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction

Plus en détail

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

La survie nette actuelle à long terme Qualités de sept méthodes d estimation La survie nette actuelle à long terme Qualités de sept méthodes d estimation PAR Alireza MOGHADDAM TUTEUR : Guy HÉDELIN Laboratoire d Épidémiologie et de Santé publique, EA 80 Faculté de Médecine de Strasbourg

Plus en détail

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre. Université de Nantes Année 2013-2014 L3 Maths-Eco Feuille 6 : Tests Exercice 1 On cherche à connaître la température d ébullition µ, en degrés Celsius, d un certain liquide. On effectue 16 expériences

Plus en détail

Méthodes de Simulation

Méthodes de Simulation Méthodes de Simulation JEAN-YVES TOURNERET Institut de recherche en informatique de Toulouse (IRIT) ENSEEIHT, Toulouse, France Peyresq06 p. 1/41 Remerciements Christian Robert : pour ses excellents transparents

Plus en détail

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems

Plus en détail

MASTER 2 : Pharmacologie Clinique et Développement Thérapeutique. Evaluation de nouvelles drogues Critères de jugement clinique

MASTER 2 : Pharmacologie Clinique et Développement Thérapeutique. Evaluation de nouvelles drogues Critères de jugement clinique MASTER 2 : Pharmacologie Clinique et Développement Thérapeutique Evaluation de nouvelles drogues Critères de jugement clinique Jean-Marie BOHER, PhD, Institut Paoli-Calmettes, Marseille Novembre 2011 Typologie

Plus en détail

Prévention et gestion des risques naturels et environnementaux

Prévention et gestion des risques naturels et environnementaux Prévention et gestion des risques naturels et environnementaux Risque et assurance : quelques éléments théoriques Ecole des Ponts - Le 6 Avril 01 Jacques Pelletan 1 Théorie du risque et pérennité de l

Plus en détail

Mémoire d actuariat - promotion 2010. complexité et limites du modèle actuariel, le rôle majeur des comportements humains.

Mémoire d actuariat - promotion 2010. complexité et limites du modèle actuariel, le rôle majeur des comportements humains. Mémoire d actuariat - promotion 2010 La modélisation des avantages au personnel: complexité et limites du modèle actuariel, le rôle majeur des comportements humains. 14 décembre 2010 Stéphane MARQUETTY

Plus en détail

Limites finies en un point

Limites finies en un point 8 Limites finies en un point Pour ce chapitre, sauf précision contraire, I désigne une partie non vide de R et f une fonction définie sur I et à valeurs réelles ou complees. Là encore, les fonctions usuelles,

Plus en détail

Modélisation aléatoire en fiabilité des logiciels

Modélisation aléatoire en fiabilité des logiciels collection Méthodes stochastiques appliquées dirigée par Nikolaos Limnios et Jacques Janssen La sûreté de fonctionnement des systèmes informatiques est aujourd hui un enjeu économique et sociétal majeur.

Plus en détail

Annexe commune aux séries ES, L et S : boîtes et quantiles

Annexe commune aux séries ES, L et S : boîtes et quantiles Annexe commune aux séries ES, L et S : boîtes et quantiles Quantiles En statistique, pour toute série numérique de données à valeurs dans un intervalle I, on définit la fonction quantile Q, de [,1] dans

Plus en détail

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens Chapitre 7 Statistique des échantillons gaussiens Le théorème central limite met en évidence le rôle majeur tenu par la loi gaussienne en modélisation stochastique. De ce fait, les modèles statistiques

Plus en détail

Master IMEA 1 Calcul Stochastique et Finance Feuille de T.D. n o 1

Master IMEA 1 Calcul Stochastique et Finance Feuille de T.D. n o 1 Master IMEA 1 Calcul Stochastique et Finance Feuille de T.D. n o 1 1. a. On considère un modèle de marché (B, S) à une étape. On suppose que S = 5 C et qu à la date t = 1 on a (S u 1 = 51, S d 1 = 48).

Plus en détail

Fiche de révision sur les lois continues

Fiche de révision sur les lois continues Exercice 1 Voir la correction Le laboratoire de physique d un lycée dispose d un parc d oscilloscopes identiques. La durée de vie en années d un oscilloscope est une variable aléatoire notée X qui suit

Plus en détail

Estimation du Quantile conditionnel par les Réseaux de neurones à fonction radiale de base

Estimation du Quantile conditionnel par les Réseaux de neurones à fonction radiale de base Estimation du Quantile conditionnel par les Réseaux de neurones à fonction radiale de base M.A. Knefati 1 & A. Oulidi 2 & P.Chauvet 1 & M. Delecroix 3 1 LUNAM Université, Université Catholique de l Ouest,

Plus en détail

Simulation d un système d assurance automobile

Simulation d un système d assurance automobile Simulation d un système d assurance automobile DESSOUT / PLESEL / DACHI Plan 1 Introduction... 2 Méthodes et outils utilisés... 2.1 Chaines de Markov... 2.2 Méthode de Monte Carlo... 2.3 Méthode de rejet...

Plus en détail

23. Interprétation clinique des mesures de l effet traitement

23. Interprétation clinique des mesures de l effet traitement 23. Interprétation clinique des mesures de l effet traitement 23.1. Critères de jugement binaires Plusieurs mesures (indices) sont utilisables pour quantifier l effet traitement lors de l utilisation d

Plus en détail

Cours 9 : Plans à plusieurs facteurs

Cours 9 : Plans à plusieurs facteurs Cours 9 : Plans à plusieurs facteurs Table des matières Section 1. Diviser pour regner, rassembler pour saisir... 3 Section 2. Définitions et notations... 3 2.1. Définitions... 3 2.2. Notations... 4 Section

Plus en détail

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I Roxane Duroux 1 Cadre de l étude Cette étude s inscrit dans le cadre de recherche de doses pour des essais cliniques

Plus en détail

ESSAIS ADAPTATIFS. Raphaël Porcher. Université Paris Diderot, UMR-S717, Hôpital Saint-Louis Paris

ESSAIS ADAPTATIFS. Raphaël Porcher. Université Paris Diderot, UMR-S717, Hôpital Saint-Louis Paris ESSAIS ADAPTATIFS Point de vue «académique» Raphaël Porcher Université Paris Diderot, UMR-S717, Hôpital Saint-Louis Paris 18 èmes Journées des Statisticiens des CLCC Lille, 16 juin 2011 Définition* Méthode

Plus en détail

Probabilités III Introduction à l évaluation d options

Probabilités III Introduction à l évaluation d options Probabilités III Introduction à l évaluation d options Jacques Printems Promotion 2012 2013 1 Modèle à temps discret 2 Introduction aux modèles en temps continu Limite du modèle binomial lorsque N + Un

Plus en détail

l École nationale des ponts et chaussées http://cermics.enpc.fr/scilab

l École nationale des ponts et chaussées http://cermics.enpc.fr/scilab scilab à l École nationale des ponts et chaussées http://cermics.enpc.fr/scilab Tests de comparaison pour l augmentation du volume de précipitation 13 février 2007 (dernière date de mise à jour) Table

Plus en détail

TSTI 2D CH X : Exemples de lois à densité 1

TSTI 2D CH X : Exemples de lois à densité 1 TSTI 2D CH X : Exemples de lois à densité I Loi uniforme sur ab ; ) Introduction Dans cette activité, on s intéresse à la modélisation du tirage au hasard d un nombre réel de l intervalle [0 ;], chacun

Plus en détail

Statistique descriptive et prévision

Statistique descriptive et prévision Statistique descriptive et prévision Année 2010/2011 L. Chaumont Contents 1. Étude d une variable 5 1.1. Définitions................................ 5 1.2. Représentations graphiques usuelles................

Plus en détail

Marketing quantitatif M2-MASS

Marketing quantitatif M2-MASS Marketing quantitatif M2-MASS Francois.Kauffmann@unicaen.fr UCBN 2 décembre 2012 Francois.Kauffmann@unicaen.fr UCBN Marketing quantitatif M2-MASS 2 décembre 2012 1 / 61 Première partie I Analyse Analyse

Plus en détail

Discrétisation et génération de hiérarchies de concepts

Discrétisation et génération de hiérarchies de concepts Prétraitement des données 1 Pourquoi prétraiter les données? Nettoyage des données Intégration et transformation Réduction des données Discrétisation et génération de hiérarchies de g concepts Pourquoi

Plus en détail

Points méthodologiques Adapter les méthodes statistiques aux Big Data

Points méthodologiques Adapter les méthodes statistiques aux Big Data Points méthodologiques Adapter les méthodes statistiques aux Big Data I. Répétition de tests et inflation du risque alpha II. Significativité ou taille de l effet? 2012-12-03 Biomédecine quantitative 36

Plus en détail

Influence du nombre de réplicats dans une analyse différentielle de données RNA-Seq

Influence du nombre de réplicats dans une analyse différentielle de données RNA-Seq Influence du nombre de réplicats dans une analyse différentielle de données RNA-Seq Sophie Lamarre 1, Stéphane Pyronnet 2, Emeline Sarot 2, Sébastien Déjean 3, Magali San Cristobal 3,4 & Matthieu Vignes

Plus en détail

Modèles et Méthodes de Réservation

Modèles et Méthodes de Réservation Modèles et Méthodes de Réservation Petit Cours donné à l Université de Strasbourg en Mai 2003 par Klaus D Schmidt Lehrstuhl für Versicherungsmathematik Technische Universität Dresden D 01062 Dresden E

Plus en détail

Le modèle de Black et Scholes

Le modèle de Black et Scholes Le modèle de Black et Scholes Alexandre Popier février 21 1 Introduction : exemple très simple de modèle financier On considère un marché avec une seule action cotée, sur une période donnée T. Dans un

Plus en détail

Probabilités. I- Expérience aléatoire, espace probabilisé : ShotGun. 1- Définitions :

Probabilités. I- Expérience aléatoire, espace probabilisé : ShotGun. 1- Définitions : Probabilités I- Expérience aléatoire, espace probabilisé : 1- Définitions : Ω : Ensemble dont les points w sont les résultats possibles de l expérience Des évènements A parties de Ω appartiennent à A une

Plus en détail

Estimation et tests statistiques, TD 5. Solutions

Estimation et tests statistiques, TD 5. Solutions ISTIL, Tronc commun de première année Introduction aux méthodes probabilistes et statistiques, 2008 2009 Estimation et tests statistiques, TD 5. Solutions Exercice 1 Dans un centre avicole, des études

Plus en détail

Mortalité observée et mortalité attendue au cours de la vague de chaleur de juillet 2006 en France métropolitaine

Mortalité observée et mortalité attendue au cours de la vague de chaleur de juillet 2006 en France métropolitaine Mortalité observée et mortalité attendue au cours de la vague de chaleur de uillet en France métropolitaine FOUILLET A 1, REY G 1, JOUGLA E, HÉMON D 1 1 Inserm, U75, Villeuif, France. Inserm CépiDc, IFR9,

Plus en détail

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

Modélisation des lois multidimensionnelles par la théorie des copules

Modélisation des lois multidimensionnelles par la théorie des copules Modélisation des lois multidimensionnelles par la théorie des copules Grégoire Mercier jeudi 9 novembre 26 Contenu 2 Mesure de dépendance Lien avec les copules 3 Estimation de l information mutuelle Estimation

Plus en détail

Liste des notes techniques... xxi Liste des encadrés... xxiii Préface à l édition internationale... xxv Préface à l édition francophone...

Liste des notes techniques... xxi Liste des encadrés... xxiii Préface à l édition internationale... xxv Préface à l édition francophone... Liste des notes techniques.................... xxi Liste des encadrés....................... xxiii Préface à l édition internationale.................. xxv Préface à l édition francophone..................

Plus en détail

metarnaseq: un package pour la méta-analyse de données RNA-seq

metarnaseq: un package pour la méta-analyse de données RNA-seq metarnaseq: un package pour la méta-analyse de données RNA-seq Guillemette Marot, Florence Jaffrézic, Andrea Rau 28/06/13 Overview 1 Introduction 2 Analyse statistique d une seule étude 3 Méta-analyse

Plus en détail

Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels

Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels Etab=MK3, Timbre=G430, TimbreDansAdresse=Vrai, Version=W2000/Charte7, VersionTravail=W2000/Charte7 Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels

Plus en détail

Tests du χ 2. on accepte H 0 bonne décision erreur de seconde espèce on rejette H 0 erreur de première espèce bonne décision

Tests du χ 2. on accepte H 0 bonne décision erreur de seconde espèce on rejette H 0 erreur de première espèce bonne décision Page n 1. Tests du χ 2 une des fonctions des statistiques est de proposer, à partir d observations d un phénomène aléatoire (ou modélisé comme tel) une estimation de la loi de ce phénomène. C est que nous

Plus en détail

FIMA, 7 juillet 2005

FIMA, 7 juillet 2005 F. Corset 1 S. 2 1 LabSAD Université Pierre Mendes France 2 Département de Mathématiques Université de Franche-Comté FIMA, 7 juillet 2005 Plan de l exposé plus court chemin Origine du problème Modélisation

Plus en détail

Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes.

Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes. Promotion X 004 COURS D ANALYSE DES STRUCTURES MÉCANIQUES PAR LA MÉTHODE DES ELEMENTS FINIS (MEC 568) contrôle non classant (7 mars 007, heures) Documents autorisés : polycopié ; documents et notes de

Plus en détail

Image d un intervalle par une fonction continue

Image d un intervalle par une fonction continue DOCUMENT 27 Image d un intervalle par une fonction continue La continuité d une fonction en un point est une propriété locale : une fonction est continue en un point x 0 si et seulement si sa restriction

Plus en détail

Etude des propriétés empiriques du lasso par simulations

Etude des propriétés empiriques du lasso par simulations Etude des propriétés empiriques du lasso par simulations L objectif de ce TP est d étudier les propriétés empiriques du LASSO et de ses variantes à partir de données simulées. Un deuxième objectif est

Plus en détail

La régression logistique. Par Sonia NEJI et Anne-Hélène JIGOREL

La régression logistique. Par Sonia NEJI et Anne-Hélène JIGOREL La régression logistique Par Sonia NEJI et Anne-Hélène JIGOREL Introduction La régression logistique s applique au cas où: Y est qualitative à 2 modalités Xk qualitatives ou quantitatives Le plus souvent

Plus en détail

Table des matières. I Mise à niveau 11. Préface

Table des matières. I Mise à niveau 11. Préface Table des matières Préface v I Mise à niveau 11 1 Bases du calcul commercial 13 1.1 Alphabet grec...................................... 13 1.2 Symboles mathématiques............................... 14 1.3

Plus en détail

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé Baccalauréat S ntilles-guyane 11 septembre 14 Corrigé EXERCICE 1 6 points Commun à tous les candidats Une entreprise de jouets en peluche souhaite commercialiser un nouveau produit et à cette fin, effectue

Plus en détail

Arithmétique binaire. Chapitre. 5.1 Notions. 5.1.1 Bit. 5.1.2 Mot

Arithmétique binaire. Chapitre. 5.1 Notions. 5.1.1 Bit. 5.1.2 Mot Chapitre 5 Arithmétique binaire L es codes sont manipulés au quotidien sans qu on s en rende compte, et leur compréhension est quasi instinctive. Le seul fait de lire fait appel au codage alphabétique,

Plus en détail

Chapitre 3. Quelques fonctions usuelles. 1 Fonctions logarithme et exponentielle. 1.1 La fonction logarithme

Chapitre 3. Quelques fonctions usuelles. 1 Fonctions logarithme et exponentielle. 1.1 La fonction logarithme Chapitre 3 Quelques fonctions usuelles 1 Fonctions logarithme et eponentielle 1.1 La fonction logarithme Définition 1.1 La fonction 7! 1/ est continue sur ]0, +1[. Elle admet donc des primitives sur cet

Plus en détail

EXEMPLE : FAILLITE D ENTREPRISES

EXEMPLE : FAILLITE D ENTREPRISES EXEMPLE : FAILLITE D ENTREPRISES Cet exemple a pour objectif d étudier la faillite d entreprises. Les données proviennent de l ouvrage de R.A.Johnson et D.W Wichern : «Applied Multivariate Statistical

Plus en détail

Texte Agrégation limitée par diffusion interne

Texte Agrégation limitée par diffusion interne Page n 1. Texte Agrégation limitée par diffusion interne 1 Le phénomène observé Un fût de déchets radioactifs est enterré secrètement dans le Cantal. Au bout de quelques années, il devient poreux et laisse

Plus en détail

Cours STAT 2150. "Statistique non paramétrique: Méthodes de lissage"

Cours STAT 2150. Statistique non paramétrique: Méthodes de lissage Cours STAT 2150 "Statistique non paramétrique: Méthodes de lissage" Année académique 2008-2009 Séance 1 1 Table de matière du cours 1. Introduction (Fonction de répartition, histogramme, propriétés d un

Plus en détail

À propos des matrices échelonnées

À propos des matrices échelonnées À propos des matrices échelonnées Antoine Ducros appendice au cours de Géométrie affine et euclidienne dispensé à l Université Paris 6 Année universitaire 2011-2012 Introduction Soit k un corps, soit E

Plus en détail

Continuité en un point

Continuité en un point DOCUMENT 4 Continuité en un point En général, D f désigne l ensemble de définition de la fonction f et on supposera toujours que cet ensemble est inclus dans R. Toutes les fonctions considérées sont à

Plus en détail

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique»

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Tests de comparaison de moyennes Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Test de Z ou de l écart réduit Le test de Z : comparer des paramètres en testant leurs différences

Plus en détail

Le pire des cas dans le choix de la copule

Le pire des cas dans le choix de la copule Comment éviter le pire Département de Mathématique Université de Bretagne Occidentale 29200 Brest Solvency 2 impose aux assureurs une analyse des risques accumulés sur plusieurs produits d assurances.

Plus en détail

Les débats sur l évolution des

Les débats sur l évolution des D o c u m e n t d e t r a v a i l d e l a B r a n c h e R e t r a i t e s d e l a C a i s s e d e s d é p ô t s e t c o n s i g n a t i o n s n 9 8-0 7 C o n t a c t : La u re nt V e r n i è r e 0 1 4

Plus en détail

Format de l avis d efficience

Format de l avis d efficience AVIS D EFFICIENCE Format de l avis d efficience Juillet 2013 Commission évaluation économique et de santé publique Ce document est téléchargeable sur www.has-sante.fr Haute Autorité de santé Service documentation

Plus en détail

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers

Plus en détail

Résumé des communications des Intervenants

Résumé des communications des Intervenants Enseignements de la 1ere semaine (du 01 au 07 décembre 2014) I. Titre du cours : Introduction au calcul stochastique pour la finance Intervenante : Prof. M hamed EDDAHBI Dans le calcul différentiel dit

Plus en détail

IFT6561. Simulation: aspects stochastiques

IFT6561. Simulation: aspects stochastiques IFT 6561 Simulation: aspects stochastiques DIRO Université de Montréal Automne 2013 Détails pratiques Professeur:, bureau 3367, Pav. A.-Aisenstadt. Courriel: bastin@iro.umontreal.ca Page web: http://www.iro.umontreal.ca/~bastin

Plus en détail

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Chapitre 5 UE4 : Biostatistiques Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés.

Plus en détail

PROGRAMME (Susceptible de modifications)

PROGRAMME (Susceptible de modifications) Page 1 sur 8 PROGRAMME (Susceptible de modifications) Partie 1 : Méthodes des revues systématiques Mercredi 29 mai 2013 Introduction, présentation du cours et des participants Rappel des principes et des

Plus en détail

Item 169 : Évaluation thérapeutique et niveau de preuve

Item 169 : Évaluation thérapeutique et niveau de preuve Item 169 : Évaluation thérapeutique et niveau de preuve COFER, Collège Français des Enseignants en Rhumatologie Date de création du document 2010-2011 Table des matières ENC :...3 SPECIFIQUE :...3 I Différentes

Plus en détail

Loi binomiale Lois normales

Loi binomiale Lois normales Loi binomiale Lois normales Christophe ROSSIGNOL Année scolaire 204/205 Table des matières Rappels sur la loi binomiale 2. Loi de Bernoulli............................................ 2.2 Schéma de Bernoulli

Plus en détail

Programmation linéaire

Programmation linéaire Programmation linéaire DIDIER MAQUIN Ecole Nationale Supérieure d Electricité et de Mécanique Institut National Polytechnique de Lorraine Mathématiques discrètes cours de 2ème année Programmation linéaire

Plus en détail

INF6304 Interfaces Intelligentes

INF6304 Interfaces Intelligentes INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie

Plus en détail

Docteur José LABARERE

Docteur José LABARERE UE7 - Santé Société Humanité Risques sanitaires Chapitre 3 : Epidémiologie étiologique Docteur José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés.

Plus en détail

Table des matières. PREMIÈRE PARTIE Étapes initiales des études marketing 7

Table des matières. PREMIÈRE PARTIE Étapes initiales des études marketing 7 Table des matières Préface Public 1 Structure de l ouvrage 1 Caractéristiques de l ouvrage 3 Contenu 3 Pédagogie 4 Remarques sur l adaptation française 4 Ressources numériques 5 Biographie 6 PREMIÈRE PARTIE

Plus en détail

Chapitre 2 Le problème de l unicité des solutions

Chapitre 2 Le problème de l unicité des solutions Université Joseph Fourier UE MAT 127 Mathématiques année 2011-2012 Chapitre 2 Le problème de l unicité des solutions Ce que nous verrons dans ce chapitre : un exemple d équation différentielle y = f(y)

Plus en détail

Soutenance de stage Laboratoire des Signaux et Systèmes

Soutenance de stage Laboratoire des Signaux et Systèmes Soutenance de stage Laboratoire des Signaux et Systèmes Bornes inférieures bayésiennes de l'erreur quadratique moyenne. Application à la localisation de points de rupture. M2R ATSI Université Paris-Sud

Plus en détail

Chapitre 2/ La fonction de consommation et la fonction d épargne

Chapitre 2/ La fonction de consommation et la fonction d épargne hapitre 2/ La fonction de consommation et la fonction d épargne I : La fonction de consommation keynésienne II : Validations et limites de la fonction de consommation keynésienne III : Le choix de consommation

Plus en détail

OPTIMISATION DE LA MAINTENANCE DES EQUIPEMENTS DE MANUTENTION DU TERMINAL A CONTENEURS DE BEJAIA (BMT)

OPTIMISATION DE LA MAINTENANCE DES EQUIPEMENTS DE MANUTENTION DU TERMINAL A CONTENEURS DE BEJAIA (BMT) OPTIMISATION DE LA MAINTENANCE DES EQUIPEMENTS DE MANUTENTION DU TERMINAL A CONTENEURS DE BEJAIA (BMT) LAGGOUNE Radouane 1 et HADDAD Cherifa 2 1,2: Dépt. de G. Mécanique, université de Bejaia, Targa-Ouzemour

Plus en détail

Le modèle linéaire généralisé avec R : fonction glm()

Le modèle linéaire généralisé avec R : fonction glm() SEMIN- Le modèle linéaire généralisé avec R : fonction glm() Sébastien BALLESTEROS UMR 7625 Ecologie Evolution Ecole Normale Supérieure 46 rue d'ulm F-75230 Paris Cedex 05 sebastien.ballesteros@biologie.ens.fr

Plus en détail

3 Approximation de solutions d équations

3 Approximation de solutions d équations 3 Approximation de solutions d équations Une équation scalaire a la forme générale f(x) =0où f est une fonction de IR dans IR. Un système de n équations à n inconnues peut aussi se mettre sous une telle

Plus en détail