Les techniques de dépistage de la fraude. Marianne Paesmans Lieveke Ameye 1

Documents pareils

Item 169 : Évaluation thérapeutique et niveau de preuve

Estelle Marcault 06/02/2015 URC PARIS NORD 1

Audit et Inspection Les contraintes extérieures B.Malivoir

PROGRAMME (Susceptible de modifications)

Responsabilité du promoteur et obligations des soustraitants. cliniques : conformité aux Bonnes Pratiques Cliniques et point de vue de l inspection

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

Séries Statistiques Simples

Principe d un test statistique

Unité de Recherche Clinique St Louis - Lariboisière Fernand Widal Le 03 Février 2012

Introduction à l approche bootstrap

Précision d un résultat et calculs d incertitudes

Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie

DETERMINATION DE L INCERTITUDE DE MESURE POUR LES ANALYSES CHIMIQUES QUANTITATIVES

Evaluation de critères res de substitution de la survie globale dans les cancers bronchiques localement avancés

SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique

Estelle Marcault. 20/01/2012 URC Paris Nord 1

ELABORATION DU PLAN DE MONITORING ADAPTE POUR UNE RECHERCHE BIOMEDICALE A PROMOTION INSTITUTIONNELLE

OUVERTURE ET MISE EN PLACE

Why Software Projects Escalate: The Importance of Project Management Constructs

CE QU IL FAUT SAVOIR PARTICIPATION À UN ESSAI CLINIQUE SUR UN MÉDICAMENT

Essais précoces non comparatifs : principes et calcul du nombre de sujets nécessaire

Spécificité des essais cliniques dans le cadre de l enregistrement d un médicament. Florence BOUDEVIN 20 Novembre 2009

Logiciel XLSTAT version rue Damrémont PARIS

Rôle de l ARCl. V Grimaud - UE recherche clinique - 18 mars Définitions

Pour les utilisateurs Investigateurs et patients. Philadelphia, PA / Gif sur Yvette, France Mai 2010

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier

Aide-mémoire de statistique appliquée à la biologie

Formation CTOM «Printemps 2013»

Document d orientation sur les allégations issues d essais de non-infériorité

Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction.

Statistiques Descriptives à une dimension

OUTIL D'EVALUATION DU TEMPS ARC / CHEF DE PROJET PROMOTEUR REQUIS POUR UNE RECHERCHE BIOMEDICALE V 2.3 DE L OUTIL NOTICE D UTILISATION

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

23. Interprétation clinique des mesures de l effet traitement

La recherche clinique au cœur du progrès thérapeutique

La classification automatique de données quantitatives

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

Gestion des bases de données

Cycle de formation certifiante Sphinx

La recherche clinique de demain ne se fera pas sans les paramédicaux

Rôle de l Assurance Qualité dans la recherche clinique

MONITORING / SUIVI DES PATIENTS

Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

Évaluations aléatoires : Comment tirer au sort?

Recherche documentaire et autoformation. Lecture critique d un article médical. Recommandations pour la pratique. Les maladies orphelines

Statistique : Résumé de cours et méthodes

Équivalence et Non-infériorité

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

NORME INTERNATIONALE D AUDIT 330 REPONSES DE L AUDITEUR AUX RISQUES EVALUES

Essais cliniques de phase 0 : état de la littérature

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

ÉTAT DES LIEUX. Niveau de preuve et gradation des recommandations de bonne pratique

Traitement des données avec Microsoft EXCEL 2010

Objectifs pédagogiques Lecture critique d article

données en connaissance et en actions?

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1

Représentation d une distribution

Fiche qualité relative à l enquête Santé et Itinéraire Professionnel 2010 (SIP) Carte d identité de l enquête

Biostatistiques : Petits effectifs

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

STA108 Enquêtes et sondages. Sondages àplusieurs degrés et par grappes

«Quelle information aux patients en recherche biomédicale? Quels enseignements en retirer pour la pratique quotidienne?»

d évaluation Objectifs Processus d élaboration

Document d accompagnement. de la 1 re à la 8 e année. Exemples de tâches et corrigés. 1 re année Tâche Corrigé... 7 Tâche Corrigé...

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #16

Lois de probabilité. Anita Burgun

La Gestion des Données Cliniques

INF6304 Interfaces Intelligentes

EXCEL et base de données

MATHÉMATIQUES. Mat-4104

à moyen Risque moyen Risq à élevé Risque élevé Risq e Risque faible à moyen Risq Risque moyen à élevé Risq

secutrial Gestion des données d'études cliniques Les Colloques de l'uic Novembre 2012 Khaled Mostaguir, Ph.D,

Tâche complexe produite par l académie de Clermont-Ferrand. Mai 2012 LE TIR A L ARC. (d après une idée du collège des Portes du Midi de Maurs)

BACCALAURÉAT GÉNÉRAL SESSION 2012 OBLIGATOIRE MATHÉMATIQUES. Série S. Durée de l épreuve : 4 heures Coefficient : 7 ENSEIGNEMENT OBLIGATOIRE

Glossaire de termes relatifs à l assurance de la qualité et aux bonnes pratiques de laboratoire

PARTICIPATION À UN ESSAI CLINIQUE SUR UN MÉDICAMENT CE QU IL FAUT SAVOIR

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

3. Caractéristiques et fonctions d une v.a.

Régression linéaire. Nicolas Turenne INRA

Terminale STMG Lycée Jean Vilar 2014/2015. Terminale STMG. O. Lader

TSTI 2D CH X : Exemples de lois à densité 1

LECTURE CRITIQUE 1 ER PAS

METHODOLOGIE GENERALE DE LA RECHERCHE EPIDEMIOLOGIQUE : LES ENQUETES EPIDEMIOLOGIQUES

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

TRAVAUX PRATIQUES SCIENTIFIQUES SUR SYSTÈME

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé

Pharmacovigilance des Essais cliniques

Réseau SCEREN. Ce document a été numérisé par le CRDP de Bordeaux pour la. Base Nationale des Sujets d Examens de l enseignement professionnel.

Probabilités conditionnelles Loi binomiale

TABLE DES MATIERES. C Exercices complémentaires 42

Introduction au Data-Mining

BACCALAURÉAT PROFESSIONNEL EPREUVE DE TRAVAUX PRATIQUES DE SCIENCES PHYSIQUES SUJET A.1

(51) Int Cl.: H04L 29/06 ( ) G06F 21/55 ( )

L analyse documentaire : Comment faire des recherches, évaluer, synthétiser et présenter les preuves

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

Représentation des Nombres

Exo7. Probabilité conditionnelle. Exercices : Martine Quinio

Transcription:

Les techniques de dépistage de la fraude Marianne Paesmans Lieveke Ameye 1

Erreurs versus fraude Contrôle qualité des données et validation d une base de données avant analyse sont des étapes standard lors de la réalisation d un essai clinique Monitoring manuel du CRF Revue centrale des évaluations Monitoring de la base de données Monitoring sur site : comparaison du CRF aux données source (qui ne sont pas nécessairement correctes) Monitoring statistique Objectif : contrôler l intégrité des données et la compliance au protocole Tâche plus complexe en cas de fraude, caractérisée par une intention délibérée de déguiser la réalité Monitoring statistique : aussi efficace et moins coûteux que le monitoring sur site? 2

La fraude peut se situer à plusieurs niveaux Au niveau des données (falsification, invention) A niveau de l analyse : exclusion de patients, de données Au niveau de ce que l on choisit de rapporter Au niveau de l interprétation et de la rédaction de la conclusion d un article Avec un continuum entre erreur et fraude Motivations : carriériste, financière, 3

Données : continuum entre erreur et fraude Type Exemples Caractère intentionnel? Erreur Matériel de mesure mal calibré Précision de la mesure non respectée Erreur d unité (mg ou mg/m 2 ) Non intentionnel 4 Source: IDDI webinar Central statistical monitoring of clinical trials

Données : continuum entre erreur et fraude Type Exemples Caractère intentionnel? Erreur Paresse (incompétence) Matériel de mesure mal calibré Précision de la mesure non respectée Erreur d unité (mg ou mg/m 2 ) Oubli de données, données mal retranscrites, report de données sur des évaluations ultérieures Non intentionnel Pas de réelle intention de tricher 5 Source: IDDI webinar Central statistical monitoring of clinical trials

Données : continuum entre erreur et fraude Type Exemples Caractère intentionnel? Erreur Paresse (incompétence) Fraude Matériel de mesure mal calibré Précision de la mesure non respectée Erreur d unité (mg ou mg/m 2 ) Oubli de données, données mal retranscrites, report de données sur des évaluations ultérieures Données falsifiées (pour rendre un patient éligible par exemple), données isolées inventées, patients inventés Non intentionnel Pas de réelle intention de tricher Intention délibérée de manipuler la réalité 6 Source: IDDI webinar Central statistical monitoring of clinical trials

Données : continuum entre erreur et fraude Type Exemples Caractère intentionnel? Erreur Matériel de mesure mal calibré Précision de la mesure non respectée Erreur d unité (mg ou mg/m 2 ) Non intentionnel Paresse (incompétence) Oubli de données, données mal retranscrites, report de données sur des évaluations ultérieures Pas de réelle intention de tricher Fraude Données falsifiées (pour rendre un patient éligible par exemple), données isolées inventées, patients inventés Intention délibérée de manipuler la réalité Fraude liée au traitement Données fabriquées ou falsifiées dans le but de favoriser un des traitements Intention délibérée de manipuler la réalité pour arriver àun résultat précis 7 Source: IDDI webinar Central statistical monitoring of clinical trials

Données : continuum entre erreur et fraude Type Exemples Caractère intentionnel? Erreur Paresse (incompétence) Fraude Fraude liée au traitement Matériel de mesure mal calibré Précision de la mesure non respectée Erreur d unité (mg ou mg/m 2 ) Oubli de données, données mal retranscrites, report de données sur des évaluations ultérieures Données falsifiées (pour rendre un patient éligible par exemple), données isolées inventées, patients inventés Données fabriquées ou falsifiées dans le but de favoriser un des traitements Impact Non intentionnel Possible perte de puissance Pas de biais Pas de réelle intention de tricher Intention délibérée de manipuler la réalité Intention délibérée de manipuler la réalité pour arriver àun résultat précis Possible perte de puissance Pas de biais Effet sur la puissance? Pas de biais BIAIS 8 Source: IDDI webinar Central statistical monitoring of clinical trials

Caractéristiques et analyse de données authentiques Les méthodes statistiques devraient permettre de distinguer effets véritables et effets aléatoires Trois éléments importants : Variabilité entre sujets Amplitude de l effet Taille de l échantillon > Pour frauder : Diminuer la variabilité entre sujets Augmenter l amplitude de l effet Augmenter la taille de l échantillon Sauf pour une étude d équivalence! 9

Caractéristiques des données erronées/falsifiées/inventées Dépendent de la sophistication des méthodes utilisées pour inventer les données Caractéristiques des distributions univariées risquent d être modifiées par rapport aux distributions de données authentiques : Préférence de la décimale ou des résultats arrondis Distributions plus «plates» qu attendu Tendance àessayer de répliquer une moyenne > trop d observations proches de la moyenne et peu de variabilité autour de la moyenne Peu ou pas de valeurs aberrantes / trop de valeurs aberrantes Structure des distributions multivariées et/ou tendances chronologiques sont sensibles aux erreurs (intentionnelles ou non) et sont très difficiles àimiter (fraude) 10

Méthodes de détection Demandent une connaissance du contexte Dépendent du type de données erronées/falsifiées Univariées ou multivariées Méthode très simple en cas de CRF manuel : contrôler l écriture du CRF : écriture régulière, sans ratures, utilisation du même stylo àtravers tout le CRF sont des éléments suspects! Exemples 11

Arrondis et décimale de préférence Suspect de retrouver ce genre de distribution pour une variable continue dont la mesure est automatisée 12 Lock, Wells, Farthing, Fraud and misconduct in biomedical research, BMJ Books 2001

Mauvaise calibration : comparaison des moyennes de chaque centre à celles de tous les autres centres Equipement mal calibré dans le pays X Venet et al, Clinical Trials, 2012 13

Falsification des critères d éligibilité 14 Venet et al, Clinical Trials, 2012

Réduction de variabilité dans les mesures répétées Patient X dans un centre suspect Y Venet et al, Clinical Trials, 2012 Ceci suggère de comparer les variances intra patient dans le centre Y et les autres centres Analyse de tendances chronologiques peuvent identifier un schéma déterministique dans les valeurs > suspicion de données générées àl aide d un algorithme automatisé (Scherrer B, La Fraude dans les Essais Cliniques, Paris 1991) 15

Evaluer les coefficients d aplatissement (moments d ordre 4) Permettent de repérer (à dispersion égale) : L absence d outliers Les distributions trop uniformes (platicurtiques) 16

Vérification des dates Fréquence des visites ou examens de routine le dimanche ou un jour férié Traitements alloués par jour, semaine ou mois de randomisation Intervalles entre examens : Buyse et al, Stat Med 1999 17

Méthodes multivariées Se basent sur le fait que les associations entre variables sur données inventées sont plus faibles (différentes) que sur des données réelles Méthodes bivariées : examiner matrice de corrélations globalement et éventuellement par centre, se référer à des données historiques Exemple réel (BMJ Books, 2001) : modèle animal sur l infarctus du myocarde : données inventées : mauvaise corrélation entre le poids des chiens et le poids de leur ventricule gauche 18

Détection d inliers : distance de Mahalanobis Cherche à identifier des données inventées en utilisant la technique de répliquer la moyenne Un individu peut être proche de la moyenne sur une variable mais pas sur toutes les variables Distance entre un point et la moyenne de la distribution multivariée Distribution de cette distance suit une distribution chi carré BMJ Books 2001 Attention aux faux positifs 19

Examen des résidus d un modèle Variabilité des résidus pourrait être plus faible sur données inventées BMJ Books 2001 20

Cluster analysis Permet de détecter des proximités entre patients Si certains patients sont trop proches : Suspicion de données inventées obtenues en construisant des variantes proches d un patient réel Suspicion de données construites en envoyant au labo des échantillons du même patient comme s il s agissait de patients différents 21

Analyse en composantes principales Pour chaque centre, construction d un vecteur contenant les probabilités de signification comparant les moyennes de variables sélectionnées Centre X suspect au départ (audit précédent avait mis en évidence que le personnel du centre remplissait les questionnaires qui auraient dû être remis aux patients) Venet et al, Clinical Trials, 2012 22

Quelles méthodes pour les reviewers et les éditeurs de journaux scientifiques? Prêter attention àla dispersion des variables étudiées Refuser les papiers qui ne la rapportent pas, préférer un intervalle interquartiles plutôt que l étendue La déduire éventuellement de probabilités de signification et vérifier son ordre de grandeur Encourager les présentations graphiques sans perte d information (scatter plots) Vérifier la plausibilité de recrutement d un auteur qui publie beaucoup sur le même sujet Comparer les résultats d études portant sur le même sujet 23

Exemple : prévention de maladies cardiovasculaires Al Marzouki et al (BMJ 2005) Deux essais cliniques avec 2 interventions différentes Régime enrichi en fruits et légumes (A) Médicament (B) Réserves émises par les reviewers pour l étude évaluant le régime (incohérences entre les probabilités de signification d une part et les moyennes, écarts type et tailles d échantillon d autre part) Etude A : étude randomisée en simple aveugle, chez des patients à risque de maladie coronarienne, 831 patients, évaluation à2 ans Requête du BMJ d avoir accès aux données individuelles (fournies sur papier) Etude B : étude randomisée chez des patients avec hypertension modérée, 21750 patients, non suspecte, 5 centres sélectionnés au hasard (n=838), évaluation à2 ans Requête du BMJ d avoir accès aux données individuelles (fournies sur support électronique) 24

Comparaison des caractéristiques baseline dans les 2 études 25

Aucune comparaison significative, 10 comparaisons 16 différences significatives pour la comparaison des variances, 10 pour la comparaison des moyennes, probabilités de signification extrêmes; 22 variables testées 26

Décimale de préférence 27

Décimale de préférence : différence entre les bras de traitement? 28

Interprétation : Même sans regarder les critères d évaluation : Données de l étude A ne proviennent pas d une étude randomisée Fraude portant sur le processus de randomisation? Données totalement falsifiées? 29

Conclusions : Il existe des méthodes autres que le monitoring sur site traditionnellement utilisé A utiliser probablement plus souvent Ne sont vraiment utiles qu avec des nombres suffisants de patients et de patients / centre > peu pertinentes en début d étude, peu utiles pour de petits centres Il existe des différences authentiques entre centres qui ne doivent pas être niées Ces méthodes peuvent induire une suspicion mais ne sont pas des preuves 30