Réutilisation des données de santé pour la recherche Rôle des entrepôts de données biomédicales Equipe données massives en santé Inserm UMR 1099 LTSI Université de Rennes 1 Pr Marc CUGGIA Unité Support Fouille de données CIC 1014 CHU de Rennes Plan de la présentation 1 Notion de «big data»en santé 2 Entrepôts de données biomédicales 3 Les réseaux de données en santé 2
Typologie des données massives en santé Dossier patient informatisé Données clinico-biologiques Données OMICS Signaux et Images Autres sources Assurance maladie (SNIIR-AM) INSEE Registres épidémiologiques Bases de données recherche : ex recherche clinique Données issues des patients Virage ambulatoire Patient empowerment better data quality Résaux sociaux Patients like me
Données issues l e-santé Pour quels usages? 6
Recherche clinique : Etude de faisabilité et prescreening Criteria Inclusion Criteria: 1Male subjects, over 50 years of age at the time of enrollment. 2Subjects referred to urology for BPH leading to permanent indwelling bladder catheters and are considered poor surgical candidates 3Written informed consent to participate in the study. 4Ability to comply with the requirements of the study procedures Exclusion Criteria: 1Previous surgical treatment for BPH 2Presence of bladder stones 3History of prostate cancer 4Prostate size > 150 g 5History of urethral stenosis or its management 6Known of suspected neurogenic bladder 7History of recent hematochezia in the last 3 months 8Contraindication to intravascular iodinated contrast such as allergies or significant elevated creatinine/renal failure 9Uncorrected coagulopathy 1Subjects who participated in an active stage of any drug, intervention or treatment trial within 30 days of enrollment. 1Subjects with preexisting conditions, which, in the opinion of the investigator, interfere with the conduct of the study. 1Subjects who are uncooperative or cannot follow instructions. 1Mental state that may preclude completion of the study procedure or obtention of infor Médecine translationnelle Médecine prédictive et personnalisée 8
9 Entrepôts de données biomédicales 10
Jusqu à hier Quels sont les patients éligibles pour ce projet de recherche? Revenez dans 1 mois Jusqu à aujourd hui Un Système d Information très riche Mais peu exploitable en l état
Pour demain Proposer un outil permettant de «fouiller»efficacement et de manière exhaustive dans les dossiers patients en assurant la sécurité des patients Exploiter les données dans une approche centrée population
Entrepôts de données biomédical Entrepôts de données biomédical
Rennes Entrepôts de données du CHU de Rennes 1,2 millions de patients 27 millions de documents 130 millions d éléments de données 1To Comptes rendus Dossier urgene Génétique Anatomo-pathologie Laboratoires PMSI Imagerie Dossier infirmier Prescription/administration Biobanque (CRB) Results Constructeur de requêtes
Results Critères démographiques Recherche sur texte Recherche sur données structurées Results
Results Results
24
Vue «Dossier patient»
Selection de cas éligibles Ajout dans un panier
32
Exploitation d ehop au CHU de Rennes Guichet unique : Le portail recherche Offre de service : Toutes les demandes arrivent et sont instruites par l US Fouille de données qui joue le rôle de Centre de Données Clinique (CDC) Interrogation de l entrepôt et selection de populations potentielles Fourniture de «datamarts»bruts aux équipes exploitation statistique des données Protection des données : Interrogation de l exhaustivitéde l entrepôt reservée àl équipe fouille : Tiers de confiance Données déidentifiées Traçabilité des accès Information aux utilisateurs + chartes d utilisation Information aux patients + Recueil de l opposition Référentiel : Guide de bonne pratique (Dr. C. Riou) 33 Perspectives : Mutualisation Projet R-CDC : réseau de centres de données cliniques Financement AO GIRCI Co-portage : Rennes / Brest (M.Cuggia /E. Stindel) - 2 volets - Organisation: Mise en place de structures CDC tiers de confiance dans les établissements Technique : Industrialisation d ehop et mise en œuvre dans les CHU d Angers et Brest Déploiement à l echelle interrégionale? 34
Perspectives : Evolutions du système Réécriture du logiciel Orientation vers les technologies les plus récentes (HADOOP/NoSQL/HIVE/PIG/JSON/D3JS) Intégration de nouveaux types de données ex : signaux de Réa Utilisation de méthodes de traitement automatique du langage Détection de l incertitude Extraction des données numériques Fouille de données : Détections automatique de tendances ( Google Trends) Connexion avec les réseaux de données de santé Réseau boston/rennes (I2B2/SHRINE) Réseau Biobanque Fondation EHR4CR 35 Perspectives : évolutions du système Développement de modules métiers : Pré-remplissage automatique d ecrf Lien avec les documents sources (monitoring) Tableaux de bords de suivis de cohortes Aide au codage (PMSI) Aide au remplissage des fiches de RCP Financement sur projets : GIRCI : R-CDC (support pour le déploiement sur Angers et Brest) PEPS + EHR4CR Projets de recherche déposés (INSHARE/IBCB/QUALIMED) Formations : Formations initiales et continues Master SDS : Sciences des données en santé 36
et après? : Réseaux de données de santé 37 FP7/IMI Inovative medical Initiative Electronic Health Record for for Clinical Research Etude Feasibility Recrutement Screening E-CRF e-crf Faisabilité Pharamaco Pharmaco vigilance
Electronic Health Record for Clinical Research Etude Faisabilité Recrutement E-CRF Pharamaco vigilance Electronic Health Record for Clinical Research Etude Faisabilité Recrutement E-CRF Pharamaco vigilance Rennes : 10 Paris : 230 Londres 223 Genève : 22
June 7 th 2013 IMI JU Interim Review Meeting 41 42
FDA NHS 43 Plateforme PEPS Plateforme d étude des produits de santé Etude de pharmacovigilance Financement ANSM 4 ans Utilisation du SNIIR-AM + données intra-hospitalières Le SNIIR-AM (CNAM) Données de remboursement + PMSI 20 Milliards de lignes de données 18 To / 30 mois 3 années Couverture : 82% de la population française 44
45 Que faut il retenir? Le «Big data»en santéest constituéde données : Hétérogènes Multi-domaines multi-échelles Données sensibles Les entrepôtssont des concentrateursde données permettant une exploitation facilitée des données mais qui nécessitent : Une technicité: nouveaux métiers Des organisations tiers de confiance permettant leurs exploitations respectant le protection des données Ces technologies peuvent mises en œuvre dans de nombreux cas d utilisation en recherche (mais aussi au delà) Ils sont complémentairesdes approches classiques de recueil pro-actif d information La tendance est la constitution de réseaux de données pour une exploitation multicentrique Nous en sommes au début 46
Merci pour votre attention marc.cuggia@chu-rennes.fr 47