The TVN pilot project - PNES poumon Pilot and national perspective of the implementation of minimum data set to improve the interoperability of tumour bank for research projects P Boucher (INCa) F Morin (IFCT) 1
Research context Identification of molecular biomarkers has led to significant improvements in our understanding of complex disease. The emergence of cost-effective and reliable technologies to analyze molecular biomarkers makes it possible to develop large-scale studies. Fulfilling these expectations requires obtaining, accessing, analyzing and integrating complex data on human tissue specimens representative of the diversity of cancer diseases. 2
Fulfilling requirements Specimens are collected in conditions that meet the highest standards Hospitals have developed institutional biobanks that organize and control the collection of tissue specimens obtained in the course of routine clinical procedures However, most biobanks do not have the capacity to collect and to store sufficient tissues to fulfill the needs of sophisticated study designs 3
Some well known solutions The development of networks of biobanks operating according to common standards and guidelines Harmonizing and developing inter-operability between biobanks is a daunting, global challenge. Standards remain exceedingly difficult to implement in routine clinical practice, with a multiplicative effect when developing operational networks regrouping several biobanks. 4
Partners federation and coordination It also requires setting up common scientific goals and governance mechanisms In a manner that complies with the Tumour bank institutional missions, ethical responsibilities With respect of the intellectual contribution of the professionals involved in obtaining, annotating or processing the specimens 5
French Tumor banks Approximately 60 Tumour banks Hospital structures organized for : Collection, storage and distribution of biological samples collected during health care process provided to individuals with a diagnosis, or suspected predisposition to cancer Identification and management of biological and clinical annotations associated to each sample, and make them available for subsequent analysis 6
Tumor banks missions Health mission: conservation and delivery of biological samples for patients diagnosis Scientific mission : samples qualification and clinical / biological data management to make it available for research projects 7
INCa Research department priorities 2 priorities to support the action of tumor banks : to follow-up and assess the scientific activities of tumor banks with an annual report to facilitate research through actions of expertise and recommendations to optimize tumor banks contribution to research, and funding them through calls for projects Development of TVN (National Virtual Tumor Bank) 8
Tumorothèque Virtuelle Nationale (TVN) A database for the optimization of the scientific application of biological resources in cancer studies To help tumor banks to coordinate and to organize. A web application that allows: To centralize, post and sort standardized data characterizing tumor samples according to the national guidelines of INCa. A multi-criteria selection of data to find biological resources and to send a request to managers of tumor banks. 9
TVN first goal : Display of collections Centralized at national level, information on biological resources resulting from tumor banks are stored in a database available via the website of INCA Declaration of collections is carried out by the managers of tumor banks, who send INCa the data in accordance with the national INCa / website Declaration of collections Through transfer of «.CSV» files TVN Server INCA 10
The national data guidelines Common minimum data Tumour bank site (contact) Patient : socio-demographic, clinical and vital statut, individual and family risk factors, Disease: ICD-10 and ctnm staging, Specimen : ICD-O Organ code, ICD-O Histological lesion type, Histopathological parameters (ptnm staging, percentage of tumor cells) Tumor tissue samples : method of preparation, derivatives, quantity, unit, Availability of supplementary biological samples : Serum, Plasma, Liquids, Constitutional DNA Additional information : inclusion in clinical trials Specific data related to pathological thematic 11
Consultation of database and request for samples 1 : Multi-criteria selection INCa / website 2 : Email Submission to Tumor bank manager Sample Request form TVN Server INCA 12
TVN Pilot project through PNES lung cancer program The concept of TVN was tested through the Specialised National Excellence Programme on lung cancers (PNES). PNES on lung cancers pools together 24 research teams, 6 tumour banks and a clinical research management and data processing centre The major objective of the PNES lung cancer programme : to validate and capitalise on the new methods, in particular the molecular methods, to speed up the transfer of knowledge about the mechanisms of lung carcinogenesis into clinical applications. 13
TVN Pilot Projet - PNES Poumon coordination Tumour banks INCa Coordination Research leaders CHU, Nice P HOFMAN INCa P BOUCHER Inserm, Grenoble C BRAMBILLA CHU, Caen F GALATEAU-SALLE IARC, Lyon P HAINAUT Inserm, Nancy C PARIS HOPITAL TENON, Paris J CADRANEL IFCT, Paris F MORIN Inserm, Grenoble E BRAMBILLA CHU, Strasbourg M FALLER IGR, Villejuif PIERRE FOURET CHU, Grenoble D MORO-SIBILOT IGR, Villejuif JEAN-CHARLES SORIA CHU, Nancy N MARTINET IFCT, Paris BERNARD MILLERON 14
Pilot project partners goals All partners : to create and organize the pilot network of tumor banks to test the TVN concept, by optimizing the delivery of biological resources to research projects The 6 Tumor banks : to identify and declare all relevant biological resources in TVN to provide biological resources (quality control) to PNES projects. IFCT : to support the development of data and information management systems IARC : to coordinate the harmonization of standard operating procedures INCa : to coordinate the project and to develop the database in respect of legal conditions (Bioethical law + CNIL ) 15
Methodology GLOBAL INVENTORY (Number of lung specimen) DECLARATION OF RELEVANT SPECIMEN IN TVN (Availability + data quality + biological quality) SCREENING AND TARGETTING FOR PNES PROJECTS (characterization according to inclusion / exclusion) criteria ATTRIBUTION TO PROJECT (Step validation with specific data management and biological quality controls DELIVERY (TMA) 16
Phase 1 : National Data Guideline and Data management systems To assimilate the data of the Catalog (3 to 6 months) What data? Standard semantic? Standard Format? Date? Modalities? Availability and accessibility? Search in files sources and existing supports 17
TVN National Data Guidelines Minimum dataset by PNES Poumon 76 minimal data + Specific dataset by PNES Poumon : Availability of questionnaire about tobacco habits Availability of questionnaire about family history Availability of questionnaire about professional exposure Radio-naive sample Chemo-naive sample Tobacco status (never, former, current, package-year) Cause of Death
Phase 1 : National Data Guidelines How to generate a standard.csv file? To generate the file of data to be exported towards the TVN (3 to 10 months) Configuration of heterogeneous Data Systems Recovery, centralization of the data (manual data entry or automatic by programming) Creation of the Excel file --> *.csv Implementation of file format Data transfer procedure (without delay) 19
Revision of an information system for clinical and biological resources in a hospital department : Experience from Tenon Hospital (Paris) Objectives : Create an ergonomic, intuitive and easy tool of use adapted to a public hospital department Structure the data collected for a better reading and their exploitation Plan the interoperability with the other information systems Plan the coherent integration in the system of biobanks Imply the hospital staff in the update of patient data forms
Data and information management systems Tenon Poumon Biobank Fichier clinique 1.1 2.2 RESEARCH Cancer Bronchique Tenon Direct Access links https://www.e-cancer.fr Extranet INCa Biobase II* 1.2 *Application Web AP-HP spécifique regroupant toutes les congélations réalisées en anapath Tenon (biopsies chirurgicales et chirurgies tout organe confondu) Formats : tab, XML Formatting old data 2.1 3 4 Tumo Tenon Application de gestion des prélèvements congelés «poumon» avec informations cliniques patient associées. Csv file (National Catalog) Tumorothèque Virtuelle Nationale TVN INCa database Excel 1.3 1. Compartmentalized and heterogeneous systems 2. Creation of a common environment
Publication - Poster PO03-061 CPLF 2008 Refonte d un système d information clinique et ressources biologiques dans un service hospitalier : Expérience du service de Pneumologie de l hôpital Tenon (Paris) F. Morin 1, Q. Tran 1, P. Boucher 2, V. Poulot 3, E. Roux 3, N. Mathiot 3, E. Bertrand 3, M. Antoine 3, P. Callard 3, J. Cadranel 3, B. Milleron 3 1 Intergroupe Francophone de Cancérologie Thoracique (IFCT), Paris - France 2 Institut National du Cancer (INCa), Boulogne Billancourt - France 3 APHP - Hôpital Tenon, Paris - France RESUME METHODES RESULTATS De 1999 à 2007, 1383 patients ont été inscrits dans le fichier de service de Pneumologie après diagnostic de cancer. Le service s est doté d'une cryoconservation systématique des biopsies (723) et des prélèvements chirurgicaux (1278). Sous l gide de l INCa, la Tumorothèque Virtuelle Nationale (TVN) a pour objectif d'établir une base de données nationale permettant aux chercheurs d'identifier et de localiser, par le réseau des tumorothèques françaises, des échantillons biologiques et annotations cliniques nécessaires à leurs programmes de recherche. S appuyant sur l expertise en recherche clinique et en bioinformatique de l IFCT, une étude est réalisée à l hôpital Tenon dans le cadre de la phase pilote TVN, pour permettre la migration de fichiers existants, la standardisation du recueil des données et le lien avec le logiciel de tumorothèque. Le système mis en place comprend un pré-formatage des informations au Catalogue National, correspondant à 40 critères minimaux de description des échantillons cryopréservés. Après migration des données existantes, les annotations cliniques sont structurées en 4 catégories : diagnostic initial, primo-traitement, traitement de rechute et suivi. L interopérabilité permet l exportation des données pour analyses approfondies. Dans le cadre d une action structurante à l chelle nationale (TVN), des solutions ont été envisagées pour permettre à l'avenir une réactualisation plus facile des données sur le dossier clinique et sur les ressources biologiques. L expérience pourrait profiter à d autres services se basant sur le rapport complet de cette phase pilote IFCT-INCa. OBJECTIFS Créer un outil ergonomique, intuitif et facile d utilisation adapté à un service hospitalier public Structurer les données recueillies pour une meilleure lecture et leur exploitation Prévoir l interopérabilité avec d autres systèmes d information Prévoir l intégration cohérente dans le système de Tumorothèque Audit technique et audit qualité des données de la Base de service Tenon existante (en FileMaker Pro 5). Rédaction d'un rapport et document d'étude décrivant l'architecture du nouveau système clinique, dans un système d'information global (liens avec la Tumorothèque Tenon). Réunions de travail IFCT avec tous les intervenants de Tenon : Discussions afin d'établir les items du nouveau système, en prenant en considération les souhaits et besoins du service, et les items de la TVN. Ces derniers seront utilisés dans la Tumorothèque Tenon. Choix collégial technique du nouveau système : Access Intégration des données existantes (base de service Tenon) dans Access pour faciliter le travail de nettoyage. Nettoyage des données existantes : détection anomalies et mise en cohérence, corrections avec échanges avec l'équipe Tenon. Etude et maquette de la nouvelle application Cancer Bronchique Tenon : base de données relationnelle structurée respectant les points validés en réunion avec l'équipe Tenon. Les données sont structurées en 4 catégories : diagnostic initial, primo-traitement, traitement de rechute et suivi. Réalisation de l'application avec échanges fréquents avec l'équipe Tenon. Mise en place de listes de choix prédéfinis pour éviter les zones libres de saisie (ex. nom des drogues). Ergonomie pour la recherche et saisie de fiches patient. Mise en place de contrôles de cohérence des données saisies. Réalisation d un outil (état Access paramétrable) d'aide à la détection de données manquantes ou incomplètes, de données de dernières nouvelles trop anciennes. Réalisation d un outil d'export de données paramétrable (sélection des items souhaités). Interopérabilité Excel, Word. Migration des données existantes vers Cancer Bronchique Tenon. Rapport des actions réalisées sur les données et actions restantes nécessitant un arbitrage. Réunion de démonstration de l application pour le service à Tenon. Détermination des conventions de saisie, notamment concernant la notion de diagnostic INITIAL et les traitements. Recueil des remarques, et modifications d'après ces remarques. Réalisation d un Manuel Utilisateur. Mise en exploitation de Cancer Bronchique Tenon en septembre 2007. Liste des fiches patient APPLICATION CANCER BRONCHIQUE TENON Module de recherche Ce fichier de service permet de recueillir les informations de patients du service de Pneumologie, ayant un diagnostic de cancer thoracique. Patients du service de Pneumologie avec diagnostic de cancer. Le filtre spécifique et le module de recherche libre permettent de retrouver rapidement une fiche. La combinaison des 2 modes est possible. Filtre spécifique Fiche Patient 1- Démographie et diagnostic initial 2- Primo- traitement 3- Suivi Détermination du stade en fonction des valeurs de TNM Aide pour la classification TNM Recul depuis les dernières nouvelles Age au diagnostic Survie calculée Impliquer le personnel hospitalier dans la mise à jour des fiches patient Message d aide au survol de la souris sur la zone concernée (ex. Date de diagnostic) Rapport de données manquantes Données de référence, exemple des produits Export de données sous Excel Systèmes cloisonnés et hétérogènes Environnement commun «tumorothèque Tenon» Fichier clinique 1.1 Cancer Bronchique Tenon Liens directs Access 2.2 Chercheurs https://www.e-cancer.fr/ Extranet INCa Ce rapport permet de repérer rapidement les données à compléter ou à mettre à jour pour les fiches sélectionnées. Pour éviter les erreurs dues aux saisies libres, des listes déroulantes ont été mises en place. Il est possible de modifier un libellé ou de créer une référence (code + libellé), ici Produit. Ces données sont alors mises à jour dans la liste déroulante. L export de données brutes sous Excel est prévu. La possibilité est donnée à l utilisateur de sélectionner les fiches patient, ainsi que les items souhaités. 2.1 3 4 TumoTenon Tumorothèque Virtuelle Nationale TVN Base de données INCa CONCLUSIONS Biobase II* 1.2 Formats : tab, XML Fichier csv (Catalogue National) Application de gestion des prélèvements congelés «poumon» avec informations cliniques patient associées. Fonctionnalité d export TVN Actuellement, 1617 fiches patient (dont celles nouvellement créées) existent dans le système. Cette expérience réalisée dans le cadre de la phase pilote TVN a démontré la faisabilité de : *Application Web AP-HP spécifique regroupant toutes les congélations réalisées en anapath Tenon (biopsies chirurgicales et chirurgies tout organe confondu) Schéma du système d information global Tumorothèque Tenon «Poumon» Poster en ligne : www.ifct.fr 1.1 1.2 2.1 2.2 3 4 Description Export Cancer Bronchique Tenon Export Biobase Import dans TumoTenon Enrichissement données labo Extraction pour TVN Téléchargement vers TVN Commentaires Liens directs Access Export des données «poumon» souhaitées dans un fichier texte.tab Intégration des données dans TumoTenon Saisie de données récupérées de fibroscopie, commentaires, divers Constitution et génération automatique du fichier.csv au format Catalogue National. Alimentation d un journal répertoriant les anomalies rencontrées Authentification à l Extranet INCa pour upload Mettre en place un système d information structuré et cohérent dans un service hospitalier public Reprendre les données d un ancien système, même si cela a nécessité beaucoup de travail (1383 fiches) Il est possible de transposer le principe à d autres organes, moyennant des modifications notamment aux interfaces des différents systèmes. Une base de données structurée permettra plus aisément d voluer vers d autres technologies si nécessaire. www.ifct.fr
Phase 2 : Coordination and scientific motivation Scientific objectives and expertise of the biobanks Description of the projects of research: Definition of the inclusion criteria, by project (6 months) Meaning for biobanks? (Patient, tumor, quantity, quality, pathological & clinical data) Method: Standardized Forms with the description for each project Plenary session with the partners 23
Phase 3 : Biobank coordination Coordination Inventory of the «LUNG» specimen To inform/declare to the TVN Targeting (Pre-allocation of the Biological Resources according to the inclusion criteria) Provisions of the Biological Resources Method : reporting schedule, inform the TVN, centralized and tracked MTA 24
TVN - Accrual 3897 lung samples from 3445 patients 4500 4000 3500 3000 2500 2000 Patients Samples 1500 1000 500 0 February 2008 October 2008 April 2009 September 2009
TVN Data Management aspects After several corrective actions, this mechanism increased coherence from 23% to 96%. Clinical trial method by Tests of coherence (format, logic) Sequential reporting: Step-by-step procedure (item by item : patient, disease, sample, then together) Half-year report (feb-08, oct-08, apr-09, sept-09) Visible by all Motivation to make better than the neighbor Many human interventions
TVN Clinical data Variables Modalities N=3897 Patient (sex) Male 3010 (77.2%) Female 887 (22.8 %) Patient (smoking habits) former smoker (quit > 1 year) 985 (38.9%) has quit smoking when diagnosed (quit =< 1 year) 693 (27.3%) smoker 627 (24.7%) Non-smoker 229 (5.9%) Missing data 1363 Specimen type Surgery 3339 (85.7%) International Classification of Diseases for Oncology (CIM03) Biopsy and aspiration 520 (13.3%) Surgical biopsy 35 (0.9%) Liquid 3 (0.1%) 8070/3 (Squamous) 1805 (46.3 %) 8140/3 (Adenocarcinoma) 1281 (32.9 %) 8020/3 (Indiffereciated) 157 (4.0%) 8013/3 (Neuroendocrine) 123 (3.2%) 8012/3 (Large cells) 77 (2.0%) Others 454 (11.6%) 65 % fullfiled
TVN - Biological aspects (1) Of the total number of frozen tissue specimens, DNA was extracted (or potentially extracted) : for at least one fragment of the tumor in 2612 cases (67%) of which 90% cases were paired with frozen normal lung tissues. RNA was extracted and qualified (or potentially extracted/ qualified) for 3083 (80%) frozen tumors and of which 83% cases were paired with frozen normal lung tissues.
TVN - Biological aspects (2) Tumor sample available Yes 3897 (100%) DNA by-products Yes* 490 (12.6%) Possible** 2122 (54.8%) No 1263 (32.6%) Missing data 22 RNA by-products Yes* 961 (24.8%) Possible** 2122 (54.8%) No 786 (20.3%) Missing data 28 Non-tumoral associated sample Yes 3036 (77.9%) No 861 (22.1%) Non-tumoral DNA by-products Yes* 1174 (40.8%) Possible** 1431 (49.8%) No 271 (9.42%) Missing data 160 Non-tumoral RNA by-products Yes* 951 (33.1%) Possible** 1431 (49.8%) No 490 (17.1%) Missing Data 164
Phase 4 : Collaborations and Standard procedures By project : additional collaborations Data management and data analysis Biomarkers performed by central labs Standard Procedures (IARC) Quality control, DNA/RNA extractions Tracking 30
Results : Biological contribution to PNES projects September 2009 SUMMARY OF PROVISIONS MADE BY PROJECT PNES 1 PNES 2 PNES 3 PNES 4 PNES 5 PNES 6 IFCT CIT Ligue T1NO - Epidemio Pro - Pharmaco Basa/Neu - AdenoK - Biomarkers - Etude C Brambilla C Paris genoscan E Brambilla P Fouret JC Soria ancilaire PLANNED 109 595 0 53 50 103 Rech 910 DECLARED 267 71 0 226 205 226 98 80 1173 2083 Total September 2010 : more than 4000 samples 31
Results National network of thematic pathology Strength of the scientific network A common governance mechanisms and common scientific strategy : Consortium agreement Research teams in partnership with a group of surgical pathologists experts in lung pathology. (guaranty of high quality for the selection and preparartion) Common guidelines > robustness of biological quality A clinical trial sponsor to facilitate biological resources collects in ancillaries studies Availability of a set of biological resources well annotated and qualified Partners able to respond quickly to set up a validation project Open to new partners (on the basis of TVN + common procedures) 32
Limitations and difficulties Fragility over time of the unifying motivation Convergence of means + capacity of scientific expression Human resources motivation : to collect data Dedicated staff (technicians, data manager) Clinicians involvement Opportunities for research leaders to publish 33
TVN ISSUES The improvement and standardization of the biological quality of stored samples and quality of associated data The federation of experts and the establishment of common procedures and synergy to achieve a level of excellence in specific research pathology The improvement of research capacity, in terms of biological resources with number, quality and specificity required to setup national and international projects 34
TVN prospects INCa will develop TVN database To display national collections dedicated to research programs and thematic networks initiated or supported by INCa To provide a tool to centralize, to display and to find data about national collections A support is proposed for the preparation of data import files Extension of the national data guidelines with specific pathologies clinical data 35
TVN initiated projects Other thematic network projects are in progress : Liver (French CHC network / ICGC) Prostate (ICGC) Thyroid Pediatric tumors Mesothelioma Rare malignant endocrine tumors All thematic networks are based on health structuring 36