RENCONTRES DU 25 au 27 JUIN 2014 DIJON Centre Georges François Leclerc L intérêt du Analysis Data Model (ADaM) pour le Data Management Valentin Harter CENTRE DE TRAITEMENT DES DONNÉES DU CANCÉROPÔLE NORD-OUEST CENTRE FRANÇOIS BACLESSE - Caen 27 juin 2014
CDISC Europe Interchange 2014 2
«We cannot have transparency without standards» Dr. Frank Rockhold (ex CDISC board) «[Wouldn t it be amazing if all of the clinical trial process could be standardized? In the meantime, let s do as much as we can ]» Monica Kowohl (formatrice ADaM) «La construction des tables ADaM reflète la façon de procéder d un biostatisticien bien structuré» Valentin Harter (simple data manager, juin 2014) 3
Sommaire 1. Encore un autre standard 2. La place de l analyse statistique dans une recherche biomédicale 3. Aperçu de ADaM 3.1. Les 4 préceptes fondamentaux 3.2. Les règles de base 3.3. «Flagging» des données 4. La table Analysis Data Subject Level (ADSL) 4.1. Quelles données? 4.2. Exemples 5. Les tables Basic Data Structure (BDS) 4.1. Quelles tables? Quelles données? 4.2. Exemples 4
Sommaire 1. Encore un autre standard 2. La place de l analyse statistique dans une recherche biomédicale 3. Aperçu de ADaM 3.1. Les 4 préceptes fondamentaux 3.2. Les règles de base 3.3. «Flagging» des données 4. La table Analysis Data Subject Level (ADSL) 4.1. Quelles données? 4.2. Exemples 5. Les tables Basic Data Structure (BDS) 4.1. Quelles tables? Quelles données? 4.2. Exemples 5
1. Encore un autre standard 6
1. Encore un autre standard 7
1. Encore un autre standard Les modèles utilisés par les relecteurs FDA Study Data Tabulation Model (SDTM) Les données collectées durant l étude, organisées par domaines (thèmes) Les metadata de ces données Analysis Data Model (ADaM) Les données calculées pour l analyse statistique et les rapports du promoteur Les observations utilisées pour l analyse statistique ou la traçabilité Les metadata de toutes ces données et des résultats Soumis à la FDA en complément du SDTM 8
1. Encore un autre standard SDTM et ADaM pour les relecteurs FDA 2 importantes sources d informations à propos de la recherche biomédicale Complémentaires (et évoluant maintenant en parallèle???) Utilisés à la fois par les relecteurs cliniques et statistiques 9
1. Encore un autre standard SDTM et ADaM pour les data managers académiques Quitte a avoir un standard interne, autant prendre ceux là! Les tables SDTM ne sont pas faites pour l analyse ADaM permet de tracer l ensemble du processus de l export des données jusqu à la productions des résultats Prévoir un gros travail pédagogique pour convertir les statisticiens 10
1. Encore un autre standard SDTM = base de données - Les données recueillies - Une table par thème Le produit fini du data manager filtres/flagging checks calculs formatages modélisations stat Data manager vs statisticien, qui fait quoi? En théorie, le data manager ne fait rien!!! ADaM = réponse au PAS - Les données prêtes pour nourrir SAS, R, etc - Les tables de résultats - ~ une table par analyse 11
Sommaire 1. Encore un autre standard 2. La place de l analyse statistique dans une recherche biomédicale 3. Aperçu de ADaM 3.1. Les 4 préceptes fondamentaux 3.2. Les règles de base 3.3. «Flagging» des données 4. La table Analysis Data Subject Level (ADSL) 4.1. Quelles données? 4.2. Exemples 5. Les tables Basic Data Structure (BDS) 4.1. Quelles tables? Quelles données? 4.2. Exemples 12
2. La place de l analyse statistique Protocole CRF Plan d analyse stat SDTM Autres données sources pour ADaM Flux d informations Flux de données Etape de création des tables d analyse Tables d analyse Documentation Metadata des tables d analyse Etape de production des résultats stat Résultats de l analyse Documentation Metadata des résultats 13
2. La place de l analyse statistique La création des tables d analyse Construit avec le plan d analyse stat en tête Observations ou données dérivées d observations Plusieurs tables SDTM peuvent être utilisées pour une même table d analyse La documentation peut inclure : Des programmes, des pseudo-codes ou des petits bouts de code Des références au protocole ou au plan d analyse stat Des guides de données 14
2. La place de l analyse statistique La production des résultats de l analyse Les tables d analyse sont utilisées pour produire des sorties statistiques : Tables, graphiques, p-values, annexes statistiques, etc La documentation peut inclure : Des programmes, des pseudo-codes ou des bouts de code Des références au plan d analyse statistique Des références aux annexes de reporting 15
Sommaire 1. Encore un autre standard 2. La place de l analyse statistique dans une recherche biomédicale 3. Aperçu de ADaM 3.1. Les 4 préceptes fondamentaux 3.2. Les règles de base 3.3. «Flagging» des données 4. La table Analysis Data Subject Level (ADSL) 4.1. Quelles données? 4.2. Exemples 5. Les tables Basic Data Structure (BDS) 4.1. Quelles tables? Quelles données? 4.2. Exemples 16
3.1 Les 4 préceptes fondamentaux 1 - La traçabilité La principale raison de ce standard : décrire clairement toute la démarche statistique (les interprétations, les hypothèses, les transformations, les modèles appliqués ) Une sorte d audit trail pour statisticien 2 - La possibilité de ré-analyse 17
3.1 Les 4 préceptes fondamentaux 3 - Le détail des metadata Le plus fastidieux à produire en ADaM, le guide d implémentation étant beaucoup plus ouvert que SDTM 4 - L application aux outils stats standards (R, SAS, ) 18
3.2 Les règles de base Les tables d analyse contiennent au minimum une table nommée ADSL (Analysis Data Subject Level) Le nommage des autres tables : ADxxxxxxx (e.g. ADAE, ADQS, ADTTE) choix libre Les variables SDTM doivent conserver tous leurs attributs : Nom, description, format, contenu 19
3.2 Les règles de base La table ADSL Une ligne par sujet Contient les informations centrales du sujet : réglementaire, démographie, traitements, date de décès Les autres tables d analyse : BDS (Basic Data Structure) Une ligne par sujet, par paramètre, par temps d analyse Construites avec le plan d analyse stat en tête Toutes les données utiles à l analyse d un paramètre doivent être reportées dans sa table BDS (classiquement par jointure de la table ADSL sur la table BDS) 20
3.2 Les règles de base Les noms de variables 21
3.2 Les règles de base Les dates et imputations d éléments manquants Elément manquant Format de la variable SDTM *DTC (string) Format des variables ADaM Date *DT (num) # imputé Flag date *DTF (string) Aucun YYYY-MM-DD YYYY-MM-DD Vide Jour YYYY-MM YYYY-MM-## D Mois YYYY YYYY-##-(##) M Année ####-(##)-(##) Y 22
3.3 «Flagging» des données Des variables booléennes pour identifier rapidement des sousgroupes de population Exemple d une table ADSL : 23
3.3 «Flagging» des données Des variables booléennes pour identifier rapidement des sousgroupes d observations Exemple d une table BDS, ADVS : 24
Sommaire 1. Encore un autre standard 2. La place de l analyse statistique dans une recherche biomédicale 3. Aperçu de ADaM 3.1. Les 4 préceptes fondamentaux 3.2. Les règles de base 3.3. «Flagging» des données 4. La table Analysis Data Subject Level (ADSL) 4.1. Quelles données? 4.2. Exemples 5. Les tables Basic Data Structure (BDS) 4.1. Quelles tables? Quelles données? 4.2. Exemples 25
4. La table Analysis Data Subject Level Le pourquoi de la table ADSL Support Des données règlementaires Des données démographiques Des caractéristiques de référence Source De variables requises dans d autres tables d analyse (e.g. les données des traitements) N a pas vocation à être l unique source de toutes les données «subject level» e.g. une table BDS ADTTE d analyse de données de survie 26
4. La table Analysis Data Subject Level Exemple de table ADSL : cas simple d un essai comparatif 27
4. La table Analysis Data Subject Level Exemple de table ADSL : cas d un essai en triple cross-over 28
Sommaire 1. Encore un autre standard 2. La place de l analyse statistique dans une recherche biomédicale 3. Aperçu de ADaM 3.1. Les 4 préceptes fondamentaux 3.2. Les règles de base 3.3. «Flagging» des données 4. La table Analysis Data Subject Level (ADSL) 4.1. Quelles données? 4.2. Exemples 5. Les tables Basic Data Structure (BDS) 4.1. Quelles tables? Quelles données? 4.2. Exemples 29
4. Les tables Basic Data Structure Le pourquoi des tables BDS Nomenclature suffisamment ouverte (ADaM-IG) pour permettre d appliquer la majorité des méthodes d analyse Des exemples d analyse ANOVA ANCOVA Régression logistique Tests de Cochran-Mantel-Haenzel Test non paramétrique de Wilcoxon Time-to-event analysis (Cox, Accelerated failure time model ) 30
4. Les tables Basic Data Structure DSL ADLB 31
4. Les tables Basic Data Structure e.g. ADVS Exemple de calculs à partir d une valeur de référence 32
4. Les tables Basic Data Structure e.g. ADVS Exemple de détermination d une valeur de référence 33
En résumé ADaM est clairement en aval du travail du data manager mais La table ADSL peut (relativement) facilement être construite en sortie d un CDMS Des éléments de la nomenclature ADSL peuvent être repris comme standard : alternative à plusieurs domaines SDTM Certaines tables BDS sont proches des tables SDTM (e.g. ADAE, ADVS ) La documentation est simple : 2 modèles de tables (plus de 40 en SDTM) Le «flagging», les données calculées et les tables de résultats doivent être laissées au biostatisticien 34
Merci pour votre attention Des questions? 35