Les données issues de carottages dans le réseau lacs sentinelles contextualisées aux niveaux national et international De la gestion des données à l'établissement de rétro-observatoires C a r o t t e s e t b a s e s d e d o n n é e s Fabien Arnaud, Cécile Pignol, Anne-Lise Develle EDYTEM?
Les besoins en matières de données des scientifiques «paléo» Niv 1 : - Historique de la prise de la carotte (mission) : => RAP. MISSION /CAMPAGNE qui, pour qui (PI), ou, comment (Logistique, techniques), pourquoi (objectifs scientifiques) - Où se trouve l objet physique? => GESTION DE STOCKS Niv2 : - Puis-je échantillonner (reste-t-il du sédiment ), qui contacter? - Suivi analytique : Qu est-ce qui a déjà été fait sur ce prélèvement : => LIMS - Quels types de données existe-t-il? (acquisition routines, analyses spécifiques) Niv3 : - Niveau de la donnée existante (brute, nettoyée ) et la qualité de la données (Protocoles, paramètres )? - Comment retrouver les données à long terme (accès, partage, embargo, ), Niv4 : - Comment la ré-utiliser (Charte, Licences d utilisation)? - Comment croiser des données (en fonction de l Age, proxies, ) => ENTREPOTS DATA => PORTAIL THEMATIQUE
Les besoins en matières de données des scientifiques «paléo» «Cybercarothèque nationale» Niv 1 : (PHASE 1) - Historique de la prise de la carotte (mission) : => RAP. MISSION /CAMPAGNE qui, pour qui (PI), ou, comment (Logistique, techniques), pourquoi (objectifs scientifiques) - Où se trouve l objet physique? => GESTION DE STOCKS Niv2 : (PHASE 2) - Puis-je échantillonner (reste-t-il du sédiment ), qui contacter? - Suivi analytique : Qu est-ce qui a déjà été fait sur ce prélèvement : => LIMS - Quels types de données existe-t-il? (acquisition routines, analyses spécifiques) Niv3 : Rétrobservatoires - Niveau de la donnée existante (brute, nettoyée ) et la qualité de la données (Protocoles, paramètres )? - Comment retrouver les données à long terme (accès, partage, embargo, ), Niv4 : - Comment la ré-utiliser (Charte, Licences d utilisation)? - Comment croiser des données (en fonction de l Age, proxies, ) => ENTREPOTS DATA => PORTAIL THEMATIQUE
ANDROID MOISSONNAGE Flux CSW, WMS Contexte national : «Cyber-carothèque nationale» Carotte (Métadonnées mini) Nom mission Nom carotte Chef de mission Site - Lac Année Nb sections LATITUDE LONGITUDE Profondeur bathy Longueur totale Localisation_archive / Une BD générique en cours de construction LABOS LABOS RESEAU PHASE 1 INVENTAIRES (LEGACY) En prévoir 2sem. 2015 GESTION STOCK Intra/Inter-labo Portail national Inter-organismes CNRS IFREMER MNHN INRA La cyber-carothèque nationale En cours 1er sem. 2015 Rapport de mission «carottage» en ligne PHASE 2 : Système de gestion d info. de laboratoire (LIMS) Métadonnées de sondage (détails des opérations, localisation, noms des carottes etc.) GPRS Métadonnées d analyse (quels échantillons, quelles analyses, dispo. du matériel etc.)
Contexte national : «Cyber-carothèque nationale» Monde : 3643 carottes issues de 308 missions Alpes : 388 carottes, 77 missions http://www.climcor-cyber.fr/cores/
Contexte national : «Cyber-carothèque nationale» Vers une CONNEXION à des PORTAILS INTERNATIONAUX PROTOCLES, NORMES et STANDARDS - ISO19115 - INSPIRE IGSN : EDY-GKT00025 - Système international de référencement des échantillons - Persitant ID des chercheurs - PID institutions - PID des publications (ou jeux de données) VISIBILITE INTERNATIONALE IMLGS (NOAA) «Index to Marine and Lacustrine Geological Samples» (flux en construction)
CSW ETEDATA Contexte national : «Cyber-carothèque nationale» SISMER PORTAL DATA Cyber Core Repository DATA GPRS DATA MARINE s LABS DATA ICE s LAB CONTINENTAL s LABS GPRS Semi-distributed architecture : Using Interoperabily
VISIBILITE Enjeu : développer des BDs «intermédiaires» Rôle du scientifique : Dataset associées aux publis => WDC : PANGAEA NOAA Données publiées dans les articles scientifiques représentent seulement la «partie émergée de l'iceberg» du BIG DATA Majorité des BDs BD Cyber-Carothèque Prélèvements échantillons (CAROTTES) SOCLE VERS LES DONNEES
VISIBILITE R O ROZA : le rétro-observatoire des zones ateliers CLIMCOR: paleoclimatic CORing: High Resolution and Innovations Carottage paléoclimatique: Haute Résolution et Innovations Enjeu : développer une BD intermédiaire Dir. Denis-Didier Rousseau (denis.rousseau@lmd.ens.fr), Dir. Adj. Michel Calzas (michel.calzas@dt.insu.cnrs.fr) ANR-11-EQPX-0009-CLIMCOR Rôle du scientifique : Dataset associées aux publis => WDC : PANGAEA NOAA R O Données publiées dans les articles scientifiques représentent seulement la «partie émergée de l'iceberg» du BIG DATA Lacs sentinelles BD Cyber-Carothèque Prélèvements échantillons (CAROTTES) SOCLE VERS LES DONNEES http://climcor-equipex.dt.insu.cnrs.fr 9
Rétro-Observatoires : concept et protoypes Concept de «rétro-observatoire» - Prolonger l observation vers le passé via des archives naturelles - Conserver et rendre visible les données et métadonnées permettant de réutiliser des sites de carottages (via échantillons ou carottes conservés OU via nouvelles carottes) - Permettre l utilisation de carottes sédimentaires pour répondre à des problématiques non anticipées au moment du carottage ROZA - un ensemble de sites bien étudiés dispersés dans 11 des 13 Zones Ateliers du CNRS - Un projet-pilote de «RO» - Définition de la liste des données obligatoires (logging, datations, mesures std) - Connections (inter)nationales (no black hole!) Lacs sentinelles - En projet : un RO intégré au système d observation des lacs alpins (SOERE - OLA) - «Lacs sentinelles» intégrés à ce RO? - Homogénéiser les méthodes de conservation des échantillons et des données