la biodiversité pour l agriculture Ch. Jenny & JL Pham / Atelier Ecoscope FRB / 25 novembre 2015
Contexte général, réalisation Le projet ARCAD/FEDER, la demande, l architecture du système et du portail
Le dispositif de conservation des ressources génétiques végétales par les organismes français de recherche INRA Cirad - IRD Un modèle distribué, contrairement à d autres pays Géographie en rapport avec l écologie des espèces conservées et le mandat des organismes de recherche: Tempérées, méditerranéennes et tropicales La plupart des collections (mais pas toutes) sont maintenues par des Centres de Ressources Biologiques végétales.
Une structuration de réseau en cours Un nœud pour les CRBs méditerranéens et tropicaux ARCAD A Montpellier, un centre de conservation, d analyse et de recherche sur les RGV méditerranéennes et tropicales (notamment de nouvelles infrastructures lourdes début 2018) Des missions nationales : Cryoconservation, Banque d ADN, Système d information Pilier Plantes de l infrastructure RARe Au sein d un dispositif national sous la houlette du GEVES Deux questions transversales et structurantes Démarche qualité Gestion et diffusion de l information
Rappel du contexte et de la demande Financement dans le cadre du projet ARCAD / FEDER WP Système d information = expertise d un outil local (GRIN Global) et montage d un portail web. Rendre plus claire et lisible l offre française en matière de ressources génétiques pour l agriculture Aujourd hui, l offre visible est fragmentée, incomplète et semble non coordonnée. Fourniture de services Listes des ressources disponibles Information sur ces ressources Proposer un point d entrée centralisé pour la commande de matériel végétal A terme, fournir des données aux DB internationales
Espèces tropicales Espèces tempérées et méditerranéennes Localement une quarantaine de collections gérées à travers 18 CRB Des regroupements intermédiaires par institut, localisation, système Guadeloupe, Martinique, Guyane, la Réunion OLGA Montpellier CRBTools Ploudaniel, Angers, Bordeaux, Clermont-Ferrand, Dijon Mauguio Vassal SIReGal MultiCrop DB Vigne Web Services Portail ARCAD Synthèse globale
Structure générale du site 2 1. informations sur les RG 2. contenu éditorial S&T 3. commande de matériel végétal 1 2 1 1 3
Les données (et les problèmes ) Descripteurs passeport, descripteurs de caractérisation et d évaluation
Les descripteurs passeports D une manière générale, l ensemble est très hétérogène, non standard et incomplet. D un système à l autre les champs ne sont pas les mêmes, car la structure de la base de données varie. Les taux de renseignement des champs sont très variables. Le renseignement des champs, même quand ils sont standards, ne l est pas lui-même
Structure et taux de renseignement des descripteurs de passeport SIReGal OLGA Descripteur Nb de valeurs Remplissage accessionname 26835 100% accessionnumber 26835 100% cropname 3826 14% scien8ficname 26835 100% rank 26835 100% domain 26828 100% kingdom 26828 100% division 20031 75% class 26351 98% order 0 0% family 26828 100% genus 26746 100% species 26742 100% variety 11274 42% cul8var 1207 4% iso 0 0% origincountry 7287 27% origine_en 0 0% holdingins8tu8onid 26835 100% biologicalstatus 23008 86% conserva8on_mode 0 0% disponibility 20423 76% presence 26430 98% protec8on 0 0% collectorins8tu8onid 3707 14% collec8ngsite 9780 36% collec8ngla8tude 3330 12% collec8nglongitude 3329 12% Différences de structure Taux de renseignement très variable Possibilités d affichage de cartes réduites Descripteur Nb de valeurs Remplissage arcad_accename 5163 100% arcad_accenumb 5163 100% cropname scien8ficname rank domain kingdom division class the_order family 5163 100% arcad_genus 5163 100% sous_genre arcad_species 5163 100% variety cul8var arcad_subtaxa 1717 33% arcad_origcty 3437 67% origine_fr 3437 67% origine_en arcad_sampstat 2205 43% conserva8on_mode disponibility 123 2% presence protec8on arcad_donorname collec8ngsite 650 13% arcad_decla8tude 275 5% arcad_declongitude 275 5% Très peu renseigné. Hypothèse = disponible si listé?
Un exemple d hétérogénéité, le «nom scientifique» Dans les listes de collection, on propose assez naturellement d afficher le nom scientifique rattaché à une accession : Genre + Espèce Ce n est pas un descripteur standard, mais il s obtient bien en concaténant les deux champs Genre et Espèce Les règles du MCPD pour ces deux champs : Genre : en latin, première lettre en majuscule Espèce : uniquement l épithète d espèce, en minuscules, suffixe sp. autorisé Les «autorités» (Linné par ex.) sont dans un champ spécifique (species authority) Le champ «subtaxon» présente tous les identifiants supplémentaires (suffixes admis : supbsp., convar., var., f. et group)
Chez OLGA OLGA ananas cacao cafeier canne hevea vanille collec8on_id 3 6 8 9 10 17 collec8on_name ananas- cirad cacao- cirad cafeier- cirad canne- cirad hevea- cirad vanille- cirad family_id 31 61 81 91 101 171 id 348 6666 831 950 10398 1717 name Anana Branco (Perola) GU 265 V ET19 B 73 438 MT/IT/16/3 tah0017 number PT- AN- 00048 PPG- CC- 00666 PPG- CF- 00031 PT- CA- 00050 PPG- HE- 00398 CRV- 00017 scien8ficname domain kingdom division class ordre Majuscules En français Mot en trop family_fr Bromeliaceae Malvacées Rubiaceae Poacées Euphorbiaceae Orchidaceae genus Ananas THEOBROMA Coffea Saccharum Hévéa Vanilla species Ananas comosus THEOBROMA CACAO Coffea arabica Saccharum species Hévéa Hevea brasiliensis Vanilla xtahitensis variety Perola haapape cul8var subtaxa Guiana Ethiopiens et sauvages Amazonien Foliosae_Lamellosae «Genre» en trop
Les descripteurs de caractérisation Il n existe pas nécessairement de standard Mais quand ils existent on peut s appuyer sur les descripteurs FAO/IPGRI Chaque spécialiste choisit les descripteurs qui lui paraissent les plus pertinents Cependant, on observe là aussi une grande hétérogénéité Dans le nombre et le type de descripteurs Dans le taux de renseignement de ces descripteurs Perfectible selon la sensibilité de chacun
Les recommandations aux CRBs Dans les bases de données locales de collection Pour les données passeport, compléter leur renseignement et le cas échéant, le corriger en s appuyant sur le standard du MCPD. Si le MCPD n est pas utilisé, tacher au minimum de rester cohérent avec soi-même pour toutes les saisies dans un champ donné Dans tous les cas, prendre le pli de ne rentrer qu une seule information par champ Pour les données d évaluation, réfléchir aux descripteurs pertinents à répercuter sur le portail Florilège. Coll-Gate est aussi un lieu pertinent de discussion et de réflexion sur ces aspects. Mettre à jour ces nouvelles données dans les bases qui les agrègent et auprès desquelles le portail s alimente Si des modifications de structure de la base locale sont envisagées, (ajout, suppression ou modification de champs), nous informer!
Faire vivre le portail Validation et actualisation des contenus Actualités du réseau, dossiers thématique Mise à jour de l information
Faire vivre le portail : Les liens avec le réseau des CRB Les CRB sont partie prenante du portail Florilège Présentations institutionnelles, présentations des activités, des champs de recherche, des projets, des publications, des actualités Mode de mise à jour de l information Remplacer (ou devenir) le site web du CRB? Coordination dynamique avec le site du CRB si déjà existant Proposer des dossiers thématiques Types de contenus : grands domaines autour des RG, dossiers d actualité Mise en place d un comité éditorial
Il reste du travail Un site web est un investissement au minimum à moyen terme. Il doit rester évolutif (structure, aspect, contenu) Des compétences variées sont requises Spécialistes plantes et RG viennent de nos instituts Pas forcément les autres (informaticiens, designers ) Et donc des sources de financement sont nécessaires Directement les instituts fondateurs (CIRAD, INRA, IRD) Montage de projets (IBISA, initiative RARe, Agropolis Fondation, projets européens ) Ce qu il reste à faire (liste minimale ) Incorporer les CRB du réseau non encore présents. Mettre en place la fonctionnalité «Fiche variétale» Réflexion sur le contenu (choix des descripteurs) et l iconographie (solutions techniques de stockage et de référencement, Cf. Projets IBISA) Mise en route du module de commande Mise en place d un accès au back office pour les curateurs de CRB Version bilingue anglais / français
L international Les flux de données, les bases de données internationales, les partenaires extérieurs
Flux de données et structure bananier café riz chou pommier blé pdt Module de commande Listings de collection, stocks, disponibilités, descripteurs. Gestion clients Contenu éditorial Dossiers plantes, références scientifiques, fiches de présentation, actualités Fiches d information variétales Listings de collection, descripteurs, contenu multimédia,. Alimentation BdD internationales Listings de collection, descripteurs standards. Eurisco, GBIF, Genesys
EURISCO is a search catalogue providing information about ex situ plant collections maintained in Europe. It is based on a European network of ex situ National Inventories (NIs). Currently, EURISCO comprises passport data about 1.1 million samples. Between 2003 and 2014, EURISCO was hosted and maintained by Bioversity International Since 15th April 2014, these responsibilities are being moved to the Leibniz Institute of Plant Genetics and Crop Plant Research (IPK), EURISCO is maintained on behalf of the Secretariat of the European Cooperative Programme for Plant Genetic Resources (ECPGR), in collaboration with and on behalf of the National Focal Points for the National Inventories. http://eurisco.ipk-gatersleben.de France = 25 e position Avec 3.500 références Entre la Serbie et la Croatie
Ressources Génétiques Species/Infra species Biodiversité CGIAR GENESYS (ex SINGER) GCDT - Trust Toutes données (Darwin Core) GBIF OCDE Museum Jardins botaniques Genebank DB de chaque centre Passport Data (MCPD) Extraction de données nettoyage, traitement DB Refined Data? USDA GRIN Global Passport Data (MCPD) Points focaux nationaux BIOVERSITY (collectes) FAO EURISCO Autres Rapports de collecte
Intégration européenne Reste à préciser BDD génomiques BDD spécialisées plantes Langage commun (via chaque CRB) Descripteurs complémentaires & DB liées Organismes français Echanges d info (RSS) Intégration nlles RG RG & biodiversité Métadonnées Préparation WS BDD internationales généralistes RG & biodiversité
En vrai Quelques vues d écran du portail
Le portail s appelle
Accès aux CRBs
Les CRBs / maquette
Accès aux collections
Les listes d accessions / maquette
Les actualités