Méthodes pour améliorer la qualité des données de biodiversité

Documents pareils
Créez votre propre Archive Darwin Core

GBIF Système mondial d'information sur la biodiversité

Atelier marin. - Vers un suivi optimal des lagons et récifs -

GÉODÉSIE, COORDONNÉES ET GPS

Présentation du SINP. DGALN/DEB/PEM4 mai 2014

Une application sur tablette tactile pour la saisie de données naturalistes sur le terrain Linhota

COMITÉ ADMINISTRATIF ET JURIDIQUE. Quarante-huitième session Genève, 20 et 21 octobre 2003

Les macroinvertébrés: des bioindicateurs incontournables pour le monitoring des cours d eau en CH

Document d Appui n 3.3. : Repérage ou positionnement par Global Positionning System G.P.S (extrait et adapté de CAMELEO 2001)

ORUXMAPSDESKTOP v.1.4 EN PREMIER, TU DOIS AVOIR LA MACHINE VIRTUELLE JAVA DANS TON PC, PUISQUE ORUXMAPSDESKTOP EST UNE APPLICATION JAVA.

Data issues in species monitoring: where are the traps?

La gestion des données en écologie des communautés végétales : l exemple de Phytobase

FORD C-MAX + FORD GRAND C-MAX CMAX_Main_Cover_2013_V3.indd /08/ :12

Identification interactive des plantes et système d'information collaboratif. P. Bonnet, J.-f. Molino & al. Umr AMAP. Equipe-projet IMEDIA

par Jean-Louis Bouet-Leboeuf, ingénieur en chef de première classe des études et techniques de l armement de réserve ABSTRACT

Comptes des changements de la biodiversité des systèmes et des espèces

Retour d expérience d outils autour d EML. Marie-Claude Quidoz (CEFE) Atelier FRB : 02/04/2014

Quatre axes au service de la performance et des mutations Four lines serve the performance and changes

CONVENTION DE STAGE TYPE STANDART TRAINING CONTRACT

Télé-Procédure de Gestion d Incidents : Spécifications et Prototype.

VAMT 2.0. Activation de Windows 7 en collège

Les Géodatabases en 9.2

Résumé du rapport final du Projet ECDD

HERBIER NUMERIQUE COLLABORATIF DE MAURICE. enseignants des établissements à programme français de Maurice

Sud Expert Plantes Comité de Pilotage

L industrie pharmaceutique et la grippe aviaire

Tout au long de l année

AMTEC RESOURCES MANAGEMENT LTD. CREATION D UNE BANQUE DE DONNEES DONNEES GEOSPATIALES NATIONALE

Title Text. Gestion de données de mobilité Mobility data management

Webinaire - Solution Rubix

Les Français et la nature

Learning Object Metadata

2. Questionnaire pour une base de données

Mise en œuvre de l architecture SINP. Forum ATEN des TIC 4 juin Y. Lebeau MEDDE/DGALN/DEB/PEM4

IFT3902 : (Gestion de projet pour le) développement, (et la) maintenance des logiciels

Demande d autorisation de faire une tournée pour des cirques itinérants détenant des animaux sauvages

Convers3 Documentation version Par Eric DAVID : vtopo@free.fr

Application Form/ Formulaire de demande

Sélection d un moteur de recherche pour intranet : Les sept points à prendre en compte

Rédaction Anne- Sophie Archambeau (GBIF France) Participants. Thomas Changeux. Michel Guiraud

TELA BOTANICA Le réseau des botanistes francophones. Daniel MATHIEU, président Montpellier, FRANCE

LE MONITORING DE LA BIODIVERSITE EN SUISSE. Hervé LETHIER, EMC2I

demander pourquoi mon site n'apparaît pas sur google ou pourquoi mon site n'est pas référencé par les moteurs de recherche?

Les marchés Security La méthode The markets The approach

Société de Geo-engineering

Journée scientifique 21 novembre «Base de données e-prpv Etat des lieux et perspectives Bernard Reynaud, Henri Brouchoud, Bruno Hostachy»

Compte-rendu technique complet et détaillé des cookies

COPYRIGHT Danish Standards. NOT FOR COMMERCIAL USE OR REPRODUCTION. DS/EN 61303:1997

Sud Expert Plantes Développement Durable. Thème COSMETOPEE participants 8 pays. SEP 2D -Cosmétopée -Restitution session du 11 juin 2012

Morcellement du paysage

ÉTUDE SUR L EFFICACITÉ DES PNEUS D HIVER EN ÉTÉ RÉALISÉE PAR CAA-QUÉBEC

Géoréférencement et RGF93

4 ème PHYSIQUE-CHIMIE TRIMESTRE 1. Sylvie LAMY Agrégée de Mathématiques Diplômée de l École Polytechnique. PROGRAMME 2008 (v2.4)

ITS en quelques mots :

Teaching Sustainable Development in Paris 1 Master Environment and Sustainable Development

staff worldwide years 36b. revenues countries

TENDANCE BYOD ET SECURITE

Document d accompagnement pour le référentiel national du C2i niveau 2 Métiers de l environnement et de l aménagement durables

Les bases de données en ligne

Journée SITG, Genève 15 octobre Nicolas Lachance-Bernard M.ATDR Doctorant, Laboratoire de systèmes d information géographique

Guide juridique des données environnementales

Conception d un CD interactif : simulation d une sortie en écologie végétale

GRAND CONCOURS. des jeunes reporters. Pour les 8-10 ans. Photos : Istockphoto. Remise des prix le. Les mammifères marins!

Adoptez la solution SMART pour votre aire protégée

CONSTRUCTION DES PROJECTIONS TYPES DE PROJECTION. Projection => distorsions. Orientations des projections

E-Biothon : Une plate-forme pour accélérer les recherches en biologie, santé et environnement.

L. Granjon, E. Le Goff, A. Millereux, L. Saligny MSH Dijon

Le digital et l assurance Antoine Denoix AXA France. 17 février 2015 / FANAF / Madagascar

lundi 3 août 2009 Choose your language What is Document Connection for Mac? Communautés Numériques L informatique à la portée du Grand Public

TerrOïko : JEU en collaboration avec la SEEM

Cadre stratégique pour l agriculture du Canada Programmes d intendance environnementale

Prospective: Champ de gravité, méthodes spatiales

Le langage SQL Rappels

Qu est-ce que le ehealthcheck?

Le standard WPS dans une solution de gestion de catastrophe industrielle

Format de l avis d efficience

Joint AAL Information and Networking Day. 21 mars 2012

MAITRISE DE LA CHAINE LOGISTIQUE GLOBALE (SUPPLY CHAIN MANAGEMENT) Dimensionnement et pilotage des flux de produits

La directive INSPIRE pour le partage des données géographiques

VANNES, VIS SANS FIN, POMPES D ASSÈCHEMENT DES MARAIS

Les principaux thèmes liés à cette cause sont :

4. Résultats et discussion

SITI Agri La nouvelle génération du Système Intégré de Gestion et de Contrôle pour l administration des subventions

Optimiser le référencement naturel de son site web

Référentiel FairWild Version 2.0. Approuvé par le Conseil d Administration de FairWild le 26 août 2010

CBBC Canadian Business & Biodiversity Council

SMART: GUIDE DE LA MISE EN ROUTE DU SMART

Bien vivre, dans les limites de notre planète

SEMINAIRE DE L IFE. Un système de management environnemental basé sur ISO Presenté par Manoj Vaghjee

PHOTO ROYAUME DE BELGIQUE /KINDOM OF BELGIUM /KONINKRIJK BELGIE. Données personnelles / personal data

ICOS Integrated Carbon Observing System

Formation continue BNF // Programme des cours 2015

1 Description générale de VISFIELD

2.0 Interprétation des cotes d évaluation des risques relatifs aux produits

1.8. APLANET GLOSSAIRE DES TERMES

Kick Off SCC EMC l offre EXTREMIO. fmarti@fr.scc.com Philippe.rolland@emc.com. Vers de nouveaux horizons

Le programme FAME Quel apport pour les AMP? Réunion nationale de restitution et d échanges du programme FAME 20 février 2013 / Paris

PROCÉDURE POUR UNE ÉTUDE EN LIGNE EXTERNE

P.L.U. Plan Local d'urbanisme PRESCRIPTION D'ISOLEMENT ACOUSTIQUE AU VOISINAGE DES INFRASTRUCTURES TERRESTRES DOCUMENT OPPOSABLE

La physique médicale au service du patient: le rôle de l agence internationale de l énergie atomique

Transcription:

Méthodes pour améliorer la qualité des données de biodiversité Formation sur la qualité, l'utilisation et la publication de données sur la biodiversité. 15-17 octobre 2012, MNHN Basé sur la présentation de Nicolas Noé niconoe@ulb.ac.be pour GB18 training sessions Buenos Aires, Argentine (sept 2011)

Aperçu Guide des bonnes pratiques Données taxonomiques Données spatiales / géographiques Données sensibles Spécificités GBIF

Bonnes pratiques Pour les données taxonomiques

Données taxonomiques Certitude d identification Conception de la base de données: Flag de vérification, nom et date Attention aux termes "aff.", "cf.", "s.lat",... Si pas identifié par expertise taxonomique, enregistrer l information: o Clés taxonomiques o Analyses ADN o Révision d un groupe taxonomique o...

Données taxonomiques Certitude d identification Saisie des données: Utilisation de checklists Utilisation de fichiers d autorité Détection d erreurs: Nécessite généralement un expert Les valeurs extrêmes (outliers) peuvent aider (géographiques ou environnementales)

Données taxonomiques Erreurs orthographiques nom scientifique Conception base Standardiser au maximum Fichiers d autorité Globaux, régionaux ou par groupe Duplicatas Interface dédiée pour la détection (+flag)

Données taxonomiques Erreurs orthographiques rang infra-spécifique Standardiser! Pour Éviter les ambiguïtés Faciliter les vérifications

Données taxonomiques Rang infra-spécifique- saisie des données Liste pré-remplie Choix restreints:

Cultivars et hybrides Cas complexes et variables: DB sur mesure! Cultivars: code de nomenclature dédié. Ajouter un flag cultivar? et un hybride?

Données taxonomiques Espèce non publiée A éviter Éviter la confusion avec un nom accepté! Éviter la confusion entre spécialistes ou institutions (sp1, sp2, )

Données taxonomiques Espèce non publiée Bonnes pratiques "<Genus> sp. <colloquial name or description> (<Voucher>)" Prostanthera sp. Somersbey (B.J. Conn 4024) Avantages Ne ressemble pas à un nom publié Pas de confusion entre institutions Peut devenir ultérieurement synonyme Peu de chances de confusion en dehors du monde scientifique

Données taxonomiques Espèce non publiée Noms communs Très complexe à standardiser: Un taxon = souvent plusieurs noms Un nom = parfois différents taxons Solution: ne pas standardiser (mais documenter très largement)!

Données taxonomiques Noms des auteurs Rarement vraiment nécessaire Si inclus: champs séparés: Genre, espèce, auteur et années Pour l affichage, tenir compte des différences entre animaux et végétaux

Données taxonomiques Auteur méthodes de vérification Standard pour les abréviations (plantes) Fichiers d autorité Soundex Auteurs manquants

Données taxonomiques Nom de collecteur Parfois, liste exhaustive La forme doit être standardisée "Primary collector's family name (surname) followed by comma and space (, ) then initials (all in uppercase and each separated by fullstops). All initials and first letter of the collector's family name in uppercase. For example, Chambers, P.F."

Données taxonomiques Collecteur: recherche d erreurs Rechercher des variations mineures Comparaisons à d autres bases: historiques, Améliorations possibles dans les deux sens!

Bonnes pratiques Pour les données spatiales

Données spatiales Souvent, beaucoup trop de choses dans les champs localité/distribution. Eurasia: throughout Europe to northernmost extremity of Scandinavia, except Iberian Peninsula, central Italy, and Adriatic basin; Aegean Sea basin in Matriza and from Struma to Aliakmon drainages; Aral Sea basin; Siberia in rivers draining the Arctic Ocean eastward to Kolyma. Widely introduced. Several countries report adverse ecological impact after introduction. (distribution de Perca Fluviatilis selon fishbase)

Données spatiales Coordonnées décimales (ex: 21.339) 21 20ʹ20ʺ (DD MMʹSSʺ ) 21:20:21 12 25m 12d25 30' 50'' W North 21 deg 20 min 11,453 sec N 21 25,568150 Outil de conversion on-line: http://webapps.cartoninjas.net/coordinateconverter/

Données spatiales Datum (type de geoid+elipsoide), systeme de coordenées (géographique ou planes) et projection utilisé SRS (Spatial Reference System/systèmes de coordonnées géoreférencées) Information a documenter! UTM, zone 17, Datum NAD27 code 2029 (code EPSG, European Petroleum Survey Group) DATUM ou code EPSG suffit!

Données spatiales GBIF Darwin Core geodeticdatum : http://rs.tdwg.org/dwc/terms/#geodeticdatum

Données spatiales Autre information a fournir: Précision (rapportée par le GPS): número de decimals Incertitude spatiale (en metres préferentement): erreurs de géolocalisation (GPS variable de 2 a plus de 20 metres) Nom de le lieu plus proche+ distance + direction+méthode de géoréférencement Méthode de géoréférencement (Differential)GPS: erreur de 10cm a 15m. Normal GPS: 2-20 metres erreur. GPS dégradé par «Selective availability» (avant anné 2000) Via carte et triangulation (+échelle) A postériori, via un logiciel de géoreferenciation (Sistéme Information Géographique)

Données spatiales Détection et correction des erreurs Tests internes: localité, pays Tests envers des données externes: consisténce des noms des lieux visités par le collecteur? (ex: Geonames.org pour télecharger base de donnés du noms géographiques; aussi services web) Tests via un SIG: test point-dans-polygone? (terrestre ou marin, pays, regions visités par le collecteur ) Recherche de valeurs extrêmes (outliers): géographiques ou environnementales

Données spatiales Localité: bonnes pratiques Aussi spécifiques que possible: Non-ambiguës Courtes Facile à trouver Référence des lieux stables et connus Distance et direction depuis cette référence «2.1km N et 5.1 km E de la la ville de X» 07/26/12 «Presque 650 metres de la (petite) riviére Y»

Bonnes pratiques Pour les données sensibles

Données sensibles Généralisation pourquoi? Protéger espèces menacées, d importance économique, réduire l impact sur les populations sauvages, Éviter la collecte non-scrupuleuse, le braconnage, encadrer la bio-prospection, Protéger les données externes détenues par l institution Conserver un avantage compétitif (publications et recherche) Crainte d un usage inapproprié des données Respect Résultats du sondage en ligne du GBIF (2006)

Données sensibles Généralisation considérations générales Aspect social = obstacle principal Composante régionale Certains ne publieront jamais La documentation est primordiale

Données sensibles Généralisation la doc. est primordiale Décrire comment et pourquoi les données ont été généralisées permet à l utilisateur de: Savoir que les données on été modifiées et en quoi Savoir qu il sera peut-être possible d obtenir des données plus détaillées Décider d ignorer ces données, des les utiliser telles quelles ou de chercher des informations supplémentaires

Données sensibles Généralisation comment faire Données spatiales o o o Utilisation d une grille 3 niveaux recommandés par Chapman & Wieczorek (2006): 0.1 degrés (11-16 km) - 0.01 degrés (1.1-1.6km) - 0.001 degrés (112-157m) Cas critiques: non publiés Données non-spatiales o o A remplacer par une formulation appropriée Ne pas restreindre les données de collection

Données sensibles Généralisation quoi? Localité ou coordonnées Autres champs: informations taxonomiques, identité du collecteur, information sur les habitats, usage traditionnels

Bonnes pratiques Spécificités GBIF

Normalisation GBIF Date - BasisOfRecord Date o o o Format (ISO 8601:2004(E)) Date simple : AAAA-MM-JJ ou AAAA-MM ou AAAA Période : AAAA-MM-JJ/JJ ou AAAA-MM-JJ/MM-JJ ou AAAA/AAAA etc BasisOfRecord o Format Darwin Core Type Vocabulary recommandé PreservedSpecimen FossilSpecimen LivingSpecimen HumanObservation MachineObservation

Questions? Merci

Références Basé sur les publications et les présentations d Arthur Chapman : «Principles of data quality» et «Principles and methods of data cleaning».