INTRODUCTION AUX BASES DE DONNÉES EN BIODIVERSITÉ Atelier CEBioS MRV, Septembre 2015. André Heughebaert Belgian Biodiversity Platform



Documents pareils
Les bases de données

Le langage SQL pour Oracle - partie 1 : SQL comme LDD

I4 : Bases de Données

NFA 008. Introduction à NoSQL et MongoDB 25/05/2013

CREATION WEB DYNAMIQUE

Créez votre propre Archive Darwin Core

Bases de données relationnelles

Information utiles. webpage : Google+ : digiusto/

Exemple accessible via une interface Web. Bases de données et systèmes de gestion de bases de données. Généralités. Définitions

Bases de données élémentaires Maude Manouvrier

Langage SQL : créer et interroger une base

INSTITUT NATIONAL DES TELECOMMUNICATIONS CONTROLE DES CONNAISSANCES. 2. Les questions sont indépendantes les unes des autres.

SQL. Oracle. pour. 4 e édition. Christian Soutou Avec la participation d Olivier Teste

Bases de Données relationnelles et leurs systèmes de Gestion

OpenPaaS Le réseau social d'entreprise

Langage SQL (1) 4 septembre IUT Orléans. Introduction Le langage SQL : données Le langage SQL : requêtes

Chaîne opératoire de réalisation d une base de données. ANF «Comment concevoir une base de données» (29-30/01/2015)

Séance 1 Introduction aux bases de données

PHP 5. La base de données MySql. A. Belaïd 1

Les BASES de DONNEES dans WampServer

Olivier Mondet

Le langage SQL Rappels

A QUOI SERVENT LES BASES DE DONNÉES?

ECR_DESCRIPTION CHAR(80), ECR_MONTANT NUMBER(10,2) NOT NULL, ECR_SENS CHAR(1) NOT NULL) ;

COMMANDES SQL... 2 COMMANDES DE DEFINITION DE DONNEES... 2

MODE OPERATOIRE OPENOFFICE BASE

Objectifs du TP : Initiation à Access

les techniques d'extraction, les formulaires et intégration dans un site WEB

TP base de données SQLite. 1 Différents choix possibles et choix de SQLite : 2 Définir une base de donnée avec SQLite Manager

Le langage SQL (première partie) c Olivier Caron

Cours: Les Jointures 1

SQL Historique

14/04/2014. un ensemble d'informations sur un sujet : exhaustif, non redondant, structuré, persistant. Gaëlle PERRIN SID2 Grenoble.

Bases de données Page 1 de 11. Bases de données. Prof. : Dzenan Ridjanovic

Cours Bases de données

Introduction au Système de Gestion de Base de Données et aux Base de Données

Chapitre 5 LE MODELE ENTITE - ASSOCIATION

Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP)

Cours 3. Développement d une application BD. DBA - Maîtrise ASR - Université Evry

Le Langage SQL version Oracle

ISC Système d Information Architecture et Administration d un SGBD Compléments SQL

Création et Gestion des tables

1. LA GESTION DES BASES DE DONNEES RELATIONNELLES

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)

Cours Base de données relationnelles. M. Boughanem, IUP STRI

TP Bases de données réparties

La dernière base de données de Teradata franchit le cap du big data grâce à sa technologie avancée

BUSINESS INTELLIGENCE

MapReduce. Malo Jaffré, Pablo Rauzy. 16 avril 2010 ENS. Malo Jaffré, Pablo Rauzy (ENS) MapReduce 16 avril / 15

Présentation du module Base de données spatio-temporelles

Pratique et administration des systèmes

Visual Paradigm Contraintes inter-associations

UNIVERSITE DE CONSTANTINE 1 FACULTE DES SIENCES DE LA TECHNOLOGIE DEPARTEMENT D ELECTRONIQUE 3 ème année LMD ELECTRONIQUE MEDICALE

DEVAKI NEXTOBJET PRESENTATION. Devaki Nextobjects est un projet sous license GNU/Public.

Bases de Données. Le cas des BD relationnelles ouverture sur les BD relationnelles spatiales Séance 2 : Mise en oeuvre

PHP 4 PARTIE : BASE DE DONNEES

Mercredi 15 Janvier 2014

Chapitre VIII. Les bases de données. Orientées Objet. Motivation

Bases de données relationnelles & SQL

TD : Requêtes SQL (BDR.TD2-1) INSA 3IF

Le Langage De Description De Données(LDD)

INTRODUCTION : Données structurées et accès simplifié

1/ Présentation de SQL Server :

SQL sous SqlServer OLIVIER D. DEHECQ Olivier 0

A QUOI SERVENT LES BASES DE DONNÉES?

Introduction à MySQL (ou MySQL en 3 heures montre en main)

Licence de MIDO - 3ème année Spécialités Informatique et Mathématiques Appliquées

1. Base de données SQLite

Bases de Données. Stella MARC-ZWECKER. Maître de conférences Dpt. Informatique - UdS

Bases de données Outils de gestion

Les technologies du Big Data

Les bases de données relationnelles

Dossier I Découverte de Base d Open Office

Bases de données. PTSI Lycée Eiffel. 28 février 2014

PROSOP : un système de gestion de bases de données prosopographiques

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

Stockage de données sous Android

Réplication E-maj Foreign Data Wrapper PostGIS PostgreSQL-f

NF26 Data warehouse et Outils Décisionnels Printemps 2010

Introduction aux Bases de Données 2004/2005

1 Introduction et installation

JDev Atelier Datalift

Hébergement de site web Damien Nouvel

Cours Bases de données 2ème année IUT

Gestion de base de données

Session S12 Les bases de l optimisation SQL avec DB2 for i

Evolution et architecture des systèmes d'information, de l'internet. Impact sur les IDS. IDS2014, Nailloux 26-28/05/2014

UML et les Bases de Données

I. MySQL : Serveur et SGBD

Modélisation de bases de données : Le modèle relationnel

Encryptions, compression et partitionnement des données

Bases de données cours 1

Mysql avec EasyPhp. 1 er mars 2006

Master Exploration Informatique des données DataWareHouse

Auto-évaluation Oracle: cours de base

Modélisation et Gestion des bases de données avec mysql workbench

16H Cours / 18H TD / 20H TP

TP3 : Creation de tables 1 seance

Transcription:

INTRODUCTION AUX BASES DE DONNÉES EN BIODIVERSITÉ Atelier CEBioS MRV, Septembre 2015 André Heughebaert Belgian Biodiversity Platform

CONTENU 1. 2. 3. 4. 5. 6. 7. Introduction Données Metadonnées SQL NoSQL Outils Standards

1. INTRODUCTION

DONNÉES EN BIODIVERSITÉ Taxonomie, noms vernaculaires, specimens types Population, habitat, aire de répartitition Description, traits, propriétés, génome Relation entre espèces, ecosystèmes Observations, collections Indicateurs, modèles Publications scientifiques (et autres) Multimedia: images, sons, vidéos... Droit: Législations, règlementations, aires protégées... Communauté d'experts, scientifiques, amateurs

DONNÉES-INFORMATION

DONNÉES-INFORMATION Une donnée est une description élémentaire d une réalité. C est par exemple une observation ou une mesure. La donnée est dépourvue de tout raisonnement, supposition, constatation, probabilité. L'information est une donnée compréhensible, qui a un sens pour la personne qui la recoit. La connaissance est le résultat d'une réflexion sur les informations analysées. Le savoir permet le discernement final sur le contenu (informations et connaissances) et le jugement de bon sens.

DONNÉES-MÉTADONNÉES Les données (primaires) : Quoi?, Quand?, Où?, Combien?... Les métadonnées : Qui?, Comment? Pourquoi?... Pas de données sans métadonnées!

CYCLE DE VIE DES DONNÉES

2. DONNÉES (NOTIONS DE BASE) Espèces, Individus, Habitats, Ecosystèmes, Menaces, Indicateurs... sont des entités différentes Chaque entité a des attributs: par exemple le nom, l'aire de répartition ou le status de protection pour une espèce.

2. DONNÉES (NOTIONS DE BASE) Il existe des relations entre entités telle espèce vit dans tel habitat tel individu appartient à telle espèce telle espèce parasite telle autre espèce Il existe des contraintes sur les attributs un nom scientifique est exprimé par un binôme latin, il est unique! une latitude est comprise entre -90 et +90. une longitude est comprise entre -180 et +180.

3. METADONNÉES Metadonnées: données descriptives d'un jeu de données. Qui?: nom, prénom, institution, partenaires Comment?: méthodologie, matériel, fréquence, limites... Pourquoi?: projet de recherche ou de monitoring, source de financement...

3. METADONNÉES 1. Métadonnées de base 2. Geographiques 3. Temporels 4. Taxonomiques 5. Mots-clés 6. Description du projet 7. Méthode d'échantillonage

4. SQL (BASE DE DONNÉES RELATIONNELLE) Organisez vos données suivants vos besoins.

4. SQL (SCHÉMA DE DONNÉES)

4. SQL (NOTIONS DE BASE) Entité Attribut Relation Contrainte Table Colonne Clé+index Contrainte

4. SQL (NOTIONS DE BASE) SQL=Structured Query Language, en français langage de requête structurée. SQL permet de rechercher, d'ajouter, de modifier ou de supprimer des données. La base de données vérifie automatiquement toute règle ou contrainte et garantit ainsi l'intégrité de vos données.

4. SQL (CREATE) create table people ( peo_id integer primary key, lab_id integer references labs, peo_familyname text, peo_firstname text, peo_begindate text, peo_enddate text); create table sites ( sit_id integer primary key, loc_id integer references localities, sit_name text, sit_latitude real, sit_longitude real, sit_uncertainty integer); create table species(

4. SQL (SELECT) Les requêtes permettent d interroger la base de données. select * from occurrences where occ_date > '1830-01-01'; select occ.id, occ_latitude, occ_longitude from occurrences where occ_latitude is not null;

4. SQL (JOIN) Les jointures permettent d associer plusieurs tables dans une même requête. select * from occurrences occ left join people peo on peo.peo_id = occ.peo_id where (occ.occ_date < peo.peo_begindate) or (occ.occ_date > peo.peo_enddate);

4. SQL (VIEW) Les vues présentent les résultats d'une requête sous forme d'une table virutelle. CREATE VIEW observations AS select occ.occ_id AS id, spe.spe_scientificname AS scientificname, spe.spe_gu coalesce(occ.occ_uncertainty,sit.sit_uncertainty) AS uncertainty, loc.loc_nam from (((((occurrences occ left join sites sit on((sit.sit_id = occ.sit_id))) left join localities loc on((loc.loc_id = sit.loc_id))) left join species spe on((spe.spe_id = occ.spe_id))) left join people peo on((peo.peo_id = occ.peo_id))) left join labs lab on((lab.lab_id = peo.lab_id))); select * from observations;

4. SQL (DEMO)

4. SQL (RÈGLES D'OR) Gardez vos entités(=tables) simples. Une seule information par colonne. Utilisez des identifants uniques et persistants. Utilisez des noms simples et parlants. Evitez les redondances, source d'erreur. Utilisez des vocabulaires fermés (eg code ISO 3166-1-alpha-2 pour pays).

5. NOSQL

5. NOSQL A côté des base de données relationnelles, ils existent d'autres solutions pour organiser/interroger vos données: Clés-valeurs Triplets, RDF Graph database Base de données orientées objets...

6. OUTILS Être à l'aise avec vos outils va grandement vous simplifier la vie.

6. OUTILS (RECOMMANDÉS) Editeur de texte (pour vos données et vos scripts) Tableur: LibreOffice, OpenRefine Base de données: SQLite, PostgreSQL Cartographie: QGIS (Language: Java, Python, Ruby...)

6. OUTILS(DÉMO)

6. OUTILS

7. STANDARDS (D'ÉCHANGES DE DONNÉES) JSON est un format texte léger; facile à lire ou à écrire pour des humains et aisément analysable ou générable par des machines. CSV(ou TSV) format texte de données tabulaires. Chaque ligne du texte correspond à une ligne du tableau et les virgules(ou tab) correspondent aux séparations entre les colonnes. Darwin Core (DwC) est un ensemble de standards pour le partage des données de biodiversité. Il a été développé par le groupe international TDWG.

DES QUESTIONS? Belgian Biodiversity Platform a.heughebaert@biodiversity.be Fait avec reveal.js - HTML Presentations made easy