Informatique Décisionnelle pour l environnement



Documents pareils
Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours

Workflow/DataWarehouse/DataMining LORIA - Université d automne Informatique décisionnelle - L. Mirtain 1

et les Systèmes Multidimensionnels

Les Entrepôts de Données

Datawarehouse: Cubes OLAP. Marlyse Dieungang Khaoula Ghilani

Entrepôt de données 1. Introduction

Urbanisation des SI-NFE107

LES ENTREPOTS DE DONNEES

Introduction à la B.I. Avec SQL Server 2008

Les Entrepôts de Données. (Data Warehouses)

La place de la Géomatique Décisionnelle dans le processus de décision

Entrepôt de Données. Jean-François Desnos. ED JFD 1

BI2 : Un profil UML pour les Indicateurs Décisionnels

Business Intelligence : Informatique Décisionnelle

L information et la technologie de l informationl

Collabora'on IRISA/INRA sur le transfert de nitrates et l améliora'on de la qualité des eaux des bassins versants:

ETL Extract - Transform - Load

Bases de Données Avancées

Chapitre 9 : Informatique décisionnelle

Les entrepôts de données

Présentations personnelles. filière IL

Introduction à l Informatique Décisionnelle - Business Intelligence (7)

Ici, le titre de la. Tableaux de bords de conférence

Plan. Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation

Entrepôts de données. NEGRE Elsa Université Paris-Dauphine

Un datawarehouse est un entrepôt de données (une base de données) qui se caractérise par des données :

SQL SERVER 2008, BUSINESS INTELLIGENCE

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

Bases de Données OLAP

La Geo-Business Intelligence selon GALIGEO avec 26/10/2005 1

La problématique. La philosophie ' ) * )

TP2 DE BUSINESS INTELLIGENCE ISIMA ZZ3 F3

Didier MOUNIEN Samantha MOINEAUX

et les Systèmes Multidimensionnels

Le Géodécisionnel. P7 : Projet Bibliographique Dans le cadre du Mastère ASIG. Les SIG au service du géodécisionnel.

BI = Business Intelligence Master Data-ScienceCours 3 - Data

Business & High Technology

IMPLEMENTATION D UN SYSTEME D INFORMATION DECISIONNEL

QU EST-CE QUE LE DECISIONNEL?

Sécurité des entrepôts de données dans le Cloud Un SaaS pour le cryptage des données issues d un ETL

Entreposage de données complexes pour la médecine d anticipation personnalisée

Mémoire de fin d études. Thème Conception et réalisation d un Data Warehouse pour la mise en place d un système décisionnel

Le "tout fichier" Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique

Big Data On Line Analytics

ÉVALUATION DES PRODUITS COMMERCIAUX OFFRANT DES CAPACITÉS

Introduction à lʼinformatique. Décisionnelle (ID) / Business. Intelligence» (1)

Fournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement

Le concept de Data Warehouse a été formalisé pour la première fois en 1990.

Bases de Données. Stella MARC-ZWECKER. Maître de conférences Dpt. Informatique - UdS

Déroulement de la présentation

Programme scientifique Majeure ARCHITECTURE DES SYSTEMES D INFORMATION. Mentions Ingénierie des Systèmes d Information Business Intelligence

Chapitre IX. L intégration de données. Les entrepôts de données (Data Warehouses) Motivation. Le problème

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)

TP2_1 DE BUSINESS INTELLIGENCE ISIMA ZZ3 F3

CONCEPTION ET REALISATION D'UN GENERATEUR DE TABLEAUX DE BORD PROSPECTIFS MULTIDIMENSIONNELS

République Algérienne Démocratique et Populaire

Intelligence Economique - Business Intelligence

L A B U S I N E S S. d a t a g i n f o r m a t i o n g a c t i o n

Diplôme de Comptabilité et de Gestion. D é c r e t N d u 2 2 d é c e m b r e A r r ê t é d u 8 m a r s

Filière Data Mining (Fouille de données) Pierre Morizet-Mahoudeaux

OPEN DATA : CHALLENGES ET PERSPECTIVES D ENTREPOSAGE

CONSERVATOIRE NATIONAL DES ARTS ET METIERS CENTRE REGIONAL ASSOCIE DE BOURGOGNE MEMOIRE. présenté en vue d'obtenir le DIPLOME D'INGENIEUR C.N.A.M.

Méthodologie de conceptualisation BI

Intégration de données hétérogènes et réparties. Anne Doucet

Business Intelligence avec Excel, Power BI et Office 365

Présentation du module Base de données spatio-temporelles

Bases de données multidimensionnelles et mise en œuvre dans Oracle

Travail de diplôme 2011 Business Intelligence Open Source SpagoBI/Talend Résumé

UNIVERSITÉ MOHAMMED V AGDAL. FACULTÉ DES SCIENCES Rabat THÈSE DE DOCTORAT. Présentée par ELhoussaine ZIYATI Discipline : Sciences de l ingénieur

XCube XML For Data Warehouses

Cabinet Conseil en Intelligence d Affaires. L'Intégration de données et la Qualité des données dans l'écosystème BI actuel et future

Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise.

Jedox rafraîchit les rapports du fabricant de boissons MBG

Tout ce que vous avez toujours voulu savoir sur SAP HANA. Sans avoir jamais osé le demander

Introduction: 1. définition d un ETL 2. importance et diversité des données spatiales utilitédes ETL géographiques

Département Génie Informatique

BUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise

Cybermarché et analyse comportementale

L INTELLIGENCE D AFFAIRE DANS LA VIE QUOTIDIENNE D UNE ENTREPRISE

Introduction au domaine du décisionnel et aux data warehouses

SQL Server 2012 et SQL Server 2014

AXIAD Conseil pour décider en toute intelligence

Evry - M2 MIAGE Entrepôts de Données

DATA QUERY : MODÉLISATION AVANCÉE DE VOS DONNÉES

Modélisation Multidimensionnelle des Tableaux de Bord Prospectifs

Le petit glossaire du décisionnel

BI = Business Intelligence Master Data-Science

BUSINESS INTELLIGENCE

Le terme «ERP» provient du nom de la méthode MRP (Manufacturing Ressource Planning) utilisée dans les années 70 pour la gestion et la planification

Filière Fouille de Données et Décisionnel FDD (Data Mining) Pierre Morizet-Mahoudeaux

Construction d un environnement destiné à l'aide au pilotage

Software Application Portfolio Management

CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2012

Le Data Warehouse. Fait Vente. temps produit promotion. magasin. revenu ... Produit réf. libellé volume catégorie poids. Temps jour semaine date ...

Entrepôt de données et l Analyse en ligne. Maguelonne Teisseire Hugo Alatrista Salas hugo.alatrista- salas@teledetec9on.fr Flavien Bouillot

UE 8 Systèmes d information de gestion Le programme

Business Intelligence

Didacticiel Études de cas. Description succincte de Pentaho Data Integration Community Edition (Kettle).

Département de Maine et Loire OASIS. Observatoire d Analyse du Système d Information Stratégique

Transcription:

Territoires, Environnement, Télédétection et Information Spatiale Unité mixte de recherche AgroParisTech - Cirad - Irstea Informatique Décisionnelle pour l environnement Principe, architecture informatique et outils d exploration des données André Miralles

Plan Rappel historique Définitions et architectures Cube multidimensionnel Outils de remobilisation et de restitution des données Propriétés de l architecture Où est la recherche? Conclusion 2

Territoires, Environnement, Télédétection et Information Spatiale Unité mixte de recherche AgroParisTech - Cirad - Irstea Rappel Historique

Rappel historique Information décisionnelle Conçus pour répondre au besoin de prise de décision rapide de la part de la Grande distribution Gestion de flux financiers Suivi du Chiffre d affaire Dédiés à l aide à la décision Temps de réponse rapide (de l ordre de quelques secondes) et constants quelque soit la complexité des requêtes 4

Territoires, Environnement, Télédétection et Information Spatiale Unité mixte de recherche AgroParisTech - Cirad - Irstea Définitions et architectures

Architecture centralisée Les données sont centralisées au sein d une même plateforme Systèmes transactionnels Entrepôt de données centralisé, unique et intégré Postes clients

Base de données (Transactionnelle) C est une Base de données dont le mode d exploitation est tourné vers la saisie, le stockage, la mise à jour, la sécurité et l intégrité des données. Systèmes transactionne ls Entrepôt de données centralisé, unique et intégré Post es clie nts 7

Entrepôts de données C est une collection de données portant sur des sujets touchant une organisation, Intégrité (rationalisation et nettoyage des données), historisées (datées), et non-volatiles (suppression impossible) pour supporter le processus de prise de décision d une organisation (Inmon et al. 1996) Systèmes transactionne ls Entrepôt de données centralisé, unique et intégré Post es clie nts 8

Architectures n-tiers Architecture n-tiers où les données sont organisées par niveau de granularité Systèmes transactionnels (données très détaillées) Entrepôt de données (données détaillées) Entrepôt de données (données résumées) Marchés de données (données résumées et agrégées) Postes clients Filière bovine Filière céréalière Filière laitière Tiers 4 Tiers 3 Tiers 2 Tiers 1

Architectures «sans entrepôt» Les données ne sont pas centralisées mais organisées directement par fonction Systèmes transactionnels Marchés de données par filière Postes clients Filière bovine Filière céréalière Filière laitière

Comparaison des caractéristiques Base de données transactionnelles Données organisées pour limiter la redondance (normalisation) Nombre élevé de tables Requêtes souvent complexes Temps de réponse variable pouvant être long Entrepôt de données Redondance des données organisée selon des analyses préétablies Nombre faible de tables Requêtes souvent plus simples Temps de réponse rapide (<10s) et constant 11

Territoires, Environnement, Télédétection et Information Spatiale Unité mixte de recherche AgroParisTech - Cirad - Irstea Cube multidimensionnel (Hypercube)

Exemple Exemple d un Cube multidimensionnel (Hypercube) Chiffre d affaire (CA) d une Entreprise Agricole Indicateur Membre 50<SAU<100 SAU 20<SAU<50 Dimension 10<SAU<20 CA Carottes Salade SAU<10 Taureau Vache 1994 1993 1992 1991 Année

Organisation Agrégative de la Dimension Production Agricole Dimension Production Ensemble Production Ensemble Production 0..1 0..* Liste Types Produit Bovin Céréale Maraichage Type Produit 0..1 0..* Liste Produits Pomme Vache Taureau Blé Carotte Salade de Terre Produit 14

Exemple Cube multidimensionnel (Hypercube) Chiffre d affaire (CA) d une Entreprise Agricole Quantité de produit (Q) 50<SAU<100 20<SAU<50 10<SAU<20 SAU<10 CA Q 1994 1993 1992 1991 Carottes Salade Taureau Vache 15

Territoires, Environnement, Télédétection et Information Spatiale Unité mixte de recherche AgroParisTech - Cirad - Irstea Outils de remobilisation et de restitution des données Collecter Restituer

Plusieurs familles d outils de remobilisation et de restitution des données Requêteur Saisir, supprimer, mettre à jour des données Génération automatique de rapports, de page web, etc. (Spatial) On-Line Analytical Processing (OLAP ou SOLAP) Tableau de Bord (Spatial et Non Spatial) Outils d extraction de connaissances Fouilles de données Statistiques Arbres de décision Etc.

On-Line Analytical Processing (OLAP) Spatial On-Line Analytical Processing (SOLAP) Il s agit d une catégorie de logiciels axés sur l exploration et l analyse rapide des données (spatiales) selon une approche multidimensionnelle à plusieurs niveaux d agrégation (Caron, 1998) 18

Drill Down / Drill Up Opérateurs OLAP ou SOLAP Navigation à travers plusieurs niveaux d une dimension Niveau global vers niveau détaillé ou l inverse Dimension Production Ensemble Production 0..1 50<SAU<100 0..* Type Produit Liste Types Produit 20<SAU<50 0..1 10<SAU<20 CA Production Bovin 0..* Liste Produits SAU<10 Taureau Produit 1994 1993 1992 1991 Vache 19

Restitutions classiques de l information Histogrammes Camemberts Etc. 20

Restitution cartographique Exemple d un emboîtement de BV

Restitution cartographique Evolution temporelle de la Matière Active appliquée

23

24

Utilisateurs potentiels de ces outils informatiques Requêteur Utilisateurs OLAP et SOLAP Utilisateurs expérimentés Scientifiques Tableau de Bord (Spatial et Non Spatial) Décideurs Extraction de connaissances Experts ou scientifiques 25

Territoires, Environnement, Télédétection et Information Spatiale Unité mixte de recherche AgroParisTech - Cirad - Irstea Propriétés de l architecture

Propriétés de l architecture 1 Propriété Souplesse de l Architecture informatique Systèmes d information transactionnels Entrepôt de données Postes client Données primaires Indicateurs (Calculés) 27

2 Propriété Propriétés de l architecture Dichotomie des modèles métier/analyse Matière Active Famille : string Solubilité : real DT50 : real DJA : real KOC : real LC50 : real Matière Active Spécialité Commerciale 1..* * Concentration Spécialité Commerciale Mode de Pénétration : string Commentaire : string Dimension MA Toutes MA 0..1 0..* Types Action Concentration Type Action Valeur : real Unité : string 0..1 0..* Matières Actives Matière Active Systèmes transactionnels Entrepôt de données centralisé, unique et intégré Postes clients Connaissances métiers Analyse des besoins

Territoires, Environnement, Télédétection et Information Spatiale Unité mixte de recherche AgroParisTech - Cirad - Irstea Où est la recherche?

Où est la recherche? Recherche informatique SIE Pesticides Dimension Spatiale Dimension Temporelle Méthodes et outils Méthodes et outils Recherches de conception des SI pour automatiser de conception des ED le processus de conception et d implémentation Transformations de Données Transformations de Données Méthodes et outils d agrégation Dimension Matière Active Mesure Surface développée : real Quantité de Matière Active kg : real /Quantité de Matière Active kg/ha : real Restitution de l information Collecter Restituer Données existantes Systèmes d information transactionnels Entrepôt de données Postes client 30

Où est la recherche? Recherche thématique Projet Miriphyque Simulations de transferts de pesticides Dimension Spatiale + Bassin Versant 0..1 Indicateurs de risque? Ft? 0..* Liste Parcelles Parcelle Indicateurs de risque

Territoires, Environnement, Télédétection et Information Spatiale Unité mixte de recherche AgroParisTech - Cirad - Irstea Conclusion

Architecture Informatique de capitalisation Double capitalisation Informatique Thématique Capitalisation des connaissances Dichotomie des modèles métiers et d analyse Meilleure stabilité des modèles Capitalisation des données Dichotomie des données primaires et des indicateurs (données calculées) Evite la «pollution» des bases de données.

Territoires, Environnement, Télédétection et Information Spatiale Unité mixte de recherche AgroParisTech - Cirad - Irstea Merci de votre attention