Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours



Documents pareils
Entrepôt de données 1. Introduction

Business Intelligence : Informatique Décisionnelle

Workflow/DataWarehouse/DataMining LORIA - Université d automne Informatique décisionnelle - L. Mirtain 1

Bases de Données Avancées

Intelligence Economique - Business Intelligence

Chapitre 9 : Informatique décisionnelle

Ici, le titre de la. Tableaux de bords de conférence

QU EST-CE QUE LE DECISIONNEL?

BUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise

Introduction à l Informatique Décisionnelle - Business Intelligence (7)

Introduction à la B.I. Avec SQL Server 2008

Filière Fouille de Données et Décisionnel FDD (Data Mining) Pierre Morizet-Mahoudeaux

Filière Data Mining (Fouille de données) Pierre Morizet-Mahoudeaux

Les Entrepôts de Données. (Data Warehouses)

LES ENTREPOTS DE DONNEES

Théories de la Business Intelligence

Didier MOUNIEN Samantha MOINEAUX

Urbanisation des SI-NFE107

BI = Business Intelligence Master Data-ScienceCours 3 - Data

La problématique. La philosophie ' ) * )

Introduction à lʼinformatique. Décisionnelle (ID) / Business. Intelligence» (1)

et les Systèmes Multidimensionnels

Plan. Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation

Spécificités, Applications et Outils

Systèmes d information décisionnels (SIAD) Extraction de connaissances (KDD) Business Intelligence (BI)

Les entrepôts de données

Thibault Denizet. Introduction à SSIS

ETL Extract - Transform - Load

Décisionnel & Reporting

Un datawarehouse est un entrepôt de données (une base de données) qui se caractérise par des données :

Les Entrepôts de Données

Petit Déjeuner Pépinière du Logiciel Libre. 25 juin 2008

Datawarehouse: Cubes OLAP. Marlyse Dieungang Khaoula Ghilani

Présentations personnelles. filière IL

TP2_1 DE BUSINESS INTELLIGENCE ISIMA ZZ3 F3

Entrepôts de données. NEGRE Elsa Université Paris-Dauphine

Business & High Technology

L information et la technologie de l informationl

Sécurité des entrepôts de données dans le Cloud Un SaaS pour le cryptage des données issues d un ETL

Fournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement

Le "tout fichier" Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique

BI2 : Un profil UML pour les Indicateurs Décisionnels

Le terme «ERP» provient du nom de la méthode MRP (Manufacturing Ressource Planning) utilisée dans les années 70 pour la gestion et la planification

SQL SERVER 2008, BUSINESS INTELLIGENCE

TP2 DE BUSINESS INTELLIGENCE ISIMA ZZ3 F3

CONCEPTION ET REALISATION D'UN GENERATEUR DE TABLEAUX DE BORD PROSPECTIFS MULTIDIMENSIONNELS

BI = Business Intelligence Master Data-Science

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1

PROGICIELS DE GESTION INTÉGRÉS SOLUTIONS DE REPORTING

Didacticiel Études de cas. Description succincte de Pentaho Data Integration Community Edition (Kettle).

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

BI Open Source Octobre Alioune Dia, Consultant BI

Agenda de la présentation

Programme scientifique Majeure ARCHITECTURE DES SYSTEMES D INFORMATION. Mentions Ingénierie des Systèmes d Information Business Intelligence

Licence Professionnelle en Statistique et Informatique Décisionnelle (S.I.D.)

En synthèse. HVR pour garantir les échanges sensibles de l'entreprise

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données

Big Data On Line Analytics

Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise.

White Paper ADVANTYS. Workflow et Gestion de la Performance

Business Intelligence avec Excel, Power BI et Office 365

HERMES SYSTEM et BEWISE souhaitent vous offrir les meilleures compétences.

République Algérienne Démocratique et Populaire

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar

Introduction: 1. définition d un ETL 2. importance et diversité des données spatiales utilitédes ETL géographiques

Entrepôt de Données. Jean-François Desnos. ED JFD 1

Outils informatiques et l aide à la prise de décision en entreprise

Introduction au domaine du décisionnel et aux data warehouses

Bases de données multidimensionnelles et mise en œuvre dans Oracle

Présentation du module Base de données spatio-temporelles

AXIAD Conseil pour décider en toute intelligence

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)

Méthodologie de conceptualisation BI

Inscriptions : Renseignements : 33 (0) education.france@sap.com

Votre Infrastructure est-elle? Business Intelligence. Améliorer la capacité d analyse et de décision de vos équipes

SGBD et aide à la décision, Aide à la décision

Apprentissage Automatique

Collabora'on IRISA/INRA sur le transfert de nitrates et l améliora'on de la qualité des eaux des bassins versants:

Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP)

La place de la Géomatique Décisionnelle dans le processus de décision

Faculté des Sciences Juridiques Économiques et Sociales Agadir. UFR : Économie et Gestion de l Espace. Pour l obtention du

MASTER OF SCIENCE MANAGEMENT ET CONSEIL EN SYSTEMES D INFORMATION

Projet M1 Sujet 21 : Développement d'un logiciel simplifié de type Business Object

Département de Maine et Loire OASIS. Observatoire d Analyse du Système d Information Stratégique

BI2B est un cabinet de conseil expert en Corporate Performance Management QUI SOMMES-NOUS?

Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining.


Mémoire de fin d études. Thème Conception et réalisation d un Data Warehouse pour la mise en place d un système décisionnel

IMPLEMENTATION D UN SYSTEME D INFORMATION DECISIONNEL

La Business Intelligence pour les Institutions Financières. Jean-Michel JURBERT Resp Marketing Produit

IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21

Data Mining. Vincent Augusto École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto.

Travail de diplôme 2011 Business Intelligence Open Source SpagoBI/Talend Résumé

Evry - M2 MIAGE Entrepôt de données

Le Data Warehouse. Fait Vente. temps produit promotion. magasin. revenu ... Produit réf. libellé volume catégorie poids. Temps jour semaine date ...

MyReport Le reporting sous excel. La solution de business intelligence pour la PME

CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2012

La Geo-Business Intelligence selon GALIGEO avec 26/10/2005 1

La Business Intelligence est-elle adaptée au monde des PME?

Transcription:

Information du cours Informatique décisionnelle et data mining www.lia.univ-avignon.fr/chercheurs/torres/cours/dm Juan-Manuel Torres juan-manuel.torres@univ-avignon.fr LIA/Université d Avignon Cours/TP partagés Juan-Manuel Torres / LIA Université d Avignon juan-manuel.torres@univ-avignon.fr Francois Lentin / Autoroutes du Sud de la France francois.lentin@asf.fr Peter Peinl / Université de Fulda (Allemagne) Data Mining 3 séances théorie Total.. 4.5h 5 séances de TP s Total.. 7.5h 1 Examen... 1h30 Total.. 14h Information du cours Cours : 16 Octobre (IMOD) 18 Octobre (TAIM) Cours : 23 Octobre (IMOD) 19 Octobre (TAIM) Cours : 24 Octobre (IMOD 8 Novembre (TAIM) EXAMEN : 28 Novembre TP1 Introduction a WEKA 26 Octobre (TAIM) 29 Nov (IMOD) TP2 Arbres de décision I 28 Nov (TAIM) 6 Dec (IMOD) TP3 Arbres de décision II 7 Dec (TAIM) 11 Dec (IMOD) TP4 Clusterisation 13 Dec (TAIM) TP5 Prédiction 14 Dec (TAIM) 13 Dec (IMOD) 20 Dec (IMOD) EVALUATION DU COURS Examen Torres... 18% TP s Torres (binôme).. 15% 3 % chaque TP x 5 1 Examen Lentin.. 33% décembre (à confirmer) Examen + TP Peinl... 33 % Data mining (fouille de données) Introduction

Datawarehouse Datawarehouse Lieu de stockage intermédiaire des différentes données en vue de la constitution du système d'information décisionnel est appelé entrepôt de données (datawarehouse). Lieu unique de consolidation de l'ensemble des données de l'entreprises 2004.09 - Transp 7 2004.09 - Transp 8 DataWareHouse (Bill Inmon) «Collection de données thématiques, intégrées, non volatiles et historisées pour la prise de décisions» Caractéristiques : Orienté sujets. Les données collectées sont être orientées «métier» : triées par thème Données intégrées. "Nettoyage" préalable des données est nécessaire : rationnalisation et de normalisation Données non volatiles. Une donnée entrée n'a pas vocation a être supprimée Les données historisées : datées OLAP On-Line Analytical Processing Concept à mi-chemin entre le système d'information pur et les utilisateurs, permettant de faire des simulations OLTP On-Line Transactional Processing Permettre une analyse multidimensionnelle sur des bases de données volumineuses afin de mettre en évidence une analyse particulière des données (il est l'objet d'un questionnement particulier) 2004.09 - Transp 9 Informatique décisionnelle "Business intelligence" Les outils décisionnels (parfois appelé "le décisionnel") Exploitation des données de l'entreprise dans le but de faciliter la prise de décision par les décideurs Compréhension du fonctionnement actuel et l'anticipation des action pour un pilotage éclairé de l'entreprise Basés sur l'exploitation d'un système d'information décisionnel alimenté grâce à l'extraction de données diverses à partir des données de production, d'informations concernant l'entreprise ou son entourage et de données économiques ETL (Extract, Transform and Load) est chargé d'extraire les données dans différentes source, de les nettoyer et de les charger dans un entrepôt de données Des outils d'analyse décisionnelle permettent de modéliser des représentations à base de requêtes afin de constituer des tableaux de bord : reporting 2004.09 - Transp 11 2004.09 - Transp 12

Le multidimensionnel Le n-cube des dimensions 2004.09 - Transp 13 2004.09 - Transp 14 La granularité des dimensions Navigation multidimensionnelle 2004.09 - Transp 15 2004.09 - Transp 16 Les vues d un n-cube 2004.09 - Transp 17 2004.09 - Transp 18

Bilan multidimensionnel DATA MINING (1) Le Datamining ("fouille de données") contrairement à l'analyse multidimensionnelle a pour but de mettre en évidence des corrélations éventuelles dans un volume important de données dégager des tendances 2004.09 - Transp 19 DATA MINING (2) Le datamining s'appuie sur des techniques d'intelligence artificielle afin de mettre en évidence des liens cachés entre les données Apprentissage de Machine Arbres de décision Réseaux de neurones Support Vector Machines (SVM) Méthodes de regroupement et clusterisation 2004.09 - Transp 21 2004.09 - Transp 22 Domaines d utilisation Mécanismes de base 2004.09 - Transp 23 2004.09 - Transp 24

Exemple : analyse linéaire Méthodes 2004.09 - Transp 25 2004.09 - Transp 26 Classification Reglès associatives 2004.09 - Transp 27 2004.09 - Transp 28 Lexique SEMMA (SAS) 2004.09 - Transp 29 2004.09 - Transp 30