2-1 2 Serveurs OLAP et introduction au Data Mining
2-2 Création et consultation des cubes en mode client-serveur Serveur OLAP Clients OLAP Clients OLAP
2-3 Intérêt Systèmes serveurs et clients Fonctionnalité de création, d édition, de consultation et d exploitation des cubes On peut définir des permissions Un exemple de langage de communication MDX = Multi-Dimensional Expressions Issu de SQL Permet des opérations spécifiques aux cubes Vues Pliage Dépliage Coupe
2-4 Exemple WITH MEMBER [Measures].[Store Profit Rate] AS '([Measures].[Store Sales]-[Measures].[Store Cost])/[Measures].[Store Cost]', FORMAT= '#.00%' SELECT {[Measures].[Store Cost],[Measures].[Store Sales],[Measures].[Store Profit Rate]} ON COLUMNS, ORDER ([Product].[Product Department].members, FROM Sales WHERE ([Time].[1997])
2-5 Analysis Services Fourni avec Microsoft SQL Server 2000 Permet des créer des serveurs et des clients OLAP Analysis Manager Administration du serveur (on doit appartenir au groupe des Administrateurs OLAP) Création, édition et visualisation des cubes Méthodes de data mining Arbre de décision Classification Permissions = rôles
2-6 Création de cubes avec Analysis Manager Connexion à un serveur OLAP Sources de données Cubes Mesures Dimensions
Connexion à un serveur OLAP 2-7 et création d une nouvelle base de donnée
2-8 Sources de données ODBC Interface OLE DB OLE DB ODBC (SQL) ici : DSN system Foodmart 2000 SQL Server BD Access ici : Foodmart 2000.mdb Oracle OLAP Server BD Access Cl. Excel Fic. texte BD FoxPro
2-9 Rappel : création d un DSN système ODBC Programmes/Outils d Administration/Sources de données (ODBC) DSN System : Foodmart 2000 Pilote Microsoft Access Driver (.mdb) Fichier : \Foodmart 2000.mdb
2-10 Schéma de la base de données (partie)
2-11 Cube Assistants et/ou éditeur Éléments Table de fait Mesures Dimensions
2-12 Editeur de dimensions Partage Propriétés de membres
2-13 Enregistrement du cube Traitement du cube Agrégations pour améliorer la rapidité des requêtes Modes de stockage MOLAP = Multidimensional OLAP (matrices) ROLAP = Relational OLAP (schémas en étoile ou flocon) HOLAP = Hybrid OLAP (mixte)
2-14 Visualisation du cube On peut choisir les lignes et les colonnes On peut préciser les modalités de toutes les autres variables
2-15 Classification (clusters) But = partitionner les cas en classes homogènes et 2 à 2 bien séparées Expliquer les classes Principe si on opère sur un cube (ici sales) On sélectionne la dimension et le niveau définissant les cas (ici Customer/Lname) On sélectionne une ou plusieurs mesures On peut préciser le nombre de classes (rustique!)
2-16 Résultats On peut expliquer les classes avec les propriétés de membres
2-17 Arbres de décision Une variable qualitative Y à expliquer p variables explicatives X, 1, X p qualitatives (pour simplifier) supposées aussi On recherche la variable explicative la plus liée avec Y (on peut considérer un Chi2 normalisé) Elle découpe la population selon ses modalités ; on recommence sur chaque classe Visualisation arborescente du résultat X k1
2-18 Données Principe si on opère sur un cube (ici Sales) On sélectionne la dimension et le niveau définissant les cas (ici Customer/Lname) On sélectionne des propriétés de membre On précise celle qui est à expliquer (ici Member Card) On peut créer une dimension associée à l arborescence et un cube virtuel
2-19 Résultats Globaux
2-20 Résultats Carte golden
2-21 Cube créé
2-22 Visualisation du cube Avec Analysis Manager Avec un Excel Tableau dynamique Données externes Cube OLAP On créé une nouvelle source de données Pilote = Microsoft OLEDB Provider for OLAP Services Connexion au serveur OLAP contenant le cube Intérêt = graphiques dynamiques
2-23 Exploration du réseaux des dépendances Créé à partir de plusieurs analyses Graphe valué de la relation de dépendance Symétrique Asymétrique Permet d extraire les plus fortes valuations