La problématique!" La philosophie #$ % La philosophie &'( ' ) * ) 1
La philosophie +, -) *. Mise en oeuvre Data warehouse ou Datamart /01-2, / 3 13 4,$ / 5 23, 2
* $3 3 63 3 #, 7 Datawarehouse Data warehouse #$8 19 8 :33 (; 681 1( ' Data Warehouse 8 : 3 '3 ; ' (!"# $!" % $ 3
Modélisation des données dans un entrepôt < <2 9= '(> ' 1#4= ) (> ' ) Les différences d objectifs *=%' *= # 1 -(> )33 # %) % 3 %$ %, *1 # 1?4?@ % % Objectif de la construction d un datawarehouse A ) 3 )', 4
Objectifs architecturaux des entrepôts de données #.4 A,(> ) *1 4' (#4/ Caractéristiques communes des entrepôts de données 9 *1( 4 Profil des utilisateurs et leurs besoins :B; <:CDB; <:EDB; / & ' ( ) $ & 5
Développement d un datawarehouse: les différentes phases du projet 11 * * 9 / 1 * #4 / / '. '9? Le modèle dimensionnel F G FG F G FG < 7 Le schéma en étoile 6
Le schéma en étoile Schéma en flocon de neige (snowflake) > $ Les tables de dimensions. 3 1(33 33 7. 3 19 - /11( * 81 :; 7
La dimension temps )118 1 8 $ @ $ @ H$ * :'''' ; Les tables des faits /9 &33?? * 9 ( : ; Les tables de faits (suite) @. & $(1 * 4 *( * 8
Operational Data Store -: ; A '9 I : ) ; Le processus ETL -) #.4. 1 /J *1 2 -.K-)3 :-.K 8 ); Le processus ETL 4/ 4 3 1 3$93 1$,.+1 4 9
Le processus ETL -) '9 <#/) $33 Transformation &:) ; 1:; ' A9 : ( 1; 3 $ Meta données fonctionnelles / A9 L1 / ( /(8 *+,-+* # 10
Meta données techniques '9 /9 4. ) / Normalisation par l OMG *J:* J1 ;8') M:M1;8 1 / 5 3$, 6'3#3<'3 Les objectifs de conception communs /1.(( 11 A8> 1 4) 4) 11
Quelle différence entre l ETL et l EAI? -8= A '9 * #A3 1( Quelle différence entre l ETL et l EAI? Quelle différence entre l ETL et l EAI? -.8 : -A4) ; '1 *2 # 1( ) 12
Quelle différence entre l ETL et l EAI? Le marché ETL en 2001 Le marché ETL en 2001 Other Torrent 0% Embarcadero 1% I-flex Flexcube ETL 1% Data Junction 1% Acta 1% Compuware Information Builders CA Teradata Microsoft ETI IBM Sagent Cognos Hummingbird Oracle SAS Ascential Informatica 2% 2%3% 4% 4% 4% 4% 4% 8% 6% 7% 8% 10% 12% 18% 0% 5% 10% 15% 20% 74 Source: Giga Information Group, Inc. Le marché de l ETL -.N 8 :0* 0*; :/; *7 * -.F :/.3F3 ; #J1 : #-3A. 03 #4; 13
Les outils de l informatique décisionnelle /) )8 '(,((. / ( +& 0 Les outils de l informatique décisionnelle * - :-) ' ; ) 5? -) 95, 8 *':, ); *':, ; Les applications analytiques (OLAP : On line Analytical Processing) ' *) : ; -) * O1( * 0 ' 4 4 14
Les différentes types de modèles OLAP #4: #4; :) 6'*; A#4:#4; :) '; 6#4:6'#4; /#4:/#4; :) #$; (> La ligne de produits Business Objects Produits Utilisateurs BUSINESSOBJECTS Module Utilisateur Reporter Suite complète d outils d aide à la décision Explorer Webi Business Miner C/S Intranet Business Query Data mining Analyse multidimensionnelle Interrogation & Reporting Accès par Excel Interfaces Applicatifs Référentiel RDTs Designer Déploiement rapide Mise en oeuvre Supervisor Administration & sécurité Etats de production Administration Intranet Produits Informaticiens Broadcast Agent Server Webi Server Intégration Un enchaînement naturel des tâches Interrogation Analyse Pourquoi? Quoi? Reporting Tableaux, Graphes, Matrices Permutation d'axes, Analyse en cascade <@8 ' 4 Partage 15
Répondre à la question «Quoi?» Représentation métier Gestion Finance Ventes Données de l'entreprise Client Vendeur Utilisateurs finals Chiffre d Affaires Article Prix A Informaticien. 1( :1 (; Des objets vers le document Traitement sur le serveur SQL Partie prise en charge par BusinessObjects Résultats Représentation Métier CA Région Produit Partie visible par l'utilisateur autonomie par rapport à l'informatique Génération du document Choisir la source de données 16
Les objets de l univers 4' 3$ (!"!"!" #$%&%!" %% ' Exécuter une requête Interface de requête homogène Informations disponibles Informations demandées Conditions.1(( (8,: )1( ;? 85( )% % - Compréhension immédiate des requêtes. 17
Les types de blocs résultat!%& %!%+, %!% *+!% Créer un graphique à partir d un tableau % %!% Répondre à la question «Pourquoi» : le module Explorer de BO Analyse multidimensionnelle intégrée Explorer les données selon les axes d analyse Aller dans des niveaux de détail de plus en plus fins Analyse en cascade Toulouse Lyon Revenus / Région Ville Revenus / ville Marseille Nice 18
Analyse descendante Drill Down % % -!% %%!.+% Analyse ascendante Drill up % % -!%/% Ajouter une dimension à l analyse 19
La ligne de produits Business Objects Produits Utilisateurs BUSINESSOBJECTS Module Utilisateur Reporter Suite complète d outils d aide à la décision Explorer Webi Business Miner C/S Intranet Business Query Data mining Analyse multidimensionnelle Interrogation & Reporting Accès par Excel Interfaces Applicatifs Référentiel RDTs Designer Déploiement rapide Mise en oeuvre Supervisor Administration & sécurité Etats de production Administration Intranet Produits Informaticiens Broadcast Agent Server Webi Server Les nouveautés de la ligne de produits #$/1 *!%! %%.%0 & % 1 2. 3 #$/ :1-.; %0 %( %%. % 4%. %0. 5 2 $% 6.%0.%% 178 % 8%8'3 Les nouveautés de la ligne de produits #$' 7% %# 9 %:% $ * % & %& 8 6.8!% % 8! 8 +;%. %&8. 6 8 20
Un SAD pour quel ROI? /9(PP3 A Q3 ' CB" <01 3 1($) 7 /R$ 1 1$) Exemples de bénéfices dans la grande distribution S ) S ) SA 9 SA (, 3 : (; Le DATA MINING /PP8 T& ( ( 1 2 U -) 33, : V01; 21
Le DATA MINING 1/(' 1 (? /',8 3= :3 4+"1 5667/ / 9 :3);.8 999/ DM ou KDD? F G W0/ /3/3 / G 3-) 3-) G Pourquoi le KDD ou le Data Mining? & : 3; Comment explorer des millions d enregistrements avec des milliers d attributs? Accroissement des réseaux (navigation sur le Web, catalogue on-line, commerce électronique...) seulement 5 à 10 % de données analysées Chaînes de supermarché >= 100 MB de données par jour 22
Data Mining, (1 ( ' //3 5 > &8/J6 /?*1 3? Data Mining 81(,,? > 91'193 (> (? Data Mining -) 98 : ;< =( " > ( 9? @:AVX&X4;Y@:AVX&; 23
Data Mining <9 ( V? 9( 8 1 1 D (((,? '9 )(,,' Data Mining 4 93 )) 9 ), )? P+, 3 ) ) 31" Data Mining *8 :; 4 4, >, 1 81( 24
le Data Mining -) 8 & )! ) 7 @ 3' 3,19 > G Types de connaissances *7) '?<!D C? 4,( 8C? Types de connaissances Quel client a répondu? Envoi du mailing Déterminer les caractéristiques des clients avec le Data Mining Sélection des clients sur la base Résultat : groupement avec une forte probabilité de réponse 25
Types de connaissances Population de Mailing 100 personnes Oui : 31%, Non : 69 % Prob : 97% Cadres 70 personnes Oui : 40 %, Non 60 % Prob : 95% Ouvrier 30 personnes Oui : 10 %, Non : 90 % Prob : 95 % Hommes 50 personnes Oui : 36 %, Non : 64 % Prob : 93 % Femmes 20 personnes Oui : 50 %, Non : 50 % Prob : 93 % Types de connaissances Population de mailing - 350 F 31*100-69*50 Cadres 700 F (70* 40%)*100 - (70*60%)*50 Ouvriers - 1050 F 3 * 100-27 * 50 Hommes 200 F 18 * 100-32 * 50 Femmes 500 F 10 * 100-10 * 50 2%. %0!% Data Mining 48 ( 93, 1'19 )$) ( ) 9 26
Le Data Mining A11 1 9 / 4 4 1(8 0%# 1!%!!% 3 0 ).%0 1+7<= &/+<>?@A 3! Exemples de data mining / 3 9 ( 9,?(@? @./ :(A B(A B( Exemples de data mining (suite) F1) 13(G &3 / ( / A1139 # 9(> 9 9 27
Comparaison des différentes méthodes Le marché du Data Mining 8 Z BD. : ; Le marché du data mining /) / #Z/ /) A1 ' WM-@#$ 28
Les perspectives du décisionnel 1 G / 1L G 3' -A4 *A313 3 CDB$ /01 7 La Business Intelligence $17433* +, :W4; -) 8 ' '1( - 7. A1 - :) J 1 ; / +11 - De nouveaux besoins *4 4 I( : 1 9; 4,$ 9 -A4 29
Les éditeurs pionniers 84 6'84 *8*4. 17 30