Introduction Phases du projet Les principales phases du projet sont les suivantes : La mise à disposition des sources Des fichiers Excel sont utilisés pour récolter nos informations L extraction des données Les données sont extraites avec un ETL L organisation des données Les données vont ensuite être chargées dans un entrepôt de données La restitution des données On va générer des cubes de données à partir de l entrepôt pour ensuite les interroger La visualisation des données A l aide d une interface web, le client accède aux rapports et aux études Restitution La partie restitution va donc faire le lien entre l entrepôt de données et nos cubes de données. On va passer d un schéma relationnel classique à des données agrégées qui forment nos cubes de données. Chaque axe de ce cube représente une variable (exemple : des régions, des années, des gammes de produits ), l intersection de ces axes forment nos données agrégées. L entrepôt de données et le moteur OLAP sont complémentaires et permettent de fournir un socle pour restituer nos données. Les intérêts d une telle solution sont multiples : Analyser nos données pour générer de la connaissance (avec par exemple l utilisation de différents niveaux d agrégation comme Région<Département<Pays ou Semaine<Mois<Année) Fournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement Supporter de gros volumes de données Le deuxième volet de la partie restitution va correspondre à l utilisation de SAS afin de réaliser les études qui peuvent être commandées par un chef de produit. Lors d une étude, des statistiques complémentaires peuvent être faites sous SAS (page 109, 119, 125 du SFD), le logiciel final doit pouvoir s interfacer avec SAS pour exporter nos données. Le chef de produit peut ensuite traiter ces données pour réaliser des analyses (scoring, ACP, régression ) et importer les résultats dans l étude du logiciel (des schémas par exemple). La dernière partie de la restitution concerne l interface graphique de l application ainsi que les tableaux de bords générés.
Interface de restitution Client léger / serveur lourd On utiliserait un client léger sous forme d exécutable (sans installation) afin de se connecter au serveur d application pour utiliser les fonctionnalités du logiciel. Cependant, cette solution ne semble pas convenir au résultat attendu. Le projet requière un portail web (p 145 et 146 du SFD), on devra donc se diriger vers un site web classique où le client se connecterait. Serveur + navigateur web On utiliserait un portail web (site web) qui nous permettrait de communiquer avec le serveur d application. Différents langages de programmation sont possibles tels que : Java (servlet + beans) PHP ASP Ce portail web devra permettre la visualisation de nos tables de données, de graphiques, l authentification des utilisateurs, l impression de rapports en PDF/.doc... Points forts PHP ASP.Net J2EE Gratuit et simple Bénéficie d un framework très Très complet Facile à mettre en place puissant Utilisable sur Windows ou Linux Points faibles Peu adapté à de gros projets Compliqué Nécessité d avoir un serveur IIS Lourd à mettre en place Le module SAS/INTRNET permet d utiliser SAS à partir d une application web (CGI ou Java). On peut donc l utiliser quelque que soit le langage de programmation retenu. Pour une comparaison entre.net / J2EE : http://www.alexandremorel.fr/netvsj2e/dotnet-j2ee.pdf
OLAP : SQL Server et son composant SSAS Microsoft SQL Server 2008 fournit à la fois un système de gestion de base de données et une plateforme décisionnelle complète (ETL, OLAP et Datamining, Reporting). Pour ce projet, nous pouvons utiliser SQL Server 2008 gratuitement dans le cadre du programme MSDNAA. Cependant, l utilisation réelle de SQL Server pour le groupe Darties nécessiterait l achat de licences. SQL Server propose l outil SQL Server Analysis Services (SSAS), jugé par Microsoft comme l un des moteurs OLAP les plus performants du marché. La version 2008 offre 3 modes de stockage : MOLAP : Stockage en mode Multidimensional (avec ProActive Cache) ROLAP : Stockage dans la BDD relationnelle HOLAP (Hybrid OLAP) : Combinaison de MOLAP et ROLAP. L assistant crée automatiquement les cubes à partir des sources de données. Les données peuvent provenir d autres SGBD que SQL Server (Oracle par exemple). L assistant permet de créer des agrégats de façon automatique dans les cubes. Les cubes peuvent être mis à jour de manière automatique. Concernant l accès aux données des cubes, Analysis Services fournit plusieurs interfaces d accès aux données pour les applications clientes. Avantages: Solution de BI complète dans la même boîte que le serveur de base de données SQL Server 2008 Facilité d installation et d utilisation (Interface graphique puissante, assistants...)
Solution très performante Inconvénients: Fonctionne uniquement sur Windows Liens utiles : Offre BI de SQL Server : http://download.microsoft.com/download/9/2/5/925675cf-8209-4b23-8e55-40d2b56d3314/sqlserver2008_bi.pdf http://www.opteems.com/actualites/7-actualites/24-loffre-bi-business-intelligence-microsoft-sql-server-2008.html Coûts Licences : http://blogs.codes-sources.com/christian/archive/2009/04/24/sql-server-2008-liste-de-prix-et-d-tails-des-ditions.aspx Nouveautés Version 2008 : http://blogs.msdn.com/b/lbanon/archive/2010/01/09/sql-server-analysis-services-quoi-de-neuf-dans-la-boite.aspx Tutoriel d utilisation / Cours : http://ftp-developpez.com/taslimanka/analysisservices2005.pdf http://www.prism.uvsq.fr/users/karima/enseignement/bd_licencepro/sid%20option/cours/ssas.pdf
OLAP : Oracle Oracle dispose de fonctionnalités OLAP aussi bien dans sa version 10g que 11g. Les deux sont disponibles gratuitement sur le site web d Oracle : http://www.oracle.com/technetwork/database/enterprise-edition/downloads/index.html Le module OLAP est embarqué dans la version 11g d Oracle. Une fois installé avec ce module, il suffit d utiliser des outils comme Oracle SQL Developper pour faire nos requêtes OLAP (SQL pur). Après installation, on peut également installer des outils fournis par Oracle pour gérer nos cubes et faciliter la création de nos requêtes avec par exemple Analytic Workspace Manager (AWM) ou Warehouse Builder (OWB). Cela nous permet de créer et gérer nos requêtes et cubes OLAP plus facilement. AWM semble plus facile d utilisation mais ne permet pas les fonctionnalités les plus avancées par rapport à OWB. D autres outils permettent également de générer des rapports et des tableaux de bord tels que : Oracle Application Express Oracle Business Intelligence Publisher Avantages : Tout peut être téléchargé et installé gratuitement pour les logiciels Oracle Tout est intégré autour d une solution plus complète : on a la BDD Oracle + les outils Oracle pour gérer OLAP dans le même pack De nombreux outils autour de Oracle 10/11g pour utiliser OLAP Inconvénients : Il faut que la BDD soit celle d Oracle pour pouvoir utiliser les différents clients OLAP (AWM/ OWB). Installation conséquente : près de 2 Go juste pour Oracle 11g Comment interfacer ces différents outils avec notre logiciel? On pourrait à la limite utiliser certains outils pour faciliter la création de requêtes et la visualisation de nos cubes de données, mais on ne pourra passer que par des requêtes SQL en utilisant le portail web Liens utiles : Oracle en général : http://www.techno-science.net/?onglet=glossaire&definition=7708 Tutoriaux OLAP / Oracle : http://www.oracle.com/technetwork/database/options/olap/index.html Oracle SQL Developper : http://www.oracle.com/technetwork/developer-tools/sql-developer/overview/index.html Wiki Oracle OLAP : http://wiki.oracle.com/page/olap+option+just+give+me+the+software Créer des tableaux de bords : http://download.oracle.com/docs/cd/b28359_01/olap.111/b28124/reports.htm#chddddjb
Autres solutions OLAP D autres solutions OLAP permettant le reporting sont également présentes même si nous devrons choisir une solution Open Source. On peut citer les principales telles que : Clickview, téléchargeable en ligne dans une version d essai. Permet de faire du reporting, des tableaux de bords, se déploie via le web SAS Enterprise BI Server qui est une plateforme décisionnelle pouvant intégrer aussi bien la partie ETL, OLAP ou le reporting. Est compatible avec Microsoft BI. Dundas Data Vizualisation. Est compatible avec Sharepoint,.NET, SQLServer Reporting Services Liens généraux Concepts d OLAP R-OLAP et M-OLAP Pourquoi OLAP Essbase OLAP en général Conclusion SAS permet grâce à son module SAS/INTRNET d être utilisé avec n importe quelle solution web. Pour répondre au cahier des charges, il faudrait développer un site web en choisissant parmi le PHP, l ASP et J2EE, avec pour chacun leur serveur respectif. Suivant le langage retenu, toutes les solutions OLAP Open Source ne pourront pas forcément être retenues, même si ce n est vrai que pour quelques unes. L idéal serait de prendre une solution OLAP qui provienne du même éditeur que la BDD comme Oracle ou SQL Server. Oracle semble bénéficier de nombreux outils et tutoriels sur ce sujet. La partie Restitution peut se décomposer en 3 sous-parties : - SAS pour l analyse prédictive - Interface graphique pour le reporting et les tableaux de bord - Requêteur OLAP