Travail de diplôme 2011 Business Intelligence Open Source SpagoBI/Talend Résumé



Documents pareils
TP2_1 DE BUSINESS INTELLIGENCE ISIMA ZZ3 F3

TP2 DE BUSINESS INTELLIGENCE ISIMA ZZ3 F3

BI Open Source Octobre Alioune Dia, Consultant BI

Projet Ecureuil DataWarehouse CNIP. ETL avec Talend. Travail de diplôme Yannick Perret. Responsable de projet: Sylvie Bouchard

Sécurité des entrepôts de données dans le Cloud Un SaaS pour le cryptage des données issues d un ETL

Introduction à la B.I. Avec SQL Server 2008

Département Génie Informatique

Thibault Denizet. Introduction à SSIS

Le "tout fichier" Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique

Business Intelligence avec Excel, Power BI et Office 365

Construction d un environnement destiné à l'aide au pilotage

Cahier des charges de l application visant à effectuer un suivi de consommation énergétique pour les communes. Partenaires du projet :

BUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise

Analyse comparative entre différents outils de BI (Business Intelligence) :

Fournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement

L INTELLIGENCE D AFFAIRE DANS LA VIE QUOTIDIENNE D UNE ENTREPRISE

Petit Déjeuner Pépinière du Logiciel Libre. 25 juin 2008

SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...)

CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2012

Business & High Technology

SQL SERVER 2008, BUSINESS INTELLIGENCE

Catalogue Formation «Vanilla»

Business Intelligence avec SQL Server 2012

Bases de Données Avancées

La problématique. La philosophie ' ) * )

Urbanisation des SI-NFE107

Business Intelligence Reporting

Solutions SAP Crystal

INTRODUCTION A LA B.I AVEC PENTAHO BUSINESS ANALYTICS Formation animée par

SQL Server SQL Server Implémentation d une solution. Implémentation d une solution de Business Intelligence.

Pentaho : Comparatif fonctionnel entre la version Communautaire (gratuite) et la version Entreprise (payante) Table des matières

Projet M1 Sujet 21 : Développement d'un logiciel simplifié de type Business Object

BUSINESS INTELLIGENCE

Didier MOUNIEN Samantha MOINEAUX

CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2014

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)

Principe, applications et limites

I. Instalation de l environnement JDK et JRE : II. Configuration outil Reporting : Pentaho... 4

ANTICIPEZ ET PRENEZ LES BONNES DÉCISIONS POUR VOTRE ENTREPRISE

Les entrepôts de données

Les Entrepôts de Données

APPEL D OFFRE. Projet décisionnel. Juillet 2011

OLAP : Mondrian + Pentaho. Maguelonne Teisseire Hugo Alatrista Salas hugo.alatrista- salas@teledetec9on.fr Flavien Bouillot

Business Intelligence

Business Intelligence

LE SECTEUR DU DECISIONNEL : LA NOUVELLE CIBLE DE MICROSOFT?

Echapper légalement à l impôt sur les données

BI = Business Intelligence Master Data-Science

MyReport, LE REPORTING SOUS EXCEL

Business Intelligence avec SQL Server 2012 Maîtrisez les concepts et réalisez un système décisionnel

RMLL Présentation Activité Pentaho

BUSINESS INTELLIGENCE

L offre décisionnel IBM. Patrick COOLS Spécialiste Business Intelligence

MYXTRACTION La Business Intelligence en temps réel

HERMES SYSTEM et BEWISE souhaitent vous offrir les meilleures compétences.

Projet CASI: Master Data Management

LES ENTREPOTS DE DONNEES

Business Intelligence avec SQL Server 2014 Maîtrisez les concepts et réalisez un système décisionnel

JEDOX FACTSHEETS SELF-SERVICE BUSINESS INTELLIGENCE, ANALYTICS & PERFORMANCE MANAGEMENT

Vers une vraie alternative du libre dans les logiciels d aide à la décision (BI)

BUSINESS INTELLIGENCE

JASPERSOFT : Répondre à la demande croissante face à un reporting de plus en plus complexe.

Méthodologie de conceptualisation BI

27 janvier Issam El Hachimi Ludovic Schmieder

Didacticiel Études de cas. Description succincte de Pentaho Data Integration Community Edition (Kettle).

Suite Jedox La Business-Driven Intelligence avec Jedox

SQL Server Installation Center et SQL Server Management Studio

IMPLEMENTATION D UN SYSTEME D INFORMATION DECISIONNEL

Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise.

Démos Reporting Services Migration vers SQL2008

La Business Intelligence est-elle adaptée au monde des PME?

SQL Server 2012 et SQL Server 2014

Chapitre 9 : Informatique décisionnelle

Curriculum Vitae. GISBERT Aurélien Ingénieur Informatique INSA Senior Business & Data Analyst Business Intelligence 11 ans d expérience

Business Intelligence : Informatique Décisionnelle

Introduction à ORACLE WAREHOUSE BUILDER Cédric du Mouza

Formations QlikView / Business Intelligence

WHITE PAPER Une revue de solution par Talend & Infosense

Mercredi 15 Janvier 2014

ORACLE DATA INTEGRATOR ENTERPRISE EDITION - ODI EE

Filière Fouille de Données et Décisionnel FDD (Data Mining) Pierre Morizet-Mahoudeaux

MyReport, une gamme complète. La Business Intelligence en toute simplicité : Concevez, partagez, actualisez! pour piloter votre activité au quotidien.

et les Systèmes Multidimensionnels

SOMMAIRE Thématique : Systèmes d'information et d'exploitation

LES NOUVEAUTES DE COST AND PROFITABILITY MANAGEMENT 8.1

Présentation du module Base de données spatio-temporelles

UE 8 Systèmes d information de gestion Le programme

QU EST-CE QUE LE DECISIONNEL?

MANAGEMENT DES SERVICES INFORMATIQUES

BI2 : Un profil UML pour les Indicateurs Décisionnels

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

La Business Intelligence en toute simplicité :

Formations 2015 JASPER, REDMINE, TABLEAU, TALEND, SPAGO BI SYNALTIC 24 RUE DE L EGLISE VINCENNES

FOIRE AUX QUESTIONS ACT! 2009

Entrepôt de données 1. Introduction

Urbanisme du Système d Information et EAI

Travail de diplôme 2005

_L'engagement qui fait la différence BUSINESS INTELLIGENCE DATA WAREHOUSING PILOTAGE DE LA PERFORMANCE

Pourquoi IBM System i for Business Intelligence

Transcription:

ESNE Travail de diplôme 2011 Business Intelligence Open Source SpagoBI/Talend Résumé I.Cirillo 2010-2011

Introduction Le laboratoire de base de données de l ESNE a mis en place, il y a quelques années, un data warehouse (projet Ecureuil) permettant au CNIP (Centre Neuchâtelois d Intégration Professionnelle) de recueillir des informations concernant la formation pour adultes et à obtenir des rapports de synthèse sous la forme de tableaux croisés dynamiques Excel. Ce projet de data warehouse développé avec SQL Server 2005 est actuellement en production. Mon travail de diplôme à consisté à réécrire une partie de ce projet de data warehouse avec des outils open source. Je me suis concentré sur les procédures ETL (Extract Transform Load) ayant comme tâche le chargement de ce nouveau data warehouse. Ce travail a été précédé par une phase de recherche qui a permis de faire un choix entre les outils de Business Intelligence open source présents sur le marché. Ce choix a été fait pendant la réalisation de mon travail de laboratoire. Les outils retenus ont été «Talend Open Studio» pour le développement des procédures ETL et «SpagoBI» comme plateforme décisionnelle. Le serveur de bases de données utilisé a été PostgreSQL. Le projet de data warehouse du CNIP Le projet Ecureuil du CNIP repose sur une application MSAccess attachée à une base de données relationnelle SQL Server 2005. Ce projet inclut un data warehouse qui est peuplé à partir de la base de données de production grâce aux services SSIS (SQL Server Integration Services), intégrés dans SQL Server 2005, permettant de créer des lots ETL qui extraient, transforment et transfèrent les données depuis la base de production vers le data warehouse. Une fois les données transférées, elles sont prêtes à l utilisation. Les services SSAS (SQL Server Analysis Services), eux aussi intégrés à SQL Server 2005, utilisent ces données pour générer des cubes OLAP (Online Analytical Processing) qui seront, à leur tour, interrogés par les gestionnaires du CNIP à des fins statistiques et décisionnelles à l aide de tableaux croisés dynamiques construits dans Excel. I.Cirillo - 28/06/2011 2/5

Voici une représentation du projet de data warehouse en production au CNIP : 1 2 3 4 5 Figure 1 : Projet de data warehouse du CNIP 1. L application Access utilise la base de données de production pour stocker ses données. 2. Les données sont transférées dans la StagingArea à l aide des services SSIS. La Staging Area est une base de données intermédiaire dans laquelle les données sont dénormalisées. 3. Les données dénormalisées sont transférées dans le data warehouse. 4. Les cubes d analyse, qui seront interrogés par les utilisateurs finaux, sont créés et remplis avec les données du data warehouse. 5. Les cubes sont interrogés à l aide d Excel qui envoient des requêtes XMLA (XML for Analysis) au moteur d analyse SSAS. Le projet de data warehouse open source Pour la réalisation du projet open source, un serveur d application Tomcat a dû être installé, dans lequel sont déployées les applications de Business Intelligence qui remplacent les services SSIS et I.Cirillo - 28/06/2011 3/5

SSAS de SQL Server. De plus, le fait d avoir retenu la plateforme décisionnelle SpagoBI fait que ces applications sont incluses dans cette plateforme. Cela permet de centraliser les différentes applications en les rendant mieux gérables et tout le projet gagne entre autre, en maintenabilité et en évolutivité. Voici le schéma représentant le projet de data warehouse en open source : 1 2 3 4 5 6 Figure 2 : Projet de data warehouse en open source 1. L application Access utilise la base de données de production pour stocker ses données. 2. Les données sont transférées dans la StagingArea (base de données PostgreSQL) à l aide des procédures ETL mises en place avec Talend Open Studio. 3. Les données dénormalisées sont transférées dans le data warehouse. 4. Le data warehouse est interrogé par le serveur d analyse Mondrian afin d obtenir les données demandées et les envoyer à JPivot (5) qui permettra leur affichage dans le browser des utilisateurs finaux (6). Mon travail de diplôme s est concentré sur la partie ETL (points 2 et 3). La partie Mondrian / JPivot n a pas été réalisée mais des idées ont quand même été développées sur ce sujet. Le schéma montre donc aussi le travail prévu pour la suite. I.Cirillo - 28/06/2011 4/5

1.1 Conclusion Ce travail de diplôme, comme aussi le travail de laboratoire qui l a précédé, m ont permis d explorer un monde dont j ignorais presque l existence et qui s est révélé extrêmement intéressant : le monde de l informatique décisionnelle. De plus, c est un domaine qui est en pleine évolution et qui acquiert toujours plus d importance. J aurais bien voulu aller plus loin dans la réalisation de ce projet et pouvoir m occuper aussi des parties concernant la mise en place du serveur d analyse et des requêtes pour la construction des tableaux croisés dynamiques avec Jpivot mais le volume de connaissances que j ai dû acquérir pour prendre en main un outil comme Talend Open Studio et pour déployer une plateforme comme SpagoBI a demandé une quantité considérable de temps. De plus, le nombre de difficultés rencontrées par rapport à la migration même du projet, par exemple le passage d une base de données SQL Server vers une base PostgreSQL, ont représenté un frein au développement du projet. Même si dans certains cas j ai pu réutiliser des éléments d anciens travaux de diplôme, j ai dû toujours les vérifier et souvent les modifier afin de corriger des problèmes ou tout simplement d améliorer les performances. Au final, je suis satisfait du travail réalisé et heureux d avoir eu l occasion de participer au développement d un projet de data warehouse utilisant des technologies open source. I.Cirillo - 28/06/2011 5/5