Décisionnel. solutions open source. Livre blanc
|
|
|
- Gabriel Moreau
- il y a 10 ans
- Total affichages :
Transcription
1 Livre blanc Décisionnel solutions open source N. Richeton - Consultant Patrice Bertrand Directeur des Opérations Version 0.9 le 25 août 2006 Pour plus d information : Tél : Mailto : [email protected]
2 Page 2 PREAMBULE Smile Fondée en 1991, Smile est une société d ingénieurs experts dans la mise en œuvre de solutions Internet et intranet. Smile compte 110 collaborateurs. Le métier de Smile couvre trois grands domaines :! La conception et la réalisation de sites Internet haut de gamme. Smile a construit quelques uns des plus grands sites du paysage web français, avec des références telles que Cadremploi ou Explorimmo.! Les applicatifs Intranet, qui utilisent les technologies du web pour répondre à des besoins métier. Ces applications s appuient sur des bases de données de grande dimension, et incluent plusieurs centaines de pages de transactions. Elles requièrent une approche très industrielle du développement.! La mise en œuvre et l intégration de solutions prêtes à l emploi, dans les domaines de la gestion de contenus, des portails, du commerce électronique, du CRM et du décisionnel.
3 Page 3 Quelques références de Smile Intranets - Extranets - Société Générale - Caisse d'épargne - Bureau Veritas - Commissariat à l'energie Atomique - Visual - Vega Finance - Camif - Lynxial - RATP - AMEC-SPIE - Sonacotra - Faceo - CNRS - AmecSpie - Château de Versailles - Banque PSA Finance - Groupe Moniteur - CIDJ - CIRAD - Bureau Veritas - Ministère de l Environnement - JCDecaux - Ministère du Tourisme - DIREN PACA - SAS - Institut National de l Audiovisuel - Cogedim - Ecureuil Gestion - IRP-Auto - AFNOR - Conseil Régional Ile de France - Verspieren - Zodiac OSEO - Prolea - Conseil Général de la Côte d Or - IPSOS - Bouygues Telecom - Pimkie Diramode - Prisma Presse - SANEF - INRA Internet, Portails et e-commerce - cadremploi.fr - chocolat.nestle.fr - creditlyonnais.fr - explorimmo.com - meilleurtaux.com - cogedim.fr - capem.fr - editions-cigale.com - hotels-exclusive.com - souriau.com - pci.fr - gdf.fr/presse - dsv-cea.fr - egide.asso.fr - osmoz.com - spie.fr - nec.fr - sogeposte.fr - metro.fr - stein-heurtey-services.fr - bipm.org - buitoni.fr - aviation-register.com - cci.fr - schneider-electric.com - calypso.tm.fr - inra.fr - cnil.fr - longchamp.com - aesn.fr - Dassault Systemes 3ds.com - croix-rouge.fr - worldwatercouncil.org - projectif.fr - editionsbussiere.com - glamour.com - fratel.org - tiru.fr - faurecia.com - cidil.fr - prolea.fr - ETS Europe - ecofi.fr - credit-cooperatif.fr - odit-france.fr - pompiersdefrance.org - watermonitoringaliance.net - bloom.com - meddispar.com - nmmedical.fr - medistore.fr - Yves Rocher - jcdecaux.com - cg21.fr - Bureau Veritas veristar.com - voyages-sncf.fr - eurostar.com - AON conseil - OSEO - cea.fr - eaufrance.fr - banquepsafinance.com - nationalgeographic.fr - idtgv.fr - prismapub.com - Bouygues Construction - Hachette Filipacchi Media Applications métier - Renault - Le Figaro - Sucden - Capri - Libération - Société Générale - Ministère de l Emploi - CNOUS - Neopost Industries - ARC - Laboratoires Merck - Egide - Bureau Veritas - ATEL-Hotels - Exclusive Hotels - Ministère du Tourisme - Groupe Moniteur - Verspieren - Caisse d Epargne - AFNOR - Souriau - MTV - Capem - Institut Mutualiste Montsouris - Dassault Systemes - Gaz de France - CFRT - Zodiac - Croix-Rouge Française Systèmes documentaires Xml - Centre d Information de la Jeunesse (CIDJ) - Pierre Audoin Consultants - EDF R&D
4 Page 4 Ce livre blanc Après avoir raflé la mise sur des marchés entiers, tels que la gestion de contenus, les portails, ou les frameworks de développement, l open source s attaque depuis quelques années à une nouvelle gamme d outils : l aide à la décision, avec des solutions qui sont aujourd hui d une grande maturité et en progrès rapide. Comme les autres livres blancs publiés par Smile, cet ouvrage s efforce de réunir :! Une approche générale de l informatique décisionnelle, ses concepts, ses champs d application, ses besoins spécifiques.! Un recensement des meilleurs outils open source dans le domaine du décisionnel.! Une présentation assez complète de ces outils, de leurs forces, de leurs limites, de leur maturité et de leur aptitude à satisfaire des besoins opérationnels. Cette étude est fondée sur quatre mois de travail de recherches, de déploiements effectifs, et de mises en œuvres opérationnelles.
5 Page 5 SOMMAIRE PREAMBULE... 2 SMILE...2 QUELQUES REFERENCES DE SMILE...3 CE LIVRE BLANC...4 SOMMAIRE... 5 PRINCIPES... 6 L AIDE A LA DECISION...6 GENERATEUR D ETATS...7 LES GRAPHIQUES...8 L INTERACTIVITE...9 L ANALYSE MULTI-DIMENSIONNELLE...10 LA CONSOLIDATION DES DONNEES...14 LES PRINCIPES DE L ETL...16 LE TABLEAU DE BORD...17 LE DATA MINING...18 LES COMPOSANTS DECISIONNELS KETTLE...19 JFREECHART...24 BIRT...26 JASPERREPORTS...30 JFREEREPORT...37 MONDRIAN...41 JPIVOT...41 PALO...44 JPALO...45 WEKA...47 LES PLATEFORMES DECISIONNELLES PENTAHO...49 SPAGO BI...58 JASPER INTELLIGENCE...64 MARVEL IT...66 PHP ET.NET...69 CONCLUSION... 70
6 Page 6 PRINCIPES L aide à la décision Le chiffre d affaire a baissé en octobre. Pour y remédier, des décisions sont à prendre. Mais pour prendre la bonne décision, il faut savoir pourquoi le chiffre d affaire a baissé, et d abord comment il a baissé. Dans quelle gamme de produits? Dans quels pays, quelles régions? Dans le portefeuille de clientèle de quels commerciaux? Dans quel segment de distribution? N avait-on pas une baisse semblable en octobre chaque année? Les questions sont nombreuses, auxquelles il faut savoir répondre avant de prendre la bonne décision. On appelle «aide à la décision», ou bien «le décisionnel», ou encore «business intelligence», un ensemble de solutions informatiques permettant l analyse des données de l entreprise, afin d en dégager des informations qualitatives nouvelles, qui seront la base de décisions, qu elles soient tactiques ou stratégiques. Une entreprise moderne brasse dans son système d information d immenses volumes de données, mais bien souvent, du fait même du volume trop important, il est très difficile de donner un sens à ces données, de comprendre ce qu elles expriment : des tendances sous-jacentes, des faiblesses ou des forces cachées, toutes choses que l on devrait connaître pour prendre de bonnes décisions. Ainsi, les outils d aide à la décision, avant d aider la décision, aident d abord à analyser les données afin de déceler des informations macroscopiques cachées dans de gros volumes de données.
7 Page 7 Générateur d états Un état, en informatique, un rapport (report en anglais), est la présentation de données de manière synthétique et lisible, généralement à des fins d impression. L état fait apparaître des tableaux de chiffres, en gérant entêtes, empieds, sous-totaux, etc. Un générateur d états est un programme qui permet de définir un état selon ses besoins, avec un minimum de programmation, uniquement au moyen d une interface interactive. Une fois défini, l état peut être généré puis imprimé à échéance régulière. Un état peut dépendre de paramètres : l année, le mois, la région, la branche d activité, etc Ainsi, un même état qui aura été défini une fois, pourra être généré en différentes variantes, selon la valeur prise par quelques paramètres. Les paramètres de l état pourront être renseignés par l utilisateur selon ses souhaits, et il pourra également faire varier ces paramètres pour affiner sa recherche. Dans d autres cas, les paramètres sont définis automatiquement par des règles de gestion, par exemple pour adresser à chaque commercial l état de ses propres ventes du mois. On peut donc distinguer deux phases dans la génération d un état :! Une phase de conception initiale, qui requiert le plus souvent une expertise spécifique, et n est pas entre les mains de l utilisateur final ;! Une phase de paramétrage et de production, qui ne requiert plus d expertise et peut être sous le contrôle de l utilisateur final. Bien sûr, on aimerait limiter la première phase, qui est la plus coûteuse, et mettre directement des outils de conception entre les mains des utilisateurs. Mais l expérience montre que c est rarement possible : même si l apprentissage est possible, les utilisateurs ont en réalité d autres priorités.
8 Page 8 Les graphiques La représentation visuelle des données est un des outils les plus efficaces pour aider à y déceler les informations qualitatives qu elles portent : tendances, comparaisons, répartitions. Ainsi, l une des catégories d outils du décisionnel est celle des générateurs de graphes. Comme chacun a pu les voir déjà, que ce soit dans Excel ou dans des magazines, il existe quelques familles de graphes, et un très grand nombre de variantes de présentation. Les familles les plus connues sont les histogrammes, les camemberts, les courbes, mais aussi les graphes radars. Du point de vue informatique, un graphe est un objets paramétrables, dont on définit les propriétés (jeux de données bien sûr, mais aussi couleurs, largeur de trait, forme des traits, échelles, fonds, titres, légendes, étiquettes de données, etc), et qui produit une représentation visuelle du graphe, une image. Il suffit de jouer un peu avec les graphes de Excel par exemple pour avoir un aperçu de l immense latitude de paramétrage d un objet graphique. Au niveau le plus bas, les graphes sont des objets de programmation, qui peuvent être utilisés et configurés par un programme. Il existe ainsi des bibliothèques de d objets graphes, disponibles dans différents environnements de développement. L objet graphe est donc un composant informatique à l usage du programmeur, qui l intègrera à ses programmes, et définira tous ses paramètres de fonctionnement. Les générateurs d états, dont nous avons parlé plus haut, incluent pour certains des objets graphes. La définition de l état permet de manipuler à la fois des tableaux de données, et des graphes, qui sont placés dans l état, puis configurés de manière interactive.
9 Page 9 L interactivité On peut distinguer deux modes de travail en décisionnel : le mode rapport et le mode interactif. Ils correspondent à des besoins différents, et parfois complémentaires :! Obtenir une information récurrente, correspondant à une analyse prédéfinie, par exemple la décomposition des ventes par région ;! Chercher une information en effectuant différentes analyses successives, les résultats de l une amenant des questions nouvelles, qui demandent une nouvelle restitution de données. Les outils peuvent être en partie les mêmes, mais il y a aussi des différences de fond :! Les analyses récurrentes sont préparées en amont. Leur paramétrage peut nécessiter l intervention d experts. Une fois préparés, ils seront produits régulièrement, de manière quasi-automatisée.! A l inverse, les analyses interactives doivent être sous le contrôle de l utilisateur final, qui n est plus simplement consommateur d analyse, mais en devient le principal acteur, sans être pour autant un expert des outils décisionnels. Cela implique que les outils intervenant dans ces analyses doivent être d une grande simplicité d emploi, autant dans les concepts fonctionnels que dans la configuration technique.
10 Page 10! Enfin, l analyse interactive requiert aussi d excellents temps de réponse, pour permettre à l utilisateur de tâtonner en direct en affinant son analyse. L analyse multidimensionnelle L analyse multi-dimensionnelle est l un des modes d analyse les plus courants dans le décisionnel. Essayons d en donner les grands principes. On dispose de jeux d informations élémentaires, généralement en grands volumes, chaque ligne d information étant caractérisée par :! Des attributs qualifiant l information! Des grandeurs portant une information quantitative Pour être concrets, prenons l exemple suivant, très classique même s il est très simplifié. Considérons l entité élémentaire qui est la ligne de facture. C est souvent une entité clé dans une entreprise, l information la plus fine dont on dispose par rapport aux processus de vente. La ligne de facture appartient à une facture et porte sur la vente d un produit, dans une quantité donnée, pour un prix donné à un client donné. Elle porte en elle différents attributs : une indication de produit, une quantité, un prix unitaire, un prix total. Au travers de la facture à laquelle la ligne appartient, on dispose d autres informations : une référence de client, une date (année, mois, jour). Sur le client lui-même, on possède d autres informations : pays, région, type de client, secteur de métier, etc Par ailleurs, le client est peut-être affecté à un collaborateur du commerce.
11 Page 11 Nous nous arrêterons ici pour cet exemple, mais l on voit bien que l on peut pousser très loin cette collecte d information gravitant autour de l entité la plus élémentaire qu est la ligne de facture. Une première étape est donc la réunion de toutes les informations nécessaires à nos analyses. Ici, les informations sont par exemple :! Date (année, mois, jour)! Produit! Famille de produits! Client! Pays du client! Commercial " Quantité " Prix Les premières informations constituent les axes potentiels d analyse, les deux dernières constituent les grandeurs. Dans l analyse multi-dimensionnelle, la modélisation relationnelle de départ n est pas la plus pertinente, ni la plus efficace. On préfère généralement dénormaliser la base, c est à dire travailler sur une table unique dans laquelle ont été rassemblées toutes les informations utiles.
12 Page 12 Dans notre cas, on obtient : Date Produit Segment Famille Client Pays Ccal Quantité Prix 31/03/ Tondeuse Jardinage Castorama France Lepaul /03/ Perceuse Outillage Castorama France Lepaul /04/ Tondeuse Jardinage LeroyMerlin Italie Legrand Etc On remarque bien sûr qu il y a énormément de redondance dans ce tableau, mais finalement il est plus utile ici de gérer de l information redondante mais simple, et l on ne s occupe pas des problèmes de cohérence et d intégrité qui sont du domaine des systèmes d information. L étape suivante consiste à faire un premier niveau d agrégation, c est à dire à réunir certaines lignes. Dans notre cas, on peut faire par exemple l hypothèse que les données ne seront pas utilisées au niveau de la référence produit, mais uniquement par segment. Dans ce cas, on réunira toutes les lignes identiques pour la clé (date, segment, famille, client, pays, commercial), et l on cumulera les grandeurs quantité et prix. La dernière étape est celle de l analyse multi-dimensionnelle proprement dite, qui consiste à sélectionner des axes d analyse. Parmi ces axes, on peut distinguer! Des axes à valeurs discrètes, ou discontinues, c est à dire qui portent un nombre fini de valeurs, par exemple une code postal, un segment CSP.! Des axes à valeurs continues, typiquement une date, un prix. On peut les ramener à un nombre discret de valeurs en définissant des tranches : tranches de prix, tranches d ages.
13 Page 13 On distingue également :! Des grandeurs cumulables, par exemple un montant, un nombre d items.! Des grandeurs non cumulables, par exemple l age ou la date. Les grandeurs cumulables sont celles qu il est pertinent d agréger, c est à dire dont on peut calculer la somme, (ou la moyenne, ou d autres fonctions mathématiques), pour un sous-ensemble de lignes, par exemple pour chaque thématique.
14 Page 14 L analyse multi-dimensionnelle consiste donc à :! Définir les axes d analyse que l on utilisera, et l ordre dans lesquels on les utilise. Par exemple : par région, puis par année, puis par vendeur, puis par gamme de produits. On n utilisera pas toujours tous les axes possibles.! Définir la ou les grandeurs qui sont étudiées, et éventuellement la fonction qu on applique à ces grandeurs. Chaque hiérarchisation des axes d analyse correspond à une question que l on se pose. Par exemple une analyse par année, par vendeur vise à représenter l évolution du chiffre d affaire, puis à comparer les vendeurs chaque année écoulée. Une analyse par vendeur, par année vise avant tout à comparer les vendeurs ( ). La consolidation des données Les informations, les données, qui seront à la base du système décisionnel, proviennent souvent de multiples systèmes d information de l entreprise, et une application décisionnelle constitue le plus souvent un entrepôt de données, un datawarehouse, en puisant les données de plusieurs sources dans l entreprise. Il y a de nombreuses raisons à cette étape de consolidation :! La centralisation : il serait très difficile, et parfois impossible, d accéder aux données dans les différents systèmes où elles se trouvent à l origine, les référentiels : problèmes d interconnexions réseaux, de débits, mais également de disparités de protocoles et d interfaces.! L unification : le datawarehouse réunit les données dans un système unique, une modélisation unifiée, des
15 Page 15 interfaces identiques. Il permet de créer des liens entre des données à l origine hétérogènes.! Les ressources informatiques : les applications décisionnelles peuvent être gourmandes en CPU, disque, mémoire, et les référentiels en place ne sont pas dimensionnés pour supporter ces nouveaux traitements.! La spécialisation : les applications décisionnelles ont des besoins spécifiques, qui ne pourront être satisfaits par les référentiels en place dans l entreprise.! Le datawarehouse est une base de données de consolidation, souvent une base relationnelle relativement standard, mais qui doit accueillir et manipuler de gros volumes d information. Ce peut être une base de données open source (MySql, PostgreSql, ) comme une base commerciale (Oracle, SQL-Server).
16 Page 16 Le datawarehouse concentre de l information décisionnelle issue de différents systèmes d information de l entreprise. Les principes de l ETL Pour alimenter cette base à partir d une variété de référentiels dans l entreprise, on utilise une gamme d outils appelés ETL, pour «Extract, Transform, Load». Comme le nom l indique, ces outils permettent d extraire des données à partir de différentes sources, de les transformer légèrement (format, dénomination), et de les charger dans une nouvelle base, qui sera ici le datawarehouse. Les transformations confiées à un ETL sont souvent très simples, mais elles peuvent dans certains cas inclure des traitements procéduraux, de véritables petits programmes spécifiques. Un ETL permet d éviter la réalisation de programmes batch répétitifs, souvent semblables, dont il faudra également assurer la maintenance. Le principe est que l intégration d un nouveau flux de données ne requiert aucun développement, et s opère par une simple configuration interactive : on choisit les éléments de données dans le référentiel source, on indique les transformations simples qu ils doivent subir, et on précise la destination de la donnée dans le datawarehouse. L ETL peut prendre en charge différentes natures de sources de données, tant en entrée qu en sortie, les principales étant bien sûr les SGBD relationnels, et les flux XML, mais il peut s agir aussi de fichiers à formats fixes ou bien avec séparateurs (CSV). Une fois qu un flux d extraction-transformation-chargement a été défini, il est généralement déclenché de manière régulière, ceci sous le contrôle d un outil de planification de tâches, ou bien d ordonnancement. ( ) Un ETL traite généralement des flux de point à point, c est à dire entre une source unique et une destination unique. Sa
17 Page 17 mission n est pas de puiser dans deux sources de données pour construire un flux agrégé. Le tableau de bord Un tableau de bord n est rien d autre qu une forme particulière d état, de rapport. On appelle tableau de bord un rapport qui est :! Particulièrement synthétique : tout doit tenir sur une feuille A4, ou sur un écran d ordinateur ;! Le plus souvent composite, c est à dire présentant plusieurs indicateurs, qui ensemble offrent une représentation complète de l activité de l entreprise ;! Souvent également personnalisé, c est à dire que chaque acteur consulte un tableau de bord qui concerne son activité. On parle parfois de Key Performance Indicators (KPI), des indicateurs clé. Ce sont les indicateurs qui sont présentés dès la page d accueil d un portail décisionnel. Selon les cas, le tableau de bord peut se suffire à lui-même, ou bien être le point d entrée vers des analyses affinées, des tableaux de bord secondaires, ou bien des accès en drill-down.
18 Page 18 On utilise parfois également le terme de Executive Information System, ou EIS, pour faire référence à un système décisionnel spécifiquement destiné à la Direction Générale, et donc présentant des informations stratégiques très consolidées. Le data mining Le data mining consiste à rechercher des informations utiles cachées dans un grand volume de données. Dans le reporting de l analyse multi-dimensionnelle, l utilisateur sait ce qu il cherche : il cherche par exemple la décomposition du chiffre d affaire par région. Il ne sait pas encore quelle est cette décomposition, mais il sait du moins en quoi elle consiste, et qu elle est une connaissance pertinente pour son travail. Dans le data mining, l utilisateur est à la recherche d une information cachée qu il n identifie pas encore : tendance, corrélation, similitude, etc. Typiquement, une analyse des tickets de caisse d un hypermarché peut faire apparaître des corrélations entre achats de produits. Certaines auront une explication simple (rasoirs et mousse à raser), d autres seraient insoupçonnées. Il convient bien sûr de valider de tels résultats, car la corrélation observée peut ne pas traduire une relation de cause à effets, mais être fortuite, ou bien résulter d une cause cachée, ayant l un et l autre phénomène comme causes conjointes. Les outils de data mining recherchent donc, de manière semiautomatisée, des corrélations, des règles invisibles, au travers de grands volumes de données, en s aidant parfois d une restitution graphique de ces règles, qui fera apparaître par exemple des nuages de points sur une représentation axiale des données.
19 Page 19 LES COMPOSANTS DECISIONNELS Avant de s orienter vers la création de solutions décisionnelles complètes, les projets open sources se concentraient chacun sur un point bien précis du décisionnel. Ainsi, les projets BIRT ou JasperReports permettent de générer des rapports, et les projets Mondrian et JPivot permettent de présenter des données sous forme multidimensionnelle. Ces projets sont destinés à être intégrés en tant que «composants» dans des développements spécifiques. Les plateformes décisionnelles open source se basent sur ces composants déjà bien rodés et les intègrent de façon a constituer une solution homogène, dans laquelle toutes les fonctionnalités sont disponibles dans un cadre unique. Dans cette partie, nous allons présenter les principaux composants décisionnels disponibles en open source, que l on peut regrouper dans les catégories suivantes : ETL : Kettle. Générateur de graphiques : JFreeChart. Générateurs d états : BIRT, JasperReports et JFreeReport. Analyse : Mondrian, JPivot, Palo et JPalo. Data mining : Weka. Kettle Présentation Kettle est un ETL open source qui permet de concevoir et exécuter des opérations de manipulation et de transformation de données.
20 Page 20 Grâce à un modèle graphique à base d étapes, il est possible de créer sans programmation des processus composés d imports et d export de données et de différentes opérations de transformation, telles que des conversions, des jointures, l application de filtres, ou même l exécution de fonctions javascript. Kettle est devenu open source à partir de la version 2.2 et a rapidement intégré le projet de plateforme décisionnelle Pentaho (voir plus loin dans ce libre blanc). Fonctionnalités Kettle permet de créer deux types de processus : Les transformations : traitements effectués au niveau d'une ou plusieurs bases de données comprenant des opération de lecture, de manipulation et d'écriture. Les tâches : traitements de plus haut niveau, combinant des actions telles que l'exécution d'une transformation Kettle, l'envoi d'un mail, le téléchargement d'un fichier ou le lancement d'une application. Il est possible d'exécuter des actions différentes en fonction de la réussite ou de l'échec de chaque étape. Kettle peut se connecter sur un grand nombre de bases de données, dont Oracle, Sybase, MySQL, PostgreSQL, Informix ou Hypersonic et peut également utiliser des données provenant de fichiers textes, XML et Excel. Les transformations et les tâches sont créées par glisserdéposer des différentes étapes du processus. Des assistants sont disponibles à chaque étape et permettent par exemple de générer automatiquement les requêtes de lecture et de création de tables.
21 Page 21 CREATION D'UNE TRANSFORMATION Les applications Kettle se compose de 4 applications : Spoon : environnement graphique de création et d'exécution de transformations. Pan : application en ligne de commande permettant de lancer l'exécution d'une transformation donnée. Chef : environnement graphique de création de tâches. Kitchen : application en ligne de commande permettant de lancer l'exécution d'une tâche donnée. Pan et Kitchen sont utilisées pour lancer automatiquement des transformations et des tâches. Planification Il est généralement souhaitable que des transformations ou tâches créées avec Kettle s'exécutent périodiquement. C'est notamment le cas pour les tâches de synchronisation ou de création d'entrepôts de données. Kettle n'intègre pas directement de planificateur de tâches. L'exécution repose donc sur un système externe, tel que les tâches planifiées de Windows ou d'unix.
22 Page 22 La plate-forme Pentaho (présentée plus loin dans ce livre blanc) supporte nativement l'exécution et la planification de tâches Kettle. Utilisation Dans le contexte de l'aide à la décision, Kettle va servir à constituer un datawarehouse, en réalisant l'importation des données depuis différentes sources, leur consolidation et leur mise en forme. L'utilisation de Kettle présente plusieurs avantages par rapport à des solutions à base de scripts : Exemple La création de flux de données complexes est extrêmement simple La maintenance est beaucoup plus aisée car tous les flux de données sont visibles d'un simple coup d'oeil. Kettle pourra également trouver sa place dans tout projet non décisionnels qui a besoin d'exécuter périodiquement des traitements sur certaines données ou des synchronisations entre différentes bases. Détaillons les étapes nécessaires pour la création et le lancement d'une synchronisation entre 2 tables contenues dans des bases différentes : 1. Déposer un objet «Extraction depuis table» dans l'espace de travail. 2. Éditer l'objet «Extraction depuis table», choisir la source de données et la table concernées. Une requête SQL est générée automatiquement mais elle peut être modifiée librement. 3. Déposer un objet «Insertion dans table» dans l'espace de travail. 4. Lier ces 2 objets.
23 Page Éditer l'objet «Insertion dans table», choisir la source de données et le nom de la table. Kettle prend en charge la création d'une nouvelle table ou la modification d'une table existante, en utilisant les informations transmises par les étapes précédentes. 6. Lancer la synchronisation. Conclusion EXECUTION D'UNE TRANSFORMATION DANS SPOON Kettle est un outil efficace pour réaliser rapidement tout type de traitements sur des bases de données. Nécessaire dans la plupart des projets décisionnels, il sera également très utile dans tout projet utilisant des bases de données et demandant des opérations de synchronisation ou d'export. Kettle faisant maintenant partie du projet Pentaho (sous le nom de Pentaho Data Integration), on peut s'attendre à de nombreuses mises à jour. D autres ETL open sources sont également disponibles, notamment Enhydra Octopus 1 et Clover.ETL 2, mais Kettle a l avantage d être performant, simple d utilisation, entièrement
24 Page 24 open source et d être interfacé avec la solution Pentaho présentée plus loin dans ce livre blanc. JFreeChart Présentation JFreeChart 3 est une bibliothèque Java permettant la génération de graphiques, sous forme d'images (PNG ou JPEG), de documents PDF ou de fichier vectoriels SVG. Elle supporte un très grand nombre de graphiques, des plus classiques tels que les histogrammes ou les courbes, aux graphiques plus complexes tels que les radars ou les diagrammes de Gantt. Cette bibliothèque est utilisée dans de nombreuses applications open source, notamment dans des générateurs d états (JasperReports, JFreeReport) et des plateformes décisionnelles (Pentaho, SpagoBI, MarvelIT). Elle est également utilisée par Google dans son service AdWords. Exemples de graphiques SECTEURS 3
25 Page 25 DIFFERENCE RADAR AXES MULTIPLES
26 Page 26 BIRT Présentation BIRT 4 (The Business Intelligence and Reporting Tool) est un projet de la communauté Eclipse comprenant un générateur d états et un environnement de conception. Le projet a été initié par la société Actuate 5, qui commercialise des offres de business intelligence basées sur BIRT et qui a ouvert une partie des sources de son outil. Générateur d états Le moteur de BIRT est une bibliothèque qui permet de générer des états (paramétrés ou non) au format HTML, PDF, XLS ou PPT 6. Ces états peuvent être complexes et contenir plusieurs tableaux, graphiques et images. Les données affichées peuvent provenir de bases et de requêtes différentes. Le moteur de BIRT peut être intégré dans toute application, développée avec le langage Java, que ce soit dans une application web ou dans une application de type «client lourd» Les formats XLS et PPT sont supportés via le projet Tribix :
27 Page 27 Conception des états EXEMPLE DE RAPPORT BIRT CREATION DE RAPPORT BIRT BIRT dispose d'un outil de conception d états, qui permet de créer et modifier les états de façon graphique, en déposant des éléments (tableaux, graphiques) dans un état vierge. Cet outil
28 Page 28 s'intègre sous forme de plug-in dans l'outil de développement Eclipse 7 mais peut être également utilisé comme une application autonome. La définition d'un état étant simplement un fichier XML, il est également possible, mais beaucoup plus long, de créer des états sans passer par cet outil. La création d'un état passe par plusieurs étapes : La définition des sources de données : une ou plusieurs sources de données (bases de données compatibles JDBC ou fichiers texte) peuvent être ajoutées à l état. La définition des jeux de données : un jeu de données est un ensemble d'informations destinées à être mises en forme par un tableau ou un graphique. C'est en fait le résultat d'une requête SQL plus ou moins complexe sur une source de données. L'utilisateur dispose d'un assistant pour faciliter la création de cette requête. Le placement des éléments : les éléments de base (tableaux, listes, graphiques, images,...) sont insérés dans l état par «glisser-déposer». La configuration : un jeu de données est associé à chaque élément et les paramètres de rendu sont modifiés. La prévisualisation : une option de prévisualisation permet de lancer la génération de l état. Audience L'outil de conception d états de BIRT s'adresse en premier lieu à des développeurs, car il est nécessaire de créer des jeux de données en utilisant des requêtes SQL. Il est cependant possible de le rendre utilisable par des utilisateurs moins techniques en utilisant certaines fonctionnalités qui permettent de contourner les étapes les plus complexes. 7
29 Page 29 Dans un premier temps, il est possible de créer des bibliothèques de ressources contenant les éléments de base pour créer un nouvel état : les sources de données, la feuille de style de l'entreprise, et un ensemble de jeux de données. Ces éléments peuvent être incorporés dans un nouvel état par un simple glisser-déposer. Conclusion L'utilisateur pourra par la suite créer ses propres jeux de données en réalisant des jointures de jeux de données existants. Par exemple, si la bibliothèque contient les jeux de données clients (liste détaillée des clients) et ventes (liste des ventes incluant une référence vers le client, le produit, ), l'utilisateur pourra facilement créer un jeu de données 'ventes par client' (liste détaillée des ventes pour chaque client). Il pourra ensuite ajouter des colonnes calculées et filtrer les résultats via un assistant. BIRT est un outil de reporting très complet, qui permet de créer rapidement des états complexes. Il bénéficie du support de très active communauté Eclipse. L'interface de l outil de conception des états est beaucoup plus intuitive que celles des autres générateurs d états et permet d envisager fournir cet outil aux utilisateurs afin qu ils puissent concevoir de nouveaux états en fonction de leurs besoins. Les seuls défauts de BIRT sont : Un nombre assez limité de types de graphiques : les plus classiques sont présents, mais il manque les diagrammes de Gant, les diagrammes polaires, etc. BIRT supporte plusieurs sources de données (fichiers XML, requêtes SQL, données générées par un script), mais ne permet pas l interrogation de serveurs d analyse multi-dimensionnelle.
30 Page 30 JasperReports Présentation JasperReports 8 est un générateur d états développé par la société JasperSoft 9 et distribué sous une licence open source. Plusieurs outils de conception sont disponibles pour créer de façon graphique de nouveaux états. Les fichiers générés sont au format XML et peuvent également être créés et modifiés manuellement. Générateur d états Le moteur de JasperReports permet la génération d états au format PDF, HTML, XML, CSV, RTF, XLS et TXT. Il utilise JFreeChart pour générer les graphiques et peut être intégré dans toute application développée avec le langage Java. Il supporte, en plus des bases de données classiques, les serveurs d analyse multi-dimensionnelle ce qui permet d exploiter les possibilités du serveur Mondrian directement dans un état JasperReport
31 Page 31 Conception des états JASPER REPORT La conception des états se fait soit par description XML soit par outil graphique. Les états sont décomposés en bandes dans lesquelles les éléments graphiques sont déposées. Chaque bande a un comportement spécifique et apparaît une ou plusieurs fois. Un état exécute une itération sur un jeu de données principal. Certaines bandes sont affichées avant ou après l ensemble des données de l état, d autres le sont une fois pour chaque élément du jeux de données.
32 Page 32 Les différentes bandes disponibles sont : titre de l état, affichée au début de la première page. entête de la page, affichée au début de chaque page. entête des colonnes, affichée avant les données. détails, répétée pour chaque élément des données. fin des colonnes, affiché après l ensemble données. pied de page, affiché en bas de chaque page. dernière page, affiché dans la dernière page. page de résumé, conclut l état. Pour créer des états plus riches, il est possible d utiliser des jeux de données secondaires dans certains éléments, comme les graphiques et les tableaux ou d insérer des états secondaires. Les états JasperReports sont fortement liés au langage de programmation Java. Ils nécessitent une étape de compilation et des données fortement typées : il est par exemple
33 Page 33 nécessaire de convertir en chaîne de caractères une donnée numérique avant de l insérer dans un tableau. Il existe plusieurs outils de conception graphique pour les états JasperReports. Les plus importants sont ireport, Jasper Assistant et JasperPal. ireport ireport 10 est l'outil de conception d états officiel de JasperReports et se présente sous la forme d'une application Java dédiée. Il supporte la totalité des fonctionnalités de JasperReports et dispose également d'une extension dédiée à l'administration de JasperIntelligence, la plate-forme décisionnelle de JasperSoft. L'interface et le mode de fonctionnement des états JasperReports destinent principalement ireport aux développeurs. Comparée à BIRT, l'interface s avère moins intuitive et moins efficace. IREPORT Jasper Assistant Jasper Assistant 11 est un outil de conception d états qui s'intègre dans l'environnement de développement Eclipse. Il est distribué sous licence commerciale. 10
34 Page 34 Le coût d'une licence est d'environ 130$ et une version de démonstration est disponible sur le site de Jasper Assistant. Le fonctionnement est semblable à celui d ireport. En comparaison, l interface bénéficie d amélioration telles que l édition des expressions et des formules qui est plus intuitive. En revanche, certaines parties telles que le paramétrage des graphiques sont plus complexes. Au final, Jasper Assistant n'apporte pas de réelle plusvalue par rapport à ireport, qui s'avère généralement plus complet. ÉDITION D'UN RAPPORT 11
35 Page 35 PREVISUALISATION JasperPal JasperPal 12 est un éditeur d états destiné à être embarqué dans une application Java. Il est développé sous la forme d un contrôle Swing et peut être utilisé dans toute application Java utilisant cet API. 12
36 Page 36 Conclusion COMPOSANT JASPERPAL Plus limité que les autres éditeurs d états, il peut cependant présenter un intérêt dans certains contextes spécifiques. Par exemple si l on doit intégrer l édition d états dans un workflow non supporté par des outils existants. Dans ce cas une application qui englobera JasperPal et prendra en charge ce workflow devra être développée. JasperReports est le moteur de génération d états le plus répandu dans le monde open source. On constatera que toutes les plateformes décisionnelles permettent son utilisation. Son principal défaut est le manque d intuitivité des différents éditeurs graphiques, ce qui limite leur utilisation aux développeurs.
37 Page 37 JFreeReport Présentation JFreeReport 13 est un générateur d états issu du même projet que JFreeChart. Ce dernier est naturellement utilisé pour la génération des graphiques. JFreeReport a rejoint le projet Pentaho début Au fur et à mesure, le nom JFreeReport sera abandonné au profit du nom Pentaho Reporting. Générateur d états JFreeReport supporte les formats PDF, HTML, CSV, Excel et Texte. Très modulaire, il permet aux utilisateurs de développer en Java de nouveaux types de contenu suivant leurs besoins. Ce moteur se base également sur des définitions d états en XML et peut être intégré dans toute application Java. 13
38 Page 38 Conception des états JFREEREPORT Les états JFreeReport se structurent en bandes, de la même façon que dans JasperReports. JFreeReport dispose de deux logiciels de conception d états : Pentaho Report Designer et Pentaho Report Design. Pentaho Report Designer, un outil de conception graphique similaire à ireport. Encore jeune, il ne dispose que des fonctions principales d un éditeur d état, mais il permet déjà un gain de temps important par rapport à la création d états via un fichier XML. Il n'est pour l'instant destiné qu'aux développeurs.
39 Page 39 PENTAHO REPORT DESIGNER Un assistant permettant la création de états à partir de modèles est également disponible. Pour l'utilisateur final, cela permet d'éviter l'étape de placement des différents objets graphique sur l état qui reste complexe. Il est cependant nécessaire d'entrer la source de données et la requête SQL à effectuer.
40 Page 40 Conclusion PENTAHO REPORT WIZARD Les outils de conception graphique pour JFreeReport sont très jeunes et ne sont pas suffisamment complets pour se passer totalement de l'édition manuelle des fichiers XML de description des états. On préférera donc pour l'instant l'utilisation de BIRT ou de JasperReports, qui disposent d'outils plus rodés et complets. Cependant, Pentaho a fait de JFreeReport le générateur d états officiel de sa suite décisionnelle et travaille activement sur ses évolutions. Il devrait donc devenir rapidement compétitif face aux autres moteurs.
41 Page 41 Mondrian Mondrian 14 est un serveur OLAP (On Line Analytical Processing) disponible sous licence open source. Il fait partie de la catégorie des serveurs R-OLAP, c'est-à-dire qu'il accède à des données contenue dans une base relationnelle. Mondrian exécute des requêtes utilisant le langage MDX, également utilisé dans Microsoft SQL Server. Ce langage permet de créer des requêtes dont l équivalent en langue SQL nécessiterait un grand nombre de requêtes et des temps d exécution beaucoup plus longs. Ce serveur est le plus souvent utilisé conjointement avec JPivot (présenté plus loin) afin de proposer une interface graphique de consultation des données. JPivot Présentation Le projet Mondrian a maintenant rejoint le projet Pentaho. JPivot 15 est un client OLAP disposant d'une interface Web. Il permet de représenter un cube OLAP sous forme de tableau croisé et d'effectuer les opérations classiques d'analyse (drill down, drill up,...) de façon interactive. JPivot permet également d'afficher un graphique correspondant aux données présentées en tableau, mis à jour au fur et à mesure de l'exploration. Il est possible d exporter tableau et graphique sous forme de fichier PDF imprimable ou de document Excel afin de réutiliser les données obtenues. L'interface utilisateur peut être facilement modifiée via l'utilisation de feuilles de styles (CSS et XSL)
42 Page 42 TABLEAU JPIVOT TABLEAU JPIVOT
43 Page 43 Conclusion JPivot et Mondrian forment un couple performant, capable de traiter des cubes volumineux. L interface de JPivot pose cependant quelques problèmes lorsqu un grand nombre de données est affichée à l écran : Chaque action effectuée dans l interface provoque le rafraîchissement complet du tableau OLAP. Ce tableau pouvant comporter plusieurs centaines de lignes, l utilisateur est contraint d attendre quelques secondes entre chaque clic. La vue graphique représentant l intégralité des données affichées dans le tableau, il n est rapidement plus possible de distinguer les différentes valeurs lorsque leur nombre augmente. Ces problèmes n apparaissent généralement que dans le cas où les dimensions du cube ne sont pas fixes. Par exemple, une dimension «Clients» peut comporter un très grand nombre d entrées, qui augmente avec le temps et qui alourdira énormément l affichage lorsque l utilisateur effectuera une opération de drill down. Au contraire, des dimensions au nombre d entrées fixes et généralement bien hiérarchisées telles que «Pays» ou «zone géographique», ne poseront aucun problème. L utilisation des fonctionnalités de filtrage de JPivot permet de limiter l affichage aux données étudiées par l utilisateur. On obtient alors de très bons temps de réponse et des graphiques lisibles. Il est également possible de scinder les cubes utilisant un grand nombre de dimensions en plusieurs cubes plus légers. L utilisateur devra donc dans un premier temps, choisir l angle sous lequel il souhaite aborder les données. Malgré ces petits défauts, JPivot reste le client OLAP web le plus aboutit et le plus utilisé du monde open source.
44 Page 44 Palo Palo 16 est un serveur OLAP développé en.net et distibué sous licence GPL. Il fait partie de la catégorie M-OLAP, c'est-à-dire que toutes les données sont stockées en mémoire et calculées à la volée, ce qui lui permet d'obtenir de très bons temps de réponse. Il s'intègre dans le tableur Excel sous forme de plugin et permet d'insérer des données multi-dimensionnelles dans les feuilles de calcul. Cette intégration permet de tirer parti des fonctionnalités de graphiques d'excel. PALO DANS EXCEL Palo n'est cependant pas limité à Excel et dispose d'api vers les langages Java et PHP. Il peut ainsi être interrogé depuis d'autres applications, telles que Palo Eclipse Client (JPalo cf ci-dessous). 16
45 Page 45 Palo ne supporte pas le langage MDX et nécessite l utilisation d applications clientes dédiées. Il n'est donc pas possible de l'utiliser conjointement avec JPivot par exemple. Dans le cadre d'un projet décisionnel, Palo va devoir utiliser les données de l'entreprise. Contrairement à Mondrian qui travaille directement sur une base relationnelle, les données doivent dans ce cas être importées dans Palo. Des API sont fournies et permettent d'écrire dans le cube OLAP depuis les langages C, Java, PHP et.net. Il faudra donc développer un programme de chargement de données spécifique au projet. On notera qu'il est également possible, depuis Excel, d'importer les données à partir d'un fichier texte ou d'une connexion ODBC mais cette solution n'est pas adaptée à l'import périodique d'un grand nombre de données. JPalo Le projet JPalo 17 propose des outils pour le serveur Palo développés en Java et notamment le client OLAP «Palo Eclipse Client» Palo Eclipse Client est une application de type client lourd qui s'intègre à l'environnement de développement Eclipse. Elle permet de présenter les données d'un cube Palo sous forme d un tableau croisé. L'utilisateur peut ensuite effectuer les opérations classiques de l'analyse. 17
46 Page 46 ILLUSTRATION 1: PALO ECLIPSE CLIENT Cette application est donc un équivalent de JPivot, mais qui bénéficie de très bon temps de réponse quels que soient les données et qui permet des opération à base de glisserdéposer. Dans sa version actuelle, Palo Eclipse Client ne propose pas la représentation des données sous forme de graphiques. Les point forts de Palo et de ce client Eclipse ne justifient pourtant pas l'effort nécessaire pour l'intégrer dans une plateforme décisionnelle telle que Pentaho ou SpagoBI. Dans la plupart des cas, JPivot (qui est intégré par défaut) sera suffisamment performant pour l'analyse OLAP.
47 Page 47 Weka Présentation Weka 18 est un outil permettant d'exécuter des algorithmes de data-mining sur un ensemble de données. Il se présente sous la forme d une application indépendante, disposant d une interface utilisateur graphique ou en ligne de commande. Les algorithmes de Weka peuvent être également utilisés dans toute application Java via l utilisation d une API spécifique. L utilisateur peut appliquer un à un les différents algorithmes, ou bien créer, d une façon similaire à Kettle, un workflow de traitements qui pourra par exemple être utilisé dans une plateforme décisionnelle pour analyser périodiquement les données. L utilisation de Weka demande de bonnes connaissance du data-mining et des différents algorithmes utilisés. PRETRAITEMENT 18
48 Page 48 VISUALISATION DES DONNEES
49 Page 49 LES PLATEFORMES DECISIONNELLES Nous avons étudié différentes plateformes décisionnelles disponibles en open source. Ces plateformes se basent généralement sur la plupart des composants open sources que nous venons de présenter. Les fonctionnalités de bases sont donc assez proches. La présentation se concentrera sur les spécificités de chaque plateforme et ne détaillera donc pas les possibilités des composants que l on retrouve dans tous les cas. Les plateformes décisionnelles open source sont toutes développées en Java, nous n'avons pas trouvé d'équivalent dans d'autres langages. Pentaho Présentation Pentaho 19 est une suite logicielle qui permet la distribution de fonctionnalités et documents décisionnels à un grand nombre de personnes par l'intermédiaire d'une application Web ou un portail. Elle permet également l'envoi automatique de documents par . Pentaho est proposée à la fois en version communautaire sous licence open source et en version professionnelle sous licence commerciale. La version professionnelle est basée sur la version open source à laquelle elle ajoute une meilleure interface utilisateur, la gestion des droits d'accès et la gestion du cycle 19
50 Page 50 de vie des documents (développement, test, production, suppression). Fonctionnalités Pentaho permet, via une interface unique, l'accès aux fonctionnalités de la plupart des outils décisionnels open sources présentés dans ce document. L'interface peut être soit un portail J2EE (Pentaho utilise le portail JBoss), soit une application Web spécifique. Il est possible de consulter des états (les outils BIRT, JasperReports et JFreeReport sont supportés), d'utiliser les fonctions d'exploration de données de JPivot, et de constituer des tableaux de bord. L'utilisateur a la possibilité de modifier les paramètres d'exécution d'un état, par exemple la période ou les produits représentés. La plateforme permet également d'envoyer automatiquement certains états, soit périodiquement, soit dès qu'une certaine condition est réalisée. La plateforme Pentaho est organisée autour de deux composants : un moteur de workflow et un planificateur de taches. Moteur de workflow Le moteur de workflow utilisé est «Enhydra Shark» 20. Son rôle est de structurer l'exécution des processus décisionnels : Dans Pentaho, chaque fonctionnalité (génération d états, analyse) correspond à l'exécution d'une «action». Une action est une succession d'étapes simples, telles que l'exécution d'une requête sur une base de données, la génération d'un état, l'envoi d'un mail ou l exécution d un job de Kettle. Les traitements effectués dans ces actions peuvent être assez poussés, car il est possible de traiter séparément 20
51 Page 51 chaque élément d'un ensemble de résultats ou bien de réaliser des calculs spécifiques via l'exécution d'un programme javascript. Le moteur de workflow gère l'enchaînement des différentes étapes. ENVOI D'UN ETAT PAR MAIL Chaque action est décrite par un simple fichier XML. Pentaho dispose d'un outil, Pentaho Design Studio, qui s'intègre dans l'environnement de développement Eclipse et permet de créer graphiquement ces fichiers.
52 Page 52 Planificateur PENTAHO DESIGN STUDIO Il faut noter que tous les composants décisionnels supportés par Pentaho constituent une étape du workflow, ce qui permet de combiner leurs fonctionnalités, et d'étendre très facilement les possibilités de la plate forme en développant de nouvelles étapes. Le planificateur utilisé est «Quartz» 21. Il permet de planifier n'importe quelle action Pentaho. Il est ainsi possible de créer une action qui génère et envoie par mail un état, et de la planifier pour une exécution périodique. Le contrôle du planificateur (ajout, suspension, et suppression des actions), peut s'effectuer soit manuellement, soit en utilisant les étapes correspondantes dans une action. 21
53 Page 53 Pentaho permet donc non seulement d'utiliser des outils décisionnels avec une interface unique, mais également de combiner leurs fonctionnalités et de les enrichir grâce à des traitements réalisés en amont et en aval de leur exécution. Interface utilisateur Il est possible d'utiliser les fonctionnalités de la plateforme Pentaho dans une application Web, un portail J2EE ou par l'appel de web-services. La version open-source de Pentaho inclus deux interfaces pour la présentation et d'exécution des différentes actions disponibles. Application web Cette interface sert de démonstration pour les fonctionnalités de Pentaho. Elle présente les actions disponibles, réparties par catégories. Elle propose également des fonctions d'administration. APPLICATION WEB PENTAHO Cette interface n'inclut aucune notion de sécurité. Les actions et les fonctions d'administration sont utilisables par tous les utilisateurs.
54 Page 54 Portail Pentaho propose également des portlets qui permettent d'utiliser les fonctionnalités de Pentaho dans le portail JBoss Portal : PentahoNavigationPortletWindow : affiche une interface similaire à l'application web. Ce portlet ne sera généralement pas utilisé en raison de l'absence de sécurité et de l'ouverture de chaque action dans une nouvelle fenêtre, ce qui est contraire au principe du portail. EmbeddedReportPortlet : permet d'intégrer un état directement dans le portail. Ce portlet peut également être utilisé pour composer des tableaux de bord à base de d états légers. ChartPortlet et WidgetGridPortlet qui permettent de combiner des graphiques afin de créer des tableaux de bord. TABLEAU DE BORD
55 Page 55 ETAT BIRT DANS PENTAHO Il est ici possible d'utiliser les fonctions d'authentification et de sécurité du portail pour sélectionner les portlets affichés pour chaque utilisateur. Les actions peuvent par la suite utiliser l'identifiant de l'utilisateur afin de retourner des résultats adaptés, profilés. Les fonctionnalités de l'interface utilisateur de la version open-source sont volontairement limitées. La gestion des annuaires LDAP et de sécurité au niveau de chaque dossier et action ne sont disponibles que dans la version commerciale. S'il est possible, avec la version open-source, d'interdire l'affichage d'un état pour une personne non autorisé, cette vérification ne peut être effectuée que lors de l'exécution de l'action. L'ensemble des actions existantes sont donc proposées à l'utilisateur bien qu'il n'ait accès qu'à certaines d'entre elles. Il sera donc souvent nécessaire de réaliser des développements spécifiques pour intégrer la version open source en entreprise et la doter d'une interface cohérente. Le portail JBoss Portal constitue néanmoins un bon point de départ pour construire des solutions autour de Pentaho.
56 Page 56 Composants utilisés Pentaho intègre la plupart des composants décisionnels open sources existants. Etats : Eclipse BIRT, JasperReports, JFreeReport Graphiques : JFreeChart Analyse : JPivot, Mondrian Portail : Jboss Portal Planificateur : Quartz Communauté Worfklow : Enhydra Shark ETL : Kettle La fonctionnalité de data-mining n est actuellement pas proposée par Pentaho. Dans une prochaine version, il sera possible d exporter les données de l entrepôt sous une forme compatible avec l application Weka. Le projet Pentaho est actuellement très actif. Plusieurs projets décisionnels open source tels que Kettle, Mondrian et JFreeReport ont rejoint le projet Pentaho, ce qui garantit une parfaite intégration et une évolution cohérente de l'ensemble. La communauté autour du projet est également dynamique comme en témoigne l'activité sur le forum Pentaho ainsi que les diverses contributions faites au projet par les utilisateurs. Version professionnelle La version professionnelle (sous licence commerciale) comporte des fonctionnalités supplémentaires importantes : Administration des actions depuis une interface spécifique Workflow de publication des actions (développement, tests, mise en production) Audit de l'application
57 Page 57 Personnalisation par l'utilisateur. Il peut par exemple choisir le format (HTML ou PDF) d'un état qu'il souhaite recevoir périodiquement. Sécurité au niveau des états Durée de vie des états Stockage des actions en base de données Support des configurations en clusters. Prix : La version «Pentaho Reporting Professional», limitée au fonctions de reporting est facturée 4500 euros par an Conclusion La version «Pentaho BI Suite Professional» est facturée 6000 euros par an. Pentaho propose des partenariats et des certifications. Pentaho est une plateforme décisionnelle extrêmement complète. Elle permet non seulement d utiliser les différents outils décisionnels open source depuis une interface unique, mais elle permet d étendre et de combiner leurs fonctionnalités grâce à l utilisation d un moteur de workflow. La version open source nécessitera cependant de réaliser plusieurs développements avant de pouvoir proposer un portail décisionnel complet utilisable en entreprise. Bien que trois générateurs d états différent soient supportés, on choisira en général celui qui correspond le plus aux fonctionnalités souhaitées. Le choix de deux générateurs peut également s envisager par exemple dans le cas où l on souhaite disposer d un générateur d états suffisamment intuitif pour être utilisé par les utilisateurs finaux (BIRT) et de certains rapports utilisant des données issues de requêtes MDX ou des graphiques spécifiques (JasperReports).
58 Page 58 Spago BI Présentation Spago BI 22 est une plate forme décisionnelle développée par la société italienne Engineering Ingegneria Informatica 23. Cette plate-forme est uniquement distribuée sous licence open source. Il n'y a donc pas de fonctionnalités volontairement absentes et réservée pour une version commerciale comme c'est le cas pour Pentaho. Fonctionnalités Spago BI permet la génération d états, simples ou paramétrés en utilisant les générateurs Jasper Reports et BIRT. Il permet également l'analyse de données avec Jpivot/Mondrian. SpagoBI intègre un composant d aide à la création de requêtes SQL (Query By Example) qui permet à l utilisateur de sélectionner graphiquement les données à extraire de l entrepôt de données puis d effectuer des tris, groupements, sélections et d exporter le résultat. L interface graphique utilise un ensemble de portlets pour afficher graphiques, états et indicateurs à l intérieur du portail. Certains indicateurs et graphiques sont capables d actualiser leur données sans intervention de l utilisateur. Les données sont stockées dans un référentiel utilisant la norme JCR (Java Content Repository) ce qui le rend librement interchangeable
59 Page 59 Interface utilisateur JPIVOT DANS SPAGOBI L'interface de SpagoBI utilise le portail exo platform 24 et permet de naviguer facilement entre les différents états et tableaux OLAP. L intégration des documents dans le portail se fait par iframe, ce qui n est pas toujours idéal. L'interface prend en charge la sécurité, avec une gestion des rôles utilisateurs pour les pages et groupes de documents décisionnels. Des profils différents sont disponibles pour les utilisateurs, les développeurs et les administrateurs. 24
60 Page 60 JASPERREPORTS DANS SPAGOBI NAVIGATION DANS SPAGOBI
61 Page 61 On pourra note que dans certains écrans, la navigation n est pas toujours intuitive. Il faut souvent utiliser une icône en haut de la page pour valider un formulaire situé plus bas. Une fois habitué à ce fonctionnement, l interface ne pose plus de problème. Workflow de publication QUERY BY EXAMPLE (QBE) Spago intègre la gestion du cycle de création, tests et validation des documents décisionnels (états, cubes multidimensionnels,..). Toutes ces opérations sont réalisées directement depuis l'interface d'administration. Il est possible de créer des états «brouillons» que seuls les développeurs pourront voir et tester, sans qu ils apparaissent dans l environnement des utilisateurs. Les différentes versions de chaque état et des fichiers attachés (gabarits, images,...) sont enregistrées et il est possible de revenir à une ancienne version à tout moment. Cette fonctionnalité permet de mettre à jour les documents décisionnels, sans avoir accès au serveur lui-même et de les
62 Page 62 tester dans des conditions réelles avant leur mise en production. Composants utilisés SpagoBI utilise plusieurs composants décisionnels open source : Etats : JasperReports, BIRT Analyse : Mondrian, JPivot Data-mining : Weka Portail : exo platform CONFIGURATION D'UN RAPPORT La fonctionnalité de création de requêtes SQL (Query By Example) est développée spécifiquement par SpagoBI. Les indicateurs dynamiques des tableaux de bord sont des composants flash, générés avec la plate-forme Open Laszlo
63 Page 63 Intégration des données INDICATEURS DYNAMIQUES Évolutions Contrairement à Pentaho, SpagoBI n est interfacé avec aucun ETL. Il n est donc pas capable de déclencher des mises à jour de données directement depuis le portail. Pour mettre en place l entrepôt de données nécessaire au reporting, l utilisateur est libre de choisir son ETL. Il est bien évidemment possible d utiliser Kettle pour remplir cette fonction. De nombreuses évolutions sont prévues à court terme, dont notamment un moteur de workflow, un planificateur, une fonction de recherche et le support de nouveaux composants (générateurs d états, ETL, ). Communauté La communauté n est pas très active, mais semble progresser régulièrement. On peut compter environ 450 messages sur le forum de SpagoBI. L activité des listes de diffusion est beaucoup plus réduite avec seulement quelques messages par mois.
64 Page 64 Conclusion SpagoBI est une plateforme décisionnelle complète. Elle ne permettra pas de créer des documents aussi complexes que ceux pouvant être générés par le système de workflow de Pentaho, mais elle a l immense avantage de proposer une interface utilisateur bien plus riche, qui ne nécessite pas de développements spécifiques avant de pouvoir être utilisée. Le portail exo platform utilise maintenant SpagoBI pour présenter les statistiques d accès et d utilisation des portlets dans l interface d administration. Jasper Intelligence Présentation JasperIntelligence 26 est la plateforme décisionnelle de JasperSoft, qui développe également JasperReports. Elle permet la visualisation d états JasperReports et dispose de fonctionnalités d analyse avec Mondrian et JPivot. Chaque état peut être généré et envoyé périodiquement à un utilisateur. L interface n utilise pas de portail contrairement aux autres plateformes. On dispose ici d une application web développée spécifiquement. Il est possible de publier et modifier des états très facilement, directement depuis l application ireport. Il est peu probable que cette plateforme supporte d autres générateurs d états que JasperReport. De nombreuses fonctionnalités son prévues pour les versions futures. 26
65 Page 65 Composants utilisés Conclusion VISUALISATION D UN ETAT DANS JASPERINTELLIGENCE Etats : JasperReports Analyse : Mondrian, JPivot Planificateur : Quartz JasperIntelligence est une plateforme aux fonctionnalités intéressantes. Malgré l utilisation de composants open source déjà rodés, la plateforme reste très jeune : la première version disponible date d avril Il est cependant très intéressant de surveiller les évolutions qui vont y être apportées.
66 Page 66 Marvel IT Présentation MARVELit DASH 27 est un projet de portail décisionnel, développé par la société MARVELit et distribué sous licence open source. Il utilise la portail Apache Jetspeed 28 et est dédié à la création de tableaux de bord. Composants utilisés Etats : JasperReports Fonctionnalités Graphiques : JFreeChart Planificateur : Quartz Portail : Apache Jetspeed 1.6 Fusion, compatible avec les portlets utilisant la norme JSR168. MARVELit se présente sous forme d un portail dans lequel l'administrateur peut disposer des portlets affichant des graphiques ou des états. Le paramétrage (définition de la source de données, de la requête SQL,...) se fait directement depuis l'interface du portail, en modifiant les paramètres de chaque portlet. Le positionnement des éléments dans la page et la gestion des droits de chaque utilisateur repose sur les fonctionnalités du portail Jetspeed. MARVELit propose 4 portlets : Portlet chart : affichage d'un graphique JFreeChart représentant les données d'une requête SQL
67 Page 67 Portlet report : affichage d'un état JasperReports. GRAPHIQUES RAPPORTS ET GRAPHIQUES Portlet open report : ouverture d'un état JasperReports au format PDF ou HTML. Il est également possible de planifier la génération et l'envoi d'un état à une ou plusieurs adresses mail données.
68 Page 68 Communauté Conclusion OUVRIR UN RAPPORT Admin : portlet d'administration de MARVELit, utilisé pour la définition des sources de données et la déclaration des états disponibles. L'utilisateur peut sélectionner la plage de données à afficher dans les états et les graphiques via des menus déroulants. En dehors de la société MARVELit, il n'y a pas de communauté visible autour de ce produit. Les fonctionnalités de MARVELit DASH sont très limitées comparées à des plateformes telles que Pentaho ou SpagoBI. Il conviendra cependant pour rapidement mettre en place un portail aux fonctionnalités de tableau de bord et de reporting élémentaires. Si l'on souhaite évoluer par la suite vers de l'analyse multidimensionnelle ou proposer des états complexes, on se tournera de préférence vers Pentaho ou SpagoBI.
69 Page 69 PHP et.net Les environnements PHP et.net sont assez pauvres en outils décisionnels open source. Il existe plusieurs bibliothèques dédiées à la génération de graphiques, mais aucun solution décisionnelle complète. Il est cependant possible de tirer partit des fonctionnalités de la plateforme Pentaho ou du serveur OLAP Palo depuis une application PHP ou.net par l intermédiaire d API spécifique ou de web services.
70 Page 70 CONCLUSION Les plateformes décisionnelles open source sont maintenant des alternatives complètes et crédibles face aux solutions décisionnelles commerciales. Les différents composants utilisés existent depuis plusieurs années et sont très fiables. Le Web est le support de prédilection des plateformes open source. Il n est pas possible d utiliser des fonctionnalités décisionnelles en mode déconnecté, comme le permettent certaines applications commerciales. On assiste à deux modes de distribution différents : le tout open source pour SpagoBI, JapserIntelligence et MarvelIT ou une combinaison open source et commercial pour Pentaho. Dans ce dernier cas, la version commerciale (qui reste d un coût très avantageux par rapport à des solutions propriétaires) est un passage pratiquement obligé si on souhaite une solution prête à l emploi. Si des solutions telles que Pentaho ou SpagoBI permettent de mettre en place un portail décisionnel complet, il est également possible d ajouter facilement des fonctionnalités décisionnelles à une application existante, en utilisant séparément les composants sur lesquels sont basés ces plateformes. Les solutions open sources souffrent encore de quelques imperfections notamment au niveau de la finition des interfaces utilisateurs. Cependant ces outils, portés par des communautés actives, évoluent très vite et il est certain que leur diffusion et leur reconnaissance va s étendre dans les mois et années qui viennent.
Petit Déjeuner Pépinière du Logiciel Libre. 25 juin 2008
Petit Déjeuner Pépinière du Logiciel Libre 25 juin 2008 1 / 37 Agenda Définition & Principes Les différents outils & composants Les Solutions intégrés Open-Source Vos Questions 2 / 37 Agenda Définition
Décisionnel Solutions open source
Livre blanc Décisionnel Solutions open source Edition 2009 Version 3.0 Pour plus d information : Tél : 01 41 40 11 00 Mailto : [email protected] Page 2 PREAMBULE Smile Fondée en 1991, Smile est une société
Analyse comparative entre différents outils de BI (Business Intelligence) :
Analyse comparative entre différents outils de BI (Business Intelligence) : Réalisé par: NAMIR YASSINE RAGUI ACHRAF Encadré par: PR. L. LAMRINI Dans le domaine d économies des Big Data et Open Data, comment
Pentaho : Comparatif fonctionnel entre la version Communautaire (gratuite) et la version Entreprise (payante) Table des matières
Pentaho : Comparatif fonctionnel entre la version Communautaire (gratuite) et la version Entreprise (payante) Table des matières 1 2 3 4 PRÉSENTATION DE PENTAHO...2 LISTING DES COMPOSANTS DE LA PLATE-FORME...4
Didier MOUNIEN Samantha MOINEAUX
Didier MOUNIEN Samantha MOINEAUX 08/01/2008 1 Généralisation des ERP ERP génère une importante masse de données Comment mesurer l impact réel d une décision? Comment choisir entre plusieurs décisions?
BUSINESS INTELLIGENCE
BUSINESS SYSTÈME D INFORMATION DÉCISIONNEL CENTRE DE RESSOURCES INFORMATIQUES PÔLE INFORMATIQUE DE GESTION & SI DÉFINITION L INFORMATIQUE DÉCISIONNELLE DÉSIGNE L ENSEMBLE DES TECHNOLOGIES UTILISÉES DANS
BI Open Source Octobre 2012. Alioune Dia, Consultant BI [email protected]
BI Open Source Octobre 2012 Alioune Dia, Consultant BI [email protected] 1 Le groupe, en bref 2004 Date de création +7M * Chiffre d affaires 2012 +80 Collaborateurs au 06/2011 35% Croissance chiffre
Catalogue Formation «Vanilla»
Catalogue Formation «Vanilla» Date : octobre 2009 Table des matières Liste des Formations...2 Contenu des formations...3 Vanilla FastTrack...3 Vanilla Architecture...5 Enterprise Services...6 BIPortail...7
Introduction à la B.I. Avec SQL Server 2008
Introduction à la B.I. Avec SQL Server 2008 Version 1.0 VALENTIN Pauline 2 Introduction à la B.I. avec SQL Server 2008 Sommaire 1 Présentation de la B.I. et SQL Server 2008... 3 1.1 Présentation rapide
Projet M1 Sujet 21 : Développement d'un logiciel simplifié de type Business Object
Florent Dubien Antoine Pelloux IUP GMI Avignon Projet M1 Sujet 21 : Développement d'un logiciel simplifié de type Business Object Professeur Tuteur : Thierry Spriet 1. Cadre du projet... 3 2. Logiciel
BUSINESS INTELLIGENCE
BUSINESS SYSTÈME D INFORMATION DÉCISIONNEL GROUPE COCKTAIL INFOCENTRE-PILOTAGE Le décisionnel et le pilotage autour du SGI et de son référentiel CENTRE DE RESSOURCES INFORMATIQUES PÔLE INFORMATIQUE DE
Urbanisation des SI-NFE107
OLAP Urbanisation des SI-NFE107 Fiche de lecture Karim SEKRI 20/01/2009 OLAP 1 Introduction PLAN OLAP Les différentes technologies OLAP Plate formes et Outils 20/01/2009 OLAP 2 Informatique décisionnelle
Business Intelligence avec SQL Server 2012
Editions ENI Business Intelligence avec SQL Server 2012 Maîtrisez les concepts et réalisez un système décisionnel Collection Solutions Informatiques Table des matières Les éléments à télécharger sont disponibles
Livre blanc. Décisionnel Solutions open source. Édition 2012. Pour plus d information : www.smile.fr Tél : +33 (0)1 41 40 11 00 Mailto : sdc@smile.
Livre blanc Décisionnel Solutions open source Édition 2012 Pour plus d information : www.smile.fr Tél : +33 (0)1 41 40 11 00 Mailto : [email protected] Page 2 PREAMBULE SMILE Smile est une société d ingénieurs
Décisionnel : le meilleur des solutions. open source
Page 1 Préambule Page 2 PREAMBULE SMILE Smile est une société d ingénieurs experts dans la mise en œuvre de solutions open source et l intégration de systèmes appuyés sur l open source. Smile est membre
SSLL du groupe UMANIS
RESTITUER, ANALYSER ET PILOTER : EVALUER LES OPPORTUNITES OPEN SOURCE Livre Blanc SSLL du groupe UMANIS Ce document est sous licence GNU Free Documentation Licence. SOMMAIRE 1 OBJECTIFS DU DOCUMENT...
Fournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement
Introduction Phases du projet Les principales phases du projet sont les suivantes : La mise à disposition des sources Des fichiers Excel sont utilisés pour récolter nos informations L extraction des données
Formations 2015 JASPER, REDMINE, TABLEAU, TALEND, SPAGO BI SYNALTIC 24 RUE DE L EGLISE 94300 VINCENNES
Formations 2015 JASPER, REDMINE, TABLEAU, TALEND, SPAGO BI SYNALTIC 24 RUE DE L EGLISE 94300 VINCENNES Table des matières Edito... 3 Informations pratiques... 4 Accueil des stagiaires... 4 Horaires...
Vers une vraie alternative du libre dans les logiciels d aide à la décision (BI)
Vers une vraie alternative du libre dans les logiciels d aide à la décision (BI) Aristote, le 10 juin 2010 http://www.smile.fr +33 1 41 40 11 00 / [email protected] Sommaire Smile Solutions décisionnelles open
Easy to. report. Connexion. Transformation. Stockage. Construction. Exploitation. Diffusion
M y R e p o r t, L A S O L U T I O N R E P O R T I N G D E S U T I L I S AT E U R S E X C E L Connexion Transformation Stockage Construction Exploitation Diffusion OBJECTIF REPORTING : De la manipulation
Business Intelligence : Informatique Décisionnelle
Business Intelligence : Informatique Décisionnelle On appelle «aide à la décision», «décisionnel», ou encore «business intelligence», un ensemble de solutions informatiques permettant l analyse des données
REQUEA. v 1.0.0 PD 20 mars 2008. Mouvements d arrivée / départ de personnels Description produit
v 1.0.0 PD 20 mars 2008 Mouvements d arrivée / départ de personnels Description produit Fonctionnalités L application Gestion des mouvements d arrivée / départ de Requea permet la gestion collaborative
MyReport, LE REPORTING SOUS EXCEL
MyReport, LE REPORTING SOUS EXCEL De la simplicité d Excel à l autonomie des utilisateurs Avec MyReport : De la manipulation en moins. De l analyse en plus! Tous les services de l entreprise utilisent
BUSINESS INTELLIGENCE
GUIDE COMPARATIF BUSINESS INTELLIGENCE www.viseo.com Table des matières Business Intelligence :... 2 Contexte et objectifs... 2 Une architecture spécifique... 2 Les outils de Business intelligence... 3
Construction d un environnement destiné à l'aide au pilotage
Retour d expérience Construction d un environnement destiné à l'aide au pilotage 1 «Journée sur le décisionnel et pilotage autour du SI de son référentiel» Marseille 26 juin Construction d un environnement
Le "tout fichier" Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique
Introduction à l informatique : Information automatisée Le premier ordinateur Définition disque dure, mémoire, carte mémoire, carte mère etc Architecture d un ordinateur Les constructeurs leader du marché
Entrepôt de données 1. Introduction
Entrepôt de données 1 (data warehouse) Introduction 1 Présentation Le concept d entrepôt de données a été formalisé pour la première fois en 1990 par Bill Inmon. Il s agissait de constituer une base de
Formations 2015 JASPER, REDMINE, TABLEAU, TALEND, SPAGO BI ALTIC & SYNOTIS - TRAINING CENTER 24 RUE DE L EGLISE 94300 VINCENNES
Formations 2015 JASPER, REDMINE, TABLEAU, TALEND, SPAGO BI ALTIC & SYNOTIS - TRAINING CENTER 24 RUE DE L EGLISE 94300 VINCENNES Table des matières Edito... 3 Informations pratiques... 4 Accueil des stagiaires...
Suite Jedox La Business-Driven Intelligence avec Jedox
Suite La Business-Driven Intelligence avec Une solution intégrée pour la simulation, l analyse et le reporting vous offre la possibilité d analyser vos données et de gérer votre planification selon vos
Business & High Technology
UNIVERSITE DE TUNIS INSTITUT SUPERIEUR DE GESTION DE TUNIS Département : Informatique Business & High Technology Chapitre 8 : ID : Informatique Décisionnelle BI : Business Intelligence Sommaire Introduction...
Chapitre 9 : Informatique décisionnelle
Chapitre 9 : Informatique décisionnelle Sommaire Introduction... 3 Définition... 3 Les domaines d application de l informatique décisionnelle... 4 Architecture d un système décisionnel... 5 L outil Oracle
FreeAnalysis. Schema Designer. Cubes
FreeAnalysis Schema Designer Cubes Charles Martin et Patrick Beaucamp BPM Conseil Contact : [email protected], [email protected] Janvier 2013 Document : BPM_Vanilla_FreeAnalysisSchemaDesigner_v4.2_FR.odt
MYXTRACTION. 2009 La Business Intelligence en temps réel
MYXTRACTION 2009 La Business Intelligence en temps réel Administration Qui sommes nous? Administration et management des profils Connecteurs Base des données Gestion des variables et catégories de variables
SQL SERVER 2008, BUSINESS INTELLIGENCE
SGBD / Aide à la décision SQL SERVER 2008, BUSINESS INTELLIGENCE Réf: QLI Durée : 5 jours (7 heures) OBJECTIFS DE LA FORMATION Cette formation vous apprendra à concevoir et à déployer une solution de Business
Business Intelligence avec SQL Server 2012
Editions ENI Business Intelligence avec SQL Server 2012 Maîtrisez les concepts et réalisez un système décisionnel Collection Solutions Informatiques Extrait Alimenter l'entrepôt de données avec SSIS Business
et les Systèmes Multidimensionnels
Le Data Warehouse et les Systèmes Multidimensionnels 1 1. Définition d un Datawarehouse (DW) Le Datawarehouse est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées
Cursus Sage ERP X3 Outils & Développement. Le parcours pédagogique Sage ERP X3 Outils et Développement
Cursus Outils & Développement Vous êtes Consultant, Chef de Projets, Directeur des Systèmes d Information, Directeur Administratif et Financier, Optez pour les «formations Produits» Nous vous proposons
QU EST-CE QUE LE DECISIONNEL?
La plupart des entreprises disposent d une masse considérable d informations sur leurs clients, leurs produits, leurs ventes Toutefois ces données sont cloisonnées par les applications utilisées ou parce
Prise en main du BusinessObjects XI R2 Service Pack 2/ Productivity Pack
Prise en main du BusinessObjects XI R2 Service Pack 2/ Productivity Pack A propos de ce guide A propos de ce guide Ce guide contient des informations de prise en main du BusinessObjects XI R2 Service Pack
BIRT (Business Intelligence and Reporting Tools)
BIRT (Business Intelligence and Reporting Tools) Introduction Cette publication a pour objectif de présenter l outil de reporting BIRT, dans le cadre de l unité de valeur «Data Warehouse et Outils Décisionnels»
SAP BusinessObjects Web Intelligence (WebI) BI 4
Présentation de la Business Intelligence 1. Outils de Business Intelligence 15 2. Historique des logiciels décisionnels 16 3. La suite de logiciels SAP BusinessObjects Business Intelligence Platform 18
2014/2015. Rapport 4 REALISE PAR : ISMAIL NAIT ABDELLAH OUALI SOUFIANE HOURRI MOHAMED OUSSAFI ENCADRE PAR : MME L.LAMRINI ANOUAR OUFQIR SMARTSIR
2014/2015 Rapport 4 REALISE PAR : ISMAIL NAIT ABDELLAH OUALI SOUFIANE HOURRI MOHAMED OUSSAFI ENCADRE PAR : ANOUAR OUFQIR MME L.LAMRINI SMARTSIR Table des matières Introduction... 2 Choix de l outil pour
MyReport, une gamme complète. La Business Intelligence en toute simplicité : Concevez, partagez, actualisez! pour piloter votre activité au quotidien.
MyReportle reporting sous excel La Business Intelligence en toute simplicité : Concevez, partagez, actualisez! MyReport, une gamme complète pour piloter votre activité au quotidien. En rendant les données
Les Entrepôts de Données
Les Entrepôts de Données Grégory Bonnet Abdel-Illah Mouaddib GREYC Dépt Dépt informatique :: GREYC Dépt Dépt informatique :: Cours Cours SIR SIR Systèmes d information décisionnels Nouvelles générations
Business Intelligence avec SQL Server 2014 Maîtrisez les concepts et réalisez un système décisionnel
Avant-propos 1. À qui s'adresse ce livre? 9 2. Les pré-requis 10 3. Les objectifs du livre 11 Introduction 1. Présentation du décisionnel 13 1.1 La notion de décideur 14 1.2 Les facteurs d'amélioration
Business Intelligence simple et efficace
Business Intelligence simple et efficace avec Excel et PowerPivot Jean-Philippe GOUIGOUX Table des matières 1 Chapitre 1 Présentation de PowerPivot A. L analyse de données.....................................................
Business Intelligence avec SQL Server 2012 Maîtrisez les concepts et réalisez un système décisionnel
Avant-propos 1. À qui s'adresse ce livre? 9 2. Les pré-requis 10 3. Les objectifs du livre 10 Introduction 1. Présentation du décisionnel 15 1.1 La notion de décideur 15 1.2 Les facteurs d'amélioration
La Business Intelligence en toute simplicité :
MyReportle reporting sous excel La Business Intelligence en toute simplicité : Concevez, partagez, actualisez! En rendant les données accessibles aux personnes habilitées dans l entreprise (comptabilité,
CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2012
CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE Edition 2012 AGENDA Qui sommes nous? Présentation de Keyrus Keyrus : Expert en formations BI Nos propositions de formation 3 modes de formations Liste des
Business Intelligence
avec Excel, Power BI et Office 365 Téléchargement www.editions-eni.fr.fr Jean-Pierre GIRARDOT Table des matières 1 Avant-propos A. À qui s adresse ce livre?..................................................
OSIRIS/ Valorisation des données PORTAIL BO MANUEL UTILISATEUR
OSIRIS/ Valorisation des données PORTAIL BO MANUEL UTILISATEUR HISTORIQUE DES VERSIONS Vers. Date Rédacteur Objet de la modification 1.00 Juillet 2007 GTBO_AGRI Création du document 1.01 Février 2009 SAMOA
RMLL Présentation Activité Pentaho
RMLL Présentation Activité Pentaho BPM Conseil «Best Pentaho partner for 2006» 11 Juillet 2007 Activités et Orientations BPM Conseil Société de conseil en informatique décisionnelle Partenaire la suite
X2BIRT : Mettez de l interactivité dans vos archives
Présentation Produit Présentation Produit X2BIRT : Mettez de l interactivité dans vos archives L accès à l information est capital pour les affaires. X2BIRT, la dernière innovation d Actuate, prend le
DataStudio. Solution d intégration des données et de diffusion de l information
DataStudio Solution d intégration des données et de diffusion de l information L ETL, cœur de la performance des entreprises La forte intégration des applications est désormais une condition indispensable
Chapitre 1 : Introduction aux bases de données
Chapitre 1 : Introduction aux bases de données Les Bases de Données occupent aujourd'hui une place de plus en plus importante dans les systèmes informatiques. Les Systèmes de Gestion de Bases de Données
Communiqué de Lancement
Direction du Marketing Produits Sage - Division Mid Market Communiqué de Lancement Rapprochement Bancaire 1000 Produit : Rapprochement Bancaire 1000 Bases de Données : Oracle - MS/SQL Server Microsoft
Travail de diplôme 2011 Business Intelligence Open Source SpagoBI/Talend Résumé
ESNE Travail de diplôme 2011 Business Intelligence Open Source SpagoBI/Talend Résumé I.Cirillo 2010-2011 Introduction Le laboratoire de base de données de l ESNE a mis en place, il y a quelques années,
Pilot4IT Tableaux de Bord Agréger et consolider l ensemble de vos indicateurs dans un même portail.
Pilot4IT Tableaux de Bord Agréger et consolider l ensemble de vos indicateurs dans un même portail. Comment exploiter au mieux l ensemble de vos indicateurs? Avec la solution agile Pilot4IT Tableau de
Les entrepôts de données
Les entrepôts de données Lydie Soler Janvier 2008 U.F.R. d informatique Document diffusé sous licence Creative Commons by-nc-nd (http://creativecommons.org/licenses/by-nc-nd/2.0/fr/) 1 Plan Introduction
Introduction à ORACLE WAREHOUSE BUILDER Cédric du Mouza
Introduction à ORACLE WAREHOUSE BUILDER Cédric du Mouza Avant de commencer à travailler avec le produit, il est nécessaire de comprendre, à un haut niveau, les problèmes en réponse desquels l outil a été
Introduction : présentation de la Business Intelligence
Les exemples cités tout au long de cet ouvrage sont téléchargeables à l'adresse suivante : http://www.editions-eni.fr Saisissez la référence ENI de l'ouvrage RI3WXIBUSO dans la zone de recherche et validez.
Cursus Sage ERP X3 Outils & Développement. CURSUS Sage ERP X3 Outils & Développement ADVANCED. Outils avancés. 2 jours X3A-ADM. Développement 1 &2
Cursus Outils & Développement Vous êtes Consultant, Chef de Projets, Directeur des Systèmes d Information, Directeur Administratif et Financier, Optez pour les «formations Produits» Nous vous proposons
Accélérateur de votre RÉUSSITE
Accélérateur de votre RÉUSSITE SAP Business Objects est une suite décisionnelle unifiée et complète qui connecte ses utilisateurs en éliminant les difficultés d accès à l information. Mobile Devices Browsers
molis result portal Description fonctionnelle La structure système Configuration système requise Architecture du système
La structure système Configuration système requise Serveur de base de données (en partenariat avec InterSystems Caché ) Serveur Windows à partir de la version 2003 x 64 Serveur Windows à partir de la version
EXCEL & XLCubed 10 raisons d en faire l assise de votre Managed Self-Service BI
EXCEL & XLCubed 10 raisons d en faire l assise de votre Managed Self-Service BI Préambule Excel au centre de la solution Si vous manipulez des rapports et tableaux de bord en somme des données - vous connaissez
Sage CRM. 7.2 Guide de Portail Client
Sage CRM 7.2 Guide de Portail Client Copyright 2013 Sage Technologies Limited, éditeur de ce produit. Tous droits réservés. Il est interdit de copier, photocopier, reproduire, traduire, copier sur microfilm,
IBM System i. DB2 Web Query for System i : le successeur de Query/400? Oui, mais bien plus!!!
DB2 Web Query for System i : le successeur de Query/400? Oui, mais bien plus!!! Stéphane MICHAUX Philippe BOURGEOIS Christian GRIERE [email protected] [email protected] [email protected] Les
Reporting Services - Administration
Reporting Services - Administration Comment administrer SQL Server Reporting Services Cet article a pour but de présenter comment gérer le serveur depuis le "portail" de Reporting Services. Nous verrons
DOSSIER SOLUTION CA ERwin Modeling. Comment gérer la complexité des données et améliorer l agilité métier?
DOSSIER SOLUTION CA ERwin Modeling Comment gérer la complexité des données et améliorer l agilité métier? CA ERwin Modeling fournit une vue centralisée des définitions de données clés afin de mieux comprendre
SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...)
Avant-propos 1. À qui s'adresse ce livre? 15 2. Pré-requis 15 3. Objectifs du livre 16 4. Notations 17 Introduction à la Business Intelligence 1. Du transactionnel au décisionnel 19 2. Business Intelligence
TP2_1 DE BUSINESS INTELLIGENCE ISIMA ZZ3 F3
TP2_1 DE BUSINESS INTELLIGENCE ISIMA ZZ3 F3 03/11/2014 Plan du TP 2 Présentation de la suite Microsoft BI Ateliers sur SSIS (2H) Ateliers sur RS (2H) 3 Présentation de la suite Microsoft BI Présentation
et Groupe Eyrolles, 2006, ISBN : 2-212-11747-7
Tsoft et Groupe Eyrolles, 2006, ISBN : 2-212-11747-7 OEM Console Java OEM Console HTTP OEM Database Control Oracle Net Manager 6 Module 6 : Oracle Enterprise Manager Objectifs Contenu A la fin de ce module,
Introduction: 1. définition d un ETL 2. importance et diversité des données spatiales utilitédes ETL géographiques
1 2 Introduction: 1. définition d un ETL 2. importance et diversité des données spatiales utilitédes ETL géographiques 3 ETL = extracto-chargeur = datadumping La Business Intelligence, BI, (ou informatique
CATALOGUE DES FORMATIONS
CATALOGUE DES FORMATIONS COURS THEMATIQUES MIGRATION À WINDOWS 10... 1 WORD: LES TABLEAUX... 2 WORD: MODÈLES ET FORMULAIRES... 3 WORD: PUBLIPOSTAGE... 4 WORD: LES LONGS DOCUMENTS... 5 WORD: PUBLICATION...
Chapitre 1 Introduction
Les éléments à télécharger sont disponibles à l'adresse suivante : http://www.editions-eni.fr Saisissez la référence ENI de l'ouvrage SOBI10SHA dans la zone de recherche et validez. Cliquez sur le titre
ANNEXE 2 DESCRIPTION DU CONTENU DE L OFFRE BUSINESS INFORMATION AND ANALYSIS PACKAGE
ANNEXE 2 DESCRIPTION DU CONTENU DE L OFFRE BUSINESS INFORMATION AND ANALYSIS PACKAGE (BUSINESS INTELLIGENCE PACKAGE) Ce document propose une présentation générale des fonctions de Business Intelligence
Qu'est-ce que le BPM?
Qu'est-ce que le BPM? Le BPM (Business Process Management) n'est pas seulement une technologie mais, dans les grandes lignes, une discipline de gestion d'entreprise qui s'occupe des procédures contribuant
PRODIGE V3. Manuel utilisateurs. Consultation des métadonnées
PRODIGE V3 Manuel utilisateurs Consultation des métadonnées Pour plus d'information sur le dispositif : à remplir par chaque site éventuellement 2 PRODIGE V3 : Consultation des métadonnées SOMMAIRE 1.
White Paper ADVANTYS. Workflow et Gestion de la Performance
White Paper Workflow et Gestion de la Performance Présentation L automatisation des process combinée à l informatique décisionnelle (Business Intelligence) offre une nouvelle plateforme de gestion pour
1 Introduction. Business Intelligence avec SharePoint Server 2010
Business Intelligence avec SharePoint Server 2010 1 Introduction Dans le chapitre précédent, nous avons créé une collection de sites et activé les fonctions de restitution décisionnelles du serveur SharePoint
SQL Server 2012 et SQL Server 2014
SQL Server 2012 et SQL Server 2014 Principales fonctions SQL Server 2012 est le système de gestion de base de données de Microsoft. Il intègre un moteur relationnel, un outil d extraction et de transformation
Gestion du parc informatique matériel et logiciel de l Ensicaen. Rapport de projet. Spécialité Informatique 2 e année. SAKHI Taoufik SIFAOUI Mohammed
6, bd maréchal Juin F-14050 Caen cedex 4 Spécialité Informatique 2 e année Rapport de projet Gestion du parc informatique matériel et logiciel de l Ensicaen SAKHI Taoufik SIFAOUI Mohammed Suivi ENSICAEN
Mercredi 15 Janvier 2014
De la conception au site web Mercredi 15 Janvier 2014 Loïc THOMAS Géo-Hyd Responsable Informatique & Ingénierie des Systèmes d'information [email protected] 02 38 64 26 41 Architecture Il est
Nell Armonia Shuttle Web
Nell Armonia Shuttle Web Optimiser la collecte, la mise à jour et la fiabilité de vos indicateurs L'IDEE ET LA GENESE DU PRODUIT LA PROBLEMATIQUE Les entreprises disposent aujourd hui de multiples indicateurs
Sage 100 CRM Guide de l Import Plus avec Talend Version 8. Mise à jour : 2015 version 8
Sage 100 CRM Guide de l Import Plus avec Talend Version 8 Mise à jour : 2015 version 8 Composition du progiciel Votre progiciel est composé d un boîtier de rangement comprenant : le cédérom sur lequel
MyReport Le reporting sous excel. La solution de business intelligence pour la PME
La solution de business intelligence pour la PME Qu est que la business intelligence La Business intelligence, dénommée aussi par simplification "Informatique Décisionnelle", est vraisemblablement l'unique
4. Utilisation d un SGBD : le langage SQL. 5. Normalisation
Base de données S. Lèbre [email protected] Université de Strasbourg, département d informatique. Présentation du module Contenu général Notion de bases de données Fondements / Conception Utilisation :
SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)
SGBDR Systèmes de Gestion de Bases de Données (Relationnelles) Plan Approches Les tâches du SGBD Les transactions Approche 1 Systèmes traditionnels basés sur des fichiers Application 1 Gestion clients
Introduction MOSS 2007
Introduction MOSS 2007 Z 2 Chapitre 01 Introduction à MOSS 2007 v. 1.0 Sommaire 1 SharePoint : Découverte... 3 1.1 Introduction... 3 1.2 Ce que vous gagnez à utiliser SharePoint... 3 1.3 Dans quel cas
Utiliser SQL Server 2008 R2 Reporting Services comme source de donne es pour Microsoft Excel
Utiliser SQL Server 2008 R2 Reporting Services comme source de donne es pour Microsoft Excel Excel est un des meilleurs outils de manipulation de données et parfois il est nécessaire d exploiter des données
Pourquoi migrer vers NAV 2013?
Pourquoi migrer vers NAV 2013? Comparatif entre Microsoft Dynamics NAV 2009 et Microsoft Dynamics NAV 2013 Le tableau ci-dessous propose une comparaison des caractéristiques techniques entre Microsoft
TP2 DE BUSINESS INTELLIGENCE ISIMA ZZ3 F3
TP2 DE BUSINESS INTELLIGENCE ISIMA ZZ3 F3 30/11/2011 Plan du TP 2 Rappel sur la chaine de BI Présentation de la suite Microsoft BI Ateliers sur SSIS (2H) Ateliers sur RS (2H) 3 Rappel sur la chaine de
Un datawarehouse est un entrepôt de données (une base de données) qui se caractérise par des données :
Page 1 of 6 Entrepôt de données Un article de Wikipédia, l'encyclopédie libre. L'entrepôt de données, ou datawarehouse, est un concept spécifique de l'informatique décisionnelle, issu du constat suivant
En synthèse. HVR pour garantir les échanges sensibles de l'entreprise
En synthèse HVR pour garantir les échanges sensibles de l'entreprise Le logiciel HVR fournit des solutions pour résoudre les problèmes clés de l'entreprise dans les domaines suivants : Haute Disponibilité
1 JBoss Entreprise Middleware
1 JBoss Entreprise Middleware Les produits de la gamme JBoss Entreprise Middleware forment une suite de logiciels open source permettant de construire, déployer, intégrer, gérer et présenter des applications
27 janvier 2011. Issam El Hachimi Ludovic Schmieder
27 janvier 2011 Issam El Hachimi Ludovic Schmieder Le Business Intelligence Les ETL PDI Talend Démo : 2 exemples Constat et comparatif Conclusion 2 «Il faut connaitre le client pour connaitre ses besoins»
MEDIAplus elearning. version 6.6
MEDIAplus elearning version 6.6 L'interface d administration MEDIAplus Sommaire 1. L'interface d administration MEDIAplus... 5 2. Principes de l administration MEDIAplus... 8 2.1. Organisations et administrateurs...
1 Actuate Corporation 2012. + de données. + d analyses. + d utilisateurs.
1 Actuate Corporation 2012 + de données. + d analyses. + d utilisateurs. Actuate et BIRT Actuate est l Editeur spécialiste de la Business Intelligence et le Reporting qui a créé le projet Open Source BIRT
ETL Extract - Transform - Load
ETL Extract - Transform - Load Concept général d analyse en ligne (rappels) Rémy Choquet - Université Lyon 2 - Master 2 IIDEE - 2006-2007 Plan Définitions La place d OLAP dans une entreprise OLAP versus
Module SpireAPI : fonctions communes aux application Spirea / Module Open-Source
Module SpireAPI : fonctions communes aux application Spirea / Module Open-Source Le logiciel SpireAPI permet de gérer et centraliser des référentiels pour les utiliser dans d'autres applications egroupware
