27 janvier 2011. Issam El Hachimi Ludovic Schmieder

Documents pareils
Analyse comparative entre différents outils de BI (Business Intelligence) :

Principe, applications et limites

Introduction: 1. définition d un ETL 2. importance et diversité des données spatiales utilitédes ETL géographiques

BI Open Source Octobre Alioune Dia, Consultant BI

Catalogue Formation «Vanilla»

Pentaho : Comparatif fonctionnel entre la version Communautaire (gratuite) et la version Entreprise (payante) Table des matières

BI = Business Intelligence Master Data-Science

DataStudio. Solution d intégration des données et de diffusion de l information

BUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise

Surmonter les 5 défis opérationnels du Big Data

Chapitre 9 : Informatique décisionnelle

Fournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement

Suite Jedox La Business-Driven Intelligence avec Jedox

BUSINESS INTELLIGENCE

BUSINESS INTELLIGENCE

CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2012

Sécurité des entrepôts de données dans le Cloud Un SaaS pour le cryptage des données issues d un ETL

Gestion de données avec TALEND

Business & High Technology

MyReport, LE REPORTING SOUS EXCEL

TP2_1 DE BUSINESS INTELLIGENCE ISIMA ZZ3 F3

BUSINESS INTELLIGENCE

Intégration de Données et Systèmes Décisionnels. Au cœur de la performance

Business Intelligence avec SQL Server 2012

FORMATION TALEND. Page 1 sur 9

MANAGEMENT DES SERVICES INFORMATIQUES

_L'engagement qui fait la différence BUSINESS INTELLIGENCE DATA WAREHOUSING PILOTAGE DE LA PERFORMANCE

LES ENTREPOTS DE DONNEES

Introduction à ORACLE WAREHOUSE BUILDER Cédric du Mouza

Pilot4IT Tableaux de Bord Agréger et consolider l ensemble de vos indicateurs dans un même portail.

ORACLE DATA INTEGRATOR ENTERPRISE EDITION - ODI EE

Travail de diplôme 2011 Business Intelligence Open Source SpagoBI/Talend Résumé

Petit Déjeuner Pépinière du Logiciel Libre. 25 juin 2008

TP2 DE BUSINESS INTELLIGENCE ISIMA ZZ3 F3

Business Intelligence avec Excel, Power BI et Office 365

INGÉNIEUR - DÉVELOPPEUR CONFIRMÉE ORACLE - PL/SQL. 27 ans - 4 ans d'expérience

Didier MOUNIEN Samantha MOINEAUX

Vers une vraie alternative du libre dans les logiciels d aide à la décision (BI)

Q.U.I.D QUALITÉ ET URBANISATION DE L'INFORMATION DÉCISIONNELLE. Tom BIZET & Stéphane SITBON 2008

Fiabilisez la diffusion de vos messages!

CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2014

Offre INES CRM + BI MyReport. Logiciels pour une meilleure performance commerciale

CATALOGUE DE FORMATIONS SAP BUSINESS OBJECTS. Edition 2012

Echapper légalement à l impôt sur les données

Le "tout fichier" Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique

X2BIRT : Mettez de l interactivité dans vos archives

Le terme «ERP» provient du nom de la méthode MRP (Manufacturing Ressource Planning) utilisée dans les années 70 pour la gestion et la planification

Curriculum Vitae. GISBERT Aurélien Ingénieur Informatique INSA Senior Business & Data Analyst Business Intelligence 11 ans d expérience

JASPERSOFT : Répondre à la demande croissante face à un reporting de plus en plus complexe.

Catalogue Formations Offre «DECISIONNEL»

Formations 2015 JASPER, REDMINE, TABLEAU, TALEND, SPAGO BI SYNALTIC 24 RUE DE L EGLISE VINCENNES

INTRODUCTION A LA B.I AVEC PENTAHO BUSINESS ANALYTICS Formation animée par

SQL Server 2012 et SQL Server 2014

Décisionnel. SI Virtualisé. Performant. Cloud. SAP BusinessObjects. Dashboards. Expertise. Succès. Service Reporting. Finance. SaaS. Web 2.0.

INGÉNIEUR - DÉVELOPPEUR EXPÉRIMENT É PHP - MAGENT O. 30 ans - 6 ans d'expérience

Formations 2015 JASPER, REDMINE, TABLEAU, TALEND, SPAGO BI ALTIC & SYNOTIS - TRAINING CENTER 24 RUE DE L EGLISE VINCENNES

CATALOGUE DE FORMATIONS SAP BUSINESS OBJECTS. Edition 2013

La Business Intelligence pour les Institutions Financières. Jean-Michel JURBERT Resp Marketing Produit

Cursus Sage ERP X3 Outils & Développement. Le parcours pédagogique Sage ERP X3 Outils et Développement

GUIDE COMPARATIF ETL.

ANTICIPEZ ET PRENEZ LES BONNES DÉCISIONS POUR VOTRE ENTREPRISE

MyReport, une gamme complète. La Business Intelligence en toute simplicité : Concevez, partagez, actualisez! pour piloter votre activité au quotidien.

1 Actuate Corporation de données. + d analyses. + d utilisateurs.

BIRT (Business Intelligence and Reporting Tools)

MYXTRACTION La Business Intelligence en temps réel

Domaines d intervention

CAHIER DES CHARGES D IMPLANTATION

IMPLEMENTATION D UN SYSTEME D INFORMATION DECISIONNEL

Business Intelligence : Informatique Décisionnelle

UE 8 Systèmes d information de gestion Le programme

Migration et import de données

Un datawarehouse est un entrepôt de données (une base de données) qui se caractérise par des données :

Plan de cours. 1. Mise en contexte. 2. Place du cours dans le programme. 3. Descripteur du cours

Offre Décisionnel / CONSEIL, SOLUTIONS DE TRANSFORMATION ET SERVICES IT. Offre Décisionnel

Easy to. report. Connexion. Transformation. Stockage. Construction. Exploitation. Diffusion

La Business Intelligence en toute simplicité :

Introduction à la B.I. Avec SQL Server 2008

Intelligence Economique - Business Intelligence

RMLL Présentation Activité Pentaho

Projet M1 Sujet 21 : Développement d'un logiciel simplifié de type Business Object

Bases de Données Avancées

THOT - Extraction de données et de schémas d un SGBD

JEDOX FACTSHEETS SELF-SERVICE BUSINESS INTELLIGENCE, ANALYTICS & PERFORMANCE MANAGEMENT

Expert technique J2EE

Didacticiel Études de cas. Description succincte de Pentaho Data Integration Community Edition (Kettle).

Big Data. Cyril Amsellem Consultant avant-vente. 16 juin Talend

Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP)

Objectif. Participant. Prérequis. Oracle BI Suite EE 10g R3 - Développer des référentiels. 5 Jours [35 Heures]

Chef de Projet Web. Expériences. Compétences. Diplômes. Formations. Communication. Informatique

Catalogue de Formations ORSYP

Programme scientifique Majeure ARCHITECTURE DES SYSTEMES D INFORMATION. Mentions Ingénierie des Systèmes d Information Business Intelligence

SCOM 2012 (System Center Operations Manager) De l'installation à l'exploitation, mise en oeuvre et bonnes pratiques

Guide de la documentation des produits BusinessObjects XI

LANDPARK ACTIVE DIRECTORY OPEN/LDAP

DEMARREZ RAPIDEMENT VOTRE EVALUATION

Agenda. Le groupe Keyrus. Orange Tunisie. Présentation du projet. Choix initial de Talend Open Studio. Evolution de la plateforme. Nécessité de migrer

L art d ordonnancer. avec JobScheduler. François BAYART

HR CRM VENTES PROJETS ACHATS PRODUCTION COMPTABILITE GESTION DES STOCKS

Offre CRM Analytique Logiciels pour une meilleure performance commerciale, 2011

Transcription:

27 janvier 2011 Issam El Hachimi Ludovic Schmieder

Le Business Intelligence Les ETL PDI Talend Démo : 2 exemples Constat et comparatif Conclusion 2

«Il faut connaitre le client pour connaitre ses besoins» Avant : Sondage : Coûteux, faible échantillon Aujourd hui : Profils déterminés en fonction des données récoltées Le marketing suit une tendance reposant sur l analyse des données. 3

Pour comprendre les tendances, analysons : Forfait téléphonique & Age du client Identification de profils clients Produit & Localisation d un supermarché Identification de zones de vente Période & Transport ferroviaire Identification des fréquentations 4

«C est l exploitation des données de l entreprise dans le but de faciliter la prise de décision» 5

Volume 10 5 0 Volume Volume 6

2,5 2 1,5 1 0,5 0 Décembre Novembre Octobre Octobre Novembre Décembre 7

8

Compréhension des données traitées Analyse de ces données Aide à la décision Exemple : Dans un magasin, croisement des produits, des ventes et de leurs emplacements : constat de zones froides et chaudes (peu et beaucoup de ventes) Développement des ventes 9

«Entrepôt de données opérationnelles et de gestion d une entreprise» Base de données destinée à contenir des données : historisées, persistantes, transverses au niveau métier, adaptées aux besoins d'analyse. 10

Besoin ressenti entre les sources de données et le Data Warehouse = transfert de données Supports multiples: Progiciels Bases de données Fichier XML, CSV Fichier Excel E-mail... S adapter aux systèmes opérationnels mis en place 11

ETL : Extract Transform Load Objectif : Réduire le coût de développement et de maintenance Avant d être enregistrées dans le Data Warehouse, les données peuvent être : Filtrées, Agrégées, Formatées, Croisées 12

Base de données Extract Transform* Load Bases de données Documents CSV XML ERP *Conversion de type, correction, filtre, agrégation, formatage 13

Initiation facile à des non-informaticiens Maintenance moins coûteuse Conception rapide Lecture/Ecriture des données sur un large choix de supports Pas besoin de Data Warehouse pour les utiliser 14

5 générations d ETL 1970 : Ordinateur Central (mainframe). Génération de COBOL. 1980 : Interface avec SQL. Usage limité avec SAP 1990 : Première IG. Connecteurs spécifiques 2000 : Gestion des flux temps-réel. Utilisation du XML 2005 : Informatique opérationnel. 15

Extract Load Transform : Même finalité mais fonctionnement différent ETL :Transformations effectuées ligne à ligne, par un moteur intermédiaire. ELT : Transformations en bloc, effectués par la source ou par la destination. Utilisation des outils fournis. Bases de données 16

ETL peu pertinent dans un environnement homogène On peut utiliser les deux! ETL avec composants ELT pur : Oracle Data Integrator (Sunopsis) Stambia 17

ETL Environnement hétérogène Abstraction du support Traitements effectués par le moteur intermédiaire ELT Environnement homogène Type de support restreint Traitement sur la source ou destination 18

ETL Tool versus Hand Coding? The answer is, It depends". Les sources sont-elles susceptibles d'être modifiées? Les supports sont-ils hétérogènes? Les données doivent-elles être transformées? 19

20

21

22

Anciennement Kettle, existe depuis 2000. Open source, licence LGPL. Community Edition: Gratuite. Entreprise Edition: Version d'évaluation de 30 jours, Support technique Maintenance 23

24

Processus ETL créé avec spoon. Création de transformations (vue micro) : traitement ligne à ligne de données. Création de jobs (vue macro) : envois de mails, transfert de fichiers appels de transformations, de jobs Planification avec kitchen et pan. 25

Utilisation de JavaScript pour le traitement spécifique de types primitifs. Envoi de mails Traitement FTP Communication avec serveur LDAP 26

Centralisation : Les jobs et transformations peuvent être enregistrées dans un repository. Les connexions aux bases sont aussi enregistrées. 27

Si la source de données n'existe plus? Si on a modifié la structure de la source de données? Si une source (ou destination) est indisponible, l'outil est-il apte à en sélectionner une autre? Les administrateurs sont-ils informés? 28

Gratuit, Open source, Licence GPL Sortie officielle 5 oct. 2006 Webinars, White Paper, Tutoriels, Documentation, Séminaires, Forum, Wiki International : USA, France, Japon, Autres pays européens 29

Certification "Talend Certified" Payant : Talend Integration Suite (Team, Pro, Entreprise...) Travail collaboratif Load balancing Outils de déploiement Support technique Outils BI (Dashboard, Job analyses, Audit, SOA...) Parallélisation des traitements 30

31

Basé sur Eclipse Génération de code Java ou Perl à partir des Jobs créées par l'utilisateur. Récupération des schémas des tables Génération de doc Traitements spécifiques par ajout de code en Java Composants principaux : SGBD, transformation, association, agrégation, filtrage, LDAP, XML, accès fichiers 32

Mode debug/traçage Modifier le code Composants spécifiques : FTP, POP/SMTP, Shell Composants personnels : Création de ses propres composants (Java/Perl) Utilisation de ceux de la communauté 33

Attrape les exceptions. Sortie : Console ou Fichier Jouer un scénario différent en cas d échec d un composant. 34

35

Durant l'installation? Durant l'utilisation? Deux philosophies différentes PDI: NullPointerException Problèmes d'actualisation lors de modification d'une base Talend: Eclipse et TOS doivent être lancés sur deux workspace différents. 36

Exemple 1 (PDI) : Création et alimentation des données : 1 heure Conception Job : 1 heure Estimation en Java : 1,5 jours Exemple 2 (Talend) : Création et alimentation bases de données : 1 heure Conception Job : 2 heures Estimation en Java : 2 jours 37

L'utilisation de code pour certains traitements => la partie la moins accessible à un noninformaticien. Les ETLs s'utilisent graphiquement : les développeurs peuvent avoir du mal. 38

Performances : PDI plus rapide dans le cas de transferts sans traitement*. Talend beaucoup plus rapide lors de croisements des données (facteur 20 dans certains cas)*. *Benchmark indépendant. 39

Avantages pour PDI : Communauté active. Sauvegarde des tâches dans une base de données relationnelle. Interface utilisateur plus appréciée. Avantages pour Talend : Performances supérieures, selon de multiples benchmarks. Prix La solution évolue plus rapidement 40

Les services proposés par PDI : service de maintenance service d'hébergement A partir de 45K pour 3 ans. Les services proposés Talend : Infrastructure indépendante au prix (intéressant pour les grandes infrastructures) Tarifs axés sur le nombre de développeur. Concurrence : nombre de cœur CPU. 5000 */développeur/an. Dégressif à partir de 3 licences. Même tarif pour 3 développeurs. *Valeur supposée 41

Sont des outils en plein essor, Fournissent une grande assistance lors du développement et de la maintenance, Ainsi que l abstraction des supports. Mais : les traitements complexes ne seront jamais entièrement accessibles à des noninformaticiens. 42

Livres : Le data webhouse - Analyser les comportements client sur le Web, Ralph Kimball et Richard Merz, Edition Eyrolles. Le Data Wharehouse - Le Data Mining, Jean-Michel Franco et EDS-Institut Prométhéus, Edition Eyrolles. Data mining et scoring - Bases de données et gestion de la relation client - Stéphane Tufféry, Edition Dunod. Mémoire : Le positionnement des systèmes ETL Berthier Rodolphe Web : http://etl-tools.info http://en.wikipedia.org/wiki/extract,_transform,_load http://www.stylusstudio.com/etl/ http://blog.atolcd.com 43

44