PDI. PENTAHO Data Integration



Documents pareils
Pentaho. présentation

Sage 100 CRM Guide de l Import Plus avec Talend Version 8. Mise à jour : 2015 version 8

TP2_1 DE BUSINESS INTELLIGENCE ISIMA ZZ3 F3

Manuel d utilisation de Gestion 6

VTX FTP. Transfert de fichiers business par FTP - Manuel de l'utilisateur. Informations complémentaires : info@vtx.

Analyse comparative entre différents outils de BI (Business Intelligence) :

Didacticiel Études de cas. Description succincte de Pentaho Data Integration Community Edition (Kettle).

Réglages du portail de P&WC

CRÉATION MODIFICATION

BIRT (Business Intelligence and Reporting Tools)

PRISE EN MAIN D UN TABLEUR. Version OPEN OFFICE

TP2 DE BUSINESS INTELLIGENCE ISIMA ZZ3 F3

Exécution de PCCOMPTA à distance sous Terminal Server 2003.

Groupe Eyrolles, 2003, ISBN : X

Sommaire. I.1 : Alimentation à partir d un fichier Access (.mdb)...2

Passerelle d'import/export entre PowerBoutique et Expeditor I Net

PRODIGE V3. Manuel utilisateurs. Consultation des métadonnées

Netstorage et Netdrive pour accéder à ses données par Internet

Enregistrement de votre Géorando Maxi Liberté

Guide SQL Server 2008 pour HYSAS

SOMMAIRE. Présentation assistée sur ordinateur. Collège F.Rabelais 1/10

Guide pour le bon fonctionnement des applications académiques avec Internet Explorer 7.x

Connecter le lecteur réseau de Pro-Cardex 3 Vérifier la version du gestionnaire de base de données 5 Procéder à l installation 6

Gestion des documents avec ALFRESCO

27 janvier Issam El Hachimi Ludovic Schmieder

Test de HSQLDB et Comparatif avec Sqlite

PRODIGE V3. Manuel utilisateurs. Consultation des métadonnées

Sauvegarde des données d affaires de Bell Guide de démarrage. Vous effectuez le travail Nous le sauvegarderons. Automatiquement

Procédure d installation des logiciels EBP sous environnement MAGRET

UltraBackup NetStation 4. Guide de démarrage rapide

PHP CLÉS EN MAIN. 76 scripts efficaces pour enrichir vos sites web. par William Steinmetz et Brian Ward

L accès à distance du serveur

Le Sphinx Millenium Modes opératoires Préparer, administrer, Dépouiller les enquêtes

Exploitation des données issues de BE ( utilisation du tableur CALC) Fiche de travail (individuelle ou en binôme)

SQL SERVER PRECONISATIONS A L INSTALLATION.2 VERIFICATION INSTALLATION...2 CONNEXION RESEAU.4 EMPLACEMENTS DOSSIERS & SAUVEGARDES...

TeamViewer 7 Manuel Manager

HTTP Commander. Table des matières. 1-Présentation de HTTP Commander

Document d accompagnement pour l utilisation du Cartable en ligne Lycée des Métiers Fernand LÉGER 2013/2014

Création d une connexion VPN dans Windows XP pour accéder au réseau local de l UQO. Document préparé par le Service des technologies de l information

CREATION D UN COMPTE PERSONNEL D-MARCHE

Guide de l utilisateur Mikogo Version Windows

But du papier : Paramétrer WSUS pour récupérer les mises à jour et administrer le serveur WSUS

Création d un document PublishView

Initiation à LabView : Les exemples d applications :

FileMaker Server 14. Guide de démarrage

Installation et configuration du serveur syslog sur Synology DSM 4.0

Contenu Microsoft Windows 8.1

Fiche n 25 01/03/2002. Power Archiver

Mercredi 15 Janvier 2014

INTERCONNEXION ENT / BCDI / E - SIDOC

PROCEDURE D INSTALLATION DES LOGICIELS EBP EN ENVIRONNEMENT ESU4

Progitek Extraire Web s version 4.0 (Prix public 19 NET ) DESCRIPTION

Catalogue Formation «Vanilla»

INITIATION A L INFORMATIQUE. MODULE : Initiation à l'environnement Windows XP. Table des matières :

1. Aménagements technologiques 2. Installation de Microsoft SQL Server Microsoft SQL Server 2008 Service Pack 3

Contenu Windows 8 MODULE 1 AVANT-PROPOS MODULE 2 INTRODUCTION À WINDOWS 8 MODULE 4 APPLICATIONS WINDOWS 8 PARTIE 1 MODULE 3 PARAMÈTRES DE WINDOWS 8

PHILA-Collector-USB-16Go Pour Windows & Android

Sous réserve de modifications techniques et des disponibilités, fabrication française.

Le logiciel de création de site internet IZISPOT est un outil très puissant et qui est assez simple après quelques temps d utilisation.

POUR ALLER UN PEU PLUS LOIN SUR UN TABLEUR. Version EXCEL

ESPACE COLLABORATIF. L Espace Collaboratif : votre espace de partage entre acteurs régionaux

Correction des Travaux Pratiques Organiser son espace de travail

Apps Sage : les 10 étapes pour publier vos données dans le Cloud.

PerSal Manuel d installation

Baccalauréat professionnel GESTION ADMINISTRATION

Construire des plug-ins pour SAS Management Console SAS 9.1

Fiery E100 Color Server. Impression

FileMaker Server 14. Aide FileMaker Server

Procédure d installation :

UTILISATION DU WEB-FFS SUR FFSSKI (Dépôt des épreuves et inscription des concurrents)

et dépannage de PC Configuration Sophie Lange Guide de formation avec exercices pratiques Préparation à la certification A+

Découvrir l'ordinateur (niveau 2)

INTRODUCTION. Pour réaliser une pièce sur Charlyrobot, il faut le faire en trois étapes :

Migration d une Base de données

Édu-groupe - Version 4.3

Procédure d installation de mexi backup

Déclarer un serveur MySQL dans l annuaire LDAP. Associer un utilisateur DiaClientSQL à son compte Windows (SSO)

Open Source Job Scheduler. Installation(s)

Mode d emploi CONNEXION AU TERMINAL SERVER

Manuel de l utilisateur

Easy to. report. Connexion. Transformation. Stockage. Construction. Exploitation. Diffusion

1 - Se connecter au Cartable en ligne

OwnCloud. Définition 1 / 10. Date d'édition 03/09/2013 Public concerné Étudiants, Personnels Version du logiciel

HAYLEM Technologies Inc.

1. CRÉER UNE LISTE DE CONTACTS

INTERCONNEXION ENT / BCDI / E - SIDOC

ACCÈS À MOODLE PAR INTERNET PROCÉDURE POUR LES ÉTUDIANTES ET LES ÉTUDIANTS POUR SE DOTER D UN NOUVEAU MOT DE PASSE

Manuel d utilisation NETexcom

Se connecter en WiFi à une Freebox

DOCUMENTATION POINT FACTURE

Utilisation de l éditeur.

Comment se connecter au VPN ECE sous vista

Manuel d utilisation de l outil collaboratif

INSTALLATION CONFIGURATION D OWNCLOUD. La réponse informatique

Utiliser le portail d accès distant Pour les personnels de l université LYON1

Guide d installation TV sur ordinateur Internet 3G+

NETSUPPORT SCHOOL 7 MAÎTRISEZ VOTRE ESPACE DE TRAVAIL ET CELUI DE VOTRE CLASSE INFORMATIQUE

Poll-O Guide de l utilisateur. Pierre Cros

Numérisation. Copieur-imprimante WorkCentre C2424

Transcription:

PDI PENTAHO Data Integration

Planification ETL Identification des Sources et Destinations de Données Les sources de données Périodes d'extraction et de chargement Extraction Définir les fenêtres d'extraction pour chaque source de données, les données peuvent éventuellement être stockées dans des bases de données temporaires Chargement Estimer 2

Evaluation des Données Sources Structure et format des données BDR, Tableurs, csv, xml, services web, fichiers plats Format des données Evaluer le volume des données Identifier les données à extraire Il faut sélectionner uniquement les lignes nouvellement créées ou modifiées depuis la dernière extraction. Identifier les anomalies 3

PDI Pentaho Data Integration (anciennement K.E.T.T.L.E Kettle ETTL Environment) est un E.T.T.L, Extraction Transport Transformation Loading. Concepts PDI Transformations Jobs Composants PDI SPOON: un EDI pour créer les transformations et les jobs.(ou tâches ) Kitchen: outil en ligne de commande pour exécuter les jobs. Pan: outil en ligne de commande pour exécuter les transformations. Carte: un serveur léger pour exécuter les jobs et les transformations sur un serveur distant. 4

SPOON Créer une transformation à l aide de SPOON Créez un fichier texte dans un dossier nommé D:/BI/atelier1/ nommé source1.txt Contenant une liste de noms(tous les fichiers de cet atelier doivent être enregistrés dans le même dossier atelier1) exemple: Lancez SPOON à partir du dossier Pentaho\data-integration Fichier /Nouveau /Transformation, enregistrer la transformation nom de la transformation: Atelier1.ktr

Ajout de l étape «Extraction depuis fichier» Dans le volet «Palette de création», glissez l étape «Extraction depuis fichier», vers la transformation atelier1 Double cliquez sur l icone «Extraction depuis fichier» pour définir ses propriétés Fichier ou répertoire: Fichier source1.txt, sélectionnez le fichier et cliquez sur «ajouter» Effacer le contenu des champs «Delimited» et «Entouré par», dans l onglet contenu. Type fichier: Fixed. Dans l onglet «Champs», cliquez sur le bouton «Obtenir les champs»

Etape «Ajout Constantes» Dans la catégorie «Transformation» glissez l étape «Ajout constantes» Définir les deux constantes suivantes: Nom: message; Type: String; Value: Bonjour Nom: exclamation; Type: String; Value:! 7

8 Ajout d un lien de «Extraction depuis fichier» vers «Ajout constantes» Gardez «MAJ» ( ou la roulette de la souris ) Appuyée et glissez «Extraction depuis fichier» vers «Ajout constantes» Une autre possibilité est d ajouter un lien depuis le nœud «liens» dans le volet «navigation»

9 Ajout d une étape «Alimentation fichier» Ajoutez une étape «Alimentation fichier» à partir de la catégorie «Alimentation». Ajoutez un lien «Ajout constantes» vers «Alimentation fichier». Définir les propriétés de l étape «Alimentation fichier»: Nom: sortie Extension : txt Dans l onglet «Contenu» effacer le «Entouré par». champs «Délimiteur»: (espace) Dans le volet «Champs», cliquez sur «Récupérer champs». Cliquez sur «Largeur minimale» pour effacer les espaces. Changez l ordre des champs comme suit:

Créer des connexions.dans le vote «Connexions», le nœud permet de créer des connexions à des bases de données. Exemple: Création d une connexion SqlLite enregistrez la transformation précédente sous «atelier2.ktr». Créez une connexion avec les paramètres suivants: Nom de la connexion: SQLite Type de base de données: SQLite. Type d accès base de données: JDBC. Nom du serveur: atelier2/sqlite.sqlite Port : -1 Glissez l étape «Alimentation dans table» sur le lien entre «Ajout constantes» et «Alimentation fichier» 10

11 Propriétés de l étape «Insertion dans table»: Table cible: table1 Cliquez sur le bouton SQL, puis sur le bouton «Exécuter» dans la nouvelle fenêtre qui s ouvre pour créer la table table1.

Exemple 2 Objectifs: Chargement des données sur les ventes dans une table à partir d un fichier texte csv avec traitement des données manquantes: Fichier source: C:\pentaho\dataintegration\samples\transformations\files\sales_data.c sv.

Connexion HSQLDB (Hypersonic SQLDB)

Connexion Mysql Le pilote Mysql doit être copié dans le dossier pentaho\dataintegration\libext\ JDBC

Étape Recherche de code postal

Etape: Recherche dans flux