Documentation Talend. Charly Riviere CDG35



Documents pareils
Sage 100 CRM Guide de l Import Plus avec Talend Version 8. Mise à jour : 2015 version 8

GUIDE D INSTALLATION INTERNET haute vitesse

SOMMAIRE... 1 ESPACE DU CLUB...

Ces Lettres d informations sont envoyées aux extranautes inscrits et abonnés sur le site assistance (voir point N 3).

Guide SQL Server 2008 pour HYSAS

Déclarer un serveur MySQL dans l annuaire LDAP. Associer un utilisateur DiaClientSQL à son compte Windows (SSO)

GUIDE DE DEMARRAGE V1.02

Manuel du logiciel PrestaTest.

Ecran principal à l ouverture du logiciel

Déclarer un serveur MySQL dans l annuaire LDAP. Associer un utilisateur DiaClientSQL à son compte Windows (SSO)

Une fois votre tableau excel complet, cliquer sur fichier enregistrer sous type de fichier (menu déroulant) csv (séparateur : point virgule).

I. Instalation de l environnement JDK et JRE : II. Configuration outil Reporting : Pentaho... 4

Logiciel libre, OpenMeetings permet de créer ou simplement de participer à des conférences en ligne.

NETWORK & SOFTWARE ENGINEERING MANUEL D UTILISATEUR. Logiciel TIJARA. NETWORK AND SOFTWARE ENGINEERING Manuel d'utilisateur "TIJARA" 1

DOSSIER D'ACTIVITES SUR LE PHP N 03 Créer une base de données MySQL avec PHPMyAdmin

Paiement sécurisé sur Internet. Pack Factures Documentation générale sur le paiement de factures par carte bancaire sur apayer.fr

COURS WINDEV NUMERO 3

Voyez clair dans vos finances avec AccèsD Affaires

DATALOGGERS SEFRAM LOG1601 et LOG1620

Migration d une Base de données

Premiers pas avec SES-Pegase (version 7.0) SES : Un Système Expert pour l analyse Statistique des données. Premiers pas avec SES-Pegase 1

Numérisation. Copieur-imprimante WorkCentre C2424

SOMMAIRE. Présentation assistée sur ordinateur. Collège F.Rabelais 1/10

Structure fonctionnelle d un SGBD

Veuillez noter que vous devez changer de Code d Accès Internet tous les 60 jours pour des raisons de sécurité.

LES BIBLIOTHEQUES DE WINDOWS 7

Configuration de Outlook Express 6 pour utilisation avec belgacom.net

HTTP Commander. Table des matières. 1-Présentation de HTTP Commander

GUIDE D UTILISATION DE L ISU SEPTEMBRE 2013 GUIDE D UTILISATION DU NAVIGATEUR UIS.STAT (VERSION BÊTA)

Guide Utilisateur ArkadinAnywhere

PRODIGE V3. Manuel utilisateurs. Consultation des métadonnées

Manuel d utilisation DeveryLoc

LANDPARK ACTIVE DIRECTORY OPEN/LDAP

Access et Org.Base : mêmes objectifs? Description du thème : Création de grilles d écran pour une école de conduite.

Enregistrement de votre Géorando Maxi Liberté

Créer le schéma relationnel d une base de données ACCESS

CEGID - Business Suite Gestion commerciale

GUIDE D UTILISATION ADSL ASSISTANCE

Comment se connecter au VPN ECE sous vista

Manuel Utilisateur Chariot odys.sante-lorraine.fr

La Clé informatique. Formation Excel XP Aide-mémoire

Principe, applications et limites

MEDIA NAV Guide de téléchargement de contenus en ligne

Table des matières L INTEGRATION DE SAS AVEC JMP. Les échanges de données entre SAS et JMP, en mode déconnecté. Dans JMP

Cahier Technique Liaison Comptabilité Api / Sage ECF

Avertissement : Nos logiciels évoluent rendant parfois les nouvelles versions incompatibles avec les anciennes.

Guide d installation

HighPush. document /06/2009 Révision pour version /11/2008 Revision pour la /10/2008 Documentation initiale.

ADELIE. Alerte-DEtection-Localisation-IncendiE. Documentation du logiciel Interface Homme / Machine du poste opérateur

Manuel d utilisation du site web de l ONRN

NOTICE TELESERVICES : Demander un état hypothécaire

INSTALLATION ET PRISE EN MAIN

Fiche Technique. MAJ le 27/03/2012. Lorsque vous activez l Assistance à distance Windows, vous pouvez effectuer les opérations suivantes :

Guide d utilisation de PL7 Pro Récupérer ou transférer un programme

Créer un hotspot Wifi sous Windows 8.1 sans logiciel

Utilisation de l outil lié à MBKSTR 9

TP2_1 DE BUSINESS INTELLIGENCE ISIMA ZZ3 F3

Manuel d utilisateur 1

Service On Line : Gestion des Incidents

PROCEDURE D EXPORT-IMPORT DU CERTIFICAT InVS INTERNET EXPLORER

Commencer avec Allplan Exchange. Nemetschek Allplan Systems GmbH, Munich. All rights reserved. Enregistrement

Guide d installation CLX.PayMaker Office (3PC)

Guide sommaire de TecLocal

Méthode de préparation du fichier texte d import depuis Excel, via Access jusqu à Drupal.

Configuration de base de Jana server2. Sommaire

MANUEL UTILISATEUR : RECETTES TABLE DES MATIERES PIE : PRESTATIONS INTERNES ET EXTERNES

Procédure d installation détaillée

Manuel utilisateur. Version 1.6b

L accès à distance du serveur

Your Detecting Connection. Manuel de l utilisateur. support@xchange2.net

Comment utiliser FileMaker Pro avec Microsoft Office

Configuration de GFI MailArchiver

Guide pratique pour les gestionnaires de flotte

TUTORIEL D INSTALLATION D ORACLE ET DE SQL DEVELOPPER TUTORIEL D INSTALLATION D ORACLE...1 ET DE SQL DEVELOPPER...1

CAPTURE DES PROFESSIONNELS

Thunderbird est facilement téléchargeable depuis le site officiel

AVEC LIVE TRADER, VISEZ PLUS HAUT POUR VOS INVESTISSEMENTS

Ce guide décrit la procédure à suivre afin de profiter pleinement du Service de Transfert de Fichiers EGIS. Il décrit

Table des matières PRESENTATION DU LANGAGE DS2 ET DE SES APPLICATIONS. Introduction

LOGICIEL KIPICAM : Manuel d installation et d utilisation

COMMENT AJOUTER DES ENTREPRISES À VOTRE PORTEFEUILLE DE SURVEILLANCE. 05/01/2015 Creditsafe France

Guide exploitant du contrôleur Legrand

Date: 22/10/12 Version: 3.2

Un logiciel pour aller plus loin dans la gestion de vos espaces. Mémo technique

Quick Start Installation de MDweb version 2.3

Voici les objectifs de la séance d'aujourd'hui :

italc - GUIDE DE PRISE EN MAIN RAPIDE

Guide d utilisation. Version 1.1

Sauvegarde des données d affaires de Bell Guide de démarrage. Vous effectuez le travail Nous le sauvegarderons. Automatiquement

Importation des données dans Open Office Base

PRÉSENTÉ PAR : NOVEMBRE 2007

MODE D EMPLOI V.2.0. Installation. Nouveautés V.02. Fais ton journal - version mars Mode d emploi -

Cher utilisateur, Nous vous souhaitons une excellente utilisation d INES.FreeEdition. L équipe INES info@ines.eu

Introduction à Eclipse

Formation. Module WEB 4.1. Support de cours

Le pare-feu de Windows 7

AIDE à l utilisation du cédérom «L athlétisme à l école» Niveau Primaire SOMMAIRE

Organiser vos documents Windows XP

Europresse.com. Pour bibliothèque d enseignement Pour bibliothèque publique. Consulter facilement la presse. Guide version 1.

Construction d un EDD avec SQL 2008 R2. D. Ploix - M2 Miage - EDD - Création

Transcription:

Documentation Talend Charly Riviere CDG35

1. Présentation générale Talend est un ETL pour "Extract Transform Load". Comme son nom l'indique il permet d'extraire des données pour ensuite les transformer à souhait et les charger dans une autre base. On manipule des objets graphiques représentant, par exemple, une connexion à une base de données puis on relie les composants entre eux. Du code Java est généré automatiquement ce qui permet de gagner du temps. Prenons par exemple le cas où une entreprise veut changer d'application tout en gardant ses données. Talend permet d'extraire les données existantes pour les manipuler et les rendre compatibles avec la nouvelle base si besoin. Il n'y a donc pas besoin de développer un outil exprès pour transférer les données d'une application à une autre puisque c est fait avec Talend. 2. Contexte entreprise Le CDG 35 fait partie de la coopération informatique GO+ (Grand Ouest Plus) qui rassemble plusieurs centres de gestions d'autres départements et qui a pour but de mutualiser les moyens et compétences pour créer des applications adaptés à leurs besoins. Une collectivité souhaite utiliser une partie des données de la base qui alimente cette application. Dans ce contexte, le centre de gestion a pour rôle de réaliser des manipulations de données par le biais du logiciel Talend en fonction des spécifications demandés par la collectivité. Mon rôle est donc de créer un job Talend suivant des spécifications prédéfinis. Celui-ci sera par la suite utilisé en production. 2.1 Les spécifications La collectivité souhaitant utiliser des données créé un «tableau de spécification». Ce document permet à la collectivité de spécifier le format de sortie du fichier qu ils ont à utiliser dans leur logiciel. Voici un exemple de ce document : Déb Fin Long Rubriques Type Obl Observations 1 10 10 Référence du Tiers x O Identifiant du tiers. Si le tiers ainsi référencé n existe pas l ensemble du fichier sera rejeté. 11 61 51 Compte budgétaire: x O Si le compte budgétaire ainsi référencé n existe pas l ensemble du fichier sera rejeté. Gestionnaire (10c) (il convient d initialiser à blanc les composants du compte budgétaire qui seraient sans objet) Code fonctionnel (7c) Nature (10c) ZONE Z28 Opération (10c) Z38 Service (4c) Z48 Antenne (10c) 62 62 1 Dépenses/Recettes x O D ou R 63 64 2 Budget x O Identifiant du budget. Si le budget ainsi référencé n existe pas l ensemble du fichier sera rejeté.

65 68 4 Exercice num O ex: 2008 L identifiant du budget doit être unique quelle que soit la collectivité. 69 78 10 Date x O Sous la forme: AAAA-MM-JJ 79 88 10 Utilisateur x O Si l utilisateur ainsi référencé n existe pas l ensemble du fichier sera rejeté. Si notion inexistante mettre CIRIL. 89 90 2 Code TVA x Si notion inexistante mettre 00 Exemple du tableau : (Le fichier de sortie doit être au format.csv.) Pour la 1 ère ligne, la taille du champ doit être de 10 caractères. Le type «x» signifie que la valeur peut-être de type numérique ou alphanumérique. La colonne «Rubriques» spécifie les données à sélectionner. La colonne «Obligation» indique si la valeur est obligatoire ou si elle peut être nulle. La dernière indique ajoute des informations sur la gestion des cas de test à inclure dans le Talend. Ce tableau va permettre de construire le Talend en gérant les cas de test et d erreurs. 3. Présentation du logiciel Lorsqu on lance le logiciel on arrive sur cette fenêtre qui permet de choisir sur quel projet démarrer : Puis on clique sur «Ouvrir» pour ouvrir le projet.

Sur l écran ci-dessus, on clique sur «Start now!» pour ouvrir le projet. Voici l interface principale. En haut (1), on retrouve les icônes permettant d exécuter un job ce qui compile le code générée par Talend lors de la mise en place des objets graphiques. Le panneau de gauche (2) est constitué de différents éléments tels que les Jobs qui permettent de manipuler les données, les Contextes qui permettent de mettre en place des variables, les Métadonnées permettant par exemple d enregistrer des données d accès à une base de données et d autres éléments. Le panneau du centre (3) représente le job par le biais d objets graphiques et de liens entre eux. En bas à gauche (4), on trouve la structure du job, on y retrouve la liste des noms des objets graphiques utilisés dans le job sélectionné.

En (5) on a un panneau qui permet de configurer les éléments des composants graphiques. Par exemple pour un objet de connexion à une base de données il faut spécifier le nom de la base ainsi que le login et le mot de passe d accès et plusieurs autres informations. Il est aussi possible de débugger le programme ou encore de donner des valeurs si des variables de contexte existent. Le panneau de droite (6) permet de sélectionner les objets graphiques qui sont triés par catégories. 4. Job d extraction des données 4.1 Présentation générale Voici le job d extraction de données qui permet de sélectionner certaines données de l application 1 (Java client lourd) et d écrire le résultat dans un fichier.csv : 4.2 Présentation par composants Partie Prejob : Le composant «tprejob_1» indique que la séquence qui suit va être exécuté avant l exécution du job.

Le composant «tfileexist_1» permet de vérifier l existence d un fichier. On doit lui indiquer le chemin du fichier : Le composant «tfiledelete_1» permet de supprimer le fichier s il existe. La liaison entre le composant tfileexist et tfiledelete est un if qui permet d indiquer que, si le fichier existe, il est supprimé pour laisser la place à celui qui sera créé après. Partie connexion : Le composant «toracleconnection_1» permet d établir la connexion avec la base Oracle en liaison avec l application 1. Voici ses paramètres : Le composant «tdie_1» permet de stopper l exécution du job si la connexion à la base de données n a pas fonctionnée.

Partie traitement : Le composant «toracleinput_1» permet d effectué le «Select» des données nécessaires. Il faut saisir une requête SQL dans un champ prévu à cet effet et sélectionner une connexion à une base de données disponible. Le composant «tlogrow_1» permet d afficher le résultat de la requête dans la fenêtre d exécution.

Le composant «tmap_1» permet de faire des tests sur les données entrantes. Il se présente comme ceci : On distingue 2 parties distinctes qu on peut diviser en plusieurs sous parties : Dans le premier encadré rouge en haut on trouve : A gauche, «row2» représente les données provenant du composant contenant la requête SQL de sélection des données. On y retrouve le nom des colonnes. Au centre, «var» permet d ajouter des variables ou d effectuer des opérations. C est ici qu on va pouvoir déclarer par exemple : Si la valeur contiens 10 caractères et qu il faut qu on en est 5 en sortie, on va créer une nouvelle chaine qui sera créée à partir du premier caractère en entrée jusqu au cinquième. On peut aussi vérifier si la valeur est nulle ou pas, supprimer les espaces blancs, etc A droite, on a le fichier de sortie. Le tableau est créé lorsqu on lie un composant tel que le «tfileoutputdelimited_1» qui permet d écrire dans un fichier.csv. Il est vide lors de la création et on l alimente ensuite en fonction des spécifications données. Le deuxième encadré rouge en bas permet d avoir une vue des types de données dans les colonnes. On peut aussi ajouter une colonne dans le tableau de droite pour ajouter un espace vide ou une valeur précise. Voici un exemple de traitement que peut réaliser le composant tmap : De gauche à droite : L id de la ligne est récupéré dans un premier temps.

On clique ensuite sur le bouton permettant d accéder au Constructeur d expression. On peut voir la fonction «Relational.ISNULL» qui prend en paramètre la colonne ID_DEMANDE. Ici, on teste donc si la valeur est nulle. Ensuite, dans le constructeur d expression du fichier d export, on trouve «!Var.exist». Cela veut dire que «Si la valeur est différente de null» le fichier sera créé.