Gestion de données avec TALEND



Documents pareils
TP2_1 DE BUSINESS INTELLIGENCE ISIMA ZZ3 F3

27 janvier Issam El Hachimi Ludovic Schmieder

Migration et import de données

TP2 DE BUSINESS INTELLIGENCE ISIMA ZZ3 F3

Introduction: 1. définition d un ETL 2. importance et diversité des données spatiales utilitédes ETL géographiques

Principe, applications et limites

FORMATION TALEND. Page 1 sur 9

Pentaho : Comparatif fonctionnel entre la version Communautaire (gratuite) et la version Entreprise (payante) Table des matières

Sécurité des entrepôts de données dans le Cloud Un SaaS pour le cryptage des données issues d un ETL

Sage 100 CRM Guide de l Import Plus avec Talend Version 8. Mise à jour : 2015 version 8

Formations QlikView / Business Intelligence

JASPERSOFT : Répondre à la demande croissante face à un reporting de plus en plus complexe.

Catalogue Formation «Vanilla»

Formations 2015 JASPER, REDMINE, TABLEAU, TALEND, SPAGO BI SYNALTIC 24 RUE DE L EGLISE VINCENNES

Q.U.I.D QUALITÉ ET URBANISATION DE L'INFORMATION DÉCISIONNELLE. Tom BIZET & Stéphane SITBON 2008

BI Open Source Octobre Alioune Dia, Consultant BI

CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2012

Mercredi 15 Janvier 2014

Construction d un environnement destiné à l'aide au pilotage

L ÉCHANGE DE DONNÉES TEMPS RÉEL

Big Data. Cyril Amsellem Consultant avant-vente. 16 juin Talend

Vers une vraie alternative du libre dans les logiciels d aide à la décision (BI)

Travail de diplôme 2011 Business Intelligence Open Source SpagoBI/Talend Résumé

Entrepôt de données 1. Introduction

Formations 2015 JASPER, REDMINE, TABLEAU, TALEND, SPAGO BI ALTIC & SYNOTIS - TRAINING CENTER 24 RUE DE L EGLISE VINCENNES

Introduction à ORACLE WAREHOUSE BUILDER Cédric du Mouza

Open Data. François Bancilhon twitter.com/fbancilhon Printemps de la recherche EDF R&D 28/9/12

Business Intelligence avec Excel, Power BI et Office 365

Petit Déjeuner Pépinière du Logiciel Libre. 25 juin 2008

Projet Ecureuil DataWarehouse CNIP. ETL avec Talend. Travail de diplôme Yannick Perret. Responsable de projet: Sylvie Bouchard

Formation Cloudera Data Analyst Utiliser Pig, Hive et Impala avec Hadoop

1 JBoss Entreprise Middleware

Didier MOUNIEN Samantha MOINEAUX

Utilisation d'outils de WebMapping OpenSource dans une collectivité territoriale Communauté de Communes de l'agglomération Saint-Loise (CCASL)

Agenda. Le groupe Keyrus. Orange Tunisie. Présentation du projet. Choix initial de Talend Open Studio. Evolution de la plateforme. Nécessité de migrer

Livret de Stages 2014 / 2015

Extensions, Documentation, Tutoriels, Astuces

Pierre Racine Professionnel de recherche Centre d étude de la forêt Département des sciences du bois et de la forêt, Université Laval, Québec

Analyse comparative entre différents outils de BI (Business Intelligence) :

Postes à pourvoir 2015

Messagerie & Groupeware. augmentez l expertise de votre capital humain

- Le LPC2E et les Bases de Données Spatiales - Valorisation des bases de données ondes

Nicolas ANGENIEUX GISMARTWARE

THÉMATIQUES. Comprendre les frameworks productifs. Découvrir leurs usages. Synthèse

Pilot4IT Tableaux de Bord Agréger et consolider l ensemble de vos indicateurs dans un même portail.

M Études et développement informatique

LANDPARK ACTIVE DIRECTORY OPEN/LDAP

Assurances & Mutuelles, Industrie, Santé, Énergie, Transport, Médias / Multimédias, Télécoms, Services

PostgreSQL. Formations. Catalogue Calendrier... 8

I. Instalation de l environnement JDK et JRE : II. Configuration outil Reporting : Pentaho... 4

Chapitre 9 : Informatique décisionnelle

Projet CASI: Master Data Management

Fournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement

NOVA BPM. «Première solution BPM intégr. Pierre Vignéras Bull R&D

Master Data Management en Open Source C est le Bon Moment

Programme scientifique Majeure ARCHITECTURE DES SYSTEMES D INFORMATION. Mentions Ingénierie des Systèmes d Information Business Intelligence

Ici, le titre de la. Tableaux de bords de conférence

BIG DATA en Sciences et Industries de l Environnement

Préparation à l examen EFA en Macro

Echapper légalement à l impôt sur les données

gvsig: nouveautés version 2.1 et plus

1 Actuate Corporation de données. + d analyses. + d utilisateurs.

M2 SIAW - Exemples de stages réalisés. Gabriella Salzano - Document de travail - 28/1/2015

Création de formulaires interactifs

Transport de marchandises (messagerie nationale, express, affrètement) ; Domaine médical (gestion administrative, paie hospitalière).

BUSINESS INTELLIGENCE

Cloud Computing, discours marketing ou solution à vos problèmes?

OpenText StreamServe Cours Customer Communication Management L essentiel

SYSTÈMES DE PUBLICATION POUR L INTERNET. Beatep Marie-France Landréa - Observatoire de Paris

Marc SALLIERES CEO ALTIC

M Études et développement informatique

CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2014

Intégration de Données et Systèmes Décisionnels. Au cœur de la performance

Développement d'applications pour le référencement d'un site web et pour la gestion de campagnes de mails

Jexcel. V1.1.4 Manuel d'utilisation. modifié le 16 nov. 2004

Les outils actuels permettent-ils d automatiser la production de cartes? De quels outils dispose-t-on?

ArcGIS 10.1 for Server

Support de TD ArcGIS Introduction à l automatisation et au développement avec ArcGIS 10.1 JEAN-MARC GILLIOT e année ingénieur

Urbanisme du Système d Information et EAI

_L'engagement qui fait la différence BUSINESS INTELLIGENCE DATA WAREHOUSING PILOTAGE DE LA PERFORMANCE

La Geo-Business Intelligence selon GALIGEO avec 26/10/2005 1

DataStudio. Solution d intégration des données et de diffusion de l information

Le Cloud Computing et le SI : Offre et différentiateurs Microsoft

Étude sur l insertion professionnelle

Documentation Ellipses Windows. Auteur : Léonard FRECHET Date : 10/01/07 Diffusion : Publique ELLIPSES Envoi Automatisé de SMS Ellipses SMS

Description du programme du Master M2 MIAGE SIIN (1)

Collaboration innovante pour la création d un outil de gestion de production pour le cinéma et l audiovisuel

Modelio by Modeliosoft

LE RESEAU Ce réseau est issu de l'identification et de la formation de personnes et d'équipes ressources en numérisation.

La reconquête de vos marges de manœuvre

DIRAC : cadre et composants pour créer des systèmes de calcul distribués

ArcGIS 10 Christophe Tourret Gaëtan Lavenu

Choisir le mode d envoi souhaité. Option 1 : Envoyer un SMS à un nombre réduit de numéros (0 10 )

Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP)

Exploitation des données issues de BE ( utilisation du tableur CALC) Fiche de travail (individuelle ou en binôme)

INGÉNIEUR - DÉVELOPPEUR CONFIRMÉE ORACLE - PL/SQL. 27 ans - 4 ans d'expérience

Excel. Identification. Informations sur vos besoins et objectifs. Notions fondamentales. Fiche de validation des besoins en formation Bureautique

Transcription:

Journée Bases de données OSUC Gestion de données avec TALEND Validation et insertion Aurore Hertout Chargée d études Géomatique & Expertise Spatiale

Données thématiques : Nombreuses et variées Différents modes d acquisition Continues Ponctuelles Autres Nécessaire de mettre en place des processus et des routines pour le traitement de ces données AUTOMATISATION

Données thématiques : Nombreuses et variées Différents modes d acquisition Continues Ponctuelles Autres Nécessaire de mettre en place des processus et des routines pour le traitement de ces données AUTOMATISATION ETL

ETL = Extract, Transform, Load Objectifs : - intégration de données de tous types et de tous volumes - unifier les projets - rendre les fichiers interopérables - traiter des données

ETL = Extract, Transform, Load Objectifs : - intégration de données de tous types et de tous volumes - unifier les projets - rendre les fichiers interopérables - traiter des données - intégrer les données dans une base de données

Présentation de Talend Talend Open Studio = éditeur de logiciels Open Source ETL de type «générateur de code» Langage = JAVA ou PERL

Présentation de Talend Talend Open Studio = éditeur de logiciels Open Source ETL de type «générateur de code» Langage = JAVA ou PERL Gestion des données et des bases de données

Présentation de Talend (interface Job Designer) Jobs / Routines Définition des paramètres des composants / Exécution Composants

Présentation de Talend (interface Job Designer) Composants = pas de développement en JAVA TALEND Open Studio -> nécessaire de connaitre le schéma des données Organisation du fichier d entrée et du fichier de sortie obligatoire Connaissance du formatage des fichiers de données

SO Tourbières et Principasol APPLICATION AUX DONNÉES SCIENTIFIQUES

Données brutes (sites Frasne, La Guette, Landemarais) Traitement (validation) Intégration dans la BDD Principasol

Données de terrain (GSM, relevés, etc.) Fichiers de données (.dat) TALEND Intégration dans la BdD Principasol Validation Expert Publication

Données de terrain (GSM, relevés, etc.) Fichiers de données (.dat) TALEND Intégration dans la BdD Principasol Validation Expert Publication

TALEND Données validées dans la BdD σx = N 1 (xx x ) N 1 i=1

TALEND Données validées dans la BdD Données brutes à valider Min < Valeur < Max Min < Valeur < Max VALIDEE Validation expert requise

TALEND Données validées dans la BdD Données brutes à valider Min < Valeur < Max Min < Valeur < Max VALIDEE Validation expert requise Intégration dans la BdD Principasol

De la théorie à la pratique

De la théorie à la pratique

De la théorie à la pratique

De la théorie à la pratique routines.data_pretraitement.sitei d(row3.rh_avg,row3.record)

De la théorie à la pratique

De la théorie à la pratique

De la théorie à la pratique Données Routine Checked / Expert validation required Intervalle Max Intervalle Min Routine Unchecked

De la théorie à la pratique

De la théorie à la pratique Intégration des données dans différents types de bases de données

Modifications? Modification des Jobs et des routines Ajout d'un paramètre (+ 1 colonne au fichier de données) Modification du schéma global à remplacer et à importer dans l'ensemble des jobs Modification d'une unité ou d'un paramètre Modification dans la routine Traitement_Unite Modification de l'emplacement de la base de données Modification du composant tmysqlinput, tmysqlconnection, tmysqloutput dans l'ensemble des jobs Modification de l'ordre des paramètres Problème de cohérence mais traitement effectué normalement

Conclusions et perspectives Talend = Σ d'outils puissants mais complexes => Forums indispensables pour comprendre l'utilisation de certains composants => Communauté de développeurs = amélioration constante des composants SO Tourbières : ETL Talend utilisé et performant pour la gestion des données et l intégration dans la BdD Principasol

Journée Bases de données OSUC 15 janv. 2014 Merci de votre attention Questions?