Migration et import de données



Documents pareils
CA 2011 M. +40% de croissance 7. agences en France. Paris Lyon Nantes Bordeaux Montpellier Aix en Provence

NOVA BPM. «Première solution BPM intégr. Pierre Vignéras Bull R&D

Comprendre «le travail collaboratif»

Formations QlikView / Business Intelligence

LE MEILLEUR DES SOLUTIONS COLLABORATIVE OPEN SOURCE. et pas que la GED

Livret de Stages 2014 / 2015

Utilisation d Alfresco à l Etat de Vaud

Gestion de données avec TALEND

Q.U.I.D QUALITÉ ET URBANISATION DE L'INFORMATION DÉCISIONNELLE. Tom BIZET & Stéphane SITBON 2008

Urbanisme du Système d Information et EAI

Cursus 2013 Déployer un Content Management System

CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2012

BUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise

Architecture SOA Un Système d'information agile au service des entreprises et administrations

Déjeuner EIM Enterprise Information Management. Mardi 16 novembre 2010 Restaurant l Amourette Montreuil Thomas Dechilly CTO Sollan

Extensions, Documentation, Tutoriels, Astuces

25 octobre JD EDWARDS ENTERPRISEONE et DÉMATÉRIALISATION

«Les documents référencés ci-dessus étant protégés par les droits d auteur et soumis à la déclaration au Centre Français d exploitation du droit de

Pérennisation des Informations Numériques

Fabien Pinckaers Geoff Gardiner. OpenERP. Tiny. Pour une. gestion d entreprise efficace et intégrée. Groupe Eyrolles, 2008, ISBN :

Constat ERP 20% ECM 80% ERP (Enterprise Resource Planning) = PGI (Progiciel de Gestion Intégré)

DataStudio. Solution d intégration des données et de diffusion de l information

Les enjeux de la dématérialisation du courrier entrant

Cursus Sage ERP X3 Outils & Développement. Le parcours pédagogique Sage ERP X3 Outils et Développement

SAP Extended ECM. Application Governance & Archiving for SharePoint. Marc WOLFF Associé fondateur Certified CDIA+

Gérez et diffusez vos contenus médias

HYPERSUITE/5. La solution de GED et d Archivage Légal intégrée à Delta-Bank

Enterprise Content Management Introduction à la GED dans l entreprise (30 min)

DataEXchanger. Echangez en toute simplicité. Atelier Dex Etat des lieux Dex X. Présentation DEX X

Atelier «La dématérialisation des factures à travers les technologies LAD»

Gagner en performance avec un extranet. et mener son projet extranet?

FORMATION TALEND. Page 1 sur 9

Progiciel K. Parce que chaque K est unique (c) K-all

Conseil et Ingénierie des Systèmes d Information d Entreprise

De la production collaborative à la capitalisation des connaissances Le rôle des documentalistes

RMLL Présentation Activité Pentaho

JASPERSOFT : Répondre à la demande croissante face à un reporting de plus en plus complexe.

Introduction MOSS 2007

Gestion Electronique d'informations et de Documents pour l'entreprise

Projet CASI: Master Data Management

COMMENT LIRE UN DEVIS DE CREATION DE SITE WEB?

Les réseaux sociaux d entreprise

silog erp L'ERP le plus complet

Analyse comparative entre différents outils de BI (Business Intelligence) :

Présentation Alfresco

CATALOGUE DE LA GAMME EASYFOLDER OFFRE GESTION DE CONTENUS NUMERIQUES

Introduction à la SOA. Youen Chéné 15/06/2010

Conception Exécution Interopérabilité. Déploiement. Conception du service. Définition du SLA. Suivi du service. Réception des mesures

Vers une vraie alternative du libre dans les logiciels d aide à la décision (BI)

Le SIG provincial. B u r e a u S y s t è m e d I n f o r m a t i o n G é o g r a p h i q u e. DSI Service des Applications Métiers. province-sud.

27 janvier Issam El Hachimi Ludovic Schmieder

Réseau social : pourquoi, comment? Social Collaborative Suite

Catalogue Formation «Vanilla»

L ÉCHANGE DE DONNÉES TEMPS RÉEL

Marc SALLIERES CEO ALTIC

BI Open Source Octobre Alioune Dia, Consultant BI

Webinar. Découvrez Rubedo, la première solution CMS open-source tirant profit des atouts de Zend Framework et du NoSQL. avec la participation de

! " # $ % & OPN Day Paris 14 mars 2006

Master Data Management en Open Source C est le Bon Moment

résolument expert Alti: spécialiste des solutions Microsoft durablement humain Poursuivez l aventure sur

Travail de diplôme 2011 Business Intelligence Open Source SpagoBI/Talend Résumé

ÉVÉNEMENT «DYNAMISEZ VOTRE INTRANET» INTRANET, PANORAMA 2012 ET NOUVELLES TENDANCES JÉRÔME BAILLY

La Business Intelligence pour les Institutions Financières. Jean-Michel JURBERT Resp Marketing Produit

Portail collaboratif Intranet documentaire Dématérialisation de processus

Le cloud computing au service des applications cartographiques à haute disponibilité

Le Traitement des Factures Fournisseurs

Offre CRM Analytique Logiciels pour une meilleure performance commerciale, 2011

Didier MOUNIEN Samantha MOINEAUX

ELOECM Conference2015

Soutenance de projet. Mise en place d une solution de reporting

1 Actuate Corporation de données. + d analyses. + d utilisateurs.

Postes à pourvoir 2015

Modèle de cahier des charges pour un appel d offres relatif à une solution de gestion des processus métier (BPM)

Découvrir Drupal, le CMS Open Source de référence. Michel-Marie MAUDET Linagora /

ELOECM Conference2015

Solution documentaire globale. Présentation du 14 janvier 2010

Un serveur d'archivage

Sauvegarde et Restauration d un environnement SAS

Principe, applications et limites

TP2_1 DE BUSINESS INTELLIGENCE ISIMA ZZ3 F3

Stage ingénieur : Participation à un projet de convergence des Systèmes d Information de retraite

X2BIRT : Mettez de l interactivité dans vos archives

Proposition de stage

XML, PMML, SOAP. Rapport. EPITA SCIA Promo janvier Julien Lemoine Alexandre Thibault Nicolas Wiest-Million

Cursus Sage ERP X3 Outils & Développement. CURSUS Sage ERP X3 Outils & Développement ADVANCED. Outils avancés. 2 jours X3A-ADM. Développement 1 &2

Montréal. New York. Les fournisseurs et utilisateurs des technologies de l'information et de communication

OFFRE MDB Service & Architecture Technique. MyDataBall Saas (Software as a Service) MyDataBall On Premise

Un business model d éditeur open source

Agenda. Le groupe Keyrus. Orange Tunisie. Présentation du projet. Choix initial de Talend Open Studio. Evolution de la plateforme. Nécessité de migrer

TP2 DE BUSINESS INTELLIGENCE ISIMA ZZ3 F3

Présentation du cadre technique de mise en œuvre d un Service d Archivage Electronique

Ici, le titre de la. Tableaux de bords de conférence

Meilleurs SQL PGI BI PMI PME RD RH MGE vœux

Solutions de gestion Catalyseur de performance

G.E.D. Gestion Électronique des Documents

Réponse à l Appel d Offre CRT 40, Présentation de CIS Valley

PloneLabs un gestionnaire de contenu pour les laboratoires

JAN OLIVIER Expert Supervision Architecte & Administrateur système

Générer du code à partir d une description de haut niveau

Transcription:

Migration et import de données Avec Alfresco et l ETL Talend Marc Dutoo - Alfresco Meetup - 30 Avril 2009

Agenda Qui sommes-nous? Problématiques de l import de données La réponse ETL Connector & Talend Architecture Démonstration Questions 2

Qui sommes-nous? Open Wide architecte Open Source ~ 90 employés sur Paris et Lyon, spin off de Thalès Portail, gestion documentaire, Business Intelligence Offre de services pour les logiciels libres couvrant tout le cycle Industrialisation de l usage des composants Open Source, pour les grands comptes et les administrations Marc Dutoo architecte GED / SOA / BPM Conseil, formations, projets Responsable R&D (Eclipse JWT, OW2 Scarbo ) 3

Open Wide et Alfresco Partenaire Gold depuis plus de 3 ans L assurance de la qualité L assurance de l engagement de l éditeur à nos côtés De nombreux projets réalisés et en production Une expertise de haut niveau de l intégration et de la solution 4

Problématique Pour pouvoir gérer des documents, il faut qu ils soient dans Alfresco! Une entreprise a toujours des documents antérieurs à l introduction Alfresco Ne serait-ce qu un dossier partagé en réseau Et en sus des documents, souvent une organisation, une classification, voire des métadonnées métier Fichiers d index Fichiers de métadonnées scannés (dématérialisation) Métier : wiki, base de données, application NB. On écarte la migration de version 5

Cas d usage 1 Flexibilité et simplicité «Peu» de documents et de méta-informations, classification antérieure non formalisée, besoin ponctuel Exemple : KM et Intranet de collectivités locales Solution : Flexibilité et simplicité Action automatique avalant un fichier index Les documents sont déposés dans Alfresco dans un espace technique Puis un index global les référence et fournit classification et métadonnées Architecture Action abstraite à étendre avec le code de classification métier Autorise toute opération lors de la classification Adapté au partage de connaissances 6

Cas d usage 2 Performance Nombreux documents, import récurrent, classification formalisée Exemple : Miauton (CH, Bâtiment, 5000 factures / jour) Solution : performance et évolutivité Import automatique des documents déposés dans un dossier sur le système de fichier, chacun avec son fichier de métadonnées Architecture Polling threadé Index : optimisation, amélioration du volume (avec Alfresco) Evolutif : autres documents métier, scanner / OCR (Kofax, Readsoft ) Adapté à la dématérialisation! 7

Cas d usage 3 Versatilité Beaucoup de documents, de métadonnées, plan de classement établi, récurrence Flexibilité, mais pas de passer du temps sur du code jetable! Exemple : Habitat 76 Solution : versatilité Intégration d outillage ETL (Extract, Transform, Load) Principe de l ETL : introspection des données (fichier, base ) et design de leurs flux d intégration («jobs») Réalisation : ETLConnector pour Talend En contribution sur la forge Alfresco (projet etlconnector) Talend : ETL Open Source, leader mondial, basé sur Eclipse, français 8

Projet en collaboration ETL Connector Présentation entre Habitat 76 (besoin et fonctionnel), Open Wide (conception et développement), Talend (support) L utiliser Fourni avec Talend 3.1RC3 Validé avec Alfresco 2.1 et 2.9b, erreurs mineurs en 3 Stable Tutorial : http://nicolas.feray.free.fr/blog/?cat=5 Voir aussi forums francophones Alfresco et Talend Quelques bonnes pratiques Premier pas Installer ETL Connector dans Alfresco (3 jars dans WEB-INF/lib) Designer un job Talend avec talfrescooutput en flux sortant Y configurer l adresse web du serveur Alfresco, mapper au minimum la métadonnée cm:name, et exécuter! 9

ETL Connector et Talend - Démonstration Démonstration : Import de quitus Fonctionnalités démontrées Fichiers référencés et métadonnées décrites dans un fichier XML Génération de l arborescence de classification Métadonnées métier (métamodèle spécifique) Propriétés multivaluées Autres fonctionnalités Modes de mise à jour Positionnement des habilitations Associations : parent-enfant et relations Merci à Habitat 76 et Nicolas Feray pour le cas métier et le jeu de tests! 10

ETL Connector Architecture - 1 XLS, RDBMS Talend code generation XML / REST Alfresco Server Server 11

ETL Connector Architecture - 2 Reprend l architecture d import ACP d Alfresco et ajoute transactions sur l import de chaque nœud, trace des erreurs, Identification par nom (et nom xpath), modes de mise à jour Interactions ETL Alfresco en XML / REST XML : ACP (Alfresco Content Package)! Documents : référencés par des URLs (pointant sur le système de fichier local, ou monté en réseau, ou HTTP ) Architecture : basée sur les Command d Alfresco «Bon citoyen» dans l architecture globale reprise par Alfresco envisageable 12

Conclusion L import de documents : De la reprise de documents à l ETL Une solution versatile : ETL Connector pour Alfresco et Talend Plus d informations : http://forge.alfresco.com/projects/etlconnector Au-delà Open Wide pour vos intégrations Alfresco! Autres réalisations : interfaces web riches, collaboratif avancé, processus métier, ERP (SAP), intégration de portail, d applications métier Sessions de démonstrations 13

Contacts Questions réponses Contact Merci de votre attention! marc.dutoo@openwide.fr www.openwide.fr 14, Rue Gaillon 75002 Paris Tél. : 01 42 68 28 00 Fax : 01 40 07 54 86 14