Ministère de l industrie et de la technologie Secrétariat d Etat des Technologies



Documents pareils
GEDEXPERT. La Gestion Electronique de Documents spécialement conçue pour les Experts Comptables VOTRE NOUVEL ASSISTANT POUR

GEDEXPERT. La Gestion Electronique de Documents des PME PMI. VOTRE NOUVEL ASSISTANT pour. Pour partager l information au sein de l entreprise

La Gestion Électronique de Documents spécialement conçue pour les Experts Comptables

Les Ateliers Info Tonic

Logiciel de capture et de gestion des flux de documents MOINS DE PAPIER, PLUS D EFFICACITÉ.

Introduction à la GED La Gestion Electronique des Documents

Avertissement. La Gestion Electronique de Documents

Logiciel de capture et de gestion des flux de documents MOINS DE PAPIER, PLUS D EFFICACITÉ.

I) - DEFINITIONS I-A) TERMINOLOGIE

Déjeuner EIM Enterprise Information Management. Mardi 16 novembre 2010 Restaurant l Amourette Montreuil Thomas Dechilly CTO Sollan

ELOECM Conference2015

Organisation d une simulation sur un prototype logiciel workflow et GED. ImmoBiens. 1 - Description du projet de l entreprise

CATALOGUE DE LA GAMME EASYFOLDER OFFRE GESTION DE CONTENUS NUMERIQUES

WysiUpStudio. CMS professionnel. pour la création et la maintenance évolutive de sites et applications Internet V. 6.x

Acquisition Indexation Classement & Recherche & Stockage Consultation. Solution d archivage sur mesure

Constat ERP 20% ECM 80% ERP (Enterprise Resource Planning) = PGI (Progiciel de Gestion Intégré)

Documalis. Denis SCHIRRA GSM : Plus d information sur notre site Internet

L application de Gestion Electronique de Documents (GED)

DEMANDE D INFORMATION RFI (Request for information)

BRZ GED : Il n'y a pas que sur vos chantiers que nous vous ferons gagner en productivité!

Gestion des sauvegardes

PageScope Suite L accélérateur de workflow * L essentiel de l image

Politique de gestion documentaire

Système de Gestion Documentaire Full Web

CAHIER DES CLAUSES TECHNIQUES PARTICULIÈRES (CCTP) MISE EN PLACE ET MAINTENANCE D UN MOTEUR DE RECHERCHE

Sélection d un moteur de recherche pour intranet : Les sept points à prendre en compte

Introduction MOSS 2007

Gestion Electronique d'informations et de Documents pour l'entreprise

OpenScribe L ECM Sagem. Pour maîtriser simplement tous les flux d informations

Enseignement Informatique. Classe de Bac Pro SAPAT

LES OUTILS DU TRAVAIL COLLABORATIF

Présentation générale du projet data.bnf.fr

Cursus 2013 Déployer un Content Management System

Logiciel de capture et de gestion des flux de documents MOINS DE PAPIER, PLUS D EFFICACITÉ. VOUS POUVEZ COMPTER SUR NOUS

Les documents primaires / Les documents secondaires

LE MEILLEUR DES SOLUTIONS COLLABORATIVE OPEN SOURCE. et pas que la GED

Catalogue des formations pour vos collaborateurs, pour vos clients,

TUTORIEL Qualit Eval. Introduction :

Chef de file dans le développement de solutions de gestion de contenu

Organiser les informations ( approche technique )

Créer et partager des fichiers

Portail collaboratif Intranet documentaire Dématérialisation de processus

CAHIER DES CHARGES DU SITE WEB POUR LA RÉALISATION. Nom du commanditaire : Dossier suivi par : Date de réalisation : Date de mise à jour :

CAHIER DES CHARGES CREATION / AMELIORATION SITE INTERNET

Gestion Electronique des Documents et la qualité documentaire au cœur du développement durable.

Logiciel de Gestion Electronique de Dossiers

Gestion des flux courriers multi formats entrants et sortants

les GDT dans le Système d Information informatisé Muriel Pinel Laurent Tabourot

Gagner en performance avec un extranet. et mener son projet extranet?

TYPO3 et la GED 30/06/2010. TYPO3 Summer University 2010 Annecy. photogl - Fotolia.com

Les enjeux de la dématérialisation du courrier entrant

Ne laissez pas le stockage cloud pénaliser votre retour sur investissement

Gestion collaborative de documents

Manuel d Administration

UltraBackup NetStation 4. Guide de démarrage rapide

Guide d utilisation WEBPORTAL CPEM Portail d Applications Web CPEM

La solution d ECM/BPM

CRM pour le Service clients et l Assistance technique

Révision salariale - Manager

Le logiciel pour le courtier d assurances

Solutions Open BeeTM. L extension documentaire de votre multifonction Konica Minolta OPEN BEETM. * La passion de l innovation

Gestion des fichiers sur micro-ordinateur

LECTURE DES FICHIERS DE FACTURES

A. Présentation. LanScanner2006

PRESENTATION 2009 L'ingénierie Documentaire

Alania CRM. Une gestion d entreprise efficace, rapide, adaptée et rentable!

Généralités. Premier lancement

Présentation du système MCAGED

Marché à Procédure adaptée. Tierce maintenance applicative pour le portail web

De la production collaborative à la capitalisation des connaissances Le rôle des documentalistes

Gestion de la Maintenance Assistée par Ordinateur

«Les documents référencés ci-dessus étant protégés par les droits d auteur et soumis à la déclaration au Centre Français d exploitation du droit de

G.E.D. Gestion Électronique des Documents

Guide d installation UNIVERSALIS 2014

Solution universelle de Gestion Electronique de Documents et d Archives Numériques

COMMENT AMÉLIORER LA VISIBILITÉ DE SON SITE WEB?

KIELA CONSULTING. Microsoft Office Open Office Windows - Internet. Formation sur mesure

Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION

Créer le schéma relationnel d une base de données ACCESS

Manuel utilisateur Portail SAP

Content Management System V.3.0. BlackOffice CMS V3.0 by ultranoir 1

Comparatif CMS. Laurent BAUREN S Bérenger VIDAL Julie NOVI Tautu IENFA

et les Systèmes Multidimensionnels

Le fonctionnement d un service d archives en entreprise. Le Service national des archives

Compte-rendu re union Campus AAR 3 mars 2015

Situation présente et devis technique

Comment utiliser FileMaker Pro avec Microsoft Office

Projet base de connaissances Réseau UNAF / UDAF. Cahier des charges

Concevoir sa stratégie de recherche d information

Fourniture d un outil de gestion du courrier électronique pour les sites internet de la Documentation Française

WEB & DÉVELOPPEMENT LES BASES DU WEB LE LANGAGE HTML FEUILLES DE STYLES CSS HISTORIQUE D INTERNET ET DU WEB LES DIFFÉRENTS LANGAGES

Optimisez la gestion de l information dans votre entreprise

ERGONOMIE GESTION DES DONNEES CLIENT. Gestion données client Vue 360 (Obligatoire) Données récupérées. Données calculées

Administration de systèmes

Système de gestion de contenu

WinBooks Logistics 5.0

Projet en nouvelles technologies de l information et de la communication

Transcription:

Ministère de l industrie et de la technologie Secrétariat d Etat des Technologies

Table des matières LISTE DES FIGURES... V PREFACE... 6 A PROPOS DE L AUTEUR... 7 LICENCE... 8 1 ÉTAT DES LIEUX... 9 1.1 QU EST CE QUE LA GESTION ÉLECTRONIQUE DE DOCUMENTS... 9 1.2 POURQUOI UTILISER UN OUTIL GED?... 9 1.3 AVANTAGES DES OUTILS GED... 10 1.4 GED OPEN SOURCE... 10 2 CONTEXTE TUNISIEN... 11 2.1 UTILISATIONS EN TUNISIE // REFERENTIEL NATIONAL... 11 2.2 DISPONIBILITES DE COMPETENCES ASSOCIEES... 11 3 FONCTIONNALITES DE BASE ET AVANCEES OFFERTES PAR LES GED... 12 3.1 METADONNEES... 12 3.1.1 Types de documents... 12 3.1.1.1 Notices des documents... 12 3.1.1.2 Fonctions relatives aux typages de l information... 13 3.1.2 Indexation manuelle... 13 3.1.2.1 Interface de saisie... 13 3.1.2.2 Table de référence... 13 3.1.3 Indexation automatique... 13 3.1.3.1 Extraction de métadonnées... 13 3.1.3.2 Induction de métadonnées... 14 3.2 GESTION DES VERSIONS... 15 3.2.1 Réservation (check-in/check-out)... 15 3.2.2 Incrémentation des versions... 15 3.3 REFERENTIEL DE CLASSEMENT... 16 3.3.1 Types de référentiels... 16 3.3.1.1 Lexique... 16 3.3.1.2 Taxonomie... 16 3.3.1.3 3.3.1.4 Thésaurus... 16 Ontologie... 16 3.3.1.5 3.3.1.6 Plan de classement... 17 Tableau de gestion... 17 3.3.2 Utilisation des référentiels... 17 3.3.2.1 3.3.2.2 Accès multi-facette aux documents... 18 Gestion multi référentiels... 18 3.3.2.3 Gestion des synonymes... 18 3.4 MOTEUR DE RECHERCHE... 18 3.4.1 Fonctions de base... 18 3.4.2 Fonctions avancées... 19 3.5 INTEGRATION DE LA GED... 19 3.5.1 Utilisation en tant qu espace de stockage... 20 3.5.2 Intégration avec les outils de bureautique... 20 3.6 NUMERISATION... 20 3.6.1 Pilotage de scanner et préindexation... 20 3.6.2 Reconnaissance automatique... 21 3.7 GESTION DES DROITS... 21 3.7.1 Niveaux de gestion... 21 3.7.2 Gestion des profils... 21 3.7.3 Annuaire et SSO... 22 3.8 FONCTIONS COLLABORATIVES... 22 3.9 WORKFLOW (FLUX DES TRAVAUX)... 23 Livre Blanc des GED en Tunisie. Janvier 2012 version 1.0 ii

3.9.1 Workflow documentaire... 23 3.9.2 Workflow métier ou BPM... 23 3.10 GESTION DU CYCLE DE VIE... 24 3.10.1 Politique de conservation... 24 3.10.2 Archivage... 24 3.10.3 Format de fichier... 24 3.10.3.1 Fonctions liées aux formats... 25 3.10.3.2 Formats ouverts... 25 3.10.3.3 Formats de conservation... 25 3.10.4 Archivage numérique légal... 25 3.11 IMPORT/EXPORT... 26 3.11.1 Import/export en masse... 26 3.11.2 Export sur support physique... 26 3.12 GESTION DES EMAILS... 26 3.12.1 Quels emails faut t il archiver?... 26 3.12.2 Gestion optimale des emails... 27 3.13 GESTION DE DOSSIERS... 27 3.13.1 Notions... 27 3.13.2 Outils de la gestion de dossiers... 27 3.13.2.1 3.13.2.2 Gestion des dossiers... 27 Classement... 27 3.13.2.3 Traçabilité... 27 3.14 INTEGRATION TECHNIQUE... 28 3.14.1 Accès direct... 28 3.14.2 Interfaces utilisateurs... 28 3.14.3 Intégration applicative... 28 3.14.3.1 Les Web services... 28 3.14.3.2 Web services SOAP... 28 3.14.3.3 Web services REST... 28 3.14.3.4 CMIS (Content Management Interoperability Services)... 28 3.14.3.5 Portlets... 29 3.14.4 Mode SaaS... 29 4 LISTE DES GED ETUDIES... 30 4.1 ALFRESCO... 30 4.1.1 Présentation... 30 4.1.2 Fiche signalétique... 30 4.1.3 Références... 31 4.2 DYNACASE (FREEDOM)... 32 4.2.1 Présentation... 32 4.2.2 Fiche signalétique... 32 4.2.3 Références... 33 4.3 JAHIA... 33 4.3.1 Présentation... 33 4.3.2 Fiche signalétique... 34 4.3.3 Références... 35 4.4 KNOWLEDGE TREE... 36 4.4.1 Présentation... 36 4.4.2 Fiche signalétique... 36 4.4.3 Références... 36 4.5 LOGICALDOC... 37 4.5.1 Présentation... 37 4.5.2 Fiche signalétique... 37 4.5.3 Références... 38 4.6 MAARCH... 39 4.6.1 Présentation... 39 4.6.2 Fiche signalétique... 39 4.6.3 Références... 40 4.7 NUXEO... 41 Livre Blanc des GED en Tunisie. Janvier 2012 version 1.0 iii

4.7.1 Présentation... 41 4.7.2 Fiche signalétique... 41 4.7.3 Références... 42 5 CRITERES DE CHOIX DES GED... 44 5.1 COMPATIBILITE AVEC L ENVIRONNEMENT DE TRAVAIL... 44 5.1.1 Diversités des standards... 44 5.1.2 Intégration bureautique... 44 5.1.3 Scanners... 44 5.2 CLASSEMENT, RECHERCHE METADONNEES... 44 5.2.1 Indexation manuelle/automatique... 44 5.2.2 Plan et navigation... 44 5.2.3 Recherche intégrale/sur métadonnées... 44 5.2.4 Import/ Export des données... 44 5.3 GESTION DES DROITS, VERSION, SECURITE ET INTERFACE... 44 5.3.1 Support LDAP/SSO... 44 5.3.2 Moteur de règles... 45 5.3.3 Gestion des versions... 45 5.4 CYCLE DE VIE ET ARCHIVAGE... 45 5.4.1 Moteur de workflow... 45 5.4.2 Archivage... 45 6 RESULTATS & ORIENTATIONS... 46 GLOSSAIRE... 47 BIBLIOGRAPHIE... 48 NETOGRAPHIE... 49 Livre Blanc des GED en Tunisie. Janvier 2012 version 1.0 iv

Liste des figures FIGURE 1 : ARBORESCENCE DE FICHIERS AVEC NOMMAGE AVANCE... 14 FIGURE 2 : CYCLE DE VIE D UN DOCUMENT... 24 Livre Blanc des GED en Tunisie. Janvier 2012 version 1.0 v

Préface Depuis environ plus de deux décennies, la Tunisie accorde une place importante aux logiciels Open Source. De nombreuses administrations publiques ont été encouragées à les utiliser et à les considérer comme de sérieuses options et alternatives dans l ensemble de leurs projets informatiques. Toute cette démarche a été réconfortée par la Circulaire N 10 encourageant le développement des systèmes d information dans le secteur public. Les outils de Gestion Electronique de Documents (GED) sont relativement peu utilisés en Tunisie. Certaines administrations et entreprises privées en font usage surtout pour le stockage et l archivage de leurs documents. Avec un souci grandissant d avoir des systèmes d information intégrés, les outils GED prennent de plus en plus de place en offrant la fonctionnalité du workflow métier. Cette dernière permet à la fois de travailler en mode collaboratif, tout en respectant un circuit bien déterminé de circulation des documents entre les utilisateurs. Suite à la révolution qu a vécu la Tunisie en janvier 2011, plusieurs documents importants ont été détruits ou perdus. La grande majorité a été perdue à jamais, ce qui engendre une perte considérable dans bien des cas. Il y a donc eu une prise de conscience générale de l importance que peuvent jouer les outils GED. Nous imaginons donc que les prochaines années vont enregistrer une importante augmentation dans l utilisation et l adoption d outils GED. Outre ce besoin conjoncturel et exceptionnel, et dans un soucis d amélioration des services rendu au citoyen, l administration tunisienne n a d autre choix que de compléter ses systèmes d information par cette composante primordiale et profiter de tous ce qu elle peut apporter comme avantages. Ce libre blanc dresse les fonctionnalités de base de la GED et propose quelques outils open source disponibles. Nous avons essayé d en faire un livre blanc facile à lire et à comprendre et nous espérons qu il soit utile à bien d entre vous. Livre Blanc des GED en Tunisie. Janvier 2012 version 1.0 6

A propos de l Auteur Créée en septembre 2001, XTENSUS est une SSLL spécialisée en conception, développement et intégration de solutions web de tout genre (CMS, CRM, GED, etc.). Dotée d une équipe jeune et spécialisée, elle enregistre plusieurs années d expérience dans le domaine des TIC à son bilan, ce qui lui a permis de se construire un nom et de compter par suite de prestigieuses références parmi ses clients. Son équipe est renforcée par le support de plusieurs consultants nationaux et internationaux, hautement qualifiés, ce qui lui permet d offrir des services rapides, de qualité et à la hauteur des attentes de ses clients. XTENSUS accompagne ses clients dans des projets de développement principalement en PHP et Java/J2EE et a réussi également à faire ses preuves en développement mobile, spécialement sur Android. Livre Blanc des GED en Tunisie. Janvier 2012 version 1.0 7

Licence Ce document est publié sous licence Creative Commons. Vous pouvez donc l utiliser librement à condition de mentionner clairement le nom de son auteur, de mettre un lien actif vers la version originale du document publié dans la section Base de Connaissance du site http://www.opensource.tn et de préserver le caractère Open Content de ce dernier. Les droits de propriété intellectuelle qui y sont rattachés reviennent au Secrétariat d Etat de la Technologie (SET) de Tunisie. Paternité - Pas d'utilisation Commerciale - Partage à l'identique : CC BY-NC-SA Vous pouvez trouver la version originale de la licence à l adresse suivante : http://creativecommons.org/licenses/by-nc-sa/3.0/ Livre Blanc des GED en Tunisie. Janvier 2012 version 1.0 8

1 État des lieux 1.1 Qu est ce que la gestion électronique de documents La GED (Gestion électronique de documents) ou encore la GEIDE (Gestion Electronique d Informations et de Documents Existants), sont un concept représentant un ensemble d outils logiciels et matériels, ainsi que de techniques qui permettent de gérer électroniquement des documents. Cette gestion concerne : la gestion proprement dite (ajout, consultation, modification, suppression), le stockage, la distribution. Les outils GED s intègrent généralement aux systèmes d information de l entreprise pour offrir un complément important d outils et de fonctionnalités permettant surtout l acquisition des documents (capture, scannage, etc.), le classement, l indexation et l archivage. Parmi les avantages qui découlent de l utilisation de l outil GED, nous citons la possibilité offerte aux utilisateurs de travailler en mode collaboratif. Ce dernier offre un environnement avancé de travail, de partage et d échange de documents de façon asynchrone et à distance. La GED remplace les documents papier par leur version électronique permettant ainsi de résoudre non seulement le problème d archivage électronique, mais aussi d optimiser les recherches et l accès à l information. La GED fait passer les documents par toute une chaine de traitement contenant les principales étapes suivantes : Acquisition numérique du document : nous parlons ici de scannage du document Formatage : selon les documents et l utilisation à en faire, un format de fichier est choisi. Traitement : certains documents nécessitent une compression réalisée à juste mesure pour permettre un gain en espace de stockage, tout en permettant d avoir un document de qualité permettant même l éventuelle reconnaissance de caractères. Indexation : c est une étape très sensible de la GED permettant d optimiser les recherches futures sur les documents. L indexation est possible manuellement ou automatiquement. Stockage : le stockage des documents avec un outil GED peut cibler non seulement le court terme (archivage en ligne) et le long terme (archivage hors ligne). Le stockage doit donc permettre l utilisateur de plusieurs types de média adapté à chacune des deux durées. Recherche de documents : la recherche est généralement la façon la plus utilisée pour accéder aux documents. La qualité des résultats dépend de la qualité de l indexation réalisée sur les documents et donc de sa précision et de sa finesse. Accès aux documents : il s agit de l étape ou l utilisateur peut consulter, modifier et supprimer des documents. Diffusion : il s agit du partage du document avec d autres utilisateurs en envoyant un document à travers un workflow documentaire. Nous pouvons aussi y trouver la possibilité de diffuser de façon restreinte ou encore largement un document à travers un portail web, un intranet, ou sur toute autre plateforme compatible. 1.2 Pourquoi utiliser un outil GED? Quand nous parlons d outil GED, nous faisons surtout référence à une automatisation de l utilisation des documents avec les avantages que nous lui connaissons. Mais la conversion des documents du format papier vers le format électronique garanti non seulement une meilleure organisation, mais aussi une gestion des documents d une quantité nettement supérieure tout en gardant un haut niveau d accessibilité et un accès instantané. La GED nous permet aussi inévitablement de bénéficier de l archivage à long terme des documents. En effet, la GED permet de stocker des documents sur différents types de supports facilitant ainsi leur accès à des systèmes informatiques hétérogènes pour des durées illimitées, ce qui leur donne pratiquement une vie éternelle. Livre Blanc des GED en Tunisie. Janvier 2012 version 1.0 9

1.3 Avantages des outils GED Les outils GED offrent de nombreux avantages comparativement à la gestion «papier» des documents. Parmi les avantages que nous pouvons attribuer à la GED, nous citons : Accès plus facile à l information grâce à l indexation avancée et aux moteurs de recherches, Suppression de la contrainte physique puisque le document est accessible depuis n importe quel endroit à condition qu il soit bien sûr connecté à l outil GED, Amélioration de la conservation des documents ainsi que leur sécurisation puisque les accès se font avec des droits bien spécifiques attribués aux utilisateurs, Travail collaboratif : la GED offre la possibilité aux utilisateurs de travailler en collaboration du début à la fin sans division fixe et préalable des tâches. Les documents sont alors accessibles en simultané, avec des droits d accès et des rôles prédéfinis. 1.4 GED Open Source Ce livre blanc couvre uniquement les outils GED Open Source qui contrairement aux solutions propriétaires, offrent la possibilité d étudier, de modifier et d ajouter du code. Il présentera une liste d outil GED Open Source offrant des fonctionnalités plus ou moins similaires. Nous y présentons les fonctionnalités de base ainsi que les principales fonctionnalités avancées. Contrairement à ce que certains peuvent lire derrière le mot «Open Source», les outils GED open source sont des solutions matures et qui se sont imposées face à leurs concurrents propriétaires. Il existe aussi des outils GED propriétaires et purement commerciaux. Ces derniers ne sont pas couverts par le présent livre blanc. Livre Blanc des GED en Tunisie. Janvier 2012 version 1.0 10

2 Contexte tunisien 2.1 Utilisations en Tunisie // Référentiel national La GED est timidement utilisée en Tunisie. Il existe cependant un bon nombre de fournisseurs spécialisés dans le domaine et offrant des services de haute qualité, que ce soit en termes de logiciels (solution complètes, intégration, etc.) ou de matériels (scanner, support de stockages, etc.). 2.2 Disponibilités de compétences associées Nous croyons que le plus des outils GED sont adoptés par des utilisateurs et des SSII & SSLL, le plus facile l obtention de support et d aide lors de projets futurs d intégration d un CMS. Il s agit donc d un élément important à tenir compte lors de votre choix de l outil GED pour vos projets web. Pour vous en assurer, plusieurs sources d information peuvent être consultées. Nous citons principalement l annuaire des entreprises tunisiennes, des associations et des clubs universitaires du Logiciel Libre en Tunisie : http://www.opensource.tn. Il est aussi important de signaler que le Secrétariat d'etat de la Technologie de Tunisie organise depuis 2010 des sessions de formation sur les outils open source au profit des fonctionnaires de l état dans le but de promouvoir l utilisation des logiciels libres et renforcer les compétences humaines dans le domaine. Livre Blanc des GED en Tunisie. Janvier 2012 version 1.0 11

3 Fonctionnalités de base et avancées offertes par les GED Les outils de Gestion Electronique de Documents offrent par définition généralement reconnue une liste de fonctionnalités grâce auxquelles ils méritent leur nom. Certaines fonctionnalités sont déjà nativement intégrées dans l outil et d autres le sont suite à une installation d un plugin ou d un complément au système de base. Quoi que certains outils GED soient classés dans cette catégorie, ils pourraient ne pas avoir nativement une ou plusieurs des fonctionnalités listées plus bas. Ces cas restent cependant rares et tendent à disparaitre dès que l outil atteint un minimum de maturité. 3.1 Métadonnées Une métadonnée est une donnée utilisée pour définir ou décrire une autre donnée. Dans notre cas, les métadonnées sont utilisées pour définir et décrire les documents (qui sont eux-mêmes considérés comme des données structurées) gérés par l outil de GED. 3.1.1 Types de documents Chaque document se voit attribué un type permettant une meilleure indexation et une catégorisation plus organisée. Le type regroupe donc un ensemble de métadonnées permettant d identifier les documents, mais aussi de contenir ses propriétés et ses attributs afin de faciliter leur recherche multicritère. Avec les types, les utilisateurs peuvent : éviter l utilisation des attributs uniques et communs à l ensemble de leurs documents indexer des documents de même catégorie selon des attributs propres à cette même catégorie améliorer le résultat des recherches sur les documents suite à une meilleure indexation Un avantage connu pour l utilisation des types des documents est le fait de permettre et d accélérer l indexation automatique des documents. En effet, sachant que les documents d un même type ont généralement un certain nombre d attributs communs par défaut, un système GED peut alors attribuer automatiquement des métadonnées préalablement définis par l utilisateur. Un certain nombre de règles de gestion peuvent aussi être attribuées aux types de documents pour permettre au système de réaliser des taches prédéfinies sur les documents dès leur chargement sur le système GED et l attribution d un type bien déterminé. 3.1.1.1 Notices des documents Les notices des documents représentent un ensemble de métadonnées qu on leurs associe. Généralement, ces notices font l objet d un formulaire de saisie permettant à l utilisateur de renseigner les informations relatives au document selon un modèle prédéfini. Une bonne étude des besoins des utilisateurs doit être réalisée au début d un projet GED pour identifier et évaluer la nécessité d avoir un à plusieurs métadonnées. En effet, il faut atteindre un équilibre et éviter les deux extrémités : avoir trop peu de métadonnées empêchant un bon référencement et donc de mauvais résultats de recherche. Imaginez ici le pire des cas ou un document n a aucune métadonnée, il devient alors impossible de le retrouver à moins d en connaitre le nom et la date de saisie exacts. avoir beaucoup trop de métadonnées à saisir au point de décourager l utilisateur. Dans ce cas, il ne faut pas non plus négliger le temps nécessaire à l opérateur qui fera la saisie surtout dans le cas de document fréquent (ajout journalier). Le message à retenir ici est donc l importance qu il faut accorder au choix de la composition d une notice pour garantir l obtention d une base de documents bien indexée et réellement exploitable. Livre Blanc des GED en Tunisie. Janvier 2012 version 1.0 12

3.1.1.2 Fonctions relatives aux typages de l information Comme il a été précisé plus haut, l attribution d un type particulier à un document peut être utilisée pour indiquer au système un ou plusieurs traitements précis à faire. Il s en suit un déclenchement automatique de traitement pouvant aider l indexation du document et son traitement. On peut alors imaginer des scénarios comme suit : remplissage automatique d un nombre de champs dans la notice lancement d un traitement à réaliser sur le document (copie, déplacement, choix du lieu de stockage sur disque, copie de sécurité, copie d information à d autres utilisateurs, initiation d un workflow de traitement, etc.) aide et assistance au remplissage des champs d une notice en faisant une vérification automatique des métadonnées et la cohérence entre elles. liaison réalisée entre documents différents ayant un rapport entre eux facilitant ainsi l accès à l ensemble de ces documents sans recherches supplémentaires. 3.1.2 Indexation manuelle 3.1.2.1 Interface de saisie Les interfaces de saisie doivent être ergonomiques et respectant les standards des interfaces homme/machine. Si les interfaces ne sont pas bien étudiées et conçues/développées dans un souci de facilitation du travail de l utilisateur, ce denier peut être découragé et le résultat de l indexation pourrait alors en souffrir. La grande majorité des solutions GED permettent aujourd hui non seulement une importante adaptation des interfaces, mais donnent aussi la possibilité d intervenir au niveau code pour adapter les interfaces selon des besoins spécifiques et avancés. Saisie assistée par la mise à disposition de composants facilitant la tache comme : o des cases à cocher et des boutons radio pour les choix récurrents évitant une saisie redondante par l utilisateur o des listes prédéfinies offrant des collections simples ou multiples, mais diverses, pour guider l utilisateur dans le choix des valeurs à attribuer, évitant ainsi les erreurs d orthographes et de saisie. Proposition de valeurs dépendantes de champs déjà renseignés par l utilisateur afin de lui faciliter la tâche et accélérer le traitement Gestion des erreurs et contrôle de saisir dans les différents champs : numérique, texte, formatage spécifique, etc. 3.1.2.2 Table de référence Une des méthodes utilisées par les systèmes GED pour faciliter le travail de référencement des documents étant la mise à disposition de tables de référence. Il s agit en fait de tables permettant la proposition de valeurs à l utilisateur pouvant être extraite : de valeurs à partir de listes prédéfinies ou enregistrées sur le système : noms de personnes, nom de sociétés, liste des gouvernorats, liste des pays, etc. de valeurs déjà saisies par l utilisateur pour d anciens documents. de tables d ontologie (cette dernière constitue un modèle de données représentatif d'un ensemble de concepts dans un domaine, ainsi que des relations entre ces concepts. Elle est employée pour raisonner à propos des objets d un domaine concerné) 3.1.3 Indexation automatique 3.1.3.1 Extraction de métadonnées Les méthodes d extraction possibles sont nombreuses et leur efficacité ainsi que leur degré de réussite dépend intiment de la qualité du stockage primaire des documents réalisé. Deux grandes méthodes d extraction de métadonnées peuvent être envisagées : Récupération normale d information : de nos jours, la grande majorité, pour ne pas dire tous les systèmes GED, permettent la récupération automatique des informations de base relatives aux documents. Nativement, nous pensons aux informations attribuées par les systèmes d exploitations aux fichiers représentant les documents, tels que : le nom du fichier, la date de Livre Blanc des GED en Tunisie. Janvier 2012 version 1.0 13

création, la date de dernière modification, la taille, date de dernier accès, propriétaire, groupe, droits d accès, etc. La liste peut varier selon le système d exploitation. Récupération avancée d information : o Documents standardisés / typés : certains documents utilisent des standards bien déterminés qu ils soient généralistes ou encore spécifiques et reliés à leur type. En effet, nous pouvons imaginer à titre d exemple de récupérer des informations stockés dans l entête de fichiers comme dans le cas des deux exemples suivants : Document Texte : généralement, ces documents ont un en-tête contenant au moins les informations suivantes récupérables automatiquement : titre du document, objet, mots clé, commentaires, source, auteur, numéro de version, etc. Document image : tous les formats d image connus contiennent par défaut une entête assez riche permettant la récupération automatique de données telles que : dimension (longueur x largeur), résolution horizontale et verticale, nombre de couleurs, etc. o Document avec des règles de nommage spécifiques : dans beaucoup de cas, les utilisateurs prennent le temps de nommer leur fichier selon des standards prédéfinis, mais aussi de bien les classer dans des répertoires dont les noms sont aussi bien pensés. Voici à titre d exemple le cas de l arborescence suivante : Dossiers Fichiers Figure 1 : Arborescence de fichiers avec nommage avancé Beaucoup d informations peuvent être tirées de cette arborescence et de ces noms de fichiers : Dossiers : Classement des noms des clients par ordre alphabétique : A, B, C Accès plus facile et plus direct au répertoire concernant un client et ses factures Fichiers : Type du document : les fichiers du répertoire représentent des factures Les factures contenues dans ce répertoire sont numérotée de 349 à 352 Les dates sont aussi extraites du nom du fichier en format Année_Mois_Jour. 3.1.3.2 Induction de métadonnées L induction de métadonnées est beaucoup plus utilisée qu on peut le croire ou le souhaiter. En effet, ce mode d extraction et d attribution automatiques de métadonnées aux documents est souvent considéré par les utilisateurs de systèmes GED comme étant un mode moins fiable et ne donnant pas des résultats de la même qualité que celle d une indexation manuelle (humaine). Néanmoins, et sachant le volume très important de documents à gérer par un système GED dans beaucoup de cas, le rapport coût/qualité devient extrêmement élevé avec une indexation manuelle, qu il devient alors très indiqué d avoir recourt à ce mode d indexation. Il existe différents moyens pour réaliser ce dernier, dont principalement : des fonctions avancées permettant de déterminer le nombre de répétition d un mot ou d une chaîne de caractères dans un document. Plus le nombre est important, plus est la pertinence de ce mot ou chaîne de caractères pour représenter et indexer le document. des fonctions d apprentissage permettant de dresser des listes de mots clés ou de chaines de caractères constituant alors un référentiel à utiliser pour l indexation de futurs documents. Livre Blanc des GED en Tunisie. Janvier 2012 version 1.0 14

des outils ontologiques permettant de déduire à partir des mots existants dans un document leur sens par ontologie pour l indexer avec des mots clés déjà référencés dans la base. Afin d augmenter la qualité de l indexation, certains systèmes offrent la possibilité de mélanger un ou plusieurs des moyens cités plus haut. Il est important de rappeler qu il faut bien étudier l utilisation de ce genre de mode d indexation car le rapport «qualité d indexation» / «vitesse d indexation» devient rapidement faible et donne des résultats, certes rapidement, mais avec une indexation médiocre. Seul l utilisateur peut juger du ratio acceptable selon ses besoins et ses attentes. 3.2 Gestion des versions L une des particularités d un outil GED étant sa fonction de gestion des versions des documents. Sans cette importante fonction, il serait difficile de parler de travail collaboratif sur des documents et l outil GED perdrait alors l une de ses principales utilités. Un bon exemple pour expliquer cette fonction étant le cas ou plusieurs intervenants travaillent sur le même document. Dans ces cas, il est souvent difficile de reconnaitre la dernière version valide du document. La gestion des versions vient donc solutionner ces cas d utilisation. 3.2.1 Réservation (check-in/check-out) Lors du travail collaboratif sur des documents, et dans bien des cas, il est impossible de travailler de façon simultanée sur les documents. Hormis les cas de simple consultation, un travail en simultané sur des documents devient impossible dans les cas de changement de leur contenu. En effet, le seul moyen de faire des modifications étant de «bloquer» ou «réserver» les documents avant d effectuer les changements. Durant ce temps, aucun autre utilisateur ne peut changer le document avant la fin des changements réalisés par le premier utilisateur. Ce dernier devra alors «débloquer» le document pour permettre aux autres utilisateurs de le modifier à leur tour. L opération de «blocage» du document est communément appelée : check-out. L opération de «déblocage» du document est communément appelée : check-in. 3.2.2 Incrémentation des versions L incrémentation des versions est un élément essentiel pour une meilleure gestion. Elle est souvent gérée automatiquement par l outil GED qui attribue un numéro séquentiel aux versions. Il devient alors possible d identifier avec exactitude chaque version du document dans l ordre des mises à jour. Il est possible dans certains outils GED de gérer l incrémentation en prenant en charge les versions mineures (exemple : passage de la version 3.0.1 à 3.0.2) et majeures (exemple : passage de la version 4.0 à 5.0). Il est aussi possible de réaliser une incrémentation plus avancée basée sur des règles à définir au préalable par l utilisateur ou l administrateur de l outil. La gestion des incrémentations des versions ainsi que la possibilité d implémenter facilement ces règles dans l outil GED devient alors un élément capital dans le choix de l outil, surtout pour des utilisations à forte demande en termes de modification de document dans un environnement collaboratif. En effet, certains outils permettent le passage automatique d une version mineure/majeure à une version suivante (quelle soit mineure ou majeure) en se basant sur des règles préétablies, comme par exemple : Nombre d interventions sur le document : dépassé un certain nombre, le numéro de la version change. Durée de vie d un document : après une durée bien déterminée depuis la dernière version, le document passe à la version suivante. Il peut passer à une version majeure si la durée dépasse un certain seuil ou encore après un nombre donné de passages successifs de versions mineures. Livre Blanc des GED en Tunisie. Janvier 2012 version 1.0 15

3.3 Référentiel de classement Le référentiel de classement offre un ensemble de mots clés ou de chaînes de caractères pour utilisation dans l indexation des documents. Ces mots clés ou expression sont spécifiques à chaque secteur ou métier. L amélioration du référentiel se passe par apprentissage automatique, mais basée sur une version de démarrage assez complète. Certains référentiels sont offerts dans des structures plus ou moins complexes en forme hiérarchisée, en thésaurus ou encore utilisant l ontologie. 3.3.1 Types de référentiels 3.3.1.1 Lexique Le lexique est un ensemble de termes d'un domaine de la connaissance, classés dans l'ordre alphabétique. Dans certains cas d utilisation, le lexique peut inclure des relations entre les termes (relation d'équivalence ou de voisinage). 3.3.1.2 Taxonomie La taxonomie permet de structurer des termes entre eux sous forme d hiérarchisation simple permettant d établir un lien précis entre un terme et ses enfants dans l arborescence. Chaque lien donne un sens additionnel et une signification au terme initial. Plus les termes enfants sont nombreux, plus on tend vers un vocabulaire organisé. 3.3.1.3 Thésaurus Contrairement à la taxonomie, le thésaurus est structuré sous forme de lien dans les deux sens. Une taxonomie nous donne seulement les synonymes d un terme, alors que le thésaurus peut donner des synonymes dans des sujets connexes. Les thésaurus sont un autre moyen utilisé par les GED pour une meilleure indexation des documents. Ils sont organisés en liste de termes normalisés servant à l'indexation des documents. Tous ces termes sont reliés entre eux par des liens types standardisés. On peut distinguer les thésaurus en fonction : du mode de regroupement des termes (thésaurus à facettes) ; de la variété linguistique des termes (mono- ou multilingue) ; des domaines de connaissances couverts (thésaurus spécialisé ou sectoriel, thésaurus encyclopédique, etc.). Un thésaurus est composé d un ensemble de termes reliés entre eux par : des relations de synonymie : on parle alors de termes terme équivalents des relations d hiérarchie : représentée sous deux formes : o terme générique : correspondant au père dans l arborescence ou dans la hiérarchie. Un terme peut avoir plusieurs pères o terme spécifique : qui correspond un fils dans la hiérarchie des relations d'association : termes associés ou regroupés entre eux ; 3.3.1.4 Ontologie L ontologie peut être très proche de la logique des thesaurus puisqu elle met des termes en relations les uns avec les autres. Nous pouvons dire que l ontologie est une utilisation des thesaurus. Elle apporte, en plus des thesaurus, une grammaire permettant de lire et de qualifier les liens entre ses termes. Nous pouvons donc dire que la taxonomie et le thesaurus sont des formes d ontologie dont la grammaire n a pas encore été spécifiée. Alors que dans les cas des thesaurus, les types de relations sont limités, l ontologie peut faire usage d autant de relation que nécessaire entre les termes utilisés. Cela donne une valeur importante et permet donc d obtenir de meilleurs résultats de recherche. Une ontologie peut donc être assimilée à un vocabulaire contrôlé et organisé et à la formalisation explicite des relations créées entre ses différents termes. Pour réaliser cette formalisation, on peut utiliser un langage particulier. Un des langages utilisés pour décrire les relations entre les différents termes d'un vocabulaire s'appelle RDF (Ressource Description Framework) qui est la normalisation de l utilisation des ontologies proposée par W3C. Livre Blanc des GED en Tunisie. Janvier 2012 version 1.0 16

L utilisation des ontologies par les outils GED reste à ce jour très limitée. 3.3.1.5 Plan de classement Un plan de classement est absolument nécessaire pour permettre un juste déploiement d une GED. L erreur souvent commise par les intégrateurs est d utiliser une GED pour stocker, archiver et consulter des documents en format électronique. Par contre, ils se rendent compte rapidement et dès que la quantité de documents gérés devient importante, qu il leur est difficile, voire même impossible de retrouver des documents dans leurs bases sans avoir des moyens et des méthodes standardisées pour les chercher. Le plan de classement consiste donc en la mise en place préalable de certaines règles pour organiser et structurer le stockage des documents dans le système GED. La grande majorité des outils GED offerts de nos jours disposent de capacités et de fonctionnalités facilitant la mise en place du plan de classement. Ces fonctionnalités tournent autour des axes suivants : indexation par catégorie : plusieurs catégories peuvent être définies pour faciliter l indexation des documents. Il est important de bien choisir les catégories ainsi que leur nombre. Trop de catégories complexifie le classement, peu de catégories réduit l effet de la catégorisation à presque néant. classement multiple des documents : un seul document peut être classé sous plusieurs catégories gestion des vues virtuelles : permettant à une utilisateur de voir un certain nombre de document et de groupe de documents auxquels il a droit, sans changer la structure de stockage des documents, ni en les dupliquant, mais simplement en donnant une «vue» différentes. 3.3.1.6 Tableau de gestion Il est entendu que chaque pays possède sa propre politique de conservation des documents. Ils doivent donc être conservés pendant une période prédéterminée selon leur type et/ou nature. L utilisateur de la GED doit donc définir son propre tableau de gestion permettant d inscrire tout sa politique de conservation des documents, basée primo sur les lois en vigueur (nationale et/ou internationale), et secundo sur les éventuelles règles internes (dans le cas d une société) ou besoins personnels (pour le cas des individus). Le tableau de gestion contient principalement et a minima les informations suivantes : durée de conservation : faire attention à cette durée car elle est souvent en fonction du règlement propre à chaque pays et selon les besoins spécifiques des personnes et des sociétés. La durée de conservation est composée de deux parties : o durée opérationnelle : durant laquelle le document est accessible à qui de droit et o éditable. durée d archivage : durant laquelle le document n est plus éditable, mais accessible selon le besoin pour des raisons de vérification et autres. Actions à réaliser à la fin de la durée de conservation : destruction/suppression, archivage sur un support de plus long terme, etc. N oublions pas ici qu il n existe à priori pas à ce jour un moyen d archivage avec une durée de vie illimitée. Chaque support ayant une durée de vie limitée. L utilisateur doit alors reproduire les données/documents sur un autre support de même type ou de type différent ayant une durée de vie plus ou moins longue. Remarquez ici qu il s agit de coûts supplémentaires importants qu il revient à l utilisateur de justifier en fonction du rapport [coût]/[valeur ou utilité du document]. 3.3.2 Utilisation des référentiels Dans le paragraphe précédent (3.3.1 Types de référentiels) nous avons essayé de présenter différents type de référentiels ainsi que leur sens et possibilité d utilisation dans la GED. Il s agit de concepts un peu techniques dans certains cas et nous avons souhaité les simplifier pour faciliter la lecture du paragraphe courant. Les lecteurs qui veulent en savoir plus peuvent consulter la Bibliographie pour quelques références dans le sujet. Nous présentons donc dans les paragraphes suivants quelques exemples d utilisation de ces référentiels. Rappelons ici qu ils sont des éléments essentiels pour une meilleure exploitation de l outil GED (recherche de document, archivage automatisé, gestion des espaces de travail et les droits d accès correspondants, etc.) Livre Blanc des GED en Tunisie. Janvier 2012 version 1.0 17

3.3.2.1 Accès multi-facette aux documents L accès aux documents peut se faire de manière organisée et structurée. En effet, l utilisateur n a pas toujours accès aux documents en ayant recours à une recherche, mais simplement en connaissant la facette sous laquelle le document a été classé. Une facette est comme une dimension de données sous laquelle l utilisateur peut avoir une vue sur les documents à partir d un angle différent. Imaginons à titre d exemple une base documentaire sur des sociétés. L utilisateur peut retrouver les documents correspondants à une société «Société ABCD» en creusant dans l arborescence selon deux facettes : le Secteur d activité et/ou la Région. Pour un accès selon la facette Secteur d activité, les deux documents peuvent être trouvés dans le répertoire suivant : /Société/Informatique/Services_Informatiques/Développement_Web/Société_ABCD Pour un accès selon la facette Région, l utilisateur peut accéder aux mêmes documents en allant dans le répertoire suivant : /Tunisie/Gouvernorat/Ariana/Société_ABCD Rappelons ici qu il s agit d un système de vues permettant d accéder aux mêmes documents selon différentes facettes ou dimensions. Les documents ne sont pas du tout dupliqués. 3.3.2.2 Gestion multi référentiels 3.3.2.3 Gestion des synonymes Les synonymes constituent un outil fondamental pour les recherches dans les bases documentaires. Pour en faire une utilisation optimale, l outil GED doit offrir a minima les fonctions suivantes : Gestion des synonymes et amélioration/enrichissement par l utilisateur lui-même. Cela permet alors d améliorer les synonymes qui existeraient par défaut dans l outil GED pour arriver à répondre au mieux aux besoins des utilisateurs. Elargissement et optimisation des recherches : à chaque fois qu un utilisateur entre un(des) mot(s) clé, le système peut proposer des résultats additionnels correspondants aux différents synonymes du(des) mot(s) clé saisi(s). Bien entendu, le système classera automatiquement les résultats de la recherche par pertinence en mettant en tête de liste les résultats du(des) mot(s) clé saisi(s) pour ensuite donner les résultats correspondants aux synonymes. 3.4 Moteur de recherche Juste après avoir stocké les documents dans un outil GED, ce qui est l étape de base pour réellement parler de GED, nous avons besoin de faire une certaine gestion de ces documents. Le moteur de recherche se présente alors comme l outil de la plus haute importance. Nous parlons généralement de grandes quantités de documents qu il devient pratiquement impossible de les retenir ou de les retrouver par leur simples identifiant par exemple. Le moteur de recherche prend donc toute son importance dans ce genre de système et joue alors le rôle d une des fonctionnalités clé et absolument nécessaires pour une réelle exploitation de l outil GED. Les moteurs de recherche intégrés dans les outils GED sont plus ou moins avancés. Il est des fois nécessaire de penser à intégrer des modules de recherche externes pour aller chercher le meilleur de ces systèmes, ne faisant souvent pas partie du cœur du métier GED. 3.4.1 Fonctions de base Les moteurs de recherche doivent offrir un minimum de fonctionnalité pour permettre aux outils GED de garder leur sens. Voici à titre d exemple les fonctionnalités minimales à avoir : indexation et recherche en utilisant les métadonnées (données alphanumériques) indexation en utilisant le contenu du document proprement dit, si possible. En effet, dans le cas des images, aucune extraction de contenu automatique n est envisageable sans passer par des systèmes de reconnaissance de caractères. Il s agit de l indexation communément connu sous le nom «full text». recherches multicritères accompagnées des opérateurs booléens : recherche un document créé entre une «Date Début» et «Date Fin», de format «PDF», ajouté par l utilisateur «U», etc. Livre Blanc des GED en Tunisie. Janvier 2012 version 1.0 18

3.4.2 Fonctions avancées Les outils GED ne sont généralement pas dotés de moteurs de recherches avec des fonctions avancées. Ces dernières permettent l obtention de résultats plus fins, plus rapidement et souvent plus justes. Les raisons sont simples et évidentes : plus fins : car avec un bon nombre d outils (thésaurus, ontologie, recherche multicritères, etc.), nous finissons toujours par avoir des réponses répondant le mieux à nos critères de recherche. plus rapidement : avec des structurations des documents dans les outils GED et surtout avec des moteurs de recherche plus puissant et utilisant des systèmes d indexation avancés. plus justes : certains moteurs de recherche peuvent faire un apprentissage à fur et à mesure de leur utilisation. Les utilisateurs peuvent après chaque utilisation noter les résultats trouvés. Cela permet au moteur de recherche de donner les résultats les plus adaptés en fonction des notes attribués dans des recherches précédentes. Parmi les fonctionnalités que nous pouvons trouver dans des moteurs de recherches avancés, nous citons la liste non exhaustive suivante : Gestion des paniers de recherche : permet d enregistrer des recherches, ou plutôt les critères de ces recherches, pour les lancer à la demande. Cela évite aux utilisateurs de perdre du temps à saisir plusieurs critères parfois de nombreuses fois dans la même journée. Robots de recherche : permettant de lancer des recherches lourdes en dehors des heures de pointes (heures d utilisation dense de l outil GED). Les résultats sont alors stockés sur le système et affichés à la demande. Combinaison de plusieurs techniques de recherche : à titre d exemple, utilisation de l ontologie, accompagnée de l apprentissage réalisé sur les recherches antérieures, etc. Il existe une multitude de moteur de recherche open source qui peuvent être utilisés avec l outil GED choisi afin de combler le besoin en recherche poussée et avancée. Cependant, avant de s investir dans de telles aventures, il faut bien analyser les besoins futurs (moyen et long termes) et obtenir une réponse à un certain nombre de questions, comme par exemple : Le moteur de recherche choisi vivra-t-il longtemps? : tout comme les autres projets open source, il faut évaluer la durée de vie d un projet en fonction de sa communauté et aussi de bons nombres d autres paramètres. Il faut donc étudier ce moteur tout comme vous faites pour l outil GED lui-même. Choisir une intégration qui vous évite de gros changements, voire même aucun, si vous êtes appelés à changer de version de votre outil GED, et peut être même de votre moteur de recherche. Sachant que les deux seraient des projets complètements différents, il peut y arriver des cas ou une nouvelle version de l un des deux fasse en sorte que l intégration déjà réalisée ne fonctionne plus et qu il soit nécessaire de faire des changements et des adaptations nouvelles. Pour finir, nous souhaitons conseiller les utilisateurs d éviter de faire du développement spécifique car il risque d être très couteux, et surtout quand vous essayerez de suivre l évolution de votre outil GED choisi (passage d une version majeure à une version supérieure). 3.5 Intégration de la GED Dans bien des cas, l outil GED est utilisé comme un espace de stockage permettant aux utilisateurs d outils de bureautique et autres de stocker leur document en format électronique pour un meilleur classement et une facilitation des recherches ultérieures. Il ne faut pas oublier non plus que la raison même d avoir fait appel à la GED provient du fait même que nous utilisons de plus en plus de document électronique, ou que nous souhaitons convertir en format électronique. Les outils GED sont donc là pour répondre à ce besoin, mais il ne faut pas que ce soit considéré comme une étape additionnelle, voire même un obstacle à franchir pour arriver à ses fins. Pour donner un exemple, imaginez l installation d un antivirus sur un ordinateur. Cela est souvent nécessaire pour se prémunir contre tout dommage pouvant cibler nos systèmes. Mais dans tous les cas, ces antivirus sont installés et fonctionnent en arrière plan, sans que l utilisateur s en rende compte, mis à part les cas d alertes. Livre Blanc des GED en Tunisie. Janvier 2012 version 1.0 19

Le fonctionnement et l utilisation des outils GED devraient eux aussi être réalisés de façon transparente aux utilisateurs. On peut alors imaginer que dans le cas de l utilisation de document de bureautique (documents, tableurs, etc.), une fois que l utilisateur fait un «enregistrement», le document est aussi enregistré sur l outil GED. Quand il demande d ouvrir un document, celui-ci est extrait de l outil GED. Tout ca sans que l utilisateur sache qu un outil GED fonctionne en permanence en arrière plan. Par ailleurs et dans certains cas, nous sommes appelés à travailler directement sur l outil GED lui-même. Dans ces cas, nous faisons alors appel à la facilité d utilisation des interfaces et leur ergonomie qui doivent être simples et suggestives. 3.5.1 Utilisation en tant qu espace de stockage Comme nous l avons déjà précisé dans les paragraphes plus haut, les utilisateurs des outils GED l utilisent ou simplement le confondent avec un simple espace de stockage. Cela est dû principalement à cause ou grâce à deux points essentiels : Visuel des interfaces très ressemblant au système de navigation sur les fichiers de la grande majorité des systèmes d exploitation Facilité d utilisation avec des fonctionnalités ressemblant à celles des outils de bureautique : déplacer, copier-coller, couper-coller, etc. Bien sûr, ces éléments et bien d autres d ailleurs laissent l utilisateur très confortable avec l utilisation et font qu il adopte facilement l outil GED. Cependant, en utilisant l outil de la sorte, nous perdons beaucoup des fonctionnalités importantes dont l indexation juste et complète des documents enregistrés. En effet, le fait de stocker les documents directement sur un espace disque virtuel (qui est l arborescence qu offre l outil GED) nous ne faisons pas de référencement des documents. 3.5.2 Intégration avec les outils de bureautique Les outils les plus largement et communément utilisés sont les logiciels de bureautique. Ils sont à priori utilisés par presque tout utilisateur de l outil informatique. Il devient alors intéressant de penser à l intégration de l ensemble du système d information d une société avec l outil GED utilisé. Il permettra alors non seulement le stockage des documents, mais aussi la gestion du travail collaboratif en permettant les aspects nécessaires (gestion des versions de documents, gestion des accès concurrents, partage, etc.). Imaginons maintenant un environnement de travail à offrir à tous les utilisateurs leur permettant de ne voir que leurs outils de bureautique habituels, mais derrière lesquels nous trouvons toute une couche de GED leur permettant de travailler sur les deux environnements (outils de bureau et outil GED) sans aucune interruption et sans avoir à faire des manipulations (import / export de données) additionnels. Malheureusement, aucun outil GED n intègre nativement ce genre de services. Il faut toujours procéder à des manipulations et des travaux d intégration lourds et couteux. 3.6 Numérisation Qui parle de GED pense directement ou indirectement à la numérisation des documents. Comme elle n est généralement pas prise en charge par les outils GED, elle est souvent négligée et oubliée lors de l évaluation et de la préparation des cahiers des charges des projets documentaires. De ce faire, et mise à part l évaluation de l outil GED lui-même, il faut souvent avoir un œil sur les possibilité de les connecter à un outils complémentaire permettant de faire la capture des documents, mais aussi de les injecter dans l outil GED accompagnées de leurs métadonnées. Ceci est loin d être une tâche facile car nous parlons d une solution différente de l outil GED lui-même. Divers problèmes peuvent alors surgir allant des difficultés de communication et d injection des données, jusqu à l inexistence ou la non prise en charge de standard d échange poussant ainsi les utilisateurs à se tourner vers du développement spécifique, souvent couteux et avec des résultats non garantis. 3.6.1 Pilotage de scanner et préindexation Presque la totalité des outils GED n offrent pas de fonction de pilotage de scanner et donc pas de préindexation. Il est déjà connu et établi que les outils GED se concentrent sur la GED proprement dite et laisse la partie de capture des documents à d autres outils pouvant être plus ou moins performants et avec des coûts très variés. Livre Blanc des GED en Tunisie. Janvier 2012 version 1.0 20

L outil GED est généralement installé sur un serveur, alors que la fonction de capture des documents est confiée aux postes de travail des utilisateurs. C est sur ces derniers que les outils (logiciels et matériels) de scannage sont installés. Outre le scannage des documents, ils doivent aussi réussir à faire passez des données de bases composant ainsi les toutes premières métadonnées du document scanné. On parle alors de préindexation qui est une étape très importante. En effet, elle permet non seulement de faciliter et accélérer la capture des documents, mais aussi et dans bien des cas, récolter des données difficiles à identifier par l utilisateur lui-même (taille du fichier, type du document, etc.) ou encore des données répétitives d un document à un autre (expéditeur, destinataire, date de capture, etc.). 3.6.2 Reconnaissance automatique Plusieurs postes de scannage de document (ensemble composé du scanner et du logiciel qui le commande) permettent la reconnaissance automatique de diverses informations sur les documents. Deux grands axes sont à noter : Reconnaissance du type du document : certains documents peuvent être identifiés par des codes à barres, ou encore des symboles ou un identifiant placé à un endroit précis du document. Lors de son scannage, le logiciel peut alors le lire, le reconnaitre, et le classer convenablement en lui attribuant une catégorie ainsi qu un ensemble de métadonnées prédéfinis au préalable. Indexation par mots clés : cette méthode peut s avérer coûteuse et non indiquée pour bien des cas. En effet, elle est lente à cause du temps nécessaire au traitement OCR (reconnaissance de caractère) et donc d extraction de tous les mots contenus dans le document. Cependant, si cela ne pénalise pas la société et qu elle soit prête à le faire malgré les surcoûts, ce mode de reconnaissance peut permettre d identifier le document et de l indexer. Cela est possible en utilisant des mots extraits directement du document (mots répétés plus qu un nombre déterminé de fois) ou encore vérifiée dans une liste externe prédéfinie et retrouvé dans le document scanné). 3.7 Gestion des droits Qui dit Gestion Electronique de Document, dit aussi partage de documents de tous types entre différents acteurs ayant des privilèges et des droits d accès aux documents très variés. Ainsi, la gestion des droits d accès est l un des axes principaux de la GED. 3.7.1 Niveaux de gestion La gestion des droits d accès des GED devrait être confiée aux gestionnaires du système et non à des techniciens en prenant le risque de leur donner accès parfois à des documents extrêmement confidentiels. Plus les gestionnaires ont la possibilité de gérer seuls les documents et les droits correspondants, mieux est le système. Les GED disponibles n offrent pas tous cette possibilité. Non seulement les gestionnaires doivent administrer les accès d eux-mêmes, mais ils doivent aussi avoir la possibilité d attribuer des droits d accès granulaires. Ces derniers se traduisent selon le système GED par l un et/ou l autre des points suivants : Droits d accès par branche du système de fichiers stockant les documents Droits d accès au niveau de chaque document Droits d accès au niveau de chaque métadonnée 3.7.2 Gestion des profils La notion de profil sert à donner aux utilisateurs des accès à des fonctions (traitement, manipulation, usage) bien définies sur les documents. Cette notion s apparente parfaitement à la gestion des groupes d utilisateurs sur un système Unix/Linux. Ainsi, un utilisateur peut appartenir en même temps à un ou plusieurs groupes, bénéficiant ainsi de l union des droits et des autorisations relatifs à tous les groupes auxquels il appartient. Le rôle même de la gestion des profils peut être géré de la même façon. Ainsi, la gestion des profils peut être déléguée à des sous administrateurs du système responsable sur une partie de la base de données GED. Avoir cette possibilité donne alors deux principaux avantages importants aux systèmes GED : Meilleure gestion des profils par des administrateurs connaissant mieux leurs besoins. Possibilité d agir rapidement et de façon autonome sans attendre l intervention d un technicien Livre Blanc des GED en Tunisie. Janvier 2012 version 1.0 21

Décentralisation permettant la répartition juste et équitable de : des responsabilités, des rôles, des privilèges et de la charge de travail 3.7.3 Annuaire et SSO Vu la haute confidentialité de certains documents et vu le risque d erreur sur la gestion des profils des utilisateurs, il est fortement conseillé de la réaliser sur un annuaire d entreprise LDAP (Lightweight Directory Access Protocol). Ce dernier permettra de décider et de paramétrer le ou les profils à donner à chaque utilisateur une bonne fois pour toute. Le système GED ne fera que prendre le profil total correspondant à chaque utilisateur depuis l annuaire directement. En plus des avantages connus pour l utilisateur des annuaires d entreprises et de la notion de SSO, plusieurs bénéfices peuvent être tirés de leur utilisation par un système GED : Centralisation de la gestion des profils pour plus de cohérence Renforcer la sécurité de cette partie de gestion/paramétrage Attribuer des rôles à des groupes et non à des personnes au niveau du GED La capacité de synchronisation et de rapidité d interfaçage avec des annuaires et des systèmes de SSO des systèmes GED constitue donc un important critère de sélection. 3.8 Fonctions collaboratives Les outils GED permettent de rassembler l ensemble des documents d une entreprise. Il s en suit qu ils offrent plusieurs fonctionnalités telles que le partage et la réservation de documents (voir paragraphe 3.2.1 Réservation (check-in/check-out)), le versionning (voir paragraphe 3.2.2 Incrémentation des versions), les notifications, etc. Dès lors, les utilisateurs de l outil se retrouvent dans un espace virtuel et le travail collaboratif prend tout son sens. Ce dernier est régi par plusieurs concepts dont les principaux sont : Réservation explicite : dans ce cas, quand un utilisateur demande à éditer un document, il est automatiquement copié sur son poste de travail pour lui permettre de faire des changements en local. Pendant ce temps, le document reste consultable et accessible par les autres utilisateurs, mais seulement en lecture. Le document aurait donc subit un «check-out» (voir paragraphe 3.2.1 Réservation (check-in/check-out)). Une fois que l utilisateur termine sa tache, il enregistre le document qui est automatiquement mis à jour sur l outil GED. Le document subit un «checkin» (voir paragraphe 3.2.1 Réservation (check-in/check-out)). Les autres utilisateurs pourront alors accéder à la nouvelle version du document, mais aussi à l ancienne puisque l outil GED gère le versionning (voir paragraphe 3.2.2 Incrémentation des versions). Modification en ligne : dans ce cas, il n y a pas de copie en local sur le poste de travail de l utilisateur. Il peut réaliser sa modification directement sur la version en ligne. Le document reste alors réservé tant qu il est ouvert sur son poste et n est libéré qu à sa fermeture. Ce genre de modification peut s avérer plus facile techniquement et évite des téléchargement/chargement des documents avec toutes les contraintes relatives (temps de téléchargement, possibilité d infection par des virus en local, etc.). Cependant, un défaut majeur étant que l utilisateur doit rester connecté. En absence de connexion fiable et permanente et sans coupure, cette méthode serait à oublier. Un cas qui arrive le plus souvent étant celui ou des documents restent verrouillés quand un utilisateur perd sa connexion et ne seraient déverrouillés automatiquement par le système qu après un certain temps. Modification concurrente : il s agit d une méthode très performante et permettant d avancer plus rapidement sur des modifications d un document par plusieurs utilisateurs en simultanée. L outil GED montre à chaque utilisateur l écart entre sa copie du document et celle modifiée par les autres. Il lui reviendra alors d accepter ou de refuser. Cependant, cette pratique n est malheureusement ni disponible sur tous les outils GED, ni possible pour tous les types de document. Qui parle travail collaboratif, pense automatiquement à deux aspects : Notification des changements : à chaque fois qu un document subit une action (édition, consultation, etc.), un ou plusieurs utilisateurs peuvent choisir de recevoir des notifications par mail. Livre Blanc des GED en Tunisie. Janvier 2012 version 1.0 22

Commentaire sur un document : tout comme nous pouvons voir sur les réseaux sociaux de nos jours, les outils GED peuvent offrir la possibilité aux utilisateurs de commenter des documents en rajoutant des notes consultables par le reste des utilisateurs ayant droit sur ce même document. 3.9 Workflow (Flux des travaux) Un workflow (anglicisme), ou en français flux des travaux est la représentation d'une suite de tâches ou opérations effectuées par une ou plusieurs personnes. Il faut d abord faire la différence entre workflow de document (dans le cadre des GED) ou workflow de contenu (dans le cadre des CMS Systèmes de gestion de contenu). En effet, l objet de notre présentation de ce chapitre étant le premier type de workflow qui représente la suite des taches et opérations réalisées sur les documents gérées par l outil GED, contrairement aux CMS qui se concentrent plutôt sur le contenu lui-même. Aussi, et dans tous les cas, le workflow peut être vu de deux manières. Le workflow documentaire et le workflow métier que nous expliquons plus en détail dans les paragraphes suivants. 3.9.1 Workflow documentaire Le workflow documentaire est en fait l ensemble des tâches et opérations réalisées sur un document. Nous parlons ici d actions standards telles que : transfert, copie, suppression, archivage, etc. Les outils GED sont pratiquement tous dotés de cette fonctionnalité qui est devenue désormais un des principaux critères de classification des outils dans la catégorie «outil GED». Nous distinguons deux types de workflow : Workflow ad-hoc : il s agit pour un utilisateur donné d envoyer/transférer un document à un autre utilisateur ou même à un groupe d utilisateurs qu il peut choisir à partir d une liste. Le document ne suit donc pas un circuit prédéfini, mais plutôt un chemin décidé par l utilisateur lui-même selon le besoin. Workflow prédéfini : dans le cadre des procédures normales de travail, il peut arriver qu un certain nombre de documents soient toujours acheminés selon leur nature aux mêmes personnes. Pour des raisons de facilité, il devient alors plus propre de transférer automatiquement le document à qui de droit, sans se soucier de son identité ou même de perdre le temps à le sélectionner à partir d une liste. 3.9.2 Workflow métier ou BPM Il s agit de la prise en charge d une partie ou de la totalité des processus métiers dans une méthode à appliquer sur un document ou un groupe de document. Cette façon de faire permet la séparation de la gestion proprement dite des documents, des traitements métiers à appliquer dessus. Plusieurs solutions open sources de moteur de workflow sont désormais disponibles. Nous citons à titre d exemple la liste non exhaustive suivante : Bonita, Enhydra-Shark, jbpm (JBoss Business Process Management), ODE (Orchestration Director Engine), Orchestra, etc. Certaines solutions sont des fois assez complexes et nécessites d importants efforts d intégration. Il convient aussi d être vigilant dans le choix de la solution en fonction des besoins spécifiques à combler. Livre Blanc des GED en Tunisie. Janvier 2012 version 1.0 23

3.10 Gestion du cycle de vie Le cycle de vie d'un document (Records life-cycle en anglais) est la période par laquelle passe un document allant de sa création à sa destination finale (conservation sur support de longue durée ou destruction). Nous pouvons parler principalement des trois étapes suivantes : l'élaboration et la production du document, son utilisation ou maintenance, sa conservation. Leur cycle de vie d un document peut être décrit ainsi : Figure 2 : Cycle de vie d un document 3.10.1 Politique de conservation La conservation des documents est de plus en plus une obligation que s est fixé les utilisateurs pour des raisons personnelles (besoin d accéder à des documents anciens) ou légale (procédures légales nécessitant la disponibilité de documents originaux anciens). Pour diverses raisons évidentes, les entreprises prennent de plus en plus conscience de l importance de la conservation des documents qu ils ont à utiliser dans le cadre de leurs opérations, vu leur valeur, souvent inestimable. Les entreprises doivent donc minutieusement préparer et penser leur politique de conservation pour décider de nombreuses choses telles que : Quels sont les documents qui doivent être conservés? Quand (après quelle durée de temps / période)? Ou (sur quel support et/ou emplacement)? 3.10.2 Archivage Dans le monde de la GED, nous parlons souvent de deux types d archivages. L archivage «en ligne» et «hors ligne». Le premier permet de simplement taggés un document comme étant archivé. Il reste cependant accessible sur le système, d où le nom «en ligne». Le deuxième nécessite un déplacement et un stockage du document sur un support externe pour une conservation d une durée plus ou moins longue. Ce support n étant pas relié à l outil GED, donc non consultable directement, d où le nom «hors ligne». Pour une prise en charge de l archivage, les outils GED doivent intégrer à minima des fonctionnalités telles que : déclenchement automatique de l archivage décider si des actions standards telles que la recherche de documents, peut avoir lieu ou non sur des documents taggés archivés paramétrage de l archivage : quels documents archiver, quand, à quel emplacement, type d archivage («en ligne» ou «hors ligne»), etc. 3.10.3 Format de fichier L outil GED gère principalement des documents. Le format de ces derniers est donc d une importance capitale à plus d un niveau. Livre Blanc des GED en Tunisie. Janvier 2012 version 1.0 24

3.10.3.1 Fonctions liées aux formats Tout comme bien des applications, les outils GED ne prennent pas en charge tous les types de fichier pour l ensemble des fonctions offertes. Parmi ces fonctions, nous citons principalement les suivantes : Prévisualisation : certains fichiers peuvent être prévisualisés en offrant un échantillon à l utilisateur. On peut par exemple penser à la première page d un document texte (word, pdf, etc.), à l image en résolution réduite, une partie d un fichier son/vidéo, etc. l idée est donc de donner une meilleure idée à l utilisateur sur le contenu du document sans avoir à le télécharger dans sa totalité. Extraction d information et de métadonnées : certains formats de fichiers stockent des informations et des métadonnées dans un format qui leur est propre. Reconnaitre le format du fichier permet à un outil GED d accéder de façon directe à ses métadonnées pour les récupérer et les utiliser. Recherche en texte intégral : très souvent, les fichiers stockés sur les systèmes GED sont en format texte (PDF, OpenOffice, HTML, etc.) à partir desquels, le contenu peut être extrait par l outil lui-même sans aucune difficulté. Ainsi, le contenu intégral peut être récupéré du document lui-même pour constituer une base d indexes et de mots clés permettant de le retrouver et de l identifier suite aux recherches. 3.10.3.2 Formats ouverts De nos jours, les notions de «code ouvert» (pour le code source des systèmes open source) ou de «contenu ouvert» (pour le contenu partageable libre de droit) sont devenues très connues et adoptées quasiment par tous. Le besoin de ces notions est motivé par la nécessité d avoir des systèmes interopérables et partageant une importante quantité d information et de documents. Qu il s agit de petite, moyenne ou grande entreprise, le besoin d avoir des systèmes intégrés nous conduit indubitablement vers l adoption d un format standard garantissant non seulement le partage et l échange de document au sein même de l entreprise, mais aussi avec l extérieur. Mais le besoin n est pas si simple à adresser. En effet, il faut non seulement trouver un format ouvert qui convient à tous, mais il doit aussi être : Documenté : une documentation disponible en quantité suffisante pour permettre aux utilisateurs de trouver le support nécessaire au démarrage de son utilisation. Cette documentation devrait aussi être disponible dans les différentes langues possibles/nécessaires afin de garantir une bien plus grande utilisation. Libre : le format doit être librement utilisable sans avoir recours à l obtention d un brevet quelconque ou un l achat d une licence d utilisation. Largement utilisé : plus grande la communauté des utilisateurs de ce format, plus haute la garantie de sa pérennité. Il faut aussi souligner l importance à accorder à la facilité d utilisation du format ouvert adopté. Il doit non seulement être facilement et rapidement maitrisable par les utilisateurs, mais il doit aussi permettre les manipulations simples telles que l ajout de contenu (dans son en-tête ou même dans son corps). 3.10.3.3 Formats de conservation Les documents gérés par et dans un système GED doivent à un moment de leur cycle de vie être conservés. Cette conservation doit se faire dans un format garantissant la conservation de la qualité du document pour permettre leur lecture sans difficultés. En effet, si un document conservé n est pas claire et lisible lors de son extraction, la conservation perd son vrai sens et utilité. Par contre, si le document est lisible et avec exactement la même qualité d origine, la conservation devient un élément clé, permettant non seulement l accompagnement de la conservation papier des documents, mais son remplacement même. Les formats possibles varient du simple format texte au PDF (Portable Document Format) 3.10.4 Archivage numérique légal L archivage des documents, quand il est nécessaire pour de périodes supérieures à 5 ans, sert surtout dans les cas où l entreprise doit avoir recourt à des documents archivés pour des fins légales. Dès lors, la certification de l exactitude et de l authenticité du document prend toute sa place. Il en découle que la procédure devient plus complexe à gérer, surtout qu elle n est généralement pas offerte en standard par les outils GED. Il faut donc avoir recours à des implémentations additionnelles et surtout, à des tiers de confiances permettant d authentifier les documents par des signatures électroniques. Livre Blanc des GED en Tunisie. Janvier 2012 version 1.0 25

3.11 Import/export 3.11.1 Import/export en masse Utiliser un outil GED, c est bien, mais qu en est-il du chargement des documents déjà existants de l entreprise? Dans bien des cas, l entreprise possède une grande quantité de documents à charger sur l outil GED. Cela peut arriver lors du lancement du projet ou encore sur base régulière lorsque l entreprise est appelée à gérer plusieurs documents dans le cadre de ses activités. Comme il est très coûteux de penser à un chargement (import) ou déchargement (export) manuels de document, il devient très utile de penser à des solutions automatisée permettant un import/export en masse. Non seulement l entreprise gagne du temps et de l argent, mais elle peut améliorer le référencement et l indexation des documents dans le cas de traitement automatisable. Certains outils offrent des modules complémentaires ou des API permettant d interagir nativement avec la base documentaire pour gérer les documents (ajout, modification, suppression) ainsi que leurs métadonnées. Cette possibilité est un élément clé de choix de l outil GED dans le cas ou l entreprise possède de grandes quantités de document à importer/exporter. 3.11.2 Export sur support physique Certains outils GED permettent l export des documents et de leurs métadonnées sur support physique pour des fins de stockages et d archivage. En effet, et dans les cas ou certains documents sont moins fréquemment demandés et utilisés que d autres, l outil GED peut procéder à l export des documents pour les mettre sur des supports moins couteux (accès plus lent, durée de vie plus longue, etc.). L outil GED garde alors les métadonnées relatives aux documents exportées pour permettre aux utilisateurs de les retrouver en faisant des recherches. Une fois le document demandé, il peut alors être extrait de la base externe. Il est possible des fois d avoir des besoins d expositions des documents en ligne. Pour des raisons diverses, on peut vouloir ne donner accès qu à une partie de la base documentaire. Il est dans ces cas indiqué de procéder à un export de la partie souhaitée des documents dans un format consultable et navigable en ligne. 3.12 Gestion des emails L email est devenu de nos jours un outil incontesté et incontournable de communication et d échange entre des utilisateurs dans leurs quotidiens, privé ou professionnel. Nous seulement il leur permet d échanger des messages, mais aussi des documents qu ils peuvent attacher à leurs mails. La GED peut alors dans ce contexte jouer pleinement son rôle et permettre à toute une communauté de garantir une fiabilité de leurs systèmes de mails en tirant pleinement profit des avantages offert par l outil GED. Ce dernier peut donc garantir la liste non exhaustive des fonctionnalités suivantes : stockage des documents, indexation des messages pour de meilleurs résultats de recherche, espace collaboratif de travail, etc. L outil GED devient alors un support très utile pour faire foi de mémoire d entreprise permettant de stocker et d indexer tous les échanges de toute nature en interne et avec les partenaires. 3.12.1 Quels emails faut t il archiver? Quand on parle de mails, on parle souvent de spam et de publicité non sollicitée. Tout comme nous faisons du «nettoyage» dans nos boites mails, il est intéressant de penser à un mécanisme nous permettant d éviter de stocker tout et n importe quoi dans l outil GED. A défaut, l outil perdrait du sens. Pour optimiser leurs apports, les outils GED proposent des fonctions de sélection de mails pour l archivage. Comme la tache est parfois difficile à réaliser vu les excès dans un sens (archiver beaucoup de spam) ou dans l autre (ne pas archiver d important mail les confondants avec des spams), il est souvent recommandé d utiliser une méthode manuelle. Ainsi, on peut voir dans certains cas des plugins se matérialisant par l ajout d un bouton au niveau du client mail et qui par un simple click, permet à l utilisateur de demander le stockage du mail courant. Livre Blanc des GED en Tunisie. Janvier 2012 version 1.0 26

3.12.2 Gestion optimale des emails Les emails ont des spécificités et particularités, qui rendent leur gestion (ajout, stockage, lecture, etc.) plus complexe qu on peut croire. En effet, il ne suffit pas de savoir et pouvoir stocker des mails pour les lire ultérieurement, mais il faut aussi, dans la mesure du possible (car ce n est pas possible dans 100% des cas), être en mesure de récupérer un mail stocker et arriver à le lire dans son format initial, sans altération et sans incompatibilité avec l outil de lecture. Donc, que l email soit en format texte simple, texte enrichi, html, ou même en format propriétaire à des clients de messagerie, l outil GED doivent permettre sa conservation et sa gestion sans que le format ne soit altéré. Comme il est souvent le cas, les emails sont échangés entre un groupe de destinataires et contenant aussi dans certains cas de nombreux fichiers en attachement. Généralement, les systèmes de messagerie dupliquent les mails ainsi que leurs attachements nécessitant ainsi d importants espaces de stockage. L outil GED doit quant à lui permettre d éviter ce genre de cas et offrir une optimisation de l espace de stockage en détectant les doublons, voire même en gérant des versions incrémentales des documents échangés. 3.13 Gestion de dossiers 3.13.1 Notions La gestion des dossiers a été réalisée sur les outils de GED de la façon la plus proche et la plus similaire possible à la gestion ordinaire physique/papier, mais aussi à la gestion du bureau dans un poste de travail d un système d exploitation conventionnel. Il a été fixé comme objectif d offrir aux utilisateurs un environnement très similaire à leur système de gestion de dossier conventionnel pour garantir leur adoption de l outil GED et minimiser, voir même réduire à néant, son «dépaysement». La GED permet par définition de gérer et stocker des documents en format numérique. Ce dernier offre plusieurs avantages dont principalement la possibilité de référencer un document sous plusieurs référentiels sans pour autant le dupliquer. On gagne alors en espace de stockage mais aussi en rapidité d accès aux informations 3.13.2 Outils de la gestion de dossiers De nos jours, les outils GED sont tous équipés de fonctions avancées de gestion des dossiers allant de la simple automatisation des traitements jusqu à l intégration avec des applications tierces. L idéal est d avoir des fonctionnalités offertes directement par l outil GED, ce qui n est malheureusement pas toujours le cas. Il faut donc prendre soin de bien dresser une liste des fonctionnalités demandées lors de la sélection d un outil. 3.13.2.1 Gestion des dossiers Les outils GED sont dans leur grande majorité dotés de plusieurs outils et fonctions leur permettant de faciliter la gestion des dossiers. Les plus connus sont : Déclenchement automatique de traitements ou de règles sur un dossier (ainsi que son contenu) dès qu un évènement a lieu. Intégration d applications externes avec l outil GED pour permettre la récupération de données dans des documents (récupération de contenu à partir de formulaire, de flux RSS ou tout autre source) Génération de document à partir de données recueillis sur les dossiers (leur contenu, leur métadonnées, etc.) 3.13.2.2 Classement Dans certains cas et surtout pour les documents à caractère légal, nous pouvons avoir besoin de faire une relation entre les documents physiques et leurs correspondants numériques. Il va aussi de soit que l identification du dossier ou de ses documents soit un élément clé pour maximiser le résultat des recherches futures. 3.13.2.3 Traçabilité Cette fonction est très utile, voire même indispensable dans tous les outils GED. Elle permet de stocker l information relative à l utilisation de toute sorte sur chaque dossier. Cette information est ensuite utilisée pour permettre des audits futurs sur les documents et leur utilisation (qui a fait quoi et quand). Livre Blanc des GED en Tunisie. Janvier 2012 version 1.0 27

3.14 Intégration technique De nos jours, les outils GED font partie du système d information des entreprises. Ils sont considérés comme une brique indissociable jouant un rôle important de stockage et d archivage des documents de l entreprise venant directement de l extérieur (intégration sur l outil GED directement) ou encore de l interne (venant d autres systèmes informatique de l entreprise). L outil GED prend donc une place au cœur du système d information et se doit donc d être pratiquement transparent et complètement intégré au reste du système. 3.14.1 Accès direct Tout d abord, nous parlerons ici de la façon la plus standard d accéder à un outil GED. Il s agit de l accès direct à travers les interfaces de l outil lui-même. Cependant, et pour des raisons de facilité aux utilisateurs, il est parfois indispensable de changer les interfaces de l outil pour les rendre plus proches des habitudes de l utilisateur et faciliter ainsi son travail. Ces changements peuvent être parfois complexes et nécessiter de lourds développements facilement mis en danger dès la mise à jour de la version de base de l outil GED (upgrade de version). Il faut donc faire attention à ne pas exagérer la quantité et la qualité des changements. 3.14.2 Interfaces utilisateurs Contrairement à l accès direct, certains outils GED permettent la création d interfaces utilisateurs simples, qui s installent sur une des applications composant le système d information. Parmi les cas les plus connus, nous citons l exemple des plateformes web (portail, intranet, extranet, etc.) permettant l insertion d information, de contenu et de documents, depuis des interfaces simples et les injectant directement dans l outil GED. Ces interfaces constituent une bonne solution intermédiaire entre les accès directs sur les outils GED et les intégrations applicatives. 3.14.3 Intégration applicative Ce type d intégration est de plus en plus utilisé, voir même indispensable, surtout si les entreprises envisagent une intégration complète avec leur système d information. Avec l arrivée des standards d échanges de contenu entre plateformes hétérogènes, cette intégration devient donc très possible, même si elle nécessite des fois un développement complexe. 3.14.3.1 Les Web services Un web service («service web» en français) est un programme informatique permettant la communication et l'échange de données entre systèmes hétérogènes dans des environnements distribués. Il s'agit de fonctionnalités exposées sur les réseaux informatiques, par et pour des applications ou machines, de manière synchrone et sans intervention humaine. 3.14.3.2 Web services SOAP Il s agit d une spécification de web services utilisant le langage XML (Extensible Markup Language) au format standard SOAP (Simple Object Access Protocol). Les échanges ont lieu via le protocole HTTP. Pour fonctionner de manière automatique et sans intervention humaine, ces web service mettent à disposition des utilisateurs un ensemble de fonctions décrites dans un format standard appelé WSDL (Web Services Description Language) 3.14.3.3 Web services REST Ce type de services est plus simple et en même temps plus performant que la spécification SOAP. En effet, les services REST (REpresentational State Transfer) utilisent le protocole HTTP dans les deux sens (entrées et sorties des données et des requetes). En plus, ils ne sont pas limités au langage XML ce qui les rends plus performants. 3.14.3.4 CMIS (Content Management Interoperability Services) Cette nouvelle norme prend de plus en plus de place sur le marché de la GED. En effet, il s agit d une norme permettant de standardiser les accès à n importe quel outil GED ou autre système faisant de la gestion documentaire. Avec l arrivée de cette norme, l investissement réalisé par les entreprises et les développeurs dans leurs systèmes d information devient de plus en plus rentable puisqu ils sont complètement indépendants de l outil GED auquel ils s interfacent. Ainsi, un applicatif développé et accédant à un outil GED peut rester entièrement opérationnel si on pense à un changement de l outil GED (en autant biensur qu il soit compatible avec cette norme). Livre Blanc des GED en Tunisie. Janvier 2012 version 1.0 28

Il est cependant intéressant de noter que ce standard offre pour le moment une version permettant simplement l utilisation des fonctions de bases des outils GED, tels que : la consultation, l upload, la modification, la suppression, etc. A titre d exemple, ni la gestion des utilisateurs/groupes, ni l utilisation des Workflows n est encore implémentés. Il est cependant annoncé que les prochaines versions de ce standard prendront en charge ces fonctionnalités. 3.14.3.5 Portlets La notion de Portlets aide à l intégration des systèmes et l échange des données entre eux. Il s agit d un composant qui s installe sur un portail J2EE donnant directement accès à du contenu, voir même des fonctionnalités d un système distant. Certains outils GED offrent nativement des Portlets ce qui leur permet donc de s intégrer facilement avec le système d information de l entreprise. 3.14.4 Mode SaaS Avec la place de plus en plus importante que prennent les outils GED, plusieurs opérateurs ont ressenti l importante augmentation de la demande et ont donc mis en ligne des plateformes offrant des solutions GED en mode SaaS (Software as a Service). Il s agit donc d une façon intéressante mettant à la disposition des entreprises des plateformes assez compétitives leur permettant non seulement de profiter des fonctionnalités de l outil GED, mais surtout de se concentrer sur le cœur de leur business, sans se préoccuper de l installation, de la maintenance, des mises à jour, etc. Livre Blanc des GED en Tunisie. Janvier 2012 version 1.0 29

4 Liste des GED étudiés 4.1 Alfresco 4.1.1 Présentation Alfresco est un projet Java/PHP Open-Source (licence MPL) de gestion électronique des documents (GED) avancée, et fournit des services de recherche et de catégorisation du contenu, multi plateforme. Il est principalement basé sur la technologie J2EE. L'architecture modulaire d'alfresco utilise des outils Open-Source pour optimiser les performances, et la Programmation Orienté Aspect (AOP) facilitant ainsi la modularité et l adaptabilité de l application. On peut citer : Spring (framework d'intégration), Hibernate (mapping Objet Relationnel), Lucene (recherche), MyFaces (présentation), JSF (Java Server Faces). Suite à de nombreuses demandes, l'entreprise Alfresco a libéré complètement les fonctionnalités jusqu'alors réservées à la version entreprise depuis la version 1.2.1. 4.1.2 Fiche signalétique Produit, version URL Alfresco V3.4 http://www.alfresco.com Architecture Plate-forme : GNU/Linux, Windows, Macintosh OS X, Unix Server Web : Apache, IIs Serveur d'application : - JBoss Application Server - Apache Tomcat - J2SE 5.0 (JRE 5.0) Structure d'application : Java Langage de programmation : Java Base de données : Toute Base de données supportées par Hibernate, y compris : MySQL ; Oracle Typologie Licence MPL/GPL/LGPL (Tri-License) Date de démarrage projet Juin 2005 Origine du projet Londres Livre Blanc des GED en Tunisie. Janvier 2012 version 1.0 30

4.1.3 Références ANFA : Association Nationale pour la Formation Automobile (France) BNPParibas (France) Autorité des marchés financiers (France) Armée de l'air (France) CNRPS : Caisse Nationale de Retraite et de Prévoyance Sociale (Tunisie) ONJ : Observatoire National de la Jeunesse (Tunisie) ISETKR : Institut Supérieur des Etudes Technologiques de Kairouan (Tunisie) Livre Blanc des GED en Tunisie. Janvier 2012 version 1.0 31

4.2 Dynacase (FreeDom) 4.2.1 Présentation Freedom-ECM est une solution de gestion de contenu (ECM) libre (Licence GPL) développée principalement par la société Anakeen. Freedom-ECM est développé en PHP/Javascript et utilise la base de données PostgreSQL. La partie serveur fonctionne sous Linux (Fedora, Debian,..) et la partie client nécessite uniquement un navigateur récent (ex: Firefox). Freedom-ECM permet de stocker tout types de documents dans des familles et de les gérer à l'aide de cycles de vies (Workflow) et de profils d'accès dynamique en fonction du contenu. 4.2.2 Fiche signalétique Produit, version URL Architecture Typologie Licence Dynacase Platform V 3.0.18 (Avril 2011) www.dynacase.org Système d'exploitation : Linux (GNU/Linux) Serveur de base de données : PostgreSQL Langage de programmation : PHP Open source, sous licence GPL Date de démarrage projet Année 2001 Origine du projet Généralité et fonctions France Quatre fonctionnalités phares : Workflow Dynamique Gestion des droits Dynamique Interfaces Dynamiques Multi-applications Compatibilité et ouverture Partenaires & contributeurs Société commerciale XML / RSS / RDF / LDAP RedHat, Ubuntu, Zend et des partenaires Intégrateurs & Distributeurs La société Anakeen Livre Blanc des GED en Tunisie. Janvier 2012 version 1.0 32

4.2.3 Références Plastigray [spécialisée dans la conception, l'industrialisation et la fabrication de pièces d'aspect et de pièces techniques par injection de matières plastiques] (France) Médiateur National de l'energie MNE (France) AFNOR Qualigaz Réseau Ferré de France 4.3 Jahia 4.3.1 Présentation Jahia est un serveur applicatif remplissant les fonctions de portail d'entreprise, de serveur de gestion de documents, de serveur de gestion d'activité, de moteur de recherche et de suite collaborative. Il est fondé sur le langage Java et distribué sous licence collaborative (concept de «contribuer ou payer»). Jahia porte l'accent sur la création et la gestion de contenu Web. Plus qu'une GED au sens strict du terme, il s'agit d'un module très complet de diffusion de contenu sur le Web. Jahia est disponible en une version Community (communautaire), libre et gratuite (distribuée sous une licence GPL), et une version Enterprise. La version Enterprise fournit une assistance professionnelle et des modules supplémentaires tels que la prise en charge de l'annuaire LDAP (Lightweight Directory Access Protocol) ou la connexion à Alfresco. La version Enterprise est facturée selon le niveau d'assistance et le nombre de machines virtuelles Java mises en œuvre pour le faire fonctionner. Livre Blanc des GED en Tunisie. Janvier 2012 version 1.0 33

4.3.2 Fiche signalétique Produit, version URL Jahia V6.5 http://www.jahia.com Architecture Plate-forme : GNU/Linux, Windows, Macintosh OS X, Unix Server Web : Tomcat, Apache, IIS Serveur d'application J2EE Langage de programmation : Java/XML/XSLT/Javascript/JSP Base de données : Interconnecter avec la plupart des bases de données existantes Typologie Licence Jahia offre un modèle de double licence : Date de démarrage projet Année 2002 - GPL 2.0 pour l'édition communautaire - JSEL (Jahia Sustainable Enterprise License) pour l'édition commerciale Le projet a été créé en 2002 et le groupe en 2005 Origine du projet Suisse Généralité et fonctions Edition de contenu facile (modèles, WYSIWYG) ; Gestion des langues et de l'internationalisation ; Gestion de la sécurité avancée ; Système de validation des pages ; Supports d'applications WEB «portlets» Ex : forum, courrier, news ; Possibilité de gérer plusieurs sites différents ; Moteur de recherche intégré ; Administration entièrement en ligne. Compatibilité et ouverture Partenaires & contributeurs Société commerciale XML / RSS / RDF / LDAP Une centaine de SSII & Intégrateurs Jahia Ltd Livre Blanc des GED en Tunisie. Janvier 2012 version 1.0 34

4.3.3 Références AON Australian Development Gateway - ADG Aircell Astre AG2R Adoma Yirdis Livre Blanc des GED en Tunisie. Janvier 2012 version 1.0 35

4.4 Knowledge Tree 4.4.1 Présentation Contrairement à Alfresco et Nuxeo qui sont développés en Java, Knowledge Tree est développé en PHP. Il est plus léger que les solutions précédentes et plus simple à installer. En contrepartie, son jeu de fonctionnalités de base est moins complet. La version Community Edition, gratuite et libre, permet d avoir une solution GED simple qui ne dispose pas de fonctionnalités telles que l'intégration à Microsoft Office ou la signature électronique. Ces fonctionnalités sont disponibles dans la version payante de Knowledge Tree (prix par mois et par utilisateur). Le tarif de l'abonnement dépend également du niveau d'assistance. 4.4.2 Fiche signalétique Produit, version URL Architecture Typologie Licence KnowledgeTree V3.7 http://www.knowledgetree.com Linux Apache MySQL PHP (LAMP) Disponible sous plusieurs licences, selon les fonctionnalités souhaitées et le nombre d utilisateurs. Edition SaaS - Propriétaire Edition Commerciale : Propriétaire Edition Communautaire (Open Source) - GPLv3 Date de démarrage projet Année 2006 Origine du projet Afrique du Sud Généralité et fonctions Business Process/Workflow Gestion des emails Recherche fulltext Sauvegarde de recherche Records management Authentification LDAP Compatibilité et ouverture Partenaires & contributeurs Société commerciale XML / RSS / RDF / LDAP MySQL / Zend et une centaine de SSII & Intégrateurs La société sud-africaine JamWarehouse 4.4.3 Références La Commission de Modernisation de l Ordre judiciaire (France) KnowledgeTree pour les juridictions KnowledgeTree pour les magistrats Livre Blanc des GED en Tunisie. Janvier 2012 version 1.0 36

4.5 LogicalDoc 4.5.1 Présentation LogicalDOC est un système de gestion électronique des documents qui peut être utilisé par les petites et grandes entreprises, comme un moyen souple pour gérer efficacement les dossiers. L'utilisation de systèmes de gestion de connaissances peut aider les entreprises à contrôler efficacement l'accès de l'employé aux ressources. Ceci conduit à une augmentation de la productivité à moyen terme. En utilisant ces systèmes, l'information, ainsi que les connaissances qui sont généré au sein d'une organisation, peut être atteint par les employés. 4.5.2 Fiche signalétique Produit, version URL Architecture Typologie Licence LogicalDoc V6.3.2 (décembre 2011) http://www.logicaldoc.com L Architecture LogicalDOC est basée sur les technologies suivantes : o o o o o Apache_Tomcat Application Server Java J2SE (JDK 1.6 or higher) GWT (Google Web Toolkit - Ajax) Lucene Spring Framework Open Source - GNU LGPL Date de démarrage projet Année 2007 Origine du projet Italie Généralité et fonctions Révision d un document (grandes et petites révisions) Gestion des images Accès au dépositaire via WebDAV et Webservice Flux de travail jbpm Recherche Lucene Supporte multi-langues Supporte multiplateformes (Windows, GNU/Linux, Mac OS X) Interface graphique intégrée à Internet (Internet Explorer, Firefox, Google Chrome) Intégration Bureau avec Microsoft Office et Microsoft Outlook Assistance aux utilisateurs Identification Pluggable: LDAP ou Active Directory Supporte différentes bases de données: MySQL, PostgreSQL, Oracle Livre Blanc des GED en Tunisie. Janvier 2012 version 1.0 37

Visualisation des documents en plein écran OCR intégré et reconnaissance par codes à barres Supporte les scans TWAIN integers LogicaDoc propose les fonctionnalités essentielles d un outil de GED. Mais l usage de la version open source est limité. Compatibilité et ouverture XML / RSS / RDF / LDAP Partenaires & contributeurs Des SSII & Intégrateurs indépendants Société commerciale LogicalDoc 4.5.3 Références ROBEL Bahnbaumaschinen GmbH OpenJaw Technologies Ltd Cygnacom Solutions, Inc. Pinnacle Documents, LLC General Teleinformatica Srl Leonardo Sistemi Integrati Srl Livre Blanc des GED en Tunisie. Janvier 2012 version 1.0 38

4.6 Maarch 4.6.1 Présentation Maarch (Maerys Archive) est une infrastructure d'archivage GED Open source complète pour la conservation de gros volumes de ressources numériques. Maarch offre les fonctions d'importation et de restitution de documents afin de permettre la conservation et l'exploitation des ressources numériques d'une organisation sur le long terme, en contribuant au respect des régulations françaises et internationales concernant l'archivage documentaire. Maarch existe aujourd'hui en français et en anglais. Le codage et les commentaires sont en anglais. Tous les messages utilisateurs se trouvant sur un fichier de ressource, il est très facile d'adapter l'interface à n'importe quel langage. Le framework Maarch offre plusieurs applications métiers basées dessus : Maarch Entreprise : Le Système d'archivage Electronique (SAE) de production Maarch LetterBox : La solution d'archivage légal open source dédiée à la gestion de courrier. Maarch Modules : Modules et outils complémentaires. Maarch Framework et ces applications métiers bâties dessus sont diffusés sous la licence Open Source GNU GPL. 4.6.2 Fiche signalétique Produit, version URL Architecture Typologie Licence Maarch Maarch Framework V3 http://www.maarch.com/ Linux Apache MySQL PHP (LAMP) Interface web : - PHP5 - Javascript - CSS Compatibilité SGBD - MySQL - PostgreSQL - SQL Server - Oracle Multiplateforme - Windows XP/Vista/Server2003 - Linux (toute distribution) - Mac Serveurs supportés - Apache - IIS Open Source GPL Date de démarrage projet Année 2004 Livre Blanc des GED en Tunisie. Janvier 2012 version 1.0 39

Origine du projet France Généralité et fonctions Gestion des archives électroniques et physiques Sécurisation des données archivées Recherche plein texte (avec OCR) Classement automatique des documents selon des critères prédéfinis Workflow et circulation documentaire Gestion de dossiers avec vérification de la complétude Alertes et notifications globales et personnalisées Pré-indexation et impression de séparateurs à codes-barres Sécurité et suivi : historisation de toutes les actions Multiple collections documentaires Gestion des droits efficace et souple Compatibilité et ouverture Partenaires & contributeurs Société commerciale XML / RSS / RDF / LDAP Bull, Aerow, etc. La société Maarch 4.6.3 Références AUTOFIRST (Gestion des dossiers clients) OWLIANCE (Vidéocodage offshore et conservation légale de documents) CREDIT SOCIAL DES FONCTIONNAIRES (Archivage des dossiers PP et PI Gestion des dossiers médicaux Instruction et archivage des dossiers délégation PP) ORANGE (Référentiel documentaire) Livre Blanc des GED en Tunisie. Janvier 2012 version 1.0 40

ECA ASSURANCES (Gestion des dossiers Assurance) NUMERICABLE (Archivage à valeur probante) Ministère de l intérieur et de l Aménagement du Territoire Villes & collectivités (Dématérialisation de l'activité courrier) 4.7 Nuxeo 4.7.1 Présentation Basée sur Java et dotée d'une architecture logicielle moderne, la plateforme Nuxeo est conçue pour être modulaire et extensible. Nuxeo DM est la solution de gestion de documents de Nuxeo, basée sur Nuxeo Enterprise Platform et qui bénéficie de sa robustesse et de sa flexibilité. En permettant de gérer et de suivre le flux des contenus tout au long de leur cycle de vie métier, Nuxeo DM apporte une solution aux problèmes de duplication de contenu, de manque de suivi des versions, de recherches inefficaces et d'accès et de sécurité sur les documents. Pourquoi? Simplement parce que la gestion de document ne consiste pas à stocker des documents sur un serveur de fichiers, mais à gérer l'interaction entre votre métier et vos contenus. 4.7.2 Fiche signalétique Produit, version Nuxeo DM 5.4.2 URL http://www.nuxeo.com/fr Architecture Architecture basées sur les technologies Java EE 5. Typologie Licence licence LGPL Date de démarrage projet Année 2000 Origine du projet Paris et Boston Généralité et fonctions o Gérer les contenus, pas les fichiers o Travail collaboratif et gestion de documents o Des performances prouvées et optimisées pour les Livre Blanc des GED en Tunisie. Janvier 2012 version 1.0 41