La gestion électronique de documents La GED (Gestion Électronique de Documents) ou GEIDE (Gestion Électronique de d'informations et de Documents pour l'entreprise) a pour fonction d'organiser et de gérer des informations et des documents électroniques au sein d'une organisation. À travers un ensemble d'outils et de techniques, elle permet de dématérialiser, classer, gérer et stocker des documents à partir d'applications informatiques dans le cadre normal des activités de l'organisation. Elle est un élément important pour le développement d'une culture apprenante dans les organisations car elle participe aux processus de travail collaboratif, de capitalisation et d'échanges informationnels. Un document a trois caractéristiques : sa présentation, sa structure et son contenu. Selon l'aproged (Association des professionnels de la GED : http://www.aproged.org/ ), on peut distinguer la GEIDE administrative (classement de documents électroniques), la GEIDE bureautique (production et partage de documents dans un groupe de travail), l'archivage numérique, la GEIDE documentaire (indexation de ressources documentaires) et la GEIDE technique (gestion de documents techniques au format propre à un métier). Mais ce sont les applications de type classement administratif ou archivage électronique qui, grâce à la GEIDE, connaissent les gains de productivité les plus importants et dégagent le meilleur retour sur investissement. Une définition qui a évolué Historiquement la GED concernait le stockage électronique de documents papier. Cette approche, accompagnée par une législation ad hoc en matière de conservation des originaux, visait la dématérialisation des documents papier. On pouvait considérer alors la GEIDE comme un dispositif de Gestion Électronique d'informations et de Documents Existants. Cette dématérialisation a permis notamment d'éloigner les lieux de stockage des documents papier des sièges sociaux des organisations (là où le mètre carré est très coûteux!). Les opérations de la GEIDE L'acquisition des documents La technique d'acquisition dépend du format du document à acquérir : document papier, fax ou document numérique. L'acquisition peut comporter plusieurs étapes, par exemple l'interprétation ou la conversion de format du document, l'adaptation de sa structure et de sa composition, sa récupération par un dispositif de stockage ou de traitement voire sa compression. Acquisition des documents papier L'acquisition des documents papier s'effectue par numérisation à l'aide d'un scanneur. Les principales caractéristiques d'un scanneur sont sa résolution (mesurée en dpi, dots per inch soit points par pouce), sa vitesse (pages par minute), son type d'acquisition (noir et blanc, niveaux de gris, couleur) et le format des documents. Lorsqu'il s'agit de fichiers graphiques principalement, une opération de compression permet de réduire la taille du document, et ainsi d'en faciliter son stockage et sa transmission. L'opération de compression se base sur un algorithme. On considère deux familles d'algorithmes : avec perte de données ou sans perte de données. Les algorithmes réversibles, sans perte de données, encodent les données pour diminuer le stockage ; l'opération inverse au moment de la consultation du fichier permet d'obtenir le contenu original. Les algorithmes irréversibles, avec perte de données, éliminent les redondances dans les images, redondance que l'œil ne perçoit pas. L'image est donc dégradée mais ce type de procédé est tout-à-fait satisfaisant pour une consultation d'image. C'est le cas de la compression JPEG (Joint Photographic Expert Group) utilisée pour les publications de photographies sur Internet ou MPEG (Moving Picture Expert Group) pour la vidéo. Afin que le contenu des documents numérisés puisse être exploité, il est nécessaire d'effectuer une reconnaissance des caractères par un logiciel d' OCR (Optical Character Recognition, logiciel qui traduit des groupes de points d'une image numérisée en caractères - avec l'enrichissement typographique associé - exploitables par des programmes informatiques). Les applications de LAD (Lecture Automatique de Documents) exploitent cette technologie ou la reconnaissance de marques (case, croix, code barre, etc.).
Échange de documents électroniques Lorsque deux organisations partenaires disposent de documents électroniques qu'elles souhaitent échanger, elles peuvent interconnecter leur système d'information par un dispositif EDI ( Échange de Données Informatisé) en s'accordant sur un format de données normalisé (EDIFAC pour l'europe, ANSI X.12 pour les USA). Production de documents électroniques Si la GED s'intéresse principalement à la gestion des documents existants, les opérations de production de documents peuvent être considérées comme faisant partie de la GED. Lorsque plusieurs agents travaillent sur des procédures administratives traitant des documents, les outils de workflow permettent l'ordonnancement, le routage et le suivi de travaux au sein d'unités de travail. Les logiciels d'informatique de groupe (ou outils de groupware, ou encore collecticiels) offrent des fonctionnalités de communication, coopération et coordination et par là-même permettent de mutualiser des documents, voire de normaliser leur structure et leur présentation à travers les modèles de documents disponibles via l'outil. Enfin les applications de production et d'aide à la décision produisent des documents qui peuvent être intégrés dans un système GED. Aujourd'hui les préoccupations de normalisation de la structure documentaire poussent les organisations à produire des documents au format XML (Extensible Markup Language). Il s'agit d'un langage qui permet la publication et l'échange de données car il permet de séparer radicalement la description de la structure du document (métadonnées décrites sous forme d'un arbre) de son contenu. Héritier de SGML (norme ISO), le point fort du format XML est la structuration qui offre de nombreux avantages : possibilité d'automatiser certaines tâches (comme la création de sommaires) ; navigation et recherche facilitées ; présentation du document indépendante du contenu (la publication du document peut être multiple à partir du même contenu : PDF, page HTML, ). L'indexation des documents L'indexation est l'opération qui permet de décrire le document en vue de son exploitation ultérieure. Il faut distinguer la description formelle du document (type, auteur, date, etc.) de la description de son contenu. La description s'effectue grâce à un descripteur qui sera associé au document au moment de son stockage. On distingue deux types d'indexation : l'indexation classificatoire qui correspond à une préoccupation de rangement du document ; l'indexation par concepts qui vise à décrire le contenu du document. Indexation classificatoire C'est l'américain Dewey qui, au siècle dernier, a proposé la Classification Décimale Universelle (voir http://www.udcc.org/cdu.htm), largement utilisée par les bibliothèques. Indexation par concepts La description du contenu peut être effectuée de plusieurs façons, plus ou moins automatisées. On distingue : la définition de mots-clefs ; les descripteurs libres (titre, résumé ou texte).
L'indexation peut se faire a priori : des mots-clefs sont associés au document. Ceux-ci peuvent être librement choisis par l'auteur ou la personne chargée de l'indexation, ou sélectionnés dans un dictionnaire ou un thésaurus (liste de mots liés par des relations de hiérarchie ou d'équivalence). Si on prend le cas des documents HTML, il existe dans ce langage de présentation de pages des balises particulières (les balises META) qui permettent au concepteur du document de définir les mots-clefs qui lui semblent pertinents. L'indexation peut être réalisée de manière automatique. On distingue : l'indexation statistique qui consiste en une simplification du texte (enlever les mots fréquents) suivie d'un choix de mots-clefs, comme étant ceux qui apparaissent le plus fréquemment dans le texte. l'indexation «full text» qui consiste en une simplification du texte (enlever les mots fréquents) puis une indexation en utilisant un dictionnaire ou un thésaurus. Au delà de la définition de mots-clefs, un document peut être décrit par un ensemble structuré d'informations ou métadonnées (éléments descriptifs d'un document ne faisant pas partie de son contenu). Il existe une standardisation du vocabulaire des métadonnées, le Dublin Core ( http://www.dublincore.org ). L'intérêt d'une standardisation est de rendre ces métadonnées utilisables par le plus grand nombre d'outils de recherche. Lors de l'indexation, il est possible d'établir un résumé du document qui peut être généré automatiquement à partir d'une analyse sémantique. Le stockage des documents Le stockage des documents répond à plusieurs problématiques : le support de stockage doit être adapté au volume des documents, au temps d'accès (fonction de leur fréquence de consultation, de l'importance de l'information, de l'intérêt d'en disposer en ligne ou non) ; l'organisation du stockage doit être hiérarchisée en fonction des types de documents ; la durée de conservation (légale notamment) des documents doit être considérée pour l'épuration du système de stockage. La recherche des documents La recherche s'effectue en utilisant un langage de requêtes qui peut être très simple (utiliser une combinaison de mots-clefs) ou faire référence à des techniques d'interrogation en langage naturel. La restitution des documents Les documents peuvent être restitués à l'écran, imprimés, transmis par messagerie électronique, ou enfin intégrés dans un dispositif de workflow. Le document peut aussi être enrichi en vue d'une publication, par exemple sur un site web, ou faire l'objet d'un traitement informatique. L'évolution de la GED vers la gestion de contenu La gestion documentaire est donc à la fois au service de la communication interne et de la communication externe, notamment avec l'avènement des technologies liées à l'internet permettant la mise en place de sites web et d'intranets (avec la notion de portail d'entreprise, le site web devient le point d'entrée sur l'ensemble des applications et des sources documentaires de l'organisation). Il est nécessaire aujourd'hui de disposer de solutions permettant une gestion consolidée de tous les fichiers d'informations de l'entreprise, si possible dans un référentiel unique et centralisé. Aujourd'hui la gestion documentaire contribue à la mise en oeuvre de gestion de contenu d'entreprise (Enterprise Content Management, ECM) qui désigne les technologies destinées à acquérir, gérer et diffuser tout contenu numérique d'entreprise, qu'il s'agisse de documents structurés (notamment les résultats de traitements informatiques) ou semi structurés (pages HTML, fichiers bureautiques, documents de partenaires... voire documents multimédia).
L'infrastructure d'un système de GEIDE L'infrastructure d'un système de GEIDE s'appuie sur le système informatique de l'organisation, à savoir : le réseau local et distant de l'organisation (ouvert sur l'internet et ses partenaires - cas d'un EDI spécifique ou d'un extranet -) ; les serveurs permettant de mettre à disposition des utilisateurs des ressources partagées (application, base de données, imprimante, serveur web, serveur de télécopie, serveur de messagerie ) ; des postes de travail. Autrefois les postes de travail étaient spécialisés, aujourd'hui il s'agit de postes banalisés. De plus en plus les nouvelles applications sont développées pour être accessibles par un navigateur tels Internet Explorer ou Mozilla. Le poste de travail est alors qualifié de «client léger» parce que seul le navigateur devient nécessaire pour accéder à toute application. Le projet GEIDE dans l'organisation La réalisation d'un projet de GED se fait par étapes où l'utilisateur est toujours associé : identification des acteurs du projet (décideurs, responsables, utilisateurs ) ; définition de l'information qui doit alimenter le système de GED, inventaire des documents existants ; établissement d'un scénario de cycle de vie pour chaque type de document ; mise en place progressive du nouveau système et validation (cohabitation avec l'ancien système) ; formation des utilisateurs ; exploitation et maintenance. Le choix d'un projet pilote permet de se lancer sur ces technologies de façon mesurée et de permettre une évaluation de la faisabilité. En guise de conclusion La GEIDE converge, avec d'autres technologies comme par exemple les entrepôts de données (datawarehouses) vers ce qu'il est convenu d'appeler la «Business Intelligence» («intelligence d'affaires»), dont le but ultime est de fournir aux décideurs les informations dont ils ont besoin. Ces éléments, générés par des briques «décisionnelles» (moteurs OLAP par exemple) ne peuvent provenir que du système d'information de l'entreprise, à condition que l'extrême diversité des données qui y sont stockées aient été correctement collectées, agrégées et analysées. La maîtrise et la gestion des contenus d'entreprise apparaissent, dans cette optique, comme un élément incontournable. Les systèmes de GED font aussi partie des dispositifs d'accompagnement du changement vers l'organisation apprenante fondée sur le principe de l'apprentissage continu, individuel et collectif, des salariés. Mais ils s'accompagnent souvent d'un bouleversement de l'organisation des données et des procédures de traitement qui peut faire baisser, dans un premier temps, la productivité des utilisateurs. C'est une résistance au changement plutôt courante lors de l'introduction des TIC. -- Cet article a été rédigé par Christine Gaubert-Macon, professeur d'économie-gestion au lycée René Descartes - Académie de Créteil et Alain Nossereau, formateur en communication et gestion de l'information - Académie de Nice. Mots clés : document, gestion documentaire, gestion électronique de documents, GED, GEIDE Pour en savoir plus APROGED : http://www.aproged.org/ (site consulté le 10 février 2004, notamment le glossaire http://www.aproged.org/glossaire/index.htm ) Claveau, V. (2001), L'indexation de documents textuels http://tim.irisa.fr/tim-adherents/11-05-2001/cnrt_claveau.pdf (page consultée le 25 avril 2003, contribution présentée à la journée «indexation multimédia» http://tim.irisa.fr/veille/indexation/index.shtml) De Montaigne. J. (2002), Le document est mort, vive le contenu http://www.weblmi.com/articles_store/962_21/article_view (page consultée le 25 avril 2003)
Direction de la Technologie Ministère de l' Éducation Nationale (2002), Rechercher sur Internet : le guide http://www.educnet.education.fr/dossier/rechercher/rechercher.pdf (page consultée le 10 février 2004) Direction de la Technologie Ministère de l' Éducation Nationale (2003), Métadonnées, normes et standards http://www.educnet.education.fr/dossier/metadata/metadata.pdf (page consultée le 10 février 2004) Fournier-Morel. F. (2003), Comprendre les solutions de gestion de contenus en entreprise http://news.zdnet.fr/cgi-bin/fr/printer_friendly.cgi?id=2128699 (page consultée le 25 avril 2003) Lazuly, P. (2003), Le monde selon Google. Le Monde Diplomatique, octobre 2003 [pages 28 et 29] http://www.monde-diplomatique.fr/2003/10/lazuly/10471 (page consultée le 10 février 2004) Prax, Y. (2001), La gestion électronique documentaire, Paris, Dunod XML, catalyseur de succès pour la GED, Le Monde Informatique, 14 mars 2003, p.19 à 28