XML pour la mise en valeur des informations Exploitez l'intelligence des documents! DIRO - Cours IFT3225 Une présentation d Irosoft Inc. Alain Lavoie Septembre 2011
Qui suis-je? Alain Lavoie B.Sc. Mathématique-Informatique (1987) Maîtrise Informatique (1989) Co-fondateur d Irosoft (1995) Impliqué dans des organisations en TIC TechnoMontréal (VP-PME), CRIM (VP), CRTL (VP), AAPI (l association sur l accès et la protection de l information), AQT (comités), MDEIE (comité), Conseil du Trésor (comité). Travaillé au DIRO de 1988 à 1995.
Qui sommes-nous? Notre mission Mettre en valeur et exploiter au mieux la richesse et l'intelligence contenues dans la complexité des informations électroniques de nos clients.
LIMS Docuthèque Qui sommes-nous? Fondé en 1995, Irosoft Inc. est une société québécoise basée à Montréal qui commercialise principalement : une suite logicielle en gestion électronique de documents (GED Docuthèque) une suite logicielle de gestion de l information législative (LIMS)
Notre équipe Une trentaine d employés Informatique, gestion documentaire, science juridique, linguistique computationnelle, bibliothéconomie et archivistique Modélisation/normalisation/gouvernance de contenu/métadonnées, recherche et navigation sémantique, fédération d information, modélisation XML, extraction automatique de métadonnées, publication Web, syndication de contenu, etc.
Secteurs d activités Secteurs d activités Produits Juridique Développements sur mesure Services spécialisés GED Produits Services spécialisés
Secteurs d activités Les marchés Juridique GED
Consultez notre site Web : http://www.irosoft.com Alain Lavoie, président Courriel : lavoie@irosoft.com 3100, Côte-Vertu, suite 510 Ville Saint-Laurent, Québec, Canada, H4R 2J8
XML pour la mise en valeur des informations Exploitez l'intelligence des documents! Les métadonnées Une présentation d Irosoft Inc. Alain Lavoie Septembre 2011
Qu est-ce que les métadonnées? Une image vaut mille mots Source: Metadata : "data about data" (http://www.uth.tmc.edu/search/metadata.htm) Les métadonnées sont à la base des techniques du Web sémantique
Qu est-ce que les métadonnées? Les métadonnées décrivent des ressources Ces ressources peuvent être de différents types: Texte Image Son Collection Dossier Métadonnée Fichier Logiciel Objet matériel Service Personne
Qu est-ce que les métadonnées? Manuel Saisies ou identifiées par l'humain. Automatique Générées automatiquement par la machine Extraite dans le cadre d une activité (métadonnées systèmes, modèles de documents, etc.) Extraite à partir du contenu (analyse de texte par ordinateur)
Qu est-ce que les métadonnées? Avantages des métadonnées Faciliter l'organisation et le repérage des documents. Permettre une évaluation rapide de la pertinence du contenu d un document. Faciliter la gestion des droits d accès, d utilisation, de copie. Certifier l autorité intellectuelle du contenu (auteur, date de création, organisme responsable, date de mise à jour). Conserver le contexte de création de la ressource (provenance, activité ayant générée la ressource). Permettre la gestion du cycle de vie de la ressource (application des règles de conservation) Donner des informations essentielles à la préservation (format, support, logiciel nécessaire). Déclencher des processus automatisés
Qu est-ce que les métadonnées? Difficultés rattachées à la création de métadonnées Il est difficile d assurer la cohérence et l uniformité des descriptions Il n existe pas d interface conviviale de saisie de métadonnées dans les outils bureautiques. Donc, il est difficile d agir en amont L utilisation de métadonnées n est pas ou peu intégrée aux applications informatiques de l organisation Il y a des risques d erreurs lors de la saisie de métadonnées L utilisation de métadonnées entraîne la double saisie d information Coûts de la saisie manuelle des métadonnées? Qualité des métadonnées extraites automatiquement?
Qu est-ce que les métadonnées? L utilisation de métadonnées peut paraître complexe coûteux difficile à implanter en amont Est-ce sans espoir? Non, il y a des solutions L utilisation d un registre de métadonnées fait partie des solutions
Qu est-ce qu un registre de métadonnées? «Un registre de métadonnées est, selon la définition qu'en donne le Dublin Core [ ], un «Système de gestion des métadonnées, c'est-à-dire un système formel qui fournit l'information d'autorité sur la sémantique et la structure de chaque élément.» Wikipédia citant le DCMI (http://fr.wikipedia.org/wiki/registre_de_m%c3%a9tadonn%c3%a9es) Système formel : écrit dans un langage formel, pas de place à l ambiguïté Information d autorité : référence, «règles» Sémantique : réfère au sens, à la signification Structure : réfère à la syntaxe, à l organisation
La notion d écosystème informationnel interroge
Qu est-ce qu un registre de métadonnées? Défini en fonction des besoins de l organisation Crée un document Interroge Indépendant des applications informatiques Créateur de documents Interface réactive en fonction des profils de métadonnées Suite bureautique Dépose un document Registre de métadonnées de l organisation Interroge Définit et met à jour les profils Basé sur des normes ouvertes (XML/RDF/SKOS) Utilise un document Gère l entrepôt Utilisateur de documents Entrepôt de documents Gestionnaire de documents
Qu est-ce qu un registre de métadonnées? Un registre de métadonnées est utilisé par les utilisateurs d applications informatiques les applications informatiques Se présente sous deux formes Forme lisible par un être humain Forme lisible par la machine
Qu est-ce qu un registre de métadonnées? Dans quel contexte devons nous utiliser un registre de métadonnées? Lorsque des métadonnées doivent être utilisées de façon cohérente dans une organisation ou un groupe d'organisations (interopérabilité à court terme). Lorsqu il est nécessaire de garantir la protection du patrimoine informationnel d une organisation (interopérabilité à long terme, préservation)
Le registre de métadonnées en pleine action Problème Il est difficile d assurer la cohérence et l uniformité des descriptions Solution Utiliser un registre de métadonnées Utiliser des profils de métadonnées Démonstration Fenêtre de saisie des propriétés avec choix d un profil de métadonnées
Le registre de métadonnées en pleine action Problème Il n existe pas d interface conviviale de saisie de métadonnées dans les outils bureautiques. Donc, il est difficile d agir en amont Solution Adapter les outils bureautiques aux besoins de la GID Démonstration Fenêtre de saisie des propriétés avec choix d un profil de métadonnées dans les applications MS Office
Le registre de métadonnées en pleine action Problème Il a des risques d erreurs lors de la saisie de métadonnées Solution Utiliser des mécanismes de validation et de contrôle Intégrer la documentation des métadonnées à même l application informatique Démonstration Contrôles de saisie, validation et documentation intégrée.
Le registre de métadonnées en pleine action Problème L utilisation de métadonnées entraine la double saisie d information Solution Création automatique de métadonnées à partir du contenu des documents (utilisation de modèles de document) Extraction automatique des métadonnées des document et puis stockage des métadonnées dans le système de GID Démonstration Utilisation de modèles intelligents (Word)
Le registre de métadonnées en pleine action Problème L utilisation de métadonnées n est pas ou peu intégrée aux applications informatiques de l organisation Solution Utiliser des normes ouvertes afin de favoriser l interopérabilité Permettre aux applications informatiques de «lire» le registre de métadonnées (API) Démonstration Utilisation conjointe du registre par l entrepôt Docuthèque, Microsoft Office, Adobe Acrobat et Microsoft SharePoint.
Et puis après...
Voici ce que nous croyons qui sera le futur Les métadonnées Le XML Le Web sémantique Le BI non structuré Les standards
Consultez notre site Web : http://www.irosoft.com Alain Lavoie, président Courriel : lavoie@irosoft.com 3100, Côte-Vertu, suite 510 Ville Saint-Laurent, Québec, Canada, H4R 2J8
Alain Lavoie, président Téléphone : (+1) (514) 920-0020 #228 Télécopieur : (+1) (514) 920-0028 Courriel : lavoie@irosoft.com 3100, Côte-Vertu, suite 510 Ville Saint-Laurent, Québec, Canada, H4R 2J8