Le Groupe de la numérisation et des microformes Notre mandat Juin 2009 Numérisation et dissémination en ligne des documents officiels de l'organisation des Nations Unies publiés avant 1993 Préservation ciblée de certains documents officiels de l'onu sur microfiches 1
Le Groupe de la numérisation et des microformes A commencé la numérisation en 2005 Emploie six personnes à temps plein, dont un superviseur Entre 2005 et 2008, a numérisé: - 62 689 documents équivalant à 626 888 pages, - soit environ 15 700 documents par an équivalant à 156 500 pages Seule entité du système des Nations Unies à poursuivre la préservation de documents officiels de l ONU sur microfiches 2
Nos clients Financement par les Etats membres de l ONU à travers leurs contributions obligatoires Utilisateurs dans le monde entier: Membres des Missions permanentes et délégués auprès de l ONU et de ses agences spécialisées Fonctionnaires des organisations internationales Personnel de la Référence des Bibliothèques du système des Nations Unies Grand public utilisateur du Système de diffusion électronique des documents de l ONU (Sédoc) sur http://documents.un.org et des sites internet départementaux de l'onu 3
Nos collaborateurs Groupe de la numérisation de la Bibliothèque Dag Hammarskjöld au Siège de l'onu à New York 4
Nos objectifs "Bon document au bon endroit" Documents facilement et rapidement accessibles Documents lisibles et complets Bonne reconnaissance optique des caractères (ROC) Numérisation et chargement dans le Sédoc de la collection complète des documents du Conseil de sécurité publiés entre 1945 et 1993 en russe, chinois et arabe (documents généraux, ordre du jour et procès verbaux) avant fin décembre 2009 5
Documents numérisés De type parlementaire Publiés par les différents organes de l ONU (Conseil de sécurité, Assemblée générale, Conseil économique et social, Commission des droits de l homme, etc.) Presque uniquement du texte, des graphiques et tableaux, très peu de photos Dans les 6 langues officielles de l ONU: anglais, français, espagnol, russe, chinois, arabe 6
Scanners à disposition Scanner mixte avec lit de lecture à plat et chargeur automatique Scanner de livres Scanner de microfiches 7
Logiciels utilisés Logiciel de reconnaissance optique de caractères (ROC ou OCR) fonctionnant avec différentes langues (anglais, espagnol, français, russe, et depuis peu, chinois) Logiciel professionnel pour la lecture et le traitement des fichiers PDF 8
Nouveaux scanners et logiciels Acquisition d un nouveau scanner à chargeur automatique Échange du scanner de livres pour un modèle offrant une meilleure résolution optique (à 300 points par pouce) Acquisition d un logiciel de reconnaissance optique de caractères fonctionnant sur serveur en mode partagé Acquisition d un logiciel de traitement de l image 9
Numérisation Systématique ou sur demande En 300 points par pouce (ppp) À partir du papier: 1. feuillets mobiles avec le chargeur automatique du scanner 2. volumes reliés à plat avec le scanner mixte ou avec le scanneur de livres À partir de microfiches avec le scanner de microfiches 10
Reconnaissance optique des caractères (ROC) En anglais, français, espagnol, russe et, depuis juin 2009, en chinois, puis conversion des fichiers TIFF en format PDF texte Pas de reconnaissance en arabe, conversion des fichiers TIFF en format PDF image Obtention d un format unique: PDF 11
Chaîne de travail actuelle Chacun des cinq membres de l équipe traite un document ou une série documentaire de A à Z, c'est-à-dire: Recherche le document ou tous les documents de la série à traiter dans toutes les langues disponibles, de préférence en secondes copies sur papier Établit les listes des cotes de documents dans une base de données Prépare physiquement les documents Numérise tous les documents de la série Traite chaque document de la série séparément à l aide d un logiciel pour le nettoyage, la reconnaissance et la conversion en PDF Une fois la série entière traitée, charge tous les documents en ligne dans le Sédoc 12
Processus de numérisation à la Bibliothèque de l ONUG l : 4 phases Saisie des références r rences Mise à jour d d Préparation des documentaires dans la UNBIS documents base de données Collecte des documents 1. Phase de préparation paration 35% ou 1. Fichiers TIFF image 2. Fichiers PDF texte avec Scanner de papier ROC ou fichiers PDF Scanner de microfiche image 2. Phase de numérisation 25% Connexion à ODS Mother Fichiers électroniques attachés Fichiers chargés sur aux métadonn tadonnées d UNBIS d le site du Sédoc 3. Phase de chargement 25% Efficacité du chargement Contrôle de la ROC Ajout à la collection Qualité de Statistiques l image 4. Phase de contrôle 15% 13
Nouvelle chaîne de travail Intégration progressive des nouveaux scanners et logiciels Début janvier 2010, mise en place d une chaîne de travail matricielle dans laquelle chaque membre du Groupe sera expert dans l une des étapes de la numérisation, tout en gardant une variété de tâches Le contrôle de qualité se fera alors à chaque étape de la chaîne de travail Le nombre et l importance des erreurs devrait diminuer et la productivité augmenter 14