Appel d'offre en vue de l'attribution d'un mandat de structuration et de mise en ligne des données Date Nota bene : xx = maître d œuvre (éditeur ou autre) bb = bibliothèque Les notes en italique sont à remplacer ou à effacer
SOMMAIRE - 2 -
Objet du marché Structuration des données sur la collection du Titre Xx a procédé à la numérisation de la collection du «titre». La numérisation des volumes est terminée. Il faut à présent assurer le passage du mode image au mode texte afin de rendre accessible la collection et autoriser la recherche plein texte tout en maintenant l apparence originale des éditions. L objectif du mandat est de procéder à l analyse de la mise en page (layout), à la reconnaissance optique de caractères [si elle n est pas déjà faite], à l analyse structurelle, à la segmentation des pages, à l extraction des métadonnées et à la mise à disposition des données. Description du Titre La parution du «titre» a débuté le jj.mm.aaaa et le titre a cessé de paraître avec le numéro daté du jj.mm.aaaa. [variante : et paraît encore aujourd hui sous forme imprimée et en ligne] Livraison du matériel Nous sommes en mesure de fournir les données numérisées selon ces modalités : Format [PDF, autres] Définition 300 DPI sans interpolation; Pages traitées en 256 niveaux de gris (8 bits) ou en couleur, selon l original; Désignation de chaque page selon le schéma jj_année_mois_jour_page. Le volume des données numérisées représente environ x TB. Les données seront transmises sur des disques durs externes. Un échantillon de données sur plusieurs années est fourni avec l appel d offre afin de vous permettre de prendre connaissance du matériel qui vous sera remis. Finalités du projet Le but du projet est la mise en ligne de la collection. La navigation devra offrir la consultation des documents en mode image et permettre une recherche textuelle. Afin de faciliter la consultation, l application présentera les fonctionnalités suivantes : Recherche par date précise ou une période définie, Recherche plein texte Mise en évidence (Highlighting) du ou des mot(s) de recherche, Tri chronologique, Tri par pertinence L application web devra également proposer les fonctionnalités additionnelles suivantes : Impression et exportation, - 3 -
Paiement en ligne 1 Desk/kiosque (stockage des archives consultées); Aide utilisateurs. 1 optionnel, merci de préciser séparément les coûts associés - 4 -
Prestations demandées Le mandat à réaliser comprend les six prestations suivantes : 1) Reconnaissance optique de caractères [le cas échéant] Le degré de précision de la reconnaissance doit être suffisant pour les besoins de la recherche. Le soumissionnaire fera une proposition liée au taux d erreur qu il prévoit en précisant l impact financier. 2) Analyse de la structure et du layout Reconnaissance des éléments sur une ou plusieurs colonnes; Repérage de la pagination et lien sur les pages concernées; En option (à deviser séparément), reconnaissance des éléments structurels additionnels suivants : Séparation et marquage «tagging» des éléments de texte, annonces publicitaires, légendes, illustrations, etc. Reconnaissance d autres éléments structurels : titres, articles, articles sur plusieurs pages, «teaser» en Une renvoyant à l intérieur d une édition, etc 3) Création des métadonnées La description de chaque fascicule est précise. Tous les fichiers sont classés chronologiquement selon l'ordre de parution et se présentent sous la forme suivante : jj_année_mois_jour_page. Par exemple jj_1969_01_31_0016 Les métadonnées issues de l OCR seront exportées comme objets XML basés sur le schéma METS/ALTO ou dans un format qui permet de générer cette structure (but : échange des données). 4) Mise en place d'une application de consultation Les fonctionnalités requises de l application sont décrites dans le paragraphe «Finalités du projet». Le soumissionnaire présentera une estimation financière liée au coût d acquisition, d infrastructure (hardware et software) et de hosting de la solution tout comme les coûts liées à son exploitation (capacité du serveur, bande passante nécessaire, etc.). L architecture de l application sera évolutive afin de permettre un traitement parallèle sur différents serveurs (web farm). Les paramètres de sécurité (prévention des cas de «crawling», piratage, sécurisation des paiements via un prestataire externe, etc.) tout comme la procédure de back-up des données de l application (fichier utilisateurs par exemple) seront également précisés dans l offre. Le soumissionnaire présentera toutes les informations qu il jugera utile. 5) Contrôle qualité Le mandataire devra contrôler l'état, le contenu et l'intégralité de la collection indexée tout comme le fonctionnement de l application de consultation. Le mandant contrôlera de manière aléatoire le travail réalisé durant toute la phase d exécution et les anomalies constatées donneront lieu à la réfection du travail. Critères d'évaluation Les offres seront évaluées en tenant compte des critères suivants : Expérience et références dans un projet similaire; Qualité d exécution; Disponibilité et qualification du personnel et des équipements; - 5 -
Prix; Planification et respect des délais. Des tests seront demandés aux prestataires le cas échéant. - 6 -
Calendrier d'intervention Idéalement le processus de reconnaissance optique de caractères devrait débuter en [définir] La société retenue devra assurer son mandat dans un délai qui sera convenu contractuellement mais qui ne devra pas dépasser [définir] mois à partir de la date de remise des données numériques. Remise des offres Contenu L offre contiendra les éléments suivants : Une description de l approche générale (organisation, méthodologie, étapes, équipe ); Un budget détaillé; Une liste de références mentionnant les coordonnées des personnes pouvant être contactées; Une brève présentation de l entreprise; Toutes indications supplémentaires utiles. Estimation budgétaire L enveloppe budgétaire globale précisera le détail de chacune des prestations demandées. Documents requis Les attestations officielles mentionnées ci-dessous, ou leurs équivalents, accompagneront le document présentant l offre de chaque soumissionnaire: Attestation de l inscription au registre du commerce; Attestation de solvabilité; Attestation du paiement des charges sociales. Ne seront prise en considération que les soumissions accompagnées d attestations datant impérativement de moins de 60 jours. Langue de rédaction des offres Les offres peuvent être rédigées en français, en allemand ou en anglais. Monnaie Les éléments monétaires seront exprimés en CHF, TTC. Durée de validité 90 jours à partir de la date limite d'envoi des offres. Délai de clôture pour le dépôt des offres 30 jours dès réception du cahier des charges. Chaque soumissionnaire recevra une réponse écrite. Un contrat sera établi avec l entreprise retenue. Envoi et informations complémentaires Les offres sont à envoyer par courriel à l adresse suivante, au plus tard 30 jours à réception de ce cahier des charges: Adresse courriel Elles peuvent aussi être envoyées par courrier postal, en trois exemplaires si ce moyen est choisi, à Adresse postale Toutes précisions et/ou questions techniques peuvent être adressées à : - 7 -
Adresse courriel - 8 -