Archivage des dossiers Par : BERTIL CHAPUIS, SYLVAIN NEYROUD DAMIEN SNOECK, SIMÉON RÜFENACHT Classe 32 M Date 23/02/06
Définition du projet...3 But principal...3 Etat initial...3 Liste des Besoins...3 Taxonomie des dossiers...3 Sémantique des documents...3 Gestion des droits...3 Sécurité...3 Numérisation des archives existantes...4 Recherche de dossier et de documents...4 Mise en archive automatique...4 Centraliser...4 Sauvegarde...4 Solution perpétuelle...4 Gestion du projet...5 Déroulement du projet...5 Durée...6 Ressources...7 Tâches...7 Architecture du système d archive...8 Processus de mise en archive...9 Le format d'archivage...9 Le format d'archivage...10 Modèle de données de l archive...11 Processus de demande de consultation...12 Logiciels...13 Hardware...14 Numérisation...15 Budget...16 Heig-vd SRT, DSK, SND, BCS 2
Définition du projet But principal Un cabinet d avocat souhaite archiver les documents antérieurs et futurs. Il souhaite également faciliter la recherche de ces documents. Etat initial Les archives sont stockées entièrement sous forme papier. Environ 350'000 documents de 100 à 500 pages ont été réunis depuis la création du cabinet. Un simple calcul nous démontre l ampleur de la masse documentaire qui s élève à plus de 100'000'000 de pages. Liste des Besoins Taxonomie des dossiers Le système doit permettre d organiser les dossiers pour améliorer le stockage de ceux-ci. Dans ce cadre on peut prendre en compte des notions telles que le client concerné, la période où a été rédigé le dossier, le domaine de droit concerné par le dossier, les articles de droit auxquelles le dossier fait référence, etc. Sémantique des documents La sémantique des documents doit, pour des questions de stockage, pouvoir être analysée et au maximum standardisée. Gestion des droits Sécurité Pour des questions de sécurité, tous les utilisateurs ne doivent pas avoir les mêmes privilèges d accès sur les dossiers. La gestion des droits devra être inclue dans le système et une politique de gestion devra être élaborée, notamment en raison du grand nombre d archives qui seront implémentées directement dans le système Les archives nécessitent un haut niveau de sécurité tant au niveau hardware que software. La protection contre les déprédations naturelles devra également être Heig-vd SRT, DSK, SND, BCS 3
prise en compte dans le système. La finalité de la question est de garantir l intégrité et le stockage des données quelques soient les déprédations possibles. Numérisation des archives existantes Le cabinet d avocat stocke dans ses archives plus de 350'000 dossiers de 100 à 500 pages. On peut estimer l ensemble des documents d archive à environ 2'500'000 unités. Se besoin devra être évalué pour déterminer dans quelle mesure toutes les archives devront être numérisées. Recherche de dossier et de documents Le cabinet doit disposer d un outil efficace pour la recherche des dossiers. Cet outil doit inclure des critères taxonomiques et permettre différents styles de recherches. Mise en archive automatique Lorsque un document est terminé, il est prêt pour être mis en archive. Cette fonction pourra être générée automatiquement et devra être comprise dans le processus de gestion des documents. Centraliser Centralisé au niveau de l architecture informatique de l archive du cabinet. L archive sera séparé par domaine qui correspondra à la filiale en question. Chaque filiale mettra son contenu à archiver dans l emplacement physique qui lui sera réservé. Ceci pour délimiter logiquement les données. Sauvegarde Mise en place d une sauvegarde périodique de la totalité de l archive. Pour assurer la restauration de l archive en cas de problème technique. Solution perpétuelle Etablir une solution d archivage qui pourra être utilisée à long terme, ainsi que le format de stockage des données. Il faudra garantir la compatibilité des données sur un futur système. Heig-vd SRT, DSK, SND, BCS 4
Gestion du projet Déroulement du projet ANALYSE DES BESOINS DOCUMENTAIRES DU CABINET Le cabinet dispose d une masse impressionnante de données pour l archivage. On peut estimer la masse de papier à plus de 100'000'000 pages à numériser. Dans ce cadre, il est important de se poser des questions relatives aux besoins du cabinet en terme d archive. Par exemple : Les archives sont-elles nécessaires pour des questions juridiques? Quels dossiers numériser pour faciliter le travail du cabinet? Toutes les archives doivent-elles nécessairement être numérisées? Etc. ANALYSE DE LA MASSE DOCUMENTAIRE Cette tâche consistera à analyser la manière dont les dossiers ont été réalisés. On se demandera par exemple quelle structure générale il est possible de dégager dans l organisation des dossiers. En bref, il s agit de définir la taxonomie générale de la masse documentaire. ANALYSE SEMANTIQUE DES DOSSIERS Cette tâche consistera analyser la structure interne des dossiers. Il s agira d élaborer un modèle sémantique des dossiers. ELABORER UNE SOLUTION FONCTIONNELLE Cette étape consiste à la conception d une solution logicielle (SGBS, OS, etc.) qui prenne en compte les critères définis dans la phase d analyse. ELABORER UNE SOLUTION MATERIELLE La solution matérielle sera conçue en fonction des contraintes logicielles et des contraintes définies lors de l analyse. ELABORER UN PLAN DE NUMERISATION Nous élaboreront un plan de numérisation qui prendra en compte l analyse des besoins documentaires du cabinet. Le nombre de document à numériser étant ce Heig-vd SRT, DSK, SND, BCS 5
qu il est, il est indispensable de définir des priorités et de planifier la numérisation des documents. PRESENTATION DE LA SOLUTION Une fois les étapes précédentes effectuée, une présentation générale de la solution sera effectuée auprès du client. ACCEPTATION DU CLIENT Phase déterminant le «go-no go» pour la réalisation du projet. NUMERISATION DES DOSSIERS La numérisation des dossiers commencera immédiatement après l acceptation finale du projet par le client. Cela est nécessaire en raison de la masse documentaire. Cependant la durée de la tâche n est pas encore exactement fixée. Elle sera établie avec la société qui s occupera de la numérisation des dossiers et dépendra de nos choix découlant de l analyse. MISE EN ŒUVRE DU SERVEUR DE FICHIER En parallèle à la phase précédente, les serveurs de fichier et de base de données pour l archivage seront mis en œuvre par l équipe de réalisation. INTERFAÇAGE DU SYSTEME Notre équipe s occupera d effectuer des modifications sur l ERP pour rendre le système de fichier et le système d archivage compatible. TESTS Des tests préliminaires seront effectués à l aide d un échantillon des données déjà numérisé. Ces tests seront enrichis et dureront au maximum jusqu à la fin de la phase de numérisation des archives. IMPLEMENTATION ET INDEXATION DU CONTENU Durée En dernier lieu, l ensemble des données numérisées seront implémentées et indexées dans la base de données. Durée du projet : 68 jours Durée de l analyse et de l élaboration de la solution : 28 jours Durée mise en œuvre : 40 jours Heig-vd SRT, DSK, SND, BCS 6
Ressources Tâches 2 personnes à 1000CHF/jour. Heig-vd SRT, DSK, SND, BCS 7
Architecture du système d archive Le serveur GED (Gestion électronique des documents) effectue une indexation automatique des documents présents dans le serveur Archive. Une indexation par auteur, date, catégorie, filiale, etc sera possible. Le serveur Archive contiendra seulement les fichiers PDF archivé ainsi que leurs métadonnées correspondantes. Ce serveur devra fournir une grand espace de stockage et être sauvegardé périodiquement. Heig-vd SRT, DSK, SND, BCS 8
Processus de mise en archive Lorsqu'un dossier est à l'état "Affaire classée" il doit rentrer dans le processus de mise en archive. Ce processus est géré automatiquement par la maison mère. Le dossier d'origine sera convertit dans le format PDF. Suite à cette conversion le fichier est déplacé sur le serveur d'archivage où un contrôle est effectué pour garantir une reproduction conforme de l'original. Seul après ce contrôle le dossier pourra être mis à l'état "En archive" et n'aura plus les caractéristiques de modifications. L'utilisateur aura une interface graphique pour insérer sa requête. Heig-vd SRT, DSK, SND, BCS 9
Le format d'archivage Adobe a sorti en 2005 le format "PDF/A" qui est spécialisé pour la mise en archive de document sous forme électronique. Le document à archiver est convertit dans le format PDF. Un processus parallèle à cette conversion est la création de donnée XML qui serviront à décrire le PDF. Ce dernier est par la suite stocké sur un serveur de fichier et le fichier XML sur un autre serveur. http://www.adobe.fr/products/acrobat/pdfs/pdfarchiving.pdf Heig-vd SRT, DSK, SND, BCS 10
Modèle de données de l archive A partir de l'archivage, les données ne subissent plus de changement. Une congrégation pour simplifier la base de données de sauvegarde est alors effectuée. Les modifications par rapport au modèle de donnée exploité sont les suivantes : AUTEUR Contient la liste des auteurs du dossier et des documents qui le compose, ainsi que leur fonction dans l'entreprise au moment de la clôture du dossier. REFERENCES JURIDIQUES Une copie complète des articles de loi touchés par le dossier est effectuée. Heig-vd SRT, DSK, SND, BCS 11
Processus de demande de consultation Ce processus survient si un utilisateur souhaite consulter un document archivé dont il n'a pas le droit de consultation. L'utilisateur sera invité à faire une demande de consultation auprès du donneur de droit sur le dossier en question. Ce processus permet de sécuriser l'accès aux documents tout en permettant de rechercher de dossiers, utile par exemple pour se documenter sur des cas similaires. Heig-vd SRT, DSK, SND, BCS 12
Logiciels Adobe fournit des solutions d archivage en partenariat avec IBM. Nous nous sommes basés sur leur recommandation pour établir cette offre logicielle. Malheureusement tous les prix ne sont pas disponibles sur site. (CHF 3 900.00) Logiciel IBM DB2 Content Manager Enterprise Edition Nb licences Prix Totaux 1 CHF 22 800.00 CHF 22 800.00 IBM TotalStorage Flashcopy for DS300 & DS400 1 CHF 3 900.00 CHF 3 900.00 Adobe Form Server for IBM 1 CHF? CHF? Estimation du Total CHF 40 000.00 Heig-vd SRT, DSK, SND, BCS 13
Hardware Serveur d archivage Backup IBM TotalStorage DS300 Disk Drive Modules (Express) 73GB 10K RPM Hot-SwapUltra320 SCSI HDD 3 Pack (CHF 1 170.-) Disk Drive Modules 2X 300GB Hot-Swap 3.5" 10K RPM Ultra320 SCSI HDD (CHF 2 600.-) Uninterruptible Power Supply APC 2U Smart-UPS 1400 RMB Uninterruptible Power Supplies (CHF 830.-) Hardware Support Services Warranty Service Upgrade - 3 YR onsite repair 9x5x4 hrs (CHF 3 380.-) 3953 Tape System Ce système permet le stockage sur bandes magnétiques, contient jusqu à 3584 cassettes (Prix non-disponible). Budget hardware Tous les prix n étant pas disponibles nous estimons un prix total pour l ensemble du matériel de CHF 60 000.-. Heig-vd SRT, DSK, SND, BCS 14
Numérisation Dossier 082106_2b Monsieur Chapuis, La tâche est réaliste, le choix d un format PDF tout aussi! L estimation temps nécessite des informations complémentaires telles que disponibilité des documents en plusieurs lots voir en un seul lot de 2 5 Mo documents Ce qui risque d immobiliser l Etude à la consultation pendant le temps du traitement de masse des Archives papier. L estimation globale tant au niveau coût de production que temps de préparation nécessite un regard partiel sur le contenu physique. Estimation portant sur la structure des dossiers de leurs conditionnement ainsi que d autres paramètres tels que qualité des originaux, formats, grammage etc. En règle générale, la reprise de document se divise en une part préparation du physique et une part traitement numérique/indexation. Objectivement nous pouvons estimer un volume disque à la hauteur de 160 Gb. ; Images PDF + txt, 1bit, 300dpi, DIN A4 Si vous avez plus de détails à nous soumettre voir un échantillon de dossiers à nous confier, c est très volontiers que nous pourrons vous soumettre notre meilleure offre en toute objectivité, notre discrétion est votre sécurité. Pour vous guider dans votre étude, dès le 27 février prochain, vous pouvez contacter Charly Stettler au 079 4011135. En vous remercient par avance pour l intérêt que vous portez à notre activité professionnelle, nous vous présentons, Monsieur Chapuis, nos salutations respectueuses. ISR NUMERISATION Administration LP-RG Le nombre des dossiers étant particulièrement élevé, nous nous sommes basés sur un nombre de 2 5Mo documents pour demander une offre. Nous constatons que les éléments déterminants pour établir un devis sont le conditionnement des dossiers, leur disponibilité, ainsi que des questions comme le genre de papier utilisés. Ces questions devront être déterminées avec le cabinet et nous demanderons à cette société d établir un devis approfondis en fonction de l analyse effectuée. Heig-vd SRT, DSK, SND, BCS 15
Budget Objet Jours Prix Totaux Personnel interne 68 CHF 6 000 CHF 136 000 Matériel technique CHF 60 000 Logiciels CHF 40 000 Numérisation CHF? Sous total CHF 230 000 Réserve (10% du sous total) CHF 23 000 Total HT > CHF 253 000 Heig-vd SRT, DSK, SND, BCS 16