Cyberthèses : une solution à la visibilité de la science africaine? Abdrahamane Anne Introduction L'enseignement et la recherche scientifique ne peuvent se passer d'une documentation de qualité. De nos jours, une grande partie de la documentation scientifique est accessible en version électronique et de plus en plus en ligne. L'édition de la littérature scientifique était caractérisée jusqu'à récemment par un paradoxe : l'augmentation du nombre de publications et l'augmentation du prix d'acquisition des documents scientifiques en même temps que diminuait le pouvoir d'achat des centres d'information et des lecteurs potentiels. La publication électronique des revues scientifiques ne s'est pas accompagnée, comme on aurait dû s'y attendre, de la diminution des coûts d'accès à la documentation scientifique. Ce constat a conduit à une première forme de contestation. Elle est réductible à l auto-édition, opération conduite par les auteurs eux-mêmes. La publication concerne cependant une partie de leurs travaux. La seconde forme de protestation se déroule se résume en la constitution de consortia par les centres de documentation afin de négocier avec les éditeurs les prix des acquisitions.. Cyberthèses est une formule qui peut être classée dans le premier lot, à côté des serveurs de preprints, et d'archivage électronique des laboratoires de recherche. Les thèses électroniques s'inscrivent dans un mouvement de plus en plus large de publication ouverte et d'accès gratuit aux résultats de la recherche scientifique. Cette contribution est articulée autour de trois grands points. Ils portent respectivement sur la présentation de Cyberthèses, la description de la plateforme logicielle utilisée et sur les portails. Présentation de cyberthèses Un projet francophone Cyberthèses est un projet francophone initialement mis en place par l'université Lumière Lyon 2 et celle de Montréal. Il est financé par les fonds francophones des inforoutes. Dès le début, son ambition a été de mettre en place une plateforme logicielle basée sur des standards publics ouverts et des logiciels libres et gratuits. Cette approche visait à garantir la pérennité des documents
électroniques produits et la possibilité de l'utilisation du dispositif logiciel par un grand nombre d'institutions. Il est ainsi basé basée sur la DTD TEI Lite. Plateforme initiale et chaîne de l édition Cyberthèses a utilisé au départ la plateforme SGML et des programmes écrits en Omnimark. Sa description ne sera pas abordée dans ce papier. Quant là la chaîne de l'édition des thèses électroniques, nous retenons qu elle fait intervenir un certain d'acteurs qui sont l'administration universitaire, le thésard, le service chargé de thèses. L'administration universitaire est responsable de la procédure de dépôt du document électronique, de sa mise en ligne, la pérennité et de sa conservation. Son auteur, le thésard, est sollicité pour autoriser sa diffusion électronique au moyen de l'utilisation de logiciels appropriés et conformément aux modèles de documents compatibles avec la plateforme logicielle de traitement et de publication des thèses. Le service chargé des thèses électroniques remplit plusieurs fonctions. Il assiste les thésards et les initie à l utilisation des logiciels de traitement de texte dans la rédaction des thèses, les sensibilise aussi aux avantages qu offre la diffusion des résultats de leurs recherches. Chargé d élaborer, de documenter et de distribuer les modèles de documents, il collecte, traite, transforme et met en ligne les thèses validées. Enfin, il est également responsable de la production des copies d'archivage susceptibles d être utilisées ultérieurement. La plateforme logicielle cyberdocs La plateforme est constituée de trois modules. Ils concernent respectivement la conversion, la gestion et la publication et offrent plusieurs avantages. Le module de conversion Il prend en entrée un fichier au format Microsoft Word. Le fichier Word est converti en un fichier OpenOffice, qui a ensuite un dérivé ou fichier dit «pivot» en XML formé selon la DTD TEI Lite. A partir de ce dernier fichier sont produits des fichiers pour la consultation (html, xhtml) et l'impression (pdf). Le module de gestion Écrit en langage de script PHP, ce module est une interface Web qui permet à plusieurs institutions de partager la même machine. Chaque institution dispose de son espace de travail où les utilisateurs peuvent charger les documents, les images, etc., effectuer la conversion, gérer les formulaires d'ajout de métadonnées (Cyberthèses, Dublin Core, ETDMS, ) et publier leurs travaux.
Le module de consultation C'est une application Web dynamique qui permet à l'administrateur d'ajouter et de supprimer les documents de la base documentaire. Avec ce module, l'utilisateur est en mesure d'effectuer des recherches simples et complexes pour retrouver l'intégralité ou les parties des documents répondant aux critères de recherche. L'utilisateur accède au chapitre qui traite sa question. Au moment de la consultation, les termes de la recherche sont mis en évidence. A partir de l'espace de consultation accéder à la version imprimable du document (en PDF notamment). Les avantages de cyberdocs Plateforme logicielle ouverte et libre, distribuée selon les termes de la licence GPL., Cyberdocs utilise la formule XML pour produire des documents structurés dans lesquels l'information est susceptible d être décrite de manière plus fine. À côté de cet avantage et celui concernant la possibilité d'effectuer des recherches sur des fragments de documents (citations, références bibliographiques, légendes illustrations, etc.), on peut citer, par exemple, l'encodage des différents types d'objets. Celui des équations mathématiques est réalisé grâce à MATHML, tandis qu on la formule SVG pour les images. L encodage que l on peut réussir est aussi celui que donne l'utilisation du jeu de caractère Unicode. Il se fait dans les différentes langues de travail utilisées, dont les langues africaines. Modifié, amélioré et distribué Cyberdocs peut être utilsé pour convertir d'autres types de documents (rapports, mémoires, articles, livres) ou indexer des documents formés selon d'autres DTD (docbook par exemple). Les applications le concernant s inscrivent dans la dynamique des archives dites ouvertes lorsqu il y a onformité avec l'open Archives Initiative Protocole for Metadata Hartvesting (OAI-PMH). Ainsi les documents indexées par le serveur de Dakar ou de Bamako, se retrouveront éventuellement sur le serveur de Lyon 2 ou de Santiago à côté de documents produits par d'autres universités. D où les autres avantages que sont la collaboration, la discusion et l échange d expériences au sein de listes de diffusion. Avec de tels atouts, les utilisateurs se constityuent en communauté d acteurs. Cyberdocs, qui bouleverse peu les habitudes de ces auteurs qui ne sont pas obligés de changer de logiciel de traitement de texte. Ayant amélioré leurs compétences grâce à leur initiation à l'utilisation de feuilles de styles et des modèles de documents, ils n ont plus besoin, pour la consultation d'un site de thèses électroniques sous cyberdocs, d obtenir l'installation de logiciels supplémentaires. Il leur suffira de se contenter d un navigateur respectant les standards HTML, CSS et Java Script.
Illustration 1Schéma simplifié de la conversion d'une thèse Les portails cyberthèses Définition de la notion de portail Le terme de portail est utilisé pour désigner des serveurs qui permettent de retrouver des documents stockés sur différents sites. Dans le cadre de thèses électroniques et des archives ouvertes, ceci peut être rendu possible grâce au protocole OAI-PMH. La base documentaire des thèses électroniques est convertible en dépôt appelé dépôt OAI (Open Archives Initiative) Une thèse électronique est composée de deux groupes de documents : le texte intégral de la thèse (aux formats XML, HTML, PDF) et le document descriptif de la thèse (la fiche contenant les métadonnées). Les serveurs OAI s'échangent les métadonnées. Le protocole OAI-PMH définit deux catégories d'applications : les fournisseurs de données (data provider) et les fournisseurs de service (service provider). Les fournisseurs de données mettent en place des entrepôts que les fournisseurs de service peuvent «moissonner». Nous illustrons ce point par deux expériences. Elles se déroulent à l'université Lyon 2 et en Amérique latine. Cette institution française dispose d'un serveur moissonneur. Son but est de d accéder aux thèses soutenues et archivées sur les serveurs de différentes universités. Pour ce faire, un robot moissonneur parcourt les sites cyberthèses répertoriés en vue de collecter les métadonnées. En bref, est mise à contribution une forme d application dite harverter. Notons que ce serveur est accessible à l'adresse http://cyberdocs.univ-lyon2.fr. le nom du portail des thèses électroniques produites en Amérique latine est http://www.cybertesis.net/. Ce site, qui utilise le programme ARC (http://dlib.cs.odu.edu) en vue de collecter les données en provenance des autres sites, permettra de retrouver les thèses produites ou en provenance des universités du Chili, de l'argentine, du Brésil, du Peru, du Venezuela, d'espagne.
Un portail africain de thèses Sa mise en place ne nécessite pas l'utilisation de la même plateforme logicielle par toutes les universités participantes, requiert, par contre, celle d'outils capables de communiquer et de formats de données identiques. Cette mise en place passe par l installation d un serveur de thèses au sein de chaque université, d un format commun de métadonnées, la construction de portails (sites fédérateurs). Chaque université reste autonome en matière de politique éditoriale des thèses. Cette autonomie renvoie aux choix des thèses qui vont être publiées, des formats des publication, des services technique de l'université chargés des thèses électronique, des outils informatiques et à l adoption des logiciels qui seront utilisés. L'adoption par les universités participantes d'un format commun de métadonnées passe par le recours au protocole OAI-PMH, dont application devra être compatible avec l'oai. La mise en place des serveurs portails, qui disposent de logiciels capables de parcourir et de «moissonner» les entrepôts OAI de thèses des universités, facilitera la création de portails institutionnels, géographiques, thématiques, linguistiques. La première catégorie de serveurs est en mettre en service à l échelle d une institution universitaire ou d un ensemble d institutions qui souhaitent fédérer leurs ressources informatiques ou documentaires. Avec la seconde catégorie, on peut obtenir des portails panafricains, régionaux ou nationaux. Quant au troisième type de portail évoqué, on aura la mise à contribution de portails pluridisciplinaires ou encyclopédiques. Illustration 2 : Constitution de portail de thèses électronique
Remettre ici la figure de l avant-dernière page du manuscritau- delà des thèses, un portail scientifique africain Les acteurs institutionnels que sont l université, l éditeur, l établissement de recherche mettront en place un système d'archivage électronique de leur production afin qu elle soit moissonnable par des robots OAI-PMH. Ils utiliseront ainsi le logiciel eprints (http://www.eprints.org). Gratuit et libre, il est exploité par la communauté scientifique mondiale pour la diffusion des résultats des travaux de recherche. Les dernières versions de cette plateforme sont compatibles avec le protocole OAI. Celleci permettra aux scientifiques africains de publier leurs travaux et de participer à la reconfiguration du champ du savoir, au renouvellement des connaissances et au renforcement de leur dissémination. Ces dynamiques s observeront aussi avec l'adoption de l archivage électronique par les établissements africains (sommés de les indexer par des outils de recherche internationaux) de productions locales et de documents produits par les universités et les institutions de recherche du Nord. Conclusion La mise en place d'un système d'édition électronique demande l'implication d acteurs tels que les auteurs, les établissements d'enseignement et de recherche, les utilisateurs. Les obstacles les plus difficiles à contourner pour réussir l exécution d un tel projet ne sont pas d ordre technique ou technologique. En vérité, ils sont d ordre humain, car l'édition électronique et la documentation numérique nécessitent un changement des façons de se comporter des acteurs, lesquels sont impliqués, comme on le sait, dans des réseaux où ils sont appelés à être à la fois auteurs et éditeurs. Ils doivent comprendre que la publication ouverte et gratuite n'est pas un palliatif de la publication commerciale payante. Les documents offerts à la consommation par les deux modes de diffusion ont les mêmes chances d'être lus et cités. Conscientes de la nécessité du dédoublement fonctionnel énoncé ci-dessus, les universités mettront à la disposition de leurs enseignants et de leurs chercheurs des plateformes de publication de leurs travaux. Il ne suffit pas aussi de mettre en place des outils et des sites. Il faut également les faire connaître. Les lecteurs apprendront à composer avec des nouveaux outils de recherche. Coexisteront avec eux les systèmes de bases de données et les moteurs de recherche classiques. Parallèlement à tout cela, la publication en ligne sera rendue fructueuse grâce la formation des professionnels et des consommateurs de l'information.