Statistiques d usage des documents accessibles en Libre Accès via Archimer



Documents pareils
Web Analytics. des Visiteurs en Ligne? Raquel de los Santos, Business Consultant Forum emarketing 2012

Rapport mensuel 01-janv janv Visites. 1&1 WebStat pour videobourse.fr

Click to edit Master title style. Yann Ferouelle Microsoft France

La situation en matière de pension privées et de fonds de pension dans les pays de l OCDE

Fiche signalétique d un service de téléphonie mobile version du 24/08/2012

Rapport mensuel 01-sept sept Visites. 1&1 WebStat pour videobourse.fr

Les classes de service pour les projets scientifiques

GalleryPrintQueue User Guide

1 La visualisation des logs au CNES

Le Web de A à Z. 1re partie : Naviguer sur le Web

L introduction à la thèse

Case study Méthodologie d enquête et développement d une Great Place To Work

Pour vos questions ou une autorisation d utilisation relative à cette étude vous pouvez contacter l équipe via contact@4gmark.com

Outils de traitements de logs Apache

Initiation à la recherche documentaire LA RECHERCHE SUR INTERNET

Avec le traitement Swissvax votre carrosserie a droit au meilleur lavage grâce à notre shampooing à base de noix de coco et au ph neutre.

Formation à la recherche documentaire sur le web

Secteur bancaire Enjeux d image

ICC septembre 2012 Original : anglais. tendances de la consommation du café dans certains pays importateurs.

: seul le dossier dossier sera cherché, tous les sousdomaines

Comment surveiller vos concurrents?

Notes de mise à jour. 4D v11 SQL Release 2 (11.2) Notes de mise à jour

v i e L engagement est une force Prêts à grandir ensemble? Volontariat Entreprise International

Les nouveaux sites documentaires de l IRD

Mesurer et analyser le trafic d un site internet Comment analyser l audience de son site et connaître les centres d intérêts des visiteurs?

Guide et conseils généraux pour optimiser le référencement d un site internet

Mise en place d un SMSI selon la norme ISO Wadi Mseddi Tlemcen, le 05/06/2013

Eurateach labellisé par la région et le FAFIEC. Si vous remplissez les conditions suivantes : Votre entreprise compte moins de 250 salariés

INTERNET. Etsup 2012

CENTRE DE DOCUMENTATION OUTIL DE RECHERCHE MER/LITTORAL/ENVIRONNEMENT

Website Express Créer un site professionnel avec Orange

Jeudi 30 avril L art de bien référencer son site Internet

Google Analytics - Analysez le trafic de votre site pour améliorer ses performances inclut Universal Analytics (2ième édition)

Tendances Clés du Marché des Réseaux Sociaux

Les actions internationales pour l enseignement supérieur Un objectif de coopération internationale entre pays programmes et partenaires

Les Réunions Info Tonic. Améliorer la visibilité de son site internet Mardi 10 décembre 2013

Le référencement de mon site

L auto-archivage en maths, quoi de neuf?

Savoir utiliser les services de l ENT Outils personnels SOMMAIRE

Mendeley, pour gérer sa bibliographie et la partager. Patricia Volland-Nail

CCI DE SAÔNE-ET-LOIRE - ATELIER ENP 18 MAI La création de sites internet

Communiquer avec un ou plusieurs interlocuteurs. Michel Futtersack, Faculté de Droit, Université Paris Descartes, Sorbonne Paris Cité

INTERNET est un RESEAU D ORDINATEURS RELIES ENTRE EUX A L ECHELLE PLANETAIRE. Internet : interconnexion de réseaux (anglais : net = réseau)

REPÈRES ÉCONOMIQUES POUR UNE RÉFORME DES RETRAITES JUILLET 2015

PRESTATIONS Nouvelles technologies éducatives

INTERNET, C'EST QUOI?

Catalogue de formations

HAL, archives ouvertes. Christine Berthaud, CNRS/CCSD - Directrice

Objectifs. Synthétiser. Moyens

20 techniques et bonnes pratiques d un positionnement visible gratuit et durable sur Internet

QUI SOMMES-NOUS? Cette solution s adresse aussi bien aux PME/PMI qu aux grands groupes, disposant ou non d une structure de veille dédiée.

Optimisez vos ressources humaines. Kelio Optima

Liste des établissements adhérant à Worldcat

Formation Découverte du Web

CREER UN UNIVERS NETVIBES

Partager rapidement un fichier volumineux

Luc RUBIELLO

Réunion des DU de Biogenouest 19 mars 2014

ISTEX, vers des services innovants d accès à la connaissance

MailStore Server 7 Caractéristiques techniques

Une plateforme logicielle pour une gestion colorimétrique globale

Solutions AvAntGArd receivables

Atelier 1. Portails documentaires : BioLib et Cemadoc

Référencement de votre site Web Google et autres moteurs de recherche (4ième édition)

Mini-guide utilisateur RefWorks 2.0

Kaizen Marketing Group Web Agency. Kaizen Marketing. - Stéphanie Héline-

L identité numérique. Risques, protection

Focus sur : Comparatif de 3 logiciels de gestion des références bibliographiques

Environnement Numérique de Travail. Solution : esup-uportal (v.4.0)

Workshop 1 La dématérialisation des factures. Comment en finir avec les factures papier?

SOMMAIRE 1 UNE INTRODUCTION : QU EST-CE QUE GOOGLE ANALYTICS? 3 2 LES PRE-REQUIS AVANT UTILISATION 3 3 ACCEDER A VOS STATISTIQUES 3

Plateforme IST Agropolis

SOL DES PRO MOS OUVERT

SEO On-page. Avez-vous mis toutes les chances de votre côté pour le référencement de votre site?

Optimiser le référencement naturel de son site web

Ecole Préparatoire SNV Université d Oran Semestre /2015 Matière : Travaux d Initiative Personnelle Encadrés (TIPE) Prof. M. Z.

Programme Type de Formation SEO

Gestion collaborative de documents

CONTACT EXPRESS 2011 ASPIRATEUR D S

Date limite d envoi du dossier le 15 mai 2015 Cachet de la poste faisant foi, à l adresse suivante :

Servir l avenir Une initiative d EUREKA et de la Commission européenne, destinée aux Pme innovantes à fort potentiel de croissance

interagir apprendre communiquer attirer

Les archives ouvertes

Formation Webmaster : Création de site Web Initiation + Approfondissement

TITRES ET DIPLÔMES FRANCAIS OUVRANT DROIT A DISPENSES D'EPREUVES DU DCG ET DU DSCG - SESSION 2013

E-COMMERCE UN SITE PROFESSIONNEL NOU PRO MOS. à partir de 4900,00 HT VEAU UNE SOLUTION CLÉ EN MAIN & ÉVOLUTIVE NOU SOL DES PRO MOS LIVRAI SON VEAU

AGENCE WEB 360 acteur du web depuis 8 ans en collaboration avec ses partenaires, déploie son. offre SEO

Fiche pratique : REPORTING SEARCH

Documentation Honolulu 14 (1)

Optimiser sa présence sur les médias sociaux

WEBSITEBURO. Agence Media Internet. Stratégies publicitaires on-line

FaxBox.com est le 1er service de Fax par en Europe. Avec FaxBox.com, vous envoyez et recevez vos fax par où que vous soyez.

LES ESPACES CAMPUS FRANCE A PROCEDURES CEF. étrangers

Internet Découverte et premiers pas

I. Descriptif de l offre. L offre Sage 100 Entreprise Edition Entreprise

COMMENT VENDRE SUR GOOGLE SHOPPING?

MODE D'EMPLOI. La gestion des versions permettra de compléter et de faire évoluer les fiches dans le temps. NOM DE LA RESSOURCE CONTACT FOURNISSEUR

Memento de la recherche documentaire en santé

L ESSENTIEL 2014 KEY FACTS & FIGURES

Transcription:

Direction de l Information Scientifique, de la Communication, de la Médiation et des Relations Institutionnelles Bibliothèque La Pérouse Auteur : Fred Merceur Réf : DISCOM&RI/BLP/FM/213-7 Version : 1. Date : Mai 213 Statistiques d usage des documents accessibles en Libre Accès via Archimer Période 25-212

Table des matières 1. Introduction... 2 2. Données statistiques... 2 2.1. Dépôts... 2 2.2. Téléchargements... 4 2.3. Chemin d accès... 11 2.4. Internautes... 14 3. Méthodologie... 19 1. Introduction Ce document propose un ensemble de données statistiques sur l usage des documents déposés en Libre Accès dans Archimer, l Archive Institutionnelle de l Ifremer. Seuls les téléchargements du texte intégral des documents ont été pris en compte. La visualisation des fiches de métadonnées n a pas été comptabilisée. Pour éviter que l activité d administration de l Archive (dépôt, contrôle, validation ) ne fausse les résultats, les téléchargements réalisés depuis le réseau informatique de l Ifremer n ont pas été pris en compte. Pour plusieurs données statistiques, des focus sur trois types de documents spécifiques sont proposés : les publications indexées dans le Web Of Sciences (WOS), les thèses et les rapports 1. Les publications indexées dans le WOS 2 et les thèses sont particulièrement intéressantes du fait de leur homogénéité en termes de taille et de langue notamment. 2. Données statistiques 2.1. Dépôts Figure 1 : Progression du nombre de documents 3 disponibles dans Archimer Nombre de documents 18 16 14 12 1 8 6 4 2 49 171 2919 4351 6368 596 933 6998 1858 1288 16919 175 8393 4531 276 935 1683 25 26 27 28 29 21 211 212 Année Visibilité Internet Visibilité Intranet Visibilité confidentielle Total 1 Rapport de contrats, rapport scientifique, compte-rendu (d'essais, de campagnes, de métrologie...), note (de synthèses, de veille prospective ou technologique...) 2 Nous avons différencié les publications indexées dans le WOS du reste des articles disponibles dans Archimer car elles sont souvent accessibles gratuitement via Archimer mais aussi, sous réserve d abonnement, via le site de leurs éditeurs (contrairement, par exemple, aux articles de plusieurs journaux anciennement publiés par l Ifremer, qui sont exclusivement accessibles via Archimer) 3 Tout type de documents confondus : publication, acte de colloque, rapport, thèse, HDR, avis, expertise, ouvrage, chapitre d ouvrage, poster. DISCOM&RI/BLP/FM/213-7 Page 2

Figure 2 : Histogramme du nombre de documents 3 déposés dans Archimer par année de dépôt 25 2 Nombre de documents 15 1 5 25 26 27 28 29 21 211 212 Année de dépôt Visibilité Internet Visibilité Intranet Visibilité confidentielle Figure 3 : Histogramme des années de publication des documents 3 déposés dans Archimer 8 7 Nombre de documents 6 5 4 3 2 1 199 1991 1992 1993 1994 1995 1996 1997 1998 1999 2 21 22 23 24 25 26 27 28 29 21 211 212 Année de publication Visibilité Internet Visibilité Intranet Visibilité confidentielle DISCOM&RI/BLP/FM/213-7 Page 3

2.2. Téléchargements Figure 4 : Progression de la somme annuelle des téléchargements des documents 3 9 Nombre de fichiers PDF téléchargés 8 7 6 5 4 3 2 146772 393556 423328 413197 53297 55154 767371 1 26 27 28 29 21 211 212 Année de consultation Figure 5 : Evolution de la somme mensuelle des téléchargements des documents 3 12 Nombre de fichiers PDF téléchargés 1 8 6 4 2 25 26 27 28 29 21 211 212 213 DISCOM&RI/BLP/FM/213-7 Page 4

Figure 6 : Evolution de la moyenne mensuelle des téléchargements par document 3 18, 16,66 16,17 16, Moyenne de téléchargements par document et par mois 14, 12, 1, 8, 6, 11,55 7,41 6,99 5,43 7,2 4, 2,, 26 27 28 29 21 211 212 Année de consultation Remarque : les moyennes mensuelles de téléchargement lors d une année n sont calculées ainsi : Téléchargements enregistrés lors de l année des documents déposés avant la fin de l année 1 Nombre de documents déposés avant la fin de l année 1 12 Figure 7 : Evolution de la moyenne mensuelle des téléchargements des publications 4, des thèses et des rapports Moyenne de téléchargements par document et par mois 1 9 8 7 6 5 4 3 2 1 85,95 56,7 42,79 22,37 24,62 2,31 16,79 15,83 17,56 13,61 9,27 7,4 7,9 5,8 7,82 6,32 7,67 4,25 5,5 4,36 5,39 26 27 28 29 21 211 212 Année de consultation Thèses Rapports Publications 4 Publications indexées dans le WOS DISCOM&RI/BLP/FM/213-7 Page 5

Figure 8 : Histogramme des moyennes mensuelles de téléchargements des documents 3 au cours de l année 212 Nombre de documents 1 18 2 16 3 14 12 1 8 6 4 4 2 1-2 3-4 5-6 7-8 9-1 11-12 13-14 15-16 17-18 19-2 21-22 23-24 25-26 27-28 29-3 31-32 33-34 35-36 37-38 39-4 41-42 43-44 45-46 47-48 Nombre de téléchargements par mois et par document 5-782 La Figure 8 se lit de la façon suivante : 1. 65 des 8393 documents déposés en Libre Accès avant le 31 décembre 211 dans Archimer n ont jamais été téléchargés au cours de l année 212 2. 173 de ces 8393 documents ont été téléchargés de 1 à 11 fois au cours de l année 212. La moyenne mensuelle de téléchargements de ces 173 documents se situe donc entre et 1. 3. 152 de ces 8393 documents ont été téléchargés de 12 à 24 fois au cours de l année 212. La moyenne mensuelle de téléchargements de ces 152 documents se situe donc entre 1 et 2. 4. 139 de ces 8393 documents ont été téléchargés en moyenne entre 5 et 782 fois par mois au cours de l année 212. Figure 9 : Histogramme des moyennes mensuelles de téléchargements des publications 4 au cours de l année 212 5 45 Nombre de publications 4 35 3 25 2 15 1 5 1-2 3-4 5-6 7-8 9-1 11-12 13-14 15-16 17-18 19-2 21-22 23-24 25-26 27-28 29-3 31-32 33-34 35-36 37-38 39-4 Nombre de téléchargements par mois et par publication 41-42 43-44 45-46 47-48 5-292 DISCOM&RI/BLP/FM/213-7 Page 6

Figure 1 : Histogramme des moyennes mensuelles de téléchargements des thèses au cours de l année 212 4 35 Nombre de thèses 3 25 2 15 1 5 1-2 3-4 5-6 7-8 9-1 11-12 13-14 15-16 17-18 19-2 21-22 23-24 25-26 27-28 29-3 31-32 33-34 35-36 37-38 39-4 Nombre de téléchargements par mois et par thèse 41-42 43-44 45-46 47-48 5-277 Figure 11 : Histogramme des moyennes mensuelles de téléchargements des rapports au cours de l année 212 35 3 Nombre de rapports 25 2 15 1 5 1-2 3-4 5-6 7-8 9-1 11-12 13-14 15-16 17-18 19-2 21-22 23-24 25-26 27-28 29-3 31-32 33-34 35-36 37-38 39-4 41-42 43-44 45-46 47-48 Nombre de téléchargements par mois et par rapport 5-341 DISCOM&RI/BLP/FM/213-7 Page 7

Figure 12 : Evolution de la moyenne mensuelle des téléchargements des thèses par année de dépôt 9 Moyenne de téléchargements par thèse et par mois 8 7 6 5 4 3 2 1 Année de dépôt 25 26 27 28 29 21 211 26 27 28 29 21 211 212 Année de consultation Figure 13 : Evolution de la moyenne mensuelle des téléchargements des publications 4 par année de dépôt 1 Moyenne de téléchargements par publication et par mois 9 8 7 6 5 4 3 2 Année de dépôt 25 26 27 28 29 21 211 1 26 27 28 29 21 211 212 Année de consultation DISCOM&RI/BLP/FM/213-7 Page 8

Figure 14 : Evolution de la moyenne mensuelle des téléchargements des rapports par année de dépôt 25 Moyenne de téléchargements par rapport et par mois 2 15 1 5 Année de dépôt 25 26 27 28 29 21 211 26 27 28 29 21 211 212 Année de consultation Figure 15 : Histogramme des moyennes mensuelles de téléchargements des thèses en fonction de la taille des fichiers au cours de l année 212 4 Moyenne de déchargements par thèse et par mois 35 3 25 2 15 1 5-1 1-2 2-3 3-4 4-5 5-6 6-7 7-8 8-9 9-1 1-11 11-12 12-13 13-14 14-15 Taille des fichiers PDF en Mo 15-16 16-17 17-18 18-19 19-2 2-21 21-22 22-23 23-24 25 ou plus Remarque : La différence très marquée entre les téléchargements des fichiers de tailles inférieures et supérieures à 15 Mo pourrait être liée au fait que Google ne semblait pas indexer les fichiers volumineux (la limite semblait se situer autour de 1Mo à 15 Mo en fonction des années). Seules les fiches de métadonnées des gros fichiers étaient indexées. Cette limite semble avoir évoluée en 213 puisqu il est désormais possible de trouver dans les index de Google des fichiers d une taille supérieure à 6 Mo. DISCOM&RI/BLP/FM/213-7 Page 9

Figure 16 : Histogramme des moyennes mensuelles de téléchargements des documents 3 en fonction de leur année de publication au cours de l année 212 25 Moyenne de téléchargement par document et par mois 2 15 1 5 196 1962 1964 1966 1968 197 1972 1974 1976 1978 198 1982 1984 1986 1988 199 1992 1994 1996 1998 2 22 24 26 28 21 Année de publication DISCOM&RI/BLP/FM/213-7 Page 1

2.3. Chemin d accès Tableau 1 : Sources d accès aux documents téléchargés au cours du mois de Novembre 212 Source des téléchargements Nombre de Pourcentage des téléchargements téléchargements Google 5717 72,15% Inconnu 9247 11,67% Google Scholar 3222 4,7% Archimer 191 2,41% Blogs, forums, lien dans des articles 5 71,9% Gallica 581,73% Bing 58,73% Yahoo 54,64% Ask 255,32% Annuaire Ifremer 24,3% WebMail 19,24% Pages WEB Ifremer 178,22% Wikipedia 15,19% Facebook 15,13% Yandex.ru 74,9% Avano 68,9% Baidu 61,8% Sabiia 39,5% eaufrance 39,5% Bibliomer 37,5% Twitter 34,4% Driver 26,3% Isidore 25,3% 123people 25,3% ResearchGate 21,3% opendoar 18,2% worldcat.org 17,2% academic.research.microsoft 13,2% scientificcommons 1,1% Autres 3684 4,65% 5 Exemples : connaissancedesenergies.org, universcience.fr, bretagne-environnement.org, DISCOM&RI/BLP/FM/213-7 Page 11

Figure 17 : Nuages de mots recherchés dans Google à l origine de téléchargements de documents rédigés en anglais Traitement : Wordle (http://www.wordle.net) DISCOM&RI/BLP/FM/213-7 Page 12

Figure 18 : Nuages de mots recherchés dans Google à l origine de téléchargements de documents rédigés en français Traitement : Wordle (http://www.wordle.net) DISCOM&RI/BLP/FM/213-7 Page 13

2.4. Internautes Figure 19 : Localisation des téléchargements enregistrés au cours de l année 212 Remarque : 1% des téléchargements 212 ne sont pas localisés sur cette carte. Un point peut représenter jusqu à 43 téléchargements. DISCOM&RI/BLP/FM/213-7 Page 14

Tableau 2 : Liste des principaux pays utilisateurs des documents rédigés en anglais Pays Nombre de Pourcentage des déchargements téléchargements United States 31256 13,71% France 23787 1,43% India 15581 6,83% United Kingdom 12569 5,51% China 1212 5,27% Germany 6714 2,94% Spain 6571 2,88% Canada 5714 2,51% Italy 5263 2,31% Indonesia 4955 2,17% Iran, Islamic Republic of 4832 2,12% Australia 4553 2,% Malaysia 442 1,93% Brazil 429 1,85% Japan 3957 1,74% Mexico 369 1,58% Philippines 3376 1,48% Portugal 3315 1,45% Korea, Republic of 3263 1,43% Algeria 388 1,35% Thailand 381 1,35% Netherlands 272 1,18% Tunisia 249 1,9% Turkey 2465 1,8% Russian Federation 24 1,5% Taiwan 228 1,% Belgium 2259,99% Egypt 2138,94% Norway 184,81% Chile 1751,77% DISCOM&RI/BLP/FM/213-7 Page 15

Tableau 3 : Liste des principaux pays utilisateurs des documents rédigés en français Pays Nombre de Pourcentage des déchargements téléchargements France 296868 61,18% Algeria 47266 9,74% Tunisia 27651 5,7% Morocco 2675 5,51% Canada 11441 2,36% Belgium 9141 1,88% United States 6425 1,32% Cote D'Ivoire 478,84% Cameroon 478,84% Senegal 3699,76% Madagascar 3548,73% Spain 3397,7% Switzerland 3227,67% United Kingdom 273,56% Italy 213,44% Benin 288,43% Germany 1723,36% China 1594,33% Portugal 159,22% Mauritania 949,2% Brazil 935,19% Burkina Faso 894,18% Korea, Republic of 84,17% Netherlands 764,16% Russian Federation 754,16% Congo 741,15% Togo 711,15% Gabon 673,14% Mexico 633,13% DISCOM&RI/BLP/FM/213-7 Page 16

Tableau 4 : Liste des principaux utilisateurs académiques et privés des documents rédigés en anglais au cours du mois de Novembre 212 Institution Pays Nombre de Pourcentage des déchargements téléchargements Universite de Brest France 415,18% INRA France 382,17% ESMISAB France 344,15% Danish Network for Research and Education Denmark 32,14% Wageningen University and Research Centre Netherlands 311,14% Universite de Bordeaux France 311,14% Universiti Putra Malaysia Campus Network Malaysia 35,13% Universitaet Bremen Germany 32,13% Universite Pierre et Marie Curie France 32,13% Universitaet Kiel Germany 291,13% Universite de Caen France 288,13% University of Southampton United Kingdom 275,12% Taiwan Academic Network Taiwan 258,11% Universidade do Porto Portugal 256,11% The University of Plymouth United Kingdom 25,11% Bogor Agricultural University Indonesia 245,11% Université de Nantes France 234,1% Dalhousie University Canada 233,1% University of Tokyo Japan 227,1% Universite Montpellier II France 223,1% Stiftung Alfred-Wegener-Institut fuer Germany 218,1% Academic and research institutions Norway 212,9% TOTAL S.A. France 27,9% Ocean University Of Qingdao China 23,9% Universiti Sains Malaysia, Penang, Malaysia Malaysia 198,9% National Taiwan Ocean University Taiwan 196,9% RRM - Reseau de la Recherche a Marseille France 195,9% Ministry of Agriculture,Forestry and Fisheries Japan 189,8% Instituto Espanol de Oceanografia Spain 188,8% University of California, San Diego United States 187,8% Institut Recerca i tecnologia Agroalimentarias Spain 187,8% National Institute of Oceanography India 187,8% Universidade do Algarve Portugal 181,8% Ocean University of China China 181,8% Universite de La Rochelle France 167,7% University of Aberdeen, UK United Kingdom 161,7% Universitat de Barcelona Spain 161,7% University of Wales Bangor United Kingdom 158,7% DISCOM&RI/BLP/FM/213-7 Page 17

Tableau 5 : Liste des principaux utilisateurs académiques et privés des documents rédigés en français au cours du mois de Novembre 212 Institution Pays Nombre de Pourcentage des déchargements téléchargements Algerian Academic Research Network Algeria 2381,49% Universite de Bordeaux France 134,28% Universite de Caen France 171,22% Universite de Nantes France 128,21% INRA France 127,21% Universite de Brest France 998,21% Universite de La Rochelle France 876,18% Universite Montpellier II France 76,15% Reseau de la Recherche a Marseille France 692,14% Universite Pierre et Marie Curie France 651,13% CNRST Morocco 617,13% ESMISAB France 553,11% Electricite De France France 515,11% Université de Rennes France 54,1% Ministere De La Sante Et Des Affaires Sociales France 497,1% Institut National de Recherches Agronomiques France 396,8% Museum national d'histoire naturelle France 379,8% Universite des Sciences et Technologies de Lille France 358,7% Commissariat a l'energie Atomique France 353,7% Gaz de France France 33,7% University of Littoral - Dunkerque France 315,6% Universite de Liege (ULg) Belgium 33,6% Universite de Strasbourg France 3,6% CEMAGREF France 299,6% Universite du Quebec a Rimouski Canada 289,6% Universite de PERPIGNAN France 278,6% TOTAL S.A. France 277,6% Universite de Corse France 268,6% Montpellier Academy France 26,5% CIRAD France 256,5% Institut Polytechnique LaSalle-Beauvais France 254,5% Universite du Havre France 252,5% BRGM France 246,5% Universite Laval Canada 238,5% Assistance Publique-Hopitaux de Paris France 237,5% Universite de Nice Sophia Antipolis France 235,5% MINISTERE de L'INTERIEUR France 23,5% Universite du Maine France 214,4% Observatoire Oceanologique CNRS France 213,4% observatoire oceanologique de banyuls France 212,4% Ministere des Peches Maritimes Morocco 2,4% Universite de Tours France 2,4% DISCOM&RI/BLP/FM/213-7 Page 18

3. Méthodologie Les résultats présentés dans ce document sont issus de l analyse des logs du serveur Web Apache de l Ifremer. Toutes les nuits, un script informatique repère dans le fichier de logs, les lignes correspondantes aux téléchargements des fichiers PDF disponibles dans Archimer. Ces lignes se présentent sous la forme suivante : xxx.xxx.xxx.xxx - - [22/May/213::28:9 +2] "GET /doc/38/14916/12245.pdf HTTP/1.1" 2 492 "http://scholar.google.it/scholar?q=phytoplankton+diversity+during+the+spring+bloom+in+the+northweste rn+mediterranean+sea&hl=it&as_sdt=&as_vis=1&oi=scholart&sa=x&ei=6_sbucilkstr7abgxyggcq&sqi=2&v ed=ccwqgqmwaa" "Mozilla/5. (Windows NT 6.1) AppleWebKit/537.31 (KHTML, like Gecko) Chrome/26..141.64 Safari/537.31" Les informations ci-dessous sont extraites de chaque ligne : L adresse IP (ex : xxx.xxx.xxx.xxx) permet d obtenir des informations (FAI et coordonnées géographiques) sur l identité de l Internaute à l aide de la base GeoIP 6. La date et l heure du téléchargement (ex : 22/May/213::28:9). L URL du document téléchargé (ex : /doc/38/14916/12245.pdf) contient le numéro d identification du document dans Archimer (ex : 14916). Le code du résultat de la requête HTTP (ex : 2) La «Referring URL» (ex : http://scholar.google.it/scholar?q=phytoplankton+diversity+during...) indique l URL de la page qui est à l origine du téléchargement. Elle correspond, dans notre exemple, à l URL de Google Scholar avec, en paramètre, la question posée par l internaute dans Google Scholar 7 (ex : phytoplankton diversity during the spring bloom in the northwestern mediterranean sea). Si un internaute accède à un document via sa fiche de métadonnées (ex : http://archimer.ifremer.fr/doc/38/14916/), le script remonte dans le fichier de log pour trouver la «Referring URL» de cette première requête. L information «Referring URL» n est pas systématiquement disponible. Les robots, notamment, exécutent souvent des requêtes HTTP sans fournir ce paramètre. Son absence peut donc aider à les identifier. Le «User-Agent» de la requête HTTP (ex : Mozilla/5. Windows NT 6.1 ) fournit des informations sur le navigateur de l internaute. Les robots des moteurs de recherche et les aspirateurs de sites sont à l origine de la très grande majorité des téléchargements. Plusieurs actions permettent de filtrer leurs activités : Les requêtes HTTP dont le «User-Agent» contient un des mots 8 associés à des robots (BOT, SPIDER, CRAWLER ) sont supprimées. Les téléchargements provenant de plusieurs FAI (ex : OVH, Microsoft Hosting ) sont également exclues en l absence de paramètre «Referring URL». Un grand nombre de téléchargements exécutés à partir de la même adresse IP est systématiquement suspect : les requêtes sont alors vérifiées manuellement (au-delà de 1 requêtes par mois). Dans certains cas, ces téléchargements proviennent d une université dont les appels sortant sont filtrés par un proxy, mais, dans la majorité des cas, il s agit de robots dont les téléchargements sont alors supprimés. 6 http://www.maxmind.com/fr/home 7 Depuis 212, les recherches dans Google ne sont plus visibles dans les requêtes HTTP quand les internautes sont connectés à leur compte GMail. 8 Une liste de robots à exclure est disponible sur le site du projet COUNTER : http://www.projectcounter.org/code_practice.html DISCOM&RI/BLP/FM/213-7 Page 19